Index

1. はじめに
2. 背景
3. 分析対象
- 3-1. 骨太の方針
  - a) 内容の概要
  - b) 前処理
- 3-2. 行政事業レビューシート
4. 評価方法と結果
5. 骨太の方針と予算の関係
6. おわりに
- 6-1. まとめ
- 6-2. 今後の展望・課題
オウンドメディアも運営しています

1. はじめに

データアナリティクスラボ株式会社データソリューション事業部の木本です。

本記事では、国の閣議決定文書である「骨太の方針」と予算編成との関係を明らかにするため、「骨太の方針」の本文テキストと「行政事業レビューシート」から得られる事業（政策）ごとの事業概要テキストとの連関度評価を行いました。また、各府省庁が要求する予算に対する実際の予算の割合（要求通過率）と、評価された連関度の関係を分析しました。その結果、連関度が高いほど、要求通過率が高くなるという関係は確認されず、むしろ逆の傾向が見られました。

以下では、まず制度的な背景と分析対象を整理した上で、連関度評価の方法と結果、そして予算編成との関係について順に確認します。

2. 背景

本章では、本記事で分析対象とする「骨太の方針」や「行政事業レビューシート」について、国家予算の編成過程と併せて概観するとともに、政策テキストと予算データとの関連性評価に関する先行事例を紹介します。

2-1. 国家予算の編成と骨太の方針

本記事の分析対象である「骨太の方針」は、正式には「経済財政運営と改革の基本方針」といい、政府の経済財政政策や予算編成に関する基本的な方針を示すものです（*1）。首相が議長を務める経済財政諮問会議での答申を経て、毎年6月ごろに閣議決定されています。

骨太の方針が初めて策定されたのは小泉内閣が発足した2001年で、民主党政権時代の中断（2010年～2012年）を除き、毎年発表されています。当初は官邸主導の性格が強いものでしたが、現在では予算編成過程の起点となる文書として定着し、この文書に政策を盛り込むことが予算確保につながるという「経験則」も業界団体などに広がっているようです（*2）。

国家予算とは、国の1年間の収入と支出の見積りを指し、その有効期間である会計年度は毎年4月から翌年3月31日までとなっています。骨太の方針は翌年度の予算の方向性を示すもので、各省庁はこれに基づく概算要求基準を受けて、8月末までに財務省に概算要求を提出し、折衝が行われます。財務省が取りまとめた予算案は12月末までに閣議決定を経て政府予算案となり、これが翌年の1月～3月にかけて国会で審議され、年度末までに「当初予算」として成立するのが通例となっています（*3）。

このようにして成立した当初予算は1年かけて執行されますが、これとは別に年度途中で編成される「補正予算」が存在します。例年11月ごろに予算案が決定され、国会審議を経て年内に成立します。本来は経済動向の急変や自然災害などにより緊急に必要となった経費に対応するためのものですが、経済対策のために編成されることが常態化しています（*4）。骨太の方針はあくまで翌年度の当初予算の方針を定めるものですが、経済対策の性質を有する補正予算への影響については検証の余地があると考えられます。

また、成立時には使途の決まっていない予算として、「予備費」があります。これは、予見しがたい予算の不足に充てるための経費です。予備費をどの費目に充当するかは、事前の国会の議決を得る必要はなく、内閣の責任で決定できるようになっています。

なお、国家予算は国の主要な収入・支出を管理する一般会計予算、特定の事業や資金運用のため一般会計とは別に経理される特別会計予算、全額政府出資の法人である政府関係機関の予算の3つに大別されます。

*1: 内閣府HP
*2: 日本経済新聞電子版「役割終えたか　骨太方針の20年」（2020年7月16日）
*3: 当初予算が年度開始前に成立しなかった場合は、成立するまでの期間の国の支出に対して「暫定予算」が編成されます。暫定予算は当初予算成立と同時に失効し、当初予算に吸収されます。
*4: 日本経済新聞電子版「後に補正予算が恒例　安定財源なく国債頼み」（2025年6月5日）

2-2. 行政事業レビューとの関係

本記事では骨太の方針が予算に与える影響を調べるため、国の政策（事業）ごとに事業の概要や予算、成果目標などが記された行政事業レビューシートに着目しました。

行政事業レビューシートとは、各省庁が所管する事業の予算の執行状況や目標達成状況について個別に整理・点検を行う行政事業レビューにおいて用いられ、公表される資料を指します。原則として国のすべての事業（約5,000事業）について1事業1シートを原則として作成され、必要性や効率性の観点から見直しを行い、その結果を予算の概算要求や執行に反映することとなっています。民主党政権時代の「事業仕分け」を定常化する取組として2010年から試行され、政権交代後も引き続き実施・公表されているものです（*5）。

行政事業のレビューの年間スケジュールは下記の通りとなっており、新年度から各省庁において所管事業の自己点検、すなわち行政事業レビューシートの作成が開始されます。うち、前年度に新規に開始された事業や継続の是非を判断する必要のある事業など、全体の約2割程度の事業については外部有識者が公表前に点検を行います。さらに優先度の高い政策などについては、6月中に「公開プロセス」と呼ばれる公開の場において外部有識者を含めて点検が行われます。レビューシートは概算要求の提出に合わせて公表され、内閣官房の行革推進会議が改めてチェックを行い、選定された事業については11月に「秋のレビュー」において公開検証が行われます。

図2-2　行政事業レビューの年間スケジュール（出典：内閣官房行政改革・効率化推進事務局「政府の行政改革」）

行政事業レビューシートは2024年度から「行政事業レビュー見える化サイト」において一元的に公表されており、レビューシート単体のほか、省庁やキーワードなどを指定した集計が行えるようになっています。なお、それ以前の2014年度から2023年度のレビューシートについては、データベースとして「政府の行政改革」（内閣官房行政改革・効率化推進事務局）から入手が可能です。

*5: 徳田貴子「政府における評価制度」『立法と調査』第458号, 2023年8月

2-3. 関係する先行事例

本節では、骨太の方針に代表されるような政策テキストや行政事業レビューシート等から得られる予算データを結びつける先行事例を概観します。

「第5期科学技術基本計画と行政事業レビューシート分析」（内閣府）

内閣府は大学等の研究機関における研究、教育、資金獲得等に関するエビデンスの収集と分析機能やデータを共有するプラットフォームとしてe-CSTI（Evidence data platform constructed by Council for Science, Technology and Innovation）を構築しています。そのコンテンツの一つである「第5期科学技術基本計画と行政事業レビューシート分析」において、第5期科学技術基本計画の政策課題と関連性の高い事業が検索可能な分析ツールが提供されています。

この分析ツールでは、計画と事業の関連性を次のように類似度として指標化することで、関連性が高い事業の検索を可能としています。具体的には、第5期科学技術基本計画から抽出された「政策課題64項目をそれぞれ説明する文章」と「各行政事業レビューシートの事業概要の説明文」について、それぞれ名詞を切り出してTF-IDF法による特徴ベクトルを計算し、その特徴ベクトル間のコサイン類似度を指標として算出しています。ここで、数値や年号、一般指示名詞などの一般的な名詞はストップワードとして計算から除外されています。

類似度算出の手法として用いられているTF-IDF法については後述しますが、単語の一致をもって類似度を判定しており、意味内容を考慮した類似度判定とはなっていない点に注意が必要です。

3. 分析対象

本章では、本記事における分析対象である「骨太の方針」および「行政事業レビューシート」の特徴を整理するとともに、分析に際して必要な前処理について説明します。骨太の方針と行政事業レビューシートについては年度ごとに公表されており、骨太の方針は2013年度以降、行政事業レビューシートは2014年度以降のデータが入手可能となっています。

3-1. 骨太の方針

a) 内容の概要

骨太の方針のページ数と章立ては2013年度以降、下記のように推移しています。章の数は3～5章で推移しており、ページ数は最も多い2019年度で75ページ、最も少ない2014年度で34ページとなっています

本記事では2022年度の骨太の方針（以下、「骨太の方針2022」）を分析対象として選定しました。これは、連関度評価の妥当性を個別事例で検証する際、筆者の実務経験に基づく補助的な判断が可能であったためです。

表3-1　骨太の方針のページ数と章立て

年度	ページ数	章立て
2013	36	第１章デフレ脱却・日本経済再生と目指すべき姿第２章強い日本、強い経済、豊かで安全・安心な生活の実現第３章経済再生と財政健全化の両立第４章平成26年度予算編成に向けた基本的考え方
2014	34	第１章アベノミクスのこれまでの成果と今後の日本経済の課題第２章経済再生の進展と中長期の発展に向けた重点課題第３章経済再生と財政健全化の好循環第４章平成27年度予算編成に向けた基本的考え方
2015	44	第１章現下の日本経済の課題と基本的方向性第２章経済の好循環の拡大と中長期の発展に向けた重点課題第３章「経済・財政一体改革」の取組－「経済・財政再生計画」第４章平成28年度予算編成に向けた基本的考え方
2016	46	第１章現下の日本経済の課題と考え方第２章成長と分配の好循環の実現第３章経済・財政一体改革の推進第４章当面の経済財政運営と平成29年度予算編成に向けた考え方
2017	44	第１章現下の日本経済の課題と考え方第２章成長と分配の好循環の拡大と中長期の発展に向けた重点課題第３章経済・財政一体改革の進捗・推進第４章当面の経済財政運営と平成30年度予算編成に向けた考え方
2018	72	第１章現下の日本経済第２章力強い経済成長の実現に向けた重点的な取組第３章「経済・財政一体改革」の推進第４章当面の経済財政運営と2019年度予算編成に向けた考え方
2019	75	第１章現下の日本経済第２章 Society 5.0時代にふさわしい仕組みづくり第３章経済再生と財政健全化の好循環第４章当面の経済財政運営と令和２年度予算編成に向けた考え方
2020	37	第１章新型コロナウイルス感染症の下での危機克服と新しい未来に向けて第２章国民の生命・生活・雇用・事業を守り抜く第３章「新たな日常」の実現
2021	38	第１章新型コロナウイルス感染症の克服とポストコロナの経済社会のビジョン第２章次なる時代をリードする新たな成長の源泉～４つの原動力と基盤づくり～第３章感染症で顕在化した課題等を克服する経済・財政一体改革第４章当面の経済財政運営と令和４年度予算編成に向けた考え方
2022	36	第１章我が国を取り巻く環境変化と日本経済第２章新しい資本主義に向けた改革第３章内外の環境変化への対応第４章中長期の経済財政運営第５章当面の経済財政運営と令和５年度予算編成に向けた考え方
2023	45	第１章マクロ経済運営の基本的考え方第２章新しい資本主義の加速第３章我が国を取り巻く環境変化への対応第４章中長期の経済財政運営第５章当面の経済財政運営と令和６年度予算編成に向けた考え方
2024	53	第１章成長型の新たな経済ステージへの移行第２章社会課題への対応を通じた持続的な経済成長の実現～賃上げの定着と戦略的な投資による所得と生産性の向上～第３章中長期的に持続可能な経済社会の実現～「経済・財政新生計画」～第４章当面の経済財政運営と令和７年度予算編成に向けた考え方
2025	51	第１章マクロ経済運営の基本的考え方第２章賃上げを起点とした成長型経済の実現第３章中長期的に持続可能な経済社会の実現第４章当面の経済財政運営と令和８年度予算編成に向けた考え方

なお、2020年度の骨太の方針は前年度からページ数が大幅に減少していますが、当時新型コロナウイルス感染症への対応が喫緊の課題であることから、「今後の政策対応の大きな方向性に重点を置いた」としており、2019年度の骨太の方針に記載の内容は「本基本方針に記載が無い項目についても、引き続き着実に実施する」とあります。

また、本文に加え、スライド資料として概要がまとめられたものが内閣府より公開されています。一例として、「骨太の方針2022」全体の概要を下記に示します。これらのスライドは今回分析の対象から外しています。

図3-1　「骨太の方針2022」の全体概要（出典：内閣府「経済財政運営と改革の基本方針2022」）

b) 前処理

骨太の方針はPDFデータであることから、分析にあたってテキストデータへの変換を行いました。テキスト化にあたってはPythonライブラリであるpdfplumberを用いています。また、ページ末尾にまとめられている注釈は本文内に挿入する処理を施しました。その例を下記に示します。

「骨太の方針2022」PDFの一部抜粋

上記のテキスト化

イノベーション創出の拠点である大学の抜本強化[7][ソフト・ハード一体となった教育研究環境の整備等の共創拠点化の推進等。]を図る。世界と伍する研究大学の実現に向け、競争的な環境の下で大学ファンドから支援を受ける国際卓越研究大学の持続的なイノベーション創出と自律化に資するよう、専門人材の経営参画等のガバナンス体制を確立するとともに、必要な規制改革等の対応を早期に実行していく。地域の中核大学等が、特色ある強みを発揮し、地域の経済社会の発展等への貢献を通じて切磋琢磨できるよう、産学官連携など戦略的経営の抜本強化を図る[8][地域中核・特色ある研究大学総合振興パッケージ」(令和4年2月1日総合科学技術・イノベーション会議決定)に基づく。]。
イノベーションの担い手である若い人材に対する支援を強力に推進する。博士課程学生の処遇向上を始め、未来ある研究者の卵たちにキャリアパス全体として魅力的な展望を与え、研究に専念できる支援策を深化させる。寄附に基づく「トビタテ！留学JAPAN」[9][官民協働で海外留学を支援する取組。]の発展的推進を含め、若者の世界での活躍を支援し、コロナ禍で停滞した国際頭脳循環の活性化に取り組む。
(3)スタートアップ(新規創業)への投資
スタートアップは、経済成長の原動力であるイノベーションを生み出すとともに、環境問題や子育て問題などの社会課題の解決にも貢献しうる、新しい資本主義の担い手である。

3-2. 行政事業レビューシート

本節では、後続の連関度分析の前提として、行政事業レビューシートの構造およびデータの基本的な特徴を整理します。

本記事で分析対象とする「骨太の方針2022」は2023年度予算の方針を定めるものであるため、行政事業レビューシートについては2023年度（令和5年度）分を参照します。「政府の行政改革」（内閣官房行政改革・効率化推進事務局）サイトからデータベースとしてまとめられているものを入手しました。

レビューシートに記載されている主な項目は下記のとおりです。分析においては、「事業の目的」「現状・課題」「事業概要」のテキストを主な分析対象として、骨太の方針との連関度評価に用います。また、予算情報については、「当初予算」「補正予算」「繰越し額」「予備費」を合算した予算額の合計を事業規模の指標として用います。

表3-2　レビューシートの主な項目

主な項目	詳細
事業所管部局の情報	省庁、部局、課室、レビューシート作成責任者
事業の基本情報	事業番号、事業開始・終了年度、会計区分、根拠法令、関係する計画・通知等
事業の概要	事業の目的、現状・課題、事業概要
予算情報	当該年度から3年前までの各年度の当初予算・補正予算・繰越し額・予備費・執行額・執行率、翌年度予算要求額、予算内訳
事業の効果発現経路	インプット（予算額・執行額）、アクティビティ（誰を対象に何をするか）、アウトプット（活動目標・活動指標）、アウトカム（成果目標・成果指標）
点検・評価	事業所管部局による点検結果・評価、外部有識者による点検、改善点・反映状況
支出先	支出先上位者リスト、費目・使途

続いて、データベースに集約されている5,440事業について、主要な項目ごとに定量的な特徴を概観します。

まず、府省庁別の事業件数を図3-2に示します。最多は厚生労働省の1,166事業で、全体の約2割を占めています。

府省庁別の予算額の合計を図3-3に示します。この予算額は、当初予算や補正予算に加え、繰越しや予備費等の金額を含めたものです。厚生労働省が突出して大きく、全体の約6割を占めています。

府省庁別の予算種別の割合を図3-4に示します。当初予算が占める割合が大きい省庁としては、厚生労働省、復興庁、文部科学省があり、いずれも約9割を占めています。一方、総務省や経済産業省では当初予算の割合は2割以下と少なく、繰越し・予備費等が多くなっています。補正予算の割合が大きい省庁としては、外務省、内閣官房、環境省が挙げられます。

2023年度予算合計の金額帯に応じた事業件数を図3-5に示します。予算額が1億円以上の事業が過半を占めていることが分かります。

各省庁の開始年度別の事業数は図3-6のとおりです。2015年度以降に開始された事業が約半数を占めており、最も事業数が多いのは2023年度の526事業（全体の約1割）となっています。

最後に、要求通過率（=当初予算／予算要求額）の分布を確認します。要求通過率とは、2022年度の夏に各省庁が翌年度の当初予算として要求した金額（予算要求額）に対して、実際の2023年度当初予算の割合を算出したものです。ここで、予算要求額については、2022年度（令和4年度）分のレビューシートを参照し、2023年度レビューシートの「関連する過去のレビューシートの事業番号」と同じ番号の2022年度レビューシートを参照することで、シート間の紐づけを行っています。紐づけのできた事業は3,551で、その要求通過率の分布を図3-7に示します。要求額通り（要求通過率=1）の事業が全体の32%、要求額より大きいものが14%、小さいものが54%となっていました。

4. 評価方法と結果

本章では、「骨太の方針2022」の本文と行政事業レビューシートの事業概要との連関度を評価するため、①統計的手法、②深層学習による手法、③LLM（大規模言語モデル）による手法の3つのアプローチをそれぞれ試し、その有効性を検討しました。

4-1. 統計的手法（TF-IDF）

最初に、先述の先行事例「第5期科学技術基本計画と行政事業レビューシート分析」でも実施されていたTF-IDFによる文章のベクトル化とコサイン類似度による連関度の評価を行いました。

a) TF-IDFによる連関度評価の方法

TF-IDFは、文章中の単語の「重要度」を数値化する方法であり、検索エンジン、レコメンド、キーワード抽出などに幅広く使われています。下表のとおり用語頻度TFと逆文書頻度IDFの積として定義されます。

表4-1　TF-IDFの定義

項目	意味	定義
TF (Term Frequency, 用語頻度)	文書中でどれくらい出てくるか	$$ \mathrm{tf}(n(i,w)) = 1 + \log n(i,w) $$ ただし、 $n(i,w)$：文書$i$における、単語$w$の出現回数
IDF (Inverse Document Frequency, 逆文書頻度)	全体でどれくらい珍しいか	$$ \mathrm{idf}(w)=\log \dfrac{N}{\mathrm{df}(w)} $$ ただし、 $\mathrm{df}(w)$：$N$個の文書の中で、ある単語$w$が一度以上出現した文書の数
TF × IDF	特定の文書で頻出し全体では珍しい単語ほど高得点	$$ \mathrm{tf}(n(i,w))\cdot\mathrm{idf}(w) $$ $$ = (1+\log n(i,w))\cdot \log \dfrac{N}{\mathrm{df}(w)} $$

文書全体の語彙集合（ボキャブラリー）を$V = \{w_1, w_2, \cdots, w_{|V|}\}$とすると、文書$i$のベクトル$\mathbf{d}_i$は、次式で表現されます。

$$ \mathbf{d}i = \left( \mathrm{tfidf}(i,w_1), \mathrm{tfidf}(i,w_2), \cdots, \mathrm{tfidf}(i,w{|V|}) \right) $$

ここで、$\mathrm{tfidf}(i,w)$は文書$i$における単語$w$のTF-IDFです。

このとき、文書$i$と$j$の類似度は、両者の文書ベクトルのコサイン類似度として次式で計算されます。

$$ \mathrm{sim}(i,j)=\frac{\mathbf{d}_i \cdot \mathbf{d}_j}{\|\mathbf{d}_i\|\|\mathbf{d}_j\|} $$

本記事では、骨太の方針を句点で区切って得られた480文と、5,440事業の概要文（*6）のそれぞれを1つの文書として扱い、これらを対象にTF-IDFを計算しました。

TF-IDFの計算には、文章を単語単位に分割する前処理（分かち書き）が必要です。ここではPythonライブラリ SudachiPy を用いて形態素解析を行い、名詞のみを抽出しました。なお、接頭辞＋名詞（例：「中小」＋「事業者」）は一つの語として扱い、数値や日付は分析対象から除外しています。分かち書きの例を下記に示します。

TF-IDFを計算したのち、5,440事業について、骨太の方針480文それぞれとのコサイン類似度を計算し、事業ごとにコサイン類似度の最大値を求めて「骨太の方針との連関度」としました。

*6: 行政事業レビューシートの「事業の目的」「現状・課題」「事業概要」を結合して１つの文章としています。

b) TF-IDFによる連関度評価の結果

骨太の方針との連関度のヒストグラムを下図に示します。連関度の平均値は0.233、中央値は0.204です。分布形状はおおよそ対数正規分布であり、骨太の方針との連関の有無によって集団が明確に分離しているわけではなく、全体が連続的に分布していることが確認できました。特定のキーワードで一致が見られる場合は類似度が上昇しますが、それ以外の文書対では低スコアとなっており、結果として右に裾の長い分布となっていると考えられます。

また、特定の骨太の文章に対する各事業の連関度評価の結果を確認したところ、適切な評価とは言えない例も散見されました。図4-3では、ある骨太の一文について、本来直接関係ない事業の連関度が関係ある事業よりも高く評価されてしまった例を示しています。ここでは、骨太の方針に紐づく事業に特有の用語（「建築BIM」）が骨太の方針において別の表現（「建築物の形状、材質、施工方法に関する3次元データ」）で表されており、連関度が低くなっています。一方、紐づかない事業であっても事業概要に骨太と同じ用語が複数含まれていると、連関度が高く評価されてしまう場合があることも確認できました。

4-2. 深層学習による手法

TF-IDFでは単語の一致のみを判定しており、意味内容の類似性が考慮できなかったことから、深層学習による手法を用いた評価を試みました。ここではテキスト埋め込みモデルである多言語E5 (multilingual-e5-large) を用いてテキストのベクトル化を行い、コサイン類似度による連関度評価を行います。

a) 多言語E5による連関度評価の方法

多言語E5は2023年に公開されたテキスト埋め込み（ベクトル化）モデルであり、大規模な対照学習データを用いることで高精度にテキストの意味を表現できる点に特徴があります。TF-IDFのように単語の出現頻度や一致のみに基づくのではなく、文脈や語の意味的関係性を考慮した埋め込みが可能となっています。

ベクトル化の対象となるテキストや、コサイン類似度の算定方法についてはTF-IDFによる連関度評価の場合と同様です。具体的には、事業側のテキストとして「事業の目的」「現状・課題」「事業概要」の3項目を連結したものを用い、骨太の方針については本文を句点で区切った文単位のテキストを用いています。

一方で、多言語E5には入力長が最大512トークンまでという制約があり、上限を超えた場合はテキストが自動的に切り捨てられます。この点について事前にトークン数を確認したところ、5,440事業中、675事業（12.4%）で超過が発生していました。これは、複数項目を連結しているため一部の事業でテキストが長くなっているためです。ただし、「事業の目的」に限定すると、512トークンを超過する事業は1件のみとなっていました。

事業の要点が主に前半（特に「事業の目的」）に記載されていることを踏まえ、512トークンを超過する場合には既定の挙動に従って後半のテキストが切り捨てられる前提で処理を行うこととしました。

b) 多言語E5による連関度評価の結果

骨太の方針との連関度のヒストグラムを下図に示します。連関度の平均値および中央値はともに0.861であり、分布形状はおおよそ正規分布となっていることが確認できました。TF-IDFの場合とは異なり、学習に基づいて意味的な近さに応じて出力が最適化されており、結果として正規分布に近い形状となっていると考えられます。

また、「TF-IDFによる連関度評価の結果」で行った確認と同様に、骨太の文章に対する各事業の連関度を確認しました。TF-IDFの場合には、本来紐づく「建築BIM加速化事業」の連関度が、紐づかない「都市行政情報データベース運営経費」の連関度を大きく下回っていましたが、多言語E5の評価では、わずかに「建築BIM加速化事業」の方が連関度が高くなっていました。この点は、E5が単語一致に依存せず意味的な類似性を捉えていることによる改善と解釈できます。

一方で、多言語E5においても、「地理地殻活動の研究に必要な経費」のように、本来は紐づかない事業であっても連関度が高く評価されるケースが確認されました。

この要因として、いくつかの可能性が考えられます。第一に、E5は大規模な一般テキストを用いて学習された汎用的な埋め込みモデルであり、行政文書のような特定の文脈における学習が十分に行われていない可能性があります。そのため、「3次元データ」といった抽象的に共通する語彙や概念が含まれている場合に、実際の政策的な関係性とは異なる形で連関度が高く評価されることがあると考えられます。

第二に、E5による評価はあくまでテキスト間の意味的な近さに基づくものであり、「当該施策を推進する文脈にあるか」といった論理的・政策的な整合性までは直接的に評価することができません。つまり、「関連するテーマに言及している」ことと、「その事業の推進を支持する文言となっている」ことは必ずしも一致せず、この差異が連関度評価の精度低下につながっている可能性があります。

以上より、多言語E5はTF-IDFと比較して意味的な対応関係をより適切に捉える一方で、政策的な文脈や論理構造を踏まえた評価には限界があるという示唆が得られました。

4-3. LLMによる手法

単に意味内容が近いかどうかだけでなく、論理的に骨太の方針の記述が事業の実施内容と対応するか判断するため、LLMによる連関評価を行うこととしました。

a) LLMによる連関度評価の方法

評価にあたっては、人間の暗黙的な判断の観点を整理・分解し、論理的に順序立てた判定フローを作成しました（図4-6）。LLMには、各事業について行政事業レビューシートの「事業名」「事業の目的」「現状・課題」「事業概要」と「骨太の方針」全文を与え、この判定フローに沿って連関度ランクおよび関係する骨太方針の記述を出力させています。

本記事では、連関度ランクを下記の通り0～4の5段階で評価しています。

ランク0：骨太の方針に対応する記述が存在しない
ランク1：理念や背景・課題のレベルでのみ関連する
ランク2：方向性としての関連はあるが、骨太の方針の記載と事業の実施内容が対応するとは言えない。
ランク3：骨太の方針に記載された施策行為を具体的に実施する事業である
ランク4：骨太の方針において特に強く推進・加速・重点化等が求められている施策を実施する事業である

連関度評価にあたっては、OpenAIのGPT-5.2およびGeminiのgemini-3-pro-previewのAPIを用い、同一のプロンプトおよび入力条件を適用しました。再現性を確保するため、生成のランダム性を決めるパラメータであるtemperatureは0とし、各事業について1回の推論で評価を実施しています。

ただし、gemini-3-pro-previewはGPT-5.2と比べて処理時間が大幅に長く、7倍以上の処理時間を要しました。このため、全5,440事業に対する評価はGPT-5.2でのみ実施し、gemini-3-pro-previewでは対象を国土交通省所管の事業に限定しています。

b) LLMによる連関度評価の結果

以下では、国土交通省が所管する677事業を対象としてGPT（GPT-5.2）とGemini（gemini-3-pro-preview）の2つのモデルによる評価結果を比較します。なお、GPTによる全5,440事業の評価結果の詳細については次章で扱います。

まず、両モデルの事業数に占める連関度ランクの割合を図4-7に示します。GPTの結果では、ランク2と判定された事業が全体の約2/3を占めている一方、最高ランクのランク4の該当は1件のみと判定されていました。

次に、GPTとGeminiの評価結果の一致・不一致を確認するため、両モデルのランクの組み合わせごとの事業数をヒートマップとして図4-8に示します。対角線上に位置する320事業（全体の約半数）が両モデルで一致しており、一定の整合性が確認されます。

一方で、不一致となった事業については、GPTの方が高いランクを付与したものが160事業、Geminiの方が高いものが197事業となっており、全体としてはGPTの方が相対的に慎重な傾向を示しました。

さらに、TF-IDFおよび深層学習による連関度評価において確認した3つの事業を対象に、LLMによる評価結果の妥当性を個別に検証します。

まず、骨太の方針に明確に紐づく事業である「建築BIM加速化事業」の評価結果を表4-2に示します。本事業は骨太の方針において推進の文脈で記載されていることから、ランク3またはランク4となることを想定していました。

実際の評価結果は、GPTではランク3、Geminiではランク2となり、Geminiの評価が相対的に低い結果となりました。連関の根拠として引用した骨太の方針の文章を確認すると、GPTは想定していた2か所の該当箇所を適切に引用しており、判断理由も判定フローに則った妥当な内容となっていました。一方、Geminiは関連する文章の抜粋が不十分であり、正しく判定できていないことが分かりました。

表4-2　「建築BIM加速化事業」の連関度評価結果

モデル	連関度ランク	関連すると判断した「骨太の方針」の文章	判断理由
GPT-5.2	3	5Gネットワーク等の整備拡大による超高速・超低遅延・多数同時接続環境をいかし、大学・民間等の技術開発の促進に向けたインフラデータのオープン化・データ連携の推進、中小建設企業へのICT施工の普及支援等による i-Construction の推進など、インフラ分野のDXを加速し、生産性を高める。災害リスクや人口動態の変化を見据えた立地適正化を促進するとともに、建築・都市のDX等を活用しつつ都市再生を促進し、公園の利活用等による人間中心のまちづくりを実現する。質の高い住宅等の流通等を図るため、IoT住宅の普及や不動産情報の活用等の取組を総合的に進める。	骨太2022に「建築・都市のDX」や「中小建設企業へのICT施工の普及支援等によるi-Constructionの推進」等の施策意思があり、建築BIMのモデル作成費を補助してBIM活用を促進する本事業は、建築分野のDXを具体的手段（導入・普及支援）として直接実装する内容に当たる。一方で、骨太本文にBIMモデル作成費補助等の強度上昇（拡充・加速等）が個別施策行為として明示されているとは言い切れないためランク4にはしない。
gemini-3-pro-preview	2	質の高い住宅等の流通等を図るため、IoT住宅の普及や不動産情報の活用等[154]の取組を総合的に進める。	骨太の方針において、引用箇所の注釈[154]に「BIMの活用」が明記されており、事業内容と方向性は合致している。しかし、記述は「取組を総合的に進める」といった抽象的な表現にとどまり、本事業のような具体的な補助や支援策（施策行為）までは特定されていないため。

続いて、TF-IDFでは連関度が高く評価されていた「都市行政情報データベース運営経費」の評価結果を表4-3に示します。連関度の評価は両モデルともにランク2（一定の連関はあるが、骨太に示された施策行為を直接実装する事業ではない）で一致しています。しかし、判断の根拠には両モデルで明確な差が見られました。

GPTは、骨太の方針から複数の関連箇所を適切に引用した上で、政策の方向性との対応関係を整理しつつも、当該事業を直接的に位置付ける記述までは存在しないことを理由にランク2と判定しています。すなわち、意味的な関連性と政策的な位置付けを切り分けた妥当な評価となっています。これに対し、Geminiは判断理由において「建築・都市のDX」を対応する施策として挙げている点に問題があります。この取り組みは実際には当該事業と直接的な関係があるとは言えず、さらに引用された骨太の方針の文章にも該当する文言は含まれていません。結果として、表面的な概念の類似性に基づく対応付けとなっており、妥当性に欠ける評価となっています。

表4-3　「都市行政情報データベース運営経費」の連関度評価結果

モデル	連関度ランク	関連すると判断した「骨太の方針」の文章	判断理由
GPT-5.2	2	5Gネットワーク等の整備拡大による超高速・超低遅延・多数同時接続環境をいかし、大学・民間等の技術開発の促進に向けたインフラデータのオープン化・データ連携の推進、中小建設企業へのICT施工の普及支援等による i-Construction の推進など、インフラ分野のDXを加速し、生産性を高める。デジタル庁を中心に、デジタル社会の実現において不可欠なデータ基盤強化を図るため、「包括的データ戦略」に基づき、医療・介護、教育、インフラ、防災に係るデータ・プラットフォームを早期に整備する。	都市計画・都市施設等のデータを収集・集約し提供する事業は、骨太2022の「インフラデータのオープン化・データ連携の推進」や「インフラに係るデータ・プラットフォーム整備」と方向性としては対応する。一方、骨太本文は都市計画データベースの運営・改良や当該DBの具体的整備を特定して明示しておらず、施策行為レベルで当該事業を主要手段として直接実装する記述までは確認できないため。
gemini-3-pro-preview	2	5Gネットワーク等の整備拡大による超高速・超低遅延・多数同時接続環境をいかし、大学・民間等の技術開発の促進に向けたインフラデータのオープン化・データ連携の推進、中小建設企業へのICT施工の普及支援等による i-Construction の推進など、インフラ分野のDXを加速し、生産性を高める。	骨太の方針には「インフラデータのオープン化・データ連携の推進」や「建築・都市のDX」を進める旨の記述があり、都市計画データの収集・提供を行う本事業はこれに対応する施策である。しかし、事業内容は既存データベースの運営・改良であり、骨太の方針において当該事業の機能を抜本的に強化・拡充するといった具体的な記述は見当たらないため、ランク2とする。

最後に、多言語E5で連関度が高く評価されていた「地理地殻活動の研究に必要な経費」の評価結果を表4-4に示します。この事業についてGPTはランク2、Geminiはランク3と評価していますが、GPTの評価の方が妥当であると考えられます。両者の評価の違いは判定フローのSTEP3「施策行為レベルでの対応確認」における判定の違いによるものですが、当該事業の実施内容は骨太の方針の文章と方向性のレベルでのみ一致するものであり、施策行為レベルでは対応しないものと判断するのが妥当です。Geminiの判定は抽象的な内容の類似性をもって直接的な対応とみなしてしまっており、評価としては過大となっていました。

表4-4　「地理地殻活動の研究に必要な経費」の連関度評価結果

モデル	連関度ランク	関連すると判断した「骨太の方針」の文章	判断理由
GPT-5.2	2	切迫する大規模地震災害、相次ぐ気象災害、火山災害、インフラ老朽化等の国家の危機に打ち勝ち、国民の生命・財産・暮らしを守り、社会の重要な機能を維持するため、「国土強靱化基本計画」に基づき、必要・十分な予算を確保し、自助・共助・公助を適切に組み合わせ、ハード・ソフト一体となった取組を強力に推進する。 …激甚化・頻発化する水害・土砂災害や高潮・高波への対策として、流域治水の取組を推進する。インフラ老朽化対策やスマート保安を加速するとともに、DXの推進などによるTEC－FORCE及び気象台等の防災体制・機能並びに消防団を含む消防防災力の拡充・強化、次期静止気象衛星やデジタル技術等を活用した防災・減災対策の高度化を推進する。	防災・減災、国土強靱化の推進という骨太の政策意思とは整合するが、骨太本文の記述は主として防災施策・体制強化やインフラ対策であり、国土地理院による測地・地殻活動研究（プレート固着把握、強靱な位置情報基盤構築、地盤災害推計等）という施策行為を特定して直接実装する記述までは確認できないため。
gemini-3-pro-preview	3	さらに、準天頂衛星等の更なる整備や地理空間(G空間)情報の高度活用及び衛星データの利活用を図る。	骨太の方針に明記された「地理空間(G空間)情報の高度活用及び衛星データの利活用」や「デジタル技術等を活用した防災・減災対策の高度化」に対し、本事業は衛星技術や測地技術を用いた高精度な地理空間情報の構築や防災・減災に向けた研究開発を行うものであり、方針に示された施策を直接実施する事業であると判断できるため。

以上のように、取り上げた3つの事業ではいずれもGPTの評価や判断理由が妥当な結果となっていました。GPTによる評価は、単なる意味的な類似性にとどまらず、「当該事業が骨太の方針における施策行為としてどの程度直接的に位置付けられているか」という観点を踏まえた判定が一貫して行われているように見受けられました。

一方でGeminiについては、関連するキーワードや概念の一致に基づいて連関度を高く評価する傾向が見られ、結果として本来は方向性レベルの一致にとどまる事業についても、施策として直接対応するものと解釈してしまうケースが確認されました。このことから、LLMによる評価において、意味的な近さと政策的な位置付けの違いをどこまで厳密に区別できるかが重要であると考えられます。

4-4. 手法のまとめ

以上のように、連関度評価の手法として、TF-IDF、テキスト埋め込み（多言語E5）、LLMの3つの手法を検討しました。表4-5に示すように、各手法はそれぞれ異なる特徴を有しており、評価対象や目的に応じて使い分けることが望ましいと考えられます。各事業と政策テキストの実質的な対応を評価するという本記事の目的に対しては、LLMが最も整合すると判断し、その結果を用いて以降の分析を行うこととしました。

表4-5　連関度評価手法の比較

手法	評価の仕組み	メリット	デメリット
TF-IDF	単語の出現頻度に基づき文書をベクトル化し、語彙の一致度で類似度を評価	・計算コストが低く大規模データに適用しやすい・再現性が高く結果が安定している	・分かち書きを行う必要がある・語彙の一致に依存するため、意味的な類似性を捉えにくい・文脈や政策的な位置づけの違いを考慮できない
多言語E5	深層学習モデルにより文書を意味ベクトルに変換し、ベクトル間の距離で類似性を評価	・語彙の一致に拠らず、意味的な類似性を捉えることが可能・文脈を反映した評価が一定程度可能	・評価はベクトル距離に基づくため、連関の理由や性質を説明できない・政策文書における論理的な位置づけや、施策行為レベルでの対応関係を評価することは困難
LLM	文脈理解と推論によりテキスト間の関係性を解釈し、判定基準に基づいて評価	・文脈理解に基づいた解釈が可能・政策的な文脈と事業の実施内容の対応関係を評価可能	・推論に時間を要する・API利用に伴うコストが発生・モデルや設定によって出力結果が変動する

5. 骨太の方針と予算の関係

本章では、骨太の方針と予算編成との関係について、連関度評価の結果をもとに分析を行います。連関度については、LLMによる評価のうち、全5,440事業を対象に実施したGPT（GPT-5.2）の評価結果を用います。

また、連関度ランク4と判定された事業は全体の0.4％と極めて少数であったため、本章ではランク3（骨太の方針に記載された施策行為を具体的に実施する事業）に統合して分析しています。

5-1. 連関度ランクの分布と要求通過率の関係

本節では、どのような事業で連関度ランクが高くなる傾向にあるかを整理した上で、要求通過率との関係を確認します。

(1) 予算種別と連関度ランク

予算種別ごとの事業件数に占める連関度ランクの割合を図5-1に示します。ここでは、予算種別を①2023年度当初予算の有無、②前年度（2022年度）補正予算の有無の2軸により事業を4分類しています。

連関度ランク3の割合は、前年度補正予算がついている事業で高く、特に「当初予算がつかず前年度補正予算のみついている事業」において最も高い結果となりました。この結果は、補正予算の対象となる事業の方が、そうでない事業よりも骨太の方針との連関が強い傾向にある可能性を示唆する結果となっています。

(2) 府省庁別の連関度ランク

府省庁別の事業件数に占める連関度ランクの割合を図5-2に示します。連関度ランク３の割合が最も多かったのは復興庁で、次いで内閣官房、デジタル庁となっていました。逆に、割合が小さかったものは財務省、外務省、厚生労働省の順となっています。

復興庁は東日本大震災からの復興を目的として2012年に設置されており、骨太の方針の「防災・減災、国土強靱化の推進、東日本大震災等からの復興」といった重点分野との関係が深いことが背景にあると考えられます。また、内閣官房は内閣の補助機関であり、横断的政策の企画・総合調整機能を担うため、骨太の方針の文言と対応する事業が多いようです。デジタル庁はコロナ禍を契機とした行政のデジタル化の遅れを背景に設立され、骨太の方針2022においてもDXが重点分野として明示されていることから、政策文書との一致が生じやすいと考えられます。

一方、財務省や外務省、厚生労働省は制度運営や対外関係、社会保障といった基盤的・継続的な行政機能を担っており、骨太の方針において個別事業との直接的な対応関係が相対的に弱くなった可能性があると考えられます。

(3) 予算規模と連関度ランク

予算規模ごとに、事業件数に占める連関度ランクの割合を確認した結果を図5-3に示します。予算規模の大きいグループほど、連関度ランク3の占める割合が大きくなっていることが分かります。これは、大規模な事業ほど政策的に重要な分野に位置づけられ、重点的に予算が配分されやすいためだと考えられます。

(4) 事業開始年度と連関度ランク

事業開始年度の区分ごとに、事業件数に占める連関度ランクの割合を確認した結果を図5-4に示します。分析対象とした骨太の方針2022に近いほど連関度ランク３の占める割合が高くなっていることが確認できます。一方、2023年度および2024年度開始の事業では2022年度開始に比べて割合が低下しています。その要因として、2022年度開始事業が骨太の方針2022の重点分野より直接的に対応している一方で、より新しい事業は骨太の方針2023以降の内容と対応している可能性があると考えられます。

(5) 連関度ランクと要求通過率

連関度ランクごとに、要求通過率（2023年度の当初予算 / 予算要求額）を確認した結果を図5-5に示します。なお、要求通過率については、全5,441事業中、要求額および当初予算額の双方が確認できた3,551事業のみで得られていることに留意が必要です。

図から、連関度ランクが高い事業ほど、全体として要求通過率が低くなる傾向があることが分かります。要因として、ランクの高い重点施策ほど各省庁の要求額が膨張し、その分財務省の削減幅が大きくなっている可能性があると考えられます。

5-2. 回帰分析による影響要因の評価

前節では、連関度ランク、予算規模、補正予算といった項目間の関係を確認しました。その結果、連関度ランクが高い事業ほど要求通過率が低い傾向が観察されました。しかし、これらの要因は相互に関連している可能性があり、単純な集計結果のみから各要因の独立した影響を評価することは困難です。

そこで本節では、回帰分析を用いて複数の要因を同時に考慮し、各要因が要求通過率に与える影響を評価することとします。

(1) モデルの概要

要求通過率は分布の歪みが大きいため、その対数を目的変数とした線形回帰モデルを作成しました。モデルの作成にはPythonの統計モデリングライブラリであるstatsmodelsを用いて最小二乗法（OLS）によりパラメータ推定を行っています。

説明変数を表5-1に示します。なお、目的変数の要求通過率は2023年度の当初予算額を要求額で割った値であるため、説明変数の補正予算および前年度予算額については、目的変数と直接関係することを避ける観点から、2022年度の値を用いています。

表5-1　回帰分析に用いた説明変数

変数名	内容	型	備考
連関度ランク	骨太の方針2022との連関度（0～3）	カテゴリ（基準：ランク0）	ランク4は該当事業数が少数であったため、ランク3に統合
補正予算	2022年度補正予算について「正」「負」「なし」の3区分	カテゴリ（基準：「なし」）	追加配分（正）と減額（負）で政策的な意味が異なるため、カテゴリ変数として扱う
事業開始年度	「2021年度以前・不明」「2022年度」「2023年度以降」の3区分	カテゴリ（基準：「2021年度以前・不明」）	解釈上の安定性を考慮し3区分に整理
log(前年度予算額)	2022年度予算額（計）の対数変換	連続	log(1 + 2022年度予算（計））を使用。 2023年度の新規事業は2022年度予算がないため0として扱う
新規事業フラグ	2023年度からの新規事業か否か	ダミー	新規事業については前年度予算額を0として扱ったことから、その影響を識別するために設定
所管省庁	事業を所管する府省庁	カテゴリ（基準：財務省）	基準カテゴリとして、予算査定を担う財務省を設定

(2) 推定結果

主要な推定結果を表5-2に示します。決定係数（R²）は0.063、自由度調整済み決定係数は0.057であり、本モデルは要求通過率の変動の一部を説明しています。説明力は限定的ではあるものの、予算査定が多様な要因に影響されることを踏まえれば、連関度と予算要求率の関係について一定の傾向を示すものと解釈されます。

なお、本分析では、有意水準5%を基準として統計的有意性を判断しています。

表5-2　要求通過率を目的変数とした回帰分析結果

変数	係数	p値	解釈
ランク1	-0.0721	0.178	約6.9%低いが有意でない
ランク2	-0.1396	0.002	約13.0%低い
ランク3	-0.2320	0.001	約20.7%低い
補正予算（正）	-0.4095	0.000	約33.6%低い
補正予算（負）	0.0329	0.738	約3.3%高いが有意でない
開始年度=2022年度	-0.1496	0.060	約13.9%低いが有意でない
開始年度=2023年度以降	0.1712	0.405	約18.7%高いが有意でない
log(前年度予算額)	0.0423	0.000	約4.3%高い
新規事業	-0.1303	0.508	約12.2%低いが有意でない
デジタル庁	0.3680	0.327	約44.5%高いが有意でない
内閣官房	0.5114	0.042	約66.7%高い
内閣府	0.4976	0.001	約64.5%高い
厚生労働省	0.2945	0.035	約34.2%高い
国土交通省	0.2814	0.053	約32.5%高いが有意でない
外務省	0.4855	0.002	約62.5%高い
復興庁	0.5198	0.002	約68.1%高い
文部科学省	0.2090	0.149	約23.3%高いが有意でない
法務省	0.6155	0.002	約85.0%高い
環境省	0.6064	0.000	約83.4%高い
経済産業省	0.3406	0.023	約40.6%高い
総務省	-0.2370	0.135	約21.1%低いが有意でない
農林水産省	0.2426	0.107	約27.5%高いが有意でない
防衛省	0.5699	0.000	約76.8%高い

注：
・従属変数は要求通過率の対数）
・係数は exp(係数) により割合変化として解釈
・基準カテゴリはランク0、補正予算なし、開始年度=2021年度以前、府省庁=財務省

(3) 主要な結果の解釈

連関度ランクについては、ランクが高くなるほど要求通過率が低くなる傾向が確認されました。特に、ランク2およびランク3において統計的に有意な負の係数が確認されています。

補正予算については、「正の補正（追加配分）」がついた事業において、要求通過率が有意に低くなる傾向が確認されました。一方、「負の補正（減額）」については統計的に有意な影響は確認されませんでした。

事業開始年度について、2021年度以前と比較して2022年度は有意に予算通過率が低くなる傾向が確認されました。一方、2023年度以降については、有意な影響は確認されませんでした。

前年度予算額については、正の係数が統計的に有意であり、予算規模が大きい事業ほど要求通過率が高い傾向が確認されました。継続的に実施される大規模事業ほど、安定的に予算がついている可能性があります。

新規事業については、負の係数を持つものの、統計的に有意ではありませんでした。

所管府省庁については、基準とした財務省と比較して、多くの府省庁で正の係数が確認され、その一部は統計的に有意な結果となりました。この結果は、要求通過率が所管府省庁のような組織的な要因によっても左右される可能性を示唆しています。

5-3. 考察

本節では、前節で確認された実証結果を踏まえ、骨太の方針が予算編成過程において果たしている役割について考察します。

まず、本分析では、骨太の方針との連関度が高い事業ほど要求通過率が高くなるという関係は確認されず、むしろ逆の関係が観察されました。この結果は、「骨太の方針に沿った事業ほど予算が優先的に配分される」という直観的な理解とは必ずしも一致しないものです。

もっとも、このような直観が生じる背景には、次のような因果関係の想定があると考えられます。すなわち、骨太の方針は予算編成の基本方針として官邸主導で策定される文書であり、首相や内閣の方針を予算編成に反映させる機能を持つことが制度的に期待されています。「骨太の方針に記載される→重点政策として予算が優先的に配分される→要求通過率が上昇する」という仮説は、制度的には十分想定可能です。ここでは、この仮説を「政策優先仮説」と称することとします。

しかし、本分析で示された観察された傾向は、この政策優先仮説とは整合しません。したがって、骨太の方針への記載がそのまま要求通過率の上昇に結び付いているとは考えにくいことが示唆されます。

これに対し、観察結果とより整合的な仮説として、「要求膨張仮説」を考えることができます。骨太の方針は官邸主導で策定されますが、その文案作成には各省庁も関係しており、重点政策として要求を積極化しやすい根拠となるよう、各省庁が重点的に進めたい事業に関する文言を骨太の方針に盛り込むインセンティブが生じることも想定されます。すなわち、「各省が推進したい事業を骨太の方針に記載する→骨太の方針に記載された事業は予算獲得の確度が高いと見込み、各省が多めに要求する→財務当局はその分を見込んで査定する→結果として要求通過率が低下する」という経路が考えられます。

さらに別の仮説として、「対象事業特性仮説」も考えられます。予算編成をめぐっては、内閣、経済財政諮問会議、財務省、各省庁、与党など多くのプレーヤーの調整の上に成り立っており、骨太の方針自体そうした調整過程の成果物であるという見方も可能です。このため、骨太の方針に位置づけられる事業は、もともと政治的・政策的に争点化しやすい分野や、大規模で調整対象となりやすい分野に偏っている可能性があります。この場合、要求通過率の低さは、骨太の方針との連関そのものよりも、そうした事業の性質を反映している可能性があります。本分析では予算規模や所管省庁を統制しているものの、こうした構造的差異を完全に除去できているとは限りません。

以上を踏まえると、本分析の結果は、骨太の方針が個別事業への予算配分を直接押し上げるというよりも、各省庁の要求行動を通じて間接的に影響している可能性を示唆していると解釈できます。特に、骨太の方針は「予算を通しやすくなるシグナル」というよりも「要求を積極化させるシグナル」として作用している可能性がある、という解釈は、今回の実証結果と比較的整合的です。

ただし、本分析は観察データに基づくものであり、上記の仮説の因果関係を直接的に示すものではないことに留意が必要です。

6. おわりに

本章では、得られた知見を整理するとともに、今後の課題と展望について述べることとします。

6-1. まとめ

本記事では、「骨太の方針2022」と2023年度の行政事業レビューシートを対象として、政策文書と個別事業との関係をテキストデータに基づき定量的に評価し、さらにその結果と予算配分の関係について分析を行いました。

政策文書と個別事業との連関度を評価する手法として、TF-IDF、多言語E5、LLMの3手法を比較検討しました。TF-IDFは単語一致に基づくため、表現が違っていると意味的に対応している場合でも適切に連関を捉えられない場合があることを確認しました。多言語E5は意味的な近さを一定程度捉えることが可能でしたが、政策文書における論理的な位置づけや、施策行為レベルでの対応関係を評価に反映することには限界がありました。これに対してLLMは、単なる語句や意味の近さだけでなく、「当該事業が骨太の方針における施策としてどの程度直接的に位置づけられているか」という点を踏まえた評価が可能であり、本分析の目的に最も整合した手法であると判断しました。

このLLMによる連関度評価結果を用いて、全5,440事業について要求通過率との関係を分析した結果、骨太の方針との連関度が高い事業ほど要求通過率が低くなる傾向が観察されました。この傾向は、予算規模、補正予算、事業開始年度、所管府省庁といった要因を統制した回帰分析においても、統計的に有意に確認されました。

この結果は、「骨太の方針に沿っているほど予算が優先的に配分される」という直観的な理解とは整合しません。骨太の方針は、「予算を通しやすくするシグナル」というより、「重点政策として要求を積極化させるシグナル」として機能している可能性があり、その結果、要求額が膨張し査定過程において調整が行われることで、要求通過率が低く観察されているという仮説が考えられます。

6-2. 今後の展望・課題

本記事での分析にはいくつかの制約があり、今後の課題および展望として以下の点が挙げられます。

本分析は単年度（骨太の方針2022）のデータに基づくものであり、骨太の方針と予算編成との関係を一般化するには限界があります。今後は対象年度を拡張し、複数年にわたるデータを用いることで、骨太の方針と予算要求・配分との関係が経年的にどのように変化するかを検証することで、新たな知見が得られる可能性があります。
本分析は観察データに基づくものであり、骨太の方針と予算配分との因果関係を直接的に評価したものではありません。因果推論手法を用いた検証を取り入れることで、骨太の方針が予算編成に与える影響の有無やその大きさを、より厳密に評価することが可能となります。
本記事では事業単位で連関度を評価しましたが、逆に骨太の方針の文章を起点として、それぞれの記述に対応する事業を特定するアプローチも可能であると考えられます。このような分析により、政策文書の各記述が具体的にどの事業に対応しているかを可視化し、その対応関係をより精緻に把握できる可能性があります。
LLMによる連関度評価を用いて、分析にとどまらず、実務的な応用につながる可能性も考えられます。例えば、骨太の方針の各記述に対して関連する事業の候補を自動的に提示する仕組みを構築することで、行政文書作成時の役割分担の明確化や、関係部局への割り振りの効率化を図ることが考えられます。政策文書と実施事業との対応関係を半自動的に判定することで、行政実務の効率化に資することが期待されます。

以上のように、本分析は、政策文書と予算配分の関係を定量的に捉える試みであると同時に、LLMを活用した政策分析および行政実務の高度化に向けた基本的な枠組みとなり得るものです。今後は、分析対象の拡張や手法の精緻化を進めることで、より実務に接続した形での応用可能性を探っていくことを目標としたいと思います。

国の政策文書と予算編成の関係は？――「骨太の方針」と行政事業レビューシートを用いた定量分析