• #tax
  • #AI
  • #quiz-design
  • #education
開発eurekapuメモ

所得税の誤りやすい事例集をAIクイズに変換する設計メモ

きっかけ

国税庁が公開している「誤りやすい事例集」の所得税編を眺めていた。CSVに落としてみたら約320件ある。1件1件は「こういうケースで間違える人が多い」という短い記述だが、320件を並べると所得税の急所が浮かび上がってくる。

これをそのまま読んで暗記しても、実務では使えない。「なぜ間違えるのか」を掘らないと、似たケースで同じミスを踏む。

そこで、この事例集を素材にして「暗記ではなく理解を試すクイズ」を作れないか検討した。

納税地の事例で試作してみた

まず1件だけ取り出して、択一問題を手で作ってみた。テーマは「納税地」。住所地と居所地の違い、転居した場合の届出など、地味だが間違いやすい領域だ。

暗記を試す問題

Q. 国内に住所と居所の両方がある場合、所得税の納税地はどちらか?

これは条文を覚えていれば答えられる。逆に言えば、覚えていなければ当てずっぽうになる。この形式だけでは「理解しているか」が分からない。

理解を試す問題

Q. フリーランスのAさんは東京の自宅で働いていたが、今年から大阪のコワーキングスペースを主な仕事場にした。住民票は東京のまま。確定申告はどこに出すか?

同じ「納税地」の知識を問うているが、状況を読み解いて判断する必要がある。条文を暗記しているだけでは迷う。

この2つを並べた瞬間、「1つの事例から複数の深さで問いを立てられる」と手応えを感じた。

4層の問い設計

1件の事例に対して、4つの層で問いを立てる構造を考えた。

Layer 1: 事実確認

条文や通達の内容をそのまま問う。正誤判定や穴埋め形式。ここで基礎知識の有無を確認する。

: 「納税地の変更届出書の提出期限は?」

Layer 2: 判断

具体的なケースを提示し、正しい処理を選ばせる。条文の知識だけでなく、状況を読む力が要る。

: 「海外赴任中に不動産所得が発生した場合、納税管理人を選任する必要があるか?」

Layer 3: 応用

複数の条件が絡むケースを出す。単一の論点では答えが出ず、複数の知識を組み合わせる必要がある。

: 「転居と同時に個人事業の開業届を出す場合、納税地の届出はどうなるか?」

Layer 4: 横断

異なる税目や制度との比較を問う。所得税だけでなく、消費税や住民税との違いに気づけるかを試す。

: 「所得税と消費税で納税地の考え方が異なるケースを挙げよ」

Layer 1だけ正解する人は暗記型。Layer 3-4まで正解する人は構造を理解している。この差が可視化できると、学習者本人にとっても発見がある。

JSON構造の検討

1問あたりのデータ構造を以下のように設計した。

{
  "id": "income-tax-domicile-001",
  "source_case_id": "NTA-INC-042",
  "layer": 2,
  "question": "フリーランスのAさんは...",
  "choices": [
    { "label": "A", "text": "東京の税務署", "is_correct": false },
    { "label": "B", "text": "大阪の税務署", "is_correct": true },
    { "label": "C", "text": "どちらでもよい", "is_correct": false },
    { "label": "D", "text": "届出を出すまで従前の納税地", "is_correct": false }
  ],
  "explanation": "住所地と居所地が異なる場合は...",
  "related_cases": ["NTA-INC-043", "NTA-INC-105"],
  "tags": ["納税地", "居所地", "届出"]
}

ポイントは layer フィールドと source_case_id。元の事例集のどの項目から派生した問題かを追跡できる。related_cases で横のつながりも持たせた。

AIに問題生成を任せる部分と人が見る部分

320件の事例に対して4層分の問題を手で作ると1,280問。現実的ではない。

AIに任せられる部分と、人の目が必要な部分を切り分けた。

AIに任せる:

  • Layer 1の事実確認問題の生成(事例文からほぼ機械的に作れる)
  • 選択肢の生成(もっともらしい誤答を含める)
  • 関連事例のリンク付け

人が確認する:

  • Layer 3-4の応用・横断問題の品質(条件の組み合わせが現実的か)
  • 解説文の正確性(税法の解釈に関わるため)
  • 難易度のバランス(易しすぎ・難しすぎの調整)

Layer 1はAIが量産し、Layer 4は人が設計する。この分業が回れば、320件×4層を現実的な工数で作れる。

教育・研修での活用イメージ

この仕組みが動くと、いくつかの使い方が見える。

新人研修: Layer 1-2を中心に出題し、基礎知識の定着を確認する。間違えた問題の元事例に戻って学習するサイクルが回る。

実務者の自己診断: Layer 3-4を解いてみて、自分の理解の穴を見つける。「納税地は分かっていたつもりだったが、消費税との違いを聞かれると答えられない」という気づきが生まれる。

学習履歴の分析: どのLayerで正答率が落ちるかを追跡すると、「暗記はできているが応用が弱い」「特定の論点だけ横断理解が足りない」といったパターンが見える。

次にやること

  • CSVの320件を論点カテゴリで分類する(納税地、所得区分、控除、etc.)
  • 1カテゴリ分(20-30件)でLayer 1-4の問題を実際に生成してみる
  • 生成した問題の品質を確認し、プロンプトを調整する

320件全てに手を広げる前に、1カテゴリで一巡させて精度を確かめる。