所得税の誤りやすい事例集をAIクイズに変換する設計メモ
きっかけ
国税庁が公開している「誤りやすい事例集」の所得税編を眺めていた。CSVに落としてみたら約320件ある。1件1件は「こういうケースで間違える人が多い」という短い記述だが、320件を並べると所得税の急所が浮かび上がってくる。
これをそのまま読んで暗記しても、実務では使えない。「なぜ間違えるのか」を掘らないと、似たケースで同じミスを踏む。
そこで、この事例集を素材にして「暗記ではなく理解を試すクイズ」を作れないか検討した。
納税地の事例で試作してみた
まず1件だけ取り出して、択一問題を手で作ってみた。テーマは「納税地」。住所地と居所地の違い、転居した場合の届出など、地味だが間違いやすい領域だ。
暗記を試す問題
Q. 国内に住所と居所の両方がある場合、所得税の納税地はどちらか?
これは条文を覚えていれば答えられる。逆に言えば、覚えていなければ当てずっぽうになる。この形式だけでは「理解しているか」が分からない。
理解を試す問題
Q. フリーランスのAさんは東京の自宅で働いていたが、今年から大阪のコワーキングスペースを主な仕事場にした。住民票は東京のまま。確定申告はどこに出すか?
同じ「納税地」の知識を問うているが、状況を読み解いて判断する必要がある。条文を暗記しているだけでは迷う。
この2つを並べた瞬間、「1つの事例から複数の深さで問いを立てられる」と手応えを感じた。
4層の問い設計
1件の事例に対して、4つの層で問いを立てる構造を考えた。
Layer 1: 事実確認
条文や通達の内容をそのまま問う。正誤判定や穴埋め形式。ここで基礎知識の有無を確認する。
例: 「納税地の変更届出書の提出期限は?」
Layer 2: 判断
具体的なケースを提示し、正しい処理を選ばせる。条文の知識だけでなく、状況を読む力が要る。
例: 「海外赴任中に不動産所得が発生した場合、納税管理人を選任する必要があるか?」
Layer 3: 応用
複数の条件が絡むケースを出す。単一の論点では答えが出ず、複数の知識を組み合わせる必要がある。
例: 「転居と同時に個人事業の開業届を出す場合、納税地の届出はどうなるか?」
Layer 4: 横断
異なる税目や制度との比較を問う。所得税だけでなく、消費税や住民税との違いに気づけるかを試す。
例: 「所得税と消費税で納税地の考え方が異なるケースを挙げよ」
Layer 1だけ正解する人は暗記型。Layer 3-4まで正解する人は構造を理解している。この差が可視化できると、学習者本人にとっても発見がある。
JSON構造の検討
1問あたりのデータ構造を以下のように設計した。
{
"id": "income-tax-domicile-001",
"source_case_id": "NTA-INC-042",
"layer": 2,
"question": "フリーランスのAさんは...",
"choices": [
{ "label": "A", "text": "東京の税務署", "is_correct": false },
{ "label": "B", "text": "大阪の税務署", "is_correct": true },
{ "label": "C", "text": "どちらでもよい", "is_correct": false },
{ "label": "D", "text": "届出を出すまで従前の納税地", "is_correct": false }
],
"explanation": "住所地と居所地が異なる場合は...",
"related_cases": ["NTA-INC-043", "NTA-INC-105"],
"tags": ["納税地", "居所地", "届出"]
}
ポイントは layer フィールドと source_case_id。元の事例集のどの項目から派生した問題かを追跡できる。related_cases で横のつながりも持たせた。
AIに問題生成を任せる部分と人が見る部分
320件の事例に対して4層分の問題を手で作ると1,280問。現実的ではない。
AIに任せられる部分と、人の目が必要な部分を切り分けた。
AIに任せる:
- Layer 1の事実確認問題の生成(事例文からほぼ機械的に作れる)
- 選択肢の生成(もっともらしい誤答を含める)
- 関連事例のリンク付け
人が確認する:
- Layer 3-4の応用・横断問題の品質(条件の組み合わせが現実的か)
- 解説文の正確性(税法の解釈に関わるため)
- 難易度のバランス(易しすぎ・難しすぎの調整)
Layer 1はAIが量産し、Layer 4は人が設計する。この分業が回れば、320件×4層を現実的な工数で作れる。
教育・研修での活用イメージ
この仕組みが動くと、いくつかの使い方が見える。
新人研修: Layer 1-2を中心に出題し、基礎知識の定着を確認する。間違えた問題の元事例に戻って学習するサイクルが回る。
実務者の自己診断: Layer 3-4を解いてみて、自分の理解の穴を見つける。「納税地は分かっていたつもりだったが、消費税との違いを聞かれると答えられない」という気づきが生まれる。
学習履歴の分析: どのLayerで正答率が落ちるかを追跡すると、「暗記はできているが応用が弱い」「特定の論点だけ横断理解が足りない」といったパターンが見える。
次にやること
- CSVの320件を論点カテゴリで分類する(納税地、所得区分、控除、etc.)
- 1カテゴリ分(20-30件)でLayer 1-4の問題を実際に生成してみる
- 生成した問題の品質を確認し、プロンプトを調整する
320件全てに手を広げる前に、1カテゴリで一巡させて精度を確かめる。