固定資産のCF精算表が完成した
朝、固定資産の年次推移表生成スクリプトを走らせた。ターミナルに KeyError: '減価償却累計額' が吐き出されて止まった。前日に貸付金で同じパターン(未登録勘定科目)を踏んでいたので、原因の見当はすぐについた。ACCOUNT_DBを開いて「減価償却累計額」を追加し、再実行。今度は最後まで通った。ここから夕方まで、CFWS生成・数式問題の迂回・SUM数式ロジックの書き直しが続いた。
Step b: 年次推移表の生成
減価償却累計額の未登録
固定資産には建物・車両・備品といった取得原価の科目と、それぞれに対応する減価償却累計額の科目がある。取得原価側はACCOUNT_DBに登録済みだったが、累計額側がごっそり抜けていた。
追加した科目:
- 減価償却累計額(建物)
- 減価償却累計額(車両運搬具)
- 減価償却累計額(工具器具備品)
SUB_ACCOUNT_EXPANDにも子科目を追加し、補助科目展開つきの年次推移表が最後まで生成されるようになった。
SUM数式の走査ロジック改善
年次推移表シートの合計行にSUM数式を埋め込む _add_sum_formulas 関数で、indentレベルの走査がうまく動かない箇所があった。
問題は、indent=1の科目行が連続するとき、indent=1同士の合計行がどこまでを範囲に含めるかを誤認するケースだった。走査ロジックが「自分より深いindentの行だけを拾う」前提で書かれていたが、indent=1の合計行(たとえば「有形固定資産合計」)の直下にまたindent=1の科目行(たとえば「無形固定資産」)が続くと、次のセクションまで巻き込んでしまう。
修正前のロジック:
# 合計行から上方向に走査し、indentが浅くなったら停止
while row > 0 and get_indent(row) >= target_indent:
row -= 1
修正後は、合計行の直上から走査を開始し、同じindentまたはそれより深い行を拾いつつ、同じindentの合計行に当たったらそこで打ち切るようにした。
while row > 0:
indent = get_indent(row)
if indent < target_indent:
break
if indent == target_indent and is_sum_row(row):
break # 同レベルの合計行は範囲外
row -= 1
この修正で、固定資産のように合計行が複数段に分かれる構造でも正しい範囲のSUM数式が入るようになった。
Step c: CFWS生成
DUAL_ACCOUNTS設定
固定資産にはBS科目とPL科目の両面がある。取得時はBS(建物)、毎期の費用計上はPL(減価償却費)。DUAL_ACCOUNTS辞書にこの対応関係を登録した。
中間テーブル関数の新規作成
借入金や貸付金と異なり、固定資産は取引モジュール側に返済予定表がない。代わりに、減価償却計算表から年度ごとの償却額と帳簿価額を抽出する中間テーブル関数を新たに書いた。
既存の _build_interest_table を参考に、固定資産用の _build_depreciation_table を作成。償却方法(定額法・定率法)ごとの分岐と、期中取得時の月割計算を含めた。
集約シート検出ロジックの更新
CFWS生成時に取引モジュールの集約シートを探すロジックが、シート名の前方一致で 集約_借入金、集約_貸付金 を検出していた。固定資産用の 集約_固定資産 を追加するため、検出対象のリストを拡張した。
openpyxl数式問題との格闘
ここが一番時間を食った。
症状
openpyxlでExcelファイルを読み込むと、数式セル(たとえば =B10-B11 のような税引前当期純利益の計算式)の値が None になる。openpyxlは数式の文字列は保持するが、計算結果は持たない。data_only=True で開いても、Excelアプリで一度開いて保存しないとキャッシュ値が入らない。
Pythonスクリプトの中で「税引前当期純利益」の値を参照してCFWS調整列の数値を組み立てる処理があり、ここで None が伝播してCF全体が壊れていた。
試行1: xlcalcで数式を評価する
最初に xlcalc ライブラリで数式をPython上で評価しようとした。しかし、シート間参照やINDEX/MATCH関数には対応しておらず、固定資産の年次推移表にある複雑な参照式で NotImplementedError が出た。
試行2: COM経由でExcelアプリに計算させる
Windows環境なのでCOM経由で win32com を使い、Excelアプリにファイルを開かせて再計算させる方法も試した。動くことは動くが、Excelアプリの起動に数秒かかり、ファイルを閉じるときのダイアログ処理も不安定だった。CI環境やヘッドレス環境では使えない。
解決策: resolve_rowsパイプライン
最終的に、Excelの数式に頼らず、Pythonで直接計算してJSON出力するパイプラインを組んだ。
- 年次推移表のExcelからセル値を読み取る(値セルのみ)
- 数式セルに相当する計算をPython側の関数で再実装する
- 計算結果をJSON中間ファイルに書き出す
- CFWS生成スクリプトはJSONから値を読む
def resolve_rows(wb, sheet_name: str) -> dict:
"""数式セルをPythonで再計算し、全行の値を辞書で返す"""
ws = wb[sheet_name]
values = {}
for row in ws.iter_rows(min_row=2, values_only=False):
label = row[0].value
if label is None:
continue
# 数式セルはPython側で計算
amount = row[1].value
if amount is None and row[1].data_type == 'f':
amount = _evaluate(row[1], values)
values[label] = amount
return values
Excelファイルは「人が開いて確認するための出力物」に徹し、スクリプト間のデータ受け渡しはJSONを経由する。この分離を入れたことで、openpyxlの数式未計算問題を根本的に迂回できた。
全4年度でcheck=0を達成
CFWS生成後、BS・PL・CFの整合性チェックスクリプトを回した。4年度分すべてでcheck=0(差異なし)を確認。
チェックの内容:
- BS: 前期末残高 + 当期増減 = 当期末残高
- PL: 収益合計 - 費用合計 = 当期純利益
- CF: 営業CF + 投資CF + 財務CF = 現金増減
固定資産で引っかかりやすいのは投資CFの符号だ。取得は支出(マイナス)、売却は収入(プラス)。減価償却費はPLには出るがCFの調整項目として加算される。この符号の整合が4年度分ズレなく通ったことで、中間テーブル関数の計算ロジックが正しいことを確認できた。
スキルファイルと進捗文書の更新
固定資産スキルファイルの作成
借入金スキル(cf-lifecycle-borrowing.md)の構造を踏襲して、固定資産用のスキルファイル cf-lifecycle-fixed-asset.md を作成した。記載内容:
- 対象勘定科目の一覧(建物、車両、備品、各累計額、減価償却費)
- Step a / b / c の実行手順
- DUAL_ACCOUNTSの設定値
- 固定資産固有の注意点(月割計算、除売却損益の扱い)
進捗チェックリストの更新
全論点の進捗管理表で、固定資産のStep b / Step cを完了に更新した。残りの未完了論点を確認し、次に着手する科目の優先順を整理した。
振り返り
openpyxlの数式問題で3時間近くハマった。xlcalcを試し、COMを試し、最終的に「Excelに計算させない」という判断に至った。遠回りに見えるが、resolve_rowsパイプラインを入れたことで、スクリプト間のデータフローからExcel依存が消えた。JSONを挟む一手間が、デバッグ時に中間値を jq で覗ける利点にもつながっている。
SUM数式のindent走査ロジックは、借入金や貸付金では露見しなかったエッジケースだった。固定資産のように「有形 / 無形 / 投資その他」と同じindentレベルで合計行が複数並ぶ構造で初めて顕在化した。テストケースの網羅性について、科目の階層パターンをもう少し洗い出しておく必要がある。