2026年6月21日の開発日記
朝6時前に蔵書DBの掃除から入り、午前中に半導体テーマの参考書554ページを yomitoku でOCRしつつ、Kindle取込パイプラインの除外タグ整備(小説・描き方シリーズ)と1冊目バッチ4冊を並列で回した。午後は2冊目バッチ4冊(不動産投資2冊+DD論+仮説行動)を並列パイプラインに乗せ、合計8冊を1日で取り込み終えた。夜は会計ソフトA内部APIハンズオン3記事を「DevTools Console に1コマンドずつ叩いて値を確認する」スタイルに統一しつつ、Chrome DevTools MCP で実機を叩いて記事の例と実機の差分を全部洗い出した。
今日のタイムライン

今日やったこと
1. ハイパースケーラーCapEx記事の仕上げ
データセンターCapExが1兆ドル超に向かっている話を、ファクトチェック並走と10枚SVG構成で1本にまとめた。表示確認で「部材インフレ7部材の同時値上がりチャートが値上がりに見えない」「マゼンタ強調の意味が凡例にない」「external-capital-stack.svg が naturalWidth:0 で壊れている(XMLの& 未エスケープ)」の3点を順に直して、ファーストビューから最終図まで通る記事に仕立てた。
主な成果:
- ファクトチェックを並列で実行し、Metaの Hyperion SPV 金額(300億→270億+3億リース)と TeraWulf 180日条項の不確実箇所を記事側で慎重に書き直した
- 部材インフレチャートをバーの長さが値上げ率に比例する形に作り直した
- マゼンタ強調を「4社の中で突出して点灯しているシグナル」と凡例に明記
- SVG の
P&L表記をP&Lに修正
詳細: データセンターのコスト構造 — 部材インフレとハイパースケーラーの限界線
2. 半導体テーマの参考書554ページをyomitokuで取り込んだ
蔵書DBに該当書がヒットせず、Dropbox の連番フォルダにあるPDFを amazon_metadata.file_no から特定。pymupdf で目次だけ抜いて書誌を確定し、yomitoku を裏で走らせて約8.6分でOCR完了。Turso に121チャンクで投入したあと、/yomitoku コマンドのドキュメントが旧仕様のままだったので現在の db.py シグネチャに合わせて直した。restructure までかけて 121→117チャンクに整理して終了。
主な成果:
- yomitoku で 554ページを8.6分でOCR完走(MD 554個+図5個)
/yomitokuコマンドドキュメントの仕様乖離を発見して修正- Turso 投入+FTS検索テストすべてヒット
/restructure-bookで 8部構成・全54章+序章・後付のメタデータ整備
詳細: 半導体テーマの参考書554ページをyomitokuでOCRしてTursoに取り込んだ朝
3. Kindle取込パイプラインを並列化して1日に8冊取り込んだ
午前は除外タグ整備から入った。novel タグを kindle_library_tagger.py に追加して47件付与、drawing タグを追加して12件付与、進捗ジェネレーターに「次の候補トップ10」表示を組み込む改造まで済ませた。1冊目バッチ4冊(コンサル一年目 / イシューからはじめよ / 目的ドリブン / 仮説行動)は最初は直列で待っていたが、スラッシュコマンドに「バッチ実行中なら次の本の撮影/OCR/DB投入に進む」と書いてあると指摘されてから並列に切り替えた。午後の2冊目バッチ4冊(不動産投資2冊+DD論+仮説行動)では方向誤判定リカバリと Chrome の Tabs cannot be edited right now エラー2回を踏みつつ、計8冊を取り込み終えた。
主な成果:
novel/drawing除外タグで KU 借中の候補リストを実質的なターゲットだけに絞った- 並列パイプライン(撮影→OCR→DB→紐付け→restructure をサブエージェントに非同期で投げる)が定着した
- 取込済 11冊→17冊、KU借中 19冊→15冊残まで進んだ
- Most Recent Page Read ダイアログがタブ操作を阻害していた原因を特定
詳細: Kindle取込パイプラインを並列化して1日に8冊取り込んだ
4. 会計ソフトA内部APIハンズオン3記事の実機検証
ハンズオン編・エクスポート編・インポート編の3記事を「DevTools Console に1コマンドずつ叩いて値を確認する」スタイルに統一しつつ、Chrome DevTools MCP で実機を叩いて記事の例と実機の差分を全部洗い出した。税区分マスタの label が記事の "課税仕入 10%" ではなく実機は "課仕 10%" で件数も58→151と乖離、削除APIの挙動も記事の説明と違ったので記事側を直した。さらに JS バンドル+React fiber+Jotai store を辿って、旧 ignore_cancel が 404 で廃止されて新API /journalable_dists/register /journalable_dists/ignore に置き換わっていることを突き止めた。
主な成果:
- ProsePre.vue のコピーボタンを復活させた
console.log自体を「値+説明文」を出す形に書き換えて、コンソール画面で意味が分かるようにした- 「ページ遷移で window.mfh が消える」問題を Step 0.1 で警告し、同タブで仕訳帳APIを叩いて結果を確認する手順を Step 10.5 として挿入した
- 旧
ignore_cancelの廃止と新journalable_distsAPI群の発見、journalCandidateIdの hash::index 形式まで特定
詳細: 会計ソフトA内部APIハンズオン3記事のスタイル統一と実機検証
5. 家族旅行カレンダーの予約確定反映
8月の家族旅行カレンダーで、HOTEL AZ大分津久見店(8/28・8/29)と月と海のリゾート コテージ上浦(8/27)の予約確定メールが届いたので、タイムラインの該当イベントを open から decided に切り替えた。料金は以前設定の値を維持、テキストを「予約確定」に直してビルドエラーなしを確認。
今日の試行錯誤
| # | テーマ | 試したこと | 結果 | 気づき |
|---|---|---|---|---|
| 1 | CapEx記事のSVGバグ | external-capital-stack.svg が naturalWidth:0 で壊れていた | XMLの P&L の & がエスケープされておらず parser エラー | SVG中のテキストで & を書くときは & に必ず置換する |
| 2 | 部材インフレチャート | バー長が値上げ率に比例していなかった | バー幅を数値スケールに直して描き直し | 「同時に値上がりしている」を伝えるなら、まずバー長が値段に比例する状態にしてから色や強調を乗せる |
| 3 | Kindle取込が直列だった | OCR待ち中は次の本の撮影に進めるのに直列で寝ていた | スラッシュコマンドを読み返したら並列化の指示が書いてあった | コマンドを定義したら定義通り動かす。「とりあえず動かしてみる」と直列に流してしまう |
| 4 | 不動産投資2冊目で方向誤判定 | p.1が奥付=逆順撮影だった | 画像の並び順を反転→md再生成→OCR再実行 | DB投入前ならリカバリは画像反転だけで済む。投入後だとchunks書き換えが要る |
| 5 | Chrome Tabs cannot be edited right now | 3冊目スクショが2回連続中断 | Most Recent Page Read ダイアログが背景で出ていてタブ操作を阻害していた | Kindle Cloud Reader のダイアログは撮影開始前に閉じる |
| 6 | コンソール出力の意味付け | 関数定義にコメント→記事内出力ブロックに注釈、と2回意図を取り違えた | 3回目に「console.log 自体を書き換える」と気付いた | 「コンソール画面で」と言われたら記事内ではなく実画面の文字列を直すのが正解 |
| 7 | 会計ソフトA 旧 ignore_cancel が動かない | DELETE すると 404 | JS バンドルから新パターンを探したら /journalable_dists/* に置き換わっていた | 内部APIが見えにくい変更を踏むのは普通。バンドル grep で探す筋肉が要る |
| 8 | 解除API(対象外→未入力)の id が違う | id を React fiber から取ったら <hash>::<index> 形式で 400 | Jotai store を辿って hash部分のみが正しい id だと特定 | React の見える props と Jotai store の id は別物。POSTペイロードの id は store 側を取る |
| 9 | 蔵書DB検索 ヒットせず | キーワード検索で半導体書が出てこなかった | amazon_metadata の file_no から Dropbox 連番フォルダにPDF実体を発見 | DBに無いなら未取込。amazon_metadata から file_no を引いて Dropbox の番号フォルダを当たる |
| 10 | yomitoku コマンドのドキュメント不整合 | 旧仕様(ローカルSQLite + init_books_db(db_path))のまま | 現在の db.py(引数なし + Turso HTTP直結)に合わせてコマンドドキュメントを修正 | 実装変更時にスラッシュコマンドのドキュメントが取り残されがち。気付いた瞬間に直す |
今日の学び
- 「コンソール出力に意味を載せる」は記事側ではなくコード側で: ハンズオン記事のコメント問題で3回意図を取り違えた。読み手の操作画面(実際のブラウザコンソール)で意味が分かる形にしないと、記事を見ながら打って結果を見たときに迷子になる
- 内部APIの仕様変更は JS バンドル grep + React fiber + state store の3点セットで追う: バンドルからエンドポイント+ペイロードのリテラルを拾い、React fiber で見える props を確認し、state store で実際の id を取り出す。表面だけ見ると 400 が解けない
- 並列パイプラインは「スラッシュコマンド定義に書いてあるか」を先に読む: 直列で動かすクセが先に出てしまった。コマンドを定義したら定義通り並列で回す
- ドキュメントと実装の乖離は仕様変更時に必ず生まれる:
/yomitokuの旧シグネチャがそのまま残っていた。実装を直すときにコマンドドキュメントも一緒に直す動線が要る - DB 検索でヒットしないときは amazon_metadata を引く: 蔵書DBに無くても、過去に登録した連番フォルダにPDFがある可能性が残る
明日やること
- 会計ソフトA ハンズオン記事3本を本番デプロイで確認 — 3本とも
unpublished: trueのままで未デプロイ、繰越 - Kindle取込の次のバッチ候補トップ10から選定 — 6/22 着手なし、繰越
- CapEx記事の updatedAt を反映+ファクトチェック残課題の TeraWulf 180日条項を別記事で深掘りするか判断 — TeraWulf 180日条項は 6/22 /datacenter-cost-structure-hyperscaler-limits で深掘り完了。
hyperscaler-capex-limits.mdの updatedAt 反映のみ残り