daily-log
2026年3月8日の開発日記
朝、参考書のPDFをナレッジベースに取り込もうとしてバグを踏んだところから一日が始まった。午前中は書籍ナレッジベースの整備に費やし、午後は会計学習サイトのUI刷新に切り替えた。どちらも「ちょっとだけ」のつもりが膨らんだ一日だった。
今日やったこと
1. 書籍ナレッジベース整備(book-knowledge-base)
55.9MBの税務参考書をPDF取り込みしようとしたところ、ページ数取得の正規表現バグで9999ページがAPIに送信されていた。幸いAPI側が400で弾いてくれたので課金は発生せず。/import-book をアーカイブし、ローカルGPU OCRのyomitokuに切り替えた。
yomitokuで285ページを処理した後、grep -P のロケール問題で図ファイル307枚が1枚に上書きされる事故も発生。Pythonスクリプトに書き直して解決した。
主な成果:
- 285ページのOCR処理 → 158チャンクをDB格納
- 装飾イラスト108件を自動判別して削除
- 目次統合(8チャンク → 1チャンク)
/restructure-bookコマンドを新規作成- 4冊の書籍でセクション単位の統合を実行
詳細: 書籍ナレッジベース整備 - PDF取り込みからOCR・チャンク統合までの全工程
2. 会計学習サイト(Eurekapu)UI刷新(eurekapu-nuxt4)
サムネイル画像が1枚も表示されていない状態を直すところから始まり、Kindleページの新設、トップページの分野別ナビゲーション追加、カードUIの全面改修まで一気に進めた。
主な成果:
- Udemy講座4本のサムネイル整備(リサイズ・変換・配置)
- Kindle書籍ページ新規作成(2冊分: データ・一覧・詳細ページ)
- トップページに「分野から探す」セクション追加(コンテンツマトリックス)
- コースカードUIを3段階で改修(テキスト → 画像追加 → 商品一覧化)
詳細: 会計学習サイトのUI刷新 - サムネイル整備・Kindleページ新設・分野別ナビゲーション構築
今日の学び
- PDFパーサーのフォールバック値9999は「安全な値」ではない。上限を超えたら止まるように設計すべき
grep -PはWindows環境(Git Bash)でLANG未設定だと壊れる。文字列処理はPythonに寄せた方が環境差を踏まない- UIの改修は「実際にブラウザで見て違和感を言語化する」サイクルを回さないと情報の過不足に気づけない
明日やること
-
/restructure-bookコマンドの改善(Codex指摘のトランザクション原子性) - Eurekapuトップページの「分野から探す」セクションの本番デプロイ確認