• #日記
  • #書籍ナレッジベース
  • #OCR
  • #UI改修
  • #Nuxt4
daily-log

2026年3月8日の開発日記

朝、参考書のPDFをナレッジベースに取り込もうとしてバグを踏んだところから一日が始まった。午前中は書籍ナレッジベースの整備に費やし、午後は会計学習サイトのUI刷新に切り替えた。どちらも「ちょっとだけ」のつもりが膨らんだ一日だった。

今日やったこと

1. 書籍ナレッジベース整備(book-knowledge-base)

55.9MBの税務参考書をPDF取り込みしようとしたところ、ページ数取得の正規表現バグで9999ページがAPIに送信されていた。幸いAPI側が400で弾いてくれたので課金は発生せず。/import-book をアーカイブし、ローカルGPU OCRのyomitokuに切り替えた。

yomitokuで285ページを処理した後、grep -P のロケール問題で図ファイル307枚が1枚に上書きされる事故も発生。Pythonスクリプトに書き直して解決した。

主な成果:

  • 285ページのOCR処理 → 158チャンクをDB格納
  • 装飾イラスト108件を自動判別して削除
  • 目次統合(8チャンク → 1チャンク)
  • /restructure-book コマンドを新規作成
  • 4冊の書籍でセクション単位の統合を実行

詳細: 書籍ナレッジベース整備 - PDF取り込みからOCR・チャンク統合までの全工程


2. 会計学習サイト(Eurekapu)UI刷新(eurekapu-nuxt4)

サムネイル画像が1枚も表示されていない状態を直すところから始まり、Kindleページの新設、トップページの分野別ナビゲーション追加、カードUIの全面改修まで一気に進めた。

主な成果:

  • Udemy講座4本のサムネイル整備(リサイズ・変換・配置)
  • Kindle書籍ページ新規作成(2冊分: データ・一覧・詳細ページ)
  • トップページに「分野から探す」セクション追加(コンテンツマトリックス)
  • コースカードUIを3段階で改修(テキスト → 画像追加 → 商品一覧化)

詳細: 会計学習サイトのUI刷新 - サムネイル整備・Kindleページ新設・分野別ナビゲーション構築


今日の学び

  • PDFパーサーのフォールバック値9999は「安全な値」ではない。上限を超えたら止まるように設計すべき
  • grep -P はWindows環境(Git Bash)でLANG未設定だと壊れる。文字列処理はPythonに寄せた方が環境差を踏まない
  • UIの改修は「実際にブラウザで見て違和感を言語化する」サイクルを回さないと情報の過不足に気づけない

明日やること

  • /restructure-book コマンドの改善(Codex指摘のトランザクション原子性)
  • Eurekapuトップページの「分野から探す」セクションの本番デプロイ確認

関連記事