• #日記
  • #yomitoku
  • #OCR
  • #SQLite
  • #Claude Code
  • #vivid-writing
  • #book-knowledge-base
daily-log

2026年2月19日の開発日記

朝、1冊目の専門書PDFをyomitokuに通したら手応えがあった。そこから歯車が噛み合い、OCR変換・クリーンアップ並列化・ビューアUI修正・スキル作成まで、手を止める暇がなかった一日。

今日やったこと

1. 書籍OCR・DBパイプラインの大整備(book-knowledge-base)

丸一日をこのプロジェクトに集中投下した。yomitoku(日本語特化AI OCR)で複数冊のPDFをMarkdown変換してSQLiteに格納し、その周辺ツールを一気に整えた。

主な成果:

  • 複数の実務書・専門書をyomitokuでOCR変換→DB格納
  • cleanup-bookコマンドをサブエージェント5並列処理に改修。処理時間が目に見えて縮まった
  • OCRインポート時の前処理パイプライン追加(ジャンク除去・ヘッダー除去・図幅統一・セクション統合をPython1回で実行)
  • クリーンアップ履歴管理の仕組み構築
  • 蔵書リストに進捗バッジ表示(済/〜100済/途中)をUI実装
  • ビューアのカクつき修正、タイトル重複解消、中カラム整理
  • 埋め込みPythonスクリプトの外部ファイル化
  • 記事量産用スラッシュコマンド2本の設計

詳細: 書籍OCRパイプライン整備


2. vivid-writingスキルの作成(mdx-playground)

メモに溜めていた「形容詞→動詞変換」のテクニックをClaude Codeスキルとして体系化した。

主な成果:

  • vivid-writingスキルを新規作成(身体動作・事実動詞・指示動詞の3パターン)
  • make-diaryコマンドに統合し、日記生成時に自動適用
  • 2/17・2/18の既存記事で適用テスト。「大変だった」が「メモリ4GBを突破してプロセスが落ちた」に変わるような、読み返して思い出せる文章に

詳細: vivid-writingスキルの作成


今日の学び

  • OCRの後処理は「ルールベース前処理 + AIクリーンアップ」の組み合わせが効く。決定的な処理はPythonで先に片付け、文脈依存の整形だけAIに渡す
  • scrollBy({ behavior: 'smooth' }) を高頻度で連続呼び出しするとアニメーションが重なってカクつく。キーボード操作ではsmoothを外す
  • スキルファイルは「変換テーブル + 適用ルール + 使用量の目安」の3点セットで書くとAIが迷わず適用できる
  • 変数名と実際の判定内容がずれていると後から確実にハマる。名前を直しただけでバグの所在が見えた

明日やること

  • クリーンアップ未処理の書籍を残り分処理
  • 記事量産用スラッシュコマンドの実装
  • 前処理パイプラインの外部ファイルにテスト追加

関連記事