daily-log
2026年2月19日の開発日記
朝、1冊目の専門書PDFをyomitokuに通したら手応えがあった。そこから歯車が噛み合い、OCR変換・クリーンアップ並列化・ビューアUI修正・スキル作成まで、手を止める暇がなかった一日。
今日やったこと
1. 書籍OCR・DBパイプラインの大整備(book-knowledge-base)
丸一日をこのプロジェクトに集中投下した。yomitoku(日本語特化AI OCR)で複数冊のPDFをMarkdown変換してSQLiteに格納し、その周辺ツールを一気に整えた。
主な成果:
- 複数の実務書・専門書をyomitokuでOCR変換→DB格納
- cleanup-bookコマンドをサブエージェント5並列処理に改修。処理時間が目に見えて縮まった
- OCRインポート時の前処理パイプライン追加(ジャンク除去・ヘッダー除去・図幅統一・セクション統合をPython1回で実行)
- クリーンアップ履歴管理の仕組み構築
- 蔵書リストに進捗バッジ表示(済/〜100済/途中)をUI実装
- ビューアのカクつき修正、タイトル重複解消、中カラム整理
- 埋め込みPythonスクリプトの外部ファイル化
- 記事量産用スラッシュコマンド2本の設計
詳細: 書籍OCRパイプライン整備
2. vivid-writingスキルの作成(mdx-playground)
メモに溜めていた「形容詞→動詞変換」のテクニックをClaude Codeスキルとして体系化した。
主な成果:
- vivid-writingスキルを新規作成(身体動作・事実動詞・指示動詞の3パターン)
- make-diaryコマンドに統合し、日記生成時に自動適用
- 2/17・2/18の既存記事で適用テスト。「大変だった」が「メモリ4GBを突破してプロセスが落ちた」に変わるような、読み返して思い出せる文章に
今日の学び
- OCRの後処理は「ルールベース前処理 + AIクリーンアップ」の組み合わせが効く。決定的な処理はPythonで先に片付け、文脈依存の整形だけAIに渡す
scrollBy({ behavior: 'smooth' })を高頻度で連続呼び出しするとアニメーションが重なってカクつく。キーボード操作ではsmoothを外す- スキルファイルは「変換テーブル + 適用ルール + 使用量の目安」の3点セットで書くとAIが迷わず適用できる
- 変数名と実際の判定内容がずれていると後から確実にハマる。名前を直しただけでバグの所在が見えた
明日やること
- クリーンアップ未処理の書籍を残り分処理
- 記事量産用スラッシュコマンドの実装
- 前処理パイプラインの外部ファイルにテスト追加