name: history-video-base description: "日本史動画制作の共通基盤。音声・画像・BGM・FFmpeg・ブランドカラー等の共通仕様を定義。history-short-video / history-long-video が参照する。"

history-video-base

日本史動画（ショート/ロング共通）の制作基盤スキル。音声合成、画像調達、BGM、FFmpeg設定、ブランドカラー、プレビュー環境など、全動画で共通する仕様をまとめている。

音声仕様の統一方針

全動画はステレオ（2ch）, 44100Hz, AAC で統一する。

VOICEVOX の出力はモノラル（1ch, 24000Hz） → 必ず -ac 2 でステレオ変換
BGM は assets/bgm_safe.mp3（ステレオ、44100Hz）
ナレーション + BGM を amix でミックスするとステレオに統一される
ナレーションを直接（BGM なしで）動画に使う場合は -ac 2 でステレオ変換が必要

TTS エンジン設定（v5: デュアルエンジン）

エンジン選択

エンジン	ポート	用途	イントネーション品質
AivisSpeech	10101	ポッドキャスト動画（推奨）	BERTベースで自然
VOICEVOX	50021	ショート動画ナレーション	pitch操作で補正が必要

AivisSpeech推奨の理由: Style-Bert-VITS2ベースでBERT（DeBERTa V2）がテキストの意味を理解し、調整なしでも自然なイントネーション・語尾を生成。MOSスコアで人間の録音と統計的に有意差なし（arXiv:2505.17320）。VOICEVOXのpitch操作による後処理が不要。

エンジン切り替えは characters.json の voice.engine フィールドで制御。 generate-podcast-video.py が自動でエンジン別のURLとパラメータ調整を行う。

ショート動画（AivisSpeech — デフォルト）

# AivisSpeech を起動（port 10101）してから実行
python3 scripts/video-gen/synthesize-narration.py {テーマ名}

# VOICEVOXにフォールバックする場合
python3 scripts/video-gen/synthesize-narration.py {テーマ名} --engine voicevox

デフォルトエンジン: AivisSpeech（port 10101）
スピーカー: まい（ID: 1431611904）、速度 1.2x
AivisSpeechでは読点長最適化 + 漢数字変換のみ（pitch操作は不要）
EQ後処理（highpass 200Hz + 4kHzブースト + コンプレッション）は両エンジン共通で適用
--engine voicevox でVOICEVOX（四国めたん, ID: 2）にフォールバック可能

ポッドキャスト動画（AivisSpeech）

# AivisSpeech を起動（port 10101）してから実行
python3 scripts/video-gen/generate-podcast-video.py --template templates/{テーマ名}

主要キャラ: まい（講師, ID: 1431611904）, まお（生徒, ID: 888753760）
AivisSpeechではpitch操作系の後処理は自動的に無効化（不要なため）
読点長最適化（0.12秒）とEQ後処理のみ適用

テキスト前処理（必須）

漢数字→アラビア数字変換: AivisSpeechは「一六〇〇」を「16」と誤読する。preprocess_tts_text() / kanji_num_to_arabic() で自動変換。VOICEVOX用の synthesize-narration.py にも同機能あり。

辞書の2層構造

scripts/video-gen/base-dictionary.json — 全テーマ共通のベース辞書（188語+）。新たに誤読を修正したら必ずここに追加
scenes.json の dictionary フィールド — テーマ固有の難読語
辞書は VOICEVOX / AivisSpeech 両方に登録される（共通の /user_dict_word API）

ユーザー辞書 API（VOICEVOX / AivisSpeech 共通）

POST /user_dict_word?surface=享保&pronunciation=キョウホウ&accent_type=0&word_type=PROPER_NOUN&priority=9
POST /accent_phrases?text=テキスト&speaker={id}

品質チェックフロー（v5）

辞書登録（自動）: base-dictionary.json を使用エンジンに一括登録
読み検証（自動）: verify_readings() で数字の誤読を検出
テキスト前処理（自動）: 漢数字→アラビア数字変換
AI監査（手動・3レイヤー）: 事実確認 → 読みAI監査 → 実文脈読みテスト
ナレーション品質チェック（任意・事後）: Whisperで文字起こし比較

非推奨TTS: Google Cloud TTS（辞書登録不可）、Pollinations.ai TTS（日本語品質が低い）、macOS say（機械的）

AI監査ポリシー（全動画共通・必須）

すべての動画制作フローで、テキスト生成後・音声合成前に AI 監査を通すこと。 監査を通さずに合成・公開に進んではならない。

3レイヤー構成: 事実確認 → 読みAI監査 → 実文脈読みテスト

詳細は references/ai-audit-policy.md を参照。

FFmpeg セットアップ

セットアップスクリプト: scripts/ffmpeg-setup.sh

libfreetype, libass, harfbuzz が有効になり、ASS字幕方式が使える。

ffmpeg 共通オプション

オプション	用途	備考
`-movflags +faststart`	moov atom をファイル先頭に移動	必須。これがないとブラウザでのシーク時に無音や音割れが発生する
`-pix_fmt yuv420p`	ブラウザ互換ピクセルフォーマット	全動画で統一
`-c:v libx264 -preset slow -crf 20 -profile:v high -level 4.1`	H.264 エンコード設定	高品質エンコード（v2: CRF 20, preset slow）

画像調達

画像ソース判断、Wikimedia Commons取得、AI生成（Pollinations.ai）、リサイズ、カラーグレーディングの詳細は references/image-procurement.md を参照。

基本ルール:

実在する遺物・建造物・美術品 → Wikimedia Commons
歴史的風景・情景・人物描写 → AI生成（Pollinations.ai）
画像比率: Wiki:AI = 50:50〜40:60 を維持
Pollinations.ai エンドポイント: https://gen.pollinations.ai/image/{prompt}（他URLは誤り）

BGM 方針

BGMポリシー、ミックス手順、ラウドネス正規化、著作権チェックの詳細は references/bgm-policy.md を参照。

基本ルール:

楽曲: SHWフリー音楽素材 Miyako Japan 4（Content ID未登録・商用利用可）
ミックス: サイドチェインダッキングでナレーション時にBGM自動減衰
ラウドネス: -14 LUFS（TikTok/YouTube推奨）に2パス正規化
Pixabay のBGMは使用禁止（Content ID問題）
新BGM使用前に必ず YouTube Studio でContent IDチェック

craftgarden ブランドカラー

名前	HEX	用途
bg	`#2E3B2D`	背景色
accent-moss	`#51704A`	アクセント（ボックス背景）
accent-leaf	`#6B8F71`	アクセント（バッジ）
bg-cream	`#FAFAF5`	テキスト色
highlight	`#A8D5A2`	ハイライト

動画プレビュー（Web UI）

制作した動画は Web UI でプレビュー・シーク確認できる。

http://localhost:3001/videos/{テーマ名}      # 個別動画
http://localhost:3001/videos/series/{id}    # シリーズ一覧（ショート/ロングタブ）

仕組み:

web/public/video-output → ../../scripts/video-gen/output への symlink
<video src="/video-output/{slug}/final.mp4"> で Next.js が静的配信
Next.js 開発サーバーが Range request を正しく処理するため、シーク問題なし

自作の Range request ハンドラ API route は使わないこと。 バッファ管理のバグでシーク時に無音や音割れが発生する。静的配信が最もシンプルかつ確実。

コンテンツ企画データの取得方法

# gh api を使う。raw URL は 404 になる
gh api repos/ksato8710/history-quiz-app/contents/web/src/pages/admin/tiktok/data.ts --jq '.content' | base64 -d

共通の「よくある失敗」と対策

詳細な対策表は [references/troubleshooting.md](ref