name: audio-transcribe
Whisper CLIで音声ファイルを文字起こしするスキル。MP3/WAV/M4Aなどに対応。
which whisper
# /opt/homebrew/bin/whisper
未インストールの場合:
pip install openai-whisper
whisper audio.mp3
whisper audio.mp3 --model base --language ja
whisper audio.mp3 --model base --language ja --output_format txt
whisper audio.mp3 --model base --language ja --output_format srt
| モデル | サイズ | 速度 | 精度 |
|---|---|---|---|
| tiny | 39MB | 最速 | 低 |
| base | 74MB | 速い | 中 |
| small | 244MB | 中 | 高 |
| medium | 769MB | 遅い | より高 |
| large | 1.5GB | 最遅 | 最高 |
推奨: base または small(日本語ならbaseで十分)
| 形式 | 説明 |
|---|---|
| txt | テキストのみ |
| srt | 字幕形式(タイムスタンプ付き) |
| vtt | WebVTT字幕形式 |
| json | JSON形式 |
生成したTTS音声が正しく読み上げられているか確認:
whisper narration.mp3 --model base --language ja --output_format txt
cat narration.txt