音声文字起こし試してみたローカル環境・Srtファイルにコンバート

2024年8月31日
文字数[599文字] この記事は1分45秒で読めます.

おはようございます.某会社のブログで音声文字起こしのやり方を記載されていたのを見てローカル環境でも文字起こしが出来そうだなって試してみたら出来たのでお裾分けです.

最初、Docker環境でwhisperとffmpegpythonがあれば上手く機能すると思っていたのだけど甘かった.ffmpegpythonだけインストールしても動かないようなのでffmpeg本体を公式サイトからダウンロードして来なくてはならない.ここらへんWindowと考え方が同じなんだなぁ.

LinuxのOSでダウンロードするffmpegが違います、またCPUによっても違うので、今回githubにアップしているDockerfileでは上手くいかない可能性もあります!、昨今ではCPUがAMDって人も多そうです.

そこら辺を合わして下記のコマンドを打つと実行されます.

docker-compose up -d --build

コンテナが起動したらコンテナ内から下記のコマンドを続けて打ってください.

python app.py

Srtファイルの変換には少々時間がかかりますが変換されます.なお、容量の大きいな音声データは恐らく落ちると思います.

では健闘を祈ってます.

https://github.com/taoka3/srt_convert

明日へ続く.