音声文字起こし試してみたローカル環境・Srtファイルにコンバート
この投稿は1年以上前に公開されました。 現在の情報とは異なる可能性がありますので、ご了承ください。
おはようございます.某会社のブログで音声文字起こしのやり方を記載されていたのを見てローカル環境でも文字起こしが出来そうだなって試してみたら出来たのでお裾分けです.
最初、Docker環境でwhisperとffmpeg–pythonがあれば上手く機能すると思っていたのだけど甘かった.ffmpeg–pythonだけインストールしても動かないようなのでffmpeg本体を公式サイトからダウンロードして来なくてはならない.ここらへんWindowと考え方が同じなんだなぁ.
LinuxのOSでダウンロードするffmpegが違います、またCPUによっても違うので、今回githubにアップしているDockerfileでは上手くいかない可能性もあります!、昨今ではCPUがAMDって人も多そうです.
そこら辺を合わして下記のコマンドを打つと実行されます.
docker-compose up -d --buildコンテナが起動したらコンテナ内から下記のコマンドを続けて打ってください.
python app.pySrtファイルの変換には少々時間がかかりますが変換されます.なお、容量の大きいな音声データは恐らく落ちると思います.
では健闘を祈ってます.
https://github.com/taoka3/srt_convert
明日へ続く.