zip358.com:地声ベースのAI音声合成モデルを再度構築しました話.たぶん似てる.

地声ベースのAI音声合成モデルを再度構築しました話.たぶん似てる.

2025年1月4日

文字数[773文字] この記事は1分58秒で読めます.

Logging

この投稿は1年以上前に公開されました。 現在の情報とは異なる可能性がありますので、ご了承ください。

おはようございます.地声ベースのAI音声合成モデルを再度構築しました話を書いていきます.まず地声ベースモデルを作る場合.自分の音声を録音しwavなどファイルにします.それが出来ない環境では音声モデルを作ることは難しいです.それが出来たらstyle-bert-vits2をGitHubから落としてきて、ブランチをdevに切り替えておきます.Windowsの場合、app.batを起動します.前提条件としてPythonがインストールされていることとgitがインストールされた環境であることです.

app.batを起動するとターミナルがターミナル立ち上がり次に任意のブラウザが開くことでしょう.ターミナルは閉じずにブラウザ画面のTOPにタブがあるので左から右へタスクをこなしていくと地声ベースの音声合成モデルが生成されます.

こんにちは作った地声です.音声合成ってやつです.ではでは👋 pic.twitter.com/3FnB6BIZ5I
— 田岡寿章(taoka_toshiaki) (@taoka_toshiaki) December 28, 2024

音声合成モデルが生成された後にstyle-bert-vits2内でターミナルを開き下記のコマンドを叩きます.

python convert_onnx.py --model model_assets\モデル名

叩く処理が実行されonnxファイルがモデルフォルダに作られます.

作られたファイルをaivm-generator.aivis-project.comサイトにてコンバートします.コンバートするとAIVM / AIVMX ファイルがダウンロードされます.最後にダウンロードされたファイルをAivisSpeechアプリに取り込めば完了です.

で、こちらが地声ベースの音声合成モデルで今回の記事を読み上げている音源になります.

明日へ続く

サイトを分離した話を黙々と書いていきます.

半額セールでアドビ様を延長.

何の前触れもなく変えたのは初めてかも.

跳ねたいサイトで跳ねたい

映画、機動戦士ガンダム閃光のハサウェイキルケーの魔女