AivisSpeech用の自分の声ベースモデルを作ろうとしてStyle-Bert-VITS2

Home > Logging > AivisSpeech用の自分の声ベースモデルを作ろうとしてStyle-Bert-VITS2

2024年11月28日

文字数[719文字] この記事は1分54秒で読めます.

この投稿は1年以上前に公開されました。 現在の情報とは異なる可能性がありますので、ご了承ください。

おはようございます．AivisSpeech用の自分の声ベースモデルを作ろうとしてStyle-Bert-VITS2を頑張る．事前に自分の声を12本録音してた奴をOpenAIが提供しているopenai-whisperで文字起こしを行いました．そのデータを元にStyle-Bert-VITS2の配下にあるTrain.batを叩くとブラウザが立ち上がる．何処にデータセットを置かないいけないかなども記載されている．

その場所にデータを配置します．配置後、上から順番に実行していけば学習モデルが生成されます、生成されたモデルをONNX形式に変換しその後aivmx形式しないとAivisSpeechでは使用できないらしい．変換コマンドはこちら、やり方はこの方が記載されているので参照ください．

git checkout dev
pip install onnx
pip install onnxsim 
pip install accelerate
python convert_onnx.py --model 【SVBS2のモデルフォルダ】

onnxに変換後、AivisSpeechの公式サイトのコンバーターサイトで変換するとaivmx形式が落ちてきます（ダウンロード）．それをAivisSpeechアプリの設定から読み取ればOK！

結構長い手順ですが、これで自分の声の音声合成が出来ます．それで作ったのがこの音源です、雑音が入っているのはセミがなく中で録音した音声を学習させたからこんな感じになっています．

追伸：雑音を除去しました．下記は雑音を除去したものになります．

明日へ続く

セキュリティが甘いサイト

明日から仕事：正月休み最終日.

AI（人工知能）は強力なツール？

学校不要論を語る人に一石を投じる.

明けましておめでとうございます.2026年が始まりました.

3214番目の投稿です／807 回表示されています．

中の人🏠️

AIによるおすすめ記事

著者名 @taoka_toshiaki

※この記事は著者が40代前半に書いたものです．

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます．たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅．
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

投稿日時 2024年11月28 06:00日

最近よく読まれている記事（過去3ヶ月）

1.さくらのAI Engine（API）をPHP言語で叩いてみてないコード（たぶん動く）

2.アクセスカウンターはSQLiteとPHP言語で出来ています.

3.React Native + SupabaseでTodoアプリ開発コピペ🙅

4.AIに仕事奪われたって記事はGeminiの生成文、いや分からないって.

5.観光サポートページ（English）を追加しました.広告を貼らないで運営.