地声ベースのAI音声合成モデルを再度構築しました話.たぶん似てる.

2025.01.04

Logging

おはようございます.地声ベースのAI音声合成モデルを再度構築しました話を書いていきます.まず地声ベースモデルを作る場合.自分の音声を録音しwavなどファイルにします.それが出来ない環境では音声モデルを作ることは難しいです.それが出来たらstyle-bert-vits2をGitHubから落としてきて、ブランチをdevに切り替えておきます.Windowsの場合、app.batを起動します.前提条件としてPythonがインストールされていることとgitがインストールされた環境であることです.

app.batを起動するとターミナルがターミナル立ち上がり次に任意のブラウザが開くことでしょう.ターミナルは閉じずにブラウザ画面のTOPにタブがあるので左から右へタスクをこなしていくと地声ベースの音声合成モデルが生成されます.

音声合成モデルが生成された後にstyle-bert-vits2内でターミナルを開き下記のコマンドを叩きます.

python convert_onnx.py --model model_assets\モデル名

叩く処理が実行されonnxファイルがモデルフォルダに作られます.

作られたファイルをaivm-generator.aivis-project.comサイトにてコンバートします.コンバートするとAIVM / AIVMX ファイルがダウンロードされます.最後にダウンロードされたファイルをAivisSpeechアプリに取り込めば完了です.

で、こちらが地声ベースの音声合成モデルで今回の記事を読み上げている音源になります.

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

コマンド, ターミナル, ターミナル立ち上がり次, タブ, ファイル, ブラウザ, ブラウザ画面, モデルフォルダ, , 再度, 前提条件, , 地声ベース, 地声ベースモデル, , 最後, 音声, 音声モデル, 音声合成モデル, 音源,

Photo by Chris J Mitchell on Pexels.com

一人で起業して低予算でハイリターンな人がそろそろ出てきそう何だよね.

2024.08.28

Logging

おはようございます.一人で起業して低予算でハイリターンな人がそろそろ出てきそう何だよとこの頃思うわけです.アイディアとある程度、IT技術に長けていたら恐らく一人で起業して低予算でハイリターンな利益を得れるところまで来ている気がしてならない.

前提条件として.

  • awsの知識がある.
  • AIの知識がある.
  • 何らかのプログラミング言語の知識がある.

これらの技術力が高いほど、人材は少人数でハイリターンな利益を得れる時代になってきている気がしてならない.サービスをリリースしてサポートはどうするかという問題も全てAI(人工知能:生成AI)で解決しそうな気がします.

いまでは人と見分けがつかない返答をする生成AIも登場してきましたので、サポートや問い合わせは生成AIで何とかなるのではないかと思います.

そうなるとウェブで完結するサービスを作れる人は少人数でハイリターンな商売が出来そうです.全ての技術が秀でている人は一人でもハイリターンを得ることが出来そうですね.

因みに自分は難しそうです?

明日へ続く.

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AI, AWS, it技術, アイディア, ウェブ, ハイリターン, プログラミング言語, 人工知能, 人材, 低予算, 全てAI, 利益, 前提条件, 商売, 問い合わせ, 少人数, 技術, 生成AI, 知識, 返答,

Photo by FOX on Pexels.com

stable-diffusion-webuiを使ってみた。

2024.03.14

Logging

おはようございます、stable-diffusion-webuiを使ってみました。結論から言うとプロンプト大事だという事とプロンプトを制御しないとろくな画像は生成されない。フリーで使用できるだけマシですけどこれで良いものを作るのは至難の業だということを使って理解しました。

これを使用する方法はgitとPythonとcudaがインストールされていることが前提条件にあります。そしてWindowsの場合はwebui.batを叩くMacなどはwebui.shを叩いて動かすのですが、動作はご自身のPCスペックに比例します。

ミッドジャーニーがどれほど優秀なのかが比べてみると分かります。

明日へ続く。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

CUDA, git, Mac, PCスペック, Python, stable-diffusion-webui, webui.bat, webui.sh, Windows, ご自身, プロンプト, ミッドジャーニー, 前提条件, 動作, 方法, , 画像, 結論, 良いもの,

Photo by cottonbro studio on Pexels.com

SF映画、アダム&アダム #ネトフリ映画

2023.01.10

Logging

こんにちは、先日、SF映画、アダム&アダムをネトフリで観ましたので感想を残しときます。

この映画、対象年齢は小学生高学年ぐらいが対象かなと思います。そんなアダムとアダムを字幕で観たわけですが、総合的に矛盾点が多く感じる映画でした。要するに時間軸を考えた場合に矛盾が生じるわけです。この矛盾を無くすためにはこの宇宙は多次元であるという事を前提条件に考えないといけない訳です。過去に戻って何かを変えてしまうと未来が変わってしまうので、未来が変わってしまった場合と未来を変えていない未来が存在しないと過去に戻ることは出来ない。なので宇宙は多次元で無いと過去には戻れないものだと自分は思っています。

『アダム&アダム』ティーザー予告編 – Netflix
アダム&アダム

因みに、光よりも早く進めば未来に行くことは可能ですがこの場合、過去には戻れません。過去に戻る方法を確立させればそれは凄い発見であるとともに諸刃の剣のようなものだと思います。

話戻すと、アダムとアダムは大人になればなるほど、楽しめる作品にはなっていないかなって思えます。もしこの映画を観て好印象だった人はピュアな心の持ち主だと思います。

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

SF映画, アダム, アダム&amp, アダム&アダム, ネトフリ, 前提条件, , 多次元, 好印象, 字幕, 宇宙, 小学生高学年, 感想, 持ち主, 時間軸, 未来, 矛盾, 矛盾点, , 諸刃,