先日作成した自分の声の音声合成で記事を読んでもらうことにしました.

2024.11.29

Logging

おはようございます.先日作成した自分の声の音声合成で記事を読んでもらうことにしました.そしてYOUTUBEも音声合成を使って再度始めようかなと思っています.

これで詰まることなく会話が出来るのでとても良い.あとは音声合成の雑音(ノイズ)を除去出来れば言うことはなさそうです.いやーとても便利ですね.

強いて言えば記事を書いたら自動でそのテキストを元に音声合成が生成出来れば言うことはないですが、そこだけは今のところ手動で対応しています.

因みにAivisSpeechのAPIが開発中らしいので今後に期待ですね.とは言ってもAPIなので恐らく課金になるのかと思っています.

追伸:ノイズを除去出来ました.

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

AivisSpeech, API, youtube, テキスト, ところ手動, ノイズ, 会話, , 再度, , 期待, 自分, 良い.あと, 記事, 課金, 追伸, 開発中, 雑音, 音声合成,

AivisSpeech用の自分の声ベースモデルを作ろうとしてStyle-Bert-VITS2

2024.11.28

Logging

おはようございます.AivisSpeech用の自分の声ベースモデルを作ろうとしてStyle-Bert-VITS2を頑張る.事前に自分の声を12本録音してた奴をOpenAIが提供しているopenai-whisperで文字起こしを行いました.そのデータを元にStyle-Bert-VITS2の配下にあるTrain.batを叩くとブラウザが立ち上がる.何処にデータセットを置かないいけないかなども記載されている.

その場所にデータを配置します.配置後、上から順番に実行していけば学習モデルが生成されます、生成されたモデルをONNX形式に変換しその後aivmx形式しないとAivisSpeechでは使用できないらしい.変換コマンドはこちら、やり方はこの方が記載されているので参照ください.

git checkout dev
pip install onnx
pip install onnxsim 
pip install accelerate
python convert_onnx.py --model 【SVBS2のモデルフォルダ】

onnxに変換後、AivisSpeechの公式サイトのコンバーターサイトで変換するとaivmx形式が落ちてきます(ダウンロード).それをAivisSpeechアプリの設定から読み取ればOK!

結構長い手順ですが、これで自分の声の音声合成が出来ます.それで作ったのがこの音源です、雑音が入っているのはセミがなく中で録音した音声を学習させたからこんな感じになっています.

追伸:雑音を除去しました.下記は雑音を除去したものになります.

明日へ続く

著者名  @taoka_toshiaki

※この記事は著者が40代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

コンバーターサイト, セミ, ダウンロード, ブラウザ, モデルフォルダ, 事前, 何処, 変換コマンド, , 学習モデル, 形式, 本録音, 追伸, 配下, 長い手順, 雑音, 音声, 音声合成, 音源, 順番,

こういうの結構需要あるよね。

2019.12.01

Logging

こういうYOUTUBE動画は結構需要あるよねと思ってしまいます。
例えば、雨の街角を記録した映像とか、ほんと何気ないのだけど
ほんとにそういうのが好きです。

雨の音のアプリがあるのは、自分は納得しています。
自分も結構使っています。スマートスピーカーから雨音を一日中流すことも
あります。雨音って聞いていても雑音にもならないし、
逆になんだか落ち着けるので良いかなと思っています。

屋久島の夜音(虫の音色)も雨音と同じぐらい落ちけます。
ちなみに雨音聞かせてくれるサイトがあります。
https://www.rainymood.com/ 【昔は映像も流れてた】

こういった環境音っていま流行っているらしいですが…
休日は何も考えないでぼーっとこういう映像を観るのもリラックスに
良いかなと思っています。

Walking in Heavy Thunderstorm at Night in NYC (Umbrella Binaural 3D Rain Sounds) ASMR 4K

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

com, rainymood, youtube, アプリ, いま, こと, サイト, スピーカー, スマート, ほんと, リラックス, 休日, , 動画, , 屋久島, , 映像, 環境, 納得, 自分, , 街角, 記録, , 雑音, , 雨音, 需要, , 音色,

動画を無音声に変換するバッチ

2019.09.28

Logging

こらからプログラムしている所のVlogを撮ろうと
月曜日に、WEBカメラを新調しました。
いざ撮影してみると部屋の雑音などが入ってしまうので
音声カットする方法は無いのかなと
フリー編集ソフトをググっていたのだけど
フリーの動画編集ソフトは動画の最初に開発会社のロゴが
表示されるものが多くて何だかやだなーと思い
断念、よくよく考えると自分プログラマーじゃないかということを
思い出しffmpegの存在を思い出して、、、。
ffmpegで無音声で検索すると音の切り離しができる事を知り
バッチを作る事が出来たのでその方法をおすそ分け。
Windows用のffmpeg(解凍したフォルダffmpeg)がC:の直下に入っているとした場合の
バッチです、尚、解凍したフォルダはffmpegに名前変更済とします。
下記のコードをテキストファイルにコピーしてその後、拡張子をbatと変更し
お使いください。動かない場合、下記のプログラムを正しく理解するか
知り合いのIT関係者にヘルプしたら大体の方はわかると思います。
※環境変数には登録していないのでexeにパラメータを渡します。

@echo off
set /P INMP4="動画ファイル名(絶対パス)を入力ください"
set /P OUTMP4="出力動画ファイル名(絶対パス)を入力ください"
cd C:ffmpegbin & ffmpeg.exe -i "%INMP4%" -vcodec copy -an "%OUTMP4%"
echo "complete"

 
無事、無音声の動画に音楽をYOUTUBEで付与することが出来ました。
https://www.youtube.com/watch?v=0-0FH3iaEP4

著者名  @taoka_toshiaki

※この記事は著者が30代前半に書いたものです.

Profile
高知県在住の@taoka_toshiakiです、記事を読んで頂きありがとうございます.
数十年前から息を吸うように日々記事を書いてます.たまに休んだりする日もありますがほぼ毎日投稿を心掛けています😅.
SNSも使っています、フォロー、いいね、シェア宜しくお願い致します🙇.
SNS::@taoka_toshiaki

OFUSEで応援を送る

タグ

Bat, ffmpeg, Vlog, web, Windows, おすそ分け, お使い, カット, カメラ, コード, こと, コピー, ソフト, だなー, テキスト, バッチ, , ファイル, フォルダ, フリー, プログラマー, プログラム, もの, ロゴ, 下記, , 動画, 名前, 場合, 変換, 変更, 存在, , , 拡張子, 撮影, 断念, 新調, 方法, 最初, 月曜日, 検索, , 直下, 編集, 自分, 表示, 解凍, 部屋, 開発, 雑音, , 音声,