VOICEVOXの基本的な使い方

Uncategorized

【テキスト入力から簡単な音調の方法】

VOICEVOXのセットアップができたら、さっそく発声してみましょう。

この記事では「VOICEVOX」の基本的な使い方と、簡単な声の調整の方法を説明します。

VOICEVOXには多くのキャラクターが設定されていますが、まずは最初に出てきた「四国めたん」で説明します。

とりあえず声を出してみる

小さい「めたん」の顔の横にテキストを打ち込んでエンター。

するとこのように、画面下方に「アクセント」の表示がされます。

アクセント表示の左の「再生ボタン▶」をクリックすると

こんな感じで話してくれます。

話す速度を変える

四国めたんは比較的ゆっくり話します。
特に「ゆっくり」の話し方と聞き比べてみると、声の質もあわせて話し方が遅いと感じることがあるかもしれません。

そのときは、右側の話速で調整します。

どうでしょう?
少し遅くなったのを感じられましたか?

ここを調整するとどうなるかは別に解説しますが、あまり変化値が大きいと不自然な話し方になります。
元のキャラクターによっておすすめ許容値は違いがありますが、一般的には20%~30%、VOICEVOXでの表示では1.2~1.3くらいが妥当かと思います。

抑揚を変えてみる

VOICEVOXはディープラーニングで常に進化しているので、いまではデフォルトでも普通に話すことができますが、やはりキャラクターによっては抑揚に違和感があって、やはり調整したいシーンはあります。

それで発声したらこうなります。

どうですか?
ちょっと感情が豊かになった気がしませんか?

逆に数字を下げると棒読みに近くなります。
でも抑揚に数値を小さくしただけでは「ゆっくり」のようにはなりません。

わざわざVOICEVOXを使うのにゆっくりに合わせる必要はないと思いますけど。

アクセントの調整

ここまで3例を聞いていただきましたが、自然に話すとはいっても若干アクセントに違和感があったと思います。

個人的には「ずんだもん」のような特殊な話し方をするキャラクターは、少しくらいアクセントが乱れていてもそれが味になると思いますが、できればアクセントも調整して自然に話してあげたいものです。

アクセントの調整をするには、下段の丸印をアクセントをつけたいところに移動します。

①「ディ・イ・プ」の「ディ」にあったアクセントを「プ」に移動しています。
②「ク・オ・リ・ティ・ガ」の「ガ」にあったアクセントを「オ」に移動しています。

するとこのようになります。

アクセントの調整には区切れ目も調整する

ここで、本当は「ラ・ア・ニ・ン・グ・デ」の「ラ」にあるアクセントの山は、「ラ」と「ア」につながった山にしたいのですが、切れ目のはじめの語から続いた山が作れません。

そもそも単語としては「ディイプ」と「ラアニングデ」という分け方はおかしいので、
「プ」と「ラ」の間をクリックしてひとつの文節としてつなげます。

つながってしまえば、あとは「プ」にあるアクセントの丸印を「ラ」の上にドラッグすれば

発声はこうなります。

アクセントを「ラ」におくか、次の「ア」まで伸ばすかは聞いてみて判断してください。

同様に「カイワノ」「クオリティガ」のところも違和感がありますね。

ここは単語としては区切れていてもおかしくはないですが、発声するときには一息で発声しますので、ここもつなげてしまいます。

どうですか?
だいぶ自然に話知ていると思いませんか?

イントネーションを調整する

「アクセント」の調整では、単語のどこにアクセントを持っていくか?という調整でしたが、より高度な調整として一音ごとの音程を調整する「イントネーション」の調整をします。

サンプルのセリフはこれです。

画面はこうです。

イントネーションを選ぶと、このように音程が先からポイントに変わります。

ここでは「ド」の音をいじってみることにします。
表示されているように「ド」の音の高さは[5.81]となっています。

これを[5.11]に下げてみます。

どうですか?

一音変えただけで雰囲気だいぶ変わりましたよね。

こういう操作を駆使して調整ができると、話し方や声色もいろいろ使えてより自然な会話、自由な会話が実現できるようになるというものです。

音の長さの調整

最後の調整機能、[長さ」の調整です。

ぱっと見はイントネーションと変わらない画面ですが、丸が左右で二分割されていますね。
これは、子音と母音それぞれで長さを変えることができるようになっているということです。

ここで、同じセリフで「ド」の母音だけ伸ばしてみましょう。

「どう」のところが強調されて、その分ちょっと感情がこもったように感じませんか?

いっぽう、子音のほうを長くすると、溜めができて、音によってははっきりとした発音になります。

まとめ

この記事では、VOICEVOXの基本的な操作として
・しゃべらせ方
・アクセントの調整
・イントネーションの調整
・音の長さの調整
について説明しました。

簡単すぎるほど簡単な説明かと思いますが、ここでは何ができるかということと、基本的な操作のイメージができればOKです。

というのも、それぞれの調整は「音」や「キャラクター」によって反応が違うので、キャラクターごとの特徴を加味する必要があるのです。

クセや特性はその都度説明をしていきますので、ここでは基本的な操作を理解して、ほかの説明記事に進んでください。

導入から見たい方はこちら

タイトルとURLをコピーしました