やっつけで作ってしまった…… pic.twitter.com/tWRmXDXemD
— イショティハドゥス (@Ishotihadus) 2015, 11月 21
このツイートがかなりの反響を呼んだ。もとのセリフは「ごめんねお姉ちゃん、いい子になるからもう怒らないで」。これを「お兄ちゃん」にしたわけだ。
今まではコラ画像の時代だったが、これからはコラ音声の時代。その手始めに、これの作り方をメモっておくことにした。
〜追記〜
twitter アカウントが凍結されてしまったので、YouTube に良質なものをあげてみました。
素材の選び方だが、「エロゲの音声をとってきた」などのツイートも見られたが、実際にはそう簡単にはいかない。人間の耳は結構いい。
一番問題なのは、「酔っているチノちゃんの声を当てた時の水瀬いのりの声」が必要だということである。魔法少女チノのドラマ CD も探したのだが、マシな「にい」の音が見つからなかった。目覚ましアプリだと「お兄ちゃん」とはっきり言うのだが、結構急ぎ気味に言っていること、素面であることからちょっと厳しそうだった(実際やってみるとうまくいくかもしれないが……)。
酔っている場面ではほぼ BGM が鳴っているので、結局子音の n は諦めて、音声中にある「いい子になるから」の「いい」を使うことにした。
なおコラ音声にはほぼ Adobe Audition、iZotope RX、Audio Director などが必須である(AudioDirector は微妙そう?)。スペクトルが生編集できるソフトウェアをこれ以外に知らない。知ってたら教えて。今回は Adobe Audition を用いている。iZotope は買うお金なし。
最初の波形はこんな感じ。「おねえ」の部分だけ。少し強い部分→弱い部分→かなり強い部分になっているが、これがそれぞれ「o」「n」「e」にあたる。
最後の減衰も含めて「いい」を入れたいので、こんな感じにコピー。
ピッチも長さもむちゃくちゃなので、とりあえず長さを整える。コピー前の「ええ」は 0.270 秒、コピー後の「いい」は 0.255 秒なので、0.270 秒になるようにストレッチする。ここではピッチの上下が動かないようにする(リサンプルでない)。さらにスプライシングの周波数を声が綺麗になるように調整する。
次にピッチの調整。チノちゃんがどんなふうに「おにいちゃん」と発音するのかを妄想しながら調整する。ところがどっこい単純に「い」の音がそのまま出るわけではないので注意しながら調整。
とりあえずはこんな感じ。-2.4 半音くらい落とした気がする。
次に接続部分の違和感を消すために修正ツールでスペクトルをガバッと修正。
さらに「フォルマント周波数」を意識しながら「い」の音を調整する。ここでやっとちゃんとした母音になる。耳がよければ耳がフーリエ変換してここのピッチを落とすと「い」になるっぽいとかすぐわかるはずなので難しくない。
こんな感じ。微妙に真ん中辺りのスペクトルを弱くしているのがわかる。ブラシツールで書いてから Delete するとだいたいできる。不透明度とサイズを調整しつつやるとよい。
最後にピッチベンドをかける。「おにいちゃん」のときに「いい」がそのまま伸びるのはおかしくて微妙にピッチが下がったほうが良い。1〜2 半音くらい下げておく。最後に綺麗に整えてあげて、最終的には下のような感じ。
結局は、元の素材をコピペして、おかしなところをブラシで修正する、というコラ画像の作り方とほぼ同じ。
みんなも音声言語処理を勉強して最高のコラ音声を作ろう!
もくじ
追記
Q. 他にも SpectraLayers がありますよ?こちらの方が使いやすいかも
知りませんでした。今度使ってみます。
Q. Melodyne で全部調整できるのでは?
Melodyne は持ってません(パンチの絵文字)。Melodyne の実力は知らないので何とも言えませんが、手持ちの VariAudio だとなかなか成果が得られなかったのでそんなものなのかな…とか思ってたりします。今度やってみます。
Q. 最初のストレッチの作業は必要なかったのでは?
動画と合わせたかったからストレッチしました。あとは「おにいちゃん」をするっと言った時の長さも多分そっちの方が自然なのでは。よく検証してないけど。
Q. 背景 BGM を消せたらもっと素材が増えたのでは?
背景 BGM を消すのはそんなに簡単ではないと思っています。もちろんそれなりの精度ではできますし、CD があればなお、ですが、やはりそれでも「それだけ」の声には敵わないでしょう。
Q. 耳がフーリエ変換とは?
耳は構造的にスペクトル分解をしています。実際にスペクトログラムをたくさん見てきたり、スペクトルの姿をたくさん見てくれば、脳内フーリエ変換・耳でフーリエ変換して脳内フィルタをかけることはそれなりにできると思います。もちろん実際にやってみてそこからまた調整して、を繰り返す必要はありますが。
そのほか
「このピッチを落とすと『い』になるっぽい」ですが、正確には「この辺のピッチのにょろにょろの振幅を落とすと」みたいな表現です。誤解を招きそうなので書いておきます。
カルラボさん(via ニコニコニュース)、Gigazine さんに掲載していただきました。ありがとうございます。
一応音声の m4a ファイルを置いておきますので、目覚ましや知り合いの自称お兄ちゃんを励ます際などにお使いください(ノーマライズなどは各自でお願いします) → これ
ピンバック: チノちゃんに「お兄ちゃん」って言わせたい! | 愛のらくがき帳 #テクノロジー -|アニメアンテナ「Anitenna」
あんまりこの手の波形編集ソフトは詳しくないのですが
・SpectraLayersPro
はどうでしょう?
ありがとうございます!追記しておきます
ピンバック: ツカエル!ネットの話題 » Blog Archive » 11月24日 05:00版
才能の無駄遣い(褒め言葉)
ピンバック: 2015-11-24のニュース | Re: spam news