リンの調教について(ミキサー的な意味で)

鏡音リンが出てから、作品がどーっと公開されているのだけど、ミキサーの初歩の部分で失敗している残念なものが多いので、参考のために。

まぁあくまでも「基本のよくわからない初心者」のためのものなんで、ごく基本的なことだけ。これはリンに限らずミクでも通用するし、人間がカラオケをやる時にも使える。ただし、これは「ナチュラルなPA」の流儀なので、他の流儀でのつっこみは禁止。その辺については私はわからないので、他の人が書いてくれるといいかも。

まず、ミキサーに入る前に。。

あなたがVOCALOID2シリーズを何も持っていないなら、悪いことは言わないから「鏡音リン・レン」には手をつけない方がいい。調教が難しくて挫折するだけだ。それよりまずは「初音ミク」で「自信」をつけた方がいい。ミクはクセが少ないので仕事を選ばないのだが、リン・レンはかなりクセがあるので、どうも仕事を選ぶ(後述)。ちょっと遊んでみるにはミクの方がずっといい。

また、ニコ動にはアイマスの曲が「課題曲」として挙がっているのだが、これが実に難しい。

リン ≠ とかち

ということは肝に命じておいていいと思う。はっきり言えば「課題曲」は難物ばかりでなかなか難しい。「調教の練習」としては「本物」がある分やりやすいのだが、難しいと思っておいた方がいい。

さて本題。

リンには、非常に厄介と思われる「クセ」がある。その一番大きなものは、「こもる音がある」というものだ。なんとなく鼻声になってしまう。「課題曲」が「らしく」聞こえない原因の一つでもある。

これをどうするかには、3つのアプローチがある。

  • こもりやすい音を避ける
  • クセを生かす
  • 補正する

である。「こもりやすい音」は決まっているので、その辺の声域や発音を避けてやるというのは、まぁ上手い逃げ方。「滑舌悪いな」な音はだいたいこもる音でもあるので、その辺を避ける。ただ、そうすると適用範囲が一気に狭くなってしまう。アレンジするという手もあるのだが、それはそれでまた微妙。

クセを生かすというのは、「そういった曲を歌わせる」ということで、これが一番素材の持ち味を殺さないし、うまくハメることが出来れば良いものになる。他の人の曲を何曲か聞いていれば、どんな曲がハマるかということが、だんだんわかって来ると思う。そういった曲を歌わせておくのが、一番幸せだろう。作り手も楽だし、聞いてる方も安心だ。

最後の手として、「こもってないように補正してやる」というのがある。あまり得意でない曲でも、補正してやれば何とかなる。実際、「エージェント夜を往く」でまるっきり「とかち」を再現している人は、フォルマントレベルでの補正をしているらしい。そうやれば確かに再現出来る。これはこれで凄い「職人技」だと思うし、時にはプロはそういったことをやらないといけないのだけど、アマチュアがそれをやる意味が果してどれくらいあるのだろうか? フォルマントをいじるのは、「別人」にしてしまうということでもあるので、「鏡音リン」である必要性は低くなってしまう。技の凄さには素直に感心するのだけど。

フォルマントをいじるというレベルではなく、イコライザをいじる程度でもかなり補正出来る。

人の声を周波数レベルで分割して、その成分がどんな働きをするか大雑把に言うと、

  • 高音域は声の通り方を
  • 中音域は声の明瞭さを
  • 低音域は音のエネルギー感を

左右するという性質があると言える。「こもった感じ」というのは、「声の通りが悪くて明瞭さを欠く」という状態なので、中〜高音をイコライザで持ち上げてやる。あるいは逆に低音を下げてやる。こうしてやれば、「鼻の詰まった感じ」がかなり改善される。

もちろんこれらはあくまでも「傾向」であるし、持ち上げるにしても下げるにしても、他の副作用があるから程々にしないといけない(低音を下げると通りは良くなるのだが、エネルギー感が欠けてしまう)。でも、調教でどうやってもうまく行かない時には、やってみるのも手だ。

ただこの時に、あまりやり過ぎると「ミク声」になってしまう。元々ミクの声は、中〜高音域が出ている声だったので、機械的なクセが目立たない声だった。だから、この補正は「リンをミクに近付ける」ことでクセを消すことになってしまう。良調教の中には「これミクじゃない?」って思ってしまうものがあるのは、そのせい。そういった意味では、補正は程々にするのがいい。ミキサー見習い時代に、あまりに下手な歌手についこんな補正をやっていたのだが、先輩には「あまり音を作るな」と叱られたものだ。

こもった感じでなくても、滑舌が悪いなと感じたり、ロボ声になったりした時には、エコーをかけてごまかす。エコーをかけることは、「一瞬前(たいてい160msくらい前)の音を重ねる」ということと同じなので、それで「隙間」が埋められるわけだ。でも、これもやり過ぎると「お風呂の中」みたいになってしまうので程々に。

もっと楽に逃げるには、

伴奏を大きくしてごまかす

という手がある。特ににぎやかな(楽器の多い)伴奏を使うと、アラが隠しやすい。ただし、これをやり過ぎると「歌詞が聞こえない」ということになってしまい、何のためのVOCALOIDだということになってしまうので、程々にした方がいい。

というのが、ごく基本的な補正のテクニック。この辺をうまく使えば、かなりマシに聞こえるようになると思う。

とは言え、こういった「補正」とか「エフェクタ」あるいは「伴奏」といったものは、

理想量はゼロ

ということを思っておくべきだ。これは「庭石と地面」の関係のようなものだ。「庭石」とは「歌手」であり、「地面」とは「エフェクタ」や「伴奏」だ。

いい石、目的に合った石があった時、その石は転がしておくだけで立派な庭石だ。地面に埋める必要はない。世の中にそんな「庭石」もいっぱいある。これが一番楽でもあり、自然でもある。本来「石」は地面に転がっているものだ。

でも、石をそのまま転がしておくと、不安定だったり必要でない面が見えたりする。だから、ちょっと地面に埋めておくと、安定するし不必要な面が隠れる。たいていの「立派な庭石」というのはそういうものだ。

石の素状が悪い場合でも、どんどん埋めてしまって、必要な面だけ見せてやればなんとか観賞に耐えるものに出来るかも知れない。ただ、そうやると元々ある「持ち味」は地面の下になってしまっているかも知れない。

魯山人的に言えば、「素材と料理」と言えるかも知れない。いい素材は余分な手をかけると、素材の良さを殺してしまう。

これらと同じように、「素状のいい調教」が出来たら、なるべくエフェクタや伴奏には「埋めない」ようにするのがいい。合唱のようなものは別だが、歌というのは歌声が聞こえてなんぼなのだ。

伴奏のレベルで言えば、聞く環境にもよるのだが、歌を基準にすると-3〜-10dBくらいにした方(つまり歌のフェーダよりもそれくらい下げる)が、歌が引き立つ。ヘッドフォンで聞くと伴奏は大き目に聞こえるとか、小さいスピーカだと歌の方が大き目に聞こえるとかの環境の違いがあるので、その辺の考慮も必要になるのだけど、だいたいこんな傾向だ。これより伴奏を高くすると、「歌が埋もれる」ことになる。あと、私は前奏や間奏の時はちょっと伴奏のフェーダを上げるのが好みだ。面倒だったり、そこまでやれないDAWならやらなくてもいいけど。

エフェクタに至っては、「かけないことこそ理想」だと言ってもいい。ただ、エコーは全くかけないと、カサカサの音になる。また、伴奏にカラオケや電子的にカラオケを作ったもの(ボーカルリデューサとかを使う)を持って来ると、それらは元々エコーがいくらかかかっているために、「伴奏と歌のエコーの量が違う」というおかしなことになってしまう。その辺を考慮して、歌にだけちょっとエコーをかけてやるのは必須となるだろう。

ということだけでもやってやれば、格段に良くなるはずだ。同じことはカラオケでも使える。

あと、これは「調教」にも言えることなのだが、

デフォルトは大切に

するべきだ。世の中のたいていのものは、デフォルト状態が一番無難なように作ってある(そうでないシステムもないわけじゃないが)。だから、そこから外すのは、それなりに理由がなければならない。VOCALOIDの各種パラメータ、エコーの時間、コンプレッサのパラメータなどなど、どれも最初はデフォルトでやることを心掛ける。選曲が自由であるなら、無調教でやれる曲を選ぶのが理想だ。だいたいこの手のもののパラメータをいじっていると、ゲシュタルト崩壊を起こしてしまって、「何が何だか」状態になってしまう。そうなったら、一度デフォルトに戻して、冷静になった方がいい。

以上が基本の基本、初歩の初歩だ。これから先はいろいろ工夫して、いい作品をうpして下さい。

PS.

レベルのことは全く書いてなかったけど、コンプレッサやリミッタを入れてない時は、「ピークインジケータは-6dBを指す」のが上限だと思うといい。場合によってはそれでもレベルオーバになって音が割れたり潰れたりする。エンコードした時にプリプチ言ったりするのは、その辺が原因だ。ただ、そうするとエネルギー感に欠けてしまう。これを改善するにはコンプレッサやリミッタを使うのだけど、それはちょっと「上級編」的かも。

PS.2

いろいろ聞いて思っただけで、実際のコードを見たわけじゃないけれど、「鼻詰まり」感については、多分VOCALOIDの音響モデルの問題ではないかと思われ。もしかしたら、この音響モデルには「鼻がない」のかも知れない。であるなら、イコライズする時に「鼻」を作ってやれば良い。具体的には「中音域よりも少し上にピークがある」ような設定にすると、マシになりそう。

PS.3

ここに書いたのとは逆に、積極的に音作りしてしまうという手もあります。それで成功している作品も多数あるので、「ナチュラル」にやることに限界を感じたら、そっちの流儀でやってみるのも良いでしょう。それが「クセを生かす」ことにもなります。でも、「基礎」としてナチュラルにやることは身につけておいた方がいいので、1作くらいは頑張ってナチュラルにやってみるのがいいと思います。

PS.4

この通りにやると、レベルはちょっと低めになります。だから「音小さくね?」なコメントがつくかも知れません。もしレベルオーバ耐性の強い(つまりコンプレッサ的動作をする)エンコーダがあれば、「-6dB」は無視しても構いません。ただ、それに頼ると音割れが起きたり、大レベルの時にバランスが崩れたりします。だから、他の人に素材として使って欲しいのなら、多少弱気くらいのミクスの方が使いやすくなります。割れてない音を割るのは簡単ですが、割れた音は元に戻せないのですからね。「完成品」として出すのであれば、聴感上割れない範囲で「メインフェーダ」を上げて構いません。

PS.5

すごく根源的なことを書くのを忘れていたけど、既存のデジタルソースのみを使う場合、フェーダ位置は0dBでも絶対にレベルオーバしない、つまり割れません。なぜなら、デジタルソースはそうレベル調整がされているはずだからです。複数のソースをミクスする場合、そのソースの総和のレベルになるので、その分だけはフェーダを下げなければレベルオーバのリスクが発生します。0dBのソースが2つあれば+3dBになって3dBだけ超える危険が出て来るので(必ず超えるというわけではありませんが)、あらかじめ各フェーダは-3dBしておくことになります。