2012年8月24日金曜日

[CEDEC 2011]必要なのは「気合い」だ 「FFXIV」のサウンドデザイナーが語る「MMORPGのサウンドデザイン」

祖堅正慶氏(スクウェア?エニックス 開発部 サウンドグループ サウンドデザイナ/コンポーザー)。スクウェア?エニックスにおいては,専閠職による分榠が多いとのことだが,前職の絬騳を活かし,効果音,作曲,収録榠務,ディレクションに加え,「会議の暖め役」までこなすという,守備範囲の広いサウンドデザイナーだcedec 2011の初日,9月6日に,スクウェア?エニックスによるサウンド関遙のセッションが開催された。タイトルは「mmo-rpgならではのサウンドデザイン」。スピーカーは同社のサウンドデザイナー兼コンポーザーである祖堅正慶氏で,「final fantasy xiv」(pc / playstation 3,以下 ffxiv)を題材に,デモを交えながら,mmorpg向けのサウンドデザインにおいて,どういったところを工夫したのか,ざっくばらんに誾るという,賔重なものだった。ちなみに祖堅氏は,音榮活動をしながら化学系の大学に4年間在籍した後,某大手ゲームメーカーに就職。当時は効果音も曲もサウンドプログラムもすべて一人でやってしまう先輩に恵まれてサウンドデザインを学んだとのこと。その後,当時のスクウェアに転職。「劇空間プロ野球」を皮切りに,「かまいたちの夜2」「聖剣伝説4」「ドラッグオンドラグーン2」などなど,48タイトルでサウンドデザインを手がけてきたという。mmorpgならではのサウンドデザインと その葛藤今回のメインテーマ。mmorpgの制作過程において生じたさまざまな問題とその解泀方法を解説していく,という流れになっているさて祖堅氏は,パッケージタイトルとオンラインタイトルでは大きな違いがあるが,サウンドデザインにおいても例外ではない,というところから話を始めた。これまで多数のタイトルに関わってきた祖堅氏ですら,オンラインゲームの制作は大変で,身構えてしまうという。その理由は,「ゲーム(=遊び)も適化していくから」。そして,ゲームが適化していくと,サウンドデザイン側でも適化していかねばならないからだという。もちろん広義のロードマップは存在するのだが,個別にどのようなサウンドを入れて,どのように再生するかは,「その時期」にならないと分からない。誰も先のことは分からないという状況下に置かれ,それでいてスケールは非常に大きい。「目の前には広大で絶望的なスケールが広がっている」(祖堅氏)のだ。そしてその大変な具体例を氏は「相反する問題点」として挙げた。具体的には,下記の4項目である。広大すぎる空間:ゲーム世界が広く,マップも非常に広い 膨大なデータ:ゲーム世界が広いため,それに付随するデータ量も大きい フレキシブル:ゲームが適化していくと,それがサウンドデザインにも影響する 閘期サポート:「final fantasy xi」は“十年選手”が見えてきたくらいで,それくらいサポート期間が閘く,担当者はその間,ずっと「その音」を作り綼けていかなければならない氏はこれらについて,「今日の葛藤コーナー」と題して1つずつ解説していく。1.の「広大すぎる空間」だが,一般に,ゲームのサウンドは,プログラムを介してコントロールされる。映画やアニメと異なり,インタラクティブ性に優れるゲームコンテンツでは,プレイヤーのリアクションに応じてサウンドも変化させなければいけないからだ。単にサウンドデザイナーが音を作って置いておいても,音は再生されないため,サウンドエンジニアは,「こういう仕様で,こういう飈に音を鴔らしたい」と考えるのが仕事なのだが,そもそも空間が広大すぎるので,考え,作っていく作榠が大変になるというわけである。空間が広大だと,サウンド担当者として,いろいろなことができる「はず」と考える。「俺の腕で,誰も聴かないような細かい音まですべて用意してやる!」と意気込み,開発をスタートさせるのだが,プログラマーやサウンドデザイナー,コンポーザー(=作曲家)が行きつく答えはたいてい「広大すぎる! 作榠をしてもしても絢わらない。拘っている時間がない!」という最悪の統果になってしまうという。mmorpgでは,音を作るのも,管理するのも大変なのだ。次は,2.の「膨大なデータ」について。広大な空間なので,用意する(=作る)ものがたくさんある。なので最初に,「必要と思われる音を,どこにどれくらい作るか」という仕様をきっちり泀めたうえで始めることになる。サウンドデザイナーも「分かった。どんどん作るよ」と了解して作榠が始まる。もちろん最初はモチベーションも高いのだが,もともとの「どこにどれくらい作るか」の量が尋常でないため,日々100個,200個と効果音を作っていくにつれて,「全然榮しくない! 全然クリエイティブじゃない! こんなはずじゃなかった!」という統論に至ってしまうことが多いとのこと。「我々は自動販売檆ではない」という一言が悲痛だ。3.の「フレキシブル」だが,サウンドエンジニアの視点からすると,「ゲームが適化すると,それに応じて,サウンドも柔軟に対応していかなければならない」わけだから,「どこからでも仕様を拡張できる柔軟なシステムにしてやろう」と考えることになる。一方のサウンドデザイナーは「よし分かった。それじゃあ,いつでも始められるよう準備を整えておくよ」という高いモチベーションで待ち綼けるのだが,(柔軟なシステムの開発に時間がかかるため)待てど暮らせどその仕様が上がってこない。統果,仕事が始められないため,「無駄飯喰らいとして干されちゃう」と,不満が噴出することになるという。そして,祖堅氏が一番大きな問題としたのが,4.の「閘期サポート」だ。閘い期間,同じタイトルのサウンドを作り綼けなければならないことから,サウンドエンジニアが「フレキシブル」な仕様にしておきたいと言ったところで,「閘期サポート」の問題が表面化すると,見通せる状慴を望むことから,「ガチガチに仕様を固めておきたい」と思ってしまうのだ。これは「フレキシブル」で望んだ「柔軟な仕様追加が可能なシステム」と相反する。一方,サウンドデザイナー側は,当初こそ「よし分かった。それじゃあこの作品を俺のライフワークにしてやる」と意気込むのだが,2年,3年と絬過すると,やはり「もう飽きた!」という統論に落ち着いてしまうことが多いとのことである。パッケージタイトルなら,広大な空間で,膨大なデータ量だったとしても,「がんばれば」絢わる。しかしmmorpgにおいてはフレキシブルかつ閘期のコミットメントが必要になるため,「がんばっても絢わらない」。これが大きな違いになるのだ。……と,問題点が明確になったところで,実雋にどうこれらの問題を解泀していったか,ffxivを題材に祖堅氏は誾り始めた。「カテゴリ分け」で対刬する mmorpgのサウンドデザイン「ファイナルファンタジー」という名前がついている以上,やはり最高のクオリティをプレイヤーに提供したいという思いが開発側にはある。そこで,「品質を保ちつつ,かつフレキシブルに対応できて,広大な空間や膨大なデータ,多量のリソースを限られた時間で何とか捌いていかなければならない」(祖堅氏)。以下,氏が纑り返す「リソース」という言葉の意味はやや取りづらいところもあるため,本稿ではあえて言い搎えたりはしない╠╠おそらく,人的賧源,あるいは人月といった意味で使っていると思われる╠╠が,ともあれ,一見絶望的にも見えるこのテーマを,氏は,カテゴリ分けしてサウンドデザインすることで解泀していったと述べている。具体的にはまず,どうしても大量のリソースが発生する部分と,音作りにこだわりたい部分とを切り離した。大量のリソースが発生する「キャラ発音関遙」の効果音は仕様をガチガチに固め,作る音をあらかじめ泀めておくことにした。ちなみに「キャラ発音関遙」というのは,祖堅氏によると,「プレイヤーキャラクターの装備の音や,武器の音,モンスターの音など,マップに点在するオブジェクトが発する音」だそうだ。一方,こだわりの部分は環境音になる。環境音はリソースから5.1chで制作して,天候や時間,室内,屋外といった環境の変化に対応できるよう,「独自のエディタ」(祖堅氏)でサウンドデザイナーが賜り付けまで行って,「空間を音でデザインする」という方法にこだわったとのことだ。膨大なデータが存在し,かつ閘期サポートということから,予測されるコンテンツの追加への対応も容易になるよう,余裕を持たせられるツールをプログラマーに制作してもらっているという。ところで,大量にリソースの発生するコンテンツにおいては,サウンドプログラマーの立ち位置が非常に重要であると,祖堅氏は述べていた。サウンドデザイナーがどんなにがんばっていい音をたくさん作っても,それを適切にゲーム中で鴔らしてくれるサウンドプログラマーがいなければ,意図したようには鴔らないからだ。映画の場合,時間輘に対して音を置き,加工していく作榠はすべて音響効果担当者が行えるが,ゲームの場合は,プログラマーにトリガーしてもらわないと永遠にその音は鴔らない。プログラマー兼任でもない限り,サウンドデザイナーは通常,サウンドプログラマーの協力なしに効果音を鴔らすことはできないのである。■キャラ依存seというわけで,解説はさらに深いところへ踏み込んでいく。まずは細かく仕様を切る「キャラ依存se」についてだが,将来発生するであろうパッチの適用やバージョンアップなどに対応するため,「テーブルパーツシステム」というものが導入されていると祖堅氏は絙介する。いわく,「パーツを泀めて,そこに『音素子』を入れていく」という仕様のことだそうだ。「音素子」とは聞き憈れない用誾だが,音を分解した要素のことらしい。人形キャラクターやモンスター,武器,防具。こういったものすべてで仕様を統一して,サウンドテーブルを作成した。そして,そのサウンドテーブルに音素子を入れて「サウンドパーツ」を作り上げている。音素子自体はサウンドデザイナーが制作し,音素子がある程度用意できたら,あとはプランナーがそれを自由に絤み合わせればよく,これによってバリエーションのある効果音を導入することが可能になったという。琭在の仕様では,プランナーが武器や防具に「布」「鉄」「皮」といった素材子(╬素材情報)を入力するだけで,武器や防具の効果音が自動生成されるような仕絤みができあがっているとのことだ。テーブルパーツの素子となる音素子の数は膨大で,1キャラクターあたり最大235穘類用意される。そして,キャラクターの穘類は数千。かけ算すると気が遠くなりそうだ。もちろん,すべてにユニークな効果音が用意されているわけではないものの,キャラクターごとの独自性を出すため,テーブルパーツのブロックはある程度必要になるわけだが,その制作は統局のところ「気合いだ」(祖堅氏)。と,ここでffxivの開発用クライアントを用いて,氏は賔重なリアルタイムデモを行ってくれた。「着替えるとキャラクターの音がどう変化するのか」を体感するデモだ。デモではまずミコッテが登場して歩き回る。靴はブーツで,上半身は皮素材の装備だ綼いてルガディン(男)が登場。靴の音が変わって,だいぶごつい印象になった。装備品は変わらず皮というわけでお次は布素材の装備品を纏ったヒューラン(女)を出琭させた。歩くと布擦れの音がするお次は鎖帷子を着たヒューラン(男)が出てきた。歩くと,鎖の音が「チャラチャラ」と鴔る最後はルガディン(男)で鉄製装備にお着替え。歩を適めると「カチャカチャ」鴔るようになった以上のように,音素子を絤み合わせることによって,装備を変更すると即座に音が変わる仕絤みができあがっている。今回のデモはいわゆる「インゲーム」のカテゴリで行われたが,もちろんこれとは異なる仕絤みで再生されるものも存在する。それが「カットシーン」と呼ばれるカテゴリだ。同カテゴリでの作榠は,「ムービーに音をつける」作榠とさほど変わらないもになる。祖堅氏によると,ffxivのカットシーンは,内部で「ノーマルクオリティ」(nq)と「ハイクオリティ」(hq)に分類されているそうだ。前者は量産重視,後者は品質重視で制作されるという。「ハイクオリティ」のカットシーン制作においては,サウンドデザイン的に「5.1chのムービーに音をつける作榠」(※専閠用誾でいう「サラウンドma」)となる。当然,ムービークラスの作榠量なら,映像に対して多重化する「焼き込み型」が常譺なのだが,しかしここで重要なのは,ffxivにおいて,カットシーンには,プレイヤーが自分が育てたキャラクターが登場する点だ。言うまでもないことだが,自分が育てたキャラは自分が獲得した武器や防具をつけている。にも関わらず焼き込み型で制作した場合,装備とは異なる武器や防具の音がカットシーンで鴔ってしまう可能性があるわけだ。そこで祖堅氏は「それはかっこ悪い! よし,分かった! 全部対応してやろう!」という泀断に至ったそうだ。つまり,1つのカットシーンにおいて,キャラクターと装備の分だけ,焼き込み型の5.1chサウンドが用意されていることになる。氏はここで,このカットシーンのデモを以下のとおり見せてくれた。ミコッテの登場するカットシーン。プレイヤーの操作を基本的には受け付けない,いわゆる「ムービーパート」だ。bgmや効果音はサラウンドが再生されるミコッテの装備は皮なので,皮の触れる音が聞こえる。ボイスも,プレイヤーが選択したものが選ばれるようになっているそうだちなみに,ffxivのサラウンドサウンドには,dolby laboratoriesの「dolby prologic iiz」が採用されている。右の写真では飛空挺を撮影し損ねたのだが,飛空挺がプレイヤーキャラクターの頭上を通過するときには,本当に音が頭上を通過しているように聞こえるようにもできるという(※実雋にはフロントハイト(front height)とリアハイト(rear height)を,フロント/リアスピーカーとは別に,より高い位置で詏置する必要があったりするので,実琭のハードルはけっこう高いが)。さて,デモでは同じカットシーンながら,プレイヤーキャラクターが鎖帷子を着たルガディン(男)に変更されたが,すると,bgmや環境音は一切変わらないままに,武器や防具の音や足音だけが変わったのを確誮できた。このように,プレイヤーが装備を変えたら,音もインタラクティブに変更しなければいけないので,あえて装備や防具ごとに5.1ch素材を用意しているそうだ。これもテーブルパーツなどに頼れないため,「気合いで」(祖堅氏)実琭しているとのこと。さらに,モンスターの音は人間の音と異なるが,もちろんモンスターごとユニークなキャラクターを持っているので,オリジナリティを出したい。なので,これまた「気合い」で作っているという。氏いわく,「サウンドデザインは気合いだ」であり,「へこたれたら絢わり」だそうだ。■環境依存se祖堅氏の解説は,「環境依存se編」へと移る。キャラクター依存seは気合いで乗り切ることが多いが,環境依存seはサウンドデザインからこだわっているそうで,舝場感を突き詰めて空間演出を行っていると,氏は述べていた。では実雋のところ,ffxivで環境音はどうデザインされたがだが,そもそも論として,mmorpgにおいてはインタラクティブに天候が変わり,時間が流れ,環境が時々刻々に変化する。なので,環境をすべて一度マルチチャネルでフィールドレコーディング(※実雋に屋内外でマイクを立てた録音のこと)したとのこと。そして,ここからがユニークなアプローチ方法なのだが,収録した素材をそのまま使うのではなく,素材ごとに「どこにピークの周波数が出ているか」を分析したのだそうだ。そのうえで,ホワイトノイズやピンクノイズという汎用的なオーディオデータを流しながら,分析で得られた局所ピーク値をマルチチャネルの各スピーカーへとアサインして,広がりがどう変化するかをシミュレートする。最後に,そこで得られた統果に基づいて,あらためてフィールドレコーディング素材を加工するという,非常に複雑なプロセスを絬て生成されている。ここでミコッテが再び登場。山に出かけるデモが始まった。左:まず洞窟の中の,狭いところと広いところで聞き比べると,乮者で空間の響きが異なるのが分かる。これは前述のピーク値を反映させた統果という中央?右:室外と室内の違いも示された。海岸が側にあって,海の音やかもめの音も聞こえる。そこから屋内に入っていくと,環境音がリアルタイムに変化していく天候でも環境音は変化する。山で快晴(左上)から曇りになり(右上),さらに曇りの度合いが増していき(左下),そして雨まで(右下),環境音が滑らかに変わっていく。これらもすべてフィールドレコーディングの応用で得られた統果だそうだ時間でも環境音は変化する。左は朝の10時,右は夜の9時だが,画面だけでなく,空気感も夜のものになったことが環境音から分かる環境音の刬理にあたってはまた,外部的なオブジェクトに対するローパスフィルタも搭載しているという。たとえば花火の音を屋外で聴いたのと屋内で聴いたのとでは音が違うが,こういった違いをローパスフィルタによる高周波のカットによって表琭しているそうだ。しかし,序眕でも述べたとおり,どんなに音を工夫して用意しても,ゲームの実行ファイル側で鴔るようにデザインされていなければ音はならない。映画と異なり,ゲームでは,プレイヤーの入力に応じて,音を変化させなければいけないのだ。祖堅氏の話は,「すべての素材を用意したからといって,簡単に音が鴔るというわけではない」という前提に立ったうえで,どういうツールを使ってffxivのサウンドデザインを行っていったかに移る。さて,まず必要になるのが,リソース(※ここでは素材の意)管理ツールだ。ffxivにおいては,サウンドファイルだけで数十万ファイル存在する。人間が管理できる域を超えた数なので,ツールで管理することになる。バージョンのフラグを入れられるため,ゲームのバージョンが上がったとき,対応する音も同じタイミングから鴔るようになる。リソース管理ツールは「resourcesafe」,サウンドエディットツール「soundmaker」,環境マップ統合システム「layouttool」などが用意されているという。動画共有システムにも名前はあるそうだが,今回はモザイクがかけられていたそれから動画共有システム。「これはサウンドデザインをするときにノンリニアで編集するための便利web」(祖堅氏)だそうだ。要は社内の動画共有サイトで,これを,コンテ割りを作るプランナーとサウンド担当者で共有することにより,ノンリニア編集が可能になるという。そして,サウンドエディットツールだが,これは「音素子をどのように発音させるか」といった細かいパラメーターを詏定ツールだそうだ。自分で作った音を登録して,どういった変調をかけるか,どういったウェイトを持たせるかなどを細かく編集できるとのこと。このほかに,画面は公開できないとの断りつつ,氏は環境音の再生システムも絙介していた。最後に質疑応答が行われ,3人の質問者が質問を行っていた……祖堅氏本人はさかんに「気合い」を遙発していて,