Home » 「日本も世界で戦える」「生成AIはゲーム産業の古くて新しい潮流」「GDC2023報告会」レポート(後編)


開発 2023.06.21

「日本も世界で戦える」「生成AIはゲーム産業の古くて新しい潮流」「GDC2023報告会」レポート(後編)

日本時間の2023年3月21日から25日にかけて、サンフランシスコで行われた世界最大級のゲーム開発者向けカンファレンス「GDC 2023(Game Developer’s Conference 2023)」。
現地で得られた知見や業界トレンドなどを紹介するオンラインイベント「GDC2023報告会」が、2023年4月4日に開催されました。ライター/編集者の高島おしゃむ氏によるイベントレポートをお届けします(前編はこちら)。

「GDC」は、1998年から続いているゲーム開発社向けのカンファレンスイベントで、ここ数年は2月~3月にかけてサンフランシスコのモスコーンセンターで行われています。毎回膨大な数の講演と展示がされており、場外のネットワーキングも活発に行われているのが特徴です。

前編では「GDC」現地会場の様子から見た業界動向についてレポートを紹介しました。後編は「技術動向編」として、フィグニー株式会社 CEOの里見恵介氏と、株式会社スクウェア・エニックス AI部 ジェネラル・マネージャーの三宅陽一郎氏によるセッションの模様をお届けします。

(写真左から、里見恵介氏、三宅陽一郎氏。撮影:Mogura)

里見恵介氏「フィグニーから見たGDC2023」

まずは、企業ブースの出展も行っていた里見恵介氏が、今年の「GDC」で見かけた各ブースの様子をレポートしました。

PicoがMetaを意識して大きめのブースを出展

里見恵介氏(以下、里見):今回の「GDC」で、Picoの展示は明らかにMetaを意識していました。ブースのサイズもMeta(60×60)と比べてPico(60×80)は大きめにとっており、市場シェアを奪いに来ていると感じましたね。Picoにはまだキラーコンテンツ(Meta Questにおける「バイオハザード4」)がありませんが、デバイス性能はPicoのほうが上ですし。

(提供:里見恵介。以下同じ)

Nreal(現:XREAL)のブースでは、「NrealLight」と「Nreal Air」(現:XREAL Air)のふたつのデバイスが出展されていました。6DoFの「NrealLight」は扱いが小さくて、視聴系デバイスの「Nreal Air」に振り切った印象でした。

Tilt Five」は、ゲームボードとコントローラーの3セットで売られているARデバイスです。「NrealLight」よりも若干ながら解像度や操作感が良く、「これならARでゲームを作ってもいい」と感じました。

私たちフィグニーの対面にはPNI COMPANYが出展していました。韓国でアミューズメント施設向けにVRコンテンツを提供している会社です。座りながら移動できるイス形のデバイスを展示していました。実体験したところ、かなりVR酔いしてしまいましたが。まだ改良の余地があるようです。

また、私たちのブースにHTCの社員さんが遊びに来てくれて、「VIVE XR Elite」と未発売の新型トラッカーを体験させてもらえました。これにはかなり感動しました。HTCのトラッカーは、最初期は消波ブロックのような無骨なデザインでしたが、新型トラッカーはその1/2ぐらいのサイズと重さでした。カメラも内蔵され、トラッカー本体がインサイドアウト方式でトラッキングできるようです。

他に気になったのは、裸眼3Dモニターの「Acer SpatialLabsView Proです。搭載されたふたつのカメラで装着者のアイトラッキングを行い、リアルタイムで2D/3D表示を切り替えることで、裸眼で3Dっぽく奥行きが見えるというものです。

低労力の開発支援ツール、低遅延のクラウドサービスも充実

里見:開発支援ツール回りでは、5月12日に発表されたUnreal Engine5.2の新機能「プロシージャル コンテンツ生成」と「Substrate」についてのデモがありました。「プロシージャル コンテンツ生成」を使えば、パラメータ定義と設定をするだけで、本物の森林のように複雑な地形が手間なく作れます。

また、「Substrate」を使えば、シェーダ―に設定するシェード情報をレイヤーで重ねられるようになります。プログラマーが陰影計算のためのプログラムを書かなくても、3Dアーティストが複雑な質感を表現できるようになります。

UI開発専用ツール「NoesisGUI」の新バージョン(v3.2)も発表されました。ユーザーインターフェースは複数のテクスチャーを貼り合わせて実装されます。「NoesisGUI」はリアルタイムレンダリングができ、テクスチャーのサイズ調整も不要で、超速で開発を進められます。Unityで使用できるほか、Unreal Engineとも共存できます。

Godot」はオープンソースのゲームエンジンです。このエンジンで開発されたゲームが、会場には10作品ほど展示されていました。どちらかというとUnityに近い操作感で、今後の市場シェアは未知数ですが、楽しみなツールです。

Cognitive 3D」は、VR空間内でユーザーの視線が集まった場所のヒートマップを作るツールです。コンテンツや機能の改善に活用できます。1000回分までは無料ですが、それ以上は有償となるため注意です。

ラップトップ1台で機械学習のためのエミュレーションができる、Python用の分散並列処理ツール「Ray」も出展していました。

個人的にもっとも盛り上がったのは「Tencent Cloud」でした。AWSやGCP、Microsoft Azureの競合にあたるクラウドサービスです。「Cloud Application Rendering」機能を使うと、XRコンテンツを低遅延でリアルタイムにクラウドレンダリングできます。3Dゲームが不得意なスマートフォンでも、ガンガン動いていました。類似のクラウドゲーミングサービス「Google Stadia」は2023年1月にサービス終了しましたが、「Tencent Cloud」は成功しているようです。

低遅延、自由動作、表情測定など、様々なモーションキャプチャー技術も

里見:メタバースと関係が深い「モーションキャプチャー&トラッキング」カテゴリでは、モーションキャプチャーシステム「OptiTrack」が、0.5秒ぐらいの遅延で動いていました。より高性能の競合ツール「Qualisys」は、その分価格も1,000万円程とお高くなります。

IMU(慣性測定装置)方式の「XSens」は、外部カメラや外部環境を内部のジャイロセンサーと加速度センサーで装着者の動きを計算する仕組みです。カメラ要らずで自由に走り回れます。

グローブ型デバイス「Manus Glove」は、キーボードを叩くぐらいの動作までトラッキングでき、様々なスーツとも連携できます。価格は100万円近いものがありました。

フェイシャルモーションキャプチャー「FaceWare」は、カメラ1台で撮影されたマーカーレスの映像でも、リアルなフェイシャルアニメが制作できます。映画『KINGSGLAIVE FINAL FANTASY XV』でも使われたそうです。

技術力では日本も負けていない!?

里見:「GDC」には、日本では知られていない掘り出しものが多数出展されており、採用目的の出展も「あり」だと思いました。

最新技術は2~3年遅れで日本に入ってきますが、スタートアップ系のプロダクトとなら技術力では日本企業も戦えます。必要なのは英語だけです。私たちフィグニーも、会場で和風ホラー系のコンテンツを出展したところ、海外の人たちにウケて、会場インタビューもされています。

三宅陽一郎氏「AIはゲーム産業の古くて新しい潮流」

最後に登壇したのが、株式会社スクウェア・エニックス AI部 ジェネラル・マネージャーの三宅陽一郎氏です。ゲーム産業におけるAI活用について、ゲームプレイやクリエイティブ生成、デバッグなどの分野で強化学習を活用する事例を紹介しました。

既存の技術を紹介する「AI Summit」も開催

三宅陽一郎氏(以下、三宅):「GDC」では、「AI Game Programmers Guild」の主催セッション「AI Summit」が2日間開催されました。必ずしも最先端の技術を紹介するわけではなく、既存技術のおさらいと事例紹介も行われていました。例えば、Roboloxがユーザー制作コンテンツに「Generative AI(生成AI)」を活用すると発表しています。

私の所属するスクエニのAI部は、機械学習に重点的に取り組んでいて、強化学習や自動テストをゲーム開発に応用しています。今回の「GDC」でもその発表を行ったほか、「GGOAP(Goal Oriented Action Planning)」に関する研究セッションも行いました。

(「GDC」では機械学習が多数扱われていた。提供:三宅陽一郎。以下同じ。)

ゲームで機械学習というと、ほとんどの場合は強化学習のことを指します。2003年頃から登場した手法で、「AlphaGo」の登場で世界的にも注目されました。史上初めて人間のプロ棋士に勝利した囲碁AIですね。

「AlphaGo」登場以前にも、ゲーム産業の外では、ゲームプレイに強化学習を用いた応用研究が数多く行われてきました。たとえば、「Atari2600」のゲームを強化学習(Deep Q-Network: DQN )を使ってハイスコアを目指す挑戦が行われています。こうした研究が、最近になってどんどんゲーム産業に入ってきている状況です。

強化学習は、アルゴリズムが試行錯誤を繰り返しながら、ゲームプレイの能力を磨いていく技術です。Xboxの格闘ゲーム「Tao Feng」の事例が有名です。アルゴリズムを実装されたキャラクターがランダムで技を出し、「特定距離で技を出すと良い結果が出る」といったことを学んでいきます。

今年の「GDC」でも、多くの展示が機械学習を扱っていました。Tencentは、レンダリング工程における陰影計算(シェーダ―設定)をDeep Q-Networkに置き換える技術を発表しています。理想のシェーダ―が出力されるようにパラメータを調整しています。

強化学習理論は、アルゴリズムに与える環境変化をマルコフ決定過程(Markov decision process: MDP)でモデル化することが一般的です。環境変化は直前の状態と行動によって決まるという考え方で、レーシングゲームや格闘ゲームは強化学習に向いていますし、所定のルールでゲーム内コンテンツを自動生成するPCG(Procedural Content Generation)も流行っています。

さらに近年では、「ダンジョンの自動作成」に留まらず、「ダンジョンを生成するゲームデザイナーを自動生成する」という手法も提案されていて、PCGR(Procedural Content Generation via Reinforcement Learning)と呼ばれます。

Star Wars バトルフロントII」は、ゲーム開発に強化学習が使われた事例です。エレクトロニック・アーツ(EA社)傘下のEA Digital Illusions CE(EA DICE)が開発した「Frostbite」が採用され、テストプレイにAIが活用されました。デバッガ―を何百人も雇わなくても、24時間ぶっ通しでテストが行えるということで、最近のゲーム産業のトレンドにもなっています。

ゲーム内に登場するNPCを制御するためのゲームAI

三宅:「空間AI」といって、3次元空間における地形の状態やキャラクターの移動、音声伝播などを解析する分野があります。CD Projekt REDの「サイバーパンク2077」は、立体空間における音声伝播を有向グラフのパス検索で表現しています。特に新しいわけではなく、ステルス系の大型タイトルならよく使われている技術です。

Naughty Dogが講演で言及した「Post System」も空間AIの一種です「The Last of Us」の「Part 」「PartII」双方に採用されています。キャラクターAIの空間認識は、サバイバルゲームの最重要課題。地形解釈のために用意しておくデータが、開発陣の腕の見せ所です。

「The Last of US」は、NPCの行動に応じて戦術ポイントがもらえる地点をエリアごとに設置して、NPCにその地点を探させたり、隠れさせたりと、地形を利用したアクションを上手く行うようにしています。

ゴッド・オブ・ウォー」は、環境側に(目に見えない)障害物などの情報を埋め込んでおき、特定地点にキャラクターが近づいたら「ジャンプする」といったアクションが発生するようにしています。スマートオブジェクトと呼ばれる技術です。

マリオ+ラビッツ」は、ゲームマップ内のオブジェクトを自動で組み合わせて表示しています。AIにゲームをプレイさせて、良いマップに関する様々な評価指標を持ち、マップ形状を自動評価して生成するところがユニークです。アカデミックの世界では2010年頃からある技術ですが、ゲーム産業にも応用されるようになってきたのです。

イベント参加者からのQ&Aコーナー

ひと通り登壇者のセッションが終わった後で、参加者からのQ&Aコーナーが実施されました。こちらではその一部を抜粋してご紹介します。

――「GDC」でコンテンツ開発における著作権に関する講演はありましたか?

三宅:学習データに著作処理されていないものが含まれるなど、データの安全性についての言及はありました。

――今回の「GDC」で一番印象に残ったものを教えてください。

三宅:やっぱり「Fortnite」です。普通のゲームですが、さすがに3億人もユーザーがいて、ゲームエンジンも持っているので、「Fortniteはメタバースになります」と言えてしまう。すごいなと思いましたね。地味な話ですが、「Anvil」(Ubisoft)や「Frostbite」(EA DICE)が、10年がかりで自社独自のゲームエンジンに育ったところもすごいと思いました。そのうえに機械学習が乗ってきてて、技術的には勝った感がありますよね。大手企業がゲームエンジンのマネジメントをしていることのパワーを感じました。

――日本製のデバイスや展示はありましたか?

里見:日本製のデバイスは、僕が見た限りだと見当たりませんでした。海外企業は仕組みづくりに長けているんだなと思いました。

――「Generative AI」の講演はなかったかもしれませんが、来場者の集まりで話題は出ていましたか?

三宅:「Generative AI」関連がなかったわけではなく、セッションの中でも言及はされていました。GPT(Generative Pre-trained Transformer)を使った会話ゲームがインディーズで出てきています。メタバースの文脈でも、Generative AIは非常に強力なUGC補助ツールですね。ユーザーにツールを渡してコンテンツを作らせるような会社は、より短期間で上手くコンテンツ制作ができると、講演中にも発言していました。

ただ、PCGMLとGenerative AIの違いは機械学習に用いるデータの大きさで、ゲーム業界ではPCGMLを昔からずっとやっています。

――モーションキャプチャーの紹介がありましたが、画像ベースのものはありましたか?

里見:画像ベースのものは、僕が見た限りではありませんでした。名前は忘れましたが、音声はありました。話すのに合わせてキャラクターが口を動かしてくれるようなものです。

――「Generative AI」について詳しく知りたい場合は、何を追いかければ良いのでしょうか?

三宅:ゲームデザインをディープラーニングで補助しましょうといった提案は結構あります。昔は、ゲームデザイナーがレベルを変えると、自分でプレイして試していました。プログラムが大きく変わると上手く動かなかったものです。今はちょっとレベルを変えるだけでも、変更内容に合わせてGenerative AIがやってくれます。

最近、ゲーム産業では研究所の設立が流行っていて、そこで集中的にGenerative AIを開発しています。EAの研究所は、3Dブロックを重ねてマップやレーシングコースを作るときに、NPCが段差を超えられるか、ユーザーが遊べるのかを、AIがテストする研究をしています。

報酬条件を決めておけば、AIがひたすらレーンを生成して、候補を出してきます。人間がそこから選ぶと、そのバリエーションをたくさん作って自動的にテストが行われます。昔はデザイナーが自分で組んでプレイしていましたが、AIなら、食事に出かけている間に1万回プレイしてくれます。

3Dマップを作るのはすごく大変です。キャラクターがどこからどこへ移動できるのかチェックするのも大変です。UBISoftの事例では強化学習だけでなく、深度マップデータなど、いろいろな情報を(ゲーム空間内の)センサー系として入れています。

LSTMによる時系列データ処理を挟んで、その後で普通のニューラルネットワークを挟み、アクションを実行させます。そうすることで、3Dダンジョンを自動で動くエージェントを作り、なおかつテストも自動で行ってくれます。そうした研究は業界内でよく行われています。

最近のPCGMLの流行りは、オートテスティングと人間のゲームデザインを組み合わせて、いかに高速に膨大なマップを作り出すか、みたいなところにあります。気軽にQA(Quality Assurance: 品質検査)に出せないと、開発者が臆病になって攻めたデザインはできないのですが、AIが1万回チェックしてくれたら、人間が10回プレイするよりも信頼性があります。AIと一緒にひたすらジェネレーションしている感じですね。

――本日はありがとうございました!

以上で今回のイベントレポートは終了。記事だけでは書ききれないぐらい、膨大なボリュームの報告会でしたが、現地ではさらに多くの発表や展示が行われていました。来年はいったいどんな新しいテクノロジーが発表されるのか、今から期待が膨らみますね!

最後に、編集長の注目スタートアップInoworld.ai

なお、この報告会では触れられなかったが、Mogura VR編集長の久保田がGDCの会場で発見した注目のスタートアップとしてInworld.aiがある。元Googleのエンジニアらが立ち上げた生成AIスタートアップで、ゲームやメタバースのように低遅延で自然な会話が求められるシーンにおけるNPC生成サービスだ。

Chat-GPTのように回答に時間をかけることなく、こちらの声に対して即座に返答を返してくるアルゴリズムをウリにしている。2023年に入ってからの生成AIブームの前から資金調達を順調に行っていたこともあり、その高い応答速度に自信を見せていたのは印象的だった。

(執筆:高島おしゃむ、編集:笠井康平)


VR/AR/VTuber専門メディア「Mogura」が今注目するキーワード