Metaは、テキストから3Dモデルを生成する研究「Meta 3D Gen」を発表しました。本技術では入力から約1分で高品質な3Dモデルとテクスチャを生成します。これらのモデルはPBR(Physics-Based Rendering, 物理ベースレンダリング)に対応しており、複数のリアルタイムアプリケーション(VR/MRゲームや3Dシミュレーションなど)に転用できます。
約50秒で「高品質な3Dモデルとテクスチャ」生成
「Meta 3D Gen」は、Metaが開発した「Meta 3D AssetGen」と「Meta 3D TextureGen」の2つのコンポーネントで構成されています。
ユーザーによってテキストプロンプトが与えられると、まず「Meta 3D AssetGen」が3Dモデル(メッシュ、テクスチャ、PBRマテリアル)を約30秒で生成します。次に「Meta 3D TextureGen」が、3Dモデルのさらに高品質なテクスチャとPBRマテリアルを約20秒で生成します。
(生成された3Dモデルとテクスチャの一例。MetaのLLM名称にちなんで「ラマ」を、ファンシーなものから金属質なもの、ややリアル寄りなもの、と幅広く生成している。3Dモデル形状も、リアル寄りからボクセル系などを幅広く作れるようだ。 画像: Meta)
さらにMetaは、「Meta 3D Gen」と他企業のベースライン(機械学習モデル)の比較検証も実施。「Meta 3D Gen」は、他モデルと比較してプロンプトに忠実かつ高品質なモデルを生成し、作成に必要な時間も短いという結果が得られた旨を主張しています。他方で使用されたハードウェアのスペックなどは公開されていません。
現状はまだ論文レベルではあるものの、仮にこうした3Dモデル生成技術が一般化した場合、ゲームや3Dシミュレータ、XRコンテンツ、メタバースなどの開発をより手軽に行えるようになるでしょう。また、3Dを含むUGC制作を簡易化し、より多くのユーザーがコンテンツ制作に参入できる可能性があります。