Home » 画像1枚からビデオ会議向け3Dモデルを生成する技術をNVIDIAが発表 人の動きもトラッキング


話題 2021.07.02

画像1枚からビデオ会議向け3Dモデルを生成する技術をNVIDIAが発表 人の動きもトラッキング

半導体大手のNVIDIAは、AIを活用したビデオ会議向けシステム「Vid2Vid Cameo」を発表しました。

「Vid2Vid Cameo」は、ビデオ会議向けシステムの開発キット「Maxine SDK」のディープラーニングモデルです。敵対的生成ネットワーク(GAN)を使用して、人物が写った1枚の写真から、3Dモデルを作り出します。

「Vid2Vid Cameo」では、選択した写真から2タイプ(「写真を再現」と「カートゥーン」)の3Dモデルを生成できます。ビデオ会議中、AIはWebカメラから、ユーザーのリアルタイムの動きを認識し、動作をモデルに反映します。

発表によれば、ビデオ会議中に使用する帯域幅を10分の1に減らすこともできるとのこと。公開された映像からは、2つのタイプのモデルが動く様子が分かります。

NVIDIAは、2021年6月30日現在、「Vid2Vid Cameo」は“近日中(coming soon)”に、「Maxine SDK」に実装されると予告しています。現時点では開発キット段階ですが、将来的には、こういった技術を手軽に利用できる時代がやってくるかもしれません。

(参考)NVIDIA


VR/AR/VTuber専門メディア「Mogura」が今注目するキーワード