Home » AIがメタバースを案内する時代が到来? VRChatで動くAI音声対話アバター「AOI」を体験してみた


話題 2022.08.31

AIがメタバースを案内する時代が到来? VRChatで動くAI音声対話アバター「AOI」を体験してみた

8月30日(火)、株式会社アドバンスト・メディアはAI音声対話アバター「AI Avatar AOI(エーアイ アバター アオイ)」を発表しました。現在は開発中の段階で、8月30日にはリリースに先駆け、メディア向けの体験会が開催されました。

本記事では、「AI Avatar AOI」の概要と、体験会の様子をお伝えします。

自ら会話し、移動するAIアバター


(画像は体験会中の発表資料より引用)

「AI Avatar AOI」は、人間の音声を認識し、会話・応対ができるAIアバターです。ソーシャルVR「VRChat」にて動作し、メタバース空間の来訪者応対を24時間365日無人で行うことができます。

アドバンスト・メディアの音声認識エンジン「AmiVoice」が搭載されており、人間の発話を高精度で認識し、自然な話し言葉を用いたコミュニケーションができます。また、空間内を自ら移動して来訪者を案内。移動ポイントごとに異なる応対もできるそうです。



(画像は体験会中の発表資料より引用)

想定されている利用シーンは、問い合わせ対応やショールーム・展示会の案内、販売・接客、受付・レセプション、製品紹介・デモンストレーション、研修・セミナーなど多岐に渡ります。アバターの姿も任意に設定でき、応対記録はログとして残るため、様々な利用者に対応できるとのことです。

実際にAIアバターに会ってみた

こちらが「AI Avatar AOI」。以下では「AOIさん」と呼ぶことにしましょう。

彼女(?)は「VRChat」ワールド内のギミックではなく、「VRChat」ユーザーアカウントとして存在しています。AOIさんの機能は「アバターのギミック」として搭載されるため、アバターに組み込めればどんなユーザーでも利用できるのだそうです(VRChatの技術としては「Avatar Dynamics Contacts」や「Avatar OSC」が関連しているとのこと)。

アバターも任意で切り替えが可能です。現時点ではどのアバターでも女性の声で話していますが、ゆくゆくはアバターごとに発話音声を変更できるようにしたいとのことです。

今回の体験会では、「メタバースで開催された立食パーティ」というシーンを想定し、AOIさんが来場者の案内を担当します。まずは開発担当の方が、AOIさんに「今日のスケジュールは?」と質問します。

すると、AOIさんが音声を認識。数秒待つと……。

「はい、お飲み物とお食べ物をご用意しましたので、まずそちらにご案内いたします。それらについて楽しんでいただいたあと、わたしについてのお話をさせていただければと思います」

AOIさんはお辞儀をしながら説明してくれました。単語のアクセントに少しだけ機械音声っぽさはありますが、言葉の流暢さは人間が話しているかのようになめらかです。

続いて、開発担当の方が「ご案内差し上げて」と話すと、AOIさんは「かしこまりました」と話しながら、ドリンクコーナーの前へと移動。

さらに移動後「ドリンクコーナーに到着しました。こちらにビールとワインをご用意いたしましたので、お好きな飲み物をお持ちください」と案内してくれました。

原理的には、AOIさんにチェックポイントが設定されており、各ポイントに応じた対話や説明ができるとのこと。音声案内だけでなく、設定した場所へ自ら動いて応対できるのが、AOIさんの最大の特徴です。

まるで中に人が入っているかのような、なめらかなモーションも大きな特徴です。AOIさんの各モーションは、モーションアクターチーム「カソウ舞踏団」のyoikamiさんが担当しており、その数は「10や20では収まらない」とのことです。

もちろん、これらのモーションもAOIさんが存在する限り24時間365日再生できるため、接客業のような、所作のマスターが必要な業種の研修にも適しています。

筆者もAOIさんとの対話を試みました。AOIさんは「可聴範囲」の中で、最も近い人の発言を聞き取ることができます。最もよく聞き取れる位置は、AOIさんの周囲に浮かぶリングの内側。かなり近めです。筆者は「AIアバターって何ですか?」と質問してみました。

AOIさんは「メタバース空間で人の代わりとなって音声、テキスト、映像を通じたコミュニケーションを行うことが出来る、AI技術により生まれたアバターです」と返答。音声認識の精度は、1対1の対話であればかなり高めな印象を受けました。

逆に、近くで複数人が同時に発言していると、聖徳太子のように聞き取ろうと試みてしまい、長考したり、音声認識に失敗することがありました。可聴範囲が広いと複数人の言葉を拾い上げやすくなるとのことです。

こちらはAOIさんの視点と管理ツールの画面です。専用管理ツールでは、AOIさんの発話内容と、AOIさんが認識した音声がチャットのように表示されており、全ての会話がログとして記録されます。

ログから応対者の声を集めることもできるほか、危ない発言をするユーザーが出てきたら即座にアラートを発することもできるのだそうです。管理者の観点で見ても扱いやすいシステム設計です。

ちなみに、AOIさんの前に表示されているテキストは「質問例」であり、これらの言葉以外でもちゃんと認識し、返答してくれる場合があります。

ある参加者がAOIさんに「なにか話して」と尋ねると、「あまりおもしろい話ではないかもしれませんが」と前置きした上で、「最近、趣味のフィールドワークをVRで再開しています。ちょっとした近所でも発見があるので、このVRChatの世界だと無限に広がっていて、とても楽しいですね」と、自身の趣味について話してくれました。何気ない雑談までこなせることに、筆者は驚きを隠せませんでした。

生きているようにAIアバターから見える可能性たち

自然な会話と自然な動き。この2つが共存することで、AOIさんはまるで生きた存在のように見えているように感じました。音声認識と発話、モーションが高度にまとまっていた印象です。特に身体と動きが存在するのは大きなポイント。「AIによる音声案内」から一歩進んだ「自ら考えて動く存在」として認識できるため、親しみを持てることでしょう。

アドバンスト・メディアから提示された想定利用シーンはビジネス用途(特に接客対応や講師業)が主です。一方、一人のエンドユーザーとしてAOIさんを見ると、広大なワールドの案内や、謎解きワールドのガイド、クラブイベントの受付案内など、ゲームにおける「NPC」のような役割を与えることもできそうだと感じました。

「VRChatのユーザーの一人」として動作する点を活かし、ワールドのオーナーとなることで「オーナーのみが通行できるエリアへ案内する」といった活用法も見出だせます。また、アバターに仕込むギミックであるため、VRChatユーザーが普段使うアバターに搭載し、離席中の応対をまかせるといったことも原理上できます。

さらに、AWSなどのクラウドマシン上で「VRChat」を起動させ、AOIさんをログインさせることで、文字通り24時間365日稼働もできるそうです。ここまでくれば完全なAIキャラクターでしょう。行き着く先は、「ソードアート・オンライン」に登場するAIの少女・ユイや、あるいは初音ミクかもしれません。

ちなみに、AOIさんにモーションを吹き込んだyoikamiさんは、「モーションアクターとしてAIに仕事を奪われると思いきや、むしろ『AIに所作を教える』という仕事が生まれそうですね」と語っており、AIをきっかけに新たな仕事が生まれるかもしれません。いろいろ考えるだけでも、AOIさんが活躍できる場は無数にありそうです。

「AI Avatar AOI」は現在開発中で、具体的なリリース時期や利用プランは未定です。開発担当の方は「VRChatユーザーに自由に使ってもらえるようにしたい」という構想を語っており、もしかすると読者のみなさんのもとにも、AOIさんがお手伝いにやってくるかもしれません。

(参考)プレスリリース


VR/AR/VTuber専門メディア「Mogura」が今注目するキーワード