グーグルはモバイル開発者向けの機械学習ツール「MLキット」について、AutoML Vision Edge、AutoML Video Intelligence、Video Intelligence APIのアップデートを公式ブログにて発表しました。ブログではそれぞれの機能について実例を交えて紹介しています。
AutoML Vision Edge:画像認識からAR試着まで応用可能に
AutoML Vision Edgeでは機械学習により、画像からそのオブジェクトが何であるか、サイズはどれくらいかなどを認識することができます。同ツールは、オブジェクトの検出から認識までをスマートフォンなどの端末上だけで実行できるように最適化されています。
公式ブログでは活用事例として、宝石のeコマースや小売店向けのARソフト開発企業TRYONのサービスを紹介しています。動画ではカタログ画像から指輪を認識し、それをスマートフォン上でARモデルとして生成。さらにスマートフォンのカメラで手を撮影することで、指輪のARモデルを実際に“試着”している様子を確認できます。
(AutoML Vision Edgeを活用したTRYONのAR試着体験の様子)
AutoML Video:物体の動きを追跡可能に
AutoML Videoでは、オブジェクト検出機能が導入され、映像内の複数の物体の動きを追跡できるようになりました。同機能は、交通管理・スポーツでの動きの分析、ロボットのナビゲーションなど、幅広い用途で活用できます。
Video Intelligence API:有名企業のロゴを認識可能に
Video Intelligence APIでは、デバイス内に保存済みの動画やストリーミング動画の中から、オブジェクトや光景、および動きを自動的に認識する機械学習モデルを提供します。また同APIは、有名企業や組織のロゴを検出・追跡・認識でき、その数は10万以上におよぶとのことです。
ブログで紹介された機能はいずれもすでに利用可能。くわしくはGoogle CloudのVision AI、およびVideo AIのページで確認することができます。