Home » 認識する物体が1億点突破 Google Lensの識別能力が向上続く


テック 2018.12.24

認識する物体が1億点突破 Google Lensの識別能力が向上続く

Googleが開発したスマートフォン用のAR機能「Google Lens」が、合計1億種類のオブジェクトを識別可能になりました。2017年にリリースされた「Google Lens」は配信当初、2,500万種類のオブジェクトが識別可能でした。1年弱で4倍の識別能力の向上を実現しました。

精力的なアップデートが継続中

「Google Lens」は、カメラの中に映ったものを認識し、関連した情報を表示してくれる機能です。オブジェクトの認識と識別にはAIが使用されています。2017年の実装直後は一部のAndroid端末でのみ利用可能でしたが、2018年3月にアップデートされiPhone(iOS)でも使用可能になりました。

実装直後は「Google Lens」の起動には、Googleフォトが必要でしたが、2018年5月のアップデートで一部Android端末に限り、カメラモードからリアルタイムの利用が可能になりました。12月には再度アップデートが行われ、iPhoneではGoogleの公式アプリを使用し「Google Lens」を使用できるようになりました。

Google Lensの時代

1億種類のオブジェクト識別の達成、という今回の発表を受けて、Googleの「Google Lens」開発部門とAR部門を統括するAparna Chennapragada氏が、Google公式ブログにコラムを掲載しました。2008年にGoogleに入社したChennapragada氏は「Google Lens」開発の中心人物です。

Chennapragada氏はブログで「私は、この10年間、AIを活用した人々の日常生活を手助けする製品の開発に携わってきました」「検索(エンジン)に(AI)アシスタント、そして「Google Lens」です」と自身の経歴を説明、加えて「「Google Lens」は、情報検索の新たな窓口を切り開きました」とコメントし「Google Lens」の成し遂げた功績を強調しました。

コラムでは、その他に「Google Lens」の詳細な動作原理なども解説されています。Chennapragada氏は「Google Lens」のオブジェクト識別機能の“キモ”は、機械学習とコンピュータビジョン、そしてGoogleが開発した機械学習用のフレームワーク「 TensorFlow」であると説明します。

文字の読み取り機能についても説明が行われています。Chennapragada氏によると、文字の読み取りには、optical character recognition (OCR) というエンジンが使用されます。OCRは、Googleのナレッジグラフ(※)などと組み合わされ「Google Lens」に文字を“読む”能力を付与します。

(※ナレッジグラフ:Googleが検索結果を最適化し、拡張するための知識ベース)

(参考)VentureBeat


VR/AR/VTuber専門メディア「Mogura」が今注目するキーワード