ドワンゴのDwango Media Villageが、100種類の声に変換できるAIボイスチェンジャー「Seiren Voice」のデモを公開しました。
Seiren Voiceは、録音した日本語音声データを深層学習技術によってさまざまな音声に変換するシステムです。リアルタイム性を重視する既存の声変換システムと比べ、Seiren Voiceでは品質を重視。「誰の声でも」「さまざまな人の声に」することが可能で、パソコンやスマートフォンで音声を録音できるブラウザがあれば声を変換できます。
誰の声でもいろんな声に変えられる声変換システムを研究開発しました。
また、品質を重視しつつ「誰の声でも」「様々な人の声に」するための課題と解決策を記事にしました。https://t.co/GKYklAb35K
(動画は開発者の声を声変換したものです。)#SeirenVoice #AIボイチェン pic.twitter.com/TZc5WYuRS1— Dwango Media Village (@Dwango_DMV) September 14, 2020
だれでも100人の声になれる声変換「Seiren Voice」のデモを公開しました!
1. 録音する
2. 音声認識されたテキストを修正する(必要があれば)
3. 声を選ぶの3ステップだけで、誰でも100人のリアルな声になれます。ぜひお試しください!https://t.co/VKBpJKkXpp #SeirenVoice #AIボイチェン pic.twitter.com/VzUbcyjb9W
— Dwango Media Village (@Dwango_DMV) September 14, 2020
デモではWEBページで音声を録音し、必要に合わせて音声認識されたテキストを修正。100種類の声の中から8人を選んで変換することで、音声を出力できます。変換した音声動画はダウンロードも可能です。
このシステムを開発したDwango Media Villageは、ドワンゴの機械学習や画像処理・CGの研究とその応用を行なっているチームです。デモの公開に合わせ、Seiren Voiceの技術的な解説記事も公開しています。今回の声変換システムはまだ完璧ではないとのことで、エンターテイメントでどう応用が可能なのかを考えつつ、できることを増やしていきたいとの考えを明かしました。
Seiren Voiceのデモページはこちら。
技術的な解説記事はこちら。
© DWANGO co., Ltd. All rights reserved.
(参考)Dwango Media Village、Seiren Voice 解説記事