公開日 2017/08/30 09:30
2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた
<山本敦のAV進化論 第143回>
文字原稿を音声合成エンジンで自然な発話に変換して、CGで作成されたバーチャルアナウンサー「沢村碧(さわむら みどり)」が読みあげてくれる「アバターエージェントサービス」をソニーが共同通信デジタルと一緒に発表、BtoB向けに提供を始めた。
今回は特別に編集部が作成したニュース原稿を沢村碧アナに読んでもらった。まずはぜひその動画をご覧いただいて、サービスの雰囲気を体験してみてほしい。
本稿では、同サービスの開発を担当するソニーの倉田宜典氏、城井 学氏にその詳細を訊ねてきた。
■アバターエージェントサービスは誰がつくってる?
倉田氏は元もとソニーのエンターテインメントロボット「AIBO(アイボ)」や二足歩行ロボット「QRIO(キュリオ)」の開発チームに所属して、当時はクラウドを使わずに製品ローカルで処理をしていた音声合成・対話システムのシナリオ制作などに関わってきた。
「それぞれの製品が開発を終了した後も、ソニーでは将来の家電機器に必須の要素技術となるであろう音声コントロールを“ナチュラルユーザーインターフェース”と呼んで研究・開発を進めてきました」(倉田氏)
倉田氏は現在ソニーとソニーモバイルコミュニケーションズの両社に籍を置いて、アバターエージェントサービスのプロデューサーとして事業化のリーダーシップを取っている。ソニー本社ではアバターエージェントサービスとしてビジネス化する方向で技術を育てながら、片方のソニーモバイルからは「Xperia Ear」や「Xperia Touch」など、同じ要素技術をベースにした音声UIを搭載する商品を発売している。
城井氏はアバターエージェントサービスのプロジェクトリーダーであり、ソニーモバイルがMWCなどのイベントにプロトタイプを出展してきた「Xperia Agent」関連ニュース)の商品企画担当者でもある。
ソニー全体として長年取り組んできた音声ユーザーインターフェースに関する技術とサービスが、今回バーチャルアナウンサーとして新しい展開を迎えることになった。“沢村碧”に関してはシステム全体の機能仕様を決めるところから、製作したアバターの細かな表情や動きの設定、声優の選定に至るまで倉田氏・城井氏の仕事は多岐にわたる。
なお、声優の寿美菜子さんは沢村碧だけでなく、Xperia Earの音声UIも担当している。
ソニーが近年に発売したコンシューマーエレクトロニクス商品としては「SmartBand Talk」(関連ニュース)や、以前に本連載でも取り上げた“踊る”Bluetoothスピーカー「BSP60」(関連ニュース)にもアバターエージェントサービスと同じ音声UIの要素技術が使われている。さらにその技術をベースにインタラクティブ性を強化したシステムも、ソニー・ミュージックコミュニケーションズがAndroidデバイス向けにGoogle Playストアで配信するアプリ「めざましマネージャー」に乗っている。
「SmartBand Talkでは東芝デジタルソリューションズの合成音声作成ツール『ToSpeak』シリーズから、標準セットとして提供されている声をそのまま使っていました。Xperia Earから同じプラットフォームをベースに当社が特注したカスタムボイスを使っています。さらに、いま3つのバージョンを配信しているめざましマネージャーアプリも、それぞれのキャラクターの声優を起用したカスタムボイス仕様です」(倉田氏)
■“沢村碧”には、ソニーのどんな技術が使われている?
ソニーの新たなサービス形態であるバーチャルアナウンサー・沢村碧はどのような技術によって構成されているのだろうか。倉田氏に訊いた。
「アバターエージェントサービスについては様々な構成要素を束ねながら、キャラクターを動かしたり、細部をカスタマイズして商品として作り込んで独自のユーザー体験を提供するところにソニー独自のノウハウが活きています。いわゆる音声認識や音声合成の技術については全体のサービスを成り立たせるための“パーツ”として捉えているので、それらはケースバイケースでベストな技術を調達して組み合わせればよいと考えています」(倉田氏)
アバターエージェントサービスの制作環境はPC用アプリケーションとして落とし込まれている。制作者はニュース原稿をテキストで入力して、キャラクターの動作やカメラワークなど、用意されているプリセットの中から選んで設定するだけ。CG制作や映像機器、PCの詳しい知識がなくてもキャラクターが声でニュースを読みあげる動画ファイルを簡単に作ることができる。ソニーにとってのパートナーである共同通信デジタルはニュース作成に関わるノウハウの提供、およびアプリケーションツールの販売を担当する。
■沢村碧アナがニュースを読み上げるまでの流れ
ここからは、アプリケーションの詳細に踏み込んでいきたい。
今回は特別に編集部が作成したニュース原稿を沢村碧アナに読んでもらった。まずはぜひその動画をご覧いただいて、サービスの雰囲気を体験してみてほしい。
本稿では、同サービスの開発を担当するソニーの倉田宜典氏、城井 学氏にその詳細を訊ねてきた。
■アバターエージェントサービスは誰がつくってる?
倉田氏は元もとソニーのエンターテインメントロボット「AIBO(アイボ)」や二足歩行ロボット「QRIO(キュリオ)」の開発チームに所属して、当時はクラウドを使わずに製品ローカルで処理をしていた音声合成・対話システムのシナリオ制作などに関わってきた。
「それぞれの製品が開発を終了した後も、ソニーでは将来の家電機器に必須の要素技術となるであろう音声コントロールを“ナチュラルユーザーインターフェース”と呼んで研究・開発を進めてきました」(倉田氏)
倉田氏は現在ソニーとソニーモバイルコミュニケーションズの両社に籍を置いて、アバターエージェントサービスのプロデューサーとして事業化のリーダーシップを取っている。ソニー本社ではアバターエージェントサービスとしてビジネス化する方向で技術を育てながら、片方のソニーモバイルからは「Xperia Ear」や「Xperia Touch」など、同じ要素技術をベースにした音声UIを搭載する商品を発売している。
城井氏はアバターエージェントサービスのプロジェクトリーダーであり、ソニーモバイルがMWCなどのイベントにプロトタイプを出展してきた「Xperia Agent」関連ニュース)の商品企画担当者でもある。
ソニー全体として長年取り組んできた音声ユーザーインターフェースに関する技術とサービスが、今回バーチャルアナウンサーとして新しい展開を迎えることになった。“沢村碧”に関してはシステム全体の機能仕様を決めるところから、製作したアバターの細かな表情や動きの設定、声優の選定に至るまで倉田氏・城井氏の仕事は多岐にわたる。
なお、声優の寿美菜子さんは沢村碧だけでなく、Xperia Earの音声UIも担当している。
ソニーが近年に発売したコンシューマーエレクトロニクス商品としては「SmartBand Talk」(関連ニュース)や、以前に本連載でも取り上げた“踊る”Bluetoothスピーカー「BSP60」(関連ニュース)にもアバターエージェントサービスと同じ音声UIの要素技術が使われている。さらにその技術をベースにインタラクティブ性を強化したシステムも、ソニー・ミュージックコミュニケーションズがAndroidデバイス向けにGoogle Playストアで配信するアプリ「めざましマネージャー」に乗っている。
「SmartBand Talkでは東芝デジタルソリューションズの合成音声作成ツール『ToSpeak』シリーズから、標準セットとして提供されている声をそのまま使っていました。Xperia Earから同じプラットフォームをベースに当社が特注したカスタムボイスを使っています。さらに、いま3つのバージョンを配信しているめざましマネージャーアプリも、それぞれのキャラクターの声優を起用したカスタムボイス仕様です」(倉田氏)
■“沢村碧”には、ソニーのどんな技術が使われている?
ソニーの新たなサービス形態であるバーチャルアナウンサー・沢村碧はどのような技術によって構成されているのだろうか。倉田氏に訊いた。
「アバターエージェントサービスについては様々な構成要素を束ねながら、キャラクターを動かしたり、細部をカスタマイズして商品として作り込んで独自のユーザー体験を提供するところにソニー独自のノウハウが活きています。いわゆる音声認識や音声合成の技術については全体のサービスを成り立たせるための“パーツ”として捉えているので、それらはケースバイケースでベストな技術を調達して組み合わせればよいと考えています」(倉田氏)
アバターエージェントサービスの制作環境はPC用アプリケーションとして落とし込まれている。制作者はニュース原稿をテキストで入力して、キャラクターの動作やカメラワークなど、用意されているプリセットの中から選んで設定するだけ。CG制作や映像機器、PCの詳しい知識がなくてもキャラクターが声でニュースを読みあげる動画ファイルを簡単に作ることができる。ソニーにとってのパートナーである共同通信デジタルはニュース作成に関わるノウハウの提供、およびアプリケーションツールの販売を担当する。
■沢村碧アナがニュースを読み上げるまでの流れ
ここからは、アプリケーションの詳細に踏み込んでいきたい。
-
DALIのブックシェルフスピーカー「SONIK 1」「SONIK 3」で組むお薦めミニコンポを徹底検証 -
暮らしを最高のサウンドで彩る「Sonos Play」をレビュー! 2台ステレオ再生の音質もチェックした -
いいのか?円安だぞ? THORENSのレコードプレーヤー「TD403DD」が22万円でもコスパが高い理由 -
ながら聴きでも騒音は抑える!Shokz「OpenFit Pro」は一段と音にのめり込めるオープンイヤー型イヤホン -
映像体験の質はスクリーンで決まる。OS SCREENが守り続ける哲学とは? -
VODの楽しみ方が劇的に変わる! LGスマートモニター「27U731SA-W」で新たなライフスタイルを -
ソニーの “高コスパ”5.1chホームシアターシステム「BRAVIA Theatre System 6」レビュー! -
冒険心をかき立てる。三菱自動車・アウトランダーPHEVの挑戦から探る、「音」でクルマを選ぶ新提案 -
着け心地軽やか、LDACも使えるインナーイヤー型TWSならコレ!SOUNDPEATS「Air6 HS」をレビュー -
音色も大きさも違う3モデル、どれを選ぶ?SHANLING「M3 Plus」「M7T」「M8T」を一斉比較 -
動画だって高画質!LGの4K有機ELゲーミングモニター「32GX850A-B」を実力チェック -
新世代JBLサウンドを先導!ワイヤレスNCヘッドホン「Live 780NC」は本命ミドルクラス -
テレビ選びの新基準とは? 画質だけでは語れない「没入感」と空間デザインの関係 -
住宅の「あったら便利」まで叶えるGLANCE、ネットワーク&セキュリティ強化で暮らしに寄り添う -
“ラグジュアリー”をまとったエプソンのコンパクトプロジェクター「EF-73」の実力を徹底レビュー -
マランツのAVプリアンプ「AV 30」でグレードを卓越したイマーシブサウンドの底力を体感! -
オーディオを高く売るなら信頼と実績のオーディオランド!下取よりも買取がお得です◎
クローズアップCLOSEUP
-
DALIのブックシェルフスピーカー「SONIK 1」「SONIK 3」で組むお薦めミニコンポを徹底検証 -
暮らしを最高のサウンドで彩る「Sonos Play」をレビュー! 2台ステレオ再生の音質もチェックした -
いいのか?円安だぞ? THORENSのレコードプレーヤー「TD403DD」が22万円でもコスパが高い理由 -
ながら聴きでも騒音は抑える!Shokz「OpenFit Pro」は一段と音にのめり込めるオープンイヤー型イヤホン -
映像体験の質はスクリーンで決まる。OS SCREENが守り続ける哲学とは? -
VODの楽しみ方が劇的に変わる! LGスマートモニター「27U731SA-W」で新たなライフスタイルを -
ソニーの “高コスパ”5.1chホームシアターシステム「BRAVIA Theatre System 6」レビュー! -
冒険心をかき立てる。三菱自動車・アウトランダーPHEVの挑戦から探る、「音」でクルマを選ぶ新提案 -
着け心地軽やか、LDACも使えるインナーイヤー型TWSならコレ!SOUNDPEATS「Air6 HS」をレビュー -
音色も大きさも違う3モデル、どれを選ぶ?SHANLING「M3 Plus」「M7T」「M8T」を一斉比較 -
動画だって高画質!LGの4K有機ELゲーミングモニター「32GX850A-B」を実力チェック -
新世代JBLサウンドを先導!ワイヤレスNCヘッドホン「Live 780NC」は本命ミドルクラス -
【追加割引クーポンあり】UGREEN「NASync」が前回セール超えの安値! -
テレビ選びの新基準とは? 画質だけでは語れない「没入感」と空間デザインの関係 -
住宅の「あったら便利」まで叶えるGLANCE、ネットワーク&セキュリティ強化で暮らしに寄り添う -
“ラグジュアリー”をまとったエプソンのコンパクトプロジェクター「EF-73」の実力を徹底レビュー -
マランツのAVプリアンプ「AV 30」でグレードを卓越したイマーシブサウンドの底力を体感! -
オーディオを高く売るなら信頼と実績のオーディオランド!下取よりも買取がお得です◎
アクセスランキング
RANKING
4/28 9:57 更新

















