ディープラーニングのテキスト読み上げサービスを活用

Amazon、Alexaスキルで27種類の言語を読み上げ可能に

編集部:成藤正宣
2018年09月06日
アマゾンジャパンは、Amazon Alexaスキルが発音できる音声の種類を、これまでの8種類から27種類へ拡大すると発表した。

Amazon Alexaスキルで利用できる音声が27種類に拡大する

これはAmazonのテキスト読み上げサービス「Amazon Polly」によって実現したもの。Amazon PollyはAWSをベースにしたディープラーニング技術を用いており、テキストを実際の人間が話しているかのようなリアルな音声に変換できるとしている。

Amazon Pollyの音声は、Alexaがサポートするすべての国・地域のAlexaスキルで使用可能となっており、英語、日本語、ドイツ語、フランス語など27種類の言語を利用できる。日本語には男声/女声の2種類が含まれている。

同社はAmazon Pollyを活用することで、製作者は従来mp3ファイルなどで複数の音声を使用していた場合より、自然な音声を簡単に管理できるようになるとしている。例えば複数のキャラクターが登場するようなAlexaスキルでは、キャラクターごとに異なる音声を割り当てたり、外国語の聞き取りや発音を練習するスキルでは、外国語の発音部分だけその言語に変更したり、という使い分けが容易になるという。

2018年9月6日現在、Amazon Pollyの音声をAlexaスキルで利用するには、開発者プレビューへ申し込み、同社の選考を受ける必要がある。申込みはアンケート(英語)から行い、対象に選ばれると詳細情報が提供される。なお選考に外れた場合も、用意が整い次第改めて利用に関する告知が行われる予定。

関連記事