【連載】ガジェットTIPS

スマートスピーカーの「リアルタイム」は本当にリアルタイムなの?

海上忍
2019年02月18日
“リアルタイム” をうたうスマートスピーカー用アプリ(スキル)は、多数存在します。しかし、実際に利用してみると、質問/命令から少し間が空いて応答があるのが当たり前。しかし、スキルの仕組みを知れば、少しは納得できることでしょう。

スマートスピーカーの「スキル」、リアルタイムとはいうけれど……

通常、スマートスピーカー用スキルの本体は “クラウド” にあります。たとえば、Googleアシスタントは「Cloud Functions」、Amazon Alexaは「AWS Lambda(ラムダ)」というクラウド上の実行環境を用意し、そこに作成したプログラム(関数)を置き動作させることで、スマートスピーカー側からの処理依頼を受け付けることができます。

つまりスマートスピーカーは、命令を受け付けクラウド上の関数に依頼するフロントエンド(ユーザと接する最前線)であり、御用聞き兼つなぎ役という位置付けです。

スマートスピーカーはインターネット経由で関数と通信するので、その往復で遅延が発生します。Cloud FunctionsやAWS Lambdaは、東京にも関数の設置場所(リージョン)を設けているため、大幅な遅延はありませんが、それでも通信を伴う以上は、遅延をゼロにすることはできません。

クラウド側の処理でもわずかに遅延が発生します。AWS Lambdaを例にすると、命令到着から数ミリ秒以内にイベントを処理するという高レスポンス設計ですが、やはり遅延はゼロにはなりません。

スマートスピーカーは目の前にありますが、翻訳などスキルとしての中核的な処理は遠く離れたクラウド上で行われているため、通信を伴う以上どうしてもやり取りに若干の時間がかかってしまうのです。"ほぼリアルタイム" と理解し、今後の技術向上を暖かく見守りましょう。

関連記事