最近、人工知能の発展と共に、SiriやGoogleアシスタントを代表とする音声アシスタントAIが注目を集めています。音声アシスタントAIは従来のようにスマートフォンに搭載されているものだけではなく、スマートスピーカという形で多数の製品が発表されており、より身近なものになってきました。
今回はSiri、Googleアシスタント、Alexa、Cortanaという4つの音声AIアシスタントについてどのような用途や機能があるのかを紹介していきます。
音声アシスタントAIとは?
音声アシスタントAIは人工知能の「自然言語処理」という音声認識の技術を利用したものです。多くの場合、スマートフォンに搭載されて、「Hey Siri」などと話しかけることで、起動し使用することができます。
人間の声を認識して、検索をしたり、音楽を再生したり、天気予報やその日の予定を教えてくれたりするのが主な機能ですが、人間と雑談的な会話をしたり、人間の代わりに電話をかけてくれるなど、驚くべき新機能も実現されています。
多くの場合、スマートフォンに搭載されていて、「Hey siri」などと話しかけることで、起動することができます。
また最近では、スマホだけではなく、家庭での利用を想定したAI搭載のスマートスピーカ(グーグルホーム、エコーなど)が登場し、生活のいたるところでAIの恩恵を受けられるようになってきました。
こうした音声アシスタントAIは今後ますます発達していき、将来的には人間一人一人が専用の秘書を持てるようになるとみられています。
Siri
音声アシスタントAIとして一番有名なのはAppleのSiriでしょう。Siriは2011年に登場したiphone4sに初めて搭載されました。その後、SiriはIpadやMAC、Apple Watch、Apple TVなどほとんどのApple製デバイスに搭載され、日本でも多くの人が利用したことがあるのではないでしょうか。
そんな SiriはIOS12で大幅で進化しました。その代表的なものがショートカット機能です。ショートカット機能は普段から決まって行う動作を登録しておくことで、自動でその動作をおこなってくれるものです。たとえば、「家に帰る」という言葉を登録することで
・家までの経路・時間の示
・音楽を再生する
・家のエアコンなどの家電の電源をつける
このような操作を自動でおこなってくれるのです。
ショートカット機能によってSiriは賢くなり、使い道が大きく広がったと言えるでしょう。
Googleアシスタント
Googleアシスタントは2016年にGoogleが満を持して発表しました。Androidスマホだけではなく、Googleホームのような多数のスマートスピーカにも搭載されていて、日本には2017年に上陸を果たしました。
GoogleアシスタントもSiri同様、Googleカレンダーに予定を追加したり、Googleマップで目的地までの経路や交通状況を調べたり、音楽を再生したりできます。
しかし、Googleアシスタントの最大の魅力はなんと言ってもGoogle検索との連携です。AI自身が知らない質問に対してもGoogle検索を駆使して回答できます。そこに高い音声認識力と文脈理解力も持ち合わせているため、今回紹介する4つの音声アシスタントAIのなかでも最も賢いとされています。
さらに、現在はアメリカのみの機能ですが、ユーザーの代わりにとても自然な話し方で電話をかけてくれるGoogleDuplex(デュプレックス)という機能も存在します。
さすが「AIファースト」を掲げているGoogleだけあり非常に高性能で多機能な音声アシスタントAIとなっています。
Google系サービスをよく利用する人、できる限り賢い音声アシスタントAIを利用したい人はGoogleアシスタントを利用してみるのがいいかもしれません。
Alexa
Alexa(アレクサ)はAmazonが2014年に発表した音声アシスタントAIです。Alexaの発表と同時にエコーというスマートスピーカも発表されました。エコーは世界初のスマートスピーカとして、世界中で話題になりました。
そんなAlexaの最大の特徴はAmazonというプラットフォームと豊富な外部APIとの連携でしょう。Alexaからの音声操作でAmazonで買い物をしたり、購買履歴を確認したり、SiriやGoogleアシスタントのように音楽を再生したり、予定を聞いたりもできます。
さらに、他社のスマートスピーカやスマートウォッチにも対応していたり、Googleカレンダーにアクセスして予定の追加・確認もできるなど他社のデバイスやサービスでも幅広く利用できるのがAlexaの特徴でもあります。 また、連携できる家電製品の多さも魅力で、IoTの中核を担う機器としても注目を集めています。
Cortana
Cortana(コルタナ)はマイクロソフトが開発した音声アシスタントAIです。Windows10に搭載されていて、カレンダーへの予定の追加や確認、リマインダーの管理、ファイルの検索、音声認識を使ったちょっとしたおしゃべりも行なえます。
さらに、最近では音声でパソコンのシャットダウン、再起動、ロック、スリープという操作も行えるようになりより便利になりました。
他の3つの音声アシスタントAIに比べると、知名度が低く、使用機会も少ないかもしれません。しかし、Cortanaは返答をパソコンのディスプレイ上に表示してくれるので視覚的に確認できて、理解しやすいという強みがあります。Cortanaを利用してパソコン上での操作をアシストしてもらうと便利でしょう。
最後に
今回は主要な4つの音声アシスタントAIを紹介しました。
それぞれに特徴的な機能や使い方があり、用途は様々です。音声アシスタントはうまく声が認識されなかったり、返答が的外れであったり、利用範囲が限られていたりなどまだまだ発展途上の技術です。それでも、音声アシスタントAIは急激なスピードで発達しています。数年後には人間の感情や気持ちを読み取って会話できるような驚くべき機能や用途が実現しているかもしれません。
AIが世界中の一人一人に完全にパーソナライズされ、秘書のような役割を担う時代がもうすぐそこまで来ているのです。