黄色いノート

ネット通販/EC、新技術、仕事など、いろいろ書いています

【リスト付き】AIスピーカー・スマートスピーカーまとめ(2017年9月)

アマゾンエコーやグーグルホームなどに代表されるスピーカー型音声認識アシスタント(AIスピーカー・スマートスピーカー)が、これから各家庭に普及することが見込まれています。

アメリカでは今年2450万台が出荷されるという試算もあり、日本でもオンキヨーやソニー、そしてLINEがこのAIスピーカーを発売していくことでマーケットが広がっていきそうです。

各社がいろいろなデバイスをいろいろな音声認識技術を使って発売している(これから発売する)ので、主要なものをリストにしてまとめました。

AIスピーカー(スマートスピーカー)とは

AIスピーカーとは、AI(人工知能)機能を利用できるスピーカーのことを示し、ユーザーが話しかけることでAIの音声アシスタント(Amazon Alexa Voice ServiceやGoogle Homeなど)を使うことができます。

AIの音声アシスタントはクラウド上で機能しているため、AIスピーカーはインターネットに常時接続されています。ユーザーの指示を処理する流れとしては、

  1. AIスピーカーの高精度マイクがユーザーの音声指示を拾う
  2. AIスピーカーがクラウド上の音声アシスタントに音声指示を送る
  3. 音声アシスタントが音声指示を解析する
  4. 音声アシスタントが解析した指示をAIスピーカーに送る
  5. AIスピーカーが指示を実行する(音楽の再生であったり、家電の操作であったり)

となります。

音声認識技術で認識したユーザーの音声による指示に従い、連携するデバイス(PCやスマホ、スマート家電)を操作・制御することができることがAIスピーカーの特徴です。

AIスピーカーの用途

AIスピーカーの用途は多岐に渡ります。

  • 音楽の再生
  • ニュースや天気予報を読み上げる
  • アラートやタイマーを設定する
  • 「何かについて教えて」という質問に対し、ウェブの検索結果やWikipediaなどから回答する
  • 電子書籍の読み上げ(Amazon EchoはKindleを読むことができる)
  • 商品の注文(Amazon EchoはアマゾンのPrime Nowに対応している)
  • スマート家電を操作できる(電気を点けたり、エアコンを入れたりなど)

などなど。。

次の章で触れるように、スマートスピーカーはAmazon Echo(アマゾンエコー)によって始まりました。その時にはアマゾンプライム会員がプライムミュージックを手軽に利用できるようにするためのスピーカーとしての位置付けでしたが、音声認識技術であるAmazon Alexa(アマゾンアレクサ)が進化していくにつれ、上記のように多くのことができるようになっていきました。

AIスピーカー・スマートスピーカーはアマゾンエコーにより始まった

2014年11月に発売されたアマゾンエコー

AIスピーカーの始まり

2014年11月にアマゾンがアメリカでAmazon Echo(アマゾンエコー)を発売したのが、スピーカー型音声認識アシスタント(家庭用AIアシスタント、家庭用スピーカー、AIスピーカー、スマートスピーカーなど、様々な名称で呼ばれます。名称が定まっていないのがマーケット黎明期というところを感じさせます)の始まりです。

日経新聞の記事などを参考に図表を作成しましたが、2017年夏以降は各社が本格的にこのAIスピーカーに力を入れ、デバイスを発売していきます。

AIスピーカー・スマートスピーカーをまとめたオリジナル図@yellowpadblog

価格はどれも数万円程度になる見込みですが、そこで使われる音声認識技術は

  • Amazon Alexa Voice Service(アマゾンアレクサ)
  • Google Assistant(グーグルアシスタント)
  • 自社の技術

というように分かれます。

AIスピーカーの最大の特徴はユーザーがその指示を音声で行えるという点にあるため、「どのように音声を認識するか」というのが最も重要です。そのコアの部分の認識技術を他社のものを使うか、自社のものを使うかという判断が各社分かれています。

マーケット規模

2017年1月にVoiceLabsが発表したレポートには、AIスピーカーの販売台数推移を示したグラフ(アメリカのみ)が掲載されています。それによると、

2015年:170万台
2016年:650万台(前年比3.8倍)
2017年:2450万台(前年比3.8倍)

というように、スマートスピーカーは今後飛躍的な販売の伸びが見込まれています。今年2017年も前年比3.8倍にあたる2450万台が出荷され、累計販売デバイス数は2017年末に3300万台に達する見込みとしています。

音声認識技術の精度の向上

スマートスピーカーの最も重要な点は、いかにユーザーの音声による指示を正しく認識して処理するかというところにあります。音声認識技術を評価する基準として、人が発声した単語のうち聞き取りできなかった単語の数を見る「ワードエラー率(Word Error Rate:WER)」という指標があります。

マイクロソフトとグーグルが、それぞれ音声認識技術に関してその精度を発表していました。両社共にこのワードエラー率が5%前後となっていますので、「100の単語を聞かせたときには5つの単語を誤って認識する。20の単語について1つの単語を誤って認識する」ということが言えます。

ちなみにエラー率が5.9%の時に「同じ会話の文字起こしを行った人間と同程度」と発表されており、現在の5%前後というワードエラー率の水準は人間の書き起こし能力を上回っているということができます。

マイクロソフト

マイクロソフトは8月20日にブログにて、音声認識タスクで5.1%のワードエラー率を達成した、すなわち音声を間違って認識してしまう率を5.1%まで引き下げることができたと発表しました。

2016年の10月にはこのエラー率は5.9%となっていましたので、音声認識技術が着実に向上していることが分かります。

グーグル

グーグルの音声認識技術も同様に改善が続いています。2017年5月の最新の発表では、ワードエラー率は4.9%に下がったということが発表されています。

アマゾンのAIスピーカー:Amazon Echo(アマゾンエコー)

いろいろなスキルと連携できるAIスピーカー、アマゾンエコー

アマゾンエコーには、いろいろなスキルを加えることができる

アマゾンエコーは、2014年11月にアメリカでプライム会員向けに発売された初のAIスピーカー(スマートスピーカー)です。その後

2015年6月にアメリカで一般会員向けに
2016年9月にはイギリスで発売
2016年10月にはドイツで発売

というように販売が拡大されています。

アメリカでの価格は179.99ドルですが、9月4日現在、アメリカのアマゾンサイトを見てみると80ドル引きの99.99ドル(40%割引)で買うことができます。

アマゾンエコーはアメリカアマゾンサイトで99.99ドルで買うことができる

AIアシスタントのAmazon Alexa(アマゾンアレクサ)に接続されており、「アレクサ」という呼びかけで起動します。

アマゾンエコー起動後は、アマゾンエコーに話しかけることで音楽を再生したり、ニュースや天気のチェック、Kindleの読み上げやネットショッピング(アマゾンプライムの利用)などを行うことができます。

またアマゾンエコーはアレクサ・スキルを利用できることも特徴で、第三者が開発したスキル(例:家電操作)を組み込むことによって、できることが増えていきます。

AmazonのAIスピーカーはAmazon Echo(アマゾンエコー)の他にも、

  • 小型タイプのEcho Dot(エコードット)
  • 携帯可能なポータブル端末としてのAmazon Tap(アマゾンタップ)
  • スクリーンを備えたAmazon Echo Show(アマゾンエコーショウ)

特にAmazon Echo Show(アマゾンエコーショウ)は、初年度に900万台を販売するとの売上予測もあり、非常に注目度が高いデバイスです。アメリカでの価格は229.99ドルとなっています。

現在対応している言語は英語とドイツ語のみとなっていることもあり、日本での発売は現時点で未定となっています。

スクリーンを備えたアマゾンエコーショウは初年度に900万台を販売するとの予測もある

スクリーンを備えたAmazon Echo Show(アマゾンエコーショウ)

グーグルのAIスピーカー:Google Home(グーグルホーム)

グーグルのAIスピーカー、グーグルホーム

グーグルホームは、2016年11月にアメリカで発売されたAIスピーカーです。その後2017年4月にイギリスで発売され、オーストラリア、カナダ、フランス、ドイツ、日本でも2017年内に発売予定となっています。

アメリカでの価格は129ドルですが、9月4日現在、アメリカのグーグルストアを見てみると20ドル引きの109ドルで買うことができます。

AIアシスタントのGoogle Assistant(グーグルアシスタント)に接続されており、「OK Google(オーケーグーグル)」という呼びかけで起動します。アンドロイドスマホのあれと一緒ですね。

グーグルホーム起動後は、グーグルホームに話しかけることで音楽を再生したり、ニュースや天気のチェックを行うことができます。またテレビに接続してYouTubeを再生したり、知りたいことに対してGoogleの検索結果を返したり、日々のタスク管理を行うといったことができます。

最後に

2014年11月にAmazon Echoの登場から始まったAIスピーカーは、図表のように今年から各社が発売していくことで各家庭に浸透していきそうです。

音楽再生機能から始まったスマートスピーカーですが、現在ではスマート家電を操作・制御することも担い、スマートホームの中心的な位置付けになることも考えられます。

スマホが登場した時には「タッチスクリーンは清潔好きな日本人には合わない」などとも言われていましたが、現在はスマホ全盛の時代です。

音声でデバイスをコントロールなんて、という先入観に捕らわれずに新製品も試していつかレビューしてみたいと思っています。

最後までお読みいただき、ありがとうございました。

今後もいろいろなエントリを書いていきますので、ぜひお気軽にTwitterのフォローや読者登録をお願いします。