怖い！？声が収集されてる！Alexaスマートスピーカーの光と影

DX顧問となって頂ける方を募集しております。LINE友だち追加で簡単！3秒で登録完了です。案件はLINEにて配信しておりますので、足元稼働予定がない方でも、お気軽に御登録頂けましたら幸いです。LINEはこちらから。

1.はじめに

皆さんスマートスピーカー、使ってますか？GoogleとかAmazonとかから出てる、あれです。声で反応するやつです。

我が家でも使っています。お使いになっている人も、知らない人も、ちょっとびっくりすることがあるので、記事にしました。

2.Alexaの便利な使い道

我が家では、Amazonのスマートスピーカー、alexaを使っています。

台所に1つ、ダイニングに1つ、ベッドルームに1つ、仕事部屋に1つ、リビングに1つ、車に1つで合計６つあります。

買う前には家内に「こんなもんいらん！」と言われましたが、今や無くてはならないものになっています。

具体的な使い道としては、

家全体に声を掛ける

子供が3人います。すると、2階の奥の部屋で子供達がおもちゃで遊んでいたりします。家内が夜ご飯を作った時、わざわざキッチンから階段の下まで移動してきて、大声で

「ご飯できたよーーー！」

よく見る光景ですよね？これ、なくなりました。

今はキッチンのalexaに「alexa, ご飯できたよ、ってアナウンスして」

で一発です。家のあちこちに設置されているalexaが一斉にこの声出してくれるので、色んな所にいる家族がすぐにダイニングに集まってきます。

音楽やラジオ

ついでにAmazon primeに加入していると、音楽やラジオのコンテンツが大量に聞けます。なので、我が家では音楽がかかっていることが多くなりました。

運転中の電話

車に車載するAlexa Autoから、家にいるalexaにコールすることができます。家内が家にいると、携帯電話が近くにない時もあり、こちらの方が話せたりします。

しかも、Alexa Autoからも、家全体にアナウンスできるので

「もうすぐ家に帰りますー」

なども可能になります。

3.音声データの収集

そんな便利なアレクサくんですが、アマゾンのサイトに行って、色々調べてみますと、こんな画面がでてきます。

見てみると、家内が良く聞くJ waveというラジオを聞くためのワードが。

えっ！！？？こ、こ、声！！？？収集されてる？？

履歴をクリックして広げて見ると、

おおおー、過去の声も聞けます。。。

つまり、発した音声は、全てアマゾンのサーバーに送信されているということですね。

URLはこちらです。アレクサをお持ちの方はぜひ確認してみて下さい。

わたしの声も、家内の声も、子供達の声もここで確認できます。自分の声だけならまだしも、家内の声を聞くのは気が引けます笑

例えばこちら、昔のわたしの声です。先程の画面から出したサウンドです。

これは２階のベッドルームから、1階のリビングにいる子供にアナウンスしているものですね。

こんなのもありました。

これは子どもたちを寝かしつける時にベッドルームで鳴らしている羊を数える曲です。過去さかのぼってあの画面から鳴らせますね。

アレクサは、「ウェイクワード」と言って、最初に「アレクサ」って言わないと、音声を拾わない仕組みになっています。ただこれ、たまに間違って音声を拾ってしまうことがあり、先程の画面で聞ける音声の中にも、「アレクサ」と言っていない音声が含まれていました。

基本的に全てサーバーに送られているということですね。

これは怖い感じもしますが、全く気にならない人もいるでしょう。でも間違って拾ってしまった音声の中に、聞かれたくない内容が含まれている場合もあると考えると、少し怖いですね。

それと気になるのが、これがいつまで保存されるかですよね。

こちらの記事を読むと、基本的にユーザーが削除しない限り、永遠に保存されるみたいです。なかなかですね。

と思いましたが、自分でもしっかりAmazonの画面を確認すると、きちんと画面が用意されていました。保存期間の設定は下の画面でできますね。

音声データの収集を怖いと感じない人であっても、収集されるよりは、されない方が消費者としては安心でしょう。

一方alexa等のスマートスピーカーを導入したことによる便益もあります。

判断は委ねますが、買う際の判断材料にして下さいね。

4.本質的な問題はAlexa単体では認識できないから？

これ、実は、本質的な問題は、

Alexa単体で音声認識できない

ことにあると思います。音声をわざわざamazonのサーバーに送るのは、Alexa単体でその音声を理解できないからでしょう。もし理解できれば、サーバーに送らなければいけない必然性は無いはずです。

これを解決するための方法は、エッジAIと呼ばれる技術を取り入れることです。

製造業などに少しずつ導入されているAIですが、AIの中には、認識のためにサーバーに送る時間でさえ、事故につながる程の遅延となりうるものがあります。

例えば自動運転に用いられる画像認識がそうです。前に映る物体が人間かどうかを判断するためにいちいちサーバーにデータを送っていては、事故になってしまうでしょう。

なのでサーバーに送らずに直接判断を行う方が望ましい場合がありますよね。これがエッジAIです。これがあれば、アレクサのこの怖い音声の収集も、避けることができます。ただ、能力の高い半導体が必要になりますので、恐らくアレクサ単体の値段も上がってしまいますし、エッジAIの導入が進むにつれて、ますます半導体が不足することになるかも知れません。

過去の記事で、わたしのご支援したプロジェクトを記事にしています。

【これまで関わったプロジェクト】歩行データから認証

ここでも、歩行データをサーバーに送っていました。AI技術の「推論」というプロセスでこの歩行データが必要になります。

5.最後に

スマートスピーカーの導入による光と影を紹介しました。AIによる音声認識と応答、まさしく消費者向けDXの最前線ですが、リスクもあります。参考にして下さい。

DX顧問サービスはこちら