怖い!?声が収集されてる!Alexaスマートスピーカーの光と影
DX顧問となって頂ける方を募集しております。LINE友だち追加で簡単!3秒で登録完了です。案件はLINEにて配信しておりますので、足元稼働予定がない方でも、お気軽に御登録頂けましたら幸いです。LINEはこちらから。
1.はじめに
皆さんスマートスピーカー、使ってますか?GoogleとかAmazonとかから出てる、あれです。声で反応するやつです。
我が家でも使っています。お使いになっている人も、知らない人も、ちょっとびっくりすることがあるので、記事にしました。
2.Alexaの便利な使い道
我が家では、Amazonのスマートスピーカー、alexaを使っています。
台所に1つ、ダイニングに1つ、ベッドルームに1つ、仕事部屋に1つ、リビングに1つ、車に1つで合計6つあります。
買う前には家内に「こんなもんいらん!」と言われましたが、今や無くてはならないものになっています。
具体的な使い道としては、
家全体に声を掛ける
子供が3人います。すると、2階の奥の部屋で子供達がおもちゃで遊んでいたりします。家内が夜ご飯を作った時、わざわざキッチンから階段の下まで移動してきて、大声で
「ご飯できたよーーー!」
よく見る光景ですよね?これ、なくなりました。
今はキッチンのalexaに「alexa, ご飯できたよ、ってアナウンスして」
で一発です。家のあちこちに設置されているalexaが一斉にこの声出してくれるので、色んな所にいる家族がすぐにダイニングに集まってきます。
音楽やラジオ
ついでにAmazon primeに加入していると、音楽やラジオのコンテンツが大量に聞けます。なので、我が家では音楽がかかっていることが多くなりました。
運転中の電話
車に車載するAlexa Autoから、家にいるalexaにコールすることができます。家内が家にいると、携帯電話が近くにない時もあり、こちらの方が話せたりします。
しかも、Alexa Autoからも、家全体にアナウンスできるので
「もうすぐ家に帰りますー」
なども可能になります。
3.音声データの収集
そんな便利なアレクサくんですが、アマゾンのサイトに行って、色々調べてみますと、こんな画面がでてきます。
見てみると、家内が良く聞くJ waveというラジオを聞くためのワードが。
えっ!!??こ、こ、声!!??収集されてる??
履歴をクリックして広げて見ると、
おおおー、過去の声も聞けます。。。
つまり、発した音声は、全てアマゾンのサーバーに送信されているということですね。
URLはこちらです。アレクサをお持ちの方はぜひ確認してみて下さい。
わたしの声も、家内の声も、子供達の声もここで確認できます。自分の声だけならまだしも、家内の声を聞くのは気が引けます笑
例えばこちら、昔のわたしの声です。先程の画面から出したサウンドです。
これは2階のベッドルームから、1階のリビングにいる子供にアナウンスしているものですね。
こんなのもありました。
これは子どもたちを寝かしつける時にベッドルームで鳴らしている羊を数える曲です。過去さかのぼってあの画面から鳴らせますね。
アレクサは、「ウェイクワード」と言って、最初に「アレクサ」って言わないと、音声を拾わない仕組みになっています。ただこれ、たまに間違って音声を拾ってしまうことがあり、先程の画面で聞ける音声の中にも、「アレクサ」と言っていない音声が含まれていました。
基本的に全てサーバーに送られているということですね。
これは怖い感じもしますが、全く気にならない人もいるでしょう。でも間違って拾ってしまった音声の中に、聞かれたくない内容が含まれている場合もあると考えると、少し怖いですね。
それと気になるのが、これがいつまで保存されるかですよね。
こちらの記事を読むと、基本的にユーザーが削除しない限り、永遠に保存されるみたいです。なかなかですね。
と思いましたが、自分でもしっかりAmazonの画面を確認すると、きちんと画面が用意されていました。保存期間の設定は下の画面でできますね。
音声データの収集を怖いと感じない人であっても、収集されるよりは、されない方が消費者としては安心でしょう。
一方alexa等のスマートスピーカーを導入したことによる便益もあります。
判断は委ねますが、買う際の判断材料にして下さいね。
4.本質的な問題はAlexa単体では認識できないから?
これ、実は、本質的な問題は、
Alexa単体で音声認識できない
ことにあると思います。音声をわざわざamazonのサーバーに送るのは、Alexa単体でその音声を理解できないからでしょう。もし理解できれば、サーバーに送らなければいけない必然性は無いはずです。
これを解決するための方法は、エッジAIと呼ばれる技術を取り入れることです。
製造業などに少しずつ導入されているAIですが、AIの中には、認識のためにサーバーに送る時間でさえ、事故につながる程の遅延となりうるものがあります。
例えば自動運転に用いられる画像認識がそうです。前に映る物体が人間かどうかを判断するためにいちいちサーバーにデータを送っていては、事故になってしまうでしょう。
なのでサーバーに送らずに直接判断を行う方が望ましい場合がありますよね。これがエッジAIです。これがあれば、アレクサのこの怖い音声の収集も、避けることができます。ただ、能力の高い半導体が必要になりますので、恐らくアレクサ単体の値段も上がってしまいますし、エッジAIの導入が進むにつれて、ますます半導体が不足することになるかも知れません。
過去の記事で、わたしのご支援したプロジェクトを記事にしています。
ここでも、歩行データをサーバーに送っていました。AI技術の「推論」というプロセスでこの歩行データが必要になります。
5.最後に
スマートスピーカーの導入による光と影を紹介しました。AIによる音声認識と応答、まさしく消費者向けDXの最前線ですが、リスクもあります。参考にして下さい。