怖い!?声が収集されてる!Alexaスマートスピーカーの光と影

DX顧問となって頂ける方を募集しております。LINE友だち追加で簡単!3秒で登録完了です。案件はLINEにて配信しておりますので、足元稼働予定がない方でも、お気軽に御登録頂けましたら幸いです。LINEはこちらから。

1.はじめに

皆さんスマートスピーカー、使ってますか?GoogleとかAmazonとかから出てる、あれです。声で反応するやつです。

我が家でも使っています。お使いになっている人も、知らない人も、ちょっとびっくりすることがあるので、記事にしました。


2.Alexaの便利な使い道

我が家では、Amazonのスマートスピーカー、alexaを使っています。

台所に1つ、ダイニングに1つ、ベッドルームに1つ、仕事部屋に1つ、リビングに1つ、車に1つで合計6つあります。

買う前には家内に「こんなもんいらん!」と言われましたが、今や無くてはならないものになっています。

具体的な使い道としては、

家全体に声を掛ける

子供が3人います。すると、2階の奥の部屋で子供達がおもちゃで遊んでいたりします。家内が夜ご飯を作った時、わざわざキッチンから階段の下まで移動してきて、大声で

「ご飯できたよーーー!」

よく見る光景ですよね?これ、なくなりました。

今はキッチンのalexaに「alexa, ご飯できたよ、ってアナウンスして」

で一発です。家のあちこちに設置されているalexaが一斉にこの声出してくれるので、色んな所にいる家族がすぐにダイニングに集まってきます。

音楽やラジオ

ついでにAmazon primeに加入していると、音楽やラジオのコンテンツが大量に聞けます。なので、我が家では音楽がかかっていることが多くなりました。

運転中の電話

車に車載するAlexa Autoから、家にいるalexaにコールすることができます。家内が家にいると、携帯電話が近くにない時もあり、こちらの方が話せたりします。

しかも、Alexa Autoからも、家全体にアナウンスできるので

「もうすぐ家に帰りますー」

なども可能になります。


3.音声データの収集

そんな便利なアレクサくんですが、アマゾンのサイトに行って、色々調べてみますと、こんな画面がでてきます。

見てみると、家内が良く聞くJ waveというラジオを聞くためのワードが。

えっ!!??こ、こ、声!!??収集されてる??

履歴をクリックして広げて見ると、

おおおー、過去の声も聞けます。。。

つまり、発した音声は、全てアマゾンのサーバーに送信されているということですね。

URLはこちらです。アレクサをお持ちの方はぜひ確認してみて下さい。

わたしの声も、家内の声も、子供達の声もここで確認できます。自分の声だけならまだしも、家内の声を聞くのは気が引けます笑

例えばこちら、昔のわたしの声です。先程の画面から出したサウンドです。

これは2階のベッドルームから、1階のリビングにいる子供にアナウンスしているものですね。

こんなのもありました。

これは子どもたちを寝かしつける時にベッドルームで鳴らしている羊を数える曲です。過去さかのぼってあの画面から鳴らせますね。

アレクサは、「ウェイクワード」と言って、最初に「アレクサ」って言わないと、音声を拾わない仕組みになっています。ただこれ、たまに間違って音声を拾ってしまうことがあり、先程の画面で聞ける音声の中にも、「アレクサ」と言っていない音声が含まれていました。

基本的に全てサーバーに送られているということですね。

これは怖い感じもしますが、全く気にならない人もいるでしょう。でも間違って拾ってしまった音声の中に、聞かれたくない内容が含まれている場合もあると考えると、少し怖いですね。

それと気になるのが、これがいつまで保存されるかですよね。

こちらの記事を読むと、基本的にユーザーが削除しない限り、永遠に保存されるみたいです。なかなかですね。

と思いましたが、自分でもしっかりAmazonの画面を確認すると、きちんと画面が用意されていました。保存期間の設定は下の画面でできますね。

音声データの収集を怖いと感じない人であっても、収集されるよりは、されない方が消費者としては安心でしょう。

一方alexa等のスマートスピーカーを導入したことによる便益もあります。

判断は委ねますが、買う際の判断材料にして下さいね。


4.本質的な問題はAlexa単体では認識できないから?

これ、実は、本質的な問題は、

Alexa単体で音声認識できない

ことにあると思います。音声をわざわざamazonのサーバーに送るのは、Alexa単体でその音声を理解できないからでしょう。もし理解できれば、サーバーに送らなければいけない必然性は無いはずです。

これを解決するための方法は、エッジAIと呼ばれる技術を取り入れることです。

製造業などに少しずつ導入されているAIですが、AIの中には、認識のためにサーバーに送る時間でさえ、事故につながる程の遅延となりうるものがあります。

例えば自動運転に用いられる画像認識がそうです。前に映る物体が人間かどうかを判断するためにいちいちサーバーにデータを送っていては、事故になってしまうでしょう。

なのでサーバーに送らずに直接判断を行う方が望ましい場合がありますよね。これがエッジAIです。これがあれば、アレクサのこの怖い音声の収集も、避けることができます。ただ、能力の高い半導体が必要になりますので、恐らくアレクサ単体の値段も上がってしまいますし、エッジAIの導入が進むにつれて、ますます半導体が不足することになるかも知れません。

過去の記事で、わたしのご支援したプロジェクトを記事にしています。

【これまで関わったプロジェクト】歩行データから認証

ここでも、歩行データをサーバーに送っていました。AI技術の「推論」というプロセスでこの歩行データが必要になります。


5.最後に

スマートスピーカーの導入による光と影を紹介しました。AIによる音声認識と応答、まさしく消費者向けDXの最前線ですが、リスクもあります。参考にして下さい。

林 高行

株式会社ヴィクセス代表取締役。東京工業大学大学院を修了後、シティバンク、エヌ、エイを経てみずほ証券にてリスク統括部にて金融派生商品の定量分析業務に従事。2012年にヴィクセスを設立。以降IT, ファイナンス領域で顧客を支援。

Previous
Previous

DXでサーファーの海難事故を減らせられるか

Next
Next

プライシングの専門家が説明する、年間パスポートは1日入場料金何回分に設定すると売上が最大化するのか