音声対話技術の未来【後編】 | 天才エンジニア「未踏」の挑戦

（前編はこちら）

さて、次のテーマ、未来の話に入る前に、2017年現在のVUI／VPAの現状がどのようになっているか、観察の一部を御紹介したいと思います。

Welcome to the voice-activated world with voice-first devices!

モバイルファースト、スマホファーストという掛け声を耳にするようになって久しいですが、VUI／VPAの勃興に伴い、新たに、ボイスファースト（デバイス）という概念が誕生してきました。ちょっと乱暴に言ってしまえば（※34）、従来の概念をまとめて「スクリーンファースト」としてしまって、スクリーンファーストの対になる概念として、ボイスファーストが位置付けられています。
ボイスファーストデバイスの定義はVoiceLabs（※35）によると「常時オン（※36）であり、入出力の第一選択肢が音声である知的なハードウェア（intelligent piece of hardware）」となっています。スクリーンが主でボイスが従であるもの（スマホなど）をスクリーンファーストデバイス、ボイスが主でスクリーンが従であるもの（Amazon Echo Showなど）をボイスファーストデバイスと分類するという考え方です。
デバイスと言わず、「ボイスファースト」という概念に留めるとしたら、後述するHelloGByeの事例などはスマホアプリではありますが、ボイスファーストなアプリであると言っても良いでしょうし、BaiduのTalkType Voice Keyboard（※37）などは、自身でも”The first voice-centric keyboard for Android”と宣伝をしていますが、ボイスファーストなアプリであると言えるでしょう。

さて、現在VUI／VPAの潮流を大きく動かしているのは、やはりGAFA（Google, Amazon, Facebook, Apple）、言い換えれば、大資本にモノを言わせ、スター選手をガンガン引っ張ってくる、シリコンバレージャイアンツ（※38）です。
それに続くBaiduやAlibabaなど、中国勢の勢いも著しいものがあります。Baiduのスマートスピーカー「Little Fish（小魚在家）（※39）」、中国の音声認識ベンダーとEC事業者とが開発した「LingLong DingDong」やAlibabaの「Tmall Genie」はMarriott ホテル10万室（10万台）の導入計画（※40）をぶち上げています。
これらは日本で良く聞くような、スマートスピーカー製品と銘打ちつつ、その中身はAmazon Alexa もしくは Google Assistant搭載というような、ハードウェアのみを自社開発した互換製品ではなく、全て独自のVPAを持つ（※41）というところが、その勢いを物語っています。そこには、スマホでの文字入力の圧倒的面倒さという観点で、中国語を母語とするユーザーの音声認識利用率がそもそも高く、受け入れられやすい素地があったという点も忘れてはならないでしょう。
日本においては、御存知の通りではありますが、独自VPAである「Clova」を搭載したLINEのスマートスピーカー「Clova Wave」や、SONYの「Xperia Hello!（※42）」などが有名です。スマートフォン上の独自VPAとしては、NTTドコモの「しゃべってコンシェル」やシャープの「エモパー」などが普及しています。

さて、Amazon Echo（互換製品を含む）は、2015年から2016年末までの約1年半で、全世界約1千万台販売（※43）されたとも言われています。2017年の1年間はさらに延び、単年で全世界約2500万台に到達するという見方（※44）もあります。さらに、Amazonの最近の発表（※45）は驚異的で、Alexa搭載デバイスは、直近のホリデーシーズンだけで数百万台以上の販売、Amazon Echo Dotは、Amazon製ハードウェアの中で最も売れているだけでなく、Amazon.com 全カテゴリの中で最も売れた製品だった、などの華々しい発表文が並んでいます。もし、スマートスピーカーが売れる毎にベルが鳴る（※46）としたら、まさに今、それは多重的な連続音に聞こえているでしょう。
これまでの経緯を簡単に振り返ると、Amazon Echoは2014年に最初の製品が限定発売され、2015年には一般にも購入可能となり、2016年9月に小型版のEcho Dotが発売され、イギリスとドイツでも販売開始されました。Amazonは日本マーケットを相手にしていないのだ、などというまことしやかな噂が先行し、Japan passingかとも思われていた2017年、Google Home日本語版の発表に前後して、日本版の発売が公式に発表されました。また、ディスプレイ付きの Amazon Echo Show、カメラ付きの Amazon Echo Look を立て続けに発表し、半導体メーカーもディスプレイ／カメラ付き音声端末（ボイスファーストデバイス）の開発を支援するSoC（※47）を相次いで発表（※48）するなど周辺マーケットも盛り上がりを見せています。

Google Homeは、Amazon Echo Dot を追うように2016年11月に米国で発売され、その後各国に展開し、今年の夏に日本語版が発売されています。それぞれの商品詳細については本稿のスコープではないため省略しますが、どちらの流れも、この3年未満の出来事であり、明らかな潮流となってきたのは、ここ2年（国内ではここ1年未満）の出来事であろうと観察しています。この流れは止まらず、ある調査（※49）によると、イギリスでのAmazon Echoの世帯普及率が2018年内に4割を超えるという見方もあります。このような統計や予測は世界中で花盛りであり、本稿ではその全てを取り上げることはできませんが、どのレポートを見ても、にわかには信じがたい成長カーブが予測されています。

さて、このような成功は、では、どのような背景でもたらされたのでしょうか？

音声認識機能の使われ方の調査があります。それによると、スマートスピーカーについては、音楽再生機能、ニュース等のオーディオコンテンツの読み上げ、タイマー機能、時間の確認、リマインダー機能などが挙げられて（※50）おり、1日に数回使うという使われ方がボリュームゾーンとなっています。これは、例えば、朝のシーンや、就寝前のシーンで継続的に利用されるであろうことを想定すれば妥当な結果であると言えます。また、最近の報告（※51）では、少ない割合ながら、物品購入にも使われ出したという報告もあります。

これらの使われ方のうち、多くの利用法は、システムに対する一命令で事が足るものです。「楽しい音楽を再生して」「明日の天気教えて」「明日の朝７時にアラームセットして」「買い物リストにキャベツを加えておいて」―――つまり、正確に声を文字にすれば概ね足るものであり、それ以上の知的な処理を機械に要求するものではありません。
これは前述の通り、DNNによるブレークスルーの射程を的確に捉えた応用であると言えます。複雑な対話は不要で、一問一答でも良い場面というのは私達の生活の中に確かに存在し、そういう場面において、スマホを取り出して、ロックを解除してアプリを立ち上げて（起動時間待って）、さらに数タップする、という操作は煩雑であり、音声入力と比較して、脳の認知的負荷が高いタスクです。
一般的に言われるVUIの利点として、他の方法より入力が速い、ハンズフリー（「ながら」操作ができる）、直観的であって認知的な負荷が小さい、感情を込めることができる（※52）、といった点があり、これらの利点を活かした応用が成功していると言え、その中でも、スマートスピーカーにおいては、音楽定額制配信サービスのゲートウェイとしての応用が、初速段階におけるキラーアプリとなったと言えます。前述の通り、朝のシーンや、就寝前のシーンなど、バタバタしていることや、スマホを開くのは面倒だけどちょっとしたことがしたいといったシーン、また、キッチンなどハンズフリー操作が必要なシーンなどで使われるアプリが、継続利用されているということにも留意が必要です。
他の先進的事例としては、HelloGbye（※53）が挙げられます。これは旅行手配という、一般的に選択肢が複数あり、GUIで完遂するには多少手間が掛かるタスクを、音声対話によって実行できるサービスです。ここでもポイントになっているのは、如何に手間を省き、能率的にタスクを実行することができるか、という点であると言えます。

また、多くの人が、現在のVPAはそれほど「頭が良く」はなく、ちょっと複雑な発話になると理解できなくなることを理解しているでしょう。一定した了解があれば、私たちは機械に慣れていくことができます。たとえ固定的な言い回ししか理解できなかったとしても、一問一答しかできなかったとしても、朝の忙しい時間に歯磨きしながらニュースヘッドラインや天気予報を聞くため、ちょっと気の利いた目覚まし時計の代わりとして、音楽定額制配信サービスの再生機として、人間側が勝手に位置づけ、勝手に慣れていきます。

これらのことから、製品価格の重要性が分かってきます。つまり、ある意味「その程度」の便益に、私たちはいくらなら払えるか、ということです。三千円？三万円？三十万円？　事前期待が高く、事後期待が低い製品は失敗する確率が高まります。特に何らか「人工知能」と銘打たれた製品は、それを付加価値として、高級指向、事前期待を高める方向にマーケティングされる場合が多いのではないでしょうか。Amazon Echo Dotは30米ドル前後（※54）です。約三千円の電器製品に私達が持つ事前期待は如何ほどのものでしょうか？Amazon Echo Dotが達成できる事後期待は、それと比較してどうでしょうか？

しかし、良いことばかりではありません。現状のスマートスピーカーにもいくつかの課題が指摘されています。特に、スキル（アプリケーション）間の認知度の差（私は「アプリの壁」と呼んでいます）に由来する問題があります。2017年のある報告（※55）によると、7,000個以上あるAlexa スキルのうち、カスタマーレビューがついているものが31%に留まり、大半のスキルがダウンロードすらされていないことを示していると報告されています。これは私達の直観にも合った結果ではないでしょうか。つまり、多くのユーザーは、特定の機能を呼び出すために、特定のコマンドを覚えることを嫌がるということです。そもそも、全体で、どのような機能があるのかを知ることすら困難です。スマホ向けのアプリストアでも同様の問題が指摘されている状況で、GUIと比較して圧倒的に一覧性が無いVUIにおいては、いわんやおや。

アプリ開発者側から見た時、さらに困った問題として、VPAの介在により、アプリ間の差別化が困難になるという問題があります。Uberスキル（タクシーの配車ができるAlexaスキル）は大きく成功したスキルのひとつですが、私達が本当に行いたいことは、「Uberの」クルマに乗ることでしょうか？それとも、Uberに限ること無く、どの会社でも良いから、現在地に最も近いタクシーを回して欲しいのでしょうか。この答えは明らかです。このことについては後ほど再度議論したいと思います。

VPAが連続的に成長し続ける上でのミッシング・リンク。それは、アプリケーション内においては、どのような技術体系によって一問一答の壁を壊すかということであり、全体として見たときには、「アプリの壁」をいかに壊すかということであり、その方法が、どちらも十分に明確ではないということです。

前半で紹介をしたスロットフィラーという武器のみでは、たとえそれを大量データという現代のマジカルジェムでレベル99まで強化したとしても、やっぱり力不足であり、Facebookの研究として紹介したような、何らかの新しい枠組み（もっとたくさんマジカルジェムがいるやつ）が必要になってくるでしょう。

さて、ここからは未来のお話。ここまでの観察と考察を元に、VUI／VPAの未来について考えていきましょう。

202X年、アプリの壁崩壊

私たちが何かを購入するとき、その商品・サービスを通して得られる便益に対して対価を支払っています。
商品を購入する前に、その購入の目的、もしくは商品によって解決したい問題を抱えているわけです。例えばここに接着剤をつけてしまった一張羅があるとしましょう。夜の会食までにその接着剤を取り除きたい、さて、どうすればよいか？「接着剤　ズボン」などのキーワードで検索して、特定の商品・サービスにたどり着くのではないでしょうか。
特定ブランドの商品が必要になる場合もあるでしょう、タバコやお酒などの嗜好品は特にそのような傾向が強いかもしれません。でも、なぜその商品に至ったのでしょうか。悪友の推薦？バーのマスターのアドバイス？
日用品セクターの商品など、安くてそこそこの品質だったら何でも良い、というような商品群もあるでしょう。何となく同じものを買ったり、近くのスーパーで安売りしてたらそれを買ったり、コストコでまとめ買いしたり…。

これらの全ての体験には、知的に信頼されたVPAが主体的に関与できる可能性を持っています。

「アレクサ、ズボンについた接着剤を出来るだけ早く落としたいんだけどどうすればいいかな？」
「アレクサ、ウィスキーって飲んだこと無いんだけど、初心者には何がおススメ？」
「アレクサ、アマゾンで安いお茶買っておいて。」

これらが成立するためには、まずVPAが信頼されている必要があり、信頼された状態で、恐る恐る行った最初の体験が成功している必要があります。
では、次の例を考えてみましょう。

例えば、テレビCMを見ながら、

人間：「アレクサ、今テレビCMでやってたアイス１個アマゾンで注文して」

という従来の延長線上にある購買行動と、

人間：「アレクサ、今度彼女がうちに泊まりに来るんだけど、女の子ウケしそうなアイス買いたい」
アレ：「それでしたら、こちらの◯◯は、人気があってオススメです。Facebook友達の花子さんも、おいしかったって言っていましたよ。」
人間：「（花子さんが言うことなら間違いないだろうな）それ注文しておいて。」

という購買行動の差です。前者はEC（Electric Commerce：電子商取引）、後者は（未来の）CC（Conversational Commerce：対話的商取引）の一例です。ECの次はCCとも言われて（※56）いますが、これはなんともいまさらな話で、昔からある商店街の、馴染みの個人商店で、数年来の付き合いのあるお店のオジちゃん／オバちゃんと話しながら、いろいろ聞いて商品を選んでいた、という体験は、極めてローカルですがCCそのものと言えます。

もちろん、これらに至る道は、技術的にも商業的にも、おそらく社会的にも平坦ではありません。少なくとも現在のアレクサを含むVPAの枠組みでは、これらを実現することは難しいでしょう。
また、前述したように、アプリの壁をどう壊すか、ということはすなわち、個社の商品やサービスという商業的トランザクションの最小単位自体、もしくはその境界を曖昧にするものであり、社会的なギャップも大きいものと考えられます。
しかし、理想の姿を想像することがたやすくなった今、何らかの形で実現される未来は、それほど遠いものではない、と考える方がむしろ妥当なのではないかと思っています。

近未来の進化したVPAは、消費者のいわばゲートキーパー（門番）もしくはバトラー（執事）となり、企業ブランドが消費者に直接リーチすることを妨げる方向にはたらきます。言い換えれば、消費者は、VPAに対して、自らの問題を解決してくれることを望むようになり、その解決の過程でVPAによって適切な商品・サービスが選ばれれば良いと考えるようになるということです。

では、近未来のレコメンデーションの実体は、どのような姿になっていくのでしょうか？そして、切っても切れない、マネタイズはどのように為されていくのでしょうか？

あなたが好きだと言っていた、トルコキキョウの花束を

レコメンデーションやそれに伴うマネタイゼーションについては、未だ実践例が多くはなく、様々な未来が予測されていますが、私見を交え、大きく２つの方向性を提示したいと思います。

まず前提として、レコメンデーションの在り方がGUIとは変わるということが重要です。GUIでは、複数候補、例えば10件や20件、場合によっては数百件近くの候補を出すことも有効ですが、VUIにおいては、多くとも3件、可能ならば1件の候補に絞ることが必要です。これは、VUIは一覧性が無いという至極当然の性質に加え、手間を省きたい、能率化したいというVUIを導入する動機自体に掛かることでもあります。また、詳細は省きますが、VPAからレコメンデーションを得るという行為の根本に絡む心理的な要因も関係します。　これは、Amazon Echo Show のようにディスプレイが付属したデバイスであっても同様です。同じ理由によって、VUI／VPAを使うシーンに、画面をスクロールするような行為はミスマッチなのです。

第一には、VPA提供業者に対しての有料広告出稿があります。とはいえ、ラジオのような単純な有料音声広告はGoogle Homeの英国での失敗事例（※57）がありますので、そういうものではなく、Googleの検索連動型広告のようなイメージです。つまり、例えば、トイレットペーパーまとめて買っておいて、と言われた時に、有料出稿されているトイレットペーパーを優先するということです。これは、消費者がVPAを信頼していて、VPAの提供業者に一方的に有利なサジェストではないと信じられていることが前提となるでしょう。VPAが有料出稿されているものを優先しすぎると、消費者の信頼を損なうことになるため、商品・サービスごとの特質を鑑みた上で、消費者の信頼と期待収益を同時に最大化する問題して捉える必要があり、難しい問題です。

関連して、ウェブ上の商品情報をVPA用に最適化しておくような何らかの処理、現在のSEOになぞらえればPAO（Personal Assistant Optimization）（※58）のような概念が生まれてくるのかもしれません。

第二には、アフィリエイトモデルがあります。これは現在のアフィリエイトとほぼ同じく、VPA経由の購買が発生した際に、コミッションが最終的にVPAの提供業者（もしくはVPA自身！）に支払われます。例えば、発話に適合する絞込みをしたのちの、価格比較サイトにおける価格順、レストラン比較サイトにおけるレイティング順、で第一位候補のみが回答として返されるというようなイメージです。発話者のソーシャルグラフ上でより高く評価されているものを優先するようなアルゴリズムを取るということも、アフィリエイトモデルへの適合が良いでしょう。
現状無償解放されているサードパーティアプリケーションですが、VPA側に全ログデータが蓄積されるため、仕組み上不可避的にVPA側の進化の方が速くなります。例えば、レストラン検索サービスが、レストラン検索用のサードパーティアプリを開発した場合、それまでは自社しか知り得なかったユーザーの検索行動が、VPA側に丸バレということになるわけです（※59）。VPA側は全てのアプリの使われ方をログデータとし、進化することが可能になります。
VPAが進化し続け、その重要度がサードパーティと比較して相対的に高まっていったとき、どこかの時点で、アプリ内で何らかのコンバージョンが為されたときに、コミッションを要求するようなモデルに変化するということも、有り得る未来のひとつではないでしょうか。
例えば、直接的なアプリの呼び出しは従来通り無償で解放されるが、前述したような、「アプリの壁」を超えた形での間接的な呼び出しの場合（例えば「タクシー呼んで」に対して、複数のタクシーアプリから特定のアプリをVPAが選択したような場合）は、VPAがそのアプリに主体的に誘導したということであるので、コミッションが要求される、というような、「新機能」を使った課金の開始は、有り得るひとつのストーリーであるようにも思います。
それに乗らないならばそれで構いません、従来通り、直接呼び出しのアプリのロングテールの裾に埋もれて、消費者から見向きもされなくなるだけですよ、というね、なんというか既視感のあるロジックな気もします。

閑話休題、「VPA自身」にコミッションが支払われるというのは、半分冗談としても、VPAとの親密度（intimacy）という観点においては、半分は重要な示唆を含んでいるように思います。例えば、VPA自身にコミッションが支払われるという体裁で、そのうちのごく一部はVPA自身が貯蓄可能であるという体裁で、例えば、あなたの誕生日に、VPAが自身の貯蓄から、通販で花束を買って送ってくれた。それは、あなたが好きだとFacebookに投稿したことのある、白いトルコキキョウの花束だった。というようなストーリーは、今でも企業から届くお誕生日おめでとうございますハガキや、誕生月のポイント３倍キャンペーンのような枠組みのちょっとした進化系でしかなく、Facebookの投稿や普段の対話情報から、喜ばれる誕生日プレゼントを予測する人工知能、というようなものは現状の技術でも十分開発可能ではないでしょうか。

そして未来へ

本稿のテーマにおいて論じるべき重要なことがらでありながら、執筆時間の都合でカバーできなかったテーマが多々あります。例えば、ヒアラブルデバイスについての議論が全くできませんでした。また、いわゆるIoT製品との相互運用についても、ほとんど触れることができませんでした。

擬人化やキャラクター性に関する論点もそのひとつです。例えばGatebox（※60）は、国際的なVUI／VPAに関する調査レポートでも、しばしばその名前を挙げられる製品のひとつです。

関連して、言語文化的側面や、VPAとの相互的な引き込み現象（entrainment）といった類の、ユーザーの心理的な側面についてもカバーできませんでした。これらについては、大規模なサーベイがなく、そもそも分かっていないことや、私の知識と経験が十分ではない部分もあり、もう少し実証経験を積んでから、また機会があれば共有したいと思います。
例えば、「サンキュー、アレクサ」という発話は、未だ一般的ではないと言われています。しかし、当社のin-houseの研究データでは、VPAに対してお礼を言うという行為は稀ながら見られます。来年誕生した子どもたち、生まれたときから傍らにスマートスピーカーがある子どもたちは、将来VPAにお礼を言うのを当然と認識するでしょうか。

最後に、私の会社の取り組みを、ちょっとだけ御紹介したいと思います。　当社、フェアリーデバイセズ株式会社は、音声UI/UXと音の機械学習の領域で2010年から仕事をしており、関連するソフトウェア・ハードウェア製品をリリースしてきました。　今般、私たちは、これまでに述べてきたような世界認識の下、未だ確立されていないVUI／VPAのB2B、B2E応用、特にVUI／VPAによる個々人の業務支援というところに大きな可能性を見出しています。　

実社会は極めて多様で、それを十全にモデル化することは容易ではありません。しかし、特定業務における多様性は限られ、現状の技術水準で対応できる範囲が十分にあります。対象とするシーンやコンテキストを絞り込むことは、製品を開発しやすく、また、性能を確保しやすくするということだけでなく、明らかなユーティリティ（便益）を生む上でも有効であると言えます。前述したMarriottホテルの10万室に配備されるというAlibabaのスマートスピーカー、開発段階でホテルの中で典型的に話されるコーパス（※61）を収集しているとされています。その詳細は分かりませんが、例えば、Marriott系列なら世界中どこでも「日本語で」ルームサービスが頼めるとしたら、それはなかなかに便利ではありませんか？
また、業務支援の文脈において、人間対人間、人間対情報システムのコミュニケーションにVUI／VPAが介在することで、私たちの日常業務はもっと能率的かつ、ある意味において楽しくなると考えています。これは、起動語から始まる現在のVPAとは異なる切り口であり、簡単なことではありませんが、独立系として、私達が取り組むべき意義のある方向性のひとつだと考えています。

VUI／VPA関連応用には、未発見の大陸が眠っています。それは1980年当時から見たGUIの先に、様々な応用が花開いたのと同様に。　そして2017年現在から見たVUI／VPAの先には、GUIのそれ以上に、私たちの暮らしをより良い方向へ変えていくための、革新的な応用が切り開かれていくことでしょう。

2027年12月、遂に工事が終わった小田急線のホーム、変わらない寒さ、変わらない月の明かり。バッテリーのぬくもりを放つのは―――

補足・参考文献リスト

（※34）それぞれ着目している軸が違うので本来はこのように横並びで比較することは不適切なのですが…

（※35）https://s3-us-west-1.amazonaws.com/voicelabs/report/vl-voice-report-exec-summary_final.pdf

（※36）常時オンであるという点が、機械と人間の関わりの歴史において、重要なターニング・ポイントになり得る部分だと考えていますが、本稿のテーマからは逸れるので省略します。

（※37）https://play.google.com/store/apps/details?id=com.baidu.research.talktype&hl=ja

（※38）いくつかの意味で、個人的に使いたい呼び方です。

（※39）http://www.zaijia.com/

（※40）https://robotstart.info/2017/10/17/alibaba-group-and-marriott-international.html

（※41）Baiduは一気通貫してソフトウェアを開発していると予測されますが、他のメーカーは、例えば音声認識器ベンダーは共通であるというようなことは、十分有り得ると思われます。ここでは、ソフトウェア部品レベルの内製化ではなく、組み合わせたシステムとしての独自性について述べています。

（※42）公式には「コミュニケーションロボット」と分類されています。

（※43）https://www.seattletimes.com/business/amazon/amazon-has-sold-more-than-11-million-echo-devices-morgan-stanley-says/

（※44）https://robotstart.info/2017/10/13/smart-speakers-sales-2017.html

（※45）http://phx.corporate-ir.net/phoenix.zhtml?c=176060&p=RssLanding&cat=news&id=2318860

（※46）http://jp.wsj.com/public/page/0_0_WJPP_7000-326836.html

（※47）System On Chip

（※48）https://www.qualcomm.com/news/releases/2016/01/05/qualcomm-announces-smart-home-reference-platform-utilizing-powerful

（※49）http://www.radiocentre.org/wp-content/uploads/2017/05/Getting-Vocal-Final-Report-Web.pdf

（※50）http://www.businessinsider.com/amazon-echo-most-used-features-2016-10

（※51）https://www.statista.com/chart/9579/smart-speaker-use-cases/

（※52）文字情報に加えて、声のトーンや音量などにも情報が含まれるということ。例えば「何か音楽かけて」という文字情報に加えて、声に含まれる感情を分析すれば、どういう音楽を掛けるべきかのヒントが得られるかもしれません。この点には、human agent interaction における示唆深い研究報告が数多く有りますが、本稿のテーマから外れるので省略します。

（※53）https://www.hellogbye.com/

（※54）https://www.amazon.com/Amazon-Echo-Dot-Portable-Bluetooth-Speaker-with-Alexa-Black/dp/B01DFKC2SO より12月15日調べ 29.99米ドル

（※55）https://s3-us-west-1.amazonaws.com/voicelabs/report/vl-voice-report-exec-summary_final.pdf

（※56）CC自体はWeChatでの成功を端緒とし、チャットアプリの爆発的普及に伴って言われ始めた概念です。2016年がCC元年とも言われていますが、そういったアプリ上で購買が完結するという状況を主に指しているものです。しかしながら、その技術背景は本文でも述べている通りであり、新幹線自動券売機くらいの対話性能に留まっているため、2017年現在はそれほど大きなインパクトをもたらしてはいません。

（※57）https://www.theverge.com/circuitbreaker/2017/3/16/14948696/google-home-assistant-advertising-beauty-and-the-beast

（※58）造語です

（※59）この点がスマホアプリとは異なる点です。ユーザーの検索行動がVPA側に丸バレだとしても、VPA対応しない方がもっと問題という二律背反があるのではないでしょうか。

（※60）https://gateboxlab.com/

（※61）発話コーパス、発話内容を大規模に集積、構造化したもの。

藤野真人
フェアリーデバイセズ株式会社　代表取締役

1981年埼玉県生まれ。2005年東京大学農学部生物情報工学研究室卒業、2007年東京大学大学院医学系研究科医科学専攻退学。東京大学在学中に大学発創薬ベンチャー企業の創業メンバー（研究開発担当）として立ち上げに参画。同大学院医学系研究科に進学する傍ら、同社経営体制の変更に伴い代表取締役に就任するも、大学院課程での実習中の経験から「人の心に寄り添うモノの温かさ」に気付き、大学院を中退し、自ら起業することを決意。「使う人の心を温かくする一助となる技術開発」をテーマに、フェアリーデバイセズ株式会社を2007年設立。2009年「センサーデバイスを用いた弦楽器の自律演奏」が未踏に採択される。非公式の未踏PM勝手連より「スーパーチャレンジャー認定」を授与される。