【インタビュー】今さら聞けないAIのキホンと将来の可能性…サイバーエージェントのデータサイエンティスト谷口和輝氏に聞く



スマートフォンアプリ業界に身を置く方々に話を伺い、2016年の市場動向と2017年のトレンドを読み解く年始恒例企画「ゲームアプリ市場のキーマンに訊く2016-2017」。今回は、サイバーエージェントアドテク本部AI Lab所属のデータサイエンティストである谷口和輝氏(写真)にインタビューを行い、最近にわかに話題のAIについてその基本から、今後のビジネスでの利用可能性について話を聞いた。


■谷口和輝氏プロフィール
2014年サイバーエージェント入社。アドテク本部にある、AI Lab所属のデータサイエンティスト。新卒1年目の時に、アドテクノロジーに特化した社内新規事業コンテンストにて優勝し、アドテク本部に所属、その後AI事業の立ち上げに従事。現在は、ダイナミックリターゲティングのDSP「Dynalyst(以下「ダイナリスト」)のロジック開発や、広告クリエイティブの自動生成などの研究開発を行う。


 
■AI、機械学習、ディープラーニングとは

――:よろしくお願いいたします。最近、人工知能が話題ですが、どういったものなのでしょうか。

僕は、人工知能とは、主に人間の知能を機械化していくもの、だと認識しています。みなさんが想像するような、ゲームや映画に出てくる「人工知能」とイメージはほぼ変わりはないですね。近年では、ディープラーニングの研究が飛躍的に進み、囲碁や将棋の対局で大きな成果を出せるようになっただけでなく、画像を自然に作り出すといったこともできるようになりました。

概念的には、人工知能が最も広い分野で、その中に機械学習やディープラーニングがあるというイメージです。機械学習は、文字どおり機械が学習することですので、ディープラーニングと同様、データを与えて学習させることを繰り返し、予測などに活用していく、というものです。

ただ、機械学習といっても色々あります。例えば、広告をクリックするか・しないか、のようなラベルを持つデータに対して予測を行なう「教師あり学習」や、教師あり学習のようなラベルがなく、大量のデータの中からそのデータの特性に基づいて結果を返す「教師なし学習」、ある環境下において報酬が最大となる最適な行動を決定するように学習する「強化学習」があります。

また、ディープラーニングとは、「ニューラルネットワーク」(人間の脳の神経回路の仕組みを模したモデル)をさらに多層化したアルゴリズムです。ニューラルネットワークは、もともと入力層・隠れ層・出力層の3層のものが主流でしたが、ネットワークの構造の多様化、多層化することによってより抽象的なデータの表現ができるようになりました。



――:これまでAIは存在していましたが、それとの違いはどういったところにあるのでしょうか。

これまでのAIと比較しても、技術的変化は少ないと考えていますが、近年注目を集めている背景としては、データの種類や量が飛躍的に増えていることが大きいと思います。これまでデータとして扱えなかった事象が、データとして扱えるようになる、それはすなわち計算機で“学習”できるようになる、ということです。

更にCPUの性能の向上や、クラスタリング、GPU(Graphics Processing Unit)による並列処理によって膨大なデータをより高速で処理できるようになったことも後押ししていると思います。そしてなにより、企業において、データをビジネスに活用することの重要性が増していることも見逃せない変化かと思います。

このような背景の最中、突如登場したのがディープラーニングです。21世紀の五本指に入る画期的な発明と言われています。画像認識の領域では、ILSVRCという画像認識のコンペティションにおいて、2012年にディープラーニングを用いた手法が登場し、認識精度を飛躍的に高めて優勝しました。画像以外にもSiriやGoogle翻訳などにみられるように、自然言語処理の分野でも広く使われています。



 
■AIのマーケティングへの利用(現状)と可能性

――:AIのマーケティングへの利用状況をお聞きしたいのですが。

現在、当社が開発・提供しているスマートフォン特化型ダイナミックリターゲティング広告「Dynalyst(ダイナリスト)」のRTBにおいて機械学習を活用しています。RTBとは1インプレッションに対して、リアルタイムで入札を行う仕組みのことです。メディアにユーザーが来訪したとき、そのユーザーが来たという情報がSSPを経由して各DSPに送られます。そしてDSPがそのユーザーに対して入札価格を決め、どの広告をいくらで入札するかを決めます。各DSPからの入札はセカンドプライスオークションに基いて勝者と落札価格を決定し、ユーザーに対して広告を配信します。

「ダイナリスト」では、ユーザーが来たときに発生するリクエストが、秒間で平均、数万件届きます。これほど大量のリクエストに対して適切に価格を決定することは、人間の手では不可能なので、ここに機械学習を利用するのがDSPのポイントになります。このユーザーだったらクリックしやすい、この広告商品だったら購買しやすい、といった状況をあらかじめ機械学習で予測し、それに基づいて最適な入札価格を決定、入札していくことになります。

 


――:ゲームのアプリマーケティングに関して、どのような状況にあるのでしょうか。

ゲームのアプリマーケティングにおいては、2つのパターンがあると考えています。1つは新規ユーザー獲得です。未ダウンロードユーザーに対し、アプリをインストールしてほしいと訴求するものです。2つ目は、リエンゲージメント広告と呼ばれるものです。リエンゲージメント広告とは、アプリはダウンロードしているが、最近アプリを起動していないユーザーに対して、再度の利用を訴求するものです。「ダイナリスト」は、後者のリエンゲージメント広告をダイナミックリターゲティングで配信しています。ユーザーひとりひとりのゲーム状況に応じて、ログイン日時やミッション達成率などの情報を広告クリエイティブに活用することで、ユーザーの復帰やログイン頻度を上げることができます。


――:なるほど。実際に広告配信しているデータを活用し広告に対する反応を機械学習によって学習させ、どのような訴求がユーザーに響きやすいのかを予測する。そして、各々のユーザーに対して効果的なメッセージやクリエイティブを見せることで、復帰させる、という理解でよいのでしょうか。

はい。現在あるクリエイティブの中から、どのユーザーに、どのクリエイティブで訴求するか、ということも機械学習で決めています。


――:すごく難しそうですね。

やっていることはシンプルです。例えば、広告配信データなどを解析し、あるメディアから起動したユーザーはログイン率や課金率が高い傾向にあるということが機械学習で推測できるわけです。他にも、最終ログインからの日時が浅く、プレイ時間が長い人の方が復帰しやすい、という推測も機械学習が代弁してくれます。ユーザーに対して、現在ある膨大な量の広告や訴求から最も効果的なものを推定してくれるのは機械学習を活用するひとつのポイントとなります。

しかし、機械学習だけではやりきれないことも多くあります。マーケティングにおいて重要なのは、誰に何をどう売るか、という戦略部分を考えることです。私たちは、ユーザーが戻ってくれるような訴求や新たしい広告とはどういうものなのかを常に考えています。チームのメンバー同士で、実際に同じゲームで遊んで、ゲームの魅力や面白さを見つけつつ、脱落しそうなポイントなども想像して訴求ポイントを考えます。本当に難しいのは、この「どんな訴求をすればユーザーが戻りたくなるのか」を考えることです。そこは機械学習を使うのではなく、私たち人間が思考すべき部分だと思っています。マーケティングにおいては、機械学習が担う部分と、人が担う部分を使い分けることが重要だと思っています。


 
■AIのメリットは単純作業からの解放

――:機械学習のメリットはどういったところにあるのでしょうか。

機械学習のメリットは、大量のデータからある知見を得られることや、24時間365日働けることです。例えば、先ほどお話したRTBについては、秒間で数万もリクエストが出てくるので絶対に人では処理できないですよね、そこに機械学習を使うことで、膨大なリクエストに対し、最適な入札を瞬時に処理することができるんです。

また、従来ですと、こういうメディアだとCVRが高くなるから、そこだけ入札価格を上げる、といったアプローチをとっていました。しかし、実はメディアのCVRが高いわけではなく、“そのメディアにそういうユーザーがそのタイミングで来ているからCVRが高くなる”わけですよね。メディアという広い範囲で仕分けするのではなく、このユーザーがこのメディアにこのタイミングに来ているからCVRが高くなるであろうと推定することが、24時間365日ずっと可能になるのは、大きなメリットになります。

これは私のスタンスですが、機械学習を使うのは最終手段だと思ってます。使ったらすごく楽になるようなイメージがありますが、なんでも機械学習を活用すれば良いわけではないと思うんです。現在の機械学習やディープラーニングのブームからすると逆行していると思われることもあるかもしれませんが、特にディープラーニングは、専門家からしても高度な技術です。大量のデータが集まっている必要がありますし、設計するにあたって設定するパラメータが多いという問題もあります。いろいろな手法が出てきて、解決しつつあるところもありますが、できるだけシンプルに問題を解決するようにしたいと考えています。

個人的な意見として、「研究」では問題を難しく解決することがひとつの美学になっていることがあると思うのですが、マーケティングなどビジネス現場で使う時、問題を難しく解く必要はありません。データの分析でぱっと決め打ちできるようならそれでいいと思いますし、それで不十分であるとわかったときに機械学習を使えばいいと思います。高度なデータが必要で、揃っている時、初めてディープラーニングを使えばいいと考えています。

実際、アドテクスタジオでも、ディープラーニングの利用例が多いわけではありません。私自身としてはもちろん、もっと使いたいと思っていますが、それはあくまで技術者目線です。ビジネス目線ではSVMやロジスティック回帰で十分なときも多いので、ビジネスに応じて手法を使い分ける必要があります。そこを見極めることが私の仕事と考えています。



――:AI全般のメリットとしては、人間がいわゆる作業から解放される点をあげる方もいますよね。

そうですね。単純作業はだいぶ減る印象がありますね。例えば、「CVRの予測」をひとつとっても、これまでは、エクセルでクロス集計を作り、CVRの高いものを見つけ、入札価格を調整するなどの作業が発生していましたが、機械学習を活用することで、CVRが高いものが瞬時にわかり、更にそこに対してどうすべきかを考えることに時間をかけることができます。ダイナリストではこういった機能が既に備わっているので、単純な作業に時間を使うことは少なくなってきていますね。


――:AIの導入を検討されたのはいつ頃からでしょうか。入社されたときには始まっていたのですか?

私がサイバーエージェントに入社したときはまだ、今のAI LabのようにAIに特化して導入を行うチームはありませんでした。私を含む新卒3人でやろうと言い始めて、2014年の社内のプロダクトコンテスト「アドつく」に提案し優勝したのがきっかけで、本格的にやらせてもらうことになったのです。新卒でここまでチャンスをくれる会社はなかなかないと思うので、僕としてもとてもありがたかったです。

当初は、社内での説明も難しく、「機械学習って何?」というところから始まりました。「こういうことができる」と説明するだけではなく、事例の積み重ねも大事と考え、配信の一部を使わせてもらい、機械学習を取り入れたロジックでA/Bテストを行っていきました。

その結果、機械学習の認知度や理解が以前に比べ社内で深まってきているのではないかな、と感じています。最近ではエンジニアだけではなくビジネスサイドとのコミュニケーションにも変化が見られ、例えば、「機械学習では昔のデータ活用が必要」とビジネスサイドが理解してくれていることで、「先週は広告を配信していなかったんだけど、今日から配信開始しようと思ってる。その場合、CVR予測はうまくいきそう?」と、機械学習を考慮した、より建設的な話し合いが出来る場が多くなりました。

さらに、機械学習の使い方への理解が深まることでそれに応じて人が労働集約型の作業から開放されていくことも大きいと思っています。広告分野はデータが多いので、機械学習を利用した方が、人が作業するよりも精度が高いことが多いです。結果的に、AIに任せられるところは任せ、それ以外の部分に時間を割くことができる環境をつくっており、機械学習を取り入れたことで、組織全体のビルドアップに貢献できていると感じています。



――:人工知能や機械学習を使うことで、マーケティング・広告はどのように変化していくとお考えですか?

例えば、化粧品をターゲティングする際、まっさきに考えるのは女性にアプローチすることだと思いますが、おそらくそういう時代は終わると思います。化粧品は、女性だから買うわけではないですし、男性でも買う人もいます。買う人の中でも買いやすい人とそうでない人もいます。従来の広告というのは、女性20代などとセグメント化して広告を配信していましたが、「ダイナリスト」でもやっているように「この人だからこういう広告を出す」というマーケティングになっていくと見ています。

ターゲットになりうる人は、1000万人、2000万人を超える人は珍しくないですし、機械学習や人工知能を使うことで1人1人の状況に合わせたマーケティングが可能になります。若い女性だから化粧品の広告を出すのではなく、そこからさらに進み、この人にこのタイミングだから購入してくれる可能性が高いので広告を配信する、というスタンスになるでしょう。

昨今のIOTの普及で、冷蔵庫のデータが取れる時代がくると言われています。例えば、冷蔵庫の中に牛乳がなくなっていたら、それに合わせて商品が届けられるようになる時はすぐくるでしょう。データの種類が増えることで、できることも増えていくはずです。これからはデータの取り方や、プライバシーポリシーがどうなるかなどの法的整備も含め、大きな波を迎えると思います。こういった環境が整った時、技術のシーズをいかに保有しているかが競争力の鍵を握ると考えています。



――:データは取られるものではなく、データを提供することでメリットを感じられるようにすることも重要かもしれませんね。

そうですね。データに良くも悪くも価値がでていますので、データを提供することでメリットが得られるようにすることは大事です。メリットを感じる人もいるでしょうが、自分の家の冷蔵庫の情報を他人に見せることを嫌がる方も当然多いはずです。そういう方にデータを提供する価値やメリットを示していくことも、データサイエンティストや研究者がやるべきことなのかもしれません。


――:ありがとうございました。

 
(編集部 木村英彦)
株式会社サイバーエージェント
http://www.cyberagent.co.jp/

会社情報

会社名
株式会社サイバーエージェント
設立
1998年3月
代表者
代表取締役 藤田 晋
決算期
9月
直近業績
売上高7202億0700万円、営業利益245億5700万円、経常利益249億1500万円、最終利益53億3200万円(2023年9月期)
上場区分
東証プライム
証券コード
4751
企業データを見る