前回、前々回とデータ分析がなぜ重要であるか、ユーザーを理解した上でゲーム運営に活かすコツを紹介した。しかし、実際のゲーム運営の場においては、データ分析を行おうにも、複雑で根深い課題が存在する。
今回は、その複雑かつ根深い課題の一つである「データない」「データが使えない」問題を取り上げ、その解決の糸口を紹介したい。
この問題は、データに関連する一連のシステムについては「レガシーシステム」、データの処理、形式などを総称して「バッドデータ」等として広く一般にも認知されてはいるものの、その解決の具体的な糸口は掴み切れていない。なぜなら、この手の変革を経験した組織や個人が多くなく、さらに個別具体性が高く、組織内部の環境も理解しなければならないからだ。
しかしこの変革に遅れをとると、さらに意思決定の難度が高くなり、機会損失も発生する。一定の埋没コストを考慮しながら、一刻も早く柔軟で拡張性のある、データ分析基盤や体制を構築しよう。(執筆者:シンキングデータ社)
1.「データがない」「データが使えない」問題
データが21世紀の石油を言われるようになってから久しい。一方で、経済産業省が2018年に公表した「DXレポート ~ITシステム『2025年の崖』克服とDXの本格的な展開~」によると、既存システムのブラックボックス状態を解消しつつ、データ活用ができない場合、年間で12兆円の損失を被ると警鐘を鳴らした。同省が提示する課題を解決する際のポイントを噛み砕いてみると、以下のようになる。
- 既存システムの問題点の把握と克服の道筋を描けるか
- 各関係者がその道筋に共感して協力できているか
- 経営層が意思決定を行えるか
- 開発会社等との責任分担や契約関係をどのように構築するか
- それらを推進する人材はいるか
このブラックボックス状態のITシステムは今後も、維持管理費が高騰し、技術的負債が増大する。また、保守運用者の不足等で、セキュリティリスク等が高まる。これらがあったとしてもその解消に動けないほど、複雑で根深い課題であるといえる。
なお、ここでいう「データが使えない」というのは「分析ができない」という意味ではなく、「データを分析に用いることができない」という意味であり、「データ分析ができない」は次回で概要とその解決に糸口を紹介する。データ分析をめぐる問題群の関係性をまとめると以下の通りになる。
図1:データ分析をめぐる課題の関係性
1.1 「データがない」問題
まずは「データがない」問題を考えてみよう。「データがない」と言っても、そのほとんどは「データが(使え)ない」と同義であることが多い。一方で、本当に「データがその場に存在しない」という場合もある。それは以下のような場合においてである。
図:「データない」問題の類型
技術的課題の解決策を分解していくと「データが使えない」問題になり得る。それ以外の点は他組織と利用者である個人との間の関係性が起因しており、意思決定としては難度が非常に高いものになる。後述するが、データを取得する際には以下のビジネス価値を創出することができるか、を念頭にデータ取得のプランを立てることが必要だ。
であるから、経営層やプロデューサーは、データ分析に関連する問題を、投げやりに指示せず、道筋を検討し決定しなければならない。その際には前回、前々回の記事を見直し、重要性や方向性を理解した上で、各ステークホルダーとの対話をおこなってほしい。
1.2 「データが使えない」問題
次に「データが使えない」問題について考えてみる。こちらはデータ分析基盤において「データを分析に用いることができない」という観点を考えている。
「データが使えない」問題の類型としては以下のようなものが考えられる。
図:「データが使えない」問題の類型
形式の不統合や識別子の不在といった課題は、長らく課題として認識されてきた。一方でデータの価値が希釈化していってしまう課題も存在する。その理由の一つが多重集計によるものだ。データとして出力された数字は、その集計の際に不要となった情報は削がれ、扱いやすくなる一方で、付随的な情報を参照しにくくなってしまい、深掘り分析が困難になる。つまり血が通わない数字になってしまう。例えば、以下のような例が考えられる。
- DAUを集計する
- 集計されたDAUを眺めると、ログイン頻度別(ユーザー層別)でDAUを分解したいと要望が上がる
- しかし、集計されたDAUは「この日にアクティブだったユーザー数は〇〇である」という情報であり、もちろんログイン頻度は削ぎ落とされており、集計済みの数字からはログイン頻度別で分解することはできない
- そのため、再度集計ロジックを定義付け、再度初めから集計しなければならない
これらが重層的に発生すると、さらに複雑化し、分析の速度と質も面から機動力が低下し、価値が希釈化してしまう。
さらに重複と欠損による価値の希釈化も考えられる。これは分析による洞察の精度という観点はもちろん、理由がわからずに発生するとデータに対する信頼も低下してしまい、分析を行おうとするモチベーションが低下する。
2.解決の糸口
このような「レガシーシステム」「バッドデータ」のような問題に直面した場合には、ビジネス価値の創出を起点としたデータ分析基盤の構築をすれば良いと安直に思えるのだが、それができたら、苦労しない。これまで行われていない背景を認識しなければならず、明確な解決のプロセスを見出さなければならない。
戦略という方向性なしに、人々は意思決定もできず、自発的な言動を促すことはできない。ここでは一般論として、システムの再構築という比較的大きな投資を伴うものの障壁と、解決に向けたプロセスを紹介する。
2.1 解決までへの障壁
データ分析基盤は比較的投資額も大きく、意思決定が難しい。さらにデータを保存するという特性から、過去の経緯や歴史に縛られる経路依存性が極めて高く、必ずしも性能が優れたものが即座に採用されるわけではない。それでも不連続な環境の変化に直面する現代においては、抜本的に再構築する必要に迫られる。しかし、それが現実的でない場合も多い、以下のような場合が考えられる。
- 現行の基盤を継続利用する場合には発生し得ないコストが生じるから
a. 基盤の再構築にはコストが発生するが、再構築しなければコストは発生しない - 環境の変化や現場の声に気づかず、再構築の必要性を認識できないから
a. 市況観などのマクロ的、運用メンバーの定常的な作業のミクロ的な情報収集のプロセスが現行の基盤を基本として構築されている場合、外部シグナルを排除する傾向がある
b. 組織やステークホルダーが満足水準を超える利得を得ており、取り立てて不満がない場合、あえて再構築する動機付けは失われる - 現行の基盤を継続利用しようとする強い力が作用するから
a. 現行の基盤にする責任を認めることの心理的コストが高い
b. 「今度こそは上手くいく」と期待を持つほうが心理的コストが低い
c. 環境変化を認識した場合にも、従来慣れ親しんだ現行の基盤を選択する傾向が強い
2.2 解決のプロセス
前述のような障壁を乗り越え、よりよりデータ分析基盤を再構築していくためには、どのようなプロセスを踏む必要があるだろうか。一般的には以下のようなものがある。
2.2.1 必要性の認識
まずはプロデューサーや経営層によって再構築の必要性を認識しなければならない。そのためには、よりリッチな情報を獲得し、その意味するところを解釈しなければならない。多様な解釈を導き出せる程度の高く、潜在的多義性が高い情報を持つリッチな情報には、以下のような効用がある。
- ハッピーストーリーを伝える
- もし再構築することで、より良いことが発生する
- バッドストーリーを伝える
- もし再構築をしなかったら、悪いことが発生する
私の経験上、リッチな情報とは現在の日常業務では触れることがない場所に存在していることが多く、組織外であれば「事例」を、組織内であれば「運用メンバーの声」(あなたがプロデューサーである場合)や「経営層の声」(あなたが運用メンバーである場合)であることが多い。
もしあなたがプロデューサーで「運用メンバーの声」をよく収集して理解していると思うのであれば、1日運用メンバーの業務を試してみると良い。往々にして運用メンバーの声は既定の情報処理プロセスによって加工されて、プロデューサーへ伝わっているものであり、これもまた不都合なものが削ぎ落とされている場合が多い。
2.2.2 要件の定義
次にリッチな情報から得られたものから、必要と思われる要件を抽出し、それぞれに優先度をつける。方向性としては、良いものは採用し、悪いものは改善する。このプロセスにおいては、実現可能性を考えず無邪気に優先度づけをおこなって良い。
前々回で伝えた通り、この分野においてグローバルで実績がある「成功の方程式」が転がっており、パッケージ・ソフトウエアとして販売されている場合がある。この場合においては採用しない手はない。
2.2.3 実現可能性の精査
最後に要件と優先度づけが行われた理想のデータ分析基盤に関して、経営資源の観点から実現可能性を精査していかなければならない。
3.ThinkingDataを用いたデータ基盤構築とデータルールの確立
ThinkingDataが提供するThinkingEngineはそれらのニーズと課題を解決するのに、最適な分析プラットフォームだ。
シンキングデータ株式会社とは
シンガポールに本社を構え、ゲームに特化したデータ分析ソリューションを提供しているグローバルテクノロジー企業。2015年創業から900社・5000ゲームタイトル以上のデータを分析。2022年8月、国際化戦略の重点市場として、日本への本格参入を発表。ツールに留まらずゲームにおけるデータ分析のメソッドやナレッジからサポートサービスまで提供している。
3.1 「データがない」問題の解決
「データがその場に存在しない」という場合においては、2つの解決策を提示している。
- データ収集プランの提出
a. ThinkingEngineでは(以下、TEという)では、これまでの実績とノウハウに基づき、それぞれのアプリゲームに関してデータ収集プランを提出している。どのようなログを、どのようなプロパティで、どのようなタイミングで、どのようなデータ形式で取得するかを、当該アプリを実際にプレイしながら、実績とノウハウに基づき網羅的に設計する
- サードパーティデータとの統合
a. プロモーション関連のデータ(広告計測データ等)がアプリ内の行動データと統合することや、アプリ内広告に関しても統合することができる
3.2 「データが使えない」問題の解決
「データが使えない」という場合においては、以下のような解決策を提示している。
- データルールの提供
a. データ形式の統合とスキーマフリー設計
b. ユーザー識別ルールの提供
c. 2枚のデータテーブル
d. データ検証プロセスの実行
データルールとはデータをどのように保持するか、そしてデータをどのように活用するかの基盤となる。そのためデータルールが揺らぐと、データが崩れ、分析手法や業務プロセスといった全ての要素の変更が必要になる。
実際には、作成者の離職などが原因でデータルールが不明瞭になってしまう場合も多く、データ分析に適さない形になっていることも多い。そのため、データルールを統一し、データ分析に適した形で決定しておくと良い。
4.まとめ
今回は、「データが使えない」問題をどのように解決するかを、データ分析基盤の再構築という観点でまとめた。それぞれの観点でポイントは以下の通り。
- 既存システムのブラックボックス状態は、技術的負債となって事業者にとって重荷になっていると指摘されている
- データ分析をめぐる問題群は大きく「データ基盤の課題」と「人材・スキル・組織の課題」に区分できる
- 「データがない」問題は技術的、組織的、規律で区分できる
- 「データが使えない」問題は、形式の不統合、識別子の不在、多重集計による価値の希釈化、重複・欠損による価値の希釈化などの類型がある
- これらの課題を解決しようにも意思決定が重く、乗り越えなければならない障壁も高く分厚い
- 解決に向けたプロセスとしては、必要性の認識、要件の定義、実現可能性の精査を踏まなければならない
今後も、「ゲームデータ分析道場」ではゲーム開発や運営に役立つ分析手法や考え方を公開予定だ。
ThinkingData特設ページにて今後の記事も掲載予定となり、その他のコンテンツも掲載されているので気になる人はチェックしてみよう。