カスタマーオンボーディングチームの塚原 一喜です。
オンボーディングチームの塚原です。今回は、ユーザー分析をする上で指標の一つになる「エンゲージメントスコア」について解説いたします。
エンゲージメントスコアとは
SNSの指標などでエンゲージメントというワード自体はマーケターにとって馴染みが深いワードになっていると思いますが、各サービスがエンゲージメントとして提示している数値が、どのようなロジックで作られているものなのか気にして考えたことがある人はそう多くないと思っております。ファイナンシャル・タイムスではかねてよりRFVでのユーザーエンゲージメントの指標化に取り組みながらビジネス推進を行っています。
彼らにとってのエンゲージメント・スコアとは、RFV(Recency, Frequency, Volume)をユーザーごとに1から100のスケールでつけたものとのことです。
Recency – どれだけ最近サイトに訪れたか
Frequency – どれだけ頻繁にサイトに訪れるか
Volume – どれだけの記事を読んでいるか
広告から収入をもとにしたビジネスモデルだと、クリック数やページビューが重要な指標ということになります。これは、RFVでいうところの、Volumeの部分になります。
Qiita「1888年創業のイギリスの老舗メディア企業がデータ使って改善サイクル回したら調子がいいという話」
このモデルは、ECや購入分析を行っているデータサイエンティストの皆様には馴染みの深い、RFMモデルに近い考え方で、メディアにおけるユーザーエンゲージメントを可視化していく手法です。
エンゲージメントのスコア化
エンゲージメントスコアはすでにさまざまなメディア企業で導入されており、代表的な例として日経新聞社が取り組んでいます。日経新聞では、F√Vという計算式でエンゲージメントをスコア化しています。ファイナンシャル・タイムスで計算ロジックに入っていた「Recency」が入っていませんが、これはメディア特性などを加味して独自のロジック化をしていると思います。
今回ご提案させていただくRFVモデルのサンプルロジックは、あくまでエンゲージメントスコアのベースであり、計算ロジックはサイト特性ごとにロジックは変わっていくと考えておりますので、その辺りは柔軟に変更していただければと思います。
https://webtan.impress.co.jp/e/2020/10/22/37714
出典:Web担当者Forum「日経電子版を成長に導いたデータ活用術。DXを阻む4つの壁と乗り越え方」
Treasure Data CDPでのエンゲージメントスコア算出サンプル
このサンプルは、上記の計算式を元に構成されています。
サンプルWorkflow
https://github.com/tsukaharakazuki/td/tree/master/proc_l2_engagement_score
p0001_calc_score.sqlにおいて、まずはcookieごとのRFVを計算しています。今回のサンプルでは過去28日間に期間を絞って分析しています。これは、あまり古い時期の行動を加味しても、今のエンゲージメントとは乖離が出てしまうという考え方から期間を絞っています。
SELECT ${media.key_id} AS device_id, '${media.key_id}' AS id_type, CAST( TRUNCATE((MAX(time)- TO_UNIXTIME(now()))/ 86400) AS INT) AS recency, COUNT(DISTINCT TD_TIME_FORMAT(time,'yyyy-MM-dd','JST')) AS frequency, COUNT(DISTINCT td_path) AS volume
上記SQLで算出したrecency、frequency、volumeを以下のロジックでスコア化しています。
log10(frequency * SQRT(volume)* (28 + recency + 1)) AS engagement_score
スコア化ロジックの説明をさせていただきます。
LOG10
対数にしています。この処理はスコアの重みを変えていると理解してください。わかりやすく説明すると、1ページビューという事象において、特定ユーザーが0PVか1PVかどうかという違いは明確な違いがあると考え、10,000PVと10,001PVの違いは誤差であると考えます。そういった時に、数値が少ない時の差は大きな重みとして、数値が大きい時の差は小さな重みとしてスコア化するロジックと考えてください。
frequency
このロジックではフリークエンシーはそのままの数値で掛け合わせています。
SQRT(volume)
閲覧記事数は、多くの記事コンテンツを保有する企業に合わせて、平方根で丸める処理をしています。保有記事数が少ない企業サイトなどで採用する場合はSQRTを外してもいいと思います。
(28 + recency + 1)
リーセンシーは、1次集計段階だと必ずマイナスの値で算出されます。そのため正の数への変換、及び0になることを避けるため、今回のサンプルでは集計期間が過去28日なので、28+1を足しあげることで、この数値が1から29になるように調整しています。
活用方法イメージ
エンゲージメントスコアの考え方は、メディア企業での活用イメージは湧きやすいですが、ECサイトや、BtoB企業サイトなどでも活用いただけると考えています。
メディア企業向け活用
- サブスクリプションの離反防止・閲覧促進分析
- ロイヤルユーザーの行動分析
- 広告レポートへの活用
- 記事制作データ活用
ECサイト向け活用
- エンゲージメントスコアごとの関心商品分析
- 広告出稿セグメント活用
- 商品開発・仕入れ活用
BtoB企業向け
- ログイン施策と活用したHotリード抽出
- リードナーチャリング活用
そのほかさまざまな活用方法が考えられると思います。導入をご検討の際は、担当カスタマーサクセスまでお問い合わせください。