
カスタマーオンボーディングチームの塚原 一喜です。
この記事では、Treasure Data CDPを活用する上で、知っておくと便利なTipsをみなさんに紹介したいと思います。
Quely:複数行に渡ってカーソルを追加
⌥ Optionを押しながらのマウス操作で複数行にカーソルを合わせることができます。

JOINをさせるSQLを書く場合など、一括でテーブル名を入れることができ、作業効率が大幅にアップします。
テーブルのカラム情報を取得する
Treasure Data CDPの環境が出来上がるとinformation_schemaというDatabaseがあることはご存知でしょうか?
すでに活用されている方は読み飛ばしていただいて構いません。
information_schemaはTreasure Data CDPに格納されているDatabeseTable内の情報を取得したい場合にQueryをかけることができます。
SELECT column_name FROM information_schema.columns WHERE table_schema = 'DATABASE_NAME' AND table_name = 'TABLE_NAME' ORDER BY column_name
MasterSegmentの更新をWorkflowから実行する
MasterSegmentの更新をカスタムクーロンで実行したい、データのプロセッシングが完了したら実行したいといった要望が多いと思います。
実はWorkflowから実行することができる記述があります。
+kick_audience_workflow:
http>: "https://api-cdp.treasuredata.com/audiences/${master_segment}/run"
method: POST
headers:
- authorization: "TD1 ${secret:td.apikey}"
retry: true
※TreasureData CDPのTokyo Regionをご契約の場合httpオペレーターで実行するURLはhttps://api-cdp.treasuredata.co.jpになります。
master_segmentの番号は変数で設定しています。
確認方法はいくつかあるのですが、わかりやすいのは一度MasterSegmentを実行いただくと、「cdp_audience_xxxxxx」というDatabaseが作られます。xxxxxxの部分の番号を記述してください。authorizationでAPI Key(Master)を設定いただく必要があります。
セキュリティの観点からsecretでの登録を推奨致します。
AudienceStudioのセグメントプレビュー画面を使いやすくする

AudienceStudioでセグメントを設定したあとで、内包されるユーザーの詳細プレビューが確認できます。
そのカラムの1つにPageというカラムがあります。
この部分は、behaviorに設定したデータ内のtd_urlカラムを表示しています。
そのため、ここに表示したい文字列をtd_urlというカラム名で作成いただけると、上記の画面で確認することができます。
Ex.購入データなどであれば、商品名と金額を入れた値などを設定いただくと、どんな表品をどういった時系列で購入しているのかなどわかりやすいです。
referrerの前処理
流入元分析をやりやすくするために、ちょっとしたreferrerの前処理をすることで飛躍的に分析がしやすくなります。
サイトごとにどのようなサイトから流入してくるかは異なるため、それぞれの環境で実行する必要があるのですが、以下のSQLを実行いただきながら、Othersに含まれるreferrerのhostを見ながら、Case文の中に追加をしていくことで、それぞれの環境にあった前処理を作ることが可能です。
WITH
t1 AS
(
SELECT
time ,
td_client_id ,
url_extract_host(td_referrer) AS td_ref_host ,
td_referrer
FROM
YOUR_DATA_BASE
WHERE
TD_PARSE_AGENT(td_user_agent) ['category'] <> 'crawler'
AND td_global_id != '00000000-0000-4000-8000-000000000000'
AND not regexp_like(td_browser, '^(?:Googlebot(?:-.*)?|BingPreview|bingbot|YandexBot|PingdomBot)$')
AND td_host != 'gtm-msr.appspot.com'
AND td_global_id is not NULL
AND td_global_id <> 'undefined'
AND TD_INTERVAL(time, '-1d', 'JST')
),
t2 AS
(
SELECT
td_ref_host ,
CASE
--クエリを回しながらリファラで出てくるアドレスを分解して判定追加していく
--WHEN td_ref_host = 'xxxxxxxxx' THEN 'XXXXXXX'
--
WHEN td_ref_host LIKE '%google%' THEN 'Google'
WHEN td_ref_host LIKE '%doubleclick%' THEN 'Google'
WHEN td_ref_host = 'ampproject.org' THEN 'Google'
WHEN td_ref_host LIKE '%google.android%' THEN 'Android'
WHEN td_ref_host LIKE '%youtube%' THEN 'YouTube'
WHEN td_ref_host LIKE '%yahoo%' THEN 'Yahoo!'
WHEN td_ref_host = 's.yimg.jp' THEN 'Yahoo!'
WHEN td_ref_host = 't.co' THEN 'Twitter'
WHEN td_ref_host LIKE '%twitter%' THEN 'Twitter'
WHEN td_ref_host LIKE '%facebook%' THEN 'Facebook'
WHEN td_ref_host = 'l.messenger.com' THEN 'Facebook'
WHEN td_ref_host LIKE '%instagram%' THEN 'Instagram'
WHEN td_ref_host LIKE '%bing%' THEN 'bing'
WHEN td_ref_host LIKE '%docomo%' THEN 'Docomo'
WHEN td_ref_host = 'sp-web.search.auone.jp' THEN 'au'
WHEN td_ref_host LIKE '%pinterest%' THEN 'Pinterest'
WHEN td_ref_host = 'www.smartnews.com' THEN 'SmartNews'
WHEN td_ref_host = 'gunosy.com' THEN 'gunosy'
WHEN td_ref_host LIKE '%rakuten.co.jp' THEN 'Rakuten'
WHEN td_ref_host = 'mobss.jword.jp' THEN 'jword'
WHEN td_ref_host = 'jwsearch.jword.jp' THEN 'jword'
WHEN td_ref_host LIKE '%line.me' THEN 'LINE'
WHEN td_ref_host = 'antenna.jp' THEN 'antenna'
WHEN td_ref_host = 'jp.antenna.app' THEN 'antenna'
WHEN td_ref_host = 'newstopics.jp' THEN 'ニュートピ'
WHEN td_ref_host = 'newspicks.com' THEN 'NewsPicks'
WHEN td_ref_host = 'mixi.jp' THEN 'mixi'
WHEN td_ref_host = 'goo.ne.jp' THEN 'goo'
WHEN td_ref_host = 'news.goo.ne.jp' THEN 'goo'
WHEN td_ref_host = 'search.goo.ne.jp' THEN 'goo'
WHEN td_ref_host = 'green.goo.ne.jp' THEN 'goo'
WHEN td_ref_host = 'green.search.goo.ne.jp' THEN 'goo'
WHEN td_ref_host = 'news-goo-ne-jp.cdn.ampproject.org' THEN 'goo'
WHEN td_ref_host LIKE '%excite.co.jp' THEN 'excite'
WHEN td_ref_host LIKE '%nifty.com' THEN 'nifty'
WHEN td_ref_host = 'cgi.search.biglobe.ne.jp' THEN 'Biglobe'
WHEN td_ref_host = 'biglobe.ne.jp' THEN 'Biglobe'
WHEN td_ref_host = 'www.so-net.ne.jp' THEN 'so-net'
WHEN td_ref_host = '%ocn.jp' THEN 'Ocn'
WHEN td_ref_host = 'googleads.g.doubleclick.net' THEN 'GoogleAds'
WHEN td_ref_host = 'duckduckgo.com' THEN 'DuckDuckGo'
WHEN td_ref_host = 'nortonsafe.search.ask.com' THEN 'NortonSafeSearch'
WHEN td_ref_host = 'feedly.com' THEN 'Feedly'
WHEN td_ref_host = 'com.twitpane' THEN 'TwitPane'
WHEN td_ref_host = 'www.linkedin.com' THEN 'Linkedin'
WHEN td_ref_host = 'note.com' THEN 'Note'
WHEN td_ref_host = 'note.mu' THEN 'Note'
WHEN td_ref_host = 'com.slack' THEN 'slack'
WHEN td_ref_host LIKE '%popin.cc' THEN 'popIn'
WHEN td_ref_host LIKE '%logly.co.jp' THEN 'LOGLY'
WHEN td_ref_host = 'transition.meltwater.com' THEN 'Meltwater'
WHEN td_ref_host = 'may.2chan.net' THEN 'ふたばちゃんねる'
WHEN td_ref_host = 'ameblo.jp' THEN 'ameblo'
WHEN td_ref_host = 'prtimes.jp' THEN 'PR TIMES'
WHEN td_ref_host = 'prtimes-jp.cdn.ampproject.org' THEN 'PR TIMES'
WHEN td_ref_host = 'trilltrill.jp' THEN 'TRILL'
WHEN td_ref_host = 'locari.jp' THEN 'Locari'
WHEN td_ref_host = 'radiko.jp' THEN 'radiko'
WHEN td_ref_host = 'rajiko.jp' THEN 'radiko'
WHEN td_ref_host = 'news-radiko-jp.cdn.ampproject.org' THEN 'radiko'
WHEN td_ref_host = 'b.hatena.ne.jp' THEN 'Hatena'
WHEN td_ref_host = 't.pia.jp' THEN 'PIA'
WHEN td_ref_host = 'www.spotifypremium.jp' THEN 'Spotify'
WHEN td_ref_host LIKE '%wikipedia.org' THEN 'wikipedia'
WHEN td_ref_host = 'www.inoreader.com' THEN ' Inoreader'
WHEN td_ref_host = 'rsch.jp' THEN 'リサーチパネル'
WHEN td_ref_host = 'tmall.wamgame.jp' THEN 'Tモール'
WHEN td_ref_host = 'aramame.net' THEN 'あらまめ2ch'
WHEN td_ref_host = 'uzulife.biz' THEN 'NAPBIZ'
WHEN td_ref_host = 'ad-contents.jp' THEN '簡単レシピ動画まとめ'
WHEN td_ref_host = 'app.couples.lv' THEN 'COUPLES'
WHEN td_ref_host = 'pokemon-matome.net' THEN 'ぽけりん'
WHEN td_ref_host = 'bakusai.com' THEN '爆サイ.com'
WHEN td_ref_host = 'm.one.impact-ad.jp' THEN 'MarketOne'
WHEN td_ref_host = 'p-birthday' THEN 'Petit Birthday'
WHEN td_ref_host = 'ast.client.jp' THEN 'DIVINATION★LINK'
WHEN td_ref_host = 'toutiao.com' THEN '今日头条'
WHEN td_ref_host LIKE '%magazine-data.com' THEN 'ファッション雑誌ガイド'
WHEN td_ref_host = 'patentsalon' THEN 'パテントサロン'
WHEN td_ref_host LIKE '%macromill.com' THEN 'macromill'
WHEN td_ref_host LIKE '%msn.com' THEN 'msn'
WHEN td_ref_host = 'taboola.com' THEN 'taboola'
WHEN td_ref_host = 't.umblr' THEN 'tumblr'
WHEN td_ref_host LIKE '%outbrain' THEN 'Outbrain'
WHEN td_ref_host = 'search.myway.com' THEN 'MyWay'
WHEN td_ref_host = 'search.ask' THEN 'ask'
WHEN td_ref_host = 'workplace' THEN 'workplace'
WHEN td_ref_host = 'surveymonkey' THEN 'surveymonkey'
WHEN td_ref_host = 'sansan.com' THEN 'sansan'
WHEN td_ref_host = 'cybozu.co.jp' THEN 'cybozu'
WHEN td_ref_host LIKE '%surveymonkey.com' THEN 'surveymonkey'
WHEN td_ref_host = 'www.chance.com' THEN 'チャンスイット'
WHEN td_ref_host = 'mv-sp.gsj.bz' THEN 'ミュージック ヴィレッジ'
WHEN td_ref_host = 'speee-ad.akamaized.net' THEN 'SPEEE AD'
WHEN td_ref_host = 'content-click.amanad.adtdp.com' THEN 'adtech studio(CA)'
WHEN td_ref_host = 'www.knshow.com' THEN '懸賞生活'
WHEN td_ref_host = 'news.mixi.jp' THEN 'mixiニュース'
WHEN td_ref_host = 'www.arugoworks.net' THEN 'Arugoworks'
WHEN td_ref_host = 'www.ghibli.jp' THEN 'スタジオジブリ'
WHEN td_ref_host = 'news.mynavi.jp' THEN 'マイナビニュース'
WHEN td_ref_host = 'blog.livedoor.jp' THEN 'ライブドアブログ'
WHEN td_ref_host = 'www.e-nexco.co.jp' THEN 'NEXCO東日本'
WHEN td_ref_host = 'www.ken-kaku.com' THEN '懸賞当確'
WHEN td_ref_host = 'news.ameba.jp' THEN 'アメーバニュース'
WHEN td_ref_host = 'news.livedoor.com' THEN 'ライブドアニュース'
WHEN td_ref_host = 'itest.5ch.net' THEN '5ちゃんねる'
WHEN td_ref_host = 'radiotuner.jp' THEN 'ラジオ局周波数 全国版'
WHEN td_ref_host = 'www.yoku-ataru.com' THEN 'よく当たるコム'
WHEN td_ref_host = 'www.1101.com' THEN 'ほぼ日刊イトイ新聞'
WHEN td_ref_host = 'admin-official.line.me' THEN 'LINE'
WHEN td_ref_host = 'lineblog.me' THEN 'LINEブログ'
WHEN td_ref_host = 'com.Slack' THEN 'slack'
WHEN td_ref_host LIKE '%toutiao.com' THEN '今日头条'
WHEN td_ref_host LIKE 'woman-excite-co-jp%' THEN 'ウーマンエキサイト'
WHEN td_ref_host = 'lin.ee' THEN 'LINE'
WHEN td_ref_host = 'ima.goo.ne.jp' THEN 'goo いまトピ'
WHEN td_ref_host = '' THEN 'Non Referer'
WHEN td_ref_host is NULL THEN 'Non Referer'
ELSE 'Others'
END AS td_ref_name
FROM
t1
)
SELECT
td_ref_host ,
td_ref_name ,
COUNT(*) AS cnt
FROM
t2
WHERE
td_ref_name ='Others'
GROUP BY
1,2
ORDER BY
cnt DESC
今回はTreasure Data CDPの活用をよりやりやすくするためのTipsを紹介させていただきました。
