本日はTreasure Data CDP導入初期のお客様に向けた、Treasure Data CDP内での「E-mailアドレス」「会員ID」等の情報をセキュリティ性高くご活用いただける「ハッシュ化」対応についてご紹介させて頂きます。Treasure Data CDPへ複数のデータソースからデータを収集し、蓄積、統合。そして各種施策に連携していく過程において、「E-mailアドレス」「会員ID」を「統合Key」に利用されている会社も多いかと思います。また、施策活用ではMAツールでのメール配信や「Facebook Custom Audience」「Twitter Tailored Audience」等のSNS広告等において「E-mailアドレス」をTreasure Data CDPから外部ソリューションへ連携するケースがあります。
3rd Party Cookie規制の強化とともに、1st Party Dataである「E-mailアドレス」を外部ソリューションとの連携keyとするケースは今後多くなる状況であり、よりセキュリティ性が高い状況でご活用頂く方法としてTreasure Data CDPでの「ハッシュ化」対応の方法をご説明させて頂きます。
ハッシュ化対応のパターン
Treasure Data CDP内にてハッシュ化データを取り扱うパターンは下記の通りです。
- データソース元において「ハッシュ化」されている状態のデータをそのまま取り込む
- Treasure Data CDPへのデータインポート時に、Treasure Data CDP提供のハッシュ化機能を利用して、ハッシュ化して取り込む
本記事では、Treasure Data CDP提供のハッシュ化機能について、データインポート方法により対応方法が異なりますので、 データインポート方法毎に後述させて頂きます。
ハッシュ化対応の活用メリット
データインポート方法毎の詳細説明の前に、簡単にハッシュ化対応を行うメリットについて記載をさせて頂きます。
- Treasure Data CDPの管理画面上にて、作業者にRAWデータ(E-mailアドレス/会員ID)を見せずに作業が可能となり、オペレーションでのセキュリティリスクを低減
- 同じハッシュ化アルゴリズム(MD5/SHA-1/SHA-256等)にてハッシュ化したデータ同士は、Treasure Data CDPのSQLにてデータ突合(Join)が可能であり、データ分析や関連データの紐付け等もセキュリティ性高く実施が可能
- ハッシュ化した状態のデータを外部施策ソリューションにそのまま連携し活用可能。
- 具体例:E-mailアドレスをkeyに連携実施
- Facebook/Instagram Custom Audience Export:連携詳細ドキュメント
- Twitter Tailored Audience Export:詳細連携ドキュメント
- Google Ads Remarketing List:詳細連携ドキュメント
- Yahoo!DMP Export:詳細ドキュメント
※上記の連携は、いづれもハッシュ化アルゴリズム:SHA-256対応
ハッシュ化対応のデータインポート方法パターン
ハッシュ化対応について、データインポート方法毎のパターンとして大きく3つあります。
- webサイトログを収集するJavaScripタグ経由でのデータインポート
- Treasure Data CDPから外部システムへのPull型によるデータインポート
- 外部システムからTreasure Data CDPへのPush型によるデータインポート
上記のデータ取得パターン毎にハッシュ化対応詳細をご説明いたします。
ハッシュ化対応詳細(1):JavaScript SDK
データインポート方法概要
取込データのハッシュ化対応方法
JavaScriptにて、Webサイトにて取得可能なユーザーID情報(E-mail/会員ID等)をTreasure Data CDPにデータ送信。送信時にユーザーID情報に対してハッシュ化を実施。
※注意点:フロント側にてハッシュ化処理を行う為、アクセスが多い等の処理負荷によっては蓄積されるデータログが欠損する可能性あり。
詳細ドキュメントはこちら
ハッシュ化対応詳細(2):Pull Type Bulk Loader(Data Connector)
データインポート方法概要
取込データのハッシュ化対応方法
Data Connector用のハッシュフィルタプラグイン機能を提供。
MD5、SHA-1、SHA-256のアルゴリズムに対応。
- AWS S3、FTP、SFTPからのインポート
- その他、Bigquery等からのインポート
→Treasure Data CDPの管理画面内にてGUI設定にて設定可能
詳細ドキュメント
→Workflow機能を利用して設定可能
詳細ドキュメント
ハッシュ化対応詳細(3):Push Type Bulk Loader(Embulk)
データインポート方法概要
取込データのハッシュ化対応方法
Embulk用のハッシュフィルタプラグインを利用し、対応。
詳細ドキュメントはこちら
以上、データインポート方法毎のハッシュ化対応詳細をご説明させて頂きました。
各社のセキュリティポリシーや運用オペレーションによって、ハッシュ化の対応有無は異なるかと思いますが、まずはTreasure Data CDPにて提供及びサポートを行なっている方法についてご紹介させて頂きましたので、各社毎の具体的な対応については、トレジャーデータ担当者にお気軽にご連絡、ご相談ください。