UserEngagement_logoUserEngagement_logoUserEngagement_logoUserEngagement_logo
  • 記事を探す
    • ロール別ガイド
      • 管理者向け
      • マーケター向け
      • エンジニア向け
    • 用途から探す
      • 業務効率化・自動化
      • 新規顧客獲得
      • 既存顧客LTV向上
      • 企業DXの推進
    • 機能から探す
      • 顧客データ活用・施策連携
      • セキュリティ
      • データ加工、処理
      • データの可視化
      • 全機能をみる
    • 活用事例を探す
    • 全記事から探す
  • LINK
    • リリースノート
    • プロダクトドキュメント
    • Status Page(Incident情報)
    • Workflowサンプル集(英語)-TreasureBox
  • Academy
ログイン
✕

データ総件数が超過しそうな時には – Utilization (2) –

  • Home
  • 表示用 Data Management(ガイドページ表示用)
  • データ総件数が超過しそうな時には – Utilization (2) –
Home Article howto データ総件数が超過しそうな時には – Utilization (2) –
2021年3月3日
Categories
  • Data Management(ガイドページ表示用)
  • howto
  • Monitoring(ガイドページ表示用)
  • システムリソース管理(ガイドページ表示用)
  • データのインポート・エクスポート(ガイドページ表示用)
Tags
  • Data Management
  • Monitoring
  • システムリソース管理
  • データインポート・エクスポート
  • 管理者向けガイド

1119699

カスタマーレプレゼンタティブチームの関川誠です。
Utilization機能の第2回、前回のインポート件数に続き、今回は総件数超過への対応についてご紹介します。
Utilization機能の概要やアクセス方法は、前回のはじめにをご参照ください。

総件数は、ご契約のTreasure Data CDPアカウント上に存在するデータの総件数で、全てのデータベース、テーブルの総行数です。
契約値としては日次の合計をその月の日数で割った月間平均を採用しています。

対象となるデータは、外部からインポートしたものに加えて、TD内部の処理から作られた作業用テーブルなど含め、お客様のTreasure Data CDPアカウント配下の全てが対象です。(Premium Audit Logをご契約のお客さまの場合、Audit Logも件数にカウントされます。)
この上限値はお客様により異なり、Order Form上の「CDP Storage」、「Infrastructure Capacity – Total Rows」、「Total Row Capacity」といった項目(項目名はご契約時期により異なります)で定義されています。

目次
  1. 総件数確認のポイント
  2. 長期の傾向はAverage Records Stored – Last 18 Months
  3. 日々の変化と件数の多いデータベースを確認「Actual Records Stored – Last 3 Month」
  4. 任意のタイミングで全テーブルのレコード数を記録できるworkflow
  5. 確認後の対応について
続きはトレジャーデータご契約ユーザーさまのみご覧いただけます。以下からご契約企業ドメインアドレスでログインしてください。

会員登録・ログイン

総件数確認のポイント

本来意図したデータ量か、不要なものが残っているか確認が必要です。以下のような理由が考えられます。

  • 新たなデータソースを追加したのでインポートに加えて総件数も増加した
  • 処理方式を見直し、中間テーブルが生成されるようになった
  • プロジェクト初期に使ったテストデータが残っている
  • 開発中にテンポラリで作成したデータが残っている

長期の傾向はAverage Records Stored – Last 18 Months

Utilization画面の2列目右端にあるグラフが、過去18ヶ月の月間平均値の推移をあらわします。こちらで長期傾向を把握します。また特定月からの傾向が変わっている場合、過去3ヶ月以内であれば後述の「Actual Records Stored – Last 3 Month」で日次単位の詳細が確認できます。

また、任意の月のグラフ上でマウスをクリックするとドリルダウンメニューが表示され、DB単位の件数が表示されます。こちらを利用し、簡易的に過去と見比べるこで、原因となっているDBの推測も可能です。

日々の変化と件数の多いデータベースを確認「Actual Records Stored – Last 3 Month」

Utilization画面の最上段右にあるグラフが日々の総件数の推移をプロットとした「Actual Records Stored – Last 3 Month」です。こちらは月間平均ではなく日次の集計値のため、徐々に増えているのか、ある特定の日に増えたのか、確認が可能です。また、グラフ上をマウスオーバーし、任意の日付でクリックすることでDB単位のその日の件数が表示されるので、簡易的に過去と見比べるこで、原因となっているDBの推測も可能です。

また、不要データを削除した後も前述の「Average Records Stored – Last 18 Months」は、月間平均のため効果の確認が難しいですが、こちらでは作業の2日後から確認できます。

任意のタイミングで全テーブルのレコード数を記録できるworkflow

ご紹介した方法では、テーブル単位の情報確認ができず、対象DBから調査をしていくことになり、テーブル数が多い場合など、詳細の把握が困難なケースもあろうかと思います。その際は、Treasure Data CDP環境で便利に利用できるツールやコードをまとめて紹介している「Treasure Boxes」で公開されているワークフロー「Record Row Count of Tables」のご利用をお勧めします。こちらを利用し、毎月末のデータ件数を記録しておけば、いつでもテーブル単位での差分調査が行えます。

確認後の対応について

不要なデータがあった場合には、テーブル単位や、行単位での削除をいただく流れとなりますが、過去の生データあっての分析もございますので、短期的な対応が難しい場合は、カスターサクセス担当までご相談ください。

その他、定期的に不要データを削除することが可能な場合は、対象テーブルにExpire設定をすることで自動的にデータを削除できます。この際、誤って必要なデータを削除してしまっても、タイミングによっては復元できるケースもございます。その際はサポートまで急ぎ連絡してください。

今後も増加が見込まれる場合は、インポート件数と同様にカスタマーサクセス担当と協議いただき、契約値の見直しを進めます。この際、データ量の増加に伴う処理能力不足になっているケースもあるため、計算リソースの見直しも同時に進めることも同様におすすめします。尚、お客様側の調査で原因特定が難しい場合などは、調査のサポートをいたしますので、カスタマーサクセス担当までご相談ください。

次回は、Workflow/Custom ScriptsのUtilizationをご紹介します。

Share
関川 誠
関川 誠

Related posts

2023年6月14日

トレジャーデータPSチームによるダッシュボード構築プロジェクト事例
~トレジャーデータ書籍Appendix~


Read more
2023年5月31日

ダッシュボードの普及と課題
~トレジャーデータ書籍出版記念!一部先行公開~


Read more
2023年4月25日

Cookieに依存せずに広告CV計測を支援する機能「Conversion API」


Read more

Comments are closed.


  • ホーム
  • 個人情報の取り扱いについて
  • 個人情報に関する公表文
  • インフォマティブデータの取扱いについて
  • 会員情報変更
  • 退会手続きはこちら
記事を探す
  • ロール別ガイド
  • 用途別ガイド
  • 機能別ガイド
  • 活用事例
  • 全記事一覧
Community
  • Treasure Academy
LINKS
  • リリースノート
  • プロダクトドキュメント
  • Status Page(Incident情報)
  • Workflowサンプル集(英語)-TreasureBox
Copyright 2022 Treasure Data, Inc.
    ログイン