※ 本セミナーは大盛況のうちに終了となりました。セミナーアーカイブページより、資料とセミナー録画を閲覧することができます。
開催概要
本セミナーでは、2023年3月にリリースされた新機能:TD AutoMLの紹介することを目的に、デモを交えながらTD AutoMLでどんなことができるのかをできるだけ具体的、かつわかりやすく説明していきます。また、本セミナーのQ&Aセッションでは、開発者責任者である油井氏に参加していただき、参加者からのご質問に直接回答してもらう予定です!
本セミナー参加申し込みは本ページの最下部から行うことができます。
AutoML とは?
近年「AutoML」という言葉が機械学習の分野で話題になっています。AutoMLは「Automated Machine Learning」の略称であり、その名の通り機械学習(主に教師あり学習)における多くのプロセスを自動化してくれることにより、従来より圧倒的に短いリードタイムで機会学習を実行することができるものです。
一般的にAutoMLでは上図のような「データの前処理」から「精度向上」に至るまでを自動化してくれるため、機械学習の実行のための敷居を大幅に下げることができます。これまで機械学習の現場ではデータの準備やモデルの制度向上を行うためにデータエンジニアやデータサイエンティストと呼ばれる人が必要でした。しかし、AutoMLにおいては、そこまで機械学習に深い知見のない場合でも自分たちで機械学習を実行できるものになっています。現在GoogleやAmazonをはじめとした多くのBig Tech CompanyがAutoMLのライブラリを開発し、サービスを展開している状況です。
Treasure Data が提供する TD AutoML とは?
まず、Treasure Data CDP内における TD AutoML の立ち位置を説明しますと、CDP内で機械学習を実行できる第4の枠組みという位置付けになっています。
TD AutoMLはWorkflowを通じて機械学習を実行できるようになっていますが、Hive SQLから実行するHivemallやWorkflow上でPythonコードを記述して実行するCustomScriptsに比べて、必要な記述量が圧倒的に短いものになっています。また、Predictive Scoringはオーディエンススタジオ内からUIベースで実行できるものですが、ロジスティック回帰というただ一つの手法のみしか実行できません。
また、Treasure Data が提供する「TD AutoML」は、もちろん AutoML の機能(ソリューション)も提供するのですが、実はそれだけにとどまりません。基本的に(テーブルデータに対する)AutoMLは「教師あり学習」と呼ばれる、分類や回帰を行なってくれるものになっています。しかし世の中にはその他にもクラスタリングに代表される教師なし学習や強化学習などの多くの機械学習のソリューションが存在しています。 TD AutoMLでは各ソリューションを「Notebook」と呼ばれるものに定義・実装し、Notebookごとに機械学習ソリューションを提供する形式となっています。これによって、AutoMLに限らず、さまざまな機械学習ソリューションを同じ枠組みの中で、しかも非常に簡潔な記述のもによって利用することができるものになっています。
さらに、提供するソリューションは機械学習だけにとどまりません。主にマーケティング領域における、マルチタッチアトリビューションやネットワーク分析といった高度なデータ分析もNotebookとして提供しています。そして、今後も時代や利用者のニーズに合わせたソリューションNotebookがどんどん増えていく拡張性もTD AutoMLの大きな魅力と価値になっています。
名前 |
大分類 |
小分類 |
何ができる? |
AutoGluon automl |
機械学習 |
教師あり学習 |
回帰および(2値,多値)分類を実行し、予測結果をテーブル出力 |
ML datasets |
その他 |
データセット |
AutoML向けサンプルデータセットの提供 |
Network analysis |
可視化 |
有向グラフ |
ネットワーク可視化 |
Exploratory Data Analysis |
データ分析 |
分析 |
探索的データ分析を行い、データの理解を深める |
Next Best Action |
機械学習 |
強化学習 |
Next Best Action(次に最適なアクションは何か)を提示 |
Timeseries Forecasting |
機械学習 |
教師あり学習 |
時系列予測 |
Multi-touch Attribution |
データ分析 |
マーケティング |
アトリビューション分析によってコンバージョンに寄与しているタッチポイントを評価 |
Shapley |
機械学習 |
予測の説明 |
特徴量が各予測値に与える影響を説明、可視化 |
上の表は、リリース時点で提供されているNotebookの一覧になっています。
こんな方におすすめ!
- 様々な機械学習やデータ分析に取り組んでみたいと思っている方
- 機械学習を試してみたいが、敷居が高いと思っていた方
- 自社のデータをどう活用して良いかお悩みの方
- マーケターだが機械学習やデータ分析に興味がある方
プログラム
-
TD AutoMLとは?
-
実行の敷居を下げる仕組みについて
-
Notebook 紹介ツアー:
• ml_datasets
• AutoGluon
• Time Series Analysis • EDA
• MTA
• network_analysis
• NBA
セミナー概要
日時 |
Q&Aセッションでは、開発者責任者である油井氏に参加していただき、参加者からのご質問に直接回答してもらう予定です! ※各回の内容は同じです |
---|---|
実施方法 |
オンラインセミナーでの開催です。 参加されるセミナーが近づきましたら、登録されたメールアドレス宛にセミナーZoomリンクをお知らせさせていただきます。 |
対象 |
※ 基本的にユーザー限定のセミナーとなりますが、弊社CDPに興味のある企業の方のご参加も可能です。また、Treasure Workflowの機能を知っていることを前提にお話しすることになります。 主にデータエンジニア、データサイエンティスト、機械学習を活用したいマーケティング部門や経営部門の方(難しい内容には触れませんのでどなたでも安心してご参加ください。) |
参加費 | 無料 |
主催 | トレジャーデータ株式会社 トレジャーアカデミーチーム |
ご連絡先 | jp-treasure-academy@treasure-data.com |