注:本記事は(2021年12月6日)に公開された(Analysts Can Now Use SQL to Build and Deploy ML Models with Snowflake and Amazon SageMaker Autopilot)を翻訳して公開したものです。

機械学習(ML)モデルは、組織にとって、事業全体の価値を高めるパターンを明らかにし予測を立てる重要な要素となっています。非常に重要であるにもかかわらず、これらのモデルの構築や展開は、プログラミングやMLフレームワークの深い専門知識を有する少数の熟練したデータサイエンティストやデータエンジニアの手に委ねられています。

しかし、優れたビジネス感覚とSQL知識を兼ね備えたアナリストが、組織内のより多方面に機械学習を取り入れることができるようになったとしたらどうでしょうか。SnowflakeとAmazon SageMaker Autopilotとの統合により、SnowflakeのデータアクセスとAmazon SageMaker Autopilotの自動化機械学習(AutoML)機能が結合し、Snowflake内でSQLを使用して簡単にMLモデルを構築、展開できるようになります。今回は、このネイティブ統合が、現在パブリックプレビュー版で利用可能となりAWSイニシアチブ「データアナリティクスのためのAI(AIDA)」に参加することをお知らせいたします。

Snowflakeのプロダクトマネジメント担当ディレクターであるTorsten Grabsは次のように述べています。「SnowflakeとAmazon SageMaker Autopilotの統合により、データをMLを活用したインサイトに変換する作業が簡素化され、データサイエンスの持つ力をデータサイエンスチームによる直接的な利用から拡大させることができました。Western Unionのような、顧客のデジタルバンキングエクスペリエンスを傾向やセグメンテーションモデルに基づいてカスタマイズする企業は、より細やかなモデルに基づいた顧客エクスペリエンスのハイパーパーソナライズが可能となります。これにより、MLモデルの構築に伴う手間のかかる作業が軽減され、Snowflake内部から最新の機械学習モデルのトレーニングや展開の自動化が可能となり、運用コストも削減されます。」

このネイティブ統合により、アナリストや他のSQLユーザーはSageMaker Autopilotを活用して、回帰や分類アルゴリズムを使用した幅広いユースケースに対し、Snowflake内にある表形式のデータセットを使用したモデルの構築や展開が可能となります。これには、顧客のチャーン予測やライフタイムバリュー、価格や売り上げの予測、さらに予知保全のような業界特有のユースケースといった頻度の高い営業やマーケティングのユースケースが含まれます。

利用開始がどれだけ簡単かを紹介するために、SQLを使用したMLモデルの構築および展開についてのクイックスタートガイドを作成いたしました。ガイドには次の内容が含まれています。

  • 前提条件
  • ワンタイム設定プロセスに向けた3つのシンプルステップ
  • SageMaker Autopilotを使用したAutoMLのためのSnowflake SQL機能
    • トレーニングの開始:aws_autopilot_create_model ()
    • ステータスチェック:aws_autopilot_describe_model()
    • 予測の取得:aws_autopilot_predict_outcome()
  • モデル最適化のアイディア

quickstarts.snowflake.comで始める