注:本記事は(2021年9月13日)に公開された(New Snowflake Features Released in August 2021)を翻訳して公開したものです。

Snowflakeがお届けする8月のリリースには、Snowflake製品に対するいくつかのアップデートやエンハンスメントが含まれますが、その中でも、データガバナンスとセキュリティに関する新機能は、組織がデータをよく知り、保護し、その価値を引き出すのに役立つものとなっています。さらに8月には大手データプロバイダー数社がSnowflakeデータマーケットプレイスに加わり、ターゲットを絞った人口統計からEコマース購買データ、さらにはサードパーティリスク管理のレビューまで、多種多様なデータセットを提供しています。 

グローバルガバナンス

データにビジネスコンテキストを適用する

現在パブリックプレビュー版として提供されているオブジェクトタギング機能は、データオブジェクトを機密として、個人識別情報(PII)として、または特定のコストセンターに属するものとして識別するタグなどのビジネスコンテキストをデータに適用することで、データを簡単に把握し管理できるようになります。この機能を使用すると、独自のカスタムタグライブラリを作成し、それらを列、テーブル/ビュー、データベース、ウェアハウスなどといった任意のオブジェクトに関連付けることができます。詳しくは、ブログ記事をご参照ください。

データの利用方法を確認する

アクセス履歴機能では、Snowflakeで誰がどのテーブル、ビュー、列をクエリしたかを把握できます。この組み込み型のビューがあれば、コンプライアンス監査のためのレポートを作成し、未使用のテーブルや列を把握してストレージを最適化し、変更を実装する前に誰がデータにアクセスしているかを確認できます。アクセス履歴機能は現在、正規版として提供されています。詳しくはこちらをご覧ください。

プラットフォームセキュリティ

内部ステージへのプライベート接続のシンプル化

AWS PrivateLinkを使用したSnowflake内部ステージへのプライベート接続機能が正規版として提供されるようになりました。この機能は、Amazon S3向けAWS仮想プライベートクラウド(VPC)インターフェイスエンドポイントとAWS PrivateLinkを組み合わせることで、Snowflake内部ステージへの安全な接続を提供します。このセットアップにより、Snowflake内部ステージへのデータアクセスに、パブリックインターネットではなくAWS内部ネットワークが使用されます。Snowflakeは、Azureプライベートエンドポイントに対しても類似の安全な接続をサポートしています。両機能とも、Snowflake Business Criticalエディション以上で提供されています。詳しくはこちらをご覧ください。

プラットフォームの最適化とコストガバナンス

クローニング効率の向上

過去数か月にわたって、Snowflakeは全リージョンを対象にクローニング効率向上機能の運用を開始しました。リージョンの1つであるAzure West Europeでは、テーブルに対するSnowflakeのクローニング効率は平均で46%向上し、スキーマに対しては52%、データベースに対しては64%向上しました。クローニングに関する考慮事項について詳しくは、Snowflakeのドキュメンテーションをお読みください。詳しくはこちらをご覧ください。

Snowflakeデータマーケットプレイス

Snowflakeカスタマーは、Snowflakeデータマーケットプレイスを利用して、18カテゴリーに及ぶ175以上のプロバイダー(2021年7月31日時点)が提供する便利なサードパーティデータやサービスを検索し、それらにアクセスすることができます。さらに、Snowflakeデータクラウド全体で自身のプロダクトを販売することもできます。詳しくは、Snowflakeデータマーケットプレイスにアクセスしてください。

Snowflakeデータマーケットプレイスの新規加入プロバイダー

ADP

ADPは、米国の労働人口に関する地理情報に基づく最新の人口統計データと収入データを提供しています。米国の約3,000万人もの雇用者のデータを地区レベルで集計し、匿名化しています。詳しくはこちらをご覧ください。

Alliant Demographics

Alliantは、トランザクションデータ、高度なデータサイエンス、および高性能なスコアリング技術を活用して構築されたオーディエンスベースのソリューションを提供しています。Snowflakeデータマーケットプレイスで販売されているAlliant社のデータセットは、年齢範囲、HHI(ハーフィンダール・ハーシュマン指数)情報、および推定資産を含め、米国人に関する幅広い情報に基づくインサイトを提供します。詳しくはこちらをご覧ください。

The Ark

The Arkの「Re-mover Gone Aways(恒久的移転者)」データセットは、英国内の住所から転居した個人の氏名と住所情報を含むデータセットです。1995年から現在まで記録された「転居者」に関する詳細により、企業は記録に掲載されている住所にもう住んでいないカスタマーを特定できます。このデータセットを利用することにより組織は、マーケティングキャンペーンからカスタマーを除外したり、詐欺の特定や身元の確認をしたりできます。詳しくはこちらをご覧ください。

CloudFactory

CloudFactoryは、人と技術を結びつけ、機械学習やビジネスプロセスの最適化のための、スケーラブルな人間参加型のワークフォースソリューションを提供しています。同社のデータアナリストは、Microsoft、GoSpotCheck、Hummingbird Technologies、Ibotta、Luminarといったイノベーターに向け、毎日何百万ものタスクを処理しています。Snowflakeデータマーケットプレイスで提供されているCloudFactoryのデータセットには、コンピュータビジョンおよび自然言語処理のためのデータ処理サービスのほか、データの注釈サービスやラベリングサービスが含まれます。詳しくはこちらをご覧ください。

Discovery Data

Discovery Dataは、金融サービスや保険業界にとって不可欠な、企業や人に関する情報を提供しています。そのデータセットの中には、金融アドバイザーや保険代理店に関する包括的な多様性とインクルージョンデータを提供するリストが含まれています。詳しくはこちらをご覧ください。

Dun & Bradstreet

Dun & Bradstreetは、インテリジェントな行動をとるためのデータ活用や分析によるインサイトの活用を支援し、企業に競争優位性をもたらします。Dun & Bradstreet社は、米国内で登録している企業の住所や電話番号データを含め、さまざまなデータセットをSnowflakeデータマーケットプレイスで提供しています。詳しくはこちらをご覧ください。

Equifax

Equifaxは、収入データから住宅資産データまで、20件以上のデータリストをSnowflakeデータマーケットプレイスで公開しています。データリストには、米国消費者のクレジットデータを時系列に匿名でリンクさせた「US Consumer Credit Trends(米国消費者クレジット傾向)」データセットなどがあります。詳しくはこちらをご覧ください。

Fluent

Fluent, Inc.の消費者エンゲージメントプラットフォームには、米国の消費者が毎日100万人以上登録しています。同社の「U.S. Consumer Demographics(米国消費者人口統計)」データセットは、オプトインで収集された人口統計から成る最大規模のアドレサブルソースの1つで、ターゲティング、アナリティクス、データのエンリッチ化に役立ちます。詳しくはこちらをご覧ください。

マインディア

株式会社マインディアは、日本のマーケティングテクノロジー企業であり、全世界でマーケティングを進化させビジネスを加速するための消費者データを収集、分析、格納する包括的なSaaSマーケティングプラットフォーム「Mineds」を提供しています。同社がSnowflakeデータマーケットプレイスで提供しているデータセットには、日本のEコマース市場における実際の購買データが含まれます。詳しくはこちらをご覧ください。

Panorays 

Panoraysは、サードパーティセキュリティリスク評価機能や管理機能をすばやく簡単に自動化して、固有のリスクから残存リスク、抑制、継続的な監視まで、全プロセスを処理します。同社の「Third-Party Security Risk Management(サードパーティセキュリティ管理)」データセットを利用することで、カスタマーはサプライヤーのセキュリティを迅速かつ容易に管理、抑制、修正して、違反を減らし、ベンダーコンプライアンスを徹底し、全体的なセキュリティを向上させることができます。詳しくはこちらをご覧ください。

Pricemoov

Pricemoovの価格管理プラットフォームは、AI技術を用いて企業の価格戦略の最適化を後押ししたり、実用的な価格設定手段を用いたりすることで、収益の可能性を解き放ちます。同社のデータセットは、複数のデータソースを統合し、バックオフィスの価格管理と、前線の営業チーム向けインテリジェンスの両方に力をもたらします。詳しくはこちらをご覧ください。

Skai

Skaiは、米国Amazonのいくつかの製品カテゴリーにおいて、各月で最も多くレビューを集めた製品に関する独自のデータポイントを提供しています。カスタマーはこのデータセットを、製品開発、マーケティング、ブランドキャンペーンに役立てています。詳しくはこちらをご覧ください

truestar

truestarは、組織運営、プロセス要件の定義、さまざまなツールの導入や実装に関するデータの分析と視覚化を含め、さまざまな問題に対してインサイトと明確さを提供しています。同社がSnowflakeマーケットプレイスで提供しているデータリスティングには、日本の2015年の国勢調査からの小地域統計を基にtruestar社が編集した日本の町名や番地別の多角的データが含まれており、取引におけるより効果的かつ迅速なエリア分析に利用することができます。詳しくはこちらをご覧ください

VideoAmp

VideoAmpは、メディアの評価や売買の在り方を再定義する高度でデータドリブンな広告エコシステムを生み出すソフトウェアおよびデータを提供しています。VideoAmpの「Linear TV」データセットは、STB(セットトップボックス)テレビおよびACR(自動コンテンツ認識)テレビへの露出に関する混在型、重複排除済み、エンリッチ化済みのデータセットとしては最大規模のもので、対象は2,800世帯、4,000万デバイスに及びます。詳しくはこちらをご覧ください

Zenreach

2012年創業のZenreachは、何万もの従来型主要企業にサービスを提供しています。同社がSnowflakeデータマーケットプレイスで提供している「The Zenreach Foot Traffic」データセットは、米国全土の客足を、国勢調査細分区グループ、郵便番号、都市、州レベルで日ごとに区分したものです。詳しくはこちらをご覧ください