注:本記事は(2021年7月27日)に公開された(How PepsiCo Gains Actionable Insights Using the Data Cloud)を翻訳して公開したものです。

CPG(消費財)企業にとって、消費者の購買行動の変化をすばやく特定し、それに対応することは非常に重要であり、PepsiCo社はデータを使用してそれを成し遂げる達人です。私たちはこのほど、当社のポッドキャストRise of the Data Cloudの最新エピソードで、PepsiCo社のエンジニアリングおよびデータサイエンス部門統括者のVaibhav Kulkarni氏をお招きし、PepsiCo社がどのようにデータクラウドを利用して組織全体のより迅速かつ賢い意思決定を実現しているかについてお伺いしました。

PepsiCo社は、フリトレー、ゲータレード、ペプシコーラ、クエーカー、トロピカーナ、ソーダストリームといったラインナップを擁する世界最大クラスのCPG企業です。多様な嗜好食品や飲料など、23ブランドから成る同社の製品ポートフォリオは、年間10億ドルもの収益を生み出しています。Kulkarni氏が勤務するのはPepsiCo社のEコマース組織で、巨大企業の中に設けられた新興企業のような立場で運営されています。彼が率いるエンジニアリング&データサイエンスチームの任務は、世界中のPepsiCoの各セクターで使用される、機械学習を利用したデータプロダクトを構築することです。さらに同氏は、拡張可能なデータインフラストラクチャー、ツール、機能をクラウドで構築するインフラストラクチャーエンジニアリングチームも統括しています。

PepsiCo社がオンプレミスインフラストラクチャーからクラウドへの移行を開始したのは数年前のことです。高い安全性、データ喪失リスクの低減、サービスやアプリケーションの規模の調整しやすさにメリットを見出したのが理由でした。Kulkarni氏のEコマース部門はSnowflakeのデータクラウドを利用し始めて2年以上経ちます。「Snowflakeは、コンピュートレイヤーとストレージレイヤーを分けるという、非常に独特なアーキテクチャを持つソリューションを提供しています」と、Kulkarni氏は説明します。「Snowflakeがあれば、パフォーマンスとスピードを高め、コストを低減できるだけでなく、マルチクラウド環境への準備ができます。」

PepsiCoのチームは用途ごとに複数のパブリッククラウドを使い分けています。Snowflakeデータクラウドを使用することで、Kulkarni氏のチームは「数クリックで」マルチクラウドのレプリケーションをセットアップできるそうです。

同氏が手掛けた大きなプロジェクトの1つは、機械学習モデリングベースのツールであるROI Engineです。これはPepsiCoのマーケティングおよび広告キャンペーンの効果を評価、測定するもので、すでに北米で稼働中ですが、PepsiCoはこれを世界中にロールアウトして、マーケティングに関してより優れた意思決定を可能にし、投資回収率を高める計画を立てています。ROI Engineにより、PepsiCoのマーケターはさまざまなメディアキャンペーンのパフォーマンスについての洞察を得たり、マーケティング費用をかけるポイントを推奨できるようになりました。

このROI Engineエンジンの一部として、チームは北米の60以上のデータソースから情報を収集し、Snowflakeデータクラウド内に格納しています。データサイエンティストはこのデータセットを使用して実用的なインサイトを生成しています。Snowflakeのセキュアなデータシェアリングにより、チームはデータベースやテーブルを組織内の他のチームとすばやく共有できます。「これらのチームは、データパイプラインの構築について気にかけることなく、いつでも最新のデータにアクセスできます」と、Kulkarni氏は言います。「データセットすべてが1つの場所にあるというのは、非常に有益です。」

Kulkarni氏によると、PepsiCo社は、ROI Engineを活用することで、既に特定のブランドのデジタル普及率が2桁も向上したそうです。

PepsiCo社は最近、サードパーティデータの入手と共有のため、Snowflakeデータマーケットプレイスの活用も開始しました。同社は新型コロナウイルスの感染率に関するデータセットを使用しており、他にも客の出足や気候に関するデータセットについても検討しています。

将来について、Kulkarni氏は、さまざまな業界で高度なAIアプリケーションが出現することを前向きにとらえており、あらゆる種類のデータテクノロジーへのニーズが増えるだろうと予想しています。「データ領域が拡大し続ける中、この分野ではデータサイエンティスト、データアナリスト、データエンジニア、機械学習エンジニア、フルスタック機械学習エンジニアが果たすべき役割や機会がたくさんあります。」

Kulkarni氏は、より多くの企業が、Snowflakeのデータシェアリング機能を用いることで、データ移転コストや開発時間の削減のメリットに気づくようになるだろうと予言しています。「企業は大規模なETLパイプラインを構築する必要なく、データを取り入れ、共有できます。そのデータは、既にロードと準備が完了しているので、直接利用できます。」

Rise of the Data Cloudは、受賞歴のある著述家でありジャーナリストであるSteve Hamm氏がホスト役を務めるポッドキャストです。エピソードごとにSteve氏は、クラウドをどのように利用してデータを管理、共有、分析しているか、どのようにビジネスの成長を加速し、イノベーションを促進し、業界に革新をもたらしているかについて、データ業界のリーダーを招いてインタビューしています。このポッドキャストの他の回を聴きたい場合は、こちらからアクセスしてください。