Beim Thema Daten entwickelt sich der aktuelle Stand der Technik ständig weiter und es gibt derzeit einen riesigen Hype um moderne Technologien, der jedoch nicht immer begründet ist. Bei Snowflake können wir genau sehen, wie innovative Unternehmen unsere Plattform tatsächlich nutzen, um mit Daten zu arbeiten. In unserem Einführungsbericht zu Datentrends haben wir die realen Nutzungsdaten dieser Unternehmen analysiert – und nicht nur das, was Führungskräfte über ihre Datennutzung denken. Hierbei haben wir vier Trends aufgedeckt, die den Erfolg moderner Unternehmen neu definieren: 

1. Unternehmen verbinden Daten miteinander, wo sie können. Doch dieses Verbinden von Daten wird zusehends schwieriger – und das, obwohl bereits seit Jahren über das Aufbrechen von Datensilos gesprochen wird. Die Anzahl der SaaS-Anwendungen, von denen jede ein potenzielles Silo darstellt, nimmt zu und moderne Unternehmen nutzen verschiedene Anbieter für ihre Cloudressourcen. Die Zahl der Unternehmen, die alle drei großen Public Clouds für ihre Daten nutzen, ist im Laufe des Jahres* um 207 % gestiegen. Diese zunehmende Datenkomplexität beeinträchtigt die Entwicklung von KI- und ML-Anwendungsfällen: Es braucht immer mehr Computing-Workloads für diese fortschrittlichen Tools – und wenn Sie nicht all Ihre Daten mit einer einzigen, allumfassenden Datenquelle verbinden, werden Sie zwangsläufig hinter der Entwicklung zurückfallen.

2. Moderne Unternehmen bringen ihre Arbeit zu den Daten – nicht umgekehrt. Wie auch viele andere Datenplattform-Anbieter befürwortet Snowflake die Speicherung sämtlicher Daten an einem Ort. Doch allein das stellt bereits eine Herausforderung dar, wenn Sie für jeden Aufgabentyp, den Sie bearbeiten, individuelle Datasets abrufen und vorbereiten müssen. Auf unserer Plattform sehen wir, wie Benutzer:innen den nächsten Schritt gehen: Sie erledigen ihre Arbeit mit zentralem Zugriff auf sämtliche Daten, anstatt die Daten extrahieren und in jede neue Anwendung hochladen zu müssen. So können Unternehmen mit weniger finanziellem Aufwand mehr erreichen, da sie keine isolierten Infrastrukturen mehr benötigen. Aufgaben, für die ein Team früher mehr als sechs Wochen brauchte, können so in wenigen Tagen erledigt werden. Hierfür gibt es sogar ein Snowflake-spezifisches Beispiel: Eines Donnerstags rief mich unser CEO, Frank Slootman, an. Er wollte eine generative KI-Lösung, welche die Navigation durch all unsere Vertriebsdaten erleichtern sollte. Frank wollte in der Lage sein, jede beliebige Vertriebsfrage mit natürlicher Sprache statt mit Code zu stellen und eine Antwort zu erhalten. In nur zwei Tagen entwickelten wir eine App mit einer einfachen, von Streamlit unterstützten Oberfläche, die typische, alltägliche Fragen eines CEOs beantworten konnte. Diese Geschwindigkeit und der Self-Service-Faktor sind echte Gamechanger.

3. Governance ist wichtiger denn je. Jeder einzelne Datentrend hat auch einen Governance-Aspekt. Wenn Ihre Daten an fünf verschiedenen Orten gespeichert sind, gibt es wahrscheinlich auch fünf widersprüchliche Governance-Richtlinien. Large Language Models (LLMs) sind das Thema der Stunde und wir sollten diese neue Technologie mit offenen Armen begrüßen – aber hierbei müssen wir natürlich wie immer den Datenschutz gewährleisten. LLMs haben in letzter Zeit bewiesen, dass sie mit Modellen, die anhand von Internetdaten trainiert wurden, die Produktivität von Entwickler:innen und geschäftlichen Usern steigern können. Für Unternehmen bietet sich hier die große Chance, LLMs mit ihren eigenen Daten zu erweitern. Die am weitesten entwickelten LLMs werden jedoch in externen Services gehostet, was ein Datenschutzrisiko darstellt. Deshalb müssen Unternehmen eine Strategie dafür entwickeln, wie sie LLMs (sowohl Open Source- als auch kommerzielle Modelle) zu ihren Daten bringen können – und nicht umgekehrt. Um Daten zu verbinden, an den Orten zu arbeiten, wo sich diese Daten befinden, und flächendeckende Automatisierung zu implementieren, ist einheitliche Governance absolut entscheidend. Im Idealfall ermöglicht eine einzige Plattform mit integrierten Governance-Funktionen Klassifizierung, rollenbasierte Zugriffskontrolle (Role-Based Access Control, RBAC), Object Tagging, Datenqualität und Beobachtbarkeit. In einem früheren Blogbeitrag (My 2023 Predictions for Chief Data Officers), habe ich betont, dass es nicht ratsam ist, die Kosten und die Komplexität, die der Einsatz unterschiedlicher Tools mit sich bringt, einfach auszuhalten. Wir befinden uns mitten in der Zukunft und es wird schon bald Standard sein, alle Daten an einem Ort aufzubewahren. 

4. Unternehmen setzen auf Automatisierung und erwarten eine vollständig verwaltete Plattform. Es braucht eine vollständig verwaltete Datenplattform, nicht nur um neue Erkenntnisse zu gewinnen, sondern auch um Maßnahmen zu ergreifen, ohne hierbei erst auf eine manuelle Prüfung warten zu müssen. Die Reaktion auf Sicherheitsereignisse oder die Verwaltung von Cloudressourcen mit Echtzeiteffizienz sind mittlerweile Standard für moderne Unternehmen. Letzteres hat sich letztes Jahr in einem erheblichen Anstieg automatisierter Warehouse-Größenanpassungen gezeigt: Hierbei kommt Automatisierung zum Einsatz, damit Kunden effizienter mit stark skalierbaren Cloudressourcen umgehen können. Bei Snowflake haben wir dieses Prinzip auf Lizenzen für Softwareapplikationen angewendet. Wir haben ein automatisiertes Verwaltungstool entwickelt, das Mitarbeitenden Softwarelizenzen entzieht, wenn sie die Anwendung über einen festgelegten Zeitraum nicht verwendet haben. Im ersten Jahr nach Einführung des Tools konnten wir so 5,5 Millionen US-Dollar an unnötigen SaaS-Kosten einsparen.

Weitere Auswirkungen 

Diese Trends deuten auf eine übergreifende Entwicklung hin: Ohne einheitliche Daten schränken Sie Ihr Unternehmen, Ihre gewonnenen Erkenntnisse, Ihr Potenzial und Ihre Monetarisierungsmöglichkeiten ein. Jedes Unternehmen versucht, den Wert zu steigern, den es aus seinen Daten gewinnt – sei es durch Entwicklung eines gänzlich neuen digitalen Produkts oder durch die Entwicklung eines internen Tools über ein langes Wochenende. Jeder will beim Rennen hin zu generativer KI dabei sein, doch nicht jeder hat genug Daten, um hochwertige Einblicke zu gewinnen. Indem Sie diese vier Trends in Ihrer Datenstrategie berücksichtigen, sichern Sie sich Ihren Platz in diesem Wettlauf.

*Die Daten im Datentrendbericht 2023 decken den 12-Monats-Zeitraum bis einschließlich 31. Januar 2023 ab (der in diesem Bericht als „dieses Jahr“ oder „das Jahr“ bezeichnet wird), was dem Geschäftsjahr 2023 von Snowflake entspricht. Wir haben die Datennutzung von ungefähr 7.800 Snowflake-Kund:innen untersucht, von denen einige langjährige Snowflake-Benutzer:innen und andere erst kürzlich zur Data Cloud gestoßen sind. Beachten Sie, dass der Kundenstamm von Snowflake im Geschäftsjahr 2023 um 31 % gewachsen ist. Mit diesem Wert als Baseline können wir vergleichende Statistiken erstellen, in denen wir Trends aufspüren können, die dieses allgemeine Wachstum überstiegen haben.