
Rakuten Saves 60% in Infrastructure Costs with Snowflake
Rakuten senkt die Kosten und veröffentlicht neue Produkte schneller, um eine persönlichere Kundenerfahrung aufzubauen.
Snowflake Intelligence ist hier
Wichtige Unternehmenseinblicke – für alle Mitarbeitenden nur einen Klick entfernt.
Die Behauptung, dass maschinelles Lernen die Welt verändert hat, ist keine Übertreibung. Indem wir Maschinen das Denken beigebracht haben – und zwar anhand von Beispielen für die Dinge, die sie lernen sollen (Daten), und nicht anhand vorprogrammierter Regeln (Code) –, ist eine breite Palette neuer, praktischer Anwendungen entstanden: Ob Diagnosesysteme in der Radiologie, E-Mail-Spamfilter oder halbautonome Fahrzeuge – all das wurde mithilfe von maschinellem Lernen (ML) erlernt.
ML ist auch die Grundlage für Large Language Models und die generativen KI-Anwendungen, die daraus entstanden sind. Doch ML-Modelle zu erstellen und zu trainieren, ist zeit- und ressourcenintensiv und erfordert neben erheblichen Investitionen in die Infrastruktur auch umfangreiche KI-Kenntnisse. Deshalb hat eine neue Kategorie von Tools, die viele dieser Prozesse automatisieren – bekannt als AutoML – die Aufmerksamkeit von Data Scientists, Engineers, Analyst:innen und geschäftlichen Nutzenden auf sich gezogen.
In diesem Leitfaden beschreiben wir, was AutoML ist und wie es dazu beiträgt, Wissenslücken zwischen Data-Science-Teams und gewöhnlichen Nutzenden zu schließen, indem es KI skalierbarer und für alle im Unternehmen zugänglich macht.
AutoML nutzt Software, um die wichtigsten Schritte bei der Entwicklung eines ML-Modells automatisch durchzuführen. Dazu gehören die Auswahl der richtigen Algorithmen, die Abstimmung der Modellparameter und die Umwandlung von Rohdaten in ein Format, das das Modell versteht – ein Prozess, der als Feature Engineering bezeichnet wird. Die Zeit, die Engineers benötigen, um ein einfaches Modell zu entwickeln, kann so von Monaten auf Tage oder sogar Stunden reduziert werden. AutoML demokratisiert KI, indem es Nutzende in Bereichen wie Gesundheitswesen, Finanzen und Marketing in die Lage versetzt, ihre eigenen Modelle zu entwickeln, ohne dass sie dafür tiefgreifende technische Kenntnisse benötigen.
Die folgenden fünf Punkte zeigen, wie AutoML die Modellentwicklung revolutioniert:
Eine typische AutoML-Pipeline automatisiert den gesamten ML-Prozess, der oft folgende Schritte umfasst:
In dieser Phase bereinigt die Plattform die Rohdaten und bereitet sie vor. Sie kümmert sich um fehlende Werte, entfernt Ausreißer und wandelt die Datentypen in Formate um, die für die ML-Algorithmen geeignet sind. So wird die Qualität und Konsistenz der Daten gewährleistet, bevor das Modelltraining beginnt.
Als Nächstes wandelt die Plattform die Rohdaten um. Dabei generiert sie neue Variablen, codiert kategorische Daten, skaliert numerische Features und wählt die relevantesten Features aus, um die Modellprognosen zu verbessern.
AutoML testet systematisch mehrere ML-Algorithmen (z. B. Entscheidungsbäume, neuronale Netze oder Ensemble-Methoden), um herauszufinden, welcher Ansatz für ein bestimmtes Dataset und Problem am besten geeignet ist.
Bei diesem wichtigsten Schritt wird das Modell mit großen Mengen an Beispieldaten gefüttert (z. B. Tausende von E-Mails, die als „Spam“ oder „kein Spam“ gekennzeichnet sind). So kann das Modell lernen, Muster und Beziehungen innerhalb dieser Daten zu erkennen. Anschließend kann das Modell auf Grundlage dieser gelernten Muster Entscheidungen über neue, unbekannte Daten treffen, die nicht Teil der Trainingsdaten waren.
Bei diesem Schritt werden verschiedene ML-Modelle mit demselben Dataset trainiert und anschließend die resultierenden Prognosen kombiniert, um eine endgültige Entscheidung zu treffen. Die Ensemble-Modellentwicklung liefert in der Regel genauere und zuverlässigere Ergebnisse als einzelne Modelle, da bei diesem Ansatz die Auswirkungen der Schwächen und des Bias eines bestimmten Modells reduziert werden.
Durch die automatische Optimierung der Einstellungen, die steuern, wie ein Algorithmus lernt – z. B. Lernraten, Baumtiefen oder Regularisierungsparameter –, können Nutzende mit AutoML die beste Kombination von Parametern ermitteln.
Unternehmen brauchen ein Modell, das gut mit neuen, unbekannten Daten funktioniert. Bei Testverfahren wie der Kreuzvalidierung werden Kennzahlen wie Genauigkeit, Präzision und Sensitivität (Recall) erfasst. Gleichzeitig werden Modelle auf Überanpassung (bei der ein Modell bei Daten außerhalb seines Trainingssets schlecht abschneidet) oder Bias geprüft.
AutoML ermittelt automatisch das leistungsstärkste Modell für die Produktion und richtet Systeme ein, um die Performance im Laufe der Zeit zu verfolgen. So wird sichergestellt, dass Modelle auch dann noch effektiv funktionieren, wenn sich die realen Bedingungen ändern, indem ein Leistungsabfall des Modells vermieden und bei Bedarf ein neues Training eingeleitet wird.
Wenn möglich, wollen Entwicklerteams erklären können, warum ein Modell eine bestimmte Prognose getroffen hat, und „Blackbox“-Modelle vermeiden, bei denen der Entscheidungsprozess völlig undurchsichtig ist. AutoML-Plattformen werden oft mit Tools geliefert, die die gesamte Modellentwicklung dokumentieren, einschließlich der Art und Weise, wie die Daten vorverarbeitet wurden und warum bestimmte Algorithmen ausgewählt wurden.
Da praktisch in jeder Branche ML-Modelle verwendet werden, gibt es viele Bereiche, in denen AutoML die ML-Initiativen von Unternehmen beschleunigen kann. Die folgenden sechs Anwendungsfälle demonstrieren die Einsatzmöglichkeiten von AutoML:
AutoML unterstützt Unternehmen bei der Modellentwicklung, um historische Verkaufsdaten, saisonale Muster und Markttrends zu analysieren. Unternehmen können auf Grundlage dieser automatisierten Prognosen den Bestand, die Personalbesetzung und die Budgets schnell anpassen, ohne ein Data-Science-Team hinzuziehen zu müssen.
Banken und Zahlungsdienstleister nutzen ML, um potenziell betrügerische Transaktionen in Echtzeit zu erkennen. Mit AutoML können Betrugsanalyst:innen und Risikomanager:innen Modelle schneller entwickeln, um mit den neuen Taktiken von Betrüger:innen Schritt zu halten.
Abonnementservices und Telekommunikationsanbieter ermitteln mit ML die Kund:innen, die ihren Service wahrscheinlich kündigen werden, und können so proaktive Maßnahmen zur Kundenbindung ergreifen. Durch Automatisierung können Unternehmen schnell neue Abwanderungsmodelle testen und bereitstellen, wenn sich das Kundenverhalten ändert.
Maschinelles Lernen unterstützt Gesundheitsdienstleister bei der Auswertung von medizinischer Bildgebung, Laborergebnissen und Patientensymptomen, um Diagnosen und Behandlungen zu unterstützen. Wenn neue medizinische Forschungsergebnisse und Patientendaten verfügbar werden, kann AutoML die vorhandenen Modelle kontinuierlich aktualisieren, damit Patient:innen die bestmögliche Versorgung erhalten.
Handelsunternehmen nutzen Modelle, um die Nachfrage nach bestimmten Produkten an verschiedenen Standorten zu prognostizieren, damit sie die richtigen Artikel zur richtigen Zeit auf Lager haben. AutoML unterstützt den Handel bei der Entwicklung von Modellen für verschiedene Produktkategorien oder Filialstandorte und kann die Modelle automatisch neu trainieren, wenn sich die Marktbedingungen ändern.
Mit AutoML können E-Commerce-Plattformen und Ridesharing-Services dynamische Preismodelle bereitstellen, indem sie automatisch Echtzeit-Datenströme integrieren, und schnell mit unterschiedlichen Preisstrategien für verschiedene Märkte, Produkte oder Servicebereiche experimentieren. So können Unternehmen ihren Umsatz maximieren, ohne dass häufige manuelle Preisanpassungen erforderlich sind.
AutoML-Plattformen bietet Vorteile für jedes Unternehmen. Sie beschleunigen die Modellentwicklung, reduzieren menschliche Fehler, entlasten Data Scientists, damit sie sich um strategischere Aufgaben kümmern können, und demokratisieren den Zugang zu KI innerhalb des Unternehmens. Aber es gibt auch einige inhärente Einschränkungen, darunter:
AutoML verwendet tendenziell Standardansätze, die möglicherweise nicht die einzigartigen Aspekte spezieller Probleme erfassen. So entgehen ihnen potenziell individuelle Lösungen, die Fachleute für bestimmte Branchen oder Anwendungsfälle entwickeln würden.
AutoML-Systemen mangelt es an geschäftlichem Kontext und spezialisiertem Fachwissen für bestimmte Branchen oder Bereiche. Dadurch entgehen ihnen möglicherweise wichtige Nuancen, die menschliche Expert:innen erkennen würden, wie z. B. saisonale Geschäftsmuster oder gesetzliche Einschränkungen.
AutoML-Plattformen sind nicht in der Lage, minderwertige Daten zu korrigieren. Wenn die von Ihnen verwendeten Eingangsdaten Bias aufweisen, unvollständig oder irrelevant sind, werden automatisierte Systeme unzuverlässige Ergebnisse liefern.
Fortgeschrittene Nutzende stoßen möglicherweise auf Hindernisse, wenn sie versuchen, spezielle Techniken, benutzerdefinierte Algorithmen oder komplexe Vorverarbeitungsschritte zu implementieren, die außerhalb der automatischen Fähigkeiten der Plattform liegen.
AutoML-Plattformen beherrschen zwar das grundlegende Feature Engineering, lassen aber möglicherweise die Erstellung anspruchsvoller, bereichsspezifischer Features vermissen, die die Performance des Modells erheblich verbessern könnten.
Auch wenn eine AutoML-Plattform erklären kann, wie ein einzelnes ML-Modell Prognosen erstellt, sind komplexe Ensemble-Modelle viel schwieriger zu interpretieren oder zu erklären. Das macht sie ungeeignet für Anwendungen, die ein hohes Maß an Transparenz erfordern, wie z. B. Diagnosen im Gesundheitswesen oder Kreditgenehmigungen.
Viele AutoML-Plattformen sind kostspielig und schaffen Abhängigkeiten von anbietereigenen Systemen. Das macht es schwierig, Modelle in verschiedene Umgebungen zu übertragen oder sie unabhängig zu pflegen.
Diese Einschränkungen erklären, warum AutoML am besten als Werkzeug zur Ergänzung menschlicher Fachkenntnisse funktioniert, anstatt diese vollständig zu ersetzen.
Mit AutoML wird maschinelles Lernen demokratisiert, indem Bereichsexpert:innen in sämtlichen Branchen ohne technisches Fachwissen anspruchsvolle Prognosemodelle entwickeln können. Und das verkürzt nicht nur monatelange Entwicklungszeiten auf wenige Tage, sondern beschleunigt auch die Einführung von KI in Unternehmen.
AutoML-Plattformen können systematisch Hunderte von Algorithmenkombinationen testen, um diejenigen zu ermitteln, die die zuverlässigsten Ergebnisse liefern. Die Plattformen setzen außerdem einheitliche Best Practices für die Bewertung und Validierung durch und reduzieren so menschliche Fehler, die die Performance der Modelle beeinträchtigen könnten.
Allerdings müssen die Teams auch die Grenzen von AutoML beachten. Dazu gehören der fehlende fachliche Kontext, potenzielle Probleme bei der Interpretierbarkeit und eine starke Abhängigkeit von der Datenqualität.
Wenn AutoML mit dem richtigen Augenmerk auf Data Governance, Qualitätsinfrastruktur und menschliche Kontrolle umgesetzt wird, kann es ein leistungsfähiges Werkzeug sein, das die menschliche Expertise verstärkt und es Unternehmen ermöglicht, KI-Initiativen unternehmensweit zu skalieren.
Maschinelles Lernen ist ein weites Feld, bei dem Computern beigebracht wird, Muster aus Daten zu lernen und Prognosen zu erstellen. AutoML automatisiert die komplexen, zeitaufwendigen Aufgaben des maschinellen Lernens, wie die Auswahl von Algorithmen und die Abstimmung von Parametern. Auf den Punkt gebracht: Maschinelles Lernen ist die Wissenschaft und AutoML ist ein automatisiertes Toolset, das diese Modelle auch für andere Nutzende als Data Scientists zugänglich macht.
MLOps konzentriert sich auf die operativen Aspekte der Bereitstellung, Überwachung und Verwaltung von ML-Modellen in Produktionsumgebungen. AutoML automatisiert die anfängliche Entwicklung und das Training dieser Modelle. Während AutoML Ihnen dabei hilft, Modelle schnell zu entwickeln, sorgt MLOps dafür, dass sie in realen Anwendungen zuverlässig funktionieren und auch bei veränderten Bedingungen weiterhin eine gute Performance aufweisen.
Große Technologieanbieter wie Amazon, Google und Microsoft führen AutoML-Plattformen als Teil ihres Cloud-Portfolios. Andere Unternehmen wie DataRobot, H20.ai und IBM Watson bieten ähnliche Tools an. Unternehmen können außerdem die Vorteile kostenloser Open-Source-Python-Bibliotheken wie Auto-sklearn und TPOT nutzen, die scikit-learn-Workflows bei voller Kontrolle über die Anpassung automatisieren.
AutoML lässt sich in Foundation-Modelle und Large Language Models integrieren, sodass Nutzende vortrainierte Modelle optimieren können, anstatt sie von Grund auf neu entwickeln zu müssen. Derzeit entstehen bereichsspezifische AutoML-Tools für Spezialgebiete wie Computer Vision, Natural Language Processing und Zeitreihenprognosen. Moderne AutoML-Plattformen konzentrieren sich zudem stärker auf Erklärbarkeit, ethische KI-Überlegungen und hybride Ansätze, die automatisierte Prozesse mit menschlicher Expertise und Aufsicht kombinieren.
Monatlichen Newsletter abonnieren
Das Neueste zu Snowflakes Produkten, Experteneinblicken und Ressourcen direkt in Ihren Posteingang!