Die Interpretation der Bedeutung von Millionen von Wörtern gehört zu den vielen ungelösten geschäftlichen Herausforderungen – bis jetzt. Hier erfahren Sie, wie semantha, die Plattform zur semantischen Verarbeitung, dank der Snowflake Data Cloud und der Unterstützung von Accenture ihr volles Potenzial ausschöpfen kann.

semantha ist eine Plattform zur semantischen Verarbeitung, die in erstaunlichem Umfang und mit beeindruckender Geschwindigkeit menschliche Sprache versteht und verarbeitet. Was als Forschungsprojekt im Bereich Sprachverarbeitung und KI begann, wurde zu einem Start-up mit Data Scientists, Geschäftsleuten, KI-Forschern und Softwarearchitekten.

Die Plattform setzt neue Maßstäbe bei der Verarbeitung natürlicher Sprache (NLP, Natural Language Processing) mit einer vielfältigen, schnell wachsenden (und nahezu unbegrenzten) Anzahl von Anwendungsfällen – von der Automobilherstellung und der chemischen Industrie bis hin zu Personalwesen, Versicherungen, Recht, Finanzen und Behörden. Die Möglichkeiten von semantha gehen über den einfachen Textabgleich für dokumentengestützte Prozesse hinaus. Die Lösung versteht die Bedeutung von Wörtern in mehr als 50 Sprachen gleichzeitig und umfasst auch spezielle Modelle für Sprachkombinationen. 

„Das System kann überall dort eingesetzt werden, wo es zu viel Text und zu wenig Zeit gibt. Ich würde sagen, das betrifft 80 % der Arbeit von Unternehmen in diesen Bereichen“, so Dr. Sven Körner, Managing Director und Gründer von semantha. „Wir verwandeln unstrukturierte Daten wie Texte, Bilder und Videos in semantische Fingerabdrücke. Anschließend verarbeiten wir Informationen ähnlich wie Menschen. Der Unterschied zwischen semantha und Menschen ist, dass semantha Daten in Sekunden statt in Monaten verarbeitet.“

Die Suche nach dem richtigen Geschäftspartner 

Damit semantha das volle Potenzial für die mehr als 25 Kund:innen in einem Proof of Concept (PoC) ausschöpfen konnte, benötigte Körner einen unkonventionellen Datenplattform-Partner, der die erforderliche Geschwindigkeit und Skalierung gewährleisten konnte. „Wir haben im Netz vom ,Snowflake for Startups’-Programm erfahren und uns dann beim Aufbau einer einheitlichen Lösung dafür entschieden“, berichtet Körner. „Von unserer Seite aus haben wir alles superschnell für den Aufbau vorbereitet, und das Snowflake-Team war ebenso schnell bei der Sache.“

Körner ergänzt: „Wir haben von Snowflake jede Menge Unterstützung erhalten, ebenso wie Zugang zu Produktpreviews und Know-how von den Kundenbetreuer:innen. Wir verdanken ihnen so ziemlich alles. Das ist eine großartige Partnerschaft.“

Bei einem Gespräch mit dem Geschäftspartner Accenture ermittelten Körner und sein Team einen PoC-Anwendungsfall, der die Stärken der Lösung zum Vorschein bringen sollte: Benutzerfreundlichkeit und Anpassbarkeit, Geschwindigkeit und Skalierbarkeit. Semantisches Textverständnis kann den ESG-Prozess (Environmental and Social Governance) drastisch beschleunigen und verbessern. Dieser Prozess hilft den Interessengruppen beim Verständnis, wie Unternehmen mit Risiken und Chancen im Zusammenhang mit Nachhaltigkeitsthemen umgehen. 

„Viele unserer Kund:innen wollen die Fülle an Verträgen, toxikologischen Berichten und anderen wichtigen Belegen für ihren Nachhaltigkeits-Fußabdruck nutzen“, so Dr. Kate Sikavica, Leiterin der Abteilung ESG Measurement im Bereich Nachhaltigkeitstechnologie von Accenture. „Dabei ist Geschwindigkeit ein entscheidender Faktor, um die jüngsten Änderungen der europäischen Gesetzgebung einzuhalten. Es gibt keine Möglichkeit, all diese Dokumente von Hand zu analysieren. Snowflake ist die Lösung, um diese Dokumente zu organisieren, und semantha ist ein leistungsstarkes Tool, um daraus wertvolle Leistungskennzahlen für die Unternehmenssteuerung und die Einhaltung von Vorschriften zu ermitteln.“

Körner präzisiert: „Der PoC erforderte eine Kombination aus dem Know-how von Accenture in diesem Bereich und der technischen Kompetenz von Snowflake sowie unserer Fähigkeit, aus unstrukturierten Daten sinnvolle Erkenntnisse abzuleiten.“ 

Dank der umfassenden Kenntnisse über die ESG-Prozesse und juristischen Frameworks spielte Accenture eine entscheidende Rolle bei der Entwicklung des PoC. Als Snowflake-Partner war das Unternehmen eine naheliegende Wahl.

Blitzschnelle Entwicklung eines Prototyps

Auf der Grundlage einer reibungslosen Integration von semantha mit Snowflake entwickelte das Team blitzschnell ein natives Modell mit einem Open-Source-UI-Tool. „Mit Streamlit haben wir innerhalb einer Woche einen Prototyp auf Snowflake realisiert“, erklärt Körner. „Das ist beispiellos. Dabei haben wir mit echten Kundendaten gearbeitet. Wir haben die API für vernetzte Apps integriert und können sie als native App auf Snowflake ausführen.“ „Vor diesem Projekt hatte ich Grundkenntnisse in Snowflake, und ich bin ein versierter Python-Entwickler. Mit nur ein paar Beispieldokumenten und Leistungskennzahlen aus unserer Reporting-Gruppe sowie etwas Unterstützung durch das semantha-Team konnte ich die grundlegende Benutzeroberfläche und die grafische Gestaltung in einer einzigen Woche erstellen“, so Fynn Kölling, Data Engineer im Data & AI-Team von Accenture. 

Der ESG-Anwendungsfall von semantha birgt ein enormes Potenzial, da er Unternehmen dabei unterstützt, unstrukturierte Daten aus unterschiedlichen Quellen zu verbinden, zu finden und zu extrahieren, z. B. Nachrichten, Unternehmensmitteilungen und externe Berichte. Geschäftliche Benutzer:innen können Daten von verschiedenen Standorten und Quellen abrufen, wie z. B. die Datenbank einer Tochtergesellschaft auf einem anderen Kontinent oder ein kompliziertes juristisches Framework in einer anderen Sprache.

So kann die Plattform Unternehmen bei der Einhaltung der ESG-Berichtspflichten, die derzeit überwiegend händisch erledigt werden, unterstützen. Das spart Zeit, Aufwand und Ressourcen. Wenn die Kund:innen wissen, wo es Lücken in der Berichterstattung gibt, verringert sich auch das Risiko, und die Geschwindigkeit sowie die Genauigkeit steigen. Dadurch vermeiden die Unternehmen hohe Strafen und Imageschäden aufgrund der Nichteinhaltung von Vorschriften.

„Unser Plan lautet: Wir wollen unsere Kund:innen auf ihrem Weg in eine nachhaltige Zukunft unterstützen. Dazu brauchen sie eine einfache, skalierbare Möglichkeit, ESG-relevante Inhalte in ihren eigenen internen Quellen zu finden, wie z. B. Arbeitsverträge, Richtlinien und andere unstrukturierte Dokumente. Je einfacher die Integration des Tools ist, desto besser für unsere Kund:innen. Mit diesem Tool können wir uns auf die Inhalte und die Benutzerfreundlichkeit konzentrieren, anstatt uns um die IT-Einrichtung zu kümmern“, so Sikavica. 

Absolute Zuverlässigkeit durch Datenverarbeitung auf einer zentralen Plattform 

Das Prinzip für diesen Anwendungsfall gilt für alle Unternehmen mit dokumentengesteuerten Prozessen. Für Automobilhersteller, die einen RFI-Bericht (Request for Information) vorbereiten, ist die Möglichkeit, Dokumente mit mehreren hundert Seiten in Sekunden statt in Wochen zu scannen, ein entscheidender Vorteil. 

Personalabteilungen können über die Plattform unzählige Lebensläufe nach den gewünschten Kompetenzen durchsuchen, selbst wenn die genaue Terminologie nicht verwendet wird. Und für alle Unternehmen kann die Plattform die Zuordnung von Leistungskennzahlen zu komplizierten juristischen Frameworks vereinfachen. Körner erklärt dazu: „Im Grunde genommen bietet sich der Einsatz überall dort an, wo es zu viele Daten und nicht genug Informationen gibt. Es ist, als hätte man eine gute Fee auf der Schulter.“

Aufgrund des breit gefächerten Potenzials an Anwendungsfällen von semantha stehen Skalierbarkeit, Datenzugriff, Sicherheit und Geschwindigkeit ganz oben auf der Prioritätenliste. Deshalb war die Plattform von Snowflake eine naheliegende Wahl: Sie unterstützt kritische Workloads, einschließlich der nahtlosen Data Collaboration, sowohl innerhalb eines Unternehmens als auch im globalen Ökosystem.

Durch diese Partnerschaft kann semantha jedem Unternehmen, das Snowflake nutzt, Zugang zu den Daten gewähren. Die Daten verlassen nie die Data Cloud. Unternehmen können also sicher auf kontrollierte Daten, Tools, Anwendungen, andere Technologien und Datendienste zugreifen und diese gemeinsam nutzen. Dabei wird zuverlässig der Datenschutz gewahrt. 

Verbindung von Geschäft und IT

semantha baut auf der Snowflake-Plattform auf und wurde als verwaltete oder vernetzte Anwendung konzipiert. Snowflake-Kund:innen können die Anwendung innerhalb von Minuten in Betrieb nehmen, und mit einem API-Schlüssel können auch andere Interessent:innen die Anwendung nutzen. Der nächste Schritt besteht darin, daraus eine native App zu machen, auf die Snowflake-Kund:innen auf möglichst einfache Weise zugreifen können.

„Das Alleinstellungsmerkmal von semantha liegt in der Fähigkeit, technische und nicht-technische Kompetenzen zu verbinden“, so Körner. „Das ist auch der größte Vorteil der Software. Sie ist für alle geeignet, die mit großen Textmengen arbeiten, also für die gesamte Belegschaft.“

Körner weiter: „Sie funktioniert sofort nach der Installation. Eine Schulung ist nicht erforderlich. Und sie lässt sich direkt in die Daten unserer Kund:innen integrieren, wobei Snowflake eine wesentliche Rolle spielt. Damit lassen sich echte Kundenprobleme schnell lösen. Schnelle Ergebnisse und Änderungen sind das Wichtigste.“

Unbegrenzte Möglichkeiten 

Für Körner und sein Team kam die Entdeckung von Snowflake genau zum richtigen Zeitpunkt. „Ohne Snowflake hätten wir nicht annähernd das erreicht, was wir im gleichen Zeitrahmen erreichen konnten. Und das ist nur der erste von vielen Anwendungsfällen. Die Möglichkeiten sind endlos, ebenso wie die potenziellen Geschäftsverbindungen durch Snowflake.“

Neues von der Snowflake Startup Challenge: semantha ist einer der 10 Halbfinalisten des Wettbewerbs 2023! Mehr über die Top 10 Halbfinalisten der Startup Challenge erfahren Sie in unserem Blog. Die 3 Erstplatzierten werden im Mai bekannt gegeben.