Augmented Analytics –Technologie statt Data Scientist?

Descriptive, Predictive, Prescriptive, Cognitive und nun auch Augmented Analytics. Bereits 2017 kündigte Gartner im jährlichen Hype Cycle einen neuen Trend im Bereich Analytics an. Kai Schulte über  den aktuellen Entwicklungsstand des Fachbereichs.

Augmented Analytics, das heißt zu Deutsch wörtlich „erweiterte Analytik“. Konkret geht es um die Ergänzung klassischer Analytics-Werkzeuge, um Dinge wie Smart Data Discovery, Machine Learning oder Natural-Language-Processing. Das Versprechen lautet, einfache Datenvorbereitung, leichte Modellerstellung und schnelle Ergebnisse. Fachanwender nutzen Advanced Analytics, ohne tiefgehender Kenntnisse in diesem Bereich zu besitzen. Das klingt vielversprechend und spannend –  doch wo stehen Anbieter gängiger Lösungen heute?

Von Self-Service BI zu Self-Service AI?

Self-Service BI ist in der Unternehmenswelt inzwischen ein geläufiger Begriff. Analytische Fragestellungen sollen möglichst von den Personen beantwortet werden, die die Fragen selbst stellen. Datenvisualisierung im ganzen Unternehmen, zu jeder Zeit, für Jedermann – so der Gedanke von Self-Service BI. Nun gesellen sich automatisierte Datenvorbereitung, maschinelles Lernen und KI-gestützte Analyse dazu.  Die Vision ist ein End-to-End Analytics-Prozess in einer einzigen Anwendung. Ist das die Evolution zur Self-Service AI?

Abbildung 1: Integrations-Szenario mit Augmented Analytics (eigene Darstellung)

Augmented Data Preparation

Eine Grundvoraussetzung für Analysen sind qualitativ hochwertige Daten, ein bis heute in vielen Unternehmen problematisches Thema. Oft sollen diese Analysen visualisiert und um Ergebnisse aus modernen Vorhersagemodellen ergänzt werden. Um dies zu erreichen, müssen Daten aus verschiedenen Quellen beschafft und harmonisiert werden, ein oftmals sehr aufwändiger und kostspieliger Prozess.

An diesem Punkt soll Augmented Analytics Abhilfe schaffen. Mit statistischen Methoden (u.a. Machine Learning) sollen Daten aus heterogenen Quellen harmonisiert, transformiert und analysiert werden. War der klassische Weg die Verwendung separater ETL-Tools (Extract, Transform, Load), so werden diese Funktionen heute direkt in modernen Analytics-Tools integriert. Wichtige Erkenntnisse über Zusammenhänge in Daten können deutlich schneller gewonnen werden, als mit manuellen Methoden. Das spart Kosten, Zeit und oft auch Nerven.

Machine Learning á la carte

Sind die Daten vorbereitet, wollen diese analysiert und genutzt werden. Statt externer Anwendungen, verspricht Augmented Analytics die nahtlose Übergabe zu Modellen und Berichten. So kann ein Fachanwender eine datengetriebene Lösung oder Analyse erstellen, ohne umfangreiche Anwendungskenntnisse zu besitzen. Klassische Modelle aus dem Bereich maschinelles Lernen, wie Klassifikation und Regression, oder auch Zeitreihenanalysen, können umgesetzt und mit passenden Metriken evaluiert werden. Die dann erzeugten Ergebnisse werden direkt im Reporting verarbeitet und mittels moderner Techniken (z.B. mittels Sprachinteraktion, computergestützte Mustererkennung) als Grundlage für Erkenntnisse und Entscheidungen abgerufen. Viele Lösungen am Markt bieten darüber hinaus die Möglichkeit die Vorhersagen qualitativ zu beurteilen. Ein essenzieller Bestandteil vieler Machine Learning Projekte.

Bedarfsgerechte Erstellung von Analysen

Einen weiteren Teil von Augmented Analytics stellt Natural Language Processing dar. Dabei können  Anwender einem Programm eine Frage stellen, welche dann interpretiert wird, um die gewünschten Ergebnisse zu liefern. In der klassischen Business Intelligence wurden Informationsbedarfsanalysen erstellt, um Berichte explizit auf diese Fragen zuzuschneiden. Mit Hilfe von Augmented Analytics wird ein Diagramm genau nach der formulierten Frage erstellt. Ein Beispiel dafür könnte sein: „Wie hoch war der Umsatz je Produktgruppe im Jahr 2019?“.

Die dahinterliegenden Konzepte lauten Natural Language Processing und Conversational Analytics. Will man zusätzlich noch Muster erkennen und diese kommentieren lassen, so kommt Natural Language Generation zum Einsatz. Dabei werden die Daten entlang ihrer Struktur analysiert und Abweichungen aufgezeigt.

Anbieter entwickeln ihre Lösungen stetig weiter

In der Praxis gab es in den letzten Jahren eine kontinuierliche Entwicklung. Viele Anbieter wie SAP, Microsoft, Tableau, Qlik oder auch Firmen wie Sisense setzen verstärkt auf Elemente aus dem Bereich Augmented Analytics. Was 2017 noch theoretische Konzepte waren, erhält eine immer größere Marktreife.

Mit Smart Insights und Smart Predict hat die SAP SE die Konzepte Augmented Intelligence und Augmented Analysis im strategischen Flagschiff der Analytics Cloud umgesetzt. Smart Predict hilft  Anwendern bei der Erstellung von Modellen des Maschinellen Lernens und bietet die Möglichkeit das Modell direkt auszuwerten. Smart Insights hingegen bietet die Möglichkeit zum Aufdecken von Zusammenhängen in den Daten. Dabei muss ein Analyst nicht erst alle Daten ausführlich observieren, sondern erhält relevante Abweichungen und Veränderungen schnell auf einen Blick. So gelingt die Analyse präziser und spart Zeit. Im Hause Microsoft findet man äquivalente Features in den sog. Power Tools (u.a. Microsoft Power BI). Im Oktober wurde dem Feature Automated Machine Learning der Stand „general availability“ zugewiesen. Es verlässt somit den Entwicklungsstatus und ist vollwertig im Tool verfügbar.

Schaut man zu weiteren Anbietern, so findet man beim von Salesforce akquirierten Tableau Features wie Ask Data, Fuzzy-Matching und die Möglichkeit zur Integration externer Add-Ons und den gängigen Programmiersprachen aus dem Bereich Data Science (R und Python). Natural Language Generation wird über eine API mit Erweiterungen von Drittanbietern angeboten. Ein Algorithmus erstellt auf Basis des Inputs Kommentare zu den gelieferten Daten und das Ganze binnen Sekunden.

Blackbox 4.0 oder ein Meilenstein zur Data-Driven-Organization?

Augmented Analytics bietet Fachanwendern eine Möglichkeit komplexe Modelle und Elemente aus dem Bereich Advanced Analytics schnell und eigenständig zu erstellen. Doch Vorsicht ist geboten, denn um eine Eignung für den produktiven Betrieb zu gewährleisten, müssen die Ergebnisse solcher Modelle validiert werden. Die dafür notwendigen Kenntnisse fehlen dem überwiegenden Teil der Fachanwender, womit die Fehleranfälligkeit immens steigt. Hat ein Unternehmen Ressourcen aus dem Bereich Statistik oder Data Science zur Verfügung, empfiehlt es sich, die erstellten Modelle entsprechend überprüfen oder direkt von diesen erstellen zu lassen. Wie hier vorgegangen wird, hängt stark vom vorliegenden Anwendungsfall ab. Für Erfolg kann das Eine nicht ohne das Andere.

Abbildung 2: Das Ying & Yang der modernen Analytics-Organisation (eigene Darstellung).

Augmented Analytics wird sich weiterentwickeln

Ob Augmented Analytics eine bahnbrechende Veränderung wird oder ob einzelne Komponenten, z.B. die Erstellung von ML-Modellen, weiterhin Data Scientisten und Machine Learning Engineers vorbehalten bleiben, gilt es abzuwarten. Die technischen Möglichkeiten entwickeln sich jedoch stetig weiter und räumen Fachanwendern schon heute Lösungen ein, die früher nur mit manueller Programmierung und umfangreichen statistischen Kenntnissen realisierbar waren. Letztendlich ist die entscheidende Voraussetzung für den unternehmensweiten Einsatz von Augmented Analytics eine saubere Datenbasis und eine betriebsfähige Plattform, um Fachanwendern den Zugang zu neuen Technologien zu ermöglichen. Inwieweit die Konzepte um- und einsetzbar sind, hängt dann vom jeweiligen Anwendungsfall ab.

Gerne unterstützen wir Sie bei der Auswahl und Evaluation der Lösungen verschiedener Anbieter am Markt. Mit unserer Erfahrung in den Bereichen Reporting und Advanced Analytics sind wir in der Lage die nötigen Brücken zu schlagen und mit Ihnen gemeinsam zukunftsfähig Lösung zu erarbeiten.