Descriptive, Predictive, Prescriptive, Cognitive und nun auch Augmented Analytics. Bereits 2017 kündigte Gartner im jähr­lichen Hype Cycle einen neuen Trend im Bereich Analytics an. Kai Schulte über  den aktuellen Entwick­lungs­stand des Fachbereichs.

Augmented Analytics, das heißt zu Deutsch wörtlich „erwei­terte Analytik“. Konkret geht es um die Ergänzung klas­si­scher Analytics-Werkzeuge, um Dinge wie Smart Data Discovery, Machine Learning oder Natural-Language-Processing. Das Versprechen lautet, einfache Daten­vor­be­reitung, leichte Modell­er­stellung und schnelle Ergeb­nisse. Fach­an­wender nutzen Advanced Analytics, ohne tief­ge­hender Kennt­nisse in diesem Bereich zu besitzen. Das klingt viel­ver­spre­chend und spannend –  doch wo stehen Anbieter gängiger Lösungen heute?

Von Self-Service BI zu Self-Service AI?

Self-Service BI ist in der Unter­neh­menswelt inzwi­schen ein geläu­figer Begriff. Analy­tische Frage­stel­lungen sollen möglichst von den Personen beant­wortet werden, die die Fragen selbst stellen. Daten­vi­sua­li­sierung im ganzen Unter­nehmen, zu jeder Zeit, für Jedermann – so der Gedanke von Self-Service BI. Nun gesellen sich auto­ma­ti­sierte Daten­vor­be­reitung, maschi­nelles Lernen und KI-gestützte Analyse dazu.  Die Vision ist ein End-to-End Analytics-Prozess in einer einzigen Anwendung. Ist das die Evolution zur Self-Service AI?

Abbildung 1: Inte­gra­tions-Szenario mit Augmented Analytics (eigene Darstellung)

Augmented Data Preparation

Eine Grund­vor­aus­setzung für Analysen sind quali­tativ hoch­wertige Daten, ein bis heute in vielen Unter­nehmen proble­ma­ti­sches Thema. Oft sollen diese Analysen visua­li­siert und um Ergeb­nisse aus modernen Vorher­sa­ge­mo­dellen ergänzt werden. Um dies zu erreichen, müssen Daten aus verschie­denen Quellen beschafft und harmo­ni­siert werden, ein oftmals sehr aufwän­diger und kost­spie­liger Prozess.

An diesem Punkt soll Augmented Analytics Abhilfe schaffen. Mit statis­ti­schen Methoden (u.a. Machine Learning) sollen Daten aus hete­ro­genen Quellen harmo­ni­siert, trans­for­miert und analy­siert werden. War der klas­sische Weg die Verwendung separater ETL-Tools (Extract, Transform, Load), so werden diese Funk­tionen heute direkt in modernen Analytics-Tools inte­griert. Wichtige Erkennt­nisse über Zusam­men­hänge in Daten können deutlich schneller gewonnen werden, als mit manuellen Methoden. Das spart Kosten, Zeit und oft auch Nerven.

Machine Learning á la carte

Sind die Daten vorbe­reitet, wollen diese analy­siert und genutzt werden. Statt externer Anwen­dungen, verspricht Augmented Analytics die nahtlose Übergabe zu Modellen und Berichten. So kann ein Fach­an­wender eine daten­ge­triebene Lösung oder Analyse erstellen, ohne umfang­reiche Anwen­dungs­kennt­nisse zu besitzen. Klas­sische Modelle aus dem Bereich maschi­nelles Lernen, wie Klas­si­fi­kation und Regression, oder auch Zeit­rei­hen­ana­lysen, können umgesetzt und mit passenden Metriken evaluiert werden. Die dann erzeugten Ergeb­nisse werden direkt im Reporting verar­beitet und mittels moderner Techniken (z.B. mittels Sprach­in­ter­aktion, compu­ter­ge­stützte Muster­er­kennung) als Grundlage für Erkennt­nisse und Entschei­dungen abgerufen. Viele Lösungen am Markt bieten darüber hinaus die Möglichkeit die Vorher­sagen quali­tativ zu beur­teilen. Ein essen­zi­eller Bestandteil vieler Machine Learning Projekte.

Bedarfs­ge­rechte Erstellung von Analysen

Einen weiteren Teil von Augmented Analytics stellt Natural Language Processing dar. Dabei können  Anwender einem Programm eine Frage stellen, welche dann inter­pre­tiert wird, um die gewünschten Ergeb­nisse zu liefern. In der klas­si­schen Business Intel­li­gence wurden Infor­ma­ti­ons­be­darfs­ana­lysen erstellt, um Berichte explizit auf diese Fragen zuzu­schneiden. Mit Hilfe von Augmented Analytics wird ein Diagramm genau nach der formu­lierten Frage erstellt. Ein Beispiel dafür könnte sein: „Wie hoch war der Umsatz je Produkt­gruppe im Jahr 2019?“.

Die dahin­ter­lie­genden Konzepte lauten Natural Language Processing und Conver­sa­tional Analytics. Will man zusätzlich noch Muster erkennen und diese kommen­tieren lassen, so kommt Natural Language Generation zum Einsatz. Dabei werden die Daten entlang ihrer Struktur analy­siert und Abwei­chungen aufgezeigt.

Anbieter entwi­ckeln ihre Lösungen stetig weiter

In der Praxis gab es in den letzten Jahren eine konti­nu­ier­liche Entwicklung. Viele Anbieter wie SAP, Microsoft, Tableau, Qlik oder auch Firmen wie Sisense setzen verstärkt auf Elemente aus dem Bereich Augmented Analytics. Was 2017 noch theo­re­tische Konzepte waren, erhält eine immer größere Marktreife.

Mit Smart Insights und Smart Predict hat die SAP SE die Konzepte Augmented Intel­li­gence und Augmented Analysis im stra­te­gi­schen Flag­schiff der Analytics Cloud umgesetzt. Smart Predict hilft  Anwendern bei der Erstellung von Modellen des Maschi­nellen Lernens und bietet die Möglichkeit das Modell direkt auszu­werten. Smart Insights hingegen bietet die Möglichkeit zum Aufdecken von Zusam­men­hängen in den Daten. Dabei muss ein Analyst nicht erst alle Daten ausführlich obser­vieren, sondern erhält relevante Abwei­chungen und Verän­de­rungen schnell auf einen Blick. So gelingt die Analyse präziser und spart Zeit. Im Hause Microsoft findet man äqui­va­lente Features in den sog. Power Tools (u.a. Microsoft Power BI). Im Oktober wurde dem Feature Automated Machine Learning der Stand „general avai­la­bility“ zuge­wiesen. Es verlässt somit den Entwick­lungs­status und ist voll­wertig im Tool verfügbar.

Schaut man zu weiteren Anbietern, so findet man beim von Sales­force akqui­rierten Tableau Features wie Ask Data, Fuzzy-Matching und die Möglichkeit zur Inte­gration externer Add-Ons und den gängigen Program­mier­sprachen aus dem Bereich Data Science (R und Python). Natural Language Generation wird über eine API mit Erwei­te­rungen von Dritt­an­bietern angeboten. Ein Algo­rithmus erstellt auf Basis des Inputs Kommentare zu den gelie­ferten Daten und das Ganze binnen Sekunden.

Blackbox 4.0 oder ein Meilen­stein zur Data-Driven-Organization?

Augmented Analytics bietet Fach­an­wendern eine Möglichkeit komplexe Modelle und Elemente aus dem Bereich Advanced Analytics schnell und eigen­ständig zu erstellen. Doch Vorsicht ist geboten, denn um eine Eignung für den produk­tiven Betrieb zu gewähr­leisten, müssen die Ergeb­nisse solcher Modelle validiert werden. Die dafür notwen­digen Kennt­nisse fehlen dem über­wie­genden Teil der Fach­an­wender, womit die Fehler­an­fäl­ligkeit immens steigt. Hat ein Unter­nehmen Ressourcen aus dem Bereich Statistik oder Data Science zur Verfügung, empfiehlt es sich, die erstellten Modelle entspre­chend über­prüfen oder direkt von diesen erstellen zu lassen. Wie hier vorge­gangen wird, hängt stark vom vorlie­genden Anwen­dungsfall ab. Für Erfolg kann das Eine nicht ohne das Andere.

Abbildung 2: Das Ying & Yang der modernen Analytics-Orga­ni­sation (eigene Darstellung).

Augmented Analytics wird sich weiterentwickeln

Ob Augmented Analytics eine bahn­bre­chende Verän­derung wird oder ob einzelne Kompo­nenten, z.B. die Erstellung von ML-Modellen, weiterhin Data Scien­tisten und Machine Learning Engineers vorbe­halten bleiben, gilt es abzu­warten. Die tech­ni­schen Möglich­keiten entwi­ckeln sich jedoch stetig weiter und räumen Fach­an­wendern schon heute Lösungen ein, die früher nur mit manueller Program­mierung und umfang­reichen statis­ti­schen Kennt­nissen reali­sierbar waren. Letzt­endlich ist die entschei­dende Voraus­setzung für den unter­neh­mens­weiten Einsatz von Augmented Analytics eine saubere Daten­basis und eine betriebs­fähige Plattform, um Fach­an­wendern den Zugang zu neuen Tech­no­logien zu ermög­lichen. Inwieweit die Konzepte um- und einsetzbar sind, hängt dann vom jewei­ligen Anwen­dungsfall ab.

Gerne unter­stützen wir Sie bei der Auswahl und Evaluation der Lösungen verschie­dener Anbieter am Markt. Mit unserer Erfahrung in den Bereichen Reporting und Advanced Analytics sind wir in der Lage die nötigen Brücken zu schlagen und mit Ihnen gemeinsam zukunfts­fähig Lösung zu erarbeiten.