Verkehrsbewegungen, Wetteraufzeichnungen, Wasserproben – alternative Daten zu erfassen, zusammenzuführen und auszuwerten, gehört zu den BI- und Daten-Trends, die im Jahr 2021 an Bedeutung gewinnen werden. Bislang ungenutzte Datenquellen könnten künftig dafür sorgen, Auffälligkeiten, Anomalien oder mögliche Bedrohungen noch präziser zu erkennen – und entsprechend zu reagieren.
Wäre die bekannte Entwicklung von COVID-19 vermeidbar gewesen? Hätte man früher erkennen können, dass eine Infektionskrankheit dieses Ausmaßes auf die Welt zurollt? Die Rede ist nicht von der sprichwörtlichen Kristallkugel, sondern von den Möglichkeiten, die sich mit der Nutzung von alternativen Daten (Alternative Data) bieten. Und tatsächlich: Bringt man Auswertungen von Verkehrsdaten rund um die Krankenhäuser in Wuhan mit der Stichwortsuche von Internetnutzern aus dieser Gegend zu bestimmten Krankheitssymptomen in Zusammenhang, dann deutet vieles darauf hin, dass das Virus schon Ende 2019 grassierte. Lässt sich aus dieser Erfahrung heraus für die Zukunft eine Art Frühwarnsystem für Pandemien oder andere unerwartete Ereignisse entwickeln?
Alternative Data – was steckt dahinter?
Alternative Daten sind unkonventionelle bzw. nicht marktbezogene Daten, die in der Regel extern erhoben werden, also nicht aus dem unternehmenseigenen oder üblicherweise verwendeten Datenpool stammen. Sie liefern einerseits zusätzliche Informationen und ermöglichen es andererseits, bereits vorhandene Daten in neuem Licht zu betrachten. In der Finanzbranche stützt man sich schon seit langem auf eine Fülle von alternativen Daten. Satellitenbilder, Verkehrsdaten, Anzahl von Klicks und Analyse von Suchbegriffen im Internet, Buchungszahlen für Restaurants und Lieferservices, Kreditkarten-, Wetter- und Bewegungsdaten und Social-Media-Posts – die alternativen Datenquellen sprudeln reichlich. Mit ihrer Hilfe können Investoren die Trends in der Wirtschaft und auf den Märkten schneller, effizienter und vor allen Dingen umfassender erkennen, als dies allein mit herkömmlichen Bilanzen und Unternehmenszahlen möglich wäre.
Quellen für Alternative Data anzapfen
Immer mehr Unternehmen entdecken den Wert alternativer Daten. Sie sehen sich jedoch mit der Herausforderung konfrontiert, externe Daten in einer anonymisierten oder zumindest so differenzierten Form zu bekommen, dass sie im Sinne der Datenschutz-Grundverordnung ohne Bedenken eingesetzt werden können. Vor allem in Europa gibt es zahlreiche Regularien. Interessierte sollten die Möglichkeit prüfen, anonymisierte Daten über sogenannte Datenhändler zu kaufen. Aber auch Mobilfunkanbieter sowie Institute und Labore, die etwa mit Hilfe von Sensoren die Luft- und Wasserqualität messen, können Daten zuliefern. Wichtig ist, dass es sich dabei um nicht sensible Daten handelt: Rückschlüsse auf einzelne Personen sind dann nicht möglich und auch nicht nötig. Vielmehr geht es darum, mit Hilfe von moderner Datenanalyse neue Erkenntnisse über größere Zusammenhänge zu gewinnen.
Einsatzbereiche für Alternative Data
In der Gesundheitsversorgung, im Einzelhandel oder im B2B-Bereich – Unternehmen über alle Branchen hinweg können von Alternative Data profitieren. So verlassen sich Markenartikler bei ihren Entscheidungen über die Einführung von Produktneuheiten zu einem großen Teil auf die Reaktionen aus den sozialen Medien. Für die Pharmaindustrie sind anonymisierte Diagnosen aus Arztpraxen und Krankenhäusern oder Medikamentenabverkäufe aus Apotheken interessant. Auch die Verteilung von knapper Schutzausrüstung in Hotspots zu Beginn der Corona-Pandemie hätte man mit Alternative Data sicherlich optimieren können. Weiteres Potenzial wartet darauf, von Behörden entdeckt zu werden: Bewegungs- und Verkehrsflussdaten liefern eine valide Grundlage für Stadtplaner, um beispielsweise über den Standort von Ampeln oder Fußgängerüberwegen zu entscheiden, Temporegulierungen festzulegen und insgesamt eine smarte Verkehrssteuerung einzuführen. Auch bei der Lösung globaler Herausforderungen wie Klimawandel, Ressourcenknappheit oder Pandemien kann Alternative Data künftig eine zentrale Rolle spielen. Schon jetzt werden Datenanalysen herangezogen, um die Verfügbarkeit von Wasser auf unserer Erde zu überprüfen. Mit Alternative Data könnte man solche Untersuchungen deutlich differenzierter gestalten: Indem man den Grundwasserstand an verschiedenen Orten misst, die gefallenen Regenmengen und Trockenphasen miteinbezieht und zahlreiche weitere Parameter miteinander in Korrelation bringt, lassen sich insgesamt genauere Prognosen treffen.
Ordnung in den Daten-Dschungel bringen
In vielen Bereichen, etwa bei Sensordaten im Bereich IoT, gilt es eine wahre Flut an Informationen zu verarbeiten. Künstliche Intelligenz kann hier unterstützen, um Ausreißer oder Anomalien zu identifizieren, die auf interessante Zusammenhänge hinweisen. Bei Social-Media-Beiträgen helfen Textanalysewerkzeuge, aus der Fülle an positiven und negativen Kommentaren über Sentiment-Analysen ein aussagekräftiges Stimmungsbild zu zeichnen. Diese Informationen lassen sich mit Analyse- und Visualisierungstechniken aufbereiten und für gezielte Maßnahmen – etwa zur Steigerung der Kundenzufriedenheit – verwerten. Doch nach wie vor macht die manuelle Arbeit beim Sammeln und Aufbereiten von alternativen Daten den Löwenanteil aus, da das Material vielfach unstrukturiert und in unterschiedlichen Formaten vorliegt. Wollte man beispielsweise für eine Corona-Studie Rohdaten aus den Gesundheitsämtern heranziehen, bekäme man es mit vielen Einzelquellen zu tun, die als PDF, als Exceldatei oder in diversen Datenbanken zur Verfügung stehen. Künstliche Intelligenz und Algorithmen tun sich mit diesen Voraussetzungen noch schwer. Doch je mehr das Thema Alternative Data an Bedeutung gewinnt, desto passgenauer werden die Tools zur automatisierten Datenauswahl und -strukturierung. Zugleich verleihen niedrige Verarbeitungskosten und ausgereiftere Techniken der Nutzung von Alternative Data weiteren Auftrieb. Wichtige Entwicklungen sind hier Knowledge Graphs, Data Fabrics, Verarbeitung natürlicher Sprache (NLP), Explainable Artificial Intelligence und Analysen für alle Arten von Inhalten. Auch Datenkataloge, die große Datenmengen zentralisieren, könnten in Zukunft alternative Daten leichter auffindbar, besser zugänglich und schneller durchsuchbar machen.
Schnellere Datenintegration für vielfältige Analysen
Intelligente Softwarelösungen ermöglichen es, heterogene Daten unterschiedlichster Herkunft schnell, systemübergreifend zusammenzuführen und quasi nebenbei zu lesen: Mit Hilfe von Datenreplikationen werden dabei große Datenmengen aus Tausenden von Quellen in Big-Data-Plattformen übertragen. Die in diesen Data Lakes gespeicherten Daten lassen sich für grafische Visualisierungen, echtzeitorientierte Analysen und Machine Learning vielfältig einsetzen. Der Vorteil: Im Data Lake können strukturierte, semistrukturierte und unstrukturierte Daten gespeichert werden. Nach dem Prinzip „Schema-on-Read“ werden die Daten erst dann formatiert und aufbereitet, wenn sie für eine konkrete Analyse gebraucht werden. Doch aufgepasst: Der Data Lake kann bei nicht fachgerechter Pflege zum Data Swamp „versumpfen“. Wer den Aufwand scheut, hat die Möglichkeit, den Data Lake in die Cloud auszulagern und die Einrichtung und Verwaltung an den Dienstleister zu übertragen.
Data Literacy als Schlüssel – (nicht nur) zu Alternative Data
Machine Learning und Künstliche Intelligenz sind unverzichtbare Hilfsmittel für den Einsatz von Alternative Data. Eine Bildanalyse-Software beispielsweise kann schnell und zuverlässig unzählige Bilder im Internet nach dem Unternehmenslogo durchforsten – das menschliche Auge wäre damit heillos überfordert. Aber es braucht doch weiterhin menschliche Intuition, Urteilsvermögen und Kreativität als Kick-off, um auf relevante Daten aufmerksam zu werden, diese einzuordnen, zu analysieren und Aktionen daraus abzuleiten. Um auf das Beispiel Wuhan zurückzukommen: Damit die Kombination unterschiedlichster Daten künftig nicht nur im Rückblick, sondern vor allem auch im Ausblick wichtige Impulse liefern kann, muss der richtige Umgang mit den zahlreichen Datenquellen erlernt werden – Stichwort Data Literacy. Die Spreu vom Weizen zu trennen, nicht auf klassische Fallstricke der Statistik hereinzufallen und kritisch und sinnvoll mit alternativen Daten umzugehen, sollte nicht nur eine Handvoll Experten können. Breit angelegte und kontinuierliche Schulungen und Weiterbildungen aller Mitarbeiterinnen und Mitarbeiter sind nötig, um sowohl die Potenziale der unternehmenseigenen als auch von alternativen Daten zu heben und den digitalen Switch vom reaktiven zum präaktiven Handeln erfolgreich zu meistern.
Aktuelle Beiträge
-
Künstliche Intelligenz braucht ethische Leitplanken
-
Alternative Data: Warum lohnt sich der Blick über den Daten-Tellerrand?
-
Data Science-Projekte: Drei Hindernisse auf dem Weg zum Erfolg
-
"Es fällt vielen Branchen schwer, die Potenziale der Digitalisierung zu erkennen."
-
Die IBM KI-Leiter: Mit KI ganz nach oben
-
Von einfachen Data Catalogs zu intelligenten Systemen
BI & Big Data Events
News
Weitere News-
Neues TDWI Poster "Process Mining - Datenanalyse in Prozessen zur digitalen Prozessoptimierung"
-
Prognosen 2022: So verschafft smarte Datennutzung Unternehmen Wettbewerbsvorteile
-
Flughafen München: Weniger Lärm und Schadstoffe dank Data Analytics
-
Digitalisierung: Sieben von zehn Deutschen halten Politik für ahnungslos
-
CoPlanner erweitert seine Geschäftsführung
-
Die Kaufprioritäten der Analytics- und BI-Käufer sollten datengetrieben sein