Kennt ihr das? Ich fotografiere gerne. Und im Laufe der Zeit haben sich tausende Bilder angesammelt, die auf der Festplatte versauern. Erschwerend kommt hinzu, dass ich im Raw-Format fotografiere. Die Inhalte sehe ich auf den ersten Blick nicht. Denn diese Dateien können nur mit Spezialprogrammen geöffnet werden.
Im übertragenen Sinne habe ich eine riesige Datenablage für Bilder geschaffen, wo ich nur ungefähr weiß, was für Aufnahmen ich haben müsste. Die Dateien sind mit rudimentären technischen Metadaten versehen, die über den Dateibrowser einsehbar sind.
Metadaten sind Beschreibungen für Daten: Entstehungsdatum, vielleicht sogar der Kameratyp, Objektiv usw. beschreiben die Datei näher, abhängig von der verwendeten Kamera. Aber aus dem Dateinamen werde ich nicht schlau. Über den Inhalt des Bildes gibt es keine Information.
Und nun stellt euch vor, ihr möchtet ein Familienalbum erstellen. Es ist eine zeitaufwändige und nervige Aufgabe, die Bilder zu suchen.
Abbildung 1: Verloren im Dateisystem
Anstatt sich auf die Gestaltung des Albums zu konzentrieren, suche ich lang nach den Bildern. Zum Glück gibt es Programme zur Bildverwaltung, die auch als Katalog bezeichnet werden können. Diese lesen die Bilder ein, extrahieren weitere technische Metadaten (bspw. Einstellungen bei der Aufnahme, GPS-Daten) und bieten auch die Möglichkeiten Bilder inhaltlich zu beschreiben. Dies können sie allerdings nicht automatisch machen.
Es bedarf in der Regel einer konsequenten, kontinuierlichen manuellen Pflege von fachlichen Metadaten. So könnt ihr Bilder mit verständlichen Attributen beschreiben, wie Art des Bildes, Stil, abgebildete Personen, Situation.
Es ist sogar möglich, die Bildobjekte auch hierarchisch zu strukturieren, im Sinne: Folgende Personen gehören einer Gruppe an. Dies ermöglicht es dann später einfach nach einer Gruppe zu suchen und alle dafür relevanten Bilder zu bekommen.
Um die Arbeit zu vereinfachen, helfen AI-Algorithmen bei der Gesichtserkennung (wenn man denn möchte) oder bei der Generierung der inhaltlich-beschreibenden Metadaten. Auf diese Weise wird jedes Bild markiert, auf dem eine Person abgebildet ist und die Bilder sind fortan nach dieser Person oder dem Objekt durchsuchbar.
Darüber hinaus unterstützen Funktionen bei der Pflege der Metadaten, um dies zeiteffizienter zu gestalten. Denn es ist nervige Zusatzarbeit, die Disziplin erfordert.
Aber ohne gut gepflegte Metadaten hilft einem die tollste Katalog-Technologie nichts. Und auch Funktionen für die Nutzung von Metadaten helfen, um sich bspw. ähnliche Bilder anzeigen zu lassen, eine umfassende Such- und Filterfunktion, Bewertungsfunktion für Bilder usw.
Abbildung 2: Die Funktionen eines Kataloges am Beispiel Adobe Lightroom CC
Hätte ich das gehabt, wäre mein Album heute schon fertig.
Bedeutung von Metadaten für Data & Analytics
Data und Analytics Teams stehen vor einer noch größeren Herausforderung: Denn in Unternehmen sind zahlreiche wertvolle Datenobjekte verteilt, die in weitaus mehr Anwendungsfällen genutzt werden als ein Fotoalbum.
Daten können…
- unterschiedliche Objekte wie Bilder, Datensätze, Berichte, Prozesse, analytische Modelle, Code, Audiodateien sein.
- strukturierte und unstrukturierte Formate besitzen.
- in unterschiedlichen Systemen gespeichert sein.
Darüber den Überblick zu behalten scheint eine unlösbare, zumindest hoch-komplexe Aufgabe. Dennoch ist dies die aktuelle Herausforderung und Basis, um datengetrieben agieren zu können. Dazu brauchen wir Daten. Und die müssen wir auch nutzen können.
Wir müssen wissen, was wir an Daten haben und wir müssen diese Daten im Unternehmenskontext inhaltlich verstehen können. Wir brauchen ein Verständnis dafür, wie diese Daten genutzt werden können und worauf wir achten müssen (wie z. B. Datenschutz, Abhängigkeiten). Metadaten schaffen hier Abhilfe und helfen bei der Beschreibung von Daten.
Zu beschreibende Datenobjekte | Beschreibende Elemente | |
Datensätze aus transaktionalen Systemen | Fachliche Beschreibungen | |
Berichte | Technische Beschreibungen | |
Analytische Modelle | Organisatorische | |
Prozesse | Zusatzinformationen | |
Systeme | Perspektiven auf Daten | |
Code | Informationen zur Verwendung | |
Datenintegrationsstrecken | Abhängigkeiten | |
Audio-, Bild-, Videodateien | Zugriffs- und | |
Dokumente | Datenschutzbestimmungen | |
IoT-Daten | Statistische Daten, bspw. zum Inhalt |
Kurz zurück zu den Bildern, liebe Freunde. Es ist richtig, dass euer Handy eure Bilder verwaltet und indexiert.
Aber nun stellt euch vor, ihr möchtet für den 80. Geburtstag eures Opas die tollsten Bilder aus der Verwandtschaft zusammentragen. Da wird es bereits schwieriger, die passenden Bilder in den Sammlungen von Tanten, Onkeln, Frau, Tochter, Sohn usw. zu finden.
Oder stellt euch vor, ihr wechselt euer Handy und verliert dabei eure Handy-spezifische Indexierung. Es kann auch sein, dass ihr Bilder auslagern müsst, da der Speicherplatz auf eurem Handy vielleicht doch mal knapp wird.
In Unternehmen ist es nicht anders: Eine Applikation für sich mag seine Metadaten im Griff haben. Aber systemübergreifende Sichten auf Daten brauchen Integration.
Genau an dem Punkt sollte man das Thema Metadaten strategischer angehen und steuern, welche Informationen benötigt werden, für wen, wann und zu welchem Zeitpunkt und auch über Werkzeugunterstützung nachdenken.
Und dabei unterstütze ich Unternehmen. Damit diese in der Lage sind Fragen zu beantworten, wie:
Dieser Beitrag ist zuerst hier erschienen. Mit freundlicher Genehmigung des Autors.
Der Beitrag ist außerdem Teil des neuen BARC Guide Data, BI & Analytics 2021, der ab sofort online hier heruntergeladen werden kann. Der Katalog stellt 50 führende Anbieter und Dienstleister von BI & Datenmanagement Tools vor. Die Produktübersicht umfasst mehr als 800 Software-Tools (Online Version hier).
Timm Grosser ist Senior Analyst Data & Analytics am Business Application Research Center (BARC) mit den Schwerpunkten auf BI, Datenmanagement und Big Data. Seine Kernkompetenzen sind entscheidungsunterstützende Informationssysteme mit einem besonderen Fokus auf strategischen Themen im Datenmanagement und Big Data. Er unterstützt Unternehmen in der Definition und Umsetzung ihrer BI- und Big-Data-Strategie, -Organisation, -Architektur und -Werkzeugauswahl. Er ist ein gefragter Redner auf Konferenzen und Seminaren sowie Autor zahlreicher BARC-Marktstudien und Fachartikel.
Kontakt: tgrosser@barc.de, Tel.: +49 931/880 651-0 | LinkedIn
Aktuelle Beiträge
-
Künstliche Intelligenz braucht ethische Leitplanken
-
Alternative Data: Warum lohnt sich der Blick über den Daten-Tellerrand?
-
Data Science-Projekte: Drei Hindernisse auf dem Weg zum Erfolg
-
"Es fällt vielen Branchen schwer, die Potenziale der Digitalisierung zu erkennen."
-
Die IBM KI-Leiter: Mit KI ganz nach oben
-
Von einfachen Data Catalogs zu intelligenten Systemen
BI & Big Data Events
News
Weitere News-
Neues TDWI Poster "Process Mining - Datenanalyse in Prozessen zur digitalen Prozessoptimierung"
-
Prognosen 2022: So verschafft smarte Datennutzung Unternehmen Wettbewerbsvorteile
-
Flughafen München: Weniger Lärm und Schadstoffe dank Data Analytics
-
Digitalisierung: Sieben von zehn Deutschen halten Politik für ahnungslos
-
CoPlanner erweitert seine Geschäftsführung
-
Die Kaufprioritäten der Analytics- und BI-Käufer sollten datengetrieben sein