Semantic Data Management – Ariadnes Wollknäuel der IT — Empolis Blog

Semantic Data Management – Ariadnes Wollknäuel der IT

0

Bunte Wollknäuel-Fäden als Symbol für Semantic Data Management

Der Ariadnefaden spielt in der griechischen Mythologie eine besondere Rolle. Prinzessin Ariadne, Tochter des Königs Minos, schenkte Theseus diesen Faden, um ihm dabei zu helfen, dass er unbeschadet den Weg durch das Labyrinth zu Minotaurus finden und diesen anschließend töten konnte.

In seiner übertragenen Bedeutung könnte der Ariadnefaden genauso gut ein Synonym für die Lösungen zum semantischen Datenmanagement sein. Semantik in der IT befasst sich im Schwerpunkt mit der inhaltlichen Analyse der Daten und mit der Erkennung von natürlichsprachlichen Elementen. Damit kann die Bedeutung von Daten automatisiert erkannt und für weitere Analysen verwendet werden.

Damit schlägt sich auch schon die Brücke von Ariadnes Faden zum semantischen Datenmanagement, denn mit dem Wachstum der Datenmenge, die von Unternehmen erzeugt wird, werden klassische Datenmanagement-Lösungen, wie zum Beispiel ordnerbasierende Dateisysteme oder Datenbanken, nicht mehr ausreichen.

Semantic Data Management wird für die Verwaltung der allgemeinen Data Governance, der Versionierung, der Bewertungskriterien für die Datenqualität, wie auch der Datenabgleichsregeln eingesetzt. Anbieter von Lösungen für diese Aufgaben stellen sicher, dass ihre Software methodisch, konzeptionell, organisatorisch und technisch geeignet ist, dies auch mit sehr großen Datenvolumina zu realisieren.

In Deutschland sind wir dabei in einer vergleichsweise günstigen Position: Viele Fehler, wie die vorschnelle Hadoop-Implementierung oder das frühzeitige Aufspringen auf den In-Memory-Bandwagon, haben andere schon gemacht.

Semantic Data Management wird (fast) jeder brauchen

 Jetzt ist die Zeit auch reif für die entsprechenden Maßnahmen, denn Anwender, die jetzt nicht engagiert mit dem Datenmanagement für ihre ständig komplexer werdenden Bestände an Social-Media-Daten, Unternehmensdaten, Messdaten, Bildern, Filmen und Tönen, beginnen, sind existentiell bedroht. In manchen Branchen kommt das Ende sicherlich schon recht bald, in anderen vielleicht etwas schleichender, dafür umso schmerzhafter.

Schon spürbar sind diese existentiellen Veränderungen bei Versicherungen: Der ehemalige CIO der Munich Re, Dr. Rainer Janßen⃰, hat schon vor Jahren das Ende der Versicherungen durch die Digitalisierung prophezeit. Denn spätestens dann, wenn selbstfahrende Autos keine Unfälle mehr bauen, ist zum Beispiel das Modell der Kfz-Versicherung obsolet.

Auch der Handel und der Telekommunikationssektor unterliegen einem heftigen Umbruch. Der Online-Versandhandel bedroht den stationären Handel. Bald wird es Versorgungsunternehmen, das Gesundheitswesen und die Logistik-Branche treffen, wenn die Unternehmen in diesen Branchen keine Maßnahmen für die Beherrschung ihrer Daten ergreifen. In diesen Branchen entstehen sehr viele Daten von sehr viel größeren Mengen an Betriebs- bis zu Verbrauchs- und Kundendaten. Diese Daten müssen beherrscht werden. Die gute alte Datenbank und Excel als Frontend werden hier nicht mehr ausreichen.

Viele Leser werden sich an die anfänglichen Definitionen von „Big Data“ erinnern. Drei V standen im Mittelpunkt, oft ergänzt durch ein viertes V. Die ersten drei V waren Volume, Velocity und Variety – das vierte V variierte mitunter, aber oft stand es für Veracity. In Summe war damit gemeint, dass Daten und Informationen miteinander verknüpft werden, die ursächlich nicht in einem Zusammenhang stehen. Vor diesem Hintergrund gewinnen Methoden und Verfahren an Bedeutung, die hier die Fäden zusammenhalten.

 

Gemälde (Öl auf Leinwand) von Niccolo Bambini: Ariadne und Theseus

Ariadne überreicht dem Helden Theseus den Faden, mit dem dieser aus dem Labyrinth des Minotaurus herausfinden kann. (Gemälde „Ariadne und Theseus“ von Niccolo Bambini)

Metadaten spinnen den roten Faden für das Datenlabyrinth

Fortgeschrittene Datenmanagementlösungen werden zum modernen Faden der Ariadne. Sie führen aus dem Labyrinth der unstrukturierten, strukturierten und gemischt strukturierten Daten. Gesponnen wird der rote Faden mit den Metadaten, mit denen Dateien und Datensätze versehen werden. Dafür sind neue Datenmanagementlösungen erforderlich. Diese können dann beispielsweise technische Messdatenreihen bereits mit Informationen ergänzen, die der Analytics-Software nicht nur mitteilen, ob es sich um Bilder oder Töne handelt, sondern zum Beispiel auch auffällige Datensätze als solche markieren – die Ausreißer in der Messreihe.

Mit solchen fortgeschrittenen Lösungen wird es möglich, Daten aus unterschiedlichen Quellen miteinander zu analysieren und die gegebenenfalls vorhandenen kausalen Zusammenhänge zu erkennen.

Voraussetzungen für fortgeschrittene Analytics-Anwendungen und Applikationen mit künstlicher Intelligenz sind die Datenqualität und die Datenintegrität. Im einfachsten Falle können semantische Datenmanagementlösungen dann zum Beispiel Dubletten erkennen und löschen, und zwar auch dann, wenn die Daten womöglich unterschiedlich geschrieben sind. Denken Sie nur einmal an Kundenstammdaten für Schröder, Schröter und Schroeder: Wo ist die Doppelung? Wann sind es unterschiedliche Kunden, Patienten oder Antragsteller?

Daten als Handelsware

Daten und die Ergebnisse von Datenanalysen werden in den nächsten Jahren selbst zu einer Handelsware. Das heißt, dass die Daten nicht mehr nur für bessere oder neue Einsichten in die eigenen Unternehmensprozesse verwendet werden, sondern in roher oder aufbereiteter Form auch anderen Nutzern angeboten werden. Dann wird die Anreicherung der Daten – auch mit natürlichsprachlichen Analysen und Lösungen für das semantische Datenmanagement – eine ganz essentielle Sache.

Im Kontext großer Mengen komplexer und unstrukturierter Daten werden wir ohne intelligente Datenmanagementsoftware nicht mehr auskommen. Dann lassen sich tatsächlich der Inhalt und der Kontext der Daten erkennen. Erst so wird ein wirklicher Nutzen aus den immer größer werdenden Datenbeständen in den Unternehmen und in den immer häufiger auftauchenden offenen Daten-Pools – Stichwort Linked Open Data – entstehen. Damit lassen sich die Daten methodisch, konzeptionell, organisatorisch und technisch in den Geschäftsprozessen nutzen.

Die Spinnmaschinen für den modernen Faden der Ariadne, mit dem Theseus aus dem Datenlabyrinth herausfindet, sind die intelligenten, semantischen Datenmanagementlösungen. Theseus war übrigens auch der Name eines vom Bundesministerium für Wirtschaft und Technologie initiierten Forschungsprogramms für Daten- und Wissensmanagement.

Ganz analog schuf Friedrich Dürrenmatt 1985 seine Ballade „Minotaurus“ um die Geschichte mit Theseus, dem Minotaurus und dem Faden der Ariadne: Metadaten-Attribut „lesenswert“.

 

⃰ Treffen Sie Dr. Rainer Janßen bei seinem Vortrag „Wie kann ich mit natürlicher Intelligenz managen bis die KI kommt?“ auf dem Executive Forum 2018 am 15. und 16.März im dbb forum berlin

 

 

Sie möchten alle Informationen rund um KI und Big Data druckfrisch erhalten? Das Blog-Abo ist für Sie da.

Teilen:

Über den Autor

Heiko Henkes

Heiko Henkes ist als Director Advisor bei Experton Group (ISG) für die strategische Unternehmens- und Advisor-Führung tätig. Er leitet darüber hinaus die Zusammenführung von IT Trendthemen im Kontext der digitalen Transformation und tritt als Keynote Speaker zu aktuellen und künftigen IT-Trends auf. Seit 2013 berät Herr Henkes sowohl ICT-Anbieter- als auch -Anwender in aktuellen Fokusthemen der digitalen Transformation wie Social Business, Cloud-Computing und Mobile Enterprise.

Sagen Sie Ihre Meinung!

Ich habe die Datenschutzbestimmungen gelesen, akzeptiere diese und stimme der Veröffentlichung der eingetragenen Daten zu