Semantische Suche: Was ist das eigentlich? [Techniken der künstlichen Intelligenz] - Empolis Blog

Semantische Suche: Was ist das eigentlich? [Techniken der künstlichen Intelligenz]

0

Künstliche Intelligenz ist in aller Munde. Aber was ist das eigentlich genau? Welche KI-Technologien gibt es überhaupt? Und was lässt sich damit anstellen? Im folgenden Beitrag betrachten wir dafür die Semantische Suche.

Definition

Die semantische Recherche ist ein Verfahren des Information Retrieval (Zu Deutsch: Informationsgewinnung), das die inhaltliche Bedeutung der Suchanfrage berücksichtigt.
Durch die Einbeziehung von Domänenwissen in Form von Synonymen, Ähnlichkeiten und Wissensmodellen (Ontologien und Taxonomien), kann die Suchanfrage mit einer höheren Präzision relevante „Treffer“ im Text liefern – ohne, dass der Suchende dieses explizit angibt.

Semantische Suche: Was ist das eigentlich?

Im Gegensatz zu einer zeichen- oder wortbasierten Recherche, bei der nur Buchstaben auf eine syntaktische Übereinstimmung geprüft und entsprechende Treffer ausgegeben werden, wird bei einer semantischen Recherche versucht, die Bedeutung oder den Sinn der Anfrage zu erfassen, zu verstehen und „sinnvolle“ Ergebnisse auszugeben.

1. Sprach-Analyse

Für die semantische Recherche werden Inhalte zunächst morphosyntaktisch analysiert und ausgezeichnet. Dies ermöglicht, dass zum Beispiel bei einer Recherche nach „gegangen“ auch die Grundform „gehen“ als Treffer gewertet wird.

Semantische Suche: Spracheerkennung und Morphosyntaktische Analyse

2. Erweiterung um (branchen-) spezifisches Wissen

In weiteren Analyseschritten erfolgt die Annotation der Inhalte mit allgemeinen und relevanten Entitäten des domänenspezifischen Wissens, die bei der Recherche dann zur Erkennung von Zusammenhängen verwendet werden können. Allgemeine Entitäten können beispielsweise Personen, Organisationen oder Orte sein.

Durch den Einsatz regulärer Ausdrücke und einer regelbasierten Skriptsprache können weitere Entitäten erkannt und annotiert werden. Bei der semantischen Recherche kommen unter anderem auch Synonyme und Hyperonyme Ähnlichkeiten zum Einsatz. Zum Beispiel hat „PKW“ und „Automobil“ eine 100%ige „synonyme“ Übereinstimmung. Dagegen hätte das Hyperonym „Fahrzeug“ eine 80%ige Übereinstimmung mit der Frage nach einem PKW. So führt die semantische Recherche zu umfassenderen und präziseren Ergebnissen.

3. Wissensmodell miteinbeziehen

Ist in einem Wissensmodell die Organisationsstruktur und Produktstruktur hinterlegt, werden diese Bezüge bei einer Anfrage mit berücksichtigt. Sind zusätzlich die jeweiligen Länder hinterlegt, können die Ergebnisse – wie zum Beispiel Patentanmeldungen – einer Karte zugeordnet werden. Oder es wird so bei einer Anfrage nach Aspirin automatisch der Wirkstoff Acetylsalicylsäure berücksichtigt. Ebenso kann die Wirkung dieses Stoffes wie schmerzstillend oder gerinnungshemmend einbezogen werden.

Die Zusammenhänge im Wissensmodell unterstützen über die initiale Anfrage hinaus. Sie werden auch genutzt, um in den Ergebnissen inhaltlich zu navigieren. Das jeweilige Interessensgebiet wird durch diese Navigation interaktiv verfeinert. Das Wissensmodell eignet sich weiterhin dazu, Ergebnisse zu gruppieren, um inhaltlich stimmige Übersichten zu erzeugen. So werden Zusammenhänge bewusst, welche vorher nicht direkt ersichtlich waren.

Bestandteile der Semantischen Suche: Sprachanalyse, Identitäten-Erkennung und Wissensmodell

 

Wofür ist semantische Suche nützlich? Was ist der Sinn?

Das zugrundeliegende Wissensmodell operationalisiert die in einer Organisation vorhandene Expertise.
Gerade für professionelle Recherchen ist es gleichermaßen wichtig, schnell passende Ergebnisse zu finden, als auch ein neues Thema umfassend zu durchdringen.

Durch die Berücksichtigung des Wissensmodells bei der Anfrage und Navigation, leistet die semantische Recherche, was sonst nur durch Lesen und Rezipieren erreicht würde: die inhaltliche Erschließung.

Durch diese präzisere und umfassendere Recherche bieten Informationsanbieter ihren Nutzern einen wesentlichen Mehrwert und grenzen sich damit vom Wettbewerb ab. Informationen innerhalb einer Organisation werden leichter gefunden und so Doppelarbeit reduziert. Die Berücksichtigung von Beziehungen im Wissensmodell löst darüber hinaus ein weiteres Problem bei der Recherche in internen Datenbeständen einer Organisation:
Webbasierte Suchverfahren nutzen die Verlinkung der Inhalte zur Bestimmung der Relevanz. Seiten, auf die viele andere Seiten zeigen, sind relevanter als isolierte Inhalte. Diese Beziehungen auf Dokumentebene fehlen meist innerhalb von Organisationen und können durch Beziehungen im Wissensmodell wettgemacht werden.

Noch mehr ins Detail?

Eine weiteren nützlichen Überblick erhalten Sie z.B. in einer Publikation der Uni Freiburg.

Darüber hinaus realisiert Empolis seit Jahrzehnten Software auf Basis von Technologien der Künstlichen Intelligenz. Verschiedene Einsatzgebiete, in denen Techniken wie die semantische Suche zum Einsatz kamen, finden Sie auch in unseren Projekt-Beispielen.

 

 

 

Sie möchten alle Informationen rund um KI und Big Data druckfrisch erhalten? Das Blog-Abo ist für Sie da.

Teilen:

Über den Autor

Dirk Paulus

Produkt Owner Information Access System

Sagen Sie Ihre Meinung!