Semantische Suche: Was ist das eigentlich?

Zurück zum Blog

Die semantische Recherche ist ein Verfahren des Information Retrieval, bei der die inhaltliche Bedeutung der Suchanfrage berücksichtigt wird. Durch die Einbeziehung von Domänenwissen in Form von Synonymen, Ähnlichkeiten und Wissensmodellen („Ontologien und Taxonomien“) kann die Suchanfrage mit einer höheren Präzision relevante „Treffer“ im Text liefern.

Im Gegensatz zu einer zeichen- oder wortbasierten Recherche, bei der nur Buchstaben auf eine syntaktische Übereinstimmung geprüft und entsprechende Treffer ausgegeben werden, wird bei einer semantischen Recherche versucht, die Bedeutung oder den Sinn der Anfrage zu erfassen, zu verstehen und „sinnvolle“ Ergebnisse auszugeben.

Für die semantische Recherche werden Inhalte zunächst morphosyntaktisch analysiert und ausgezeichnet. Dies ermöglicht, dass zum Beispiel bei einer Recherche nach „gegangen“ auch die Grundform „gehen“ als Treffer gewertet wird.

In weiteren Analyseschritten erfolgt die Annotation der Inhalte mit allgemeinen und relevanten Entitäten des domänenspezifischen Wissens, die bei der Recherche dann zur Erkennung von Zusammenhängen verwendet werden können. Allgemeine Entitäten können beispielsweise Personen, Organisationen oder Orte sein. Durch den Einsatz regulärer Ausdrücke und einer regelbasierten Skriptsprache können weitere Entitäten erkannt und annotiert werden. Bei der sematischen Recherche kommen unter Anderem auch Synonyme und Hyperonyme Ähnlichkeiten zum Einsatz, zum Beispiel hat „PKW“ und „Automobil“ eine 100%ige „synonyme“ Übereinstimmung. Dagegen hätte das Hyperonym „Fahrzeug“ eine 80%ige Übereinstimmung mit der Frage nach einem PKW. So führt die semantische Recherche zu umfassenderen und präziseren Ergebnissen.

Ist in einem Wissensmodell die Organisationsstruktur und Produktstruktur hinterlegt, werden diese Bezüge bei einer Anfrage mit berücksichtigt. Sind zusätzlich die jeweiligen Länder hinterlegt, können die Ergebnisse – wie zum Beispiel Patentanmeldungen – einer Karte zugeordnet werden. Oder es wird so bei einer Anfrage nach Aspirin automatisch der Wirkstoff Acetylsalicylsäure berücksichtigt. Ebenso kann die Wirkung dieses Stoffes wie schmerzstillend oder gerinnungshemmend einbezogen werden.

Die Zusammenhänge im Wissensmodell unterstützen über die initiale Anfrage hinaus. Sie werden auch genutzt, um in den Ergebnissen inhaltlich zu navigieren. Das jeweilige Interessensgebiet wird durch diese Navigation interaktiv verfeinert. Das Wissensmodell eignet sich weiterhin dazu, Ergebnisse zu gruppieren, um inhaltlich stimmige Übersichten zu erzeugen. So werden Zusammenhänge bewusst, welche vorher nicht direkt ersichtlich sind.

Warum ist das wichtig? Was ist der Sinn?

Das zugrundeliegende Wissensmodell operationalisiert die in einer Organisation vorhandene Expertise. Gerade für professionelle Recherchen ist es gleichermaßen wichtig, schnell passende Ergebnisse zu finden, als auch ein neues Thema umfassend zu durchdringen.

Durch die Berücksichtigung des Wissensmodells bei der Anfrage und Navigation, leistet die semantische Recherche, was sonst nur durch Lesen und Rezipieren erreicht würde: die inhaltliche Erschließung.

Durch diese präzisere und umfassendere Recherche bieten Informationsanbieter ihren Nutzern einen wesentlichen Mehrwert und grenzen sich damit vom Wettbewerb ab. Informationen innerhalb einer Organisation werden leichter gefunden und so Doppelarbeit reduziert. Die Berücksichtigung von Beziehungen im Wissensmodell löst darüber hinaus ein weiteres Problem bei der Recherche in internen Datenbeständen einer Organisation. Webbasierte Suchverfahren nutzen die Verlinkung der Inhalte zur Bestimmung der Relevanz. Seiten, auf die viele andere Seiten zeigen, sind relevanter als isolierte Inhalte. Diese Beziehungen auf Dokumentebene fehlen meist innerhalb von Organisationen und können durch Beziehungen im Wissensmodell wettgemacht werden.