Embeddings und semantische Suche: Bedeutung statt Stichworte finden

Klassische Suche findet Stichworte; semantische Suche findet Bedeutung. Wer nach „günstige Unterkunft" sucht, will auch Ergebnisse zu „preiswertes Hotel" finden, obwohl kein einziges Wort übereinstimmt. Die Technik, die das ermöglicht, sind Embeddings — die Übersetzung von Text in Vektoren, die seine Bedeutung in einem mathematischen Raum verorten. Embeddings sind das Fundament der semantischen Suche und zugleich der Schlüsselbaustein vieler KI-Anwendungen, von der Wissenssuche bis zu Retrieval-Augmented Generation. Dieser Beitrag erklärt das Konzept und seine praktische Umsetzung.

Was ein Embedding ist

Ein Embedding ist eine Liste von Zahlen — ein Vektor —, die einen Text in einem hochdimensionalen Raum verortet. Das Entscheidende: Texte mit ähnlicher Bedeutung erhalten ähnliche Vektoren, liegen also im Raum nahe beieinander, unabhängig von den konkreten Wörtern. „Hund" und „Welpe" liegen nah, „Hund" und „Steuererklärung" weit auseinander. Ein Embedding-Modell hat diese Bedeutungsbeziehungen aus riesigen Textmengen gelernt. Die semantische Ähnlichkeit zweier Texte wird dann zur geometrischen Nähe ihrer Vektoren — und Nähe lässt sich effizient berechnen.

Wie semantische Suche funktioniert

Der Ablauf ist konzeptionell einfach. Sie zerlegen Ihre Wissensbasis in sinnvolle Stücke, erzeugen für jedes Stück ein Embedding und speichern diese Vektoren in einer Vektordatenbank. Bei einer Suchanfrage erzeugen Sie ein Embedding der Anfrage und suchen die Vektoren, die ihr am nächsten liegen — die Texte mit der grössten Bedeutungsähnlichkeit. Das Ergebnis sind die inhaltlich relevantesten Stücke, auch wenn sie kein Wort der Anfrage enthalten. Diese Nächste-Nachbarn-Suche im Vektorraum ist der Kern jeder semantischen Suche und jedes Retrieval-Schritts in RAG-Systemen.

Chunking: die unterschätzte Kunst

Wie man die Wissensbasis in Stücke zerlegt — das Chunking —, entscheidet massgeblich über die Qualität. Zu grosse Stücke verwässern die Bedeutung, weil ein langer Abschnitt zu viele Themen mischt und sein Embedding unscharf wird. Zu kleine Stücke verlieren Kontext, sodass ein einzelner Satz isoliert nicht mehr verständlich ist. Die richtige Stückgrösse hängt vom Inhalt ab; oft bewähren sich Abschnitte, die einen abgeschlossenen Gedanken umfassen, mit etwas Überlappung zwischen benachbarten Stücken, damit kein Kontext an den Grenzen verloren geht. Chunking ist selten die erste Stellschraube, an die man denkt — aber oft die wirkungsvollste.

Die Wahl des Embedding-Modells

Embedding-Modelle unterscheiden sich in Qualität, Dimensionalität, Sprachunterstützung und Kosten. Für den DACH-Raum ist die Mehrsprachigkeit entscheidend: Ein Modell, das deutsche Texte gut versteht und idealerweise sprachübergreifend arbeitet, ist Voraussetzung für brauchbare Ergebnisse. Höhere Dimensionalität kann mehr Nuance erfassen, kostet aber mehr Speicher und Rechenzeit. Wichtig ist die Konsistenz: Anfrage und gespeicherte Inhalte müssen mit demselben Modell eingebettet werden, sonst sind die Vektoren nicht vergleichbar. Ein Modellwechsel bedeutet, die gesamte Wissensbasis neu einzubetten.

Hybrid Search: das Beste aus beiden Welten

Semantische Suche ist klassischer Stichwortsuche nicht überlegen, sondern komplementär. Stichwortsuche glänzt bei exakten Begriffen, Eigennamen, Produktnummern oder Codes — genau dort, wo semantische Ähnlichkeit in die Irre führen kann. Semantische Suche glänzt bei umschriebenen, vagen oder synonymen Anfragen. Die beste Praxis ist deshalb oft die hybride Suche: Sie kombiniert beide Verfahren und führt ihre Ergebnisse zusammen. So findet das System sowohl die exakt passende Produktnummer als auch das bedeutungsähnliche Konzept — eine Kombination, die in der Praxis fast immer bessere Ergebnisse liefert als jedes Verfahren allein.

Kosten und Aktualität im Blick

Das Erzeugen von Embeddings kostet — pro eingebettetem Text fallen Rechenkosten an, und bei grossen, sich ändernden Wissensbasen summiert sich das. Planen Sie deshalb, wie Sie mit Änderungen umgehen: Wird ein Dokument geändert, muss sein Embedding neu berechnet werden, damit die Suche aktuell bleibt. Ein durchdachter Aktualisierungsprozess, der nur geänderte Stücke neu einbettet statt der gesamten Basis, hält die Kosten beherrschbar. Bei sehr grossen Beständen lohnt sich zudem ein Blick auf die Speicher- und Suchkosten der Vektordatenbank, die mit der Zahl der Vektoren wachsen.

Fazit

Embeddings übersetzen Bedeutung in Geometrie und machen damit eine Suche möglich, die versteht statt nur abzugleichen. Achten Sie auf durchdachtes Chunking als wichtigsten Qualitätshebel, wählen Sie ein mehrsprachiges, zum DACH-Kontext passendes Embedding-Modell und halten Sie die Einbettung von Anfrage und Inhalten konsistent. Kombinieren Sie semantische mit klassischer Suche zur hybriden Suche, die exakte und bedeutungsähnliche Treffer vereint, und planen Sie Aktualisierung und Kosten von Anfang an mit. Wer diese Bausteine beherrscht, baut Such- und Wissenssysteme, die sich für den Nutzer anfühlen, als verstünden sie wirklich, wonach er fragt — die Grundlage jeder ernsthaften KI-gestützten Wissensanwendung.

Qualität messen und verbessern

Wie bei jedem KI-System gilt: Was Sie nicht messen, können Sie nicht verbessern. Für semantische Suche bedeutet das, die Qualität der Treffer systematisch zu bewerten — etwa mit einem Satz typischer Anfragen, für die Sie die erwarteten relevanten Dokumente kennen, und der Messung, ob das System sie tatsächlich findet und weit oben platziert. Diese Evaluierung deckt auf, ob Chunking, Modellwahl oder die Kombination mit Stichwortsuche nachjustiert werden müssen. Ohne sie optimiert man im Blindflug und merkt eine Verschlechterung erst, wenn Nutzer sich beschweren.

Beachten Sie schliesslich, dass semantische Suche kein Selbstzweck ist, sondern dem Nutzer dienen muss. Manchmal ist die einfachste Lösung die beste — für eine kleine, klar strukturierte Datenmenge mit eindeutigen Begriffen kann eine gute Stichwortsuche völlig ausreichen, und der Aufwand für Embeddings und Vektordatenbank lohnt sich nicht. Setzen Sie semantische Suche dort ein, wo Bedeutung und Umschreibung wirklich zählen — bei grossen, unstrukturierten Wissensbeständen und vagen Nutzeranfragen — und widerstehen Sie der Versuchung, jede Suche reflexhaft semantisch zu machen, nur weil die Technik verfügbar ist.

Embeddings und semantische Suche: Bedeutung statt Stichworte finden

Was ein Embedding ist

Wie semantische Suche funktioniert

Chunking: die unterschätzte Kunst

Die Wahl des Embedding-Modells

Hybrid Search: das Beste aus beiden Welten

Kosten und Aktualität im Blick

Fazit

Qualität messen und verbessern

Related insights.

pgvector vs. dedizierte Vektordatenbanken: Die Wahl für SaaS-Skalierung

Retrieval-Augmented Generation (RAG): Ein praktischer Engineering-Leitfaden

LLM Integration in SaaS: Architecture Patterns That Survive Production

Let's talk.