Wer sucht der kauft – Suchfunktionen Teil 2: Index und Algorithmus

Im ersten Teil zu Suchfunktionen ging es um das Sucheingabefeld mit seinen unterstützenden Angeboten. Was nützt mir aber das noch so gute Suchfeld, wenn die Ergebnisse nicht zu meiner Suche passen? Probleme in diesem Bereich können mit ungenügendem Inhalt zusammenhängen, mit einer schlechten Erschließung des Inhalts oder damit, dass meine Suchanfrage nicht gut verarbeitet wird. In diesem Beitrag sollen diese Faktoren genauer unter die Lupe genommen werden.

Die Dokumentensammlung hinter der Suche

Für die Vielfältigkeit von Dokumentenarten, die über eine Suche gezielt erreichbar werden sollen, gibt es natürlich keine Grenzen. In Online-Shops sind es verschiedenste Produkte. Inhalte von Webseiten können durchsucht werden entweder über eine Suchfunktion auf der Webseite oder global über Suchmaschinen. Vertriebsdokumente werden gesucht, wissenschaftliche Volltexte oder Metadaten zu Artikeln, Inserate, Unternehmensdaten oder auch Bilder und Videos, wie auch Musik.

Der Umfang der durchsuchten Dokumentensammlung beeinflusst die Anforderungen an die Suchfunktion. Zunächst ist es problematisch, wenn die Menge sehr begrenzt ist und so allein von der Anzahl an Treffern her von vornherein kein befriedigendes Ergebnis geliefert werden kann. Eine Suchfunktion lässt erwarten, dass hier aus dem Vollen geschöpft werden kann. Häufigere Herausforderung an eine Suchfunktion dürfte jedoch sein, dass eine riesige Menge an Inhaltselementen vorhanden ist, die durchsuchbar gemacht werden muss.

Inhaltselemente suchbar machen – die Erschließung

Sobald ein Inhaltselement einer großen Menge an ebensolchen Elementen beigefügt wird, entsteht das Problem, dass es ohne weiteres unauffindbar darin verschwindet. Es muss also eine Kennzeichnung bekommen, anhand derer es wiedergefunden werden kann. Dies erfolgt über die Indexierung. Hierbei werden einem Element bestimmte Informationen angehängt, die den Inhalt möglichst genau beschreiben. Das sind die Metadaten. In Bibliotheken oder auch bei bestimmten Datenbanken erfolgt dieser Prozess intellektuell. Ein Indexierer analysiert ein Element und vergibt aus einem kontrollierten Vokabular die Metadaten, über die dieses Element gefunden werden kann. Dies ist sehr zeitaufwändig und deshalb bei riesigen Inhaltsmengen nicht praktikabel. Hier werden statistische Methoden zur Indexierung eingesetzt. Es werden aus dem Inhalt eines Elements Begriffe gezogen, die einerseits im Dokument häufig vorkommen, andererseits in der Dokumentenmenge nicht so oft vorkommen. Dadurch gewinnt man eine Kennzeichnung, die das Dokument zum einen gut beschreibt, zum anderen aber dieses Dokument auch von anderen gut unterscheidet. Die Bedeutung von Indextermen kann zudem gewichtet werden, je nachdem wo im Dokument sie erscheinen. Gehört ein Term zum Titel, dann erhält er ein höheres Gewicht, als wenn er mitten im Text auftaucht.

Man kann die Menge an zurückgegebenen Treffern und die Genauigkeit der Treffer über die Breite und Spezifität der Indexierung beeinflussen. Werden für ein Dokument mehr Indexterme auch für Seitenaspekte vergeben, dann taucht es auch häufiger in Treffermengen auf und diese sind größer, der Recall erhöht sich. Werden wenige, sehr spezifische Indexterme vergeben, dann erscheint das Dokument seltener in der Treffermenge, die Genauigkeit und Precision der Suche ist aber dadurch größer.

Die Verarbeitung einer Suchanfrage

Ich stelle eine Suchanfrage und ich möchte darauf eine genau passende und auch vollständige Antwort haben. Dies ist die berechtigte Forderung an eine Suchfunktion.

Was passiert im Suchprozess zwischen dem Abschicken einer Suchanfrage und der Ausgabe des Ergebnisses?

Zunächst wird die Suchanfrage analysiert. Es werden Operatoren wie „AND“ und „OR“ identifiziert. Unwichtige Bestandteile wie Artikel werden gelöscht. Möglicherweise wird an dieser Stelle ein Thesaurus hinzugezogen, um Synonyme und Grundformen in die Suche mit einzubeziehen. In Zeiten der immer mehr verfeinerten Sprachsteuerung, verbessern sich auch Möglichkeiten, syntaktische Aspekte aus der Suchanfrage herauszulesen. Suchmaschinen beziehen zudem frühere Suchen mit ein, um auch über diese Informationen die Analyse der Suchanfrage zu verbessern. Das möglichst genaue „Verstehen“ der Suchanfrage durch die Suchfunktion ist die erste Voraussetzung, um gute Ergebnisse liefern zu können.

Dann erfolgt das Matching: welche Elemente in der Inhaltsmenge passen am besten als Antwort auf die Suchanfrage? Hier greift die Qualität der Indexierung. Sind die Inhaltselemente gut erschlossen, dann bieten sie auch die geeigneten Ansatzpunkte, um den Grad ihrer Relevanz für die Suchanfrage feststellen zu können und die richtige Auswahl zu treffen. Gewichtungsprozesse spielen hier eine wichtige Rolle, so wie etwa die Berücksichtigung der Termplatzierung im Dokument.

Fazit

Die Erschließung von Inhalten und die Verarbeitung von Suchanfragen sind unsichtbare Faktoren, die aber die Qualität einer Suche entscheidend beeinflussen. Die Relevanz von Suchergebnissen ist eine Basisanforderung an eine Suchfunktion. Wenn sie nicht gegeben ist, dann entsteht erhebliche Unzufriedenheit. Nutzer, für die eine Suche der bevorzugte Einstieg in die Inhalte und Angebote einer Webseite ist, werden die Seite schnell wieder verlassen und nicht mehr zurückkommen. Es lohnt also, in die Erschließung und den Suchalgorithmus zu investieren und hier einen hohen Standard einzuhalten.

Was sind Ihre Erfahrungen zu dem Thema? Gibt es weitere Aspekte dazu, die aus Ihrer Sicht wichtig sind? Ich freue mich über Ihre Kommentare.

5 Gedanken zu „Wer sucht der kauft – Suchfunktionen Teil 2: Index und Algorithmus

  1. Pingback: Navigation – Die erfolgreiche Website

  2. Maikel

    „Normale“ Benutzer geben üblicherweise keine Operatoren wie AND und OR ein.
    Deshalb wäre es wichtig, anzugeben, wie die Sucheingabe standardmäßig interpretiert wird.
    Zumal die Benutzer es von Suchmaschinen gewohnt sind, daß die eingegebenen Begriffe mit AND verknüpft werden; manche Seiten aber davon abweichend eine OR-Verknüpfung verwenden.

    Oftmals kann man die Auswahl an Artikeln auch durch Kategorien o.ä. einschränken.
    Wenn es zusätzlich ein Suchfeld gibt, dann ist meist nicht zu erkennen, ob die Textsuche sich auf die ausgewählte Kategorie oder auf die gesamte Artikel-Menge bezieht. Auch hier ist das Verhalten von Seite zu Seite unterschiedlich; oftmals ist die wünschenswerte Text-Suche innerhalb einer Kategorie nicht möglich.

    Antworten
  3. Maikel

    P.S.: Und wieder nervt diese Webseite mich damit, daß die Leerzeile, die ich in meinem Text zwecks inhaltlicher Strukturierung verwendet hatte, nicht übernommen wurde.

    Antworten
  4. Pingback: Wer sucht der kauft – Suchfunktionen Teil 3: Qualität von Trefferlisten - Usabilityblog.de

  5. Andreas E. Nabicht

    Ich finde Ihre Beiträge wirklich sehr nützlich und deshalb hier meine Gedanken zu diesem Beitrag.

    Je länger sich Besucher in einem Online-Shop aufhalten, umso mehr sollte über sie in Erfahrung gebracht werden. Werden unterschiedliche Ausdrucksweisen berücksichtigt? Welche Präferenzen und Affinitäten können zugeordnet werden? In Summe: Fühlt sich der Kunde abgeholt und verstanden?
    Aus diesem Grund ist es essentiell eine lernfähige Suchfunktion bereit zu stellen.
    Kein anderer Berührungspunkt im Online-Store hat hierbei den Wirkungsgrad einer abgestimmten Suchfunktion. Das manuelle Hinzufügen von zusätzlichen Themen- oder Einkaufswelten wird alleinig nicht ausreichend sein, als dass sich missverstandene Kunden abwenden und anderweitig entscheiden.

    Lernfähige Datenbanken bilden das Suchverhalten tausender Szenarien ab, welche das algorithmische Verhalten von Kunden sammelt, analysiert und entsprechend optimiert ausspielt.
    Mit dem Ziel, dass durch das Verhalten des Users der ganze Shop automatisch Bedürfnisse erkennt und sich Großteils selbst zu regeln weis.

    Wichtig für die Praxis: Der Online-Shop und dessen MitarbeiterInnen sollten verstehen, wie die Suchergebnisse entstehen und gewichtet werden.
    Natürlich sollte jedem Online-Händler auch klar sein, wie die Suchergebnisse automatisch und manuell zu steuern sind. Schließlich geht es darum den eingekauften Traffic: Die Online-Shopper zu profitablen und begeisterten Kunden zu machen.

    Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.