Suchoperatoren: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
(Kategorie hinzugefügt)
Zeile 22: Zeile 22:
 
:„*“ ersetzt eine beliebige Anzahl von Buchstaben
 
:„*“ ersetzt eine beliebige Anzahl von Buchstaben
 
:„!“ ersetzt einen einzelnen Buchstaben
 
:„!“ ersetzt einen einzelnen Buchstaben
 +
 +
[[category:Information Retrieval]]

Version vom 25. Januar 2006, 21:29 Uhr

Suchoperatoren sind Teile der Bool'schen Logik, ein mengentheoretisches Information Retrieval Modell, und bieten den Nutzern von Suchmaschinen oder Datenbanken die Möglichkeit ihre Suche nach verschiedenen Kriterien einzuschränken. Dies soll anhand einiger Beispiele erläutert werden.

  • and: Wenn man nach „Universität AND Saarland“ sucht, findet man alle Dokumente, in denen beide Begriffe vorkommen, also die Schnittmenge.
  • or: „Universität OR Saarland“ sucht nach Dokumenten, die mindestens einen der beiden Begriffe beinhalten. Mathematisch gesehen handelt es sich dabei um die Vereinigungsmenge.
  • and not: „Universität AND NOT Saarland“ findet alle Dokumente, in denen der Begriff „Universität“, nicht aber der Begriff „Saarland“ vorkommt. Mathematisch betrachtet ist dies die Differenzmenge.
  • near: „Universität NEAR Saarland“ findet alle Dokumente, in denen die Begriffe „Universität“ und „Saarland“ in unmittelbarer Nähe zueinander vorkommen. Wie groß der Abstand zwischen den beiden Begriffen sein darf, hängt vom jeweiligen Suchdienst ab. In der Regel umfasst die Distanz etwa zehn bis 50 Worte. Die Reihenfolge der Begriffe spielt dabei keine Rolle.
  • Die Ausdrücke, die mehrere Suchoperatoren enthalten, können je nach Suchdienst unterschiedlich interpretiert werden. Es empfiehlt sich die Verwendung von Klammern.
Ein Beispiel: Der Ausdruck "Universität AND Saarland OR Informationswissenschaft" kann je nach Abarbeitungsreihenfolge als "(Universität AND Saarland) OR Informationswissenschaft" oder aber als "Universität AND (Saarland OR Informationswissenschaft)" verstanden werden. Setzt man als Nutzer bei der Suchanfrage Klammern, lassen sich Missverständnisse vermeiden. Klammern ermöglichen es ebenfalls, bereits selektierte Mengen noch einmal zu Teilgruppen zusammenzufassen; die Stärke der Bool'schen Operatoren wird auf diese Weise erst richtig ausgenutzt.

Zusätzlich zu diesen bekanntesten Operatoren gibt es noch weitere, die eine zusätzliche Spezialisierung der Anfrage ermöglichen und so ein noch besseres Ergebnis erzielen können:

  • ADJ(adjacency): „Universität ADJ Saarland“ findet alle Dokumente, in denen die Begriffe „Universität“ und „Saarland“ in unmittelbarer Nachbarschaft vorkommen.
  • Phrasensuche: Die Phrasensuche setzt man für die Suche nach zusammenhängenden Begriffen (wie z.B. Personennamen, feststehenden Ausdrücken, Buch-, Film- oder Liedtiteln) ein. Um die entsprechenden Begriffe als zusammengehörig zu kennzeichnen, setzt man sie in Hochkommas.
  • Trunkierung: Mit Hilfe von Trunkierungen kann man Suchbegriffe so abkürzen, dass unterschiedliche Wortvariationen gefunden werden. Dies erreicht man durch Einfügen so genannter Trunkierungssymbole (auch Joker oder Wildcards genannt):
„*“ ersetzt eine beliebige Anzahl von Buchstaben
„!“ ersetzt einen einzelnen Buchstaben