Ranking: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
 
Zeile 7: Zeile 7:
  
 
*Häufigkeit der Suchterme innerhalb des Dokuments
 
*Häufigkeit der Suchterme innerhalb des Dokuments
Wenn ein Suchbegriff mehrmals vorkommt, wird ein Dokument ebenfalls höher eingestuft. Dies ist jedoch ein problematisches Kriterium, da die Häufigkeit ja nicht zwangsläufig etwas über die Qualität aussagt, denn es kann sich ja auch um bloße Wortwiederholungen halten oder um Spamming.
+
Wenn ein Suchbegriff mehrmals vorkommt, wird ein Dokument ebenfalls höher eingestuft. Dies ist jedoch ein problematisches Kriterium, da die Häufigkeit ja nicht zwangsläufig etwas über die Qualität aussagt, denn es kann sich ja auch um bloße Wortwiederholungen halten oder um Spamming (s.o.).
 +
 
 +
*Die Gesamthäufigkeit einzelner Worte

Version vom 27. September 2005, 17:43 Uhr

Um den Benutzer die Beurteilung des Ergebnisses seiner Recherche zu erleichtern, versuchen Datenbanken oder Websuchmaschinen, die Dokumente nach deren Relevanz zu sortieren. Diesen Prozess bezeichnet man als Ranking. Die meisten Ranking-Methoden beruhen auf statistischen Kriterien.

Prinzipielle Sortierungskriterien sind:

  • Die Anzahl der gefundenen Wörter

Je mehr eingegebene Suchbegriffe vorkommen, desto höher ist die Relevanz. Bei Anfragen mit mehreren Suchbegriffen werden die Dokumente, in denen alle Begriffe vorkommen höher eingestuft.

  • Häufigkeit der Suchterme innerhalb des Dokuments

Wenn ein Suchbegriff mehrmals vorkommt, wird ein Dokument ebenfalls höher eingestuft. Dies ist jedoch ein problematisches Kriterium, da die Häufigkeit ja nicht zwangsläufig etwas über die Qualität aussagt, denn es kann sich ja auch um bloße Wortwiederholungen halten oder um Spamming (s.o.).

  • Die Gesamthäufigkeit einzelner Worte
… weitere Daten zur Seite „Ranking
Um den Nutzern die Beurteilung eines Rechercheergebnisses zu erleichtern, sortieren Datenbankenhosts oder Websuchmaschinen die Dokumente nach deren Relevanz +