Recall: Unterschied zwischen den Versionen
Sab (Diskussion | Beiträge) |
|||
(6 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
− | + | Beim [[Information Retrieval]] ist für die Ermittlung des Recall ebenso wie für die Ermittlung der [[Precision]] die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind. | |
− | |||
− | Der Recall gibt an, wie viele der in | + | |
+ | <math>\mbox{Recall} = \frac{\mbox{Anzahl der gefundenen relevanten Dokumente}}{\mbox{Anzahl aller relevanten Dokumente}}</math> | ||
+ | |||
+ | |||
+ | |||
+ | <math>\mbox{Recall}=\frac{|\{\mbox{Relevante Dokumente}\}\cap\{\mbox{Gefundene Dokumente}\}|}{|\{\mbox{Relevante Dokumente}\}|} </math> | ||
+ | |||
+ | |||
+ | |||
+ | [[definition::Der Recall gibt an, wie viele der in einer Datenbank vorhandenen relevanten Dokumente bei einer Suche auch tatsächlich gefunden wurden]]. Die Berechnung zielt also auf die '''Vollständigkeit''' der Suche ab. Nimmt der Recall den Idealwert 1 an, wurden alle relevanten Dokumente in der Datenbank gefunden. | ||
Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt '''alle''' Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten. | Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt '''alle''' Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten. | ||
+ | ==Verwandte Begriffe== | ||
− | + | * [[broader::Information Retrieval]] | |
+ | * [[related::Indexierung]] | ||
+ | * [[related::Deskriptor]] | ||
+ | * [[related::Precision]] | ||
+ | [[category:Informationserschließung]] | ||
[[category:Information Retrieval]] | [[category:Information Retrieval]] |
Aktuelle Version vom 13. Januar 2009, 14:04 Uhr
Beim Information Retrieval ist für die Ermittlung des Recall ebenso wie für die Ermittlung der Precision die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind.
<math>\mbox{Recall} = \frac{\mbox{Anzahl der gefundenen relevanten Dokumente}}{\mbox{Anzahl aller relevanten Dokumente}}</math>
<math>\mbox{Recall}=\frac{|\{\mbox{Relevante Dokumente}\}\cap\{\mbox{Gefundene Dokumente}\}|}{|\{\mbox{Relevante Dokumente}\}|} </math>
Der Recall gibt an, wie viele der in einer Datenbank vorhandenen relevanten Dokumente bei einer Suche auch tatsächlich gefunden wurden. Die Berechnung zielt also auf die Vollständigkeit der Suche ab. Nimmt der Recall den Idealwert 1 an, wurden alle relevanten Dokumente in der Datenbank gefunden.
Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt alle Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten.