Recall: Unterschied zwischen den Versionen
K |
|||
Zeile 3: | Zeile 3: | ||
[[Bild:Recall.png]] | [[Bild:Recall.png]] | ||
− | [[definition::Der Recall gibt an, wie viele der in | + | [[definition::Der Recall gibt an, wie viele der in einer Datenbank vorhandenen relevanten Dokumente bei einer Suche auch tatsächlich gefunden wurden]]. Die Berechnung zielt also auf die '''Vollständigkeit''' der Suche ab. Nimmt der Recall den Idealwert 1 an, wurden alle relevanten Dokumente in der Datenbank gefunden. |
Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt '''alle''' Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten. | Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt '''alle''' Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten. |
Version vom 11. September 2008, 12:25 Uhr
Beim Information Retrieval ist für die Ermittlung des Recall ebenso wie für die Ermittlung der Precision die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind.
Der Recall gibt an, wie viele der in einer Datenbank vorhandenen relevanten Dokumente bei einer Suche auch tatsächlich gefunden wurden. Die Berechnung zielt also auf die Vollständigkeit der Suche ab. Nimmt der Recall den Idealwert 1 an, wurden alle relevanten Dokumente in der Datenbank gefunden.
Ein hoher Recall ist vor allem dann wünschenswert, wenn bei einer Suche ein bestimmter Bereich vollständig erfasst werden soll. Dies ist beispielsweise bei der Patentrecherche oft der Fall. In anderem Kontext ist ein hoher Recall nicht so wichtig, beispielsweise bei einer Websuche, bei der die meisten Nutzer sich schon mit wenigen relevanten Treffern zufrieden geben und nicht unbedingt alle Dokumente (in diesem Fall Webseiten) zu einem Thema finden möchten.