Precision: Unterschied zwischen den Versionen
Sab (Diskussion | Beiträge) |
Sab (Diskussion | Beiträge) (Annotationen wurden im Advanced Annotation Mode hinzugefügt.) |
||
(2 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
− | Beim [[Information Retrieval]] ist für die Ermittlung des Qualitätsmaßes '[[Recall]]' ebenso wie für die Ermittlung der [[Precision]] die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind. | + | Beim [[Information Retrieval]] ist für die Ermittlung des Qualitätsmaßes '[[related::Recall]]' ebenso wie für die Ermittlung der [[Precision]] die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind. |
<math>\mbox{Precision} = \frac{\mbox{Anzahl der gefundenen relevanten Dokumente}}{\mbox{Anzahl aller gefundenen Dokumente}}</math> | <math>\mbox{Precision} = \frac{\mbox{Anzahl der gefundenen relevanten Dokumente}}{\mbox{Anzahl aller gefundenen Dokumente}}</math> | ||
+ | |||
<math>\mbox{Precision}=\frac{|\{\mbox{Relevante Dokumente}\}\cap\{\mbox{Gefundene Dokumente}\}|}{|\{\mbox{Gefundene Dokumente}\}|} </math> | <math>\mbox{Precision}=\frac{|\{\mbox{Relevante Dokumente}\}\cap\{\mbox{Gefundene Dokumente}\}|}{|\{\mbox{Gefundene Dokumente}\}|} </math> | ||
Zeile 20: | Zeile 21: | ||
[[category:Informationserschließung]] | [[category:Informationserschließung]] | ||
[[category:Information Retrieval]] | [[category:Information Retrieval]] | ||
+ | |||
+ | * [[synonymous::Genauigkeit]] |
Aktuelle Version vom 21. April 2009, 15:30 Uhr
Beim Information Retrieval ist für die Ermittlung des Qualitätsmaßes 'Recall' ebenso wie für die Ermittlung der Precision die Relevanz eines Treffers die ausschlaggebende Größe. Als relevante Treffer werden dabei all diejenigen Treffer verstanden, die beim Bearbeiten der Problemstellung von Nutzen sind.
<math>\mbox{Precision} = \frac{\mbox{Anzahl der gefundenen relevanten Dokumente}}{\mbox{Anzahl aller gefundenen Dokumente}}</math>
<math>\mbox{Precision}=\frac{|\{\mbox{Relevante Dokumente}\}\cap\{\mbox{Gefundene Dokumente}\}|}{|\{\mbox{Gefundene Dokumente}\}|} </math>
Die Precision gibt an, wie viele der bei der Suche in einer Datenbank gefundenen Dokumente relevant sind, ermittelt also die Genauigkeit der Suche. Nimmt die Precision den Idealwert 1 an, sind alle gefundenen Dokumente relevant. Bei der Suche im WWW ist die Precision ein praktischer Wert, der exakt ermittelbar ist, wenn auch ggf. mit sehr großem Aufwand. Inwiefern die gefundenen Dokumente tatsächlich relevant sind, kann man nämlich nur durch Betrachtung des Ergebnisses feststellen.
Natürlich liegt es am Nutzer selbst, ob er einen höheren Recall, also eine größere Menge gefundener Dokumente und demnach alle, die für ihn relevant sind und darüber hinaus noch weitere möglicherweise uninteressante Daten bevorzugt, oder eine höhere Präzision, d. h. nur Dokumente, die auch 100%ig zu seiner Anfrage passen. Bei letzterer Präferenz besteht die Gefahr, dass interessante Dokumente nicht angezeigt werden.