Stoppwort: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
K
 
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt)
Zeile 1: Zeile 1:
[[category: Informationslinguistik]]
+
[[definition::Ein Stoppwort ist ein inhaltsleeres Wort, also ein Term, der nichts zur Inhaltsbeschreibung eines Textdokumentes beiträgt]]. Stoppwörter werden in so genannten '''Stoppwortlisten''' zusammengefasst.
Ein Stoppwort ist ein inhaltsleeres Wort. Also ein Term, der nichts zur Semantik eines Dokumentes
 
beiträgt.
 
Stoppworte werden in so genannten '''Stoppwortlisten''' zusammengefasst.
 
  
Diese '''Stoppwortlisten''' sind notwendig um bei der [[Indexierung]] die so genannte '''Stoppwortlimitierung''' einsetzen zu können. Die '''Stoppwortlimitierung''' findet ihren Einsatz meist bei der [[automatische Indexierung |automatischen Indexierung]], die das [[Automatische Indexierung#Freitextverfahren|Freitextverfahren]] einsetzt. Wird ein Dokument nach dem Freitextverfahren indexiert, so übernimmt man einfach alle im Text vorkommenden Worte in den Index außer den Worten, die in der '''Stoppwortliste''' enthalten sind. Je nach Art des Dokumentes gibt es unterschiedliche Stoppwortlisten. Es gibt allgemeine Stoppwortlisten die universell auf Texte angewendet werden können. Um die Qualität des Freitextverfahrens zu steigern empfiehlt es sich jedoch (zusätzlich) fachspezifische Stoppwortlisten einzusetzen. Bei einem Text aus dem Fachgebiet der Informationstechnologie beinhaltet die fachspezifische Stoppwortliste beispielsweise das Wort „Computer“. Allgemeine Stoppwortlisten beinhalten Worte wie beispielsweise Artikel, Konjunktionen etc.
+
Diese '''Stoppwortlisten''' sind notwendig, um bei der [[Indexierung]] die so genannte '''Stoppwortlimitierung''' einsetzen zu können. Die '''Stoppwortlimitierung''' findet ihren Einsatz meist bei der [[automatische Indexierung|automatischen Indexierung]], die das [[Automatische Indexierung#Freitextverfahren|Freitextverfahren]] einsetzt. Wird ein Dokument nach dem Freitextverfahren indexiert, so übernimmt man einfach alle im Text vorkommenden Wörter in den Index außer den Wörtern, die in der '''Stoppwortliste''' enthalten sind. Je nach Art des Textsammlung gibt es unterschiedliche Stoppwortlisten. Es gibt allgemeine Stoppwortlisten, die universell auf Texte angewendet werden können. Um die Qualität des Freitextverfahrens zu steigern, empfiehlt es sich jedoch (zusätzlich) fachspezifische Stoppwortlisten einzusetzen. Bei einem Text aus dem Fachgebiet der Informationstechnologie beinhaltet die fachspezifische Stoppwortliste beispielsweise das Wort „Computer“. Allgemeine Stoppwortlisten beinhalten Wörter wie beispielsweise Artikel, Konjunktionen etc.
  
 
Folgende Tabelle zeigt ein Beispiel für eine allgemeine deutschsprachige Stoppwortliste.
 
Folgende Tabelle zeigt ein Beispiel für eine allgemeine deutschsprachige Stoppwortliste.
Zeile 55: Zeile 52:
 
|-
 
|-
 
|}
 
|}
 +
 +
==Verwandte Begriffe==
 +
 +
* [[broader::Information Retrieval]]
 +
* [[broader::Indexierung]]
 +
* [[related::Deskriptor]]
 +
* [[related::Recall]]
 +
 +
[[category:Informationserschließung]]
 +
[[category:Information Retrieval]]

Aktuelle Version vom 11. September 2008, 12:35 Uhr

Ein Stoppwort ist ein inhaltsleeres Wort, also ein Term, der nichts zur Inhaltsbeschreibung eines Textdokumentes beiträgt. Stoppwörter werden in so genannten Stoppwortlisten zusammengefasst.

Diese Stoppwortlisten sind notwendig, um bei der Indexierung die so genannte Stoppwortlimitierung einsetzen zu können. Die Stoppwortlimitierung findet ihren Einsatz meist bei der automatischen Indexierung, die das Freitextverfahren einsetzt. Wird ein Dokument nach dem Freitextverfahren indexiert, so übernimmt man einfach alle im Text vorkommenden Wörter in den Index außer den Wörtern, die in der Stoppwortliste enthalten sind. Je nach Art des Textsammlung gibt es unterschiedliche Stoppwortlisten. Es gibt allgemeine Stoppwortlisten, die universell auf Texte angewendet werden können. Um die Qualität des Freitextverfahrens zu steigern, empfiehlt es sich jedoch (zusätzlich) fachspezifische Stoppwortlisten einzusetzen. Bei einem Text aus dem Fachgebiet der Informationstechnologie beinhaltet die fachspezifische Stoppwortliste beispielsweise das Wort „Computer“. Allgemeine Stoppwortlisten beinhalten Wörter wie beispielsweise Artikel, Konjunktionen etc.

Folgende Tabelle zeigt ein Beispiel für eine allgemeine deutschsprachige Stoppwortliste.

eine allgemeine Stoppwortliste
über können wie von der waren
nach sollen falls auf ihre was
alle könnten in nur ihnen wenn
auch brauchen darein oder darauf wo
an dürfen ist irgendeiner da welcher
und darf es unser diese während
noch jeder seinem aus sie wer
jeglicher sonsteiner eben über dieser will
sind für gleich betreffs jene mit
weil wegen durften sollten durch könntest
bei dahinter viele derselbe zu ihres
sein hatte ich sch ebensolcher euer
darum hat könntet seit unter a b c d e
gewesen hattest mehreres solltest wohinauf f g h i j
davor er viele so brauchen k l m n o
seiend haben viel einige sehr p q r s t
zwischen ihre müssen doch wollen u v w x y
beide dadrinnen mein solcher war z ä
aber ihm nichts habt solcherart 1 2 3 4 5
nahe selbst nein als wir 6 7 8 9 0
wollten seinem eben dass wohl  

Verwandte Begriffe

… weitere Daten zur Seite „Stoppwort
Ein Stoppwort ist ein inhaltsleeres Wort, also ein Term, der nichts zur Inhaltsbeschreibung eines Textdokumentes beiträgt +