Stopwort: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
 
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt)
Zeile 1: Zeile 1:
Ein Stoppwort ist ein inhaltsleeres Wort. Also ein Term, der nichts zur Semantik eines Dokumentes
+
#redirect [[Stoppwort]]
beiträgt.
 
Stoppworte werden in so genannten '''Stoppwortlisten''' zusammengefasst.
 
 
 
Diese '''Stoppwortlisten''' sind notwendig um bei der [[Indexierung]] die so genannte '''Stoppwortlimitierung''' einsetzen zu können. Die '''Stoppwortlimitierung''' findet ihren Einsatz meist bei der [[automatische Indexierung |automatischen Indexierung]] die das [[automaische Indexierung#Freitextverfahren|Freitextverfahren]] einsetzt. Wird ein Dokument nach dem Freitextverfahren indexiert, so übernimmt man einfach alle im Text vorkommenden Worte in den Index außer den Worten die in der '''Stoppwortliste''' enthalten sind. Je nach Art des Dokumentes gibt es unterschiedliche Stoppwortlisten. Es gibt allgemeine Stoppwortlisten die universell auf Texte angewendet werden können. Um die Qualität des Freitextverfahrens zu steigern empfiehlt es sich jedoch (zusätzlich) fachspezifische Stoppwortlisten einzusetzen. Bei einem Text aus dem Fachgebiet der Informationstechnologie beinhaltet die fachspezifische Stoppwortliste beispielsweise das Wort „Computer“. Allgemeine Stoppwortlisten beinhalten Worte wie beispielsweise Artikel, Konjunktionen etc.
 
 
 
Folgende Tabelle zeigt ein Beispiel für eine allgemeine deutschsprachige Stoppwortliste.
 
 
 
{| border="0" cellpadding="5" cellspacing="1" style="float:left; empty-cells:show; margin-left:1em; margin-bottom:0.5em; background:#e3e3e3;"
 
! colspan="3" align="center" | eine allgemeine Stoppwortliste
 
|---- bgcolor="#FFFFFF"
 
|über || können || wie || von || der || waren
 
|---- bgcolor="#FFFFFF"
 
|nach || sollen || falls || auf || ihre || was
 
|---- bgcolor="#FFFFFF"
 
|alle ||könnten ||in ||nur ||ihnen ||wenn
 
|---- bgcolor="#FFFFFF"
 
|auch ||brauchen ||darein ||oder ||darauf ||wo
 
|---- bgcolor="#FFFFFF"
 
|an ||dürfen ||ist ||irgendeiner ||da ||welcher
 
|---- bgcolor="#FFFFFF"
 
|und ||darf ||es ||unser ||diese ||während
 
|---- bgcolor="#FFFFFF"
 
|noch ||jeder ||seinem ||aus ||sie ||wer
 
|---- bgcolor="#FFFFFF"
 
|jeglicher ||sonsteiner ||eben ||über ||dieser ||will
 
|---- bgcolor="#FFFFFF"
 
|sind ||für ||gleich ||betreffs ||jene ||mit
 
|---- bgcolor="#FFFFFF"
 
|weil ||wegen ||durften ||sollten ||durch ||könntest
 
|---- bgcolor="#FFFFFF"
 
|bei ||dahinter ||viele ||derselbe ||zu ||ihres
 
|---- bgcolor="#FFFFFF"
 
|sein ||hatte ||ich ||sch ||ebensolcher ||euer
 
|---- bgcolor="#FFFFFF"
 
|darum ||hat ||könntet ||seit ||unter ||a b c d e
 
|---- bgcolor="#FFFFFF"
 
|gewesen ||hattest ||mehreres ||solltest ||wohinauf ||f g h i j
 
|---- bgcolor="#FFFFFF"
 
|davor ||er ||viele ||so ||brauchen ||k l m n o
 
|---- bgcolor="#FFFFFF"
 
|seiend ||haben ||viel ||einige ||sehr ||p q r s t
 
|---- bgcolor="#FFFFFF"
 
|zwischen ||ihre ||müssen ||doch ||wollen ||u v w x y
 
|---- bgcolor="#FFFFFF"
 
|beide ||dadrinnen ||mein ||solcher ||war ||z ä
 
|---- bgcolor="#FFFFFF"
 
|aber ||ihm ||nichts ||habt ||solcherart ||1 2 3 4 5
 
|---- bgcolor="#FFFFFF"
 
|nahe ||selbst ||nein ||als ||wir ||6 7 8 9 0
 
|---- bgcolor="#FFFFFF"
 
|wollten ||seinem ||eben ||dass ||wohl || 
 
|-
 
|-
 
|}
 

Aktuelle Version vom 10. Mai 2006, 08:45 Uhr

Weiterleitung nach: