Automatische Indexierung: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
 
(30 dazwischenliegende Versionen von 5 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
=Testausgabe Automatische Indexierung=
+
{| border="1" cellspacing="0" cellpadding="5" style="border-collapse:collapse;" align="center" width="80%" style="background:#E8F2FF;" bgcolor="#E8F2FF"
Dieser Artikel ist noch nicht abgeschlossen, bitte nicht verändern.<br>
+
|-
<p>Die automatische [[Indexierung]] ist neben der intellektuellen (manuellen) und computergestützten Indexierung eine der Methoden, mit denen [[Deskriptoren]] einer Dokumentarischen Bezugseinheit zugeordnet werden können.<br>
+
|[[definition:: Die '''automatische Indexierung''' ist ein Methode, mit der einer dokumentarischen Bezugseinheit von einem Computer [[Deskriptoren]] zugeordnet werden können.]] Daneben gibt es noch die [[intellektuelle_Indexierung|intellektuelle]] (manuelle) und die [[Computergestützte Indexierung|computergestützte Indexierung]].
Die automatische Indexierung setzt voraus, dass coded informations vorhanden sind.
 
Mit anderen Worten, Zeichenketten, die der Computer bzw. die Software durchsuchen kann.</p>
 
  
 +
Die '''automatische Indexierung''' setzt voraus, dass "coded informations" vorhanden sind. Mit anderen Worten, Zeichenketten, die der Computer bzw. die Software durchsuchen kann.
 +
Man unterscheidet zwischen folgenden unterschiedlichen automatischen Indexierungsverfahren:
 +
|}
 +
<br>
  
=== Stoppwortliste (Negativeliste) ===
+
==Freitextverfahren==
<p>Mit Hilfe einer '''Stoppwortliste''' können z.B. inhaltsleere Wörter ausgeschlossen werden. Das System funktioniert so, dass jedes Wort das in der Liste enthalten ist bei der Wahl der Deskriptoren nicht berücksichtigt wird.  
+
 
Beispiele dafür sind im allgemeinen Artikel, Präpositionen, Adverbien etc. ...<br>
+
Hierbei übernimmt das System alle Wörter in den [[Index]] und lässt sie somit zur Suche zu.
Das Thema der dokumentarischen Bezugseinheit gibt jedoch weitere Stoppwörter vor, so kann in einem Artikel über Informatik das Wort „Programm“ ausgeschlossen werden.</p>
+
 
 +
Der Index kann hierbei nach vollen bzw. trunkierten Wortformen durchsucht werden. Durch Trunkierungssymbole werden Teile des Wortes isoliert, es können dann Wörter gesucht werden, in denen der übrig gebliebene Wortteil enthalten ist.<br>
 +
Diese Symbole können, je nach Anwendung, unterschiedlich aussehen (z.B. "?" oder "*") und vor, nach oder in der Mitte eines Wortes gesetzt werden.
  
=== Freitextverfahren und Trunkierungssymbole ===
 
<p>Sind alle Wörter der dokumentarischen Bezugseinheit, die nicht in der Stoppwortliste stehen zur Suche zugelassen (also Deskriptoren), spricht man von '''Freitextverfahren'''.
 
Der Index kann hier nach vollen bzw. trunkierten Wortformen durchsucht werden.
 
Durch '''Trunkierungssymbole''' werden Teile des Wortes isoliert, es können dann Wörter gesucht werden, in denen der abgesonderte Wortteil enthalten ist.<br>
 
Diese Symbole können je nach Anwendung unterschiedlich aussehen (z.B. "?" oder "*") und vor, nach oder in der Mitte eines Wortes gesetzt werden.<br>
 
 
Beispielsweise „Atlas“:<br>
 
Beispielsweise „Atlas“:<br>
man möchte andere Formen dieses Wortes Berücksichtigen und schreibt „atla?“, erhält dann u.a. „Atlasse, Atlassen, Atlanten“ aber auch „Atlantik“. <br>
+
man möchte andere Formen dieses Wortes berücksichtigen und schreibt „atla?“, erhält dann u.a. „Atlasse, Atlassen, Atlanten“ aber auch „Atlantik“.  
Dieses Beipiel macht deutlich, dass durch dieses Vefahren auch viel Ballast produziert werden kann (Atlantik=Ballast).</p>
+
 
 +
Dieses Beispiel macht deutlich, dass durch dieses Verfahren auch viel Ballast produziert werden kann (Atlantik = Ballast). <br>
 +
Dem Problem des Ballastes versucht das [[#Morphologisch-lexikalische Verfahren|Morphologisch-lexikalische Verfahren]] gerecht zu werden.
 +
 
 +
Um die Indexdatenbank jedoch möglichst schlank halten zu können, also die Zahl der Deskriptoren zu reduzieren und somit die Bearbeitungszeit zu verringern (sowohl bei der Erstellung als auch bei der Suchanfrage), löscht man aus dem Index so genannte [[Stoppwort|Stoppworte]] (inhaltsleere Wörter) heraus.
 +
 
 +
Dieses Verfahren ist relativ einfach zu implementieren, aber (abgesehen von trunkierten Wortformen – wenn im Suchsystem implementiert) nicht sehr "intelligent".
 +
 
 +
==Morphologisch-lexikalische Verfahren==
 +
 
 +
Das '''morphologisch-lexikalische Verfahren''' wird eingesetzt, um den bei der Trunkierung entstehenden Ballast zu reduzieren. Es bietet eine bessere [[Retrieval]]-Genauigkeit durch Computerlexika, aufgeteilt in Wortformen- und Stammlexika, die mit unterschiedlichen Arbeitsweisen vorgehen.
 +
 
 +
Wortformenlexika beinhalten alle Grundformen aller enthaltener Wörter mit den dazugehörigen grammatischen Formen (Person, Numerus, Tempus..). Dadurch wird eine [[Morphologie|morphologische]] Analyse, und somit eine Untersuchung von Wörtern, die nicht im Lexikon enthalten sind, überflüssig, z.B. Wortzusammensetzungen und Ableitungen. <br>
 +
Nur mit Stammlexika kann man neue Wörter analysieren, die noch nicht im Lexikon stehen. Auf diesem Weg und in Verbindung mit einer syntaktischen Analyse lassen sich auch Mehrwortbegriffe mit einbeziehen (wie "natürliche Person"). Lexikalische Systeme sind flexibler in Bezug auf neue Wörter, wie z.B. Spaßgesellschaftskonsum.
 +
 
 +
==Morphosyntaktische Verfahren==
 +
 
 +
Deutlich aufwendiger als das '''morphologisch-lexikalische Verfahren''' ist das '''morphosyntaktische Verfahren'''. Es ist allerdings auch - abgesehen vom [[#Semantische Analyse|semantischen Verfahren]] - das qualitativ hochwertigste Verfahren. Hierbei werden Texte [[Parsen|geparst]] (auf Wort- und Satzebene analysiert) und eine komplette Repräsentation des Textes wird angelegt. Damit ist dann auch die Analyse von Mehrwortdeskriptoren möglich. Teilweise können auch Abhängigkeiten zwischen mehreren [[Deskriptoren ]] erkannt werden, z.B.:
 +
 
 +
  1. Auf Entschädigung hatte der Kläger keinen Anspruch.
 +
  2. ... Entschädigung. Einen Anspruch darauf hat der Kläger nicht.
 +
  3. Das Gericht verneinte einen Anspruch des Klägers auf Entschädigung.
 +
 
 +
Nur eine satz- oder sogar textlinguistische Analyse kann die entsprechenden Bezüge identifizieren, z.B. über eine Dependenzanalyse. Die Dependenz- oder Valenzgrammatik geht davon aus, dass v.a. Verben, aber auch Substantive und Adjektive über Valenzen andere Satzkonstituenten an sich binden können. Für das Beispiel 3. bedeutet dies z. B., dass der Begriff "auf Entschädigung" nicht an das Verb "verneinen" gebunden wird, weil dieses keine entsprechende Valenz hat. Dafür hat aber "Anspruch" eine solche Valenz, so dass folgendes Ergebnis ermittelt wird:
 +
 
 +
Anspruch (des Klägers; auf Entschädigung)
 +
 
 +
Hieraus ließen sich die Mehrwortdeskriptoren "Anspruch des Klägers" und "Anspruch auf Entschädigung" generieren.
 +
 
 +
Syntaxanalysen führen recht schnell zu unverhältnismäßig aufwendigen und komplexen Lösungen, ohne eine wirklich entscheidende Verbesserung der Indexierung leisten zu können.
 +
 
 +
==Semantische Analyse==
 +
 
 +
Eine semantische Analyse wäre beispielsweise von Vorteil, wenn ein Sachverhalt von mehreren Personen beschrieben wird. Erläutern verschiedene Nutzer den gleichen Sachverhalt, wählen sie dafür unterschiedliche Formulierungen. Die sogenannten Rollenindikatoren trennen hier mit Hilfe der semantischen Analyse Subjekt, Objekt und Handlung von den Deskriptoren. Ein und derselbe Sachverhalt kann je nach Situation ganz verschieden formuliert werden, sollte aber, um diesen Sachverhalt abfragen zu können, in eine einzige schlüssige semantische Repräsentation überführt werden.
 +
Zum besseren Verständnis folgt hier ein Beispiel aus dem [http://is.uni-sb.de/studium/handbuch/exkurs.ind.php#semant virtuellen Handbuch der Informationswissenschaft], das ursprünglich in der DIN 31 623 Teil 3 aufgeführt wurde:
 +
 
 +
"Der Einsatz von Pferden zum Schleppen von Baumstämmen"
 +
 
 +
Die Formulierung dieses Sachverhalts kann fast beliebig variiert werden:
 +
 
 +
Pferde schleppen Baumstämme<br>Pferde können Baumstämme schleppen<br>Baumstämme können von Pferden geschleppt werden<br>das Schleppen von Baumstämmen durch Pferde<br>Pferde, die Baumstämme schleppen können<br>
  
=== Morphologisch-lexikalische Verfahren ===
+
Im Grunde handelt es sich immer um den gleichen Sachverhalt:
<p>Um diesen Ballast zu vermeiden, wird z.B. das '''morphologisch-lexikalische Verfahren''' angewendet. Es bietet eine bessere Retrievalgenauigkeit durch Computerlexika, aufgeteilt in Wortformen- und Stammlexika, die mit unterschiedlichen Arbetsweisen vorgehen.</p>
 
  
<p>'''Wortformenlexika''' beinhalten alle Grundformen aller enthaltener Wörter mit den dazugehörigen grammatischen Angaben.</p>
+
{| border="0" cellpadding="5" cellspacing="1" style="float:left; empty-cells:show; margin-left:1em; margin-bottom:0.5em; background:#e3e3e3;"
 +
! colspan="2" align="center" |
 +
|---- bgcolor="#FFFFFF"
 +
|'''Rollenindikator''' || '''Deskriptor'''
 +
|---- bgcolor="#FFFFFF"
 +
|Subjekt (Handelnder) || Pferd
 +
|---- bgcolor="#FFFFFF"
 +
|Handlung  || Schleppen
 +
|---- bgcolor="#FFFFFF"
 +
|Objekt || Baumstamm
 +
|---- bgcolor="#FFFFFF"
 +
|}
 +
<br><br><br><br><br><br><br>
  
<p>Das '''stammlexikalische Indexierungsverfahren''' benutzt nur die Grundformen der Wörter. <br>
+
Es gibt Forschungsansätze wie z.B. AIR-PHYS von der TH Darmstadt oder CTX der informationswissenschaftlichen Fakultät der Universität des Saarlandes. Alle haben jedoch ähnliche Probleme wie z.B.: hoher Aufwand für die Lexikonpflege, Mehrdeutigkeiten, Performanceprobleme, Bedienungsprobleme, etc. Das Produkt [http://www.fujitsu-siemens.de/products/software/transaction_processing/retrieval_systems/passat.html PASSAT] von Siemens findet bereits erfolgreichen Einsatz.
Dadurch wird eine '''morphologische Analyse''' und damit eine Untersuchung von Wörtern, die nicht im Lexikon enthalten sind möglich. Z.B. Wortzusammensetzungen und Ableitungen.
 
Auf diesem Weg lassen sich auch Mehrwortbegriffe mit einbeziehen (wie "natürliche Person")</p>
 
  
=== Semantische Analyse ===
+
'''Thesaurusrelation'''<br>
<p>Eine '''semantische Analyse''' ist beispielsweise von Vorteil, wenn ein Sachverhalt von mehreren Personen beschrieben wird. Erläutern verschiedene Nutzer den gleichen Sachverhalt, wählen Sie dafür unterschiedliche Formulierungen. Die sogenannten '''Rollenindikatoren''' trennen hier mit Hilfe der semantischen Analyse Subjekt, Objekt und Handlung von den Deskriptoren.</p>
+
Auch '''[[Thesaurus|Thesauri]]''' werden bei der automatischen Indexierung angewendet. Durch sie werden die semantischen Beziehungen verschiedener Begriffe zueinander festgehalten. Das heißt, dass auch Begriffe, die nicht im Text stehen, aber trotzdem das Dokument sehr gut beschreiben, als Deskriptoren zur Verfügung stehen können. <br>
  
<p>Zum besseren Verständnis, möchte ich hier ein Beispiel aus dem virtuellen Handbuch der Informationswissenschaft anführen das ursprünglich in der DIN 31 623 Teil 3 aufgeführt wird.</p>
+
==Quellen==
::''<p>"Der Einsatz von Pferden zum Schleppen von Baumstämmen.<br><br>'''Die Formulierung dieses Sachverhalts kann fast beliebig variiert werden:'''<br>Pferde schleppen Baumstämme<br>Pferde können Baumstämme schleppen<br>Baumstämme können von Pferden geschleppt werden<br>das Schleppen von Baumstämmen durch Pferde<br>Pferde, die Baumstämme schleppen können<br><br>'''Im Grunde handelt es sich immer um den gleichen Sachverhalt:'''<br>Rollenindikator:_________Deskriptor:<br>Subjekt (Handelnder)____Pferd<br>Handlung______________Schleppen<br>Objekt_______________Baumstämme"</p>''
 
  
=== Thesaurusrelation ===
+
*DIN 31 623 "Indexierung zur inhaltlichen Erschließung von Dokumenten"<br>
<p>Auch '''[[Thesaurus|Thesauri]]''' werden bei der automatischen Indexierung angewendet. Durch sie werden die semantischen Beziehungen verschiedener Begriffe zueinander festgehalten. Das heißt, dass auch Begriffe, die nicht im Text stehen, aber trotzdem das Dokument sehr gut beschreiben als Deskriptoren zur Verfügung stehen können.</p>
+
*Knorz, G. (1994), Automatische Indexierung. In: Hennings, R.-D.; Knorz, G.; Manecke, H.-J.; Reinicke, W.; Schwandt, J.: Wissensrepräsentation und Information Retrieval. Universität Potsdam, Informationswissenschaft, Modellversuch BETID, Lehrmaterialien Nr. 3, Kapitel 4, S. 138 - 196. Online verfügbar unter: http://fiz1.fh-potsdam.de/volltext/fhdarmstadt/03003.html last visited 5.11.05<br>
 +
*Knorz, G. (2004): Informationsaufbereitung II: Indexieren. In: Kuhlen/Seeger/Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation, Kap B5, S. 179-188<br>
 +
*Luckhardt, Heinz-Dirk: Automatisches und intellektuelles Indexieren: Virtuelles Handbuch der Informationswissenschaft, Abschnitte 0.-3.4.2. Online verfügbar unter: http://is.uni-sb.de/studium/handbuch/exkurs.ind.html last visited 5.11.05<br>
  
 +
==Verwandte Begriffe==
  
 +
* [[broader::Informationslinguistik]]
 +
* [[broader::Informationserschließung]]
 +
* [[broader::Indexierung]]
 +
* [[synonymous::maschinelle Indexierung]]
 +
* [[related::Information Retrieval]]
 +
* [[english::automatic indexing]]
  
=== Quellen: ===
+
[[category:Informationslinguistik]]
1. Luckhardt, Heinz-Dirk, Automatisches und intellektuelles Indexieren: Virtuelles Handbuch der Informationswissenschaft, Abschnitte 0.-3.4.2
+
[[category:Informationserschließung]]
http://is.uni-sb.de/studium/handbuch/exkurs.ind.html last visited 5.11.05<br>
 
2. DIN 31 623<br>
 
3. Knorz, G., Automatische Indexierung, in: Hennings, R.-D.;Knorz, G.; Manecke, H.-J.; Reinicke, W.; Schwandt, J.: Wissensrepräsentation und Information Retrieval. Universität Potsdam, Informationswissenschaft, Modellversuch BETID, Lehrmaterialien Nr. 3, Mai 1994, Kapitel 4, S. 138 - 196
 
http://fiz1.fh-potsdam.de/volltext/fhdarmstadt/03003.html last visited 5.11.05<br>
 
4. Knorz, G., Informationsaufbereitung II: Indexieren, in: Kuhlen/Seeger/Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation (2004), Kap B5, S. 179-188<br>
 

Aktuelle Version vom 5. Februar 2009, 11:21 Uhr

Die automatische Indexierung ist ein Methode, mit der einer dokumentarischen Bezugseinheit von einem Computer Deskriptoren zugeordnet werden können. Daneben gibt es noch die intellektuelle (manuelle) und die computergestützte Indexierung.

Die automatische Indexierung setzt voraus, dass "coded informations" vorhanden sind. Mit anderen Worten, Zeichenketten, die der Computer bzw. die Software durchsuchen kann. Man unterscheidet zwischen folgenden unterschiedlichen automatischen Indexierungsverfahren:


Freitextverfahren

Hierbei übernimmt das System alle Wörter in den Index und lässt sie somit zur Suche zu.

Der Index kann hierbei nach vollen bzw. trunkierten Wortformen durchsucht werden. Durch Trunkierungssymbole werden Teile des Wortes isoliert, es können dann Wörter gesucht werden, in denen der übrig gebliebene Wortteil enthalten ist.
Diese Symbole können, je nach Anwendung, unterschiedlich aussehen (z.B. "?" oder "*") und vor, nach oder in der Mitte eines Wortes gesetzt werden.

Beispielsweise „Atlas“:
man möchte andere Formen dieses Wortes berücksichtigen und schreibt „atla?“, erhält dann u.a. „Atlasse, Atlassen, Atlanten“ aber auch „Atlantik“.

Dieses Beispiel macht deutlich, dass durch dieses Verfahren auch viel Ballast produziert werden kann (Atlantik = Ballast).
Dem Problem des Ballastes versucht das Morphologisch-lexikalische Verfahren gerecht zu werden.

Um die Indexdatenbank jedoch möglichst schlank halten zu können, also die Zahl der Deskriptoren zu reduzieren und somit die Bearbeitungszeit zu verringern (sowohl bei der Erstellung als auch bei der Suchanfrage), löscht man aus dem Index so genannte Stoppworte (inhaltsleere Wörter) heraus.

Dieses Verfahren ist relativ einfach zu implementieren, aber (abgesehen von trunkierten Wortformen – wenn im Suchsystem implementiert) nicht sehr "intelligent".

Morphologisch-lexikalische Verfahren

Das morphologisch-lexikalische Verfahren wird eingesetzt, um den bei der Trunkierung entstehenden Ballast zu reduzieren. Es bietet eine bessere Retrieval-Genauigkeit durch Computerlexika, aufgeteilt in Wortformen- und Stammlexika, die mit unterschiedlichen Arbeitsweisen vorgehen.

Wortformenlexika beinhalten alle Grundformen aller enthaltener Wörter mit den dazugehörigen grammatischen Formen (Person, Numerus, Tempus..). Dadurch wird eine morphologische Analyse, und somit eine Untersuchung von Wörtern, die nicht im Lexikon enthalten sind, überflüssig, z.B. Wortzusammensetzungen und Ableitungen.
Nur mit Stammlexika kann man neue Wörter analysieren, die noch nicht im Lexikon stehen. Auf diesem Weg und in Verbindung mit einer syntaktischen Analyse lassen sich auch Mehrwortbegriffe mit einbeziehen (wie "natürliche Person"). Lexikalische Systeme sind flexibler in Bezug auf neue Wörter, wie z.B. Spaßgesellschaftskonsum.

Morphosyntaktische Verfahren

Deutlich aufwendiger als das morphologisch-lexikalische Verfahren ist das morphosyntaktische Verfahren. Es ist allerdings auch - abgesehen vom semantischen Verfahren - das qualitativ hochwertigste Verfahren. Hierbei werden Texte geparst (auf Wort- und Satzebene analysiert) und eine komplette Repräsentation des Textes wird angelegt. Damit ist dann auch die Analyse von Mehrwortdeskriptoren möglich. Teilweise können auch Abhängigkeiten zwischen mehreren Deskriptoren erkannt werden, z.B.:

  1. Auf Entschädigung hatte der Kläger keinen Anspruch.
  2. ... Entschädigung. Einen Anspruch darauf hat der Kläger nicht.
  3. Das Gericht verneinte einen Anspruch des Klägers auf Entschädigung.

Nur eine satz- oder sogar textlinguistische Analyse kann die entsprechenden Bezüge identifizieren, z.B. über eine Dependenzanalyse. Die Dependenz- oder Valenzgrammatik geht davon aus, dass v.a. Verben, aber auch Substantive und Adjektive über Valenzen andere Satzkonstituenten an sich binden können. Für das Beispiel 3. bedeutet dies z. B., dass der Begriff "auf Entschädigung" nicht an das Verb "verneinen" gebunden wird, weil dieses keine entsprechende Valenz hat. Dafür hat aber "Anspruch" eine solche Valenz, so dass folgendes Ergebnis ermittelt wird:

Anspruch (des Klägers; auf Entschädigung)

Hieraus ließen sich die Mehrwortdeskriptoren "Anspruch des Klägers" und "Anspruch auf Entschädigung" generieren.

Syntaxanalysen führen recht schnell zu unverhältnismäßig aufwendigen und komplexen Lösungen, ohne eine wirklich entscheidende Verbesserung der Indexierung leisten zu können.

Semantische Analyse

Eine semantische Analyse wäre beispielsweise von Vorteil, wenn ein Sachverhalt von mehreren Personen beschrieben wird. Erläutern verschiedene Nutzer den gleichen Sachverhalt, wählen sie dafür unterschiedliche Formulierungen. Die sogenannten Rollenindikatoren trennen hier mit Hilfe der semantischen Analyse Subjekt, Objekt und Handlung von den Deskriptoren. Ein und derselbe Sachverhalt kann je nach Situation ganz verschieden formuliert werden, sollte aber, um diesen Sachverhalt abfragen zu können, in eine einzige schlüssige semantische Repräsentation überführt werden. Zum besseren Verständnis folgt hier ein Beispiel aus dem virtuellen Handbuch der Informationswissenschaft, das ursprünglich in der DIN 31 623 Teil 3 aufgeführt wurde:

"Der Einsatz von Pferden zum Schleppen von Baumstämmen"

Die Formulierung dieses Sachverhalts kann fast beliebig variiert werden:

Pferde schleppen Baumstämme
Pferde können Baumstämme schleppen
Baumstämme können von Pferden geschleppt werden
das Schleppen von Baumstämmen durch Pferde
Pferde, die Baumstämme schleppen können

Im Grunde handelt es sich immer um den gleichen Sachverhalt:

Rollenindikator Deskriptor
Subjekt (Handelnder) Pferd
Handlung Schleppen
Objekt Baumstamm








Es gibt Forschungsansätze wie z.B. AIR-PHYS von der TH Darmstadt oder CTX der informationswissenschaftlichen Fakultät der Universität des Saarlandes. Alle haben jedoch ähnliche Probleme wie z.B.: hoher Aufwand für die Lexikonpflege, Mehrdeutigkeiten, Performanceprobleme, Bedienungsprobleme, etc. Das Produkt PASSAT von Siemens findet bereits erfolgreichen Einsatz.

Thesaurusrelation
Auch Thesauri werden bei der automatischen Indexierung angewendet. Durch sie werden die semantischen Beziehungen verschiedener Begriffe zueinander festgehalten. Das heißt, dass auch Begriffe, die nicht im Text stehen, aber trotzdem das Dokument sehr gut beschreiben, als Deskriptoren zur Verfügung stehen können.

Quellen

  • DIN 31 623 "Indexierung zur inhaltlichen Erschließung von Dokumenten"
  • Knorz, G. (1994), Automatische Indexierung. In: Hennings, R.-D.; Knorz, G.; Manecke, H.-J.; Reinicke, W.; Schwandt, J.: Wissensrepräsentation und Information Retrieval. Universität Potsdam, Informationswissenschaft, Modellversuch BETID, Lehrmaterialien Nr. 3, Kapitel 4, S. 138 - 196. Online verfügbar unter: http://fiz1.fh-potsdam.de/volltext/fhdarmstadt/03003.html last visited 5.11.05
  • Knorz, G. (2004): Informationsaufbereitung II: Indexieren. In: Kuhlen/Seeger/Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation, Kap B5, S. 179-188
  • Luckhardt, Heinz-Dirk: Automatisches und intellektuelles Indexieren: Virtuelles Handbuch der Informationswissenschaft, Abschnitte 0.-3.4.2. Online verfügbar unter: http://is.uni-sb.de/studium/handbuch/exkurs.ind.html last visited 5.11.05

Verwandte Begriffe

… weitere Daten zur Seite „Automatische Indexierung
Die automatische Indexierung ist ein Methode, mit der einer dokumentarischen Bezugseinheit von einem Computer Deskriptoren zugeordnet werden können. +