https://wiki.infowiss.net/api.php?action=feedcontributions&user=Maegertm&feedformat=atomInfoWissWiki - Das Wiki der Informationswissenschaft - Benutzerbeiträge [de]2024-03-29T08:48:59ZBenutzerbeiträgeMediaWiki 1.33.0https://wiki.infowiss.net/index.php?title=Extracting&diff=15580Extracting2014-12-31T13:37:45Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
Der Grossteil an heute verfügbarer Information ist in Texten und anderen unstrukturierten Medien gespeichert und deswegen nicht direkt durch Rechner interpretierbar. Hier setzt die Methode des Extractings an: Dabei werden vordefinierte Typen von Informationen aus maschinenlesbaren Dokumenten extrahiert. [[definition::Extracting ist somit ein Teilgebiet der inhaltlichen Erschliessung, genauer eine Unterkategorie der [[Indexierung]]. Dabei wird auf Grundlage von [[Stichwort|Stichwörtern]] gearbeitet, im Gegensatz zur [[Additionsmethode]], welche auf [[Schlagwort|Schlagwörtern]] basiert.]]<br />
<br />
==Ziele==<br />
<br />
Meist besteht das Ziel des Extracting darin, [[Datenbank|Datenbanken]] mit den gewonnenen Informationen zu füllen um diese weiter zu verarbeiten. Dazu werden oftmals Vorverarbeitungstechniken auf die Texte angewendet, wie die Zerlegung dessen in Basiseinheiten (Token), dem Erkennen von Satzgrenzen und Wortarten (Part-Of-Speech-Tagging) das Rückführen der Wörter auf Grundformen ([[Morphologie|morphologische]] Zerlegung), ggf. Rechtschreibkorrekturen, sowie das Erkennen von Satzteilen (Chunking). Der Erfolg der gewählten Methode wird anhand der Masse [[Precision]] und [[Recall]] gemessen.<br />
<br />
==Arten==<br />
<br />
Informationsextraktion, sprich die Suche nach den relevanten Indikator-Daten, kann in unterschiedlichen Arten geschehen. Diese beinhalten unter anderem:<br />
<br />
* Topic Detection (Themenextraktion)<br />
* Name Extraction (Namensextraktion)<br />
* Named Entity Extraction (Begriffsextraktion)<br />
* Relation Extraction (Relationsextraktion)<br />
* Event Extraction (Ereignisextraktion)<br />
* Opinion Mining (Meinungsextraktion)<br />
* Sentiment Detection (Extraktion von Emotionen und subjektiven Bewertungen)<br />
* Answer Extraction (Antwortextraktion)<br />
<br />
==Ansätze==<br />
<br />
Die Informationsextraktion kann mit [[Knowledge Engineering|Knowledge-Engineering]]- Ansätzen oder über automatisch trainierbare Lernverfahren umgesetzt werden. In der Realität sind meist gemischte Formen populär, welche die jeweiligen Stärken und Schwächen kombinieren. Die Technologie ist noch sehr domänen- und sprachabhängig und so können viele Ansätze nicht ohne weiteres aus dem Englischen auf andere Sprachen übertragen werden.<br />
<br />
===Intellektuelles Extracting===<br />
<br />
Beim Knowledge-Engineering-Ansatz erstellen Menschen Regeln und Muster zur Extraktion von Information aus Texten. Dies basiert oft auf kaskadierenden Regel-Grammatiken, wobei der Engineer eine Menge von Regeln definiert, welche aus dem regulären Ausdruck über die Eigenschaften des Textes bestehen, beispielsweise Einträge eines Wörterbuches oder von Wortklassen. Werden diese Muster im Text erkannt, wird der entsprechenden Textstelle eine Entität oder eine Relation zugewiesen. Es werden meist mehrere aufeinander aufbauende Grammatiken verwendet, welche komplexere Eigenschaften oder Entitäten für spätere Phasen herleiten.<br />
Die Herausforderungen umfasst die Definition einer standardisierten Regelsprache, welche Vorteile für die Forschung und Anwendungen mit sich bringen würde. Diese müsste ausreichend ausdrucksmächtig sein, eine deklarative Natur, sowie Erweiterbarkeit besitzen.<br />
<br />
===Automatisches Extracting===<br />
<br />
Beim automatischen Extracting werden zu allen Textstellen manuelle [[Annotation|Annotationen]] hinzugefügt, woraus Modelle generiert werden, um Informationen aus ähnlichen, unbekannten Texten zu extrahieren. Es wird dabei aus den bearbeiteten Beispieldokumenten automatisch gelernt. Die Voraussetzung dazu bildet das Vorhandensein einer ausreichend grossen Stichprobe von repräsentativen Dokumenten der Domäne und die Annotationen der Texte mit den gesuchten Informationstypen.<br />
<br />
==Verfahren==<br />
<br />
Bei den Verfahren zur Extraktion handelt es sich im wesentlichen um freitext- und wortorientierte Verfahren. Da maschinelle Sprachverarbeitungsverfahren (natural Language processing, NLP) nicht in der Lage sind die Inhalte der Texte zu verstehen, versucht man diese mittels verschiedener formaler Kenntnisse zu unterstützen, welche der Maschine übermittelt werden.<br />
<br />
===Syntaktische Analyse===<br />
<br />
Die [[Syntax|syntaktische]] Analyse besteht im wesentlichen aus:<br />
<br />
* Textextraktion: Extraktion des Fliesstextes mittels Eliminierung sämtlicher Auszeichnungen zur Formatierung.<br />
* Spracherkennung: Um auf einzelne Sprachen abgestimmte Verfahren wählen zu können, wird auf Spracherkennung gesetzt.<br />
* Segmentierung von Wörtern: Unterteilung des Textes in Segmente, deren kleinste Einheit Wörter sind, was in europäischen Sprachen einfach, in asiatischen jedoch komplizierte Verfahren bedeutet.<br />
* Segmentierung von Sätzen: Regeln und Heuristiken zur Erkennung von Satzenden und vor allem unter Berücksichtigung von Klammerausdrücken und Abkürzungen definieren.<br />
* Part-of-Speech-Tagging: Anreicherung von Wörtern eines Textes mit Informationen über deren Bedeutung innerhalb von Satzgrenzen in Form von Wortarten.<br />
* Erkennung von Phrasen: Den Zusammenhang zwischen einzelnen Wörtern eines Satzes herstellen.<br />
<br />
===Semantische Analyse===<br />
<br />
Die erkannten syntaktischen Strukturen werden auf ihren eigentlichen Bedeutungsinhalt analysiert. Dabei geht es primär um das Erkennen von Entitäten, also Personen, Organisationen oder Orte.<br />
<br />
Die [[Semantik|semantische]] Analyse besteht im wesentlichen aus:<br />
<br />
* Benannten Entitäten<br />
* Strukturierten Entitäten<br />
* Koreferenzanalyse: Wenn in einem Text verschiedenen sprachliche Segmente auf die gleiche Entität verweisen, spricht man von Koreferenz: Somit versucht man Koreferenzketten aufzulösen.<br />
* Auflösung sprachlicher Mehrdeutigkeit<br />
<br />
==Schwierigkeiten==<br />
<br />
Die Schwierigkeiten, die sich bei der Informationsextraktion ergeben, liegen in der Natur des Freitextes. Dies umfasst unter anderem folgende Phänomene:<br />
<br />
* Die selbe Entität kann unterschiedlich benannt werden.<br />
* Auf bereits benannte Entitäten oder Aussagen kann mithilfe von Anaphern Bezug genommen werden.<br />
* Die grammatikalischen Rollen der Entitäten in Aussagen sind nicht markiert sondern ergeben sich aus der morphologischsyntaktischen Struktur eines Satzes: Flexionsendungen, Wortstellung, Präposition etc. deuten auf diese hin, sind jedoch unverständlich ohne vorheriges Wissen über deren Bedeutung.<br />
* Ein [[Lemmatisierung|Lemma]] kann durch Flexionsendungen unterschiedliche Gestalt annehmen.<br />
* Aussagen können mit unterschiedlichem Vokabular gemacht werden.<br />
* Es existieren Haupt- und Nebensätze, sowie andere Satz- und Teilsatzstrukturen mit unterschiedlicher Syntax.<br />
* Trotz standardisierter Rechtschreibung und Grammatik existieren in der Realität Fehler.<br />
<br />
==Quellen==<br />
<br />
*Capurro, Rafael (2000): ''Einführung in die Informationswissenschaft.'' Verfügbar unter: http://www.capurro.de/iwmodul5.html [13.11.2014].<br />
<br />
*Dengel, Andreas (Hrsg.) (2012): ''Semantische Technologien. Grundlagen-Konzepte-Anwendungen.'' Heidelberg: Spektrum.<br />
<br />
*Klügl, Peter; Toepfer Martin (2014): ''Informationsextraktion.'' In: ''Informatik_Spektrum'' (Nr. 37_2, S. 132-135).<br />
<br />
*Luckhardt, Heinz-Dirk (2010): ''Virtuelles Handbuch Informationswissenschaft. Automatische und intellektuelle Indexierung.'' Verfügbar unter: http://is.uni-sb.de/studium/handbuch/exkurs_ind.html [13.11.2014].<br />
<br />
*Meyer, Alexander (2012): ''Extraktion von RDF-Tripeln aus unstrukturierten Wikipedia-Texten. DBpedia erweitern durch Auswertung kompletter Artikeltexte.'' Verfügbar unter: http://amor.cms.hu-berlin.de/~meyerale/wiki2rdf/Masterarbeit_A_Meyer.pdf [13.11.2014].<br />
<br />
*Uszkorei, Hans (2009): ''Informationsextraktion. Information Retrieval.'' Verfügbar unter: http://www.coli.uni-saarland.de/courses/is-is/slides/VLIWIS_IE_HU.pdf [13.11.2014].<br />
<br />
==Weiterführende Literatur==<br />
<br />
* Salton, Gerard; McGill, Michael J. (1987): ''Information Retrieval. Grundlegendes für Informationswissenschaftler.'' Hamburg: McGraw-Hill.<br />
<br />
* Knorz, G. (1997). ''Indexieren, Klassieren, Extrahieren.'' In: Buder;Rehfeld;Seeger;Strauch (Hrsg.): ''Grundlagen der praktischen Information und Dokumentation.'' München: K.G. Saur. (S.120-140).<br />
<br />
==Weblinks==<br />
<br />
* http://de.wikipedia.org/wiki/Informationsextraktion<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Informationserschließung]]<br />
* [[narrower::Stichwort]]<br />
* [[related::Abstracting]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Additionsmethode]]<br />
* [[synonymous::Extraktionsmethode]]<br />
* [[synonymous::Extrahieren]]<br />
<br />
* [[english::extracting]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Maschinelle_Klassifikation&diff=15578Maschinelle Klassifikation2014-12-31T13:36:49Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::Das maschinelle [[Klassifikation|Klassifizieren]] kann als ein Teilaspekt automatischer [[Informationserschließung|Inhaltserschliessung]] verstanden werden und ist vom automatischen [[Cluster|Clustern]] abzugrenzen, bei welchem kein fertiges Klassifikationssystem benutzt wird.]]<br />
Im Bibliotheksumfeld hingegen existieren feste Klassifikationssysteme, in welche die zu klassifizierenden Texte eingeordnet werden müssen. Ein rein automatisches Verfahren ist dabei nicht möglich, da die aus den Texten automatisch gewonnene Information immer im Bruch zur intellektuell erstellten Klassifikation stehen wird. Deshalb sind in diesem Zusammenhang semiautomatische Verfahren das Ziel, welche bestenfalls durch die Anwenderaktionen lernen können.<br />
<br />
==Ziele==<br />
<br />
Das Ziel einer Klassifikation besteht darin, einen Dokumentenbestand zu strukturieren, um so leichter in diesem Bestand navigieren zu können. Automatische Verfahren sollen dabei Zeit-, Personal und - damit verbunden - Kosteneinsparungen mit sich bringen.<br />
<br />
==Arten==<br />
<br />
Grundsätzlich wird bei der maschinellen Klassifikation zwischen häufigkeitsbasierten, lineraren, prototypbasierten und hierarchischen Verfahren unterschieden.<br />
Dies umfasst hauptsächlich:<br />
<br />
*Naiver Bayes-Klassifikator<br />
*Lineare Diskriminanzanalyse<br />
*Support-Vektor-Maschine<br />
*Nächster Nachbar Klassifikator<br />
*Lernende Vektorquantisierung<br />
*Entscheidungsbäume<br />
<br />
==Ansätze==<br />
<br />
Grundsätzlich wird immer zwischen maschinellen und regelbasierten Lernverfahren unterschieden.<br />
<br />
===Regelbasierter Ansatz===<br />
<br />
Bei den regelbasierten Verfahren werden von Experten Regeln aufgestellt. Nach diesen werden Texte [[Annotation|annotiert]]. Das Verfahren ist sehr aufwendig und somit kosten- und zeitintensiv, da das Expertenwissen in einen [[Algorithmus]] umgeschrieben werden muss, damit das Konstrukt auf die Dokumente angewendet werden kann. Der Vorteil ist, dass keine Trainingsdokumente benötigt werden und der Algorithmus direkt auf den zu klassifizierenden Text angewendet werden kann. Regelbasierte Verfahren werden auch computerlinguistische Verfahren genannt, was nicht ganz korrekt ist, denn diese enthalten auch die wörterbuchbasierten Verfahren. Dieses wiederum benutzt elektronische Wörterbücher zur Referenzierung bestimmter Terme in einem Text.<br />
<br />
===Maschineller Ansatz===<br />
<br />
Maschinelle Lernverfahren hingegen benötigen Trainingsdokumente. Dies sind Texte, welche bereits intellektuell klassifiziert wurden, was in Bibliotheken meist durch Fachreferenten geschieht, welche jedes Dokument einer bestimmten Klasse zuordnen.<br />
Diese Trainingsdokumente werden dazu benutzt, dass das Programm die Charakteristika einer Klasse über die vorklassifizierten Dokumente erlernt. Dies beinhaltet die Anwendung stochastischer und statistischer Methoden auf den Text. Die Vorteile liegen darin, dass kein Expertenwissen benötigt wird. Das Lernverfahren kann zudem leicht auf andere Klassifikationssysteme angewendet werden.<br />
<br />
==Verfahren==<br />
<br />
===Zerlegung===<br />
<br />
Um von einem Dokument zu einer Klassifikation zu gelangen, muss als erstes eine Zerlegung vorgenommen werden, wobei auf Grundlage des Dokumentes ein Index erzeugt wird.<br />
Dazu wird eine [[Extracting|Termextraktion]] vorgenommen, deren Ziel die Bestimmung der relevanten Begriffe eines Textes ist. Dabei wird das Ursprungsdokument, welches Volltext und Metadaten umfasst, in mehreren Teilschritten bearbeitet:<br />
<br />
*Eliminierung der Struktur:syntaktische Elemente werden nicht berücksichtigt.<br />
*Eliminierung häufiger Terme: [[Stoppwort|Stoppwörter]].<br />
*Eliminierung der 200-300 häufigsten Wörter einer Kollektion von Dokumenten.<br />
*Aufbrechen des Textes in Terme: Die Ermittlung von Wörtern und Wortfolgen, die als Terme zur Beschreibung verwendet werden, wobei sie auf ihre Stammform reduziert werden.<br />
*Reduktion der Terme auf Stammform und Zerlegung der Komposita.<br />
<br />
Allgemeingültige Algorithmen, wie beispielsweise der Porter Algorithmus, existieren nur für die englische Sprache. Aufgrund der starken Konjugation und Deklination im Deutschen, können diese Wörter nicht automatisch in ihre Stammform überführt werden, weshalb zusätzlich [[Thesaurus|Thesauri]] verwendet werden.<br />
Nach der Indexierung liegt als Ergebnis eine Menge von Begriffen vor.<br />
<br />
===Bestimmung der Relevanz===<br />
<br />
Ebenfalls nimmt die Bestimmung der Relevanz von Begriffen eine zentrale Rolle ein. Diese werden nach Position und Auftreten im Dokument beurteilt und in Bezug zum allgemeinen Wortschatz gestellt. Wenn die Termhäufigkeit im Dokument den festgelegten Erwartungswert X um einen Faktor Y überschreitet, gilt dieser als relevant. Die Bedeutung eines Begriffes innerhalb eines Textes wird über verschiedene Verfahren ermittelt. Eine weit verbreitete ist die Differenzanalyse, welche sich sowohl statistischer als auch linguisitscher Methoden bedient. Zur Durchführung der Differenzanalyse werden zwei Textmengen verglichen. Dies ist zum einen der zu analysierende Text und zum anderen ein Referenzkorpus, welcher allgemeinsprachlich aufgebaut ist.<br />
Als Ergebnis entsteht eine Liste von Worten, welche die relevante Terminologie des Textes abbildet.<br />
<br />
===Abbildung der Terme===<br />
<br />
Des Weiteren muss die erstellte Liste auf eine Klassifikation abgebildet werden. Dazu wird als Ausgangsbasis idealerweise ein Fachthesaurus verwendet, welcher eine Klassifikation impliziert.<br />
Die ausgewählte Klassifikation muss dem Anwendungsszenario gemäss gewählt werden. Werden beispielsweise Online-Dokumente automatisiert klassifiziert, spielt eine Aufstellungssystematik keine Rolle, so dass auch polyhierarchische Strukturen optimal genutzt werden können.<br />
Zudem sollte die Klassifikation mit jedem Vorgang des Klassifizierens um relevante Terme angereichert werden.<br />
<br />
===Auswirkungen auf die Datenbasis===<br />
<br />
Bereits klassifizierte Fachtexte können als Instanzen der jeweiligen Klasse hinterlegt werden, um die Datenbasis zu verbessern. Intellektuell klassifizierte Begriffe können dabei als Deskriptoren hinterlegt werden. Mit jeder Klassifizierung werden die neuen Terme als weitere [[Deskriptor|Deskriptoren]] verwendet und das Dokument als Instanz einer Klasse zugeordnet, wodurch das System lernend wird. Damit wird die Datenbasis vergrössert und die Automatisierung verbessert.<br />
<br />
==Schwierigkeiten==<br />
<br />
Wesentliche Probleme entstehen bei der maschinellen Klassifikation in Bezug auf Dokumente mit übergreifenden Themen, da diese keinem klaren Gebiet zugeordnet werden können.<br />
Weitere Schwierigkeiten birgt die Pflege der Klassifikation an sich. Es stellt sich die Frage, wann Deskriptoren einer Klasse entfernt werden können, und ob sie überhaupt entfernt werden sollen. <br />
Zudem können Terme innerhalb von Kontexten Bedeutungswandeln unterliegen, welche nicht automatisiert angepasst werden.<br />
<br />
==Quellen==<br />
<br />
*Helmbrecht-Schaar, Anja (2007): ''Entwicklung eines Verfahrens der automatischen Klassifizierung für Textdokumente aus dem Fachbereich Informatik mithilfe eines fachspezifischen Klassifikationssystems''. In: Umlauf, Konrad (Hrsg.): ''Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft'' (Heft 200). Berlin: Humboldt-Universität.<br />
<br />
*Runkler, Thomas A. (2010): ''Data Mining. Methoden und Algorithmen intelligenter Datenanalyse''. Wiesbaden: GWV Fachverlage.<br />
<br />
*Sommer, Maike (2012): ''Automatische Generierung von CCD-Notationen für Hochschulveröffentlichungen''. Bacherlorarbeit: Hochschule Hannover.<br />
<br />
==Weiterführende Literatur==<br />
<br />
*Nohr, Holger (2003): ''Grundlagen der automatischen Indexierung. Ein Lehrbuch''. Berlin: Logos.<br />
<br />
*Heyer, Gerhard; Quasthoff, Uwe; Wittig, Thomas (2008): ''Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse''. 1. korrigierter Nachdr. Herdecke: W3L-Verl.<br />
<br />
*Sebastiani, Fabrizio (2002): ''Machine learning in automated text categorization''. In: ''ACM Computing Surveys''. Jg. 34, H. 1, S. 1-47. Verfügbar unter: http://nmis.isti.cnr.it/sebastiani/Publications/ACMCS02.pdf [22.11.2014].<br />
<br />
==Weblinks==<br />
<br />
*http://de.wikipedia.org/wiki/Automatische_Klassifizierung<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Klassifikation]]<br />
* [[related::Extracting]]<br />
* [[related::Cluster]]<br />
* [[synonymous::Automatische Klassifizierung]]<br />
<br />
* [[english::automatic classification]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=OPAC&diff=15576OPAC2014-12-31T13:35:31Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::Der OPAC (Online Public Access Catalogue) ist ein als Datenbank angelegter elektronischer Katalog. Er gewährt den Bibliotheksbenutzern über das [[Internet]] Zugriff auf die Katalogdatenbank der Bibliothek. Er weist in der Regel eine Suchfunktion auf, in der beispielsweise nach Namen der beteiligten Personen, Sachtitel, Erscheinungsjahr und Reihentitel gesucht werden kann. Meist ist zudem eine Expertensuche vorhanden. Da Bibliotheken erst nach 1980 auf einen Online-Katalog umgestiegen sind, müssen ältere Bestände rekatalogisiert werden.]]<br />
<br />
==Geschichte==<br />
<br />
Der OPAC begann in den 1980er Jahren die konventionellen [[Kataloge]] (beispielsweise Zettelkatalog) der Bibliotheken abzulösen, wobei der Zugang vorerst über lokale Netzwerke erfolgte. In den 90er Jahren begann man nach und nach webbasierte OPACs einzusetzen, die über das Internet zugänglich sind. Heute ist ein OPAC meist ein integrierter Bestandteil von umfassenden Bibliotheksverwaltungsprogrammen. Lokale OPACs sind meist zu überregionalen Verbundkatalogen zusammengeschlossen, die den Bibliotheken den Datenaustausch ermöglichen und dem Benutzer grössere bibliografische Pools bieten. Heute ist der OPAC die verbreitetste Form des Bibliothekskataloges.<br />
<br />
==Struktur==<br />
<br />
Damit ein OPAC die nötigen Such-, Sortier-, Verknüpfungs-, Ausgabe- und Anzeigefunktionen gewährleisten kann, wird er in Form einer [[Datenbank]] strukturiert. Im Normalfall werden die Daten in drei Einheiten verwaltet: <br />
<br />
*Einzelne Dateien, die aus Datensätzen bestehen, welche sich in Feldern gliedern.<br />
*In der Titeldatei wird die bibliografische Titelaufnahme verwaltet, die dann einen Datensatz bildet.<br />
*Individuelle Identifikationsnummern (ID-Nummer) werden vergeben, damit jeder Datensatz eindeutig identifiziert werden kann.<br />
<br />
Ein [[Index]] (Register) für die Inhalte der abfragbaren Felder wird jeweils in einer Indexdatei gespeichert. Dieser enthält die Suchbegriffe eines Feldes in sortierter Form, entweder als Einzelwörter oder als vollständige Feldinhalte. Durch die Indizes wird der Such- und Sortiervorgang beschleunigt. Über die ID-Nummer sind die Indexeinträge mit den dazugehörigen Datensätzen verknüpft. Bei einem Recherchevorgang wird zunächst auf den Index zugegriffen, der dann alle Datensätze anzeigt, die durch ihre ID-Nummer mit dem Index verknüpft sind.<br />
Folgende Kategorien sind wichtig in der OPAC-Recherche:<br />
*Titelstichwörter<br />
*Phrasensuche<br />
*Personennamen<br />
*Körperschaftsnamen<br />
*Erscheinungsjahr,-ort<br />
*[[Verlag]]<br />
*ISBN / ISSN<br />
*Signatur, [[Notationen]]<br />
*[[Schlagwort]]<br />
*[[Stichwort]]<br />
<br />
==Benutzeroberfläche==<br />
<br />
Obwohl die meisten OPAC-Oberflächen nicht sonderlich hübsch anzuschauen sind, bieten sie den Nutzern komplexe Recherchemöglichkeiten. Meist hat man die Wahl zwischen einer Einfachen Suche oder einer erweiterten Expertensuche. In der Einfachen Suche steht nur eine Suchleiste zur Verfügung, in der eine umfassende Suche mit einzelnen Suchbegriffen durchgeführt werden kann. In der Expertensuche sind mehrere Suchleisten vorhanden, deren Suchfunktionen auf verschiedene Indexkategorien festlegbar sind. Die Suchleisten lassen sich durch Einbezug von [[Suchoperatoren]] wie die Booleschen Operatoren miteinander verbinden. Ebenfalls hilfreich sind Trunkierungen. Sobald eine Suche durchgeführt wird, werden die Titeldaten der entsprechenden Treffermenge aufgelistet. <br />
<br />
==Quellen==<br />
<br />
*Rautenberg, Ursula (2003): ''Reclams Sachlexikon des Buches.'' Stuttgart: Reclam.<br />
*Gantert, Klaus, Hacker, Rupert (2008): ''Bibliothekarisches Grundwissen.'' München: Saur.<br />
<br />
==Weiterführende Literatur==<br />
<br />
*IFLA Division of Bibliographic Control (2010): Richtlinien für die OPAC-Anzeige.'' Berlin: De Gruyter.<br />
<br />
==Weblinks==<br />
<br />
*Metakatalog der Schweizer Hochschulbibliotheken und der Schweizerischen Nationalbibliothek: https://www.swissbib.ch/<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Informationserschließung]]<br />
* [[broader::Information Retrieval]]<br />
* [[related::Katalogisierung]]<br />
* [[related::Katalog]]<br />
<br />
[[category:Information Retrieval]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Facettenklassifikation&diff=15574Facettenklassifikation2014-12-31T13:33:51Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[Definition::"Eine Facettenklassifikation (auch analytisch-synthetische Klassifikation) ist eine Kombination der Konstruktionsprinzipien von [[Notation]], Hierarchie und Citation Order aus der [[Klassifikation]] mit dem Prinzip der Facettierung.]] Dabei wird der Wissensbereich nicht in eine starre Baumstruktur wie in der [[Dezimalklassifikation]] eingegliedert; die Anzahl der Teilsysteme richtet sich nach der Anzahl von Facetten" (Schmatz et al. 2004).<br />
<br />
==Historische Entwicklung==<br />
<br />
Die bekannteste und älteste Form der Facettenklassifikation, die Colon Classification (CC), geht auf den indischen Mathematiker und Bibliothekar Shiyali Ramamrita Ranganathan (1892-1972) zurück. Ranganathan führte anfangs der 20er Jahre das Prinzip der Facettierung in die Klassifikationspraxis der Universitätsbibliothek Madras ein. 1933 entwickelte er die Grundzüge der Colon Classification, welche aktuell in der von 1972 erschienenen siebten, verbesserten Auflage vorzufinden ist. Die Colon Classification ist eine teilfacettierte Universalklassifikation, welche über eine kurze, kaum ausgebildete Hierarchie verfügt. Der Name der Klassifikation lässt sich von "colon" (dt. Doppelpunkt) ableiten, wobei auch weitere Interpunktionszeichen wichtige Bestandteile der Notation bilden. <br />
<br />
===Colon Classification===<br />
<br />
Die CC besteht aus logisch angeordneten Klassen, welche mit Grossbuchstaben kennzeichnet werden ( A Wissenschaft, B Mathematik, C Physik usw.). Diese Klassen werden in Unterklassen geteilt, als Notationen werden dabei arabische Ziffern benutzt, was z.B. bei der Gruppierung bei den "Nützlichen Künsten" folgendermassen aussieht:<br />
<br />
M — Nützliche Künste<br><br />
<br />
M1 — Buchproduktion und -beschreibung<br><br />
<br />
M13 — Papierherstellung<br><br />
<br />
M14 — Drucken (allgemein)<br><br />
<br />
M143 — Druck<br><br />
<br />
M1435 — Offsetdruck<br><br />
<br />
Klassen können auch zu Doppelklassen zusammengefasst und mit Doppelbuchstaben bezeichnet werden. Danach folgen die in Facetten unter einem Oberbegriff zusammengefassten Einzelbegriffe. <br />
<br />
==Allgemeines zur Facettenklassifikation==<br />
<br />
Der Ausgangspunkt bei der Facettenklassifikation ist die Überlegung, dass ein Gegenstandsbereich aus verschiedenen Blickwinkeln oder unter verschiedenen Aspekten betrachtet werden kann. Aus diesen Aspekten werden Facetten. Facettierte Begriffsordnungen können Wissensdomänen mit deutlich geringerem Platzaufkommen speichern, als dies bei den typischen Klassifikationssystemen der Fall ist. Die Anzahl der Teilsysteme richtet sich nach der Anzahl der Facetten; Facettenklassifikationen besitzen keine starre Baumstruktur, weshalb sie flexibel und jederzeit erweiterbar sind. Die Notation wird bei der Bearbeitung des Dokuments durch Notationen aus den jeweils zutreffenden Facetten zusammengebaut. Ab dem 1. Dokument steht die fertig synthetisierte Notation allen anderen themengleichen oder themenähnlichen Dokumenten zur Verfügung. <br />
<br />
===Facetten und Foci===<br />
<br />
Eine Facette ist das Ergebnis der Unterteilung eines Gegenstandsbereichs in grundlegende Aspekte, d.h. nichts anderes als eine Klasse, die einen Begriff auf einem sehr hohen Abstraktionsniveau repräsentiert. Facetten werden häufig mit Facettenindikatoren versehen, welche ermöglichen, die einzelnen Bestandteile einer zusammengesetzten Notation als solche zu identifizieren. Die Ausprägungen einer Facette werden als Foci bezeichnet. Auch bei Foci handelt es sich um Klassen, jedoch auf einem niedrigeren Abstraktionssniveau. Somit können Foci als Unterklassen von Facetten bezeichnet werden. <br />
<br />
Beispiel: Klassifizierung von Personen<br />
<br />
*Facetten--> Geschlecht/Alter<br />
*Foci--> männlich/weiblich, Erwachsene/Kinder<br />
<br />
Das Beispiel zeigt, dass sich die Klassen ausschliessen, also eindimensional sind. Eine Person kann entweder männlich oder weiblich sein, bzw. Kind oder Erwachsene sein. <br />
<br />
===Eigenschaften===<br />
<br />
Analytisch-synthetische Klassifikationen gehen im Gegensatz zu typischen, starr strukturierten analytischen Klassifikationen von den in der Systematik zusammengestellten, gleichrangigen Merkmalsbegriffen eines Wissensgebiets aus (z.B. Objekte, Eigenschaften, Personen, Zeit) denen die entsprechenden Einzelbegriffe, also Foci oder Isolate genannt, zugeordnet werden. Begriffsgruppen, welche auf diese Weise entstehen, werden Facetten oder Kategorien genannt. Facetten lassen sich fünf Grund- bzw. Fundamentalkategorien zuordnen: <br />
<br />
[[Bild: Facetten.png | 500px |Facetten]]<br />
<br />
Zu den Facetten zählen ferner auch allgemeine, für alle Klassen geltende genormte Reihen von formbeschreibenden, chronologischen und geographischen Begriffen sowie Unterteilungen nach Sprachen. Für die Anwendung der Facettenmethode ist die Folge der fünf Grundkategorien P-M-E-S-T als verbindliche Reihenfolge festgelegt worden (citation order). Durch die Citation Order wird gewährleistet, dass thematisch verwandte oder ähnliche Dokumente nebeneinander auftreten. Jeder Focus einer Facette wird durch eine Notation charakterisiert. An einen Focus der 1. Facette können alle Foci der 2. Facette angehängt werden, an diese wiederum die Foci der 3. Facette etc. Die Foci sind disziplinspezifisch und kontextabhängig ausgerichtet, weshalb z.B. die Energie-Facette bei Medizin ganz anders aussieht, als bei Landwirtschaft. <br><br />
<br />
Hauptbestandteile sind die Tafeln der Klassen, der ihnen zugeordneten Facetten sowie ein alphabetisches Register. Die Unterscheidung von Haupt- und Hilfstafeln fällt weg, alle Tafeln sind quasi gleichberechtigt. <br />
<br />
Weitere notwendige Untergliederung erfolgt durch (Unter-) Facetten. Facettenklassifikationen sind ahierarchisch und mehrdimensional, mit ihnen können postkoordinativ, d.h. erst bei der Erschliessung von Wissensquellen sehr komplexe Sachverhalte wiedergegeben werden:<br />
<br />
===Beispiel===<br />
<br />
*Sachverhalt: Verhütung von Hautkrankheiten bei Chemiearbeitern<br />
*Notation: CgHeMbi<br />
*Erläuterung: <br />
<br />
--> Cg Hautkrankheiten (Aus der Facette C= Berufskrankheiten) <br><br />
<br />
--> He Verhütungsmassnahmen (Facette H= Arbeitsschutz<br><br />
<br />
--> Mbi Chemiearbeiter (Facette M= Berufsgruppen) <br><br />
<br />
Der Klassifikation liegt das Ordnungsprinzip der perspektivischen Ordnung zugrunde. Die perspektivische Ordnung lebt von Analyse (Unterteilen in Facetten und Foci) und Synthese (Zusammensetzen der Facetten und Foci beim Indexieren), d.h. ein Sachverhalt wird mehrfach analysiert, das Analyseergebnis wird aus vorgegebenen Elementen zusammengesetzt. Hierarchien werden zwar berücksichtigt, werden aber frei miteinander kombiniert.<br />
<br />
==Erstellung und Anwendung==<br />
<br />
Bei der Erstellung von Facettenklassifikationen gilt im Gegensatz zu präkombinierten Klassen das Bottom-up-Prinzip. Zuerst müssen also Begriffe ermittelt werden, um danach Facetten zu bestimmen, denen diese Begriffe zugeordnet werden. Dabei gilt das Prinzip, die Facetten so allgemeingültig wie möglich zu halten, so dass jedem Dokument nach Möglichkeit ein Focus aus jeder Facette zugeordnet werden kann. Bei der Anordnung der Foci einer Facette wird nach der hierarchischen Ordnung vorgegangen, die Foci werden mit einer Notation versehen; die Synthese der Einzelnotationen zu einer Gesamtnotation ergibt die Notation. <br><br />
<br />
Facettenklassifikationen werden als Spezialklassifikationen eingesetzt und sind ihrer Reinform nicht sehr verbreitet. In der Praxis sind eher präkombinierte Klassifikationen mit facettenartigen Komponenten anzutreffen, wie dies bei den Universalklassifikationen DDC und DK der Fall ist. Von ihrem Strukturprinzip her sind sie aber flexibler und ausdrucksfähiger als präkombinierte Klassifikationen, weshalb deren Erstellung und Pflege sich unproblematisch gestalten lässt.<br />
<br />
==Quellen==<br />
<br />
*Bertram, Jutta (2005): ''Präkombinierte und Facettenklassifikation''. ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente''. Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
<br />
*Fuchs, Susanne (2001): ''Klassifikation und Thesaurus.'' ''Seminararbeit Informationswirtschaft.'' Wirtschaftsuniversität Wien. Verfügbar unter: https://ai.wu.ac.at/~koch/courses/wuw/archive/inf-sem-ws-00/fuchs/Facettenklassifikation.htm. [30.11.2014].<br />
<br />
*Manecke, H.-J. (2004): ''Klassifikation''. In: Kuhlen/Seeger/Strauch (Hrsg.): ''Grundlagen der praktischen Information und Dokumentation.''. 5., völlig neu gefasste Ausgabe. (S. 127-138). München: K.G. Saur. <br />
<br />
*Schmatz, Franz; Hutzheimer, Jasmin, Schemainda, Katrina; Voigt, Dirk; Brock, Stefan (2004): ''Facettenklassifikation''. Verfügbar unter: https://bscw.uni-duesseldorf.de/pub/bscw.cgi/d2988328/Facettenklassifikation.pdf. [30.11.2014].<br />
<br />
*Stock, Wolfgang G. (2004): ''Wissensrepräsentation.'' Heinrich Heine Universität Düsseldorf. SS 2004. Verfügbar unter: http://fiz1.fh-potsdam.de/volltext/duesseldorf/04123.pdf. [01.12.2014]. <br />
<br />
==Weiterführende Literatur==<br />
<br />
*Denton, Wiliam(2003): ''How to Make a Faceted Classification and Put It On the Web.'' Miskatonic University Press. Verfügbar unter: https://www.miskatonic.org/library/facet-web-howto.html. [01.12.2014].<br />
<br />
*Gaus, Wilhelm (2005): ''Dokumentations- und Ordnungslehre. Theorie und Praxis des Information Retrieval''. 5., überarb. Aufl. Berlin:Springer.<br />
<br />
*Stock, Wolfgang; Stock, Mechthild (2008): ''Wissensrepräsentation. Informationen auswerten und bereitstellen.'' München: Oldenbourg.<br />
<br />
==Weblinks==<br />
<br />
http://www.duden.de/rechtschreibung/Facettenklassifikation<br />
<br />
http://de.wikipedia.org/wiki/Facettenklassifikation<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[Broader::Klassifikation]]<br />
* [[Narrower::Notation]]<br />
* [[English::Faceted classification]]<br />
* [[Related::Deskriptor]]<br />
* [[Related::Dezimalklassifikation]]<br />
* [[Related::Informationserschließung]]<br />
* [[Related::Hierarchie]]<br />
* [[Synonymous::Colon-Klassifikation]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Thesaurus&diff=15299Thesaurus2014-12-21T23:09:57Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::„Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstallung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“]]<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
„Im IuD-Bereich versteht man unter einem Thesaurus eine natürlichsprachig-basierte Dokumentationssprache zur inhaltlichen Feinerschliessung. Sie enthält eine geordnete Zusammenstellung von Begriffen und Benennungen, die zum Indexieren, Speichern und Wiederauffinden dokumentarischer Bezugseinheiten dient.“<br />
(Bertram 2004, S. 209)<br />
<br />
==Merkmale==<br />
Ein Thesaurus wird nach Burkhart durch folgende Merkmale gekennzeichnet:<br />
*Begriffe und Beziehungen werden eindeutig aufeinander bezogen („terminologische Kontrolle“), indem<br />
**Synonyme möglichst vollständig erfasst werden<br />
**Homonyme und Polyseme besonders gekennzeichnet werden<br />
**Für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt<br />
*Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt<br />
*Der Thesaurus ist präskriptiv, indem er für seinen Geltungsbereich festlegt, welche begrifflichen Einheiten zur Verfügung gestellt werden und durch welche Bezeichnungen diese repräsentiert werden.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
==Wortherkunft und Entstehungsgeschichte==<br />
Ursprünglich bezeichnete der aus dem griechischen stammende Begriff „Thesaurus“ einen Ort zum Einsammeln und Aufbewahren von Schätzen und Weihgaben. Im Bereich der Sprachwissenschaften versteht man zur heutigen Zeit ein Synonymwörterbuch.<br />
(Bertram 2004, S. 209)<br />
<br />
De Entwicklung von Thesauri wurde in der Mitte des 20. Jahrhunderts von der Motivation getrieben, sich von der starren und unflexiblen Präkombination abzuwenden und stattdessen eine benutzerfreundliche, natürliche Sprache zu verwenden. Schnell stellte sich das Bedürfnis nach einer Feinerschliessung von Dokumentbeständen in den Vordergrund, die eine Klassifikation nicht leistet. Durch die Entwicklung moderner Informationstechnologien wurde die physische Bindung der Erschliessung zu lösen und anstelle dessen digitale Stellvertreter zu verwenden. Dies erlaubte den polydimensionalen Zugriff auf Inhalte von Dokumenten, was die Vergabe von mehreren Indextermen in einem sinnvollen Rahmen ermöglichte.<br />
(Bertram 2004, S. 217)<br />
<br />
==Thesaurusaufbau==<br />
Zur Erstellung eines Thesaurus ist es notwendig den Bezugsrahmen einzugrenzen, denn ein Thesaurus kann den Anforderungen bezüglich Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der entsprechende Sachverhalt klar umrissen ist. Es ist also sinnvoll, sich auf einen bestimmten, überschaubaren Gegenstandsbereich zu beziehen, und Spezifitätsgrad (Allgemein vs. Speziell), Sprachstil (Wissenschaftlich vs. Allgemein) und Umfang zu konkretisieren.<br />
<br />
Wenn die Rahmenbedingungen festgelegt sind, wird anhand geeigneter Quellen (z.B. Experten, Fachliteratur, Fachwörterbücher, bereits existierende Thesauri, etc.) eine Wortgutsammlung erstellt.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
===Terminologische Kontrolle===<br />
Da in der erstellten Wortgutsammlung noch Unklarheiten und Mehrdeutigkeiten aus der natürlichen Sprache enthalten sind, ist die terminologische Kontrolle unerlässlich für die Eindeutigkeit der Beziehung zwischen Bezeichnungen und Begriffen. Die terminologische Kontrolle erfolgt durch die Synonymkontrolle, die Polysemkontrolle und die Zerlegungskontrolle.<br />
(Kuhlen et al. 2004, S. 142)<br />
===Synonymkontrolle===<br />
Bei der Synonymkontrolle sollen alle als Synonym erkannten Begriffe einer Äquivalenzklasse zugeordnet werden; d.h. es werden alle Bezeichnungen in einer Äquivalenzklasse zusammengefasst, die den gleichen Begriff repräsentieren.<br />
<br />
'''Vollständige Synonymie:'''<br />
<br />
Photographie – Fotografie<br />
<br />
Frisör – Friseur<br />
<br />
'''Unterschiedliche Konnotationen:'''<br />
<br />
Pferd – Gaul<br />
<br />
Samstag – Sonnabend<br />
<br />
'''Pars pro toto Übertragung:'''<br />
<br />
Rundfunk – Hörfunk<br />
<br />
'''Quasi – Synonyme:'''<br />
<br />
Härte – Weichheit<br />
<br />
Wohnen - Wohnung<br />
<br />
(Kuhlen et al. 2004, S. 115; Bertram 2004, S. 220)<br />
===Homonym- und Polysemkontrolle===<br />
Die Homonym- und Polysemkontrolle macht mehrdeutige Benennungen eindeutig. Dieser Vorgang wird als Disambiguierung bezeichnet. Hier werden Bezeichnungen, die unterschiedliche Bedeutungen aufweisen, differenziert und verschiedenen Fachgebieten zugeordnet. Dazu kann nur eine Bedeutung beibehalten werden und die anderen explizit exkludiert werden oder das Homonym/Polysem wird durch eine eindeutige Benennung ersetzt. Als weiteres Vorgehen wird das Anfügen eines Homonymzusatzes verwendet.<br />
<br />
Schloss (Gebäude) - Schloss (Schließmechanismus)<br />
<br />
Hahn (Haustier) - Hahn (Wasserhahn) - Hahn (Wetterhahn)<br />
(Kuhlen et al. 2004, S. 143-144;Bertram 2004, S. 219)<br />
===Zerlegungskontrolle===<br />
Die Zerlegungskontrolle betrifft Komposita; hier wird zwischen der morphologischen Zerlegung und der semantischen Zerlegung unterschieden.<br />
<br />
Bei der '''morphologischen Zerlegung''' wird ein zusammengesetztes Wort in seine Grundwörter aufgeteilt:<br />
<br />
arbeit , -er, -en, -barkeit, etc<br />
<br />
Bei der '''semantischen Zerlegung''' wird ein Begriff in seine Begriffsteile zerlegt. Diese Begriffsteile werden durch im Thesaurus vorhandene Bezeichnungen ausgedrückt<br />
<br />
Kaffetasse Kaffe + Tasse<br />
(Kuhlen et al. 2004, S. 144)<br />
====Vor- und Nachteile einer Begriffszerlegung====<br />
Die Zerlegungskontrolle ist insbesondere in der deutschen Sprache, welche nahezu unendliche Wortkombinationen zulässt ein zentrales Problem. Da dies grosse Auswirkungen auf den Aufbau eines Thesaurus hat, stellt sich oft die Frage, ob eine Zerlegungskontrolle entsprechende Vorteile birgt. Nachfolgend sollen daher die Vor- und Nachteile einer Begriffszerlegung aufgeführt werden.<br />
<br />
Vorteile<br />
*zusätzliche sprachliche Einstiegsmöglichkeiten<br />
*erhöhte Vergabehäufigkeit der Deskriptoren<br />
*schlankes Gebrauchsvokabular<br />
<br />
Nachteile<br />
*Gefahr von Fehlverknüpfungen<br />
*Komplexere Thesaurusstruktur<br />
*Höhere Anforderungen an Indexierer<br />
*Begriffliche Beziehung zu Deskriptoren weniger gut möglich<br />
(Bertram 2004, S. 220- 222)<br />
==Thesaurusvokabular==<br />
Die aus der terminologischen Kontrolle entstandenen Begriffseinheiten werden als Äquivalenzklassen bezeichnet. Die Darstellung der Äquivalenzklassen kann in einem Thesaurus unterschiedlich sein. Bei einem '''Thesaurus ohne Vorzugsbenennung''' sind alle Elemente einer Äquivalenzklasse uneingeschränkt für Indexierung und Retrieval verwendbar. In Gegensatz dazu wird bei einem '''Thesaurus mit Vorzugsbenennung''' wird ein Element der Äquivalenzklasse als Vorzugsbenennung ausgewählt und als Deskriptor bezeichnet. Deskriptoren sind Schlagworte, die im Thesaurus enthalten und zur Indexierung zugelassen sind. <br />
(Kuhlen et al. 2004, S. 145)<br />
Der Deskriptor ist ein aktives Element. Es ist genormt und terminologisch kontrolliert, somit ist es für die Indexierung und das Retrieval zugelasen und verbindlich. Nicht-Deskriptoren sind passive Elemente. Sie stellen Benennungen dar, welche im Thesaurus enthalten aber nicht zur Indexierung zugelassen sind.<br />
(Bertram 2004, S. 210)<br />
<br />
Im Bezug auf den Thesaurus stellen die Deskriptoren dessen Gebrauchsvokabular, die Nicht-Deskriptoren dessen Zugangsvokabular dar. Benennungen, welche bisher fehlen und bei welchen unklar ist, ob und mit welchem Status sie in den Thesaurus aufgenommen werden in ihrer Gesamtheit als Kandidatenvokabular bezeichnet.<br />
(Bertram 2004, S. 210-211)<br />
<br />
[[Datei:Bestandteile_thesaurusvokabular.png]]<br />
==Relationen==<br />
Die Relationen begründen die Struktur des Thesaurus. Sie stellen die Beziehungen zwischen den einzelnen Äquivalenzklassen dar. Dadurch entsteht ein semantisches Netz über den gesamten Thesaurus, das durch Querbeziehungen zu anderen ähnlichen oder verwandten Begriffen verweist und zu besseren Ergebnissen bei Indexierung und Information Retrieval führt. Hierbei wird zwischen der Äquivalenzrelation, der Hierarchierelation, der Assoziationsrelation und der Begriffskombinationen unterschieden.<br />
===Äquivalenzrelation===<br />
Bei der Äquivalenzrelation werden Bedeutungen als gleichwertig aufgefasst und Bezeichnungen zu Äquivalenzklassen zusammengeführt.<br />
<br />
Äquivalenzrelation<br />
{| class="wikitable"<br />
|Sonnabend<br />
|BS<br />
|Samstag<br />
|-<br />
|Naturwissenschaft<br />
|BSU<br />
|Chemie, Biologie<br />
|}<br />
BS = Benutze Synonym<br />
<br />
BSU = Benutze spezifischen Unterbegriff<br />
<br />
(Kuhlen et al. 2004, S. 147-148)<br />
===Hierarchische Relation===<br />
Die hierarchische Relation drückt ein Über- und Unterordnungsverhältnis der Begriffe aus.<br />
<br />
Generische Relation (Abstraktionsfunktion)<br />
<br />
{| class="wikitable"<br />
|Kraftwagen<br />
|UB<br />
|Personenkraftwagen<br />
|-<br />
|Lastkraftwagen<br />
|OB<br />
|Kraftwagen<br />
|}<br />
<br />
Partitive Relation (Bestandsrelation)<br />
<br />
{| class="wikitable"<br />
|Auto<br />
|TP<br />
|Automotor<br />
|-<br />
|Karosserie<br />
|SP<br />
|Auto<br />
|}<br />
<br />
UB = Unterbegriff<br />
<br />
OB = Oberbegriff<br />
<br />
TP = Teilbegriff<br />
<br />
SP = Verbandsbegriff<br />
(Kuhlen et al. 2004, S. 148-149)<br />
<br />
===Assoziationsrelation===<br />
Bei der Assoziationsrelation werden alle Relationen zwischen Begriffen erfasst, die weder eindeutig hierarchischer Natur sind, noch als äquivalent betrachtet werden können<br />
<br />
{| class="wikitable"<br />
|Obst<br />
|VB<br />
|Obstbaum<br />
|-<br />
|Hitze<br />
|VB<br />
|Kälte<br />
|-<br />
|Vater<br />
|VB<br />
|Sohn<br />
|}<br />
<br />
VB = Verwandter Begriff<br />
(Kuhlen et al. 2004, S. 149)<br />
<br />
===Begriffskombination===<br />
Bei der Begriffskombination wird eine Schnittmenge zwischen den Deskriptoren zweier Äquivalenzklassen erzeugt.<br />
<br />
{| class="wikitable"<br />
|Botschftsgebäude<br />
|BK<br />
|Verwaltungsgebäude, diplomatische Vertretung<br />
|-<br />
|Verwaltungsgebäude<br />
|KB<br />
|Botschaftsgebäude<br />
|-<br />
|diplomatische Vertretung<br />
|KB<br />
|Botschaftsgebäude<br />
|}<br />
<br />
BK = Benutze Kombination<br />
<br />
KB = Kombinationsbegriff<br />
<br />
(Kuhlen et al. 2004, S. 149-150)<br />
<br />
==Thesauruspflege==<br />
Damit ein Thesaurus seinen Anforderungen gerecht bleiben kann, ist eine ständige Beobachtung der Entwicklung der Forschungsschwerpunkte des jeweiligen Fachs notwendig; dazu gehören z.B. die:<br />
<br />
*Beobachtung der fachsprachlichen Entwicklung<br />
*Beobachtung des Indexierungsverhaltens/der Indexierungsergebnisse<br />
*Beobachtung des Benutzerverhaltens und der Rechercheergebnisse<br />
(Kuhlen et al. 2004, S. 151)<br />
<br />
==Normen==<br />
Für Thesauri existieren verschiedene Normen. Nennenswert sind vor allem die Norm DIN 1463 („Erstellung und Weiterentwicklung von Thesauri“) sowie die ISO-Normen 2788 und 5964 („Guidelines for the establishment and development of multilingual thesauri“).<br />
(Bertram 2004, S. 219)<br />
==Thesaurussoftware==<br />
Obwohl die Erstellung eines Thesaurus nach wie vor eine hauptsächlich intellektuelle Tätigkeit ist, so kann diese durch Software erheblich unterstützt und erleichtert werden. Ein wesentlicher Vorteil ist hier die automatische Generierung von reziproken Begriffsbeziehungen sowie automatischen Konsistenzprüfungen. Bekannte Vertreter sind hier unter anderem:<br />
*Oracle Thesaurus Management<br />
*MIDOS<br />
*ThesaurusMaster<br />
*STRIDE<br />
*Synaptica<br />
*a.k.a. Library<br />
<br />
(Bertram 2004, S. 230-232; Milstead 2002)<br />
==Quellen==<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente''. Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*Milstead, Jessica (2002): ''Thesaurus Management Software''. Verfügbar unter: http://www.asindexing.org/about-indexing/thesauri/thesaurus-management-software/. [21.12.2014<br />
<br />
<br />
==Weiterführende Literatur==<br />
*Virtuelles Handbuch Informationswissenschaft: http://is.uni-sb.de/studium/handbuch/infoling/thesnlp<br />
*Wersig, Gernot (1985): ''Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis''. München et al.: K.G. Saur<br />
<br />
==Weblinks==<br />
*ISO 5964: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159<br />
*Normdaten-Standards: https://wiki.dnb.de/display/DINIAGKIM/Normdaten-Standards<br />
*MIDOS: http://www.progris.de/m6info/index.htm<br />
*Oracle Thesaurus Management: http://www.oracle.com/us/products/applications/health-sciences/e-clinical/thesaurus-management/index.html<br />
*ThesaurusMaster: http://www.dataharmony.com/services-view/thesaurus-master/<br />
*STRIDE: http://www.questans.co.uk/p100l2.html<br />
*Synaptica: http://www.synaptica.com/<br />
*a.k.a. Library: http://www.a-k-a.co/index.php/aka-library/<br />
<br />
==Verwandte Begriffe==<br />
* [[broader::Dokumentationssprache]]<br />
* [[narrower::Einsprachiger Thesaurus]]<br />
* [[narrower::Mehrsprachiger Thesaurus]]<br />
* [[english::thesaurus]]<br />
* [[related::Synonym]]<br />
* [[related::Deskriptor]]<br />
* [[related::Äquivalenzklasse]]<br />
* [[related::Homonym]]<br />
* [[related::Relation]]<br />
* [[Synonymous:: Synonymwörterbuch]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Datei:Bestandteile_thesaurusvokabular.png&diff=15298Datei:Bestandteile thesaurusvokabular.png2014-12-21T23:08:36Z<p>Maegertm: </p>
<hr />
<div></div>Maegertmhttps://wiki.infowiss.net/index.php?title=Thesaurus&diff=15297Thesaurus2014-12-21T23:07:34Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::„Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstallung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“]]<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
„Im IuD-Bereich versteht man unter einem Thesaurus eine natürlichsprachig-basierte Dokumentationssprache zur inhaltlichen Feinerschliessung. Sie enthält eine geordnete Zusammenstellung von Begriffen und Benennungen, die zum Indexieren, Speichern und Wiederauffinden dokumentarischer Bezugseinheiten dient.“<br />
(Bertram 2004, S. 209)<br />
<br />
==Merkmale==<br />
Ein Thesaurus wird nach Burkhart durch folgende Merkmale gekennzeichnet:<br />
*Begriffe und Beziehungen werden eindeutig aufeinander bezogen („terminologische Kontrolle“), indem<br />
**Synonyme möglichst vollständig erfasst werden<br />
**Homonyme und Polyseme besonders gekennzeichnet werden<br />
**Für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt<br />
*Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt<br />
*Der Thesaurus ist präskriptiv, indem er für seinen Geltungsbereich festlegt, welche begrifflichen Einheiten zur Verfügung gestellt werden und durch welche Bezeichnungen diese repräsentiert werden.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
==Wortherkunft und Entstehungsgeschichte==<br />
Ursprünglich bezeichnete der aus dem griechischen stammende Begriff „Thesaurus“ einen Ort zum Einsammeln und Aufbewahren von Schätzen und Weihgaben. Im Bereich der Sprachwissenschaften versteht man zur heutigen Zeit ein Synonymwörterbuch.<br />
(Bertram 2004, S. 209)<br />
<br />
De Entwicklung von Thesauri wurde in der Mitte des 20. Jahrhunderts von der Motivation getrieben, sich von der starren und unflexiblen Präkombination abzuwenden und stattdessen eine benutzerfreundliche, natürliche Sprache zu verwenden. Schnell stellte sich das Bedürfnis nach einer Feinerschliessung von Dokumentbeständen in den Vordergrund, die eine Klassifikation nicht leistet. Durch die Entwicklung moderner Informationstechnologien wurde die physische Bindung der Erschliessung zu lösen und anstelle dessen digitale Stellvertreter zu verwenden. Dies erlaubte den polydimensionalen Zugriff auf Inhalte von Dokumenten, was die Vergabe von mehreren Indextermen in einem sinnvollen Rahmen ermöglichte.<br />
(Bertram 2004, S. 217)<br />
<br />
==Thesaurusaufbau==<br />
Zur Erstellung eines Thesaurus ist es notwendig den Bezugsrahmen einzugrenzen, denn ein Thesaurus kann den Anforderungen bezüglich Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der entsprechende Sachverhalt klar umrissen ist. Es ist also sinnvoll, sich auf einen bestimmten, überschaubaren Gegenstandsbereich zu beziehen, und Spezifitätsgrad (Allgemein vs. Speziell), Sprachstil (Wissenschaftlich vs. Allgemein) und Umfang zu konkretisieren.<br />
<br />
Wenn die Rahmenbedingungen festgelegt sind, wird anhand geeigneter Quellen (z.B. Experten, Fachliteratur, Fachwörterbücher, bereits existierende Thesauri, etc.) eine Wortgutsammlung erstellt.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
===Terminologische Kontrolle===<br />
Da in der erstellten Wortgutsammlung noch Unklarheiten und Mehrdeutigkeiten aus der natürlichen Sprache enthalten sind, ist die terminologische Kontrolle unerlässlich für die Eindeutigkeit der Beziehung zwischen Bezeichnungen und Begriffen. Die terminologische Kontrolle erfolgt durch die Synonymkontrolle, die Polysemkontrolle und die Zerlegungskontrolle.<br />
(Kuhlen et al. 2004, S. 142)<br />
===Synonymkontrolle===<br />
Bei der Synonymkontrolle sollen alle als Synonym erkannten Begriffe einer Äquivalenzklasse zugeordnet werden; d.h. es werden alle Bezeichnungen in einer Äquivalenzklasse zusammengefasst, die den gleichen Begriff repräsentieren.<br />
<br />
'''Vollständige Synonymie:'''<br />
<br />
Photographie – Fotografie<br />
<br />
Frisör – Friseur<br />
<br />
'''Unterschiedliche Konnotationen:'''<br />
<br />
Pferd – Gaul<br />
<br />
Samstag – Sonnabend<br />
<br />
'''Pars pro toto Übertragung:'''<br />
<br />
Rundfunk – Hörfunk<br />
<br />
'''Quasi – Synonyme:'''<br />
<br />
Härte – Weichheit<br />
<br />
Wohnen - Wohnung<br />
<br />
(Kuhlen et al. 2004, S. 115; Bertram 2004, S. 220)<br />
===Homonym- und Polysemkontrolle===<br />
Die Homonym- und Polysemkontrolle macht mehrdeutige Benennungen eindeutig. Dieser Vorgang wird als Disambiguierung bezeichnet. Hier werden Bezeichnungen, die unterschiedliche Bedeutungen aufweisen, differenziert und verschiedenen Fachgebieten zugeordnet. Dazu kann nur eine Bedeutung beibehalten werden und die anderen explizit exkludiert werden oder das Homonym/Polysem wird durch eine eindeutige Benennung ersetzt. Als weiteres Vorgehen wird das Anfügen eines Homonymzusatzes verwendet.<br />
<br />
Schloss (Gebäude) - Schloss (Schließmechanismus)<br />
<br />
Hahn (Haustier) - Hahn (Wasserhahn) - Hahn (Wetterhahn)<br />
(Kuhlen et al. 2004, S. 143-144;Bertram 2004, S. 219)<br />
===Zerlegungskontrolle===<br />
Die Zerlegungskontrolle betrifft Komposita; hier wird zwischen der morphologischen Zerlegung und der semantischen Zerlegung unterschieden.<br />
<br />
Bei der '''morphologischen Zerlegung''' wird ein zusammengesetztes Wort in seine Grundwörter aufgeteilt:<br />
<br />
arbeit , -er, -en, -barkeit, etc<br />
<br />
Bei der '''semantischen Zerlegung''' wird ein Begriff in seine Begriffsteile zerlegt. Diese Begriffsteile werden durch im Thesaurus vorhandene Bezeichnungen ausgedrückt<br />
<br />
Kaffetasse Kaffe + Tasse<br />
(Kuhlen et al. 2004, S. 144)<br />
====Vor- und Nachteile einer Begriffszerlegung====<br />
Die Zerlegungskontrolle ist insbesondere in der deutschen Sprache, welche nahezu unendliche Wortkombinationen zulässt ein zentrales Problem. Da dies grosse Auswirkungen auf den Aufbau eines Thesaurus hat, stellt sich oft die Frage, ob eine Zerlegungskontrolle entsprechende Vorteile birgt. Nachfolgend sollen daher die Vor- und Nachteile einer Begriffszerlegung aufgeführt werden.<br />
<br />
Vorteile<br />
*zusätzliche sprachliche Einstiegsmöglichkeiten<br />
*erhöhte Vergabehäufigkeit der Deskriptoren<br />
*schlankes Gebrauchsvokabular<br />
<br />
Nachteile<br />
*Gefahr von Fehlverknüpfungen<br />
*Komplexere Thesaurusstruktur<br />
*Höhere Anforderungen an Indexierer<br />
*Begriffliche Beziehung zu Deskriptoren weniger gut möglich<br />
(Bertram 2004, S. 220- 222)<br />
==Thesaurusvokabular==<br />
Die aus der terminologischen Kontrolle entstandenen Begriffseinheiten werden als Äquivalenzklassen bezeichnet. Die Darstellung der Äquivalenzklassen kann in einem Thesaurus unterschiedlich sein. Bei einem '''Thesaurus ohne Vorzugsbenennung''' sind alle Elemente einer Äquivalenzklasse uneingeschränkt für Indexierung und Retrieval verwendbar. In Gegensatz dazu wird bei einem '''Thesaurus mit Vorzugsbenennung''' wird ein Element der Äquivalenzklasse als Vorzugsbenennung ausgewählt und als Deskriptor bezeichnet. Deskriptoren sind Schlagworte, die im Thesaurus enthalten und zur Indexierung zugelassen sind. <br />
(Kuhlen et al. 2004, S. 145)<br />
Der Deskriptor ist ein aktives Element. Es ist genormt und terminologisch kontrolliert, somit ist es für die Indexierung und das Retrieval zugelasen und verbindlich. Nicht-Deskriptoren sind passive Elemente. Sie stellen Benennungen dar, welche im Thesaurus enthalten aber nicht zur Indexierung zugelassen sind.<br />
(Bertram 2004, S. 210)<br />
<br />
Im Bezug auf den Thesaurus stellen die Deskriptoren dessen Gebrauchsvokabular, die Nicht-Deskriptoren dessen Zugangsvokabular dar. Benennungen, welche bisher fehlen und bei welchen unklar ist, ob und mit welchem Status sie in den Thesaurus aufgenommen werden in ihrer Gesamtheit als Kandidatenvokabular bezeichnet.<br />
(Bertram 2004, S. 210-211)<br />
[[Datei:Beispiel.jpg]]<br />
==Relationen==<br />
Die Relationen begründen die Struktur des Thesaurus. Sie stellen die Beziehungen zwischen den einzelnen Äquivalenzklassen dar. Dadurch entsteht ein semantisches Netz über den gesamten Thesaurus, das durch Querbeziehungen zu anderen ähnlichen oder verwandten Begriffen verweist und zu besseren Ergebnissen bei Indexierung und Information Retrieval führt. Hierbei wird zwischen der Äquivalenzrelation, der Hierarchierelation, der Assoziationsrelation und der Begriffskombinationen unterschieden.<br />
===Äquivalenzrelation===<br />
Bei der Äquivalenzrelation werden Bedeutungen als gleichwertig aufgefasst und Bezeichnungen zu Äquivalenzklassen zusammengeführt.<br />
<br />
Äquivalenzrelation<br />
{| class="wikitable"<br />
|Sonnabend<br />
|BS<br />
|Samstag<br />
|-<br />
|Naturwissenschaft<br />
|BSU<br />
|Chemie, Biologie<br />
|}<br />
BS = Benutze Synonym<br />
<br />
BSU = Benutze spezifischen Unterbegriff<br />
<br />
(Kuhlen et al. 2004, S. 147-148)<br />
===Hierarchische Relation===<br />
Die hierarchische Relation drückt ein Über- und Unterordnungsverhältnis der Begriffe aus.<br />
<br />
Generische Relation (Abstraktionsfunktion)<br />
<br />
{| class="wikitable"<br />
|Kraftwagen<br />
|UB<br />
|Personenkraftwagen<br />
|-<br />
|Lastkraftwagen<br />
|OB<br />
|Kraftwagen<br />
|}<br />
<br />
Partitive Relation (Bestandsrelation)<br />
<br />
{| class="wikitable"<br />
|Auto<br />
|TP<br />
|Automotor<br />
|-<br />
|Karosserie<br />
|SP<br />
|Auto<br />
|}<br />
<br />
UB = Unterbegriff<br />
<br />
OB = Oberbegriff<br />
<br />
TP = Teilbegriff<br />
<br />
SP = Verbandsbegriff<br />
(Kuhlen et al. 2004, S. 148-149)<br />
<br />
===Assoziationsrelation===<br />
Bei der Assoziationsrelation werden alle Relationen zwischen Begriffen erfasst, die weder eindeutig hierarchischer Natur sind, noch als äquivalent betrachtet werden können<br />
<br />
{| class="wikitable"<br />
|Obst<br />
|VB<br />
|Obstbaum<br />
|-<br />
|Hitze<br />
|VB<br />
|Kälte<br />
|-<br />
|Vater<br />
|VB<br />
|Sohn<br />
|}<br />
<br />
VB = Verwandter Begriff<br />
(Kuhlen et al. 2004, S. 149)<br />
<br />
===Begriffskombination===<br />
Bei der Begriffskombination wird eine Schnittmenge zwischen den Deskriptoren zweier Äquivalenzklassen erzeugt.<br />
<br />
{| class="wikitable"<br />
|Botschftsgebäude<br />
|BK<br />
|Verwaltungsgebäude, diplomatische Vertretung<br />
|-<br />
|Verwaltungsgebäude<br />
|KB<br />
|Botschaftsgebäude<br />
|-<br />
|diplomatische Vertretung<br />
|KB<br />
|Botschaftsgebäude<br />
|}<br />
<br />
BK = Benutze Kombination<br />
<br />
KB = Kombinationsbegriff<br />
<br />
(Kuhlen et al. 2004, S. 149-150)<br />
<br />
==Thesauruspflege==<br />
Damit ein Thesaurus seinen Anforderungen gerecht bleiben kann, ist eine ständige Beobachtung der Entwicklung der Forschungsschwerpunkte des jeweiligen Fachs notwendig; dazu gehören z.B. die:<br />
<br />
*Beobachtung der fachsprachlichen Entwicklung<br />
*Beobachtung des Indexierungsverhaltens/der Indexierungsergebnisse<br />
*Beobachtung des Benutzerverhaltens und der Rechercheergebnisse<br />
(Kuhlen et al. 2004, S. 151)<br />
<br />
==Normen==<br />
Für Thesauri existieren verschiedene Normen. Nennenswert sind vor allem die Norm DIN 1463 („Erstellung und Weiterentwicklung von Thesauri“) sowie die ISO-Normen 2788 und 5964 („Guidelines for the establishment and development of multilingual thesauri“).<br />
(Bertram 2004, S. 219)<br />
==Thesaurussoftware==<br />
Obwohl die Erstellung eines Thesaurus nach wie vor eine hauptsächlich intellektuelle Tätigkeit ist, so kann diese durch Software erheblich unterstützt und erleichtert werden. Ein wesentlicher Vorteil ist hier die automatische Generierung von reziproken Begriffsbeziehungen sowie automatischen Konsistenzprüfungen. Bekannte Vertreter sind hier unter anderem:<br />
*Oracle Thesaurus Management<br />
*MIDOS<br />
*ThesaurusMaster<br />
*STRIDE<br />
*Synaptica<br />
*a.k.a. Library<br />
<br />
(Bertram 2004, S. 230-232; Milstead 2002)<br />
==Quellen==<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente''. Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*Milstead, Jessica (2002): ''Thesaurus Management Software''. Verfügbar unter: http://www.asindexing.org/about-indexing/thesauri/thesaurus-management-software/. [21.12.2014<br />
<br />
<br />
==Weiterführende Literatur==<br />
*Virtuelles Handbuch Informationswissenschaft: http://is.uni-sb.de/studium/handbuch/infoling/thesnlp<br />
*Wersig, Gernot (1985): ''Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis''. München et al.: K.G. Saur<br />
<br />
==Weblinks==<br />
*ISO 5964: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159<br />
*Normdaten-Standards: https://wiki.dnb.de/display/DINIAGKIM/Normdaten-Standards<br />
*MIDOS: http://www.progris.de/m6info/index.htm<br />
*Oracle Thesaurus Management: http://www.oracle.com/us/products/applications/health-sciences/e-clinical/thesaurus-management/index.html<br />
*ThesaurusMaster: http://www.dataharmony.com/services-view/thesaurus-master/<br />
*STRIDE: http://www.questans.co.uk/p100l2.html<br />
*Synaptica: http://www.synaptica.com/<br />
*a.k.a. Library: http://www.a-k-a.co/index.php/aka-library/<br />
<br />
==Verwandte Begriffe==<br />
* [[broader::Dokumentationssprache]]<br />
* [[narrower::Einsprachiger Thesaurus]]<br />
* [[narrower::Mehrsprachiger Thesaurus]]<br />
* [[english::thesaurus]]<br />
* [[related::Synonym]]<br />
* [[related::Deskriptor]]<br />
* [[related::Äquivalenzklasse]]<br />
* [[related::Homonym]]<br />
* [[related::Relation]]<br />
* [[Synonymous:: Synonymwörterbuch]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Thesaurus&diff=15296Thesaurus2014-12-21T23:01:19Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::„Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstallung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“]]<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
„Im IuD-Bereich versteht man unter einem Thesaurus eine natürlichsprachig-basierte Dokumentationssprache zur inhaltlichen Feinerschliessung. Sie enthält eine geordnete Zusammenstellung von Begriffen und Benennungen, die zum Indexieren, Speichern und Wiederauffinden dokumentarischer Bezugseinheiten dient.“<br />
(Bertram 2004, S. 209)<br />
<br />
==Merkmale==<br />
Ein Thesaurus wird nach Burkhart durch folgende Merkmale gekennzeichnet:<br />
*Begriffe und Beziehungen werden eindeutig aufeinander bezogen („terminologische Kontrolle“), indem<br />
**Synonyme möglichst vollständig erfasst werden<br />
**Homonyme und Polyseme besonders gekennzeichnet werden<br />
**Für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt<br />
*Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt<br />
*Der Thesaurus ist präskriptiv, indem er für seinen Geltungsbereich festlegt, welche begrifflichen Einheiten zur Verfügung gestellt werden und durch welche Bezeichnungen diese repräsentiert werden.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
==Wortherkunft und Entstehungsgeschichte==<br />
Ursprünglich bezeichnete der aus dem griechischen stammende Begriff „Thesaurus“ einen Ort zum Einsammeln und Aufbewahren von Schätzen und Weihgaben. Im Bereich der Sprachwissenschaften versteht man zur heutigen Zeit ein Synonymwörterbuch.<br />
(Bertram 2004, S. 209)<br />
<br />
De Entwicklung von Thesauri wurde in der Mitte des 20. Jahrhunderts von der Motivation getrieben, sich von der starren und unflexiblen Präkombination abzuwenden und stattdessen eine benutzerfreundliche, natürliche Sprache zu verwenden. Schnell stellte sich das Bedürfnis nach einer Feinerschliessung von Dokumentbeständen in den Vordergrund, die eine Klassifikation nicht leistet. Durch die Entwicklung moderner Informationstechnologien wurde die physische Bindung der Erschliessung zu lösen und anstelle dessen digitale Stellvertreter zu verwenden. Dies erlaubte den polydimensionalen Zugriff auf Inhalte von Dokumenten, was die Vergabe von mehreren Indextermen in einem sinnvollen Rahmen ermöglichte.<br />
(Bertram 2004, S. 217)<br />
<br />
==Thesaurusaufbau==<br />
Zur Erstellung eines Thesaurus ist es notwendig den Bezugsrahmen einzugrenzen, denn ein Thesaurus kann den Anforderungen bezüglich Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der entsprechende Sachverhalt klar umrissen ist. Es ist also sinnvoll, sich auf einen bestimmten, überschaubaren Gegenstandsbereich zu beziehen, und Spezifitätsgrad (Allgemein vs. Speziell), Sprachstil (Wissenschaftlich vs. Allgemein) und Umfang zu konkretisieren.<br />
<br />
Wenn die Rahmenbedingungen festgelegt sind, wird anhand geeigneter Quellen (z.B. Experten, Fachliteratur, Fachwörterbücher, bereits existierende Thesauri, etc.) eine Wortgutsammlung erstellt.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
===Terminologische Kontrolle===<br />
Da in der erstellten Wortgutsammlung noch Unklarheiten und Mehrdeutigkeiten aus der natürlichen Sprache enthalten sind, ist die terminologische Kontrolle unerlässlich für die Eindeutigkeit der Beziehung zwischen Bezeichnungen und Begriffen. Die terminologische Kontrolle erfolgt durch die Synonymkontrolle, die Polysemkontrolle und die Zerlegungskontrolle.<br />
(Kuhlen et al. 2004, S. 142)<br />
===Synonymkontrolle===<br />
Bei der Synonymkontrolle sollen alle als Synonym erkannten Begriffe einer Äquivalenzklasse zugeordnet werden; d.h. es werden alle Bezeichnungen in einer Äquivalenzklasse zusammengefasst, die den gleichen Begriff repräsentieren.<br />
<br />
'''Vollständige Synonymie:'''<br />
<br />
Photographie – Fotografie<br />
<br />
Frisör – Friseur<br />
<br />
'''Unterschiedliche Konnotationen:'''<br />
<br />
Pferd – Gaul<br />
<br />
Samstag – Sonnabend<br />
<br />
'''Pars pro toto Übertragung:'''<br />
<br />
Rundfunk – Hörfunk<br />
<br />
'''Quasi – Synonyme:'''<br />
<br />
Härte – Weichheit<br />
<br />
Wohnen - Wohnung<br />
<br />
(Kuhlen et al. 2004, S. 115; Bertram 2004, S. 220)<br />
===Homonym- und Polysemkontrolle===<br />
Die Homonym- und Polysemkontrolle macht mehrdeutige Benennungen eindeutig. Dieser Vorgang wird als Disambiguierung bezeichnet. Hier werden Bezeichnungen, die unterschiedliche Bedeutungen aufweisen, differenziert und verschiedenen Fachgebieten zugeordnet. Dazu kann nur eine Bedeutung beibehalten werden und die anderen explizit exkludiert werden oder das Homonym/Polysem wird durch eine eindeutige Benennung ersetzt. Als weiteres Vorgehen wird das Anfügen eines Homonymzusatzes verwendet.<br />
<br />
Schloss (Gebäude) - Schloss (Schließmechanismus)<br />
<br />
Hahn (Haustier) - Hahn (Wasserhahn) - Hahn (Wetterhahn)<br />
(Kuhlen et al. 2004, S. 143-144;Bertram 2004, S. 219)<br />
===Zerlegungskontrolle===<br />
Die Zerlegungskontrolle betrifft Komposita; hier wird zwischen der morphologischen Zerlegung und der semantischen Zerlegung unterschieden.<br />
<br />
Bei der '''morphologischen Zerlegung''' wird ein zusammengesetztes Wort in seine Grundwörter aufgeteilt:<br />
<br />
arbeit , -er, -en, -barkeit, etc<br />
<br />
Bei der '''semantischen Zerlegung''' wird ein Begriff in seine Begriffsteile zerlegt. Diese Begriffsteile werden durch im Thesaurus vorhandene Bezeichnungen ausgedrückt<br />
<br />
Kaffetasse Kaffe + Tasse<br />
(Kuhlen et al. 2004, S. 144)<br />
====Vor- und Nachteile einer Begriffszerlegung====<br />
Die Zerlegungskontrolle ist insbesondere in der deutschen Sprache, welche nahezu unendliche Wortkombinationen zulässt ein zentrales Problem. Da dies grosse Auswirkungen auf den Aufbau eines Thesaurus hat, stellt sich oft die Frage, ob eine Zerlegungskontrolle entsprechende Vorteile birgt. Nachfolgend sollen daher die Vor- und Nachteile einer Begriffszerlegung aufgeführt werden.<br />
<br />
Vorteile<br />
*zusätzliche sprachliche Einstiegsmöglichkeiten<br />
*erhöhte Vergabehäufigkeit der Deskriptoren<br />
*schlankes Gebrauchsvokabular<br />
<br />
Nachteile<br />
*Gefahr von Fehlverknüpfungen<br />
*Komplexere Thesaurusstruktur<br />
*Höhere Anforderungen an Indexierer<br />
*Begriffliche Beziehung zu Deskriptoren weniger gut möglich<br />
(Bertram 2004, S. 220- 222)<br />
==Thesaurusvokabular==<br />
Die aus der terminologischen Kontrolle entstandenen Begriffseinheiten werden als Äquivalenzklassen bezeichnet. Die Darstellung der Äquivalenzklassen kann in einem Thesaurus unterschiedlich sein. Bei einem '''Thesaurus ohne Vorzugsbenennung''' sind alle Elemente einer Äquivalenzklasse uneingeschränkt für Indexierung und Retrieval verwendbar. In Gegensatz dazu wird bei einem '''Thesaurus mit Vorzugsbenennung''' wird ein Element der Äquivalenzklasse als Vorzugsbenennung ausgewählt und als Deskriptor bezeichnet. Deskriptoren sind Schlagworte, die im Thesaurus enthalten und zur Indexierung zugelassen sind. <br />
(Kuhlen et al. 2004, S. 145)<br />
Der Deskriptor ist ein aktives Element. Es ist genormt und terminologisch kontrolliert, somit ist es für die Indexierung und das Retrieval zugelasen und verbindlich. Nicht-Deskriptoren sind passive Elemente. Sie stellen Benennungen dar, welche im Thesaurus enthalten aber nicht zur Indexierung zugelassen sind.<br />
(Bertram 2004, S. 210)<br />
<br />
Im Bezug auf den Thesaurus stellen die Deskriptoren dessen Gebrauchsvokabular, die Nicht-Deskriptoren dessen Zugangsvokabular dar. Benennungen, welche bisher fehlen und bei welchen unklar ist, ob und mit welchem Status sie in den Thesaurus aufgenommen werden in ihrer Gesamtheit als Kandidatenvokabular bezeichnet.<br />
(Bertram 2004, S. 210-211)<br />
GRAFIK s.211<br />
==Relationen==<br />
Die Relationen begründen die Struktur des Thesaurus. Sie stellen die Beziehungen zwischen den einzelnen Äquivalenzklassen dar. Dadurch entsteht ein semantisches Netz über den gesamten Thesaurus, das durch Querbeziehungen zu anderen ähnlichen oder verwandten Begriffen verweist und zu besseren Ergebnissen bei Indexierung und Information Retrieval führt. Hierbei wird zwischen der Äquivalenzrelation, der Hierarchierelation, der Assoziationsrelation und der Begriffskombinationen unterschieden.<br />
===Äquivalenzrelation===<br />
Bei der Äquivalenzrelation werden Bedeutungen als gleichwertig aufgefasst und Bezeichnungen zu Äquivalenzklassen zusammengeführt.<br />
<br />
Äquivalenzrelation<br />
{| class="wikitable"<br />
|Sonnabend<br />
|BS<br />
|Samstag<br />
|-<br />
|Naturwissenschaft<br />
|BSU<br />
|Chemie, Biologie<br />
|}<br />
BS = Benutze Synonym<br />
<br />
BSU = Benutze spezifischen Unterbegriff<br />
<br />
(Kuhlen et al. 2004, S. 147-148)<br />
===Hierarchische Relation===<br />
Die hierarchische Relation drückt ein Über- und Unterordnungsverhältnis der Begriffe aus.<br />
<br />
Generische Relation (Abstraktionsfunktion)<br />
<br />
{| class="wikitable"<br />
|Kraftwagen<br />
|UB<br />
|Personenkraftwagen<br />
|-<br />
|Lastkraftwagen<br />
|OB<br />
|Kraftwagen<br />
|}<br />
<br />
Partitive Relation (Bestandsrelation)<br />
<br />
{| class="wikitable"<br />
|Auto<br />
|TP<br />
|Automotor<br />
|-<br />
|Karosserie<br />
|SP<br />
|Auto<br />
|}<br />
<br />
UB = Unterbegriff<br />
<br />
OB = Oberbegriff<br />
<br />
TP = Teilbegriff<br />
<br />
SP = Verbandsbegriff<br />
(Kuhlen et al. 2004, S. 148-149)<br />
<br />
===Assoziationsrelation===<br />
Bei der Assoziationsrelation werden alle Relationen zwischen Begriffen erfasst, die weder eindeutig hierarchischer Natur sind, noch als äquivalent betrachtet werden können<br />
<br />
{| class="wikitable"<br />
|Obst<br />
|VB<br />
|Obstbaum<br />
|-<br />
|Hitze<br />
|VB<br />
|Kälte<br />
|-<br />
|Vater<br />
|VB<br />
|Sohn<br />
|}<br />
<br />
VB = Verwandter Begriff<br />
(Kuhlen et al. 2004, S. 149)<br />
<br />
===Begriffskombination===<br />
Bei der Begriffskombination wird eine Schnittmenge zwischen den Deskriptoren zweier Äquivalenzklassen erzeugt.<br />
<br />
{| class="wikitable"<br />
|Botschftsgebäude<br />
|BK<br />
|Verwaltungsgebäude, diplomatische Vertretung<br />
|-<br />
|Verwaltungsgebäude<br />
|KB<br />
|Botschaftsgebäude<br />
|-<br />
|diplomatische Vertretung<br />
|KB<br />
|Botschaftsgebäude<br />
|}<br />
<br />
BK = Benutze Kombination<br />
<br />
KB = Kombinationsbegriff<br />
<br />
(Kuhlen et al. 2004, S. 149-150)<br />
<br />
==Thesauruspflege==<br />
Damit ein Thesaurus seinen Anforderungen gerecht bleiben kann, ist eine ständige Beobachtung der Entwicklung der Forschungsschwerpunkte des jeweiligen Fachs notwendig; dazu gehören z.B. die:<br />
<br />
*Beobachtung der fachsprachlichen Entwicklung<br />
*Beobachtung des Indexierungsverhaltens/der Indexierungsergebnisse<br />
*Beobachtung des Benutzerverhaltens und der Rechercheergebnisse<br />
(Kuhlen et al. 2004, S. 151)<br />
<br />
==Normen==<br />
Für Thesauri existieren verschiedene Normen. Nennenswert sind vor allem die Norm DIN 1463 („Erstellung und Weiterentwicklung von Thesauri“) sowie die ISO-Normen 2788 und 5964 („Guidelines for the establishment and development of multilingual thesauri“).<br />
(Bertram 2004, S. 219)<br />
==Thesaurussoftware==<br />
Obwohl die Erstellung eines Thesaurus nach wie vor eine hauptsächlich intellektuelle Tätigkeit ist, so kann diese durch Software erheblich unterstützt und erleichtert werden. Ein wesentlicher Vorteil ist hier die automatische Generierung von reziproken Begriffsbeziehungen sowie automatischen Konsistenzprüfungen. Bekannte Vertreter sind hier unter anderem:<br />
*Oracle Thesaurus Management<br />
*MIDOS<br />
*ThesaurusMaster<br />
*STRIDE<br />
*Synaptica<br />
*a.k.a. Library<br />
<br />
(Bertram 2004, S. 230-232; Milstead 2002)<br />
==Quellen==<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente''. Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*Milstead, Jessica (2002): ''Thesaurus Management Software''. Verfügbar unter: http://www.asindexing.org/about-indexing/thesauri/thesaurus-management-software/. [21.12.2014<br />
<br />
<br />
==Weiterführende Literatur==<br />
*Virtuelles Handbuch Informationswissenschaft: http://is.uni-sb.de/studium/handbuch/infoling/thesnlp<br />
*Wersig, Gernot (1985): ''Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis''. München et al.: K.G. Saur<br />
<br />
==Weblinks==<br />
*ISO 5964: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159<br />
*Normdaten-Standards: https://wiki.dnb.de/display/DINIAGKIM/Normdaten-Standards<br />
*MIDOS: http://www.progris.de/m6info/index.htm<br />
*Oracle Thesaurus Management: http://www.oracle.com/us/products/applications/health-sciences/e-clinical/thesaurus-management/index.html<br />
*ThesaurusMaster: http://www.dataharmony.com/services-view/thesaurus-master/<br />
*STRIDE: http://www.questans.co.uk/p100l2.html<br />
*Synaptica: http://www.synaptica.com/<br />
*a.k.a. Library: http://www.a-k-a.co/index.php/aka-library/<br />
<br />
==Verwandte Begriffe==<br />
* [[broader::Dokumentationssprache]]<br />
* [[narrower::Einsprachiger Thesaurus]]<br />
* [[narrower::Mehrsprachiger Thesaurus]]<br />
* [[english::thesaurus]]<br />
* [[related::Synonym]]<br />
* [[related::Deskriptor]]<br />
* [[related::Äquivalenzklasse]]<br />
* [[related::Homonym]]<br />
* [[related::Relation]]<br />
* [[Synonymous:: Synonymwörterbuch]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Thesaurus&diff=15295Thesaurus2014-12-21T23:00:21Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::„Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstallung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“]]<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
„Im IuD-Bereich versteht man unter einem Thesaurus eine natürlichsprachig-basierte Dokumentationssprache zur inhaltlichen Feinerschliessung. Sie enthält eine geordnete Zusammenstellung von Begriffen und Benennungen, die zum Indexieren, Speichern und Wiederauffinden dokumentarischer Bezugseinheiten dient.“<br />
(Bertram 2004, S. 209)<br />
<br />
==Merkmale==<br />
Ein Thesaurus wird nach Burkhart durch folgende Merkmale gekennzeichnet:<br />
*Begriffe und Beziehungen werden eindeutig aufeinander bezogen („terminologische Kontrolle“), indem<br />
**Synonyme möglichst vollständig erfasst werden<br />
**Homonyme und Polyseme besonders gekennzeichnet werden<br />
**Für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt<br />
*Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt<br />
*Der Thesaurus ist präskriptiv, indem er für seinen Geltungsbereich festlegt, welche begrifflichen Einheiten zur Verfügung gestellt werden und durch welche Bezeichnungen diese repräsentiert werden.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
==Wortherkunft und Entstehungsgeschichte==<br />
Ursprünglich bezeichnete der aus dem griechischen stammende Begriff „Thesaurus“ einen Ort zum Einsammeln und Aufbewahren von Schätzen und Weihgaben. Im Bereich der Sprachwissenschaften versteht man zur heutigen Zeit ein Synonymwörterbuch.<br />
(Bertram 2004, S. 209)<br />
<br />
De Entwicklung von Thesauri wurde in der Mitte des 20. Jahrhunderts von der Motivation getrieben, sich von der starren und unflexiblen Präkombination abzuwenden und stattdessen eine benutzerfreundliche, natürliche Sprache zu verwenden. Schnell stellte sich das Bedürfnis nach einer Feinerschliessung von Dokumentbeständen in den Vordergrund, die eine Klassifikation nicht leistet. Durch die Entwicklung moderner Informationstechnologien wurde die physische Bindung der Erschliessung zu lösen und anstelle dessen digitale Stellvertreter zu verwenden. Dies erlaubte den polydimensionalen Zugriff auf Inhalte von Dokumenten, was die Vergabe von mehreren Indextermen in einem sinnvollen Rahmen ermöglichte.<br />
(Bertram 2004, S. 217)<br />
<br />
==Thesaurusaufbau==<br />
Zur Erstellung eines Thesaurus ist es notwendig den Bezugsrahmen einzugrenzen, denn ein Thesaurus kann den Anforderungen bezüglich Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der entsprechende Sachverhalt klar umrissen ist. Es ist also sinnvoll, sich auf einen bestimmten, überschaubaren Gegenstandsbereich zu beziehen, und Spezifitätsgrad (Allgemein vs. Speziell), Sprachstil (Wissenschaftlich vs. Allgemein) und Umfang zu konkretisieren.<br />
<br />
Wenn die Rahmenbedingungen festgelegt sind, wird anhand geeigneter Quellen (z.B. Experten, Fachliteratur, Fachwörterbücher, bereits existierende Thesauri, etc.) eine Wortgutsammlung erstellt.<br />
(Kuhlen et al. 2004, S. 141)<br />
<br />
===Terminologische Kontrolle===<br />
Da in der erstellten Wortgutsammlung noch Unklarheiten und Mehrdeutigkeiten aus der natürlichen Sprache enthalten sind, ist die terminologische Kontrolle unerlässlich für die Eindeutigkeit der Beziehung zwischen Bezeichnungen und Begriffen. Die terminologische Kontrolle erfolgt durch die Synonymkontrolle, die Polysemkontrolle und die Zerlegungskontrolle.<br />
(Kuhlen et al. 2004, S. 142)<br />
===Synonymkontrolle===<br />
Bei der Synonymkontrolle sollen alle als Synonym erkannten Begriffe einer Äquivalenzklasse zugeordnet werden; d.h. es werden alle Bezeichnungen in einer Äquivalenzklasse zusammengefasst, die den gleichen Begriff repräsentieren.<br />
<br />
'''Vollständige Synonymie:'''<br />
<br />
Photographie – Fotografie<br />
<br />
Frisör – Friseur<br />
<br />
'''Unterschiedliche Konnotationen:'''<br />
<br />
Pferd – Gaul<br />
<br />
Samstag – Sonnabend<br />
<br />
'''Pars pro toto Übertragung:'''<br />
<br />
Rundfunk – Hörfunk<br />
<br />
'''Quasi – Synonyme:'''<br />
<br />
Härte – Weichheit<br />
<br />
Wohnen - Wohnung<br />
<br />
(Kuhlen et al. 2004, S. 115; Bertram 2004, S. 220)<br />
===Homonym- und Polysemkontrolle===<br />
Die Homonym- und Polysemkontrolle macht mehrdeutige Benennungen eindeutig. Dieser Vorgang wird als Disambiguierung bezeichnet. Hier werden Bezeichnungen, die unterschiedliche Bedeutungen aufweisen, differenziert und verschiedenen Fachgebieten zugeordnet. Dazu kann nur eine Bedeutung beibehalten werden und die anderen explizit exkludiert werden oder das Homonym/Polysem wird durch eine eindeutige Benennung ersetzt. Als weiteres Vorgehen wird das Anfügen eines Homonymzusatzes verwendet.<br />
<br />
Schloss (Gebäude) - Schloss (Schließmechanismus)<br />
<br />
Hahn (Haustier) - Hahn (Wasserhahn) - Hahn (Wetterhahn)<br />
(Kuhlen et al. 2004, S. 143-144;Bertram 2004, S. 219)<br />
===Zerlegungskontrolle===<br />
Die Zerlegungskontrolle betrifft Komposita; hier wird zwischen der morphologischen Zerlegung und der semantischen Zerlegung unterschieden.<br />
<br />
Bei der '''morphologischen Zerlegung''' wird ein zusammengesetztes Wort in seine Grundwörter aufgeteilt:<br />
<br />
arbeit , -er, -en, -barkeit, etc<br />
<br />
Bei der '''semantischen Zerlegung''' wird ein Begriff in seine Begriffsteile zerlegt. Diese Begriffsteile werden durch im Thesaurus vorhandene Bezeichnungen ausgedrückt<br />
<br />
Kaffetasse Kaffe + Tasse<br />
(Kuhlen et al. 2004, S. 144)<br />
====Vor- und Nachteile einer Begriffszerlegung====<br />
Die Zerlegungskontrolle ist insbesondere in der deutschen Sprache, welche nahezu unendliche Wortkombinationen zulässt ein zentrales Problem. Da dies grosse Auswirkungen auf den Aufbau eines Thesaurus hat, stellt sich oft die Frage, ob eine Zerlegungskontrolle entsprechende Vorteile birgt. Nachfolgend sollen daher die Vor- und Nachteile einer Begriffszerlegung aufgeführt werden.<br />
<br />
Vorteile<br />
*zusätzliche sprachliche Einstiegsmöglichkeiten<br />
*erhöhte Vergabehäufigkeit der Deskriptoren<br />
*schlankes Gebrauchsvokabular<br />
<br />
Nachteile<br />
*Gefahr von Fehlverknüpfungen<br />
*Komplexere Thesaurusstruktur<br />
*Höhere Anforderungen an Indexierer<br />
*Begriffliche Beziehung zu Deskriptoren weniger gut möglich<br />
(Bertram 2004, S. 220- 222)<br />
==Thesaurusvokabular==<br />
Die aus der terminologischen Kontrolle entstandenen Begriffseinheiten werden als Äquivalenzklassen bezeichnet. Die Darstellung der Äquivalenzklassen kann in einem Thesaurus unterschiedlich sein. Bei einem '''Thesaurus ohne Vorzugsbenennung''' sind alle Elemente einer Äquivalenzklasse uneingeschränkt für Indexierung und Retrieval verwendbar. In Gegensatz dazu wird bei einem '''Thesaurus mit Vorzugsbenennung''' wird ein Element der Äquivalenzklasse als Vorzugsbenennung ausgewählt und als Deskriptor bezeichnet. Deskriptoren sind Schlagworte, die im Thesaurus enthalten und zur Indexierung zugelassen sind. <br />
(Kuhlen et al. 2004, S. 145)<br />
Der Deskriptor ist ein aktives Element. Es ist genormt und terminologisch kontrolliert, somit ist es für die Indexierung und das Retrieval zugelasen und verbindlich. Nicht-Deskriptoren sind passive Elemente. Sie stellen Benennungen dar, welche im Thesaurus enthalten aber nicht zur Indexierung zugelassen sind.<br />
(Bertram 2004, S. 210)<br />
<br />
Im Bezug auf den Thesaurus stellen die Deskriptoren dessen Gebrauchsvokabular, die Nicht-Deskriptoren dessen Zugangsvokabular dar. Benennungen, welche bisher fehlen und bei welchen unklar ist, ob und mit welchem Status sie in den Thesaurus aufgenommen werden in ihrer Gesamtheit als Kandidatenvokabular bezeichnet.<br />
(Bertram 2004, S. 210-211)<br />
GRAFIK s.211<br />
==Relationen==<br />
Die Relationen begründen die Struktur des Thesaurus. Sie stellen die Beziehungen zwischen den einzelnen Äquivalenzklassen dar. Dadurch entsteht ein semantisches Netz über den gesamten Thesaurus, das durch Querbeziehungen zu anderen ähnlichen oder verwandten Begriffen verweist und zu besseren Ergebnissen bei Indexierung und Information Retrieval führt. Hierbei wird zwischen der Äquivalenzrelation, der Hierarchierelation, der Assoziationsrelation und der Begriffskombinationen unterschieden.<br />
===Äquivalenzrelation===<br />
Bei der Äquivalenzrelation werden Bedeutungen als gleichwertig aufgefasst und Bezeichnungen zu Äquivalenzklassen zusammengeführt.<br />
<br />
Äquivalenzrelation<br />
{| class="wikitable"<br />
|Sonnabend<br />
|BS<br />
|Samstag<br />
|-<br />
|Naturwissenschaft<br />
|BSU<br />
|Chemie, Biologie<br />
|}<br />
BS = Benutze Synonym<br />
<br />
BSU = Benutze spezifischen Unterbegriff<br />
<br />
(Kuhlen et al. 2004, S. 147-148)<br />
===Hierarchische Relation===<br />
Die hierarchische Relation drückt ein Über- und Unterordnungsverhältnis der Begriffe aus.<br />
<br />
Generische Relation (Abstraktionsfunktion)<br />
<br />
{| class="wikitable"<br />
|Kraftwagen<br />
|UB<br />
|Personenkraftwagen<br />
|-<br />
|Lastkraftwagen<br />
|OB<br />
|Kraftwagen<br />
|}<br />
<br />
Partitive Relation (Bestandsrelation)<br />
<br />
{| class="wikitable"<br />
|Auto<br />
|TP<br />
|Automotor<br />
|-<br />
|Karosserie<br />
|SP<br />
|Auto<br />
|}<br />
<br />
UB = Unterbegriff<br />
<br />
OB = Oberbegriff<br />
<br />
TP = Teilbegriff<br />
<br />
SP = Verbandsbegriff<br />
(Kuhlen et al. 2004, S. 148-149)<br />
<br />
===Assoziationsrelation===<br />
Bei der Assoziationsrelation werden alle Relationen zwischen Begriffen erfasst, die weder eindeutig hierarchischer Natur sind, noch als äquivalent betrachtet werden können<br />
<br />
{| class="wikitable"<br />
|Obst<br />
|VB<br />
|Obstbaum<br />
|-<br />
|Hitze<br />
|VB<br />
|Kälte<br />
|-<br />
|Vater<br />
|VB<br />
|Sohn<br />
|}<br />
<br />
VB = Verwandter Begriff<br />
(Kuhlen et al. 2004, S. 149)<br />
<br />
===Begriffskombination===<br />
Bei der Begriffskombination wird eine Schnittmenge zwischen den Deskriptoren zweier Äquivalenzklassen erzeugt.<br />
<br />
{| class="wikitable"<br />
|Botschftsgebäude<br />
|BK<br />
|Verwaltungsgebäude, diplomatische Vertretung<br />
|-<br />
|Verwaltungsgebäude<br />
|KB<br />
|Botschaftsgebäude<br />
|-<br />
|diplomatische Vertretung<br />
|KB<br />
|Botschaftsgebäude<br />
|}<br />
<br />
BK = Benutze Kombination<br />
<br />
KB = Kombinationsbegriff<br />
<br />
(Kuhlen et al. 2004, S. 149-150)<br />
<br />
==Thesauruspflege==<br />
Damit ein Thesaurus seinen Anforderungen gerecht bleiben kann, ist eine ständige Beobachtung der Entwicklung der Forschungsschwerpunkte des jeweiligen Fachs notwendig; dazu gehören z.B. die:<br />
<br />
*Beobachtung der fachsprachlichen Entwicklung<br />
*Beobachtung des Indexierungsverhaltens/der Indexierungsergebnisse<br />
*Beobachtung des Benutzerverhaltens und der Rechercheergebnisse<br />
(Kuhlen et al. 2004, S. 151)<br />
<br />
==Normen==<br />
Für Thesauri existieren verschiedene Normen. Nennenswert sind vor allem die Norm DIN 1463 („Erstellung und Weiterentwicklung von Thesauri“) sowie die ISO-Normen 2788 und 5964 („Guidelines for the establishment and development of multilingual thesauri“).<br />
(Bertram 2004, S. 219)<br />
==Thesaurussoftware==<br />
Obwohl die Erstellung eines Thesaurus nach wie vor eine hauptsächlich intellektuelle Tätigkeit ist, so kann diese durch Software erheblich unterstützt und erleichtert werden. Ein wesentlicher Vorteil ist hier die automatische Generierung von reziproken Begriffsbeziehungen sowie automatischen Konsistenzprüfungen. Bekannte Vertreter sind hier unter anderem:<br />
*Oracle Thesaurus Management<br />
*MIDOS<br />
*ThesaurusMaster<br />
*STRIDE<br />
*Synaptica<br />
*a.k.a. Library<br />
<br />
(Bertram 2004, S. 230-232)<br />
(Milstead 2002)<br />
==Quellen==<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente''. Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*Milstead, Jessica (2002): ''Thesaurus Management Software''. Verfügbar unter: http://www.asindexing.org/about-indexing/thesauri/thesaurus-management-software/. [21.12.2014<br />
<br />
<br />
==Weiterführende Literatur==<br />
*Virtuelles Handbuch Informationswissenschaft: http://is.uni-sb.de/studium/handbuch/infoling/thesnlp<br />
*Wersig, Gernot (1985): ''Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis''. München et al.: K.G. Saur<br />
<br />
==Weblinks==<br />
*ISO 5964: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159<br />
*Normdaten-Standards: https://wiki.dnb.de/display/DINIAGKIM/Normdaten-Standards<br />
*MIDOS: http://www.progris.de/m6info/index.htm<br />
*Oracle Thesaurus Management: http://www.oracle.com/us/products/applications/health-sciences/e-clinical/thesaurus-management/index.html<br />
*ThesaurusMaster: http://www.dataharmony.com/services-view/thesaurus-master/<br />
*STRIDE: http://www.questans.co.uk/p100l2.html<br />
*Synaptica: http://www.synaptica.com/<br />
*a.k.a. Library: http://www.a-k-a.co/index.php/aka-library/<br />
<br />
==Verwandte Begriffe==<br />
* [[broader::Dokumentationssprache]]<br />
* [[narrower::Einsprachiger Thesaurus]]<br />
* [[narrower::Mehrsprachiger Thesaurus]]<br />
* [[english::thesaurus]]<br />
* [[related::Synonym]]<br />
* [[related::Deskriptor]]<br />
* [[related::Äquivalenzklasse]]<br />
* [[related::Homonym]]<br />
* [[related::Relation]]<br />
* [[Synonymous:: Synonymwörterbuch]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Thesaurus&diff=15294Thesaurus2014-12-21T22:27:22Z<p>Maegertm: </p>
<hr />
<div>==Definition==<br />
[[definition::„Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstallung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“]]<br />
Kks 141<br />
<br />
„Im IuD-Bereich versteht man unter einem Thesaurus eine natürlichsprachig-basierte Dokumentationssprache zur inhaltlichen Feinerschliessung. Sie enthält eine geordnete Zusammenstellung von Begriffen und Benennungen, die zum Indexieren, Speichern und Wiederauffinden dokumentarischer Bezugseinheiten dient.“<br />
<br />
Betram 209<br />
<br />
==Merkmale==<br />
Ein Thesaurus wird nach Burkhart durch folgende Merkmale gekennzeichnet:<br />
*Begriffe und Beziehungen werden eindeutig aufeinander bezogen („terminologische Kontrolle“), indem<br />
**Synonyme möglichst vollständig erfasst werden<br />
**Homonyme und Polyseme besonders gekennzeichnet werden<br />
**Für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt<br />
*Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt<br />
*Der Thesaurus ist präskriptiv, indem er für seinen Geltungsbereich festlegt, welche begrifflichen Einheiten zur Verfügung gestellt werden und durch welche Bezeichnungen diese repräsentiert werden.<br />
KKS 141<br />
<br />
==Wortherkunft und Entstehungsgeschichte==<br />
Ursprünglich bezeichnete der aus dem griechischen stammende Begriff „Thesaurus“ einen Ort zum Einsammeln und Aufbewahren von Schätzen und Weihgaben. Im Bereich der Sprachwissenschaften versteht man zur heutigen Zeit ein Synonymwörterbuch.<br />
Bertram 209<br />
<br />
De Entwicklung von Thesauri wurde in der Mitte des 20. Jahrhunderts von der Motivation getrieben, sich von der starren und unflexiblen Präkombination abzuwenden und stattdessen eine benutzerfreundliche, natürliche Sprache zu verwenden. Schnell stellte sich das Bedürfnis nach einer Feinerschliessung von Dokumentbeständen in den Vordergrund, die eine Klassifikation nicht leistet. Durch die Entwicklung moderner Informationstechnologien wurde die physische Bindung der Erschliessung zu lösen und anstelle dessen digitale Stellvertreter zu verwenden. Dies erlaubte den polydimensionalen Zugriff auf Inhalte von Dokumenten, was die Vergabe von mehreren Indextermen in einem sinnvollen Rahmen ermöglichte.<br />
Betram 217<br />
<br />
==Thesaurusaufbau==<br />
Zur Erstellung eines Thesaurus ist es notwendig den Bezugsrahmen einzugrenzen, denn ein Thesaurus kann den Anforderungen bezüglich Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der entsprechende Sachverhalt klar umrissen ist. Es ist also sinnvoll, sich auf einen bestimmten, überschaubaren Gegenstandsbereich zu beziehen, und Spezifitätsgrad (Allgemein vs. Speziell), Sprachstil (Wissenschaftlich vs. Allgemein) und Umfang zu konkretisieren.<br />
<br />
Wenn die Rahmenbedingungen festgelegt sind, wird anhand geeigneter Quellen (z.B. Experten, Fachliteratur, Fachwörterbücher, bereits existierende Thesauri, etc.) eine Wortgutsammlung erstellt. (Quelle: Burkart, S 141f)<br />
<br />
===Terminologische Kontrolle===<br />
Da in der erstellten Wortgutsammlung noch Unklarheiten und Mehrdeutigkeiten aus der natürlichen Sprache enthalten sind, ist die terminologische Kontrolle unerlässlich für die Eindeutigkeit der Beziehung zwischen Bezeichnungen und Begriffen. Die terminologische Kontrolle erfolgt durch die Synonymkontrolle, die Polysemkontrolle und die Zerlegungskontrolle.<br />
Burkhart 142<br />
===Synonymkontrolle===<br />
Bei der Synonymkontrolle sollen alle als Synonym erkannten Begriffe einer Äquivalenzklasse zugeordnet werden; d.h. es werden alle Bezeichnungen in einer Äquivalenzklasse zusammengefasst, die den gleichen Begriff repräsentieren.<br />
<br />
'''Vollständige Synonymie:'''<br />
<br />
Photographie – Fotografie<br />
<br />
Frisör – Friseur<br />
<br />
'''Unterschiedliche Konnotationen:'''<br />
<br />
Pferd – Gaul<br />
<br />
Samstag – Sonnabend<br />
<br />
'''Pars pro toto Übertragung:'''<br />
<br />
Rundfunk – Hörfunk<br />
<br />
'''Quasi – Synonyme:'''<br />
<br />
Härte – Weichheit<br />
<br />
Wohnen - Wohnung<br />
<br />
Burkhart 143, betram 220<br />
===Homonym- und Polysemkontrolle===<br />
Die Homonym- und Polysemkontrolle macht mehrdeutige Benennungen eindeutig. Dieser Vorgang wird als Disambiguierung bezeichnet. Hier werden Bezeichnungen, die unterschiedliche Bedeutungen aufweisen, differenziert und verschiedenen Fachgebieten zugeordnet. Dazu kann nur eine Bedeutung beibehalten werden und die anderen explizit exkludiert werden oder das Homonym/Polysem wird durch eine eindeutige Benennung ersetzt. Als weiteres Vorgehen wird das Anfügen eines Homonymzusatzes verwendet.<br />
<br />
Schloss (Gebäude) - Schloss (Schließmechanismus)<br />
<br />
Hahn (Haustier) - Hahn (Wasserhahn) - Hahn (Wetterhahn)<br />
Burkhart 143-144<br />
Bertram 219<br />
===Zerlegungskontrolle===<br />
Die Zerlegungskontrolle betrifft Komposita; hier wird zwischen der morphologischen Zerlegung und der semantischen Zerlegung unterschieden.<br />
<br />
Bei der '''morphologischen Zerlegung''' wird ein zusammengesetztes Wort in seine Grundwörter aufgeteilt:<br />
<br />
arbeit , -er, -en, -barkeit, etc<br />
<br />
Bei der '''semantischen Zerlegung''' wird ein Begriff in seine Begriffsteile zerlegt. Diese Begriffsteile werden durch im Thesaurus vorhandene Bezeichnungen ausgedrückt<br />
<br />
Kaffetasse Kaffe + Tasse<br />
Burkhart 144<br />
====Vor- und Nachteile einer Begriffszerlegung====<br />
Die Zerlegungskontrolle ist insbesondere in der deutschen Sprache, welche nahezu unendliche Wortkombinationen zulässt ein zentrales Problem. Da dies grosse Auswirkungen auf den Aufbau eines Thesaurus hat, stellt sich oft die Frage, ob eine Zerlegungskontrolle entsprechende Vorteile birgt. Nachfolgend sollen daher die Vor- und Nachteile einer Begriffszerlegung aufgeführt werden.<br />
<br />
Vorteile<br />
*zusätzliche sprachliche Einstiegsmöglichkeiten<br />
*erhöhte Vergabehäufigkeit der Deskriptoren<br />
*schlankes Gebrauchsvokabular<br />
<br />
Nachteile<br />
*Gefahr von Fehlverknüpfungen<br />
*Komplexere Thesaurusstruktur<br />
*Höhere Anforderungen an Indexierer<br />
*Begriffliche Beziehung zu Deskriptoren weniger gut möglich<br />
Bertrem 220- 222<br />
==Thesaurusvokabular==<br />
Die aus der terminologischen Kontrolle entstandenen Begriffseinheiten werden als Äquivalenzklassen bezeichnet. Die Darstellung der Äquivalenzklassen kann in einem Thesaurus unterschiedlich sein. Bei einem '''Thesaurus ohne Vorzugsbenennung''' sind alle Elemente einer Äquivalenzklasse uneingeschränkt für Indexierung und Retrieval verwendbar. In Gegensatz dazu wird bei einem '''Thesaurus mit Vorzugsbenennung''' wird ein Element der Äquivalenzklasse als Vorzugsbenennung ausgewählt und als Deskriptor bezeichnet. Deskriptoren sind Schlagworte, die im Thesaurus enthalten und zur Indexierung zugelassen sind. <br />
Burkhart 145<br />
<br />
Der Deskriptor ist ein aktives Element. Es ist genormt und terminologisch kontrolliert, somit ist es für die Indexierung und das Retrieval zugelasen und verbindlich. Nicht-Deskriptoren sind passive Elemente. Sie stellen Benennungen dar, welche im Thesaurus enthalten aber nicht zur Indexierung zugelassen sind.<br />
Bertram210<br />
<br />
Im Bezug auf den Thesaurus stellen die Deskriptoren dessen Gebrauchsvokabular, die Nicht-Deskriptoren dessen Zugangsvokabular dar. Benennungen, welche bisher fehlen und bei welchen unklar ist, ob und mit welchem Status sie in den Thesaurus aufgenommen werden in ihrer Gesamtheit als Kandidatenvokabular bezeichnet.<br />
Bertram 210-211<br />
GRAFIK s.211<br />
==Relationen==<br />
Die Relationen begründen die Struktur des Thesaurus. Sie stellen die Beziehungen zwischen den einzelnen Äquivalenzklassen dar. Dadurch entsteht ein semantisches Netz über den gesamten Thesaurus, das durch Querbeziehungen zu anderen ähnlichen oder verwandten Begriffen verweist und zu besseren Ergebnissen bei Indexierung und Information Retrieval führt. Hierbei wird zwischen der Äquivalenzrelation, der Hierarchierelation, der Assoziationsrelation und der Begriffskombinationen unterschieden.<br />
===Äquivalenzrelation===<br />
Bei der Äquivalenzrelation werden Bedeutungen als gleichwertig aufgefasst und Bezeichnungen zu Äquivalenzklassen zusammengeführt.<br />
<br />
Äquivalenzrelation<br />
{| class="wikitable"<br />
|Sonnabend<br />
|BS<br />
|Samstag<br />
|-<br />
|Naturwissenschaft<br />
|BSU<br />
|Chemie, Biologie<br />
|}<br />
BS = Benutze Synonym<br />
<br />
BSU = Benutze spezifischen Unterbegriff<br />
<br />
Burkahrt 147-148<br />
===Hierarchische Relation===<br />
Die hierarchische Relation drückt ein Über- und Unterordnungsverhältnis der Begriffe aus.<br />
<br />
Generische Relation (Abstraktionsfunktion)<br />
<br />
{| class="wikitable"<br />
|Kraftwagen<br />
|UB<br />
|Personenkraftwagen<br />
|-<br />
|Lastkraftwagen<br />
|OB<br />
|Kraftwagen<br />
|}<br />
<br />
Partitive Relation (Bestandsrelation)<br />
<br />
{| class="wikitable"<br />
|Auto<br />
|TP<br />
|Automotor<br />
|-<br />
|Karosserie<br />
|SP<br />
|Auto<br />
|}<br />
<br />
UB = Unterbegriff<br />
<br />
OB = Oberbegriff<br />
<br />
TP = Teilbegriff<br />
<br />
SP = Verbandsbegriff<br />
Burkhart 148-149<br />
<br />
===Assoziationsrelation===<br />
Bei der Assoziationsrelation werden alle Relationen zwischen Begriffen erfasst, die weder eindeutig hierarchischer Natur sind, noch als äquivalent betrachtet werden können<br />
<br />
{| class="wikitable"<br />
|Obst<br />
|VB<br />
|Obstbaum<br />
|-<br />
|Hitze<br />
|VB<br />
|Kälte<br />
|-<br />
|Vater<br />
|VB<br />
|Sohn<br />
|}<br />
<br />
VB = Verwandter Begriff<br />
Burkhart 149<br />
<br />
===Begriffskombination===<br />
Bei der Begriffskombination wird eine Schnittmenge zwischen den Deskriptoren zweier Äquivalenzklassen erzeugt.<br />
<br />
{| class="wikitable"<br />
|Botschftsgebäude<br />
|BK<br />
|Verwaltungsgebäude, diplomatische Vertretung<br />
|-<br />
|Verwaltungsgebäude<br />
|KB<br />
|Botschaftsgebäude<br />
|-<br />
|diplomatische Vertretung<br />
|KB<br />
|Botschaftsgebäude<br />
|}<br />
<br />
BK = Benutze Kombination<br />
<br />
KB = Kombinationsbegriff<br />
<br />
Burkhart 149-150<br />
<br />
==Thesauruspflege==<br />
Damit ein Thesaurus seinen Anforderungen gerecht bleiben kann, ist eine ständige Beobachtung der Entwicklung der Forschungsschwerpunkte des jeweiligen Fachs notwendig; dazu gehören z.B. die:<br />
<br />
*Beobachtung der fachsprachlichen Entwicklung<br />
*Beobachtung des Indexierungsverhaltens/der Indexierungsergebnisse<br />
*Beobachtung des Benutzerverhaltens und der Rechercheergebnisse<br />
Burkart, S.151<br />
<br />
==Normen==<br />
Für Thesauri existieren verschiedene Normen. Nennenswert sind vor allem die Norm DIN 1463 („Erstellung und Weiterentwicklung von Thesauri“) sowie die ISO-Normen 2788 und 5964 („Guidelines for the establishment and development of multilingual thesauri“).<br />
Bertram 219<br />
==Thesaurussoftware==<br />
Obwohl die Erstellung eines Thesaurus nach wie vor eine hauptsächlich intellektuelle Tätigkeit ist, so kann diese durch Software erheblich unterstützt und erleichtert werden. Ein wesentlicher Vorteil ist hier die automatische Generierung von reziproken Begriffsbeziehungen sowie automatischen Konsistenzprüfungen. Bekannte Vertreter sind hier unter anderem:<br />
*Oracle Thesaurus Management<br />
*MIDOS<br />
*ThesaurusMaster<br />
*STRIDE<br />
*Synaptica<br />
*a.k.a. Library<br />
<br />
Bertram 230-232<br />
http://www.asindexing.org/about-indexing/thesauri/thesaurus-management-software/<br />
==Quellen==<br />
<br />
<br />
==Weiterführende Literatur==<br />
*Virtuelles Handbuch Informationswissenschaft: http://is.uni-sb.de/studium/handbuch/infoling/thesnlp<br />
*Wersig, G. (1985): Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis. München et al.: K.G. Saur<br />
<br />
==Weblinks==<br />
*ISO 5964: http://www.iso.org/iso/catalogue_detail.htm?csnumber=12159<br />
*Normdaten-Standards: https://wiki.dnb.de/display/DINIAGKIM/Normdaten-Standards<br />
*MIDOS: http://www.progris.de/m6info/index.htm<br />
*Oracle Thesaurus Management: http://www.oracle.com/us/products/applications/health-sciences/e-clinical/thesaurus-management/index.html<br />
*ThesaurusMaster: http://www.dataharmony.com/services-view/thesaurus-master/<br />
*STRIDE: http://www.questans.co.uk/p100l2.html<br />
*Synaptica: http://www.synaptica.com/<br />
*a.k.a. Library: http://www.a-k-a.co/index.php/aka-library/<br />
<br />
==Verwandte Begriffe==<br />
* [[broader::Dokumentationssprache]]<br />
* [[narrower::Einsprachiger Thesaurus]]<br />
* [[narrower::Mehrsprachiger Thesaurus]]<br />
* [[english::thesaurus]]<br />
* [[related::Synonym]]<br />
* [[related::Deskriptor]]<br />
* [[related::Äquivalenzklasse]]<br />
* [[related::Homonym]]<br />
* [[related::Relation]]<br />
* [[Synonymous:: Synonymwörterbuch]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15082Stichwort2014-11-30T17:45:05Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein '''Stichwort''' ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
==Quellen==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
==Weiterführende Literatur==<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
*SPRINT: http://sprint.informationswissenschaft.ch/allgemeine-suche/suchverfahren/suchmaschinen/die-funktionsweise/<br />
<br />
==Weblinks==<br />
* Duden: http://www.duden.de/rechtschreibung/Stichwort<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
* [[related::Lemma]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15079Stichwort2014-11-30T17:37:44Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein '''Stichwort''' ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Quellen==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
==Weiterführende Literatur==<br />
<br />
==Weblinks==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
* [[related::Lemma]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15078Stichwort2014-11-30T17:33:44Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein '''Stichwort''' ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Literatur==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
<br />
==Links==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
* [[related::Lemma]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15074Stichwort2014-11-30T17:27:38Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein '''Stichwort''' ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Literatur==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
<br />
==Links==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15073Stichwort2014-11-30T17:27:22Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein Stichwort ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Literatur==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
<br />
==Links==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
<br />
==Verwandte Begriffe==<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15072Stichwort2014-11-30T17:25:49Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein Stichwort ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“]] (Kuhlen et al. 2004, S. 115)<br />
<br />
[[definition::„[Ein Stichwort ist ein] inhaltstragendes Wort, das im Basisdokument vorkommt“]] (Hierl 2011, S. 8)<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Literatur==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
<br />
==Links==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
*Glossar TU Kaiserslautern: https://glossar.ub.uni-kl.de/begriff500<br />
<br />
===Verwandte Begriffe===<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertmhttps://wiki.infowiss.net/index.php?title=Stichwort&diff=15069Stichwort2014-11-30T17:19:41Z<p>Maegertm: </p>
<hr />
<div>[[definition::„Ein Stichwort ist eine Benennung, die zum Zweck der Inhaltskennzeichnung nach dem Extraktionsprinzip aus dem Titel, dem Text oder auch dem Kurzreferat zugeordnet wird. Während dies bei der manuellen Auswertung mit einer dokumentbezogenen Relevanzentscheidung gekoppelt ist, werden bei der Freitext-Methode alle im Text vorkommenden Wörter (eventuell gekoppelt mit einer Stoppwort-Liste) in ein Register gestellt und damit als Suchtermini zugänglich gemacht.“ (Kuhlen et al. 2004, S. 115)<br />
<br />
„inhaltstragendes Wort, das im Basisdokument vorkommt“ (Hierl 2011, S. 8)]]<br />
<br />
==Enge und weite Definition des Begriffs==<br />
Der Begriff Stichwort wird sowohl im engeren, wie auch im weiteren Sinne definiert und verwendet. Bei der engeren Definition werden nur diejenigen Begriffe als Stichwörter angesehen, welche sich im Titel oder Untertitel des Dokuments befinden. Bei der weiteren Definition des Begriffs werden nicht nur Titel und Untertitel, sondern sämtliche Begriffe, welche in der bibliographischen Beschreibung vorkommen, mit eingeschlossen. Dies umfasst daher auch beispielsweise den Verlag oder einen allfälligen Abstract. Eine Suche nach dieser Definition wird oft als Freitextsuche bezeichnet. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Abgrenzung zu Schlagwort==<br />
Oft führt die Verwendung der Begriffe Stichwort und Schlagwort zu Konfusion, zumal die beiden Begriffe oft fälschlicherweise synonym verwendet werden. Hierbei ist zu beachten, dass es sich um zwei verschiedene Konzepte handelt. Stichwörter sind nach vorhergehender Definition Begriffe, welche direkt aus dem Titel oder der bibliographischen Beschreibung extrahiert werden. Es handelt sich hierbei um ein nicht kontrolliertes Vokabular. Mit Schlagwörtern hingegen wird der Inhalt eines Dokuments beschrieben. Bei der (intellektuellen) Indexierung werden hierbei Begriffe aus einem kontrollierten Vokabular vergeben. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
==Stichwortregister==<br />
Stichworte werden in einem Stichwortregister zusammengefasst. Stichwortregister sind benennungsorientierte Register, welche meist automatisch erstellt werden, indem die Begriffe dem Basisdokument entnommen werden. In den meisten Fällen handelt es sich hierbei um Kontextregister. Stichwortregister werden meist erstellt, wenn das Dokument, auf welches sich das Register stützt von einem einzigen Autor stammt. (Bertram 2005, S. 121–122)<br />
==Suche mit Stichwörtern==<br />
Die Suche mit Stichwörtern bietet sich besonders bei Dokumenten an, welche noch keine Schlagwörter erhalten haben. Dies ist insbesondere bei sehr aktuellen Dokumenten der Fall. Daher eignet sich eine Suche nach Stichwörtern primär als ergänzende Suche zur Schlagwortsuche. Zu beachten ist hier, dass viele Suchmaschinen die Stichwortsuche unterschiedlich interpretieren, also im engeren oder weiteren Sinn. Meist ist die vereinfachte Suche in einer Fachdatenbank identisch mit einer Stichwortsuche. (LOTSE: Library Online Tour & Self-Paced Education 2014)<br />
<br />
<br />
==Literatur==<br />
<br />
*Bertram, Jutta (2005): ''Einführung in die inhaltliche Erschließung: Grundlagen, Methoden, Instrumente.'' Content and communication: Bd. 2. Würzburg: Ergon-Verl.<br />
*Hierl, Sonja (2011): ''Wissenorganisation & - repräsentation: 09. Inhaltliche Erschliessung: (Intellektuelle) Indexierung.''<br />
*Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (2004): ''Grundlagen der praktischen Information und Dokumentation: Band 1: Handbuch zur Einführung in die Informationswissenschaft und -praxis - Band 2: Glossar'' (5. Aufl., 5th completely new Edition). Berlin: De Gruyter. Verfügbar unter: http://www.degruyter.com/doi/book/10.1515/9783110964110.<br />
*LOTSE: Library Online Tour & Self-Paced Education (2014): ''Der Unterschied zwischen Stichwort, Schlagwort und Thesaurus.'' Verfügbar unter: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php. [30.11.2014].<br />
<br />
<br />
==Links==<br />
*LOTSE: http://lotse.sub.uni-hamburg.de/physik/literatur_recherchieren_und_beschaffen/strategien_zur_literatursuche/exkurs_stichwort_schlagwort-de.php<br />
<br />
*FACTMINER: http://www.compris.com/FactMiner/de/Overview.html<br />
<br />
*Virtuelles Handbuch Informationswissenschaft: Information Retrieval. http://is.uni-sb.de/studium/handbuch/exkurs.ir.php<br />
<br />
*Virtuelles Handbuch Informationswissenschaft: Automatische und intellektuelle Indexierung. http://is.uni-sb.de/studium/handbuch/exkurs.ind.php <br />
<br />
===Verwandte Begriffe===<br />
<br />
* [[broader::Indexierung]]<br />
* [[related::Schlagwort]]<br />
* [[related::Deskriptor]]<br />
* [[related::Extraktionsmethode]]<br />
* [[related::Extrahieren]]<br />
<br />
[[category:Informationsarbeit]]<br />
[[category:Wissensrepräsentation]]</div>Maegertm