Maschinelle Klassifikation
Das maschinelle Klassifizieren kann als ein Teilaspekt automatischer Inhaltserschliessung verstanden werden und ist vom automatischen Clustern abzugrenzen, bei welchem kein fertiges Klassifikationssystem benutzt wird. Im Bibliotheksumfeld hingegen existieren feste Klassifikationssysteme, in welche die zu klassifizierenden Texte eingeordnet werden müssen. Ein rein automatisches Verfahren ist dabei nicht möglich, da die aus den Texten automatisch gewonnene Information immer im Bruch zur intellektuel erstellten Klassifikation stehen wird. Deshalb sind in diesem Zusammenhang semiautomatische Verfahren das Ziel, welche bestenfalls durch die Anwenderaktionen lernen können.
Inhaltsverzeichnis
Ziele
Arten
Grundsätzlich wird bei der maschinellen Klassifikation zwischen häufigkeitsbasierten, lineraren, prototypbasierten und hierarchischen Verfahren unterschieden. Dies umfasst hauptsächlich:
- Naiver Bayes-Klassifikator
- Lineare Diskriminanzanalyse
- Support-Vektor-Maschine
- Nächster Nachbar Klassifikator
- Lernende Vektorquantisierung
- Entscheidungsbäume
Ansätze
Verfahren
Schwierigkeiten
Quellen
- Helmbrecht-Schaar, Anja (2007): Entwicklung eines Verfahrens der automatischen Klassifizierung für Textdokumente aus dem Fachbereich Informatik mithilfe eines fachspezifischen Klassifikationssystems. In: Umlauf, Konrad (Hrsg.): Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft (Heft 200). Berlin: Humboldt-Universität.
- Runkler, Thomas A. (2010): Data Mining. Methoden und Algorithmen intelligenter Datenanalyse. Wiesbaden: GWV Fachverlage.
- Sommer, Maike (2012): Automatische Generierung von CCD-Notationen für Hochschulveröffentlichungen. Bacherlorarbeit: Hochschule Hannover.
Weiterführende Literatur
- Nohr, Holger (2003): Grundlagen der automatischen Indexierung. Ein Lehrbuch. Berlin: Logos.
- Heyer, Gerhard; Quasthoff, Uwe; Wittig, Thomas (2008): Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse. 1. korrigierter Nachdr. Herdecke: W3L-Verl.
- Sebastiani, Fabrizio (2002): Machine learning in automated text categorization. In: ACM Computing Surveys. Jg. 34, H. 1, S. 1-47. Verfügbar unter: http://nmis.isti.cnr.it/sebastiani/Publications/ACMCS02.pdf [22.11.2014].