Extracting: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
Zeile 1: Zeile 1:
[[definition::Extracting bezeichnet eine Methode, nach der inhaltsbeschreibende Elemente dem zu beschreibenden Dokument (automatisch oder intellektuell) entnommen werden]] (im Gegensatz zur Additionsmethode, nach der zur Inhaltsbeschreibung auch solche Termini verwendet werden, die nicht im Dokument vorkommen). Der Schwerpunkt im Bereich Informationsextraktion (information extraction) liegt heute auf automatischen Verfahren, die inhaltsrelevante Beschreibungselemente (Wörter, Wortgruppen, Satzteile, Sätze) aufgrund struktureller, linguistischer oder mathematisch-statistischer Kriterien aus Dokumenten extrahieren.
+
Der Grossteil an heute verfügbarer Information ist in Texten und anderen unstrukturierten Medien gespeichert und deswegen nicht direkt durch Rechner interpretierbar. Hier setzt die Methode des Extractings an: Dabei werden vordefinierte Typen von Informationen aus maschinenlesbaren Dokumenten extrahiert. Extracting ist somit ein Teilgebiet der inhaltlichen Erschliessung, genauer eine Unterkategorie der [[Indexierung]]. Dabei wird auf Grundlage von Stichwörtern gearbeitet, im Gegensatz zur [[Additionsmethode]], welche auf Schlagwörtern basiert.
  
==Literatur==
+
=Ziele=
  
*Salton, Gerard; McGill, Michael J.: Information Retrieval: Grundlegendes für Informationswissenschaftler. - Hamburg [u.a.]: McGraw-Hill, 1987.
+
=Arten=
  
*Knorz, G. (1997). Indexieren, Klassieren, Extrahieren. In: Buder/Rehfeld/Seeger/Strauch (Hrsg., 1997): Grundlagen der praktischen Information und Dokumentation. München et al. K.G. Saur, 120-140
+
=Ansätze=
  
==Links==
+
==Intellektuelles Extracting==
  
*FACTMINER: http://www.compris.com/FactMiner/de/Overview.html
+
==Automatisches Extracting==
  
*Wikipedia: Informationsextraktion. http://de.wikipedia.org/wiki/Informationsextraktion
+
=Verfahren=
 +
 
 +
=Schwierigkeiten=
 +
 
 +
=Quellen=
 +
 
 +
*Capurro, Rafael (2000): Einführung in die Informationswissenschaft. Verfügbar unter: http://www.capurro.de/iwmodul5.html [13.11.2014].
 +
 
 +
*Dengel, Andreas (Hrsg.) (2012): Semantische Technologien. Grundlagen-Konzepte-Anwendungen. Heidelberg: Spektrum.
 +
 
 +
*Klügl, Peter; Toepfer Martin (2014): Informationsextraktion. In: Informatik_Spektrum (Nr. 37_2, S. 132-135).
 +
 
 +
*Luckhardt, Heinz-Dirk (2010): Virtuelles Handbuch Informationswissenschaft. Automatische und intellektuelle Indexierung. Verfügbar unter: http://is.uni-sb.de/studium/handbuch/exkurs_ind.html [13.11.2014].
 +
 
 +
*Meyer, Alexander (2012): Extraktion von RDF-Tripeln aus unstrukturierten Wikipedia-Texten. DBpedia erweitern durch Auswertung kompletter Artikeltexte. Verfügbar unter: http://amor.cms.hu-berlin.de/~meyerale/wiki2rdf/Masterarbeit_A_Meyer.pdf [13.11.2014].
 +
 
 +
*Uszkorei, Hans (2009): Informationsextraktion. Information Retrieval. Verfügbar unter: http://www.coli.uni-saarland.de/courses/is-is/slides/VLIWIS_IE_HU.pdf [13.11.2014].
 +
 
 +
 
 +
=Weiterführende Literatur=
 +
 
 +
=Weblinks=
  
(alle Webadressen zuletzt besucht am 04.08.2010)
 
  
 
==Verwandte Begriffe==
 
==Verwandte Begriffe==

Version vom 15. November 2014, 13:15 Uhr

Der Grossteil an heute verfügbarer Information ist in Texten und anderen unstrukturierten Medien gespeichert und deswegen nicht direkt durch Rechner interpretierbar. Hier setzt die Methode des Extractings an: Dabei werden vordefinierte Typen von Informationen aus maschinenlesbaren Dokumenten extrahiert. Extracting ist somit ein Teilgebiet der inhaltlichen Erschliessung, genauer eine Unterkategorie der Indexierung. Dabei wird auf Grundlage von Stichwörtern gearbeitet, im Gegensatz zur Additionsmethode, welche auf Schlagwörtern basiert.

Ziele

Arten

Ansätze

Intellektuelles Extracting

Automatisches Extracting

Verfahren

Schwierigkeiten

Quellen

  • Dengel, Andreas (Hrsg.) (2012): Semantische Technologien. Grundlagen-Konzepte-Anwendungen. Heidelberg: Spektrum.
  • Klügl, Peter; Toepfer Martin (2014): Informationsextraktion. In: Informatik_Spektrum (Nr. 37_2, S. 132-135).


Weiterführende Literatur

Weblinks

Verwandte Begriffe