Information Retrieval im Web: Unterschied zwischen den Versionen
K (nur zum testen des inhaltsverzeichnisses) |
|||
Zeile 1: | Zeile 1: | ||
!!!Under Construction!!! | !!!Under Construction!!! | ||
− | |||
''"Information Retrieval umfasst "alle Verfahren …, die mit der Aufbereitung, Speicherung und Wiedergewinnung (Recherche) von Wissen (Texte, Fakten) zu tun haben."'' [http://www.is.uni-sb.de/studium/handbuch/exkurs.ir.php Luckhardt, Information Retrieval] | ''"Information Retrieval umfasst "alle Verfahren …, die mit der Aufbereitung, Speicherung und Wiedergewinnung (Recherche) von Wissen (Texte, Fakten) zu tun haben."'' [http://www.is.uni-sb.de/studium/handbuch/exkurs.ir.php Luckhardt, Information Retrieval] |
Version vom 17. Februar 2005, 14:24 Uhr
!!!Under Construction!!!
"Information Retrieval umfasst "alle Verfahren …, die mit der Aufbereitung, Speicherung und Wiedergewinnung (Recherche) von Wissen (Texte, Fakten) zu tun haben." Luckhardt, Information Retrieval
Inhaltsverzeichnis
Aufbereitung von Wissen im Web
Aufbereitung von Webseiten durch den Webdesigner
Die Aufbereitung von Wissen im Web bezieht sich im Rahmen des Webpublishing auf die Vorbereitung von Webseiten für die leichtere Auffindbarkeit von Suchmaschinen. Dazu gehört vor allem das Proactive Webdesign.
(evtl. die Seite zu proactive noch erweitern:
- genauere Angaben zu metatags
- dynamische Seiten
- Zugriffsregelung
- Anzahl der verlinkenden Seiten wichtig))
Aufbereitung von Webseiten durch die Suchmaschine
Überführung der indexierten Dokumente in einheitliche Dokumentenrepräsentation - Herausfiltern von Stoppwörtern
- Stemmen der Begriffe
- Verknüpfen von Dokument und den darin gefunden Begriffen über invertierten Index
- Überführung der Anfrage in einheitliche Anfragerepräsentation
- Herausfiltern von Stoppwörtern
- Stemmen der Begriffe
- Durchsuchen des invertierten Index nach mit der Anfrage übereinstimmenden Dokumenten
Beispiel Arbeitsweise invertierter Index
Speicherung von Wissen im Web
kein zentraler Speicher, Suchmaschinen haben evtl zwar Seiten im Cache, aber nicht alle, nicht aktuelle Version
Wiedergewinnung von Wissen im Web
Suchmöglichkeiten
Newsgroups
- Hierarchisch aufgebaut
- Inhalt selten als Informationsangebot ins Netz gestellt
- nicht für Information Retrieval ausgelegt
Spezialangebote
- Häufig Frontend für Datenbanken
- meist kostenpflichtig
- Bei sehr spezifischen Anfragen und i.d.R. hohem Vorwissen genutzt