Invisible Web: Unterschied zwischen den Versionen
(8 dazwischenliegende Versionen von 4 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
+ | [[category:Internet]] | ||
+ | [[category:Problemfelder der Informationswissenschaft]] | ||
+ | |||
== Definition == | == Definition == | ||
Das Invisible Web (''unsichtbares Web''; auch: Deep Web, Dark Matter) besteht aus Inhalten, die von normalen Suchmaschinen nicht erfasst werden, wie: | Das Invisible Web (''unsichtbares Web''; auch: Deep Web, Dark Matter) besteht aus Inhalten, die von normalen Suchmaschinen nicht erfasst werden, wie: | ||
Zeile 11: | Zeile 14: | ||
== 4 Typen von unsichtbaren Web-Inhalten == | == 4 Typen von unsichtbaren Web-Inhalten == | ||
=== 1. Opaque Web === | === 1. Opaque Web === | ||
− | Das Opaque Web ist ziemlich groß, seine Inhalte können aber leicht ins Visible Web übernommen werden. Es umfasst u.a. Seiten, auf die keine Links verweisen oder neue Seiten, die von den Crawlern der Suchmaschinen noch nicht gefunden wurden. Auch | + | Das Opaque Web ist ziemlich groß, seine Inhalte können aber leicht ins Visible Web übernommen werden. Es umfasst u.a. Seiten, auf die keine Links verweisen oder neue Seiten, die von den Crawlern der Suchmaschinen noch nicht gefunden wurden. Auch eine begrenzte Anzahl an Suchergebnissen kann Webseiten unsichtbar machen. |
=== 2. Private Web === | === 2. Private Web === | ||
− | Das Private Web besteht aus passwortgeschützten Inhalten oder Seiten, die mit dem Robots Exclusion Protocol vor Indexierung durch Suchmaschinen geschützt werden. | + | Das Private Web besteht aus passwortgeschützten Inhalten oder Seiten, die mit dem Robots Exclusion Protocol vor der Indexierung durch Suchmaschinen geschützt werden. |
=== 3. Proprietary Web === | === 3. Proprietary Web === | ||
− | Dieser Teil des Invisible Web besteht aus Seiten, die eine vorherige Registrierung verlangen oder kostenpflichtige Inhalte anbieten | + | Dieser Teil des Invisible Web besteht aus Seiten, die eine vorherige Registrierung verlangen oder kostenpflichtige Inhalte anbieten. |
=== 4. Truly Invisible Web === | === 4. Truly Invisible Web === | ||
Das Truly Invisible Web umfasst PDF-Dateien und andere Formate, die von den Suchmaschinen nicht indexiert werden können bzw. deren Indexierung zu aufwändig wäre. Auch relationale Datenbanken und dynamisch generierte Seiten zählen dazu. | Das Truly Invisible Web umfasst PDF-Dateien und andere Formate, die von den Suchmaschinen nicht indexiert werden können bzw. deren Indexierung zu aufwändig wäre. Auch relationale Datenbanken und dynamisch generierte Seiten zählen dazu. | ||
+ | ---- | ||
+ | Quelle: | ||
+ | *Sherman, Chris; Price, Gary (2001): [[The Invisible Web (Buchbesprechung)|The Invisible Web]]. Uncovering Information Sources Search Engines Can´t See. Medford: Information Today Inc. |
Aktuelle Version vom 11. Februar 2009, 08:54 Uhr
Inhaltsverzeichnis
Definition
Das Invisible Web (unsichtbares Web; auch: Deep Web, Dark Matter) besteht aus Inhalten, die von normalen Suchmaschinen nicht erfasst werden, wie:
- unverlinkte Seiten
- Seiten, deren Inhalte größtenteils aus Bild-, Audio- oder Videodateien bestehen
- Seiten, deren Inhalte größtenteils aus PDF´s, PostScripts, Zip-Archiven oder Flash bestehen
- Inhalte von relationalen Datenbanken
- Seiten mit Real-Time-Inhalten
- Dynamisch generierte Inhalte
Nicht immer sind es technische Hindernisse, die eine Aufnahme dieser Seiten in die Indizes der Suchmaschinen verhindern.
4 Typen von unsichtbaren Web-Inhalten
1. Opaque Web
Das Opaque Web ist ziemlich groß, seine Inhalte können aber leicht ins Visible Web übernommen werden. Es umfasst u.a. Seiten, auf die keine Links verweisen oder neue Seiten, die von den Crawlern der Suchmaschinen noch nicht gefunden wurden. Auch eine begrenzte Anzahl an Suchergebnissen kann Webseiten unsichtbar machen.
2. Private Web
Das Private Web besteht aus passwortgeschützten Inhalten oder Seiten, die mit dem Robots Exclusion Protocol vor der Indexierung durch Suchmaschinen geschützt werden.
3. Proprietary Web
Dieser Teil des Invisible Web besteht aus Seiten, die eine vorherige Registrierung verlangen oder kostenpflichtige Inhalte anbieten.
4. Truly Invisible Web
Das Truly Invisible Web umfasst PDF-Dateien und andere Formate, die von den Suchmaschinen nicht indexiert werden können bzw. deren Indexierung zu aufwändig wäre. Auch relationale Datenbanken und dynamisch generierte Seiten zählen dazu.
Quelle:
- Sherman, Chris; Price, Gary (2001): The Invisible Web. Uncovering Information Sources Search Engines Can´t See. Medford: Information Today Inc.