Informationsrezeption und Informationssuche

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen


Der Zusammenhang zwischen menschlichem Denken und der Stichwortsuche in Volltexten

  • Die Argumentation folgt dem Artikel “KWIC and Dirty? Human Cognition and the Claims of Full-Text Searching “ von Jeffrey Garrett. Journal of Electronic Publishing. Ann Arbor, MI: Scholarly Publishing Office, University of Michigan, University Library. vol. 9, no. 1, Winter 2006. URL: http://hdl.handle.net/2027/spo.3336451.0009.106 Journal of Electronic Publishing : http://www.hti.umich.edu/j/jep/

Aufhänger

"Google Is Adding Major Libraries to Its Database". New York Times, December 14, 2004. Newsweek feiert dies als "… transition to a new era of history" und behauptet “…memorization will be obsolete, because even the most obscure fact will be instantly retrievable” (Levy 2004).

Garrets Szenario

Alles Wissen der Welt, alles, was jemals geschrieben wurde, wird in einem einzigen (verteilten) Textspeicher verfügbar und durchsuchbar sein. Man muss nichts mehr (auswendig) lernen, weil alles unmittelbar (wieder-)findbar ist. In der Schule wird nur noch die Internetrecherche gelehrt.

Kernfragen

  • Welche Folgen hat die totale Zugänglichkeit dieses „Menschheitsgedächtnisses“?
  • In welchem Maße befreit das den Menschen von geistiger Tätigkeit, von dem Zwang, Namen und Fakten und komplexe Gedanken und Vorgänge in seinem Gedächtnis zu speichern?
  • Werden wir letztendlich von einem traditionellen und längst überholten (?) Lern- und Forschungsparadigma „für alle Fälle“ (‚just in case’) zu einem Paradigma „just in time“ übergehen?
  • Wird das menschliche Gedächtnis überflüssig, weil man ja – wie Newsweek postuliert – doch alles, was sich zu behalten lohnt, unmittelbar wiederfinden kann (‚immediate retrieval’)?
  • Was hat die menschliche Denkfähigkeit, was die Maschine nicht hat, wenn es um Gedächtnisleistungen geht?
  • Könnte es sein, dass maschinell gespeichertes Wissen beim Lehren und Forschen die Wissensübermittlung und die Erzeugung neuen Wissens eher behindert, und dass wir am Ende weniger wissen als vorher?

Zwei Erkenntnisse vorweg

(was im Folgenden zu erläutern ist)

  • Es bestehen erhebliche Gegensätze zwischen den Prozessen, die heute die Suche in Volltexten ermöglichen, und den subtilen und zuweilen geheimnisvollen kognitiven Prozessen, die dem menschlichen Lernen und logischen Denken zugrunde liegen.
  • Wie alle mächtigen Werkzeuge erfordern auch Volltextsuchen umsichtigen Gebrauch und entheben Geistes- und andere Wissenschaftler keinesfalls der Notwendigkeit, viel zu lesen und tief nachzudenken.

Problem „Begriff-Benennung“

Ein erstes Beispiel Garrets: von Michel Foucault grundlegendem Werk über Bedeutung und Bezeichnung („Die Ordnung der Dinge“) kann man sagen, es ginge die ganze Zeit um die französische Revolution, und dennoch tauchen die Worte „französische Revolution“ nirgendwo auf. Aus einer englischen Übersetzung:

  • The last years of the eighteenth century are broken by a discontinuity similar to that which destroyed Renaissance thought at the beginning of the seventeenth . . . It is a radical event that is distributed across the entire visible surface of knowledge. (Foucault 1994)

Es wird eine Behauptung über die französische Revolution aufgestellt, ohne dass diese Worte vorkommen. Eine Suche mit eben diesen Suchwörtern würde diesen Text nicht als Treffer bringen, obwohl er auf der Trefferliste eigentlich ganz oben stehen müsste. Volltextsuchen basieren ausschließlich auf einer blinden Zählung mechanisch gesammelter Wörter.

Diese Diskrepanz zwischen einem Vokabular, also Sprache als Ansammlung von Stichwörtern, und wahrnehmbaren Phänomenen ist nicht auf die Geisteswissenschaften beschränkt, ein allgemeines Beispiel dafür sind Metaphern.

Metaphern

In seinem Buch „Metaphor and Knowledge: The Challenges of Writing Science“ zeigt Ken Baake (2003), dass Metaphern – die ja ein großes Hindernis für die Volltextsuche sind – nicht nur zur Dekoration dienen, sondern vielmehr ein wichtiger Teil von wissenschaftlichen Beweisführungen sind. Dies greift Argumente der Linguisten George Lakoff and Mark Johnson auf (Metaphors We Live By, 1980), die Metaphern als Schlüssel dafür bezeichnen, wie Menschen mit der Wirklichkeit klarkommen:

"We have found, on the contrary, that ... our ordinary conceptual system, in terms of which we both think and act,
is fundamentally metaphorical in nature". 

Spätestens seitdem gelten in der kognitiven Linguistik Metaphern als Strukturierungen des Denkens. Beispiele: "Drahtzieher"/"Strippenzieher" für "Hintermänner", "Zahn der Zeit" für "Verfall", "Raumpflegerin" für "Putzfrau", "Mitarbeiter freistellen", "rationalisieren" statt „entlassen“.

Bedeutung und Kontext

Die Bedeutung von Wörtern hängt von ihren jeweiligen Kontexten ab, sogar in den Naturwissenschaften (den „exakten“ Wissenschaften). Soziologen und Philosophen bezeichnen dieses Phänomen als „Indexikalität“

indexicality = "… the fact that the meaning of speech and action depends on the ... situation in which it occurs" (Johnson 2000). 

Indexikalität/indexikalisch bezeichnet also die Vorstellung, dass alle Äußerungen nur in ihrem jeweiligen Kontext verstanden werden können und entsprechend alle Wörter eines Textes ihre Bedeutung innerhalb dieses Textes verlieren, wenn sie aus dem Text ausgegliedert werden. Beispiel: die Bedeutung des Wortes "noise" in der Alltagssprache und in der Kommunikationstheorie, wo es ein terminus technicus ist.

Als Folge davon haben Indextermini (Wörter eines Textes, wenn sie in einen Index aufgenommen worden sind) entweder überhaupt keine Bedeutung und sind nur eine Kette von Zeichen, oder sie tragen alle Bedeutungen, die sie jemals in irgendeinem Text getragen haben (was man ihnen natürlich nicht ansieht). So gesehen ist ein Index nur eine Ansammlung von Zeichenketten ohne (erkennbare) Bedeutung. Diese Erkenntnis ist wichtig für Informationssuchende, die sich einer Suchmaschine bedienen: das eingetippte Suchwort ist nur eine Zeichenkette, die Bedeutung des Suchworts existiert (zunächst) nur im Kopf des Suchenden. Und dort muss die Bedeutung des Suchworts für jeden gefundenen Kontext konstruiert werden.

Text als organisches Ganzes

Artikel, Bücher, Texte allgemein sind komplexe Organismen. Sie haben eine gewisse Integrität und innere Kohärenz, die sich nicht unmittelbar auf bestimmte Phänomene oder die reale Welt allgemein zurückführen lassen. Selbst die in ihrer Bedeutung scheinbar vollkommen festgelegten Wörter sind in ihren jeweiligen direkten oder indirekten Umgebungen indexikalisch.

Suchen durch Assoziation: Vannevar Bush

Es ist vielfach davor gewarnt worden, sich auf maschinelle Intelligenz zu verlassen, wenn es um in Texten kodiertes Wissen geht. Einer der ersten Warner war Vannevar Bush, der in seinem berühmten Artikel "As We May Think" anmerkte, die Künstlichkeit von Indexierungssystemen sei Schuld, wenn man bestimmte Einträge in großen Datensammlungen nicht findet. Der Computer sei einfach nicht in der Lage, Dinge zu finden, die nicht Buchstaben für Buchstaben mit der Suchanfrage übereinstimmen. Das menschliche Gehirn suche assoziativ.

Stichwortsuche und das menschliche Gedächtnis

Nach Bush zeichnet sich das menschliche Denken im Vergleich zum Computer durch das Verfolgen assoziativer Spuren aus. Diese Spuren, so Garrett, können zu Gruppen zusammengefasst und durch Metaphern miteinander in Beziehung gesetzt werden und sich zu Schemata und Geschichten entwickeln.

“…the construction of stories by our brain is … the fundamental instrument of thought" (Turner 1996).

Wer also behauptet, die Online-Suche könne das menschliche Gedächtnis ersetzen, lässt all diese Besonderheiten der menschlichen Kognition außer Acht. Wir können keine langen Listen von Stichwörtern in bestimmten Kontexten (keywords in context in KWIC-Indizes) auswendig lernen, aber das Gedächtnis kann fast unbegrenzt Wörter in sinnvollen Kontexten in Form von Geschichten, Lyrik oder Argumentationen aufnehmen. Man kann das Lesen längerer Texte als Mittel des Wissenserwerbs nicht durch Stichwortsuche in großen Textsammlungen ersetzen. Dies würde das menschliche Denken und Lernen nur behindern.

Denken, Vergessen und das Unbewusste

Nach Garrett könnte jetzt die Frage kommen, warum man überhaupt lesen soll, wenn man doch das Meiste wieder vergisst? Die Stichwortsuche könne doch eine Art just-in-time Wissenserwerbstrategie sein, die der traditionellen humanistischen Bildung überlegen sei.

Hier muss zunächst eine andere Frage beantwortet werden: was ist “Vergessen”? Wenn man etwas liest und dann vergisst, ist das Dasselbe, wie “etwas von der Festplatte löschen”? Harald Weinrich argumentiert in seinem Buch “Lethe. Kunst und Kritik des Vergessens”wie folgt dagegen: Zu Beginn der Titel eines Buchs des uruguayischen Schriftstellers Mario Benedetti: El olvido está lleno de memoria: "Vergessen ist voller Erinnerung” (Benedetti 1995). Oder das Gedicht "A Reader" von Jorge Luis Borges mit den folgenden Zeilen:

"Having learned and having forgotten Latin is a possession, 
because forgetting is a form of memory, its broad basement,
the secret other side of the coin". (cf. Weinrich 2004).

Daher können wir uns überhaupt daran erinnern, dass wir etwas vergessen haben, was wiederum eine notwendige Bedingung dafür ist, dass wir in einer Datenbank etwas suchen, was wir einmal wussten. Also ist die Auseinandersetzung mit Texten verbunden mit der Fähigkeit des menschlichen Gehirns zu vergessen die Grundlage für das Information Retrieval und das Lernen allgemein.

Vergessen in der kognitiven Psychologie

Garrett schreibt weiter, dass natürlich auch in der kognitiven Psychologie gefragt wird, wie sich das Vergessen vom Löschen einer Festplattendatei unterscheidet, oder von dem Zustand, nie den betreffenden Text gelesen zu haben. Borowicz (2001) schreibt:

"[t]he conventional wisdom in cognitive science is that at least 95 percent of all thought is unconscious".

Nach Lakoff und Johnson (1999) sei es so, dass

"… 95 percent below the surface of conscious awareness shapes and structures all conscious thought.
If the cognitive unconscious were not there doing this shaping, there would be no conscious thought"

Garrett schließt daraus, dass das, was wir vergessen, nicht wirklich aus dem Gedächtnis gelöscht wird, sondern Teil des Unterbewusstseins wird. Es ist sicher keine 1:1-Kopie dessen, was wir einmal gelernt / gewusst haben, aber es kann durch Nachdenken wieder aktiv / bewusst werden.

Lernen durch Wiedererinnerung

In dem Dialog “Menon” entwickelt Plato das Konzept der Anamnese (Wiedererinnerung) als Quelle des Lernens. Er schreibt das Wissen um wichtige Prinzipien einem angeborenen Verstehen zu, das von einem Lehrer nur an die Oberfläche geholt werden muss. Lernen ist demnach nichts anders als Erinnern. Die Kognitionswissenschaft bestätigt, dass Lernen oft vor dem Hintergrund des Unterbewussten stattfindet. Wie oft sind wir überrascht darüber, dass wir etwas schon wissen, von dem wir glaubten, dass wir es zum ersten Mal hören! Aber ohne die Mühsal einer ausgedehnten Textlektüre ist eine spätere anamnetische Wiedererinnerung nicht möglich.

Und so wäre das menschliche Gedächtnis ohne das Lesen ganzer Werke letzten Endes nur ein einziger Müllhaufen, wie bei Funes, der literarischen Figur Jorge Luis Borges’, der nie ein Detail vergaß, von dem er Kenntnis bekam. Allein, er war nicht in der Lage, die Details miteinander zu verknüpfen, sodass sein Gedächtnis nach eigenem Bekunden “wie ein Müllhaufen” war.

Wege durch den Wissensdschungel

Garrett sieht die Bibliothekare als Pfadfinder - also als Vermittler, Katalogisierer und Interpretierer - durch die „enormous mass of the common record“ (Vannevar Bush 1945), also die heute so genannte Wissensflut. Ohne Volltextsuche in großen Wissenssammlungen kann wissenschaftliches Arbeiten sicher nicht auskommen, aber es geht auch nicht ohne eine „Humanisierung“ des Computers, seinen Einsatz zu menschlichen Bedingungen, und die menschliche Kognition. Eine Reduzierung des Wissenserwerbs auf eine Stichwortsuche macht keinen Sinn.


Garretts Artikel basiert auf einem Vortrag im Programm "Old Texts Made New: EEBO, ECCO, and the Impact on Literary Scholarship,"
der „Literatures in English Section (LES)“ der „Association of College and Research Libraries“ in Chicago am 25. Juni 2005.
Jeffrey Garrett, Northwestern University Library, 1970 Campus Drive, Evanston, Illinois 60208;
Telephone 847-467-5675; Fax 847-467-7899; E-mail jgarrett@northwestern.edu.

Literatur

  • Baake, Ken. 2003. Metaphor and Knowledge: The Challenges of Writing Science, Studies in Scientific and Technical Communication. Albany: State University of New York Press.
  • Baker, Nicholson. 1997. Lumber. In The Size of Thoughts. New York: Vintage.
  • Benedetti, Mario. 1995. El olvido está lleno de memoria. Montevideo, Uruguay: Cal y Canto.
  • Borges, Jorge Luis. 1964a. Funes, the Memorious. In: Labyrinths. Selected Stories and Other Writings, edited by D. A. Yates and J. E. Irby. New York: New Directions.
  • ------. 1964b. The Library of Babel. In Labyrinths: Selected Stories and Other Writings, edited by D. A. Yates and J. E. Irby. New York: New Directions.
  • ------. 1964c. Tlön, Uqbar, Orbis Tertius. In Labyrinths. Selected Stories and Other Writings, edited by D. A. Yates and J. E. Irby. New York: New Directions.
  • ------. 1977. Un lector. In Obra poética. Buenos Aires: Edición Emecé Editores.
  • Borowicz, Jon. 2001. The Body of a Philosopher: Embodied Thought as Physical and Social Activity. In Sagesse du Corps: Actes du colloque interdisciplinaire organisé au Collège domi-nicain de philosophie et de théologie à Ottawa les 29 et 30 septembre 2000, edited by G. Csepregi. Aylmer (Québec): Éditions du scribe.
  • Bullokar, John. 1616. An English expositor teaching the interpretation of the hardest words vsed in our language. With sundry explications, descriptions, and discourses. By I.B. Doctor of Phisicke. London Printed by Iohn Legatt.
  • Bush, Vannevar. 1945. As We May Think. Atlantic Monthly, Juli 1945: 101-108.
  • De Rosa, Cathy, Lorcan Dempsey, and Alane Wilson. 2004. The 2003 OCLC Environmental Scan: Pattern Recognition: A Report to the OCLC Membership. Dublin, Ohio: OCLC.
  • Fast, Karl V., and D. Grant Campbell. 2004. 'I Still Prefer Google': University Student Per-ceptions of Searching OPACs and the Web. In ASIST 2004 Annual Meeting, "Managing and Enhancing Information: Cultures and Conflicts." Providence, Rhode Island: American Society for Information Science and Technology.
  • Foucault, Michel. 1994. The Order of Things. Translated by A. Sheridan. New York: Vintage.
  • Friedell, Deborah. 2005. The Word Crunchers. New York Times, June 5, 47.
  • Garrett, Jeffrey. 1999. Redefining Order in the German Library, 1775-1825. Eighteenth-Century Studies 33 (1 (Fall)):103-23.
  • ------. 2004. The Legacy of the Baroque in Virtual Representations of Library Space. Library Quarterly 74 (1):42-62.
  • Gross, Tina, and Arlene G. Taylor. 2005. What Have We Got to Lose? The Effect of Control-led Vocabulary on Keyword Searching Results. College & Research Libraries 66 (3):212-230.
  • Hargrave, Frank. 2001. Noise. In Hargrave's Communications Dictionary: Wiley.
  • Johnson, Allan G. 2000. The Blackwell Dictionary of Sociology: A User's Guide to Sociolo-gical Language. Malden, Mass.: Blackwell Publishers.
  • Knapp, Jeffrey. 2002. Shakespeare's Tribe: Church, Nation, and Theater in Renaissance Eng-land. Chicago: University of Chicago Press.
  • Lakoff, George, and Mark Johnson. 1980. Metaphors We Live By. Chicago: University of Chicago Press.
  • ------. 1999. Philosophy in the Flesh. New York: Basic Books.
  • Levy, Steven. 2004. Google's Two Revolutions. Newsweek, December 27, 70.
  • Marcum, Deanna B. 2005. The Future of Cataloging: Address to the Ebsco Leadership Semi-nar. In ALA Midwinter Meeting. Boston, Mass.
  • Markoff, John, and Edward Wyatt. 2004. Google Is Adding Major Libraries to Its Database. New York Times, December 14, 1.
  • Norman, Donald A. 1993. Things That Make Us Smart: Defending Human Attributes in the Age of the Machine. Reading, Mass.: Addison-Wesley.
  • Nunberg, Geoffrey. 2005. Teaching Students to Swim in the Online Sea. New York Times, February 13, 4.
  • Saenger, Paul Henry. 1997. Space Between Words: The Origins of Silent Reading, Figurae. Stanford, Calif.: Stanford University Press.
  • Schmitt, Rudolf. 2001. Metaphern in der Psychologie - eine Skizze. In: Journal für Psycholo-gie, Heft 4, Jahrgang 9, Dezember 2001, S. 3 - 15 http://www.hs-zigr.de/~schmitt/aufsatz/editoria.htm
  • Schmundt, Hilmar. 2002. Hightechmärchen: die schönsten Mythen aus dem Morgen-Land. Berlin: Argon.
  • Schwartz, Hillel. 1996. The Culture of the Copy: Striking Likenesses, Unreasonable Facsimi-les. New York: Zone Books.
  • Spence, Jonathan D. 1985. The Memory Palace of Matteo Ricci. New York, London: Pengu-in.
  • Turner, Mark. 1996. The Literary Mind. New York: Oxford University Press.
  • Wegmann, Nikolaus. 2000. Bücherlabyrinthe: Suchen und Finden im alexandrinischen Zeital-ter. Köln: Böhlau.
  • Weinrich, Harald. 2004. Lethe: The Art and Critique of Forgetting. Translated by S. Rendall. Ithaca: Cornell University Press.
  • Wittgenstein, Ludwig. 1974. Tractatus logico-philosophicus. 1st pbk. ed. London: Routledge and Kegan Paul.
  • Yates, Frances Amelia. 1992. The Art of Memory. London: Pimlico.