205
| Title / Titel: | Information Retrieval. Informationen suchen und finden | 
|---|---|
| Author / Autor: | Wolfgang G. Stock | 
| Source / Quelle: | Oldenbourg Wissenschaftsverlag, München, Wien, 2007, pp. 599 | 
| Language / Sprache: | German / Deutsch | 
Information Retrieval. Informationen suchen und finden
Information Retrieval
Grundlagen der Informationswissenschaft
1 Ziel der Buchreihe
Lehrbücher  zur Informationswissenschaft - Information Retrieval im Kontext der  Informationswissenschaft - Zielgruppen - Danksagung 
2 Informationswissenschaft
Was  ist Informationswissenschaft? Eine plakative Annäherung -  Informationswissenschaft im Kontext: Die Nachbardisziplinen - Geschichte  der Informationswissenschaft in fünf Teilen - Einsatzbereiche:  Internetwirtschaft und betriebliche Informationswirtschaft -  Informationswissenschaftliche Zeitschriften und Datenbanken - Fazit 
3 Information und Wissen
Signal,  Daten, Wissen, Information - Information als in Bewegung gesetztes  Wissen - "Wissen ist Macht" - Information als Wirtschaftsgut - Fazit 
Propädeutik des Information Retrieval
4 Geschichte des Information Retrieval
Vom  Memex über den Sputnik-Schock zum Weinberg-Report - Frühe kommerzielle  Informationsdienste: DIALOG, SDC Orbit und Lexis-Nexis - Das World Wide  Web und seine Suchwerkzeuge - Fazit 
5 Grundbegriffe des Information Retrieval
Konkreter  und problemorientierter Informationsbedarf - Zusammenspiel von  Information Indexing und Information Retrieval - Dokumentarische  Bezugseinheit und Dokumentationseinheit - Kognitive Modelle - Pull- und  Pushdienste - Informationsbarrieren - Recall und Precision - Fazit 
6 Relevanz und Pertinenz
Relevanz,  Pertinenz, Nützlichkeit - Aspekte der Relevanz - Relevant oder nicht  relevant: Der binäre Ansatz - Relevanzverteilung von Dokumenten zu einem  Thema - Relevanzverteilungen - Fazit 
7 Dokumente
Was ist  ein Dokument? - Formal publizierte Textdokumente - Informell publizierte  Texte - Nicht publizierte Texte - Nicht-textuelle Dokumente - Fazit 
8 Typologie von Retrievalsystemen
Schwach  strukturierte Texte - Retrievalsysteme und terminologische Kontrolle -  Informationslinguistische Textbearbeitung - Retrievalmodelle -  Oberflächenweb und Deep Web - Fazit 
9 Architektur eines Retrievalsystems 
Informatik  der Retrievalsysteme - Zeichensätze - Aufnahme neuer Dokumente in die  Datenbasis - Thematische Crawler - Crawling des Deep Web - Vermeidung  von Spam - Erkennung von Dubletten bzw. "Spiegeln" - Aktualisierung der  Dokumentationseinheiten - Speicherung und Indexierung - Invertierte  Dateien - Trees und Tries - Fazit 
Boolesche Retrievalsysteme
10 Boolesches Retrieval 
George  Booles "Denkgesetze" - Die "atomaren" Suchargumente - Boolesche  Operatoren - Abstandsoperatoren - Algebraische Operatoren -  Häufigkeitsoperator - Menüführung und Befehlsführung -  Informationsprofile und Selective Dissemination of Information -  Recherchestrategien - Vor- und Nachteile Boolescher Systeme - Fazit 
11 Informetrische Analysen
Online-Informetrie  - Auswahl der Dokumentenmenge - Rangordnungen - Informetrische  Zeitreihen - Semantische Netze - Informationsflussanalysen - Fazit 
12 Erweitertes Boolesches Retrieval
Boolesche  Anfragen und Gewichtung - Der "Wunschzettel" von Cater, Kraft und  Waller - Fuzzy Boolesches Retrieval - Ein unscharfer Funktor: UNDODER -  Ähnlichkeiten und die p-Norm - Die Negation im erweiterten Booleschen  Modell - Vor- und Nachteile erweiterter Boolescher Systeme - Fazit 
Informationslinguistik - Natural Language Processing
13 n-Gramme
Worte  oder Zeichenfolgen? - Henrichs' Pentagramm-Register - ACQUAINTANCE:  n-Gramme im Vektorraum - HAIRCUT: n-Gramme probabilistisch bearbeitet -  Abhängigkeiten innerhalb der Zeichenfolgen - Vor- und Nachteile  n-Gramm-basierter Retrievalsysteme - Fazit 
14 Worte
Schriftsystemerkennung  - Spracherkennung - Stoppwortlisten - "Verschmelzung" von Wortformen  (Conflation) - Grundformbildung (Lemmatisierung) - Wortstammbildung  (Stemming) - Wortbearbeitung bei Handy-Tastaturen - Fazit 
15 Phrasen, Eigennamen, Komposita 
Zusammengesetzte  Ausdrücke - Phrasenbildung - Eigennamenerkennung - Die  Personennamendatei - Namensidentifikation - Kompositazerlegung - Fazit 
16 Begriffe
Semantische  Felder - Synsets und Deskriptoren als kleinste semantische Einheiten -  Die Wort-Begriff-Matrix - Relationen in WordNet - Kalibrierung von  Synsets - Relationen im Standard-Thesaurus Wirtschaft - Semantische  Ähnlichkeit - Disambiguierung homonymer Worte - Fazit 
17 Anaphora
Referenzausdrücke  - Anaphora und Ellipsen beim Einsatz von Abstandsoperatoren - Anaphora  und Ellipsen in der Textstatistik (298) - Anaphoraauflösung - Fazit 
18 Fehlertolerantes Retrieval
Eingabefehler  - Phonetische Ansätze: Soundex und Phonix - Die Damerau-Methode -  Eingabefehlererkennung und -korrektur durch n-Gramme - Fazit 
Klassische Retrievalmodelle
19 Textstatistik
Die  These von Luhn: Termhäufigkeit als Signifikanzfaktor - Termgewichtungen  - Dokumentspezifische Termgewichtung (TF / WDF) - Feldoder  positionsspezifische Termgewichtung - Termgewichtung nach inverser  Dokumenthäufigkeit (IDF) - TF*IDF - Textstatistik im praktischen  Einsatz: Freestyle - Fazit 
20 Vektorraummodell
Dokumente  im n-dimensionalen Raum - Clusterung von Dokumenten mittels  Zentroidbestimmung - Relevance Feedback - SMART - Termunabhängigkeit -  Latent Semantic Indexing - Vor- und Nachteile des Vektorraummodells -  Fazit 
21 Probabilistisches Modell
Die bedingte  Relevanzwahrscheinlichkeit eines Dokuments unter einer Anfrage -  Suchtermgewinnung und -gewichtung durch Musterdokumente -  Pseudo-Relevance-Feedback - P(D) im Intervall [0,1] - Statistische  Sprachmodelle - Vor- und Nachteile des probabilistischen Modells - Fazit  
Web Information Retrieval
22 Linktopologie
Web Information Retrieval - Links und Zitationen - Kleinberg-Algorithmus - PageRank - Re-Ranking - Fazit 
23 Strukturinformationen in Dokumenten 
Metadaten: Informationen über Dokumente - Strukturinformationen in Dokumenten - Anker - Pfadlänge - Aktualität - Fazit 
24 Nutzer und Nutzung 
Simulation  von Auskunftsinterviews - Typen von Webanfragen - Personalisiertes  Retrieval - Nutzungsstatistiken als Rankingkriterium - Ranking nach  Sprache - Ranking nach Entfernung: geographisches Information Retrieval  (GIR) - Ranking nach Gebot: Sponsored Links - Fazit 
25 Themenentdeckung und -verfolgung 
Identifizieren und Verfolgen aktueller Ereignisse - Themenentdeckung - Themenverfolgung - Anfragefreie Nachrichtensuche - Fazit 
Spezialprobleme des Information Retrieval
26 Soziale Netzwerke und "small worlds" 
Intertextualität  und Netzwerke - Zentralität eines Akteurs - "degree" von Autoren -  Trennpunkte und Brücken - "small world"-Netzwerke - Fazit 
27 Kontrolliertes Vokabular 
Paradigmatische  und syntagmatische Relationen - Gewichtungsberechnung bei syntaktischer  Indexierung - Einstellbare syntagmatische Netze - Dynamische  Klassierung - Fazit 
28 Sprachübergreifendes Retrieval 
Übersetzung  von Anfragen, von Texten oder gar keine Übersetzung? - Maschinenlesbare  Wörterbücher - Fachthesauri im CLIR - Korpusbasierte Methoden - Fazit 
29 Anfragedialog 
Anfragemodifikationen  - Intellektuelle Suchanfragemodifikation - Automatische  Suchanfrageerweiterung - Relevance Feedback als Anfragemodifikation -  Vorschlag neuer Suchargumente - Ähnliche Dokumente: More like this! -  Vorschlagssysteme - Fazit 
30 Retrieval von Textstellen 
Recherche  nach Absätzen und Textausschnitten - Ranking von Dokumenten nach den  jeweils bestpassenden Stellen - Ranking von Textstellen innerhalb eines  Dokuments - Frage-Antwort-Systeme - Faktendatenbanken - Fazit 
31 Bild- und Tonretrieval 
Multimedia  Retrieval - Dimensionen des Bildretrieval - Anwendungsfälle von  Bildretrieval - Videoretrieval - Gesprochene Suchanfragen - Gesprochene  Dokumente - Dimensionen des Musikretrieval (MIR) - Musikretrieval  mittels Musterdokument - Gesungene, gepfiffene und gesummte Suchanfragen  - Fazit 
32 Ausblick 
Die Literatur zum Information  Retrieval - Kombiniertes Information Retrieval - Wissensrepräsentation -  Empirische Informationswissenschaft - Angewandte  Informationswissenschaft - Information Retrieval: Informatik und  Informationswissenschaft - Fazit 
Glossar 
Register 
Namensregister - Sachregister