114
Title / Titel: | Lexis-Nexis' Freestyle. Natürlichsprachige Suche - More like this! |
---|---|
Author / Autor: | Wolfgang G. Stock |
Source / Quelle: | Password Nr. 11 (1998), 21-28 |
Language / Sprache: | German / Deutsch |
Lexis-Nexis' Freestyle. Natürlichsprachige Suche - More like this!
Insbesondere durch die Suchmaschinen im Internet wurde die Aufmerksamkeit der Information Professionals auf Retrievalmöglichkeiten jenseits der Booleschen Operatoren gelenkt. Auch die kommerziellen Online-Archive entwickelten in den letzten Jahren natürlichsprachige Suchoptionen. Lexis-Nexis erhielt im Laufe des Jahres 1998 zwei Patente für Module automatischer Indexierung erteilt.
Mit natürlichsprachigen Suchen ist gemeint, daß Suchfragen durch die Angabe von Suchwörtern oder durch ganze Sätze ausgedrückt werden, ohne daß irgendwelche Operatoren zu benutzen wären. Das Suchergebnis ist eine nach Wichtigkeit geordnete Liste von Treffern. Der zur Suchfrage bestpassende Datensatz steht oben, der zweitbeste folgt usw. Zwei Ziele werden mit natürlichsprachigen Suchen verfolgt. Zum einen spricht die einfache Suche Endnutzer an, die ohne Kenntnis von mengentheoretischen Operatoren, Abstandsoperatoren, Klammerung und weiteren für sie kryptischen Befehlen nunmehr zu ansprechenden Suchergebnissen kommen. Zum anderen ist dieser Retrievalmodus an den professionellen Rechercheur gerichtet. Im Booleschen Retrieval zeigte sich nämlich seit langem, daß ein Recall von 100% und Präzision von ebenfalls 100% bei Literaturinformationen unmöglich zu erreichen sind. Eine Steigerung des Recall führt - im theoretischen Modell - zu einer Verringerung der Präzision und umgekehrt. Die erhoffte Summe aus Recall und Präzision erreicht auf keinem Fall die idealen 200, sondern in aller Regel gerademal die Hälfte.
Natürlichsprachiges Retrieval soll diesen Mißstand lindern.
In der kommerziellen Informationswirtschaft setzen derzeit bereits einige Hosts auf natürlichsprachiges Retrieval. Zu erinnern ist an DIALOG mit Target, Westlaw mit WIN ("Westlaw is Natural") und Lexis-Nexis mit Freestyle. Mit Freestyle wollen wir uns hier exemplarisch befassen. Kann ein Endnutzer damit nutzbringend umgehen? Was bringt Freestyle dem Information Professional? Wird die Recall-Präzision-Begrenzung wirklich angehoben? Konkret: Bekommen wir mehr relevante Datensätze als beim Booleschen Retrieval? Und: Wird die Nachweismenge präziser, d.h. ärmer an Ballast?
Wolfgang G. Stock
Institut für Sprache und Information
Abt. Informationswissenschaft
Heinrich-Heine-Universität Düsseldorf
Universitätsstr. 1
D - 40225 Düsseldorf
E-Mail:
Wolfgang G. Stock: