Lexikalische Analyse und Stoplisten
Ein Vortrag von Frank Kleine im Rahmen des Proseminars "Information Retrieval" WS 1999/2000, Otto-von-Guericke-Universität Magdeburg Dienstag, 16. November 1999
Sie befinden sich hier: >Vortrag >2.3 Die Kosten lexikalischer Analyse
2.3 Die Kosten lexikalischer Analyse:
Die lexikalische Analyse ist teuer, weil jedes Eingabezeichen überprüft werden muss, während die weitere Verarbeitung dies nicht benötigt. Bisher gibt es keine Studien zur lexikalischen Analyse in IR-Systemen (vielleicht mal was für's Praktikum ;), es wird geschätzt, dass ca. 50% der Resourcen dafür draufgehen, weshalb es auch so wichtig ist, den Vorgang der lexikalischen Analyse so effizient wie nur irgendwie möglich zu gestalten.
|