Lexikalische Analyse und Stoplisten

Ein Vortrag von Frank Kleine
im Rahmen des Proseminars "Information Retrieval"
WS 1999/2000, Otto-von-Guericke-Universität Magdeburg
Dienstag, 16. November 1999

 

 Sie befinden sich hier: >Vortrag >4. Zusammenfassung

 

 4. Zusammenfassung:

Die lexikalische Analyse muss sowohl während des automatischen Indizierens als auch während der Eingabeverarbeitung erfolgen. Wichtige Entscheidungen über die lexikalische Form der Index- und Suchterme und über Suchoperatoren müssen in der Designphase auf Grund der Anforderungen an das Zielsystem getroffen werden. Ist dies erst einmal erledigt, ist es relativ leicht, das System zu erstellen. Systeme zur lexikalischen Analyse auf Basis endlicher Automaten sind einfach und schnell von Hand oder mit Hilfe eines Generators zu erstellen.

Demnach sieht der Vorgang der lexikalischen Analyse, empfohlen nach den bisher getroffenen Aussagen, folgendermassen aus:

  1. Zerlegung des Textes in einzelner Wörter
  2. Worterkennung
  3. Stopworteliminierung
  4. Weitergabe des Wortes an den sich anschliessenden Prozess

Der sich anschliessende Prozess ist nun nicht mehr zu diesem Thema zugehörig, weshalb ich an dieser Stelle meine Erläuterungen abbrechen möchte und auf den Vortrag nächste Woche verweise.

 

Zurück. Home. Vorwärts.

 

Letzte Änderung am 16. November 1999. Nach oben fk@sirmikey.de © 1999 Frank Kleine