Mittwald Webhosting

Technologie Latent Semantic Indexing

Mittwald Webhosting

Die Semantik, die durch LSI ermittelt wird, wird in einer Matrix errechnet und dargestellt, die in diesem Fall Semantischer Raum genannt wird. Eine Matrix ist eine Tabelle, in die bei LSI die semantischen Zusammenhänge mehrdimensional eingetragen werden. Neu hinzukommende Inhalte müssen mit aufgenommen werden, was ständig neue Berechnungen erfordert. Beim Verfahren des LSI werden die Dimensionen einer Matrix reduziert, da semantisch zusammenhängende Inhalte zusammengefasst und kategorisiert werden. Durch die reduzierte Matrix werden die Berechnungen vereinfacht. Die Frage ist, in wie weit man die Dimensionen reduzieren soll.

Durch LSI können Synonyme sehr gut erkannt und in den Suchergebnissen wiedergespiegelt werden. Ein Problem hat das Verfahren noch teilweise mit Polysemen. Polyseme sind Wörter, die mehrere Bedeutungen haben, wie beispielsweise das Wort „Bank“ (Geldinstitut oder Sitzgelegenheit). Die Technologie des LSI muss hier noch verbessert werden.

Zurück zu: Latent Semantic Indexing

SERPWatcher - Stop wasting time with conventional rank trackers