|
Engl., in etwa schwammig oder ungenau. Suchmaschinen,
die eine Fuzzy Suche bieten, vergleichen Suchbegriffe und in Dokumenten
enthaltene Wörter nicht buchstabengenau, sondern erlauben gewisse
Abweichungen.
Meist werden dabei Verdreher von 2 Zeichen und
ausgelassene oder hinzugefügte Buchstaben stillschweigend als
Übereinstimmung betrachtet.
Bei der Verarbeitung englischsprachiger Dokumente
hat sich die Reduzierung der Wörter auf eine phonetische Schreibweise
bewährt. Hierbei werden nur noch Laute, nicht aber direkte
Buchstabenfolgen verglichen. Experimente mit anderen Sprachen waren
weniger erfolgreich.
Im Deutschen kann man die Aussprache eines Wortes
in vielen Fällen nicht der Zeichenfolge ablesen, wenn man nur
einzelne Silben berücksichtigt, da die Position einer Zeichenfolge
innerhalb eines Wortes genauso wie die ersten Zeichen der folgenden
Silbe die Aussprache und damit die phonetische Codierung beeinflussen
kann.
Eine Mischform, die sich in der Praxis bewährt,
ist die Reduzierung eines Begriffes auf den Wortstamm vor der eigentlichen
Fuzzy Suche (Stemming).
|