TYPO/N

Wählt Dokumente aus, die das angegebene Wort und diesem Wort ähnliche Wörter enthalten. Der Operator TYPO/N führt einen Mustervergleich durch, um ähnliche Wörter zu erkennen. Man kann ihn daher gut in Umgebungen einsetzen, in denen Dokumente mit einem Scanner unter Einsatz optischer Zeichenerkennung (OCR, engl. "Optical Character Recognition") eingelesen wurden.

Die optionale Variable N im Operatornamen drückt die maximal zulässige Anzahl der Unterschiede zwischen dem Suchbegriff und den Wörtern aus, mit denen er verglichen wird (Fehlerabstand). Wenn N nicht angegeben wird, so wird als Fehlerabstand 2 angenommen.

Die Anzahl der Unterschiede zwischen zwei Wörtern beruht auf der Berechnung von Fehlern, wobei es als Fehler gilt, wenn ein Zeichen entfallen ist, eingefügt oder durch ein anderes ersetzt wurde (Transposition). In den folgenden Beispielen stimmt jeweils das zweite mit dem ersten Wort bei einem Fehlerabstand von 1 überein:

Maus, Haus (M  H)
feilen, eilen (f ist entfallen)
Tor, Thor (h wurde eingefügt)

Auf die folgende Anfrage passen Dokumente mit den Wörtern "schaufeln" und "schummeln", weil es drei Transpositionen im zweiten Wort gibt (a → u, u → m, f → m).

<#TYPO/3> schaufeln

Die beiden unten aufgeführten Anfragen haben das gleiche Ergebnis. Dokumente, die die Wörter "Geiger" und "Tiger" enthalten, werden durch diese Anfragen gefunden, weil in "Tiger" gegenüber "Geiger" ein Zeichen entfallen ist und eines durch ein anderes ersetzt wurde.

<#TYPO/2> Geiger
<#TYPO> Geiger

Der Operator TYPO/N muss die Wörterliste der Collection absuchen, um Wörter zu finden, die auf die Anfrage passen könnten. Er sollte daher nicht bei großen Collections (mehr als 100.000 Dokumente) oder in performanzkritischen Umgebungen verwendet werden, es sei denn, eine übergreifende Wörterliste wurde erzeugt. Eine solche übergreifende Wörterliste für die zu verwendende Collection kann die Performanz verbessern.

Bitte beachten Sie die folgenden Einschränkungen: Ein Begriff, nach dem mit TYPO/N gesucht wird, darf höchstens 32 Zeichen lang sein. Ferner wird TYPO/N bei Multibyte-Zeichensätzen nicht unterstützt.