Stemming

Die Bildung von Wortstämmen wird als Stemming bezeichnet, einem Begriff aus der Linguistik. Diese Methode hilft bei der Reduzierung von Wörtern auf ihren Stamm. Das ist die Hoffnung, dass bei den Suchmaschinen bessere und relevantere Suchergebnisse zustande kommen. Dadurch wird die Anzahl der Suchergebnisse gesteigert. Wird z. B. das zusammengesetzte Wort Suchmaschinenoptimierung gesucht, sind Wörter wie Optimierung, optimieren oder gar Suchmaschine in der SERP aufgelistet. Das Stemming wird von Google seit 2004 im deutschsprachigen Bereich erfolgreich eingesetzt. Die verschiedenen Algorithmen zu programmieren, damit diese Suchfunktionen geboten werden können, ist eine sehr schwierige Aufgabe, weil die Programmierung für die verschiedenen Sprachen anders geschrieben werden muss oder gar ganz neu. Die Testphase unter Hilfe der Textkorpora und den praktischen Anwendungen dauert lange. Diese Phase ist aber notwendig, um sicher zu sein, dass der Algorithmus auch zu hundert Prozent funktionsfähig ist. Der Porter-Stemmer-Algorithmus ist eines der bekanntesten Verfahren. Haben Suchmaschinen kein integriertes Stemming, nehmen sie die Hilfe von Trunkierung in Anspruch, dabei gestaltet sich die Suche nach Zeichenketten, die mit Sternchen abgekürzt werden.