WDF*P*IDFWer einen Text im Internet veröffentlicht, möchte, dass dieser unter einem bestimmten Schlüsselwort möglichst weit vorne in den Suchmaschinen platziert wird. Hierbei kann eine Online-Marketing Agentur dank ihrer Erfahrung und spezieller Tools wertvolle Unterstützung leisten. Eine Zeitlang schien es, als genügte es für die Suchmaschinenoptimierung, das richtige Schlüsselwort = Keyword oft genug zu nennen und ein paar Füllwörter darüber zu streuen. Doch für Menschen gut lesbare Texte sehen anders aus. Ein Trend, der seit letztem Jahr in der Szene heiß diskutiert wird, ist die Formel „WDF*P*IDF“. Dabei ist diese aus dem Information Retrieval bereits seit den 70er Jahren bekannt.

Damit eine Webseite von den Suchmaschinen ein Top-Ranking zugesprochen bekommt, muss sie eine Lösung für die gestellte Frage bieten und somit Zufriedenheit beim Suchenden erreichen. Statt nur die Keyworddichte zu messen, sind bei WDF*P*IDF mehrere Faktoren wichtig: Die Thematik der gesamten Seite wird von Google bewertet. Alle Keywords werden mit dem Rest der Seite verglichen: Passt alles zusammen und ergibt somit einen Sinn? Auch die „Umwelt“ wird durch den Term „IDF“ in die Betrachtung miteinbezogen.

Die „DNA“ eines Textes berechnen

WDF ist die Abkürzung für Within-document Frequency, zu deutsch: die dokumentspezifische Gewichtung. Das heißt, es beschreibt, wie oft ein Wort i im Verhältnis in einem Dokument j vorkommt. Je häufiger das entsprechende Wort oder die Wortkombination auftaucht, umso größer ist der WDF-Wert.

Die ganze Formel lautet: WDF(i) = \frac{\log_2(\mathrm{Freq}(i,j)+1)}{\log_2(L)}

i ist das gesuchte Wort
j ist das Dokument, in dem das Wort steht
L ist die Gesamtzahl der Wörter in diesem Dokument j
Freq(i,j) beschreibt die Häufigkeit des Wortes i im Dokument j

Die Häufigkeit des Keywords wird hier durch den Logarithmus „gestaucht“, man erreicht nun einmal keine größere Relevanz des Textes, indem man ein Wort zum Beispiel noch fünf weitere Male verwendet. Dieser Wert lässt sich in einem Dokument für jedes sinntragende Wort errechnen. Sogenannte Stoppwörter („und“, „oder“, „der“), die lediglich der besseren Lesbarkeit dienen, werden dabei nicht berücksichtigt. Somit erhält man eine Kurve, welche das Ranking der verwendeten Worte in diesem Dokument beschreibt, quasi die DNA eines Dokumentes.

IDF ist die Abkürzung für Inverse Document Frequency, zu deutsch: die Inverse Dokumenthäufigkeit. Hier wird die gesamte Anzahl von Dokumenten (ND) in Beziehung gesetzt zur Zahl der Dokumente (f), die das entsprechende Wort oder die Wortkombination (t) enthalten. Je größer die errechnete Zahl ist, umso weniger Dokumente gibt es, in denen dieses Wort beziehungsweise die Wortkombination vorkommt.

Hier lautet die Formel: IDF_{t}=\log\left(1+\frac{N_D}{f_t}\right)

Wenn also das Schlüsselwort beziehungsweise die gesamte Kombination relativ oft im Text vorkommt und es mit diesem Keyword nur wenige andere Texte gibt, dann ist das Produkt aus den beiden Werten rechnerisch am besten. Der Faktor P ist lediglich ein mathematischer Korrekturfaktor. Bei manchen Begriffen tauchen auf den vorderen Plätzen in den Suchmaschinen inzwischen relativ lange Texte mit über 3.000 Wörtern auf. Wenn man die Texte analysiert, die weit vorne gelistet wurden, hat man eine gute Verteilung von SEO relevanten Keywords – und kann seinen eigenen SEO-Text daran ausrichten. Hilfreich sind in diesem Zusammenhang Tools, die den WDF/IDF-Wert für jedes Wort eines Dokuments errechnen und die Ergebnisse grafisch aufbereiten.

Das neue Onpage.org-Tool von Marcus Tandler bietet beispielsweise eine WDF/IDF-Analyse in seiner neuen Suite an. Das Tool Seolyze.com ist sogar ausschließlich auf die Textoptimierung mittels der neuen Formel ausgerichtet. Und auch XOVI bietet seit neuestem eine entsprechende Funktionalität in seinem Tool an. Anhand der Resultate lässt sich dann u. a. ersehen, welche Wörter vom Wettbewerb verwendet werden, die man noch nicht auf dem Zettel hatte. Oder es ergeben sich Keywords, die im Schnitt zu häufig in einem Text vorkommen und so fatale Spam-Signale an die Suchmaschinen aussenden.

Sind mit WDF*P*IDF alle Rankingprobleme gelöst?

Aber der goldene Gral der Suchmaschinenoptimierung ist auch diese Formel nicht: Sie ist bei längeren Texten sinnvoller, als bei kurzen Shoptexten. Bei wettbewerbsstarken Begriffen ist ihre Anwendung wirtschaftlicher als bei weniger umkämpften Keywords. Außerdem werden in dieser Formel einige Faktoren, wie zum Beispiel Worte von privilegierten Seiten wie Wikipedia oder Amazon, noch nicht berücksichtigt. Wer bisher schon Synonyme und themenverwandte Begriffe in seinen Texten verwendet hat, hat intuitiv auch ohne Kenntnis von WDF/IDF in Sachen Suchmaschinenoptimierung der eigenen Text schon einiges richtig gemacht. Nicht zuletzt muss betont werden, dass eine inhaltliche Optimierung nach einer Formel letztlich nur einen Rankingfaktor von vielen darstellt.

Um einen idealen SEO-Content zu schreiben, der dazu noch von Menschen mit Vergnügen gelesen wird und Neuigkeiten bietet, muss man ein glückliches Händchen für SEO genauso wie für Sprache haben. Dann wird sich die Suchmaschinenoptimierung auch im eigenen Projekt positiv auswirken – im Zweifel auch ohne Formel.

Gastautor: David von Ostrowski ist Junior SEO Manager bei der Online Solutions Group in München