Grundsätzliche Überlegungen
Neben der möglichst lesbaren Darstellung eines Texts ist es ein Service für den Leser, weiterführende Links passend zum Thema des aktuell angezeigten Artikels anzubieten. Eine Möglichkeit diesen Mehrwert zu schaffen ist, eine Liste inhaltlich verwandter Texte der gleichen Quelle anzuzeigen. Die Schwierigkeit hierbei liegt in der Definition, wann zwei Texte als verwandt gelten können und wie eng deren Verwandtschaftsgrad ist.
Für einen beschränkten Kreis an Texten kann die Zuordnung manuell durchgeführt werden: Beim Anlegen eines neuen Texts trifft der Autor eine Auswahl an bereits vorhandenen Texten, die aus seiner Sicht für den Leser interessant sein könnten. Mit steigender Zahl der Texte steigt jedoch auch die Gefahr, einen Texte zu übersehen und ein zu einem späteren Zeitpunkt erstellter Texte wird in der Liste niemals auftauchen - außer die Zuordnungen werden immer wieder aufs Neue kontrolliert und gepflegt.
Während ein Mensch nach kurzem Überfliegen meist problemlos den Verwandtschaftsgrad zwischen zwei Texten bestimmen kann, ist dies für einen Computer ungleich schwieriger. Eine generelle und für alle Anwendungsfälle gültige Regel lässt sich nur schwer aufstellen, denn je nach Ausgangslage können sich die Anforderungen an einen solchen Algorithmus stark unterscheiden. Deshalb muß versucht werden, ihm möglichst clever einen Weg zum Bestimmen des Verwandtschaftsgrades aufzuzeigen.