
| | W. Popken im Fenster Selbstportrait 08/2004 | | | | | 15.07.2007
Suchmaschine
Suchmaschinen sind unerläßlich im Internet, das hat man ziemlich schnell begriffen. Deshalb sind Suchmaschinen eine der ältesten Anwendungen im weltweiten Netz. Anfangs waren es lediglich manuell geführte Listen, aber schnell wurde klar, daß man auf diese Weise nur einen Bruchteil des rasant wachsenden Angebots erfassen konnte. Yahoo und Web.de waren ursprünglich sogenannte Kataloge, und die Sachbearbeiter entschieden über Wohl und Wehe der Anbieter, indem sie nämlich bewerteten, ob die Inhalte in ihren Augen relevant waren oder nicht, und ob sie folglich aufgenommen werden sollten. Ich kann mich noch gut daran erinnern, welche Anstrengungen man unternommen hat, um in den Augen dieser mächtigen Richter bestehen zu können.
Die meisten Suchmaschinen, die später entwickelt wurden, verzichteten auf diesen kostenintensiven und wenig ergiebigen Ansatz und setzten auf Roboter, die selbsttätig das Rechnernetz durchforsten, ohne eine inhaltliche Bewertung vornehmen zu können. Diese wurde durch Auswertung unsichtbarer Schlüsselwörter und Beschreibungen vorgenommen, die folglich sofort in ihrer Bedeutung für die Bewertung der Suchmaschinenergebnisse erkannt wurden und - legitimerweise oder nicht - von beflissenen Webmastern manipuliert wurden.
Spam-Abwehr
Gegen unberechtigte Manipulierung mußten sich die Suchmaschinen folglich schnell zur Wehr setzen. Jede Suchmaschine entwickelte dabei ihre eigenen Mechanismen, die ebensowenig wie die eigentlichen Bewertungsalgorithmen veröffentlicht wurden, um nicht einem sofortigen Mißbrauch Tür und Tor zu öffnen. Folglich entwickelte sich die Wissenschaft der Suchmaschinen-Optimierung. Es galt, die Geheimnisse von außen auszuspionieren, um - in guter oder böser Absicht - diese Erkenntnisse zum eigenen Nutzen anzuwenden. Womit sich die Suchmaschinen gezwungen sahen, ihre Algorithmen ständig zu verändern, nämlich in dem Maße, wie sie ausspioniert wurden.
Es handelt sich um den bekannten Wettlauf zwischen Gut und Böse, den eigentlich keiner gewinnen kann. Also mußten neue Ideen her. Google ist heute in aller Munde, und zwar deshalb, weil diese Suchmaschine durch einen völlig neuen Ansatz sowohl das geschilderte Karussell vermeiden konnte - jedenfalls für eine Weile - als auch zuverlässigere Bewertungen erbrachte. Der Trick bestand darin, die Benutzer des Internet selbst einzuspannen. Da Verweise auf andere Seiten (jedenfalls bis dahin) mit einer bewußten Entscheidung und einem manuellen Aufwand eingerichtet wurden, schlossen die Erfinder des neuen Algorithmus, daß die Seiten, auf die verwiesen wird, für diejenigen, die sich dafür entschieden haben, auf diese Seiten zu verweisen, wertvoll und wichtig sind. Diese Seiten werden infolgedessen höher bewertet.
Es dauerte natürlich nicht lange, bis findige Köpfe Mechanismen entwickelt hatten, auch diesen Ansatz auszuhebeln. Schließlich kann man Verweise auch maschinell setzen, womit sich Google in derselben Lage befand, wie andere Suchmaschinen. Bisher hat Google es aber einigermaßen geschafft, die Qualität seiner Suchergebnisse zu stabilisieren. Auch Yahoo mußte schließlich zusätzlich auf Roboter zurückgreifen und kaufte die entsprechenden Dienste kurzerhand ein. Der Siegeszug Googles begann übrigens damit, daß Yahoo den Vertrag mit der Roboter-Suchmaschine kündigte und statt dessen die Dienste von Google einkaufte. Damit war die Qualität von Google gewissermaßen besiegelt.
Google
Google war so erfolgreich, daß viele Webmaster zu dem Schluß kamen, Google kenne sich besser auf ihrer eigenen Seite aus als sie selbst. Also boten sie dem Besucher eine Suche von Google auf der eigenen Seite an. Diese Einschätzung kann ich nicht bestätigen. Google kennt nur einen Bruchteil der Pferdezeitung, und vor allen Dingen hat Google keine Ahnung von der Systematik. Ob ein Wort auf ein Pferdeangebot hinweist oder eine Rezension oder einen Artikel, können wir viel besser herausfinden.
Deshalb hat die Pferdezeitung eine eigene Suche, die systematisch entweder alle Bereiche oder nur den gewählten Bereich durchsucht. Infolgedessen kann unsere Suchmaschine beliebig kontrolliert und angepaßt werden, was freilich auch Arbeit macht. Immerhin kann diese Suche grundsätzlich nicht manipuliert werden. Aber andererseits ist sie auch keineswegs fehlerfrei oder komfortabel.
Google kann mittlerweile Varianten in der Schreibweise erkennen und auch nach diesen suchen. Das ist gut und schlecht zugleich. Wenn ich nach "Pferd" suche, will ich nicht unbedingt auch nach "Pferde" oder "Pferden" suchen. Das kann man Google dadurch untersagen, daß man den gewählten Suchbegriff in Anführungszeichen stellt. Besonders interessant sind die Vorschläge, die auf fehlerhafte Schreibweisen hinweisen. Vor etwa fünf Jahren wurde ich das erste Mal darauf aufmerksam, weil Google bei der Suche nach "msql" fragte: meinten Sie"mysql"? Das war insofern pikant, als msql die Datenbank von Microsoft, also kommerziell, mysql jedoch eine Open-Source-Datenbank ist, also dem für Microsoft verteufelten Linux-Lager angehört. Inzwischen sucht Google schon von selbst. nach solchen Schreibfehlern, womit nach meiner Erfahrung die Qualität der Suchergebnisse eher verschlechtert wird.
zorro sorro surro
Das sind drei Varianten eines Pferdenamens - welcher ist richtig? Ich fürchte, auch Google hätte da keinen guten Vorschlag. Auf dieses Beispiel bin ich gestoßen, weil mich jemand anrief, der ein Pferdeangebot suchte und mir den Namen des Pferdes nannte. Unsere Suchmaschine fand das Pferd nicht. Ich stutzte. Das Inserat sollte es definitiv gegeben haben. Also mußte unsere Suchmaschine dieses Inserat finden - wenn nicht, war die Suchmaschine fehlerhaft. Was konnte hier der Fehler sein? Sollte die Suchmaschine nicht zuverlässig arbeiten?
Nein, es handelte sich um einen Hörfehler oder auch um schlampige Aussprache, wie man es nimmt. Bekanntlich sollte man E-Mail-Adressen am besten buchstabieren, wenn man sie am Telefon durchgibt, weil auch die E-Mail-Server keineswegs fehlertolerant sind. Mit der richtigen Schreibweise wurde das Inserat wie erwartet gefunden. Sollte unsere Suchmaschine jetzt verbessert werden, um schriftsprachliche Varianten vollautomatisch mitzudurchsuchen? Ich glaube nicht, das wäre wohl ziemlich unsinnig. Aber wenn jemand gar nicht weiß, wie der Name geschrieben wird? Tja, da hat man dann wohl Pech. Tut mir leid. Da muß man probieren.

| | | Chefredakteur und Herausgeber | | | | |
|