Während ich die Feiertage über sehr gefaulenzt habe, hat mein Kollege Patrice seinen Website Translator veröffentlicht. In Form eines WordPress-Plugins kann man mit Hilfe des Google-Übersetzungsdienstes jeden seiner Blogeinträge in diverse Sprachen übersetzen lassen.
Continue reading “Website Translator – Übersetzungen für Blog-Einträge”
Aus SEO-Gründen sollte man ja immer versuchen, die Session-ID (unter Verwendung von PHP i.d.R. PHPSESSID) abzuschneiden, damit kein Duplicate Content entsteht. Dafür gibt es mit PHP (aber natürlich auch mit vielen anderen Mitteln) eine einfach Möglichkeit: Man startet die Session erst gar nicht, wenn es sich um einen Bot handelt.
Diese Sache hat aber natürlich einen Haken. Sehr oft brauch man aber die Session, z.B. um die Sprache der aktuellen Seite zu speichern, wenn intern Sprachdateien geladen werden oder für diverse andere Zwecke. Aus diesem Grund musste ich mir etwas anderes einfallen lassen.
Continue reading “Session-ID elegant abschneiden”
“Manchmal kommt es vor, dass Leute auf eine Domain linken und dabei einen Parameter übergeben, der keinerlei Änderung an der Ausgabe der Seite hervorruft.”
Dieser Satz klingt kompliziert und deswegen erläutere ich ihn mal anhand eines Beispiels.
Continue reading “Duplicate Content vermeiden durch “Query-Strings richtig abschneiden””
Ich habe hier mal eine Übersicht über die gängisten Crawler der Suchmaschinen. Anhand der Liste kann man diese dann aussperren oder gezielt umleiten (was natürlich oft sehr böse wäre ;)).
|
Name
|
HTTP_USER_AGENT
|
|
Alexa-1
|
ia_archiver
|
|
Alexa-2
|
ia_archiver-web.archive.org
|
|
AskJeeves-Teoma
|
Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://sp.ask.com/docs/about/tech_crawling.html)
|
|
Googlebot 2.1
|
Googlebot/2.1 (+http://www.google.com/bot.html)
|
|
Googlebot-Mozilla-2.1
|
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
|
|
Google-AdSense-2.1
|
Mediapartners-Google/2.1
|
|
MSN-1.0
|
msnbot/1.0 (+http://search.msn.com/msnbot.htm)
|
|
Yahoo-Slurp
|
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
|
|
ZyBorg-1.0
|
Mozilla/4.0 compatible ZyBorg/1.0 (wn-14.zyborg@looksmart.net; http://www.WISEnutbot.com)
|
Aus Sicht der Suchmaschinenoptimierung ist eine gute Wiederspiegelung der aktuellen Seite (!= Website) in den Meta-Angaben auch heute noch von großer Bedeutung. Daher muss man sich frühzeitig Gedanken um gute Keyword- und Description-Tags machen. Ich habe das eben für mein Fotoalbum nachholen müssen. Dabei stieß ich schnell auf das leidige Problem mit den Umlauten. Wie schreibt man sie denn nun? Im Klartext oder lieber als HTML-Entitiy? Oder lieber “von Hand konvertieren”, also ä wird zu ae, ß zu ss, etc.? Nach einiger Recherche habe ich hier eine Zusammenfassung zu bieten:
- Umlaute werden von den Robots generell in eine 7-Bit-Sequenz umgewandelt. Also wird aus ä ein “ae” und aus einem ß wird ein “ss”.
- Umlaute werden doppelt indiziert, nämlich als Stamm- und als Sonderzeichen. Deshalb wird Müsli auch unter Musli gefunden.
- Eine Umwandlung in eine Entity ist keine gute Idee, da Entitäten als solche indiziert werden. Das heißt ganz einfach, dass ein Müsli auch als solches indiziert und gefunden wird – wenn es jemanden gibt, der nach sowas sucht.
Fazit: Meta-Angaben immer schön in normalen Umlauten schreiben, da sie für die Suche eh umgewandelt werden.
PHP gibt sich gerne als Plaudertasche und erzählt brav jedem Besucher in dem Header der Verbindung, dass es für den zurückgegebenen Inhalt verantwortlich ist. Das sieht dann ungefähr so aus:
HTTP/1.x 200 OK
Date: Fri, 29 Jun 2007 08:28:04 GMT
Server: Apache/2.2.3 (Debian) PHP/4.4.4-8+etch3 mod_perl/2.0.2 Perl/v5.8.8
X-Powered-By: PHP/4.4.4-8+etch3
Content-Length: 481
Keep-Alive: timeout=15, max=98
Connection: Keep-Alive
Content-Type: text/html
Nun gehen die Meinung er SEO-Leute auseinander, manche behaupten, mod_rewrite-Regeln, die z.B. .html-Seiten vorgaukeln, wären nicht effektiv, wenn im Header eh steht, dass die Seite von PHP gerendert wurde. Um nun PHP das Senden dieser Header-Zeile abzugewöhnen, muss man lediglich in der php.ini den Wert von expose_php auf Off setzen.
Anschließend ist PHP mucksmäuschenstill. :-)
;
; Misc
;
; Decides whether PHP may expose the fact that it is installed on the server
; (e.g. by adding its signature to the Web server header). It is no security
; threat in any way, but it makes it possible to determine whether you use PHP
; on your server or not.
expose_php = Off
Nachtrag vom 06.11.2011:
Da es in die gleiche Richtung geht, hier der Hinweis, dass ich in dem Artikel Apache sehr extravertiert – Signatur verbergen und Token anpassen beschrieben habe, wie man dem Apache sein von Haus aus sehr gesprächige Art eindämmen kann.