Posty z Styczeń, 2015

404 vs 410 – test skuteczności usuwania

404 google Standardowa odpowiedź serwera www dla nieistniejącego zasobu to 404 “not found” – nie znaleziono.

Przedstawianie takiej informacji o nieistniejącej zasobach wraz nagłówkiem 404 powinno być standardem na każdej witrynie www.
Oczywiście nie wszyscy twórcy witryn przejmują się takimi szczegółami i bywa, że skrypt “nie zauważa”, że podstrony już nie ma.
Podstawianie podstrony z informacją o błędzie 404 bez przekazywania nagłówka także jest popularne. Google rozpoznaje takie sytuacje i określa je jako pozorne błędy 404.
Nie wszycy wiedzą, że do usunięcia podstrony z indeksu Google można użyć innego nagłówka – 410 “Gone”. Dla Google jest to informacja o tym, że podstrona została usunięta – “odeszła” jak tłumaczy te słowo Translator Google :).

Kilka lat temu czytałem wywiad z kimś z Google, niestety nie pamiętam z kim, i był tam poruszony temat nagłówków 404 i 410. Zainteresowała mnie informacja o tym, że Google inaczej interpretuje te nagłówki i reaguje na nie inaczej.
404 to informacja o tym, że adresu nie znaleziono a 410 informuje o tym, że adres został usunięty. Był ale poszedł i nie wróci :) W związku z tym dla algorytmów 410 jest mocniejszym przekazem.

Zacząłem więc używać nagłówków 410 przy usuwaniu podstron, wychodząc z założenia, że mocniejszy przekaz 410 spowoduje szybsze usunięcie niż 404. I przyznam się, że miałem wrażenie, że rzeczywiście tak jest. Podstrony były usuwane szybko i bez problemowo.
…Czytaj dalej »