404 vs 410 – test skuteczności usuwania

404 google Standardowa odpowiedź serwera www dla nieistniejącego zasobu to 404 “not found” – nie znaleziono.

Przedstawianie takiej informacji o nieistniejącej zasobach wraz nagłówkiem 404 powinno być standardem na każdej witrynie www.
Oczywiście nie wszyscy twórcy witryn przejmują się takimi szczegółami i bywa, że skrypt “nie zauważa”, że podstrony już nie ma.
Podstawianie podstrony z informacją o błędzie 404 bez przekazywania nagłówka także jest popularne. Google rozpoznaje takie sytuacje i określa je jako pozorne błędy 404.
Nie wszycy wiedzą, że do usunięcia podstrony z indeksu Google można użyć innego nagłówka – 410 “Gone”. Dla Google jest to informacja o tym, że podstrona została usunięta – “odeszła” jak tłumaczy te słowo Translator Google :).

Kilka lat temu czytałem wywiad z kimś z Google, niestety nie pamiętam z kim, i był tam poruszony temat nagłówków 404 i 410. Zainteresowała mnie informacja o tym, że Google inaczej interpretuje te nagłówki i reaguje na nie inaczej.
404 to informacja o tym, że adresu nie znaleziono a 410 informuje o tym, że adres został usunięty. Był ale poszedł i nie wróci :) W związku z tym dla algorytmów 410 jest mocniejszym przekazem.

Zacząłem więc używać nagłówków 410 przy usuwaniu podstron, wychodząc z założenia, że mocniejszy przekaz 410 spowoduje szybsze usunięcie niż 404. I przyznam się, że miałem wrażenie, że rzeczywiście tak jest. Podstrony były usuwane szybko i bez problemowo.
…Czytaj dalej »

Czasowe usunięcie witryny z Google

pytanie Trzy tygodnie temu na searchengineland.com pojawił się wpis, który dość mocno mnie zaintrygował.

W skrócie – Grupon w USA na 6 godzin usunął się z wyszukiwarki Google.com. Dzięki temu dowiedzieli się, że około 60% ruchu klasyfikowanego w ich statystykach jako ruch bezpośredni ma powiązanie z Google.

W artykule znajdziecie wykresy, które obrazują automatyczny spadek ilości wejść bezpośrednich wraz ze spadkiem wejść z Google.

Z racji tego, że ten wpis nie ma być analizą tego co zostało tam napisane pozwolę sobie na 3 pytania:
– po co to zrobili? (duża amerykańska korporacja usuwa się sama z wyszukiwarki?),

– jaki udział w ruchu mają frazy związane z ich nazwą (frazy brandowe mają u nich na pewno bardzo duży udział, więc jak znikli z Google to ci co używali Google jako “ulubione” już nie weszli :)),

– jak się wyindeksować na 6 godzin z Google?

Po zapoznaniu się z wynikami “eksperymentu” najbardziej byłem bardzo ciekawy odpowiedzi na trzecie pytanie, nawet zadaliśmy takie pytanie w komentarzach ale nikt na nie nie odpowiedział.

Analizując temat widziałem tylko dwie możliwości:
– telefon do przyjaciela z Google i ładne poproszenie o pomoc,
– usunięcie się poprzez mechanizmy dostępne w GWT.

Jako, że telefony do USA kosztują nie mało a mój przyjaciel Google jest na urlopie :) postanowiłem przetestować opcje nr 2 czyli sprawdzić co mogę zrobić z GWT.
…Czytaj dalej »

Webmaster Tools – informacje o powieleniu treści

Przeglądając kilka dni temu Google Webmaster Tools natknąłem się na ciekawy wykres dotyczący indeksowania witryny. Przechodząc w menu Kondycja >> Stan indeksowania, dostajemy się do wykresu z indeksowaniem witryny. Nad wykresem widnieją butony Podstawowe i Zaawansowane.

Dane, które mnie zainteresowały dostępne na podstronie z danymi zaawansowanymi.

Zobaczymy tutaj wykres na którym możemy dowiedzieć się o:
Zaindeksowano łącznie – czyli wszystkie znajdujące się podstrony w Google w indeksie podstawowym nie wiem jak się tu ma sprawa z SI.
Kiedykolwiek pobrane – wszystkie pobrane podstrony – tu widać ile generuje się podstron, w niektórych serwisach,
Niewybrane – podstrony, które są powieleniem lub są przekierowane, niestety nie ma informacji czy są to powielanie tylko wewnątrz strony czy nie.
Zablokowane w pliku robots.txt – łatwo tu zauważyć jak się za dużo zablokuje,
Usunięte – tu nic nie będzie jeśli nie było dla witryny prośby o usunięcie podstron z indeksu.

Z listy dostępnych informacji, zainteresowałem się informacją związana z “niewybranymi” podstronami. Dzięki dostępnej tutaj informacji, gdy zastanawiamy się dlaczego mamy problemy z indeksacją lub nie ma ruchu na nowych podstronach, można dowiedzieć się o przynajmniej jednej przyczynie. Bo problemów może być więcej…

Poniżej przedstawiam kilka przykładów stron, podejrzewam, że przedstawione informacje mogą być lekkim zaskoczeniem.
…Czytaj dalej »

Caffeine – nowy algorytm Google już jest

O zapowiedzi zmiany algorytmu na Caffeine pisałem tutaj. Jak pamiętamy już po świętach miało nastąpić wdrożenie, jednak tak się nie stało.

Pierwsze oznaki “nowego” widać było na początku roku, wielu wyszukiwało Data Center, na których były serwowane wyniki oparte na nowym algorytmie. Przez te kilka miesięcy pozycjonerzy żyli w obawie co będzie się działo.

Kilka tygodni temu nastąpiły dość mocne zmiany w wynikach oraz ilości podstron zaindeksowanych.

Jednak dopiero wczoraj Google ogłosiło, że Caffeine jest już na 100% DC i wszystkie wyniki są serwowane dzięki niemu.

Google w notatce o tym poinformowało nas także, że nowy algorytm to tylko na nowo napisana funkcja indeksacji a nie określania pozycji. Caffeine jest szybszy o 50% od starych botów, dzięki temu mogą wyłapać więcej rzeczy, które mogą wpływać na rankingi. Działa też on bardziej wielowątkowo, analizując więcej danych z różnych miejsc niż poprzedni algorytm. …Czytaj dalej »

Test – indeksacja bez linków – update

Jak pewnie pamiętacie we wpisie z lipca Test – indeksacja bez linków opisałem dziwną sytuację pojawienia się w indeksie Google moich domen, do których nie prowadziły żadne linki.

Z przyczyn niezależnych od mojej skromnej osoby :) mogłem ten test przedłużyć. Za kilka dni domeny będą wypełnione treścią i linkowane, dlatego dziś postanowiłem ponownie sprawdzić jak to wygląda.

Co tu dużo pisać, wygląda bardzo dobrze. 100% domen zostało przez Google zauważone i znajduje się w indeksie. Patrząc w logi mam nawet już wejścia z niestety panującej nam wyszukiwarki.

Drugim torem testuje opinie jakoby używanie narzędzi firmy Google czyli toolbar, PR checker tudzież samo sprawdzanie site: powodowało indeksację.

Test trwa ponad 2 miesiące. Testuję subdomeny, które nie mają wpisu w DNS czyli tworzone na wildcardzie.

Na część tych subdomen wchodzę z włączonym Gtoolbarem, dla części codziennie sprawdzany jest site. Raz w tygodniu sprawdzam PR dla wszystkich testowych subdomen.

Efekt nijaki, logi puste. Zostawię to jeszcze na kilka miesięcy może coś “drgnie”.

Następna strona »