Pozorny błąd 404

Pozorny błąd 404 to jeden z podstawowych czynników optymalizacyjnych, jakie kontroluję podczas optymalizacji początkowej i okresowej. Gdy Google kilka lat temu zaczęło informować o takich sytuacjach pracy było więcej niż obecnie ale i dziś jest trzeba o tym pamiętać.

Nie jest to błąd z kategorii tych błędów, które potrafią mocno wpłynąć na ogólny odbiór przez Google witryny. No chyba, że ogólnie jest problem i np 80% podstron zostało zakwalifikowane przez Google jako podstrony z pozornym błędem ale to zdarza się na pewno rzadko.

Mimo tego warto się nad nim pochylić i poprawić mechanizmy tak by go usunąć. Tym bardziej, że często dzięki tej informacji od Google można wykryć różne problemy na stronie.

Co jest pozorny błąd 404?

W przesyłanych do niedawna wiadomościach przez Google zostało to tak opisane:

A w Pomocy Google mamy taki opis:

Pozorny błąd 404 oznacza, że adres URL Twojej witryny kieruje użytkownika na stronę, która nie istnieje. Użytkownik widzi stosowny komunikat, a przeglądarka otrzymuje kod stanu 200 (powodzenie) (w niektórych przypadkach zamiast strony z komunikatem „nie znaleziono” może wyświetlić się strona z niewielką ilością treści lub z nieprzydatną treścią – np. pusta lub prawie pusta).

…Czytaj dalej »

404 vs 410 – test skuteczności usuwania

404 google Standardowa odpowiedź serwera www dla nieistniejącego zasobu to 404 “not found” – nie znaleziono.

Przedstawianie takiej informacji o nieistniejącej zasobach wraz nagłówkiem 404 powinno być standardem na każdej witrynie www.
Oczywiście nie wszyscy twórcy witryn przejmują się takimi szczegółami i bywa, że skrypt “nie zauważa”, że podstrony już nie ma.
Podstawianie podstrony z informacją o błędzie 404 bez przekazywania nagłówka także jest popularne. Google rozpoznaje takie sytuacje i określa je jako pozorne błędy 404.
Nie wszycy wiedzą, że do usunięcia podstrony z indeksu Google można użyć innego nagłówka – 410 “Gone”. Dla Google jest to informacja o tym, że podstrona została usunięta – “odeszła” jak tłumaczy te słowo Translator Google :).

Kilka lat temu czytałem wywiad z kimś z Google, niestety nie pamiętam z kim, i był tam poruszony temat nagłówków 404 i 410. Zainteresowała mnie informacja o tym, że Google inaczej interpretuje te nagłówki i reaguje na nie inaczej.
404 to informacja o tym, że adresu nie znaleziono a 410 informuje o tym, że adres został usunięty. Był ale poszedł i nie wróci :) W związku z tym dla algorytmów 410 jest mocniejszym przekazem.

Zacząłem więc używać nagłówków 410 przy usuwaniu podstron, wychodząc z założenia, że mocniejszy przekaz 410 spowoduje szybsze usunięcie niż 404. I przyznam się, że miałem wrażenie, że rzeczywiście tak jest. Podstrony były usuwane szybko i bez problemowo.
…Czytaj dalej »

Czasowe usunięcie witryny z Google

pytanie Trzy tygodnie temu na searchengineland.com pojawił się wpis, który dość mocno mnie zaintrygował.

W skrócie – Grupon w USA na 6 godzin usunął się z wyszukiwarki Google.com. Dzięki temu dowiedzieli się, że około 60% ruchu klasyfikowanego w ich statystykach jako ruch bezpośredni ma powiązanie z Google.

W artykule znajdziecie wykresy, które obrazują automatyczny spadek ilości wejść bezpośrednich wraz ze spadkiem wejść z Google.

Z racji tego, że ten wpis nie ma być analizą tego co zostało tam napisane pozwolę sobie na 3 pytania:
– po co to zrobili? (duża amerykańska korporacja usuwa się sama z wyszukiwarki?),

– jaki udział w ruchu mają frazy związane z ich nazwą (frazy brandowe mają u nich na pewno bardzo duży udział, więc jak znikli z Google to ci co używali Google jako “ulubione” już nie weszli :)),

– jak się wyindeksować na 6 godzin z Google?

Po zapoznaniu się z wynikami “eksperymentu” najbardziej byłem bardzo ciekawy odpowiedzi na trzecie pytanie, nawet zadaliśmy takie pytanie w komentarzach ale nikt na nie nie odpowiedział.

Analizując temat widziałem tylko dwie możliwości:
– telefon do przyjaciela z Google i ładne poproszenie o pomoc,
– usunięcie się poprzez mechanizmy dostępne w GWT.

Jako, że telefony do USA kosztują nie mało a mój przyjaciel Google jest na urlopie :) postanowiłem przetestować opcje nr 2 czyli sprawdzić co mogę zrobić z GWT.
…Czytaj dalej »

Webmaster Tools – informacje o powieleniu treści

Przeglądając kilka dni temu Google Webmaster Tools natknąłem się na ciekawy wykres dotyczący indeksowania witryny. Przechodząc w menu Kondycja >> Stan indeksowania, dostajemy się do wykresu z indeksowaniem witryny. Nad wykresem widnieją butony Podstawowe i Zaawansowane.

Dane, które mnie zainteresowały dostępne na podstronie z danymi zaawansowanymi.

Zobaczymy tutaj wykres na którym możemy dowiedzieć się o:
Zaindeksowano łącznie – czyli wszystkie znajdujące się podstrony w Google w indeksie podstawowym nie wiem jak się tu ma sprawa z SI.
Kiedykolwiek pobrane – wszystkie pobrane podstrony – tu widać ile generuje się podstron, w niektórych serwisach,
Niewybrane – podstrony, które są powieleniem lub są przekierowane, niestety nie ma informacji czy są to powielanie tylko wewnątrz strony czy nie.
Zablokowane w pliku robots.txt – łatwo tu zauważyć jak się za dużo zablokuje,
Usunięte – tu nic nie będzie jeśli nie było dla witryny prośby o usunięcie podstron z indeksu.

Z listy dostępnych informacji, zainteresowałem się informacją związana z “niewybranymi” podstronami. Dzięki dostępnej tutaj informacji, gdy zastanawiamy się dlaczego mamy problemy z indeksacją lub nie ma ruchu na nowych podstronach, można dowiedzieć się o przynajmniej jednej przyczynie. Bo problemów może być więcej…

Poniżej przedstawiam kilka przykładów stron, podejrzewam, że przedstawione informacje mogą być lekkim zaskoczeniem.
…Czytaj dalej »

Caffeine – nowy algorytm Google już jest

O zapowiedzi zmiany algorytmu na Caffeine pisałem tutaj. Jak pamiętamy już po świętach miało nastąpić wdrożenie, jednak tak się nie stało.

Pierwsze oznaki “nowego” widać było na początku roku, wielu wyszukiwało Data Center, na których były serwowane wyniki oparte na nowym algorytmie. Przez te kilka miesięcy pozycjonerzy żyli w obawie co będzie się działo.

Kilka tygodni temu nastąpiły dość mocne zmiany w wynikach oraz ilości podstron zaindeksowanych.

Jednak dopiero wczoraj Google ogłosiło, że Caffeine jest już na 100% DC i wszystkie wyniki są serwowane dzięki niemu.

Google w notatce o tym poinformowało nas także, że nowy algorytm to tylko na nowo napisana funkcja indeksacji a nie określania pozycji. Caffeine jest szybszy o 50% od starych botów, dzięki temu mogą wyłapać więcej rzeczy, które mogą wpływać na rankingi. Działa też on bardziej wielowątkowo, analizując więcej danych z różnych miejsc niż poprzedni algorytm. …Czytaj dalej »

Następna strona »