Pozorny błąd 404

Pozorny błąd 404 to jeden z podstawowych czynników optymalizacyjnych, jakie kontroluję podczas optymalizacji początkowej i okresowej. Gdy Google kilka lat temu zaczęło informować o takich sytuacjach pracy było więcej niż obecnie ale i dziś jest trzeba o tym pamiętać.

Nie jest to błąd z kategorii tych błędów, które potrafią mocno wpłynąć na ogólny odbiór przez Google witryny. No chyba, że ogólnie jest problem i np 80% podstron zostało zakwalifikowane przez Google jako podstrony z pozornym błędem ale to zdarza się na pewno rzadko.

Mimo tego warto się nad nim pochylić i poprawić mechanizmy tak by go usunąć. Tym bardziej, że często dzięki tej informacji od Google można wykryć różne problemy na stronie.

Co jest pozorny błąd 404?

W przesyłanych do niedawna wiadomościach przez Google zostało to tak opisane:

A w Pomocy Google mamy taki opis:

Pozorny błąd 404 oznacza, że adres URL Twojej witryny kieruje użytkownika na stronę, która nie istnieje. Użytkownik widzi stosowny komunikat, a przeglądarka otrzymuje kod stanu 200 (powodzenie) (w niektórych przypadkach zamiast strony z komunikatem „nie znaleziono” może wyświetlić się strona z niewielką ilością treści lub z nieprzydatną treścią – np. pusta lub prawie pusta).


Link do Supportu Google.

Można więc napisać, że taki błąd następuje gdy Google wykrywa, że dana podstrona nie istnieje ale zwraca ona kod HTTP 200 zamiast 404 lub 410.

I najczęściej tak jest ale widziałem sytuacje gdy Google błędnie interpretowało sytuację na danej podstronie jako pozorny błąd.

Jak Google kwalifikuje podstrony do pozornego błędu 404?

Możemy wymienić kilka sytuacji, które widziałem a Google określił je jako pozorny błąd. W każdej z nich zwracany jest nagłownej HTTP 200.

1. Podstrona rzeczywiście nie istnieje, zgłasza informacje not found, nie odnaleziono, nie istnieje itd.
W tym przypadku trzeba poprawić mechanizmy wykrywania nieistniejących podstron i dodać HTTP 404. Sama treść „Strona nie istnieje” lub podobny komunikat, bez nagłówka 404, nie jest działaniem optymalnym.

2. Podstrona istnieje ale tymczasowo nie ma treści np skończyły się produkty i wyświetlana jest tylko informacja o tym.
Komunikat „No products matching your criteria have been found” powoduje wykrycie przez Google pozornego błędu 404. Warto rozważyć czy rzeczywiście indeksować tego typu podstrony. Jeśli jest taka konieczność – trzeba zmienić komunikaty.

3. Zamiast treści wyświetlane są błędy.
Oczywiście taka sytuacja jest do poprawy. Emisja błędów różnego typu na podstronach nie jest działaniem optymalnym. Wystarczy by zawierały „not found” lub pokrewne określenie i Google kwalifikuje podstronę jako pozorny błąd 404.

4. Podstrona ma mało treści.
Czasami tego typu podstrony odbiegają graficznie od pozostałych ale widziałem przypadki gdy np podzielenie tabów z jednej strony na kolejne podstrony powodowało, że Google rozpoznawał nowe strony jako błędne.

5. Podstrona nie ma treści ani kodu – pusta podstrona z nagłówkiem 200.
Jest to po prostu błąd i warto usunąć tego typu sytuacje.

6. Adres jest przekierowany na inny adres np stronę główną. Najczęściej błąd rozpoznawany jest przy przekierowaniu 302.
Warto sprawdzić dlaczego tak się dzieje, może rzeczywiście strona została skasowana ale skrypt zamiast 404 dalej 302 na główną? W przypadkach, które widziałem zawsze był to błąd rozwiązań przy usuwaniu treści.

Różnice w nowym GWT i starym

Obecnie w poszukiwaniu pozornych błedów 404 warto odwiedzić nową i starą wersję Google Search Console.
Poniżej przykład w ilości wyświetlanych przykładów.

Stare GSC

Nowe GSC

Jak widać nowe GSC wyświetla inne wartości dla obydwóch błędów.

Prawdopodobnie z czasem różnice te będą się jeszcze bardziej pogłębiać co jest wynikiem lepszych mechanizmów w nowym GSC lub w ten sposób Google będzie nas powoli zmuszało do migracji :).

Podsumowanie

Mimo, że na początku napisałem, że pozorne błędy 404 nie są błędami bardzo ciężkiego kalibru, warto nie pomijać tej kwestii w optymalizacji witryny.

Jak widzicie przypadki rozpoznawania przez Google tego błędu są różne ale najczęściej Google ma rację. To skrypty nie stają na wysokości zadania by poinformować o braku danego adresu poprzez nagłówek 404 lub 410.

Zdarza się jednak, że sytuacja zostaje przez Google zinterpretowana jako błąd a tak nie jest. Jak wiemy, co jest oczywiste, tego typu błędy wykluczają podstrony z indeksacji.
I czasami można tracić przez to „jakiś” ruch, tym bardziej jak zjawisko jest szerokie.

Warto popracować więc nad tym by Google zmieniło zdanie np poprzez zmianę komunikatu lub dodanie treści na podstronach.

Jeśli ktoś zna inne przypadki, o których warto pamiętać to zapraszam do podzielenia się tym w komentarzu.

5 komentarzy

  1. Autor Szymon Słowik dodany 28 lutego, 2018

    Ja spotkałem się z jeszcze jednym scenariuszem. Wpisanie nieprawidłowego adresu powoduje wyświetlenie zawartości strony głównej (bez przekierowania). To wyjątkowo słaba sytuacja, bo mamy wówczas duplikację wewnętrzną 1:1 i bardzo utrudnioną analitykę problemu (np. z poziomu GSC / GA).

  2. Autor mkane dodany 28 lutego, 2018

    Masz racje, czasami Google rozpoznaje taką sytuację jako pozorny błąd 404. Niestety częściej patrzy na to jak na powielenie treści.

  3. Autor Marcin dodany 2 marca, 2018

    Bardzo dobrze, że ktoś poruszył to zjawisko i dokładnie je opisał

  4. Autor mkane dodany 2 marca, 2018

    Cieszę się, że mogłem pomóc.

  5. Autor Sławomir dodany 11 maja, 2018

    „Ja spotkałem się z jeszcze jednym scenariuszem. Wpisanie nieprawidłowego adresu powoduje wyświetlenie zawartości strony głównej (bez przekierowania). To wyjątkowo słaba sytuacja, bo mamy wówczas duplikację wewnętrzną 1:1 i bardzo utrudnioną analitykę problemu (np. z poziomu GSC / GA).”

    Szczerze mówiąc jestem zaskoczony. Niemniej naturalnie Ci wierzę podobnie jak „mkane”. Co do samego artykułu, bardzo dobry tekst.