Czy Google czyta adresy URL w treści – wynik testu SEO

W poprzednim wpisie “Czy Google czyta adresy URL w treści” opisałem sytuację błędów 404 wskazanych w GSC.

Jak się okazało błędy był wynikiem napisania adresu URL w treści starego wpisu.

Założyłem więc, że boty Google czytają adresy i nimi podążają. W wyniku tego Google próbuje zaindeksować adres wskazany w treści.

Dopełniając temat w treści wpisu utworzyłem test by sprawdzić jaką formę powinien mieć adres by podążył nim Googlebot.

Dla przypomnienia utworzone zostały cztery grupy adresów.
1. Bez protokołu i subdomeny www.
2. Bez protokołu z subdomeną www.
3. Adresy z protokołem
4. Adresy w treści jako kod strony – hreflang.

Sprawdźmy co się działo dalej.

Wpis opublikowałem 23.09.2022 o godzinie 16:45 i tego dnia Google nie raczyło odwiedzić żadnych linków z treści.

Następnego dnia Googlebot odwiedził dwa adresy:
66.249.66.199 - - [24/Sep/2022:02:44:28 +0200] "GET /mx/ HTTP/1.1" 301 233 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.76.143 - - [24/Sep/2022:02:44:29 +0200] "GET /mx HTTP/1.1" 404 20591 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.90 - - [24/Sep/2022:02:52:27 +0200] "GET /es/ HTTP/1.1" 301 233 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.76.145 - - [24/Sep/2022:02:52:28 +0200] "GET /es HTTP/1.1" 404 20591 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

A 25 września kolejne dwa:
66.249.66.155 - - [25/Sep/2022:03:25:12 +0200] "GET /de/ HTTP/1.1" 301 233 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.17 - - [25/Sep/2022:03:25:12 +0200] "GET /de HTTP/1.1" 404 20591 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.26 - - [25/Sep/2022:03:26:13 +0200] "GET /ro/ HTTP/1.1" 301 234 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.76.141 - - [25/Sep/2022:03:26:13 +0200] "GET /ro/ HTTP/1.1" 301 233 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.91 - - [25/Sep/2022:03:26:14 +0200] "GET /ro HTTP/1.1" 404 20591 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Tego samego dnia dodana została informacja do GSC o nowych podstronach z błędem 404.

gsc błędy 404

Kilkukrotnie jeszcze sprawdzane było czy czy status tych adresów URL się nie zmienił. Od dłuższego już czasu Google ich nie odwiedza.

gsc lista stron z 404

Inne adresy z testów nie zostały ani razu odwiedzone. Można więc wywnioskować, że czytane są adresy z protokołami to wydawałoby się logiczne.
W innym przypadku Google musiałoby odwoływać się zawsze do http, do tego sprawdzanie czy domena gffdgfd.pl istnieje zabierałoby globalnie dużo zasobów.

Na pewno warto się jeszcze dowiedzieć kilka tematów np. ile “mocy” jest przekazywane, czy może być za dużo takich “linków” itp.

Waszej wyobraźni SEO pozostawię kwestię co dalej można przetestować i jak to użyć.

Komentarzy brak

Twoja odpowiedź