Niedawno mogliśmy się zapoznać z wewnatrzną dokumencją Content Warehouse API wyszukiwarki Google. Prawdopodobnie została ona przypadkowo opublikowana w repozytorium kodu biblioteki klienta.
Nie jest to dokumentacja samej wyszukiwarki tylko wewnętrznego API.
Przeglądając jej zawartość można natrafić na funkcje, które opisane są w sposób umożliwiający jednoznaczną identyfikację ich w zakresie zagadnień SEO.
Część wyraźnie wskazuje na różne mechanizmy dostępne na przestrzeni lat a część na czynniki, które wpływają na ranking.
Nie będę tutaj opisywał czym jest całe API i co można tam znaleźć. Warto dodać, że to ponad 2500 modułów z ponad 14 tysiącami funkcji.
Jest więc co przeglądać.
I tutaj jest problem bo spędziłem nad tą dokumentację ponad godzinę i myślę, że jeszcze posiedzę dlatego wpis opieram na informacjach dostępnych w artykule https://ipullrank.com/google-algo-leak.
Na co zwróciłem uwagę czytając tą treść?
1. Autorytet strony ma swoją funkcje w tym API. Ludzie Google wielokrotnie mówili, że nie ma takiego sygnału ale pewnie jak wiele rzeczy, które mówią nie jest w pełni prawdą.
2. Kliki z wyszukiwarki są brane pod uwagę w rankingach. Zdefiniowane są tzw. „dobre kliki”, „złe kliki”, czy np. „długie kliki”. Prawdopodobnie ilość klików musi być skorelowana z czasem przebywania na stronie.
3. Sandbox czyli opóźnienie dla nowych domen może istnieć.
4. Panda – by się wyratować potrzeba stworzyć więcej dobrej treści, która wygeneruje ruch. Także potrzeba jest więcej różnorodnych linków. Czyli jest przepis na dobrze działające SEO :).
5. Autor treści czyli EEAT jest istotne i Google to sprawdza a także przechowuje te dane.
6. Źle dopasowana kotwica linku nie będzie brana pod uwagę. Google sprawdza czy strona docelowa jest powiązana z kotwica, więc linkowanie na frazy niepowiązane to nie dobry pomysł.
7. Zła nawigacja może popsuć SEO.
8. Linki są dalej dość ważne.
7. Linki spamowe – tutaj liczone jest ile linków spamowych zostało znalezione na różnych domenach. Ile dni są widoczne, jak wiele się degraduje.
Sprawdzany jest także czas wzrostu ilość. Istotna jest także ilośc linków tego typu w domenie.
Ogólnie wydaje się, że Google jest bez problemu w stanie zidentyfikować takie linki.
8. Google analizuje poprzednie wersje treści. Według zapisuje w funkcji UrlHistory jest to 20 ostatnich zmian. W funkcji jest też informacja o ostatniej wersji, więc może przy każdej zmianie jest to najbardziej porównywane z poprzednią wersją.
9. PageRank strony głównej jest przenoszony prawdopodobnie na początku dla nowych URL.
10. Rozmiar czcionki w linkach ma znaczenie – kiedyś to testowałem i nie widziałem różnicy.
11. Google zlicza tokeny i stosunek całkowitej ilości słów do liczby unikalnych tokenów. Z tego wynika, że najważniejsze treści dalej powinny być na początku.
12. Krótkie treści są oceniane pod kątem oryginalności. A co w takim razie z długimi?
13. Tytuły stron maja dalej znaczenie w dopasowaniu do zapytania.
14. Google skupia się na świeżych danych, więc daty maja duże znaczenie.
15. Informacja o dacie rejestracji domeny i jej wygaśnięciu jest przechowywana.
16. Jeżeli w domenie ponad 50% stron jest treściami wideo to traktowana jest jako witryna skupiona na wideo.
17. W API znajdują się funkcje dotyczące YMYL, jest to przekazanie punktacji. Nie ma informacji o tym jak jest to określone.
18. Google porównuje tematyczność podstrony do tematyczności całej witryny.
19. Małe witryny osobiste mogą otrzymywać czasami dodatkową promocję.
Po więcej opisów zapraszam na stronę, do której link dodałem w górnej części wpisu. A same API możecie przejrzeć tutaj.
Jest co przeglądać :).
Jak wiemy Google nie jest ochocze do udzielania nam bardziej szczegółowych informacji dlatego taki „wyciek” na pewno wymaga poświęcenia mu chwili.
Łącząc kropki można dojść od wniosków, które ułatwią nam pracę.
Dzięki temu możemy też być bardziej skuteczni.