Google wie więcej niż pokazuje – znowu site:
Ostatni wpis na blogu był o operatorze site:. Postanowiłem pójść za ciosem i dziś także będę o nim pisał.
Nie będę jednak znowu zastawiał się nad umiejętnościami matematycznymi wyszukiwarki.
Dziś chciałbym napisać parę słów o tym, że Google pokazuje nam „jedno” a w swych trzewiach mieli coś innego.
Czy pokazuje wszystko co wie?
Od zawsze pozycjonerzy zastanawiają się co wyszukiwarka wie o danej witrynie w kontekście tego co nam o niej pokazuje.
Jak wiemy, teoretycznie możemy sprawdzać wiele parametrów analizując witrynę. Od zawsze najważniejsze parametry to ilość linków przychodzących (pomijając ich jakość) oraz ilość zindeksowanych podstron.
Operator link: już kilka lat temu niestety przestał poprawnie funkcjonować. Pokazywane ilości mają się nijak do stanu rzeczywistego i są bardzo mylące.
Więcej informacji możemy uzyskać w GWT ale musimy się najpierw autoryzować a to może zrobić jedynie ktoś kto ma dostęp do serwera.
Operator site: do dziś używany przez wszystkich by sprawdzić czy Google nas lubi i premiuje nas dużą cyferką czy też nie i cyferka jest mała.
Ogół ludzi zajmujących się SEO przyjął, że jak jest dużo to dobrze a jak mało to źle. Lepiej przecież mieć link z witryny, która jest dobrze zaindeksowana bo wtedy szybciej i więcej tego linka zostanie dostrzeżone.
Wszystko wydaje się logiczne i oczywiste. Do czasu…..
Site = 1
Pisałem kiedyś o jednym z moich serwisów, który ma jakiś dziwny filtr powodujący wyindeksowanie podstron z Google aż do strony głównej.
Bawiłem się z Google co jakiś czas robiąc drobne zmiany w wyglądzie i adresy URL. Po tym indeks znowu rósł by po jakimś czasie zanikać i zostawała tylko strona główna.
Ostatnio nie mam na zabawy czasu, mam ochotę zrezygnować z katalogu w tej domenie i po prostu zrobić tam serwis zbieżny z nazwą domeny.
Serwis podlinkowana jest OK, wg GWT prowadzi do niego lekko ponad 49 tys. linków z 551 innych serwisów. Site powinien więc być więc OK. Ot jest jakiś filtr, trzeba więc domenę przeznaczyć na coś lepszego, pewnie zniknie.
Jednak site = 1 nikogo nie dziwi i mnie też by to nie dziwiło a nad filtrem zastanawiałem się już nie raz.
Nie było by więc tematu do przemyśleń gdyby nie to, że …
To skąd te link są jak nie ma podstron
Któregoś dnia analizując w GTW linki prowadzące do mojego bloga zauważyłem ciekawą rzecz.
Google nie krępując się niezręcznością i niedorzecznością sytuacji w innym miejscu niż wyszukiwarka informuje mnie, że z domeny alpinistyka.pl prowadzi do bloga
Jakże więc to możliwe jeśli w SERPach wyświetlana jest cyferka 1 jako ilość podstron, które zna, więc i linków powinno być 1 a nie ponad 20 tys.
Po co istnieje operator site
Moim zdaniem taka różnica jest możliwa i nie jest żadnym błędem.
Wiemy o tym, że są dwa światy – SEO vs. Reszta, choć niestety wpatrzeni w monitory często o tym zapominamy.
Jak już pisałem pozycjoner użyje site: po to by dowiedzieć się ile podstron danego serwisu „jest w Google”. Wyciągnie z tego mniej lub bardziej sensowne wnioski.
„Reszta” – jeśli już wie, że coś takiego istnieje użyje go by sprawdzić czy w obrębie danej domeny znajdują się jakieś podstrony z określoną treścią. Opisałem to w tym wpisie.
I tak się powinno tego operatora używać. Bo korzystając z site: powinniśmy zobaczyć tylko podstrony, które są warte tego by wyszukiwarka je nam pokazywała a nie te, z którymi się zapoznała.
Piszę „powinniśmy” bo nieraz mam wrażenie, że nawet z tym sobie nie radzą.
Błędne wyciąganie wniosków
Po zastanowieniu i przeanalizowaniu sytuacji (nie tylko tej jednej z przykładu) dochodzę do wniosku, że nie powinniśmy opierać się w takim stopniu na tym operatorze bo dochodzimy do błędnych wniosków.
Sprawdzamy i widzimy, jak w przykładzie, site=1 myślimy sobie:
– słaba domena
– mało linków przychodzących
– Google jej nie odwiedza
– nie warto z niej się linkować
– itp
Jednocześnie nie zaświta nam w głowach myśl, że:
– domena jest podlinkowana OK
– serwis jest zaśmiecony
– serwis duplikuje treść
– może mieć słabą nawigację
– ktoś kombinuje z serwisem np poprzez ataki XSS co obniżyło jego wiarygodność.
– warto z niej linkować
Wynika to z tego, że brakuje nam danych do pełnej analizy.
GWT
Kiedyś, korzystając z site, można było założyć, że dowiemy się jak nas Google traktuje i wnioski były poprawne.
Jednak od uruchomienia GWT, sytuacja ulega zmianie. Google promuje te narzędzia i powoli zmusza nas do tego by zacząć z tego korzystać.
Jeśli szukasz czegoś w domenie użyj site, jeśli chcesz się dowiedzieć jak idzie współpracy Google <–> Twoja witryna, sprawdź to w GWT tak jak w przypdaku operatora link:.
Proste i logiczne, tylko co niedługo zrobią ludzie od SWLi, w których ten operator jest głównym wykładnikiem oceny danego serwisu.
Śmiem twierdzić, że ocenianie wartości serwisu korzystając z site mija się z celem i jest błędne.
Powoli osobiście odchodzę od tego, starając się zwracać uwagę na inne rzeczy. Zdaje sobie sprawę jednak z tego, że jest to trudne.
Tajemnicze Google
Jak widzimy Google nie pokazuje nam w jednym miejscu wszystkiego co wie o jakimś serwisie. Uważam, że jest to celowe działania i lepiej już nie będzie.
By jakakolwiek analiza była w miarę dokładna dane trzeba zebrać z wielu narzędzi i wyszukiwarek a nie tylko z Google.
Warto o tym pamiętać następnym razem szukając nowych miejsc na linki.
a skąd masz pewność, że w GTW – linki, są aktualne? w moim jednym z przypadków, stronę którą pozycjonuje (wcześniej ktoś inny to robił) jest pokazane wiele linków z stron ala SWL (wcześniejszy master tak działał) tylko, że obecnie już ich nie ma mimo tego że w GTW widnieje wiele linków z takich stron, niektóre nawet są off, a linki mimo tego widnieją
drugie, jak G dba o jakość SERP’ów, po co miałby w swojej bazie trzymać 20k marnej jakości podstrony?
Bo widzę z jakich urli idą. Większość jest z adresów, które zrobiłem przy ostatnich zmianach.
Nie twierdzę, że wszystkie bo widzę też adresy, które były potrzednio ale jest ich mało.
Jakby G dbał o SERPy to by usunął minimum 30-40% tego co pokazuje.
Te zdanie jednak potwierdza mój wpis, to co jest pokazywane w SERPach jest tylko częścią tego co G przelicza i prawdopodobnie bierze pod uwagę.
@Bigu
W GWT po dodaniu xml`owej mapy, mam informacje, że w indeksie jest 96 podstron. Jak wiemy pokazuje 1.
w sumie racja, nie powinno być tego między pierwszym a drugim przecinkiem :)
wracając do podstron, po co Google miałoby uwzględniać linki z podstron, które nie są dostępne dla użytkownika
teraz (00:40) np. wg. site są 2 dodatkowe podstrony
Bo w algo Page Rank każda podstrona ma jakąś „moc” a brak jej w indeksie ma inną przyczynę.
A teraz znowu jest tylko 1 (strona główna).
Podczas pisania dodałem do GWT mapę xml dlatego w indeksie może się coś pojawiać.
Stan site=1 dla tej domeny to minimum 3 miesiące.
Ciekawy wpis. Trzeba przyznać, że z tym site’em to różnie bywa. Mnie martwi/ciekawi jeszcze coś innego, aktualizacje Page Ranku.
Ostatnio długo coś wszystko jakby zastygło w miejscu, nie zauważyłem na swoich stronach jakiś większych zmian. Pomimo linkowania domen z wysokim PR, cyferki „nie chca” przejść dalej.
Masz jakiś pomysł na to :) ?
Aktualizacja jest robiona na bieżąco, nie ma tylko masowego eksportu PR toolbar.
Około roku temu Google przebąkiwało, że zrezygnuje z tego działania. Możliwe, że właśnie zostało to zrobione. Częściowe eksporty są robione często.
Hmm, kilka razy miałem ostatnio sytuacje, że po dopaleniu dobrymi linkami PR wzrósł dla dopalonej domeny. Choć łatwiej spada, niż wzrasta.
Jakbym miał odpowiedzieć, co się dzieje z Page Rankiem to szczerze musiałbym powiedzieć – nie wiem ale niewiele mnie to interesuje.
Pamiętajmy też o tym, że w 2012 roku Google traci patent na Page Rank i albo zapłacą Uniwersytetowi Stanforda za jego używanie albo muszą zamienić PR na coś innego.
Mam jeden przypadek, gdy site: dla katalogu pokazuje 1 i żadne treści znajdujące się na jego podstronach nie są wyszukiwane. Zarówno unikalny fragment treści szukany w „”, jak i wpisywanie frazy razem z site:nazwadomeny.pl
Pozostaje zrobić całkiem inna stronę, najlepiej firmową wizytówkę z site:10 ;)
Dla Google to bez różnicy :) tylko by treść była nowa.