Google wie więcej niż pokazuje – znowu site:

Ostatni wpis na blogu był o operatorze site:. Postanowiłem pójść za ciosem i dziś także będę o nim pisał.
Nie będę jednak znowu zastawiał się nad umiejętnościami matematycznymi wyszukiwarki.
Dziś chciałbym napisać parę słów o tym, że Google pokazuje nam „jedno” a w swych trzewiach mieli coś innego.

Czy pokazuje wszystko co wie?

Od zawsze pozycjonerzy zastanawiają się co wyszukiwarka wie o danej witrynie w kontekście tego co nam o niej pokazuje.
Jak wiemy, teoretycznie możemy sprawdzać wiele parametrów analizując witrynę. Od zawsze najważniejsze parametry to ilość linków przychodzących (pomijając ich jakość) oraz ilość zindeksowanych podstron.

Operator link: już kilka lat temu niestety przestał poprawnie funkcjonować. Pokazywane ilości mają się nijak do stanu rzeczywistego i są bardzo mylące.
Więcej informacji możemy uzyskać w GWT ale musimy się najpierw autoryzować a to może zrobić jedynie ktoś kto ma dostęp do serwera.

Operator site: do dziś używany przez wszystkich by sprawdzić czy Google nas lubi i premiuje nas dużą cyferką czy też nie i cyferka jest mała.
Ogół ludzi zajmujących się SEO przyjął, że jak jest dużo to dobrze a jak mało to źle. Lepiej przecież mieć link z witryny, która jest dobrze zaindeksowana bo wtedy szybciej i więcej tego linka zostanie dostrzeżone.

Wszystko wydaje się logiczne i oczywiste. Do czasu…..

Site = 1

Pisałem kiedyś o jednym z moich serwisów, który ma jakiś dziwny filtr powodujący wyindeksowanie podstron z Google aż do strony głównej.

Bawiłem się z Google co jakiś czas robiąc drobne zmiany w wyglądzie i adresy URL. Po tym indeks znowu rósł by po jakimś czasie zanikać i zostawała tylko strona główna.

site w google dla www.alpinistyka.pl

Ostatnio nie mam na zabawy czasu, mam ochotę zrezygnować z katalogu w tej domenie i po prostu zrobić tam serwis zbieżny z nazwą domeny.

Serwis podlinkowana jest OK, wg GWT prowadzi do niego lekko ponad 49 tys. linków z 551 innych serwisów. Site powinien więc być więc OK. Ot jest jakiś filtr, trzeba więc domenę przeznaczyć na coś lepszego, pewnie zniknie.

Jednak site = 1 nikogo nie dziwi i mnie też by to nie dziwiło a nad filtrem zastanawiałem się już nie raz.

Nie było by więc tematu do przemyśleń gdyby nie to, że …

To skąd te link są jak nie ma podstron

Któregoś dnia analizując w GTW linki prowadzące do mojego bloga zauważyłem ciekawą rzecz.

Google nie krępując się niezręcznością i niedorzecznością sytuacji w innym miejscu niż wyszukiwarka informuje mnie, że z domeny alpinistyka.pl prowadzi do bloga

linki z alpinistyka.pl

Jakże więc to możliwe jeśli w SERPach wyświetlana jest cyferka 1 jako ilość podstron, które zna, więc i linków powinno być 1 a nie ponad 20 tys.

Po co istnieje operator site

Moim zdaniem taka różnica jest możliwa i nie jest żadnym błędem.

Wiemy o tym, że są dwa światy – SEO vs. Reszta, choć niestety wpatrzeni w monitory często o tym zapominamy.

Jak już pisałem pozycjoner użyje site: po to by dowiedzieć się ile podstron danego serwisu „jest w Google”. Wyciągnie z tego mniej lub bardziej sensowne wnioski.

„Reszta” – jeśli już wie, że coś takiego istnieje użyje go by sprawdzić czy w obrębie danej domeny znajdują się jakieś podstrony z określoną treścią. Opisałem to w tym wpisie.
I tak się powinno tego operatora używać. Bo korzystając z site: powinniśmy zobaczyć tylko podstrony, które są warte tego by wyszukiwarka je nam pokazywała a nie te, z którymi się zapoznała.

Piszę „powinniśmy” bo nieraz mam wrażenie, że nawet z tym sobie nie radzą.

Błędne wyciąganie wniosków

Po zastanowieniu i przeanalizowaniu sytuacji (nie tylko tej jednej z przykładu) dochodzę do wniosku, że nie powinniśmy opierać się w takim stopniu na tym operatorze bo dochodzimy do błędnych wniosków.

Sprawdzamy i widzimy, jak w przykładzie, site=1 myślimy sobie:
– słaba domena
– mało linków przychodzących
– Google jej nie odwiedza
– nie warto z niej się linkować
– itp

Jednocześnie nie zaświta nam w głowach myśl, że:
– domena jest podlinkowana OK
– serwis jest zaśmiecony
– serwis duplikuje treść
– może mieć słabą nawigację
– ktoś kombinuje z serwisem np poprzez ataki XSS co obniżyło jego wiarygodność.
– warto z niej linkować

Wynika to z tego, że brakuje nam danych do pełnej analizy.

GWT

Kiedyś, korzystając z site, można było założyć, że dowiemy się jak nas Google traktuje i wnioski były poprawne.
Jednak od uruchomienia GWT, sytuacja ulega zmianie. Google promuje te narzędzia i powoli zmusza nas do tego by zacząć z tego korzystać.

Jeśli szukasz czegoś w domenie użyj site, jeśli chcesz się dowiedzieć jak idzie współpracy Google <–> Twoja witryna, sprawdź to w GWT tak jak w przypdaku operatora link:.

Proste i logiczne, tylko co niedługo zrobią ludzie od SWLi, w których ten operator jest głównym wykładnikiem oceny danego serwisu.

Śmiem twierdzić, że ocenianie wartości serwisu korzystając z site mija się z celem i jest błędne.

Powoli osobiście odchodzę od tego, starając się zwracać uwagę na inne rzeczy. Zdaje sobie sprawę jednak z tego, że jest to trudne.

Tajemnicze Google

Jak widzimy Google nie pokazuje nam w jednym miejscu wszystkiego co wie o jakimś serwisie. Uważam, że jest to celowe działania i lepiej już nie będzie.

By jakakolwiek analiza była w miarę dokładna dane trzeba zebrać z wielu narzędzi i wyszukiwarek a nie tylko z Google.

Warto o tym pamiętać następnym razem szukając nowych miejsc na linki.

8 komentarzy

  1. Autor Łukasz dodany 11 grudzień, 2010

    a skąd masz pewność, że w GTW – linki, są aktualne? w moim jednym z przypadków, stronę którą pozycjonuje (wcześniej ktoś inny to robił) jest pokazane wiele linków z stron ala SWL (wcześniejszy master tak działał) tylko, że obecnie już ich nie ma mimo tego że w GTW widnieje wiele linków z takich stron, niektóre nawet są off, a linki mimo tego widnieją

    drugie, jak G dba o jakość SERP’ów, po co miałby w swojej bazie trzymać 20k marnej jakości podstrony?

  2. Autor mkane dodany 11 grudzień, 2010

    a skąd masz pewność, że w GTW – linki, są aktualne?

    Bo widzę z jakich urli idą. Większość jest z adresów, które zrobiłem przy ostatnich zmianach.
    Nie twierdzę, że wszystkie bo widzę też adresy, które były potrzednio ale jest ich mało.

    drugie, jak G dba o jakość SERP’ów, po co miałby w swojej bazie trzymać 20k marnej jakości podstrony?

    Jakby G dbał o SERPy to by usunął minimum 30-40% tego co pokazuje.
    Te zdanie jednak potwierdza mój wpis, to co jest pokazywane w SERPach jest tylko częścią tego co G przelicza i prawdopodobnie bierze pod uwagę.

    @Bigu
    W GWT po dodaniu xml`owej mapy, mam informacje, że w indeksie jest 96 podstron. Jak wiemy pokazuje 1.

  3. Autor Łukasz dodany 12 grudzień, 2010

    Jakby G dbał o SERPy to by usunął minimum 30-40% tego co pokazuje.
    Te zdanie jednak potwierdza mój wpis, to co jest pokazywane w SERPach jest tylko częścią tego co G przelicza i prawdopodobnie bierze pod uwagę.

    w sumie racja, nie powinno być tego między pierwszym a drugim przecinkiem :)

    wracając do podstron, po co Google miałoby uwzględniać linki z podstron, które nie są dostępne dla użytkownika

    teraz (00:40) np. wg. site są 2 dodatkowe podstrony

  4. Autor mkane dodany 12 grudzień, 2010

    po co Google miałoby uwzględniać linki z podstron, które nie są dostępne dla użytkownika

    Bo w algo Page Rank każda podstrona ma jakąś „moc” a brak jej w indeksie ma inną przyczynę.

    teraz (00:40) np. wg. site są 2 dodatkowe podstrony

    A teraz znowu jest tylko 1 (strona główna).
    Podczas pisania dodałem do GWT mapę xml dlatego w indeksie może się coś pojawiać.
    Stan site=1 dla tej domeny to minimum 3 miesiące.

  5. Autor Ząbek dodany 14 grudzień, 2010

    Ciekawy wpis. Trzeba przyznać, że z tym site’em to różnie bywa. Mnie martwi/ciekawi jeszcze coś innego, aktualizacje Page Ranku.

    Ostatnio długo coś wszystko jakby zastygło w miejscu, nie zauważyłem na swoich stronach jakiś większych zmian. Pomimo linkowania domen z wysokim PR, cyferki „nie chca” przejść dalej.

    Masz jakiś pomysł na to :) ?

  6. Autor mkane dodany 14 grudzień, 2010

    aktualizacje Page Ranku

    Aktualizacja jest robiona na bieżąco, nie ma tylko masowego eksportu PR toolbar.
    Około roku temu Google przebąkiwało, że zrezygnuje z tego działania. Możliwe, że właśnie zostało to zrobione. Częściowe eksporty są robione często.

    Pomimo linkowania domen z wysokim PR, cyferki „nie chca” przejść dalej.

    Hmm, kilka razy miałem ostatnio sytuacje, że po dopaleniu dobrymi linkami PR wzrósł dla dopalonej domeny. Choć łatwiej spada, niż wzrasta.

    Jakbym miał odpowiedzieć, co się dzieje z Page Rankiem to szczerze musiałbym powiedzieć – nie wiem ale niewiele mnie to interesuje.

    Pamiętajmy też o tym, że w 2012 roku Google traci patent na Page Rank i albo zapłacą Uniwersytetowi Stanforda za jego używanie albo muszą zamienić PR na coś innego.

  7. Autor Marek dodany 3 styczeń, 2011

    Mam jeden przypadek, gdy site: dla katalogu pokazuje 1 i żadne treści znajdujące się na jego podstronach nie są wyszukiwane. Zarówno unikalny fragment treści szukany w „”, jak i wpisywanie frazy razem z site:nazwadomeny.pl
    Pozostaje zrobić całkiem inna stronę, najlepiej firmową wizytówkę z site:10 ;)

  8. Autor mkane dodany 4 styczeń, 2011

    najlepiej firmową wizytówkę z site:10 ;)

    Dla Google to bez różnicy :) tylko by treść była nowa.