Posty z Marzec, 2007

Gdzie moje podstrony?

Od kilku tygodni na różnych forach toczy się dyskusja nad nowym „filtrem” Google, który przy użyciu operatora „site” pokazuje np.: tylko 260 wyników. Powtórzenie tego wyszukiwania z wyłączonym filtrem pokazuje już pełną liczbę zaindeksowanych stron.

Przeglądając moje strony znalazłem 3szt., gdzie można było zaobserwować taki wynik.
Po kilkudniowych obserwacjach nie zauważyłem jednak by w jakikolwiek sposób szkodziło to tym stronom. Po około tygodniu od zauważenia na dwóch stronach ten operator zaczął zachowywać się normalnie.

Niektórzy snują domysły, dlaczego tak jest, co zrobić by strona nie wpadła w taki filtr i co zrobić by z niego się wydostać. Moja odpowiedz brzmi – nic nie robić.

Dlaczego? Bo to prawdopodobnie nie jest filtr tylko błędne działanie tego operatora, do stanu tego poniekąd przyznano się na jednym z oficjalnych blogów Google z informacją, że kiedyś to naprawią jednak nie prędko, bo to nie przeszkadza „normalnym” używaniu tego operatora, czyli wyszukaniu danej frazy w obrębie jednej strony.

Dziś za to możemy obserwować totalne szaleństwo.
Na jednej z moich stron zauważyłem takie o to cudo
„Rezultaty od 1 – 2 z około 0 z ********** z włączonym . (Znaleziono w 0,13 sek.)”.
Ciekawie mnie przeogromnie jak mogą być dwa rezultaty z zera :) na stronie, która ma mało bo tylko 5 podstron ale są one zaindeksowane.

Na Kolejnej stronie
„Wyniki 1 – 2 z 2 z domeny ********** dla zapytania . (Znaleziono w 0,94 sek.)”, przy wyłączonym filtrze około 2,5k podstron.

I jeszcze jedna „Wyniki 1 – 3 z 3 z domeny ********** ”, strona ma zaindeksowane ponad 5k podstron.

No zabawnie dziś jest, niektórzy pewnie już testują, dlaczego tak jest a ja jednak będę powtarzał, że to po prostu kolos się chwieje, bo za dużo kombinuje.

„Sieczkę” z tym operatorem opisałem już w tamtym roku w tym wpisie, jak widać po prostu załatali wtedy dziurę “na okrętkę”, lecz szew puścił lub rozdarło się w innym miejscu i znowu mamy aferę.

Nie dokazuj Miły, nie dokazuj!

Od początku roku obserwuję coraz częściej „karne 403” w wynikach wyszukiwania.
ban1a.jpg

Częściowo rozumiem Google, jest to zwykły mechanizm mający niby uniemożliwiać korzystanie z wszelakich rodzajów skryptów, botów itp. czyli wyszukiwań automatycznych.
Nie rozumiem jednak, dlaczego korzystając intensywnie z wiodącej wyszukiwarki, wpisując wszelkiego typu zapytania ręcznie, prawie codziennie napotykam ten screen. Zaczynam się naprawdę martwić, co jeszcze Google wymyśli, co ograniczy, by zaoszczędzić promile mocy czy też transfer.

Te ograniczenie polegające na capchy jest niewygodne, można jednak jakoś z tym pracować.
Niestety po pewnym czasie, nieraz kilku dosłownie wyszukiwaniach, mym oczom ukazuje się taka informacja

ban2a.jpg
już bez możliwości przejścia dalej i jestem zmuszony przełączyć się na inne IP by cokolwiek dalej robić.
Ten czasowy ban mija po kilkunastu minutach, jednak będąc w toku jakiś prac utrudnia to niesamowicie życie. 

Czekam dalej by zobaczyć co jeszcze wymyslą by ich serwery jak najmniej się napracowały…

Szukanie podstron w wyniku uzupełniającym

     Kilka osób pytało się mnie jak określić liczbę podstron znajdujących się w „wynikach uzupełniających”.
Strony takie wyszukujemy operatorem site:nazwa-domeny *** -view.
Sprawdźcie swoje strony, naprawdę wyniki takiego zapytania nieraz są zatrważające.

     Aktualnie „Supplemental Result” jest jednym z głównych kierunków moich testów.
Mam nadzieję, że w ciągu dwóch miesięcy będę mógł podzielić się z Wami, tutaj na mym blogu, wynikami tych testów wraz z radami jak najskuteczniej go uniknąć lub przynajmniej zminimalizować ilość stron w tym indeksie.

GoogleBan

     W styczniu kupiłem domenę, którą używał jakiś czas temu „niedobry spamer” :) Kupiłem ją świadomie wiedząc o jej historii, by za radą Google zażądać ponownego uwzględnienia, jako nowy, w pełni przestrzegający zaleceń, właściciel. Od dwóch miesięcy do domeny prowadziły linki z moich stron, bot odwiedził ją raz, nie pojawiła się w indeksie.
Dodałem tą domeną do mojego zestawu map w panelu Google i użyłem magicznego linku z anchorem „Prześlij żądanie ponownego uwzględnienia”. Na wynik tej czynności pozostaje mi teraz czekać.
     Jakież jednak było moje zdziwienie, gdy okazało się, że mimo ewidentnego bana są o niej informacje, do tego aktualne, przynajmniej jeśli chodzi o PR.
W zakładce „Statystyka” w sekcji „Statystyki indeksowania” ujrzałem, że moja domena, nie przejmując się banem aktualny posiada PageRank

PageRank zbanowanej domeny

     nie tylko dla strony głównej ale także dla podstron.

PageRank postron

     W sekcji „Analiza stron” jak na dłoni pokazane są słowa z treści tej strony

treść witryny

      a w podsumowaniu diagnostyki widnieje zdanie „W indeksie Google nie są aktualnie uwzględnione żadne strony tej witryny. Zaindeksowanie może zająć trochę czasu…….”  

     Domena nie była używana od połowy 2005r. a ta ciekawa sytuacja może wskazywać fakt, że istnieje indeks dla zbanowanych domen lub wcale nie są one usuwane z indeksu głównego, tylko posiadają atrybut określający ban.

     Wśród pozycjonerów istnieje podejrzenie, że domeny są usuwane z indeksu ręcznie, jednak jeśli Google zachowuje i przelicza dane domen usuniętych, mogę podejrzewać, że prędzej czy później wyciągną z tych danych „wspólny mianownik” i stworzą narzędzie do automatycznego banowania stron, co na pewno podniosłoby skuteczność i jakość wyszukiwania. Jak wiemy z tym jest coraz większy problem. Możliwe też, że mechanizm ten ma zapobiec ponownemu użyciu, idealnie tej samej treści na nowej domenie. Tej teorii nie jestem jednak w stanie sprawdzić, ponieważ w mojej karierze nie udało mi się doprowadzić żadnej strony do usunięcia z indeksu.

     Nie można też się dziwić, że nasza ulubiona wyszukiwarka ma takie problemy z przeliczaniem czegokolwiek, jak trzyma tak dużo danych o dziesiątkach tysięcy domen, które teoretycznie nie istnieją.

Addurl by Google

Pewnie kiedyś zastanawialiście się jak działa mechanizm zgłaszania stron w Google i czy jest on skuteczny.
     

     Ja też się zacząłem nad tym zastanawiać w styczniu tego roku po rozmowie z moim znajomym, który żalił się, że nie ma wcale wejść z Google na swoją stronę.
Po bardzo krótkiej analizie z mojej strony oczywistym stał się fakt, że nie może mieć żadnych wejść bo strona nie jest nawet zaindeksowana :).
Na pytanie, co zrobił po umieszczeniu strony na serwerze usłyszałem, że jak to co… zgłosił ją w Google, poprzez formularz na stronie http://www.google.com/addurl/?continue=/addurl i zaraz dodał „a co miałem jeszcze zrobić?”.
Ma racje, co miał zrobić jeszcze, przecież ma stronę i dodał ją do wyszukiwarki tak jak ona zaleca, więc jest OK.
Tak pewnie robi miliony ludzi na całym Świecie, nie każdy posiadacz strony od razu musi się znać na wyszukiwarkach.
Ja sam użyłem tego formularza ostatni raz bodajże z 5 lat temu i oprócz świadomości, że istnieje nie pamiętam bym nawet przypadkowo wszedł na tą stronę.
Po rozmowie z nim postanowiłem sprawdzić, czego można oczekiwać używając tego formularza.

     W dniu 28.01.2007 około godziny 2.30 umieściłem na serwerze domenę, nigdy nie zaindeksowaną w żadnej z wyszukiwarek tzw. świeżynkę :)
Od razu postanowiłem zapoznać ją z Google wypełniając wspomniany formularz.
Założyłem, że test ten będzie trwał koło miesiąca i co 7 dni będzie na nowo zgłaszana.

Dlaczego kilka razy a nie raz ?

Zdaje sobie sprawę z ilości domen, jaka jest zgłaszana poprzez tą stronę, nie wiem jednak jak ten mechanizm działa, więc wedle zasady „od przybytku głowa nie boli” zgłoszenie było kilkukrotne.
Test zakończyłem dziś w nocy, czyli 1.03.2007 koło godziny 3.00 poprzez wyłączenie testowej domeny.

Dlaczego tak krótko ?

Miesiąc czasu to aż nadto na zaindeksowanie domeny, nie wysilając się można to zrobić w 2 tyg. Jak potrzeba szybko to czas pomiędzy 2-5 dni jest wystarczający.

Jakie wyniki tego „testu” ?

No właśnie żadne! I wcale nie chodzi mi o to, że domeny nie ma w indeksie lub test się nie powiódł.
Pisząc „żadne” mam na myśli to, że domeny owej GoogleBot  nie odwiedził ani razu.

Log na serwerze miałem czysty jak śnieg w Himalajach. Jego wielkość wynosiła 0 bajtów, bo nic w nim nie było.

     Od rana zastanawiam się, po co więc ogólnodostępny formularz zgłaszania witryn jak nikt lub nic z niego nie korzysta chodzi o własciciela czyli G.
Jedyna myśl, jaka mi przychodzi do głowy jest taka, że to po prostu pozostałość po starym, odchodzącym w niepamięć Google, porzucona podstrona, o której zapomnieli albo z rozmysłem „jest” by ten coraz większy twór był bardziej ludzki.
By Pan Kazik i Pani Frania, którzy z jakiś powodów mają swoją stronę a o Google słyszeli bo jest to standard, nawiązali swój pierwszy kontakt i zaczęli się zapoznawać z tą wyszukiwarką, drugim kontaktem pewnie powinien być AdWords.
Zostaje jeszcze możliwość, że są długotrwałe problemy techniczne, lecz jakoś w to wątpię.
 

Na koniec, jak widać formularz ten z punktu widzenia pozycjonowania oraz SEM jest absolutnie nieprzydatny.