Pierwszego marca Google udostępnił plik Search Quality Rating Guidelines, w którym znajdują się informacje dotyczące wytycznych pracy zespołu oceniającego jakość stron internetowych. Wyniki wyszukiwania Google są bowiem oceniane nie tylko przez automatyczne algorytmiczne czynniki, ale również przez ludzi. Informacje te do tej pory były poufne i wzmianki o nich pojawiały się jedynie w nieoficjalnych przeciekach. W dokumencie opisane jest między innymi, jak Google znajduje, a następnie indeksuje strony, dzięki czemu pojawiają się w wynikach wyszukiwania. Wyjaśnione jest również, jak Google zwraca konkretne wyniki, gdy użytkownik wprowadzi zapytanie, a także w jaki sposób decyduje, które strony są bardziej istotne i wyższej jakości, co pozwala im wpływać na pozycje w wynikach wyszukiwania. Wszystkie te wytyczne mają na celu walkę z webspamem, która prowadzi do usuwania z wyników zbędnych i bezużytecznych witryn, stworzonych w celu dowartościowania innych witryn pod kątem ich widoczności w naturalnych wynikach wyszukiwania.
Na podstawie wytycznych, których fragment opublikowano, pracownicy Google muszą ocenić przydatność strony docelowej dla użytkownika w kontekście wyszukanej frazy. Przy takiej ocenie trzeba ustalić jaki charakter ma wyszukiwana fraza. Może to być zapytanie akcji – gdy użytkownik szuka stron, na których może złożyć zamówienie, dokonać zakupu, pobrać plik itp., zapytanie informacyjne – wyszukiwanie informacji na zadany temat, bądź zapytanie nawigacyjne – gdy użytkownik chce trafić na konkretną stronę. Ocenie przydatności podlega tylko treść znajdująca się na stronie docelowej, na którą użytkownik trafia po wpisaniu wyszukiwanego hasła, a nie cała witryna.
A co jeśli wpisana fraza ma wiele znaczeń? W tym celu stworzono następujące oznaczenia: dominujące – przychodzi do głowy jako pierwsze, powszechne – gdy żadne ze znaczeń nie jest dominujące oraz mało istotne – rzadko używane znaczenia danej frazy lub słowa.
Ostatecznie strona może być:
– istotna, zapytanie wskazuje, że użytkownik chciał trafić właśnie na tę stronę. Są to najczęściej strony firm itp. Ocenę tę może dostać tylko jedna strona docelowa;
– przydatna, strony wysokiej jakości, trafne dla wyszukiwanego hasła i przydatne dla większości użytkowników wpisujących daną frazę;
– odpowiednia, podobnie jak strony oznaczone jako przydatne tylko mniej obszerne i aktualne, pochodzące z mniej zaufanych źródeł;
– średnio przydatna, strony nie są przydatne, jednak jakoś powiązane z szukanym hasłem. Strony te mogą być niskiej jakości, zawierać mało i nieaktualne treści. Do tej kategorii zaliczane są też strony zbyt ogólne lub o niszowej tematyce i okrojone, mobilne wersje stron;
– nie na temat, nie są powiązane z wyszukiwanym hasłem i nie spełniają oczekiwań użytkowników. Ocenę taką dostają strony wprowadzające w błąd, skupiające się na reklamach i linkach, nie dostarczające poza tym żadnej treści. Często są to po prostu strony oznaczone jako spam;
– brak oceny, strony w budowie, zwracające nagłówek 404 lub nie wczytujące się.
Strony oceniane są również w odniesieniu do lokalizacji osoby szukającej i zawartej w zapytaniu. Strony zwracane w wynikach wyszukiwania dopasowane są do lokalizacji użytkownika, w szczególności do kraju. Dla fraz, które zawierają lokalizację (nazwę miejscowości, kod pocztowy itp.), wyświetlane są wyniki z danej lokalizacji. W takich przypadkach najwyżej oceniane są strony lokalne i oficjalne strony miejscowości.
Dodatkowo do strony może zostać przypięta jedna z flag: nie spam, prawdopodobnie spam, spam, strona szkodliwa. Brak oceny, czyli status “Unratable”, jest ustawiany dla stron 404, stron w budowie, wyświetlających komunikat o prawdopodobnej szkodliwości lub gdy pod adresem znajdują się podejrzane pliki. Przy nakładaniu flag nie ma znaczenia szukana fraza. Spamem są strony stworzone w celach zarobkowych nie mające wartości dla użytkowników.
Wykres pokazuje liczbę domen, w przypadku których zostały podjęte przez Google ręczne działania antyspamowe w określonym czasie, z podziałem na różne rodzaje spamu.
Przy oznaczaniu stron jako spam zwracana jest uwaga na:
– ukryte teksty – niewidoczne, w kolorze tła, minimalnej wielkości, ustawione poza widocznym polem. Nie każdy ukryty tekst jest spamem, czasem po prostu webmaster ukrywa datę aktualizacji. Treści te znaleźć można: zaznaczając wszystko (ctrl+a), wyłączając css, wyłączając javascript, oglądając źródło strony.
– upychanie słów kluczowych – słowa kluczowe, lub powiązane z nimi, powtórzone wielokrotnie na stronie; wielokrotne literówki; tekst, który zasadniczo nie ma żadnego sensu lub jest zlepkiem słów kluczowych, również generowany automatycznie. Upychanie słów kluczowych może mieć miejsce również w adresie, nieraz dynamicznie generowanym.
– podchwytliwe przekierowania – przekierowanie na stronę na innej domenie w celu zmylenia robotów indeksujących; przekierowanie ma kilka poziomów; samo przekierowanie może być dynamiczne, jeden link może dać za każdym razem inną docelową stronę.
– przykrywka – kiedy strona pokazuje inną zawartość użytkownikowi, a inną robotom; przekierowanie javascript; dwie ramki na stronie, z czego jedna zajmuje 100% okna.
– strony z zawartością reklamową – zawierają głównie skopiowaną treść; zawartość tworzoną za pomocą kanałów RSS; niemal identyczną treść, ale udają, że są dopasowane do zapytania; strony szablonowe, służące do masowej reprodukcji stron; fałszywe strony wyszukiwania, gdzie wyniki są płatnymi linkami; fałszywe blogi i fora.
– strony „komercyjne” – strony partnerskie, które zarabiają na wysyłaniu do stron firmowych, a nie dodają żadnej nowej treści; strony podszywające się pod strony firmowe; fałszywe katalogi; wygasłe domeny, które ktoś kupił, żeby mieć od razu dotychczasową moc domeny i jej linków; domeny z literówką, liczące na to, że ktoś się pomyli przy wpisywaniu adresu; domeny, które ktoś mógłby wpisać, szukając adresu firmy/strony; strony phishingowe;
Istnieją wyjątki, takie jak: porównywarki cen, portale z recenzjami produktów (o ile są oryginalne), przepisami kulinarnymi, tekstami piosenek itp., posiadające wysokiej jakości zawartość, które są przydatne dla użytkowników, mimo że zostały stworzone w celach zarobkowych. Dodatkowej wiarygodności stronom zarobkowym dodają opublikowane dane kontaktowe, polityka prywatności czy adres firmy.
To tylko część wytycznych dla pracowników oceniających strony docelowe dla wyników wyszukiwania. Warto je wziąć pod uwagę przy tworzeniu lub optymalizacji stron internetowych, a w szczególności stron zaplecza seo.