Indeksowanie strony internetowej www w Google – które podstrony zablokować przed robotem Google?

Pozycjonując swoją stronę internetową, na pewno często sprawdzasz, w jaki sposób wyświetla się ona w wynikach wyszukiwania, […]

Czas czytania: 3 minut
Opublikowane: 21 marca, 2021

Pozycjonując swoją stronę internetową, na pewno często sprawdzasz, w jaki sposób wyświetla się ona w wynikach wyszukiwania, na jakich pozycjach, a także czy Twoi potencjalni lub stali klienci znajdują te informacje oraz oferty, których poszukują. To, czy Twoja witryna lub jej podstrony są widoczne w Google, zależy od Googlebota (tzw. robota Google) oraz indeksacji. Czym jest indeksowanie strony w Google i których podstron nie należy indeksować?

Jak działa indeksowanie stron w Google?

Najprościej opisując ten proces, indeksowanie stron internetowych polega na ich analizie, ocenieniu wartości i dodaniu do indeksu – uporządkowanego katalogu witryn Google. Korzystając z wyszukiwarki, przeglądasz ten katalog, a Google podpowiada Ci najlepiej pasujące do zapytania zaindeksowane pozycje.

Jak sprawdzić, czy moja strona jest zaindeksowana w Google?

Najłatwiej to sprawdzić poprzez wpisanie domeny w wyszukiwarkę. Jednak, jeśli domena nie jest oryginalną nazwą a zawiera popularne słowa, nazwy czy frazy, np. sklep-rowerowy, to nadal możemy nie zobaczyć swojej strony w wynikach wyszukiwania – co nie znaczy, że nie została ona zaindeksowana.

Najbardziej skutecznym sposobem na sprawdzenie, czy nasza strona internetowa oraz które jej podstrony są zaindeksowane, jest wpisanie formuły „site:domena”, np. „site:brandnewportal.dfirma.pl”. W ten sposób otrzymamy wyniki tylko z podstronami naszej witryny. Możesz również wpisać konkretną podstronę, która niedawno została utworzona, np. „site:brandnewportal.dfirma.pl/seo/sprawdz-znasz-podstawy-seo/”

Warto także zainstalować kod Google Search Console (GSC) – bezpłatnego narzędzia marketingowego od Google, które wspiera administratorów stron internetowych w ich optymalizacji. Dostarcza informacje na temat ruchu organicznego, po wpisaniu jakich słów kluczowych użytkownicy pojawili się na stronie, ale także pozwala monitorować stan indeksacji. Wystarczy skorzystać z raportu Stan indeksowania. W panelu znajdziesz też informacje o błędach na stronie i możliwych powodach, dla których niektóre podstrony nie są widoczne w Google.

Których podstron nie należy indeksować w Google?

Jeśli nie zablokujesz przed Googlebotem niektórych podstron, możesz mieć problemy nie tylko z pozycjonowaniem i obniżeniem oceny użyteczności, ale też ujawnić poufne dane. Szczególną ostrożność powinni zachować administratorzy sklepów internetowych oraz innych witryn, przez które generują leady i pozyskują dane.

Uważaj na duplikację treści

Przede wszystkim nie pozwól na duplikację treści, tzw. duplicate content. Chodzi o powielenie tych samych treści na kilku podstronach. Mogą to być regulaminy, certyfikaty czy polityka prywatności, ale także kilka adresów URL dla tego samego produktu, jednak w różnych wariantach wzorów. W tym przypadku kilkukrotnie stworzona jest ta sama podstrona. Problemy z duplikacją treści są często skutkiem błędów w konfiguracji różnych wersji językowych strony, powielenia opisów kategorii oraz opisów produktów, wdrożenia SSL bez przekierowań z http na https, a nawet powieleniem strony głównej pod różnymi adresami.

Przez duplikację Google nie wie, którą wersję ma wyświetlić. Prowadzi to do obniżenia widoczności strony w wynikach wyszukiwania, a tym samym spadku widoczności i ruchu organicznego.

Miejsce docelowe konwersji

Jest wiele sposobów na generowanie leadów na stronie internetowej. Użytkownicy skierowani na landing page, muszą zostawić swoje dane, aby np. zapisać się do newslettera, zarejestrować na wydarzenie czy otrzymać dostęp do dedykowanych materiałów, jak e-booki, wideo czy poradniki. Sprawdź, czy twoje materiały lub tzw. Thank You Page nie są zaindeksowane.

Czego nie powinny indeksować sklepy internetowe?

No indeksowanie powinny uważać szczególnie firmy e-commerce. Przed robotem Google powinny zablokować:

  • podstrony z zamówieniami,
  • podstrony z koszykiem zakupowym,
  • wewnętrzną wyszukiwarkę,
  • puste podstrony, generowane chociażby przez filtry,
  • podstrony generowane przez tagi – jeśli nie są odpowiednio zbudowane z uwzględnieniem dobrych praktyk SEO,
  • formularze i miejsca konwersji, np. formularz rejestracji lub logowania.

Jak blokować podstrony przed Googlebotem?

Wybrane podstrony można zablokować przed robotem Google na kilka sposobów:

  1. zgłoszenie w Google Search Console;
  2. dodanie znacznika meta robots noindex – ta metoda pozwala usunąć podstronę z indeksu oraz zabezpieczyć ją przed indeksacją;
  3. dodanie pliku robots.txt – zablokuje indeksację podstrony lub pliku, jednak nie cofnie indeksacji;
  4. dodanie nagłówka 404 lub 410.

Monitoruj indeksację swojej witryny

Indeksowanie strony to ważny element działań SEO. Warto jednak często monitorować, czy podstrony, które mają pozytywnie działać na widoczność witryny, są zaindeksowane oraz, czy te, które mogą szkodzić działaniom SEO lub ujawniać niewłaściwe informacje, są zablokowane przed robotem Google.

Sprawdź, czego dowiesz się z artykułu

starusersclockmagnifiercrossmenuarrow-right-circletext-align-justify