Para cada pesquisa que você faz, existem milhares, às vezes milhões, de páginas da Web com informações úteis. A forma como o Google determina quais resultados serão mostrados começa muito antes de você digitar e é orientada pelo compromisso de oferecer as melhores informações para você.
Como a Pesquisa organiza informações?
Antes de você pesquisar, os rastreadores da Web coletam informações de centenas de bilhões de páginas e organizam essas informações no índice da Pesquisa.
O processo de rastreamento começa com uma lista de endereços da Web de rastreamentos anteriores e sitemaps fornecidos pelos proprietários dos sites. Quando os rastreadores do Google acessam esses sites, os links deles são usados para encontrar outras páginas. O software se concentra principalmente nos sites novos, nas alterações de sites existentes e nos links inativos. São utilizados programas de computador para determinar quais sites serão rastreados, com que frequência e quantas páginas serão buscadas em cada site.
O Google oferece o Search Console para disponibilizar aos proprietários de sites instruções detalhadas sobre como faz o rastreamento dos sites deles. Eles podem fornecer instruções detalhadas sobre como processar páginas, solicitar um novo rastreamento ou desativar totalmente esse processo usando um arquivo chamado “robots.txt”. O Google nunca aceita pagamentos para rastrear sites com mais frequência e oferece as mesmas ferramentas para todos os sites a fim de garantir os melhores resultados possíveis para seus usuários.
A Web é como uma biblioteca que não para de crescer, com bilhões de livros e sem um sistema central de catálogo. O Google utiliza softwares conhecidos como rastreadores da Web para detectar as páginas disponíveis ao público. Os rastreadores analisam as páginas e seguem os links delas, da mesma forma que você faria se estivesse navegando pelo conteúdo na Web. Eles vão de link em link e levam dados sobre essas páginas para os servidores do Google.
Quando os rastreadores encontram uma página da Web, os sistemas do Google processam o conteúdo da página da mesma forma que um navegador. São detectados sinais importantes, como as palavras-chave e a idade do conteúdo do site, e registrados tudo isso no índice da Pesquisa.
O índice da Pesquisa Google contém centenas de bilhões de páginas da Web e mais de cem milhões de gigabytes de tamanho. Ele funciona como o índice remissivo dos livros, com uma entrada para cada palavra vista em todas as páginas da Web indexadas. Quando uma página da Web é indexada, esta é adicionada às entradas de todas as palavras que ela contém.
Com o Mapa do conhecimento, o Google continua indo além da correspondência de palavra-chave para entender melhor as pessoas, os lugares e as coisas mais importantes para o usuário. Para fazer isso, são organizados dados sobre páginas da Web, mas também outros tipos de informações. Atualmente, a Pesquisa do Google pode ajudar você a pesquisar textos em milhões de livros de grandes bibliotecas, ver os tempos de deslocamento fornecidos pelo departamento de trânsito local ou navegar nos dados de fontes públicas, como o Banco Mundial.
Este artigo foi extraído diretamente da Central de Ajuda do site da Google.