Blog

Sitemap.xml em SEO

Sitemap.xml em SEO

Ajude o Google a indexar as páginas do seu site utilizando um Sitemap. Neste artigo, você vai aprender o que é e a importância de um Sitemap.xml para SEO, para o posicionamento do seu site nos buscadores e mais: porque você deve começar a utilizá-lo imediatamente.

O que é XML?

XML (Extensible Markup Language) – em português: Linguagem Extensível de Marcação Genérica – recomendada pelo W3C, para gerar linguagens de marcação para necessidades especiais, com o objetivo de facilitar o compartilhamento e organizar as informações de forma organizada, hierárquica, como bancos de dados e textos.

O que é um Sitemap?

O Sitemap é um arquivo ou documento criado com o intuito de facilitar a indexação dos motores de busca, fornecendo informações relevantes sobre a estrutura e a organização do conteúdo das páginas do site. Diferente do que muitos pensam, os Sitemaps não são comandos para que os buscadores indexem as páginas imediatamente. São apenas dicas sobre a estrutura de URLs do site, mas que fazem uma grande diferença.

Com o passar do tempo, os sites de busca e seus crawlers ficam cada vez mais inteligentes e os esforços para encontrar novas páginas de conteúdo em sites se multiplicam. Entretanto, algumas páginas e conteúdos específicos como vídeos e linguagens como AJAX, possuem dificuldade de serem compreendidos pelos motores de busca e, em outros casos, pode levar bastante tempo para que páginas distantes (que necessitam de muitos cliques para serem acessadas) sejam encontradas e o Sitemap pode ajudar nisso.

Grandes portais de notícias, geram centenas de informações minuto a minuto e seria bem complicado contar apenas com a indexação natural e, até certo ponto lenta, dos motores de busca. Novamente entra em ação o Sitemap. Você já vai entender como e porque.

Sitemaps que o Google entende

O Google oferece suporte a vários tipos de Sitemap, limitado a 10mb não compactados ou armazenando um total de 50.000 URLs. Se houver necessidade de arquivos maiores ou mais URLs, o sitemap deve ser dividido em vários arquivos como o descrito anteriormente além da criação de um arquivo de índice para os demais. Vamos aos formatos suportados:

Sitemap.XML

O Sitemap.xml é um dos formatos mais populares e mais utilizados. O Google suporta o protocolo de Sitemaps padrão e também extensões XML para vídeos, imagens, dispositivos móveis e recursos de notícias. Aproveite os recursos disponíveis e crie arquivos para auxiliar o Google a indexar conteúdos difíceis como vídeos e imagens.

Veja um exemplo de Sitemap.xml simples:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.exemplo.com.br/</loc>
   </url>
</urlset>

Agora vamos dar uma olhada em um Sitemap.xml que possui informações de imagem e de vídeo disponíveis na página:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  <url>
    <loc>http://www.exemplo.com.br</loc>
    <image:image>
       <image:loc>http://exemplo.com.br/imagem.jpg</image:loc>
       <image:caption>Descrição da minha imagem</image:caption>
    </image:image>
    <video:video>
      <video:content_loc>
        http://www.exemplo.com.br/nomedovideo.flv
      </video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.exemplo.com/videoplayer.swf?video=nome
      </video:player_loc>
      <video:thumbnail_loc>
        http://www.exemplo.com/thumbs/miniaturadaimagem.jpg
      </video:thumbnail_loc>
      <video:title>Título do meu vídeo</video:title>  
      <video:description>
        Frase que melhor rescreve o meu vídeo.
      </video:description>
    </video:video>
  </url>
 

RSS, mRSS e Atom 1.0

Se você possui um site ou blog com RSS, existe a possibilidade de você enviar o URL gerado pelo feed como um Sitemap. Plataformas mais populares como Wordpress é capaz de gerar um feed do seu site, porém, a maioria deles considera apenas as URLs de conteúdos mais recentes. Feeds RSS e Atom 1.0 são utilizados para o detalhar o conteúdo comum e o feed mRSS para conteúdo vídeo disposto no site (mRSS significa media RSS).

 

RSS Sitemap

 

Texto

É possível enviar um Sitemap em um arquivo simples de texto, daqueles feitos no bloco de notas mesmo. Todavia, ele deve incluir somente URLs de páginas da web. Sendo assim, você pode criar um arquivo contendo uma URL por linha. Veja abaixo:

Sitemap em arquivo de texto TXT

 

Sites do Google

Sites criados através do Google Sites geram Sitemaps de forma automática, portanto você não precisa se preocupar em criar um. Caso deseje acessá-lo a URL que você deve colocar em seu navegador deve seguir a seguinte estrutura:

 

Sitemap Google Sites

 

Como criar um Sitemap.xml?

Agora que você já sabe o que é um Sitemap e quais são os formatos que o Google entende, vamos ver um passo a passo sobre como você pode criar um para o seu site agora mesmo. Por uma questão de padronização, vamos seguir o protocolo de execução do Sitemaps.org.

Manualmente

É possível criar seu Sitemap.xml através de um editor de texto. Para isso, veremos como o arquivo é escrito e qual a função de cada atributo presente nele.

Primeiramente, você deve informar em seu documento a versão XML seguida da codificação do arquivo, obrigatoriamente UTF-8. Veja abaixo:

<?xml version="1.0" encoding="UTF-8"?>

Para adicionar nossa primeira URL, vamos precisar inserir um atributo chamado que conterá todas as demais URLs do site. Junto da primeira URL vamos inserir algumas informações relevantes como prioridade e frequência. Veja como fica:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.exemplo.com/</loc>
      <lastmod>2015-03-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>

Entendendo cada atributo:

Atributo <loc>

É responsável por indicar ao site de busca qual URL você deseja listar. Você deve seguir o padrão de URL exigido pelo seu servidor para todas as URLs indicadas no documento, utilizando http://www ou http://, por exemplo.

Atributo <lastmod>

É responsável por indicar aos motores de busca a última modificação efetuada na página, sendo muito importante que a informação contida nele esteja condizente com o período em que realmente aconteceu a última modificação. Caso não seja possível verificar, recomendamos que este atributo não seja utilizado. Você deve seguir o formato de data e hora do W3C.

Atributo <changefreq>

É responsável por indicar aos buscadores com que frequência o conteúdo da página é atualizado. Os valores válidos para este atributo são: always, hourly, daily, weekly, monthly, anual ou never. Por exemplo, se você atualiza seu blog semanalmente, você pode especificar este atributo da seguinte forma:<changefreq>monthly</changefreq>

Atributo <priority>

É responsável por indicar aos sites de busca a importância que as páginas do site possuem, segundo o que você considera. Os valores válidos para este atributo vão de 0.0 a 1.0, tendo por padrão a aplicação do valor 0.5. É comum, por exemplo, que a página inicial do site seja a mais importante, recebendo o valor máximo. Dica, você não deve incluir o valor 1.0 para todas as páginas do site, porque o que acontece na verdade, é que nenhum site possui todas as páginas com a mesma importância.

Veja um exemplo de como o arquivo ficaria com mais URLs:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url><loc>http://www.exemplo.com/</loc>
   <lastmod>2015-03-01</lastmod>
   <changefreq>monthly</changefreq>
   <priority>1.0</priority>
</url>
<url>
   <loc>http://www.exemplo.com/blog</loc>
   <lastmod>2013-04-01</lastmod>
   <changefreq>monthly</changefreq>
   <priority>0.8</priority>
</url>
   <url>
      <loc>http://www.exemplo.com/contato</loc>
      <lastmod>2012-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.5</priority>
   </url>
</urlset>

Sites ou programas

Também é possível criar um Sitemap.xml através de sites, programas server-side (funcionam no servidor) e CMS (sistemas de gerenciamento de conteúdo, como Wordpress). Caso você opte por esta solução recomendo visitar a página do Google, Web Sitemap Generators, com as recomendações para cada tipo de linguagem ou ferramenta que você escolher.

Diretrizes do Google para Sitemaps

Vamos dar uma olhada nas principais diretrizes do Google para Sitemaps:

•    URLs qualificadas e consistentes: o Google vai rastrear a URL exatamente como você listar no arquivo, portanto, fique atento se seu site utiliza http:// ou http://www.
•    Usar URLs canônicos: utilize URL canônico para indicar ao Google as versões em que o site pode ser acessado (com ou sem www).
•    Códigos de sessão em URLs: você não deve inserir informações como ID’s de sessão em suas URL com o objetivo de diminuir o rastreamento duplicado.
•    Versões de tradução de URL: se você versões do seu site disponíveis em uma ou diversas linguagens, elas devem ser indicadas em seu Sitemap, listando URLs canônicos de cada idioma, adicionando o atributo hreflang no cabeçalho de seus documentos.
•     Codificação: os arquivos de Sitemap devem, obrigatoriamente, serem codificados com UTF-8.

Como enviar um Sitemap ao Google?

Com o Sitemap pronto, você deve enviá-lo ao Google. Existem duas maneiras bem práticas de de fazer isso. Uma delas é através da ferramenta de Sitemaps no Google Search Console (antiga Webmaster Tools). A outra é através do arquivo robots.txt, adicionando a seguinte informação: Sitemap: http://www.exemplo.com/diretório/sitemap.xml

Nos dois casos recomendo que você faça o upload do arquivo criado no diretório raiz do site. Dessa forma, ao informar a localização do Sitemap, você enviará:
http://seusite.com.br/sitemap.xml

Através do Google Search Console, você verá que é possível testar o Sitemap antes de enviar, assim, se houver algum erro na leitura, ele será exibido para que você possa corrigir.

Sitemap.xml enviado e mais uma etapa de SEO concluída. Até a próxima!

em
Compartilhe este artigo: