O que acontece quando 98% das notícias (30k) são apagados de um site? [Atualizado]
[Atualização] Este post foi escrito em setembro de 2023 contextualizando. A atualização foi adicionada em fevereiro de 2024. Pule para a atualização aqui.
Como consultor de SEO, é comum eu falar com ex-clientes ou mesmo amigos que pedem alguma ajuda. Tiro dúvidas pontuais e dou dicas. Eis que em 29/09/2023, uma dessas pessoas me chama, perguntando sobre apagar posts antigos.
Tópicos:
Eis o início da conversa:
Contexto
Fiz algumas perguntas que eu vou sintetizar aqui:
É um site de notícias, especialmente sobre novelas e celebridades. É um WordPress leve e comum com categorias e tags com noindex. Está no Google News.
O objetivo do site é visualizações de anúncios. É monetizado com Ad Sense. Eles publicam cerca de 30 notícias diariamente.
O critério para apagar os posts foi a data. Tudo que era de julho de 2023 para trás foi apagado.
Foram apagados cerca de 30.000 posts! Equivalente a 98% das publicações!
Segundo ele, só as notícias mais recentes tinham tráfego.
No comando site: o site apresenta 8.450 resultados.
A ferramenta de SEO SE Ranking estima um tráfego de 30k em setembro. Classificado para 8582 palavras-chave, sendo 150 na primeira página.
Sobre os redirecionamentos. Eu recomendei que as URLs removidas gerassem um código 410 e não fosse redirecionadas para a página inicial.
Eles nunca fizeram um trabalho de SEO mais estruturado, tendo atenção apenas a algumas partes de SEO mais técnico. Quanto ao conteúdo, eles fazem conforme a demanda, tendências, etc.
O que o Google diz
Qualquer conteúdo, e não apenas conteúdo irrelevante, que estiver sites onde há uma quantidade relativamente alta de conteúdo pouco útil em geral tem menor probabilidade de ter um bom desempenho na Pesquisa, supondo que haja outro conteúdo na Web que seja melhor para exibir. Por isso, a remoção de conteúdo irrelevante pode ajudar a classificação de outro conteúdo.
Sistema de conteúdo útil – Google
Entretanto, recentemente nosso querido John Muller respondeu o contrário em um post no X, explicando que isso não e necessariamente bom.
Mais debate no SE Round Table.
Na prática: Focar em conteúdo útil não é sinônimo de apagar conteúdo inútil ou sem visualizações. Mas pode ser um meio de fazer isso.
Content Pruning
Eu expliquei ao dono do site que que o nome técnico disso seria Content Pruning, poda de conteúdo em bom português. Basicamente, você analisa seu site e atua sobre o conteúdo irrelevante. Como fazer content pruning:
Critérios de seleção:
- Falta de posicionamento das urls nos resultados de pesquisa (avaliando os resultados no Search Console, por exemplo).
- Falta de visualizações da página pelos usuários (analisando os dados do Analytics).
- Ambos. Também pode fazer um mix de ambos e determinar uma linha de corte.
Como cortar o conteúdo:
- Você pode simplesmente apagar o conteúdo do site.
- Bloquear o rastreamento das URLs com noindex e assim a indexação pelo Google.
Redirecionamentos
Esse procedimento exige uma abordagem sobre as urls quando elas forem apagadas. Elas continuam existindo no índice do Google e precisam ser redirecionadas.
Diante disso, existem diferentes abordagens:
Deixar erro 404 – é o comum quando a página é apenas apagada. Significa “não encontrada”, na prática ela permanece no índice do Google e permanece na SERP. Voltará a ser rastreada periodicamente até o Google decidir que não faz mais parte do índice. Um pouco de erros 404 fazem parte de qualquer site, mas é coerente pensar que 98% de urls com erro não é uma boa ideia.
Redirecionamento 301 para página inicial – é uma prática muito comum mas não é uma boa ideia. Ela tende a bagunçar o site, pois o Google tem milhares de urls com funções diferentes e todas elas redirecionam para a página inicial.
Minha recomendação:
Código de resposta 410 – significa “url não existe mais”, ou seja, sinaliza para o Google que ele não deve rastrear essa url novamente e deve remover ela da SERP.
Dúvidas
Diante disto, eu pedi para que ele compartilhar informações do Search Console para aprender com esse case. Afinal apagar 30k urls/98% do conteúdo de um site é drástico. Minhas dúvidas:
- Será que o Google vai reconhecer a mudança rapidamente?
- As páginas serão desindexadas lentamente ou rápido?
- O rastreamento vai aumentar?
- O tráfego, visualizações, engajamento, anúncios serão impactados?
- A visibilidade e posicionamentos vão mudar?
- Vai ser bom ou ruim para o SEO?
Vamos acompanhar nos gráficos abaixo as mudanças de tráfego e palavras-chave, através das estimativas do SE Ranking.
E as mudanças de indexação e desempenho com dados mais precisos do Search Console.
Vamos aguardar!
Atualização
Quais foram os resultados dessa brincadeira?
Eis que o tempo passou, nos falamos e eu perguntei sobre como ia o site. Ele não estava feliz.
Pedi dados do Search Console para ver o que tinha acontecido. Vou resumir um pouco os resultados do projeto.
Resultado
Apagar 98% do conteúdo não foi positivo para o projeto. Mesmo com apenas 2% das páginas gerando o tráfego real, os resultados foram negativos:
O tráfego via Google despencou, dá para ver isso claramente nesses 6 meses em Desempenho, vejam só:
Mas não ficou só nisso. Como é um site de notícias de novelas e fofocas de famosos, é um site com grande apelo a aparecer no Google Discover, sendo uma fonte importante de tráfego.
No caso, as impressões e cliques diminuíram no Discover.
O que aconteceu? Acho razoável compreender que:
Aquela grande quantidade de posts formavam um grande bloco de conteúdo que dava base de relevância e profundidade para os novos conteúdos. Sem essa base, o Google foi não tinha mais motivos para entregar os novos conteúdos.