Conteúdo copiado na primeira posição do Google

O que fazer? Como denunciar plágio? Porque é que sites que copiam artigos conseguem ficar melhor posicionados do que a fonte original do artigo?

Vamos por partes… Há que considerar alguns fatores que podem influenciar uma possível melhor classificação de conteúdo plagiado antes de decidir qual a melhor e mais eficiente maneira de agir. E porque existem várias maneiras de lidar com conteúdo copiado, é necessário em primeiro lugar pensar um pouco a longo termo, e entender o “como” e o “porquê” de algumas das intenções que caem na categoria de duplicação de conteúdo.

De um modo simplificado as principais causas da duplicação de conteúdo encontram-se categorizadas do seguinte modo:

  1. O conteúdo é copiado sem consentimento do webmaster (normalmente off-site);
  2. O conteúdo é distribuído pelo próprio webmaster (normalmente off-site);
  3. O webmaster não tomou as devidas precauções e ocorrem duplicações de conteúdo (on-site ou off-site).

Existem várias maneiras de abordar cada uma destas situações e nem todas elas caem na definição de Webspam ou infringem diretamente as Diretrizes de Qualidade do Google. Explicando de um modo simplificado, apenas os casos em que a duplicação de conteúdo é acompanhada de sinais de intenção maliciosa são passíveis de ser tratados como um problema de webspam.

Quando o Google rastreia a web, ao encontrar conteúdo duplicado entre diferentes sites, ele analisa vários sinais para determinar qual a fonte original desse conteúdo, o que normalmente funciona muito bem. Isto quer dizer também que você não deve ficar muito preocupado se notar algumas flutuações pouco tempo após o seu conteúdo ter sido alvo de cópia, isto porque na maioria dos casos estas situações não tendem a ser duradouras. Mas como em toda a regra existe uma exceção, vejamos algumas das razões que podem afetar o modo como conteúdo duplicado é avaliado:

  • Reputação ou popularidade do domínio que copia – quando o site que copia o conteúdo tem uma reputação ou popularidade superior.
  • Links para o URL copiador – quando o URL do artigo copiado recebe mais links do que o original.

Estas são as exceções em que me quero focar neste artigo, pois podem tornar-se um pouco mais persistentes que o desejado. No entanto existem algumas medidas que podem ser tomadas para remediar cada uma das situações:

O seu conteúdo foi copiado por alguém sem o seu consentimento ou conhecimento

Este é o caso mais comum e o que pode entrar na categoria de plágio! Vendo a situação pelo lado positivo, este pode até ser um indicador de sucesso do seu site. Alguém copiou o seu conteúdo apenas porque gostou, ou simplesmente porque não consegue nem sabe fazer melhor. Neste caso a melhor maneira é em primeiro lugar tentar contatar o responsável pelo site que copiou o seu conteúdo, mas sempre de um modo cordial e profissional — você não quer “queimar” as suas chances de sucesso logo ao início. No entanto antes de contatar o webmaster pense no resultado das ações que você quer tomar:

  • você quer que o webmaster remova todo o conteúdo copiado completamente;
  • você permite apenas um excerto do conteúdo com menção da fonte;
  • você permite a duplicação integral mas com menção da fonte;
  • etc…

Tente levar as coisas pela razão e explicar ao webmaster que está a causar um impacto negativo no seu site. No entanto se as suas tentativas não tiverem qualquer resultado ou resposta, a melhor maneira de lidar com a situação é através de um pedido de remoção via DMCA (Digital Millennium Copyright Act). Após recepção o Google removerá o conteúdo copiado dos resultados de pesquisa.

O conteúdo é distribuído pelo próprio webmaster

Há webmasters que distribuem conteúdo por todos os serviços de bookmarking e redes sociais sem a mínima modificação, apenas para mais tarde se depararem com o problema de que existe uma duplicação indesejada de conteúdo. Esta duplicação pode vir a tornar-se problemática principalmente quando combinada com a anterior. Uma vez que você submeta o seu conteúdo para sites externos, você perde o controle sobre possíveis re-distribuições desse mesmo conteúdo, por isso pense antes de distribuir. É aconselhável deixar o seu site ganhar alguma reputação primeiro. Para isso você pode optar por distribuir excertos re-adaptados do seu conteúdo, onde é necessário um link de volta para ler o artigo completo. Por outro lado se o seu site já começa a ter alguma reputação, utilize as meta-tags de atribuição de fonte. Ou opte apenas por distribuir através de fontes que você controla como por exemplo a sua conta no Twitter, Facebook, etc.

O webmaster não tomou as devidas precauções e ocorrem duplicações de conteúdo

Esta situação ocorre maioritariamente on-site, não cai na categoria de plágio e normalmente ocorre porque existem várias maneiras que não foram previstas pelo webmaster de aceder ao mesmo conteúdo. É também aquela que é mais fácil de resolver porque está dentro do seu controle. Para se certificar que os motores de busca indexam apenas a versão que você deseja, faça uso de recursos como:

  • implementação do link para páginas canónicas rel="canonical";
  • utilize a meta-tag="noindex" nas secções do seu site que não deseja indexar (mas não bloqueie com robots.txt ao mesmo tempo);
  • use redirecionamentos 301 sempre que possível.

Por fim, não deixe de ler também o artigo sobre conteúdo duplicado na Central de Ajuda.

Comments

  1. Boa tarde!
    Gostei bastante do seu artigo :)
    Tenho só uma dúvida. Se, por exemplo, alguém me copiar o conteudo e alterar a meta.tag para conteudo original, o Google “sabe” qual dos originais é realmente o original? É pela antiguidade?

    Obrigado e continuação de bom trabalho!
    Cumprimentos,

    Rui

    • Olá Rui,

      O Google indexa conteúdo muito rapidamente, atualmente vejo conteúdo indexado em cerca de 30 segundos no caso do meu blog. Entre outros sinais usados, o Google irá com certeza acertar na fonte original do conteúdo :^)

  2. Excelente artigo,
    muito esclarecedor, alias um dos mais esclarecedores que ja li vindo de um Googler.

    Esse artigo facilitará a dar muitas respostas no fórum, já que vem muitas perguntas relacionadas a isso, e agora basta enviar o link desse post. Inclusive, será que não tem como ter uma área no fórum para esse artigo, pois realmente ele tira as dúvidas dos webmasters MESMO!

    Grande Abraço Pedro!

  3. Olá Pedro,

    Mais uma vez, obrigado pelo tempo investido para instruir as pessoas com relação a este assunto.

    Uma dúvida que tenho, na verdade uma reflexão é sobre as meta tags indicadas ou ainda sobre as ultimas ações que você mencionou.

    Quando alguém copia o seu conteúdo, normalmente é por RSS ou ainda por “Ctrl + C e Ctrl + V”, sendo assim, fica realmente dificil ele implementar uma meta tag, canonical ou 301. Seria uma dica válida, recomendar que o seu RSS sempre apareça com créditos no final, indicando o artigo original? O Google usa isso a favor da fonte original?

    Um outro detalhe que gostaria que você explicasse melhor, você comenta: “quando o URL do artigo copiado recebe mais links do que o original.” – aqui é levado em conta o número ou podemos considerar a qualidade também dos links. Acho importante este detalhe.

    Um abraço

    • Olá Fábio,

      Seria uma dica válida, recomendar que o seu RSS sempre apareça com créditos no final, indicando o artigo original? O Google usa isso a favor da fonte original? O Google usa isso a favor da fonte original?

      Sim é uma dica muito válida, eu mesmo utilizo isso no meu blog. O Google irá usar os links em favor do site original.

      …aqui é levado em conta o número ou podemos considerar a qualidade também dos links.

      Sempre considere a qualidade dos links, a quantidade é algo muito fugaz :^)

  4. Muito bom Pedro!

    Excelentes informações, para quem de alguma forma tem conhecimento técnico. Porém para bloggers sem tal conhecimento ainda ficarão a mercê dos CHUPISCOS On-line.

    Por isso que acredito que uma solução definitiva, seria uma solução algoritimica com base em data do documento, privilegiando assim o documento + velho como original, independente de outros fatores. Assim colocaria a originalidade do documento como fator primário nesses casos!

    Claro que isso não é o fim do mundo porém seria uma melhoria significativa para a qualidade do índice do Google!

    Abraço

  5. Pedro, muito bom o post, mas além de posts copiados fico em dúvida sobre “indexadores de blogs” como o Google vê eles?

    algo que tenho visto são indexadores de blogs nas primeiras posições. Fiz até alguns testes de posts e depois de um certo tempo fazia uma busca no google e os inexadores ficavam a frente, nesses casos como o google se comporta?

    • Olá Alan,

      Creio que você se refere a agregadores de conteúdo, o que cai na categoria de “conteúdo distribuído pelo próprio webmaster” embora por vezes existam agregadores que fazem sindicação mesmo sem autorização.

      Nestes casos é útil incluir na sua feed um link para o seu site ou URL. Outra medida que você pode tomar no caso de ter um site muito novo, é fazer com que o conteúdo fique apenas disponível em RSS uma ou duas horas após ter sido publicado no seu site, creio que em WordPress existem plugins que implementam essa função.

      No fundo é apenas uma questão de trabalhar a reputação do seu site e certificar-se que o Google indexa primeiro o conteúdo no seu domínio.

  6. Caro Pedro Dias,

    Você citou: “utilize a meta-tag=”noindex” nas secções do seu site que não deseja indexar (mas não bloqueie com robots.txt ao mesmo tempo)”

    Por que ?

    Obrigado!

    @custodio_m

    • Olá Marcelo,

      Porque ao bloquear com robots.txt você estará impedindo o crawler de ver a meta-tag="noindex". Se o crawler não consegue ver a meta-tag o motor de busca não vai processar o “drop” do URL.

  7. Artigo excelente e muito esclarecedor. Os meus sinceros parabéns, este foi o artigo que mais gostei de ler no teu blog.

    Tenho uma pergunta e dúvida ao mesmo tempo, quando um artigo de texto tem pouco indice de originalidade (alteração de apenas de algumas palavras), nestes casos também é considerado conteúdo duplicado ou não?

    Obrigado

    • Olá Bruno,

      Não, duplicação são cópias exatas de conteúdo :) No entanto as palavras “pouco índice de originalidade” devem fazer soar as campainhas em algum lado.

  8. Pedro,

    na página explicativa sobre a meta tag de atribuição de fonte, existe um trecho que diz:

    “For now, no ranking changes will take place based on this tag.”

    ou seja, se eu tiver uma página com conteúdo plagiado rankeando antes da fonte original (devido a reputação, popularidade, backlinks, etc) ela continuará rankeando antes da fonte original, mesmo com a meta tag de atribuição de fonte?

    Existe algo que se possa fazer para evitar que se rankeie na frente da fonte original (com exceção de redirect e cross domain canonical tag)?

    Abraços

  9. @Pedro belas dicas,faz pouco tempo que uso a meta tag canonical e também o plugin rss footer e acredito que tenha me ajudado a evitar duplicar meu próprio conteúdo(eu mesmo).
    Agora e quando grandes portais copiam conteúdo de blogs menores sem autorização? como denunciar?

    Abraço!

  10. A minha maior preocupação é com esses “Agregadores de conteúdos”, que republicam nossas postagens via RSS, sem nossa autorização. Ultimamente estou sendo vítima disso, inclusive há posts plagiados aparecendo melhor posicionado que meu blog.

    A minha pergunta é: se todos nós (inclusive o Google) sabemos que esses “Agregadores de conteúdos” não criam nada, apenas copiam e republicam, porque o Google os indexa? Já que o Google prima tanto, pelo menos teoricamente, por indexar conteúdo único, por qual motivo continua indexando e rankeando bem páginas que só fazem plagiar/copiar/republicar?

    Um abraço.

    • Opa, só mais uma dúvida: será que esse novo algoritmo, o Panda, ajudará a nos livrarmos dos prejuízos causados pelos “Agregadores de conteúdos”, que republicam nosso conteúdo sem autorização via RSS? Será que o Google passará a dar menos credibilidade a eles, que é o que deveria acontecer desde sempre?

      Realmente estou muito irritado com isso. Inclusive fiz uma denúncia de spam ao Google, mas tenho a impressão de que nada foi feito, e meus posts continuam sendo republicados via RSS feed e sendo bem rankeados, mesmo exibindo apenas o título e o description e contendo um link de volta através do plugin RSS Footer.

      • Olá Pedro,

        Apreciei seu artigo, mas teria várias considerações a fazer. Para não ser aborrecido, vou me limitar a três.

        1. Se entendi bem, acho que há um equívoco: não há como impedir cópia e a respectiva duplicação na Internet.
        2. Em 2010 Matt Cutts deu a entender que o Google não considera a duplicação de todo mal. Ao encontrá-las os programas vão escolher a versão que parece melhor e promovê-la. Isto, para mim, é um estímulo a quem tem mau carater.
        3. Há indícios de que, quando atualizamos uma página, o Google considera a última data. Desta forma todo o restante (que estava na página) é “duplicação de cópia”. – até a redundância soa estranho, não acha?

        Grato,

  11. Pedro, o que tenho notado é que muita gente esta se “inspirando” em textos já escritos e produzindo mais do mesmo ou seja não com as mesmas palavras, mas com a mesma ideia e até de vez em quando com as mesmas expressões com palavras diferentes e em partes até iguais, isso é considerado cópia? e como o google panda interpreta esse tipo de artigo?

    • Olá Marcello,

      Esse conteúdo que, como você descreve é “inspirado” em textos já escritos, se não agregar mais valor do que o texto original é algo que o Panda irá resolver muito em breve :^)

  12. Olá Pedro,
    tenho um site sobre saúde com razoável audiência (cerca de 55.000 vistas/dia) e muitos textos copiados pela web. Eu tenho como política autorizar a cópia contanto que seja colocado um link para a postagem original. Acho que informações sobre saúde são essenciais para a população e quanto mais difundidos forem meus textos, melhor. Sempre achei que textos copiados com os devidos créditos fossem bem vistos pelo Google, uma vez que tal identificação facilita o trabalho de se reconhecer a fonte original. Todavia, andei conversando com algumas pessoas que lidam com SEO e fui alertado que cópias, mesmo com links para o texto original, poderiam ser prejudiciais para o meu site do ponto de vista de ranqueamento nas SERPs. Isso não faz muito sentido na minha opinião, mas fiquei com esta dúvida. Uma vez encontrado conteúdo meu reproduzido em outros sites, o melhor é pedir sua remoção ou não há problemas em continuar com minha política de autorizar a cópia e apenas pedir para se acrescentar um link para o texto original?
    Agradeço antecipadamente pelo seu tempo. Abs

    • Olá Pedro,

      Não há problema em deixar as cópias circular se normalmente as mesmas incluem um link para a fonte. Como referi no meu artigo, na maioria dos caso o Google consegue fazer a distinção entre o artigo original e as cópias, o que não representa qualquer tipo de problema para a classificação do seu site nas pesquisas.
      O que pode fazer para reforçar a segurança de que o Google rastreia o seu artigo primeiro (caso já não tenha feito), é incluir o seu site na sua conta de Ferramentas do Google para Webmasters e submeter um Sitemap XML.

  13. Que bom que o Google consegue reconhecer a fonte original do conteúdo. Tenho investido bastante tempo na elaboração de conteúdo para meu site e isso tem trazido resultados excelentes.

    Muito obrigado por esclarecer minhas dúvidas

    Abraço

  14. Excelente artigo!!!!
    Me esclareceu muito, obrigado pela colaboração.

  15. Olá Pedro:
    Tenho uma grande dúvida a muito tempo…! Meu blog é criado através do WordPress.org e tenho alguns resultados de pesquisas onde quando busco por uma determinada palavra chave possuem dois resultados do meu site, por exemplo o do artigo e da categoria, ou até da inicial, este resultado aparece devido a chamada do WordPress… Eu sei que isto pode ser considerado conteúdo duplicado :’(! Sei que posso corrigir isto adicionando um noindex, porém estas páginas de categorias e de tags rendem visitas através do Google…! E eu gostaria de saber como posso contornar isto para que só o que seja encontrado quando busco por uma palavra seja o artigo e não a página da chamada…! Meu plugin possui a opção de * index, nofollow* já ouvi dizer que esta era a solução mais não tenho certeza… Pode me ajudar?

  16. Excelente artigo Pedro!

    Está me ajudando a resolver uma queda repentina de 50% das visitas. No meu caso ocorreu a a situação um combinada com a situação 2, onde um site popular copiou na íntegra 40 artigos do meu site. Depois descobri mais 21 sites que também copiaram um artigo cada.

    Pois bem, estou tomando todas as medidas sugeridas aqui. Minha dúvida é a seguinte: Após tudo corrigido devo fazer um pedido de reconsideração ou apenas aguardar que o google perceba a mudança?

    Obrigado!

Se o seu comentário ou pergunta é sobre um site ou problema específico, ou mesmo uma pergunta geral sobre a pesquisa do Google, o melhor lugar para obter uma resposta é no Fórum do Google de Ajuda a Webmasters!

Ao comentar, por favor utilize o seu nome ou nick, e não o nome do seu negócio ou empresa. Os nomes de negócios ou empresas quando utilizados em comentários tendem a ter uma conotação de spam, e eu gostaria de encorajar as pessoas a comentarem com o seu nome verdadeiro.
Link para reportar SPAM no Google.

Comentários fecham automaticamente ao fim de 365 dias.