Como denunciar plágio? Porque é que o conteúdo copiado, em alguns sites, ficar melhor posicionados do que a fonte original?
Vamos por partes… Antes de decidir qual a melhor e mais eficiente maneira de agir, há que considerar os fatores que podem influenciar a possível preferência de conteúdo copiado. E porque existem várias maneiras de lidar com conteúdo copiado, é necessário em primeiro lugar, pensar um pouco a longo prazo. É preciso entender o “como” e o “porquê” do que está por detrás da duplicação de conteúdo.
De um modo simplificado, as principais causas da duplicação de conteúdo encontram-se categorizadas do seguinte modo:
- O conteúdo é copiado sem consentimento do webmaster (normalmente off-site);
- O conteúdo é distribuído pelo próprio webmaster (normalmente off-site);
- O webmaster não tomou as devidas precauções e ocorrem duplicações de conteúdo (on-site ou off-site).
Existem várias maneiras de abordar cada uma destas situações e nem todas elas caem na definição de webspam ou infringem diretamente as Diretrizes de Qualidade do Google.
Nem todo o conteúdo copiado ou duplicado é spam
De um modo simplificado, apenas os casos em que a duplicação de conteúdo é acompanhada de intenção maliciosa são passíveis de ser tratados como webspam.
Quando o Google rastreia a web, ao encontrar conteúdo duplicado entre diferentes sites, ele analisa os sinais necessários para determinar a fonte original desse conteúdo. O que normalmente funciona muito bem. Isto quer dizer, também, que você não deve ficar muito preocupado se notar algumas flutuações. Especialmente se estas ocorrem pouco tempo após o seu conteúdo ter sido alvo de cópia. Na maioria dos casos estas flutuações não tendem a ser duradouras. Mas, como em toda a regra existe uma exceção, vejamos algumas das razões que podem afetar uma avaliação de conteúdo duplicado:
- Reputação ou popularidade do domínio que copia – quando o site que copia o conteúdo tem uma reputação ou popularidade superior.
- Links para o URL duplicada – quando o URL do artigo copiado recebe mais links do que o original.
Estas são as duas exceções em que me quero focar neste artigo. Pois podem tornar-se um pouco mais persistentes que o desejado. No entanto, existem algumas medidas que podem ser tomadas para remediar cada uma das situações.
Conteúdo copiado sem o seu consentimento
Este é o caso mais comum. E o que pode entrar na categoria de plágio! Vendo a situação pelo lado positivo, este pode até ser um indicador de sucesso do seu site. Alguém copiou o seu conteúdo apenas porque gostou, ou simplesmente porque não consegue nem sabe fazer melhor. Neste caso, a melhor maneira é, em primeiro lugar, tentar contatar o responsável pelo site que copiou o seu conteúdo. Mas sempre de um modo cordial e profissional — você não quer “queimar” as suas chances de sucesso logo ao início. No entanto, antes de contatar o webmaster pense no resultado das ações que você quer tomar:
- Você quer que o webmaster remova todo o conteúdo copiado completamente;
- Você permite apenas um excerto do conteúdo com menção da fonte;
- Você permite a duplicação integral mas com menção da fonte;
- etc…
Tente levar a conversa pela razão. Explique ao infrator que ele está a causar um impacto negativo no seu site. Se as suas tentativas não tiverem qualquer resultado, ou resposta, a segunda melhor maneira de lidar com a situação é através de um pedido de remoção via DMCA. Após recepção e verificação de veracidade, o Google decidirá a remoção, ou não, do conteúdo copiado dos resultados de pesquisa.
O conteúdo é distribuído pelo próprio webmaster
Há webmasters que distribuem conteúdo por todos os serviços de bookmarking e redes sociais; sem a mínima modificação. Apenas para, mais tarde, se depararem com um problema de duplicação indesejada de conteúdo. Esta duplicação pode vir a tornar-se problemática, principalmente quando combinada com a anterior (plágio). Uma vez que você distribui o seu conteúdo para sites externos, você perde o controle sobre possíveis re-distribuições desse mesmo conteúdo. Então, pense antes de distribuir. É aconselhável deixar o seu site ganhar alguma reputação primeiro. Para isso, você pode optar por distribuir apenas excertos re-adaptados do seu conteúdo, onde é necessário um link de volta para ler o artigo completo.
Por outro lado, se o seu site já tem alguma reputação, utilize as meta-tags de atribuição de fonte. Ou opte apenas por distribuir através de fontes que você controla, como por exemplo, as sua contas nas redes sociais.
Duplicação de conteúdo interna
Esta situação não cai na categoria de plágio. Normalmente ocorre, porque existem várias maneiras aceder ao mesmo conteúdo. Especialmente se não foram previstas de antemão pelo webmaster. É também aquela que é mais fácil de resolver, porque está dentro do seu controle. Para se certificar que os motores de busca indexam apenas a versão que você deseja, faça uso de recursos como:
- Implementação do link para páginas canónicas
rel="canonical"
; - Utilize a
meta-tag="noindex"
nas secções do seu site que não deseja indexar (mas não bloqueie com robots.txt ao mesmo tempo); - Use redirecionamentos 301 sempre que possível.
Por fim, não deixe de ler também o meu artigo mais recente sobre conteúdo duplicado. Ou a documentação sobre o tema na Central de Ajuda.
Boa tarde!
Gostei bastante do seu artigo :)
Tenho só uma dúvida. Se, por exemplo, alguém me copiar o conteudo e alterar a meta.tag para conteudo original, o Google “sabe” qual dos originais é realmente o original? É pela antiguidade?
Obrigado e continuação de bom trabalho!
Cumprimentos,
Rui
Olá Rui,
O Google indexa conteúdo muito rapidamente. Atualmente, vejo conteúdo indexado em aproximadamente 30 segundos no caso do meu blog.
Entre outros sinais usados, o Google irá com certeza acertar na fonte original do conteúdo :^)
Excelente artigo,
muito esclarecedor, alias um dos mais esclarecedores que ja li vindo de um Googler.
Esse artigo facilitará a dar muitas respostas no fórum, já que vem muitas perguntas relacionadas a isso, e agora basta enviar o link desse post. Inclusive, será que não tem como ter uma área no fórum para esse artigo, pois realmente ele tira as dúvidas dos webmasters MESMO!
Grande Abraço Pedro!
Olá Pedro,
Mais uma vez, obrigado pelo tempo investido para instruir as pessoas com relação a este assunto.
Uma dúvida que tenho, na verdade uma reflexão é sobre as meta tags indicadas ou ainda sobre as ultimas ações que você mencionou.
Quando alguém copia o seu conteúdo, normalmente é por RSS ou ainda por “Ctrl + C e Ctrl + V”, sendo assim, fica realmente dificil ele implementar uma meta tag, canonical ou 301. Seria uma dica válida, recomendar que o seu RSS sempre apareça com créditos no final, indicando o artigo original? O Google usa isso a favor da fonte original?
Um outro detalhe que gostaria que você explicasse melhor, você comenta: “quando o URL do artigo copiado recebe mais links do que o original.” – aqui é levado em conta o número ou podemos considerar a qualidade também dos links. Acho importante este detalhe.
Um abraço
Olá Fábio,
Sim é uma dica muito válida. Eu mesmo utilizo isso no meu blog.
O Google tende a usar os links em favor do site original.
Sempre considere a qualidade, a quantidade é algo muito fugaz :^)
Muito bom Pedro!
Excelentes informações, para quem de alguma forma tem conhecimento técnico. Porém para bloggers sem tal conhecimento ainda ficarão a mercê dos CHUPISCOS On-line.
Por isso que acredito que uma solução definitiva, seria uma solução algoritimica com base em data do documento, privilegiando assim o documento + velho como original, independente de outros fatores. Assim colocaria a originalidade do documento como fator primário nesses casos!
Claro que isso não é o fim do mundo porém seria uma melhoria significativa para a qualidade do índice do Google!
Abraço
Pedro, muito bom o post, mas além de posts copiados fico em dúvida sobre “indexadores de blogs” como o Google vê eles?
algo que tenho visto são indexadores de blogs nas primeiras posições. Fiz até alguns testes de posts e depois de um certo tempo fazia uma busca no google e os inexadores ficavam a frente, nesses casos como o google se comporta?
Olá Alan,
Creio que você se refere a agregadores de conteúdo; que cai na categoria de “conteúdo distribuído pelo próprio webmaster”. Embora, por vezes, existam agregadores que fazem sindicação mesmo sem autorização. Nesses casos é útil incluir na sua feed um link para o seu site ou URL.
Outra medida que você pode tomar, no caso de ter um site muito novo, é fazer com que o conteúdo fique apenas disponível em RSS, uma ou duas horas após ter sido publicado no seu site. Creio que em WordPress existem plugins que implementam essa funcionalidade.
No fundo, é apenas uma questão de trabalhar a reputação do seu site, e certificar-se que o Google indexa primeiro o conteúdo no seu domínio.
Caro Pedro Dias,
Você citou: “utilize a meta-tag=”noindex” nas secções do seu site que não deseja indexar (mas não bloqueie com robots.txt ao mesmo tempo)”
Por que ?
Obrigado!
@custodio_m
Olá Marcelo,
Porque ao bloquear com
robots.txt
você estará impedindo o robô de ver ameta-tag="noindex"
.Se o crawler não consegue ver a meta-tag o motor de busca não vai processar a exclusão da URL.
Ah, entendi. Por “drop” você quer dizer retirar do índice do Google *permanentemente* ?
Obrigado mais uma vez!
@custodio_m
Artigo excelente e muito esclarecedor. Os meus sinceros parabéns, este foi o artigo que mais gostei de ler no teu blog.
Tenho uma pergunta e dúvida ao mesmo tempo, quando um artigo de texto tem pouco indice de originalidade (alteração de apenas de algumas palavras), nestes casos também é considerado conteúdo duplicado ou não?
Obrigado
Olá Bruno,
Não. Duplicação são cópias exatas de conteúdo :)
No entanto as palavras “pouco índice de originalidade” devem fazer soar alarmes em algum lugar.
Pedro,
na página explicativa sobre a meta tag de atribuição de fonte, existe um trecho que diz:
“For now, no ranking changes will take place based on this tag.”
ou seja, se eu tiver uma página com conteúdo plagiado rankeando antes da fonte original (devido a reputação, popularidade, backlinks, etc) ela continuará rankeando antes da fonte original, mesmo com a meta tag de atribuição de fonte?
Existe algo que se possa fazer para evitar que se rankeie na frente da fonte original (com exceção de redirect e cross domain canonical tag)?
Abraços
Ah, esqueci de mencionar que a página que faz plágio já coloca no fim do texto o link para o artigo original.
@Pedro belas dicas,faz pouco tempo que uso a meta tag canonical e também o plugin rss footer e acredito que tenha me ajudado a evitar duplicar meu próprio conteúdo(eu mesmo).
Agora e quando grandes portais copiam conteúdo de blogs menores sem autorização? como denunciar?
Abraço!
A minha maior preocupação é com esses “Agregadores de conteúdos”, que republicam nossas postagens via RSS, sem nossa autorização. Ultimamente estou sendo vítima disso, inclusive há posts plagiados aparecendo melhor posicionado que meu blog.
A minha pergunta é: se todos nós (inclusive o Google) sabemos que esses “Agregadores de conteúdos” não criam nada, apenas copiam e republicam, porque o Google os indexa? Já que o Google prima tanto, pelo menos teoricamente, por indexar conteúdo único, por qual motivo continua indexando e rankeando bem páginas que só fazem plagiar/copiar/republicar?
Um abraço.
Opa, só mais uma dúvida: será que esse novo algoritmo, o Panda, ajudará a nos livrarmos dos prejuízos causados pelos “Agregadores de conteúdos”, que republicam nosso conteúdo sem autorização via RSS? Será que o Google passará a dar menos credibilidade a eles, que é o que deveria acontecer desde sempre?
Realmente estou muito irritado com isso. Inclusive fiz uma denúncia de spam ao Google, mas tenho a impressão de que nada foi feito, e meus posts continuam sendo republicados via RSS feed e sendo bem rankeados, mesmo exibindo apenas o título e o description e contendo um link de volta através do plugin RSS Footer.
Olá Pedro,
Apreciei seu artigo, mas teria várias considerações a fazer. Para não ser aborrecido, vou me limitar a três.
1. Se entendi bem, acho que há um equívoco: não há como impedir cópia e a respectiva duplicação na Internet.
2. Em 2010 Matt Cutts deu a entender que o Google não considera a duplicação de todo mal. Ao encontrá-las os programas vão escolher a versão que parece melhor e promovê-la. Isto, para mim, é um estímulo a quem tem mau carater.
3. Há indícios de que, quando atualizamos uma página, o Google considera a última data. Desta forma todo o restante (que estava na página) é “duplicação de cópia”. – até a redundância soa estranho, não acha?
Grato,
Pedro, o que tenho notado é que muita gente esta se “inspirando” em textos já escritos e produzindo mais do mesmo ou seja não com as mesmas palavras, mas com a mesma ideia e até de vez em quando com as mesmas expressões com palavras diferentes e em partes até iguais, isso é considerado cópia? e como o google panda interpreta esse tipo de artigo?
Olá Marcello,
Esse conteúdo que, como você descreve, é “inspirado” em textos já escritos, se não agregar mais valor do que o texto original é algo que o Panda irá resolver muito em breve :^)
Olá Pedro,
tenho um site sobre saúde com razoável audiência (cerca de 55.000 vistas/dia) e muitos textos copiados pela web. Eu tenho como política autorizar a cópia contanto que seja colocado um link para a postagem original. Acho que informações sobre saúde são essenciais para a população e quanto mais difundidos forem meus textos, melhor. Sempre achei que textos copiados com os devidos créditos fossem bem vistos pelo Google, uma vez que tal identificação facilita o trabalho de se reconhecer a fonte original. Todavia, andei conversando com algumas pessoas que lidam com SEO e fui alertado que cópias, mesmo com links para o texto original, poderiam ser prejudiciais para o meu site do ponto de vista de ranqueamento nas SERPs. Isso não faz muito sentido na minha opinião, mas fiquei com esta dúvida. Uma vez encontrado conteúdo meu reproduzido em outros sites, o melhor é pedir sua remoção ou não há problemas em continuar com minha política de autorizar a cópia e apenas pedir para se acrescentar um link para o texto original?
Agradeço antecipadamente pelo seu tempo. Abs
Olá Pedro,
Não há problema em deixar as cópias circular se, normalmente, as mesmas incluem um link para a fonte. Como referi no artigo, na maioria dos casos, o Google consegue fazer a distinção entre o artigo original e as cópias. O que não representa qualquer tipo de problema para a classificação do seu site nas pesquisas.
O que pode fazer para reforçar a segurança de que o Google rastreia o seu artigo primeiro (caso já não tenha feito), é incluir o seu site na sua conta de Ferramentas do Google para Webmasters e enviar um Sitemap XML.
Que bom que o Google consegue reconhecer a fonte original do conteúdo. Tenho investido bastante tempo na elaboração de conteúdo para meu site e isso tem trazido resultados excelentes.
Muito obrigado por esclarecer minhas dúvidas
Abraço
Excelente artigo!!!!
Me esclareceu muito, obrigado pela colaboração.
Olá Pedro:
Tenho uma grande dúvida a muito tempo…! Meu blog é criado através do WordPress.org e tenho alguns resultados de pesquisas onde quando busco por uma determinada palavra chave possuem dois resultados do meu site, por exemplo o do artigo e da categoria, ou até da inicial, este resultado aparece devido a chamada do WordPress… Eu sei que isto pode ser considerado conteúdo duplicado :'(! Sei que posso corrigir isto adicionando um noindex, porém estas páginas de categorias e de tags rendem visitas através do Google…! E eu gostaria de saber como posso contornar isto para que só o que seja encontrado quando busco por uma palavra seja o artigo e não a página da chamada…! Meu plugin possui a opção de * index, nofollow* já ouvi dizer que esta era a solução mais não tenho certeza… Pode me ajudar?
Excelente artigo Pedro!
Está me ajudando a resolver uma queda repentina de 50% das visitas. No meu caso ocorreu a a situação um combinada com a situação 2, onde um site popular copiou na íntegra 40 artigos do meu site. Depois descobri mais 21 sites que também copiaram um artigo cada.
Pois bem, estou tomando todas as medidas sugeridas aqui. Minha dúvida é a seguinte: Após tudo corrigido devo fazer um pedido de reconsideração ou apenas aguardar que o google perceba a mudança?
Obrigado!
Basta esperar… Não precisa submeter pedido de reconsideração.
Conteúdo duplicado é algo que é tratado algoritmicamente.