BLOG

Contenido duplicado, cómo detectarlo y ponerle solución

  • 29/12/2016
  • SEO

Desde que Google lanzó la actualización de su algoritmo llamada cariñosamente Panda allá por 2011, tener contenido duplicado en una web lo único que consigue es que Google directamente no la tenga en cuenta en sus resultados de búsqueda, o lo que es lo mismo, no la visita ni el tato.

[bctt tweet=”Tener contenido duplicado en tu web se traduce en una menor visibilidad online #SEO”]

¿Cómo se genera el contenido duplicado?

Pues básicamente, cuando este contenido es copiado se coge “prestado” de algún otro sitio web. Esto, que parece algo obvio, ocurre con demasiada frecuencia sobre todo en Internet, donde hay tal cantidad de información que puedes encontrar cualquier cosa que se te ocurra, y cogerlo “prestado” es tan fácil como hacer click derecho, copiar y pegar.

Aunque también el contenido duplicado puede generarse internamente en un sitio web, basta con que el contenido publicado en una url aparezca también en otra url del mismo dominio.

Google busca mostrar a los usuarios páginas web con contenido interesante, útil y sobre todo único, por lo que actualización tras actualización va perfeccionando su algoritmo para que aquellas páginas web que contienen contenido duplicado, no se muestren en los resultados del buscador o se muestren muy alejados de las primeras posiciones.

Tener contenido duplicado en una web puede deberse a muchos motivos, y nadie está libre de pecado hasta que no se demuestra lo contrario. Aparte de tener un texto copiado y pegado desde otra web, también se considera duplicado el contenido de las etiquetas title y description, que pueden generarse automáticamente y por tanto, puedes no darte cuenta de que lo tienes hasta que es demasiado tarde.

Para evitar posibles “penalizaciones” y más que previsibles bajadas de visitas, vamos a ver cómo detectar si tu web tiene contenido duplicado y cómo remediarlo.

¿Cómo detectar contenido duplicado en una web?

Para saber si tu contenido ha sido copiado de otra web o cualquier otro medio publicado en internet, o tu propia web está generando contenido duplicado de forma automática, tenemos varias opciones.

Primero veamos cómo comprobar si existen copias de tu contenido en otras páginas web publicadas en internet.

Comprobación manual

Es una forma rápida y sencilla, aunque no es 100 % efectiva. Para ello puedes copiar (botón derecho > copiar) parte del contenido que quieras comprobar y pegarlo entre comillas en la caja de búsqueda de Google, siempre menos de 32 palabras que es el límite que permite este buscador. Generalmente el buscador solo te mostrará un resultado: la página de la cual has obtenido ese texto, si no es así, puede que el resto de resultados sean otros sitios que hayan cogido prestado ese contenido de tu web.

Como ejemplo, he copiado y pegado parte de un artículo anterior de este mismo blog, y me llevo la “sorpresa” de que otra web publicó nuestro mismo artículo justo un día después que nosotros. Por lo menos, Google sabe que la fuente es el blog de Synergy, por la fecha de publicación y porque la web que tomó ese contenido “prestado” nos cita “amablemente” como fuente.

 

detectar contenido duplicado de forma manual

 

Herramientas online para detectar contenido duplicado en internet

Existen varias herramientas online que te ayudarán a saber si tienes contenido duplicado, a continuación te damos algunos ejemplos de buenas herramientas para detectar contenido duplicado:

En las dos primeras, puedes insertar la url a comprobar y la herramienta se encargará de buscar en internet y mostrarte los resultados de aquellas webs que pueden estar utilizando de forma indebida el contenido de tu sitio.

La herramienta Plagium Bot es un programa gratuito que te permite comprobar si tu contenido es único y algunas otras cosas más,  en su propia web explican su uso de forma extendida.

Herramientas para detectar contenido en tu propio sitio web

Como hemos explicado, puede que tú mism@ estés generando contenido duplicado, por repetición de titles y descriptions, por la paginación de tu blog o páginas de productos, etc.

Para detectar si estás generando contenido duplicado tenemos varias opciones:

  • La herramienta para webmasters de Google, Search Console: si no estás dado de alta en esta herramienta seguramente deberías hacerlo. Una vez dentro, dirígete a Aspecto de la búsqueda > Mejoras de HTML.

En este apartado se te muestran las metadescripciones y etiquetas de título que tienes duplicadas, con lo que verás de forma rápida qué secciones de tu web tienes que mejorar.

  • Screaming Frog: esta herramienta, que tiene versión gratuita, te permitirá realizar un análisis profundo a tu web y detectar aquellas URL, títulos, descripciones y etiquetas de encabezado que tienes duplicadas en tu sitio. Es muy sencillo de utilizar, pero siempre puedes buscar un tutorial por internet.

Cómo solucionar el problema del contenido duplicado

Como ya hemos explicado, este tipo de errores no benefician a nuestra visibilidad en internet, por lo que deberíamos solucionarlos cuanto antes. Existen varias formas de librarte del contenido duplicado que se genera en tu propio sitio web, exponemos algunas de las más efectivas.

  • Impidiendo el acceso a los buscadores mediante el archivo robots.txt: mediante este archivo puedes impedir que determinado robot de rastreo acceda a una determinada sección o página de tu web. Por ejemplo, si no queremos que las “arañas” entren en la carpeta “top-secret” de “tusitio.com”, escribiríamos estas líneas en el archivo robots.txt:
[dt_code]User-agent: Googlebot
Disallow: /top-secret/[/dt_code] Nota: tienes que tener cuidado con esto, si escribes “Disallow:” sin especificar una carpeta, estarás impidiendo el acceso a todo tu sitio web.
  • Utilizando la etiqueta “rel=canonical”: esta etiqueta HTML se ideó justamente para este motivo, combatir el contenido duplicado. Deberás introducirla dentro de la etiqueta <head> de tu web, y con ella estarás indicando a Google qué página es la buena entre las que pueden considerarse como “duplicadas”.
[bctt tweet=”Crea contenido único y de calidad, la combinación perfecta para que Google te adore #posicionamientoweb”]

Estas son buenas formas de solucionar el problema de la duplicidad de contenido, pero sin duda la mejor seguirá siendo la de unificar en una sola página aquellas secciones de tu sitio web que contengan contenidos muy parecidos, de esta forma estarás creando una página única que recogerá todo el contenido sobre una temática concreta y será tu herramienta más potente de cara a mejorar tu posicionamiento seo, a la vez que estarás mejorando la experiencia de usuario de tus visitantes.

Autor

¿Te han surgido dudas?

Contactar