¡Hola Soywebmasters!
¡Aquí David Ayala de nuevo!
En este artículo quiero hablarte sobre un tema que me parece bastante interesante, y es el siguiente: si tienes varias versiones de una misma URL, cómo determina Google cual será la URL “primaria”, cómo determina cuál será la URL que considerará como la “principal”.
Y no, no tiene por qué ser la URL hacia la que apunten los canonical, si no que Google puede determinar que otra URL merece ser la primaria o canónica.
Además hoy lo vamos a ver desde el punto de vista de una de las patentes de Google llamada “Identifying a primary version of a document“, es decir voy a interpretar lo que entiendo sobre la misma y las conclusiones que saco tras verla.
¡Vamos al lío!
Índice
¿Qué significa que una URL sea considerada como la primaria por Google?
Antes de comenzar a darle caña a la patente, tenemos que tener claro qué significa que Google considere una URL como primaria o canónica.
Eso significará que de un conjunto de versiones de una URL, esa URL será la que considera como la “principal”, la que considera que es la más importante y por lo tanto la que debería de rankear y tener toda la fuerza.
Por ello, es importante entender cómo funciona Google en este aspecto, y es que en ocasiones, por mucho que uses la etiqueta rel canonical, tan solo significará una sugerencia y Google podrá tomar como URL principal o canonica otra URL a su elección.
¿De qué trata la patente?
La patente describe un sistema que identifica cual es la versión primaria de un conjunto de versiones de un mismo documento.
O lo que es lo mismo, que identifique cual es la URL primaria o canónica dentro de un conjunto de URLs versiones de ella misma.
Motivos de existencia
En la patente también se incluyen algunos motivos por los cuales es importante que se pueda elegir una versión primaria:
-Tener varias versiones no proporciona información adicional al usuario.
-Aparecer en las búsquedas varias versiones del mismo contenido hará que otras URLs de contenido interesante/importante no aparezcan y por lo tanto no las pueda encontrar el usuario.
-Si el usuario encuentra varias versiones del mismo contenido en una búsqueda, no sabrá cual es la primaria y por lo tanto a cual acceder realmente.
Como puedes ver, todas estas razones están enfocadas a lo mismo, están enfocadas a darle un contenido de calidad al usuario, a que dicho usuario tenga varias opciones y no le salga varias veces el mismo resultado, ya que en ese caso solo estaría leyendo exactamente la misma información por duplicado.
Cómo funciona la patente
Hasta ahora todo bien, pero, ¿En qué aspectos realmente se fija la patente para considerar que una URL sea la primaria?
La fuente donde los encuentra
La patente dice que las versiones de los documentos las encontrará desde cualquier fuente, web o base de datos que se mencione.
¿Qué quiere decir esto?
Que también se tendrá en cuenta en cierto modo los lugares donde se encuentre, por lo tanto se podría decir que enlaces internos y externos.
Los meta datos
También se comenta que tendrá en cuenta los meta datos del propio documento.
Por lo tanto también podrá tener en cuenta cosas como meta etiquetas, idiomas, contenidos, etcétera.
Contenido del documento
Se tendrá en cuenta el contenido en si de los documentos de las diferentes versiones.
¿Cómo se tendrá en cuenta?
Si una de las versiones del documento tiene más contenido que el resto (eso significará que es una versión más relevante que el resto en cierto modo).
Información identificativa
Otra de las cosas que se nombra que se tendrá en cuenta será la información identificativa.
Es decir, si alguno de los documentos contiene información relevante para identificarlo como el original, mención de autor, etcétera.
Y, evidentemente… Que estas señales para identificarlo no estén en el resto de documentos.
Menciones a otros documentos
También se valorará las menciones dentro de un documento hacia el resto.
¿Qué significa esto?
El documento que más menciones tenga hacia otros documentos se podría decir que sería el documento más importante en cierto modo.
Fecha del documento
La fecha también es algo que se tendrá en cuenta.
El documento con fecha más reciente de modificación significará que este se modifica/actualiza y el resto no, por lo tanto será señal que también es el documento principal y el resto no.
El Pagerank
Cómo no, la métrica “estrella” de Google, el pagerank, tenía que aparecer en esta patente.
El documento con mayor pagerank será también en cierto modo el más relevante, por lo tanto también tendrá en cuenta esa “autoridad”.
Mi opinión sobre la patente
Qué una patente exista no quiere decir que Google tenga que aplicarla al 100% de esta manera en Google, no por que no la aplique, si no por que el algoritmo de Google es mucho más complejo e influyen muchos otros factores.
Sin embargo hay patentes que nos pueden ayudar a entender mejor algunas cosas de Google y sin lugar a dudas esta patente nos puede ayudar a entender mucho mejor como decide Google cual es la versión principal o canónica de un conjunto de versiones de una misma URL.
Sobre esta patente en concreto tengo que decir que me ha parecido muy interesante y que está bastante cerca de lo que podíamos pensar sobre este tema, así que creo que será bastante útil este despiece para que muchos podáis comprender un poco más como funciona Google en algunos aspectos.
Conclusiones
Como conclusión se podría decir que esta patente deja claro que aunque usemos rel canonical, Google puede tomar como URL primaria o canónica otra URL que el determine como más “adecuada” en función de algunos de los parámetros que se comentan.
¿Te ha gustado el análisis de esta patente? ¿Te a parecido útil? ¡DEJAME UN COMENTARIO SI QUIERES QUE HAGA MÁS ARTÍCULOS COMO ESTE!
RECIBIR NOVEDADES POR EMAIL
Muy interesante David Ayala el articulo es motivo de analizar cada punto que detallas sobre una url Primaria o Canónica a la vista de google.
Venga un saludo…..
Me ha parecido un post muy interesante, la verdad es que es útil tener en cuenta aquellos aspectos que toma Google para tomar las decisiones que toma. En cuanto al canonical entramos en el eterno debate, si tan solo es una sugerencia y no siempre lo toma en cuenta, ¿es imprescindible el uso de esta?
Un abrazo!
Buenas!! Gracias por pasarte a comentar 🙂
Yo canonical hace ya mucho tiempo que casi no lo uso, por que al final es una recomendación y no algo que vaya a cumplirse sí o sí y no me gusta dejar cosas al azar jeje.
SEO ROSA THANK YOU . muy interesante.
Buenas!! Gracias por pasarte a verlo y comentar 🙂
Muy Buen Articulo David, tiene sentido todo lo que explicas sobre las URLs anonicals o primarias.
La duda es: ¿Se puede forzar de alguna manera?
Buenas! Gracias por tu comentario 🙂
Lo ideal es siempre intentar que no indexen las diferentes versiones que no son la "original" y que no te interesan. Pero en caso de no ser posible esto, entre otras cosas, un buen punto es subir la "autoridad" de la URL, darle más relevancia tanto con enlaces internos como externos.
las canónicas para lo único que suelo utilizarlo es para las páginas que he pasado de http a https donde Google parece que lo tiene más en cuenta, pero como dices tu, es solo una recomendación que se le hace.
Gracias David por las aportaciones. Yo estoy empezando con SEO y aunque no me queda del todo claro haré pruebas.