Seleccionar página

¡Hola Soywebmasters!
¡Aquí David Ayala de nuevo!

En este artículo quiero hablarte sobre un tema que me parece bastante interesante, y es el siguiente: si tienes varias versiones de una misma URL, cómo determina Google cual será la URL “primaria”, cómo determina cuál será la URL que considerará como la “principal”.

Y no, no tiene por qué ser la URL hacia la que apunten los canonical, si no que Google puede determinar que otra URL merece ser la primaria o canónica.

Además hoy lo vamos a ver desde el punto de vista de una de las patentes de Google llamada “Identifying a primary version of a document“, es decir voy a interpretar lo que entiendo sobre la misma y las conclusiones que saco tras verla.

¡Vamos al lío!

¿Qué significa que una URL sea considerada como la primaria por Google?

Antes de comenzar a darle caña a la patente, tenemos que tener claro qué significa que Google considere una URL como primaria o canónica.

Eso significará que de un conjunto de versiones de una URL, esa URL será la que considera como la “principal”, la que considera que es la más importante y por lo tanto la que debería de rankear y tener toda la fuerza.

Por ello, es importante entender cómo funciona Google en este aspecto, y es que en ocasiones, por mucho que uses la etiqueta rel canonical, tan solo significará una sugerencia y Google podrá tomar como URL principal o canonica otra URL a su elección.

¿De qué trata la patente?

La patente describe un sistema que identifica cual es la versión primaria de un conjunto de versiones de un mismo documento.

O lo que es lo mismo, que identifique cual es la URL primaria o canónica dentro de un conjunto de URLs versiones de ella misma.

Motivos de existencia

En la patente también se incluyen algunos motivos por los cuales es importante que se pueda elegir una versión primaria:

-Tener varias versiones no proporciona información adicional al usuario.

-Aparecer en las búsquedas varias versiones del mismo contenido hará que otras URLs de contenido interesante/importante no aparezcan y por lo tanto no las pueda encontrar el usuario.

-Si el usuario encuentra varias versiones del mismo contenido en una búsqueda, no sabrá cual es la primaria y por lo tanto a cual acceder realmente.

Como puedes ver, todas estas razones están enfocadas a lo mismo, están enfocadas a darle un contenido de calidad al usuario, a que dicho usuario tenga varias opciones y no le salga varias veces el mismo resultado, ya que en ese caso solo estaría leyendo exactamente la misma información por duplicado.

Cómo funciona la patente

Hasta ahora todo bien, pero, ¿En qué aspectos realmente se fija la patente para considerar que una URL sea la primaria?

La fuente donde los encuentra

La patente dice que las versiones de los documentos las encontrará desde cualquier fuente, web o base de datos que se mencione.

¿Qué quiere decir esto?

Que también se tendrá en cuenta en cierto modo los lugares donde se encuentre, por lo tanto se podría decir que enlaces internos y externos.

Los meta datos

También se comenta que tendrá en cuenta los meta datos del propio documento.

Por lo tanto también podrá tener en cuenta cosas como meta etiquetas, idiomas, contenidos, etcétera.

Contenido del documento

Se tendrá en cuenta el contenido en si de los documentos de las diferentes versiones.

¿Cómo se tendrá en cuenta?

Si una de las versiones del documento tiene más contenido que el resto (eso significará que es una versión más relevante que el resto en cierto modo).

Información identificativa

Otra de las cosas que se nombra que se tendrá en cuenta será la información identificativa.

Es decir, si alguno de los documentos contiene información relevante para identificarlo como el original, mención de autor, etcétera.

Y, evidentemente… Que estas señales para identificarlo no estén en el resto de documentos.

Menciones a otros documentos

También se valorará las menciones dentro de un documento hacia el resto.

¿Qué significa esto?

El documento que más menciones tenga hacia otros documentos se podría decir que sería el documento más importante en cierto modo.

Fecha del documento

La fecha también es algo que se tendrá en cuenta.

El documento con fecha más reciente de modificación significará que este se modifica/actualiza y el resto no, por lo tanto será señal que también es el documento principal y el resto no.

El Pagerank

Cómo no, la métrica “estrella” de Google, el pagerank, tenía que aparecer en esta patente.

El documento con mayor pagerank será también en cierto modo el más relevante, por lo tanto también tendrá en cuenta esa “autoridad”.

Mi opinión sobre la patente

Qué una patente exista no quiere decir que Google tenga que aplicarla al 100% de esta manera en Google, no por que no la aplique, si no por que el algoritmo de Google es mucho más complejo e influyen muchos otros factores.

Sin embargo hay patentes que nos pueden ayudar a entender mejor algunas cosas de Google y sin lugar a dudas esta patente nos puede ayudar a entender mucho mejor como decide Google cual es la versión principal o canónica de un conjunto de versiones de una misma URL.

Sobre esta patente en concreto tengo que decir que me ha parecido muy interesante y que está bastante cerca de lo que podíamos pensar sobre este tema, así que creo que será bastante útil este despiece para que muchos podáis comprender un poco más como funciona Google en algunos aspectos.

Conclusiones

Como conclusión se podría decir que esta patente deja claro que aunque usemos rel canonical, Google puede tomar como URL primaria o canónica otra URL que el determine como más “adecuada” en función de algunos de los parámetros que se comentan.

¿Te ha gustado el análisis de esta patente? ¿Te a parecido útil? ¡DEJAME UN COMENTARIO SI QUIERES QUE HAGA MÁS ARTÍCULOS COMO ESTE!



RECIBIR NOVEDADES POR EMAIL