Saltar al contenido

Analizo la patente de Google US7716225B1 (2010) – Clasificación de documentos basada en atributos de usuario

En este artículo, exploraremos la patente US7716225B1 de Google, titulada «Document Scoring Based on User Behavior Data» (Clasificación de documentos basada en datos de comportamiento del usuario), que fue otorgada el 11 de mayo de 2010. Esta patente presenta un enfoque innovador para mejorar la calidad y relevancia de los resultados de búsqueda al considerar el comportamiento de los usuarios en la clasificación de documentos.

¿Qué propone la patente US7716225B1?

La patente US7716225B1 describe un método y un sistema para clasificar documentos, como páginas web, en función del comportamiento de los usuarios que interactúan con ellos. El objetivo es mejorar la relevancia de los resultados de búsqueda al considerar factores como el tiempo que los usuarios pasan en una página, la frecuencia con la que la visitan y cómo interactúan con ella.

image 9

Funcionamiento del sistema propuesto

El sistema propuesto en la patente considera varios aspectos del comportamiento del usuario para determinar la relevancia y calidad de un documento:

  1. Tiempo de permanencia: El tiempo que un usuario pasa en un documento puede indicar si el contenido es relevante y valioso. Los documentos en los que los usuarios pasan más tiempo podrían recibir una puntuación más alta.
  2. Tasa de rebote: Si los usuarios visitan un documento y luego vuelven rápidamente a los resultados de búsqueda, esto puede indicar que el documento no es relevante o de baja calidad. Un alto índice de rebote podría disminuir la puntuación de un documento.
  3. Historial de navegación: La frecuencia con la que un usuario visita un documento y si lo agrega a sus favoritos puede proporcionar información sobre la relevancia y utilidad del contenido.
  4. Interacción con el contenido: Las acciones de los usuarios, como hacer clic en enlaces dentro de un documento o compartir el contenido en redes sociales, también pueden ser indicadores de calidad y relevancia.

Algoritmo propuesto en la patente y explicado (algo más técnico)

La patente US7716225B1 describe un algoritmo para asignar rangos a los documentos basándose en la ponderación de los enlaces entrantes a cada documento. La ecuación 1 en la patente se presenta de la siguiente manera:

r(A) = α * Σ(wr(Bi) * r(Bi) / IBi) + (1 – α) * B

Donde:

  • A es un documento al cual se le está asignando un rango.
  • Bi son los documentos que tienen enlaces entrantes a A.
  • r(Bi) son los rangos de los documentos Bi.
  • wr(Bi) son los pesos asignados a los enlaces entrantes de los documentos Bi.
  • IBi es el número de enlaces salientes de los documentos Bi.
  • α es una constante en el intervalo [0, 1].
  • B es una constante en el intervalo [0, 1].
  • N es el número total de documentos en la base de datos enlazada.

Esta fórmula asigna un rango a cada documento, y este rango puede interpretarse como la probabilidad de que un navegador razonable acceda al documento después de seguir una gran cantidad de enlaces salientes.

El algoritmo de la patente tiene en cuenta tanto el comportamiento del usuario como los datos de características de los enlaces para determinar los pesos de los enlaces y, en última instancia, los rangos de los documentos. Los enlaces con pesos más altos tendrán un impacto más significativo en el rango de un documento en comparación con los enlaces con pesos más bajos. El algoritmo también considera otros factores, como la cantidad de enlaces salientes de un documento.

En resumen, esta patente propone un algoritmo para clasificar documentos basado en la ponderación de enlaces entrantes, teniendo en cuenta el comportamiento del usuario y los datos de características de los enlaces.

Un ejemplo sencillo aplicado (Gracias a Chatgpt)

Imaginemos una red simple de tres páginas web (A, B y C) con enlaces entre ellas.

Supongamos que la estructura de enlaces es la siguiente:

  • La página A tiene enlaces a las páginas B y C.
  • La página B tiene un enlace a la página C.
  • La página C tiene un enlace a la página A.

Vamos a asignar pesos a los enlaces de la siguiente manera:

  • Enlace de A a B: 0.6
  • Enlace de A a C: 0.4
  • Enlace de B a C: 0.9
  • Enlace de C a A: 0.5

Para este ejemplo, estableceremos el factor de amortiguación α en 0.85.

Usando la fórmula de PageRank mencionada anteriormente:

r(A) = α * Σ(wr(Bi) * r(Bi) / IBi) + (1 – α) * B

Podemos calcular los rangos de las páginas A, B y C de la siguiente manera:

  1. r(A) = 0.85 * (0.5 * r(C) / 1) + (1 – 0.85) * B
  2. r(B) = 0.85 * (0.6 * r(A) / 2) + (1 – 0.85) * B
  3. r(C) = 0.85 * ((0.4 * r(A) / 2) + (0.9 * r(B) / 1)) + (1 – 0.85) * B

La solución a este sistema de ecuaciones no lineales es:

r(A) ≈ 0.225 r(B) ≈ 0.163 r(C) ≈ 0.245

Teniendo en cuenta que la suma de los rangos es 1, la probabilidad de que un navegador razonable acceda a cada página después de seguir una gran cantidad de enlaces salientes sería aproximadamente:

  • Página A: 22.5%
  • Página B: 16.3%
  • Página C: 24.5%

Recuerda que este es solo un ejemplo simplificado, y en la práctica, los pesos de los enlaces y los rangos de las páginas se actualizan de manera iterativa y se basan en el comportamiento del usuario y los datos de características de los enlaces.

Implicaciones para el SEO

Aunque no podemos estar seguros de que Google esté utilizando actualmente el método descrito en esta patente en su algoritmo de clasificación, la idea de considerar el comportamiento del usuario es un enfoque interesante para mejorar la calidad de los resultados de búsqueda. Si Google implementara un sistema similar al propuesto en la patente US7716225B1, tendría varias implicaciones para el SEO:

  1. Enfocarse en la experiencia del usuario: Sería crucial para los profesionales del SEO asegurar que sus páginas web ofrezcan una experiencia positiva para los usuarios. Esto incluye garantizar que el contenido sea relevante, fácil de leer y que satisfaga las expectativas del usuario.
  2. Diseño y navegación amigables: Un diseño web claro y una navegación intuitiva pueden mantener a los usuarios interesados y reducir la tasa de rebote, lo que podría mejorar la clasificación en los resultados de búsqueda.
  3. Contenido interactivo y compartible: Fomentar la interacción del usuario mediante el uso de enlaces internos, botones de compartir en redes sociales y otros elementos interactivos puede mejorar la puntuación de un documento en función del comportamiento del usuario.

Conclusión

La patente US7716225B1 de Google presenta un enfoque interesante para clasificar documentos en función del comportamiento del usuario, lo que podría mejorar la calidad y relevancia de los resultados de búsqueda. Aunque no hay garantía de que este sistema esté en uso en el algoritmo actual de Google, es una de las patentes que más se ha hablado en el panorama SEO.

Si Google decide implementar un sistema basado en el comportamiento del usuario, como el descrito en la patente US7716225B1, será esencial centrarse en la experiencia del usuario y garantizar que el contenido sea relevante, fácil de navegar e interactivo.

Deja un comentario

Recaptcha *Límite de tiempo excedido. Por favor complete el captcha otra vez más.