Filtran documentos que revelan cómo funciona el algoritmo de Google
Filtran documentos que revelan cómo funciona el algoritmo de Google
Google fue el foco de una filtración masiva en la que se divulgaron más de 2,500 páginas de documentos que detallan el funcionamiento interno del algoritmo de su motor de búsqueda, sugiriendo discrepancias entre las declaraciones públicas de la compañía y sus prácticas reales.
La compañía ha comunicado en repetidas ocasiones cómo opera el algoritmo de su buscador y su compromiso con ofrecer los mejores resultados posibles, en línea con su política de transparencia hacia los usuarios.
Además, ha reiterado su objetivo de combatir la desinformación y el contenido no deseado, actualizando regularmente su algoritmo y sus políticas para contrarrestar las tácticas de «spam» y garantizar la calidad de los resultados.
Rand Fishkin, cofundador de la plataforma de inteligencia SparkToro y con experiencia en SEO, recientemente publicó un artículo en el que revela haber tenido acceso a documentos relacionados con la interfaz de programación (API) del motor de búsqueda de Google. Estos documentos contradicen las afirmaciones públicas de la compañía sobre el funcionamiento de su algoritmo.
Fishkin recibió un correo electrónico el 5 de mayo que afirmaba contener una filtración autenticada por ex empleados de Google, que revelaba información adicional sobre las operaciones de búsqueda de la empresa. Según Fishkin, estas afirmaciones contradicen directamente las declaraciones públicas de los empleados de Google a lo largo de los años.
Los documentos, provenientes del Almacén de API de contenido interno de Google, incluyen más de 2,500 páginas y 14,014 atributos de la interfaz. Aunque algunos de estos documentos hacen referencia a funciones obsoletas y no abordan las descripciones más recientes de inteligencia artificial (IA), Fishkin considera que estas revelaciones son solo el comienzo de la historia.
La importancia de estas revelaciones radica en la necesidad de verificar las afirmaciones hechas por Google sobre su algoritmo y su compromiso con la transparencia y la calidad de los resultados de búsqueda.
Afirmaciones Principales
En primer lugar, el investigador ha señalado que Google emplea diversas estrategias para filtrar los clics que no desea registrar en sus sistemas de clasificación, optando por incluir solo aquellos que considera relevantes. Además, se analiza la duración de los clics y las impresiones.
Por otro lado, se ha agregado que según los documentos de la API, Google mantiene una lista de las URL principales y utiliza la cantidad de clics en las páginas de Chrome para determinar cuáles son las más populares.
En tercer lugar, los documentos indican que Google incorpora ciertos dominios relacionados con «consultas muy controvertidas o potencialmente peligrosas» en las búsquedas sobre viajes y política, lo que genera resultados que pueden estar sesgados.
La filtración también reveló que hay pruebas de que las evaluaciones y los datos generados por algunos evaluadores de la plataforma EWOK, que evalúan la calidad de los sitios web, pueden estar directamente vinculados al sistema de búsqueda de Google, en lugar de ser simplemente un conjunto de entrenamiento para experimentos.
Finalmente, parte de los documentos revisados sugieren que Google utiliza los datos de los clics para determinar cómo ponderar los enlaces en sus clasificaciones (ya sea de calidad baja, media o alta). De esta manera, si un enlace no recibe clics, se considera de baja calidad y se ignora, mientras que si recibe una gran cantidad de clics desde dispositivos verificables, se clasifica como un enlace de alta calidad.