Documentos filtrados del DOJ revelan cómo Google ordena la web: PageRank, Navboost y RankEmbed
Durante el juicio antimonopolio que enfrenta el Departamento de Justicia de Estados Unidos contra Google, han salido a la luz una serie de documentos internos confidenciales que revelan información inédita sobre el algoritmo de búsqueda más influyente del mundo.
Lejos de tratarse de simples suposiciones, esta filtración ofrece pruebas concretas de cómo Google combina señales tradicionales con tecnologías modernas, y desvela elementos del sistema que hasta ahora solo se intuían. Los documentos pueden consultarse públicamente en el sitio oficial del Departamento de Justicia:
👉 justice.gov/atr/us-and-plaintiff-states-v-google-llc-2020-remedies-hearing-exhibits
Google aún confía en señales tradicionales
Una de las revelaciones más relevantes es que, a pesar de su integración con modelos de lenguaje y sistemas basados en inteligencia artificial, Google sigue apoyándose en una estructura de ranking construida sobre señales clásicas:
- PageRank continúa siendo una de las métricas centrales.
- Las puntuaciones se construyen a partir de más de 100 señales sin procesar, combinadas de forma lineal y ponderada.
- La mayoría de estas señales siguen una lógica monótona: una señal positiva no puede perjudicar el posicionamiento.
- Se utilizan escalas logarítmicas para evitar que una señal domine excesivamente sobre las demás.
Esto significa que el SEO técnico y estratégico basado en contenido, enlaces y experiencia de usuario sigue plenamente vigente.
Señales clave reveladas en los documentos
Por primera vez se mencionan abiertamente algunos de los factores internos que influyen en el ranking de resultados. Entre los más destacados:
- Q*: métrica interna de calidad del documento, posiblemente basada en valoraciones humanas.
- Navboost: sistema que registra clics e interacciones de los usuarios durante los últimos 13 meses. No es machine learning, sino una tabla agregada de comportamiento real.
- RankEmbed: señal generada mediante modelos de lenguaje que convierte páginas y consultas en vectores semánticos.
- Twiddlers: mecanismos que permiten reordenar resultados ya seleccionados, aplicando criterios como diversidad, frescura o personalización.
También se confirma algo que hasta ahora era solo una sospecha: Google utiliza los datos de los evaluadores humanos (Quality Raters) como base de entrenamiento para algunas de sus señales de calidad.

La IA no sustituye al sistema, lo complementa
Aunque Google ha incorporado modelos como DeepRank o RankEmbed, no ha abandonado sus fundamentos. Según los propios documentos, los mejores resultados se logran al combinar señales tradicionales con salidas de modelos de IA.
Este enfoque híbrido es clave: permite que el algoritmo siga siendo interpretable y depurable, en lugar de una caja negra opaca. En contraste con otros buscadores como Bing, que apuestan por sistemas puramente automáticos, Google mantiene el control sobre la lógica y el peso de cada señal.
Cambios en Chrome y Gemini
Otro detalle significativo es la confirmación de que Google está integrando Gemini —su sistema de IA generativa— directamente en Chrome, utilizando su buscador como canal por defecto. Esto plantea cambios relevantes en cómo se accede a la información y cómo se interpreta la búsqueda en el futuro.
También se ha hecho pública una propuesta de OpenAI para integrar la API de búsqueda de Google en ChatGPT, que fue rechazada por Google para no comprometer el control de su tecnología.
¿Qué significa esto para el SEO?
Esta filtración confirma, con pruebas internas de Google, que:
- El contenido sigue siendo el rey, especialmente si demuestra calidad y relevancia.
- Los enlaces y la autoridad siguen contando: PageRank no ha muerto.
- El comportamiento de los usuarios (clics, permanencia, interacción) influye directamente en los rankings.
- La IA no sustituye a los fundamentos SEO, sino que añade una capa semántica y de interpretación.
- Las Quality Rater Guidelines tienen valor real: sus criterios se usan para alimentar señales como Q*.
Estamos ante un momento clave para la industria. Por primera vez, contamos con una visión interna, detallada y validada judicialmente de cómo Google estructura su sistema de ranking. Esta información permitirá que profesionales, docentes y estudiantes de SEO comprendan con mayor claridad qué prácticas siguen funcionando y por qué.

