Marcado schema para GEO: lo que dicen los datos reales

por Carmen Diaz SoloagaJun 19, 2026Investigaciones sobre contenidos0 Comentarios

Si te gusta, ¡dale un voto positivo!

Resumen rápido

El marcado schema para GEO se ha convertido en uno de los consejos más repetidos del sector. El problema es que los estudios controlados publicados en 2026 no respaldan esa recomendación cuando se aplica a plataformas como ChatGPT o Perplexity. Aquí analizamos los datos reales, sin filtros.

Puntos clave

El 81% de páginas citadas tienen schema — pero la correlación desaparece al controlar otros factores

AccuraCast analizó 9.000 citaciones y encontró correlación, no causalidad. Las páginas con schema suelen tener mejor SEO general, y eso es lo que las hace citables.

Ahrefs rastreó 1.885 páginas: las citaciones de IA apenas se movieron

El estudio de mayo de 2026 usó un análisis de diferencia en diferencias contra 4.000 páginas de control. Resultado: +2,4% en AI Mode y +2,2% en ChatGPT, ambos indistinguibles de ruido estadístico.

El paper de Princeton que todos citan nunca testó schema

El estudio de Princeton, Georgia Tech y Allen Institute (KDD 2024) testó estrategias de contenido como añadir citas y estadísticas. El schema no formó parte del experimento. El sector lo malinterpretó.

Schema sigue siendo útil — pero para SEO y Google, no para ChatGPT

La evidencia de rich snippets, Knowledge Graph y AI Overviews de Google es sólida. La de plataformas externas como ChatGPT o Perplexity, no existe.

Cuando empezamos a implementar el marcado schema en socialmediapymes.com, lo hicimos porque tenía sentido técnico. Añadimos Organization schema en la homepage con las propiedades esenciales: nombre, URL, descripción, logo y perfiles sociales en sameAs. En pocas semanas vimos un Knowledge Panel incipiente en los resultados de búsqueda de marca. El schema funcionó.

Lo que no teníamos entonces —y que ahora el sector empieza a tener— son datos controlados sobre si ese mismo marcado schema para GEO mejora las citaciones en motores generativos como ChatGPT, Perplexity o Gemini. La respuesta que está emergiendo de los estudios reales es incómoda para muchos: probablemente no.

Esto no significa que el schema sea inútil. Significa que la narrativa que se ha construido alrededor del marcado schema para GEO va por delante de la evidencia. Y eso merece un análisis honesto.

Lo que se está discutiendo sobre marcado schema para GEO

Schema sí mejora la visibilidad en Google Search y AI Overviews.

Schema no ha demostrado mejorar citaciones en ChatGPT ni Perplexity.

El paper de Princeton que todos citan nunca testó schema.

Qué es el marcado schema para GEO y por qué se convirtió en el consejo más repetido

El marcado schema (también llamado datos estructurados) es código en formato JSON-LD que se añade al HTML de una página para que los motores de búsqueda e IA interpreten su contenido con precisión.

Está basado en el vocabulario de schema.org, el estándar mantenido por Google, Microsoft, Yahoo y Yandex desde 2011.

Los tipos más relevantes para contenido editorial son:

FAQPage
Article
Organization
HowTo y
Person.

Cada uno le dice al sistema que rastrea la página algo concreto: si el contenido es un artículo, quién lo escribe, si hay preguntas y respuestas, etc.

Herramienta de validación de marcado shema

La lógica de aplicarlo a GEO es intuitiva. Si Google usa el schema para entender el contenido antes de mostrarlo en resultados enriquecidos, ¿no harán lo mismo los motores de IA para decidir qué fuentes citar? Es una extrapolación razonable.

El problema es que extrapolación y evidencia no son lo mismo.

El consejo se propagó rápido porque encajaba con lo que los profesionales de SEO ya sabían hacer. Implementar JSON-LD es una tarea técnica concreta, medible, con herramientas de validación disponibles.

Como todo lo relacionado con el funcionamiento de GEO, tener algo específico que hacer fue bienvenido entre la comunidad SEO.

Las agencias lo adoptaron, lo vendieron y lo documentaron.

Ahora hay decenas de artículos en inglés y en español que lo recomiendan como parte de cualquier estrategia de posicionamiento en IA.

Nadie, hasta hace poco, había sometido esa recomendación a una prueba controlada.

Otro generador de marcado schema

El problema con los datos de correlación: el 81% que no significa lo que parece

El argumento más citado a favor del marcado schema para GEO proviene de un análisis de AccuraCast sobre 9.000 citaciones en ChatGPT, AI Overviews de Google y Perplexity: el 81% de las páginas citadas tenían schema markup implementado. El número circuló por el sector como prueba de que el schema mejora la visibilidad en IA.

Análisis de Accuracast sobre marcado schema IA

El problema del estudio de Accuracast

El problema es estadístico. Correlación no es causalidad, y en este caso hay una explicación alternativa mucho más plausible: las páginas con schema tienden a ser páginas de sitios técnicamente bien mantenidos.

Esas mismas webs publican contenido de mayor calidad, acumulan más backlinks, tienen mejor autoridad de dominio y posicionan bien en búsqueda orgánica tradicional. Los motores de IA citan ese tipo de contenido precisamente por esas características, no porque tenga JSON-LD.

Los propios autores del estudio de AccuraCast llegaron a esa conclusión: «nuestra investigación ha encontrado que la adición de datos schema no correlaciona necesariamente con mayor visibilidad en búsqueda generativa de IA.» Una frase que no viajó tanto como el 81%.

Conclusiones clave del estudio de Accuracast

Esto es relevante para entender las entidades SEO y su relación con la visibilidad en IA: lo que los modelos generativos buscan no es el schema en sí, sino la claridad de identidad que el schema —bien implementado en un sitio de calidad— ayuda a construir. La diferencia es importante.

Lo que revelan los experimentos controlados

En mayo de 2026, Ahrefs publicó el estudio más riguroso realizado hasta la fecha sobre el impacto del marcado schema para GEO.

Louise Linehan y Xibeijia Guan rastrearon 1.885 páginas que añadieron JSON-LD entre agosto de 2025 y marzo de 2026, y las compararon contra 4.000 páginas de control sin schema usando un análisis de diferencia en diferencias — la metodología estándar en econometría para aislar el efecto de un cambio cuando hay ruido de fondo.

Los resultados, medidos sobre citaciones en Google AI Overviews, Google AI Mode y ChatGPT, fueron los siguientes:

+2,4% en AI Mode,
+2,2% en ChatGPT y
−4,6% en AI Overviews.

Los dos primeros son estadísticamente indistinguibles de ruido aleatorio a lo largo de miles de URLs. El tercero es estadísticamente significativo, con una probabilidad de ser azar de aproximadamente 1 entre 2.500, pero apunta en dirección contraria a la que se esperaba.

Ahrefs, estudio marcado Schema

La conclusión del informe fue directa:

añadir schema a páginas ya visibles para la IA no mueve la aguja, y en un caso la mueve ligeramente en la dirección equivocada.

Tres meses antes, OtterlyAI había publicado los resultados de un experimento propio sobre siete plataformas de IA.

Implementaron cinco tipos de schema en páginas reales y luego preguntaron directamente a cada motor que les devolviera el código JSON-LD de esas páginas.

Resultado: 6 de 7 plataformas no pudieron leer ni interpretar el schema cuando se les pidió explícitamente. Solo Gemini recuperó el JSON-LD correctamente. Google AI Mode llegó al extremo opuesto: alucinó tipos de schema que no existían en la página.

Hallazgos clave del estudio de OtterlyAI sobre Marcado schema y GEO

La arquitectura explica el resultado. Los modelos de lenguaje leen texto no estructurado de forma nativa — para eso fueron diseñados. El schema fue creado en 2011 como solución a un problema que los parsers de entonces no podían resolver: interpretar el significado semántico del contenido HTML. Los LLMs no tienen ese problema.

Tres datos que cambian el análisis

Ahrefs: +2,4% en AI Mode tras añadir schema. Ruido estadístico.

OtterlyAI: 6 de 7 motores de IA no pudieron leer el JSON-LD.

El paper de Princeton nunca testó schema — testó estrategias de contenido.

El malentendido con el paper de Princeton que todos citan

Hay un estudio que aparece en prácticamente todos los artículos sobre marcado schema para GEO como evidencia de su impacto: la investigación de Princeton, Georgia Tech y Allen Institute for AI publicada en KDD 2024, que documentó que aplicar técnicas GEO puede aumentar la visibilidad en respuestas generativas hasta un 40%.

El problema es que ese estudio no testó schema en absoluto.

Testó estrategias de contenido: añadir citas de fuentes, incluir estadísticas con atribución explícita, usar lenguaje persuasivo, estructurar respuestas directas. Son técnicas de escritura, no de marcado técnico. Las confundió el sector al trasladar los resultados a una recomendación de implementación de JSON-LD.

Marcado schema para GEO, la investigación de Princestone.

Lo señala con precisión Belmore Digital en su análisis de mayo de 2026:

«el estudio de Princeton que se cita constantemente en las discusiones sobre schema no testó schema en absoluto. Esas recomendaciones están extrapoladas desde el valor SEO tradicional, no desde evidencia específica de IA.»

A fecha de hoy no existe ningún estudio revisado por pares sobre el impacto del schema en la visibilidad de IA. Ninguno.

Las recomendaciones que llenan el sector son hipótesis razonables, no conclusiones empíricas.

Conviene tener esto en cuenta cuando se evalúa si incluir el marcado schema para GEO dentro de una estrategia de visibilidad en motores de búsqueda con IA.

Por qué los LLMs no necesitan schema como lo necesitaban los buscadores

Entender la arquitectura ayuda a entender por qué el schema no tiene el mismo efecto en GEO que en SEO tradicional.

Los buscadores de 2011 —cuando nació schema.org— dependían de reglas explícitas para interpretar el contenido. Si una página decía «29,99 €», el crawler no sabía si era un precio, una puntuación o un número de teléfono. El schema resolvía esa ambigüedad etiquetando cada elemento: esto es un precio, esto es una valoración, esto es el nombre del autor.

Los modelos de lenguaje grandes funcionan de forma radicalmente distinta

Han sido entrenados sobre cantidades masivas de texto no estructurado y pueden inferir el significado semántico de un párrafo sin necesidad de etiquetas. Un LLM entiende perfectamente que una sección de preguntas y respuestas es una FAQ aunque no tenga schema FAQPage implementado, porque ha leído millones de FAQs durante el entrenamiento.

Esto no significa que el schema sea irrelevante para los sistemas de IA.

Significa que su papel es diferente: puede contribuir durante la fase de ingesta de datos de entrenamiento, y probablemente tiene efecto cuando los sistemas usan recuperación aumentada (RAG), como hace ChatGPT cuando realiza búsquedas web. Pero ese efecto no está cuantificado ni demostrado de forma controlada.

Para qué sí sirve el marcado schema en 2026

No confundamos cosas, el marcado schema funciona y eso no se discute.

Funciona para los resultados enriquecidos en la búsqueda de Google, que no es poca cosa.

Para alimentar el Knowledge Graph y construir la identidad de una marca como entidad reconocible, el schema de Organization en la página de inicio es lo mejor, nuestra propia experiencia en socialmediapymes.com lo confirma.

Para AI Overviews de Google específicamente, el estudio de OtterlyAI encontró un aumento de +1.500% en SERP features tras implementar schema, lo que sugiere que dentro del ecosistema de Google el efecto sí existe.

La distinción importante es esta: Google AI Overviews es un sistema que vive dentro del buscador de Google, que ya indexa y procesa el schema de forma nativa. ChatGPT, Perplexity y Gemini como motor de búsqueda independiente son sistemas diferentes, con arquitecturas diferentes, que no han demostrado beneficiarse del JSON-LD de la misma manera.

Para quien trabaja el posicionamiento en la IA de Google, el schema sigue siendo una inversión justificada. Para quien quiere aparecer en ChatGPT o Perplexity, la evidencia apunta hacia otras palancas.

Qué hacer en lugar de obsesionarse con el schema para GEO

El mismo estudio de Ahrefs que descartó el schema como palanca de GEO identificó qué sí mueve la aguja en plataformas generativas. Los resultados son más útiles que la recomendación de schema porque están basados en el mismo conjunto de datos.

Las páginas cuyos titulares responden directamente la pregunta del usuario son citadas por ChatGPT el 41% de las veces, frente al 29% de páginas con titulares vagamente relacionados.

El contenido completo que cubre entre el 26% y el 50% de las sub-consultas de ChatGPT se cita más que el contenido exhaustivo que intenta cubrirlo todo. Un URL semánticamente relevante para la consulta también mejora la probabilidad de citación.

El paper de Princeton sí identificó qué funciona dentro del contenido: añadir citas de fuentes verificables, incluir estadísticas con atribución explícita, responder preguntas de forma directa en los primeros párrafos de cada sección. Estas estrategias producen mejoras documentadas de entre un 30% y un 40% en visibilidad generativa.

Nada de esto contradice implementar schema. Pero sí establece prioridades: si el tiempo es limitado, mejorar la estructura y el enfoque del contenido tiene más impacto demostrado en GEO que añadir JSON-LD. El schema es la capa que viene después, no la primera.

Más sobre cómo estructurar el contenido para este objetivo en nuestra guía de redacción con IA orientada a resultados.

Qué sí funciona para GEO según los datos

Titulares que responden la pregunta directamente: +41% de citaciones en ChatGPT.

Contenido enfocado (no exhaustivo) citado con más frecuencia.

Citas de fuentes verificables y estadísticas con atribución: +30-40% visibilidad.

Implementamos schema en socialmediapymes.com y seguimos haciéndolo. Funciona para lo que siempre ha funcionado: rich snippets, Knowledge Panel, AI Overviews dentro de Google. No hay razón para desinstalarlo.

Lo que no haremos es recomendarlo a un cliente como estrategia de visibilidad en ChatGPT o Perplexity mientras no haya evidencia controlada que lo respalde. Las tres mejores palancas disponibles hoy para GEO en plataformas generativas son: titulares directos que responden preguntas, contenido con citas y datos verificables, y autoridad de entidad bien construida.

El schema puede venir después. El contenido es lo primero.

Preguntas frecuentes sobre marcado schema para GEO

¿El marcado schema mejora las citaciones en ChatGPT y Perplexity?

Según el estudio de Ahrefs de mayo de 2026, que analizó 1.885 páginas con un diseño de diferencia en diferencias, el efecto fue de +2,4% en AI Mode y +2,2% en ChatGPT, ambos indistinguibles de ruido estadístico. No existe evidencia controlada de que el marcado schema para GEO mejore las citaciones en plataformas externas a Google.

¿El estudio de Princeton demostró que el schema mejora la visibilidad en IA?

No. El paper de Princeton, Georgia Tech y Allen Institute (KDD 2024) testó estrategias de contenido —añadir citas, estadísticas y respuestas directas— no schema markup. La asociación entre ese estudio y el JSON-LD es un error de interpretación que se propagó por el sector.

¿Para qué sí funciona el schema en 2026?

El schema tiene evidencia sólida para rich snippets en Google Search, para construir identidad de marca en el Knowledge Graph, y para AI Overviews dentro del ecosistema de Google. OtterlyAI encontró un aumento de +1.500% en SERP features tras implementar schema, aunque no un impacto equivalente en plataformas de IA externas.

¿Qué estrategias sí mejoran la visibilidad en motores generativos?

Los datos de Ahrefs señalan titulares que responden directamente la pregunta del usuario (+41% de citaciones en ChatGPT frente a titulares vagos), contenido enfocado en lugar de exhaustivo, y URLs semánticamente relevantes. El estudio de Princeton identifica citas de fuentes verificables y estadísticas con atribución como factores que aumentan la visibilidad hasta un 40%.

¿Debo dejar de implementar schema si me interesa el GEO?

No. El schema sigue siendo una práctica SEO correcta con beneficios documentados para Google Search y AI Overviews. La recomendación es mantenerlo por esos motivos, pero no priorizar su implementación como palanca específica de GEO en plataformas como ChatGPT o Perplexity mientras no haya evidencia controlada que lo respalde.

0 comentarios

Enviar un comentario Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

¿Sin ideas para tu blog?

Encuentra temas que conectan con tus clientes y mejoran tu visibilidad.

Ideas reales para crear contenido que vende

¿Quién escribe mejor: un humano o la IA?

¡Adivínalo! Haz el quiz y prueba tus habilidades de redacción.

HAZ EL QUIZ AHORA