Lección 3.3 El papel del Schema en la preparación de contenidos para LLMs

🎯 Objetivo

Comprender cómo el uso de Schema.org y datos estructurados puede aumentar las probabilidades de que tu contenido:

  1. Sea comprendido correctamente por modelos de lenguaje como ChatGPT o Gemini.
  2. Sea utilizado como base o referencia para sus respuestas.
  3. Aparezca citado, mencionado o priorizado en resultados conversacionales.

🧠 ¿Cómo “leen” los LLMs el contenido de tu web?

Los LLMs procesan texto web mediante crawlers y bases de datos de entrenamiento. Aunque no todos acceden en tiempo real (salvo Perplexity, Bing o algunas extensiones en ChatGPT), sí integran datos estructurados si están bien definidos.

Cuando encuentran una web con marcado:

  • Identifican mejor las entidades (personas, productos, recetas, servicios…)
  • Distinguen claramente lo que es información útil vs. ruido
  • Generan respuestas más confiables si los datos tienen contexto estructurado

🔍 ¿Qué aporta Schema a los LLMs?

Sin SchemaCon Schema
Texto libre, ambiguoContenido con contexto semántico
Difícil de interpretar relaciones entre elementosRelación clara entre precio, disponibilidad, autor, etc.
Bajo nivel de reutilizaciónAlta probabilidad de ser citado o reformulado
Más errores al generar respuestasMayor precisión y confianza

📦 Casos concretos donde Schema ayuda

🛒 Producto

  • Schema: Product + Offer + AggregateRating
  • Resultado: Gemini o Perplexity pueden listar tus productos como opciones válidas, con precio y valoración visible

🧑 Persona o experto

  • Schema: Person
  • Resultado: ChatGPT puede reconocer tu perfil como autor fiable en un tema específico

🎓 Curso online

  • Schema: Course + FAQPage
  • Resultado: Apareces citado en búsquedas como “¿Dónde hacer un curso de Schema en WordPress?”

📰 Artículo especializado

  • Schema: Article
  • Resultado: Aumenta la probabilidad de ser resumido o citado correctamente

💡 Bonus: Schema para prompts y aprendizaje de IA

Muchos proyectos están usando marcado semántico para entrenar LLMs privados, personalizando qué tipo de contenido aprenden y cómo lo entienden.

En sistemas como:

  • Chatbots empresariales con embeddings
  • IA entrenadas en documentación técnica
  • LLMs internos para atención al cliente

👉 El Schema ayuda a:

  • Clasificar tipos de contenido
  • Extraer secciones clave
  • Organizar respuestas por categorías

🔐 Recomendaciones para LLM-readiness

  1. Usa JSON-LD estructurado y completo
  2. Marca solo contenido visible y relevante
  3. Incluye Schema para:
    • Autoría (author)
    • Fecha (datePublished)
    • Categoría (@type)
    • Entidades relacionadas (brand, organization, person, etc.)
  4. Añade un archivo llms.txt (lo veremos en detalle) para indicar que autorizas a los LLMs a usar tu contenido
  5. Escribe con lenguaje claro, natural y sin relleno

🛠️ Actividad práctica

  1. Elige una página con contenido relevante en tu web
  2. Añade o revisa su Schema usando JSON-LD
  3. Luego, en ChatGPT o Perplexity, formula una pregunta relacionada con ese tema
  4. ¿Aparece tu contenido? ¿Hay referencias a webs similares?
  5. Analiza qué parte de tu contenido podrías marcar mejor o reescribir más claramente

Más entradas