Lección 2.1: Estructura básica y sintaxis del archivo llms.txt

Imagen promocional del curso online Domina el archivo llms.txt: SEO Conversacional para LLMs

🎯 Objetivo de esta lección:

Aprender a redactar correctamente un archivo llms.txt, entender sus componentes clave y dominar la sintaxis necesaria para establecer tus preferencias frente a los modelos de lenguaje.


📂 ¿Qué es exactamente un archivo llms.txt?

Es un archivo de texto plano (sin formato, como un .txt normal) que debe colocarse en la raíz de tu dominio, es decir:

arduinoCopiarEditarhttps://tusitio.com/llms.txt

Los modelos de lenguaje lo consultan para saber si pueden utilizar el contenido de tu web, bajo qué condiciones y a qué secciones afecta.


⚙️ Estructura general

El archivo se compone de instrucciones simples, una por línea, con este formato:

makefileCopiarEditarComando: valor

Los comandos pueden ir dirigidos a un modelo específico (por ejemplo, gpt-4) o a todos los modelos (*), y los valores definen tus preferencias.


🔑 Comandos principales del llms.txt

1. User-agent

Especifica el modelo o familia de modelos a los que se aplican las reglas.

txtCopiarEditarUser-agent: gpt-4
User-agent: gemini
User-agent: *

Usa * para indicar todos los modelos.


2. Allow y Disallow

Permite o deniega el acceso a rutas específicas de tu web.

txtCopiarEditarAllow: /
Disallow: /privado/
  • Allow: / → permite el acceso a toda la web.
  • Disallow: /carpeta/ → bloquea esa carpeta concreta.

✅ Se aplican como en robots.txt, pero enfocados a la lectura por parte de modelos de IA, no de motores de búsqueda.


3. Commercial-use

Indica si autorizas que tu contenido se utilice con fines comerciales.

txtCopiarEditarCommercial-use: allow
Commercial-use: disallow
  • allow → aceptas que usen tu contenido en respuestas que puedan generar beneficios (como en plataformas de pago).
  • disallow → solo autorizas uso no comercial.

4. Attribution

Determina si exiges que tu web sea citada como fuente.

txtCopiarEditarAttribution: required
Attribution: optional
Attribution: not-required
  • required → obligas a que te mencionen como autor o fuente.
  • optional → lo dejas a criterio del modelo.
  • not-required → no exiges atribución.

5. Contact

Proporciona un correo o enlace para temas legales o peticiones específicas.

txtCopiarEditarContact: contacto@tusitio.com

🛡️ Muy útil si quieres permitir el uso de contenido, pero tener un canal abierto para negociaciones o solicitudes.


✍️ Ejemplo completo de llms.txt bien estructurado

txtCopiarEditarUser-agent: *
Allow: /
Disallow: /zona-privada/
Commercial-use: allow
Attribution: required
Contact: legal@midominio.com

Esto indica:

  • Permites que cualquier modelo acceda a toda tu web, excepto la carpeta /zona-privada/.
  • Aceptas uso comercial, pero solo si se te atribuye como fuente.
  • Has dejado un correo para consultas o solicitudes.

🚨 Reglas y buenas prácticas

  • Una directiva por línea.
  • ✅ Usa siempre letras minúsculas, sin espacios antes ni después de los dos puntos.
  • ✅ El archivo debe estar codificado en UTF-8 sin BOM.
  • ✅ Si usas WordPress, deberás subirlo vía FTP o plugin avanzado (veremos esto en el módulo 4).
  • ⚠️ El orden importa: si hay reglas contradictorias, las más específicas deben ir después.

🧠 Conclusión

El archivo llms.txt es como un contrato abierto entre tu web y las IA del mundo.
Dominar su sintaxis es el primer paso para proteger tu contenido y posicionarte estratégicamente.
Con solo 5-10 líneas de texto, puedes definir cómo será tu relación con los modelos que ya están modelando el futuro del SEO.

Más entradas