🎯 Objetivo de esta lección:
Aprender a redactar correctamente un archivo llms.txt
, entender sus componentes clave y dominar la sintaxis necesaria para establecer tus preferencias frente a los modelos de lenguaje.
📂 ¿Qué es exactamente un archivo llms.txt
?
Es un archivo de texto plano (sin formato, como un .txt
normal) que debe colocarse en la raíz de tu dominio, es decir:
arduinoCopiarEditarhttps://tusitio.com/llms.txt
Los modelos de lenguaje lo consultan para saber si pueden utilizar el contenido de tu web, bajo qué condiciones y a qué secciones afecta.
⚙️ Estructura general
El archivo se compone de instrucciones simples, una por línea, con este formato:
makefileCopiarEditarComando: valor
Los comandos pueden ir dirigidos a un modelo específico (por ejemplo, gpt-4
) o a todos los modelos (*
), y los valores definen tus preferencias.
🔑 Comandos principales del llms.txt
1. User-agent
Especifica el modelo o familia de modelos a los que se aplican las reglas.
txtCopiarEditarUser-agent: gpt-4
User-agent: gemini
User-agent: *
Usa *
para indicar todos los modelos.
2. Allow
y Disallow
Permite o deniega el acceso a rutas específicas de tu web.
txtCopiarEditarAllow: /
Disallow: /privado/
Allow: /
→ permite el acceso a toda la web.Disallow: /carpeta/
→ bloquea esa carpeta concreta.
✅ Se aplican como en
robots.txt
, pero enfocados a la lectura por parte de modelos de IA, no de motores de búsqueda.
3. Commercial-use
Indica si autorizas que tu contenido se utilice con fines comerciales.
txtCopiarEditarCommercial-use: allow
Commercial-use: disallow
- allow → aceptas que usen tu contenido en respuestas que puedan generar beneficios (como en plataformas de pago).
- disallow → solo autorizas uso no comercial.
4. Attribution
Determina si exiges que tu web sea citada como fuente.
txtCopiarEditarAttribution: required
Attribution: optional
Attribution: not-required
- required → obligas a que te mencionen como autor o fuente.
- optional → lo dejas a criterio del modelo.
- not-required → no exiges atribución.
5. Contact
Proporciona un correo o enlace para temas legales o peticiones específicas.
txtCopiarEditarContact: contacto@tusitio.com
🛡️ Muy útil si quieres permitir el uso de contenido, pero tener un canal abierto para negociaciones o solicitudes.
✍️ Ejemplo completo de llms.txt
bien estructurado
txtCopiarEditarUser-agent: *
Allow: /
Disallow: /zona-privada/
Commercial-use: allow
Attribution: required
Contact: legal@midominio.com
Esto indica:
- Permites que cualquier modelo acceda a toda tu web, excepto la carpeta
/zona-privada/
. - Aceptas uso comercial, pero solo si se te atribuye como fuente.
- Has dejado un correo para consultas o solicitudes.
🚨 Reglas y buenas prácticas
- ✅ Una directiva por línea.
- ✅ Usa siempre letras minúsculas, sin espacios antes ni después de los dos puntos.
- ✅ El archivo debe estar codificado en UTF-8 sin BOM.
- ✅ Si usas WordPress, deberás subirlo vía FTP o plugin avanzado (veremos esto en el módulo 4).
- ⚠️ El orden importa: si hay reglas contradictorias, las más específicas deben ir después.
🧠 Conclusión
El archivo
llms.txt
es como un contrato abierto entre tu web y las IA del mundo.
Dominar su sintaxis es el primer paso para proteger tu contenido y posicionarte estratégicamente.
Con solo 5-10 líneas de texto, puedes definir cómo será tu relación con los modelos que ya están modelando el futuro del SEO.