🎯 Objetivo de esta lección:
Entender qué es el archivo llms.txt
, por qué ha surgido, qué papel cumple en el ecosistema de los modelos de lenguaje (LLMs) y cómo se está convirtiendo en un nuevo estándar dentro del SEO conversacional.
📜 ¿Qué es el archivo llms.txt
?
El archivo llms.txt
(Large Language Models Exclusion Protocol) es un archivo de texto plano que se ubica en la raíz de una web (por ejemplo, https://tusitio.com/llms.txt
) y permite declarar tus condiciones sobre cómo quieres que los modelos de lenguaje usen tu contenido.
Piensa en él como el equivalente moderno del archivo robots.txt
, pero orientado a la inteligencia artificial conversacional.
📌 robots.txt → le dice a los motores de búsqueda qué pueden rastrear.
📌 llms.txt → le dice a los modelos de lenguaje qué contenido pueden usar, cómo, y bajo qué condiciones.
📅 ¿Cuándo y por qué nació?
El archivo llms.txt
fue propuesto en abril de 2024 como parte de una respuesta al crecimiento masivo del uso de modelos LLMs (ChatGPT, Gemini, Claude…) y a las preocupaciones de los creadores de contenido, medios de comunicación, editores y desarrolladores.
🔍 ¿El problema?
Millones de webs estaban siendo utilizadas para entrenar modelos de IA sin conocimiento ni consentimiento directo de los autores.
🛡️ ¿La solución?
Un mecanismo simple, accesible y universal para que cualquier webmaster pudiera decidir cómo se usa su contenido en la era de la IA.
🔎 ¿Quién está detrás?
El impulso inicial del estándar fue dado por OpenAI, pero ha sido rápidamente adoptado y observado por otros actores del sector tecnológico. Aunque todavía no es una norma legal, es ya una práctica reconocida y emergente, como lo fue robots.txt
en sus primeros años.
🎯 ¿Para qué sirve exactamente?
Con llms.txt
puedes:
- Permitir que tu contenido sea utilizado por modelos de IA.
- Restringir el uso de partes o secciones de tu web.
- Solicitar atribución (que te citen como fuente).
- Denegar el uso comercial de tu contenido.
- Declarar una dirección de contacto para cuestiones de derechos.
Es decir: tienes una herramienta para establecer tus reglas del juego con los LLMs.
📌 Ejemplo básico de un archivo llms.txt
:
txtCopiarEditarUser-agent: gpt-4
Allow: /
Commercial-use: allow
Attribution: required
Contact: contacto@tusitio.com
Este archivo indica que permitimos que GPT-4 use todo nuestro sitio, incluso con fines comerciales, siempre que nos cite como fuente y nos puedan contactar si hay problemas.
📌 Ejemplo alternativo (más restrictivo):
txtCopiarEditarUser-agent: *
Disallow: /blog-privado/
Commercial-use: disallow
Attribution: required
Contact: legal@midominio.com
En este caso, se prohíbe el uso comercial, se restringe el acceso a una parte específica del sitio, pero se permite el resto con mención.
🚨 ¿Y si no tienes un archivo llms.txt
?
💡 Por defecto, los modelos pueden seguir usando tu contenido si ya lo han recolectado, a menos que uses este archivo o tomes medidas legales específicas.
No tener un archivo llms.txt
es como dejar la puerta abierta.
Tenerlo te permite negociar, condicionar o facilitar un uso controlado y beneficioso.
🧠 Conclusión
El archivo
llms.txt
es el nuevo punto de control entre creadores de contenido y la inteligencia artificial.
Es sencillo, transparente y una oportunidad para los que quieran liderar el SEO del futuro.
Si sabes usarlo estratégicamente, no solo protegerás tu contenido: lo convertirás en una fuente visible, citada y relevante dentro del universo de las IA.