Derechos de Autor y Conexos
11 of August,2025

Entrenamiento de IA con obras protegidas: amparada por uso justo en EE. UU 

Por: Lina M. Díaz  - Abogada, Magíster en PI y Derecho de la Competencia - LSE Magíster en Economía Aplicada - U. de los Andes

Entrenamiento de IA con obras protegidas: amparada por uso justo en EE. UU 

Dos decisiones judiciales, aplicando análisis diferentes, concluyeron que el uso de obras protegidas por derecho de autor para entrenar herramientas de inteligencia artificial IA -Large Language Models LLMs- se justifica en virtud de la doctrina del fair use1.  

La doctrina del Fair Use, o uso justo, busca equilibrar los derechos del autor con los del público en general y la libre expresión al permitir el uso no autorizado de obras protegidas por derecho de autor. Para esto se analizan cuatro parámetros señalados en la Sección 107 del Copyright Act. Los parámetros, a grandes rasgos, son:  

  1. El propósito del uso, si es transformativo y tiene finalidad comercial; Es decir, cómo se usó la obra protegida y con qué finalidades. Los usos transformadores son aquellos en los que la obra se usa para crear cosas nuevas como una parodia. 
  1. La naturaleza de la obra, determinar si las obras son creativas y expresivas o no. En otras palabras, se analiza si la obra es creativa y expresiva o si más bien es fáctica e informativa, teniendo mayor protección las primeras porque son las que se desean fomentar a través del Copyright.  
  1. La cantidad e importancia de la obra protegida que fue empleada, es decir, la razonabilidad de la cantidad empleada frene al objetivo del uso 
  1. Si el uso no autorizado afecta la posibilidad del titular de explotar la obra. El Copyright otorga a los autores un conjunto de derechos sobre la obra protegida: reproducción, distribución, creación de trabajos derivados, exhibición y ejecución pública de grabaciones. Si el uso no autorizado limita la posibilidad de explotar la obra, es decir, si afecta el mercado de la obra no se considera un uso justo.  

Estos parámetros se estudian analizando las pruebas existentes en el caso concreto, primero individualmente y luego en conjunto para sopesarlos y determinar si está justificado el uso no autorizado de la obra protegida. 

En seguida se resumen las dos sentencias en mención y se plantean algunos comentarios:  

  1. Andrea Bartz, Charles Graeber, Kirk Wallace Johnson, Bartz Inc., and MJ + KJ Inc. v. Anthropic PBC (No. C 24-05417 WHA). 

 Tres autores y su casa editorial demandaron a Anthropic PBC por usar sin autorización sus obras para crear una biblioteca que luego serviría para entrenar a Claude, un LLM que responde con texto al recibir prompt del usuario. La biblioteca tenía como objetivo tener “todos los libros del mundo” y preservarlos para “siempre”. Algunos libros fueron adquiridos legalmente, otros descargados de sitios piratas y otros escaneados tras destrozar ejemplares impresos de segunda mano. 

Anthropic, fundada por exempleados de OpenAI, no negó la creación de la biblioteca ni el uso de las obras, sino que solicitó un juicio sumario alegando uso justo conforme a la Sección 107 del Copyright Act. 

La Corte del Distrito Norte de California identificó dos usos distintos: i) la creación de la biblioteca y ii) el entrenamiento de la IA, y analizó la doctrina del Fair use para las tres fuentes de obras usadas. Respecto de las obras adquiridas legítimamente la Corte concluyó que el uso era justo: porque fue transformador al no replicar el trabajo de los autores, sino que crear algo nuevo, que la Corte consideró es similar a un humano que lee, aprende de lo que lee y luego escribe algo nuevo. Aunque las obras eran expresivas y producto de la creatividad, su uso se consideró razonable dada la gran cantidad de obras necesaria para entrenar la IA. Además, las salidas de la IA no reproducían las obras y para evitar que eso pasara se empleó un software que bloquea esa posibilidad. 

Sobre el impacto en el mercado, la Corte rechazó que el entrenamiento de la IA generara una competencia de la que los autores se pudieran proteger en virtud del Copyright. La Corte señaló que “The Act seeks to advance original Works of authorship, not to protect authors against competition”2. También desestimó que los autores tuvieran derecho a un mercado de licencias para entrenar IA, afirmando que “La Ley de Derechos de Autor no autoriza a los autores a explotar un mercado para ese uso”3.  

Recuérdese que el Copyright otorga un conjunto de derechos exclusivos (reproducir, distribución, exhibición pública) pero dentro de esos no se encuentra exactamente uso para entrenar IA. 

Respecto a los libros de segunda escaneados, la Corte consideró que el uso fue justo porque los libros físicos se sustituyeron por copias digitales sin divulgación a terceros. En cambio, las obras piratas no superaron el análisis de los parámetros del uso justo, ya que los libros piratas sí usurpan el mercado de los originales y se almacenaron permanentemente sin compensar a los autores. 

  1.  Kadrey v. Meta Platforms, Inc., No. 23-cv-03417-VC (N.D. Cal. June 25, 2025), 

Esta segunda decisión, también inicia por autores oponiéndose al uso de sus obras para entrenar LLMs, aunque cuestiona y desestima algunos de los argumentos de la decisión anterior, coincide en que tal uso está justificado por la doctrina del Fair use. 

En el análisis del impacto del uso no autorizado sobre el mercado de la obra, se cuestionó que en efecto entrenar una IA con obras protegidas sea equivalente a usarlas para enseñar a escribir a futuros autores. El uso de IA generativa ahorra tiempo y esfuerzo creativo, de forma que la creación de obras de literatura, fotografías, canciones, etc. es mucho más rápido y requiere menos esfuerzo intelectual, de forma que fácilmente va a inundarse el mercado de obras creadas usando estas herramientas que competirán por las obras creadas por humanos.  

Así mismo, se cuestionó que se desincentivara el desarrollo de la IA si se concluye que este uso no es fair use, porque los ingresos que se esperan obtener de la comercialización de ellas supera los USD$1,4 trillones en 10 años. De forma que sí realmente las obras protegidas son tan importantes para entrenar las IAs las empresas creadoras hallarán una forma legítima de acceder a ellas. 

Sin embargo, la Corte en esta decisión también concluyó que se configura fair use porque los demandantes no aportaron prueba suficiente de la competencia que enfrentan en la actualidad o que enfrentarían en el futuro con la creación masiva de obras gracias a estas herramientas de IA.  

Así mismo, explicó que en todos los casos de fair use, los demandantes alegan que pierden la posibilidad de explotar un mercado de licencias por lo que el cuarto elemento se vuelve un argumento circular. En otras palabras, cuando se alega que el uso no autorizado de una obra no se ampara por fair use, uno de los argumentos respecto del cuarto factor es que, si se autoriza ese uso, los autores pierden la posibilidad de explotar la obra a través de un mercado de licencias. Sobre este punto la Corte señaló que “para evitar que el cuarto factor de análisis se vuelva circular y favorezca al titular del derecho en todos los casos, el daño por la pérdida de las tarifas pagadas para licenciar una obra con fines transformadores no es reconocible.”4 Así mismo reiteró la corte que “Sin embargo, el hecho de que tal mercado exista o sea probable que se desarrolle es irrelevante, porque no es un mercado que los demandantes tengan derecho legal a monopolizar.”5 

Conclusiones: 

De las decisiones anteriores surgen varios puntos a considerar: 

  1. Con relación al carácter transformador del uso y a la cantidad o volumen de las obras empleadas para entrenar IA parece emerger un estándar que ampara el uso justo. Esto porque el resultado del entrenamiento no es una copia ni reproducción de la obra inicial, sino una tecnología nueva para crear contenido. Adicionalmente, porque el volumen de material necesario es tan basto que, mientras no reproduzcan fragmentos sustanciales ni reconocibles de las obras iniciales es justifica por el fair use.  
  1. Sin embargo, las diferencias argumentativas que llevan a esta conclusión generan incertidumbre respecto de la mejor estrategia para que futuras acciones de infracción tengan éxito. No es del todo claro que argumentar que con la IA se facilita exponencialmente la creación de obras creativas que compitan con las no creadas con IA vaya a ser un argumento favorable para los autores, sobre todo si se considera también que existen diferentes posturas sobre la autoría y titularidad de las obras creadas con IA y si se protegen por Copyright/Derecho de autor.  
  1. Es incierto que Copyright Act permita o ampare creación de un mercado de licencias para entrenar IA con obras protegidas. El Copyright otorga a los autores ciertos derechos exclusivos sobre actos definidos (reproducción, distribución, exhibición, hacer obras derivadas) pero no reconoce un derecho general a controlar todos los posibles usos de las obras. Entonces, si comprando obras de segunda mano el fair use legitima su uso para entrenar una IA, no habría necesidad de incurrir en largas negociaciones con los autores o con sociedades de gestión colectiva para obtener las licencias. 

Así, tenemos que en tanto no se decidan casos en instancias superiores, la seguridad jurídica para autores frente al entrenamiento de IA seguirá siendo limitada, especialmente si los modelos se entrenan con obras legalmente adquiridas y no generan una reproducción textual de las obras en sus respuestas.