La inteligencia artificial (IA) de Meta, la empresa matriz de gigantes como Facebook, Instagram y WhatsApp, se encuentra en el ojo del huracán. La compañía ha sido señalada por utilizar bases de datos piratas, como Library Genesis (LibGen), para entrenar sus modelos de IA generativa. Esta práctica, revelada en una investigación publicada por The Atlantic, ha desatado un intenso debate sobre las implicaciones legales, éticas y sistémicas en el desarrollo de la IA y el acceso al conocimiento.
La controvertida fuente de entrenamiento: Library Genesis o LibGen
Library Genesis, o LibGen, es una plataforma conocida por alojar millones de copias ilegales de libros académicos y materiales protegidos por derechos de autor. Para muchos investigadores, especialmente en regiones con acceso limitado a bibliotecas bien financiadas, LibGen ha sido una herramienta invaluable para acceder a información que de otra manera sería inaccesible debido a los exorbitantes precios de las publicaciones académicas. Su surgimiento, en gran medida, fue una respuesta a un sistema editorial percibido como injusto, que restringe el acceso al conocimiento y se beneficia económicamente del trabajo de investigadores sin ofrecerles una compensación justa.
La ironía surge cuando una corporación del tamaño de Meta, una de las empresas más influyentes en el ecosistema digital, recurre a una herramienta nacida de la resistencia contra el poder corporativo. Al utilizar LibGen para alimentar sus modelos de IA, Meta no solo se apropia de contenido sin permiso, sino que también instrumentaliza un acto de desafío para fortalecer su propio poder tecnológico.

Implicaciones legales y éticas de la práctica de Meta
En el tema de la adquisición y consulta de datos Meta puede que esté rozando una fina línea en cuanto a implicaciones legales y éticas.
Más allá de la infracción de derechos de autor
La utilización de contenido pirateado por parte de Meta podría considerarse una infracción directa a los derechos de autor, abriendo la puerta a posibles demandas por parte de editoriales y autores. Sin embargo, la discusión va más allá de la mera legalidad. Lo que realmente se pone en tela de juicio es la lógica «extractivista» que parece guiar el desarrollo de la IA en el sector privado. Tal como señaló un académico cuyo trabajo fue incluido sin autorización: «El problema no es la piratería, sino la forma en que una empresa multimillonaria, que durante años ha explotado los datos personales con fines publicitarios, ahora hace lo mismo con el contenido cultural e intelectual».
Este incidente no es aislado para Meta, que actualmente enfrenta un juicio antimonopolio impulsado por la FTC (Comisión Federal de Comercio) de Estados Unidos. Estos frentes legales y éticos evidencian una falla sistémica: el marco legal de derechos de autor actual no está preparado para los desafíos que plantea la IA generativa, permitiendo que las grandes tecnológicas avancen en zonas grises o incluso al margen de la ley.
¿Es el acceso abierto la solución definitiva?
Ante este panorama, muchas instituciones académicas y científicos están impulsando el modelo de acceso abierto, que promueve la publicación de investigaciones sin barreras de suscripción o pago. Si bien se han logrado avances, el acceso abierto aún enfrenta desafíos relacionados con el privilegio geográfico y económico. Plataformas como Sci-Hub y LibGen surgieron como paliativos a este sistema excluyente, pero su uso sigue siendo ilegal en muchos países. El problema de fondo persiste: la industria editorial científica ha convertido el conocimiento en un lujo, y ahora se enfrenta a la explotación masiva de ese conocimiento por parte de inteligencias artificiales comerciales.
El gran dilema: ¿Piratería o extractivismo digital?
El uso de LibGen por parte de Meta no debe interpretarse como un acto de rebeldía contra el sistema de derechos de autor. Es, más bien, la instrumentalización de una práctica nacida de la resistencia para alimentar una máquina de lucro. Esto desvirtúa el gesto original de LibGen y añade una capa adicional de explotación.
«El verdadero problema no es la IA», concluye el autor de la nota original en The Atlantic, «sino las condiciones en las que se crea, los actores implicados y sus fines». No se trata de demonizar la inteligencia artificial, que posee un vasto potencial para aplicaciones valiosas. Se trata de cuestionar el modelo de desarrollo extractivo y opaco que están adoptando las grandes tecnológicas. La controversia que rodea a Meta y LibGen, destacada en esta fecha, nos invita a repensar el valor y la circulación del saber en la era digital, y a buscar un equilibrio entre la innovación tecnológica y los principios éticos y legales que deben regir el acceso al conocimiento.

