Madrid, España, 6 de junio de 2025. Un grupo de científicos ha demostrado que es posible entrenar grandes modelos de lenguaje (LLM, por sus siglas en inglés) con una base de datos ética, que no perjudica a los titulares de los derechos de autor, con resultados de rendimiento comparables a los de los modelos más populares.
Los LLM que impulsan la inteligencia artificial generativa necesitan enormes cantidades de datos en su entrenamiento para tener un buen rendimiento, y por ello, empresas como Meta, Google y OpenAI han terminado acudiendo a internet e incluso a sus propios productos para obtenerlos.
Esta situación ha generado un debate sobre el uso de documento protegidos por derechos de autor para entrenar esos LLM, en el que unas voces abogan por compensar a quienes están en posesión de esos derechos y otras, por preservar la capacidad de los modelos para aprender de material protegido.
Compensar a los titulares de los derechos de autor costaría miles de millones de dólares, e incluso las denuncias por falta de compensaciones pueden suponer un daños financieros de también miles de millones de dólares, como recogen científicos de 14 instituciones en un reciente estudio, con el que exponen la alternativa de una base de datos ética.
En concreto, indican que han creado una base de datos de dominio público y licencia abierta de 8TB, que han denominado The Common Pile, que recoge datos de 30 fuentes, incluídos investigaciones, audios, libros, enciclopedias, material educativo, código de programación y transcripciones, entre otros.
Para demostrar que es posible entrenar LLM sin perjudicar a los autores y con resultados en línea con los modelos más populares, han entrenado con texto extraído de The Common Pile dos modelos de 7.000 millones de parámetros, de un billón y dos billones de tokens, respectivamente.
Aseguran que los dos modelos ofrecen “un rendimiento competitivo” con modelos como Llama 1 y Llama 2 de 7.000 millones de parámetros. “Nuestros resultados demuestran que The Common Pile no solo es el conjunto de datos más sólido para el preentrenamiento bajo una restricción de licencia abierta, sino que también produce modelos comparables a aquellos entrenados con una cantidad equivalente de datos sin licencia”, afirman en el texto de la investigación publicado en GitHub.
Consideran, además, que la base de datos “representa el primer paso en el camino hacia un ecosistema de modelo de lenguaje más ético, donde el rendimiento no tiene por qué llegar a costa de los derechos de los creadores y la transparencia legal”.
Texto: Portaltic/EP
El cargo Modelos de lenguaje pueden entrenarse con bases de datos éticas, demuestran científicos apareció primero en El Sur Acapulco suracapulco I Noticias Acapulco Guerrero.
Los hechos sucedieron la noche del 10 de octubre del 2024, en la colonia Chulavista II.
El Imparcial
Copa América 2015
Juan Soto completó una jornada espectacular y se acentuó gracias a la remontada de su equipo ante New York Yankees.
Swingcompleto.com
¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.
Lado.mx
Despídete de la minería tradicional y da la bienvenida a la nueva era de la riqueza inteligente. Imagina estar recostado en una silla de playa, bebiendo una bebida helada, mientras tus activos criptográficos generan ingresos para ti las 24 horas del día.
Lado.mx
Micrositio para conocer participantes del concurso de musical de música sin apología del delito: Sheinbaum. Puro talento Regeneración, 4 de julio de 2025. Durante Las […]La entrada Sheinbaum presenta 365 clasificados de México canta por la paz se publicó primero en RegeneraciónMX.
Regeneracion.mx
Meganoticias Veracruz
Meganoticias Tuxpan
El tiktoker y creador de contenido es el tercer habitante confirmado para la nueva temporada.
El Imparcial
Staff/RG En sesión pública ordinaria se avalaron acuerdos en materia de vivienda, migración y educaciónThe post Exhorta Congreso del Estado a municipios para que establezcan Centros de Bienestar Animal appeared first on Desde Puebla.
Desde Puebla
Servicio Meteorológico Nacional
El FC Barcelona sigue rastreando el mercado en busca de jóvenes jugadores que puedan ser interesantes para el futuro y uno de los países en los que se ha movido más en los últimos años es Brasil. El pasado enero llegó Vitor Roque, ahora cedido hasta final de temporada en el Betis, y se intentó el fichaje del extremo Estevao
Mundo Deportivo
Despedida de oro: Estevao brilla en el 6-0 de Palmeiras antes de irse al Chelsea El joven crack anotó el primer gol de la paliza a Sporting Cristal en su último partido en el Allianz Parque araguilarMié, 28/05/2025 - 23:30
Record
Lo del Chelsea es un no parar. Rey absoluto de los dos últimos mercados estivales, el recientemente coronado campeón de la Conference League va camino de repetir en el presente. Cuando todavía no hemos llegado a julio, los ‘blues’ ya han firmado a Dário Essugo (Sporting CP), Liam Delap (Ipswich Town), Mamadou Sarr (E
Mundo Deportivo
Conoce los motivos por los cuales ambas figuras de los "Blues" no integran el once inicial para el duelo clave de hoy. Enzo Maresca confirmó la alineación de Chelsea para un encuentro trascendental en la continuidad del Mundial de Clubes: el elenco británico afrontará este martes un juego crucial, en busca de la clasificación a los o
Bolavip
Estos serían los posibles titulares del juego que se llevará a cabo este sábado 28 de junio en Charlotte. Comienza una nueva etapa en el Mundial de Clubes de Estados Unidos. Luego de la culminación de la fase de grupos, se abren los octavos de final que este sábado 28 de junio contarán con un duelo 100% europeo con el enfrentamiento entre Be
Bolavip
Benfica vs Chelsea EN VIVO Mundial de Clubes Octavos de Final Choque de gigantes europeos en octavos del Mundial de Clubes c.chavezSáb, 28/06/2025 - 12:13 El Mundial de Clubes entra en su fase decisiva con un cruce de alto calibre: Benfica y Chelsea,
Record
En esta nota, conoce todo lo que tienes que saber para no perderte la siguiente ronda del certamen intercontinental. El Mundial de Clubes 2025 llega a instancias decisivas y cada vez falta menos para descubrir cuál será el equipo campeón de este nuevo formato de competición. Luego de una fase de sorprendentes resultados y cruces apasionantes, s
Bolavip
Enrique LópezLa ronda de octavos de final del Mundial de Clubes 2025 llegó a su final y únicamente quedan ocho equipos en competencia, mismos que buscarán el título del renovado torneo de la FIFA a partir del próximo viernes, conoce cuáles son los clubes sobrevivientes, los partidos que jugarán, así como las fechas y horarios de estos duel
Excelsior
Mundial de Clubes 2025: ¿Cómo y cuándo ver los Cuartos de Final del torneo de la FIFA? Ocho equipos mantienen con vida su esperanza de levantar el trofeo internacional rtrujilloMar, 01/07/2025 - 21:05
Record
Últimas noticias
ENTREVISTA ¬ Una novela puede traer reflexiones sobre nuestra realidad: Liliana Blum
El Presidente de EU promulga su criticada Ley fiscal en el Día de la Independencia
Empleo formal sigue perdiendo fuerza
Real Salt Lake Enfrenta un Calendario Húmedo Contra St. Louis City y Más
Donan 10 mil litros de agua embotellada para emergencias en Durango
Real Madrid vs Dortmund y PSG vs Bayern: hora y transmisión de Cuartos de Final del Mundial de Clubes
Avanza proyecto del nuevo Hospital del IMSS en Saltillo
América y Chivas presentan a sus refuerzos para el Apertura 2025: Isaías Violante y Diego Campillo
Isla Mujeres lleva la salud a tu hogar con el programa “Médico en tu Casa”
Queman armados otra máquina retroexcavadora en Chilpancingo
Jubilación IMSS con Ley 1973: ¿En cuánto te podría quedar pensión?
Profepa frustra tráfico de más de 2 mil cactáceas exóticas; venían de Chile y estaban en peligro de extinción
Develan mural en honor a Erik ‘Terrible’ Morales en la Zona Norte de Tijuana
“Su carita de felicidad, qué ternura”: Joven alegra a su hermano al ser la única que se presentó en su graduación
De paciente a terapeuta biomagnética: Así nació la vocación de la Dra. Thania Maldonado