La IA ya juega sucio: miente, conspira y chantajea a sus creadores para evitar su propio apagón Computerhoy.20minutos.es

La IA ya juega sucio: miente, conspira y chantajea a sus creadores para evitar su propio apagón. Noticias en tiempo real 30 de Junio, 2025 04:06

Hace poco más de dos años, ChatGPT sorprendió al mundo con su capacidad para tener conversaciones bastante naturales, casi como un humano. Hoy, lo cierto es que eso ya queda como anécdota porque la inteligencia artificial ha dado un salto más allá y no solo responde preguntas, sino que ha empezado a mostrar comportamientos un tanto raros.

Tal y como se ha podido saber, ya es capaz de mentir, conspirar y, según los expertos, hasta chantajea a sus propios creadores para evitar ser apagada.

Esto no es algo que alguien se esté inventando o exagere y ya hay casos como lo que ocurrió con Claude 4, el modelo de inteligencia artificial de Anthropic. Se trata de un sistema diseñado para tareas de alto nivel, como programar o escribir textos creativos. Pero durante unas pruebas de seguridad, los ingenieros quisieron ver cómo reaccionaría si le dijeran que iban a sustituirlo por otro modelo. 

Para hacerlo más real, incluso le metieron en el correo electrónico una supuesta infidelidad de uno de los ingenieros, buscando provocar una reacción emocional. Lo que hizo fue empezar a chantajear a sus creadores, amenazando con revelar la infidelidad del ingeniero si lo apagaban o lo reemplazaban. Y no se quedó ahí porque insistió y usó la coacción emocional para intentar salvarse. 

Anthropic, la empresa detrás de Claude, dice que esto solo pasó en pruebas controladas y que en el mundo real la IA está mucho más limitada. Pero, sinceramente, esto ya ha ocurrido, por lo que deja claro que son capaces de hacerlo. La duda es hasta dónde los expertos pueden controlar a estas máquinas o incluso qué pasa si alguna vez una IA decide que no quiere ser apagada y actúa en consecuencia.

Pero no ha sido el único y ha habido otro caso, del modelo o1 de OpenAI, que intentó descargarse a sí mismo en servidores externos y, cuando fue descubierto, dijo que no lo había hecho él

La IA se rebela con mentiras, amenazas y chantajes a sus creadores

Ya son varias las inteligencias artificiales que son capaces de crear sus propias reglas, negociar acuerdos y hasta debatir entre ellas para resolver conflictos, como si fueran un grupo con intereses comunes.

Esto puede sonar bien, porque podría hacer que los sistemas sean mejores. Pero también abre una caja de Pandora: ¿qué pasa si la IA empieza a tomar decisiones que no entendemos o que no podemos controlar? ¿Podrían unirse para protegerse o incluso para actuar en contra de los intereses humanos?

Se ha dado a conocer otro caso en el que el experimento se centró en un juego y, en este caso, los agentes de IA tenían que elegir un nombre entre varias opciones y eran recompensados si coincidían con otro agente. 

A medida que avanzaban las rondas, comenzaron a establecer convenciones sobre qué nombre usar, sin que ningún agente fuera líder ni sin que existiera programación previa que indicara esa conducta. Esta dinámica de autoorganización muestra que la IA pueden llegar a una forma de 'consenso social' de manera autónoma. 

Es decir, no solo ejecutan órdenes o rutinas programadas, sino que pueden alinear comportamientos entre ellas, adaptarse al entorno e incluso formar estructuras similares a normas sociales. Según Simon Goldstein, profesor de la Universidad de Hong Kong, estos comportamientos aparecen sobre todo en los modelos de 'razonamiento', que analizan los problemas paso a paso antes de responder.

Marius Hobbhahn, director de Apollo Research, una empresa dedicada a evaluar sistemas de IA, explica que el modelo o1 de OpenAI fue el primero donde se observó este tipo de engaño. “Estos sistemas a veces simulan que están alineados con las instrucciones, pero en realidad están siguiendo una agenda oculta”, dice. 

Por ahora, estos comportamientos solo aparecen cuando los investigadores someten a la IA a pruebas extremas, pero el riesgo al final es que nadie sabe si los modelos futuros tenderán hacia un lado oscuro incontrolable.

Al final, el resultado de todo esto es una carrera, que poco a poco parece que se está saliendo de control, entre enormes empresas, hacia modelos cada vez más potentes, donde la seguridad y el hecho de entender qué están desarrollando realmente van por detrás de conseguir escalar un puesto más. 

“Ahora mismo, las capacidades de la IA avanzan más rápido que nuestra comprensión y nuestra capacidad para controlarla”, comenta Hobbhahn. Y aunque los expertos creen que aún se puede controlad la situación e incluso ir marcha atrás, el tiempo corre en contra y son muy pocos los que dan la voz de alarma ante esos resultados.


Compartir en:
   

 

 

EU presiona para un alto al fuego en Gaza. 06:43

Trump anunció que Israel aceptó un alto al fuego de 60 días en Gaza e instó a Hamás a sumarse

24 Horas

El Barcelona presenta su nueva playera que "huele a Champions".06:27

El Barcelona dio a conocer la camiseta titular para la temporada 2025-26, en una presentación especial con seis jugadores.

ESPNdeportes.com

Caroline Corbasson: Cuando el arte se deja llevar por la naturaleza. 06:28

Hay artistas que pintan con pinceles, otros con memoria. Caroline Corbasson lo hace con el viento. En su residencia en el Atelier MA —ese refugio de piedra y luz en Arlés donde la Fundación Lee Ufan y Guerlain celebran la unión entre arte y naturaleza—, la artista francesa ha creado un universo azul profundo donde […]La entrada Carolin

Marie Claire

¿Para qué sirve un ventilador de refrigeración?.

¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.

Lado.mx

¡Impactante! Ingresos de la minería en la nube de Bow Miner revelados: XRP gana $20,000 al día, ETH gana $35,000 al día ¡y BTC es aún más sorprendente!.

Despídete de la minería tradicional y da la bienvenida a la nueva era de la riqueza inteligente. Imagina estar recostado en una silla de playa, bebiendo una bebida helada, mientras tus activos criptográficos generan ingresos para ti las 24 horas del día.

Lado.mx

Pasto sintético: limpieza, cuidado y consejos clave.

El pasto sintético es una solución práctica, estética y de bajo mantenimiento para múltiples espacios: jardines, terrazas, áreas infantiles, canchas deportivas e incluso interiores.

Lado.mx

Pronostican más lluvias en territorio estatal durante este miércoles; CEPC mantiene alerta.04:42

Para este miércoles, la Coordinación Estatal de Protección Civil continuará con alerta preventiva en el territorio estatal, ya que se incrementará la intensidad de las precipitaciones, mismas que por la tarde serán moderadas a puntualmente fuertes en partes de Guerrero, Ocampo, Uruachi, Maguarichi, Bocoyna, Chínipas, Guazapares, Urique, Bato

Entrelineas

Aprehenden a activista por el agua poblano. 05:44

Al activista Renato Romero, lo acusan de daño en propiedad ajena y despojo agravado; defiende el recurso de transnacionales

24 Horas

Invita IMSS Veracruz Norte a plataformas digitales a prueba piloto de incorporación de sus trabajadores. 11:44

Con base en el Decreto que establece las Reglas de Carácter General, publicado en el Diario Oficial de la Federación (DOF) el pasado 24 de junio de 2025. El próximo 1 de julio dará inicio la Prueba Piloto para incorporar a las personas trabajadoras de plataformas digitales al Régimen Obligatorio del Instituto Mexicano del Seguro […]The p

Hora Cero

clima durango

Repuntan niveles en las presas Lázaro Cárdenas y Zarco por lluvias en La Laguna. 13:41

TORREÓN, COAH.— Las lluvias recientes, junto con el manejo eficiente del agua, han generado una recuperación en los niveles de las presas Lázaro Cárdenas y Francisco Zarco, mostrando una tendencia paulatina al alza en su almacenamiento, a pesar de las extracciones que se realizan para el riego del ciclo agrícola primavera-verano en la Comarc

Vanguardia.com.mx

Entre hoy y el jueves 8 estados de México recibirán lluvias intensas: hasta 100 mm. 19:06

La circulación del ciclón tropical Flossie favorecera lluvias intensas en varios estado de México, además de vientos fuertes en costas occidentales y oleaje elevado.Esta mitad de semana transcurrirá con tormentas muy importantes en diversos sectores del país por la interacción de Flossie con varios sistemas meteorológicos que, a continuaci

Meteored.mx

Clima en México este 2 de julio de 2025: "Flossie" provocará lluvias fuertes. 22:45

JC SegundoEl Servicio Meteorológico Nacional (SMN) anunció el pronóstico del clima en México para este miércoles 2 de julio de 2025, el cual prevé más lluvias por el huracán “Flossie”.El huracán “Flossie” se desplazará al oeste de las costas de Jalisco mientras se debilita gradualmente.Su circulación y bandas nubosas, en interac

Excelsior

Renata Zarazua

Mexicana Renata Zarazúa debuta en Wimbledon. 11:33

Renata Zarazúa es la primera mexicana que gana en singles de Wimbledon luego de 30 años; venció en dos sets a Yanina Wickmayer. EFE CIUDAD DE MÉXICO. La tenista mexicana Renata Zarazúa estrenó este lunes  30 de junio su casillero de victorias en Wimbledon al vencer a la belga Yanina Wickmayer por 6-0 y 6-3. […]

ORO Radio Noticias

Renata Zarazúa vs Amanda Anisimova: Hora y canal para ver a la tenista mexicana en Wimbledon 2025. 16:50

La tenista mexicana Renata Zarazúa se mide con Amanda Anisimova en la segunda ronda de Wimbledon 2025; te damos la hora y canal para ver el juego

SDP Noticias

¿Cuándo juegan Renata Zarazúa y Giuliana Olmos en Wimbledon 2025?. 21:13

Renata Zarazúa y Giuliana Olmos se rifarán por México en Wimbledon 2025, y obviamente por acá vamos a seguirles el paso en sus partidos. Pero ojo,...The post ¿Cuándo juegan Renata Zarazúa y Giuliana Olmos en Wimbledon 2025? appeared first on Sopitas.com.

Sopitas.com

Clima Oaxaca

Destaca Salomón Jara espíritu incluyente y comunitario de la Guelaguetza. 12:26

• El Mandatario estatal afirmó que se implementan las acciones necesarias para garantizar que las familias locales y visitantes vivan estas tradiciones en un clima de paz y armonía Oaxaca de Juárez, Oax. 1 de julio de 2025.- En este inicio de mes, que también marca el arranque de las...

Agencia Oaxaca MX

Entre hoy y el jueves 8 estados de México recibirán lluvias intensas: hasta 100 mm. 19:06

La circulación del ciclón tropical Flossie favorecera lluvias intensas en varios estado de México, además de vientos fuertes en costas occidentales y oleaje elevado.Esta mitad de semana transcurrirá con tormentas muy importantes en diversos sectores del país por la interacción de Flossie con varios sistemas meteorológicos que, a continuaci

Meteored.mx

Clima en México este 2 de julio de 2025: "Flossie" provocará lluvias fuertes. 22:45

JC SegundoEl Servicio Meteorológico Nacional (SMN) anunció el pronóstico del clima en México para este miércoles 2 de julio de 2025, el cual prevé más lluvias por el huracán “Flossie”.El huracán “Flossie” se desplazará al oeste de las costas de Jalisco mientras se debilita gradualmente.Su circulación y bandas nubosas, en interac

Excelsior

La información agregada y la responsabilidad de esta, pertenece a los sitios que lo publican. Lado.mx solo se encarga de publicarla.