OpenAI presentó o3-pro como el siguiente paso del "razonamiento" de la IA. Según un estudio, la IA no puede superar el acertijo del río 3d Juegos

OpenAI presentó o3-pro como el siguiente paso del 16 de Junio, 2025 06:10

No existe un solo modelo de inteligencia artificial capaz de competir contra ChatGPT, el gigante de OpenAI.
Gracias a la inversión de la compañía norteamericana, el chatbot conversacional ha protagonizado noticias de todo tipo, ya que no solo consiguió salvar la vida de un hombre, sino que dejó sin trabajo a un auxiliar jurídico a raíz de una serie de citas inexistentes que compartió como veraces.
No obstante, OpenAI sigue centrada en evolucionar sus modelos de IA y, como consecuencia directa de ello, hoy nos toca profundizar en o3-pro, el siguiente paso en la cadena evolutiva de ChatGPT.
En 3D Juegos Un test te permite comparar tu CI con el de una IA.
Sorprendentemente, muchas ya están por encima de los 120 puntos Como señala Ars Technica, OpenAI estrenó o3-pro, una versión avanzada centrada en razonamiento simulado que ya está disponible para los suscriptores de pago de ChatGPT.
Este modelo toma el lugar de o1-pro en la selección de modelos, ya que cuenta con mejoras determinantes en matemáticas, ciencia y programación.
Además, también incluye herramientas como búsqueda web, análisis de archivos e imágenes e, incluso, ejecución del código Python, un aspecto muy interesante tanto para los programadores como para las compañías.
Sin embargo, tantos avances ponen el foco sobre una cuestión: ¿dónde está el límite de la IA?OpenAI quiere revolucionar el sector con o3-proAdemás de todo lo mencionado, otro de los aspectos más interesantes de este lanzamiento es la reducción de precios del modelo o3-pro respecto al o1-pro.
Según los datos recogidos de Ars Technica, esta reducción es de un 87% tanto en el terreno de los input (18,40 euros por un millón de tokens) como en el de los output (73,60 euros por un millón de tokens).
A su vez, esto terminó afectando al modelo o3 estándar, una versión que redujo su precio hasta un 80% en lo que a eficiencia/rendimiento se refiere.
Sin embargo, o3-pro ha puesto sobre la mesa uno de los principales problemas de OpenAI: la evolución de sus modelos no elimina los errores previos.
Aunque este es uno de sus enfoques principales, la firma está más centrada en reducir el consumo de recursos que en mejorar las prestaciones de sus modelos de inteligencia artificial.
De hecho, aunque hayan vendido o3-pro como un modelo capaz de sacar partido al razonamiento simulado, la existencia de esto no implica pensamiento lógico real, sino el uso de más recursos computacionales durante la inferencia.
Por consiguiente, sus datos en diferentes campos reflejan lo siguiente: 93% de precisión en el AIME 2024 (matemáticas).
84% de precisión en GPQA Diamond (preguntas de ciencia a nivel de doctorado).
Elo de 2748 en Codeforces (programación).
Estos avances, según indica la publicación original, se deben a técnicas como "el pensamiento en voz alta", una opción que le permite ir compartiendo paso a paso los razonamientos que sigue (similar al experimento de Claude con Pokémon Rojo).
No obstante, la misma noticia señala que varios estudios hacen hincapié en que o3-pro sigue funcionando como un sistema de reconocimiento de patrones, una situación que demuestra que la IA no es capaz de razonar por sí misma, sino que sigue los pasos de todos aquellos datos con los que han sido entrenadas.
Un ejemplo podría ser el de la Torre de Hanoi, un rompecabezas matemático que consigue poner contra las cuerdas al modelo de OpenAI.
Según revelan los investigadores, las limitaciones podrían estar relacionadas con su baja capacidad para corregir errores o detectar contradicciones, ya que no pueden analizar estos dos parámetros en su propio razonamiento.
Así, aunque o3-pro sea un modelo más barato y eficaz para problemas conocidos, vuelve a poner el foco sobre uno de los principales problemas de la inteligencia artificial: deben revisar los resultados de forma cuidadosa.
Apple tampoco se fía de la IAUna de las investigaciones centradas en la eficiencia del razonamiento de la IA está firmada por Apple, compañía que se encuentra trabajando en el futuro de la marca.
En otra publicación, Ars Technica recoge que los investigadores de la compañía publicaron un estudio que cuestiona si los modelos de IA son capaces de razonar o solo imitan patrones del entrenamiento.
En él, compararon modelos como o1, o3, DeepSeek-R1 y Claude 3.
7, utilizando puzzles clásicos como la ya citada Torre de Hanoi u otros desafíos de la talla de las damas, el cruce de río y la construcción de bloques.
Según los resultados del estudio, los modelos fallan de forma flagrante en problemas novedosos que requieren razonamiento sistemático.
De esta forma, si se somete a un modelo de IA a una prueba que no ha visto antes, solo lograrán salir con éxito el 25% de las veces.
De hecho, ninguno fue capaz de obtener una puntuación perfecta (resolver todos los desafíos de forma consecutiva en un mismo intento) a pesar de que realizaron casi 200 intentos, siendo uno de los ejemplos más llamativo el de Claude: aunque obtuvo la solución en la torre de Hanoi, no pudo superar con éxito una tarea tan sencilla como el cruce del río.
En 3D Juegos El boom de la IA en los centros de atención telefónica se acerca a su fin: el 95% de los jefes ya no confía en sus posibilidades Tras extraer sus conclusiones, el estudio resume cuáles son sus impresiones: "cuando el problema es más complejo, los modelos razonan menos".
De hecho, esta situación ni siquiera cambia cuando se les proporciona un algoritmo correcto, ya que los modelos no mejoran su rendimiento ante la ausencia de lógica real.
Por ello, Gary Marcus (investigador especializado en diferentes campos) señaló que esta situación es devastadora para los modelos de lenguaje, mientras que otras voces como Kevin Bryan (economista) quisieron aportar otro punto de vista: "Los modelos están entrenados para evitar cálculos excesivos, esto no implica que no sean capaces".
Bryan, por su parte, sugiere que la limitación puede guardar relación con el diseño, ya que la presencia de algunas técnicas reducen el esfuerzo computacional.
Sea como fuere, el propio estudio de Apple reconoce sus limitaciones y, además, asegura que estos puzzles no representan todos los casos de razonamiento.
Aún así, el resultado de su investigación deja patente que, a pesar de los intentos de las compañías más punteras del sector, los modelos actuales no alcanzan el razonamiento general, sino que están estrechamente relacionados a los datos que utilizan para mejorar sus prestaciones.
Imagen principal de 3DJuegosEn 3DJuegos | Mark Zuckerberg cambia de estrategia: adiós al metaverso y la IA tradicional, hola a la búsqueda de la "superinteligencia"En 3DJuegos | China limitó el acceso a la IA a 1.
400 millones de personas durante 3 días.
No fue por censura, sino por proteger un examen nacional (function() { window.
_JS_MODULES = window.
_JS_MODULES || {}; var headElement = document.
getElementsByTagName("head")[0]; if (_JS_MODULES.
instagram) { var instagramScript = document.
createElement("script"); instagramScript.
src = "https://platform.
instagram.
com/en_US/embeds.
js"; instagramScript.
async = true; instagramScript.
defer = true; headElement.
appendChild(instagramScript); } })(); - La noticia OpenAI presentó o3-pro como el siguiente paso del "razonamiento" de la IA.
Según un estudio, la IA no puede superar el acertijo del río fue publicada originalmente en 3DJuegos por Abelardo González .


Compartir en:
   

 

 

PSG vs Real Madrid: Dónde y cuándo ver la semifinal del Mundial de Clubes. 13:21

Conoce todos los detalles del juego entre PSG vs Real Madrid para definir al último finalista del Mundial de Clubes.

24 Horas

Atacan a Luisito Comunica por "gentrificador" y es exhibido en redes.13:21

Luisito Comunica es blanco de críticas en redes sociales desde el pasado fin de semana tras la marcha contra la gentrificación

24 Horas

Gobierno decomisa 69.3 millones de litros de huachicol. 13:21

Sheinbaum promete erradicar el huachicol y castigar a funcionarios involucrados; en Coahuila decomisan 15 millones de litros.

24 Horas

Créditos para comprar en línea: financia tus compras sin salir de casa.

Los créditos para comprar en línea se han convertido en una herramienta esencial para quienes buscan adquirir productos sin desembolsar el total de su costo de inmediato. Esta modalidad ofrece la posibilidad de realizar compras desde la comodidad del hogar, con la flexibilidad de pagar en plazos que se ajusten a las necesidades del comprador. [&#

Lado.mx

Mi opinión sobre brokersrecomendados.com.

En el mundo de las finanzas y la inversión, la información es poder. Cada vez más personas buscan oportunidades para hacer crecer su dinero a través de plataformas de inversión, trading online o compra de activos financieros.

Lado.mx

¿Para qué sirve un ventilador de refrigeración?.

¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.

Lado.mx

Reportan baja de 24.5% en homicidios dolosos durante gobierno de Sheinbaum.11:44

El gobierno federal reportó que junio de 2025 es el mes con menor número de homicidios dolosos desde 2016. Sinaloa encabezó la lista de estados con más víctimas.The post Reportan baja de 24.5% en homicidios dolosos durante gobierno de Sheinbaum appeared first on Chilango.

Chilango.com

En la marcha anti gentrificación hubo ‘grupos pagados para violentar’, acusa Alessandra Rojo. 12:20

La alcaldesa Alessandra Rojo acusó que grupos pagados provocaron destrozos y robaron comercios en la Condesa en la protesta anti gentrificación el viernes 4 de julio.

El Financiero

“Si todo sale bien…”: Nicolás Larcamón aguarda por 2 jugadores para el Cruz Azul vs. Mazatlán. 12:20

En La Noria continúan ultimando detalles de cara al debut frente a Mazatlán y el DT podría recibir buenas noticias. Después de una intensa pretemporada que dejó a Cruz Azul con algunas preguntas que tendrán respuestas en los siguientes partidos, y tras un mercado de fichajes electrizante, llega el momento más esperado: el debut en el

Vamos Azul

México y los cambios de Iberdrola.01:40

La empresa seguirá invirtiendo alrededor de 20 millones de pesos en mejorar la eficiencia energética de la iluminación de 10 edificios históricos en Oaxaca

El Financiero

La lista completa de la motosierra: cuáles son los 100 organismos públicos cerrados o modificados durante el Gobierno de Milei. 22:50

En el año que duró la vigencia de las facultades delegadas al Ejecutivo por el Congreso, las medidas de ajuste abarcaron casi todas las áreas del sector público

Infobae

Huacho Díaz encabeza reapertura de oficina de Registro Civil en Tahmek. 05:53

El gobernador Huacho Díaz resaltó que, tras 12 años sin servicio, habitantes de Tahmek ya no tendrán que trasladarse a otros municipios para realizar trámites. Tras más de diez años sin operar, la oficialía del Registro Civil de Tahmek reabrió sus puertas este lunes en un acto encabezado por el Gobernador Huacho Díaz Mena, quien […]

Acustiknoticias.com

Champions League

Guillermo Almada dirigirá al Valladolid con miras al ascenso. 12:25

Arturo LópezGuillermo Almada dirigirá al Real Valladolid y su contrato expirará el 30 de junio de 2026. El objetivo principal será ascender al cuadro español.- TE PUEDE INTERESAR: Así lucirá Cruz Azul de local y de visitante“Soy optimista y estoy convencido de que se pueden hacer cosas importantes. El ascenso es el objetivo y conseguiremos

Excelsior

Pronósticos Paris Saint-Germain vs Real Madrid: choque de potencias por un lugar en la final del Mundial de Clubes. 12:31

Bolavip México te ofrece los mejores pronósticos deportivos para apostar en Paris Saint-Germain vs Real Madrid, por el Mundial de Clubes de la FIFA 2025. El MetLife Stadium será testigo de una semifinal de alto voltaje en el Mundial de Clubes 2025, con Paris Saint-Germain y Real Madrid frente a frente en una reedición de varios choques europeos

Bolavip

La UEFA anuncia un cambio revolucionario para la próxima Champions League . 12:48

Esta pasada temporada la UEFA presentó el nuevo formato de la Champions League, que salió como respuesta a la iniciativa de la Superliga y para dar partidos más vibrantes a lo largo de la temporada. 

Mundo Deportivo

Nicolas Jackson

Flamengo remonta a Chelsea y es líder del Grupo D. 20 de Junio, 2025 15:10

Bernardo Ferreira / AFPTres minutos bastaron para que Bruno Henrique agrandara su leyenda en el Flamengo. Con un gol y una asistencia, el extremo comandó la remontada rojinegra 3-1 ante el Chelsea este jueves en Filadelfia en la segunda jornada del Grupo D del Mundial de Clubes.NO TE PIERDAS: Afición volvería a dejar a México sin estadio llenoU

Excelsior

Las alineaciones confirmadas de Esperance de Túnez vs. Chelsea por el Mundial de Clubes 2025. 24 de Junio, 2025 14:40

En Philadeplhia, el equipo inglés buscará acceder a los octavos de final frente a un conjunto que irá por la gran sorpresa. El Mundial de Clubes 2025 comienza a conocer a sus clasificados a octavos de final. Uno de los que desea estar en dicha instancia es Chelsea, que este martes 24 de junio afrontará un juego decisivo frente a Esperance de T

Bolavip

El Flu de los veteranos reta al Chelsea juvenil en las semifinales del Mundial. 10:00

Con la misión de evitar una final europea del Mundial de Clubes, el Fluminense de los veteranos Thiago Silva, Fábio y Germán Cano desafiará al Chelsea de los jóvenes Cole Palmer, Enzo Fernández y Nicolas Jackson el martes en East Rutherford. La tarjeta de presentación del club de Río de Janeiro dice que sabe derrumbar …El cargo El Flu

Tribuna Noticias

Jaden Smith

Ecléctico, nostálgico y enriquecedor, así fue el Tecate Emblema. 18 de Mayo, 2025 04:00

Jorge Emilio SánchezEcléctica, musical y de contrastes.Así fue la noche del cierre del festival Tecate Emblema, que en su segundo día realizado en la Curva 4 del Autódromo Hermanos Rodríguez, convocó a menos personas que en su primer día, pero cuyo entusiasmo no mermó en absoluto. La noche del sábado trajo consigo uno de los momentos má

Excelsior

Así luce Jaden Smith; el intérprete de Dre Parker en "Karate Kid" después de más 15 años de su estreno. 19 de Mayo, 2025 15:05

La película 'Karate Kid' con Jackie Chan se estrenó en 2010 y así luce actualmente Jaden Smith el interprete de Dre Parker.

Periódico Correo

Efemérides de julio 2025: Día del Ingeniero, Día de la secretaría y más. 26 de Junio, 2025 15:20

Paola Jiménez El 2025 sigue avanzando y estamos a poco de empezar un nuevo mes, en esta ocaisón julio, que es una antesala para las vacaciones de verano.Y además de las vacaciones, también se celebran importantes fechas. Aquí te dejamos las efemérides más destacadas de julio, ¿cuál no sabías que se conmemoraba?Te recomendamos: Día Inter

Excelsior

La información agregada y la responsabilidad de esta, pertenece a los sitios que lo publican. Lado.mx solo se encarga de publicarla.