No existe un solo modelo de inteligencia artificial capaz de competir contra ChatGPT, el gigante de OpenAI.
Gracias a la inversión de la compañía norteamericana, el chatbot conversacional ha protagonizado noticias de todo tipo, ya que no solo consiguió salvar la vida de un hombre, sino que dejó sin trabajo a un auxiliar jurídico a raíz de una serie de citas inexistentes que compartió como veraces.
No obstante, OpenAI sigue centrada en evolucionar sus modelos de IA y, como consecuencia directa de ello, hoy nos toca profundizar en o3-pro, el siguiente paso en la cadena evolutiva de ChatGPT.
En 3D Juegos Un test te permite comparar tu CI con el de una IA.
Sorprendentemente, muchas ya están por encima de los 120 puntos Como señala Ars Technica, OpenAI estrenó o3-pro, una versión avanzada centrada en razonamiento simulado que ya está disponible para los suscriptores de pago de ChatGPT.
Este modelo toma el lugar de o1-pro en la selección de modelos, ya que cuenta con mejoras determinantes en matemáticas, ciencia y programación.
Además, también incluye herramientas como búsqueda web, análisis de archivos e imágenes e, incluso, ejecución del código Python, un aspecto muy interesante tanto para los programadores como para las compañías.
Sin embargo, tantos avances ponen el foco sobre una cuestión: ¿dónde está el límite de la IA?OpenAI quiere revolucionar el sector con o3-proAdemás de todo lo mencionado, otro de los aspectos más interesantes de este lanzamiento es la reducción de precios del modelo o3-pro respecto al o1-pro.
Según los datos recogidos de Ars Technica, esta reducción es de un 87% tanto en el terreno de los input (18,40 euros por un millón de tokens) como en el de los output (73,60 euros por un millón de tokens).
A su vez, esto terminó afectando al modelo o3 estándar, una versión que redujo su precio hasta un 80% en lo que a eficiencia/rendimiento se refiere.
Sin embargo, o3-pro ha puesto sobre la mesa uno de los principales problemas de OpenAI: la evolución de sus modelos no elimina los errores previos.
Aunque este es uno de sus enfoques principales, la firma está más centrada en reducir el consumo de recursos que en mejorar las prestaciones de sus modelos de inteligencia artificial.
De hecho, aunque hayan vendido o3-pro como un modelo capaz de sacar partido al razonamiento simulado, la existencia de esto no implica pensamiento lógico real, sino el uso de más recursos computacionales durante la inferencia.
Por consiguiente, sus datos en diferentes campos reflejan lo siguiente: 93% de precisión en el AIME 2024 (matemáticas).
84% de precisión en GPQA Diamond (preguntas de ciencia a nivel de doctorado).
Elo de 2748 en Codeforces (programación).
Estos avances, según indica la publicación original, se deben a técnicas como "el pensamiento en voz alta", una opción que le permite ir compartiendo paso a paso los razonamientos que sigue (similar al experimento de Claude con Pokémon Rojo).
No obstante, la misma noticia señala que varios estudios hacen hincapié en que o3-pro sigue funcionando como un sistema de reconocimiento de patrones, una situación que demuestra que la IA no es capaz de razonar por sí misma, sino que sigue los pasos de todos aquellos datos con los que han sido entrenadas.
Un ejemplo podría ser el de la Torre de Hanoi, un rompecabezas matemático que consigue poner contra las cuerdas al modelo de OpenAI.
Según revelan los investigadores, las limitaciones podrían estar relacionadas con su baja capacidad para corregir errores o detectar contradicciones, ya que no pueden analizar estos dos parámetros en su propio razonamiento.
Así, aunque o3-pro sea un modelo más barato y eficaz para problemas conocidos, vuelve a poner el foco sobre uno de los principales problemas de la inteligencia artificial: deben revisar los resultados de forma cuidadosa.
Apple tampoco se fía de la IAUna de las investigaciones centradas en la eficiencia del razonamiento de la IA está firmada por Apple, compañía que se encuentra trabajando en el futuro de la marca.
En otra publicación, Ars Technica recoge que los investigadores de la compañía publicaron un estudio que cuestiona si los modelos de IA son capaces de razonar o solo imitan patrones del entrenamiento.
En él, compararon modelos como o1, o3, DeepSeek-R1 y Claude 3.
7, utilizando puzzles clásicos como la ya citada Torre de Hanoi u otros desafíos de la talla de las damas, el cruce de río y la construcción de bloques.
Según los resultados del estudio, los modelos fallan de forma flagrante en problemas novedosos que requieren razonamiento sistemático.
De esta forma, si se somete a un modelo de IA a una prueba que no ha visto antes, solo lograrán salir con éxito el 25% de las veces.
De hecho, ninguno fue capaz de obtener una puntuación perfecta (resolver todos los desafíos de forma consecutiva en un mismo intento) a pesar de que realizaron casi 200 intentos, siendo uno de los ejemplos más llamativo el de Claude: aunque obtuvo la solución en la torre de Hanoi, no pudo superar con éxito una tarea tan sencilla como el cruce del río.
En 3D Juegos El boom de la IA en los centros de atención telefónica se acerca a su fin: el 95% de los jefes ya no confía en sus posibilidades Tras extraer sus conclusiones, el estudio resume cuáles son sus impresiones: "cuando el problema es más complejo, los modelos razonan menos".
De hecho, esta situación ni siquiera cambia cuando se les proporciona un algoritmo correcto, ya que los modelos no mejoran su rendimiento ante la ausencia de lógica real.
Por ello, Gary Marcus (investigador especializado en diferentes campos) señaló que esta situación es devastadora para los modelos de lenguaje, mientras que otras voces como Kevin Bryan (economista) quisieron aportar otro punto de vista: "Los modelos están entrenados para evitar cálculos excesivos, esto no implica que no sean capaces".
Bryan, por su parte, sugiere que la limitación puede guardar relación con el diseño, ya que la presencia de algunas técnicas reducen el esfuerzo computacional.
Sea como fuere, el propio estudio de Apple reconoce sus limitaciones y, además, asegura que estos puzzles no representan todos los casos de razonamiento.
Aún así, el resultado de su investigación deja patente que, a pesar de los intentos de las compañías más punteras del sector, los modelos actuales no alcanzan el razonamiento general, sino que están estrechamente relacionados a los datos que utilizan para mejorar sus prestaciones.
Imagen principal de 3DJuegosEn 3DJuegos | Mark Zuckerberg cambia de estrategia: adiós al metaverso y la IA tradicional, hola a la búsqueda de la "superinteligencia"En 3DJuegos | China limitó el acceso a la IA a 1.
400 millones de personas durante 3 días.
No fue por censura, sino por proteger un examen nacional (function() { window.
_JS_MODULES = window.
_JS_MODULES || {}; var headElement = document.
getElementsByTagName("head")[0]; if (_JS_MODULES.
instagram) { var instagramScript = document.
createElement("script"); instagramScript.
src = "https://platform.
instagram.
com/en_US/embeds.
js"; instagramScript.
async = true; instagramScript.
defer = true; headElement.
appendChild(instagramScript); } })(); - La noticia OpenAI presentó o3-pro como el siguiente paso del "razonamiento" de la IA.
Según un estudio, la IA no puede superar el acertijo del río fue publicada originalmente en 3DJuegos por Abelardo González .
Conoce todos los detalles del juego entre PSG vs Real Madrid para definir al último finalista del Mundial de Clubes.
24 Horas
Luisito Comunica es blanco de críticas en redes sociales desde el pasado fin de semana tras la marcha contra la gentrificación
24 Horas
Sheinbaum promete erradicar el huachicol y castigar a funcionarios involucrados; en Coahuila decomisan 15 millones de litros.
24 Horas
Los créditos para comprar en línea se han convertido en una herramienta esencial para quienes buscan adquirir productos sin desembolsar el total de su costo de inmediato. Esta modalidad ofrece la posibilidad de realizar compras desde la comodidad del hogar, con la flexibilidad de pagar en plazos que se ajusten a las necesidades del comprador. [
Lado.mx
En el mundo de las finanzas y la inversión, la información es poder. Cada vez más personas buscan oportunidades para hacer crecer su dinero a través de plataformas de inversión, trading online o compra de activos financieros.
Lado.mx
¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.
Lado.mx
El gobierno federal reportó que junio de 2025 es el mes con menor número de homicidios dolosos desde 2016. Sinaloa encabezó la lista de estados con más víctimas.The post Reportan baja de 24.5% en homicidios dolosos durante gobierno de Sheinbaum appeared first on Chilango.
Chilango.com
La alcaldesa Alessandra Rojo acusó que grupos pagados provocaron destrozos y robaron comercios en la Condesa en la protesta anti gentrificación el viernes 4 de julio.
El Financiero
En La Noria continúan ultimando detalles de cara al debut frente a Mazatlán y el DT podría recibir buenas noticias. Después de una intensa pretemporada que dejó a Cruz Azul con algunas preguntas que tendrán respuestas en los siguientes partidos, y tras un mercado de fichajes electrizante, llega el momento más esperado: el debut en el
Vamos Azul
La empresa seguirá invirtiendo alrededor de 20 millones de pesos en mejorar la eficiencia energética de la iluminación de 10 edificios históricos en Oaxaca
El Financiero
En el año que duró la vigencia de las facultades delegadas al Ejecutivo por el Congreso, las medidas de ajuste abarcaron casi todas las áreas del sector público
Infobae
El gobernador Huacho Díaz resaltó que, tras 12 años sin servicio, habitantes de Tahmek ya no tendrán que trasladarse a otros municipios para realizar trámites. Tras más de diez años sin operar, la oficialía del Registro Civil de Tahmek reabrió sus puertas este lunes en un acto encabezado por el Gobernador Huacho Díaz Mena, quien […]
Acustiknoticias.com
Criterio Hidalgo Digital
El Financiero Bloomberg TV
Arturo LópezGuillermo Almada dirigirá al Real Valladolid y su contrato expirará el 30 de junio de 2026. El objetivo principal será ascender al cuadro español.- TE PUEDE INTERESAR: Así lucirá Cruz Azul de local y de visitante“Soy optimista y estoy convencido de que se pueden hacer cosas importantes. El ascenso es el objetivo y conseguiremos
Excelsior
Bolavip México te ofrece los mejores pronósticos deportivos para apostar en Paris Saint-Germain vs Real Madrid, por el Mundial de Clubes de la FIFA 2025. El MetLife Stadium será testigo de una semifinal de alto voltaje en el Mundial de Clubes 2025, con Paris Saint-Germain y Real Madrid frente a frente en una reedición de varios choques europeos
Bolavip
Esta pasada temporada la UEFA presentó el nuevo formato de la Champions League, que salió como respuesta a la iniciativa de la Superliga y para dar partidos más vibrantes a lo largo de la temporada.
Mundo Deportivo
Bernardo Ferreira / AFPTres minutos bastaron para que Bruno Henrique agrandara su leyenda en el Flamengo. Con un gol y una asistencia, el extremo comandó la remontada rojinegra 3-1 ante el Chelsea este jueves en Filadelfia en la segunda jornada del Grupo D del Mundial de Clubes.NO TE PIERDAS: Afición volvería a dejar a México sin estadio llenoU
Excelsior
En Philadeplhia, el equipo inglés buscará acceder a los octavos de final frente a un conjunto que irá por la gran sorpresa. El Mundial de Clubes 2025 comienza a conocer a sus clasificados a octavos de final. Uno de los que desea estar en dicha instancia es Chelsea, que este martes 24 de junio afrontará un juego decisivo frente a Esperance de T
Bolavip
Con la misión de evitar una final europea del Mundial de Clubes, el Fluminense de los veteranos Thiago Silva, Fábio y Germán Cano desafiará al Chelsea de los jóvenes Cole Palmer, Enzo Fernández y Nicolas Jackson el martes en East Rutherford. La tarjeta de presentación del club de Río de Janeiro dice que sabe derrumbar …El cargo El Flu
Tribuna Noticias
Jorge Emilio SánchezEcléctica, musical y de contrastes.Así fue la noche del cierre del festival Tecate Emblema, que en su segundo día realizado en la Curva 4 del Autódromo Hermanos Rodríguez, convocó a menos personas que en su primer día, pero cuyo entusiasmo no mermó en absoluto. La noche del sábado trajo consigo uno de los momentos má
Excelsior
La película 'Karate Kid' con Jackie Chan se estrenó en 2010 y así luce actualmente Jaden Smith el interprete de Dre Parker.
Periódico Correo
Paola Jiménez El 2025 sigue avanzando y estamos a poco de empezar un nuevo mes, en esta ocaisón julio, que es una antesala para las vacaciones de verano.Y además de las vacaciones, también se celebran importantes fechas. Aquí te dejamos las efemérides más destacadas de julio, ¿cuál no sabías que se conmemoraba?Te recomendamos: Día Inter
Excelsior
Últimas noticias
Mundial de Clubes 2025: Estos son todos los finalistas desde su creación
¿Por qué Joao Pedro no festejó sus goles en el Chelsea vs Fluminense?
¡Let"s ready to rumble! Michael Buffer fue el presentador oficial del Fluminense vs Chelsea
Semana del Surf llenará de adrenalina y turismo la Playa Olas Altas en Manzanillo
30 under 30 2025: Tamara Chayo, la emprendedora que salva a miles de doctores
30 under 30 2025 | Julián Ríos: el joven que desafía a la medicina tradicional
Recomienda a revisar techos y ventanas para evitar daños eléctricos con las lluvias
Destituyen a funcionaria tras muerte de dos agentes en operativo vinculado a secta en Pachuca
Niegan rastro del software Pegasus en la Secretaría de Finanzas
Atrasan audiencia de Ovidio Guzmán en EEUU donde se declarará culpable
Encabeza titular de la SEyD graduaciones en planteles de Educación Básica
Inseguridad no disminuye llegada de turistas: Jaime Oropeza
Saltillo: ¡No se confíe! Una tormenta no avisa, pero un buen seguro, respalda tu casa...
Tradición que sigue viva; más de dos mil jinetes cabalgarán por San Buenaventura
Protección Civil de Saltillo emite alerta por lluvias y activa refugios temporales