DeepSeek-R1 desafía el dominio en IA de ChatGPT: es gratis, hecha en China y ya la puedes probar desde México Xataka México

DeepSeek-R1 desafía el dominio en IA de ChatGPT: es gratis, hecha en China y ya la puedes probar desde México. Noticias en tiempo real 27 de Enero, 2025 11:24

Es de China, gratis, de código abierto, y supera a otras IAs, como ChatGPT en varias pruebas de rendimiento.
Se trata de DeepSeek-R1, una inteligencia artificial desarrollada en el país asiático que tiene como principales características el haber utilizado menos recursos para su entrenamiento contra otros modelos con potencia similar.
Eso no es todo, sino que luego de su presentación, la app de chatbot de DeepSeek se ha terminado por colocar en los primeros lugares de la App Store de Apple en Estados Unidos.
{"videoId":"x9crq6w","autoplay":true,"title":"WILLIAM BOCINA SUBS", "tag":"", "duration":"41"} Qué es DeepSeek- R1El más reciente anuncio de la compañía es la presentación del modelo DeepSeek-R1, un gran modelo que mezcla 671 mil millones de parámetros, con una arquitectura diferente que le permite tener un "rendimiento sólido" y un "entrenamiento e inferencia eficientes", esto último gracias a un sistema de predicción de tokens que mejora sus procesos sin tener que necesitar de una mayor cantidad de recursos para hacerlo.
Según DeepSeek, para entrenar a su modelo, la compañía necesitó de menos de 6 millones de dólares, aproximadamente dos meses y aproximadamente 2,000 chips especializados H800 de NVIDIA (un componente con menor potencia que otras variantes, por las restricciones de la guerra comercial con Estados Unidos).
Caso contrario, GPT-4 requirió de 100 millones de dólares, según Sam Altman, y al menos 16,000 componentes de este tipo para otros modelos líderes.
Esto le permite, dice la compañía, tener un "rendimiento comparable" al de OpenAI-01 en tareas de razonamiento, gracias al "aprendizaje por refuerzo" (RL) puro.
Este permite mejorar el rendimiento del modelo en temas de razonamiento, en lugar de utilizar un proceso de ajuste fino supervisado (SFT), algo común en el entrenamiento de grandes modelos de lenguaje (LLM).
Es decir, se confió directamente en él para que pudiera desarrollar capacidades independientes, y evitar problemas con el uso de datos predeterminados, para así acelerar su entrenamiento.
Aunque esto tuvo algunos problemas, como indica el equipo, que eventualmente requirió de un STF limitado en las etapas finales, les permitió obtener un modelo capaz de tener un nivel de rendimiento similar sin los grandes costos de hardware ni de tamaño en comparación con otras alternativas.
El origen de este modeloDeepSeek-R1 se entrenó a partir de un modelo intermedio, llamado DeepSeek-R1-Zero, que sirvió como antesala a partir del uso exclusivamente de aprendizaje de refuerzo puro, lo que le permitió "pensar" de forma independiente, y siendo recompensado con las respuestas correctas  y los procesos lógicos que se utilizaban para llegar a estas.
Después, el modelo comenzó a asignarse tiempo de procesamiento para problemas más complejos, para así categorizar las tareas a partir de su dificultad, sin la necesidad de métodos de entrenamiento tradicionales.
Eso sí, no todo fue bueno, pues este modelo también tuvo varios problemas, como comportamientos de razonamientos "inesperados", entre ellos una mala legibilidad de los contenidos que se le proporcionaban, pero también la mezcla de idiomas, como el iniciar en chino y terminar en inglés.
A partir de los descubrimientos de este modelo, se definieron las bases para R1.
Este también está basado en la arquitectura V3 de DeepSeek, pero con algunas limitaciones SFT para poder evitar comportamientos similares, y luego se le sometió a un proceso de entrenamiento similar al de R-1 Zero de aprendizaje de refuerzo.
La comparativa contra otras IAsSegún los datos de DeepSeek, R1 tiene un rendimiento a la par de OpenAI-01, uno de los últimos modelos de OpenAI que tiene capacidades de razonamiento, y que lo hacen uno de los más potentes.
Además, tiene un par de características adicionales, como que tanto su modelo y el informe técnico de su funcionamiento son de código abierto, por lo que cualquier persona lo puede revisar, utilizar y adaptar, pero también cuenta con una licencia MIT, es decir, que se puede comercializar libremente.
Como se puede ver en la siguiente gráfica, DeepSeek-R1 tiene una potencia prácticamente idéntica a las de ChatGPT en distintas pruebas, desde en conocimientos generales, programación y hasta la resolución de problemas matemáticos, a pesar de su menor tiempo de entrenamiento y en principio menor potencia.
Grafica del rendimiento de DeepSeek-R1 contra otras IAs como OpenAI-o1 Cómo utilizar DeepSeek-R1 en MéxicoPoder utilizar DeepSeek-R1 es bastante sencillo, y funciona de forma similar a otras herramientas con IA que tenemos actualmente en el mercado.
Para ello será necesario dirigirse ya sea a su página oficial en nuestro navegador web o descargar la app del chatbot directamente de la tienda de aplicaciones de nuestro sistema operativo, sea Android o iOS.
Después, necesitaremos iniciar sesión para comenzar a usarla, algo que podremos hacer si nos registramos con un correo electrónico o si vinculamos nuestra cuenta de Google.
Sin embargo, al momento de escribir esta nota, los servidores de la compañía están lentos, de acuerdo con DeepSeek, por un ataque malicioso a gran escala, por lo que la única forma de hacerlo es si nos damos de alta en la versión web para celular, enlazamos el perfil de Google y luego entramos a la app o al navegador web del mismo modo, donde ya no marcará error en el registro.
Al ingresar encontraremos unos cuantos botones en la interfaz que deberemos activar, como los de usar el modelo R1 en lugar del V3, para mayor capacidad de razonamiento, y si queremos también tener la opción de buscar contenido en la web gracias a su navegador integrado, algo que también hace ChatGPT, pero en su variante Plus de pago.
De acuerdo con su informe, DeepSeek tiene múltiples capacidades gratuitas, como el poder realizar tareas de programación avanzada, resolver problemas matemáticos y explicar el proceso de solución, acceso a internet, además del análisis y procesamiento de datos complejos.
Dicho de otra forma, con DeepSeek se pueden hacer una gran cantidad de tareas que ya son posibles con chatbots como ChatGPT o Gemini, por mencionar algunas, como el poder cargarle archivos y realizar consultas sobre ellos o hacerle preguntas "complicadas".
(function() { window.
_JS_MODULES = window.
_JS_MODULES || {}; var headElement = document.
getElementsByTagName("head")[0]; if (_JS_MODULES.
instagram) { var instagramScript = document.
createElement("script"); instagramScript.
src = "https://platform.
instagram.
com/en_US/embeds.
js"; instagramScript.
async = true; instagramScript.
defer = true; headElement.
appendChild(instagramScript); } })(); - La noticia DeepSeek-R1 desafía el dominio en IA de ChatGPT: es gratis, hecha en China y ya la puedes probar desde México fue publicada originalmente en Xataka México por Gonzalo Hernández .


Compartir en:
   

 

 

Ahora reportan apagón en la Línea B del Metro. 21:44

La Línea B del Metro de la Ciudad de México registró otra falla por segundo día consecutivo; reportan apagón.

24 Horas

UNRWA condena el “asalto” a escuelas en Jerusalén Oriental.21:14

La entrada forzosa de las fuerzas de seguridad israelíes en tres escuelas de la agencia de la ONU ha sido descrita por ésta como una violación del derecho de los niños a la educación y a la seguridad. “Irrumpir en las escuelas y obligarlas a cerrar es un flagrante desprecioLa entrada UNRWA condena el “asalto” a escuelas en Jerusalén Ori

MPV

¿Hay escena postcréditos en Karate Kid: Leyendas?. 21:30

Gustavo AlonsoEste jueves llegó a los cines de México la película Karate Kid: Leyendas (Karate Kid: Legends), cinta que une a personajes clásicos del universo de Cobra Kai con una nueva generación de estudiantes.La historia sigue a Li Fong (Ben Wang), un joven que entrena con Mr. Han (Jackie Chan) y Daniel LaRusso (Ralph Macchio) para particip

Excelsior

Comprar un auto seminuevo en línea: ventajas y precauciones a tomar en cuenta.

Hoy en día, la compra de vehículos por internet se convierte en una alternativa cada vez más popular, especialmente cuando se trata de autos seminuevos.  Gracias a las plataformas digitales especializadas, es posible encontrar buenas oportunidades sin salir de casa; sin embargo, como en toda transacción en línea, también es importante conoce

Lado.mx

Wall Street’s ETF wave is here — but the real money is in AI-powered cloud mining.

With the monthly net inflow of Bitcoin spot ETF exceeding 9.8 billion US dollars, it marks the full embrace of crypto assets by traditional capital. However, in the market fluctuations dominated by institutions, the real wealth opportunities often belong to those investors who actively build a profit system.

Lado.mx

Sweet Bonanza: El juego que transforma dulces en grandes premios.

¿Te imaginas una máquina tragamonedas donde frutas y caramelos no solo te dan hambre, sino también grandes recompensas? Así es Sweet Bonanza, uno de los slots más adictivos y coloridos del momento, creado por el reconocido proveedor Pragmatic Play. Fácil de jugar, con funciones atractivas y visualmente deliciosa, esta tragamonedas ha conqui

Lado.mx

Supuestos clientes asaltan joyería en Las Ánimas.19:44

Puebla, Pue.- La tarde de este miércoles 8 de mayo tres sujetos se hicieron pasar por clientes para asaltar la joyería que se encuentra en una tienda departamental en la plaza comercial El Triángulo de Las Ánimas. Los delincuentes se llevaron una charola con 15 pares de aretes, cuyo valor fue estimado en 37 mil pesos. …El cargo Supuestos

Tribuna Noticias

Podríamos ver Death Stranding 3, aunque no sería desarrollado por Hideo Kojima. 11:44

El desarrollador habló sobre el futuro de la franquicia.Estamos todos en espera de la segunda parte de Death Stranding, pero tenemos que Hideo Kojima ya habló sobre la posibilidad de una tercer entrega. En una reciente charla con Eurogamer, Kojima reveló que aunque tiene una idea para Death Stranding 3, no la haría el mismo y está abierto …

IGN Latinoamérica

Sheinbaum felicita al nuevo Papa León XIV y reafirma compromiso con la paz global. 12:42

Este jueves 8 de mayo, el cardenal estadounidense Robert Prevost fue elegido como nuevo Papa por el Colegio Cardenalicio, adoptando el nombre de León XIV. Ante este hecho histórico, la presidenta de México, Claudia Sheinbaum, envió un mensaje oficial desde su cuenta de X:“Felicitamos a su santidad León XIV, electo por el Colegio Cardenalicio

El Siglo de Torreón

Oscar Jiménez

Así reaccionó Oscar Jiménez tras la llegada de su esposa, Mariana Echeverría, a Guanajuato. 29 de Agosto, 2024 08:00

A pesar de haber sido eliminada del reality show, la conductora señaló que no ve esta salida como un fracaso, sino como una oportunidad de redefinir su camino

Infobae

Tras rumores de veto en Televisa, Mariana Echeverría presume sus vacaciones con Óscar Jiménez. 03 de Septiembre, 2024 15:40

La ex habitante de La casa de los famosos México decidió refugiarse en su familia y olvidarse de todas sus polémicas

Infobae

Mariana Echeverría embarazada junto a su esposo Óscar Jiménez. 29 de Enero, 2025 13:44

Mariana Echeverría ha superado los escándalos mediáticos y a podido centrarse en su vida familiar. Felizmente ha anunciado que el proceso de fecundación in vitro ha tenido éxito y ya está embarazada. Mariana decidió someterse a este proceso luego de haber sufrido una perdida gestacional a principios de 2024. El bebé que espera es coloquialm

Tribuna Noticias

Brad Pitt

Pensaban que era un piloto de F1… pero escondía uno de los trajes más elegantes de la noche. 05 de Mayo, 2025 19:24

Gustavo AlonsoEl actor Damson Idris, conocido por su papel en la serie Snowfall, acaparó miradas en la Met Gala 2025 al llegar vestido con un traje de carreras blanco y un casco cubierto de pedrería, una aparición que confundió y sorprendió a los asistentes y usuarios de redes sociales.“Wtf”, escribió un usuario en X (antes Twitter), mien

Excelsior

La película de ciencia ficción que rompió récords en streaming: la responsable de opacar al último thriller de Brad Pitt y George Clooney. 06 de Mayo, 2025 18:05

En 2001 vio la luz La gran estafa, proyecto que juntó a dos íconos del cine: George Clooney y Brad Pitt. Esta comedia de crimen dio origen a una trilogía, además de otro par colaboraciones entre los actores, la más reciente titulada Wolfs. Pero ni siquiera ambos rostros pudieron c

Xataka México

La supuesta enemistad de Brad Pitt y Leonardo DiCaprio que terminó con una orden de restricción. 17:20

Antes de protagonizar “Había una vez en Hollywood”, las estrellas de cine dejaron entrever sus tensiones personales

Infobae

Minnesota Timberwolves

Wolves" Anthony Edwards (ankle) returns after brief absence . 21:37

Minnesota guard Anthony Edwards left the Timberwolves" playoff game against the Golden State Warriors Thursday night in Minneapolis after sustaining a

Deadspin

La información agregada y la responsabilidad de esta, pertenece a los sitios que lo publican. Lado.mx solo se encarga de publicarla.