Es de China, gratis, de código abierto, y supera a otras IAs, como ChatGPT en varias pruebas de rendimiento.
Se trata de DeepSeek-R1, una inteligencia artificial desarrollada en el país asiático que tiene como principales características el haber utilizado menos recursos para su entrenamiento contra otros modelos con potencia similar.
Eso no es todo, sino que luego de su presentación, la app de chatbot de DeepSeek se ha terminado por colocar en los primeros lugares de la App Store de Apple en Estados Unidos.
{"videoId":"x9crq6w","autoplay":true,"title":"WILLIAM BOCINA SUBS", "tag":"", "duration":"41"} Qué es DeepSeek- R1El más reciente anuncio de la compañía es la presentación del modelo DeepSeek-R1, un gran modelo que mezcla 671 mil millones de parámetros, con una arquitectura diferente que le permite tener un "rendimiento sólido" y un "entrenamiento e inferencia eficientes", esto último gracias a un sistema de predicción de tokens que mejora sus procesos sin tener que necesitar de una mayor cantidad de recursos para hacerlo.
Según DeepSeek, para entrenar a su modelo, la compañía necesitó de menos de 6 millones de dólares, aproximadamente dos meses y aproximadamente 2,000 chips especializados H800 de NVIDIA (un componente con menor potencia que otras variantes, por las restricciones de la guerra comercial con Estados Unidos).
Caso contrario, GPT-4 requirió de 100 millones de dólares, según Sam Altman, y al menos 16,000 componentes de este tipo para otros modelos líderes.
Esto le permite, dice la compañía, tener un "rendimiento comparable" al de OpenAI-01 en tareas de razonamiento, gracias al "aprendizaje por refuerzo" (RL) puro.
Este permite mejorar el rendimiento del modelo en temas de razonamiento, en lugar de utilizar un proceso de ajuste fino supervisado (SFT), algo común en el entrenamiento de grandes modelos de lenguaje (LLM).
Es decir, se confió directamente en él para que pudiera desarrollar capacidades independientes, y evitar problemas con el uso de datos predeterminados, para así acelerar su entrenamiento.
Aunque esto tuvo algunos problemas, como indica el equipo, que eventualmente requirió de un STF limitado en las etapas finales, les permitió obtener un modelo capaz de tener un nivel de rendimiento similar sin los grandes costos de hardware ni de tamaño en comparación con otras alternativas.
El origen de este modeloDeepSeek-R1 se entrenó a partir de un modelo intermedio, llamado DeepSeek-R1-Zero, que sirvió como antesala a partir del uso exclusivamente de aprendizaje de refuerzo puro, lo que le permitió "pensar" de forma independiente, y siendo recompensado con las respuestas correctas y los procesos lógicos que se utilizaban para llegar a estas.
Después, el modelo comenzó a asignarse tiempo de procesamiento para problemas más complejos, para así categorizar las tareas a partir de su dificultad, sin la necesidad de métodos de entrenamiento tradicionales.
Eso sí, no todo fue bueno, pues este modelo también tuvo varios problemas, como comportamientos de razonamientos "inesperados", entre ellos una mala legibilidad de los contenidos que se le proporcionaban, pero también la mezcla de idiomas, como el iniciar en chino y terminar en inglés.
A partir de los descubrimientos de este modelo, se definieron las bases para R1.
Este también está basado en la arquitectura V3 de DeepSeek, pero con algunas limitaciones SFT para poder evitar comportamientos similares, y luego se le sometió a un proceso de entrenamiento similar al de R-1 Zero de aprendizaje de refuerzo.
La comparativa contra otras IAsSegún los datos de DeepSeek, R1 tiene un rendimiento a la par de OpenAI-01, uno de los últimos modelos de OpenAI que tiene capacidades de razonamiento, y que lo hacen uno de los más potentes.
Además, tiene un par de características adicionales, como que tanto su modelo y el informe técnico de su funcionamiento son de código abierto, por lo que cualquier persona lo puede revisar, utilizar y adaptar, pero también cuenta con una licencia MIT, es decir, que se puede comercializar libremente.
Como se puede ver en la siguiente gráfica, DeepSeek-R1 tiene una potencia prácticamente idéntica a las de ChatGPT en distintas pruebas, desde en conocimientos generales, programación y hasta la resolución de problemas matemáticos, a pesar de su menor tiempo de entrenamiento y en principio menor potencia.
Grafica del rendimiento de DeepSeek-R1 contra otras IAs como OpenAI-o1 Cómo utilizar DeepSeek-R1 en MéxicoPoder utilizar DeepSeek-R1 es bastante sencillo, y funciona de forma similar a otras herramientas con IA que tenemos actualmente en el mercado.
Para ello será necesario dirigirse ya sea a su página oficial en nuestro navegador web o descargar la app del chatbot directamente de la tienda de aplicaciones de nuestro sistema operativo, sea Android o iOS.
Después, necesitaremos iniciar sesión para comenzar a usarla, algo que podremos hacer si nos registramos con un correo electrónico o si vinculamos nuestra cuenta de Google.
Sin embargo, al momento de escribir esta nota, los servidores de la compañía están lentos, de acuerdo con DeepSeek, por un ataque malicioso a gran escala, por lo que la única forma de hacerlo es si nos damos de alta en la versión web para celular, enlazamos el perfil de Google y luego entramos a la app o al navegador web del mismo modo, donde ya no marcará error en el registro.
Al ingresar encontraremos unos cuantos botones en la interfaz que deberemos activar, como los de usar el modelo R1 en lugar del V3, para mayor capacidad de razonamiento, y si queremos también tener la opción de buscar contenido en la web gracias a su navegador integrado, algo que también hace ChatGPT, pero en su variante Plus de pago.
De acuerdo con su informe, DeepSeek tiene múltiples capacidades gratuitas, como el poder realizar tareas de programación avanzada, resolver problemas matemáticos y explicar el proceso de solución, acceso a internet, además del análisis y procesamiento de datos complejos.
Dicho de otra forma, con DeepSeek se pueden hacer una gran cantidad de tareas que ya son posibles con chatbots como ChatGPT o Gemini, por mencionar algunas, como el poder cargarle archivos y realizar consultas sobre ellos o hacerle preguntas "complicadas".
(function() { window.
_JS_MODULES = window.
_JS_MODULES || {}; var headElement = document.
getElementsByTagName("head")[0]; if (_JS_MODULES.
instagram) { var instagramScript = document.
createElement("script"); instagramScript.
src = "https://platform.
instagram.
com/en_US/embeds.
js"; instagramScript.
async = true; instagramScript.
defer = true; headElement.
appendChild(instagramScript); } })(); - La noticia DeepSeek-R1 desafía el dominio en IA de ChatGPT: es gratis, hecha en China y ya la puedes probar desde México fue publicada originalmente en Xataka México por Gonzalo Hernández .
La Línea B del Metro de la Ciudad de México registró otra falla por segundo día consecutivo; reportan apagón.
24 Horas
La entrada forzosa de las fuerzas de seguridad israelíes en tres escuelas de la agencia de la ONU ha sido descrita por ésta como una violación del derecho de los niños a la educación y a la seguridad. “Irrumpir en las escuelas y obligarlas a cerrar es un flagrante desprecioLa entrada UNRWA condena el “asalto” a escuelas en Jerusalén Ori
MPV
Gustavo AlonsoEste jueves llegó a los cines de México la película Karate Kid: Leyendas (Karate Kid: Legends), cinta que une a personajes clásicos del universo de Cobra Kai con una nueva generación de estudiantes.La historia sigue a Li Fong (Ben Wang), un joven que entrena con Mr. Han (Jackie Chan) y Daniel LaRusso (Ralph Macchio) para particip
Excelsior
Hoy en día, la compra de vehículos por internet se convierte en una alternativa cada vez más popular, especialmente cuando se trata de autos seminuevos. Gracias a las plataformas digitales especializadas, es posible encontrar buenas oportunidades sin salir de casa; sin embargo, como en toda transacción en línea, también es importante conoce
Lado.mx
With the monthly net inflow of Bitcoin spot ETF exceeding 9.8 billion US dollars, it marks the full embrace of crypto assets by traditional capital. However, in the market fluctuations dominated by institutions, the real wealth opportunities often belong to those investors who actively build a profit system.
Lado.mx
¿Te imaginas una máquina tragamonedas donde frutas y caramelos no solo te dan hambre, sino también grandes recompensas? Así es Sweet Bonanza, uno de los slots más adictivos y coloridos del momento, creado por el reconocido proveedor Pragmatic Play. Fácil de jugar, con funciones atractivas y visualmente deliciosa, esta tragamonedas ha conqui
Lado.mx
Puebla, Pue.- La tarde de este miércoles 8 de mayo tres sujetos se hicieron pasar por clientes para asaltar la joyería que se encuentra en una tienda departamental en la plaza comercial El Triángulo de Las Ánimas. Los delincuentes se llevaron una charola con 15 pares de aretes, cuyo valor fue estimado en 37 mil pesos. …El cargo Supuestos
Tribuna Noticias
Copa América 2015
Paco Almaraz
El Financiero Bloomberg TV
El desarrollador habló sobre el futuro de la franquicia.Estamos todos en espera de la segunda parte de Death Stranding, pero tenemos que Hideo Kojima ya habló sobre la posibilidad de una tercer entrega. En una reciente charla con Eurogamer, Kojima reveló que aunque tiene una idea para Death Stranding 3, no la haría el mismo y está abierto …
IGN Latinoamérica
Este jueves 8 de mayo, el cardenal estadounidense Robert Prevost fue elegido como nuevo Papa por el Colegio Cardenalicio, adoptando el nombre de León XIV. Ante este hecho histórico, la presidenta de México, Claudia Sheinbaum, envió un mensaje oficial desde su cuenta de X:“Felicitamos a su santidad León XIV, electo por el Colegio Cardenalicio
El Siglo de Torreón
El Financiero Bloomberg TV
El Financiero Bloomberg TV
A pesar de haber sido eliminada del reality show, la conductora señaló que no ve esta salida como un fracaso, sino como una oportunidad de redefinir su camino
Infobae
La ex habitante de La casa de los famosos México decidió refugiarse en su familia y olvidarse de todas sus polémicas
Infobae
Mariana Echeverría ha superado los escándalos mediáticos y a podido centrarse en su vida familiar. Felizmente ha anunciado que el proceso de fecundación in vitro ha tenido éxito y ya está embarazada. Mariana decidió someterse a este proceso luego de haber sufrido una perdida gestacional a principios de 2024. El bebé que espera es coloquialm
Tribuna Noticias
Gustavo AlonsoEl actor Damson Idris, conocido por su papel en la serie Snowfall, acaparó miradas en la Met Gala 2025 al llegar vestido con un traje de carreras blanco y un casco cubierto de pedrería, una aparición que confundió y sorprendió a los asistentes y usuarios de redes sociales.“Wtf”, escribió un usuario en X (antes Twitter), mien
Excelsior
En 2001 vio la luz La gran estafa, proyecto que juntó a dos íconos del cine: George Clooney y Brad Pitt. Esta comedia de crimen dio origen a una trilogía, además de otro par colaboraciones entre los actores, la más reciente titulada Wolfs. Pero ni siquiera ambos rostros pudieron c
Xataka México
Antes de protagonizar “Había una vez en Hollywood”, las estrellas de cine dejaron entrever sus tensiones personales
Infobae
Minnesota guard Anthony Edwards left the Timberwolves" playoff game against the Golden State Warriors Thursday night in Minneapolis after sustaining a
Deadspin
Últimas noticias
Localizan cadáver en estado de descomposición
Maryjose Gamboa encabeza las encuestas en Boca del Río: Jorge Romero
Llama Alfonso Martínez a construir un Gobierno de jóvenes y para jóvenes
TRABALENGUAS
¿Por qué el nuevo Papa Robert Prevost eligió llamarse León XIV?
De esta manera perdieron los Nuggets vs Thunder #shorts | ESPN Deportes
Ciro Procuna, tajante: Si hubiera estado de ÁRBITRO CÉSAR RAMOS, no le cambian decisión | Enfocados
Ellos son los nuevos integrantes al Salon de la Fama 2025 del beisbol mexicano
Reconocen labor de voceadores; celebran 75 anos de ardua dedicacion
TELE ZÓCALO NOCTURNO / 8 DE MAYO DE 2025
Autonomía de gestión para ente regulador
#Loret. León XIV centra su primer mensaje en la paz y la unidad. #Latinus
#Loret. El Papa León XIV va a ser invitado a la nueva Presa León: Samuel García. #Latinus
#Loret. García Harfuch acusa a jueces de liberar delincuentes. #Latinus
#Loret. Nuevo intercambio de ataques entre India y Pakistán. #Latinus