8 de febrero de 2025

Nueva Inteligencia Artificial de un laboratorio chino se especializa en el razonamiento

El laboratorio chino DeepSeek, lanzó R1 una nueva Inteligencia Artificial (IA) especialmente diseñada para el razonamiento, que alcanza o incluso supera el rendimiento de los modelos más avanzados de OpenAI, especialmente en evaluaciones de matemáticas y programación.

Este modelo es de código abierto y totalmente gratuito, contando con 671 mil millones de parámetros.

Por otro lado, alcanzó un 97,3% de aciertos en las pruebas matemáticas MATH-500, superando el 96,4% de uno de los modelos de OpenAI. Su costo de desarrollo es entre un 90% y un 95% menor que el de sus competidores.

DeepSeek logró esto a través de un aprendizaje por refuerzo puro, sin utilizar datos previamente etiquetados.

El aprendizaje por refuerzo permite que el modelo adquiera conocimientos a través de prueba y error. Aunque los resultados iniciales fueron erráticos, el modelo va formando estrategias de razonamiento propias.

DeepSeek perfeccionó este método al integrarlo con entrenamiento supervisado, dando lugar a la versión final de R1, refieren medios internacionales.

Como modelo de razonamiento, R1 se valida de forma eficiente, lo que le ayuda a evitar algunos de los problemas comunes que enfrentan estos modelos, como la necesidad de más tiempo para generar soluciones en comparación con un modelo típico que no utiliza razonamiento.

Con información de Nota de Prensa

Foto Cortesía

Comparte esto