DeepSeek AI lanza su propia inteligencia artificial conversacional
El gigante tecnológico chino, DeepSeek AI, ha presentado su nueva inteligencia artificial conversacional, DeepSeek Chat. Este lanzamiento se produce en un intento de competir con la popular ChatGPT y se ha realizado como parte de una prueba alfa. La nueva IA utiliza modelos de aprendizaje automático de lenguaje (LLM) de 7B y 67B parámetros.
Los modelos LLM de DeepSeek Chat han sido entrenados en un conjunto de datos masivo de 2 billones de tokens en inglés y chino. Los resultados preliminares muestran un fuerte rendimiento en una variedad de evaluaciones, incluyendo codificación y matemáticas. Además, los modelos han sido liberados en código abierto para fomentar la investigación.
Arquitectura y rendimiento del modelo
Ambos modelos utilizan la misma arquitectura de decodificador transformador auto-regresivo que Llama, una popular IA conversacional. El modelo más pequeño utiliza atención multi-cabeza (MHA), mientras que el más grande utiliza atención de consulta agrupada (GQA). Los detalles del entrenamiento y las tasas de aprendizaje para cada modelo aún no han sido revelados.
En términos de rendimiento, el modelo LLM 67B Base de DeepSeek demostró capacidades generales superiores, superando a Llama2 70B Base en áreas como razonamiento, codificación, matemáticas y comprensión del chino. La versión chat del modelo también tuvo un rendimiento excepcional en pruebas nunca antes vistas.
Censura y competencia en el espacio IA
Sin embargo, se ha señalado que el modelo sufre cierto nivel de censura, especialmente con preguntas relacionadas con China. Este es un tema delicado que podría afectar la adopción del modelo por parte del público internacional.
El lanzamiento de los LLMs de DeepSeek marca otro movimiento notable de China en el espacio de la IA. Otras ofertas de IA de propósito general anunciadas recientemente incluyen Baidu’s Ernie 4.0, 01.AI’s Yi 34B y los modelos de Qwen.
Es interesante notar que algunos modelos más pequeños han demostrado un rendimiento incluso mejor que sus contrapartes más grandes. Esto significa que las empresas pueden ahorrar recursos informáticos mientras apuntan a casos de uso con el mismo nivel de efectividad.
En trabajos relacionados, Microsoft también compartió su trabajo en el mismo área con el lanzamiento de los modelos Orca 2. Este es un indicativo claro del creciente interés y competencia en el campo de la inteligencia artificial conversacional.
Sarah es además de experta en marketing digital, creadora de contenido con amplia experiencia en el campo. Graduada en Sociología por la Universidad de Barcelona y con un Postgrado en Marketing Digital en Inesdi, Sarah ha logrado destacarse como Directora de Marketing Digital.
Su profundo conocimiento de las tendencias digitales y su habilidad para identificar oportunidades de crecimiento han sido fundamentales para el éxito de numerosas campañas. Además, imparte clases y conferencias en prestigiosas escuelas de negocio, universidades y eventos, compartiendo sus conocimientos y experiencias con otros profesionales y estudiantes.