DeepSeek AI lança sua própria inteligência artificial conversacional
O gigante tecnológico chinês, DeepSeek AI, apresentou sua nova inteligência artificial conversacional, DeepSeek Chat. Este lançamento ocorre numa tentativa de competir com o popular ChatGPT e foi realizado como parte de um teste alfa. A nova IA utiliza modelos de aprendizado automático de linguagem (LLM) de 7B e 67B parâmetros.
Os modelos LLM do DeepSeek Chat foram treinados em um conjunto de dados massivo de 2 trilhões de tokens em inglês e chinês. Os resultados preliminares mostram um forte desempenho em uma variedade de avaliações, incluindo codificação e matemática. Além disso, os modelos foram liberados em código aberto para incentivar a pesquisa.
Arquitetura e desempenho do modelo
Ambos os modelos utilizam a mesma arquitetura de decodificador transformador auto-regressivo que Llama, uma popular IA conversacional. O modelo menor utiliza atenção multi-cabeça (MHA), enquanto o maior utiliza atenção de consulta agrupada (GQA). Os detalhes do treinamento e as taxas de aprendizado para cada modelo ainda não foram revelados.
Em termos de desempenho, o modelo LLM 67B Base da DeepSeek demonstrou capacidades gerais superiores, superando o Llama2 70B Base em áreas como raciocínio, codificação, matemática e compreensão do chinês. A versão de chat do modelo também teve um desempenho excepcional em testes nunca antes vistos.
Censura e competição no espaço IA
No entanto, foi apontado que o modelo sofre certo nível de censura, especialmente com perguntas relacionadas à China. Este é um tema delicado que pode afetar a adoção do modelo pelo público internacional.
O lançamento dos LLMs da DeepSeek marca outro movimento notável da China no espaço da IA. Outras ofertas de IA de propósito geral anunciadas recentemente incluem Baidu’s Ernie 4.0, 01.AI’s Yi 34B e os modelos da Qwen.
É interessante notar que alguns modelos menores demonstraram um desempenho ainda melhor que suas contrapartes maiores. Isso significa que as empresas podem economizar recursos computacionais enquanto visam casos de uso com o mesmo nível de efetividade.
Em trabalhos relacionados, a Microsoft também compartilhou seu trabalho na mesma área com o lançamento dos modelos Orca 2. Este é um indicativo claro do crescente interesse e competição no campo da inteligência artificial conversacional.
Sarah é, além de uma especialista em marketing digital, uma criadora de conteúdo com vasta experiência no campo. Graduada em Sociologia pela Universidade de Barcelona e com uma Pós-graduação em Marketing Digital pelo Inesdi, Sarah conseguiu se destacar como Diretora de Marketing Digital. Seu profundo conhecimento das tendências digitais e sua habilidade para identificar oportunidades de crescimento foram fundamentais para o sucesso de inúmeras campanhas. Além disso, ela dá aulas e palestras em prestigiosas escolas de negócios, universidades e eventos, compartilhando seus conhecimentos e experiências com outros profissionais e estudantes.