DeepSeek
Hangzhou DeepSeek Artificial Intelligence Co., Ltd., comumente chamada de DeepSeek, é uma empresa chinesa de inteligência artificial especializada no desenvolvimento de modelos de linguagem de grande porte (LLMs) de código aberto. Sediada em Hangzhou, a companhia é propriedade e recebe financiamento do fundo de hedge chinês High-Flyer, cujo cofundador, Liang Wenfeng, fundou a empresa em 2023 e atualmente ocupa o cargo de CEO.
Imagem: User:Phudeptrai47540370870 · CC0 · Openverse
Em 2 de novembro de 2023, a DeepSeek revelou seu primeiro modelo DeepSeek Coder, que era gratuito para uso comercial e totalmente de código aberto. Em 29 de novembro de 2023, a DeepSeek lançou o DeepSeek LLM (modelo de linguagem grande), que foi dimensionado para até 67 bilhões de parâmetros. Ele foi desenvolvido para competir com outros LLMs disponíveis na época, com um desempenho próximo ao do GPT-4. No entanto, enfrentou desafios em termos de eficiência computacional e escalabilidade. Uma versão de chat do modelo chamada DeepSeek Chat também foi lançada. Em maio de 2024, o DeepSeek-V2 foi lançado. O Financial Times informou que era mais barato que seus pares, com um preço de 2 RMB para cada milhão de tokens produzidos. A tabela de classificação do Tiger Lab da Universidade de Waterloo classificou o DeepSeek-V2 em sétimo lugar em sua classificação LLM. DeepSeek-V2 introduziu MLA, um mecanismo de atenção que otimiza o cache KV durante inferência, drasticamente reduzindo o tamanho e mantendo ou melhorando performance em relação a outro métodos.
Imagem: Jwz1000520 · CC0 · Openverse
Censura
Algumas fontes observaram que a versão oficial da API do R1 usa mecanismos de censura para tópicos considerados politicamente sensíveis para o governo da China. Por exemplo, o modelo se recusa a responder perguntas sobre os protestos e massacres da Praça da Paz Celestial de 1989, perseguição de uigures, comparações entre Xi Jinping e o Ursinho Pooh ou direitos humanos na China. A IA pode inicialmente gerar uma resposta, mas depois a exclui logo depois e a substitui por uma mensagem como: "Desculpe, isso está além do meu escopo atual. Vamos falar sobre outra coisa." Os mecanismos de censura e restrições integrados só podem ser removidos até certo ponto na versão de código aberto do modelo R1. Se os "valores socialistas essenciais" definidos pelas autoridades reguladoras da Internet chinesas forem tocados ou o status político de Taiwan for levantado, as discussões serão encerradas.


