From DeepSeek V3 to V3.2: Architecture, Sparse Attention, and RL Updates
DeepSeek, l'entreprise spécialisée dans l'intelligence artificielle, a annoncé la sortie de la version 3.2 de son modèle phare DeepSeek V3. Cette nouvelle version intègre des améliorations architecturales, notamment l'ajout d'une attention éparse, ainsi que des mises à jour basées sur le renforcement de l'apprentissage. Ces changements visent à optimiser les performances du modèle DeepSeek V3 dans ses applications de pointe en matière d'IA.