Con motivo del primer aniversario de DeepSeek-R1, se revela un nuevo modelo "MODEL1"

By: theblockbeats.news|2026/03/30 06:37:10
0
Compartir
copy

Noticias de BlockBeats, 21 de enero: Según QuantumBit, DeepSeek-R1 ha revelado su nuevo modelo "MODEL1" en su primer aniversario. DeepSeek ha actualizado el código FlashMLA en GitHub, con 28 menciones de MODEL1 en 114 archivos, apareciendo como un modelo distinto de V32. Se sabe que V32 es DeepSeek-V3.2, por lo que MODEL1 es probablemente una nueva arquitectura. Las diferencias específicas en el código se reflejan en el diseño de la caché KV, el manejo de la dispersión y la decodificación FP8, mostrando varias diferencias en la optimización de la memoria.

Precio de --

--

También te puede interesar