您的當(dāng)前位置:首頁 >探索 >剛剛,DeepSeek開源V3.2 正文
時間:2025-12-01 06:18:08 來源:網(wǎng)絡(luò)整理編輯:探索
剛剛,DeepSeek-V3.2-Exp 開源了!該模型參數(shù)量為 685B,HuggingFace 鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.

剛剛,剛剛DeepSeek-V3.2-Exp 開源了!開源

該模型參數(shù)量為 685B,剛剛HuggingFace 鏈接:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
此外,開源此次發(fā)布竟然也同步公開了論文,剛剛公開了 DeepSeek 新的開源稀疏注意力機制,為我們提供了更多結(jié)束細(xì)節(jié):

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
DeepSeek Sparse Attention(DSA)稀疏注意力機制
在官方介紹中,剛剛DeepSeek 表示 DeepSeek-V3.2-Exp 是開源實驗版本。作為邁向下一代架構(gòu)的剛剛過渡,V3.2-Exp 在 V3.1-Terminus 的開源基礎(chǔ)上引入了 DeepSeek 稀疏注意力機制(DeepSeek Sparse Attention,DSA)—— 一種旨在探索和驗證在長上下文場景下訓(xùn)練和推理效率優(yōu)化的剛剛稀疏注意力機制。
DSA 也是開源 3.2 版本的唯一架構(gòu)改進(jìn)。

DeepSeek-V3.2-Exp 的剛剛架構(gòu),其中 DSA 在 MLA 下實例化。開源
重點要說的剛剛是,DeepSeek 稱該實驗版本代表了他們對更高效的 Transformer 架構(gòu)的持續(xù)研究,特別注重提高處理擴展文本序列時的計算效率。

在 v3.2 版本中,DeepSeek 稀疏注意力 (DSA) 首次實現(xiàn)了細(xì)粒度稀疏注意力,在保持幾乎相同的模型輸出質(zhì)量的同時,顯著提高了長上下文訓(xùn)練和推理效率。
為了嚴(yán)格評估引入稀疏注意力機制的影響,DeepSeek 特意將 DeepSeek-V3.2-Exp 的訓(xùn)練配置與 9 月 22 日剛剛推出的 V3.1-Terminus 進(jìn)行了對比。在各個領(lǐng)域的公開基準(zhǔn)測試中,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 相當(dāng)。

更多信息,讀者們可以查閱 DeepSeek-V3.2-Exp 的 huggingface 介紹。
值得一提的是,智譜的 GLM-4.6 也即將發(fā)布,在 Z.ai 官網(wǎng)可以看到,GLM-4.5 標(biāo)識為上一代旗艦?zāi)P汀?/p>
最后,有一波小節(jié)奏。在模型發(fā)布前,已經(jīng)有網(wǎng)友在 Community 里發(fā)帖稱:國慶是休息日,請給我們關(guān)注的同學(xué)一點休息時間。

對此,你怎么看?
涉臺灣提問,日本外相不給正面回答2025-12-01 06:12
中日韓三國棋手共品貴陽“四精”文化 點贊貴陽城市魅力2025-12-01 05:50
加拿大央行將裁員10% 配合總理卡尼撙節(jié)開支2025-12-01 05:34
美墜機事故已致9死,當(dāng)?shù)厥虚L:預(yù)計遇難人數(shù)還會繼續(xù)上升2025-12-01 05:06
舒帕普拉邁轟HIO 躋身亞巡巴拉特精英賽54洞榜首2025-12-01 04:55
精選大樂透專家:郝曉帥、六爺同中二等各攬79萬2025-12-01 04:38
精選大樂透專家:郝曉帥、六爺同中二等各攬79萬2025-12-01 04:29
莫里森問鼎勞力士總決賽 20人取得歐巡賽入場券2025-12-01 04:20
當(dāng)房子和人一起老去:香港大火背后的城市困局2025-12-01 03:37
歐冠大神:專家專治冷門豪取17連紅 琛茹16連紅2025-12-01 03:33
律師談14歲男生刺死同學(xué)被判無期:補刀情節(jié)相當(dāng)惡劣,理應(yīng)頂格刑罰2025-12-01 06:08
20歲小伙喜中福彩100萬 近幾年頻繁中大獎2025-12-01 06:07
“陽明杯”圍棋推廣活動走進(jìn)貴陽市實驗小學(xué)2025-12-01 05:59
新手購彩一年擒大樂透1800萬:獎金存好繼續(xù)上班2025-12-01 05:54
大樂透頭獎11注916萬無追加 獎池余額7.83億元2025-12-01 05:44
2025全民健身主題示范活動走進(jìn)合肥包河區(qū)濱湖世紀(jì)社區(qū)2025-12-01 05:33
牧原食品股份有限公司2025年10月份銷售簡報2025-12-01 05:01
精選大樂透專家:江維中頭獎1058萬累擒2419萬2025-12-01 04:36
澤連斯基解除烏總統(tǒng)辦公室主任職務(wù)2025-12-01 03:45
齊魯棋院選手十五運摘金 山東省體育局致信祝賀2025-12-01 03:39