8月21日,DeepSeek在其官宣發(fā)布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。另外 ,V3.1對分詞器及chat template進行了較大調(diào)整,與DeepSeek-V3存在明顯差異 。DeepSeek官微在置頂留言里表示,UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。
相關(guān)報道DeepSeek發(fā)布新模型V3.1 價格漲了但Agent能力提升了
8月21日 ,業(yè)界千呼萬喚的R2模型沒來,但DeepSeek官方正式發(fā)布了新模型V3.1。從命名來看這或許不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代 。
在X上 ,DeepSeek將V3.1稱為“我們邁向智能體時代的第一步”(our first step toward the agent era)。本次升級主要有三大亮點,其中包括更強的 Agent能力、混合思考模式和更高的思考效率。
官方表示,通過后訓(xùn)練優(yōu)化 ,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升 。在編程智能體、搜索智能體測評中, V3.1 相比之前的 DeepSeek 系列模型都有明顯提高。
DeepSeek-V3.1 是混合推理架構(gòu),一個模型同時支持思考模式和非思考模式。目前用戶可在官方 App與網(wǎng)頁端體驗新模型 ,通過“深度思考 ”按鈕,實現(xiàn)思考模式與非思考模式的自由切換 。DeepSeek API 也已同步升級,deepseek-chat對應(yīng)非思考模式,deepseek-reasoner對應(yīng)思考模式 ,且上下文均已擴展為 128K。
“混合推理非常棒。擁有一個能夠在深度思考和快速響應(yīng)之間切換的模型,感覺就像是實用人工智能的未來 。”X上有網(wǎng)友表示,“在深度推理和快速反應(yīng)之間切換真是天才之舉。”根據(jù)查詢調(diào)整深度 ,可以避免在簡單任務(wù)上過度耗時,同時在需要時進行全面分析。
與之前的版本相比,V3.1也有更高的思考效率。官方表示 ,DeepSeek-V3.1-Think 在保持與 DeepSeek-R1-0528 相當(dāng)?shù)拇鸢纲|(zhì)量的同時,響應(yīng)速度更快 。
官方測試結(jié)果顯示,經(jīng)過思維鏈壓縮訓(xùn)練后 ,V3.1-Think 在輸出 token 數(shù)減少 20%-50% 的情況下,各項任務(wù)的平均表現(xiàn)與 R1-0528 持平。
同時,V3.1 在非思考模式下的輸出長度也得到了有效控制 ,相比于 DeepSeek-V3-0324 ,能夠在輸出長度明顯減少的情況下保持相同的模型性能。
同步地,DeepSeek進行了價格調(diào)整,模型的API接口調(diào)用價格有所上漲 。自 9 月 6 日凌晨起 ,取消夜間時段優(yōu)惠,輸入價格上,緩存命中時為0.5元/百萬tokens ,緩存未命中的價格則為4元/百萬tokens(此前V3為2元/百萬tokens);輸出價格為12元/百萬tokens(此前V3為8元/百萬tokens)。
官方提到,V3.1的基礎(chǔ)模型在V3的基礎(chǔ)上重新做了外擴訓(xùn)練,一共增加訓(xùn)練了840B tokens?;A(chǔ)模型與后訓(xùn)練模型均已在Huggingface與魔搭開源 。
值得一提的是 ,DeepSeek此次還宣布增加了對海外模型Anthropic API格式的支持,官方提到這是“為了滿足大家對 Anthropic API 生態(tài)的使用需求 ”,用戶可以將 DeepSeek-V3.1 的能力接入Claude Code框架。
尚競配資:實盤的股票杠桿平臺-泰柬爆發(fā)新沖突!泰國出動4架戰(zhàn)機空襲柬埔寨!中使館發(fā)布最新提醒:柬泰邊境的中國公民盡快撤離
蜀商證券:股票推薦平臺-工信部部長李樂成就人工智能賦能新型工業(yè)化開展調(diào)研
美港通證券:股票杠桿配資找加杠網(wǎng)-突然暴拉!芯片產(chǎn)業(yè)鏈全線井噴!三大利好集中來襲!上漲極限在哪里?
安聯(lián)配資:香港股票配資平臺-加拿大宣布取消多項針對美國商品的報復(fù)性關(guān)稅
蜀商證券:股票杠桿正規(guī)平臺-統(tǒng)計局:1-5月份全國規(guī)模以上工業(yè)企業(yè)利潤下降1.1%
配資官網(wǎng):股票配資-【獨家】空缺近8個月,國金證券迎來新一任首席經(jīng)濟學(xué)家宋雪濤|界面新聞