999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

當(dāng)前熱門:“價格屠夫”DeepSeek上線,新模型成本下降超50%
發(fā)布時間:2025-09-29 20:32:46 文章來源:第一財經(jīng)資訊
當(dāng)前位置: 主頁 > 資訊 > 財經(jīng) > 正文


(資料圖片)

被稱為“價格屠夫”的DeepSeek再次揮刀降價了。

9月29日晚間,DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型,性能仍是穩(wěn)步提升,但出乎意料的是,調(diào)用價格大幅降低,尤其輸出價格大降75%,業(yè)界人士表示“這很難卷得過”。DeepSeek提到,在新價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

具體來看,輸入價格上,緩存命中時,DeepSeek-V3.2-Exp從0.5元/百萬tokens降至0.2元/百萬tokens,緩存未命中的價格則從4元/百萬tokens降為2元/百萬tokens;輸出價格上,從12元/百萬tokens直接降到了3元/百萬tokens。

降價原因方面,DeepSeek介紹是得益于新模型服務(wù)成本的大幅降低。V3.2-Exp是一個實驗性(Experimental)的版本,作為邁向新一代架構(gòu)的中間步驟,在 V3.1-Terminus 的基礎(chǔ)上這一模型引入了 DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓(xùn)練和推理效率進行了探索性的優(yōu)化和驗證。

簡單來說,因為實現(xiàn)了細(xì)粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,可以實現(xiàn)長文本訓(xùn)練和推理效率的大幅提升。

DeepSeek介紹,為了嚴(yán)謹(jǐn)?shù)卦u估引入稀疏注意力帶來的影響,團隊將 DeepSeek-V3.2-Exp 的訓(xùn)練設(shè)置與 V3.1-Terminus 進行了嚴(yán)格的對齊。在各領(lǐng)域的公開評測集上,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。

目前,DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經(jīng)更新為 DeepSeek-V3.2-Exp,訪問方式保持不變。

此外,為支持社區(qū)研究,DeepSeek 還開源了新模型研究中設(shè)計和實現(xiàn)的 GPU 算子,包括 TileLang 和 CUDA 兩種版本。團隊建議社區(qū)在進行研究性實驗時,優(yōu)先使用基于 TileLang 的版本,以便于調(diào)試和快速迭代。

值得一提的是,就在9月22日,DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁語里是終點、界限的意思,當(dāng)時業(yè)界猜測這是否會是V3系列的終極版本,并期待下一個發(fā)布的將是大版本更新,目前看起來這個猜測并不成立。

在年初海內(nèi)外出圈后,DeepSeek每一次更新都成為業(yè)界矚目的焦點,但這幾個月以來DeepSeek幾次更新都是小版本的迭代,關(guān)于V4和R2的呼聲也越來越多。在DeepSeek這次 X平臺上的官宣帖子下,就有海外網(wǎng)友詢問“什么時候可以期待下一個V4和R2的版本”,很快有網(wǎng)友回復(fù)表示,結(jié)合這次發(fā)布來看近期并不會看到。

標(biāo)簽: 調(diào)用 exp 價格屠夫 深度思考按鈕 deepseek

最近更新