商傳媒DeepSeek V4模型四月下旬登場 兆級參數採用華為晶片

DeepSeek V4模型四月下旬登場 兆級參數採用華為晶片

圖/本報資料庫

商傳媒|葉安庭/綜合外電報導

AI模型開發商 DeepSeek 預計於本(4)月下旬發布其最新一代模型 DeepSeek V4。據路透社(Reuters)引述新聞網站 The Information 報導,這款新模型已延宕兩次上市時間,原定於今年2月推出。

DeepSeek V4 據傳將採用 Mixture-of-Experts (MoE) 架構,總參數規模約達一兆級別,但每次推論(inference)時僅啟用約 320 億至 370 億參數,旨在有效控制推論成本。此前,DeepSeek V3 已採用相同的MoE架構,總參數為 6,710 億。

值得注意的是,DeepSeek V4 將運行於華為(Huawei)的昇騰(Ascend)系列晶片,這使其成為首個建立在中國國產半導體基礎設施上的前沿級AI模型。據報導,DeepSeek 在模型優化初期,優先提供中國本土晶片製造商技術窗口,而未向輝達(NVIDIA)和超微(AMD)等西方晶片供應商開放早期優化存取權。此舉被分析認為是直接反駁美國出口管制措施未能有效阻礙中國AI發展的觀點。

市場傳聞,DeepSeek V4 有望支援高達一百萬個token的上下文視窗(context window),儘管DeepSeek官方尚未證實此數據,但該公司確實在今年1月發布了Engram—一套專為長上下文檢索設計的條件記憶系統研究。此外,V4 的輕量化版本 V4-Lite 已於今年4月初開始進行API基礎設施的實測。DeepSeek過往以其具競爭力的定價策略見稱,分析師預期,V4若能以頂尖效能搭配其一貫的積極定價,恐將再次衝擊AI市場。

想讓你的品牌在新聞媒體曝光? 立即點我加入官方LINE@免費諮詢

熱門新聞