商傳媒DeepSeek V4模型四月下旬登場兆級參數採用華為晶片

DeepSeek V4模型四月下旬登場兆級參數採用華為晶片

商傳媒｜葉安庭／綜合外電報導

AI模型開發商 DeepSeek 預計於本（4）月下旬發布其最新一代模型 DeepSeek V4。據路透社（Reuters）引述新聞網站 The Information 報導，這款新模型已延宕兩次上市時間，原定於今年2月推出。

DeepSeek V4 據傳將採用 Mixture-of-Experts (MoE) 架構，總參數規模約達一兆級別，但每次推論（inference）時僅啟用約 320 億至 370 億參數，旨在有效控制推論成本。此前，DeepSeek V3 已採用相同的MoE架構，總參數為 6,710 億。

值得注意的是，DeepSeek V4 將運行於華為（Huawei）的昇騰（Ascend）系列晶片，這使其成為首個建立在中國國產半導體基礎設施上的前沿級AI模型。據報導，DeepSeek 在模型優化初期，優先提供中國本土晶片製造商技術窗口，而未向輝達（NVIDIA）和超微（AMD）等西方晶片供應商開放早期優化存取權。此舉被分析認為是直接反駁美國出口管制措施未能有效阻礙中國AI發展的觀點。

市場傳聞，DeepSeek V4 有望支援高達一百萬個token的上下文視窗（context window），儘管DeepSeek官方尚未證實此數據，但該公司確實在今年1月發布了Engram—一套專為長上下文檢索設計的條件記憶系統研究。此外，V4 的輕量化版本 V4-Lite 已於今年4月初開始進行API基礎設施的實測。DeepSeek過往以其具競爭力的定價策略見稱，分析師預期，V4若能以頂尖效能搭配其一貫的積極定價，恐將再次衝擊AI市場。

想讓你的品牌在新聞媒體曝光？立即點我加入官方LINE@免費諮詢

DeepSeek V4模型四月下旬登場兆級參數採用華為晶片

熱門新聞

《巫師3：狂獵》銷量突破6500萬套躋身史上十大暢銷遊戲

曾遭美國拒發簽證美光執行長今帶領公司市值破兆美元

NFT 與 AI 點燃數位藝術市場動能預計 2035 年規模達 359 億美元

美國多戶住宅投資入門：創業者掘金本地市場

日本職場「謎文化」成新箭靶年輕一代不滿超越「血汗企業」

關於我們

追蹤我們

DeepSeek V4模型四月下旬登場 兆級參數採用華為晶片

相關新聞

熱門新聞

關於我們

追蹤我們

DeepSeek V4模型四月下旬登場兆級參數採用華為晶片