商傳媒Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

商傳媒｜林昭衡／綜合外電報導

AI新創公司Anthropic於今日（17日）正式推出其最新大型語言模型Claude Opus 4.7，該模型為Anthropic向公眾發布的最智能版本。新模型在程式編碼、推理及視覺智能等方面均有顯著提升，並在關鍵基準測試中，其效能超越了Google及OpenAI的部分頂級模型。

Anthropic指出，Claude Opus 4.7系列模型以其多步驟推理及先進編碼能力著稱。新版本除了能更有效地處理複雜且耗時的任務，同時也能精準遵循指令，甚至在回報結果前自行驗證輸出內容。此外，Opus 4.7在專業任務處理上更具品味與創意，能夠產出更高品質的介面、投影片及文件。

在視覺能力方面，Claude Opus 4.7能夠處理更高解析度的視覺內容，並執行像素級精確的任務，例如從密集截圖中提取數據，以及改進文件製作、簡報和設計輸出。Anthropic強調，開發者回報稱，他們能夠放心地將過去需要密切監督的艱鉅編碼工作交由Opus 4.7執行。

根據Anthropic發布的模型卡，Claude Opus 4.7在「人類終極考試」（Humanity’s Last Exam）這項基準測試中展現出色。在未輔助工具的情況下，Opus 4.7得分為46.9%，超越了Google的Gemini 3.1 Pro（44.4%）與OpenAI的GPT-5-4 Pro（42.7%）。若允許使用工具，Opus 4.7的得分則提升至54.7%。

不過，Anthropic也坦承，Opus 4.7的效能仍不及公司內部未公開的Claude Mythos模型。Claude Mythos雖在「人類終極考試」中取得56.8%（無工具）和高達64.7%（有工具）的成績，但Anthropic考量其「過於危險」而暫未向公眾開放。這凸顯了AI模型在追求極致性能與確保安全之間面臨的平衡挑戰。

在安全性方面，Claude Opus 4.7展現了低度的錯位行為風險，與前代Opus 4.6相似，且更不易產生幻覺，獎勵駭客行為（reward hacking）發生率較低。模型內部亦建置防護措施，能自動偵測並阻止涉及禁止或高風險網路安全用途的請求，儘管其網路安全能力相較於Claude Mythos預覽版有所限制。新模型可透過Claude AI、Claude API以及微軟（Microsoft Foundry）、亞馬遜（Amazon Bedrock）和Google Cloud等合作夥伴平台取得，定價與Claude Opus 4.6相同。

想讓你的品牌在新聞媒體曝光？立即點我加入官方LINE@免費諮詢

Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

熱門新聞

XRP ETF資產飆破10.8億美元機構資金湧入千萬美元

美參院加強監管AI語音詐騙要求科技公司揭露防堵機制

OpenAI推AI模型GPT-Rosalind 強攻生命科學研發挑戰Google AlphaFold

馬來西亞砂拉越中央醫院引領無線AI超音波強化行動醫療與社區篩檢

加密貨幣交易所Grinex遭駭近1500萬美元平台停止運作引發資安警訊

關於我們

追蹤我們

Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

相關新聞

熱門新聞

關於我們

追蹤我們