

商傳媒|林昭衡/綜合外電報導
AI新創公司Anthropic於今日(17日)正式推出其最新大型語言模型Claude Opus 4.7,該模型為Anthropic向公眾發布的最智能版本。新模型在程式編碼、推理及視覺智能等方面均有顯著提升,並在關鍵基準測試中,其效能超越了Google及OpenAI的部分頂級模型。
Anthropic指出,Claude Opus 4.7系列模型以其多步驟推理及先進編碼能力著稱。新版本除了能更有效地處理複雜且耗時的任務,同時也能精準遵循指令,甚至在回報結果前自行驗證輸出內容。此外,Opus 4.7在專業任務處理上更具品味與創意,能夠產出更高品質的介面、投影片及文件。
在視覺能力方面,Claude Opus 4.7能夠處理更高解析度的視覺內容,並執行像素級精確的任務,例如從密集截圖中提取數據,以及改進文件製作、簡報和設計輸出。Anthropic強調,開發者回報稱,他們能夠放心地將過去需要密切監督的艱鉅編碼工作交由Opus 4.7執行。
根據Anthropic發布的模型卡,Claude Opus 4.7在「人類終極考試」(Humanity’s Last Exam)這項基準測試中展現出色。在未輔助工具的情況下,Opus 4.7得分為46.9%,超越了Google的Gemini 3.1 Pro(44.4%)與OpenAI的GPT-5-4 Pro(42.7%)。若允許使用工具,Opus 4.7的得分則提升至54.7%。
不過,Anthropic也坦承,Opus 4.7的效能仍不及公司內部未公開的Claude Mythos模型。Claude Mythos雖在「人類終極考試」中取得56.8%(無工具)和高達64.7%(有工具)的成績,但Anthropic考量其「過於危險」而暫未向公眾開放。這凸顯了AI模型在追求極致性能與確保安全之間面臨的平衡挑戰。
在安全性方面,Claude Opus 4.7展現了低度的錯位行為風險,與前代Opus 4.6相似,且更不易產生幻覺,獎勵駭客行為(reward hacking)發生率較低。模型內部亦建置防護措施,能自動偵測並阻止涉及禁止或高風險網路安全用途的請求,儘管其網路安全能力相較於Claude Mythos預覽版有所限制。新模型可透過Claude AI、Claude API以及微軟(Microsoft Foundry)、亞馬遜(Amazon Bedrock)和Google Cloud等合作夥伴平台取得,定價與Claude Opus 4.6相同。
