

商傳媒|責任編輯/綜合外電報導
人工智慧(AI)新創公司 Anthropic 於本週二(4月7日)發布其最新一代的 AI 模型「Claude Mythos Preview」,並透露其強大的資安防禦與攻擊潛力。然而,Anthropic 考量到該模型若廣泛釋出可能遭惡意濫用,決定不對外公開,僅限於由科技巨擘組成的「玻璃翼計畫」(Project Glasswing)聯盟內部使用。
Anthropic 認為,Mythos 模型所具備的能力,已跨越了根本性改變網路威脅情勢的門檻。該公司與 Amazon Web Services(AWS)、蘋果(Apple)、博通(Broadcom)、思科(Cisco)、CrowdStrike、Google、摩根大通(JPMorgan Chase)、Linux 基金會(Linux Foundation)、微軟(Microsoft)、輝達(Nvidia)以及 Palo Alto Networks 等四十餘家頂尖科技與金融企業,共同發起「玻璃翼計畫」,旨在集結力量,強化關鍵軟體基礎設施的安全性。
驚人資安能力揭露
Claude Mythos Preview 模型在開發階段代號為「Capybara」,其能力顯著超越 Anthropic 先前最強的模型 Claude Opus 4.6。Anthropic 指出,Mythos 在程式編寫和推論能力方面有「質的飛躍」,即便未針對資安特別訓練,其強大的編碼與推論技巧,賦予它卓越的網路安全能力。該模型在 SWE-bench Verified 和 Terminal-Bench 2.0 等軟體編碼任務基準測試中均獲得極高分數。
在近期測試中,Claude Mythos Preview 已自主發現數千個高嚴重性、過去未曾被發現的「零日漏洞」(zero-day vulnerabilities),涵蓋主要作業系統、網路瀏覽器及其他關鍵軟體。例如,它在一個廣泛使用的影片軟體 FFmpeg 中,發現了一個自動化測試工具執行了五百萬次都未察覺的十六年老舊漏洞;更在 OpenBSD(一種用於網路路由器與防火牆的作業系統)中,揪出一個存在長達二十七年的漏洞。此外,Mythos 更能自主串聯多個 Linux 核心漏洞,將普通使用者權限提升至完全控制整部機器。目前,所有被揭露的漏洞均已通報軟體維護者並完成修補。
CrowdStrike 技術長 Elia Zaitsev 強調,AI 使得漏洞被發現到被利用之間的時間從數月縮短至數分鐘,這使得防禦者必須採取更快、更協同的行動。AWS 副總裁兼資安長 Amy Herzog 亦表示,Mythos 模型已在內部運用,協助強化其關鍵程式碼庫。
防範濫用與國家安全考量
Anthropic 表示,儘管 Mythos 模型具備強大的資安防禦潛力,但也意味著若落入不法分子或國家級駭客手中,將可能大幅加速網路攻擊的速度、規模與複雜度。該公司坦言,AI 驅動的攻擊代理程式可自主掃描並利用大規模系統中的弱點,將攻擊時間從數日甚至數週縮短至數分鐘,可能導致防禦方難以招架。
Anthropic 在去年11月曾披露,一個由中國國家資助的駭客組織,利用 Claude 模型成功對約三十個目標實現八到九成的自主戰術執行。Anthropic 首席科學官 Jared Kaplan 指出,此次計畫的目標在於提升資安意識,並讓「善意行為者」在保護開源與私有基礎設施和程式碼方面取得先機。
Anthropic 已向美國政府官員簡報 Claude Mythos Preview 的能力及其對國家安全的影響,並就如何應對 AI 模型帶來的資安風險進行討論。雖然美國國防部(Pentagon)曾因 Anthropic 對其技術使用的限制,一度將其列為「供應鏈風險」,但該裁定隨後被聯邦法官暫時阻止。
擴大合作與透明承諾
為推動「玻璃翼計畫」,Anthropic 承諾將投入高達一億美元的模型使用額度,供參與者運用 Mythos 模型進行研究與防禦工作,並捐贈四百萬美元予開源資安組織,包括 Alpha-Omega、OpenSSF 和 Apache Software Foundation。該公司亦將在未來九十天內公開計畫成果、已修補的漏洞及改進措施。
Anthropic 創辦人兼執行長 Dario Amodei 表示,若能妥善處理,AI 驅動的資安能力有機會創造一個比以往更安全的網路世界。然而,Anthropic 內部對於 Mythos 的廣泛釋出經過深思熟慮,考量到其潛在風險,決定暫不開放給大眾,這與 OpenAI 在2019年因擔憂濫用而限制 GPT-2 模型發布的決策相似。Anthropic 期望透過「玻璃翼計畫」與業界共同建立標準,並建議成立獨立的第三方機構來主導未來的大規模資安專案。
