代理型AI面臨非結構化數據難題:IBM推出解決方案

ibm logo

香港 2025年7月1日 /美通社/ — IBM 正在從根本上簡化面向 AI 的數據堆棧。IBM 在Think大會上預覽 watsonx.data的重大演進,以幫助組織做好數據準備為AI所用,同時提供一個開放的混合數據基礎架構和企業級的結構化和非結構化數據管理。

代理型AI面臨非結構化數據難題:IBM推出解決方案
代理型AI面臨非結構化數據難題:IBM推出解決方案

測試結果顯示,與傳統 RAG相比,IBM watsonx.data的AI準確性提高了40%。IBM於6月推出的產品和功能包括:

  • Watsonx.data integration (集成 ),該軟件可在單個界面中編排不同集成樣式和格式的數據訪問和工程設計,其核心是靈活性和規模 
  • Watsonx.data intelligence (智能 ),該軟件可改變組織處理、管理和利用有意義數據的方式,利用 AI 的力量簡化數據治理 
  • Meta 的 Llama Stack 中增加 watsonx 作為 API 提供商,增強了企業大規模部署生成式 AI 的能力,並以開放性為核心

Watsonx.data 集成和 Watsonx.data 智能將作為獨立產品提供,部分功能也將通過 Watsonx.data 提供,從而最大限度地提高客戶選擇和模塊化程度。

為了補充這些產品, IBM 近期宣佈 了收購 DataStax 的意向,DataStax 擅長將非結構化數據用於生成式AI。借助 DataStax,客戶可以訪問其他矢量搜索功能。

基於內部測試,對比使用 watsonx.data Premium Edition 檢索層與僅矢量 RAG 在三個常見用例中 AI 模型輸出答案的準確性,測試使用 IBM 專有數據集,採用相同的選定開源通用推理、評估和嵌入模型以及額外變量。測試結果可能因具體情況而異。

這一重大演進的背景

企業正面臨著實現準確且高性能的生成式 AI——尤其是具有自主決策能力的代理AI人的重大障礙,但該障礙並非如大多數企業領導者所想。

問題不在於推理成本或難以捉摸的「完美」模型。問題在於數據。

企業需要可信且具有公司特性的數據,才能讓代理 AI真正創造價值——這些數據存在於電子郵件、文檔、演示文稿和視頻等非結構化數據中。據 估計 2022年企業產生的數據中90%是非結構化數據,但IBM預測其中僅有1%為大型語言模型(LLMs) 所用

非結構化數據的利用往往面臨巨大挑戰。這類數據分布廣泛且動態變化,存儲於多種格式中,缺乏清晰的標籤,且常需額外上下文才能完整解讀。傳統檢索增強生成( RAG)技術難以有效提取其價值,也無法妥善整合非結構化與結構化數據。

與此同時,各類孤立的工具會使 AI數據處理架構變得複雜且繁瑣。企業需要同時管理數據倉庫、數據湖以及數據治理和數據集成工具。數據架構可能與它本應管理的非結構化數據一樣令人困惑。

許多組織並未解決根本問題。它們僅關注生成式 AI的應用層,而非其下方的核心數據層。除非組織修復其數據基礎架構,否則AI代理和其他生成式AI計劃將無法充分發揮其潛力。 

幫助組織實現數據的 AI就緒

IBM提供的新功能將使組織能夠採集、治理和檢索非結構化(及結構化)數據——在此基礎上,實現準確、高性能的生成式AI的規模化應用。

關於 IBM

IBM 是全球領先的混合雲、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,並獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的數千家政府和企業實體依靠 IBM 混合雲平台和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業雲解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。瞭解更多信息,請訪問: www.ibm.com/

傳媒查詢:

郭韜 gguotao@cn.ibm.com

 

 

想讓你的品牌在新聞媒體曝光? 立即點我加入官方LINE@免費諮詢

熱門新聞