
人工智慧領域浮現「AI Tarpits」新型威脅,它透過「AI投毒」欺騙大型語言模型(LLMs)資料爬蟲,使其攝取無用數據。一旦模型運用這些受污染資訊,將產生不正確或誤導性內容,最終可能嚴重影響AI聊天機器人的服務品質及使用者體驗。
人工智慧領域近期浮現一種名為「AI Tarpits」的新型威脅,這種工具旨在透過「AI投毒」(AI poisoning)手段,損害人工智慧聊天機器人底層的「大型語言模型」(LLMs),使其產生不正確、誤導性甚至荒謬的輸出內容。
根據外媒報導,AI投毒的過程涉及故意污染AI聊天機器人的核心模型。而AI Tarpits正是其中一種特定工具,其設計目的是欺騙大型語言模型用於資料搜集的網路爬蟲,使其攝取大量無用或惡意的垃圾數據。
一旦大型語言模型攝取了這些被污染的數據,便會將其用於生成文字輸出。如此一來,所產生的內容將會是不正確或充滿誤導性的,嚴重降低AI回應的品質。最終,這種情況可能導致使用者對聊天機器人失去信心,進而減少使用。
