商傳媒大型語言模型面臨「焦油坑」威脅 AI投毒恐致輸出失準

大型語言模型面臨「焦油坑」威脅 AI投毒恐致輸出失準

人工智慧領域浮現「AI Tarpits」新型威脅，它透過「AI投毒」欺騙大型語言模型（LLMs）資料爬蟲，使其攝取無用數據。一旦模型運用這些受污染資訊，將產生不正確或誤導性內容，最終可能嚴重影響AI聊天機器人的服務品質及使用者體驗。

人工智慧領域近期浮現一種名為「AI Tarpits」的新型威脅，這種工具旨在透過「AI投毒」（AI poisoning）手段，損害人工智慧聊天機器人底層的「大型語言模型」（LLMs），使其產生不正確、誤導性甚至荒謬的輸出內容。

根據外媒報導，AI投毒的過程涉及故意污染AI聊天機器人的核心模型。而AI Tarpits正是其中一種特定工具，其設計目的是欺騙大型語言模型用於資料搜集的網路爬蟲，使其攝取大量無用或惡意的垃圾數據。

一旦大型語言模型攝取了這些被污染的數據，便會將其用於生成文字輸出。如此一來，所產生的內容將會是不正確或充滿誤導性的，嚴重降低AI回應的品質。最終，這種情況可能導致使用者對聊天機器人失去信心，進而減少使用。