AI Agents Are Not LLMs / Chatbots

一年後,世界將像記住傳真機一樣記住聊天機器人:在通往更好事物的道路上的一個尷尬步驟。問任何首席運營官關於他們的聊天機器人推廣,你會看到同樣禮貌的聳肩:“它很笨重,維護成本高,無法回答常見問題。我們仍然需要人類。”
我們都經歷過。你試圖調整一個重要包裹的送貨時間或地址。一個聊天機器人禮貌地回覆說它已經記錄了你的請求,並將讓一個人類客服人員來執行物流。它沒有采取任何其他行動。你感到沮喪。
現實是:聊天機器人時代已經結束。那些堅守它的企業將消耗時間、金錢和人才。一種新的生物——自主AI代理正在崛起,而這兩種方法之間的鴻溝將決定哪些公司迅速前進,哪些則困於客戶服務的煉獄。

我們是如何被殭屍聊天機器人困住的
早期的聊天機器人本應是自動化的前線。然而,它們卻成爲了每個人最不喜歡的客戶體驗。爲什麼?因爲它們從未被構建來理解任何事情。
它們從一開始就是基於規則的。硬編碼的腳本、線性決策樹、“如果這樣,那麼那樣”的流程很快就變得複雜。說出完全正確的短語它們會迴應。稍微偏離一點,你要麼被忽視,要麼被循環回到開始。就像IVR菜單,禮貌得多。指數級的分支使得傳統聊天機器人在超過20個常見用例之外變得難以維護,更不用說提供投資回報了。
而問題不僅僅是糟糕的用戶體驗——它是架構性的問題。基於規則的系統不能泛化。它們只能響應預定義的輸入和場景。只要有任何變化——政策更新、新的定價層,客戶稍微不同地提出有效問題——整個流程就會崩潰。
接下來會發生什麼?升級到人工客服。一次又一次。
與此同時,前線員工被困在聊天機器人無法完成的重複任務中——手動更新運輸記錄,給司機打電話,記錄更新——而儀表盤卻報告“成功互動。”這到底是爲誰工作?
如今,大多數企業的“AI聊天機器人”部署不過是被美化的決策樹。表面上的改進——更友好的語氣,品牌化的頭像——無法改變潛在的現實:它們脆弱、膚淺,容易卡住。
但這些機器人被當作靈丹妙藥出售。因此,企業不斷投資,希望每一個新版本最終能夠閉合循環。然而,它沒有。也不可能。因爲架構從未爲自主理解或行動而構建——它是爲了轉移工單而建。
這就是爲什麼大多數聊天機器人關鍵績效指標都是表面層次:客戶滿意度、交接率、會話時長。當你問,“它真的解決了問題嗎?”儀表盤就會變得安靜。
當你慶祝聊天機器人的指標時,實際上是在慶祝一個用於計步的跑步機。簡單來說:大量的運動,卻沒有目的地。

然後來了LLM——說話者,而非執行者
進入GPT及其同類產品。突然間,機器人可以進行對話。它們理解俚語。它們處理模糊性。它們記住事情,擁有較長的上下文記憶。
這感覺像魔法。而這確實是一次真正的飛躍。第一次,AI能夠以規模產生人類般的迴應。AI是智能的。
但這裏有一個問題:LLM是出色的即興表演者,而不是操作者。
它們沒有結構化的目標。它們不知道任務何時完成。沒有支撐的情況下,它們無法可靠地訪問、更新或執行業務規則。它們所產生的只是語言——引人注目、清晰且偶爾有用,但很少負責任。
當一個LLM告訴你它已提交你的請求時,它其實並沒有。除非它被包裝在一個連接語言和行動的編排層中,否則它仍然只是談話。
因此,雖然LLM推動了行業向前發展,但它們並沒有解決執行差距。它們創造了一種新的虛假期望。現在,用戶不僅對機器人感到沮喪——他們還對聽起來聰明但實際上無法提供幫助的AI感到困惑。
這種困惑就是導致我們來到這裏的原因:AI工作流和AI代理。

什麼是真正的AI代理
AI工作流是一個執行預定步驟的LLM(大語言模型)。但在現實世界中,步驟往往無法提前預測。
這就是AI代理髮揮作用的地方。它是一個與外部工具集成的LLM,能夠進行深層推理,並利用其訪問的一切資源解決複雜問題,這些問題人類需要數倍的時間才能完成。
AI代理通過結合所有三層來實現這一點。
首先,是一個對話層,通常是一個LLM,用於解釋意圖(是的,LLM是有用的,只是將LLM默認稱爲“AI解決方案”就像把撥號調制解調器稱爲WiFi);其次,是一個推理層,概述所有決定應該發生什麼的規則、政策和任務規劃;第三,是一個執行層,安全連接到CRM、ERP、支付系統、語音系統,以及任何隱藏在櫃子裏的遺留系統。
去掉任何層,塔樓就會倒塌。將它們結合在一起,系統就會從“回覆”轉變爲“解決”。
讓我們回顧一下需要重新路由包裹的客戶場景。
傳統上,聊天機器人可以完成第一步——工單處理。LLM可能會讓你更進一步。然後需要人類介入。他們做出決策,然後手動輸入回覆。這是痛苦的。現在,一個AI代理主動執行整個工作流,做出自主決策,與後端系統交互,並記錄活動以備審計,除非絕對必要,否則無需人類干預。

Infographic comparing chatbot, LLM, and AI agent on handling a parcel reroute in 10 step-by-step actions.

圖像來源:Jurin AI

代理在三十秒內完成了原本需要在多個部門間來回磕碰的任務。它從頭到尾負責這項任務。

所以讓我們停止把一切都稱爲“代理”

“AI代理”這個術語正處於它的風頭之上——但像所有好的流行詞一樣,它正在被拉得很薄。每個擁有聊天機器人和API的供應商現在都聲稱提供“代理”。甚至有些僅僅因爲他們的LLM能記住你的名字五次就使用這個詞。

這種誤用不僅僅是品牌宣傳——它造成了真正的混淆。它讓買家期望從本來就不是爲之設計的工具中獲得結果。它通過創造虛假的期望,然後是實際的失望,減緩了採用過程。最糟糕的是,它讓企業自我安慰,以爲自己正在創新,實際上他們所做的只是把一個新的用戶界面附加到同樣的舊服務檯上。

但AI轉型是真實的。
真正的AI代理不僅僅是更會對話。它們更有責任感。它們深度整合,負責任地行動,並提供可追蹤的、對業務至關重要的結果。它們不僅僅是一個界面——它們是基礎設施。

而我們僅僅是在開始。

信息的未來:從應用程序到AI代理
多年來,我們一直在適應機器的邏輯。我們一直在點擊菜單,記住界面, juggling五個標籤頁只爲完成一項任務。搜索變得更聰明,應用程序變得更流暢——但負擔依然在用戶身上。

AI代理顛覆了這一點。

系統不是讓你學習如何運作,而是通過自然對話學習你如何工作。

想要預訂旅行嗎?只需與您的私人AI禮賓聊天:
“在阿爾卑斯山計劃一次徒步旅行,九月初,偏離人跡罕至的路徑。”
一切便會實現。航班、酒店、當地嚮導——甚至是您自己從未發現的隱藏寶藏。沒有90年代的網站或糟糕用戶體驗的笨重移動應用。只是一場能完成任務的對話。

這是一種從你操作應用程序到代理在你名下操作的轉變。

而且這不會止步於旅行。代理將重新塑造我們與所有事物的互動——物流、採購、合規、HR。悄然地用能夠推理、行動和隨着時間推移而改進的智能系統轉變脆弱的工具和碎片化的工作流。

這就是代理的未來:任務通過理解、行動和交付的AI瞬間完成——您自己的執行助理。

這不是科幻願景。它只是距離我們一到兩年。我們已經在Jurin AI朝這個方向努力。

代理型AI的時代已經到來,我們纔剛剛開始。我從未如此興奮。

AI代理不是LLM/聊天機器人的文章首次出現在Metaverse Post上。