AI Agent 是什麼?用「引擎和車」搞懂 Claude Chat、Cowork、Code 差在哪

AI Agent 是什麼?為什麼 Claude 分成 Chat、Cowork、Code 三種、又該怎麼選?用「模型是引擎、外殼是車」一個比喻,一次搞懂三者差在哪、各自適合誰,以及那些自架的 24 小時 AI Agent 到底值不值得追。

分享
AI Agent 是什麼?用「引擎和車」搞懂 Claude Chat、Cowork、Code 差在哪

我有一陣子,老有種沒跟上技術潮流的感覺。

打開社群,到處有人在講自架的 AI Agent(像 2026 年初爆紅的 OpenClaw):跨平台、有記憶、24 小時掛在伺服器上、從手機就能指揮。而我呢?我認真在用的就兩個——Claude Code 拿來寫程式,Claude Cowork 拿來做分析(另外偶爾用 Claude Chat 隨手問點東西,但那不算幹活)。每次看到一個沒聽過的新名字,我都會懷疑:是不是我太遜,落後了?

後來我花了一個下午,把這些東西的底層拆開來看。拆完之後,那種沒跟上的感覺就消失了。不是因為我學會了那些花俏的玩法,而是因為我終於看懂:那些看起來很猛的工具,猛的地方不是 AI,是外殼。

這篇是我拆解的筆記。如果你也對「AI Agent」這個詞一直有點模糊,這兩個比喻可能會幫你省下一個下午。

第一件事:Agent 不是產品,是程度

我原本以為 Agent 是某個具體的東西,像一款 app。錯了。

Agent 是一個抽象概念,指的是「能自己跑完多步驟任務的 AI」——它會自己規劃、自己呼叫工具、執行、看結果、再修正,直到任務做完。重點是「自主程度」。

而且它不是有或沒有,是一條光譜。

一端是一問一答:主導權在你手上,你問一句它答一句,下一步要做什麼由你決定。另一端是完全自主:你給它一個目標,它自己跑完全程,中間不用你插手。市面上所有的 AI 工具,都落在這條線的某個位置。差別只是「它能自己走多遠」。

AI 的「自主程度」是一條光譜 一問一答 Agent 工具 ≈ Claude Chat ≈ Claude Cowork/Code 每一步你決定 給目標,它自己跑完

所以「這是不是 Agent」是個假問題。真正該問的是:這個工具的自主程度有多高?

你以為的落後,其實看不見

這裡要插一段,因為它正是那種「你落伍了」說法的根源。

我常看到一種說法:「如果你還只會跟 AI 一來一往對話,你就落後了。」這句話聽起來很有壓力,但它其實混淆了一件事。

我後來實際去用所謂的 Agent,發現一個有趣的事實——表面上,它也是一來一往。 你打一句,它回一句,你再打一句,它再回一句。畫面上跟普通聊天長得一模一樣。

差別不在表面,在你看不到的地方。

普通聊天,它回你的那一格,就只是回一句話。而 Agent 回你的那一格,背後可能已經自己跑了一輪迴圈:先規劃要做什麼、去呼叫工具、實際執行、看結果對不對、不對就再修一次——這些全部發生在「你打一句、它回一句」這個動作的內部,你只看到最後吐出來的結果。

同樣是一來一往,差別在你看不到的地方 表面:你看到的對話 AI AI 這一格的背後… 背後:AI 自己跑的迴圈(你看不到) 規劃 呼叫工具 執行 看結果 修正 不滿意就再跑一輪

所以那句「還在一來一往就落後」,問錯了重點。一來一往只是介面,不是落後的證據。真正的差別是主導權交出去多少——你是每一步都自己拍板,還是把「中間那串思考和動手」整包外包出去。

想通這個,你就不用再被那句話綁架:你沒有落後,你只是還沒把方向盤鬆開。要不要鬆、什麼時候鬆,是你的決定,不是別人的標準。

第二件事:模型是引擎,外殼是車

這是整篇最關鍵的一個分層,搞懂它,後面全部都通。

所有這些工具,底層都是在呼叫同一類東西——大型語言模型(也就是 AI 本身)。以 Claude 來說,模型就是 Claude Opus、Claude Sonnet 這些,是負責「想」的那顆腦,也就是引擎。但引擎不會自己跑路,它需要一台車把它包起來:方向盤、輪子、儀表板、油門。

這台車,行話叫 harness(外殼/框架)。外殼決定了幾件事:

  • 給這顆引擎哪些工具(能不能上網、能不能讀你的檔案)
  • 怎麼跑迴圈(一步一停,還是自己連續跑)
  • 看得到哪些脈絡(記不記得你上次說過什麼)
  • 介面長什麼樣(終端機、桌面 app、還是手機)

同一顆引擎,包進不同的車,就變成完全不同的產品。

引擎(模型) 車(外殼)
是什麼 AI 本身,負責「想」 包在外面的框架,負責「做」
決定什麼 回答得聰不聰明 能碰到哪些工具、記不記得、長什麼樣
換掉會怎樣 變笨或變聰明 同一顆腦,換一套手腳跟記憶
同一顆模型引擎,包成三台不同的車 Claude 模型 如 Opus·Sonnet Claude Chat 一問一答 Claude 模型 如 Opus·Sonnet Claude Cowork 做分析 Claude 模型 如 Opus·Sonnet Claude Code 寫程式 引擎同一顆,是車不一樣

拿 Claude 自己來說最清楚,因為它兩層都看得到。引擎那層,是模型——像 Claude Opus 4.8、Claude Sonnet 4.6,是負責「想」的那顆腦,你甚至可以在同一個工具裡換不同的模型來開。車那層,是把同一顆模型包起來的三種外殼:Claude Chat 是一問一答的聊天介面、Claude Cowork 把它變成會做分析和報告的桌面工具、Claude Code 把它變成住在終端機、會自己讀檔改檔的工程助手。引擎可以是同一顆,但外殼能碰到的工具、記得的脈絡、長出來的樣子全不一樣。

最明顯的差別在收尾。同樣丟一份數據進去,Claude Code 預設你是工程師,把「算出結果」當終點,丟給你程式和數字就收工;Claude Cowork 預設你要看人話,會多走一步,把結果解讀成「這代表什麼、你該怎麼做」。同一顆腦,因為外殼對使用者的假設不同,產出就差一截。

引擎一樣。是車不一樣。

Chat、Cowork、Code 各長什麼樣?舉三個例子

光講「外殼不同」還是抽象,直接看三個你會真的丟給它的任務。

Claude Chat —— 一問一答

你說:「幫我把這段英文 email 改得更客氣一點。」它回你一個改寫版本,就結束了。它碰不到你電腦裡的任何檔案,給完答案就收工——適合問問題、改文字、腦力激盪。

Claude Cowork —— 做分析

你說:「把這個資料夾裡的 12 份月報,整理成一張各月營收總表,再告訴我哪個月最差、可能為什麼。」它會自己打開檔案、讀數字、做出表格,還順手把結論解讀給你聽。你交辦的是一個「任務」,不是一個「問題」。

Claude Code —— 寫程式

你在終端機裡丟一句:

找出這個專案為什麼登入會壞掉,修好它,然後跑一次測試

它會自己翻程式碼、定位 bug、改檔案、跑測試,再回報結果。它住在你的開發環境裡,會實際動手改你的專案。

三句話、三種「能碰到的東西」:Chat 只能動文字,Cowork 能動你的檔案,Code 能動你的程式。自主程度一路往上——這就是前面那條光譜,落到你每天會用的工具上。

那些自架 Agent,在動「車」那層

現在回頭看開頭那些讓我覺得自己落隊的東西——那些被討論得很多的自架 Agent,像 2026 年初爆紅、幾天衝破十萬星的 OpenClaw,主打「越用越聰明、會自己寫技能」的 Hermes Agent,還有最早把這套玩法帶紅的元老 AutoGPT。把它們的賣點攤開來看:能自架在伺服器上、能從通訊軟體指揮、能換不同模型、能跨對話記住東西。

用前面的比喻,這些全都是在動「車」那層——讓你自己調整外殼:車停哪(自架)、從哪裡發動(介面)、換哪顆引擎(選模型)、油箱多大(記憶)。它們把「外殼可以自己改」這件事,開放給你動手。

現成工具走的是另一條路。像我用的 Claude Code、Cowork,外殼是廠商配好的——開箱就能用,但你不能大改。自架工具剛好相反:彈性很大,代價是得自己組、自己接。沒有誰比較猛,是兩種取捨——一邊換「外殼能不能自己改」,一邊換「省不省事」。

那這份「能自己調外殼」的彈性,什麼時候真的用得上?這就要看你是誰了。

那我到底需要哪種車?

我查了一下大家實際怎麼用,發現使用者其實分三種,需求完全不同。

第一種,絕大多數人,用現成的整合工具。打開就能用,不碰外殼、不自架。要寫程式有寫程式的,要做文件有做文件的——我用的 Claude Code 和 Claude Cowork 就屬於這種。這群人要的是「完成我自己的任務」。

第二種,開發者和新創,才會去碰自架、自選模型。動機通常很具體:要把 Agent 嵌進自己的產品、要省訂閱費、要讓資料留在自己的伺服器上。他們做這些不是因為 Agent 更聰明,是因為要整合進別的系統。這群人要的是「把 Agent 變成產品的一部分」。

第三種,企業,把 Agent 當生產線員工,跑客服、跑數據、管基礎設施。這群人要的是「無人運轉的勞動力」。

我屬於第一種。我的需求是用 AI 完成我手上的事,不是做一個給別人用的產品,也不是替公司跑生產線。

想清楚這件事,結論很乾脆:那些自架方案對我不是升級,是多餘的工程負擔。 我不是用不起,是用不上。

真正該投資的,不是換車,是把脈絡餵好

那我這種人,要進步該往哪裡使力?

不是換一台更炫的車。瓶頸從來不在引擎記不記得,而在「對的脈絡,有沒有在對的時機被餵進去」。而「餵脈絡」這件事,在我身上長成了兩個很不一樣的系統。

一個是生活和思考用的。我把自己的判斷、價值觀、各個領域的背景知識,全部寫成檔案,讓 AI 每次要用的時候自己去翻——這本質上就是 Andrej Karpathy 在 2026 年提出的「LLM Wiki」那套:用 AI 幫你把零散素材整理成一頁頁結構化的知識,養成一個會自己長大的第二大腦。我要做決策、要它幫我想事情時,脈絡就在那裡等著被讀。

另一個是寫程式用的。我有一個資料平台的專案,幾乎整包程式都是 AI 在 Claude Code 裡寫的,我只負責寫規範、做終審。這裡餵的脈絡不是價值觀,是規格、架構約定、踩過的坑——寫進 CLAUDE.md 那類檔案,AI 照著把功能蓋出來。

兩個系統長得天差地別:一個是生活的第二大腦,一個是工程專案的規格庫。但骨子裡是同一件事——把對的脈絡,結構化地放在 AI 拿得到的地方。 這比換任何一台車都值得投資;而且不管之後換哪台車,這層脈絡都帶得走。


如果你覺得這類「把工具拆到底層再決定要不要追」的筆記有用,可以訂閱 kirolife,我會持續把自己摸索的過程記下來分享。