AI Agent 是什麼?用「引擎和車」搞懂 Claude Chat、Cowork、Code 差在哪
AI Agent 是什麼?為什麼 Claude 分成 Chat、Cowork、Code 三種、又該怎麼選?用「模型是引擎、外殼是車」一個比喻,一次搞懂三者差在哪、各自適合誰,以及那些自架的 24 小時 AI Agent 到底值不值得追。
我有一陣子,老有種沒跟上技術潮流的感覺。
打開社群,到處有人在講自架的 AI Agent(像 2026 年初爆紅的 OpenClaw):跨平台、有記憶、24 小時掛在伺服器上、從手機就能指揮。而我呢?我認真在用的就兩個——Claude Code 拿來寫程式,Claude Cowork 拿來做分析(另外偶爾用 Claude Chat 隨手問點東西,但那不算幹活)。每次看到一個沒聽過的新名字,我都會懷疑:是不是我太遜,落後了?
後來我花了一個下午,把這些東西的底層拆開來看。拆完之後,那種沒跟上的感覺就消失了。不是因為我學會了那些花俏的玩法,而是因為我終於看懂:那些看起來很猛的工具,猛的地方不是 AI,是外殼。
這篇是我拆解的筆記。如果你也對「AI Agent」這個詞一直有點模糊,這兩個比喻可能會幫你省下一個下午。
第一件事:Agent 不是產品,是程度
我原本以為 Agent 是某個具體的東西,像一款 app。錯了。
Agent 是一個抽象概念,指的是「能自己跑完多步驟任務的 AI」——它會自己規劃、自己呼叫工具、執行、看結果、再修正,直到任務做完。重點是「自主程度」。
而且它不是有或沒有,是一條光譜。
一端是一問一答:主導權在你手上,你問一句它答一句,下一步要做什麼由你決定。另一端是完全自主:你給它一個目標,它自己跑完全程,中間不用你插手。市面上所有的 AI 工具,都落在這條線的某個位置。差別只是「它能自己走多遠」。
所以「這是不是 Agent」是個假問題。真正該問的是:這個工具的自主程度有多高?
你以為的落後,其實看不見
這裡要插一段,因為它正是那種「你落伍了」說法的根源。
我常看到一種說法:「如果你還只會跟 AI 一來一往對話,你就落後了。」這句話聽起來很有壓力,但它其實混淆了一件事。
我後來實際去用所謂的 Agent,發現一個有趣的事實——表面上,它也是一來一往。 你打一句,它回一句,你再打一句,它再回一句。畫面上跟普通聊天長得一模一樣。
差別不在表面,在你看不到的地方。
普通聊天,它回你的那一格,就只是回一句話。而 Agent 回你的那一格,背後可能已經自己跑了一輪迴圈:先規劃要做什麼、去呼叫工具、實際執行、看結果對不對、不對就再修一次——這些全部發生在「你打一句、它回一句」這個動作的內部,你只看到最後吐出來的結果。
所以那句「還在一來一往就落後」,問錯了重點。一來一往只是介面,不是落後的證據。真正的差別是主導權交出去多少——你是每一步都自己拍板,還是把「中間那串思考和動手」整包外包出去。
想通這個,你就不用再被那句話綁架:你沒有落後,你只是還沒把方向盤鬆開。要不要鬆、什麼時候鬆,是你的決定,不是別人的標準。
第二件事:模型是引擎,外殼是車
這是整篇最關鍵的一個分層,搞懂它,後面全部都通。
所有這些工具,底層都是在呼叫同一類東西——大型語言模型(也就是 AI 本身)。以 Claude 來說,模型就是 Claude Opus、Claude Sonnet 這些,是負責「想」的那顆腦,也就是引擎。但引擎不會自己跑路,它需要一台車把它包起來:方向盤、輪子、儀表板、油門。
這台車,行話叫 harness(外殼/框架)。外殼決定了幾件事:
- 給這顆引擎哪些工具(能不能上網、能不能讀你的檔案)
- 怎麼跑迴圈(一步一停,還是自己連續跑)
- 看得到哪些脈絡(記不記得你上次說過什麼)
- 介面長什麼樣(終端機、桌面 app、還是手機)
同一顆引擎,包進不同的車,就變成完全不同的產品。
| 引擎(模型) | 車(外殼) | |
|---|---|---|
| 是什麼 | AI 本身,負責「想」 | 包在外面的框架,負責「做」 |
| 決定什麼 | 回答得聰不聰明 | 能碰到哪些工具、記不記得、長什麼樣 |
| 換掉會怎樣 | 變笨或變聰明 | 同一顆腦,換一套手腳跟記憶 |
拿 Claude 自己來說最清楚,因為它兩層都看得到。引擎那層,是模型——像 Claude Opus 4.8、Claude Sonnet 4.6,是負責「想」的那顆腦,你甚至可以在同一個工具裡換不同的模型來開。車那層,是把同一顆模型包起來的三種外殼:Claude Chat 是一問一答的聊天介面、Claude Cowork 把它變成會做分析和報告的桌面工具、Claude Code 把它變成住在終端機、會自己讀檔改檔的工程助手。引擎可以是同一顆,但外殼能碰到的工具、記得的脈絡、長出來的樣子全不一樣。
最明顯的差別在收尾。同樣丟一份數據進去,Claude Code 預設你是工程師,把「算出結果」當終點,丟給你程式和數字就收工;Claude Cowork 預設你要看人話,會多走一步,把結果解讀成「這代表什麼、你該怎麼做」。同一顆腦,因為外殼對使用者的假設不同,產出就差一截。
引擎一樣。是車不一樣。
Chat、Cowork、Code 各長什麼樣?舉三個例子
光講「外殼不同」還是抽象,直接看三個你會真的丟給它的任務。
Claude Chat —— 一問一答
你說:「幫我把這段英文 email 改得更客氣一點。」它回你一個改寫版本,就結束了。它碰不到你電腦裡的任何檔案,給完答案就收工——適合問問題、改文字、腦力激盪。
Claude Cowork —— 做分析
你說:「把這個資料夾裡的 12 份月報,整理成一張各月營收總表,再告訴我哪個月最差、可能為什麼。」它會自己打開檔案、讀數字、做出表格,還順手把結論解讀給你聽。你交辦的是一個「任務」,不是一個「問題」。
Claude Code —— 寫程式
你在終端機裡丟一句:
找出這個專案為什麼登入會壞掉,修好它,然後跑一次測試
它會自己翻程式碼、定位 bug、改檔案、跑測試,再回報結果。它住在你的開發環境裡,會實際動手改你的專案。
三句話、三種「能碰到的東西」:Chat 只能動文字,Cowork 能動你的檔案,Code 能動你的程式。自主程度一路往上——這就是前面那條光譜,落到你每天會用的工具上。
那些自架 Agent,在動「車」那層
現在回頭看開頭那些讓我覺得自己落隊的東西——那些被討論得很多的自架 Agent,像 2026 年初爆紅、幾天衝破十萬星的 OpenClaw,主打「越用越聰明、會自己寫技能」的 Hermes Agent,還有最早把這套玩法帶紅的元老 AutoGPT。把它們的賣點攤開來看:能自架在伺服器上、能從通訊軟體指揮、能換不同模型、能跨對話記住東西。
用前面的比喻,這些全都是在動「車」那層——讓你自己調整外殼:車停哪(自架)、從哪裡發動(介面)、換哪顆引擎(選模型)、油箱多大(記憶)。它們把「外殼可以自己改」這件事,開放給你動手。
現成工具走的是另一條路。像我用的 Claude Code、Cowork,外殼是廠商配好的——開箱就能用,但你不能大改。自架工具剛好相反:彈性很大,代價是得自己組、自己接。沒有誰比較猛,是兩種取捨——一邊換「外殼能不能自己改」,一邊換「省不省事」。
那這份「能自己調外殼」的彈性,什麼時候真的用得上?這就要看你是誰了。
那我到底需要哪種車?
我查了一下大家實際怎麼用,發現使用者其實分三種,需求完全不同。
第一種,絕大多數人,用現成的整合工具。打開就能用,不碰外殼、不自架。要寫程式有寫程式的,要做文件有做文件的——我用的 Claude Code 和 Claude Cowork 就屬於這種。這群人要的是「完成我自己的任務」。
第二種,開發者和新創,才會去碰自架、自選模型。動機通常很具體:要把 Agent 嵌進自己的產品、要省訂閱費、要讓資料留在自己的伺服器上。他們做這些不是因為 Agent 更聰明,是因為要整合進別的系統。這群人要的是「把 Agent 變成產品的一部分」。
第三種,企業,把 Agent 當生產線員工,跑客服、跑數據、管基礎設施。這群人要的是「無人運轉的勞動力」。
我屬於第一種。我的需求是用 AI 完成我手上的事,不是做一個給別人用的產品,也不是替公司跑生產線。
想清楚這件事,結論很乾脆:那些自架方案對我不是升級,是多餘的工程負擔。 我不是用不起,是用不上。
真正該投資的,不是換車,是把脈絡餵好
那我這種人,要進步該往哪裡使力?
不是換一台更炫的車。瓶頸從來不在引擎記不記得,而在「對的脈絡,有沒有在對的時機被餵進去」。而「餵脈絡」這件事,在我身上長成了兩個很不一樣的系統。
一個是生活和思考用的。我把自己的判斷、價值觀、各個領域的背景知識,全部寫成檔案,讓 AI 每次要用的時候自己去翻——這本質上就是 Andrej Karpathy 在 2026 年提出的「LLM Wiki」那套:用 AI 幫你把零散素材整理成一頁頁結構化的知識,養成一個會自己長大的第二大腦。我要做決策、要它幫我想事情時,脈絡就在那裡等著被讀。
另一個是寫程式用的。我有一個資料平台的專案,幾乎整包程式都是 AI 在 Claude Code 裡寫的,我只負責寫規範、做終審。這裡餵的脈絡不是價值觀,是規格、架構約定、踩過的坑——寫進 CLAUDE.md 那類檔案,AI 照著把功能蓋出來。
兩個系統長得天差地別:一個是生活的第二大腦,一個是工程專案的規格庫。但骨子裡是同一件事——把對的脈絡,結構化地放在 AI 拿得到的地方。 這比換任何一台車都值得投資;而且不管之後換哪台車,這層脈絡都帶得走。
如果你覺得這類「把工具拆到底層再決定要不要追」的筆記有用,可以訂閱 kirolife,我會持續把自己摸索的過程記下來分享。