AI Agent 真正帶來的挑戰,不是技術,而是管理
最近在整理自己官網的 Agent Workflow 時,我以為最花時間的事情會是模型能力、工具選擇或執行環境。實際做下去才發現,真正困難的不是讓 Agent 做事,而是讓它在正確的邊界裡做事。
一開始,我會很自然地把焦點放在「它能不能完成任務」。後來我發現,這個問題太晚了。更早要問的是:任務有沒有被定義清楚?哪些檔案可以改?哪些內容不能碰?什麼情況必須停下來確認?完成後要用什麼標準驗收?如果這些沒有先講清楚,Agent 可能仍然會產出一個看起來完整的結果,只是那個結果不一定符合我要的方向。
這件事讓我對 AI Agent 有一個很直接的判斷:AI Agent 不會讓管理消失,反而讓管理變得更具體。過去很多管理要求可以靠默契、經驗或事後修正處理;但當工作被委派給 Agent,模糊的地方會很快變成執行風險。
從一句指令,到一套工作規則
我在官網整個開發流程裡面建立 AGENTS.md,不是為了把規則寫得好看,而是因為網站本身已經不只是幾個靜態頁面。它包含個人品牌定位、Blog 文章平台、PostgreSQL CMS、SEO、GEO、AIO,以及內容從 draft、review、published 到 archive 的生命周期。
如果我只說「幫我把文章整理好」,這句話對人來說也許還能靠背景理解補足,但對 Agent 來說太模糊。它不知道正式文章可以保留哪些區塊,不知道 published content 不能任意修改,也不知道 CMS 欄位和 Topic 分類不能混在一起。這些不是技術細節,而是工作規則。
所以 AGENTS.md 的價值,不只是告訴 Agent 專案在哪裡,更重要的是把管理者的判斷寫成可執行的邊界。例如只能在專案的根目錄內工作、不能越界碰到其他開發專案、不能提交 .env 或 token、內容任務要讀指定 skills、發布前要經過 review。這些規則讓委派不再只靠一句 prompt,而是有一個穩定的管理框架。
OpenAI 在 Agents SDK 文件中把 agent 描述為由 instructions、tools,以及 handoffs、guardrails、structured outputs 等 runtime behavior 組成。這個說法和我的實際感受很接近,Agent 的能力不是只有模型本身,還包含它被放進什麼規則、工具和驗收流程裡。
Skills 其實是在固定工作方法
我後來開始理解,Skills 不是提示詞技巧,而是在固定工作方法。以程式開發來說,如果每次交辦 Codex 都要重新提醒先讀現有架構、不要直接改 published content、不要破壞既有 URL、修改後要跑 build、完成後要說明改了哪些檔案,這代表這些規則其實不應該只存在單次對話裡。
這些要求本質上就是工作標準。當它們被整理成 Skills 或 Workflow 之後,Agent 才有機會穩定地照同一套方式工作。這件事很像管理團隊。主管不能只說「把功能做好」,而是要定義什麼可以改、什麼不能改、完成後怎麼驗收、出了問題要怎麼回報。所以 Skills 和 Workflows 的價值,不是讓 AI 變得更會回答,而是把原本存在人腦中的工作方法,變成可以被執行、被檢查、被重複使用的標準。
AI Agent 真正帶來的管理挑戰也在這裡。當工作開始被委派出去,管理者要管理的不只是結果,而是任務邊界、執行規則與驗收方式。
Workflow 決定任務怎麼被推進
很多人以為 Agent 的能力來自模型本身,但實際使用之後我發現,很多時候決定結果品質的不是模型,而是工作流程。以 tigerlee.cc 這個官網的開發為例,我不會直接要求 Agent「把網站做好」。這種任務太大,也無法驗收。比較合理的做法是先拆成幾個階段,確認需求、閱讀現有架構、找出相關檔案、提出修改方案、實作修改、驗證 build、檢查 SEO 是否受影響,最後再進行部署。這些步驟本身就是 Workflow。
Workflow 的價值不在於把工作變複雜,而是把原本模糊的大任務拆成可以檢查的階段。當每個階段都有明確輸出與驗收標準時,問題比較容易被定位,也比較容易修正。從管理角度來看,Workflow 其實是在管理風險。因為當工作開始交給 Agent 執行時,如果沒有明確順序與檢查點,錯誤往往不是發生在最後一步,而是在前面某個看起來合理但其實方向已經偏掉的決策。
Review 才是 Agent 時代最重要的管理能力
很多人看到 Agent 能自動完成任務,第一個想到的是效率,但我覺得真正重要的其實是 Review。例如在 tigerlee.cc 官網的開發過程裡,我經常把功能修改交給 Agent 處理。Agent 可以讀專案、修改檔案、執行測試,甚至完成大部分開發工作。但即使如此,我仍然需要確認幾件事情:有沒有影響既有 URL、是否破壞 SEO 結構、資料來源是否正確、內容生命周期是否被遵守,以及這次修改是否符合網站長期規劃。這些問題都不是模型能力可以決定的,因為 Agent 負責執行,而責任仍然屬於管理者。OpenAI 在 Codex 的設計中,也把人類審查放在重要位置。Agent 可以推進工作,但最終是否接受結果、是否承擔風險、是否符合目標,仍然需要人做判斷。
當 Agent 能力越來越強時,我反而覺得 Review 變得更重要。過去管理者花很多時間在執行細節,未來可能會把更多時間放在驗收標準、風險控制與結果判斷。這也是我認為 AI Agent 帶來的管理變化。工作不一定變少,但管理的重心正在改變。
驗收標準會逼管理者把期待說清楚
我很喜歡「驗收標準」這個詞,因為它會逼人把抽象期待變成可檢查的條件。這些標準越具體,Agent 越容易交出可用的結果;標準越模糊,後面 Review 的成本就越高。這件事也提醒我,很多時候不是 Agent 不理解,而是管理者自己沒有把期待說清楚。人類團隊可以靠長期合作累積默契,但 Agent 更依賴明確的上下文與規則。你沒有定義的標準,就不能期待它一定會被遵守。
從這個角度看,AI Agent 帶來的不是少管理,而是更精準的管理。管理者必須把目標、限制、品質標準和決策責任外顯化,才能讓 Agent 在正確範圍內加速推進工作。
管理會從人,擴大到人與 Agent 的工作系統
我認為未來管理者要管理的,不會只是人,也不會只是工具,而是人與 Agent 組成的工作系統。在這個系統裡,人負責方向、判斷、取捨與責任;Agent 負責在明確邊界內推進任務;Skills 保存工作標準;Workflows 定義工作順序;Review 機制確保品質;驗收標準決定什麼叫完成。這些元素缺一個,整個系統就會不穩。
所以 AI Agent 真正帶來的挑戰,不是技術,而是管理。技術會持續進步,模型會更強,工具會更多,但如果組織沒有能力定義任務、建立邊界、設計流程、檢查結果,Agent 只會把原本模糊的管理問題放大。
AI Agent 不會讓管理消失,反而讓管理變得更具體。
FAQ
AI Agent 導入企業後最大的挑戰是什麼?
很多人以為最大的挑戰是模型能力或技術整合,但實際導入後,真正困難的往往是任務定義、權限管理、驗收標準與責任歸屬。當 Agent 能夠執行工作時,管理的重要性反而提高。
AI Agent 會降低管理需求嗎?
不會。AI Agent 可以降低部分執行成本,但管理者仍然需要定義目標、設定邊界、控制風險並驗收結果。Agent 接手的是執行,不是責任。
為什麼 AI Agent 特別需要明確的任務邊界?
因為 Agent 不只是回答問題,而是會採取行動。如果權限、限制與回報機制不清楚,Agent 可能在錯誤方向上快速執行,造成更大的成本與風險。
AI Agent 和傳統自動化工具有什麼不同?
傳統自動化通常依照固定規則執行,而 AI Agent 能根據上下文規劃與調整步驟。這讓它更有彈性,但也更依賴管理者提供清楚的目標與驗收標準。
AI Agent 時代,管理者最重要的能力是什麼?
除了專業能力之外,管理者更需要把原本存在腦中的經驗與判斷外顯化,包括任務拆解、工作規則、品質標準與驗收機制,讓 Agent 能在可控範圍內執行工作。