AI Agent 真正帶來的挑戰，不是技術，而是管理

最近在整理自己官網的 Agent Workflow 時，我以為最花時間的事情會是模型能力、工具選擇或執行環境。實際做下去才發現，真正困難的不是讓 Agent 做事，而是讓它在正確的邊界裡做事。

一開始，我會很自然地把焦點放在「它能不能完成任務」。後來我發現，這個問題太晚了。更早要問的是：任務有沒有被定義清楚？哪些檔案可以改？哪些內容不能碰？什麼情況必須停下來確認？完成後要用什麼標準驗收？如果這些沒有先講清楚，Agent 可能仍然會產出一個看起來完整的結果，只是那個結果不一定符合我要的方向。

這件事讓我對 AI Agent 有一個很直接的判斷：AI Agent 不會讓管理消失，反而讓管理變得更具體。過去很多管理要求可以靠默契、經驗或事後修正處理；但當工作被委派給 Agent，模糊的地方會很快變成執行風險。

從一句指令，到一套工作規則

我在官網整個開發流程裡面建立 AGENTS.md，不是為了把規則寫得好看，而是因為網站本身已經不只是幾個靜態頁面。它包含個人品牌定位、Blog 文章平台、PostgreSQL CMS、SEO、GEO、AIO，以及內容從 draft、review、published 到 archive 的生命周期。

如果我只說「幫我把文章整理好」，這句話對人來說也許還能靠背景理解補足，但對 Agent 來說太模糊。它不知道正式文章可以保留哪些區塊，不知道 published content 不能任意修改，也不知道 CMS 欄位和 Topic 分類不能混在一起。這些不是技術細節，而是工作規則。

所以 AGENTS.md 的價值，不只是告訴 Agent 專案在哪裡，更重要的是把管理者的判斷寫成可執行的邊界。例如只能在專案的根目錄內工作、不能越界碰到其他開發專案、不能提交 .env 或 token、內容任務要讀指定 skills、發布前要經過 review。這些規則讓委派不再只靠一句 prompt，而是有一個穩定的管理框架。

OpenAI 在 Agents SDK 文件中把 agent 描述為由 instructions、tools，以及 handoffs、guardrails、structured outputs 等 runtime behavior 組成。這個說法和我的實際感受很接近，Agent 的能力不是只有模型本身，還包含它被放進什麼規則、工具和驗收流程裡。

Skills 其實是在固定工作方法

我後來開始理解，Skills 不是提示詞技巧，而是在固定工作方法。以程式開發來說，如果每次交辦 Codex 都要重新提醒先讀現有架構、不要直接改 published content、不要破壞既有 URL、修改後要跑 build、完成後要說明改了哪些檔案，這代表這些規則其實不應該只存在單次對話裡。

這些要求本質上就是工作標準。當它們被整理成 Skills 或 Workflow 之後，Agent 才有機會穩定地照同一套方式工作。這件事很像管理團隊。主管不能只說「把功能做好」，而是要定義什麼可以改、什麼不能改、完成後怎麼驗收、出了問題要怎麼回報。所以 Skills 和 Workflows 的價值，不是讓 AI 變得更會回答，而是把原本存在人腦中的工作方法，變成可以被執行、被檢查、被重複使用的標準。

AI Agent 真正帶來的管理挑戰也在這裡。當工作開始被委派出去，管理者要管理的不只是結果，而是任務邊界、執行規則與驗收方式。

Workflow 決定任務怎麼被推進

很多人以為 Agent 的能力來自模型本身，但實際使用之後我發現，很多時候決定結果品質的不是模型，而是工作流程。以 tigerlee.cc 這個官網的開發為例，我不會直接要求 Agent「把網站做好」。這種任務太大，也無法驗收。比較合理的做法是先拆成幾個階段，確認需求、閱讀現有架構、找出相關檔案、提出修改方案、實作修改、驗證 build、檢查 SEO 是否受影響，最後再進行部署。這些步驟本身就是 Workflow。

Workflow 的價值不在於把工作變複雜，而是把原本模糊的大任務拆成可以檢查的階段。當每個階段都有明確輸出與驗收標準時，問題比較容易被定位，也比較容易修正。從管理角度來看，Workflow 其實是在管理風險。因為當工作開始交給 Agent 執行時，如果沒有明確順序與檢查點，錯誤往往不是發生在最後一步，而是在前面某個看起來合理但其實方向已經偏掉的決策。

Review 才是 Agent 時代最重要的管理能力

很多人看到 Agent 能自動完成任務，第一個想到的是效率，但我覺得真正重要的其實是 Review。例如在 tigerlee.cc 官網的開發過程裡，我經常把功能修改交給 Agent 處理。Agent 可以讀專案、修改檔案、執行測試，甚至完成大部分開發工作。但即使如此，我仍然需要確認幾件事情：有沒有影響既有 URL、是否破壞 SEO 結構、資料來源是否正確、內容生命周期是否被遵守，以及這次修改是否符合網站長期規劃。這些問題都不是模型能力可以決定的，因為 Agent 負責執行，而責任仍然屬於管理者。OpenAI 在 Codex 的設計中，也把人類審查放在重要位置。Agent 可以推進工作，但最終是否接受結果、是否承擔風險、是否符合目標，仍然需要人做判斷。

當 Agent 能力越來越強時，我反而覺得 Review 變得更重要。過去管理者花很多時間在執行細節，未來可能會把更多時間放在驗收標準、風險控制與結果判斷。這也是我認為 AI Agent 帶來的管理變化。工作不一定變少，但管理的重心正在改變。

驗收標準會逼管理者把期待說清楚

我很喜歡「驗收標準」這個詞，因為它會逼人把抽象期待變成可檢查的條件。這些標準越具體，Agent 越容易交出可用的結果；標準越模糊，後面 Review 的成本就越高。這件事也提醒我，很多時候不是 Agent 不理解，而是管理者自己沒有把期待說清楚。人類團隊可以靠長期合作累積默契，但 Agent 更依賴明確的上下文與規則。你沒有定義的標準，就不能期待它一定會被遵守。

從這個角度看，AI Agent 帶來的不是少管理，而是更精準的管理。管理者必須把目標、限制、品質標準和決策責任外顯化，才能讓 Agent 在正確範圍內加速推進工作。

管理會從人，擴大到人與 Agent 的工作系統

我認為未來管理者要管理的，不會只是人，也不會只是工具，而是人與 Agent 組成的工作系統。在這個系統裡，人負責方向、判斷、取捨與責任；Agent 負責在明確邊界內推進任務；Skills 保存工作標準；Workflows 定義工作順序；Review 機制確保品質；驗收標準決定什麼叫完成。這些元素缺一個，整個系統就會不穩。

所以 AI Agent 真正帶來的挑戰，不是技術，而是管理。技術會持續進步，模型會更強，工具會更多，但如果組織沒有能力定義任務、建立邊界、設計流程、檢查結果，Agent 只會把原本模糊的管理問題放大。

AI Agent 不會讓管理消失，反而讓管理變得更具體。

FAQ

AI Agent 導入企業後最大的挑戰是什麼？

很多人以為最大的挑戰是模型能力或技術整合，但實際導入後，真正困難的往往是任務定義、權限管理、驗收標準與責任歸屬。當 Agent 能夠執行工作時，管理的重要性反而提高。

AI Agent 會降低管理需求嗎？

不會。AI Agent 可以降低部分執行成本，但管理者仍然需要定義目標、設定邊界、控制風險並驗收結果。Agent 接手的是執行，不是責任。

為什麼 AI Agent 特別需要明確的任務邊界？

因為 Agent 不只是回答問題，而是會採取行動。如果權限、限制與回報機制不清楚，Agent 可能在錯誤方向上快速執行，造成更大的成本與風險。

AI Agent 和傳統自動化工具有什麼不同？

傳統自動化通常依照固定規則執行，而 AI Agent 能根據上下文規劃與調整步驟。這讓它更有彈性，但也更依賴管理者提供清楚的目標與驗收標準。

AI Agent 時代，管理者最重要的能力是什麼？

除了專業能力之外，管理者更需要把原本存在腦中的經驗與判斷外顯化，包括任務拆解、工作規則、品質標準與驗收機制，讓 Agent 能在可控範圍內執行工作。