那顆不見的滷蛋，揭露了企業 AI 最大的假象

企業 AI 不是聊天框，而是工作流

先不要從 OpenAI 開始。

先問一個比較荒謬的問題：

一顆不見的滷蛋，為什麼可以解釋企業 AI 最大的假象？

晚上七點半，店門口站著等位的客人，外送平台的鈴聲每隔幾秒就響一次，後廚的牛肉麵已經出到第 47 碗。湯鍋邊都是白霧，出餐口貼滿了被湯汁弄皺的單子。

老闆拿起其中一張，皺著眉頭問：「為什麼又少放一份滷蛋？」

這時候，如果有人衝進來說：「我有一個 AI，可以幫你把菜名寫得更漂亮，還能幫你回客人五星評論。」

老闆大概不會太感動。

因為滷蛋沒有消失。

它是被一條破掉的工作流吞掉了。

前台改了單，後廚沒看到；昨天外送退單沒有補回庫存；POS、外送平台、Excel 各記一套；新人不知道加點滷蛋要貼哪一張貼紙；店長以為還有 30 顆，其實冰箱只剩 8 顆。

這就是今天很多企業導入 AI 的真實樣子。

大家以為自己缺的是更聰明的模型。結果模型來了之後，才發現真正麻煩的不是回答不夠漂亮，而是公司的工作現場本來就很亂：資料散在不同系統，流程卡在不同部門，責任藏在不同人的腦袋裡。

AI 可以幫業務寫一封很流暢的 email。

但寄出之前，業務還是要自己去 CRM 查客戶狀態，去 Slack 問交期，去 Excel 找上一版報價，去合約資料夾確認付款條件，再憑經驗判斷：這封信到底能不能寄？寄了會不會承諾過頭？會不會踩到法務紅線？

所以企業 AI 的問題，從來不只是「模型會不會回答」。

真正的問題是：AI 能不能進到那個會延遲、會漏單、會互相踢皮球、會有人臨時插單、也會有人負責收拾殘局的工作現場。

很多企業不是還沒準備好用 AI。

是 AI 一進來，大家才看見：公司其實沒有一條清楚的工作流。

企業不是缺聊天框，是缺一條能跑的線

過去幾年，很多公司第一次接觸生成式 AI 的方式都很像。

先開一個聊天框。

行銷拿它寫文案，業務拿它修 email，客服拿它摘要對話，工程師拿它解釋程式碼。每個人都覺得「有幫助」，但過一陣子之後，管理層開始問一個很尷尬的問題：

那為什麼公司的流程沒有變快多少？

原因很簡單。聊天框可以幫個人變快，但它不會自動改掉公司的工作流。

客服主管每天早上打開 300 張未結案工單。AI 摘要每一張都很漂亮，但主管真正需要的不是 300 份漂亮摘要。她要知道哪 20 件可能違約，哪 10 件其實是同一個產品 bug，哪 5 件要立刻通知客戶成功經理，哪幾件只是文件寫得不清楚。

業務總監也一樣。他不缺一個會寫 follow-up email 的 AI。他缺的是一個系統，在他打開客戶頁面時，自動把過去往來、付款風險、客服抱怨、產品使用下降、續約日期和下一步建議放在同一個地方，並且清楚標出哪些建議可以直接採用，哪些一定要人批准。

這兩件事差很多。

前者是「AI 幫人寫一句話」。後者是「AI 被放進一條公司真的每天在跑的流程裡」。

也就是說，企業 AI 真正值錢的地方，不是多一個聊天框，而是把一條工作流拆成幾個可以被設計、被審核、被追蹤的環節：

Context：它到底讀了哪些上下文？
Tools：它可以使用哪些工具、寫回哪些系統？
Permission：它能看什麼、不能看什麼，能做什麼、不能做什麼？
Human review：哪一步需要人類確認？
Trace / Eval：做錯之後，錯誤會不會留下來，變成下一輪改進的材料？

沒有這些東西，AI 再會說話，也只是站在後廚門口喊：「我覺得滷蛋應該放進去。」

真正的改變，是有人進去把出餐線重排。

FDE 為什麼突然變重要？

這也是 FDE 重新被看見的原因。

FDE 可以理解成 Forward-Deployed Engineering，或 Deployment Engineering。中文翻成部署工程有點乾，但它的角色其實很好理解：不是在會議室裡放 demo 的人，也不是做完售前簡報就離開的人。

FDE 是那個捲起袖子進後廚的人。

他要看點餐單從哪裡來，庫存怎麼扣，退單怎麼記，尖峰時段誰有權限插單，哪一步可以讓系統先做，哪一步一定要人按確認。

換到企業裡，他要看的也不是「要不要加一個 AI chatbot」。他要看一張工單怎麼進來，一筆訂單怎麼被修改，一份合約誰可以看，一個客訴什麼時候要升級，一個 AI 建議如果被員工覆寫，理由要不要留下來。

這些問題聽起來不像 AI 發表會。

但它們才決定 AI 能不能真的上線。

你可以把 OpenAI、Anthropic、MCP、企業顧問合作這幾類動作放在一起看。表面上，它們像是不同公司各自推出平台、職缺、合作案或技術標準。放在更長的時間線裡，它們其實都在回答同一個問題：

模型已經夠會回答了，接下來要怎麼進公司真正的工作流？

OpenAI 強化 forward-deployed engineers 與企業 agent 部署能力；Anthropic 透過企業合作把 Claude 推進銀行、保險、航空、製造這類流程更重的產業；MCP 這類協定則在處理更底層的連接問題：AI 要怎麼接上工具、資料和系統，而不是每次都重新做一套客製整合。

這些不只是「AI 公司開始做企業市場」。

更像是模型公司發現，真正的戰場不在模型回答的那一秒，而在回答前後的整條線：它讀了什麼資料、用了什麼工具、寫回哪個系統、誰批准、誰覆寫、錯誤如何進入下一輪 eval。

以前我們說，每家公司都是軟體公司。

那句話的意思不是每家公司最後都要賣軟體，而是銀行、零售、物流、教育、製造、醫療，都會靠軟體重新組織自己的工作方式。

但 AI agent 時代，這句話可能要再往前推一步：

每個高價值工作流，都有機會變成一個 agent system。

不是每家公司都會變成 AI 公司。

而是每家公司裡那些重複、高價值、跨系統、又需要判斷的流程，會被重新拆開、接起來、加上權限與回饋機制。

所以判斷一個企業 AI 專案有沒有真正落地，不要先看 demo 有多炫。

先問三個比較土的問題：

第一，它有沒有讀到真正決策需要的上下文？

第二，它有沒有在正確的權限裡，寫回正確的系統？

第三，當人類不同意它的判斷時，這次覆寫會不會變成下一次改進？

如果三個答案都是沒有，那它大概還不是工作流，只是一個比較會說話的搜尋框。

PoC 很漂亮，不代表正式環境能用

很多 AI 專案一開始都很漂亮。

丟 20 份 PDF，模型可以摘要。丟一段客服紀錄，模型可以分類。丟一份合約，模型可以抓風險。會議室裡大家點頭，覺得這東西應該很快就能上線。

然後一進正式環境，問題就開始冒出來。

誰能讀這些 PDF？舊版本合約要不要排除？摘要要存在哪裡？業務能不能把模型回答直接轉寄給客戶？如果 AI 標錯風險，法務要怎麼覆寫？覆寫理由要不要保存？下次類似合約進來，系統會不會記得這次修正？

這些問題沒有 demo 那麼性感。

但它們決定 AI 到底能不能從「看起來很強」變成「每天有人敢用」。

想像一個 B2B SaaS 的客戶成功團隊。

某天早上，一張 enterprise support ticket 進來，標題很普通：「系統登入異常」。如果只看 ticket 本身，AI 很可能把它分類成一般登入問題，丟給一線客服照 SOP 回覆。

但資深 CSM 一看就覺得不對。

這個客戶下個月要續約，合約金額很大；上週才因為資安審查延遲抱怨過；昨天產品團隊剛好在修一個權限 bug；財務那邊還有一張未結發票。這不是單純的登入異常，這是一個可能擴大成 churn risk 的訊號。

真正有用的 AI，不是把「系統登入異常」摘要成三點。

真正有用的是把 CRM、billing、CSM note、product issue、合約條款和客服紀錄串起來，告訴主管：「這張 ticket 看似普通，但建議升級處理。原因是續約日期接近、過去 14 天已有兩次負面訊號、相關 bug 尚未關閉。」

然後更重要的是：主管如果不同意，能不能覆寫？覆寫原因會不會留下？下次模型遇到類似情況，會不會把這次修正變成 eval 或規則調整？

這才是企業 AI 的難點。

不是把答案寫出來，而是讓答案出現在正確的資料、權限、責任和回饋迴路裡。

這也是很多企業 AI 會卡住的真正原因：它不是技術展示題，而是組織現場題。

錯誤如果不能留下來，就不會變聰明

很多公司談 AI 轉型時，喜歡講「讓專家更有效率」。

但真正困難的地方是：專家的判斷要怎麼被系統吸收？

法務看完 AI 抓出的合約風險，說：「這條不算風險，因為我們跟這類客戶一直用這個條款。」如果這句話只是留在 Slack 裡，下次 AI 還是會犯一樣的錯。

客服主管把 AI 排出的高風險工單往下調，原因是：「這個客戶每次都用很急的語氣，但歷史上沒有違約風險。」如果這個判斷沒有被記錄，下次系統還是會把同一類客戶排到最前面。

餐廳也是一樣。

客人抱怨少放滷蛋，如果店員只是在群組裡罵一句「今天後廚又出包」，下週還是會少放。真正有用的是回頭看：是哪個平台的單？哪個時段？哪個品項？是備料不足、標籤不清，還是出餐檢查沒有設計好？

AI 也是這樣。

錯誤如果不能被追蹤，就不能被改進。人工修正如果不能變成 trace、eval、test case 和下一輪工程任務，它就只是一次性的救火。

這也是 FDE 和 deployment engineering 的價值：他們不只是把模型接進去，而是把「人怎麼修正 AI」這件事產品化。

誰可以覆寫？覆寫要填理由嗎？理由要不要分類？哪些覆寫代表模型問題，哪些覆寫其實是流程規則沒寫清楚？哪些修正應該進 eval，哪些只是單次例外？

這些問題很細。但所有真正能落地的企業 AI，最後都會走到這裡。

FDE 是補丁，還是新常態？

這裡也有一個值得懷疑的地方。

如果 AI 產品真的成熟，為什麼還需要這麼多人進企業現場？

FDE 可能代表 AI 產品還不夠標準化。就像有些 SaaS 看起來是產品，其實背後靠大量 customer success、solutions engineer 和 professional services 才能交付。當每個客戶都要客製，每個流程都要人肉接起來，這當然不像一個漂亮的軟體生意。

這是「FDE 作為補丁」的那一面。

但另一面也要承認：企業工作本來就不是乾淨的 API。

越高價值、越專業、越有風險的流程，就越多例外、權限、責任和歷史包袱。金融、保險、醫療、製造、政府，不可能只靠一個 self-serve 按鈕完成部署。

餐廳也不會因為買了新的 POS，就自動解決尖峰時段的出餐混亂。有人還是要站在現場，看單子怎麼貼、誰先煮麵、誰補滷蛋、誰回外送訊息，然後把規則改掉。

所以 FDE 可能同時是補丁，也是新常態。

說它是補丁，是因為它暴露出 AI 產品還沒辦法完全自助落地。模型公司需要用人力服務，把還不夠標準化的部署問題包起來。

說它是新常態，是因為只有進入現場，模型公司才知道哪些流程真的有價值，哪些錯誤會反覆發生，哪些人工修正可以轉成 eval，哪些部署模式最後能沉澱成平台能力。

這不是「AI 公司變成顧問公司」那麼簡單。

比較準確地說，是 API 正被放進一個更完整的企業部署包裡：模型、agent runtime、connector、MCP、資料權限、治理、FDE、系統整合，以及持續改進的 eval loop。

最後爭奪的不是聊天框，是工作流的定義權

當 AI 真的進入企業工作流，它就不只是工具。

它會開始影響：哪張 ticket 先處理，哪個客戶被視為高風險，哪個合約條款被標成問題，哪個員工可以覆寫模型判斷，覆寫紀錄會不會進入下一版 eval。

以前導入軟體，很多時候是把既有流程搬進系統。

現在導入 agent，可能是重新決定流程本身。

客服單進來，誰先看？AI 能不能先分類？分類錯了誰修？修正會不會留下來？下次同樣客訴出現，系統會不會自動升級？哪些客戶不能讓 AI 自動回覆？哪些內容一定要主管批准？

這些不是單純的技術設定。

這是在重新分配工作裡的權力：誰能定義流程，誰能覆寫判斷，誰擁有修正紀錄，誰承擔錯誤後果。

所以，下一階段的企業 AI，真正值得問的不是「AI 會不會取代 SaaS」，也不是「每家公司會不會變成 AI 公司」。

這些說法都太大，也太空。

更具體的問題是：

哪些工作流會先被 agent 化？

哪些流程必須保留人類判斷？

哪些企業會因為 AI 變得更自主，哪些企業反而會更依賴外部 AI 基礎設施？

當模型公司、FDE、顧問、SI、SaaS 和企業內部團隊一起重寫工作流時，誰會掌握新的流程定義權？

回到那顆不見的滷蛋。

如果你只把 AI 放在前台，它會幫你把道歉訊息寫得很漂亮：「很抱歉造成您的不便，我們會加強內部訓練。」

但如果你真的想讓下週五晚上不要再少放滷蛋，你要改的不是道歉文案。

你要改點餐單、庫存、貼紙、出餐檢查、退單紀錄、尖峰時段的分工，還有出錯之後怎麼回頭修流程。

企業 AI 也是一樣。

真正關鍵的不是 AI 能不能講得像人。

而是它能不能進入一條真實工作流，知道自己該看什麼、能做什麼、哪一步要停下來問人、做錯後又怎麼把錯誤變成下一次改進。

上一個時代，我們說每家公司都是軟體公司。

AI agent 時代，下一句可能是：

每個高價值工作流，都會變成一個 agent system。

但最後決定價值的，不是誰擁有最漂亮的聊天框。

而是誰能設計那條出餐線，治理那條出餐線，並且在滷蛋又少一顆的時候，讓整個系統真的變得更好。