當 AI 坐上駕駛座:AI 客服新創 Sierra 估值爆衝關鍵
Sierra 由前 Salesforce 執行長 Bret Taylor 與前 Google 副總裁 Clay Bavor 共同創立,創下 21 個月內達成 1 億美元 ARR、估值衝破百億美元的驚人發展。它不做會聊天的 AI,而是打造能「執行操作」的企業級 Agent OS,讓金融機構的客服從「回答問題」進化到「解決問題」。
Sierra 為什麼崛起?一分鐘速讀
市場痛點:企業砸大錢導入 AI 客服,結果發現它只會回答 FAQ。一旦客戶要求掛失卡片、處理爭議、申請貸款,AI 就卡住,90% 的問題還是得轉接真人,AI 淪為昂貴的「自動語音選單」。
破局創新:Sierra 打造 Agent OS,用「模型星座」架構搭配多層監督機制,讓 AI 能在合規框架內自主執行操作。同時首創「成果導向定價」,沒解決問題不收錢。
資本驗證:成立 21 個月 ARR 突破 1 億美元,估值從種子輪的 10 億美元飆升至 100 億美元,累計融資 6.35 億美元,投資人包括 Sequoia、Benchmark、Greenoaks。
一句話結論:Sierra 的目標是定義「Actionable AI」的企業標準,讓每一家公司的 AI 都能「說到做到」。
那通永遠轉不完的客服電話
週五下午,Kevin 發現信用卡被盜刷了三筆。
他打給銀行客服,電話那頭傳來熟悉的 AI 語音:「請問有什麼可以幫您的?」
Kevin 說:「我的卡片被盜刷,我要掛失。」
AI 回覆:「好的,我來幫您查詢最近的交易記錄。您的帳戶在今天下午有三筆消費,分別是⋯⋯」
Kevin 打斷它:「我知道,那三筆就是盜刷的。我要掛失卡片。」
AI 頓了一下:「關於卡片掛失,我需要為您轉接專人服務。目前等待時間約 40 分鐘,請問您要繼續等待嗎?」
這個場景每天在全球上演數百萬次。AI 可以查餘額、解釋政策條款、甚至推薦信用卡優惠,但一旦客戶說出「我要掛失」、「我要爭議這筆扣款」、「我要申請貸款」,它就卡住了。AI 會說話,但不會做事。
為什麼 AI 客服「說到做不到」?
問題的根源在於大型語言模型(LLM)的本質。當你問 ChatGPT「1+1 等於多少」,它並沒有在做數學運算,而是在預測「根據訓練資料,這個問題後面最可能接什麼文字」。這種「機率性」的運作方式,讓 LLM 在開放式對話中表現出色,卻在需要精確執行的場景中充滿風險。
然而,金融交易要求 100% 的確定性,當客戶說「幫我轉帳到這個帳號」,系統不能有 0.1% 的機率轉錯金額或轉錯帳號;傳統 LLM 卻無法提供這種保證,因為它的每一次輸出都是機率分佈的結果,而非邏輯推導的必然,這導致了三個實務上的困境:
AI 無法執行操作:多數 AI 客服的權限僅限於「讀取」資料,沒有「寫入」的能力。它可以告訴你帳戶餘額,但不能幫你轉帳;它可以解釋信用卡權益,但不能幫你掛失。因為一旦讓 AI 動手,就必須承擔它犯錯的後果。
幻覺風險難以控制:LLM 偶爾會「創造」不存在的資訊,在客服場景中,這可能意味著告訴客戶錯誤的利率、不存在的優惠、或違反法規的建議。對銀行來說,一次的幻覺就可能引發一場合規災難。
跨渠道的上下文會斷裂:客戶在網頁聊天室問了一半,轉接電話後要從頭講起 —— 因為 AI 沒有「記憶」,每次對話都是全新的開始。
這些限制讓企業陷入兩難,雖然導入 AI 可以降低客服成本,但 AI 只能處理最簡單的查詢,複雜問題還是得靠真人。結果是,AI 變成了一個昂貴的「分流器」,而非真正的生產力。有鑑於此,Sierra 的兩位創辦人 Bret Taylor 和 Clay Bavor 在 2023 年開始思考一個問題:有沒有可能在機率性的 LLM 之上,建立一層「確定性」的執行邏輯,讓 AI 既能流暢對話,又能安全地執行操作?為了找出解方,Sierra 應運而生。
矽谷皇室級的創業組合
要理解 Sierra 為什麼能在 21 個月內達成 1 億美元 ARR,必須先看看它的創辦團隊,兩位創辦人的履歷儼然是矽谷過去 20 年的縮影。
(一)Bret Taylor:從 Google Maps 到 OpenAI 董事會
Bret Taylor 在 2003 年加入 Google,參與創建了 Google Maps。2007 年,他離開 Google ,並創辦社交聚合平臺 FriendFeed,平臺在兩年後被 Facebook 收購。在 Facebook 工作期間,Taylor 的團隊創造了「讚」按鈕,這個功能後來成為社群媒體的標準配備。
2012 年,Taylor 創辦了文件協作平臺 Quip,而 Quip 於 2016 年被 Salesforce 以 7.5 億美元收購,Taylor 也隨之加入 Salesforce,一路做到 Co-CEO 的位置。在 Salesforce 的經歷,讓他深刻理解企業如何管理客戶關係,以及 CRM 系統在實務上的痛點。
2025 年,Taylor 出任 OpenAI 董事會主席,成為 AI 產業最具影響力的人物之一。
(二)Clay Bavor:Google 十八年的產品老將
Clay Bavor 在 Google 的資歷更長。他從 2005 年加入,曾任 Gmail、Google Drive 等核心產品的負責人,後期領導 Google Labs 以及 VR/AR 部門。18 年的 Google 經歷,讓他累積了大規模消費產品的開發經驗,以及對使用者體驗的深刻理解。
Taylor 和 Bavor 的緣分可以追溯到 2005 年,兩人都參加了 Google 的 APM(Associate Product Manager)計畫,這個計畫培養出了許多後來的矽谷高管。將近 20 年後,兩人在 2023 年決定一起創業,目標是打造 AI 時代的企業軟體平臺。
(三)融資火箭:從 10 億到 100 億
Sierra 的融資速度反映了市場對這個團隊的信心。2024 年 2 月,公司完成 1.1 億美元的種子輪融資,由 Sequoia Capital 和 Benchmark 共同領投,估值約 10 億美元。同年 10 月,Greenoaks Capital 領投 1.75 億美元的 A 輪,估值升至 45 億美元。
2025 年 9 月,Sierra 宣布完成 3.5 億美元的 B 輪融資,估值達到 100 億美元。此時距離公司成立僅 18 個月,ARR 已突破 1 億美元。以收入的 100 倍估值計算,投資人顯然把 Sierra 視為下一個企業軟體巨頭,而非普通的 SaaS 公司。
截至 2026 年初,Sierra 累計融資 6.35 億美元,在舊金山、紐約、倫敦、亞特蘭大均設有據點,客戶名單包括 SoFi、Brex、Ramp、Chime、Rocket Mortgage 等金融科技領導者,以及多家 Fortune 500 企業。
Taylor 在多次公開訪談中強調,Sierra 的目標是成為 AI 時代的「作業系統」。他認為,AI Agent 將會是繼 Web 和 Mobile 之後的第三波平臺革命,而 Sierra 要做的,是定義這個新平臺的執行標準。
Agent OS:讓 AI 從「說」到「做」
Sierra 的核心產品為 Agent OS,這個名字透露了它的野心 —— 它要成為 AI Agent 的「作業系統」,就像 iOS 之於 iPhone、Windows 之於 PC。Agent OS 解決的核心問題是:如何讓本質上「機率性」的 LLM,在企業環境中「確定性」地執行任務?Sierra 的答案是一套四層架構。
第一層:模型星座(Constellation of Models)
多數 AI 應用是依賴單一的大型語言模型,例如 GPT-4 或 Claude。而 Sierra 採取了不同的策略,它同時使用超過 15 個不同的 AI 模型,根據任務特性自動切換到最適合的模型。
這種模型星座架構的邏輯是認為「沒有一個模型能同時滿足所有需求」。簡單的查詢(如:餘額是多少?)需要的是低延遲、用小型模型即可快速回應,複雜的決策(如:該選擇哪種房貸方案?)需要的是深度推理、必須調用更強大的模型;語音對話對延遲極度敏感,文字對話則可以容忍較長的思考時間。
模型星座還提供了內建的冗餘機制,當某個模型供應商出現故障或延遲增加,Sierra 的系統會自動切換到其他可用的模型,確保服務不中斷。對於金融機構來說,這種可靠性至關重要。
第二層:監督者模型(Supervisor Models)
這是 Sierra 最獨特的設計,每一個對外服務的 AI Agent 背後,都有多個「隱藏」的監督者 Agent 同步運作,負責即時審查主 Agent 的行為。
監督者的工作分為幾個面向:
在輸入端:監督者會檢測並過濾惡意攻擊,例如 Prompt Injection、詐欺訊息、或試圖讓 AI 說出不當內容的釣魚問題。Sierra 的團隊持續更新這些監測模型,以應對不斷演進的攻擊手法。
在輸出端:監督者會審核主 Agent 的每一個回覆,檢查是否符合企業政策、是否包含幻覺、是否有合規風險。如果發現問題,監督者可以攔截並修改回覆,或者將對話升級給真人客服。
Sierra 將指令分為不同的風險等級,這種分級制度讓 AI 在安全與體驗之間取得平衡:對於惡意攻擊或違法請求,AI 必須零容忍,即使語氣生硬也沒關係;對於一般的品牌規範或服務政策,AI 可以保持彈性,只要符合精神即可。
Bret Taylor 曾用一個比喻解釋這個設計:「AI 的許多問題,解方往往是更多 AI。」聽起來有點弔詭,但他的意思是,與其期待單一模型完美無缺,不如建立一個系統,讓多個 AI 角色互相校正。
第三層:確定性執行邏輯
Agent OS 的 Agent SDK 允許開發者用 TypeScript 編寫客戶服務流程,這意味著 AI 與客戶對話時可以保持自然語言的流暢,但一旦涉及具體操作(如轉帳、掛失、額度調整),系統會切換到預先定義的程式邏輯。
舉例來說,當客戶說「幫我掛失信用卡」,AI 會先用自然語言確認客戶身份、詢問掛失原因。但實際執行掛失的步驟,是由一段固定的程式碼完成,包括呼叫哪個 API、傳遞哪些參數、如何處理例外狀況等等。這段程式碼可以版本控管、測試、審計,就像傳統軟體一樣。
Ramp 的工程主管描述這種模式:「Sierra 的 Agent SDK 讓我們用工程標準打造 AI 流程,每一個變更都有 code review、每一個功能都有測試覆蓋,AI 的行為變得可預測、可追蹤。」
第四層:記憶與跨管道整合
2025 年發布的 Agent OS 2.0 加入了「代理人數據平台」,讓 AI Agent 具備長效記憶。Agent Data Platform 會記錄客戶的對話歷史、個人偏好、交易記錄,讓 AI 在任何管道都能接續之前的脈絡。在實務上,這意味著企業只需要建立一次 Agent 邏輯,就可以部署到語音電話、網頁聊天、SMS、WhatsApp、Email 等多個管道。AI 在每個渠道的回應方式會根據媒介特性調整(語音要簡短、文字可以詳細),但底層的業務邏輯是一致的。
綜合以上,四層架構加總起來,讓 Sierra 的 AI Agent 達到了 Taylor 所說的「工業級」水準 —— 既有 LLM 的對話能力,又有傳統軟體的可控性。
金融實戰部署案例
技術架構再精妙,最終還是要看實際成效。Sierra 在金融科技領域已經累積了多個大規模部署案例,數據相當亮眼。
案例一:Ramp
Ramp 是企業支出管理平臺的領導者,主要產品是企業信用卡和費用管理軟體。在導入 Sierra 之前,Ramp 曾嘗試自建 AI 助理來回答常見問題,但當業務需求擴展到多步驟流程時,自行維護的難度急劇上升。
轉向 Sierra 後,Ramp 的 AI Agent 可以執行一系列具體操作:對持卡用戶,AI 可以處理卡片鎖定、補發申請、交易失敗原因查詢、消費明細解釋、地址變更並觸發新卡寄送;對企業管理員,AI 可以批次發卡、彙整特定類別的交易紀錄、匯出報表。這些流程以前需要人工在多個系統之間切換操作,現在 AI 可以一站式完成。根據 Ramp 的數據,AI Agent 的案件自動解決率達到 90%。剩下 10% 需要人工介入的案件,通常是涉及複雜判斷或例外狀況的高價值問題。
Ramp 的營運負責人提到一個關鍵點:Sierra 平台內建了信任與安全機制,包括越權請求攔截、濫用監控、監督模型等。這讓 Ramp 的團隊可以專注於定義業務流程,而非從零處理風控挑戰。
|補充 馬克曾經介紹過 Ramp 喔,歡迎參考文章:https://www.markreadfintech.com/p/ramp
案例二:Chime
Chime 是美國最大的數位銀行之一,擁有數百萬用戶。對這種規模的平臺來說,客服反應速度將直接影響用戶留存率。
Chime 部署的 Sierra Agent 能夠 24 小時處理薪資提前發放查詢、帳戶存取權限、密碼重設、交易爭議等問題。根據官方數據,導入 Sierra 後,Chime 的案件解決率從 50% 提升至 70% 以上,超過三分之二的會員問題可以即時解決。這個提升幅度意味著大量原本需要排隊等待真人客服的用戶,現在可以在幾分鐘內完成需求。對 Chime 來說,這同時降低了客服成本和提升了用戶滿意度。
|補充 馬克曾經介紹過 Chime 喔,歡迎參考文章:https://www.markreadfintech.com/p/chime
案例三:Brex
Brex 是 Ramp 的主要競爭對手,同樣提供企業信用卡和財務管理服務。2025 年,Brex 宣布全面打造「AI 原生」的營運架構,讓 AI 參與每一項產品和流程:
客戶服務:Brex 的 Sierra Agent(稱為 Brex Assistant)上線六個月後,客戶獲得回應的速度加快了 90%,每年為客戶節省超過 15,000 小時的等待時間
爭議款項處理:傳統的爭議處理需要客戶提供書面說明、上傳證明文件、等待人工審核。Brex 的 AI Agent 可以引導客戶完成文件上傳、自動彙總爭議理由、預測可能結果、並草擬解決方案供人工審核。
交易審查和核准:超過一半的申請或交易異常由 AI 初步審核,符合明確標準的案件可以即時批准。這讓 AI 的角色從客服延伸到了風控和合規。
|補充 馬克曾經介紹過 Brex 喔,歡迎參考文章:https://www.markreadfintech.com/p/brex
案例四:Rocket Mortgage
房貸再融資是一個複雜的銷售場景,涉及利率計算、信用評分驗證、長期財務規劃諮詢,傳統的自動化工具難以勝任。Rocket Mortgage 是美國最大的房貸機構之一,根據公開資料,與 Sierra Agent 互動的潛在客戶,完成交易的可能性是傳統客服模式的三倍。
這個數據說明了一件事:AI Agent 在處理複雜金融產品銷售時,可以展現比人類客服更穩定的專業度和勸服力。AI 不會疲倦、不會情緒波動、不會忘記提及重要的產品特點。對於需要大量解釋和教育的產品,這是顯著的優勢。
商業模式特色
(一)成果導向定價
傳統企業軟體按授權數或用量收費,無論軟體是否真的解決了問題,客戶都要付錢。而 Sierra 採取了不同的策略,也就是成果導向定價。
具體做法是,Sierra 會與客戶預先定義「成功解決」的標準,例如成功更新了客戶的信用卡寄送地址算一次、完整處理了一筆交易爭議且未引發後續投訴算一次、引導客戶完成房貸再融資申請算一次等等。只有 AI 真正完成了這些任務,Sierra 才會收費。
這種模式對客戶的吸引力顯而易見,即支出與成效直接掛鉤,不用擔心買了軟體卻用不上。對 Sierra 來說,這種模式則創造了強烈的激勵,讓公司必須持續優化 Agent 的解決率,因為解決率越高,收入越高;當然,這種模式也有門檻。Sierra 的平臺許可費通常是六位數美元的年度起始費用、專業服務費(涉及系統對接和客製化)可能高達 5 萬至 20 萬美元。業界估計,Sierra 的年度合約通常從 15 萬美元起跳,目標客群是 Fortune 1000 等大型企業。
(二)競爭定位
在 AI 客服市場,Sierra 選擇了一條獨特的路線。相較於 Salesforce 的 Agentforce(內嵌於 Salesforce 生態系的 AI 功能),Sierra 採取「模型不可知論」的策略,作為獨立的 Agent OS 橫跨於多個系統之上,企業不需要被綁定在特定的 CRM 或雲端供應商。
相較於 Intercom Fin 或 Ringg AI 等新興平臺(強調低成本、快速部署),Sierra 走的是重型基礎設施路線。新興平臺可能在幾天內上線,而 Sierra 的部署週期通常是 3 到 6 個月;新興平臺多依賴單一模型,而 Sierra 使用 15 個以上的模型組合;在語音延遲方面,Sierra 目前約 700 毫秒至 1 秒,落後於部分專注語音的對手(如 Ringg AI 的 400 毫秒以下),但在推理準確度上具有優勢。
綜合以上,Sierra 的護城河在於創始團隊的企業基因、Fortune 1000 客戶的背書效應、以及在高度監管產業(金融、醫療)累積的合規經驗,這些優勢讓後進者難以在短期內複製。
馬克碎念
過去幾年,市場談論 AI 的方式是「Co-pilot」,副駕駛。AI 提供建議,人類做最終決定。這個模式預設了 AI 的能力邊界:它可以輔助,但不能執行。人類依然是審核者、把關者、負責人。
Sierra 代表的是下一個階段。AI 不只建議,還要執行。它不只告訴你「你可以掛失信用卡」,而是直接幫你掛失。它不只解釋房貸方案的差異,而是引導你完成申請。當 AI 能夠「做到」,人類的角色就從「審核者」變成了「定義者」。我們定義 AI 可以做什麼、在什麼條件下做、做到什麼程度,然後讓它去執行。
這個轉變的影響是深遠的。如果「成果導向定價」成為行業標準,所有 AI 供應商都必須優化「真正的效果」,而非「Demo 效果」。過去賣企業軟體,可以靠華麗的簡報和功能清單拿下合約,反正客戶買了之後用不用是他的事。成果導向的邏輯則是:你說 AI 能解決問題,那就按解決的問題數量收費,解決不了就不用付錢。這會倒逼整個產業提升交付品質。
當然,Sierra 的模式也有明顯的侷限。15 萬美元的年度起跳價格,加上 3 到 6 個月的部署週期,意味著中小企業短期內難以採用。語音延遲的技術短板,在電話客服場景中可能影響體驗。「成功解決」的定義也存在灰色地帶,客戶和供應商對於什麼算「解決」可能有不同認知,這會增加合約談判的複雜度。
對臺灣金融業來說,Sierra 的案例提供了一個參照點。目前臺灣銀行的客服系統仍以 IVR 加真人為主,AI 應用多停留在 FAQ 問答或簡單的意圖分類。Sierra 證明了 AI 可以進入「執行層」,直接操作後端系統完成交易。前提是解決兩個問題:合規框架(AI 執行金融操作的法律責任歸屬)和系統整合(與核心銀行系統的 API 對接)。
如果臺灣能發展出本地化的 Agent OS 方案,或者有金融機構願意投資導入 Sierra 等級的解決方案,客戶體驗和營運效率都有機會大幅躍進。當然,這需要時間,也需要監理機關的配合。
最後回到 Sierra 本身。Bret Taylor 說過,AI Agent 將會是「自行動網頁以來最大的技術變革」。這句話是否成真,還需要市場驗證。但 Sierra 在 21 個月內達成 1 億美元 ARR 的事實說明,至少在企業客服這個場景,市場已經準備好為「能做事的 AI」買單。
AI 會聊天不稀奇,AI 會做事才值錢。下一代企業軟體的競爭,不在於誰更會「說」,而在於誰更敢「做」。









