FinLLM 專案:16 家金融機構共建台灣金融 AI 主權,7,000 萬預算夠嗎?
中信金領頭、16 家金融機構聯手啟動 FinLLM 專案,預算 4,000 萬到 7,000 萬新台幣。將深度拆解金融大語言模型的戰略意義、預算爭議與三大技術魔王,並對照新加坡、英國 Aveni、UAE、日本與歐盟的不同走法。
一分鐘速讀
這次啟動了什麼:金管會指導、中信金控召集,16 家銀行、金控、郵政與純網銀聯手打造金融專屬 LLM。預算 4,000–7,000 萬新台幣,預計 2026 年底完成原型,2027 Q1 推出 AI Agent。
為什麼要共建:通用模型有「語境斷層」、合規風險、成本黑洞。個別金控各自研發已被證明是死胡同。
三大魔王:資料孤島(聯邦學習要解)、模型幻覺(RAG 架構要扛)、第三方供應商依賴(黑盒子與影子 AI)。
真實爭議:預算規模、後續維運、商業模式都是問號。新加坡、UAE、英國、日本、歐盟各有不同走法。
為什麼台灣需要自己的金融大語言模型?三個結構性推手
通用模型的「語境斷層」:聽不懂的不是中文,是金融
試想一個情境:一位台灣銀行的理專正在向 70 歲客戶介紹境外結構型商品,他想用 ChatGPT 快速生成一份符合「高齡客戶適合度審查」要求的風險揭露說明。GPT-5 寫出的中文流暢漂亮,但裡頭引用的是美國 SEC 規範。模型提到的「適合度」概念來自 FINRA Rule 2111,根本對不上金管會「境外結構型商品管理規則」第 27 條。
問題不在中文好不好,在於通用模型根本沒看過台灣金管會的函釋、銀行公會的自律規範、各家金控內部的 SOP。它們的訓練語料以英文為主、中文部分以簡體中文為大宗。台灣特有的金融術語、監理框架、商品分類,在它們的世界裡幾乎是空白。
這個落差在客服聊天場景可能只是讓人尷尬,但在金融業可能引發違規裁罰、消費者權益損害、甚至商品下架的後果。
「各自研發」的死胡同:當 AI 變成法說會 KPI
過去兩年,幾乎每一家金控都在法說會上強調「AI 戰略」。但仔細看,多數機構面對的是同一組難題:高昂的算力成本、零散的語料蒐集、看不到盡頭的資料授權程序,以及難以量化的法遵與資安風險。
每家自己扛這些成本,結果就是 16 家金控各自燒錢做出 16 個「不上不下」的實驗性專案。對話品質普遍不如 ChatGPT、上線後沒人敢真的用在客戶服務、產出的合規報告還要人工逐字檢查。
這個結果反映的是市場結構問題。台灣這種規模的市場,根本撐不起 16 條獨立的 AI 開發產線。
主權 AI 從口號變成國家戰略
2024 年起,輝達執行長黃仁勳在多個公開場合喊出「Sovereign AI」的概念,認為每個國家都應該擁有自己的人工智慧基礎設施。這個論述很快從產業口號變成國家戰略。
主權 AI 語料庫由數位發展部建置,FinLLM 計畫則已正式納入國發會主導的「AI 新十大建設推動方案」。國科會的 TAIDE 計畫也持續釋出新版本,最新的 Gemma-3-TAIDE-12b 模型已導入中期訓練技術。
金融業是這波浪潮中需求最迫切的產業。涉及國民財富、敏感個資、嚴格監理的時候,把資料丟給海外伺服器訓練的模型回答,這個風險沒有金控老闆扛得起。
FinLLM 專案規格全解析:16 家機構、7,000 萬預算、兩階段時程
16 家機構:從中信到中華郵政的全產業整合
這個專案的參與陣容很值得仔細看。
大型民營金控派出中信、國泰、富邦、台新新光、永豐、凱基六家。公股與泛公股體系拉進臺銀、土銀、合庫、兆豐、第一、華南、彰銀、臺企銀八家。剩下兩席分別由中華郵政與將來銀行填補,前者代表基層金融通路,後者代表純網銀路線。
研究與技術夥伴方面分工明確。金融研訓院負責產業知識整合,資策會處理底層運算,政大金融科技研究中心負責評測標準,APMIC(亞太智慧機器)則扛起模型微調與蒸餾的工程實作。
這個組合幾乎涵蓋了台灣金融體系的所有核心板塊。從規模來看,比新加坡 MAS 的 Project MindForge 第二階段(24 家機構)少一些,但相對於台灣金融市場的整體規模,已經是極為集中的產業共識。
4,000 萬到 7,000 萬:預算、時程與兩階段路徑
預算規模落在新台幣 4,000 萬到 7,000 萬之間,換算約 130 萬到 230 萬美元。時程方面,2026 年 5 月開始實質訓練,2026 年第三季產出原型,2026 年底完成最終版本,2027 年第一季推出 FinLLM AI Agent。
專案分兩階段推進。第一階段火力集中於銀行業務的核心痛點,例如授信案件初步風險評估、客戶財務狀況分析、授信報告自動整理。第二階段才會擴展到保險與證券領域。
這種分階段策略相對務實。銀行業的 SOP 標準化程度最高、語料最完整、合規邊界最清楚。先在銀行業練兵,等模型能力成熟後再進攻保險與證券,可以避免一開始就陷入跨業態混合訓練的混亂。
共建、共治、共益
這個專案有一個值得關注的戰略選擇:奠基於數位發展部正在建置的「主權 AI 語料庫」。FinLLM 沒有從零開始。它站在國家級語料基礎建設之上,再加入金融業特有的法規、SOP、商品說明書等垂直語料。
另一個值得注意的決定是「明確排除中系平台」。這不是政治表態,而是國家資安戰略的一部分。台灣金融業的客戶資料一旦進入中國的開源模型訓練流程,後續的合規風險與地緣政治風險都會難以控制。
至於第三方維運機制,APMIC 的 PrivModel 企業微調蒸餾技術,搭配 NVIDIA NeMo 框架,目標是用最小運算資源訓練出高精度的模型。這套組合的好處在於,金融業者的內部知識不會外洩到外部訓練流程,後續的迭代、維護、授權都能由聯盟內部掌控。
餵了什麼料:金管會函釋、SOP、商品說明書
FinLLM 真正的核心資產不是模型本身,是訓練語料。
聯盟成員會合法地把核心金融資料餵入模型,內容涵蓋金管會函釋、銀行公會自律規範、各銀行 SOP,以及商品說明書與風險揭露檔。KYC 與 AML 的流程文件也在訓練語料的範圍之內。
這些資料的特點是高度專業、高度結構化,而且永遠不會出現在 OpenAI 或 Anthropic 的訓練資料集裡。一個能夠準確引用「境外結構型商品管理規則第 27 條」的金融 AI,對通用模型來說是不可能的任務,但對 FinLLM 來說是基本能力。
FinLLM 預算只有 7,000 萬夠嗎?冰山一角的爭議與誤判
介紹完專案規格之後,必須處理一個無法迴避的質疑:7,000 萬到底夠不夠?
不少評論者直白地說,這只是金管會交功課、金控應付差事。預算規模放在國際座標上根本是零頭。這個批評打到了專案的要害,值得仔細拆解。
先看幾個對照數字:
這個質疑有三個合理之處。
首先,TAIDE 的歷史先例已經給了警訊。中研院黃瀚萱在 iThome 的專訪中直白指出,DeepSeek 團隊在最終模型釋出前可能已經訓練數十次到上百次。TAIDE 因為算力資源不足,每個版本只能試驗兩三次,很難從更多次的試驗中找出最好的效果。連政府主導、預算更高的 TAIDE 都仍在跟維運經費搏鬥,FinLLM 也很難讓人特別樂觀。
第二,金控老闆的「最低必要參與」邏輯確實存在。董座要的是 KPI、是金管會的關愛眼神、是法說會上能講的故事。每家分攤幾百萬就能列在新聞稿上,遠比自己花幾十億搞 AI 部門划算。這是金融業面對政策性專案常見的策略性參與。
第三,平攤後每家投入確實偏低。7,000 萬除以 16 家機構,平均每家不到 440 萬新台幣。相對於這些金控動輒幾十億的年度 IT 預算,這個數字在內部簽核流程上連董事會都不用上。
但這個批評也有兩個誤判點需要釐清。
第一個誤判:拿「從頭訓練」的成本當基準是錯的座標系。FinLLM 走的是「微調加蒸餾」路線,奠基於開源基礎模型(如 Llama 系列)和數發部的主權語料庫之上。這跟 GPT-4 從零訓練的成本結構,差距可達 100 到 1000 倍。
真正應該對照的是同樣走微調路線的同行。Aveni FinLLM 也是用基礎模型加上英國金融語料微調而成。1,100 萬英鎊不是用來從頭訓練模型,是用來做領域微調與商業化。跟 Aveni 比,台灣這次預算還是少了 6 倍多,但不是少了 40 倍。這個差距比較公道。
第二個誤判:忽略了主權語料才是這次的真正資產。從金管會函釋到各銀行 SOP,再到商品說明書與風險揭露檔,這些金融業內部知識是任何外國模型、任何公開資料都拿不到的。FinLLM 的價值不在 GPU 燒了多少,而在 16 家機構願不願意把這些「金庫鑰匙」放到共建語料池裡。
除了預算之外,FinLLM 還面臨四個結構性風險,這些才是更值得擔心的部分。
第一,後續維運預算是否到位。做出原型不難,難的是 2026 年底完成後,誰繼續餵新資料、誰負責每季迭代、誰扛伺服器電費。
第二,商業模式還待釐清。模型 IP 歸屬、非聯盟成員的接入權限、金管會是否強制要求業者導入,這些問題目前都沒有公開答案。
第三,人才留任的挑戰。台灣 AI 工程師被輝達、超微、台積電 AI 部門挖角的速度,遠比 16 家金控聯盟能給的薪水快。
第四,監理機構是否過早鬆手。如果金管會在 2027 年覺得「我們已經有 FinLLM 了」就放鬆對主權 AI 的整體資源投入,這才是最大的風險。
主權 AI 的真實考驗,永遠不在啟動記者會那天,而在新聞稿熱度散去之後。
金融大語言模型的三大技術挑戰:聯邦學習、模型幻覺、第三方依賴
資料孤島與個資法的死結
金融機構彼此之間有兩個結構性矛盾:他們是激烈的競爭者,又必須遵守極度嚴格的個資法與銀行保密義務。這意味著聯盟成員之間不可能直接共享客戶的原始交易紀錄、徵信資料、行為數據。
聯邦學習(Federated Learning)是目前最受看好的解方。在這個架構下,各機構的原始數據永遠不會離開本地伺服器。中央伺服器把初始模型下發給各機構,各機構用本地敏感數據訓練後,只把「模型參數的更新」加密回傳。中央伺服器聚合這些更新後形成全局模型,再分配回去。
IBM 研究團隊曾在美英政府主辦的隱私增強技術(PETs)挑戰賽中,端出一套混合方案。這套方案結合聯邦學習、同態加密與差分隱私,協助跨國銀行在不暴露客戶身分的情況下,識別跨機構洗錢的異常交易圖譜。這個案例證明了聯邦學習在金融場景的實戰價值。
至於更前沿的 PriFFT 等密碼學機制,則進一步處理了大語言模型聯邦微調過程中的參數洩漏風險,把通訊與運算成本降低 70% 以上。台灣 FinLLM 專案是否會採用這類架構,目前還沒公開資訊。
模型幻覺:金融業的致命傷
「模型幻覺」(Hallucination)指的是大語言模型產出語法流暢但內容虛構的資訊。這在客服聊天場景可能只是讓人尷尬,但在金融業可能導致編造的財務數字、錯誤的投資建議、違規的授信決策。對金融機構來說,這不是體驗問題,是合規與聲譽的問題。
業界目前的解法是「多層次防禦架構」。第一層是進階提示工程(Prompt Engineering),透過少樣本學習在輸入階段就提供標準範例,限制模型偏離既定任務。第二層是檢索增強生成(Retrieval-Augmented Generation, RAG)。系統在生成回答之前,會先從銀行內部嚴格控管的知識庫、最新法規資料庫中檢索相關文獻。模型只能基於檢索到的內容回答,缺乏依據時直接拒答。第三層是領域微調與人機協作,由金融從業人員對關鍵決策進行最終審查。
RAG 是其中最關鍵的一環。它讓模型的「記憶」從靜態的訓練資料,轉變為動態的知識庫查詢。這解決了一個關鍵問題:銀行內部的最新規範可能每週更新,模型不可能每週重新訓練,但可以每週更新知識庫。
第三方供應商依賴的黑盒子
即使共建模式能解決資料孤島與幻覺問題,第三方供應商依賴仍然是金融業繞不開的結構性風險。
BCG 與 MIT Sloan 的聯合研究指出,78% 的組織依賴第三方 AI 工具,而 55% 的 AI 失敗案例來自第三方工具。這個比例在金融業特別關鍵,任何一次失敗都可能引發監理裁罰或客戶資料外洩。
更隱蔽的問題是「影子 AI」(Shadow AI)。員工為了追求工作效率,可能在未經資安與法遵審核的情況下,私自把客戶資料丟進 ChatGPT、Claude 或 Gemini 處理。這種行為缺乏集中管控,也沒有審計追蹤,是金融機構合規體系的最大漏洞之一。
FinLLM 專案能否提供一個合規的內部替代品,讓員工不再需要偷偷使用外部 AI,這是另一個值得觀察的指標。
金融主權 AI 國際比較:新加坡、UAE、英國 Aveni、日本、歐盟
不同國家面對同樣的金融主權 AI 課題,走出了截然不同的路。
新加坡:監理框架與評測標準的標竿
新加坡的策略最值得台灣參考。MAS 的 Project MindForge 第二階段已擴展到 24 家頂尖金融與資產管理機構,包含星展、華僑、大華、渣打、貝萊德、瑞士寶盛等。這個專案最重要的成果,是發布了一份詳盡的《AI 風險管理營運手冊》,把治理嚴密劃分為四大範疇:範疇與監督、AI 風險管理、AI 生命週期管理、賦能機制。
另一邊的 IMDA 推出 Project Moonshot。這是一套五級評分的紅隊演練工具,專門用來在模型上線前評估越獄防護、內容毒性、偏見生成等風險,並與 ISO/IEC 42001 國際標準對接。
新加坡的厲害之處在於,他們不只做模型,還做標準。當 24 家機構都按照同一份手冊管理 AI 風險,整個產業的合規語言就會統一。台灣 FinLLM 專案目前在共通評測標準上的著墨還相對有限,這是值得補強的方向。
UAE:基礎設施主權優先
相較於新加坡的軟性框架,UAE 走的是硬底子路線。CBUAE 與 Core42 合作推出了全球首個「主權金融雲服務基礎設施」(SFCSI),運作於高度安全、集中且物理隔離的基礎設施之上,不依賴公有雲。
這套基礎設施整合了先進 AI 與即時數據分析能力,為該國所有持照金融機構提供從日常營運到風險分析的自動化服務。底層算力來自 G42 集團的 Condor Galaxy 超級電腦,模型層則由阿拉伯語的 Jais 模型提供。
UAE 的邏輯是:與其依賴別人的雲,不如自己蓋一個從算力、模型到應用全自主的金融雲堆疊。這個路線的代價當然是極高的資本投入,但也展示了一個資源充足的國家可以走多遠。
英國 Aveni:和台灣最像的領域模型路線
英國的 Aveni FinLLM 是和台灣 FinLLM 最相似的案例。Aveni 是一家金融科技新創,在 Lloyds Banking Group 與 Nationwide 的戰略投資下(A 輪 1,100 萬英鎊),開發出專為英國金融服務業量身打造的領域模型。
Aveni 執行長有一句話特別值得引用:「金融服務業不需要能背誦莎士比亞的 AI 模型,它需要的是能提供透明度、信任,最重要的是正確性的 AI 模型。」這句話精準點出了領域模型的核心價值,重點不在通用能力的廣度,而在合規邊界內的準確度。
Aveni FinLLM 嚴格對齊英國 FCA 指引與歐盟 AI 法案,透過持續預訓練(CPT)與指令微調(SFT)提升準確性。這個案例對台灣最大的啟示是:領域模型不一定要做大,但一定要做準。
日本與歐盟:兩種不同的防禦邏輯
日本的金融 AI 戰略受到兩股力量驅動。一邊是人口老化導致的勞動力短缺,迫使金融機構大規模採用 AI 自動化(超過 90% 的受訪金融機構已導入 AI)。另一邊是嚴峻的資安威脅。當 Anthropic 推出可能被用於發現系統漏洞的「Mythos」模型時,日本財務大臣立刻召集三大銀行(MUFG、SMBC、Mizuho)與日本銀行召開緊急會議。同時,微軟對日本投資 100 億美元,在當地建設 AI 基礎設施。
歐盟則被《AI 法案》驅動。德國電信旗下 T-Systems 在慕尼黑提供搭載最高 10,000 顆 NVIDIA Blackwell GPU 的工業 AI 雲,支援 SOOFI(Sovereign Open Source Foundation Models)千億參數級模型。法國強制要求公部門、國防、金融機構使用的雲端服務必須符合「SecNumCloud 3.2」認證,並推動 Mistral AI 與 SAP 合作開發主權 ERP 系統。
兩個地區的共同點是:把 AI 主權拉高到國家安全層級來處理。
結論:台灣金融 AI 主權的下一步
第一,共建共治模式對中小規模經濟體是合理的解方,但前提是別停在原型階段。FinLLM 真正要回答的核心問題,是 2027 年之後誰來繼續餵養它。
第二,聯邦學習與 RAG 架構是必修課。這些技術直接決定了模型能不能在合規前提下使用真實的金融數據,也決定了模型輸出能不能被監理機構與客戶信任。預算多寡不是唯一指標,技術路線的選擇更關鍵。
第三,監理機構要從「靜態合規」轉向「共創監理」。新加坡 MAS 在 Project MindForge 中以共建者身分介入產業,這是台灣金管會值得思考的角色轉變。
這次 16 家金控聯手做 FinLLM,動機可能很複雜。有金管會的壓力、有產業的焦慮、有真實的需求,也有應付差事的成分。但無論動機如何,這個專案至少讓台灣金融業第一次認真思考一個問題:當全世界都在重新定義 AI 主權的時候,我們要把自己擺在哪個位置。
在 AI 時代,金融主權不是把資料鎖在境內就夠,而是要從演算法底層就懂得「在地的語言」。
FinLLM 常見問題
Q1:FinLLM 是什麼?
FinLLM(Financial Large Language Model)是台灣 16 家金融機構在金管會指導下,由中信金控召集啟動的金融專屬大語言模型專案。目標是建立一套能精準理解台灣金融法規、商品實務與本土語境的 AI 模型,協助銀行業處理授信評估、客戶分析、合規審查等任務。
Q2:FinLLM 預算多少?
專案總預算落在新台幣 4,000 萬到 7,000 萬之間,由 16 家金融機構共同分擔。換算約 130 萬到 230 萬美元。這個規模相較於英國 Aveni FinLLM 的 A 輪 1,100 萬英鎊(約 4.5 億新台幣)少了約 6 倍,但因採用「微調加蒸餾」路線而非從頭訓練,成本結構不可直接相比。
Q3:FinLLM 預計什麼時候上線?
2026 年 5 月開始實質訓練,2026 年第三季產出原型,2026 年底完成最終版本。2027 年第一季推出以 FinLLM 為基礎的 AI Agent。第一階段聚焦銀行業,第二階段才會擴展到保險與證券領域。
Q4:FinLLM 跟 TAIDE 有什麼不同?
TAIDE 是國科會主導、聚焦繁體中文通用任務的台灣主權模型,總投入經費約新台幣 2 至 3 億元。FinLLM 是金管會指導、由 16 家金融機構共建的金融垂直領域模型,奠基於數位發展部主權 AI 語料庫,再加入金融法規、銀行 SOP、商品說明書等垂直語料。兩者是不同層級的主權 AI 建設。
Q5:哪些金融機構參與了 FinLLM 專案?
16 家機構分成三組。大型民營金控有中信、國泰、富邦、台新新光、永豐、凱基六家。公股與泛公股體系有臺銀、土銀、合庫、兆豐、第一、華南、彰銀、臺企銀八家。剩下兩席是中華郵政與將來銀行。技術與研究夥伴包括金融研訓院、資策會、政大金融科技研究中心、亞太智能機器(APMIC),國網中心提供 GPU 算力。




