Harmonic:如何用「數學超級智能」終結 AI 幻覺
Harmonic探討以可驗證的數學推理取代機率猜測,讓 AI 的每一步推論都能被證明、檢查與重現。透過數學基礎與形式化方法,Harmonic 試圖打造更可靠、可控且值得信任的人工智慧,從根本解決 AI 幻覺問題。
Harmonic 為什麼崛起?ㄧ分鐘速讀
市場斷層:現有 AI 存在「機率性幻覺」,無法用於金融、航太等「零容錯」關鍵領域,導致企業面臨效率低下的「驗證瓶頸」。
技術護城河:Harmonic 首創「神經-符號」(Neuro-Symbolic) 架構,結合 LLM 直覺推理與 Lean 4 形式化驗證,確保程式碼與邏輯具備數學上的絕對正確性。
資本訊號:成立兩年內,以近 3 億美元融資、估值達 14.5 億美元,迅速成為獨角獸。獲得等頂級投資者青睞,視為高風險行業的未來信任基礎設施。
典範轉移:I 軸心正從「生成」轉向「驗證 」。Harmonic 讓 AI 從輔助角色進化為能獨立負責的驗證者,打破人類必須審核 AI 的效率天花板。
那個不敢按下 Enter 鍵的工程師
如果你是一位在紐約某高頻交易公司工作的資深演算法工程師。任務是改良一個新的交易策略,該策略將負責管理數十億美元的資金流動。
打開了最新的 AI 助手,輸入了複雜的數學參數與市場假設。AI 表現得非常完美,不到 30 秒就吐出了超過 500 行程式碼。它甚至還貼心地加上了註解,解釋了每一行邏輯。
但此刻,你的手指懸在 Enter 鍵上方,遲遲不敢按下去。
為什麼?因為 AI 是「機率性」的。它可能在第 450 行的一個極端邊界條件判斷中,產生了一個微小的邏輯幻覺。這個幻覺在單元測試中可能跑不出來,但一旦上線,遭遇市場黑天鵝事件時,可能導致公司在幾秒鐘內損失上億美元。
於是,你開始了一項痛苦的工作:逐行閱讀 AI 寫的代碼,手動推導它的邏輯。最終,你發現你花在「驗證」這段代碼的時間,比你自己從頭寫一遍還要長。
這就是當前 AI 產業面臨的最大隱憂,「驗證瓶頸」(Verification Bottleneck)。
雖然生成式 AI 讓內容生產的成本趨近於零,但驗證內容正確性的成本卻居高不下。對於寫詩、畫圖或寫行銷文案來說,這不是問題,但對於金融、航太、資安與晶片設計這些支撐現代文明運作的基石產業來說,這是致命的缺陷。
這正是 Harmonic 誕生的原因。這家估值 14.5 億美元的新創獨角獸,不打算做另一個會聊天、會畫畫的 AI。它的目標只有一個:打造一個「不知疲倦的數學家」,一個不僅能給出答案,還能給出「數學證明」的 AI,徹底終結幻覺,讓那位工程師敢於自信地按下 Enter 鍵。
源起與哲學 - 當 Robinhood 遇上數學真理
要理解 Harmonic 為什麼能吸引矽谷最聰明的資金,我們必須先看看它的兩位靈魂人物。這個組合本身就充滿了「理論」與「實踐」的張力。
從華爾街亂局到數學第一性原理
Vlad Tenev,他是廣為人知的 Robinhood 聯合創始人兼 CEO。但在成為金融科技大亨之前,Tenev 的身份是一位純粹的數學家。他擁有史丹佛大學的數學學士學位與 UCLA 的數學碩士學位。
在經營 Robinhood 的過程中,Tenev 見證了金融系統的極端脆弱性。2021 年的 GameStop 軋空事件,本質上就是一場關於清算邏輯、資金流動與規則邊界的混亂博弈。這讓他深刻體會到,現實世界的許多災難,源於系統邏輯的不嚴謹。他曾多次表示,數學訓練賦予了他「第一性原理」的思考方式,而現在,他希望將這種絕對的邏輯帶回 AI 領域。對他而言,Harmonic 不僅是商業版圖的擴張,更是一種向學術根源的回歸。
當 99.9% 還不夠好
另一位聯合創始人 Tudor Achim,則是 Harmonic 的技術掌舵者(CEO)。他曾是自動駕駛獨角獸 Helm.ai 的 CTO。
自動駕駛是一個對「錯誤」零容忍的行業。在自動駕駛領域,一個 AI 模型即便有 99.9% 的準確率,那剩下的 0.1% 錯誤在高速公路上就意味著致命車禍。Achim 在史丹佛攻讀計算機科學博士期間,就一直在思考如何讓 AI 具備「可驗證的正確性」。他意識到,僅靠餵食海量數據的深度學習就像是教 AI 依樣畫葫蘆,它學會了「像」人類一樣開車,但並沒有理解物理定律和交通規則的本質邏輯。
這兩人的結合,定調了 Harmonic 的企業基因:金融級的價值敏感度 + 工業級的安全標準 + 學術級的數學追求。
核心使命:定義「數學超級智能」
Harmonic 的願景並非追求 AGI(通用人工智慧),而是 MSI(Mathematical Superintelligence,數學超級智能)。
為什麼是數學?Harmonic 團隊認為,數學是現實世界的作業系統。物理學是數學在宇宙中的投影,經濟學是數學在資源分配上的投影,計算機科學則是數學在邏輯閘上的投影。
如果一個 AI 能夠掌握數學推理的本質,它就能順理成章地解決物理模擬、程式撰寫、金融風控等一切基於邏輯的難題。這與目前主流 LLM 試圖通過閱讀人類文本來模仿人類思維的路徑截然不同。Harmonic 認為,真理不是機率分佈,真理是二元的,透過一個證明要麼是對的,要麼是錯的,中間沒有模糊地帶。
拆解黑科技 - Aristotle 模型如何運作?
Harmonic 的旗艦模型名為 Aristotle(亞里斯多德)。這個名字本身就致敬了形式邏輯的鼻祖。要理解 Aristotle 為什麼強大,我們得先打開 LLM 的黑盒子,看看它與傳統模型有何不同。
現狀:LLM 的「機率性」原罪
目前的 ChatGPT 或 Claude,本質上是「預測下一個字」的機器。當你問它「123 * 456 等於多少?」時,它並不是在腦中進行乘法運算,而是在回憶訓練數據中這兩個數字出現時,後面通常接什麼數字。
這就是為什麼 LLM 會出現幻覺。它是在「模仿」推理,而不是在「進行」推理。對於寫作來說,這種模糊性是創造力的來源;但對於數學和應用程式來說,這是災難。
解法:神經-符號架構 (Neuro-Symbolic Architecture)
Harmonic 採用了一種混合架構,將 AI 拆解為兩個部分:「大腦」與「裁判」。
大腦(The Prover / LLM):
這是一個強大的大型語言模型,負責提出假設、直覺與解題策略。就像一位數學家在面對難題時,腦中會閃過「試試看用歸納法?」或「這看起來像是一個圖論問題」的靈感。這部分負責「生成」候選的證明步驟。裁判(The Verifier / Lean 4):
這是 Harmonic 的殺手鐧。Lean 4 是一種「互動式定理證明語言」(Interactive Theorem Prover)。你可以把它想像成一個超級嚴格的編譯器。LLM 生成的每一步推理,都必須被轉譯成 Lean 4 的程式碼,並提交給這個編譯器。
如果邏輯有漏洞,Lean 4 會直接報錯。
如果邏輯成立,Lean 4 會通過編譯。
運作流程:
當你問 Aristotle 一個問題時,它內部的運作是這樣的:
Step 1:大腦(LLM)生成一個自然的證明草稿。
Step 2:大腦嘗試將草稿轉化為 Lean 4 的形式化程式碼。
Step 3:裁判(Lean 4)檢查程式碼。如果報錯,裁判會把錯誤訊息丟回給大腦。
Step 4:大腦根據錯誤訊息修正邏輯,再次提交。
Step 5:這個過程在內部快速迭代(可能幾百次),直到找到一條完全通過驗證的路徑。
Output:系統輸出答案,並附上一個「機器可驗證」的數學證明。
這意味著,Aristotle 輸出的答案,自帶「防偽標籤」。使用者不需要相信 AI,只需要相信 Lean 4 這個數學編譯器。
數據飛輪:合成數據與自我博弈
訓練這樣一個模型最大的困難在於:網路上關於「形式化數學證明」的數據非常稀缺。GitHub 上的 Lean 程式碼庫比起 Python 來說簡直是九牛一毛。
Harmonic 的解決方案是「合成數據生成」。
因為 Aristotle 擁有 Lean 4 這個客觀的裁判,它可以進行「自我博弈」(Self-Play)。系統可以自動生成數百萬個數學命題,然後嘗試自己證明。
證明失敗 -> 丟棄。
證明成功 -> 加入訓練集。
這就像 AlphaGo 自己跟自己下棋一樣。Harmonic 不需要依賴昂貴的人類數學家來標註數據,它建立了一個能夠自我進化的數據飛輪。隨著模型變強,它能證明的題目越難,生成的數據質量就越高,形成正向循環。
實戰成績單:奧數金牌與程式碼驗證
這種架構不是紙上談兵:
IMO(國際數學奧林匹亞)金牌水平:在 2025 年的相關測試中,Aristotle 解決了 6 道題目中的 5 道,達到了人類頂尖奧數金牌選手的水準。而且它給出的不是模糊的文字,而是嚴謹的 Lean 程式碼。
VERINA 基準測試:在軟體工程領域的 VERINA 測試(要求生成程式碼並證明其符合規範)中,Aristotle 達到了 96.8% 的準確率,不僅能證明正確的程式碼,還能精準指出錯誤規範的邏輯漏洞,甚至給出「反例」。這碾壓了當時所有的通用 LLM。
商業版圖 - 誰需要「絕對真理」?
Harmonic 的估值之所以能衝上 14.5 億美元,並不是因為它能做數學題,而是因為這種「形式化驗證」能力是多個兆級產業的需求。
軟體工程與資安
目前的軟體開發極度依賴測試,但測試只能證明「Bug 存在」,永遠無法證明「Bug 不存在」。
Harmonic 的技術可以實現「形式化驗證軟體」。
應用場景:作業系統內核、瀏覽器 Sand box、雲端基礎設施。
價值:想像一個能夠自動修復 Bug 的 AI,它不是「覺得修好了」,而是能提供數學證明,保證這個修復不會引入新的副作用。這是微軟、Google 和 Amazon 夢寐以求的功能。
金融與區塊鏈
這也是為什麼 Paradigm 會投資 Harmonic 的原因。
智能合約審計:在 Web3 世界,程式碼就是法律。智能合約一旦上鏈就無法更改,且掌管著巨額資產。過去幾年,因為合約邏輯漏洞(如重入攻擊)導致的損失高達數十億美元。Aristotle 可以作為一個超級審計員,在合約部署前,證明其邏輯符合安全規範(例如:證明「用戶資金永遠不會被鎖死」)。
高頻交易風控:對於傳統金融,驗證交易演算法的極端邊界行為,確保在市場崩盤時系統不會做出瘋狂舉動,是 Ribbit Capital 看重的價值。
航太與工業控制
這是真正的「人命關天」領域。
波音/SpaceX:飛機和火箭的 Control Laws 需要極度嚴格的驗證。例如,證明「在任何風速和角度下,飛行器的攻角都不會超過 15 度」。
價值:傳統上,這需要數百名工程師進行數月的模擬。Harmonic 可以將這個過程自動化,生成保證符合物理約束的控制程式碼。
資本與競爭對手
融資:14 個月,3 億美元
Harmonic 的融資速度堪稱矽谷傳奇。
A 輪 (2024.09):7,500 萬美元,Sequoia (紅杉) 領投。驗證了技術路徑的可行性。
B 輪 (2025.07):1 億美元,Kleiner Perkins (KP) 領投,Paradigm 加入。資金用於擴展算力。
C 輪 (2025.11):1.2 億美元,Ribbit Capital 領投,估值 14.5 億美元。
這個投資人組合非常有意思:
Sequoia & KP:矽谷深科技的「造王者」,代表技術本身的高壁壘。
Paradigm:代表區塊鏈與去中心化計算的最前沿,暗示了技術在 Web3 的應用。
Ribbit:金融科技專家,代表了技術在傳統金融落地的巨大商業潛力。
Emerson Collective:Laurene Powell Jobs 的基金,代表了對科學與教育的長遠支持。
這顯示資本市場認為 Harmonic 不僅僅是一個工具,而是未來數位經濟的信任基礎設施。
競爭格局:推理領域上群雄崛起
AI 產業的競爭軸心,正從「誰讀過的書比較多(Pre-training)」轉向「誰的邏輯比較好(Inference/Reasoning)」。在這條賽道上,Harmonic 雖然跑在前面,但背後的追兵個個來頭不小。
OpenAI GPT-5.2:更像人的「機率性思考」
OpenAI 在 2025 年底推出的 GPT-5.2 已經將「思維鏈」(Chain of Thought)技術發揮到極致。比起去年的 o1 系列,GPT-5.2 的推理速度更快,且具備了初步的「Agentic」能力,能自主執行多步驟任務。
軟性驗證的極致。GPT-5.2 的「思考」本質上還是神經網路內部的機率預測。它會不斷自我反思、自我糾錯,甚至能寫出通過 99% 測試用例的程式碼。
通用性極強。GPT-5.2 不僅能解數學題,還能處理法律文件、創意寫作、多模態分析等「非形式化」的模糊任務。對於現實世界中那些「沒有標準答案」的問題,GPT-5.2 表現得像一個經驗豐富的人類專家。
Harmonic 的機會:99.9% vs 100%。GPT-5.2 依然是一個黑盒子。對於銀行或波音來說,99.9% 的正確率意味著每天仍有 0.1% 的巨額風險。Harmonic 的 Lean 4 硬約束 提供了 GPT-5.2 無法企及的「數學確定性」。
Google DeepMind Gemini 2.0:AlphaProof 的完全體
DeepMind 終於亮出了底牌。他們不再將 AlphaProof 視為獨立的實驗室項目,而是將其邏輯核心深度整合進了 Gemini 2.0 的頂級版本中。
生態系降維打擊。Google 將形式化驗證能力直接封裝在 Google Cloud Vertex AI 中。開發者不需要懂 Lean 4,只需點選「嚴格模式」,Gemini 2.0 就會調用 AlphaProof 的邏輯進行驗證。
Harmonic 的機會:中立性與專業深度。Google 的解決方案雖好,但對於使用 AWS 或 Azure 的企業來說存在鎖定風險。且 Gemini 的核心 DNA 仍是搜尋與生成,Harmonic 則提供了更純粹、可審計的數學引擎,特別適合需要「第三方獨立審計」的金融與加密貨幣場景。
DeepSeek-V3:價格屠夫的逆襲
來自中國的 DeepSeek 在 2025 年發布了 DeepSeek-V3,這是一個參數規模驚人的混合專家模型(MoE),且完全開源。它在 IMO 競賽中的表現已經與 AlphaProof 不相上下。
極致性價比。DeepSeek 證明了你可以用 GPT-5.2 十分之一的成本,獲得 95% 的推理能力。他們採用獨特的「生成器-驗證器」強化學習迴圈,讓開源社群能用消費級顯卡跑出頂級推理結果。
威脅:DeepSeek 是 Harmonic 最大的潛在威脅。如果開源模型也能達到 95% 的推理能力,企業是否還願意為了那最後 5% 的「絕對真理」支付高額溢價?Harmonic 必須證明在關鍵領域(如核電站控制、兆級資金調度),那 5% 的差距就是生與死的距離。
4.4 終極對比圖表
風險與挑戰 - 真理的代價
儘管前景輝煌,Harmonic 前方的路並非坦途。這不只是技術問題,更是商業模式的生死考驗。
真理的翻譯代價:當「模糊」遇上「精確」
這是 Harmonic 落地最大的「死亡之谷」。
Lean 4 是一種極度精確的數學語言,它無法容忍任何歧義。但現實世界是模糊的、混亂的。一個銀行行員可能會問:「如果客戶信用分數不錯,就核准這筆貸款。」但 Lean 4 會問:「什麼叫『不錯』?是 700 分以上?還是 650 分但沒有違約紀錄?還是要看過去 6 個月的平均值?」
這就產生了一個巨大的「形式化成本」。
如果企業為了使用 Harmonic,必須先聘請一位年薪 30 萬美元的 Lean 工程師把所有業務邏輯「翻譯」成數學語言,那這項技術永遠無法普及。Harmonic 必須證明其 AI 具備強大的「自動形式化」能力,即 AI 要能聽懂人類模糊的命令,自動補全細節,並將其轉化為嚴謹的邏輯。如果做不到這一點,Aristotle 將永遠只是象牙塔裡的玩具,無法進入充滿泥濘的商業戰場。
推理的經濟學:比 GPT-5.2 貴上一千倍?
我們必須面對物理現實:驗證是極其昂貴的。
當你問一般的 LLM 一個問題,它只需要進行一次「前向傳播」,消耗的算力是線性的。但 Aristotle 為了給出一個「被證明的答案」,背後可能進行了數萬次的「蒙特卡洛樹搜索」和編譯器使用。這意味著,它回答一個問題的算力成本,可能是普通 LLM 的 100 倍甚至 1000 倍。
這帶來了一個嚴峻的商業問題:誰付得起這筆帳單?
對於航太控制或高頻交易這種「錯誤成本無限大」的場景,客戶願意支付高額溢價。但對於大多數中型企業來說,如果驗證一段程式碼的成本比請人來寫還貴,那商業模式就不成立。Harmonic 的未來,取決於它能否在不犧牲準確性的前提下,將推理成本呈指數級下降,否則它將只能服務金字塔頂端 1% 的客戶。
「雙語」人才的真空
Harmonic 正處於一場極其不對稱的人才戰爭中。
要改進 Aristotle,你需要一種極其罕見的複合型人才:他們既要是頂尖的深度學習研究員,同時又要是高水平的數學家(精通 Lean 4、懂範疇論)。
DeepMind 擁有全球最大的此類人才庫;OpenAI 正在用高薪瘋狂挖角;學術界則試圖留住這些大腦。作為一家新創公司,Harmonic 雖然有 1.2 億美元,但在巨頭的支票簿面前仍顯單薄。如果無法持續吸引這些「雙語天才」,Harmonic 的技術護城河可能會被巨頭的人海戰術迅速填平。
馬克碎念 - 垂直化與驗證時代的來臨
看完 Harmonic 的故事,馬克認為,它更是 AI 發展中的關鍵轉折點,預示了未來軟體的三大變革。
從 Co-pilot 到 Verifier
過去兩年,我們都在談 AI 是 Co-pilot(副駕駛)。但它預設你是機長,你要負責檢查它的工作。這其實並沒有完全釋放生產力,因為「檢查」往往比「做」還累。
Harmonic 代表的是 AI 的下一個階段,Verifier(驗證者)。它不只是幫你寫,它還幫你驗。當 AI 能提供數學證明時,人類的角色將從「審核者」轉變為「定義者」。我們只需要定義「什麼是我們想要的結果」,剩下的執行與驗證,AI 可以全包。這才是自動化的終極型態。
Web3 與 AI 的交會點
Web3 的核心精神是 “Code is Law”,我們不相信人,只相信程式碼。但諷刺的是,程式碼是由會犯錯的人寫的。
AI 是一個黑盒子,Web3 是一個透明盒子。Harmonic 剛好站在這兩者的交會點。它用 AI 生產代碼,用數學證明程式碼的透明性。它是連接 AI「不可解釋的智慧」與區塊鏈「絕對透明的規則」之間的橋樑。在未來,也許所有的智能合約都必須蓋上 Harmonic 的「驗證戳記」才能上鏈。
垂直 AI 的終局是「專業語言」
很多垂直 SaaS 公司在問:在大模型時代,我的護城河是什麼?Harmonic 給出了答案:掌握「領域語言」。
通用大模型(如 GPT)學的是自然語言(英文、中文)。但專業領域都有自己的語言:數學有 Lean,晶片設計有 Verilog,法律有 Legalese。Harmonic 選擇了最難的數學語言 Lean 作為切入點。這告訴我們,垂直 AI 的競爭力不在於你會聊更多的話題,而在於你能否說該領域最精準的「行話」,並遵循該領域最嚴格的「邏輯」。
Harmonic 給出的不只是技術,而是一個「可以信任 AI 的未來」。在這個充滿幻覺的生成式時代,「確定性」或許才是最昂貴的奢侈品。
首圖連結:https://image.cmoney.tw/attachment/blog/1766678400/08e2a51e-1819-49aa-8a5e-861d363e2014.png




