AI拿下奧數(shù)IMO金牌,但數(shù)學(xué)界的AlphaGo時(shí)刻還沒(méi)來(lái)
日期:2025-08-04 16:46:44 / 人氣:75

近期,2025年國(guó)際數(shù)學(xué)奧林匹克(IMO)在澳大利亞落幕,AI界圍繞“IMO金牌認(rèn)證”展開(kāi)了一場(chǎng)激烈的人才與技術(shù)話語(yǔ)權(quán)爭(zhēng)奪戰(zhàn)。OpenAI和DeepMind先后宣布其模型達(dá)到IMO金牌標(biāo)準(zhǔn),這一成果標(biāo)志著AI在數(shù)學(xué)推理能力上取得了顯著躍升,但也引發(fā)了關(guān)于AI在數(shù)學(xué)領(lǐng)域地位和前景的諸多討論。
AI在IMO競(jìng)賽中的表現(xiàn)與競(jìng)爭(zhēng)
雙雙達(dá)到金牌標(biāo)準(zhǔn)
2025年7月20日IMO在澳大利亞閉幕,OpenAI在7月18日晚就宣布其保密推理模型在IMO競(jìng)賽的6道題目中解出5道,獲得35分,達(dá)到金牌線。兩天后,DeepMind也宣布其Gemini Deep Think的進(jìn)階版本模型同樣達(dá)到這一成就,且完全使用自然語(yǔ)言操作,還獲得了IMO官方組委會(huì)的證明。
競(jìng)爭(zhēng)背后的戲劇性
OpenAI提前宣布成績(jī)引發(fā)爭(zhēng)議,DeepMind的Demis Hassabis公開(kāi)譴責(zé)。此外,媒體曝出DeepMind金牌團(tuán)隊(duì)三名核心研究員被Meta挖角,此前半年DeepMind已有20名員工被挖去微軟,這場(chǎng)頂尖實(shí)驗(yàn)室之間的競(jìng)爭(zhēng)愈發(fā)激烈。
與人類(lèi)頂尖學(xué)生的對(duì)比
今年有72位高中生達(dá)到金牌標(biāo)準(zhǔn),其中5位獲得42分滿分,完美解答6道題,而兩個(gè)AI模型都只做出5道題,所以說(shuō)AI在數(shù)學(xué)能力上勝過(guò)人類(lèi)還為時(shí)過(guò)早,但這足以證明當(dāng)下大模型具備優(yōu)秀的數(shù)學(xué)能力。
IMO金牌對(duì)AI數(shù)學(xué)推理能力的證明
突破形式化證明限制
此前,DeepMind的AlphaGeometry和AlphaProof等模型雖達(dá)到銀牌標(biāo)準(zhǔn),但使用形式化證明方法,需把自然語(yǔ)言題目“翻譯”成Lean等機(jī)器能“看懂”的語(yǔ)言,過(guò)程耗時(shí)久,遠(yuǎn)超IMO比賽限制。而DeepMind最新的Gemini Deep Think模型在完全自然語(yǔ)言輸入輸出的條件下達(dá)到金牌標(biāo)準(zhǔn),直接從自然語(yǔ)言讀題、作答,不依賴(lài)形式化工具,這證明了語(yǔ)言模型本身也可完成高難度數(shù)學(xué)推理,挑戰(zhàn)了部分AI學(xué)者認(rèn)為語(yǔ)言模型無(wú)法獨(dú)立完成真正數(shù)學(xué)推理的觀點(diǎn)。
引發(fā)學(xué)術(shù)觀點(diǎn)變化
此前一些AI學(xué)者認(rèn)為AI模型必須依托形式化語(yǔ)言輸出可機(jī)器驗(yàn)證的邏輯結(jié)構(gòu),再人工轉(zhuǎn)換成自然語(yǔ)言,如AlphaProof這樣的“混合模型”才可能達(dá)到數(shù)學(xué)研究標(biāo)準(zhǔn)。但Gemini Deep Think的成功讓數(shù)學(xué)家可能改變把電腦輔助數(shù)學(xué)與形式化方法等同的看法。
前IMO金牌得主對(duì)AI解題的評(píng)價(jià)
解答思路與表現(xiàn)
前IMO中國(guó)國(guó)家隊(duì)成員胡蘇麟點(diǎn)評(píng),AI作答的五道題思路清晰、邏輯鏈條完整,獲得滿分實(shí)至名歸。不過(guò),在具體題目上兩個(gè)AI表現(xiàn)有差異。如第二題平面幾何題,DeepMind的解法更幾何、自然,接近人類(lèi)選手思路,OpenAI則使用解析幾何手段,將幾何題轉(zhuǎn)化為代數(shù)題,計(jì)算量巨大,人類(lèi)選手考場(chǎng)一般不會(huì)這么做。
語(yǔ)言風(fēng)格差異
兩個(gè)AI解答時(shí)會(huì)不斷引入新符號(hào)定義概念或公式,這在高中競(jìng)賽中不常見(jiàn),會(huì)增加理解難度。OpenAI語(yǔ)言風(fēng)格更像課堂老師,有人性化描述詞,會(huì)適當(dāng)省略細(xì)節(jié)、循循善誘;DeepMind語(yǔ)言更書(shū)面化,像閱讀數(shù)學(xué)論文。
AI用于數(shù)學(xué)研究的前景分歧
積極觀點(diǎn)
IMO競(jìng)賽只是數(shù)學(xué)能力的一個(gè)側(cè)面,與生活中的數(shù)學(xué)和數(shù)學(xué)家的研究目標(biāo)不同。澳籍華人數(shù)學(xué)家陶哲軒認(rèn)為,2023年AI就能為職業(yè)數(shù)學(xué)家生成有啟發(fā)性的提示和思路,2026年與形式化證明及驗(yàn)證等結(jié)合使用的AI將成為數(shù)學(xué)研究中值得信賴(lài)的合作者,能在一定程度上幫助數(shù)學(xué)家。
消極觀點(diǎn)
哥倫比亞大學(xué)的數(shù)學(xué)家Michael Harris批判AI數(shù)學(xué),認(rèn)為數(shù)學(xué)的真正意義在于自由探索和內(nèi)在洞見(jiàn),而非淪為市場(chǎng)邏輯下的技術(shù)產(chǎn)品。像Lean這樣的計(jì)算機(jī)語(yǔ)言將數(shù)學(xué)簡(jiǎn)化成機(jī)器能看懂的邏輯,使數(shù)學(xué)失去自由創(chuàng)造和思辨力。他關(guān)注數(shù)學(xué)研究資本化趨勢(shì),擔(dān)心資助者以應(yīng)用價(jià)值衡量數(shù)學(xué),忽視其內(nèi)在價(jià)值,認(rèn)為當(dāng)前關(guān)于AI輔助數(shù)學(xué)的討論忽略了根本問(wèn)題。
促進(jìn)學(xué)術(shù)研究觀點(diǎn)
DeepMind的Pushmeet Kohli認(rèn)為,AI在數(shù)學(xué)上的成就會(huì)促進(jìn)數(shù)學(xué)學(xué)術(shù)研究,如同圍棋選手分析AlphaGo策略發(fā)現(xiàn)新理論一樣,AI系統(tǒng)能為數(shù)學(xué)家和科學(xué)家提供強(qiáng)大工具,幫助他們理解世界。
作者:杏耀注冊(cè)登錄測(cè)速平臺(tái)
新聞資訊 News
案例展示 Case
- 杏耀08-23
- 杏耀如何代理08-23
- 杏耀如何注冊(cè)08-23
- 杏耀平臺(tái)測(cè)速地址08-23
- 杏耀主管聯(lián)系方式08-23
- 杏耀如何登錄08-23

