看片一区二区,青青草成人免费在线视频,国产午夜大地久久

AI拿下奧數(shù)IMO金牌，但數(shù)學(xué)界的AlphaGo時(shí)刻還沒(méi)來(lái)

日期：2025-08-04 16:46:44 / 人氣：75

近期，2025年國(guó)際數(shù)學(xué)奧林匹克（IMO）在澳大利亞落幕，AI界圍繞“IMO金牌認(rèn)證”展開(kāi)了一場(chǎng)激烈的人才與技術(shù)話語(yǔ)權(quán)爭(zhēng)奪戰(zhàn)。OpenAI和DeepMind先后宣布其模型達(dá)到IMO金牌標(biāo)準(zhǔn)，這一成果標(biāo)志著AI在數(shù)學(xué)推理能力上取得了顯著躍升，但也引發(fā)了關(guān)于AI在數(shù)學(xué)領(lǐng)域地位和前景的諸多討論。

AI在IMO競(jìng)賽中的表現(xiàn)與競(jìng)爭(zhēng)

雙雙達(dá)到金牌標(biāo)準(zhǔn)

2025年7月20日IMO在澳大利亞閉幕，OpenAI在7月18日晚就宣布其保密推理模型在IMO競(jìng)賽的6道題目中解出5道，獲得35分，達(dá)到金牌線。兩天后，DeepMind也宣布其Gemini Deep Think的進(jìn)階版本模型同樣達(dá)到這一成就，且完全使用自然語(yǔ)言操作，還獲得了IMO官方組委會(huì)的證明。

競(jìng)爭(zhēng)背后的戲劇性

OpenAI提前宣布成績(jī)引發(fā)爭(zhēng)議，DeepMind的Demis Hassabis公開(kāi)譴責(zé)。此外，媒體曝出DeepMind金牌團(tuán)隊(duì)三名核心研究員被Meta挖角，此前半年DeepMind已有20名員工被挖去微軟，這場(chǎng)頂尖實(shí)驗(yàn)室之間的競(jìng)爭(zhēng)愈發(fā)激烈。

與人類(lèi)頂尖學(xué)生的對(duì)比

今年有72位高中生達(dá)到金牌標(biāo)準(zhǔn)，其中5位獲得42分滿分，完美解答6道題，而兩個(gè)AI模型都只做出5道題，所以說(shuō)AI在數(shù)學(xué)能力上勝過(guò)人類(lèi)還為時(shí)過(guò)早，但這足以證明當(dāng)下大模型具備優(yōu)秀的數(shù)學(xué)能力。

IMO金牌對(duì)AI數(shù)學(xué)推理能力的證明

突破形式化證明限制

此前，DeepMind的AlphaGeometry和AlphaProof等模型雖達(dá)到銀牌標(biāo)準(zhǔn)，但使用形式化證明方法，需把自然語(yǔ)言題目“翻譯”成Lean等機(jī)器能“看懂”的語(yǔ)言，過(guò)程耗時(shí)久，遠(yuǎn)超IMO比賽限制。而DeepMind最新的Gemini Deep Think模型在完全自然語(yǔ)言輸入輸出的條件下達(dá)到金牌標(biāo)準(zhǔn)，直接從自然語(yǔ)言讀題、作答，不依賴(lài)形式化工具，這證明了語(yǔ)言模型本身也可完成高難度數(shù)學(xué)推理，挑戰(zhàn)了部分AI學(xué)者認(rèn)為語(yǔ)言模型無(wú)法獨(dú)立完成真正數(shù)學(xué)推理的觀點(diǎn)。

引發(fā)學(xué)術(shù)觀點(diǎn)變化

此前一些AI學(xué)者認(rèn)為AI模型必須依托形式化語(yǔ)言輸出可機(jī)器驗(yàn)證的邏輯結(jié)構(gòu)，再人工轉(zhuǎn)換成自然語(yǔ)言，如AlphaProof這樣的“混合模型”才可能達(dá)到數(shù)學(xué)研究標(biāo)準(zhǔn)。但Gemini Deep Think的成功讓數(shù)學(xué)家可能改變把電腦輔助數(shù)學(xué)與形式化方法等同的看法。

前IMO金牌得主對(duì)AI解題的評(píng)價(jià)

解答思路與表現(xiàn)

前IMO中國(guó)國(guó)家隊(duì)成員胡蘇麟點(diǎn)評(píng)，AI作答的五道題思路清晰、邏輯鏈條完整，獲得滿分實(shí)至名歸。不過(guò)，在具體題目上兩個(gè)AI表現(xiàn)有差異。如第二題平面幾何題，DeepMind的解法更幾何、自然，接近人類(lèi)選手思路，OpenAI則使用解析幾何手段，將幾何題轉(zhuǎn)化為代數(shù)題，計(jì)算量巨大，人類(lèi)選手考場(chǎng)一般不會(huì)這么做。

語(yǔ)言風(fēng)格差異

兩個(gè)AI解答時(shí)會(huì)不斷引入新符號(hào)定義概念或公式，這在高中競(jìng)賽中不常見(jiàn)，會(huì)增加理解難度。OpenAI語(yǔ)言風(fēng)格更像課堂老師，有人性化描述詞，會(huì)適當(dāng)省略細(xì)節(jié)、循循善誘；DeepMind語(yǔ)言更書(shū)面化，像閱讀數(shù)學(xué)論文。

AI用于數(shù)學(xué)研究的前景分歧

積極觀點(diǎn)

IMO競(jìng)賽只是數(shù)學(xué)能力的一個(gè)側(cè)面，與生活中的數(shù)學(xué)和數(shù)學(xué)家的研究目標(biāo)不同。澳籍華人數(shù)學(xué)家陶哲軒認(rèn)為，2023年AI就能為職業(yè)數(shù)學(xué)家生成有啟發(fā)性的提示和思路，2026年與形式化證明及驗(yàn)證等結(jié)合使用的AI將成為數(shù)學(xué)研究中值得信賴(lài)的合作者，能在一定程度上幫助數(shù)學(xué)家。

消極觀點(diǎn)

哥倫比亞大學(xué)的數(shù)學(xué)家Michael Harris批判AI數(shù)學(xué)，認(rèn)為數(shù)學(xué)的真正意義在于自由探索和內(nèi)在洞見(jiàn)，而非淪為市場(chǎng)邏輯下的技術(shù)產(chǎn)品。像Lean這樣的計(jì)算機(jī)語(yǔ)言將數(shù)學(xué)簡(jiǎn)化成機(jī)器能看懂的邏輯，使數(shù)學(xué)失去自由創(chuàng)造和思辨力。他關(guān)注數(shù)學(xué)研究資本化趨勢(shì)，擔(dān)心資助者以應(yīng)用價(jià)值衡量數(shù)學(xué)，忽視其內(nèi)在價(jià)值，認(rèn)為當(dāng)前關(guān)于AI輔助數(shù)學(xué)的討論忽略了根本問(wèn)題。

促進(jìn)學(xué)術(shù)研究觀點(diǎn)

DeepMind的Pushmeet Kohli認(rèn)為，AI在數(shù)學(xué)上的成就會(huì)促進(jìn)數(shù)學(xué)學(xué)術(shù)研究，如同圍棋選手分析AlphaGo策略發(fā)現(xiàn)新理論一樣，AI系統(tǒng)能為數(shù)學(xué)家和科學(xué)家提供強(qiáng)大工具，幫助他們理解世界。

作者：杏耀注冊(cè)登錄測(cè)速平臺(tái)

AI拿下奧數(shù)IMO金牌，但數(shù)學(xué)界的AlphaGo時(shí)刻還沒(méi)來(lái)

新聞資訊 News

案例展示 Case

現(xiàn)在致電 8888910 OR 查看更多聯(lián)系方式 →

現(xiàn)在致電 8888910 OR 查看更多聯(lián)系方式 →