102分!AI首战中学奥赛拿下金牌,离超越人类已经不远?
发布时间:2026-03-17 23:21:00 作者:玩站小弟
我要评论
銆€銆€銆婃椿鍔涗簹澶€斺€斾簹澶湴鍖16鍥芥皯鎰忚皟鏌ユ姤。
\u003cdiv class=\"rich_media_content\"\u003e\u003cp\u003e在刚刚落幕的2025年全国中学生数学奥林匹克竞赛(CMO)决赛中,除了涌现出一批数学天赋出众的年轻选手,还有一个特殊的“考生”引人注目——AI大模型。\u003c/p\u003e\u003cp\u003eCMO是中国最高规格的数学奥林匹克竞赛,今年,主办方首次设立AI测试环节,邀请大模型与人类同场答题,并交由相同的评委专家组阅卷打分。上海人工智能实验室旗下的书生科学\u003c!--VERTICAL_CARD_BEGIN_0--\u003e多模态大模型\u003c!--VERTICAL_CARD_END_0--\u003e(Intern-S1-20251122)拿到102分。\u003c/p\u003e\u003cp\u003e据公开信息,今年CMO考生前三名得分分别为126(满分)、110分、102分,Intern-S1取得的成绩位列总分榜第三,在AI中排名第一。\u003c/p\u003e\u003cp style=\"text-align: center\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--IMG_0--\u003e\u003c/p\u003e\u003cp\u003e本届CMO共有700余名选手参赛,223人获得金牌,前60名选手获得清华北大保送资格并入选国家集训队。AI目前虽未超越人类选手最高分,但其表现已远超大多数参赛者,甚至超过了许多金牌得主,本次金牌线为78分。\u003c!--AI_AD_1000--\u003e\u003c/p\u003e\u003cp\u003e“AI在奥赛中超越人类是未来一定会发生的事。”上海人工智能实验室青年领军科学家陈恺对第一财经表示。他认为,正如AlphaGo最终战胜世界围棋冠军,AI在数学竞赛上的进步也是一个逐步发展的过程。现在AI已经能拿奥赛金牌了,未来超过奥赛顶尖的人类选手也大有可能。\u003c!--MID_AD_0--\u003e\u003c!--EOP_0--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_0--\u003e\u003cp\u003e“数学是推理能力的代表性领域,也是目前很多大模型团队重点投入优化的方向之一,因此进展相对更快。”不过,陈恺强调,奥赛只是数学里的一个任务,因此AI在奥赛中超过人类,并不意味着AI在数学或更广泛的能力上就能超过人。\u003c/p\u003e\u003cp\u003e“数学是个很宽泛深奥的领域,也有很多前沿的研究,在这方面AI还要更长的时间积累。”陈恺补充道。\u003c/p\u003e\u003cp\u003e中国人民大学附属中学教师、奥数金牌教练张端阳也是AI训练的“顾问”,在接触之初他对大模型的印象还停留在只能解答数学高考题的水平,大模型在CMO的表现,也让他惊讶于AI发展的速度之快,“就像 10 年前的围棋一样,突破可能就是一刹那。”\u003c!--AI_AD_1001--\u003e\u003c!--MID_AD_1--\u003e\u003c!--EOP_1--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_1--\u003e\u003cp\u003e上海人工智能实验室发布的文章提到,此次Intern-S1 推理能力的提升得益于“通专融合”技术架构 SAGE(中文含义为智者),创新点在于以数学引理为核心的多轮分层推理机制,以及基于结果的过程校验模型,显著提升了模型在超长程思考和证明时的严谨性,还有通用模型结合专业符号引擎,让通用模型掌握像人类科学家一样逐步推导、探索和修正的思路。\u003c!--MID_AD_2--\u003e\u003c!--EOP_2--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_2--\u003e\u003cp\u003eAI在数学和推理领域的突破意味着什么?陈恺认为,这对教育和科研领域的落地都会很有帮助,此外,数学能力也是复杂推理等各种能力的基础,因此这一能力的提升和演进能进一步帮助大模型提升智力水平。\u003c/p\u003e\u003cp\u003e让大模型辅助教育学习是已经在落地的方向之一,AI可以给出解答和思考过程。而AI在奥数能够拿金牌、达到人类第三的水平,就意味着在高中数学或者K12教育领域,AI的辅导能力更强了。此外,在科研方面,陈恺提到,有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。\u003c!--MID_AD_3--\u003e\u003c!--EOP_3--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_3--\u003e\u003cp\u003e对于这次Intern-S1的答卷,有阅卷专家认为,AI对第四题的解答是“一个新的解法,巧妙的调整法,在学生的解法中没有见过”。这意味着AI能突破人类解题思路局限,通过自主探索和分析找到新的解题方法,这对赋能科学发现有很大的意义。\u003c/p\u003e\u003cp\u003e上海人工智能实验室在官方发文中表示,计划将 Intern-S1 的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域,通过与专业工具的打通与融合,实现从“长时间独立思考”向“长时间独立科研”转变,进而加速各领域科研范式的变革,为科学突破提供支撑。\u003c!--MID_AD_4--\u003e\u003c!--EOP_4--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_4--\u003e\u003cp\u003e (本文来自第一财经)\u003c/p\u003e\u003cdiv powered-by=\"qqnews_ex-editor\"\u003e\u003c/div\u003e\u003cstyle\u003e.rich_media_content{--news-tabel-th-night-color: #444444;--news-font-day-color: #333;--news-font-night-color: #d9d9d9;--news-bottom-distance: 22px}.rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.rich_media_content .qn-editor-copy p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:unset;line-height:unset;margin-bottom:unset;word-wrap:unset}.rich_media_content{color:var(--news-font-day-color);font-size:18px}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qn-editor-copy p:not([data-exeditor-arbitrary-box=image-box]):not(.qn-editor-copy){letter-spacing:unset;line-height:unset;margin-bottom:unset;word-wrap:unset}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content{color:var(--news-font-night-color)}}.data_color_scheme_dark .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.data_color_scheme_dark .rich_media_content .qn-editor-copy p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:unset;line-height:unset;margin-bottom:unset;word-wrap:unset}.data_color_scheme_dark .rich_media_content{color:var(--news-font-night-color)}.data_color_scheme_dark .rich_media_content{font-size:18px}.rich_media_content p[data-exeditor-arbitrary-box=image-box]{margin-bottom:11px}.rich_media_content\u003ediv:not(.qnt-video),.rich_media_content\u003esection{margin-bottom:var(--news-bottom-distance)}.rich_media_content hr{margin-bottom:var(--news-bottom-distance)}.rich_media_content .link_list{margin:0;margin-top:20px;min-height:0!important}.rich_media_content blockquote{background:#f9f9f9;border-left:6px solid #ccc;margin:1.5em 10px;padding:.5em 10px}.rich_media_content blockquote p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content blockquote{background:#323232}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content blockquote{background:#323232}}.rich_media_content ol[data-ex-list]{--ol-start: 1;--ol-list-style-type: decimal;list-style-type:none;counter-reset:olCounter calc(var(--ol-start,1) - 1);position:relative}.rich_media_content ol[data-ex-list]\u003eli\u003e:first-child::before{content:counter(olCounter,var(--ol-list-style-type)) '. ';counter-increment:olCounter;font-variant-numeric:tabular-nums;display:inline-block}.rich_media_content ul[data-ex-list]{--ul-list-style-type: circle;list-style-type:none;position:relative}.rich_media_content ul[data-ex-list].nonUnicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.5)}.rich_media_content ul[data-ex-list].unicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.8)}.rich_media_content ol:not([data-ex-list]){padding-left:revert}.rich_media_content ul:not([data-ex-list]){padding-left:revert}.rich_media_content table{display:table;border-collapse:collapse;margin-bottom:var(--news-bottom-distance)}.rich_media_content table th,.rich_media_content table td{word-wrap:break-word;border:1px solid #ddd;white-space:nowrap;padding:2px 5px}.rich_media_content table th{font-weight:700;background-color:#f0f0f0;text-align:left}.rich_media_content table p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content table th{background:var(--news-tabel-th-night-color)}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content table th{background:var(--news-tabel-th-night-color)}}.rich_media_content .qqnews_image_desc,.rich_media_content p[type=om-image-desc]{line-height:20px!important;text-align:center!important;font-size:14px!important;color:#666!important}.rich_media_content div[data-exeditor-arbitrary-box=wrap]:not([data-exeditor-arbitrary-box-special-style]){max-width:100%}.rich_media_content .qqnews-content{--wmfont: 0;--wmcolor: transparent;font-size:var(--wmfont);color:var(--wmcolor);line-height:var(--wmfont)!important;margin-bottom:var(--wmfont)!important}.rich_media_content .qqnews_sign_emphasis{background:#f7f7f7}.rich_media_content .qqnews_sign_emphasis ol{word-wrap:break-word;border:none;color:#5c5c5c;line-height:28px;list-style:none;margin:14px 0 6px;padding:16px 15px 4px}.rich_media_content .qqnews_sign_emphasis p{margin-bottom:12px!important}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{padding-left:30px}.rich_media_content .qqnews_sign_emphasis ol\u003eli{list-style:none}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep:first-child::before{margin-left:-30px;content:counter(olCounter,decimal) ''!important;counter-increment:olCounter!important;font-variant-numeric:tabular-nums!important;background:#37f;border-radius:2px;color:#fff;font-size:15px;font-style:normal;text-align:center;line-height:18px;width:18px;height:18px;margin-right:12px;position:relative;top:-1px}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis{background:#262626}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis{background:#262626}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}}.rich_media_content h1,.rich_media_content h2,.rich_media_content h3,.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{margin-bottom:var(--news-bottom-distance);font-weight:700}.rich_media_content h1{font-size:20px}.rich_media_content h2,.rich_media_content h3{font-size:19px}.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{font-size:18px}.rich_media_content li:empty{display:none}.rich_media_content ul,.rich_media_content ol{margin-bottom:var(--news-bottom-distance)}.rich_media_content div\u003ep:only-child{margin-bottom:0!important}.rich_media_content .cms-cke-widget-title-wrap p{margin-bottom:0!important}\u003c/style\u003e\u003c/div\u003e