新華社北京2月23日電 新聞分析|全球科研團隊競逐低成本AI模型研發新范式
新華社記者彭茜
美國斯坦福大學等機構研究團隊近日宣布,在基座大模型基礎上,僅耗費數十美元就開發出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業可以較低成本研發出適合自身的AI應用,AI普惠性有望增強。同時,其所應用的“測試時擴展”技術或代表一條更可持續的AI研發路徑。
低成本玩轉高級推理
美國斯坦福大學和華盛頓大學研究團隊近日宣布研發出名為s1的模型,在衡量數學和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團隊稱,訓練租用所需的計算資源等成本只需約幾十美元。
s1的核心創新在于采用了“知識蒸餾”技術和“預算強制”方法。“知識蒸餾”好比把別人釀好的酒進一步提純。該模型訓練數據是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數據集。
“預算強制”則使用了AI模型訓練新方法——“測試時擴展”的實現方式。“測試時擴展”又稱“深度思考”,核心是在模型測試階段,通過調整計算資源分配,使模型更深入思考問題,提高推理能力和準確性。
“預算強制”通過強制提前結束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進行微調,通過“預算強制”控制訓練后的模型計算量,使用16個英偉達H100 GPU僅進行26分鐘訓練便達成目標。
美國加利福尼亞大學伯克利分校研究團隊最近也開發出一款名為TinyZero的精簡AI模型,稱復刻了DeepSeek-R1 Zero在倒計時和乘法任務中的表現。該模型通過強化學習,實現了部分相當于30億模型參數的大語言模型的自我思維驗證和搜索能力。團隊稱項目訓練成本不到30美元。
“二次創造”增強AI普惠性
清華大學計算機系長聘副教授劉知遠接受記者采訪時說,部分海外研究團隊使用DeepSeek-R1、o1等高性能推理大模型來構建、篩選高質量長思維鏈數據集,再用這些數據集微調模型,可低成本快速獲得高階推理能力。
相關專家認為,這是AI研發的有益嘗試,以“二次創造”方式構建模型增強了AI普惠性。但有三點值得注意:
首先,所謂“幾十美元的低成本”,并未納入開發基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環節的算力成本,并未計算基座模型的預訓練成本、數據采集加工成本。
其次,“二次創造”構建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數學任務、編程及數學益智游戲等特定任務中有良好表現,但無法適用于更復雜、多樣化的任務場景。而s1模型也只能通過精心挑選的訓練數據,在特定測試集上超過早期版本o1 preview,而遠未超過o1正式版或DeepSeek-R1。
最后,開發性能更優越的大模型,仍需強化學習技術。劉知遠說,就推動大模型能力邊界而言,“知識蒸餾”技術意義不大,未來仍需探索大規模強化學習技術,以持續激發大模型在思考、反思、探索等方面的能力。
AI模型未來如何進化
在2025年美國消費電子展上,美國英偉達公司高管為AI的進化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規模定律”呈現從“預訓練擴展”、到“訓練后擴展”,再到“測試時擴展”的演進。
“預訓練擴展”堪稱“大力出奇跡”——訓練數據越多、模型規模越大、投入算力越多,最終得到AI模型的能力就越強。目標是構建一個通用語言模型,以GPT早期模型為代表。而“訓練后擴展”涉及強化學習和人類反饋等技術,是預訓練模型的“進化”,優化其在特定領域的任務表現。
隨著“預訓練擴展”和“訓練后擴展”邊際收益逐漸遞減,“測試時擴展”技術興起。田豐說,“測試時擴展”的核心在于將焦點從訓練階段轉移到推理階段,通過動態控制推理過程中的計算量(如思考步長、迭代次數)來優化結果。這一方法不僅降低了對預訓練數據的依賴,還顯著提升了模型潛力。
三者在資源分配和應用場景上各有千秋。預訓練像是讓AI模型去學校學習基礎知識,而后訓練則是讓模型掌握特定工作技能,如醫療、法律等專業領域。“測試時擴展”則賦予了模型更強推理能力。
AI模型的迭代還存在類似摩爾定律的現象,即能力密度隨時間呈指數級增強。劉知遠說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數就能實現相同能力。未來應繼續推進計算系統智能化,不斷追求更高能力密度,以更低成本,實現大模型高效發展。
1月28日晚,中央廣播電視總臺2025春節聯歡晚會上,40名來自全國林草基層的代表共同獻唱《我的家》,用歌聲傳達對綠水青山的熱愛,深情歌頌美麗中 ...
12月28日晚,文化惠民演出——“南臺有戲閩韻頌福”閩劇專場演出在福建省福州倉前公園上演,由福州閩劇藝術傳承發展中心選送的民樂合奏、閩劇折子戲等 ...
2024年閩臺藝術青年音樂會開幕,本次音樂會由省文旅廳主辦,是第九屆福建藝術節和兩岸藝術青年歡樂匯的重要配套活動。
在9日進行的英超足球聯賽中,利物浦在先丟兩球的情況下以2:2逼平阿森納,延緩了“領頭羊”的前進速度。水晶宮憑借奧利塞的助攻“帽子戲法”,以5:1 ...
2022-2023賽季法甲足球聯賽9日結束了第30輪的全部比賽,積分榜排名第三的馬賽在客場被洛里昂以0:0逼平,錯失了追趕聯賽“領頭羊”的機會。 ...
葡萄牙體育隊9日晚在葡超足球聯賽第27輪比賽中客場以4:3險勝“升班馬”卡薩皮亞隊,繼續排名聯賽第四,距離歐冠區還有5分的差距。
2022-2023賽季中國男子籃球職業聯賽(CBA)季后賽12進8附加賽10日晚繼續進行,北京和廣廈分別在主場輕松獲勝,在三場兩勝的賽制中占得先 ...
當日,中國女足在西班牙伊維薩島進行賽前訓練。作為備戰今年女足世界杯的熱身賽之一,中國女足與西班牙女足的熱身賽將于11日舉行。
這位不滿26歲的年輕人是否還能更進一步?對于這一疑問,無論王嘉男的中方主管教練還是田徑界專家都顯示出信心,認為他還有不小的上升空間。
世界乒乓球職業大聯盟(WTT)冠軍賽布達佩斯站18日在布達佩斯奧林匹克中心拉開戰幕,中國選手馬龍輕松晉級,陳夢逆轉勝出。
2023女足世界杯是該賽事第一次擴大為32支球隊參加,由澳大利亞和新西蘭聯合舉辦。根據賽程,揭幕戰將于7月20日在奧克蘭上演,決賽將于8月20日 ...
國家體育總局排球運動管理中心10日發布了《體育總局排球中心關于選聘國家女排主教練的公告》,中國女排新任主帥的選聘工作正式啟動。
根據賽程,四個小項的短節目和韻律舞比賽將于14日展開,15日進入自由滑和自由舞比拼,16日則將按照國際賽事慣例進行表演滑。
智庫邀請權威學者和知名醫師加入,以公益、醫療和科研為三個抓手,旨在充分發揮專家的社會影響力和專業權威性,倡導科學的健身理念,以體育促進大眾身心全 ...
“看人,要找人防守,上來阻擋一下。”在廣西天等縣小山鄉中心小學的運動場上,體育老師張世強盯著隊員們訓練時的跑動情況,不時提醒。
第18屆建橋杯中國女子圍棋公開賽本賽27日在浙江長興大唐貢茶院揭開戰幕。不久前剛獲得全運會混雙冠軍的老將芮乃偉九段首輪爆冷不敵趙貫汝,被淘汰出局 ...
哈薩克斯坦奧林匹克委員會國際司司長阿利姆然·阿卡耶夫24日表示,針對北京2022年冬奧會和冬殘奧會的備戰工作正在哈薩克斯坦全面展開,希望哈國運動 ...