• <bdo id="00ikk"><del id="00ikk"></del></bdo>
    <input id="00ikk"><del id="00ikk"></del></input>
  • <bdo id="00ikk"></bdo>
  • <bdo id="00ikk"><del id="00ikk"></del></bdo>
  • <bdo id="00ikk"><del id="00ikk"></del></bdo>
    • <bdo id="00ikk"></bdo>
      簡繁互換
      設為首頁
      設為收藏
      手機版
      東南網 / 新聞頻道 / 天下 / 環球新聞 / 正文

      新聞分析|全球科研團隊競逐低成本AI模型研發新范式

      2025-02-24 09:35 新華網 責任編輯:陳曦

      新華社北京2月23日電 新聞分析|全球科研團隊競逐低成本AI模型研發新范式

      新華社記者彭茜

      美國斯坦福大學等機構研究團隊近日宣布,在基座大模型基礎上,僅耗費數十美元就開發出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業可以較低成本研發出適合自身的AI應用,AI普惠性有望增強。同時,其所應用的“測試時擴展”技術或代表一條更可持續的AI研發路徑。

      低成本玩轉高級推理

      美國斯坦福大學和華盛頓大學研究團隊近日宣布研發出名為s1的模型,在衡量數學和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團隊稱,訓練租用所需的計算資源等成本只需約幾十美元。

      s1的核心創新在于采用了“知識蒸餾”技術和“預算強制”方法。“知識蒸餾”好比把別人釀好的酒進一步提純。該模型訓練數據是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數據集。

      “預算強制”則使用了AI模型訓練新方法——“測試時擴展”的實現方式。“測試時擴展”又稱“深度思考”,核心是在模型測試階段,通過調整計算資源分配,使模型更深入思考問題,提高推理能力和準確性。

      “預算強制”通過強制提前結束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進行微調,通過“預算強制”控制訓練后的模型計算量,使用16個英偉達H100 GPU僅進行26分鐘訓練便達成目標。

      美國加利福尼亞大學伯克利分校研究團隊最近也開發出一款名為TinyZero的精簡AI模型,稱復刻了DeepSeek-R1 Zero在倒計時和乘法任務中的表現。該模型通過強化學習,實現了部分相當于30億模型參數的大語言模型的自我思維驗證和搜索能力。團隊稱項目訓練成本不到30美元。

      “二次創造”增強AI普惠性

      清華大學計算機系長聘副教授劉知遠接受記者采訪時說,部分海外研究團隊使用DeepSeek-R1、o1等高性能推理大模型來構建、篩選高質量長思維鏈數據集,再用這些數據集微調模型,可低成本快速獲得高階推理能力。

      相關專家認為,這是AI研發的有益嘗試,以“二次創造”方式構建模型增強了AI普惠性。但有三點值得注意:

      首先,所謂“幾十美元的低成本”,并未納入開發基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環節的算力成本,并未計算基座模型的預訓練成本、數據采集加工成本。

      其次,“二次創造”構建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數學任務、編程及數學益智游戲等特定任務中有良好表現,但無法適用于更復雜、多樣化的任務場景。而s1模型也只能通過精心挑選的訓練數據,在特定測試集上超過早期版本o1 preview,而遠未超過o1正式版或DeepSeek-R1。

      最后,開發性能更優越的大模型,仍需強化學習技術。劉知遠說,就推動大模型能力邊界而言,“知識蒸餾”技術意義不大,未來仍需探索大規模強化學習技術,以持續激發大模型在思考、反思、探索等方面的能力。

      AI模型未來如何進化

      在2025年美國消費電子展上,美國英偉達公司高管為AI的進化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規模定律”呈現從“預訓練擴展”、到“訓練后擴展”,再到“測試時擴展”的演進。

      “預訓練擴展”堪稱“大力出奇跡”——訓練數據越多、模型規模越大、投入算力越多,最終得到AI模型的能力就越強。目標是構建一個通用語言模型,以GPT早期模型為代表。而“訓練后擴展”涉及強化學習和人類反饋等技術,是預訓練模型的“進化”,優化其在特定領域的任務表現。

      隨著“預訓練擴展”和“訓練后擴展”邊際收益逐漸遞減,“測試時擴展”技術興起。田豐說,“測試時擴展”的核心在于將焦點從訓練階段轉移到推理階段,通過動態控制推理過程中的計算量(如思考步長、迭代次數)來優化結果。這一方法不僅降低了對預訓練數據的依賴,還顯著提升了模型潛力。

      三者在資源分配和應用場景上各有千秋。預訓練像是讓AI模型去學校學習基礎知識,而后訓練則是讓模型掌握特定工作技能,如醫療、法律等專業領域。“測試時擴展”則賦予了模型更強推理能力。

      AI模型的迭代還存在類似摩爾定律的現象,即能力密度隨時間呈指數級增強。劉知遠說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數就能實現相同能力。未來應繼續推進計算系統智能化,不斷追求更高能力密度,以更低成本,實現大模型高效發展。




      本網轉載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請點擊投訴按鈕,我們會及時反饋并處理完畢。
      投訴
      新聞中心
      • 快訊
      • 國內
      • 國際
      • 娛樂
      • 體育
      點擊加載更多>>>
      點擊加載更多>>>
      點擊加載更多>>>
      點擊加載更多>>>
      點擊加載更多>>>

      關注東南網微信

      掃碼關注,了解福建

      排行榜
      • 日排行
      • 周排行
      • 月排行
      關于我們 | 廣告服務 | 網站地圖 | 網站公告
      國新辦發函[2001]232號 閩ICP備案號(閩ICP備05022042號) 互聯網新聞信息服務許可證 編號:35120170001 網絡文化經營許可證 閩網文〔2019〕3630-217號
      信息網絡傳播視聽節目許可(互聯網視聽節目服務/移動互聯網視聽節目服務)證號:1310572 廣播電視節目制作經營許可證(閩)字第085號
      網絡出版服務許可證 (署)網出證(閩)字第018號 增值電信業務經營許可證 閩B2-20100029 互聯網藥品信息服務(閩)-經營性-2015-0001
      福建日報報業集團擁有東南網采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播
      職業道德監督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327
      制服丝袜在线视频香蕉,五月开心六月伊人色婷婷,在线激情爱性视频,欧美性xxxbbb
    • <bdo id="00ikk"><del id="00ikk"></del></bdo>
      <input id="00ikk"><del id="00ikk"></del></input>
    • <bdo id="00ikk"></bdo>
    • <bdo id="00ikk"><del id="00ikk"></del></bdo>
    • <bdo id="00ikk"><del id="00ikk"></del></bdo>
      • <bdo id="00ikk"></bdo>
        主站蜘蛛池模板: 777奇米视频| 男人操女人网站| 国产在线91精品天天更新 | 日韩亚洲av无码一区二区三区| 末成年女a∨片一区二区| 天天拍拍夜夜出水| 国内午夜免费鲁丝片| 久久久国产精品无码免费专区| taoju.tv| 色综合久久中文字幕综合网| 污污的软件下载| 无码午夜人妻一区二区不卡视频 | 2018天天爽天天玩天天拍| 深夜网站在线观看| 成人精品一区二区三区中文字幕| 国产一在线观看| 亚洲一区二区三区久久| 亚洲色图欧美激情| 狼人香蕉香蕉在线视频播放| 日本高清视频色wwwwww色| 国产在线精品一区二区不卡麻豆 | 日韩欧美在线精品| 国产又色又爽又黄的| 久久久久综合国产| 老师白妇少洁王局长| 校草被c呻吟双腿打开bl双性| 国内精品伊人久久久久AV一坑 | 国产人与动zozo| 五月婷婷色综合| 91亚洲欧美综合高清在线| 欧美大肚乱孕交hd| 国产成人精品曰本亚洲78| 亚洲天堂电影在线观看| a毛看片免费观看视频| 精品国产污污免费网站| 日本夫妇交换456高清| 四虎8848精品永久在线观看| 久久精品中文字幕免费| 色一情一乱一乱91av| 日本天堂免费观看| 又粗又硬又大又爽免费视频播放 |