亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網 - 新科技與新能源行業網絡媒體

DeepSeek R1小版本大升級,深度思考與工具調用能力全面飛躍!

   發布時間:2025-05-31 00:26 作者:楊凌霄

近日,人工智能領域再度傳來重大進展,DeepSeek R1模型在5月28日悄然完成了小版本迭代,新版本被命名為DeepSeek-R1-0528。用戶只需通過官方渠道,無論是網站、App還是小程序,開啟“深度思考”功能,即可率先體驗這一升級后的智能服務。同時,API接口也已同步更新,保持原有調用方式不變,確保了用戶體驗的連貫性。

緊接著,5月29日晚間,深度求索官方詳細披露了DeepSeek-R1-0528版本的升級亮點。本次升級的核心在于深度思考能力的顯著增強。雖然依舊基于2024年12月發布的DeepSeek V3 Base模型,但通過加大后訓練過程中的算力投入,模型的思維深度和推理能力實現了質的飛躍。在數學、編程及通用邏輯等多個關鍵測評中,DeepSeek-R1-0528的表現已躋身國內頂尖行列,甚至逼近國際知名模型如o3和Gemini-2.5-Pro的水平。

具體而言,新版R1模型在復雜推理任務上的表現尤為突出。以AIME 2025測試為例,其準確率從舊版的70%大幅提升至87.5%。這一顯著進步得益于模型在推理過程中思維深度的增加,新版模型在解題時平均使用23K tokens,遠高于舊版的12K tokens,顯示出更為細致和深入的解題策略。

深度求索官方還通過蒸餾DeepSeek-R1-0528的思維鏈,訓練出了DeepSeek-R1-0528-Qwen3-8B模型。在數學測試AIME 2024中,該8B模型緊隨DeepSeek-R1-0528之后,表現優于Qwen3-8B達10%,與Qwen3-235B相媲美。這一成果不僅對學術界推理模型的研究具有啟示意義,也為工業界小模型的開發提供了新的思路。

除了深度思考能力的增強,新版DeepSeek R1還在其他方面進行了優化。針對“幻覺”問題,新版模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了約45%至50%,提供了更為準確可靠的結果。在創意寫作方面,新版R1能夠生成篇幅更長、結構更完整、風格更接近人類偏好的作品,覆蓋了議論文、小說、散文等多種文體。雖然目前不支持在深度思考過程中直接調用工具,但DeepSeek-R1-0528在Tau-Bench測評中的表現已與OpenAI o1-high相當。

騰訊官方也迅速響應,宣布旗下元寶、ima、搜狗輸入法、QQ瀏覽器等產品迎來升級,率先接入了DeepSeek R1-0528最新版。這些產品在推理能力、代碼生成、寫作表現、思考邏輯等方面均得到了顯著提升。用戶只需打開相應產品,選擇DeepSeek模型R1深度思考功能,即可免費不限量體驗這一智能升級。騰訊表示,從模型開源到產品上線,整個過程不到一天時間,展現了其在人工智能領域的快速響應和部署能力。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群