亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

微軟Phi-4推理模型發(fā)布,小型AI能否撼動大型模型地位?

   發(fā)布時間:2025-05-01 16:01 作者:蘇婉清

微軟近期在人工智能領(lǐng)域邁出了重要一步,于4月30日正式發(fā)布了Phi-4-reasoning系列推理模型。這一系列模型專為應(yīng)對復(fù)雜推理任務(wù)而設(shè)計,通過監(jiān)督微調(diào)Phi-4,并利用o3-mini生成的高質(zhì)量“可教導(dǎo)”提示數(shù)據(jù)集進(jìn)行訓(xùn)練,實現(xiàn)了推理能力的顯著提升。

本次發(fā)布的Phi-4-reasoning系列包含三款模型:Phi-4-reasoning、Phi-4-reasoning-plus以及Phi-4-mini-reasoning。據(jù)微軟官方介紹,這些模型不僅繼承了小型模型的高效特性,還在推理能力上取得了重大突破。它們通過推理時間擴(kuò)展技術(shù),能夠處理需要多步驟分解和內(nèi)部反思的復(fù)雜任務(wù),尤其在數(shù)學(xué)推理和代理型應(yīng)用中表現(xiàn)卓越。

Phi-4-reasoning模型是一款擁有140億參數(shù)的開源推理模型。它結(jié)合了OpenAI o3-mini的高質(zhì)量推理演示數(shù)據(jù),通過監(jiān)督微調(diào)Phi-4,并利用額外計算資源,生成了詳細(xì)的推理鏈條。這一特性使得Phi-4-reasoning在處理復(fù)雜推理任務(wù)時,能夠展現(xiàn)出強大的解析和推理能力。

而Phi-4-reasoning-plus增強版則進(jìn)一步通過強化學(xué)習(xí)技術(shù)提升了性能。與標(biāo)準(zhǔn)版相比,它的tokens用量增加了1.5倍,從而支持更高精度的推理任務(wù)。兩款模型在數(shù)學(xué)推理和博士級科學(xué)問題測試中,均超越了OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B等模型,甚至在AIME 2025(美國數(shù)學(xué)奧林匹克資格賽)中擊敗了擁有6710億參數(shù)的DeepSeek-R1滿血模型。

針對計算資源有限的環(huán)境,微軟還推出了Phi-4-mini-reasoning模型。這是一款基于Transformer的緊湊型語言模型,專門優(yōu)化用于數(shù)學(xué)推理。它通過DeepSeek-R1生成的合成數(shù)據(jù)進(jìn)行了微調(diào),能夠在低延遲場景下提供高質(zhì)量的逐步問題解決方案。這款模型覆蓋了從中學(xué)到博士級的百萬級多樣化數(shù)學(xué)問題,非常適合教育應(yīng)用、嵌入式輔導(dǎo)以及邊緣設(shè)備部署。

在多項數(shù)學(xué)基準(zhǔn)測試中,Phi-4-mini-reasoning模型憑借其3.8億參數(shù)的表現(xiàn),超越了OpenThinker-7B和Llama-3.2-3B-instruct等更大模型,甚至在部分測試中接近了OpenAI o1-mini的水平。這一成績充分展示了Phi-4-mini-reasoning在高效性和準(zhǔn)確性方面的卓越表現(xiàn)。

微軟Phi-4-reasoning系列的發(fā)布,無疑為人工智能領(lǐng)域注入了新的活力。這一系列模型不僅在推理能力上取得了重大突破,還兼顧了高效性和實用性,為未來的應(yīng)用和發(fā)展提供了廣闊的空間。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群