亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

AMD ROCm 7發(fā)布:AI推理性能大幅提升,DeepSeek R1增速達(dá)3.8倍

   發(fā)布時(shí)間:2025-06-17 01:43 作者:馮璃月

AMD在近日舉行的AMD Advancing AI 2025活動(dòng)中,正式揭曉了其備受矚目的下一代開(kāi)源軟件棧技術(shù)——ROCm 7。這一發(fā)布標(biāo)志著AMD在加速AI與提升開(kāi)發(fā)者生產(chǎn)力方面邁出了重要一步。

ROCm 7的問(wèn)世,是AMD繼ROCm 6之后的又一次重大更新。自AI計(jì)算興起以來(lái),ROCm軟件棧經(jīng)歷了多次迭代與優(yōu)化。此次ROCm 7的發(fā)布,帶來(lái)了多項(xiàng)關(guān)鍵功能的增強(qiáng):

首先,ROCm 7引入了最新的算法與模型,為AI應(yīng)用提供了更為強(qiáng)大的計(jì)算基礎(chǔ)。其次,AMD在ROCm 7中加入了擴(kuò)展AI的高級(jí)功能,進(jìn)一步提升了軟件的靈活性和適用性。ROCm 7還首次支持了MI350系列,為這一系列的用戶提供了更為全面的軟件支持。集群管理和企業(yè)級(jí)功能的加入,也使得ROCm 7更加適合大規(guī)模部署和復(fù)雜應(yīng)用場(chǎng)景。

AMD在ROCm 7中特別強(qiáng)調(diào)了其軟件堆棧中日益增長(zhǎng)的推理能力。為此,ROCm 7堆棧中包含了增強(qiáng)型框架,如vLLM v1、llm-d和SGLang等,這些框架旨在提供多種優(yōu)化,以滿足不同場(chǎng)景下的需求。ROCm 7還引入了新的內(nèi)核和算法,包括GEMM自動(dòng)調(diào)優(yōu)、MoE、Attention以及基于Python的內(nèi)核編寫(xiě),這些新技術(shù)的加入將進(jìn)一步提升軟件的性能和靈活性。

在數(shù)據(jù)類(lèi)型支持方面,ROCm 7也取得了顯著進(jìn)展。AMD宣布對(duì)其MI350系列提供FP6和FP4支持,同時(shí)ROCm 7也全面支持FP8、FP6、FP4和混合精度等高級(jí)數(shù)據(jù)類(lèi)型。這些支持的加入,將使得ROCm 7在處理復(fù)雜AI任務(wù)時(shí)更加得心應(yīng)手。

從性能表現(xiàn)來(lái)看,ROCm 7同樣不負(fù)眾望。AMD表示,ROCm 7將推理作為重點(diǎn),為AI工作負(fù)載帶來(lái)了高達(dá)3.5倍的性能提升。具體來(lái)說(shuō),相較于ROCm 6,ROCm 7在Llama 3.1 70B上的性能提升了3.2倍,在Qwen2-72B上提升了3.4倍,在DeepSeek R1上更是實(shí)現(xiàn)了3.8倍的性能飛躍。

這些顯著的性能提升和新增功能,無(wú)疑將使得ROCm 7成為AI領(lǐng)域的一股強(qiáng)勁力量。對(duì)于開(kāi)發(fā)者而言,ROCm 7的發(fā)布無(wú)疑將為他們提供更多的選擇和可能性,助力他們?cè)贏I領(lǐng)域取得更加輝煌的成就。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群