亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

站內(nèi)搜索 | 手機版

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

當前位置：智快網(wǎng) > 產(chǎn)業(yè) > 正文內(nèi)容

英偉達Blackwell GPU助力AI推理速度飛躍，達成千TPS/用戶新高度

發(fā)布時間：2025-05-24 13:12 來源：ITBEAR 作者：朱天宇

英偉達近日宣布了一項令人矚目的成就：其最新推出的Blackwell GPU在meta的Llama 4 Maverick模型上，成功刷新了大型語言模型（LLM）推理速度的世界紀錄。這一突破發(fā)生在周四，當時英偉達正式對外公布了這一消息。

據(jù)悉，為了達到這一里程碑，AI基準測試權(quán)威機構(gòu)Artificial Analysis采用了配置了8塊Blackwell GPU的DGX B200節(jié)點。這一配置使得系統(tǒng)每用戶每秒能夠生成高達1000個tokens（TPS），這在之前是難以想象的。

英偉達的技術(shù)團隊通過深度優(yōu)化TensorRT-LLM軟件棧，并結(jié)合EAGLE-3技術(shù)，對推測解碼草稿模型進行了訓(xùn)練。這種加速技術(shù)通過小型快速草稿模型預(yù)測token序列，再由大型目標LLM進行并行驗證。英偉達表示，這種方法的優(yōu)勢在于單次迭代可能生成多個token，盡管這需要額外的草稿模型計算開銷。經(jīng)過這些優(yōu)化，整套服務(wù)器系統(tǒng)在峰值吞吐配置下，每秒能夠處理72,000個tokens。

英偉達進一步解釋說，Blackwell架構(gòu)與Llama 4 Maverick級別的超大規(guī)模語言模型完美適配，這得益于其專為大型語言模型推理加速設(shè)計的EAGLE3軟件架構(gòu)。這一架構(gòu)與GPU硬件架構(gòu)形成了協(xié)同效應(yīng)，從而實現(xiàn)了性能的顯著提升。

英偉達還強調(diào)，他們在提高性能的同時，也確保了響應(yīng)的準確性。測試結(jié)果顯示，使用FP8數(shù)據(jù)格式的準確性與人工分析的BF16數(shù)據(jù)格式相當。這意味著，在保持高準確性的前提下，英偉達成功地大幅提高了系統(tǒng)的性能。

英偉達的這一突破，不僅展示了其在GPU技術(shù)領(lǐng)域的領(lǐng)先地位，也為大型語言模型的推理加速提供了新的解決方案。隨著人工智能技術(shù)的不斷發(fā)展，這一突破將對未來的AI應(yīng)用產(chǎn)生深遠的影響。

更多>同類內(nèi)容

Java 30周年：歷久彌新，云原生時代下的編程王者

05-24

索尼PS+臨期用戶專享：限時免費升級至Premium三檔，你會續(xù)訂嗎？

05-24

shadPS4模擬器v0.9.0重大更新：游戲兼容性及性能全面升級

05-24

長安啟源A06E純電轎車亮相公示，下半年上市引期待

05-24

《生化危機9》設(shè)計大揭秘：最初竟是開放世界多人游戲？

05-24

《信長之野望?新生CE》Switch2首發(fā)，確認支持鼠標操作，游戲體驗再升級！

05-24

防城港核電三期“華龍一號”啟動，年發(fā)電量將增200億千瓦時！

05-24

蘋果iOS 19日歷應(yīng)用大改在即，新版究竟會如何“重新定義”現(xiàn)代日歷？

05-24

波音737 MAX空難賠償協(xié)議達成，波音能否重拾公眾信任？

05-24

Sublime Text Build 4200發(fā)布：逐步淘汰Python 3.3，性能大幅提升

05-24

富士6月12日X-Summit發(fā)布會，X-E5 APSC相機或?qū)Ⅲ@艷亮相？

05-23

市場監(jiān)管總局重拳出擊，全國范圍內(nèi)整治移動式大型游樂設(shè)施安全

05-23

SwitchBot Hub 3智能中樞發(fā)布：旋鈕操控，紅外兼容，打造全屋智能新體驗

05-23

余承東清華開講：鴻蒙系統(tǒng)開發(fā)不易，生態(tài)建設(shè)更難上加難！

05-23

五菱新能源全球突破300萬輛，印尼基地見證新里程碑！

05-23

點擊查看更多 +

全站最新

英偉達Blackwell GPU助力AI推理速度飛躍，達成千TPS/用戶新高度

英偉達Blackwell GPU助力AI推理速度飛躍，達成千TPS/用戶新高度

寶馬Speedtop概念轎跑驚艷亮相，限量70臺搭載最強V8引擎！

寶馬Speedtop概念轎跑驚艷亮相，限量70臺搭載最強V8引擎！

小米室外攝像機4C來襲：199元享500萬像素3K畫質(zhì)，雙云臺設(shè)計

小米室外攝像機4C來襲：199元享500萬像素3K畫質(zhì)，雙云臺設(shè)計

2025款寶馬M2 CS亮相：前臉大改，車尾鴨尾擾流板成亮點

2025款寶馬M2 CS亮相：前臉大改，車尾鴨尾擾流板成亮點

智己LS6增程版SUV官圖曝光，前臉煥新，已完成工信部新車申報

智己LS6增程版SUV官圖曝光，前臉煥新，已完成工信部新車申報

Java 30周年：歷久彌新，云原生時代下的編程王者

Java 30周年：歷久彌新，云原生時代下的編程王者

三星Galaxy Watch8新功能曝光：抗氧化指數(shù)，飲食健康新管家？

三星Galaxy Watch8新功能曝光：抗氧化指數(shù)，飲食健康新管家？

蘋果Apple Watch新專利：邊緣曲面屏設(shè)計將帶來哪些改變？

蘋果Apple Watch新專利：邊緣曲面屏設(shè)計將帶來哪些改變？

熱門內(nèi)容

本欄最新

英偉達Blackwell GPU助力AI推理速度飛躍，達成千TPS/用戶新高度

英偉達Blackwell GPU助力AI推理速度飛躍，達成千TPS/用戶新高度

Java 30周年：歷久彌新，云原生時代下的編程王者

Java 30周年：歷久彌新，云原生時代下的編程王者

索尼PS+臨期用戶專享：限時免費升級至Premium三檔，你會續(xù)訂嗎？

索尼PS+臨期用戶專享：限時免費升級至Premium三檔，你會續(xù)訂嗎？

shadPS4模擬器v0.9.0重大更新：游戲兼容性及性能全面升級

shadPS4模擬器v0.9.0重大更新：游戲兼容性及性能全面升級

長安啟源A06E純電轎車亮相公示，下半年上市引期待

長安啟源A06E純電轎車亮相公示，下半年上市引期待

《生化危機9》設(shè)計大揭秘：最初竟是開放世界多人游戲？

《生化危機9》設(shè)計大揭秘：最初竟是開放世界多人游戲？

《信長之野望?新生CE》Switch2首發(fā)，確認支持鼠標操作，游戲體驗再升級！

《信長之野望?新生CE》Switch2首發(fā)，確認支持鼠標操作，游戲體驗再升級！

防城港核電三期“華龍一號”啟動，年發(fā)電量將增200億千瓦時！

防城港核電三期“華龍一號”啟動，年發(fā)電量將增200億千瓦時！

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據(jù)客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群