英特爾在MLPerf Client v0.6基準測試中取得突破,成為首家全面支持NPU的企業。這一成就標志著客戶端NPU在大語言模型(LLM)性能評估方面的標準化邁出了重要一步。
在5月5日的公告中,英特爾透露了其在MLPerf Client v0.6基準測試中的卓越表現。測試結果顯示,英特爾酷睿Ultra 200處理器在GPU和NPU上的處理速度遠超人類平均閱讀速度,這一成績無疑為行業樹立了新的標桿。
英特爾客戶端PC產品營銷部門的副總裁兼總經理丹尼爾·羅杰斯對此表示:“我們非常自豪能夠引領行業,實現客戶端PC平臺的全NPU加速和領先的GPU性能。這一成就不僅展示了英特爾的技術實力,更為未來客戶端計算體驗的提升奠定了堅實基礎。”
為了更具體地展現其性能優勢,英特爾還公布了詳細的測試配置。測試分別在AMD平臺和英特爾平臺上進行,使用了華碩Zenbook S 16和Zenbook S 14兩款筆記本。其中,英特爾平臺搭載了酷睿Ultra 9 288V處理器、32GB LPDDR5內存、英特爾Arc 140V顯卡以及1TB存儲空間。這一配置在LLama 2 7B模型的四項內容生成與摘要測試中,展現了出色的性能。
測試數據顯示,英特爾在NPU上創造了最快的響應速度,首個詞元生成僅需1.09秒。同時,NPU的吞吐量也達到了最高的18.55個詞元/秒。英特爾內置的Arc GPU在首token生成速度上也超越了競品。這些成績充分證明了英特爾在NPU和GPU技術方面的領先地位。
值得注意的是,MLPerf Client基準測試是由MLCommons聯盟成員聯合開發的,其中包括英特爾、AMD、微軟、英偉達和高通等知名企業。此次測試首次突破了以GPU為核心的測試模式,新增了專用NPU的基準評估。這一變化不僅反映了行業對NPU技術的日益重視,也為未來客戶端計算性能的提升提供了新的方向。