清華大學(xué)高性能計(jì)算研究所傳來重要消息,翟季冬教授團(tuán)隊(duì)攜手清華系科創(chuàng)先鋒清程極智,共同宣布了一項(xiàng)重大開源成果——大模型推理引擎“赤兔 Chitu”。
這款引擎開創(chuàng)性地實(shí)現(xiàn)了在非英偉達(dá)Hopper架構(gòu)GPU及眾多國產(chǎn)芯片上的FP8精度模型原生運(yùn)行,顯著降低了推理成本,性能更是實(shí)現(xiàn)了翻倍。據(jù)悉,赤兔引擎被精準(zhǔn)定位為“生產(chǎn)級大模型推理引擎”,旨在為用戶帶來多重優(yōu)勢。
首先,赤兔引擎具備強(qiáng)大的多元算力適配能力。無論是NVIDIA的最新旗艦產(chǎn)品,還是舊款的多系列產(chǎn)品,亦或是國產(chǎn)芯片,赤兔引擎都能提供優(yōu)化的支持,確保了廣泛的兼容性。
其次,赤兔引擎全場景可伸縮的特性使其應(yīng)用場景更加靈活。無論是純CPU部署、單GPU部署,還是大規(guī)模集群部署,赤兔引擎都能提供可擴(kuò)展的解決方案,滿足不同場景下的需求。
赤兔引擎的長期穩(wěn)定運(yùn)行能力也是其一大亮點(diǎn)。在實(shí)際生產(chǎn)環(huán)境中,赤兔引擎的穩(wěn)定性足以承載高并發(fā)的業(yè)務(wù)流量,確保了業(yè)務(wù)的連續(xù)性和穩(wěn)定性。
在部署DeepSeek-R1-671B滿血版時,赤兔引擎在A800集群的測試中展現(xiàn)出了卓越的性能。與部分國外開源框架相比,赤兔引擎在實(shí)現(xiàn)GPU使用量減少50%的同時,推理速度還提升了3.15倍,這一成績無疑令人矚目。
對于廣大開發(fā)者和用戶而言,赤兔引擎的開源無疑是一個巨大的福音。現(xiàn)在,大家可以通過訪問GitHub上的開源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗(yàn)這款強(qiáng)大的大模型推理引擎。