近日,阿里巴巴旗下AI領(lǐng)域的重大動(dòng)態(tài)引發(fā)了廣泛關(guān)注。據(jù)可靠消息透露,阿里通義千問開源項(xiàng)目的領(lǐng)軍人物林俊旸,在某一平臺(tái)上發(fā)布了一條引人遐想的消息,暗示Qwen3系列模型或?qū)⒂诮诿媸馈?/p>
值得注意的是,Qwen3系列模型此前曾在阿里巴巴的AI模型開源社區(qū)ModelScope(魔搭)上短暫亮相,隨后又悄然下線。這一系列包括了Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B以及Qwen3-30B-A3B-Base四款模型,全部遵循Apache License 2.0開源協(xié)議。盡管官方尚未發(fā)布正式公告,但通過觀察命名規(guī)則與前代技術(shù)的邏輯,業(yè)界對(duì)其技術(shù)路徑和定位方向已有初步推測(cè)。
在即將發(fā)布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以參數(shù)規(guī)模直接命名,分別對(duì)應(yīng)40億、17億和6億參數(shù)。這種無后綴的命名方式,或許意味著它們采用的是單架構(gòu)稠密模型,并未采用混合專家(MoE)設(shè)計(jì),更側(cè)重于輕量化應(yīng)用場(chǎng)景。而Qwen3-30B-A3B-Base則是一款MoE架構(gòu)的基礎(chǔ)模型,其總參數(shù)達(dá)到300億(30B),但在處理任務(wù)時(shí)僅動(dòng)態(tài)調(diào)用30億(3B)參數(shù)。
據(jù)AIbase的報(bào)道,Qwen3系列模型在功能上也頗具亮點(diǎn),其支持高達(dá)256K的上下文長度,能夠涵蓋推理與非推理任務(wù),這無疑將極大地提升其在各種應(yīng)用場(chǎng)景下的表現(xiàn)。
回顧過去,自2023年8月以來,阿里云在開源AI模型方面取得了顯著進(jìn)展,相繼推出了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,覆蓋了從0.5B到110B的全尺寸范圍,以及大語言、多模態(tài)、數(shù)學(xué)和代碼等全模態(tài)領(lǐng)域。這一系列動(dòng)作不僅展示了阿里云在AI領(lǐng)域的深厚積累,也為其在全球范圍內(nèi)的競(jìng)爭(zhēng)力注入了新的活力。