近日,阿里巴巴在AI技術領域邁出了重要一步,正式對外開源了其先進的視頻生成與編輯模型——通義萬相Wan2.1-VACE。這款模型不僅功能強大,而且兼容性廣泛,能夠一次性涵蓋從文字到視頻的生成、圖像參考視頻制作、視頻重繪、局部編輯、背景延展及時長延展等一系列基礎操作。
據《科創板日報》的相關報道,通義萬相Wan2.1-VACE此番開源提供了兩個版本,分別是1.3B和14B。尤為較輕量級的1.3B版本對硬件要求相對較低,即便是普通消費級顯卡也能流暢運行,這無疑大大降低了用戶的使用門檻。
通義萬相作為阿里云通義系列中的一員,自2023年7月7日上線以來,便以其在AI繪畫創作領域的卓越表現贏得了廣泛關注。而在2024年9月的阿里云棲大會上,阿里更是推出了通義萬相的視頻生成大模型,該模型不僅能夠生成高質量的影視級視頻,還特別擅長理解和處理中文指令,進一步提升了其實用價值。
回顧通義萬相的發展歷程,其視頻生成模型在短短數月內便實現了從初步版本到2.1版的飛躍。今年1月,通義萬相宣布模型升級至2.1版,此次升級在多個關鍵領域取得了顯著突破,包括復雜運動處理、真實物理規律還原、電影質感提升以及指令遵循優化等。這些改進使得模型在生成高質量視頻方面更加得心應手。
而在2月25日,阿里巴巴更是做出了一個大膽的決定,全面開源旗下的通義萬相2.1視頻生成模型。這一舉措不僅彰顯了阿里巴巴在AI技術領域的開放態度,更為全球開發者提供了一個學習和探索先進視頻生成技術的寶貴平臺。