近日,阿里巴巴旗下的通義萬相技術平臺宣布了一項重大開源進展,推出了一項名為“首尾幀生視頻14B模型”的前沿視頻生成技術。
這項AI技術的核心在于,它可以根據用戶提供的起始幀和結束幀畫面,自動生成一段720p高清分辨率的過渡視頻。這一創新為視頻創作者開辟了新的創作路徑。
該模型背后依托的是一套復雜的深度學習算法,它能夠深入解析用戶提供的畫面內容、風格以及主題元素。一旦用戶上傳了首尾兩幀圖像,模型便會細致分析畫面中的各類視覺細節,如物體的形狀、色彩搭配以及光影效果,進而推理并生成最為合理的中間過渡幀。
通過這種方式生成的視頻,不僅保持了物體運動軌跡的自然流暢,還實現了光線和色彩的平滑過渡,最終呈現出一個邏輯嚴密、視覺連貫的高質量視頻作品。
值得注意的是,通義萬相已經將此技術全面開放給公眾。用戶可以通過訪問通義萬相的官方網站直接體驗這項服務,同時也可以通過GitHub、Hugging Face或魔搭社區獲取開源代碼,便于本地部署和進一步的二次開發。
這一技術的推出,尤其對于需要精細控制過渡效果的視頻創作領域,如延時攝影、特效轉換等,提供了更為高效且可控的解決方案。內容創作者現在可以利用這一技術,以更少的時間和精力,實現更加復雜的視頻創作需求。