近日,人工智能開發領域的巨頭Hugging Face發布了一款名為SmolVLA的開源機器人AI模型,引起了廣泛關注。這款模型在虛擬與現實環境中均展現出了超越許多大型機器人模型的能力。
Hugging Face在官方博客中提到,SmolVLA致力于推廣視覺-語言-行動(VLA)模型的應用,并推動通用機器人智能體的研究進程。它不僅是一個輕量級且功能強大的模型,更是一種全新的方法,用于訓練和評估通用機器人技術。
作為Hugging Face低成本機器人軟硬件生態系統的一部分,SmolVLA的推出進一步豐富了該公司在機器人領域的布局。此前,Hugging Face已經推出了LeRobot,這是一套專注于機器人的模型、數據集和工具。近期,該公司還收購了法國的機器人初創公司Pollen Robotics,并推出了一系列價格親民的機器人系統,包括人形機器人。
SmolVLA擁有4.5億個參數,這些參數被稱為模型的“權重”,決定了模型的行為。該模型基于LeRobot社區數據集進行訓練,這一數據集是專門為機器人標注的,并在Hugging Face AI開發平臺上共享。Hugging Face表示,SmolVLA的規模足夠小,可以在單個消費級GPU甚至MacBook上運行,并且可以在經濟實惠的硬件上進行測試和部署。
SmolVLA還支持異步推理堆棧功能,這一功能使模型能夠將機器人行動的處理與視覺和聽覺的處理分離。這種分離使得機器人能夠在快速變化的環境中更快地做出響應,從而提高了機器人的效率和性能。
目前,SmolVLA已經在Hugging Face官方網站上開放下載。一些用戶已經在社交平臺上分享了他們的使用體驗,聲稱利用該模型成功控制了第三方機械臂。這一成果進一步證明了SmolVLA的實用性和潛力。
在開放機器人領域,Hugging Face并非孤軍奮戰。英偉達也推出了一套用于開放機器人的工具集,而初創公司K-Scale Labs正在開發所謂的“開源人形機器人”組件。該領域的其他實力公司還包括Dyna Robotics、杰夫·貝索斯支持的Physical Intelligence以及RLWRLD等。這些公司和組織的共同努力,將進一步推動機器人技術的發展和普及。