谷歌的人工智能領域傳來振奮人心的消息,其最新研發的Gemini 2.5 Pro模型在一款經典電子游戲中取得了歷史性成就——成功攻克了發布于29年前的《寶可夢藍》。
這一突破性進展由谷歌首席執行官桑達爾·皮查伊在社交媒體上激動宣布:“真是令人驚嘆!Gemini 2.5 Pro已經成功通關《寶可夢藍》!”這場名為“Gemini Plays Pokemon”的直播活動,由一位非谷歌員工的30歲軟件工程師Joel Z發起,卻獲得了谷歌高層的鼎力支持。
據悉,早在直播活動前一個月,谷歌AI Studio的產品負責人洛根·基爾帕特里克就已透露,Gemini在《寶可夢》系列游戲上取得了顯著進展,并已斬獲第五個徽章。相比之下,當前表現第二的模型僅獲得三個徽章,盡管它們使用的是不同的代理框架。皮查伊還幽默地表示:“我們正在研發API,即‘人工寶可夢智能’。”
為何谷歌選擇《寶可夢》作為挑戰對象?這背后有其深意。早在今年2月,Anthropic公司便展示了其Claude AI模型在《寶可夢紅》中的卓越表現,強調Claude的“深度思考和代理訓練”能力使其在處理復雜任務時更具優勢。然而,盡管Claude表現出色,卻似乎未能完全通關《寶可夢紅》。這是否意味著Gemini在游戲領域的能力更勝一籌?對此,Joel Z在Twitch頁面上提醒觀眾:“請勿將此次成就視為衡量大型語言模型(LLM)在《寶可夢》游戲中表現的唯一標準。Gemini和Claude使用不同的工具和接收到的信息差異較大,因此無法進行直接比較。”
值得注意的是,兩款AI模型在玩游戲時都需要借助代理框架。這些框架為模型提供帶有額外信息的游戲截圖,幫助模型做出決策,并按下與AI指令相對應的按鈕。盡管在幫助Gemini完成游戲的過程中,Joel Z進行了一些“開發干預”,但他堅稱這并非作弊,而是為了提升Gemini的整體決策和推理能力。
“我的干預并未涉及給出具體提示詞或為特定挑戰提供攻略或直接指令。”Joel Z解釋道,“唯一接近這種情況的是,我告訴Gemini需要與火箭隊小兵對話兩次才能獲得升空鑰匙,這實際上是一個在《寶可夢黃》中被修復的漏洞。”他進一步表示,“Gemini Plays Pokémon仍在積極開發中,其框架也在不斷演進和完善。”