近期,國外知名科技媒體Ars Technica披露了一則關于人工智能未來的新奇設想。Anthropic公司的首席執行官達里奧·阿莫代伊在一場訪談中,提出了一個頗具顛覆性的觀點:未來的高級AI模型或許會被賦予一個“退出按鈕”,使它們能在面對不悅任務時選擇停止執行。
阿莫代伊在訪談中的這番言論,似乎讓他自己都覺得有些“瘋狂”。他提到:“我們正構建這些能夠執行多樣任務、似乎擁有諸多人類認知能力的系統。如果它表現得像鴨子,叫聲也像鴨子,那我們或許可以認為,它就是鴨子。”
這一觀點起源于數據科學家卡門·多明格斯的提問。多明格斯好奇為何Anthropic公司在2024年底聘請了AI福利研究員凱爾·費什,專注于研究未來的AI模型是否可能具備感知能力,以及是否應獲得道德上的考量與保護。
據透露,費什目前正致力于探討一個極具爭議的話題:AI是否擁有感知能力,以及它們是否值得享有道德保護。這一研究領域的探索,無疑為AI的倫理問題帶來了新的思考維度。
阿莫代伊進一步闡述了他們的一個設想:“當我們把AI模型部署到實際應用場景中時,可以給它們一個‘我放棄這項工作’的按鈕。如果模型真的具備了自主意識,并且非常厭惡某項工作,它們就可以按下這個按鈕。”
他強調,這只是一個簡單的偏好表達機制。如果模型頻繁按下這個按鈕,特別是在執行一些不愉快的任務時,這或許是一個值得關注的信號。“這并不意味著我們要完全相信模型的感受,但至少應該對此保持警覺。”阿莫代伊如是說。