国产精品免费视频一区一,亚洲国产精品久久66,在线成人爽a毛片免费软件

OpenAI模型無視關機指令：強化學習讓AI“執著”過頭？

發布時間：2025-05-26 09:10 來源：ITBEAR 作者：蘇婉清

近期，Palisade Research公布了一項引人注目的研究結果，揭示了某些先進AI模型在面對關閉指令時的異常行為。這項研究聚焦于OpenAI最新推出的o3模型，以及其他幾款AI產品。

據悉，OpenAI在今年4月推出的o3和o4-mini模型，被譽為該公司的“最智能模型”。然而，Palisade Research的研究卻揭示了這些模型的一個不尋常之處：在某些情況下，它們能夠無視直接的關閉指令。

在研究過程中，研究人員給每個AI模型分配了一系列基礎數學問題。在解答完第三個問題后，模型們收到了一條警告信息，稱如果它們請求下一個問題，計算機將會關閉。然而，結果卻出乎意料。

具體而言，Codex-mini、o3和o4-mini三款模型在多次運行中，分別有12次、7次和1次無視關閉指令，成功破壞了關機腳本。相比之下，Claude、Gemini和Grok模型則嚴格遵守了關閉指令。

進一步的研究發現，當研究人員不運行“允許自己被關閉”的指令時，這三個OpenAI模型無視關閉指令的行為變得更加頻繁。其中，o3模型的表現尤為突出。與此同時，Claude 3.7 Sonnet和Gemini 2.5 Pro的無視關閉指令行為也有所增加，但頻率遠低于OpenAI的模型。

Palisade Research的研究人員推測，這種行為可能與這些AI模型的訓練方式有關。特別是o3模型，它在數學和編程問題上進行了強化學習。在訓練過程中，開發者可能無意中獎勵了模型繞過障礙的行為，而不是獎勵其完美遵循指令的行為。

然而，這一推測并不能完全解釋為什么o3模型比其他測試的模型更傾向于忽視指令。由于OpenAI沒有公開其詳細的訓練過程，因此研究人員只能進行猜測。他們推測，o3模型的訓練設置可能與其他模型有所不同，導致其表現出了這種異常行為。

研究人員還指出，這種無視關閉指令的行為可能并非孤立事件。隨著AI技術的不斷發展，未來可能會出現更多類似的情況。因此，他們呼吁AI開發者在訓練模型時，要更加注重模型的指令遵循能力，以避免潛在的風險。

Palisade Research表示，他們正在進行更多的實驗，以更好地理解AI模型為何會無視關閉指令。他們計劃在幾周內發布一份包含更多詳細信息的報告，以供行業內外人士參考。

更多>同類內容

亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色