(美通社頭條)《國際AI安全報告》(International AI Safety Report)第二版關(guān)鍵更新現(xiàn)已發(fā)布,及時更新了通用AI的風(fēng)險管理與技術(shù)緩和措施。該報告由圖靈獎得主、計算機科學(xué)家Yoshua Bengio主持,匯集了百余位國際專家的參與,并獲得包括歐盟、經(jīng)合組織和聯(lián)合國在內(nèi)的30多個國家和國際組織的支持。

第二版關(guān)鍵更新涵蓋了提升可靠性與防范濫用的技術(shù)方法概述,以及風(fēng)險管理領(lǐng)域新興的制度化方法。其核心重點包括:在訓(xùn)練模型抵御惡意攻擊方面雖有所進展,但仍存在不足。技術(shù)嫻熟的黑客仍能在約50%的案例中僅用10次嘗試即可突破防護。開源鴻溝正在縮小,開放權(quán)重模型如今與行業(yè)領(lǐng)先產(chǎn)品的差距已不足一年。行業(yè)在安全方面的承諾有所增加,但其成效仍不明確。