當前位置:首頁 > 科技文檔 > 自動化 > 正文

面向強化學(xué)習(xí)的可解釋性研究綜述

計算機學(xué)報 頁數(shù): 30 2024-04-23
摘要: 強化學(xué)習(xí)作為機器學(xué)習(xí)的一種范式,因其強大的策略試錯學(xué)習(xí)能力,受到關(guān)注.隨著深度學(xué)習(xí)的融入,強化學(xué)習(xí)方法在許多復(fù)雜的控制任務(wù)中取得了巨大成功.然而,深度強化學(xué)習(xí)網(wǎng)絡(luò)作為黑盒模型,其缺乏可解釋性所帶來的不安全、不可控及難理解等問題限制了強化學(xué)習(xí)在諸如自動駕駛、智慧醫(yī)療等關(guān)鍵領(lǐng)域中的發(fā)展.為了解決這一問題,科研人員開展了對強化學(xué)習(xí)可解釋性的研究.然而,這些研究開展相對較晚,且缺少針對...

開通會員,享受整站包年服務(wù)立即開通 >