神經(jīng)網(wǎng)絡(luò)壓縮聯(lián)合優(yōu)化方法的研究綜述
智能系統(tǒng)學(xué)報(bào)
頁數(shù): 22 2024-01-03
摘要: 隨著人工智能應(yīng)用的實(shí)時(shí)性、隱私性和安全性需求增大,在邊緣計(jì)算平臺(tái)上部署高性能的神經(jīng)網(wǎng)絡(luò)成為研究熱點(diǎn)。由于常見的邊緣計(jì)算平臺(tái)在存儲(chǔ)、算力、功耗上均存在限制,因此深度神經(jīng)網(wǎng)絡(luò)的端側(cè)部署仍然是一個(gè)巨大的挑戰(zhàn)。目前,克服上述挑戰(zhàn)的一個(gè)思路是對(duì)現(xiàn)有的神經(jīng)網(wǎng)絡(luò)壓縮以適配設(shè)備部署條件?,F(xiàn)階段常用的模型壓縮算法有剪枝、量化、知識(shí)蒸餾,多種方法優(yōu)勢(shì)互補(bǔ)同時(shí)聯(lián)合壓縮可實(shí)現(xiàn)更好的壓縮加速效果,正成為...