當前位置:首頁 > 科技文檔 > 儀器儀表 > 正文

一種融合視覺Transformer和擴散模型的單視點內(nèi)窺鏡手術(shù)光場重建方法(特邀)

激光與光電子學進展 頁數(shù): 11 2024-08-25
摘要: 針對內(nèi)窺鏡手術(shù)中單一視角圖像深度估計不確定性與遮擋導致的手術(shù)場景三維感知難題,提出了一種融合視覺Transformer和條件擴散模型的單視點多平面圖(MPI)表征方法,用以進行內(nèi)窺鏡手術(shù)光場重建。該方法首先利用視覺Transformer將輸入的單視角圖像令牌化,從而分解為多個圖像塊,并通過多頭注意力機制提取局部與全局相結(jié)合的關(guān)聯(lián)特征。然后,利用多尺度卷積解碼器將圖像塊特征從粗到...

開通會員,享受整站包年服務立即開通 >