新闻动态

当前位置: 首页 - 新闻动态 - 科研进展 -正文

(通讯员张右润)西安电子科技大学协同智能系统教育部重点实验室张右润博士、公茂果教授在IEEE Transactions on Image Processing (IEEE TIP)上发表题为“Self-Supervised Monocular Depth Estimation With Multiscale Perception”的学术论文,为自监督单目深度估计任务提供了多尺度感知的解决方案。

该论文提出了一种多尺度自监督单目深度估计算法。在自监督的单目深度估计框架中,深度估计任务被转换为视图合成任务规避对真实深度标签的依赖,但视图合成过程中存在局部梯度问题。此论文深入调查了自监督深度估计任务中的局部梯度的诱因,并发现视图合成过程中的可微分双线性采样会导致合成图像中的每个像素只能与源图像的四个像素建立联系从而产生局部梯度。此外,视图合成过程中的结构相似性函数仅能在局部窗口中对比不同图像的差异,未能充分感知到不同图像在大区域内的差异。

为解决上述问题,该论文设计了一种新型的可学习下采样训练策略,通过对模型的预测进行下采样并在低分辨率的深度图上执行图像合成可间接扩大像素梯度的感受范围,在此过程中,基于引导滤波的可学习的下采样器可以自适应地调节下采样系数以减少深度图的信息丢失。该论文亦提出了一种金字塔结构相似性衡量函数,用于弥补基础模型在局部窗口中的感受域受限问题,使得模型具备多尺度的立体感知能力。实验结果表明该方法在室内环境中尤其有效。

IEEE Transactions on Image Processing是计算机视觉领域的顶级期刊、中科院SCI期刊大类一区TOP期刊、中国计算机学会(CCF)认定的计算机图形学与多媒体领域的A类期刊。

论文链接:https://doi.org/10.1109/TIP.2022.3167307

上一篇:实验室刘佳璐博士、公茂果教授在IEEE TCSVT发表论文

下一篇:实验室公茂果教授、高原博士在《中国科学:信息科学》发表论文

Baidu
map