西电主页 English 宣传部
西电要闻
表格等宽内容时,请左右滑动 <>
【学在西电】西电学子在ICCV 2023获计算机视觉6D姿态挑战赛冠军
时间:2023-10-12 11:36:13 来源:通信工程学院 点击:

西电新闻网讯(通讯员郝丰达)近日,两年一届的国际计算机视觉大会(IEEE International Conference on Computer Vision,简称ICCV)在法国巴黎举行。由西安电子科技大学,洛桑联邦理工学院(EPFL),和Magic Leap组成的联合队伍获得了此次会议举办的BOP Challenge(Benchmark for 6D Object Pose Estimation)中的单模型赛道冠军,同时获邀在8th International Workshop on Recovering 6D Object Pose(R6D)上汇报。

本次比赛吸引了包括清华大学,皇后大学,德国人工智能研究中心,慕尼黑工业大学,普林斯顿大学,帝国理工学院,浙江大学在内的多个世界知名高校和研究机构的团队参加,总计共有超过2400次挑战结果提交,通院宋锐教授指导的由博士后郝丰达、硕士生樊鑫垚和海洋组成的参赛队伍在其中脱颖而出,获得了单模型赛道的冠军。

郝丰达博士在ICCV workshop中对获奖作品进行在线汇报

获奖算法可视化结果

获奖方法采用检测-估计-修正的处理框架。团队针对初始位姿中对称物体存在的姿态歧义性进行了算法改进,性能了提升接近20%。其次,方法进一步改进了位姿优化流程,加入了双向光流、在线渲染、深度信息优化等组件。另外,获奖方法还采用了迭代修正的思路,以实现速度与精度之间的平衡。相比于其他队伍采用的方案,获奖方法仅需使用RGB进行训练,即可在测试时同时处理RGB和RGB-D数据,可扩展性强。最终在单模型赛道,无论是使用RGB还是RGB-D,均大幅领先其他队伍。

本次比赛参赛队伍由西安电子科技大学通信工程学院图像所、ISN国家重点实验室的宋锐教授和李娇娇副教授,洛桑联邦理工学院的Mathieu Salzmann研究员,以及Magic Leap的胡银林博士等共同指导。

此外,团队的姿态估计新算法论文在ICCV 2023正式发表,论文一作为图像所硕士生海洋,导师为宋锐教授。该论文从利用自监督方法构建任务的角度出发,提出了一种仅使用RGB图像进行训练,不需要任何辅助信息的目标6D位姿估计方法。算法首先仅利用合成图像训练姿态估计网络获得初始姿态,然后在没有真值标注信息的真实图像上训练位姿优化网络。训练过程中,论文算法利用来自不同视角的图像对之间的几何一致性,动态地为位姿优化网络生成像素级的光流监督信号,最后通过获得的预测光流确定3d到2d对应关系,使用PnP求解器来计算最终姿态结果,实现基于自监督方法的目标级6D位姿估计。在LINEMOD, Occluded-LINEMOD, 和YCB-V等数据集上的实验结果和可视化表明,论文提出的方法在真实数据集上有很好的泛化能力。

上一条: 西安电子科技大学召开本科教育教学专题研讨会
下一条: 【学在西电】西电学子在国际顶级会议ICCV 2023获26项赛事冠亚季军奖项

请遵守《互联网电子公告服务管理规定》及中华人民共和国其他有关法律法规。
用户需对自己在使用本站服务过程中的行为承担法律责任。
本站管理员有权保留或删除评论内容。
评论内容只代表网友个人观点,与本网站立场无关。
匿名发布验证码看不清楚,换张图片
0条评论 共1页 当前第1
【学在西电】西电学子在ICCV 2023获计算机视觉6D姿态挑战赛冠军

西电新闻网讯(通讯员郝丰达)近日,两年一届的国际计算机视觉大会(IEEE International Conference on Computer Vision,简称ICCV)在法国巴黎举行。由西安电子科技大学,洛桑联邦理工学院(EPFL),和Magic Leap组成的联合队伍获得了此次会议举办的BOP Challenge(Benchmark for 6D Object Pose Estimation)中的单模型赛道冠军,同时获邀在8th International Workshop on Recovering 6D Object Pose(R6D)上汇报。

本次比赛吸引了包括清华大学,皇后大学,德国人工智能研究中心,慕尼黑工业大学,普林斯顿大学,帝国理工学院,浙江大学在内的多个世界知名高校和研究机构的团队参加,总计共有超过2400次挑战结果提交,通院宋锐教授指导的由博士后郝丰达、硕士生樊鑫垚和海洋组成的参赛队伍在其中脱颖而出,获得了单模型赛道的冠军。

郝丰达博士在ICCV workshop中对获奖作品进行在线汇报

获奖算法可视化结果

获奖方法采用检测-估计-修正的处理框架。团队针对初始位姿中对称物体存在的姿态歧义性进行了算法改进,性能了提升接近20%。其次,方法进一步改进了位姿优化流程,加入了双向光流、在线渲染、深度信息优化等组件。另外,获奖方法还采用了迭代修正的思路,以实现速度与精度之间的平衡。相比于其他队伍采用的方案,获奖方法仅需使用RGB进行训练,即可在测试时同时处理RGB和RGB-D数据,可扩展性强。最终在单模型赛道,无论是使用RGB还是RGB-D,均大幅领先其他队伍。

本次比赛参赛队伍由西安电子科技大学通信工程学院图像所、ISN国家重点实验室的宋锐教授和李娇娇副教授,洛桑联邦理工学院的Mathieu Salzmann研究员,以及Magic Leap的胡银林博士等共同指导。

此外,团队的姿态估计新算法论文在ICCV 2023正式发表,论文一作为图像所硕士生海洋,导师为宋锐教授。该论文从利用自监督方法构建任务的角度出发,提出了一种仅使用RGB图像进行训练,不需要任何辅助信息的目标6D位姿估计方法。算法首先仅利用合成图像训练姿态估计网络获得初始姿态,然后在没有真值标注信息的真实图像上训练位姿优化网络。训练过程中,论文算法利用来自不同视角的图像对之间的几何一致性,动态地为位姿优化网络生成像素级的光流监督信号,最后通过获得的预测光流确定3d到2d对应关系,使用PnP求解器来计算最终姿态结果,实现基于自监督方法的目标级6D位姿估计。在LINEMOD, Occluded-LINEMOD, 和YCB-V等数据集上的实验结果和可视化表明,论文提出的方法在真实数据集上有很好的泛化能力。

责任编辑:冯毓璇
相关阅读:
    读取内容中,请等待...
Baidu
map