学术成果

学院机器视觉团队在实时语义分割领域取得新进展


日期:2024年07月01日  




日,计算机科学领域国际顶级刊物《IEEE Internet of Things Journal》(一区TOPIF 8.2)报道了人工智能学院机器视觉团队在实时语义分割领域的研究进展,相关成果以Multi Resolution Refinement Network for Semantic Segmentation in Internet of Things为题在线发表。

语义分割作为一项基本的图像分割任务,在自动驾驶、遥感图像、场景解析、智慧交通等领域有着广阔的应用前景。然而,现有的模型由于计算开销较大在实际应用中的部署受到大量计算和内存需求的阻碍,难以在边缘设备上满足实时准确分割的要求。因此,需要设计在速度和准确性之间取得平衡的实时语义分割网络,从而解决上述问题

本论文主要以智能交通系统为背景,进行了实时语义分割网络设计。目前,流行的实时语义分割结构策略包括使用编码器-解码器或多分支网络架构进行模型设计。然而,这些网络通常会陷入实时和准确分割性能难以平衡的困境。在本论文中,利用这两种优势,强调使用轻量级编码器组成和不同分支之间的信息交互。为此,提出了一种有效且高效的编码器-解码器架构,且具有足够的分支特征通信,称为多分辨率细化网络(MRRNet)。在编码器阶段,集成了语义重构模块(SRM)来捕获尺度特征信息并细化语义特征的性能。为了解决信息丢失问题,加强特征的表征,提出了多尺度特征打磨模块(MSFPM)。此外,设计了对称聚合交互模块(SAIM)来利用低级和高级特性之间固有的互补性。广泛的评估表明,MRRNetCityscapesCamVidNightCity数据集上取得了具有竞争力的结果。


1. MRRNet网络结构图

2. 网络结构图对比

3. 输出结果对比图. (a) 输入图像. (b) 标签图像. (c) MRRNet-S. (d) MRRNet-M. (e) MRRNet-L.

河南大学人工智能学院为该论文的第一单位,机器视觉团队硕士研究生王大凯为第一作者,机器视觉团队张苗辉教授为通讯作者。该研究工作受到国家自然科学基金的支持。

论文链接:https://ieeexplore.ieee.org/document/10535445





微信扫码关注