日期:2024年07月01日
近日,计算机科学领域国际顶级刊物《IEEE Internet of Things Journal》(一区TOP,IF 8.2)报道了人工智能学院机器视觉团队在实时语义分割领域的研究进展,相关成果以“Multi Resolution Refinement Network for Semantic Segmentation in Internet of Things”为题在线发表。
语义分割作为一项基本的图像分割任务,在自动驾驶、遥感图像、场景解析、智慧交通等领域有着广阔的应用前景。然而,现有的模型由于计算开销较大,在实际应用中的部署受到大量计算和内存需求的阻碍,难以在边缘设备上满足实时准确分割的要求。因此,需要设计在速度和准确性之间取得平衡的实时语义分割网络,从而解决上述问题。
本论文主要以智能交通系统为背景,进行了实时语义分割网络设计。目前,流行的实时语义分割结构策略包括使用编码器-解码器或多分支网络架构进行模型设计。然而,这些网络通常会陷入实时和准确分割性能难以平衡的困境。在本论文中,利用这两种优势,强调使用轻量级编码器组成和不同分支之间的信息交互。为此,提出了一种有效且高效的编码器-解码器架构,且具有足够的分支特征通信,称为多分辨率细化网络(MRRNet)。在编码器阶段,集成了语义重构模块(SRM)来捕获尺度特征信息并细化语义特征的性能。为了解决信息丢失问题,加强特征的表征,提出了多尺度特征打磨模块(MSFPM)。此外,设计了对称聚合交互模块(SAIM)来利用低级和高级特性之间固有的互补性。广泛的评估表明,MRRNet在Cityscapes、CamVid和NightCity数据集上取得了具有竞争力的结果。
图1. MRRNet网络结构图
图2. 网络结构图对比
图3. 输出结果对比图. (a) 输入图像. (b) 标签图像. (c) MRRNet-S. (d) MRRNet-M. (e) MRRNet-L.
河南大学人工智能学院为该论文的第一单位,机器视觉团队硕士研究生王大凯为第一作者,机器视觉团队张苗辉教授为通讯作者。该研究工作受到国家自然科学基金的支持。
微信扫码关注