学院机器视觉团队在实时语义分割领域取得新进展-河南大学人工智能学院

学术成果

学院机器视觉团队在实时语义分割领域取得新进展

日期：2024年07月01日

近日，计算机科学领域国际顶级刊物《IEEE Internet of Things Journal》（一区TOP，IF 8.2）报道了人工智能学院机器视觉团队在实时语义分割领域的研究进展，相关成果以“Multi Resolution Refinement Network for Semantic Segmentation in Internet of Things”为题在线发表。

语义分割作为一项基本的图像分割任务，在自动驾驶、遥感图像、场景解析、智慧交通等领域有着广阔的应用前景。然而，现有的模型由于计算开销较大，在实际应用中的部署受到大量计算和内存需求的阻碍，难以在边缘设备上满足实时准确分割的要求。因此，需要设计在速度和准确性之间取得平衡的实时语义分割网络，从而解决上述问题。

本论文主要以智能交通系统为背景，进行了实时语义分割网络设计。目前，流行的实时语义分割结构策略包括使用编码器-解码器或多分支网络架构进行模型设计。然而，这些网络通常会陷入实时和准确分割性能难以平衡的困境。在本论文中，利用这两种优势，强调使用轻量级编码器组成和不同分支之间的信息交互。为此，提出了一种有效且高效的编码器-解码器架构，且具有足够的分支特征通信，称为多分辨率细化网络(MRRNet)。在编码器阶段，集成了语义重构模块(SRM)来捕获尺度特征信息并细化语义特征的性能。为了解决信息丢失问题，加强特征的表征，提出了多尺度特征打磨模块(MSFPM)。此外，设计了对称聚合交互模块(SAIM)来利用低级和高级特性之间固有的互补性。广泛的评估表明，MRRNet在Cityscapes、CamVid和NightCity数据集上取得了具有竞争力的结果。

图1. MRRNet网络结构图

图2. 网络结构图对比

图3. 输出结果对比图. (a) 输入图像. (b) 标签图像. (c) MRRNet-S. (d) MRRNet-M. (e) MRRNet-L.

河南大学人工智能学院为该论文的第一单位，机器视觉团队硕士研究生王大凯为第一作者，机器视觉团队张苗辉教授为通讯作者。该研究工作受到国家自然科学基金的支持。

论文链接:https://ieeexplore.ieee.org/document/10535445