近日,我院张立军教授团队在基于海参图像的水下图像增强方面取得重要进展,研究成果《基于多尺度混合注意力残差网络的水下图像增强与水下多场景海参识别》(A Multi-scale Convolutional Hybrid Attention Residual Network for Enhancing Underwater Image and Identifying Underwater Multi-scene Sea Cucumber)发表在《IEEE ROBOTICS AND AUTOMATION LETTERS》。《IEEE ROBOTICS AND AUTOMATION LETTERS》是计算机科学领域专注于机器人研究的国际顶级期刊,目前影响因子为4.6(SCI二区Top)。论文第一作者与通讯作者为张立军教授,论文第二作者为2023级硕士(本研一体化)学生马哲,中国石油大学(华东)为独立完成单位。
论文首页
目前海参以人工捕捞为主,利用水下机器人替代人工捕捞海参是未来的发展趋势。然而复杂多变的水下环境,对海参捕捞机器人的自动检测识别带来了极大困难。为了改善海参图像色彩失真和退化问题,提高海参检测的准确率和稳定性,本文提出了一种基于数据驱动的多尺度卷积混合注意力残差增强网络(MCRNet)方法。首先,采用考虑了各颜色通道差异的增益因子来中和水下图像色偏,其次提出多尺度卷积融合模块来提取不同尺度的浅层特征信息,构建多个残差块和混合注意力模块专注于图像深层特征的提取,网络整体残差连接有助于保留浅层信息。
所提的水下图像增强网络模型
增强网络对比实验结果
海参识别对比结果
本文提出的增强网络对于存在严重色偏和极度模糊海参图像,能够有效地恢复其色彩信息和细节特征,该研究成果在于水下机器人视觉应用方面具有实际意义。
论文链接:https://ieeexplore.ieee.org/document/10595499