- 黄飞庆;郭宝峰;尤靖云;吴治龙;王奕炜;王庆林;
针对循环神经网络存在的梯度消失现象和传统卷积神经网络感受野的限制问题,本文提出了一种引入多尺度卷积滤波器的光谱-空间特征提取方法。该方法包括光谱特征提取和空间特征提取两个部分。在光谱特征提取部分,将双向长短时记忆网络与波段分组策略相结合,在一定程度上缓解了因网络太深导致的梯度消失问题。在空间特征提取部分,在卷积神经网络的基础上引入多尺度卷积滤波器,使网络能够同时捕捉到细节特征和全局结构。同时将浅层特征与深层特征融合,从而提高分类性能。在两个数据集上的实验结果表明,该方法能够有效提高分类准确度。
2025年06期 v.47;No.390 712-721页 [查看摘要][在线阅读][下载 1894K] [下载次数:254 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 葛斌;郑海君;石怀忠;夏晨星;邬成;
红外-可见光行人重识别任务的目的是匹配同一身份的RGB图像和红外图像。由于两者的成像原理不同,因此难以高效地提取具有鉴别性的模态共享特征。为了解决这一问题,文中提出了模态共享特征增强模块和全局特征增强模块,联合两个模块提取增强全局特征的鉴别性。首先在骨干网络中加入模态共享特征增强模块,结合上下文信息缓解模态信息并强化模态共享特征。其次,在全局特征增强模块中对全局特征进行编码操作,联合损失函数在挖掘模式特征的同时进一步增强全局特征的鉴别性。最后采用互均值学习方式缩小模态差异,约束特征表示。本文在主流数据集上进行了实验,实验结果表明与现有方法相比,精度达到了较高的水准。
2025年06期 v.47;No.390 722-728页 [查看摘要][在线阅读][下载 900K] [下载次数:30 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 李才荣;王志社;李晋红;任乃奎;王春发;
红外成像的小目标通常缺乏明确的轮廓和纹理信息,导致仅依靠目标自身特征进行识别存在较大困难。为克服这一不足,本文提出了一种新型混频特征融合检测(mixed-frequency feature fusion detection, MFFD)模型,它通过充分聚合目标及周边背景的上下文信息,有效提升小目标检测性能。模型中的混频提取模块通过结合全局低频语义特征与局部高频目标细节,显著增强系统对弱小目标的感知能力;此外,模型中的多阶段融合模块通过高效协同不同级别特征的交互融合,促进更深层次的语义理解和空间信息的整合。在公开数据集NUAA-SIRST和IRSTD-1k中,MFFD-Net相较于其他五种基于深度学习的方法表现更优。与AGPC-Net相比,MFFD-Net在NUAA-SIRST数据集上的Io U和nIoU指标分别提升了4.42%和4.33%,在IRSTD-1k数据集上相应指标分别提升了3.63%和6.38%。这充分表明本模型在复杂背景下进行小目标检测具有较大的应用潜力。
2025年06期 v.47;No.390 729-738页 [查看摘要][在线阅读][下载 1103K] [下载次数:18 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 童金鑫;蒋刚;黄凯睿;陈清平;徐文刚;
红外热成像目标检测对机器人在野外环境实现全天候巡检有重要意义。针对机器人机载的嵌入式计算机运算能力不足、目标检测实时性低以及红外热成像图形的小目标分辨率低的问题。提出了一种基于YOLOv7改进的轻量级检测算法。首先,对网络进行结构化剪枝以提高在嵌入式计算机上运行的实时性,再构建自适应卷积层和无批次归一化处理模块改进骨干网络。然后,使用多速率空洞卷积与3D卷积提取高分辨率的尺度序列特征,再使用FPN将尺度序列特征做特征融合,增强小目标检测精度。最后,在预测阶段引入SIoU位置回归方法,提升回归速度和准确度。通过NVIDIA Jetson Xavier NX平台在夜间红外热成像数据集上验证表明,与YOLOv7相比,以mAP降低1.95%为代价换取了FPS 162%的提升,达到实时性检测的要求。
2025年06期 v.47;No.390 739-747页 [查看摘要][在线阅读][下载 1007K] [下载次数:20 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 张慧宁;张培航;
针对红外小目标图像特征提取较难、对比度低等问题,提出基于改进注意力机制的红外目标检测方法。首先在反注意力机制的基础上设计并联双通道的反向注意力机制,一个分支按空间注意力、通道注意力顺序操作进行,另一个分支按通道注意力、空间注意力顺序操作进行,这两个独立的分支并联使用,将它们的输出合并在一起。然后并联双通道反向注意力机制引入到Res2Net,并且在Res2Net增设改进区域强度水平模块。最后损失函数考虑全局约束损失函数和局部约束损失函数。仿真结果表明,本文算法视觉效果较好,精确率、ROC检测指标性能优于其他算法。
2025年06期 v.47;No.390 748-756页 [查看摘要][在线阅读][下载 1134K] [下载次数:63 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 屠晨浩;叶文亚;杜妮妮;郑彬淏;徐生;
红外小目标检测作为一项复杂且关键的计算机视觉任务,面临着目标尺寸微小、对比度低、背景噪声干扰强烈及数据稀缺等多重挑战,这些问题极大地制约了检测精度与实时性。现有基于深度学习的算法大多基于分割范式,通过设计结构较深的编码器-解码器网络实现分割掩码的生成,由于缺乏足够的特征表示和学习能力,在应对各种复杂场景时检测精度较低。鉴于此,受启发于人工智能领域扩散模型技术所取得的巨大成功,本文提供了一种新的解决思路,将红外小目标检测问题描述为生成式任务,并提出了一个条件去噪网络diff-ISTD。该网络利用逐步去噪与重建优势,挖掘图像内在深层次统计特性,从而能够更精确地区分并捕获微弱且易于混淆的小目标特征。具体来说,该网络包含条件分支网络以及去噪分支网络,分别用于充分提取红外图像的先验知识和细化含有噪声的掩码。此外,本文还设计了一种并行双维自注意力计算(PDSA)模块,融合空间与通道维度分析,极大增强了模型对全局结构和局部细节的把握力,克服了由分辨率和环境多样性引起的目标模糊难题。综合实验结果显示,diff-ISTD在面对极端检测条件时,相比目前先进的分割方法,展现出卓越的性能与更高的检测效率,为克服小目标检测领域的长期挑战开辟了新路径。
2025年06期 v.47;No.390 757-764页 [查看摘要][在线阅读][下载 1027K] [下载次数:50 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 林中骏;黄新栋;李争;
红外焦平面阵列传感器因制作工艺与材料限制,其探测单元在接收相同强度红外光时响应不一致,导致生成图像中存在显著的非均匀性噪声。为有效抑制该噪声,本文提出一种基于运动模糊图像的红外非均匀性校正算法。该算法利用红外运动模糊图像的特性,通过滑动窗口技术分离图像中的非均匀性噪声与场景信息,并基于分离出的噪声特征实现图像校正。实验结果表明,经本文算法校正后的图像,其非均匀性指标较原始图像显著降低了4.2%,有效提升了红外图像的成像质量。
2025年06期 v.47;No.390 765-769页 [查看摘要][在线阅读][下载 918K] [下载次数:15 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 申万科;李罗璟懿;方春华;江全才;陆杰炜;夏星宇;彭万钊;
提出了一种名为VA-Unet的语义分割模型,旨在解决传统分割方法在电气设备紫外检测任务中面临的复杂背景及小光斑分离困难、特征选取复杂、分割精准度低等问题。VA-Unet引入了VGG16特征提取模块和迁移学习,提高训练速度并增强模型泛化能力;同时,增加了注意力门(Attention Gate)以提高模型精度,从而实现对紫外图像放电光斑的精准分割。此外,VA-Unet采用混合损失函数代替单一损失函数,解决了紫外放电光斑数据集样本不平衡的问题。实验表明,VA-Unet模型在紫外图像放电光斑的精准定位和准确分割方面表现突出,其IoU,PA,F1-score评价指标分别达到84.09%,88.20%,91.35%,相较于初始U-net网络,分别提升了14.41%,3.24%,9.22%。
2025年06期 v.47;No.390 770-778页 [查看摘要][在线阅读][下载 1013K] [下载次数:341 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]