基于UNet++的硝化棉团块语义分割方法研究

卿蕊; 黄月苹; 曾睿嘉; 郑钰琪; 夏培惠; 喻洋

当前位置：首页 > 科学研究与应用 > 基于UNet++的硝化棉团块语义分割方法研究

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
648

基于UNet++的硝化棉团块语义分割方法研究

Research on Semantic Segmentation Method of Nitrocellulose Agglomerates Based on UNet++

发布时间：2026-03-31

作者: 卿蕊,黄月苹,曾睿嘉,郑钰琪,夏培惠,喻洋 :泸州职业技术学院智能制造与汽车工程学院四川泸州;

摘要: 针对高含氮量硝化棉后处理工序中湿态团块物料难以自动识别的问题，提出了一种基于UNet++的语义分割方法。采集了2000余张现场实测图像，涵盖多种生产批次和冲洗阶段，真实保留了硝化棉在实际工况下的形态学特征。采用UNet++网络构建分割模型，通过密集嵌套跳跃连接实现多尺度特征融合，选用smoothL1损失函数并以Adam优化器进行训练。实验结果表明，UNet++模型的mDice系数和mIoU分别达到96.75%和94.86%，较VGG-16、ResNet-34和U-Net模型分别提升15.70%、11.94%和7.18%，显著改善了边缘模糊团块的分割精度。该方法无需对原始图像进行干燥、压片等预处理，为硝化棉出料过程的智能化监控提供了有效的技术支持。

Abstract: To address the challenge of automatic recognition of wet agglomerate materials in the post-processing of high-nitrogen nitrocellulose, a semantic segmentation method based on UNet++ is proposed. More than 2,000 field-measured images were collected, covering multiple production batches and rinsing stages, authentically preserving the morphological characteristics of nitrocellulose under actual working conditions. The UNet++ network was employed to construct the segmentation model, achieving multi-scale feature fusion through dense nested skip connections. The smoothL1 loss function was adopted and optimized using the Adam optimizer. Experimental results demonstrate that the UNet++ model achieves mDice coefficient and mIoU of 96.75% and 94.86%, respectively, representing improvements of 15.70%, 11.94%, and 7.18% compared to VGG-16, ResNet-34, and U-Net models. The proposed method significantly enhances segmentation accuracy for edge-blurred agglomerates without requiring preprocessing steps such as drying or tableting of original images, providing effective technical support for intelligent monitoring of the nitrocellulose discharge process.

关键词: 硝化棉；语义分割；UNet++；深度学习；图像识别

Keywords: nitrocellulose; semantic segmentation; UNet++; deep learning; image recognition

引言

硝化棉是重要的含能高分子材料，其煮洗后以湿态团块（含水率≥25%）形式存在，需人工高压水枪疏解为悬浮液。该过程依赖经验判断，劳动强度大、稳定性差，制约智能化升级。深度学习语义分割技术可实现像素级物料识别，其中UNet++凭借密集嵌套跳跃连接，有效融合多尺度特征，提升边界分割精度，在工业检测中潜力显著。然而，针对硝化棉这类湿态、团聚、边缘模糊的特殊形态，相关研究仍匮乏。本文基于现场采集的真实图像，构建并评估UNet++模型，对比VGG-16、ResNet-34与U-Net，验证其在硝化棉团块分割中的优越性，为出料自动化提供技术支撑。

1 数据采集和预处理

本研究所用图像数据来源于合作生产企业高含氮量硝化棉后处理工序的现场实测。实验所用原始物料由北方化学工业股份有限公司提供，为反应釜内完成硝化反应后自然团聚形成的湿态硝化棉（含水率≥25%）。在企业安全规范许可及全程监管下，研究团队于硝化棉煮洗出料阶段开展图像采集工作。在现行工艺流程中，煮洗结束后硝化棉以不规则团块形式存留于煮洗槽内，如图1（a）所示。出料操作依赖人工操控高压水枪对团块进行定向冲击，通过调节水流方向与压力强度，逐步疏解团聚结构，使其转化为流动性良好的悬浮液，以便经泵输送至后续脱水与包装工序。该过程高度依赖操作人员对槽内物料分布状态的实时判断，需动态调整喷射角度与作用点，以确保团块充分分散并顺利排出。

图像采集同步覆盖出料过程的关键阶段，包括初始入槽状态、中间冲洗阶段及最终洗净状态。拍摄在自然光照环境下进行，并辅以便携式LED柔光灯以减少阴影与反光干扰。成像设备采用CanonEOSR5数码相机（30.3MP）搭配EF100 mm f/2.8L Macro IS USM微距镜头，固定拍摄距离约为30cm，光圈f/8、快门速度1/125s、ISO200，以保证图像曝光一致性与细节清晰度。所有样品均置于统一灰度背景板上，每次拍摄前手动确认对焦准确，并同步记录团块的空间姿态及其表面湿润特征，图1（b）展示了拍摄的硝化棉。

图1现场拍摄的硝化棉

所采集图像未经干燥、压片或人为整形等干预，真实保留了硝化棉在实际工况下的形态学特性，包括团块尺度、边缘模糊性、表面水膜反射以及内部孔隙结构等关键视觉信息。最终构建的数据集包含2000余张高分辨率图像，涵盖多个生产批次、不同冲洗阶段及多样化的团聚形态，为后续基于深度学习的硝化棉语义分割任务提供了具有工程代表性的训练与验证基础。

图像标注采用Label me工具对硝化棉团块区域进行像素级标注，将标注的区域命名为硝化棉，图2展示了原图和标注的掩码。所有图像统一重采样至256×256像素，作为模型输入时保持三通道RGB格式（256×256×3）。输入图像首先经由3×3卷积核进行初步特征提取，padding设为1以维持空间维度不变；后续网络各卷积层均采用ReLU激活函数引入非线性表达能力。

图2 硝化棉成团区域标注示意图

2 模型构架

本研究采用UNet++作为基础分割框架，该网络由Zhou等人提出，通过引入密集嵌套的跳跃连接结构，有效缓解了传统UNet中编码器与解码器之间语义鸿沟问题，显著提升了多尺度特征融合能力与分割边界精度。

UNet++的整体架构呈对称的编码器—解码器形式，包含一个主干编码路径（下采样路径）和多个并行的上采样路径，构成一个密集连接的“嵌套”U形结构，如图3所示。编码器由四个连续的下采样阶段组成，每一阶段包含两个3×3卷积层，后接ReLU激活函数与2×2最大池化操作，逐步提取高维语义特征并降低空间分辨率。与标准UNet不同，UNet++在解码器侧构建了多层级的子网络：在第l层（l=1,2,3,4），解码器不仅接收来自上一层的上采样特征，还通过密集跳跃连接聚合来自编码器同尺度及所有更浅尺度的特征图，实现跨尺度、多层次的特征复用与精细化融合。这种设计使得浅层高分辨率细节与深层强语义信息得以在多个粒度上协同优化，尤其适用于硝化棉团块这类边缘模糊、形态多变的目标分割任务。具体而言，每个节点X^l,d的输入为：

(1)

其中，l表示深度，d表示解码层级。

图3 UNet++结构示意图

在建立模型时，使用Python编程语言，计算工作平台配置为Intel(R) Core(TM) Ultra7265 KF(3.90 GHz，20核，48G RAM)和单个NVIDIA Quadro RTX5070ti（16GB）的GPU。实验过程中由于需要使用GPU加速，受限于GPU内存，batch size设置为16。将整个数据集分为训练集和验证集，其中80%的数据作为训练集，20%的数据集作为验证集。通过实验，初始的学习率设置为0.001。优化器选择一种随机梯度下降（SGD）的变体Adam算法。总共的迭代次数设置为100。为了避免过拟合，当验证集的loss长时间没有明显下降时就自动停止迭代计算。

在训练和优化神经网络中的权值时，损失函数用来衡量预测值和真实值之间的差距，也表示了梯度下降的方向。因为成团硝化棉分割的边缘是一个连续型的值，因此，smooth L1 loss被选择来评估预测值和真实计算结果之间的误差。其继承了L1 loss和L2 loss的优点，可以避免L2 loss的梯度爆炸，也比L1 loss更平滑。损失函数通过公式（2）计算。

(2)

式中表示真实值，表示预测值，表示样本点的个数。

值得注意的是，本工作未采用深度监督策略。尽管UNet++原始设计支持在多个解码层级输出辅助损失以加速训练，但消融实验表明，在本数据集规模（2000张图像）和任务复杂度下，仅使用最终输出层的损失函数即可获得最优泛化性能，且避免了多损失权重调参带来的不确定性。

3结果分析

为了验证模型的准确性，选择了VGG-16、ResNet-34和UNet三种经典的图像分割模型进行比较。其中，VGG-16模型包括13层卷积层和3层全连接层；ResNet-34模型包括34层卷积层、1层池化层、1层全连接层；UNet模型除跳跃连接与UNet++模型结构一致。其他学习率、迭代次数、批次大小等与UNet++模型设置相同。在表1比较了四种模型mIoU和mDice的结果，从表中可以发现增加跳跃连接的UNet++分割效果最好，mDice和mIoU分别达到96.75%和95.15%，对比另外三种模型有明显的效果提升。UNet++与VGG-16、ResNet-34、UNet三种模型的mDice相比，分别提高了15.70%、11.94%、7.18%；mIoU分别提高了16.42%、11.39%、6.88%，表明UNet++在分割成团硝化棉时具有更优的效果。

表1 不同模型分割准确性比较

模型	mDice系数（%）	mIoU（%）
VGG-16模型	83.62	81.51
ResNet-34模型	86.43	85.19
UNet模型	90.27	88.78
UNet++模型	96.75	94.86

在图4比较四种模型对成团硝化棉的分割结果，从图中可以发现，VGG-16模型的分割结果较为粗糙，边缘区域存在明显的欠分割现象，部分硝化棉团块的边界未能被完整识别，导致目标区域出现不规则的缺损，尤其在团块边缘模糊或存在水膜反光的位置分割精度较差。ResNet-34模型相比VGG-16有所改善，能够大致勾勒出硝化棉团块的整体轮廓，但在细节捕捉方面仍有不足，对于小型团聚体及边缘细微结构的识别能力有限，分割边界仍存在一定程度的锯齿化和不连续现象。UNet模型借助“U”型结构进行解码和编码，在边缘定位精度上有明显提升，能够较好地保持团块的几何形态，但对于复杂纹理区域和阴影重叠部分的识别仍显不足，个别区域出现过分割或欠分割的混合错误。UNet++模型展现出最优的分割性能，其密集嵌套的跳跃连接结构有效融合了多尺度特征信息，在硝化棉团块的边缘定位、形态保持及细节还原方面均表现优异。具体而言，该模型能够精准捕捉团块的不规则边界，准确区分湿润表面与背景的过渡区域，完整保留了内部孔隙结构的细节特征，分割结果与人工标注的结果吻合度最高，视觉效果最为清晰连贯。表明UNet++模型通过增强编码器—解码器间的特征融合能力，显著提升了硝化棉团块分割的准确性和鲁棒性，为工业生产环境中实现自动化物料状态监测提供了可靠的技术支撑。

图4 不同模型分割结果

4结论

本研究基于UNet++深度学习框架，构建了适用于湿态硝化棉团块语义分割的智能识别模型。通过引入密集嵌套跳跃连接结构，有效融合了多尺度特征信息，在自建数据集上取得了96.75%的mDice系数和94.86%的mIoU，较VGG-16、ResNet-34和U-Net模型分别提升15.70%、11.94%和7.18%，显著改善了边缘模糊团块的分割精度。该方法直接基于现场实测原始图像训练，无需人工预处理，为硝化棉后处理工序中物料状态的自动化监测与工艺参数优化提供了有效的技术支撑。

参考文献：

[1] 马秀芳.高聚物粘结炸药结构与性能的计算模拟研究[D].南京理工大学,2006.
[2] 向国富.含酸硝化棉快速安定处理及"氮量早知道"方法研究[J].弹箭与制导学报,2007,27(03):344-347.
[3] 苏童,王琳,班超,等.基于语义分割的中后期玉米行间路径导航线检测[J].农业机械学报,2024,55(10):275-285.
[4] 王新. PR U-Net:工业缺陷分割中的特征融合和渐进监督策略[J].建模与仿真,2024,13(04):4893-4903.
[5] 于双双,康帅,张建军,等.基于改进Unet++的双时相遥感图像建筑物损伤评估模型 [J]. 地球信息科学学报,2025,27(11):2741-2755.
[6] 付豪,张振利,陈源.改进UNet++模型的脑肿瘤图像分割算法[J].河北大学学报(自然科学版),2025,45(04):398-407.
[7] Zhou Z, Rahman Siddiquee M M, Tajbakhsh N, et al. Unet++: A nested u-net architecture for medical image segmentation[C]//Proceedings of the International workshop on deep learning in medical image analysis.2018.
[8] Zhou Z, Siddiquee M M R, Tajbakhsh N, et al. Unet++: Redesigning skip connections to exploit multiscale features in image segmentation[J]. IEEE transactions on medical imaging,2019,39(06):1856-1867.
[9] Yu Y, Chen S, Wei H. Modified UNet with attention gate and dense skip connection for flow field information prediction with porous media[J].Flow measurement and instrumentation,2023(89):102300.

科学研究与应用

Journal of Scientific Research and Applications

相关文章

基于UNet++的硝化棉团块语义分割方法研究

Research on Semantic Segmentation Method of Nitrocellulose Agglomerates Based on UNet++

引言

1 数据采集和预处理

2 模型构架

3结果分析

4结论

参考文献：