基于受限二维装箱模型的核桃树单树检测

张驰; 沈占锋

当前位置：首页 > 科学研究与应用 > 基于受限二维装箱模型的核桃树单树检测

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
754

基于受限二维装箱模型的核桃树单树检测

Individual Walnut Tree Detection Based on a Constrained Two-Dimensional Bin-Packing Model

发布时间：2026-03-11

作者: 张驰 ,沈占锋 :中国科学院空天信息创新研究院北京，中国科学院大学北京;

摘要: 针对和田绿洲核桃树冠层密集重叠的单树检测难题，提出融合DeepLab v3+语义分割与启发式二维装箱模型的检测方法。实验证明该方法在GF-2影像上取得0.914的F1分数，具备高精度和良好适应性，可为经济林单树识别提供技术支持。

Abstract: To address the challenge of individual tree detection in the densely overlapping walnut canopies of the Hotan Oasis, this study proposes a detection method that integrates DeepLab v3+ semantic segmentation with a heuristic 2D bin-packing model. Experimental results demonstrate that the method achieves an F1-score of 0.914 on GF-2 imagery, exhibiting high precision and robust adaptability. This approach provides valuable technical support for the individual tree identification of economic forests.

关键词: 单树检测；深度学习；和田绿洲；核桃树

Keywords: individual-tree detection; deep learning; Hotan Oasis; walnut tree

引言

作为新疆干旱区特色经济林的核心优势树种，核桃不仅是南疆绿洲农业提质增效、农民稳定增收的支柱产业，更在抵御风沙侵蚀等生态治理中发挥着不可替代的作用。新疆核桃种植面积与总产量连续多年稳居全国首位，其中南疆干旱区贡献了全区95%以上的产量，是我国优质核桃的核心产区和出口基地。实现核桃树单木树冠的精准检测，是干旱区核桃园精细化管理、市场供需调控及特色产业可持续发展的核心技术支撑，对保障区域农业经济稳定具有重要现实意义。传统核桃单木检测依赖人工实地调查、样方实测与经验推算，不仅耗时费力、成本高昂，且受人为误差、采样代表性不足等因素影响，难以满足大尺度、高精度、高频次的监测需求。而遥感技术的快速发展为解决这一问题提供了有效途径，其中高分辨率遥感影像凭借对地表精细结构的精准刻画能力，在经济林单木识别与长势监测中展现出独特优势。针对上述问题，本研究提出一种融合深度学习语义分割与约束二维装箱模型的单木检测方法。首先，采用适配干旱区植被特征DeepLab v3+语义分割模型，实现核桃树与其他混生植被的精准分离；其次，基于南疆典型核桃单木的树冠直径、冠幅面积等实地实测数据，构建多尺度单木检测模板；再次，利用受约束二维装箱问题的启发式算法，将核桃集群连通区域视为“容器”，单木视为“待装箱物品”，通过空间与光谱约束下的模板匹配和贪心填充策略，实现集群区单木的精准分割与特征提取。研究以新疆和田绿洲地区为实验区，选取GF-2高分辨率遥感影像为数据源，结合实地调查获取的核桃单木样本开展方法验证。

1 方法

1.1 技术路线

图1为本研究方法的流程示意图。首先，利用语义分割模型实现核桃树及非核桃树的像素级分类，并进而生成纯净核桃树的连通域；然后，将簇生状态下的核桃树单株检测问题构建为受限二维装箱问题，其中把连通区域视作具备空间与光谱约束的容器，将不同规格的核桃树单株当作待填充物品，其优化目标设定为总体填充价值的最大化。基于研究区内散生核桃树的统计特性构建单树模板，设计了一种启发式模板匹配填充算法，此算法融合贪心策略下的大尺寸优先准则，并引入约束搜索机制，以趋近价值最大化填充。

图1研究单树检测方法流程示意图；(a-c) 基于核桃树语义分割结果生成对每个核桃树丛的连通域；(d) 基于农田内单树生成不同尺寸的统计模板；(e-h) 在每个连通域内进行基于受限二维装箱模型的最优化模板填充。

1.2 基于语义分割的像素级核桃树提取

本研究运用基于深度学习的语义分割方法，达成像素级别的核桃树冠区域自动提取，为后续的单树检测奠定基础。本研究采用DeepLab v3+模型作为语义分割器，这是在对比多种模型后选取的全局性能最优者。在训练过程中，选用Adam优化器，并采用指数衰减策略对学习率进行调整。损失函数采用Focal Loss，通过增加误分样本的权重，有效缓解核桃树语义分割中的类别不平衡问题。超参数则依据训练数据集和模型结构进行针对性的优化调整。在预测阶段，将输入影像划分为与训练尺寸相同的无重叠图像块，分别进行推理操作。训练及预测均对各图像块进行归一化处理，以降低卫星影像中大气条件和反射率差异所带来的干扰。预测结束后，将所有图像块拼接恢复至原始影像大小，生成对应的核桃树栅格分类结果。

1.3 核桃树单树检测

研究区内核桃树种植尺度差异显著，为构建具有代表性的单株核桃树模板提供了条件。首先，在样区内对所有可辨识的单株核桃树进行统一标注，并尽量减少主观筛选带来的偏差。随后构建一组具有中心像素的正方形模板，不同模板对应不同空间尺度。每一株单株核桃树根据其冠层面积被分配到最接近的模板尺度中，并将树冠中心与模板中心对齐，在此基础上统计模板范围内的多光谱均值，形成原始统计模板。

原始模板能够反映单株核桃树的平均光谱特征，但在簇生情形下，树冠之间的遮挡会导致光谱分布与单株情况存在差异。为增强模板的鲁棒性，本文不直接使用均值模板，而是基于树冠内部光谱分布规律构建光照不变的半经验模板。具体而言，在近红外波段中，树冠与背景反射差异较小，因此采用空间均匀的常值模板；而在可见光波段中，树冠中心区域反射率最低，向边缘逐渐升高，呈现典型的径向凹形分布。基于这一特征，通过参数化方式描述树冠由中心向外的连续变化，从而得到不同尺度下的统一数学模板。

簇生核桃树的识别通过模板匹配与填充流程完成。该过程可视为在核桃树连通区域内，逐步放置不同尺度模板以逼近真实树冠分布的问题。考虑到模板之间允许有限重叠但需避免重复检测，本文采用一种基于贪心思想的启发式策略。具体流程为：首先提取核桃树的连通区域，并生成初始锁定图以标识可检测区域。随后按照“先大后小”的原则，对不同尺度模板依次进行匹配。对于每个模板，通过局部窗口与模板之间的相似度计算得到适宜性分布，局部最优位置被视为候选树冠中心。在满足重叠约束和唯一性约束的前提下，候选位置被确认并写入树冠中心列表，同时更新锁定图，限制后续模板的搜索范围。该过程持续迭代，直至所有模板处理完成，从而实现对簇生核桃树的逐步拆分与定位。

从计算复杂度上看，算法主要开销来自连通区域的遍历以及多尺度模板的相似度计算，整体复杂度随图像像素数量和模板数量线性增长，能够满足高分辨率遥感影像的处理需求。

本研究采用基于单点标记的方法进行精度评定。在验证数据中，每棵核桃树的真实位置以其冠层中心的单一点进行标记。通过算法建立预测单树点与真实标记点之间的一一对应关系，匹配时设定了一个最大欧氏距离容差为3像素。在此基础上，精度评定的指标计算如下：真正例（TP）：被成功匹配的正确预测点数量；假正例（FP）：未被匹配到真实点的多余预测点数量；假负例（FN）：未被任何预测点匹配到的真实点数量。基于上述定义，采用精确率（P）、召回率（R）与F1分数作为单树检测的主要评价指标，其计算公式如下：

	（1）
	（2）
	（3）

2 实验

2.1研究区及数据集

和田绿洲位于新疆南部干旱区，是我国核桃主产区之一，核桃广泛种植于农田与林地交界地带，种植模式多样但结构不规范，呈现散落与成片混合分布。研究选取典型核桃种植区域，覆盖不同土壤、灌溉条件和树龄分布。实验数据基于GF-2遥感影像，采集于2024年6—10月，共28景，均完成辐射和几何校正、配准与融合处理。构建了两类数据集：语义分割数据集（40张512×512图像）用于树冠提取，单树检测数据集（162张240×240图像）用于个体定位，标注结合实地核查以提升精度。

2.2 参数实验结果

重叠锁定阈值（Locking Threshold, LT）是本文后处理阶段中对单树检测精度影响最为显著的可调参数之一，用于模拟实际核桃树冠之间的重叠关系。LT值的范围为0到1，其中LT=1表示树冠之间没有重叠，LT=0表示树冠重叠没有限制。值得注意的是，较小的树冠受LT的影响更大。当在算法中全局应用相同的LT时，存在丢失一些较小树冠的风险。为了避免这种情况，我们专门对最小模板（5×5像素）应用了较小的LT。这个较小的LT被称为MLT (Minimum LT)；剩余的模板大小都被分配了一个统一且更大的LT，称为GLT (Global LT)。随着LT值的增加，检测的树冠数量减少。如果LT太大，过于严格的重叠限制会导致许多漏检，从而导致召回率下降。相反，如果LT太小，过于宽松的重叠限制会导致检测到太多的树冠，从而导致精度显著降低。GLT和MLT值较低会导致检测到的树总数增加，这种效应在密集树丛中尤为显著。MLT的引入显著提高了算法的性能，实验表明，当GLT=0.9和MLT=0.8时，该算法在单树测试集上取得最佳性能，F1分数为0.914。

2.3 和田绿洲单树提取结果

基于前述实验确定的最优参数与模型，本研究对和田绿洲的核桃树进行了单树尺度的自动识别与提取。结果表明，如图2所示，在整个研究区内共成功提取出核桃树2,859,203棵，提取结果的F1分数达到0.914，证明了方法在区域尺度应用中的高精度与可靠性。从空间分布特征来看，核桃树因其显著的经济价值，在农户种植积极性高的驱动下，广泛分布于和田绿洲的整个灌溉区域。本次提取核桃单树数据集为区域尺度经济林精细监测提供了支撑。在经营模式方面，和田绿洲仍以传统小农经营为主导，这直接影响了核桃树的种植结构与空间形态。核桃树大量与其他农作物进行套种，形成了典型的农林复合系统，同时种植模式呈现多样化但不规范的特点，兼具散落种植与成片种植两种典型模式。值得注意的是，在集约化种植区域，由于栽植密度较大或管理粗放，导致相邻树木的树冠之间出现较高比例的重叠，增加了单树识别的难度。与现代规模化、标准化管理的果园相比，研究区内符合标准化种植与管理模式的核桃园数量相对有限。

该算法在检测单棵核桃树和小规模聚集的核桃树方面都表现良好。此外，提出的算法应用在大规模密集的核桃树丛也有稳定的表现，可以有效地处理大规模连通域内的间隙和阴影，在缺失个体信息的情况下依然能实现对单树点位的准确识别。

图2研究区的核桃树单树检测结果及局部放大图。

3讨论

本研究提出了一种基于二维装箱模型的启发式模板匹配与填充算法，用于干旱区中核桃单树检测。大量实验验证了该方法的优异性能，但同时也揭示了一些需要进一步探讨的技术挑战和局限性。

本文方法采用分步处理策略，其中语义分割阶段的误差会直接传递至单树检测阶段，产生明显的误差累积效应。为缓解这一问题，可考虑两种改进思路：一是引入误差校正机制，通过迭代优化提升整体精度；二是设计端到端的检测框架，直接从原始影像中识别核桃单树。然而，这两种策略都会增加算法复杂度并降低可解释性，尤其是端到端的检测算法，密集核桃树丛中缺乏个体信息，此类算法会产生严重的性能退化。

二维装箱问题属于NP完全问题，缺乏通用最优解法。本文采用的贪婪策略启发式算法虽在实验中表现良好，但所得解为近似解而非全局最优解。与多数启发式算法类似，本文方法对参数设置较为敏感。尽管我们通过参数优化仅保留了关键参数LT，但其他效率相关参数，如无效斑块过滤阈值、局部极值搜索深度等仍会隐式影响结果。参数空间的急剧扩张使得确定最优参数组合具有较大挑战。

本算法的核心是基于专门为簇生核桃树设计的检测模板，这些模板通过对研究区内农民散落种植的单树统计特征进行数学建模生成。实验表明，该模板对典型簇生核桃树具有优异的检测效果。然而，对于冠形特殊、光谱特征异常，或在秋冬季落叶期冠层形态不完整的个体，模板方法的适应性有限。这表明基于通用模板的填充策略在高度异质性场景中可能存在局限，此时传统的图像分割或目标检测方法可能更具优势。

4 总结

针对和田绿洲簇生核桃树冠密集重叠、边界模糊导致的单树检测难题，本研究提出了一种基于受限二维装箱模型的启发式模板匹配与填充算法。该方法首先采用基于全局精度最高的DeepLab v3+的语义分割模型提取纯净的核桃树连通分量，随后应用受约束二维装箱问题启发的启发式算法，实现连通分量内的单树检测。基于GF-2遥感影像的实验表明，本研究方法在核桃树单树检测任务中表现优异。基于原始统计模板生成的数学模板具有良好的稳定性，最优模板边长范围为[5~11]像素。参数实验确定研究区核桃树单树检测的最优参数设置为GLT=0.9，MLT=0.8，揭示当前种植模式下较高的树冠重叠率。最优配置下，算法在和田绿洲共检测出2,859,203棵核桃树，在包含162张小块影像的测试集上取得了0.914的F1分数。未来的研究工作将重点围绕以下方面展开：一是通过并行计算优化提升大范围应用的算法效率；二是探索该方法在不同影像源和不同树种检测任务中的推广适用性；三是进一步研究如何降低算法对模板参数的敏感性，增强方法的鲁棒性。

参考文献：

[1] 陆妍如,毛辉辉,贺琰,等.基于Deeplab v3+的高分辨率遥感影像地物分类研究[J].地理空间信息,2022,20(06):1-6.
[2] 李和兵,穆振侠,洪明,等.干旱半干旱地区成龄核桃灌水方式优选[J].节水灌溉,2013(06):36-39+42.
[3] 卢丹妮,张新焕,杨德刚,等.新疆农业要素演化及其对绿洲的影响机理——基于千年屯垦史的系统性解读[J].地理研究,2025,44(09):2335-2353.
[4] 张琳翔,郭勇,王浩宇,等.基于DE-Segformer的无人机影像农业大棚信息提取方法[J].测绘工程,2024,33(02):56-64.

科学研究与应用

Journal of Scientific Research and Applications

相关文章

基于受限二维装箱模型的核桃树单树检测

Individual Walnut Tree Detection Based on a Constrained Two-Dimensional Bin-Packing Model

引言

1 方法

1.1 技术路线

1.2 基于语义分割的像素级核桃树提取

1.3 核桃树单树检测

2 实验

2.1研究区及数据集

2.2 参数实验结果

2.3 和田绿洲单树提取结果

3讨论

4 总结

参考文献：