基于深度学习的植物图像识别系统设计与实现

叶伊; 汪琛玉

当前位置：首页 > 科学研究与应用 > 基于深度学习的植物图像识别系统设计与实现

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
568

基于深度学习的植物图像识别系统设计与实现

Design and Implementation of a Deep Learning-Based Plant Image Recognition System

发布时间：2025-12-03

作者: 叶伊 :武汉东湖学院湖北武汉; 汪琛玉 :湖北师范大学文理学院湖北黄石;

摘要: 随着国家倡导生物多样性保护，植物图像的自动化识别成为提升分类效率的关键，传统的植物分类方法，难以应对复杂背景下的细粒度分类挑战。本文提出一种基于深度学习的植物图像识别系统。系统设计上，通过收集多样化植物图片，构建5600个自然场景图像的数据集，结合标注与数据增强技术，利用深度学习中卷积神经网络架构，通过卷积层进行特征提取，利用激活函数增强网络的非线性表达能力，最后通过池化层降低纬度防止过拟合问题，在预训练数据集上多轮训练实现90%的识别准确率。通过系统测试，将预训练模型进行多轮测试，测试结果均在80%以上，说明该系统在复杂光照、遮挡场景下保持高度鲁棒性，为植物学研究、农业发展等提供可靠的技术依据。

Abstract: With China's national advocacy for biodiversity conservation, automated plant image recognition has become crucial for improving classification efficiency. Traditional plant classification methods struggle to handle fine-grained classification challenges in complex backgrounds. This paper proposes a deep learning-based plant image recognition system. In the system design, we constructed a 5,600-image dataset of natural scenes by collecting diverse plant images. Combining annotation and data augmentation techniques, we utilized a convolutional neural network architecture from deep learning. The convolutional layers extracted features, while activation functions enhanced the network's nonlinear expression capabilities. Pooling layers were employed to reduce dimensions and prevent overfitting. Through multi-round training on the pre-trained dataset, we achieved 90% recognition accuracy. Through systematic testing, the pre-training model was tested for several rounds, and the test results were all above 80%, indicating that the system maintains a high degree of robustness under complex lighting and occlusion scenes, providing a reliable technical basis for botanical research and agricultural development.

关键词: 深度学习；卷积神经网络；图像识别；图像分类

Keywords: deep learning; convolutional neural network; image recognition; image classification

引言

图像识别是计算机视觉领域的重要概念之一。随着全球农业现代化和智能化进程的不断推进，植物图像识别技术在植物物种分类、病害检测、生态监测和农作物估产等领域得到了广泛应用，逐渐成为了推动智能农业发展的重要工具。植物分类是精准农业、生物多样性保护的核心基础，由于传统分类方法长期受限于技术、成本不足等瓶颈。传统分类法主要依赖形态学的人工分类，分类依赖专业经验，但分类结果容易受环境等因素的影响，且难以识别隐藏性状与模糊种间差异，面对复杂野外场景效率低下。随着深度学习的发展，卷积神经网络在图像识别上有了广泛研究，卷积神经网络能够自动提取图像深层特征，很好地弥补了传统特征提取的不足。本研究利用深度学习中的卷积神经网络模型进行智能分类，依据数据处理、特征提取进行分类，构建基于深度学习的植物图像识别系统，实现植物图像智能识别，为图像识别与深度学习领域研究提供新的参考方向。

1 深度学习在图像识别领域的应用现状

随着人工智能的高速发展，深度学习中各分类模型不断升级，图像识别领域主要依赖于深度学习模型，深度学习也在不断推动各行各业数字化智能化发展，推动技术从实验室走向多行业规模化应用，形成架构创新与场景落地并行的发展格局。

关于深度学习在图像识别中的应用较为广泛，主要集中研究各种模型的识别准确率的差别，对模型研究较多，其次为图像增强方法的研究。关键技术突破必定促成实用便捷性高效性。其中迁移学习与数据增强技术能够避免特征标注不精确导致的识别效率低的问题，E-FineR结合大型语言模型生成语义描述，在样本不足情况下也能够精确提取特征，例如王甘红等学者收集了163种常见中药材的图像数据集，通过迁移学习开发了5种卷积神经网络架构的AI模型，以自动识别这些中药材，实验结果发现EfficientNetB0模型在验证和测试过程中表现最佳。

其应用领域早已全面渗透，例如智能安防、医疗影像等，截止至今中国智能安防市场中图像识别贡献300亿元收入，医疗领域肿瘤筛查准确率超98%。植物识别、植物虫害等的应用在近几年比较火热，本研究基于深度学习进行植物图像识别系统的设计与实现为智能农业提供新的研究方向。

2 相关技术基础

2.1 深度学习

深度学习是机器学习的一个重要分支，深度学习包括简BP神经网络、卷积神经网络，共同性在于通过构建多层网络层，将多层数据进行联系与学习，最后总结提取特征信息。卷积神经网络是深度学习技术在计算机视觉领域最成功、最广泛应用的架构之一，它通过仿生学原理，模拟人类视觉皮层的处理机制。

CNN的技术基础在于其特殊的网络结构，由图1所示，主要包含卷积层、池化层和全连接层三个部分。卷积层主要基于输入图像中自动提取特征，通过使用多个滤波器在输入图像上滑动，识别局部特征并传递给后层，从而高效地提取局部特征。池化层则对特征图进行降采样与压缩，在保留最显著特征的同时减少数据维度，同时防止模型过拟合。激活函数为网络引入非线性，使其能够拟合复杂的映射关系。

在植物识别研究中，CNN具有的层次化特征提取能力很关键。网络先浅层学习植物的基础外观元素，到中层将这些元素综合为更复杂的模式如花瓣形状等，到深层则进一步抽象，从具体到抽象卷积神经网络最终实现高效特征提取。这种端到端的方式，避免了传统人工标注特征不够准确等问题，模仿人的视觉系统直接从原始像素中学习并优化用于分类的最有效特征。

图1 卷积神经网络基本结构

2.2 图像识别

图像识别是计算机视觉的核心任务，旨在让计算机自动理解图像内容并对其中包含的特定目标、场景或概念进行标识或分类。其技术发展经历了从传统数字图像处理到基于机器学习的模式识别，再到当今以深度学习为主导的演进过程。

由于传统的图像识别主要依据手工特征提取器提取特征，利用SIFT、HOG等算法来捕获图像局部梯度数据，再结合分类器进行识别，识别过程在特定约束下才能实现，图片特征表达有限，泛化能力较低，难以应对自然场景中复杂的背景、光照变化、视角变化及目标形态多样性等挑战。深度学习中卷积神经网络的出现，为图像识别提供了新的方向。利用卷积神经网络通过数据驱动的方式，能够自动从海量标注数据中学习具有高度判别性的特征，这种特征比手工标注特征更鲁棒，能更好地处理上述的不足。

在植物图像识别应用中结合深度学习进行探索的研究广泛，主要聚焦在技术的革新上。植物由于生长环境因素导致物种多样性繁多，同一物种在不同生长阶段、不同气候等外因下形态不同，同时存在不同物种间可能形态相似的问题。基于深度学习的图像识别系统通过端到端的学习，能够自动标注植物独特特征信息，能够整合植物的多尺度视觉信息，特征标注准确性高。不仅能够高效识别植物，还能提供识别的置信度，为植物学研究、生物多样性调查及农业智能化提供更为便捷的手段。

3 系统搭建与设计

3.1 系统实验环境

基于卷积神经网络的植物图片识别系统的实验环境需从硬件与软件两方面搭建，以保障模型训练效果与准确率。在硬件方面，采用高性能服务器作为实验主机，配置Intel处理器，为数据预处理与模型计算提供充足算力；搭载NVIDIA显卡，利用CUDA核心加速CNN网络的传播与参数更新，缩短训练周期；配备高内存，或者用虚拟机进行，满足大规模植物图片数据集的加载与缓存需求；存储采用2TB固态硬盘，保障数据集读取速度与实验文件存储稳定性。

软件环境上基于操作系统进行配置，该系统对深度学习框架兼容性强且运行稳定；编程语言采用Python 3，配合NumPy进行数值计算、Panda处理数据集标签、OpenCV完成植物图片的预处理；数据标注工具使用LabelImg，用于对自制植物图片数据集进行类别标注；实验过程中通过Anaconda管理虚拟环境，避免依赖包冲突，确保实验环境的可复现性。

3.2 系统总体功能结构

该系统的总体功能模块包括深度学习模型（卷积神经网络）、图像数据管理、图像识别任务、结果分析四个模块，如下图2所示，其中可以先对模型进行预训练，利用预训练的植物图片训练集进行预训练，其结果准确率达到80%以上即可进行正式测试。

在软件图像数据管理中可以增加删除或修改植物图片，包括图片尺寸等，对图片进行分类管理，在系统界面的主菜单上找到数据分类目录项；然后选择数据分类，系统展示数据分类列表；数据分类列表信息包括数据分类名称，图像类型，特征标签，数据来源，分类状态，可将已分类的数据进行移动保存或导出，将未标注的数据进行编辑，新增数据等操作，数据清洗完成后，进行任务创建，在任务创建中能对基于深度学习的图像智能识别系统中的进行编辑修改。

分组分布编辑对应项，更直观的对像完成基于深度学习的图像智能识别系统编辑修改，任务管理系统展示任务管理列表；任务管理列表信息包括任务名称，任务状态，创建时间，执行人员。在结果查看模块系统展示结果统计列表；结果统计列表信息包括结果统计名称，识别结果，识别数量，识别准确率，识别时间，可以查看结果统计对象的各项属性值，还可以查看列表中隐藏不显示的部分参数值。探索对比的结果对比的历史版本，深入了解它们在不同时间段内的变化和发展。通过直观的参数对比（结果对比名称，图像类别，识别精度，处理时间，置信度值），将能够清晰地看到每个版本的改进和创新之处。

图2 系统总体功能模块图

4 系统实现

4.1 植物图片识别模块测试

4.1.1 数据处理

训练过程首先对标注后的植物数据集按7:3划分为训练集、测试集，利用OpenCV实现随机翻转、旋转、亮度调整等数据增强，提升模型泛化能力。模型选用ResNet50作为基础架构，移除顶层全连接层后添加适配植物类别数的输出层，采用迁移学习策略加载预训练权重。训练时开启GPU加速，每轮结束后用验证集评估准确率，在卷积层中能够通过激活函数Softmax计算出置信度，作为模型的不确定性的依据。训练完成后，用测试集计算模型的精确率、召回率及F1值。

4.1.2 模型训练

在模型设计上选用的是深度学习中的卷积神经网络，训练过程中，卷积神经网络通过分层特征提取与映射实现植物图像分类。模型以ResNet50为基础CNN架构，其分类流程如下：首先，输入经预处理的224×224植物图像，通过底层卷积层（含3×3卷积核）滑动计算，提取叶片边缘、纹理等局部低级特征，同时利用ReLU激活函数引入非线性，增强特征表达能力；接着，通过池化层（如最大池化）对特征图下采样，在保留关键特征的同时降低维度与计算量，堆叠的卷积-池化模块逐步构建高级语义特征如叶片形状、花朵结构等植物类别关键特征。ResNet50的残差连接设计还能缓解深层网络梯度消失问题，保障复杂特征有效传递。

随后，将深层输出的高维特征图展平为一维向量，输入新增的全连接层进行特征整合与映射，最终通过适配植物类别数的输出层如10类植物对应10个输出节点，结合Softmax激活函数将输出转化为各类别概率分布，概率最高的类别即为模型预测的植物类别。训练中通过交叉熵损失计算预测值与真实标签的差异，利用Adam优化器反向更新CNN各层参数，使模型逐步学习到区分不同植物类别的关键特征，实现精准分类。由图3所示，在选择测试数据集后继续选择模型训练，可进行图示的模型训练的训练信息查询，包括训练名称，训练数据数量，训练轮数，模型预测试准确率，训练状态。

图3 系统模型训练

4.2 总体测试效果分析

在模型训练完成后，直接弹出训练的结果，如图4所示为其中一次花卉测试数据集的测试结果，分类中识别出玫瑰的数量为120，其准确率为90%，在测试完成后，可重新进行测试，也可以继续下一轮测试，在几轮测试完成后，可以对测试结果进行统计计算，如表1所示为三轮植物图片与花卉图片的测试结果，都以三轮的平均准确率、召回率进行计算得出F1的平均结果。表中植物与花卉的图片数据集进行测试的准确率均高于80%，说明该模型训练效果较好。

图4 系统训练结果

表1 测试结果

测试集	召回率	准确率	F1
植物图片	89.9	93.2	91.5
花卉图片	88.4	90.5	89.3

5 总结

该系统主要基于卷积神经网络中植物图像标注与分类进行研究，围绕深度学习技术、系统功能模块设计、系统测试分析进行阐述。其中系统功能模块设计涉及到模型选型卷积神经网络（CNN）架构，主要利用ResNet，通过残差连接解决梯度消失问题，利用卷积层进行细粒度特征提取，利用池化层进行特征图像压缩，从而输出高效识别结果。最终系统经过多轮测试，从识别准确率、召回率、F1三个量化维度进行评估。结果显示系统在基础植物类别上准确率达80%以上，但对于数据准确性仍然有发展空间，通过融合多模态数据，如叶片光谱、土壤数据等提升识别精度；其次通过引入小样本进行单独学习，解决珍稀植物数据稀缺问题；还可以延伸应用范围，与植物病害等结合研究，促进农业高效生产，为智能农业领域提供可行的研究方向。

参考文献：

[1] 周成. 一种基于卷积神经网络的植物识别方法[D]. 安徽农业大学, 2023.
[2] 马娜, 徐苗. 基于卷积神经网络的猪只个体身份识别研究[J]. 计算机时代, 2022(04):51-54.
[3] 魏敬涵. 深度学习技术在图像识别中的优化策略研究[J]. 信息与电脑, 2025, 37(01):56-58.
[4] 谭雅苧, 李倩, 王建标. 视觉智能发展与应用[J]. 电子技术与软件工程, 2019(08):240-241.

科学研究与应用

Journal of Scientific Research and Applications

相关文章

基于深度学习的植物图像识别系统设计与实现

Design and Implementation of a Deep Learning-Based Plant Image Recognition System

引言

1 深度学习在图像识别领域的应用现状

2 相关技术基础

2.1 深度学习

2.2 图像识别

3 系统搭建与设计

3.1 系统实验环境

3.2 系统总体功能结构

4 系统实现

4.1 植物图片识别模块测试

4.1.1 数据处理

4.1.2 模型训练

4.2 总体测试效果分析

5 总结

参考文献：