面向无人机低空飞行的语义通信资源优化研究

潘伟松; 褚鹏

当前位置：首页 > 科学研究与应用 > 面向无人机低空飞行的语义通信资源优化研究

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
715

面向无人机低空飞行的语义通信资源优化研究

Semantic Communication Resource Optimization for Low-Altitude UAV Flight

发布时间：2026-05-21

作者: 潘伟松,褚鹏 :西京学院陕西西安;

摘要: 低空经济推动无人机规模化应用，但低空信道多径衰落、多普勒频移、非视距传输等挑战使传统通信架构难以满足需求。语义通信通过提取核心语义信息实现高效传输，但现有研究存在融合不充分、模型复杂等问题。本文构建简化“语义—信道—资源”关联模型，将3000m以下低空划分为LoS/NLoS两类场景，设计适配文本与图像任务的端到端语义通信架构，聚焦频谱与功率二元资源；基于深度强化学习设计改进型DQN算法，构建12维状态向量，设计离散化动作集合，采用加权求和型奖励函数与惩罚机制，结合优先级经验回放与轻量化网络设计；通过Matlab与Python仿真验证，结果表明该算法在城市、乡村、山区场景下均能实现较高资源利用率，有效平衡语义保真度、传输速率与能耗，相较于传统DQN、DDPG等算法，收敛速度提升约30%、频谱利用率提升5%-8%、语义错误率降低2%-3%。

Abstract: The rapid development of the low-altitude economy has promoted large-scale applications of unmanned aerial vehicles (UAVs). However, challenges such as multipath fading, significant Doppler shifts, and high proportions of non-line-of-sight (NLoS) transmission in low-altitude channels make traditional communication architectures difficult to meet requirements. Semantic communication achieves efficient transmission by extracting core semantic information, yet existing research suffers from insufficient integration and overly complex models. This paper constructs a simplified "semantic-channel-resource" correlation model, dividing low-altitude areas below 3000m into two scenarios: LoS-dominated and NLoS-dominated. An end-to-end semantic communication architecture adapted for text and image tasks is designed, focusing on dual core resources of spectrum and power. Based on deep reinforcement learning, an improved DQN algorithm is proposed, constructing a 12-dimensional state vector and a discretized action set. A weighted sum reward function with penalty mechanisms is adopted, combined with prioritized experience replay and lightweight network design. Simulation verification through Matlab and Python demonstrates that the proposed algorithm achieves high resource utilization in urban, rural, and mountainous scenarios, effectively balancing semantic fidelity, transmission rate, and energy consumption. Compared with traditional DQN and DDPG algorithms, the convergence speed improves by approximately 30%, spectrum utilization increases by 5%-8%, and semantic error rate decreases by 2%-3%.

关键词: 无人机低空飞行；语义通信；资源优化分配；改进DQN；深度强化学习

Keywords: low-altitude UAV flight; semantic communication; resource optimization allocation; improved DQN; deep reinforcement learning

引言

随着低空经济纳入国家战略性新兴产业，无人机在物流配送、应急救援、环境监测等领域的规模化部署加速推进。然而，3000米以下低空信道呈现强时变、高动态特性，多径衰落与多普勒效应显著，传统“比特-centric”通信架构面临频谱资源紧张与语义失真双重困境。语义通信作为6G潜在关键技术，通过“先理解后传输”范式突破香农极限，为无人机受限带宽下的高效信息交互提供新路径。现有研究多聚焦单一语义模态或静态资源分配，缺乏对低空复杂信道与多任务需求的协同优化。本文针对无人机低空飞行场景，构建轻量化语义通信资源优化框架，探索深度强化学习与多目标优化的融合机制，以期为低空智联网的可靠传输提供理论支撑与技术参考。

1 绪论

1.1研究背景与意义

1.1.1研究背景

低空经济蓬勃发展，无人机在应急救援、城市管理、环境监测等领域广泛应用。但低空飞行面临严峻通信挑战：信道多径衰落严重，信号受地面、建筑物影响剧烈变化；多普勒频移显著，高速飞行造成频率偏移；非视距传输占比高，城市环境中障碍物导致信号无法直接传输。

传统比特中心通信架构频谱效率低、语义信息易失真。语义通信通过提取核心语义内容实现高效压缩，图像传输数据量可降低60%以上，有效提升通信效率。

1.1.2研究意义

理论意义：构建简化“语义—信道—资源”关联模型，为同类研究提供简洁建模思路；拓展轻量化强化学习算法应用。

实践意义：提供基础仿真方案，降低研究门槛，为小型无人机通信场景提供资源调度思路。

1.2 国内外研究现状

1.2.1语义通信技术研究进展

Nalluri等构建基于DCGAN的端到端图像传输系统，传输语义分割图更节省带宽。Pokhrel和Choi提出基于哈希的语义提取框架，实现低时延安全通信。郭疆远等提出自适应语义通信框架。张平等提出非线性变换编码传输框架，提升传输性能与鲁棒性。牛凯和张平构建语义信息论理论框架，建立语义熵、语义信道容量等度量体系。

1.2.2 无人机资源调度研究进展

Jiang等提出基于DRL的多任务资源调度框架MARS，最小化用户设备与UAV能耗。Tang等提出基于用户调度与轨迹优化的资源优化方法。刘建华等提出改进多目标深度确定性策略梯度算法，综合优化数据速率、能量、能耗、时延四项指标。

1.2.3现有研究不足与发展趋势

不足：缺乏“语义任务—信道状态—资源优化”一体化设计；现有算法基于静态信道假设，难以应对动态特性；多数研究仅优化单一目标。

趋势：语义优先级量化指引资源分配；强化学习与多目标优化结合；多机协同与轻量化设计成为关键。

1.3研究目的与内容

目的：构建简化关联模型；设计改进DQN算法；验证多目标平衡效果。

内容：系统模型构建、语义特征提取、改进型DQN算法设计、仿真实验验证。

2 概念与理论基础

2.1 核心概念界定

语义通信：核心在于信息意义的有效传送。三大环节：语义提取（CNN、Transformer）、高效编码（非线性变换、动态压缩）、协同推理（知识库、跨模态重建）。

低空信道特性（0-1000m）：多径衰落剧烈（城市-20~-40dB）、多普勒频移显著（50~400Hz）、NLoS占比高（城市60%~85%，山区75%~90%）。随高度提升，衰落减小，NLoS概率下降。

2.2 理论方法支撑

深度学习：CNN用于图像特征提取，LSTM/GRU用于时序指令，Transformer实现全局建模（准确率90%~96%）。

深度强化学习：通过“状态—动作—奖励”交互实现动态决策。改进型DQN收敛500~800次迭代，频谱利用率85%~90%，语义错误率较传统算法降低30%以上。

多目标优化：采用加权求和型函数，权重依据场景动态调整。应急救援侧重语义保真度（权重0.5），环境监测侧重频谱效率（权重0.5）。

3 系统模型构建

3.1 分层信道与任务适配模型

表1 不同场景不同飞行高度的信道核心参数

场景类型	100m高度	500m高度	1000m高度
城市	衰落-35～-40dB NLoS概率75%～85% 时延扩展350～500ns	衰落-28～-34dB NLoS概率60%～70%	衰落-20～-27dB NLoS概率45%~55%
乡村	衰落-18～-20dB NLoS概率30%～40%	衰落-15～-17dB NLoS概率20%～30%	衰落-10～-14dB NLoS概率10%～20%
山区	衰落-45～-55dB NLoS概率85%～95% 时延扩展600～800ns	衰落-40～-44dB NLoS概率75%～85%	衰落-35～-39dB NLoS概率65%～75%

语义任务限定：

感知类：高清图像侦察（15~25MHz，≤50ms，SSIM≥0.85）、视频实时回传（20~30MHz，≤30ms，SSIM≥0.90）

控制类：飞行指令传输（1~3MHz，≤10ms）、应急指令下发（2~5MHz，≤5ms）

3.2端到端语义通信架构

编码层：Transformer（4头注意力，维度256）提取文本特征，CNN（5层卷积）提取图像特征。动态压缩比 r(t) = r0·C(t)/C0 根据信道容量实时调整。

信道层：联合衰落模型涵盖多径衰落、多普勒频移、阴影衰落。

解码层：引入SSIM/BLEU评估，闭环反馈动态调整压缩比。

3.3资源约束与优化空间

二元资源：频谱资源（感知类5～30MHz，控制类1～8MHz）；功率资源 P_total = P_t + P_c + P_s（传输、计算、存储功率）。

约束条件：功率ΣPi ≤ P_max（5～30W）；带宽ΣBi ≤ B_total（40～120MHz）；时延 T_encode+T_transmit+T_decode ≤ T_th（5～100ms）。

4 改进型DQN算法设计

4.1 状态与动作空间定义

状态向量（12维）：信道特性（衰落因子、多普勒频移、NLoS概率、时延扩展）、任务需求（任务类型、语义优先级、带宽需求占比）、资源状态（频谱/功率利用率、压缩比、语义保真度、传输时延）。

表2 动作集合及取值范围

动作类型	取值范围	调整步长	约束依据
频谱分配a1	[8,16,32,64,128]子载波	8	总子载波≤256
功率分配a2	[3,5,8,12,18,25]W	2-7W	最大功率≤30W
动态压缩比a3	[0.3,0.5,0.7,0.8,1.0,1.2]	0.1-0.2	压缩比1:20~1:120

4.2 奖励函数优化设计

核心指标加权：R = ω1η_spec + ω2η_power + ω3Q_norm + ω4(1-T_norm)

表3 不同场景的奖励函数权重系数

应用场景	ω1(频谱)	ω2(功率)	ω3(语义)	ω4(时延)
应急救援	0.20	0.10	0.50	0.20
环境监测	0.50	0.20	0.20	0.10
物流配送	0.30	0.10	0.20	0.40
城市管理	0.35	0.15	0.30	0.20

惩罚机制：R_total = R - Σλ_k I_k。功率超上限λ=5.0，带宽超上限λ=4.5，时延超阈值λ=4.0，语义错误率超标λ=6.0。

4.3训练策略与复杂度控制

优先级经验回放：根据TD误差分配优先级，收敛速度提升约30%。

表4 改进型DQN网络结构参数

网络层	神经元数	激活函数	输出维度	计算复杂度(FLOPs)
输入层	12	-	12	0
隐藏层1	64	ReLU	64	768
隐藏层2	32	ReLU	32	2048
输出层	8	Linear	8	256
总计	-	-	-	3072

单次前向传播≤2ms，满足实时性要求。

5 仿真实验与结果分析

5.1 实验环境与评估指标

环境：Matlab2024b（信道建模、资源分配），Python3.10+PyTorch2.1（DQN训练）。数据集：文本语义8000条指令，图像语义20000张场景图像。

指标：资源利用率（频谱、功率）、语义保真度（SSIM、BLEU、错误率）、传输性能（时延、丢包率）。

5.2 实验结果

表5 单场景下改进型DQN算法性能指标

场景类型	频谱利用率(%)	功率利用率(%)	SSIM	BLEU	平均时延(ms)	丢包率(%)
城市	86.2	82.5	0.89	0.94	31.5	1.2
乡村	90.5	87.8	0.94	0.97	22.3	0.5
山区	80.3	76.7	0.83	0.90	42.6	2.1

乡村性能最优，山区满足通信需求，算法能自适应信道状态。

表6 多场景下算法多目标性能指标

应用场景	频谱利用率(%)	语义保真度	平均时延(ms)	约束满足率(%)
应急救援	78.5	0.92	34.8	99.0
环境监测	89.7	0.87	49.2	98.5
物流配送	82.3	0.89	27.6	98.8
城市管理	85.6	0.90	32.1	99.2

所有场景约束满足率≥98.5%，实现多目标精准平衡。

表7 不同算法性能指标对比

算法类型	收敛迭代次数	频谱利用率(%)	语义错误率(%)	平均时延(ms)
传统DQN	1150	79.3	4.8	38.6
DDPG	1420	76.5	5.2	41.2
MARS	880	82.6	3.5	33.8
改进型DQN	650	86.2	2.1	31.5

改进型DQN收敛速度提升30%~54%，频谱利用率提升3.6%~9.7%，语义错误率降低2.7个百分点。

6结论

简化建模：划分LoS/NLoS场景，设计端到端架构，聚焦频谱与功率二元资源。

算法设计：改进型DQN构建12维状态向量，采用加权奖励与惩罚机制，轻量化网络仅3072 FLOPs。

性能验证：三场景频谱利用率均≥80%，约束满足率≥98.5%；较传统算法收敛速度提升30%，频谱利用率提升5%-8%，语义错误率降低2%-3%。

参考文献：

[1] 刘建华,李国华,刘佳嘉,等.无人机辅助无线供电移动边缘计算系统的多目标优化[J].电子与信息学报,2025,47(12):1-14.
[2] 黄靖洪,孙梦颖,韩书君,等.面向6G卫星通信的语义通信技术展望[J].中兴通讯技术,2024,30(05):3-8.
[3] 郭畅,何占豪,杨君刚,等.图像语义通信技术综述与展望[J].电讯技术,2025(02):1-12.
[4] Nalluri S S, Kumar G A E S, Arumulla D K, et al. Enhanced semantic communication in6g networks using DCGAN[C]//International conference on broadband communications, networks and systems.2025.
[5] Pokhrel S R, Choi J. Understand-before-talk (UBT): A semantic communication approach to6G networks[J].IEEE transactions on vehicular technology,2022，72:3544-3556.
[6] 郭疆远,陈为,艾渤.面向铁路入侵检测的语义通信技术[J].中兴通讯技术,2025(04):45-51.
[7] 张平,戴金晟,张育铭,等.面向语义通信的非线性变换编码[J].通信学报,2023,44(04):1-14.
[8] 牛凯,张平.语义通信的数学理论[J].通信学报,2024,45(06):7-59.
[9] Jiang F, Peng Y, Wang K, et al. MARS: A DRL-based multi-task resource scheduling framework for UAV with IRS-assisted mobile edge computing system[J].IEEE transactions on cloud computing,2023,11(04):2345-2358.
[10] Tang J, Huang J, Wang B, et al. Resource optimization of multi UAV assisted communication system based on user scheduling[J]. Journal of Beijing University of aeronautics and astronautics,2025,51(04):1143-1151.

科学研究与应用

Journal of Scientific Research and Applications

相关文章

面向无人机低空飞行的语义通信资源优化研究

Semantic Communication Resource Optimization for Low-Altitude UAV Flight

引言

1 绪论

1.1研究背景与意义

1.1.1研究背景

1.1.2研究意义

1.2 国内外研究现状

1.2.1语义通信技术研究进展

1.2.2 无人机资源调度研究进展

1.2.3现有研究不足与发展趋势

1.3研究目的与内容

2 概念与理论基础

2.1 核心概念界定

2.2 理论方法支撑

3 系统模型构建

3.1 分层信道与任务适配模型

3.2端到端语义通信架构

3.3资源约束与优化空间

4 改进型DQN算法设计

4.1 状态与动作空间定义

4.2 奖励函数优化设计

4.3训练策略与复杂度控制

5 仿真实验与结果分析

5.1 实验环境与评估指标

5.2 实验结果

6结论

参考文献：