
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:5
- 浏览量:715
相关文章
暂无数据
面向无人机低空飞行的语义通信资源优化研究
Semantic Communication Resource Optimization for Low-Altitude UAV Flight
引言
随着低空经济纳入国家战略性新兴产业,无人机在物流配送、应急救援、环境监测等领域的规模化部署加速推进。然而,3000米以下低空信道呈现强时变、高动态特性,多径衰落与多普勒效应显著,传统“比特-centric”通信架构面临频谱资源紧张与语义失真双重困境。语义通信作为6G潜在关键技术,通过“先理解后传输”范式突破香农极限,为无人机受限带宽下的高效信息交互提供新路径。现有研究多聚焦单一语义模态或静态资源分配,缺乏对低空复杂信道与多任务需求的协同优化。本文针对无人机低空飞行场景,构建轻量化语义通信资源优化框架,探索深度强化学习与多目标优化的融合机制,以期为低空智联网的可靠传输提供理论支撑与技术参考。
1 绪论
1.1研究背景与意义
1.1.1研究背景
低空经济蓬勃发展,无人机在应急救援、城市管理、环境监测等领域广泛应用。但低空飞行面临严峻通信挑战:信道多径衰落严重,信号受地面、建筑物影响剧烈变化;多普勒频移显著,高速飞行造成频率偏移;非视距传输占比高,城市环境中障碍物导致信号无法直接传输。
传统比特中心通信架构频谱效率低、语义信息易失真。语义通信通过提取核心语义内容实现高效压缩,图像传输数据量可降低60%以上,有效提升通信效率。
1.1.2研究意义
理论意义:构建简化“语义—信道—资源”关联模型,为同类研究提供简洁建模思路;拓展轻量化强化学习算法应用。
实践意义:提供基础仿真方案,降低研究门槛,为小型无人机通信场景提供资源调度思路。
1.2 国内外研究现状
1.2.1语义通信技术研究进展
Nalluri等构建基于DCGAN的端到端图像传输系统,传输语义分割图更节省带宽。Pokhrel和Choi提出基于哈希的语义提取框架,实现低时延安全通信。郭疆远等提出自适应语义通信框架。张平等提出非线性变换编码传输框架,提升传输性能与鲁棒性。牛凯和张平构建语义信息论理论框架,建立语义熵、语义信道容量等度量体系。
1.2.2 无人机资源调度研究进展
Jiang等提出基于DRL的多任务资源调度框架MARS,最小化用户设备与UAV能耗。Tang等提出基于用户调度与轨迹优化的资源优化方法。刘建华等提出改进多目标深度确定性策略梯度算法,综合优化数据速率、能量、能耗、时延四项指标。
1.2.3现有研究不足与发展趋势
不足:缺乏“语义任务—信道状态—资源优化”一体化设计;现有算法基于静态信道假设,难以应对动态特性;多数研究仅优化单一目标。
趋势:语义优先级量化指引资源分配;强化学习与多目标优化结合;多机协同与轻量化设计成为关键。
1.3研究目的与内容
目的:构建简化关联模型;设计改进DQN算法;验证多目标平衡效果。
内容:系统模型构建、语义特征提取、改进型DQN算法设计、仿真实验验证。
2 概念与理论基础
2.1 核心概念界定
语义通信:核心在于信息意义的有效传送。三大环节:语义提取(CNN、Transformer)、高效编码(非线性变换、动态压缩)、协同推理(知识库、跨模态重建)。
低空信道特性(0-1000m):多径衰落剧烈(城市-20~-40dB)、多普勒频移显著(50~400Hz)、NLoS占比高(城市60%~85%,山区75%~90%)。随高度提升,衰落减小,NLoS概率下降。
2.2 理论方法支撑
深度学习:CNN用于图像特征提取,LSTM/GRU用于时序指令,Transformer实现全局建模(准确率90%~96%)。
深度强化学习:通过“状态—动作—奖励”交互实现动态决策。改进型DQN收敛500~800次迭代,频谱利用率85%~90%,语义错误率较传统算法降低30%以上。
多目标优化:采用加权求和型函数,权重依据场景动态调整。应急救援侧重语义保真度(权重0.5),环境监测侧重频谱效率(权重0.5)。
3 系统模型构建
3.1 分层信道与任务适配模型
| 场景类型 | 100m高度 | 500m高度 | 1000m高度 |
|---|---|---|---|
| 城市 | 衰落-35~-40dB NLoS概率75%~85% 时延扩展350~500ns | 衰落-28~-34dB NLoS概率60%~70% | 衰落-20~-27dB NLoS概率45%~55% |
| 乡村 | 衰落-18~-20dB NLoS概率30%~40% | 衰落-15~-17dB NLoS概率20%~30% | 衰落-10~-14dB NLoS概率10%~20% |
| 山区 | 衰落-45~-55dB NLoS概率85%~95% 时延扩展600~800ns | 衰落-40~-44dB NLoS概率75%~85% | 衰落-35~-39dB NLoS概率65%~75% |
语义任务限定:
感知类:高清图像侦察(15~25MHz,≤50ms,SSIM≥0.85)、视频实时回传(20~30MHz,≤30ms,SSIM≥0.90)
控制类:飞行指令传输(1~3MHz,≤10ms)、应急指令下发(2~5MHz,≤5ms)
3.2端到端语义通信架构
编码层:Transformer(4头注意力,维度256)提取文本特征,CNN(5层卷积)提取图像特征。动态压缩比 r(t) = r0·C(t)/C0 根据信道容量实时调整。
信道层:联合衰落模型涵盖多径衰落、多普勒频移、阴影衰落。
解码层:引入SSIM/BLEU评估,闭环反馈动态调整压缩比。
3.3资源约束与优化空间
二元资源:频谱资源(感知类5~30MHz,控制类1~8MHz);功率资源 P_total = P_t + P_c + P_s(传输、计算、存储功率)。
约束条件:功率ΣPi ≤ P_max(5~30W);带宽ΣBi ≤ B_total(40~120MHz);时延 T_encode+T_transmit+T_decode ≤ T_th(5~100ms)。
4 改进型DQN算法设计
4.1 状态与动作空间定义
状态向量(12维):信道特性(衰落因子、多普勒频移、NLoS概率、时延扩展)、任务需求(任务类型、语义优先级、带宽需求占比)、资源状态(频谱/功率利用率、压缩比、语义保真度、传输时延)。
| 动作类型 | 取值范围 | 调整步长 | 约束依据 |
|---|---|---|---|
| 频谱分配a1 | [8,16,32,64,128]子载波 | 8 | 总子载波≤256 |
| 功率分配a2 | [3,5,8,12,18,25]W | 2-7W | 最大功率≤30W |
| 动态压缩比a3 | [0.3,0.5,0.7,0.8,1.0,1.2] | 0.1-0.2 | 压缩比1:20~1:120 |
4.2 奖励函数优化设计
核心指标加权:R = ω1η_spec + ω2η_power + ω3Q_norm + ω4(1-T_norm)
| 应用场景 | ω1(频谱) | ω2(功率) | ω3(语义) | ω4(时延) |
|---|---|---|---|---|
| 应急救援 | 0.20 | 0.10 | 0.50 | 0.20 |
| 环境监测 | 0.50 | 0.20 | 0.20 | 0.10 |
| 物流配送 | 0.30 | 0.10 | 0.20 | 0.40 |
| 城市管理 | 0.35 | 0.15 | 0.30 | 0.20 |
惩罚机制:R_total = R - Σλ_k I_k。功率超上限λ=5.0,带宽超上限λ=4.5,时延超阈值λ=4.0,语义错误率超标λ=6.0。
4.3训练策略与复杂度控制
优先级经验回放:根据TD误差分配优先级,收敛速度提升约30%。
| 网络层 | 神经元数 | 激活函数 | 输出维度 | 计算复杂度(FLOPs) |
|---|---|---|---|---|
| 输入层 | 12 | - | 12 | 0 |
| 隐藏层1 | 64 | ReLU | 64 | 768 |
| 隐藏层2 | 32 | ReLU | 32 | 2048 |
| 输出层 | 8 | Linear | 8 | 256 |
| 总计 | - | - | - | 3072 |
单次前向传播≤2ms,满足实时性要求。
5 仿真实验与结果分析
5.1 实验环境与评估指标
环境:Matlab2024b(信道建模、资源分配),Python3.10+PyTorch2.1(DQN训练)。数据集:文本语义8000条指令,图像语义20000张场景图像。
指标:资源利用率(频谱、功率)、语义保真度(SSIM、BLEU、错误率)、传输性能(时延、丢包率)。
5.2 实验结果
| 场景类型 | 频谱利用率(%) | 功率利用率(%) | SSIM | BLEU | 平均时延(ms) | 丢包率(%) |
|---|---|---|---|---|---|---|
| 城市 | 86.2 | 82.5 | 0.89 | 0.94 | 31.5 | 1.2 |
| 乡村 | 90.5 | 87.8 | 0.94 | 0.97 | 22.3 | 0.5 |
| 山区 | 80.3 | 76.7 | 0.83 | 0.90 | 42.6 | 2.1 |
乡村性能最优,山区满足通信需求,算法能自适应信道状态。
| 应用场景 | 频谱利用率(%) | 语义保真度 | 平均时延(ms) | 约束满足率(%) |
|---|---|---|---|---|
| 应急救援 | 78.5 | 0.92 | 34.8 | 99.0 |
| 环境监测 | 89.7 | 0.87 | 49.2 | 98.5 |
| 物流配送 | 82.3 | 0.89 | 27.6 | 98.8 |
| 城市管理 | 85.6 | 0.90 | 32.1 | 99.2 |
所有场景约束满足率≥98.5%,实现多目标精准平衡。
| 算法类型 | 收敛迭代次数 | 频谱利用率(%) | 语义错误率(%) | 平均时延(ms) |
|---|---|---|---|---|
| 传统DQN | 1150 | 79.3 | 4.8 | 38.6 |
| DDPG | 1420 | 76.5 | 5.2 | 41.2 |
| MARS | 880 | 82.6 | 3.5 | 33.8 |
| 改进型DQN | 650 | 86.2 | 2.1 | 31.5 |
改进型DQN收敛速度提升30%~54%,频谱利用率提升3.6%~9.7%,语义错误率降低2.7个百分点。
6结论
简化建模:划分LoS/NLoS场景,设计端到端架构,聚焦频谱与功率二元资源。
算法设计:改进型DQN构建12维状态向量,采用加权奖励与惩罚机制,轻量化网络仅3072 FLOPs。
性能验证:三场景频谱利用率均≥80%,约束满足率≥98.5%;较传统算法收敛速度提升30%,频谱利用率提升5%-8%,语义错误率降低2%-3%。
参考文献:
- [1] 刘建华,李国华,刘佳嘉,等.无人机辅助无线供电移动边缘计算系统的多目标优化[J].电子与信息学报,2025,47(12):1-14.
- [2] 黄靖洪,孙梦颖,韩书君,等.面向6G卫星通信的语义通信技术展望[J].中兴通讯技术,2024,30(05):3-8.
- [3] 郭畅,何占豪,杨君刚,等.图像语义通信技术综述与展望[J].电讯技术,2025(02):1-12.
- [4] Nalluri S S, Kumar G A E S, Arumulla D K, et al. Enhanced semantic communication in6g networks using DCGAN[C]//International conference on broadband communications, networks and systems.2025.
- [5] Pokhrel S R, Choi J. Understand-before-talk (UBT): A semantic communication approach to6G networks[J].IEEE transactions on vehicular technology,2022,72:3544-3556.
- [6] 郭疆远,陈为,艾渤.面向铁路入侵检测的语义通信技术[J].中兴通讯技术,2025(04):45-51.
- [7] 张平,戴金晟,张育铭,等.面向语义通信的非线性变换编码[J].通信学报,2023,44(04):1-14.
- [8] 牛凯,张平.语义通信的数学理论[J].通信学报,2024,45(06):7-59.
- [9] Jiang F, Peng Y, Wang K, et al. MARS: A DRL-based multi-task resource scheduling framework for UAV with IRS-assisted mobile edge computing system[J].IEEE transactions on cloud computing,2023,11(04):2345-2358.
- [10] Tang J, Huang J, Wang B, et al. Resource optimization of multi UAV assisted communication system based on user scheduling[J]. Journal of Beijing University of aeronautics and astronautics,2025,51(04):1143-1151.
