基于规划步数自适应Dyna-Q 的多功能雷达干扰决策方法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

复杂电磁环境效应国家重点实验室项目(2020Z0203B)


Multi-function Radar Jamming Decision Method Based onPlanning Steps Adaptive Dyna-Q
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对基于强化学习的干扰决策方法存在着收敛速度过慢的问题,在Dyna-Q 算法的基础上提出一种规划 步数自适应的Dyna-Q 干扰决策算法。在保证干扰策略有效性的前提下,提升强化学习算法的收敛速度,使算法能 以更快的速度学习到最优干扰策略。实验与仿真结果表明:该算法能实现多功能雷达干扰的实时有效,也可扩展到 其他强化学习应用领域,具有一定借鉴价值。

    Abstract:

    Aiming at the problem of slow convergence speed of jamming decision method based on reinforcement learning, a jamming decision algorithm with selfadaptive planning steps based on Dyna-Q algorithm is proposed. On the premise of ensuring the effectiveness of the jamming strategy, the convergence speed of the reinforcement learning algorithm is improved, so that the algorithm can learn the optimal jamming strategy at a faster speed. The experimental and simulation results show that the algorithm can realize the real-time and effective jamming of multi-function radar, and can also be extended to other reinforcement learning applications, which has a certain reference value.

    参考文献
    相似文献
    引证文献
引用本文

朱霸坤.基于规划步数自适应Dyna-Q 的多功能雷达干扰决策方法[J].,2022,41(7).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-03-22
  • 最后修改日期:2022-04-28
  • 录用日期:
  • 在线发布日期: 2022-07-11
  • 出版日期:
文章二维码