基于强化学习技术的四旋翼无人机控制系统文献综述-文献综述网

文献综述

文献综述1 、研究背景和意义四旋翼无人机具有结构简单，机动性强（可垂直起降，完成旋转、斜飞、翻转等各种复杂动作），操控方便等特点。

经过多年的发展，其控制器的设计也逐步趋于完善，从基础的PID控制器到先进的复杂控制算法，都在四旋翼上得到了测试及应用。

课题需熟悉四旋翼无人机硬件系统工作原理，与硬件系统关联，且包含传感器、控制器、安全报警等多个子系统，涉及控制系统设计、通信通讯、单片机等综合技术。

强化学习主要由智能体（Agent）、环境（Environment）、状态（State）、动作（Action）、奖励（Reward）组成。

智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信号（正奖励或者负奖励）。

随后，智能体根据新的状态和环境反馈的奖励，按照一定的策略执行新的动作。

上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。

目前四旋翼无人机大部分都采用经典控制方法进行控制律的设计，控制参数的选择和对被控对象数学模型的依赖一直是经典控制方法设计中需要克服的问题，研究人员往往需要对特定飞行器的结构、模型非常熟悉，才能设计出性能优秀的控制器。

针对此问题，本课题采用了一种基于深度强化学习算法方法的无人机控制律设计方法，以四旋翼姿态角和姿态角速率作为三层神经网络的输入数据，最终输出动作值函数，再根据贪婪策略进行动作的选取，通过与环境的不断交互，智能体根据奖惩信息来更新神经网络的权值，使得智能体朝着获得累积回报最大值的方向选取动作。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

以上是毕业论文文献综述，课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。