基于深度强化学习的无人清扫车自动循迹
信息与通信工程学院
Automatic tracking based on deeping reinforc learning for unmanned auto-sweeper
目前关于无人车,多运用传统的控制算法,它的控制基于对运行环境的理解,运用阿克曼转向理论对车辆的行驶轨迹进行估算。但是在计算过程中,不可避免地会存在近似,存在误差。
本项目主要是在此基础之上,给出一套具有可行的奖励反馈公式的强化学习算法,在通过仿真验证后,把算法装载到无人清扫车上,进行多次实地测试,最终使得无人清扫车能够成功作业。并且这套算法不需要理解环境,只是根据环境反馈试图拿到更大的奖励。这种奖励机制的学习能使人工智能本身在运行的过程中进行自我调节,引导车辆进行自主判断,从而跳过了计算的过程。最终利用这套算法实现无人清扫车成功作业。