基于深度强化学习的车道保持与自适应巡航系统研究文献综述

 2023-08-03 15:20:00
  1. 文献综述(或调研报告):

1.前言

现行的自动驾驶技术仍处在较为初级的阶段,许多技术都还不够成熟,在实际应用中都存在各自的不足。但我们可以看见,最近几年来无人驾驶技术正在以较快的速度发展中。而汽车跟驰功能和车道保持辅助功能在无人驾驶领域中都占有了相当重要的地位。因此在无人驾驶领域,对这两项技术的研究也一直都是行业的热点。

2.汽车跟驰技术现况

汽车跟驰理论作为一项较为基础的自动驾驶理论,学者们针对其先后提出了GM跟驰模型[1]、安全距离模型[2]、模糊推理模型[3]和生理-心理模型等跟驰理论模型[4]。这些模型根据各自的不同侧重点进行建模并求解跟驰方程以得到任意时刻车队中各车辆的速度、加速度和位置参数等数据。其中生理-心理模型由于充分考虑了驾驶员的生理、心理因素对对驾驶行为的影响和制约及由此产生的不同驾驶行为,同时从建模方法上也更接近实际情况,因此比起其他模型能更加贴切地描述我们日常中的真实驾驶行为[5]。然而由于生理-心理模型的参数较多,子模型之间的相互关系较为复杂,且对各项阈值调查和观察都相对困难,因此其在实际应用中仍存在着一定的不足。

3.车道保持辅助系统现况

车道保持辅助功能由于其在辅助驾驶领域中的重要性及其现今就已经可以应用在许多低级别的自动驾驶汽车上以辅助人类驾驶员进行汽车操控从而有效减少交通事故[6],因而近几年来逐渐成为各汽车公司争相发展和研究的重要技术[7]。现有的车道保持辅助系统所采用的方法也各式各样,而其也因各自侧重点不同而有各自的优缺点。例如,于立娇[8]提出的多模式未来跨道时间(Time to Lane Crossing,TLC)和未来偏移距离(Future Offset Distance,FOD)的车道保持联合预警算法,其TLC算法假设车辆保持当前运动状态不变,并计算从当前位置至左右前轮触及车道边界线所精力时间,而FOD算法预测前视时间后车辆的侧向位置并与虚拟车道边界线对比,从而判断是否需要启用车道保持功能。该方法已在仿真试验中被证明优于单一预警方法。Angkititrakul[9]等基于TLC与虚拟车道边界相结合的方法,设计模糊规则,动态调整虚拟车道宽度的车道保持方法,在一定程度上可以降低车道保持系统的误警率。单峻杉[10]等利用人工势场法设计了车道保持横向控制算法,且将线性轮胎模型扩展为了非线性轮胎模型,并通过仿真验证了其在极限工况下的稳定性。此外,还有基于单点预瞄驾驶员模型的车道保持系统[11],较与其他算法,结构简单且运算量小,因此应用也甚广。然而上述当前的车道保持系统主要都是根据摄像头的视觉输入判断汽车偏离当前车道的趋势,当不同的算法检测到汽车即将偏离当前车道时便会向驾驶员发出提醒,驾驶员若未在一定时间内做出反应,那么控制器将会操控汽车转向系统调节方向盘转角,使得汽车继续保持在当前车道行驶[12]。如图1所示为一般的车道保持辅助系统安全预警模型。

图1 车道保持辅助系统的安全预警模型[30]

4.现有无人驾驶技术的局限性

我们可以看到,现如今许多的无人驾驶技术包括汽车跟驰技术和车道保持辅助都还是基于规则策略的算法即当识别到已预设的交通情况时采取对应的唯一预设动作,或是基于监督学习的策略,即通过已预先采集的静态数据进行学习及训练智能体,再将训练完成的智能体应用于无人驾驶[13]。然而以上两种无人驾驶技术都存在着各自的问题:基于规则策略的算法需要工程师事先罗列出尽可能多的可能遇到的交通情况并一一设定相应的应对操作,然而现实中的交通状况是千变万化且十分复杂的,通过事先的罗列难以囊括所有可能出现的情况,因此在实际驾驶中若策略算法遇到尚未预设的交通情况可能无法做出及时的正确响应从而导致交通事故的发生,这是我们不愿看到的;而基于监督学习的策略虽然不是由工程师手动进行可能遇到情况的预设,而是由机器根据给定的经验数据进行自主学习并生成相应的行动策略,在一定程度上拥有更好的泛化能力,然而由于经验数据的有限性,训练后的策略依然无法应对尚未囊括在经验数据中的情况[14]

5.深度强化学习的应用和近况

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。