论文相关信息

本文内容取自[1]

研究背景与意义

近年来,随着无人机感知、控制与通信技术的快速发展,遥操作无人机被广泛应用于搜索救援、环境监测等高风险或人类难以直接到达的场景。传统的直接遥操作模式中,操作者需全程负责无人机的航迹规划与避障控制,不仅要求其具备较高的专业技能与情境认知能力,而且在复杂、高危环境下极易因频繁操作而产生严重的认知疲劳。为缓解这一问题,融合自主决策能力的辅助空中遥操作模式逐渐兴起:人在回路中通过指令表达任务意图,无人机在此基础上自主规划具体飞行轨迹与动作策略,人机协同完成任务,在一定程度上降低了操作负担并提升了任务效率与安全性。

然而,辅助遥操作在改善操作负荷的同时,也引入了新的人机信任失衡问题。受限于无人机本身复杂的高维非线性动态特性以及遥操作终端感知能力的不足,操作者往往难以及时、准确地理解无人机当前状态与决策依据,造成信息不对称,从而诱发“过度信任”或“信任不足”两种极端:前者使得人在无人机产生错误行为时未能及时干预,可能导致任务失败甚至安全事故;后者则表现为频繁、甚至不必要的人工接管与路径修正,既加重了操作者负担,又削弱了无人系统的效率与优势。因此,如何在辅助遥操作场景下实现人对无人机的合理信任调节,使主观信任水平与无人机的客观性能动态匹配,已成为制约人机协同效能提升的关键瓶颈之一。

从现有研究来看,一方面,面向辅助空中遥操作的人机信任建模工作仍然相对薄弱,已有模型多针对地面机器人或自动驾驶场景构建,尚未充分考虑空域环境复杂性与遥操作感知受限等特点,难以直接迁移应用。另一方面,即便获得了合适的信任模型,如何将这种随时间变化的信任信息真正“落地”到无人机的规划与控制之中,使其能够根据操作者的实时信任水平自适应调整自主性与干预程度,也缺乏系统性的框架与方法。目前大多数辅助规划仅关注意图预测与轨迹生成,对信任这一关键人因变量缺乏显式建模与融合机制。

基于上述背景,本研究面向辅助空中遥操作场景中存在的人机信任失衡与认知负荷过高问题,拟构建适用于人–无人机协作任务的动态信任模型,并在此基础上设计一种面向信任感知的轨迹规划框架:一方面,通过融合无人机飞行安全性、环境可见度等多维指标,更精细地刻画人与无人机在任务过程中的信任演化规律,为理解和预测人机信任状态提供理论支撑;另一方面,将实时信任度显式引入轨迹规划与自主性调节机制中,在“过度干预”与“过度依赖”之间实现动态平衡,从而在保障安全性的前提下有效降低操作者负担、提升任务执行效率。该研究对于推动复杂动态环境下的人–无人机协同系统具有重要的理论研究价值和工程应用意义。

本文方法

本文提出了一种用于辅助空中遥操作的“信任感知”轨迹规划框架。该方法基于机器性能依赖(Machine-Performance-Dependent, MPD)人类信任模型,为客观系统性能与操作者信任之间建立起定量关联提供了基础。我们针对无人机遥操作场景对这一通用框架进行了适配与专门化,且关键在于将其集成进一个实时轨迹规划器之中。系统的工作流程如下: 1) 环境感知与局部地图构建:无人机前端的视觉场景系统获取当前环境信息,生成局部地图,并将该局部地图作为后续规划与评价的基础输入。 2) 人类输入与候选轨迹生成:操作者通过摇杆输入控制指令。系统将操作者输入与局部地图一起送入“人类引导轨迹生成”模块,在其中生成多条候选轨迹,并从中选出一条当前的最优候选轨迹。 3) 轨迹性能评价与信任估计:基于局部地图和当前候选轨迹,轨迹评价模块计算与安全性、可见度相关的指标;这些指标被送入 MPD 信任模型,用来估计此时操作者对无人机的信任水平,并随任务过程不断更新。 4) 基于信任的轨迹优化:估计得到的信任度输入到“轨迹优化”模块。首先根据当前信任水平对轨迹优化中的权重进行调整,然后由“信任感知优化器”在任务目标、环境约束和信任信息共同作用下生成最终执行轨迹,使辅助策略能随信任动态调节。 5) 轨迹跟踪与闭环反馈:轨迹跟踪模块根据优化后的轨迹控制无人机飞行。无人机实际运动产生的新状态和环境信息再次反馈给视觉场景系统和轨迹评价模块,从而不断更新局部地图和信任估计,形成一个持续循环的人机协同控制闭环。


图1 系统框架示意图

轨迹规划模块

轨迹规划模块的核心是在人意图引导下生成一组安全可行的候选轨迹。具体而言,系统首先利用四旋翼的可微分平坦性,将状态表示为 $\mathbf{x} = [x,y,z,\theta]^\top$,根据操作者通过摇杆给出的输入 $\mathbf{u}h = [v_x,\omega,v_z]^\top$,生成一个满足边界条件的八阶多项式人引导运动基元 $\gamma{\mathbf{u}_h}(t)$,用于指示期望飞行方向。

在此基础上,固定前向速度 $v_x$ 为人工输入值,对角速度 $\omega$、垂直速度 $v_z$ 和持续时间 $T$ 进行离散采样,逐步扩展形成运动基元树。每个候选基元均通过相同多项式生成过程获得,并需满足处于安全状态空间 $\mathcal{X}_\text{safe}$ 的硬约束,不安全轨迹直接剔除。为保证对齐人意图,对每个候选基元与人引导基元计算方向相似度代价$f_c^n = 1 - \mathbf{d}_n \cdot \mathbf{d}_h$,优先选择代价最小的节点继续扩展。树扩展至达到局部感知范围或节点上限后停止,通过连接不同深度节点即可得到一组无碰撞且方向贴合人意图的候选轨迹集合。

轨迹优化模块

首先,从运动基元树中选出期望的人类轨迹 $\xi^{*}$,并采用 MINCO 方法对轨迹进行重新参数化。MINCO 对含 $M$ 段的多项式轨迹进行时空解耦,将中间控制点 $\mathbf{q}$ 与时间分配 $\mathbf{T}$ 线性映射为多项式系数,从而得到便于优化的轨迹表示。在此基础上,轨迹优化问题被统一写为:

\[\min_{\mathbf{q},\mathbf{T}}\left[J_t,J_o,J_e,J_d\right]\cdot\bm{\lambda}\]

其中,$J_t$ 为执行时间惩罚,$J_o$ 为安全惩罚(与障碍物距离相关),$J_e$ 为控制能量惩罚,$J_d$ 为动态可行性惩罚;
$\bm{\lambda} = [\lambda_t,\lambda_o,\lambda_e,\lambda_d]^\top$ 为各惩罚项的权重向量。

在求解过程中,时间与安全相关的权重 $\lambda_t$ 与 $\lambda_o$ 会根据信任水平 $T = T_U^h$ 动态调整,以在效率与安全之间实现自适应平衡:

\[\lambda_t = \lambda_{t,0} + \Delta\lambda_t(T), \quad \lambda_o = \lambda_{o,0} + \Delta\lambda_o(T)\]

其中,$\Delta\lambda_t(T)$ 与 $\Delta\lambda_o(T)$ 分别为效率权重与安全权重的调整量,其形式为:

\[\Delta\lambda_t(T) = \frac{\Lambda_t}{1 + e^{-k_1(T - T_H)}}, \quad \Delta\lambda_o(T) = \frac{\Lambda_o}{1 + e^{k_2(T - T_L)}}\]

当信任较低时,系统提高安全权重、降低时间权重,以更保守方式规划轨迹;随着信任升高,逐步增强效率权重、减弱安全权重,在保证安全的前提下提升任务效率并减轻长期操作负担,从而实现“信任感知”的轨迹优化。

实验结果

本文在三种不同树木密度(稀疏、中等、稠密)的随机森林仿真环境中,对比了所提出的信任感知轨迹规划方法与不考虑信任的基线方法在人–无人机协同任务中的性能。两种方法均采用相同的实验平台和任务设置:操作者通过摇杆输入指令,引导四旋翼从森林一端飞行至另一端,系统记录任务距离、时间、平均速度以及人机交互相关指标。无人机飞行轨迹如下图所示:


图2 无人机飞行轨迹示意图

从导航效率指标来看(任务距离、任务时长和平均速度),两种方法在三种环境下都能够完成穿越任务,且本方法在任务完成时间和飞行效率上并未劣于基线方法,说明在引入信任建模和在线调节机制后,系统的基本导航能力并未受到损害。

在人机交互成本和协同质量方面,实验结果更能体现本方法的优势。与不考虑信任的基线方法相比,信任感知方法在三种森林环境下均表现出更少的操作者输入次数和更低的加加速度积分,表明操作者对飞行过程的干预更加稀疏、操纵负担更小,飞行轨迹也更加平滑;与此同时,平均信任度在本方法下明显高于基线方法,说明操作者对系统所规划路径的认可度更高,人机协同更加流畅。

综合对比可以看出:在不同复杂度的随机森林场景下,本文提出的信任感知轨迹规划方法在不牺牲任务效率的前提下,显著降低了操作工作量并提升了轨迹平滑性,从而获得优于基线方法的人–无人机协同性能。

参考文献

  1. [1]Q. Zhuang, K. Huang, X. Jin, P. Li, Y. Zhao, and Y. Kang, “Enhancing Human Machine Collaboration: A Trust-Aware Trajectory Planning Framework for Assistive Aerial Teleoperation,” Machines, vol. 13, no. 9, 2025.

相关科研项目

机载座舱智能系统人机信任动态演化建模方法研究