基于贝叶斯信息更新的无人机目标搜索策略研究
李悦, 周长银
(山东科技大学 数学与系统科学学院,山东 青岛 266590)
摘要:基于贝叶斯信息更新方法,提出了一个无人机目标搜索的动态策略模型,并给出了相应算法。该模型是在更一般贝叶斯先验假设下给出的,不需要现有一些相关文献中均匀分布的假设。在无人机搜索行动中,可以实施贝叶斯干预,利用新获取的目标搜索区域的额外信息,实时地改进搜索策略。数值实验中,假设目标处于搜索区域的分布为正态分布的组合叠加,实验结果表明相比较均匀分布假设,在正态分布假设下发现概率更大,而且贝叶斯干预后的累计发现概率不会降低。
关键词:发现概率;贝叶斯更新;贝叶斯干预;最优搜索策略
中图分类号:Q29 文献标准码:A
1 引言
随着信息化、智能化时代的到来,无人机在军事、经济以及工农业生产等领域的广泛应用愈来愈显示其重要性。军事和灾害救助中,目标搜索是目前无人机应用中的一个重要方面,相对于人工搜索,无人机如何快速发现搜索目标,受困于对目标信息的掌握程度和无人机对搜索区域的搜索策略,这需要研究提出更好的决策算法。
针对目标搜索问题的研究,早在第二次世界大战期间Koopman[1]等人就已提出了基本的目标搜索理论,基于目标静止均匀分布在搜索区域内并且匀速连续搜寻的假设,提出了发现概率模型。在Koopman的假设下,J.R.Frost[2]设计“扫地”实验对发现概率和扫海宽度等作了详尽阐释,Robert J.Koester[3]等人提出基于搜寻区域大小、扫描宽度和努力程度的发现概率表达式。为了突破上述假设的限制,Charns等人提出在搜寻离散情况下的发现目标的概率。后来,国内研究人员将发现概率模型用于海上搜索。周涛[4]对海上搜寻中发现概率的预测值进行研究,但是对于扫描宽度等因素的研究不够。吴翔[5]等就影响发现概率的核心因素扫海宽度进行重点探讨,并提出了扫海宽度的修正模型和指数探测函数的修正模型。王博研[6]将影响发现概率的因素结合起来,提出了一套新的计算初始搜寻区域中不同位置的搜寻成功率的数学方法。上述文献提出的模型和方法,在研究无人机目标搜索问题中值得借鉴和参考,但所给搜索过程都是确定性的,不能利用搜索过程获取的新信息实时地更改搜索策略。
将贝叶斯方法应用于目标搜索,国外已有一定的研究。2011年,C.M.Keller[7]和她的团队,利用贝叶斯方法提出一个搜寻失事飞机的数学模型,找到了坠落近两年的法航447。2015年,Lu Yadong[8]等利用贝叶斯推理,通过分析碎片位置和系统搜寻方式,对陷入困境的飞机搜索给出了优化方法。Wei Lu[9]着重研究了坠毁飞机的定位方法,确定救援区域和搜索策略,并将贝叶斯概率应用于搜索区域中。
在无人机目标搜索问题的研究中,多无人机协同搜索方法得到了研究人员的更多关注。王勋等[10]为提高无人机编队对区域的有效搜索覆盖率,减小搜索盲区,提出一种多无人机斜线协同搜索策略。轩永波等[11]提出一种基于质心V图划分(CVP)的无人机搜索决策方法对多架无人机进行搜索空间分配。协同搜索的假设是目标在所在区域的位置服从均匀分布,该假设在目标位于搜索区域的分布信息未知的情况下是合理的,但若目标所处位置有明显的分布特征,则需其它的假设。
本文将借助于贝叶斯信息更新方法,研究利用无人机进行目标搜索的搜索策略问题,提出目标搜索的动态策略模型,给出相应算法,并在正态分布的假设下做数值模拟,来验证所给方法的适用性。
2 发现概率模型
发现概率是指搜寻目标100%位于某一个区域时,搜寻设备能够发现该目标的概率。发现概率的大小与搜寻区域总面积,扫视宽度大小和搜寻设备努力程度有关。本文假设搜索设备采取平行搜索。
在目标搜索区域内,先确定目标处于区域的一个或多个可能位置,把这些位置称为基点。假设有
个基点,
个基点的相关信息构成初始信息集合
;记
为
个基点的笛卡尔坐标,
表示与基点
有关的初始概率分布,则在
的条件下,失踪目标的初始概率分布为
(1)
其中,的值由目标失踪位置的可能性大小决定。
根据各基准点所在区域的概率大小,从中选取一部分区域即任务搜索区域
进行搜索,如果没有搜索成功,则需要进行下一阶段的搜索,因此在
中对失事飞机的搜索可能要持续多个阶段。
为方便搜索,假设可分割为
个边长为
的正方形区域
,并且第
阶段的任务搜索区域
是由
个相连的小正方形
组成。令
表示飞机在
内,则第
阶段飞机在
内的先验概率为
(2)
记为
的面积,
为搜索设备的努力程度,即搜索设备单位时间扫视过的面积,若用
表示搜索设备位于
时发现失踪目标的概率,则根据文献[12],有
(3)
若用表示在
内搜索时发现失踪目标这一事件,则发现概率为
(4)
3 基于贝叶斯更新的发现概率模型
若假设无人机的扫视宽度为,在
内最大停留时间为
,实际搜索区域面积为
,无人机的扫描面积为
(由于扫描面积不小于实际搜索区域面积,
),本文定义无人机的前行平均速度
,则无人机位于
内的条件下,发现失踪目标的可能性只与无人机的努力程度有关。若
表示在区域
内每一个小区域
上搜索的距离,由(3)得
,因此:
(5)
当搜索进行到阶段时,选择具体的区域
是很关键的问题。在已知
个基点的条件下,计算每个基点相同面积内的概率大小,按照概率从大到小的原则选择概率大的作为第
阶段的
。在有贝叶斯干预的条件下,需将新基点和剩下的基点重新比较概率大小,选取概率最大的作为
。
假设搜索工作进行到阶段,还没有搜到,则要进行
阶段的搜索,需要对
阶段坠机点在
上的先验概率分布进行更新,如果除了搜寻失败这一结果,没有额外的新信息,则根据文献[11],
。 (6)
对任意,有
(7)
同理,对任意,有
(8)
为了避免重复搜索,在确定下一阶段任务搜索区域之前,将内失踪位置的后验概率置为0,再将后验概率
均匀分配到所有的区域上,即概率的归一化。
(9)
其中为区域
的面积。
需要指出,计算阶段的发现概率时,需将第
阶段获得的后验概率
作为下一阶段的先验概率,即
。特别是,在有额外信息的情况下,还需对
进一步修正。若经过
个阶段才发现失踪目标,则“前
个阶段搜寻发现飞机”的累计概率为
,这也是累计发现概率。
4 最优搜索策略
在一次搜寻任务中,最优搜索策略是找到最优搜寻距离任务搜索区域和
。
的确定要根据每个区域的概率大小确定,搜索设备根据搜索区域的概率从高至低进行搜索。搜索区域的概率定义为:
(10)
的确定模型如下:
(11)
在实际搜索中,无人机搜索的努力程度,是根据搜索区域决定的。搜索设备的努力程度被定义为搜索设备扫描过的面积,或者是搜索设备的飞行速度。本文用
表示在区域
内每一个小区域
上搜索距离,则在每一个区域内的搜索时间为
,相应的每个区域上的搜索速度为
,可以表示在每个小区域内搜索设备的飞行速度的变化。
无人机在进行一个或多个阶段搜索之后,可能会有新的信息加入,则需要进行贝叶斯干预。此时,需要更新各个基准点的概率分布,再根据概率大的区域先搜索原则制定下一阶段的最优搜索策略。综上所述,基于贝叶斯更新和贝叶斯干预的搜索过程可以描述为如下算法:
步1: 根据(2)式计算,
;
步2: 根据(10)式确定阶段的最优搜索策略
,根据(9)式确定
阶段的最优搜索区域
;
步3: 在上按照一定搜索规则进行搜索,进入搜索实施阶段,等待搜索结果。若搜到或者收到终止指令,则终止搜索。若有新的信息加入,则回到Step 1重新开始。否则,到步4;
步4: 按照(7)、(8)式进行贝叶斯更新,令;
步5: 令,到步2。
5 数值模拟
这一节对已给出的模型做数值模拟,来验证模型的实际效果。假设搜索目标在搜索区域内的可能基点处服从二维正态分布,若有
个基点,则目标在整个区域
内的分布用(1)式来计算,其中
服从二维正态分布,此时,目标在整个区域
内的分布为
个二维正态分布的概率加权叠加。数值实验程序采用Matlab2014编程,在联想X230上运行。
5.1 无贝叶斯干预下的模拟实验
假设只有一个基点,即。同时假设无人机的飞行速度为匀速,则每个阶段无人机扫描的面积相同。概率离散化如图1。
图1 概率离散化
其中,,飞行速度
不变,则
为定值等于
。此时,
累计发现概率为,若不进行贝叶斯更新,则
。
假设在内有五个任务区域,每个任务区域的概率都服从正态分布
,且每个任务区域可以划分为
个等面积的小区域。根据区域分布概率的大小确定概率最大的三个区域为搜索的任务区域,即搜索的三个阶段。若五个区域的概率分布以及概率分别为表1:
表1 概率分布与概率
区域 |
概率分布 |
概率 |
A |
|
|
B |
|
|
C |
|
|
D |
|
|
E |
|
|
由于,选择区域
分别为任务区域
。将概率归一化后可知,
,
,
。取扫视宽度
,每个阶段的最大停留时间
,
,则平均飞行速度为
。
为了避免实验的偶然性,取为[1,2]中的值进行实验,间隔为0.2。实验中的概率分布处理为每个区域概率分布的加权。对最优搜索策略模型进行求解可得每个阶段的发现概率如表2(表中用
代替
,
代替
,
代替
)。
表2无贝叶斯干预的发现概率
发现概率 |
|
|
|
|
||||
|
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
|
0.2107 |
0.4587 |
0.2107 |
0.2670 |
0.2107 |
0.3477 |
0.5083 |
0.7337 |
|
0.2330 |
0.6576 |
0.2330 |
0.3330 |
0.2330 |
0.3904 |
0.5487 |
0.8594 |
|
0.2512 |
0.6854 |
0.2512 |
0.3546 |
0.2512 |
0.4226 |
0.5801 |
0.8817 |
|
0.2661 |
0.6990 |
0.2661 |
0.3699 |
0.2661 |
0.4448 |
0.6047 |
0.8939 |
|
0.2783 |
0.7048 |
0.2783 |
0.3813 |
0.2783 |
0.4634 |
0.6240 |
0.9009 |
|
0.2882 |
0.7089 |
0.2882 |
0.3868 |
0.2882 |
0.4792 |
0.6394 |
0.9055 |
图2 正态分布下每阶段发现概率
图3 均匀分布下每阶段发现概率
从图2和图3中可以看出,发现概率随着的增大而逐渐增大。同时,从表2中也可以看到,选取正态分布比均匀分布,发现概率更大。
5.2 有贝叶斯干预下的模拟实验
若在上述实验中加入贝叶斯干预,即在完成第一阶段搜索之后,加入一个新的信息,
,则更新
区域为第二阶段搜索区域,
区域为第三阶段搜索区域,此时每个阶段的发现概率如表3:
表3 贝叶斯干预下发现概率
发现概率 |
|
|
|
|
||||
|
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
均匀分布 |
正态分布 |
|
0.2107 |
0.4587 |
0.2107 |
|