基于智能对抗进化的联合火力打击任务规划方法

刘昊¹，张策¹，丁文韬²

(1.国防大学联合作战学院, 河北石家庄 050000; 2.国防大学研究生院, 北京 100091)

摘要：针对常规联合火力打击任务规划方法很少涉及敌我对抗，导致评估环境发生变化的问题，提出一种基于敌我对抗进化的智能对抗进化算法。该算法以遗传算法为基础，将模拟生物竞争机制引入敌我双种群，互为评估条件实施对抗进化。依据敌我战场态势图构建观察- 判断- 决策- 打击(OODA)超网络，计算OODA循环效率、确定敌我打击排序,通过多代对抗进化获得能够适应战场动态变化的任务规划最优个体。仿真结果表明：多代进化后的最优个体相比于标准优化结果，战场动态适应性更强，联合火力打击胜率更高，应对突发情况的响应机制更完善，能够有效地解决联合火力打击任务规划的评估优化问题。

关键词：联合火力打击；任务规划；智能对抗进化；遗传算法；超网络；观察- 判断- 决策- 打击循环；人工智能

0 引言

联合火力打击任务规划是根据联合火力打击任务等约束条件，运用辅助决策工具对联合火力打击行动进行筹划计算，包括计算兵力弹药满意度、辅助制定联合火力打击计划、评估火力打击效果等^[1]。其核心问题是解决联合作战中的动态火力分配问题，即根据战场态势和敌我动态博弈情况实时生成目标打击清单，动态分配火力打击力量和打击目标，以实现联合火力打击效能的最大化^[2]。其难点在于火力打击任务规划不仅计算我方火力分配的效能最大化，还必须考虑敌方火力打击对我方造成的影响，这是因为敌我初始火力分配的微小差别将导致最终打击效果的千差万别，极大地增加任务分配推演计算和算法实现的复杂度。

在豫西南的内乡、镇平、邓州、西峡、淅川一带，腊八节的“腊祭”说至今依稀尚存。有人说，枣树从前不结果，人们不愿种枣树。枣神见人们不尊敬她，变成一个老太婆来到人间。在离村不远的地方画一片果园，满园枣树，红枣满枝。人们摘下一尝，又酸又甜，就纷纷前来，向老太婆讨教。她告诉人们，只要每年腊月初八给枣树喂米饭，枣树就会结果。人们按照她说的方法去做，果然棵棵树上都结出了红枣。直到现在，豫北还有这个风俗，民谣有：“腊八枣树吃米饭，枣儿结得干连蛋。”“干连蛋”，河南土语，意即红枣疙疙瘩瘩，枣树硕果累累。

国内外研究人员已经针对任务规划问题探索了多种解决方法，其中：特征评估法^[3-5]通过算法公式计算影响战果的评估指标，效率高但推广性差；改进遗传算法^[6-9]利用生物进化思想寻找当前状态下的全局最优解，构造简单但环境依赖性大；动态博弈法^[10-13]通过博弈论形成敌我双方之间的纳什均衡，动态适应性强但计算复杂性剧增；神经网络法^[14-16]模拟智能体的自学习能力，依靠经验解决问题，理论完美但训练数据来源受限。上述方法存在的普遍问题是：关注静态条件下对我方火力打击效能的评估，未考虑将敌我双方纳入网络体系实施对抗推演，使火力打击计划片面化、简单化；关注评估指标的理论计算，未考虑对抗推演中的有效性检验，使火力打击计划偏离战场实际；关注当前态势下的最优分配结果，未考虑敌我双方态势变化的可能性，使火力打击计划更脆弱。

本文在总结前人方法的基础上，借鉴自然界物种间的对抗进化机理，在遗传算法基础上设计对抗进化算法，实现敌我双方任务规划的无上限对抗进化，产生出在当前态势及未来可能态势下解决任务规划问题的最优个体，并通过仿真实验验证了该方法产生的最优个体自我学习能力以及在解决联合火力打击任务规划问题上的智能性。

1 问题描述

设敌我双方的节点总数分别为n _e和n _o，其中火力打击节点数为m _e和m _o；为构建动态分配模型，设敌我双方可同步获取对方的目标打击清单并同时分配火力打击任务，共执行r 波打击；当第k 波火力打击结束时(1≤k ≤r )，敌我双方各节点发现概率和的数学模型如下：

(1)

(2)

式中：和分别为敌方第p 个节点和我方第q 个节点在第k 波打击时的发现概率增量。

和分别表示敌方第p 个节点和我方第q 个节点是否被发现，表示各节点的发现阈值，则判断当时否则当时否则

按P _t 排序实施火力打击，更新打击目标方的毁伤程度，更新实施打击方的弹药消耗和发现概率。设某个作战单元在第p 波次火力打击中的易毁伤程度为h _p ，参与火力打击的部队毁伤能力为k _p ，兵力消耗比例为b _p ，更新各节点毁伤程度的计算公式为

(3)

(4)

式中：和分别为敌我双方的毁伤程度增量；为火力分配情况，若敌方第α 个火力打击节点对我方第q 个节点在第k 波打击中实施火力打击，则否则为若我方第β 个火力打击节点对敌方第p 个节点在第k 波打击中实施火力打击，则否则

设表示敌方第α 个火力打击节点对我方第q 个节点的火力打击能力，表示敌方第α 个节点执行第k 波打击的弹药消耗量；表示我方第β 个火力打击节点对敌方第p 个节点的火力打击能力，表示我方第β 个节点执行第k 波打击的弹药消耗量；则敌我双方的毁伤程度增量和的数学模型如下：

(5)

(6)

设敌方第α 个火力打击节点和我方第β 个火力打击节点的总弹药量分别为和则约束条件的数学模型如下：

(7)

(8)

本文中的个体特指具备一定智能程度的任务规划对象，即给定当前状态的目标打击清单，能够唯一地输出联合火力打击任务规划的智能体。对于一个固定的目标打击清单，个体必能产生唯一对应的火力打击任务分配表。本文对DNA定义为：由随机整数组成的二维动态数组，整数值、组内个数均不固定，用以模拟生物DNA随机变异、由简单向复杂进化的自然特性。个体数据结构如表1所示(敌我双方双种群内的个体结构相同)。

(9)

综上所述，问题的输入函数应为敌我双方初始目标清单中的初始发现概率和敌我双方火力毁伤能力表中的火力打击能力和以及火力打击属性表中敌我双方各火力打击节点的弹药总量和设评估条件为在火力打击结束时保证我方综合毁伤程度E _o最小，且敌方综合毁伤程度E _e最大，输出评估函数的数学模型如下：

(10)

问题的难点在于：1)各节点的发现概率决定了目标打击清单，目标打击清单决定了各波次打击任务的火力分配结果，火力分配差异影响最终评估结果，如何从不确定的发现概率中找到确定性的最优化火力分配，是任务规划问题的难点^[17]；2)敌我双方均在寻找最优化评估结果，且双方火力分配的微小调整均对各自最终评估结果产生重要影响，如何实现敌我双方的对抗推演评估也是算法难点。本文试图构造敌我双方多波次的火力打击对抗评估模型，通过对抗推演统计敌我双方的评估函数分值，以此判断胜负结果并找到最佳火力分配方法。

2 算法构建

针对联合火力打击动态分配问题难点，智能对抗进化算法设计目标包括：1)实现由不确定的发现概率得到确定性的评估结果；2)建立敌我双方互为评估条件的对抗评估机制。智能对抗进化算法以遗传算法为基础，引入双种群对抗评估机制，在设置初始个体的基础上实现敌我双方种群间的对抗进化，在众多代繁衍后产生能够解决联合火力打击任务规划问题的最优个体。算法流程图如图1所示。

图1 智能对抗进化算法流程图
Fig.1 Flow chart of intelligent confrontation evolution algorithm

2 .1 生成敌我超网络

超网络概念是美国科学家Sheffi^[18]在处理交织网络时提出的，特指高于而又超于现存网络的网络，体现出超越一般网络的复杂性和涌现性。为了确定敌我火力分配任务的打击排序，本文将敌我双方节点区分为观察单元、判断决策单元、信息传输单元、行动单元、其他单元5类；按照各目标的信息通联属性，构建出侦察情报网、指挥控制网、信息传输网、火力打击网，并在各子网基础上构建作战超网络。图2为以敌方战场态势信息构建的超网络示例。

2 .2 生成敌我双种群

并保证我方弹药消耗比例d _o约束条件如下：

蒋介石于1934年2月在南昌发起的新生活运动，是国民党执政以后最重要的意识形态教育运动。国民党执政后，实现政党意识形态的国家化是一个重要转变。国民党执政初期意识形态的建构，需要完成政党和国家两个层面的并轨。新生活运动试图将三民主义的党义变为全民的观念及行为准则。新生活运动的对象和范围，从南昌开始，先使南昌所有的人在衣食住行各方面符合整齐、清洁、简单、朴素、迅速、确实的原则，然后推广到全国，使全国国民都合乎标准，成为现代的文明的国民。简而言之，新运的对象是全体国民，范围“包括全部日常生活”⑮ 。

江西作为具有丰富历史文化的城市，历史文化街区众多。截至2018年4月，江西省人民政府已将乐平市、抚州市、南风县、金溪县等列入省级历史文化名城行列。对江西历史文化街区的旅游开发与旅游保护，还需要进一步完善。

图2 敌方作战超网络示例
Fig.2 Example of a friend-foe operation super-network

表1 个体数据结构

Tab.1 Individual data structure

繁殖变异用于产生新生个体，以优秀个体作为父代，通过1/1 000的随机变异操作产生不同于父代的子个体。繁殖变异算法流程图如图3所示。

图3 繁殖变异算法流程图
Fig.3 Flow chart of reproductive mutation algorithm

设种群内个体上限数目为1 000. 其中，输入压缩种群阶段，种群中个体数目小于1 000；选中父个体阶段，在种群中选取最高评分且遗传次数最少的个体作为父个体，若存在多个个体，则采用轮盘法确定父个体；复制新个体阶段，将父个体完整复制产生新个体；变异操作阶段，通过千分之一的随机变异操作修改新个体的DNA动态数组信息；算法输出规模为1 000的扩充种群。

2 .3 更新目标清单

设第i _s 个行动单元的毁伤程度为h _i_s ，平均兵力损耗的计算公式如下：

图4 更新目标清单算法流程图
Fig.4 Flow chart of target list updating algorithm

图4中，输入各单元毁伤程度和发现概率阶段，将目标按发现概率由大至小排序，选取发现概率大于5%的目标作为初始打击目标。设节点数目为n _e，重要程度指标为z _i ，机动能力指标为d _i ，超网络中第i 个节点的初始发现概率的计算公式为

山麓有滔滔江河，沟壑有汩汩清泉。这是“丰水湖南”留给人们的一贯印象。然而随着近年极端天气频发，2013年湖南遭受了严重的干旱灾害，时间之长、范围之广、程度之重均为历史罕见。湖南省充分发挥水利工程的基础性抗旱作用，科学调度水源，同时全力以赴开展应急送水服务，打井找水，及时调水，紧急送水……广大干部群众积极抗旱，主动作为，把灾害损失降到了最低。

(11)

删除已消灭节点阶段，删除毁伤程度超过80%的节点；添加新发现节点阶段，将发现概率超过80%的节点加入目标清单。

2 .4 个体转录

为了验证智能对抗进化算法在联合火力打击任务规划的优越性，采用文献[7]提供的改进遗传算法作为对比算法。仿真实验计算机配置如下：联想笔记本电脑运行MFC程序；Intel酷睿双核处理器T7300 2.0 GHz；3 GB内存；32位Windows7操作系统；vc6.0编程环境。敌我双方目标态势特征属性如表3所示，各类目标的网络关联情况示例如表4所示，火力打击兵器毁伤属性如表5所示。

步骤1 穷举所有可能的火力分配任务。每个火力分配任务包含“打击目标编号、使用部队编号、火力打击起止时刻”。

步骤2 数据非线性推演。为每个火力分配任务和DNA数组，对应计算f (z _i )函数并留存计算结果。设火力分配任务输入值为目标重要程度z _i ，DNA数组初始维数为10，对应数组值为d ，推演公式如下：

(12)

若为首段输入，则输入打击目标的重要程度；若为第i 段输入，则以z _i =f (z _i-1 -1)代入f (z _i )函数进行计算。

939 Application and development of artificial intelligence technology in nursing

步骤3 判定是否实施该火力分配任务。若结果f (z _i )<50，则不实施；反之则实施；按f (z _i )的分值由大到小排序，选取前10的火力分配任务。

步骤4 去冗余操作。去除超程任务；去除弹药不足任务；去除兵力不足任务；去除执行冲突任务；输出最终的火力分配表如表2所示。

试验数据以“平均值±标准误”表示，采用SPSS 19.0统计软件中的ANOVA过程进行单因素方差分析，P＜0.05表示差异显著，P＜0.01表示差异极显著。

表2 个体对应火力分配表示例

Tab.2 Example of individual corresponding firepower distribution

注：T 为战斗发起时刻。

2 .5 计算火力打击排序

根据OODA循环理论，火力打击过程可抽象为“观察(Observe)-判断(Orient)-决策(Decide)-打击(Act)”4种行动的不断循环，则胜利的关键在于通过加快己方的OODA循环，在敌人对己方前次行动作出反应之前发起新的行动，从而迟滞或打破敌人的OODA循环，以达成制胜的目的。OODA循环理论可以解决敌我双方火力打击任务的排序问题。在敌我作战超网络中，侦察情报网对应“观察”环节，指挥控制网对应“判断”和“决策”环节，火力打击网对应“打击”环节，则可通过超网络中各节点的通联效率作为评判OODA循环效率的依据。

本文设置敌我双方各火力打击任务的排序规则如下：1)超网络中观察单元、判断决策单元、行动单元之间的循环越短，该行动单元的OODA循环效率越高；2)超网络中的各子网越健全，网络中行动单元的OODA循环效率越高；3)行动单元的OODA循环效率越高，火力打击排序越靠前。设超网络中第i 个单元的易毁伤程度为h _i ；与第t 个行动单元相连接的观察单元数目为m ，判断决策单元数目为n ，信息传递单元数目为k ，分别对应的单元编号为i _m 、i _n 、i _k . 定义第t 个行动单元的观察效率为G _t ：与其相接的观察单元重要程度越高，机动能力越强，越难以毁伤，则观察效率越高。G _t 的计算公式如下：

(13)

式中：h _i_m 、z _i_m 、d _i_m 分别表示易毁伤程度、重要程度、机动能力指标。

定义判断决策效率C _t ：与其相连接的判断决策单元重要程度越高，越难以毁伤，固定位置时间越长，则判断决策效率越高。C _t 的计算公式如下：

（2）空中三角测量环节。空中三角测量成果的正确性是数字线划图成果质量保障的前提条件，空三成果决定了立测建模以及立体像对的精度。同时，如未经过外业实地检查，在生产过程中很难发现空三成果导致的成果精度问题。因此，在进行立体测图生产之前，首先应确保空三成果的正确性及精度。

(14)

式中：h _i_n 、z _i_n 、d _i_n 分别表示易毁伤程度、重要程度、机动能力指标。

定义信息传输效率S _t ：与其相连接的信息传输单元重要程度越高，越难以毁伤，固定位置时间越长，则信息传输效率越高。S _t 的计算公式如下：

(15)

式中：h _i_k 、z _i_k 、d _i_k 分别表示易毁伤程度、重要程度、机动能力指标。

更新发现概率的计算公式为

P _t =lg(max{G _t ,1})×lg(max{C _t ,1})×

lg(max{S _t ,1}).

(16)

敌我双方各节点的毁伤程度和的数学模型如下：

(17)

定义OODA评估指标P _t ，其计算公式如下：

f _p =f _p-1 +rand{G _t ,C _t ,S _t }×
rand{10,…,30}.

(18)

此外，每波打击中随机对一个目标发现概率赋值100.

本文对西江流域广东段传统村落的空间分布特征及影响因素进行了分析，受限于评估标准的约束，没有完全对所有传统村落的属性情况进行详细分析。此外，研究区域也仅针对西江流域广东段，对全西江流域传统村落及其数字化保护和现代化转型的探讨将是下一步研究的方向。

2 .6 计算敌我双方对抗结果

敌我双方对抗评估用于在火力打击结束后，通过敌我双方兵力、弹药损耗，计算出敌我双方综合评分的过程。对抗评估算法流程图如图5所示。

首先，在政策信息与咨询子系统方面，必须从以政策学习与政策移植为主的“拿来主义”向原创性政策分析转变。无论是产业政策或科技政策，政策主体都必须改变“以洋为师”的信息获得模式，转向内生性数据和大数据分析，独立自主地进行信息收集和信息分析，进而原创性地提供解决问题的途径和方案。因此，以专利分析为主体的知识产权评议机制，必须在产业政策、科技政策的信息与咨询子系统中居于核心位置，并予以制度化保障。

图5 对抗评估算法流程图
Fig.5 Flow chart of confrontation evaluation algorithm

设行动单元数为s ，第i _s 个行动单元的额定火力打击次数为u _i_s ，已完成火力打击次数为c _i_s ，平均弹药消耗的计算公式如下：

财务公司在产业链金融监督管理中的工作量与工作难度都相对较大，财务公司需要完善现有的监管方法来提高监督力度。财务公司的监督管理工作需要贯穿与企业集团相关的整条产业链中，同时确定监督管理的重点，财务公司需要合理使用内部控制来及时检查各企业的运营情况以及金融服务的开展情况，有助于及时发现各个环节潜在的问题并进行及时处理。财务公司自身的监督管理能力有限，企业集团和产业链上下游企业需要共同参与到监管工作当中，明确各企业在监管工作中的责任和监督任务，同时各企业能够相互制约而保证监管工作的有效性，确保整条产业链都处理良好的运行状态的同时能够控制产业链金融服务的整体质量。

(19)

由于敌我双方处于信息不透明状态，在初始目标清单基础上，火力打击方必然会使己方处于观察- 判断- 决策- 打击(OODA)循环中的节点发现概率增大，当发现概率到达发现阈值时即被对方侦察，目标清单上即显示该节点，因此每波次火力打击后敌我双方的目标清单均需更新，用于剔除已消灭目标并引入新发现目标。更新目标清单算法流程图如图4所示。

(20)

计算对抗评估参数阶段，用T ₁描述在固定火力打击次数情况下对更重要的节点实施火力打击；用T ₂描述实际火力打击次数和规定火力打击次数的差异率；用T ₃描述各节点的平均毁伤程度。设第i _s 个行动单元的火力打击次数为r _i_s ，重要程度为z _i_s ，对抗评估参数T ₁、T ₂、T ₃的计算公式如下：

(21)

(22)

(23)

计算综合评分阶段，使用熵权法将对抗评估参数降维为单一评估指标。设敌我双种群共进行了v 次对抗推演，则在第q 次对抗推演中，第p 项评估指标对应评估参数矩阵T 中的子集为t _pq . 首先对评估参数矩阵T 做归一化处理，得到归一化矩阵P ，其中子集p _pq 的计算公式如下：

(24)

然后计算每次对抗推演中每项评估参数对应的熵值e _p 为

(25)

式中：当p _pq =0时，e _p =0.

计算每次对抗推演中每项评估参数对应的权重t _p 为

综上所述，林业生态建设是林业工程发展的基础，造林技术是保证林业建设的重要手段。因此，造林水平的高低直接影响到林业生态工程的健康发展和我国经济和生态环境的发展。面对当前造林工作中存在的问题，对林业生态工程行业提出有效的解决方案具有重要意义。

(26)

最后计算并输出本次对抗推演的综合评分M _q 为

(27)

对敌我双方计算综合评分，判断评分高的一方为胜利方。

2 .7 双种群优胜劣汰

优胜劣汰用于构造敌我双方动态博弈环境，在博弈中胜者留存并繁衍后代，败者淘汰以释放资源。优胜劣汰算法流程图如图6所示。

图6 优胜劣汰算法流程图
Fig.6 Flow chart of fittest algorithm

图6中，结束条件设置为：当我方种群中个体的胜利次数和敌方种群中个体的胜利次数比例超过某一阈值时，可判定结束。

社区委员会应积极组织创建社区志愿消防队，让社区居民参与公共消防事务，为本社区内的成员提供志愿消防服务。消防中介组织对志愿消防队进行专业化的培训，使志愿消防队能够为居民提供更好的服务，发挥出更大的作用。

3 仿真分析

转录是指以DNA为基础产生蛋白质酶以控制生物体性状的过程，本文中特指在输入目标打击清单后，个体DNA数组通过内部算法，产生唯一对应的火力打击任务分配表的过程。具体算法步骤如下：

表3 敌我双方目标态势表示例

Tab.3 Example of friend and foe target situations

表4 营指挥所的目标关联表示例

Tab.4 Example of target associations in battalion command post

表5 火力打击兵器毁伤属性表示例

Tab.5 Example of fire strike attributes

表4为以营指挥所为中心的各目标类型与其关联情况。

表6为以炮兵阵地为火力打击力量对各目标类型实施火力打击，能够达成规定毁伤程度所需的打击次数。运用该算法设计制作“智能联合火力打击任务规划软件”以服务于作战筹划实践。软件操作界面如图7所示。

表6 炮兵阵地的火力毁伤能力表示例

Tab.6 Example of fire damage capabilities in artillery position 次

图7 软件操作界面
Fig.7 Software operation interface

3 .1 参数有效性分析

本文实验参数求取过程如下：随机枚举500个敌方火力打击任务规划，在调节我方各参数适用范围基础上计算个体的适应度值，以500次仿真计算结果的平均值作为参数优选参考依据。所用参数如表7所示。

3 .2 各代最优个体适应度分析

为了检验算法的适应度变化情况，以敌我双方双种群为基础实施自由对抗，每次对抗记为1代，并记录我方个体对抗中的适应度分值；同时引入文献[7]中的改进遗传算法作为对比实验，以敌方初始种群作为对抗环境代入改进遗传算法中计算各代最优个体的适应度分值。经过500代迭代进化的适应度变化情况如图8所示。

表7 参数取值范围表

Tab.7 Parameter range

图8 各代最优个体适应度分值统计
Fig.8 Optimal individual fitness scores for each generation

实验结果表明：智能对抗进化算法相比于改进遗传算法的适应度结果，适应度分值呈现阶段性收敛和陡降状态，改进遗传算法由于敌方环境固定不变，适应度分值收敛于固定分值，而后的进化计算由于结果不变而导致进化停滞；智能对抗进化算法则处于敌我双方动态变化过程中，敌方环境的动态变化导致我方最优个体结构做出动态调整以应对敌方环境变化，调整必然导致适应度分值产生陡降，而每次陡降过程中产生的个体结构有后代个体继承并作为DNA传递，因此智能对抗进化算法相比于改进遗传算法的环境适应能力更强。

3 .3 最优个体对抗结果分析

为了验证算法的自我学习能力和对抗优越性，取智能对抗进化算法中的敌方各代最优个体作为对抗环境，取改进遗传算法经过500代进化获得的最优个体作为对比实验个体，通过智能对抗产生我方最优个体，每次对抗记为1代，共推演400 000代，分析我方和对比实验与敌方最优个体对抗的胜败比率，以此判断智能对抗进化算法是否具备优于遗传算法的自我学习进化能力。我方胜利次数统计如图9所示。

图9 各代最优个体胜利次数统计
Fig.9 Statistics of the victories of best individuals in each generation

实验结果表明：随着对抗进化迭代次数的增加，敌方最优个体不断改进自身结构，改进遗传算法的最优个体初期可获胜，随后被敌方最优个体压制，并在总体进化进程中无翻盘可能；智能对抗进化算法中的我方最优个体可通过改造自身结构积累获胜经验，具备随时翻盘的可能。

为了验证智能对抗进化算法获得最优个体的任务规划能力优越性，实验设计从敌方种群中随机抽取1 000个个体作为对抗环境，以改进遗传算法获得的最优个体作为对比实验个体，使敌我双方个体逐一对抗并记录胜负，以此判断智能对抗进化算法在任务规划能力上的优越性。最优个体胜利情况统计如图10所示。

图10 最优个体随机对抗胜利次数统计
Fig.10 Statistics of optimal individual random confrontation wins

实验结果表明，智能对抗进化算法获取的最优个体在胜率上明显优于改进遗传算法，相比于智能对抗进化产生的最优个体，改进遗传算法获取的最优个体由于严重依赖固定的敌方环境而产生了过拟合，导致其在敌方环境变化上的适应度分值明显下降，并促使胜率低于智能对抗进化的最优个体。

3 .4 算法时空消耗分析

为了验证算法对个体结构改善情况，实验抽取对抗过程中产生的最优个体并统计其存储容量，以改进遗传算法的各代最优个体存储容量作为对比实验个体，结果如图11所示。

图11 最优个体存储容量统计
Fig.11 Optimal individual storage capacity statistics

实验结果表明：随着进化代数的增加，改进遗传算法获取的最优个体存储容量趋近收敛，并在多代进化后陷入进化停滞，个体结构不再改变；智能对抗进化获取的最优个体随着对抗进化代数的增加，个体数据结构呈线性增长，伴随着结构复杂性的提升，个体对敌方动态环境的适应性相应增强。

为了检验算法的计算效率，取各代最优个体实施对抗并统计时间消耗，以改进遗传算法的最优个体作为对比实验个体，以随机抽取的100个敌方个体作为对抗环境，取100次对抗平均时间作为评估指标，结果如图12所示。

图12 最优个体对抗时间消耗统计
Fig.12 Optimal individual vs. time consumption

实验结果表明，相比于改进遗传算法最优个体，智能对抗进化算法的最优个体由于自身结构复杂度提升，对抗时间消耗也相应增大，但考虑到战场中只使用智能对抗进化的多代最优个体，因此时间消耗在可承受范围内。

3 .5 任务规划结果显示

联合火力打击任务规划的最终结果是生成辅助决心建议，因此将多代进化的最优个体和敌方当前态势获取的实时个体进行对抗，并生成对抗结果，转化为辅助决心建议格式如下：依据当前敌我态势以及目标打击清单，我火力打击综合胜率为XX%，不能完成火力打击任务，建议补充兵力弹药或能够完成火力打击任务；建议使用X号个体作为火力打击任务分配算法，其综合胜率达XX%；预计执行完火力打击任务时，我火力打击部队兵力剩余XX%，弹药剩余XX%.

4 结论

本文基于对抗进化思想，在遗传算法基础上构造出敌我双方的对抗进化机制，通过多代的优胜劣汰和遗传变异，积累应对各种情况的遗传因子，获取能够应对各种情况的最优个体，进而实现联合火力打击任务规划的自我进化和迭代，产生了符合作战实际需求的任务规划。仿真实验结果表明，该算法相比于标准遗传算法具有更大的灵活性，能够动态匹配目标打击清单和敌我双方作战态势，具备解决特定问题的人工智能算法基础。

攀枝花钛精矿经过改性- 酸浸后，所得产品人造金红石中CaO含量、SiO2含量去除率低下的原因主要受钛精矿物相组成决定。攀枝花钛精矿主要由易溶的钛铁矿和难溶的硅酸盐两种物相组成，其中大部分为钛铁矿相。杂质元素Mg既分布在钛铁矿中，也分布在硅酸盐相中，而Ca和SiO2主要分布在硅酸盐相中。钛精矿中SiO2越多，硅酸盐相存在越多，CaO则越难被浸出[8]。攀枝花钛精矿中SiO2含量达到了4%左右，在制取人造金红石过程中，只能除去部分CaO，采用磁选的方式也只能部分去除SiO2和CaO。图1为攀枝花钛精矿物相组成。

参考文献

[1] 贺扬清, 沈治河. 反舰导弹集群协同作战任务规划研究[J].舰船电子工程, 2015, 35(7): 1-3.

HE Y Q, SHEN Z H. Anti-ship missiles clustered together mission planning[J].Ship Electronic Engineering, 2015, 35(7): 1-3.(in Chinese)

[2] 朱建明, 宋彪, 黄启发. 基于系统动力学的网络安全攻防演化博弈模型[J].通信学报, 2014, 35(1): 54-61.

ZHU J M, SONG B, HUANG Q F. Evolution game model of offense-defense for network security based on system dynamics[J].Journal on Communications, 2014, 35(1): 54-61. (in Chinese)

[3] 张明智, 马力. 体系对抗OODA循环鲁棒性建模及仿真分析[J].系统仿真学报, 2017, 29(9): 1968-1975.

ZHANG M Z, MA L. System-of-systems combat OODA loop robustness modeling and experiment[J].Journal of System Simulation, 2017, 29(9): 1968-1975. (in Chinese)

[4] 李子杰, 刘湘伟. 基于进化算法的多无人机协同航路规划[J].火力与指挥控制, 2015, 40(2): 85-89.

LI Z J, LIU X W. Cooperative path planning of multi-UAV based on evolutionary algorithm[J].Fire Control & Command Control, 2015, 40(2): 85-89. (in Chinese)

[5] 张明智, 马力, 季明. 网络化体系对抗OODA指挥循环时测建模及实验[J].指挥与控制学报, 2015, 1(1): 50-55.

ZHANG M Z, MA L, JI M. Networked system-of-systems combat OODA command circulation time measuring modeling and experiment[J].Journal of Command and Control, 2015, 1(1): 50-55. (in Chinese)

[6] 张鑫, 许峰. 基于质点模型的多智能体遗传算法[J].软件导刊, 2018, 17(1): 81-84.

ZHANG X, XU F.Multi-agent genetic algorithm based on particle model[J].Software Guide, 2018, 17(1): 81-84. (in Chinese)

[7] 李亚雄, 刘新学, 武健. 基于改进遗传算法的多弹型混合火力分配优化模型[J].指挥控制与仿真, 2017, 39(4): 50-54.

LI Y X, LIU X X, WU J. An optimal model of multi missile hybrid firepower distribution based on improved genetic algorithm[J].Command Control & Simulation, 2017, 39(4): 50-54. (in Chinese)

[8] 聂文亮, 蔡黎, 邱刚. 带密度加权的自适应遗传算法[J].计算机系统应用, 2018, 27(1): 137-142.

NIE W L, CAI L, QIU G. Adaptive genetic algorithm with density weighted[J].Computer Systems & Applications, 2018, 27(1): 137-142. (in Chinese)

[9] HAN J K, KIM J H. Quantum-inspired evolutionary algorithms with a new termination criterion [J]. IEEE Transactions on Evolutionary Computation, 2004, 8(2):156-169.

[10] SPRONCK P, PONSEN M, SPRINKHUIZEN-KUYPER I, et al. Adaptive game Al with dynamic scripting[J]. Machine Learning, 2006, 63(3):217-248.

[11] 李婵, 徐龙顺, 张文德. 网络信息资源著作权风险演化博弈分析[J].理论研究, 2018, 36(1): 32-37.

LI C, XU L S, ZHANG W D. Evolutionary game analysis of the copyright risk of network information resources[J].Theory Research, 2018, 36(1): 32-37. (in Chinese)

[12] 陈侠, 赵明明, 徐光廷. 基于模糊动态博弈的多无人机空战策略研究[J].电光与控制, 2014, 21(6): 19-24.

CHEN X, ZHAO M M, XU G T. Fuzzy dynamic game based operation strategy for multiple UAVs[J].Electronics Optics & Control, 2014, 21(6): 19-24. (in Chinese)

[13] 曾松林, 王文辉, 丁大春. 基于动态博弈的目标分配方法研究[J].电光与控制, 2011, 18(2): 26-29.

ZENG S L, WANG W H, DING D C. Target allocation method based on dynamic game[J].Electronics Optics & Control, 2011, 18(2): 26-29. (in Chinese)

[14] 张立仿, 张喜平. 量子遗传算法优化BP神经网络的网络流量预测[J].计算机工程与科学, 2016, 38(1): 114-119.

ZHANG L F, ZHANG X P. Network traffic prediction based on BP neural networks optimized by quantum genetic algorithm[J].Computer Engineering & Science, 2016, 38(1): 114-119. (in Chinese)

[15] 简平, 邹鹏. 混合离散粒子群的任务调度算法及应用[J].火力与指挥控制, 2014, 39(5): 146-149.

JIAN P, ZOU P. Task scheduling algorithm and application based on hybrid discrete particle swarm optimization[J].Fire Control & Command Control, 2014, 39(5): 146-149. (in Chinese)

[16] 贾子英, 闫飞龙. 系统演化的作战体系对抗结构模型[J].火力与指挥控制, 2013, 38(9): 91-94.

JIA Z Y, YAN F L. Structure model for SoS combat base on system evolution[J].Fire Control & Command Control, 2013, 38(9): 91-94. (in Chinese)

[17] 曾家有, 王国卫, 钟建林. 多平台舰舰导弹饱和攻击几个协同问题与模型[J].兵工学报, 2014, 35(2): 256-261.

ZENG J Y, WANG G W, ZHONG J L. Research on cooperative saturation attack problems and models of ship-to-ship missiles from multi-ship platforms[J].Acta Armamentarii, 2014, 35(2): 256-261. (in Chinese)

[18] SHEFFI Y. Urban transportation network: equilibrium analysis with mathematical programming methods[M]. Englewood Cliffs, NJ, US: Prentice Hall, 1985: 261-347.

Joint Fire Attack Mission Planning Method Based on Intelligent Confrontation Evolution

LIU Hao¹，ZHANG Ce¹，DING Wentao²

(1.Joint Operation College, National Defense University, Shijiazhuang 050000, Hebei， China;2.Graduate School, National Defense University, Beijing 100091, China)

Abstract : In view of the fact that the conventional joint fire attack mission planning method rarely involves an issue of friend-foe confrontation leading to the change in evaluation environment, a smart confrontation evolution algorithm based on the evolution of friend-foe confrontation is proposed. The proposed algorithm is based on genetic algorithm, in which the simulation of biological competition mechanism is introduced into the two populations of friend and foe for implementing the confrontational evolution. An observe-orient-decide-act (OODA) super-network is constructed based on the battlefield situation map, and then the OODA cycle efficiency is calculated to determine the order of friend and foe attacks. The task-planning optimal individuals can adapt to the dynamic changes of the battlefield through the confrontation evolution of multiple generations. The simulated results show that the multi-generation evolutionary optimal individual has stronger dynamic adaptability, and the joint firepower strike rate is higher. The response mechanism to respond to the emergencies is more perfect, which can effectively solve the evaluation optimization issues of joint firepower mission planning.

Keywords : joint fire attack; mission planning; intelligent confrontation evolution; genetic algorithm; super-network; observe-orient-decide-act cycle; artificial intelligence

中图分类号： E837

文献标志码： A

文章编号： 1000-1093(2019)06-1287-10

DOI :10.3969/j.issn.1000-1093.2019.06.020

收稿日期： 2018-09-06

基金项目：国家社会科学基金项目(16GJ003-051)

作者简介：刘昊(1983—)，男，博士研究生。 E-mail： 176892033@qq.com

通信作者：张策(1965—)，男，教授，博士生导师。 E-mail： wentaoding2131@gfdx.edu.cn

标签：联合火力打击论文; 任务规划论文; 智能对抗进化论文; 遗传算法论文; 超网络论文; 观察-判断-决策-打击循环论文; 人工智能论文; 国防大学联合作战学院论文; 国防大学研究生院论文;

基于智能对抗进化的联合火力打击任务规划方法论文