基于演化博弈模型的装备基地级维修
服务PPP采购合作奖励激励
冯海斌1,4,郑绍钰2,史童3,王飞4
(1.国防大学联合勤务学院研究生管理大队,北京 100036;2.国防大学联合勤务学院联合勤务管理系,北京 100036;
3.西安理工大学经济与管理学院,陕西 西安 710054;4.陆军装备部装备项目管理中心,北京 100072)
摘 要:奖励激励能够使装备基地级维修服务PPP采购共生系统向着人们所期望的最佳状态——对称性互惠共生的状态进化。在提出装备基地级维修服务PPP采购合作奖励激励理论依据和基本原则的基础上,结合实际基于演化博弈模型设计了装备基地级维修服务PPP采购合作奖励激励方法,为科学设计装备基地级维修服务PPP采购合作奖励激励提供了理论指导。
关键词:演化博弈模型;装备基地级维修服务PPP采购;合作奖励激励
中图分类号:E257 文献标志码:A
PPP Procurement Cooperative Reward Excitation for
the Military Equipment Depot-level Maintenance
Services Based on Evolutionary Game Model
FENG Haibin1,4,ZHENG Shaoyu2,SHI Tong3,WANG Fei4
(1. Department of Graduate Management,National Defense University Joint Service Academy,Beijing 100036,China;
2. Department of Joint Services Management,National Defense University Joint Service Academy,Beijing 100036,China;
3. College of Economic and Management,Xi'an University of Technology,Xi'an Shanxi 710054,China;
4. Equipment project management center,the Army Equipment Department,Beijing 100072,China)
Abstract:Reward excitation enable the PPP procurement symbiotic ecosystem of the military equipment depot-level maintenance services to evolve to the best state that people expect-Symmetric reciprocal symbiosis status. On the basis of proposing the theoretical basis and basic principles of PPP procurement cooperative reward excitation for the military equipment depot-level maintenance services, combined with the actual situation, the paper designs a PPP procurement cooperative reward excitation method for the military equipment depot-level maintenance services based on the evolutionary game model. This method provides theoretical guidance for the scientific design PPP procurement cooperative reward excitation for the military equipment depot-level maintenance services.
Key words:evolutionary game model; PPP procurement of the military equipment depot-level maintenance services; cooperative reward excitation
装备基地级维修服务PPP采购是指军队装备部门按照优势互补、风险共担、利益共享的原则与社会资本建立合作关系,以获取活劳动对武器系统、装备终端、总成、部件、组件和零件进行大修、升级、改造、测试、检查和回收利用(必要时)等维护或修理,以及维修支援等一系列活动[1-4]。装备基地级维修服务PPP采购系统是人类社会生活中一个典型的军事经济复合共生系统。根据共生系统相变原理和进化原理,共生系统的状态不是固定不变的,是随着共生环境的变化不断发展演化的,而对称性互惠共生既是共生系统的最佳运行状态,又是共生系统的根本进化方向[5]。所以,人们只有遵循共生系统相变规律设计奖励激励,人为干预和影响合作伙伴的行为决策,才能使装备基地级维修服务PPP采购共生系统向着人们所期望的最佳状态——对称性互惠共生的状态进化。同时,装备基地级维修服务PPP采购中,军队装备部门作为公共部门以公共利益——军事效益最大化为首要目标,而社会资本作为经营主体则以自身利益——经济效益最大化为追求目标,也只有建立适当的奖励激励,才能使二者之间通过动态博弈达到合作效益的帕累托最优。因此,必须设计科学有效的装备基地级维修服务PPP采购合作奖励激励方法。
1 理论依据
1.1 演化博弈理论
演化博弈理论是将博弈理论分析与动态演化过程分析结合起来的一种理论,是关于行为策略的相互作用与迭代过程的博弈模型。它的研究对象不是单个的参与者,而是“种群”,关心的是群体结构的变迁,而不是单个参与者的效用分析。其基本思想是:基于有限理性和不完全信息,博弈双方不可能在每一次博弈的过程中都能找到最优均衡点,其最佳策略就是通过反复博弈模仿和改进自己和对方的最优策略,寻找“演化稳定策略”(ESS),这种模仿和改进的过程实质上就是一种适应过程[6]。传统的博弈理论假定参与人是完全理性的,且博弈是在完全信息的条件下进行的,这在现实中很难做到。而与传统博弈理论的本质区别在于,演化博弈理论既不要求参与人是完全理性的,也不要求完全信息的条件,比较符合客观实际。在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态均衡。装备基地级维修服务PPP采购过程中,军队装备部门与社会资本之间的合作共生行为,是一种典型的非完全理性和不完全信息下的演化博弈活动。装备基地级维修服务PPP采购共生系统的形成过程就是军队装备部门与社会资本通过反复博弈,模仿和改进对方及自身的最优策略,寻找“演化稳定策略”——最佳采购策略的相互适应的过程。
激励理论是关于如何满足人的各种需要、调动人的积极性的原则和方法的概括总结。它认为,工作效率和劳动效率与员工的工作态度有直接关系,而工作态度则取决于需求的满足程度和激励因素。激励的目的在于激发人的行为动机,调动人的积极性和创造性,以充分发挥人的智力效应,做出最大成绩。激励理论按照学派可分为行为主义激励理论、认知派激励理论和综合型激励理论。行为主义激励理论认为,管理过程的实质就是激励,通过激励手段诱发人的行为。认知派激励理论认为,人的行为是外部环境刺激和内部思想认识共同作用的结果,对于人的行为的发生和发展,要充分考虑到人的内在因素。综合型激励理论则是以上两者的继承和发展,它把激励过程看成外部刺激、内部条件、行为表现和行为结果相互作用的统一过程,认为人们对工作的努力程度,是由完成该工作时所获得的激励价值和个人感到做出努力后能获得奖励的期望概率所决定的。激励理论中与本文密切相关的主要包括:内容激励理论(主要有马斯洛的需要层次理论和赫茨伯格的双因素理论)、过程激励理论(主要有弗鲁姆的期望理论和亚当斯的公平理论)和行为后果激励理论(主要有斯金纳等人的强化理论)。
2 基本原则
2.1 基于经济效益、通过市场机制
装备基地级维修服务PPP采购合作效益主要体现在军事效益、经济效益以及社会效益3个方面[7]。其中:军事效益作为根本效益,能且只能由军队装备部门“独享”。社会效益作为附带效益,由于其正外部性而无法进行量化分配[8]。而经济效益作为主要效益,既是装备基地级维修服务PPP采购各利益相关者的共同利益关切,又能通过经济效益核算量化分配。因此,装备基地级维修服务PPP采购合作奖励激励应当基于经济效益。同时,装备基地级维修服务PPP采购是一种社会主义市场经济体制下的国防服务采购活动,军队装备部门与社会资本作为独立、自主的“经营个体”拥有平等的市场主体地位。因此,装备基地级维修服务PPP采购合作奖励激励应当通过市场机制,而不能通过计划经济体制下的行政命令干预社会资本的自主经营。
2.2 基于超额收益、运用奖励机制
装备基地级维修服务PPP采购产生的经济效益可分为基准收益和超额收益两大部分,其中:基准收益是指军队装备部门与社会资本签订的合同或者协议所商定的预期经济收益;超额收益则是指超出预期基准收益的“额外”经济收益。装备基地级维修服务PPP采购初期,军队装备部门与社会资本通过订立合同或协议的形式,已经就基准收益及其分配比例达成一致。所以,基准收益就是需要层次理论中的低级需要或者双因素理论中的保健因素,是确保装备基地级维修服务PPP采购项目运营的基本收益;而超额收益则就是需要层次理论中的高级需要或者双因素理论中的激励因素,是激励装备基地级维修服务PPP采购项目更好运营的额外收益。同时,按照装备基地级维修服务PPP采购“利益共享”的基本原则,以及军队装备部门与社会资本的平等地位,社会资本获得的超额收益的分配比例不得低于其基准收益的分配比例。因此按照强化理论,军队装备部门要激励社会资本努力创造更大的超额收益,能且只能基于超额收益,通过高于基准收益分配比例(对于社会资本而言)的方式给予社会资本付出的努力以奖励,即以“牺牲”军队装备部门部分超额收益的方式激励社会资本付出更多的努力创造更大的超额收益。
2.3 基于期望收益、建立动态机制
装备基地级维修服务PPP采购中,虽然基准收益即军队装备部门与社会资本签订的合同或者协议所商定的预期经济收益是固定不变的,但是超额收益即超出预期基准收益的“额外”经济收益却是浮动可变的。在帕累托最优经济效益的限额下,军队装备部门与社会资本间的合作越密切、产生的超额收益就越大,社会资本对于装备基地级维修服务PPP采购项目的期望收益也就越大;反之,超额收益就越小,社会资本的期望收益也就越小。因此根据期望理论,装备基地级维修服务PPP采购合作奖励激励应当基于社会资本的期望收益。同时根据公平理论,社会资本在参与装备基地级维修服务PPP采购项目过程中,不但会随着超额收益的大小改变其期望收益,而且会以已往类似项目中的其他社会资本、激励制度和自身收益为参照物,设想不同的期望收益。因此,装备基地级维修服务PPP采购合作奖励激励应当建立动态机制,针对社会资本期望收益的变化情况动态调整奖励激励额度。
3 设计思路
根据理论依据和基本原则,装备基地级维修服务PPP采购合作奖励激励方法设计的基本思路如图1所示。在装备基地级维修服务PPP采购项目执行阶段中的评估步骤,由军队装备部门与社会资本共同组织对其进行收益评估。对于实际收益小于基准收益的项目,由于无法满足合作双方的“低级需要或者保健因素”即不能产生新增经济收益,军队装备部门与社会资本之间的合作共生关系将破裂,项目将中止运营;对于实际收益等于基准收益的项目,由于产生的经济效益恰好能够满足合作双方的“低级需要或者保健因素”,项目将按军队装备部门与社会资本前期约定的经济效益分配方案正常运行;而对于实际收益大于基准收益的项目,由于产生的经济收益在满足合作双方的“低级需要或者保健因素”的基础上有所盈余即产生了超额收益,按照“利益共享、互惠共生”原则,军队装备部门通过合作奖励措施,激励社会资本更加努力的运营项目以产生更大的超额收益。其中:对不响应军队装备部门激励的社会资本,按照原定的基准收益分配方案正常运营项目;对响应军队装备部门激励,付出更多努力的社会资本,则给予正强化即奖励激励以激发其合作行为。从而使军队装备部门与社会资本的战略目标更加“兼容”,以实现装备基地级维修服务PPP采购军事、经济、社会等合作效益的帕累托最优。
图1 装备基地级维修服务PPP采购合作
奖励激励方法设计思路
4 激励方法
按照设计思路,装备基地级维修服务PPP采购合作奖励激励是一种基于超额收益分配的激励方法。对于产生超额收益即实际收益大于基准收益的PPP项目,在运营过程中由于合作双方特别是社会资本期望收益的不断变化而导致他们之间的反复博弈,同时鉴于军队装备部门和社会资本的有限理性和信息的不完全性,他们通常在一开始无法找到最优策略,而会通过多次博弈不断试验、调整以及改进策略,从而逐渐形成最佳决策。此外,军队装备部门和社会资本也会按照生物进化复制动态思想,学习借鉴同行经验,模仿高收益者的策略,从而形成二者之间的某种动态均衡。只有准确分析这种动态均衡的达成过程、最终状态及其影响因素,才能有效设计装备基地级维修服务PPP采购合作奖励激励。因此,本文基于演化博弈模型来设计装备基地级维修服务PPP采购合作奖励激励方法。
4.1 条件假设
1)假设在装备基地级维修服务PPP采购中,军队装备部门和社会资本作为博弈主体都为有限理性。同时,在反复博弈过程中,双方都是在不完全信息的条件下。
2)假设在装备基地级维修服务PPP采购合作奖励激励中,军队装备部门有两种策略可供选择:一种是激励,另一种则是不激励;同时,社会资本也有两种策略可供选择:一种是响应,另一种则是不响应。假设博弈初始时,军队装备部门选择激励策略的概率为x,选择不激励策略的概率则为(1-x);社会资本选择响应策略的概率为y,选择不响应策略的概率则为(1-y)。
3)假设装备基地级维修服务PPP采购项目前期产生的超额收益为R。社会资本响应军队装备部门的激励后期产生的新增超额收益为∆R。显然,R>0;∆R>0。
4)假设军队装备部门与社会资本之间商定的基准收益分配比例为β∶(1-β)。显然,0<β<1。同时,假设在军队装备部门不进行激励的情况下,军队装备部门与社会资本之间仍按照β∶(1-β)的比例分配超额收益。
5)假设社会资本响应军队装备部门的激励时,为了给予其奖励,军队装备部门以高于基准收益分配比例的比例α∶(1-α)分配新增超额收益∆R。对社会资本而言,显然军队装备部门进行激励前、后的收益分配率β>α,即社会资本响应激励前、后的收益分配率(1-β)<(1-α)。
6)假设在装备基地级维修服务PPP采购合作奖励激励中,军队装备部门的付出的激励成本为CM, 社会资本付出的努力成本为CS。同时,假设通过装备基地级维修服务PPP采购合作奖励激励,军队装备部门与社会资本获得的新增超额收益都大于其付出的激励或者努力成本,即α∆R>CM;(1-α)∆R>CS。
4.2 模型构建
基于上述假设条件,可以得到如表1所示的军队装备部门与社会资本的支付矩阵:
表1 军队装备部门与社会资本的支付矩阵
军队装备部门 M |
社会资本S |
|
响应y |
不响应(1-y) |
|
激励x |
βR+α∆R-CM,(1-β)R+(1-α)∆R-CS |
βR-CM,(1-β)R |
不激励(1-x) |
βR,(1-β)R-CS |
βR,(1-β)R |
根据支付矩阵,可以分别得出军队装备部门选择激励策略、不激励策略的期望收益UMY、UMN及其平均期望收益:
因此,军队装备部门的复制动态方程为:
(1)
同理,也可分别得出社会资本选择响应策略、不响应策略的期望收益USY、USN及其平均期望收益:
因此,社会资本的复制动态方程为:
(2)
由式(1)、(2)可得出,装备基地级维修服务PPP采购共生系统的复制动态方程为:
(3)
4.3 博弈分析
4.3.1 军队装备部门策略的演化稳定性分析
根据式(1),当(显然
)时,
。此时,对于所有的x都是均衡状态。其复制动态相图如图2-1所示。
图2-1 军队装备部门复制动态相图
当时,令
,可得x=0,1是
的两个均衡点。对式(1)求导可得出:
。演化稳定策略要求
,下面分两种情况讨论:
情况之一:当时,
,所以x=1是演化的稳定策略。这表明当社会资本选择响应策略,即主动与军队装备部门合作的概率大于
时,军队装备部门的策略便从不激励逐渐转向激励,军队装备部门的演化稳定策略是对社会资本进行激励。其复制动态相图如图2-2所示。
图2-2 军队装备部门复制动态相图
情况之二:当时,
,因此x=0是演化的稳定策略。这表明当社会资本选择响应策略,即主动与军队装备部门合作的概率小于
时,军队装备部门的策略便从激励逐渐转向不激励,军队装备部门的演化稳定策略是不对社会资本进行激励。其复制动态相图如图2-3所示。
图2-3 军队装备部门复制动态相图
4.3.2 社会资本策略的演化稳定性分析
根据式(2),当(显然
)时,
。此时,对于所有的y都是均衡状态。其复制动态相图如图3-1所示。
图3-1 社会资本复制动态相图
当时,令
,可得y=0,1是 的两个均衡点。对式(2)求导可得出:
。演化稳定策略要求
,下面分两种情况讨论:
情况之一:当时,
,所以y=1是演化稳定策略。这就表明当军队装备部门选择激励策略的概率大于
时,社会资本的策略便从不响应逐渐转向响应,社会资本的演化稳定策略是响应军队装备部门的激励。其复制动态相图如图3-2所示。
图3-2 社会资本复制动态相图
情况之二:当时,
,所以y=0是演化稳定策略。这就表明当军队装备部门选择激励策略的概率小于
时,社会资本的策略便从响应逐渐转向不响应,社会资本的演化稳定策略是不响应军队装备部门的激励。其复制动态相图如图3-3所示。
图3-3 社会资本复制动态相图
表2 装备基地级维修服务PPP采购共生系统均衡点的稳定性分析表
均衡点 |
Det(J) |
Det(J) 的正负 |
Tr(J) |
Tr(J) 的正负 |
局部 稳定性 |
(0,0) |
|
+ |
|
- |
ESS |
(0,1) |
|
+ |
|
+ |
不稳定 |
(1,0) |
|
+ |
|
+ |
不稳定 |
(1,1) |
|
+ |
|
|
ESS |
(x*,y*) |
|
|
0 |
|
鞍点 |
4.3.3 装备基地级维修服务PPP采购共生系统策略的演化稳定性分析
根据方程组(3),令、
,可以得到装备基地级维修服务PPP采购共生系统的5个均衡点(0,0)、(0,1)、(1,0)、(1,1)以及
,其中:
;
。根据Friedman的研究成果,演化系统均衡点的稳定性可由该系统的雅可比矩阵的局部稳定性分析得到[6]。
对、
分别关于x、y求偏导,可以得到装备基地级维修服务PPP采购共生系统的雅可比矩阵:
按照雅可比矩阵的局部稳定性分析方法,分别对5个均衡点的稳定性进行详细分析,具体情况如表2所示。
由表2可知:均衡点(0,1)、(1,0)为不稳定点;均衡点为鞍点;均衡点(0,0)、(1,1)为两个局部稳定点,代表了装备基地级维修服务PPP采购共生系统的两个演化稳定策略(ESS)。由此,可得出如图4所示的装备基地级维修服务PPP采购共生系统的演化相图。
图4 装备基地级维修服务PPP采购共生系统演化相图
根据以上演化博弈模型及其相图可知,装备基地级维修服务PPP采购共生系统的演化稳定策略既可能是“激励——响应”,也可能是“不激励——不响应”,而其到底采取哪种演化稳定策略则主要取决于其初始状态。通过装备基地级维修服务PPP采购共生系统演化相图可以看出:折线AEC将图4分为两个区域,当装备基地级维修服务PPP采购共生系统初始状态处于折线AEC右上方,即多边形AECB区域内时,其演化稳定策略是“激励——响应”;而当装备基地级维修服务PPP采购共生系统的初始状态处于折线AEC左下方,即多边形AECO区域内时,其演化稳定策略则是“不激励——不响应”。
4.4 方法设计
4.4.1 影响因素分析
根据图4可知,装备基地级维修服务PPP采购共生系统选择“激励——响应”策略的概率Q为:
显然,当Q越大,即多边形AECB的面积越大时,装备基地级维修服务PPP采购合作奖励激励的作用就越明显。因此,装备基地级维修服务PPP采购合作奖励激励方法的设计就应着力扩大多边形AECB的面积,即增大Q的值。由式(3)可知,影响装备基地级维修服务PPP采购共生系统选择“激励—响应”策略的概率Q的因素有CM、CS、∆R和α。下面,分别讨论这些因素对于Q的影响。
因素一:成本因素CM、CS的影响。将Q分别对CM、CS求偏导,可得:
;
因此,Q分别关于CM、CS为单调递减函数,即Q分别与CM、CS成反比。
因素二:收益因素∆R的影响。将Q对∆R求偏导,可得:
因此,Q关于∆R为单调递增函数,即Q与∆R成正比。
因素三:分配因素α的影响。将Q对α求偏导,可知Q关于α虽然为非单调函数,但是在CM、CS和∆R一定(已知)的情况下,可以通过调整新增超额收益的分配比例即α的值,从而使取到最小值,即Q的值达到最大。
4.4.2 奖励激励方法
通过上述分析,可从以下几个方面设计装备基地级维修服务PPP采购合作奖励激励方法:
1)基于超额收益的分配设计合作奖励激励。装备基地级维修服务PPP采购合作奖励激励是一种基于超额收益分配的激励。只有对产生超额收益的装备基地级维修服务PPP采购项目,军队装备部门才能通过以高于基准收益分配比例(对社会资本而言)分配超额收益的方式给予社会资本以奖励,从而形成合作奖励激励。对不产生超额收益的装备基地级维修服务PPP采购项目,无法设计合作奖励激励方法。
2)基于降低投入产出比优化合作奖励激励。装备基地级维修服务PPP采购共生系统选择“激励——响应”策略的概率与投入成本成反比;与产出收益则成正比。因此,可以通过降低投入产出比,即投入较少的成本产出较多的收益的方式,提高装备基地级维修服务PPP采购共生系统选择“激励——响应”策略的概率。装备基地级维修服务PPP采购项目中,军队装备部门应当激励社会资本投入双方耦合率更高的、具有资源禀赋优势的装备维修资源,以提高单位生产率或者劳动生产率而产生更多的超额收益。
3)基于设置分配比例来调控合作奖励激励。装备基地级维修服务PPP