企业员工复杂适应行为的模拟_swarm论文

企业员工复杂适应行为的模拟，本文主要内容关键词为：员工论文,企业论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

虽然近几年来国内已经有学者把计算机技术引入到群体模拟中来，但研究的因素比较少，关系比较简单，还有一个重要的问题就是没有考虑到员工的主观能动性特点，认为员工仅仅是被动地接受环境的影响，忽略人的学习能力与适应环境的能力。随着近十几年来复杂性科学的发展，这种模拟的不足越来越明显[1,2]。

复杂性科学（science of complex）是一门新兴的交叉性学科[3]，其根源可以追溯到20世纪40年代贝塔朗菲一般系统论的创立，而真正对复杂性科学进行比较有规模化的研究一般认为是在20世纪70年代开始的，在这段时期创立了很多理论，比如耗散结构理论、协同学、混沌理论、分形理论、元胞自动机理论等，主要从时间发展的角度来研究系统的演化行为和性质。这些理论的出现为解决复杂系统问题提供了新的思想和方法，并对解决一些具体问题的模型提供了理论基础[4,5]。然而，这些理论还存在一些缺陷，如用混沌理论无法解释结构和内聚力以及复杂系统的自组织内聚性。1984年来自不同学科领域的权威科学工作者在美国新墨西哥成立了圣塔菲研究所（santa fe institute），开始了对复杂科学进行系统的研究。1994年，由Holland[6] 提出了复杂适应系统（complex adaptive system,CAS）思想。CAS成功地解释了蚂蚁群、生态系统、免疫系统以及人类社会中的各种现象。

复杂科学发展到20世纪90年代，CAS思想提出之后，就广泛应用于自然科学、经济学、生态学、社会科学之中，特别是应用于交通与经济学的领域。如Nagel等[7] 提出了对于高速公路交通的一维元胞自动机模型；Arthur等[8] 一起建立了一种复杂系统的仿真模型——Santa Fe Artificial Stock Market——来研究股票市场。国内学者在这方面也做了一些研究，文献[9] 以CAS理论为指导思想，利用SWARM平台建立了基于多主体离散的动态交通模拟系统。文献[10] 使用一种高级Petri网方法建立基于多主体的供应链模型，通过SWARM仿真平台模拟了供应链配送渠道系统的动态组合行为。还有一些学者应用复杂系统思想对组织复杂度和创造性、文化复杂度，组织的自适应性以及组织的管理理念等方面都进行了研究[3,4,11 ～14]。

国内对于复杂系统管理方面的应用研究主要基于定性的分析，因此，本文基于CAS理论，利用SWARM平台开发了基于多主体的群体行为模拟系统。本文应用激励学习算法和遗传算法实现员工在模拟中的学习能力与适应能力，用元胞自动机理论模拟员工的行为，建立群体系统模型，模型中的各个主体具有其自身的行为规则和策略，通过主体之间以及主体与其周围环境之间的相互作用和影响，整个系统将会涌现出宏观层面上的特征。最后，应用SWARM平台，给定一个初始的群体状态进行模拟，并对实验结果进行分析。

1 群体系统动态模拟模型

利用SWARM模拟平台来实现群体行为的模拟，必需满足该平台的条件。一般的SWARM模拟程序包括4个部分：模型swarm（model swarm）、观察员swarm（observer swarm）、模拟主体和环境。模型对应着一个群体；模拟主体就是群体中的一员；环境对应着企业的管理政策（在企业群体之中，对于群体成员而言，影响最大的是企业的内部环境，相对而言，外部环境的影响较小，因此本文主要考虑企业内部环境）；而观察员则对应了模拟结果（输出的图表）。结合SWARM仿真平台的原理，建立的群体系统结构图如图1所示。

图1 群体系统结构图

在结构图中，存在着2种自适应的智能主体（adaptive agent），即员工主体和管理者主体，其都具有各自的行为规则：员工主体通过激励学习算法和遗传算法对于个人行为进行局部优化和全局优化；管理者主体通过自适应能力，同样也不断地学习与改变管理政策。元胞自动机用来模拟群体行为，同时系统自适应地调整员工的行为。预警机制（管理环境）则负责协调整个系统，采用不同的管理政策来调整企业的员工行为，使其达到企业管理者所期望的行为状态，同时具有预警功能，在一定的时间内汇报员工的行为状态，员工就可以根据这些信息来调整自己的行为。

1.1 员工主体的行为规则

群体行为学的需求理论指出，人处于组织或群体之中是有需求的。有了需求就有可能转变成为某种动机，这种动机决定了员工的行为。假设员工的需求为

对应着不同的需求，对于员工而言，每一个需求具有3种状态，即需求能否实现、实现这种需求的概率和这种需求的效用。

1.1.1 单个需求的优化

设某个需求能实现的概率为P[,i]，且每一个员工主体都会记住当前状态和前一状态下此需求对自己的效用，采用Narendra随机激励学习（reinforcement learning,RL）策略[15] 调整不同的需求。首先计算各个需求的适应度：

在Narendra随机激励学习策略中，α和β是系统的外部参数，可以由用户规定，以决定调整策略的力度。

每一个员工主体根据上述调整方法所得到的概率来调整其状态。通过随机激励策略进行局部优化使自己的需求自适应地得到更好的实现。

1.1.2 整体需求的优化和自适应能力的实现

利用RL策略可以实现员工单个需求的优化，然而从整体上来说，并不能使员工所有需求达到总体优化，因此，笔者利用遗传算法实现员工需求的总体优化，该方法还可以实现员工主体的学习能力。

遗传算法是一种基于生物进化机制和原理并引用随机理论的优化搜索方法。它具有全局收敛特点，可以被用来解决各种复杂的实际问题[16]。在优化过程中，使用3种遗传算子：选择算子、交叉算子以及变异算子。

适应度函数F[,i]定义为需求i的效用。

利用选择算子对需求中的单个个体进行优胜劣汰操作：适应度高的需求被遗传到下一状态的概率较大；适应度较低的需求被遗传到下一状态的概率较小，且染色体个体被选中的概率与其适应度的大小成正比，即个体i被选中的概率

利用交叉算子产生新的染色体个体。基本思想是在染色体编码串中随机设置2个交叉点，然后进行部分基因交换。过程如下（见图2）：

（1）相互配对的2个染色体编码串中随机设置2个交叉点；

（2）换2个染色体在所设定的2个交叉点之间的部分染色体。

图2 交叉算子算法

最后，利用变异算子产生新的染色体，它将个体染色体编码串中的、某些基因座上的基因值用该基因座的其他等位基因来替换，从而形成一个新的个体。变异算子可采用均匀变异操作[17]，其具体操作过程如下：

（1）指定个体染色体编码串中的变异点；

（2）每个变异点以变异概率P从对应基因的取值范围内取一随机数代替原有基因值。

通过选择、交叉和变异，新的染色体不断产生，而且其适应度不断提高，即员工的需求设计方案不断优化。在模拟中多次重复迭代，最终将得到整体最优的需求方案。

1.1.3 利用元胞自动机实现模拟

元胞自动机（cellular automata，CA）的研究开始于号称现代计算机之父的著名数学家Von Neumann，它是由一些特定规则的格子所组成，每个格子被看作是一个元胞；每一个元胞可以具有一些状态，但是在某一时刻只能处于一种状态之中。随着时间的变化，格子上的每一个元胞根据周围元胞的情形，按照相同的法则而改变状态[18]。本文中所用元胞模型框架如下：

（1）元胞——员工主体。

（2）元胞空间——局部空间棋盘式网格，所谓局部空间是指群体的局部空间，在空间概念上是群体的子集。

（3）邻居形式——为简化问题，这里选取典型的Moore型。

（4）规则——元胞下一时刻的状态只受其邻居元胞的行为和自身的从众心理的影响，而且邻居元胞不包括其自身。邻居元胞的行为表现为当前时刻何种行为在它们之中占多数。元胞的从众心理用从众概率表示，每种从众心理对应一个从众概率，记为p（i,j），表示第i行第j列元胞的从众概率。当不存在外在影响因素时，当前元胞以此概率转为邻居元胞中当前时刻占多数的行为，具体算法如表1所示（以员工工作努力度为例）。

表1 CA深化规则的具体算法

1.2 预警机制

根据上述方法，员工主体在一定的规则下（即一定的内部环境下）可以根据自身的需求和群体中其他员工的行为进行自适应变化，寻找自身的最优状态。通过各个主体之间以及主体与环境之间的相互作用，群体在宏观方面会涌现出一定的行为特征；通过主体的自适应学习，整个系统在经过一定时间的演化之后，可能会不断优化，达到一个令人满意的结果。然而，这样的群体系统毕竟是一个纯自然的演化系统，在一个企业之中，管理政策的存在势必对员工行为产生很大的影响，因此，在主体自适应学习的基础上加入预警机制，在宏观方面给主体一个诱导（以一定的管理激励政策来诱导），从而可以更好地优化群体系统，使群体总体涌现的行为更接近或是达到企业管理者所期望的行为。

在实际中，企业管理者的管理政策会随着时间的改变而有所改变，然而这种改变的周期太长，而且很多管理政策的改变只是因为以前的管理手段已经与现实不符，不利于企业发展才做出的。而预警机制的存在，则可以起一种未雨绸缪的作用。

2 模拟实验结果和分析

假设员工的行为与其工作努力程度存在直接关系，为了实现其需求，员工必须调整其行为，更多地表现为努力工作的行为。而这种努力工作的行为正是企业管理者所期望的员工群体的行为。

在本文所描述方法的基础之上，笔者给定群体初始状态时的员工人数为10人，初始状态需求数目为10，α取0.2，β取0.2，变异概率为0.01，交叉概率为0.3，每一需求对应的效用在初始状态时给定一个值，从众概率由系统随机产生，CA的模拟空间定义为50×50。

本文基于SWARM平台，运用JBuilder2005软件开发了系统原型，在上述所给定的初始条件下，让员工群体自发地演化发展，在整体上可以涌现出一个群体所具有的特性。界面如图3所示

图3 程序界面

程序运行100个模拟周期之后，员工个体模拟结果如图4所示（在模拟的过程中，员工群体的行为时刻都处于一种变化之中，此图为第100个模拟周期时的图，并不是程序的结束）。从模拟结果中可以看出，企业员工表现出来的行为，不只是因为环境或是管理政策引起的，企业平常运营过程中所涌现出来的复杂性更主要来源于员工本身，以及企业的内部机制和结构。员工的行为有着其自身的规律和演化的方式，但任其自身演化又将导致员工行为的多变性（无论是对于员工个体而言，还是对于群体而言），如图4中黑色柱形所示，而当引入预警机制之后，员工群体的行为方式明显地比无预警机制下的行为更集中，便于管理和使企业产出稳定，这对于一个企业来说无疑是有利的。

图4 员工个体模拟结果

在同一模拟时间周期中，员工群体行为模拟结果如图5所示。员工群体的行为就是企业员工在相互作用、相互影响的过程中在宏观上所涌现出的特征。从图5中可以看出，员工在自由演化的过程中，群体涌现出的努力度变化幅度很大。预警机制的引入对于员工的群体行为有很大的影响，如在第28次模拟到第55次模拟之间，管理政策的实施使员工的工作努力度有很大的提高，而在第73次模拟到第93次模拟中，因为管理政策的影响而导致了员工工作努力度的下降。从总体来说，预警机制的引入导致了群体行为的集中化，使单个员工行为的复杂多变性，转化成了一种相对稳定的状态，这种相对稳定性对于企业是十分有用的，如前所述，将方便管理者进行管理，有利于企业总产出的相对稳定，同样，用这种方法也有利于分析群体员工的离职行为和预测需招聘新员工的数量。

图5 群体模拟结果图

使用上述方法，可以对员工群体的行为进行很好的预测，实践证明，这种结果比较符合实际，同时根据实验结果还可以得出如下相关结论：

（1）员工群体在日常生活工作中所表现出来的复杂性行为主要是由其自身在演化的过程中形成的，结合CAS理论，具体来说，是人本身作为一个Agent个体的学习能力与适应能力所导致的，群体的复杂性，是员工的相互非线性作用所导致的。

（2）环境对于员工群体的行为会产生影响，包括外部环境和内部环境，而内部环境起主要作用，如管理政策、群体氛围等，同时员工的行为又会影响到环境（管理政策、群体氛围），也就是说员工的群体行为具有非线性和反馈性。

（3）预警机制的重要性。现代企业面对的环境变化日趋迅速，预警机制的存在可以对未来群体行为作出某些有效的预测，同时制定相应的管理政策，使群体行为能接近或是达到预期目标，能对外部环境做出有效、迅速的反应。

3 结语

本文利用SWARM平台实现了群体系统的模拟，充分运用复杂系统的元胞自动机、激励学习算法和遗传算法等工具，成功实现了在CAS理论下群体行为的模拟。模拟结果表明该模型比较符合实际，有利于企业管理人员对于企业员工的行为作出正确的预测，并实施正确的管理政策，以适应外部环境的多变性。

在模拟过程中，也简化了许多问题，如员工的需求与行为之间的关系，在本文中只是采用了简单的对应关系，虽然不影响模型的方法和正确性，但相对于现实情境还是有很大差距的。本文的后续工作是要充分考虑各种合理的变量因素，特别是要完善员工主观因素的影响，把该方法用于大型的人群系统。

基金项目：国家自然科学基金资助项目（70271029）；湖北省自然科学基金资助项目（2004ABA069）。

标签：swarm论文; 预警机制论文; 群体行为论文; 概率计算论文;

企业员工复杂适应行为的模拟_swarm论文

猜你喜欢