利己与利他的博弈论分析
发布时间:2015-04-04 浏览次数:

利己与利他的博弈论分析

——幼儿德育研究的新视角

                                            裘指挥   张 丽

 

[摘  依据博弈论的观点,“互利互惠”有助于实现个人与团体利益的最优化。幼儿在与同伴的交往实践中经过多次博弈,往往会发现“互利互惠”这一“ 金规则”。这一博弈的过程有利于儿童社会性的发展和摆脱“自我中心主义”的状态。

[关键词]博弈论;利己;利他;互惠

 

“利他”与“利己”的关系是德育中的核心问题,在我国的文化背景下,“他”是德育的主流价值。相对于成人来说,幼儿身心发展的有限性决定了其德育中“利己”与“利他”关系定位的独特性——“互利互惠”性。本文将从博弈论的视角对这两个命题的关系进行分析。

 

一、博弈论的视角

 

博弈(Game)是一个分析冲突、协作等行为相互转换的基本工具。博弈本是棋弈、桥牌及战争中所使用的术语,指研究游戏中参与者各自可能选择的策略。博弈论(Game Theory)最初是经济学的一个分支,研究的“结果无法由个人完全控制而须视群体的共同决策而定时,个人为了取胜应该采取何种策略”的学问。正如该理论的创始人约翰·冯·诺伊曼John von Neumann1928年所发表的有关论文中所阐述的,任何一种群体游戏,例如“剪刀、石头和布,都是一种群体环境之下如何做决策的问题,因为各个策略之间存在互动关系,而团体游戏策略运用应该有其规则与原理可循,由此便诞生了一门新的学问——博弈理论。”现代博弈论的涵义则大大扩展和引申了,成为一门研究相互作用的行为主体进行决策和这种决策的均衡问题的理论,也是一门研究主体行为发生直接相互作用时由矛盾冲突向协作互惠转化过程中的条件、方式和结果类型等问题的颇具数学分析特色的理论。

当然,博弈并不是一种新的现象,而是古已有之,可以说,自有人类就有博弈。博弈是幼儿生活中一种随处可见的现象,只要幼儿在各种互动中做出选择,就是在进行博弈。两个小朋友决定谁先荡秋千、三个小朋友一同在积木区游戏或同伴间决定谁当医生和病人等都是在博弈。

博弈论的发现为我们研究幼儿同伴互动中的冲突与合作等行为提供了一个有效的、系统的分析工具。当代英国经济学家肯·宾默尔教授说:“从博弈论的角度对伦理问题进行研究可以从中得到很多领悟”。博弈论以“理性人”为假设,这与幼儿的“自我中心”的思维状态是相吻合的。“理性人”以追求自身利益最大化为前提,但他也能意识到最大化的、长远的利益的获得离不开与对手的协作,在追求双赢中获得个体最大的利益。幼儿的“自我中心状态”常常使其出现自利的表现,但我们将看到,“幼儿在人际博弈中逐渐地会从自利走向互惠互利和他利”。博弈均衡所追求的从冲突到协作、从自利到互惠符合幼儿的发展需求和社会性教育的规律。正是基于此,我们试着从“博弈论”的视角来分析幼儿是如何从冲突走向协作,从自利、利他走向互利互惠的。

 

二、博弈模型的建立

 

幼儿的同伴生活其实就是一种博弈生活,冲突、合作成为同伴生活的主要基调。“利己与利他”博弈模型的建立基于下面我们所观察到的案例:

(一)“积木”博弈

大班的积木区里有 4个小朋友在搭积木,他们自由组合成两组,我们把他们各称为A( A1、A2)和BB1、B2)。随着收拾玩具的音乐的响起,小朋友们意识到接下来他们应该收拾好玩具并准备去户外活动了。可是B组的小朋友对收拾积木没有作出任何反应,只听见B1小声地说:“B2,我们再玩会儿积木,让他们先去放积木。”于是,正在收积木的A1 说:“我们是一起的,要一起收拾积木。”(意思是在同一个区里,积木要大家一起整理)B组的两个小朋友对 A1 的意见没做出任何的反应,而是继续玩他们的积木。最后,当A2提出“你们再不把积木放好,我们也不放积木了,大家都不能去户外游戏”时,B组的小朋友才开始一起来整理积木区。

以这个案例为基础,我们来进行利己与利他的博弈分析。AB 两组幼儿合作完成一项工作(收拾积木)。其中,可能出现三种情况:一是双方中的一方偷懒,而由另一方收拾积木;二是双方都不收拾积木;三是双方协作收拾积木。根据这三种情况,我们可以做如下假设:第一种情况,B在工作中逃避责任不做,待A完成工作后就一起去户外活动,且教师会认为这是他们共同完成的工作,B

没有工作却同样享有工作完成后所带来的一切,是纯粹的“利己”行为,对B的利益来说这个占尽便宜的对策是最好的,可记为10分。而A单独完成了所有的工作,却被B凭空分享占有,这个吃亏的对策对A的利益来说可记为0分。第二种情况,A、B都不收拾积木,利用这段时间背着老师做各自喜欢的事情,也许不能去户外游戏,但也不是一无所获,故二组在记分上均可记为2分。第三种情况,A、B采取合作的态度,都为双方着想,采取“互利互惠”的行为,就可以尽快完成工作,均可去户外活动,各记6分。这样在这个博弈中,A、B均有两种对策:利己或利他。他们的支付矩阵如表1所示。

1积木博弈的支付矩阵

                          B             互惠

                                 利己   

                  A                 利他

                        

                        利己     2,2   10,0

  

                      互惠利他   0,10   6,6

 

(二)秋千博弈

户外活动时间里小朋友A、B同时到达秋千旁边,他们都想荡秋千,于是发生了谁先玩的冲突博弈。首先,双方同时都想独占秋千,结果却是双方都没玩到秋千;随之,一方妥协,另一方获利;再之,是妥协方发现先获利方没有任何让利的意愿而对对方的行动加以阻止,使得双方再次陷入僵局;最后是双方的妥协与协作,达成互利互惠的共享秋千。

我们把小朋友玩到秋千赋值为1,反之则赋值为-1。于是 AB小朋友可能会遇到以下四种情况:一是 AB都想独占秋千而发生争执和僵局,其结局是两人都玩不成秋千,记为(-1-1);二是A独占秋千,B妥协,没玩秋千,记为(1,-1);三是B妥协,而A独占没得玩,记为(-1,1);四是 A、B轮流玩秋千,双方获利,记为(1,1)。他们的支付矩阵见表2

2秋千博弈的支付矩阵

                                         B

                        A        独占    轮流

                        

                             独占   -1-1      1-1

  

                             轮流    1-1     11

 

很明显,从表1、表2这两个矩阵来看,如果AB都采取合作的策略(互利互惠),双方的利益达到最大化,即互惠策略是最佳的选择方案,它达成了双赢。在积木博弈中,当双方选择利己,利己)时,他们的整体利益之和为4;选择( 利他,利己)或( 利己,利他)时,整体利益为10;选择(互惠、互惠)时,整体利益为12,即6+6>10+0>2+2。同样,在秋千博弈中,双方都选择独占,整体利益为2,出现了“负和博弈”;一方选择轮流而另一方选择独占

时,出现的是(-1,1)或(1,-1)的局面,即是“零和博弈”;只有双方都选择互惠轮流时,出现的是(1,1)的局面,即“正和博弈”或“双赢博弈”,即1+1>1+(-1)>-1+(-1)。距阵表明,幼儿个人选择导致的最优结果并不是整体选择的最优结果,这就是困境(Dilemma),即个人理性与整体理性发生矛盾。可见,个人利益最大化的达成要求双方都从互惠的角度出发行事。当A、B都坚持“互惠利他”、走向共同合作时,根据系统论观点,整体利益达到最大化,从而使双方的利益也达到最大化。

 

三、博弈模型的分析

 

(一)“互利互惠”的金规则

从上面的博弈分析中我们可以看到,AB 幼儿只有在协作的情况下,他们的利益才能得到最大的保障,即都有机会去户外游戏或荡秋千。这种博弈生成的互惠性价值取向被数学家拉波尔波特称为“金色规则”。每个人在博弈中首先会提出这样一个问题:“什么时候对双方来说是最好的”回答是:“当结果是合作性的时候。”接下来的一个问题是:“什么是必要条件,从而使人们达到这一选择”回答是:“对方都相信对方,对方将做出同自己一样的选择。”因为合作有利于系统的均衡,“合作博弈”可以使双方相对成本最小,故拉波尔波特将这种合作性博弈的最佳选择方式称为“金色规则”。而如果博弈者放弃合作,那么,他在最好情况下所得到的平均赢利小于在合作情况下至少可得到的赢利。

根据“金色规则”,以“自我为中心”的幼儿个体想取得个人利益的最优化,就必须接受“协作的决策方案,从利己走向互惠性利他。正如博弈中的理性人一样,幼儿在同伴交往中对自己的利益常常是给予优先考虑的。但是,在同伴的压力和给定的约束条件下,他们也在学会平衡、兼顾自己与别人的需要。

由此,我们认为,“互利互惠”应是幼儿德育的价值定位:从利益归属上看,坚持“利己优先、兼顾利他”的原则;从行动策略上,要求幼儿从追求自身利益的最大化到兼顾同伴或团体利益的最优化,从冲突趋向协作,在共生、共享中生存、发展。

(二)在“重复”博弈中生成互惠性

当然,互利互惠的价值取向和行为规范的形成往往是多次博弈的结果。多次博弈可能是幼儿与同一主体间的博弈,也可能是幼儿就同一属性事件与不同主体间的博弈。通过多次的博弈,幼儿认识到协作,即互利互惠的重要意义。幼儿会意识到,没有这种互惠性,个人长远利益的实现是不可能的,与同伴、团体的合作也是不可能的。正如皮亚杰所言:幼儿要走出“自我中心”的思维状态,同伴间的协作交往是前提。自利的个人追求的并不是在某一次博弈中期望的得分最大,而是多次博弈中期望得分的总和最大。在这个过程中“利己”的个人采取“触发策略”触发策略指博弈方之间首先试探合作,一旦发觉对方不合作,则也用不合作相报复,然后利用后续阶段博弈的制约作用达成均衡的策略,这是一个摸索、学习、提高自身交往能力,逐渐走出自我中心状态的过程。这样,个人的理性转化为整体理性,由利己走向互惠性利他

冲突与合作是博弈的主要表现形式,因此我们要关注同伴冲突在促进幼儿走出“自我中心状态”中的积极功能。正是在冲突中幼儿学会如何协调个人需求与别人或团体需求的。

幼儿同伴冲突是幼儿同伴间的互不兼容性及不同个性的表现。人际冲突的解决,需要幼儿能站在别人的角度和立场来思考问题。皮亚杰指出,孩子们的社会互动与冲突是他们发展逻辑概念的必要条件。当儿童有机会面对别人对他们的任何反应时,他们已开始去体会所谓的逻辑一致性和事情的真相。幼儿之间的冲突是幼儿体会别人感受、观念和愿望的成长背景。冲突会引起个体内在的反省,引发孩子们思考如何对付不同意见。通过同伴间的人际冲突,幼儿学会调整自己与别人的想法,更能站在别人的立场上思考问题,其人际理解力不断地得到提升。在解决冲突的过程中,个体能够逐渐获得观点采择能力,学会协商、互助与合作,增长社会经验和规则意识,提高社会交往能力,并最终促进个体社会化的进程和良好个性品质的发展。心理学者罗伯逊认为,儿童的社会化过程是在不断解决个人内部冲突和与他人(主要是同伴)的冲突中得到发展的。冲突是个人建立的秩序与外在秩序的对话,是个体的秩序顺应外界的秩序,也是个体同化外界秩序的过程。冲突也是原有水平遭遇新的挑战,使原有认知走向新的发展水平的过程。

(三)从“负和”博弈走向“双赢”博弈

从上面的博弈模型中我们可以发现,从博弈均衡结果来看,博弈分为合作性博弈(双赢或正和博弈)和非合作性博弈(零和博弈与负和博弈)。两者间的主要区别在于幼儿同伴的行为相互作用时,当事人最终能否达成一个具有约束力的协议。

所谓合作性博弈是指参与者从自己的利益出发选择行动,但所选的行动其结果对双方或多方均有利,即从自利达成了互惠,最终取得了“双赢”或“多赢”的结局,所以合作性博弈也可称为双赢或正和博弈,它是我们所追求的博弈。所谓非合作性博弈是指参与者的行动选择对双方或多方均不利,即各方虽进行了个人最佳选择和决策,但没有达成协议,没能为团体或双方带来最大的利益,从而使自己或他方的利益受损。非合作性博弈可能会出现两种结局,即零和博弈和负和博弈。如在前面的“秋千博弈”中,假如最后的结局是A、B双方都一直选择独占而造成双方都没能玩上秋千,这就是负和博弈;若有一方选择独占而另一方选择妥协,会造成零和博弈;只有双方都选择轮流时,才是双赢博弈或是正和博弈。

合作博弈强调同伴或团体的共有利益,强调的是效率、公正和互惠;而非合作博弈强调的是个人自利、个人最优决策和选择,其结果可能是有效的,也可能是无效的。因此,在幼儿德育中,我们提倡的是合作性的正和博弈,“互惠”的价值取向是符合早期儿童的身心发展需要的。

 

 

参考文献:

1.刘焱编著.幼儿教育概论.北京:中国劳动社会保障出版社,1999

2.茅于轼著.中国人的道德前景.广州:暨南大学出版社,2003

3.肯·宾默尔.博弈论与社会契约——公平博弈.上海:上海财经大学出版社,2003

4.戴维·伊斯顿.政治生活的系统分析.北京:华夏出版社,1999