《模型思维》之合作模型

如题所述

第1个回答  2022-06-15
合作要求合作者采取不符合自身利益的行动,而这就意味着我们不会经常观察到合作现象。但是在现实世界中,我们却看到合作出现在无数领域中,而且达到了非常大的规模。合作在细胞层面上就存在:细胞通过黏附作用实现了合作,一个细胞会产生细胞外物质,供其他细胞黏附之用。我们观察到,蚂蚁、蜜蜂、人类、人类组织之间,甚至国家之间都存在着广泛合作,不同国家会在制定条约和国际法方面进行合作。

一、囚徒困境博弈
每个博弈参与者可以选择合作或背叛。图中的灰色数字表示列博弈参与者的收益,黑色数字表示行博弈参与者的收益。对每个博弈参与者来说,背叛都是占优策略,无论其他博弈参与者采取什么行动,背叛都能带来更高的收益。但是,如果两个博弈参与者都背叛,每个博弈参与者的收益都会低于双方合作时的收益。因此,追求自身利益的行为导致了集体利益的恶化。

囚徒困境博弈紧紧抓住了现实世界中许多情况下的核心激励,它可以用来建模一些国家之间的军备竞赛:背叛对应于将资源用于开发武器,合作对应于发展经济等等。很多囚徒困境博弈都是在事后才认识到的。

二、通过重复和声誉机制实现合作
能够维持合作这个事实,并不能保证合作真的能够实现,它只是说明,如果合作“不知怎么”出现时,理性的博弈参与者能够维持它。
博弈参与者在重复博弈中,要根据以往的博弈历史选择行动。
冷酷触发(grimTrigger)的重复博弈策略:策略是在第一次博弈中选择合作,并且,只要另一个博弈参与者不背叛,那么就在未来的所有博弈中一直选择合作;但是,一旦另一个博弈参与者背叛了,那么就永远选择背叛。冷酷触发策略是“永不饶恕”的。如果两个博弈参与者都采用冷酷触发策略,那么双方将会永远合作。

在声誉模型中,合作是通过社区来实施的。背叛并被发现的人,在未来将会遭到所有博弈参与者的背叛。在这里,个体还是会计算背叛的收益和成本。他们还必须相信其他人会坚持惩罚到底,而这也就意味着其他所有人都会背叛那些背叛的人。

三、规则行为者之间的合作
如果博弈继续重复进行下去的概率足够高,那么理性的博弈参与者会在这种情况下合作。

仔细研究这张表可以发现,这五种策略中其实有四种是在与自己合作的,因此我们可以将这些策略视为潜在的合作策略。只有针锋相对这一种策略是所有这四种潜在的合作策略都能合作的策略。因此,如果这四种策略的任何一个组合在人口中占了大部分,那么针锋相对策略就能够表现得非常好,尽管不一定总是最好的。合作出现或发展的一个必要条件是,合作带来的收益超过了背叛者能够获得的收益。否则,选择和学习都会导致整个种群趋向背叛。

四、合作行动模型
在这个模型中,人们可以采取合作行动,也可以不采取合作行动。合作行动要求个人承担一定成本,会给他人带来收益。在这个模型中,聚类和群体选择都可以产生合作。

在这个模型中,网络发挥了关键的作用。网络的存在,使合作得以出现,甚至可以实现合作的自我引导。一个主要在内部成员之间进行互动的合作者团体或合作者群组会有很好的表现,能够使合作在种群中扩展开来。在生态系统中,后代通常位于父母附近。如果合作者的后代更有可能成为合作者,那么合作的自我引导将会变得更加容易。

五、群体选择
在每个群体内,个人的行动满足某种形式的合作行动模型——每个人或者选择合作或者背叛。与以前一样,我们可以认为每个人都有各自的表现。我们还为每个群体分配一个表现,它等于该群体成员的平均表现。群体选择模型假设选择是在群体与群体之间进行的,表现最佳的群体的复制体(副本)将替换表现较低的群体。
在每个群体内部,背叛者对合作者有优势,但是表现更好的群体却必须包含更多的合作者。这里的张力是非常明显的:个体选择有利于背叛,但是群体选择却有利于合作。