新闻动态
您当前所在位置是: 首页 >> 新闻通知 >> 新闻动态 >> 正文
【转载】西安光机所数据驱动的行为决策研究获进展

原文载于:http://www.cas.cn/syky/201712/t20171221_4627672.shtml

时间:2017年12月22日


中国科学院西安光学精密机械研究所研究员李学龙及其合作者,在数据驱动的行为决策研究方面取得阶段进展。12月20日,最新成果以Punishment diminishes the benets of network reciprocity in social dilemma experiments为题,在线发表在PNAS上。

现实社会中,人们面临社会、经济、科技和军事等问题,如国家间的博弈与冲突、贸易谈判与贸易制裁、网络攻击、科技竞争、群体对抗等(这些问题统称为困境问题)。这些问题往往很难找到合理、有效的解决办法,给人们带来许多的困惑和无奈。然而,现实经验表明,个体通过互相合作可以解决这些困境问题。因此,如何在竞争激烈的环境下维持稳定的群体合作(因为单个个体处于劣势)成为解决困境问题的关键所在,这引起科学家分别从自然科学不同领域来思考这一问题(如数理科学家从合作动力学的角度,信息科学家从合作优化的视角,生物学家从合作演化的角度等),也是使之成为自然科学领域持续关注的研究热点之一。

借用博弈框架,研究人员设计了混合群体(也称非网络群体,即每个个体可以和所有个体等概率的进行博弈,因此个体相互作用网无固定的拓扑)和网络群体(即个体相互作用的搭档是固定的,呈现特定的网络拓扑结构)两种行为决策环境,并邀请300多名志愿者参加匿名实验。每名参与者可以选择合作、非合作两种策略,并反复进行博弈以产生行为决策的结构化数据。

研究表明,相比于混合群体,网络群体能够有效地促使处于劣势的合作者聚集成团簇(如图),从而维持稳定的合作水平,使群体获得较高的收益。这一现象被称为网络互惠(network reciprocity),这也是国内第一次通过行为实验证实网络互惠对解决社会与技术困境问题可提供可行的帮助。研究进一步发现,如果将惩罚作为第三种策略引入网络群体,这种新的策略选择将会在一定程度上破坏已形成的合作团簇,从而降低网络互惠的功效。

这一研究成果具有重要的现实意义,对解决社会、科技、军事问题可提供一定的科学依据。当前,网络暴力频发、交通拥堵令人担忧、教育资源日趋紧张、无人系统混乱等,人们寄希望于个体的相互合作来解决这些困境问题。例如,交通问题中,在既定的交通道路和导航信息环境下,个体只有自觉地通过人类作用网络自组织形成合作模式(如文明并道、礼让红灯等)方可从根本上解决拥堵问题。在此环境下,应慎用惩罚策略,从而避免打破人类作用网已形成的合作范式。此外,这一研究对理解和解决当前国际事务中的经济困境问题可提供一定的借鉴作用。例如,国际贸易的发展使得世界各国在贸易领域建立了固有的网络联系,有效促进了全球贸易的发展。当一国为了自身利益启动对他国的贸易制裁时,必然引发对方的反制裁和对抗;研究表明这种惩罚措施的加入会破坏原有的合作模式,不但不能促进合作,反而会减少双方的收益,从而降低全球贸易水平。  

因此,在解决面临的困境问题时,双方应以合作、协商的方式找到解决问题的途径,而慎用惩罚手段,才能有效维护社会的和谐、稳定和健康发展。

论文链接:https://www.pnas.org/content/pnas/early/2017/12/15/1707505115.full.pdf?with-ds=yes

行为决策演化示意图。最上面一行是混合群体,下面两行是网络群体。相比于混合群体,网络促使合作者聚集成团簇,但惩罚的加入将破坏合作环境。

 

隐藏