计算社会科学:数字时代的社会科学研究(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-14 11:30:53

点击下载

作者:腾讯研究院,集智俱乐部

出版社:浙江出版集团数字传媒有限公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

计算社会科学:数字时代的社会科学研究

计算社会科学:数字时代的社会科学研究试读:

计算社会科学Computational Social Science腾讯研究院×集智俱乐部 编著浙版数媒序言

社会科学、自然科学、思维科学一直并称为人类历史上的三大科学。而与另两门科学相比,社会科学称得上是“最接地气”的科学了,因为它所操心的事与我们每个人的生活息息相关。它研究计划生育、税收管理等政策问题;它也研究工厂制度,劳动条件等人事问题;它还研究财富变化,假消息的传播等社会问题。为什么只能生一个,现在又鼓励我们生两个?为什么我们公司天天加班还不给加班费?为什么我很努力还是这么穷?等等等等问题,社会科学中总有一门学科能给出你解释。

相比之下,自然科学是一项上知天文,下知地理,又涉及物理、生物、化学的科学,看上去就是一项专业性非常强的学问。如果要深入研究自然科学,那就需要学习这个领域非常多的概念、定理、理论体系。

然而,从最近大科学发展来看,社会科学和自然科学这两块看起来彼此分离的大陆正在逐渐融合形成更大的科学版图——这就是本书谈论的重点:计算社会科学。

21世纪,冷战结束,世界格局稳定,科技的飞速发展带来了众多创世纪的研究:网络与计算机等电子产品的出现革新了人脉的概念,也为社会科学的研究带来了新的机遇。网络上的数据、计算方法的发展推动了社会科学的前进,由此产生了社会科学具有革命意义的分支学科——计算社会科学。计算社会科学家们手握人工智能、机器学习、网络分析等强大的分析手段,却对人类如何行为、政治偏好如何量化这样的社会学问题充满了好奇。大数据这把利器正在帮计算社会科学家们一点点叩开社会科学定量化研究之门。

实际上,用定量化的手段来研究社会科学并不是新的尝试。在19世纪早期,法国哲学家孔德就率先提出了社会物理学的概念,并主张利用物理学的手段和方法来研究人类社会。而帕累托分布、齐普夫定律、吉布莱特定律、引力定律等大规模社会经济系统中的统计规律的发现更让人们看到了运用数学方程刻画人类社会或经济行为的可能性。

进入二十世纪以来,随着计算机技术的发展,人们开始在计算机模拟世界中构建“人工社会”,运用人工创建的计算规则代替人类真实的决策,并观察大量人工智能主体在“人工社会”中的涌现行为。从囚徒困境博弈到“糖域”社会,从货币的涌现再到人工股票市场,基于多主体的社会学仿真研究俨然形成了社会科学与计算科学渗透交叉的一道独特的风景线。

2009年,以哈佛大学的David Lazer、MIT的Alex Pentland等为首的十六位科学家联合在著名期刊《Science》上发表了题为“计算社会科学”这一新型交叉学科的诞生。虽然仅从题目上来看,它与前面讲到的社会学仿真与人工社会的研究没有什么本质区别,但二者最大的不同就在于计算社会科学更加强调运用大数据的手段去获得第一手的社会调查材料。

短短不到十年的时间,计算社会科学就以一种势如破竹之势获得了巨大的发展。从社交网络到集体注意力;从不同群体的政治倾向到假消息在社交网络上的传播。一个个鲜活的计算社会科学研究散发着无穷的魅力,也在不断地吸引着新的研究者加入到计算社会科学大军之中。

这些年轻的研究者们就包括施永仁、吴令飞、王成军、陈志聪、徐绘敏等人,他们聚集到了集智俱乐部——这个中国的“没有围墙的研究所”。从2017年的9月份开始,集智俱乐部与腾讯研究院S-Tech工作室联合举办了AI&Society的系列主题活动。其中前三期都是有关计算社会科学主题的。我们将这些活动集结成册,于是就有了这本书的诞生。

单看书名,如果你认为本书是一个介绍计算社会科学固定概念、领域和方法的专业书,那你可就错了,在本书的第一、二、三章是使用计算社会科学的领头人的三篇论文对计算社会科学简单的介绍,在第三章之后,是几位国内外计算社会科学领域研究学者讲述自己社会研究中一些有趣的发现:人与人之间是怎样相互影响的?朋友会阻碍我的发展,那我应该少交朋友吗?你的手机暴露了你的阶层?一入贫困深似海,贫困加剧了我的贫困?都是一些非常奇妙又确实值得深思的问题。不管你是正在修读计算社会科学,需要一本合适的书籍来开导启发你的思路,还是对社会学一窍不通,仅仅是被生活中的一些问题所困扰,都可以在本书中与几位研究者进行思想的碰撞,找到你想要的答案。集智俱乐部 张江 陈孟园目 录序言第一章 21世纪——计算社会科学时代 A Twenty-first Century Science第二章 计算社会科学诞生与发展 The Birth and Development of Computational Social Science

计算社会科学的诞生

计算社会科学关心的问题

计算社会科学研究障碍

延伸阅读第三章 计算社会科学简介 Computational Social Science

计算社会科学

计算社会科学研究方法

自动信息提取 Automated information extraction

社交网络分析 SNA

社会地理空间分析 socio-GIS information systems

复杂系统建模间 Complexity modeling

社会仿真模型 Social simulations models

结语

延伸阅读第四章 文化,观念,与社会影响 Culture, Opinion and Social Influence

一个简单的社会影响模型

命运共同体“我们”和“他们”

互联网上的气泡

延伸阅读第五章 创新者的孤独 The Relationship Between Team Size and the Development or Disruption of Science and Technology

被人误解的社会学

社会学的发现:创新者孤独论

著名的社会学研究:“结构洞”与“弱连接优势”

朋友即阻碍

阻碍的结果

结构洞优势

用社群结构理解“朋友即限制”

颠覆式创新一百年

创新,发展之源

小团队PK大团队

创新的影响因素

结语

延伸阅读第六章 移动媒体中的注意力流动与社会阶层 Social Class and Attention Flow in Mobile Media

注意力的流动与人类传播行为

数字鸿沟与社会阶层的再生产

一个移动阅读行为数据的观察

移动终端平台中的社会阶层差异

不同社会阶层的个体在阅读内容上的差异

不同社会阶层的个体在阅读时间上的差异

结语

延伸阅读第七章 社会阶层塑造线上和线下空间轨迹 Social Class Shapes Our Trajectories in Both Online and Offline Space

社会阶层

数字媒体

相似性网络

不同阶层的移动轨迹

探究

结语

延伸阅读第八章 社会贫困与认知 Poverty Impedes Cognitive Function Science

贫困妨碍认知

新泽西州的穷人与富人

印度泰米尔纳德的甘蔗农们邦

政策制定新视角

延伸阅读后记活动发起方第一章 21世纪——计算社会科学时代 A Twenty-first Century Science作者 Duncan J. Watts译者 杨清怡校译 刘培源

极少人会否认,目前人类面临的许多重大问题,实质上都是社会和经济问题。从席卷伊斯兰世界(及部分西方国家)的宗教原教旨主义,到集体经济安全、全球变暖和当代的流行病,无一不有强大而神秘的社会力量在其中发挥作用。

但《Nature》的读者中鲜有人认为社会科学是二十一世纪的科学。虽然在经济学、社会学、政治学和人类学中,对人类社会行为的研究已成为滥觞,但是缺少能够解释这些发现的统一而连贯的理论框架,成果远不及物理学和生命科学。这并非由于社会科学家逊色于其他领域的同行,而是因为社会现象是最难解决的科学问题之一。

社会现象涉及大量(但个数仍有限)的异构实体的相互作用,随着时间推移,其行为在多个尺度上展开。这种社会现象很难理解。比如对于一个机构,即使完全不考虑(a)在其中工作的个人;(b)与其竞争、合作、比较的其他机构;(c)运行所依靠的制度和监管结构;和(d)以上要素之间的相互作用,这个机构仍然可以自行运转。

社会科学的成果要赶上物理学,相当于,我们必须同时解决量子力学,广义相对论和多体问题——即使弦理论研究者面临的问题也没有这么艰巨!幸好,网络科学领域的新发现为社会科学的未来带来了一些希望。

网络科学正在崛起。在过去的50年里,社会学家深刻地认识到,人、机构和市场之间的相互作用对集体社会行为的确定相当重要。他们甚至创立了一种语言,网络分析(network analysis),来定量描述这些相互作用。但是分析的对象,比如友谊关系,是很难观察的,尤其是针对大规模人群的长时间观察。因此,网络数据(包括一次性网页快照,即单次的独立观察)过去通常用于规模较小的人群。而且,大多数研究依赖于参与者的自我报告,存在认知偏差、感知错误和界限模糊的问题。

然而,过去十年间基于互联网的通讯和交互量激增,正逐渐破除这些局限。首次,我们可以开始观察百万级人群的实时互动,其分辨率很高,可以敏锐感知个体级别的影响。同时,更高速的计算机让模拟大型社交互动网络成为可能。这引起了对社会网络领域的极大兴趣:在不到十年的时间里,数以千计的论文和越来越多的书籍得以出版,这预示着“网络科学”的到来。图1-1 3种类型的复杂网络

毫不意外的是,“网络科学”这个标签同样带来了部分有一定合理性的批评。其中,有些批评是陈词滥调;也有批评常用模型过于简化,以至于经不起推敲的;还有批评这些实证研究倾向于使用恰好可用的数据,而不是根据具体的研究问题搜集数据。因此,即使网络科学出版物数量暴涨,标题起得令人屏息,也很少反映真实的社会进程。

尽管有上述批评,但是网络科学仍有迅速兴起之势,特别是如果社交网络的特征受到重视的话。首先,社交网络并非静态的结构,而是根据它们所处的社会和组织环境而发展的。其次,社交网络不是一元的,而是多元化的,这意味着人们同时维系着很多功能各异的人际关系:正式的和非正式的,强联系和弱联系,两性关系、商业关系和友谊。最后,网络结构必须放在集体社会动力学的大框架内理解。人‘们不只是互动,这些互动行为还会影响他们甚至更多人的选择结果。

Duncan J. Watts目前正在研究两个非常有趣的项目:第一个项目使用约有40000名用户在大学社区匿名电子邮件的日志数据,根据现有网络结构、共享活动(如班级内的)和个人属性,跟踪一年内单日的网络变化。这种动态数据可以揭示结构性约束和个人偏好在决定朋友圈的同质性等问题上的相对作用。研究组的第二个项目是基于网络的实验,要求14000名参与者对未知乐队的歌曲进行试听、评分和下载。一些参与者独立做出选择,其他人则可以看到歌曲的下载次数。这类实验不仅衡量了个人对彼此决策的影响,还衡量了个体选择对宏观属性的影响,比如“流行”产品的可预测性。显然,从这些仍非常简化的社会网络研究飞跃到社会科学的“大问题”,依然是一段艰巨的道路。在这方面,学界与目前主导数据收集的互联网大公司的合作,可能会有极大成效。虽然这样的合作会遇到挑战,包括隐私和知识产权问题,但这些社会科学的问题的难度,无法依靠直觉乃至经验单独解决。我们必须开始思考互联网的技术革命如何推动社会科学的革命。本文首发于微信公众号“集智俱乐部”(ID:swarma_org)第二章 计算社会科学诞生与发展 The Birth and Development of Computational Social Science作者 David Lazer, Alex Pentland, Lada Adamic, Sinan Aral, Albert-

László Barabási, Devon Brewer, Nicholas Christakis, Noshir

Contractor, James Fowler, Myron Gutmann, Tony Jebara, Gary

King, Michael Macy, Deb Roy, Marshall Van Alstyne译者 陈孟园校译 张 洪David Lazer,哈佛大学,东北大学,政治学、计算与信息科学教授AlexPentland,麻省理工学院,媒体艺术与科学教授Lada Adamic,密歇根大学,网络动力学方向教授,Facebook数据科学家Sinan Aral,麻省理工学院,管理学教授Albert-LászlóBarabási,东北大学,物理系和计算机与信息科学学院教授Devon Brewer,华盛顿大学,社会学系Nicholas Christakis,耶鲁大学,西利曼学院教授Noshir Contractor,西北大学,麦考密克工程与应用科学学院的行为科学方向教授James Fowler,加州大学,政治科学系Myron Gutmann,美国密歇根大学,社会研究所教授Tony Jebara,哥伦比亚大学,计算机科学教授Gary King,哈佛大学,数量社会科学研究所教授Michael Macy,康奈尔大学,艺术与科学学院社会学系教授Deb Roy,麻省理工学院,社会机器实验室(LSM)副教授Marshall Van Alstyne,科罗拉多大学,历史系,行为科学研究所教授计算社会科学的诞生

新的世纪,我们生活在网络之中,脸书、微信、电话和邮件一秒钟沟通起了你我他,一封封往来的信件在互联网中留下印记;信用卡、公交卡记录了你我的地域轨迹和消费支出;在车头我们安装摄像机记录行车状况,而政府在公共场所各处装上监控记录犯罪证据。我们虽生活在真实的生活当中,但却在虚拟的世界留下种种数字印记,这些印记改变了我们的生活,改变了我们对社会的理解,改变了科学研究的进程。

搜集和分析大数据的能力已经彻底改变了自然科学,比如生物学和物理学。然而,数据驱动的计算社会科学发展却极为缓慢,在经济学、社会学以及政治学的重要期刊上都很少有计算社会科学的相关文章。但不容忽视的是,在一些知名的互联网公司Google、Yahoo和政府部门比如美国安全局中,正在开展计算社会科学的研究。计算社会科学也许会仅仅集中在私人公司和政府部门内部。又或者,某些拥有特权的学术研究者将使用这些独一无二的“秘密”数据,从而发表无法被别人评价和复制的论文。从长远来看,以上这两种情况都不利于知识的积累、验证与传播。让我们试想,如果在一个开放的学术环境下,计算社会科学将会如何增强我们对个人和集体行为的理解?计算社会科学关心的问题

至今,关于人类互动的研究还主要依赖于某一特定时段个人填答的调查数据。而技术发展带来的海量数据(1),能够极大的改善这一现象。例如,往来的电子邮件数据中展示了不同的时间段里人们之间互动关系的结构和内容,据此我们可以研究人们之间的关系如何随时间而变化,帮助我们思考一系列人类互动行为的问题:一个团体内部之间的关系究竟是怎么样的,是已经达到了稳态很少出现变化,还是他们之间的关系一直发生着剧烈的波动?优秀的团队和个人具备怎样的互动模式(2)/(3)?同样,我们还能够考察宏观的社会网络(4),观察它如何随着时间演变。移动电话公司,大型互联网公司Google、Yahoo拥有大量的用户交流信息数据,这些数据能不能描绘出一张社会通信模式的复杂图景,而这张图景又如何影响经济生产力和公共健康?手机使得追踪人类活动变得方便快捷(5,6),同时人类活动数据可以帮助我们研究流行病如何通过个体传播等重要问题。总之,互联网提供了一个全新的途径理解人们之间的连接(7)。仔细思考一下,在刚刚过去的政治选举时期,如果能够追踪被火热传播的论点、谣言、政治立场或者博客圈中的一些谈论(8)以及网络上的“冲浪”行为(9),每一个选民最关心的问题将会变得显而易见。

互联网所营造的虚拟世界,自然而又轻松的捕获了个体行为的完整记录,这为原本不可能实现的研究提供了丰富的数据基础(10)。例如,这些完整的个人记录帮助我们了解一个人在社交网络中的位置是如何影响他们的喜好、心情、甚至是身心健康(11)。自然语言处理技术的发展(NLP)也大大提高了我们分析大量文本数据的能力(12)。未来,我们希望,对社会的认知不再通过手动记录面对面交流者的信息来实现,而是通过各种各样的电子设备自动生成和记录社交信息。总而言之,计算社会科学正在以前所未有的广度、深度以及规模搜集与分析数据,但与此同时,计算社会科学的兴起与发展却遭遇着重重阻碍。计算社会科学研究障碍

在研究范式上,现有的解释人类行为的理论和范式是在无法获取和处理几千万兆的人类交互信息数据的时候发展和建立起来的。比如说,基于几十个人某一时刻的数据而建构的社会网络理论如何能解释上百万人之间的相互关系呢?关于人们如何互动的大量新兴数据可以为研究人类的集体行为提供新的视角,但我们目前社会科学的研究范式并不一定会接受。

推进计算社会科学还存在着很多制度性障碍。计算社会科学与物理和生物学的研究问题不同,在观察与干预研究对象过程中也存在着不同的挑战。在物理学和生物学实验中,夸克和细胞不像人类一样,会因为别人的观察而不自觉或者刻意的掩盖自己的行为,它们乖乖的听从人类的干预而不会反抗。就基础条件而言,从社会科学到计算社会科学所要解决的困难要比从生物学到计算生物学之间克服的困难大得多,究竟为什么会这样呢?主要是从社会科学到计算社会科学的发展需要解决分布式监控、数据使用许可权获取和加密等问题,在社会科学领域中这些资源都较为缺乏。

也许最令人头疼的问题还是数据的获取和保护,目前很多研究所需数据都涉及到个人隐私。以美国AOL公司事件为例(13),在2006年8月,AOL公司公布了2006年3月1号到5月31号这3个月用户的真实搜索记录,包括1900万搜索,1080多万不一样的搜索词,还有65万8000个用户ID(美国AOL公司是一家在线信息服务公司,可提供电子邮件、新闻组、教育和娱乐服务,并支持对因特网访问,2015年被威瑞森通信(Verizon Communications)收购)。虽然用户的ID是匿名的,但如果你足够细心认真的话,还是可能从这8000多个用户中发现足够多的信息。有一位记者就从搜索的地址和姓名中快速找到了一位62岁的老太太,并且老太太证实了那些罗列出来的搜索词确实是她的。你还可以从搜索词中看到这样一些关键词(来源:https://www.seozac.com/other-se/aol-data/)

1、怎样炸掉一栋楼

2、怎样给别人下药

3、怎样制造炮弹

4、怎样攻入别人的电脑

5、怎样杀死太太

6、怎样杀人能够不留痕迹

7、......

AOL公司做出的这件蠢事给社会带来了一场大混乱,虽然该网页几个小时之后就被撤下,但数据却被网友们在互联网上广泛传播,这也为私人公司擅自分享私人数据敲了警钟。

设想现在,如果谷歌、百度、天猫、腾讯、京东等互联网巨头突然公布了所有人的搜索记录、聊天记录、购物记录等,更不幸的是,如果你浏览器的登录昵称是你的真实名字,同时你多次在浏览器中搜索你家附近的加油站、超市等信息,并且在天猫购物平台中多次输入你的地址,那么你可能很快就被定位。根据你的搜索记录,你将被贴上各种各样的标签,“房奴”、“彩妆迷”以及“二次元”等。更可怕的是,你的电话可能会被各种销售公司打爆,生活将变得一塌糊涂。

因此,为了保护个人的数据隐私和企业的利益,为了能让这些数据发挥作用从而促进科学研究的进步,企业和科学家之间建立起合作共赢的数据分享模式是非常有必要的。总体来说,妥当地处理隐私问题是非常必要的。最近美国国家研究委员会有关地理信息系统的报告就特别指出,即使是非常仔细地匿名化数据,还是有可能重新分析出个体的隐私数据(14)。去年,美国国家健康局和惠康信托基金会突然停止了一些基因数据库的在线获取功能(15)。尽管这些数据只是非常简单地报告了某些特定的遗传标记的总频率,根本没有包含个人信息,一些研究者仍然认为,基于数据库中每个个体的大量数据,依照现有的统计技术,依旧能够重新定位到个体(16)。

因为一次偶然的违背个人隐私事故的发生,就可能使得社会对信息共享深恶痛绝,甚至会颁布一些扼杀计算社会科学发展的法律条文。此时我们迫切需要制定合理的规章制度,既能够降低信息泄露风险,又可以保留数据的研究价值。作为学术界自我管理的核心制度,美国机构审查委员会(IRB)需要加强他们的科技知识以了解新技术对于个体的潜在侵权和伤害,因为他们目前的规定中有关伤害的定义已经难以评估这些新型的伤害。IRB的审查员们现有的技术也很难判断数据有没有“真正的匿名化”。除了上述问题外,IRB可能有必要建立起一个处理数据安全问题的部门。目前,已经有很多私人企业手中握有大量的数据,但却没有一个统一的标准来保护数据安全。如果科学家们要用这些数据做研究,就需要考虑到数据的隐私问题,开发技术保护个人数据的隐私,这些技术将会反过来帮助政府和公司保护数据安全和客户的隐私(17)。

与其他新兴交叉学科一样(如:可持续发展科学),若要发展新兴的计算社会科学,就需要建立新的范式培养新的学者。大学中终身教职评定委员会和各个期刊的编辑部需要积极地鼓励新兴学者在跨学科建设方面做出的努力。最开始,计算社会科学的发需要社会科学和计算机科学的学者组成团队一起努力,但来自不同学科的学者努力是远远不够的,计算社会科学的发展最终还是取决于学术界愿不愿意培养计算社会科学家、具有计算相关知识的社会科学家或者是具有社会科学知识的计算机科学家团队。好在认知科学的出现为计算社会学的发展提供了一个很好的范例。认知科学的研究涉及从神经生物学到哲学到计算机科学等各个领域。它吸引了大量资源投入来创建一个共同领域,并在上一代为公共事业创造了巨大的进步。我们认为计算社会科学具有类似的潜力,值得进行类似的投入。延伸阅读1、D. Roy et al., "The Human Speech Project," Proceedings of the

28th Annual Conference of Cognitive Science Society,

Vancouver, BC, Canada, 26 to 29 July 2009.2、J. P. Eckmann et al. Proc. Natl. Acad. Sci. U.S.A. 101, 14333

(2004).3、S. Aral, M. Van Alstyne, "Network Structure & Information

Advantage," Proceedings of the Academy of Management

Conference, Philadelphia, PA, 3 to 8 August 2007.4、J.-P. Onnela et al., Proc. Natl. Acad. Sci. U.S.A. 104,7332 (2007).5、T. Jebara, Y. Song, K. Thadani, "Spectral Clustering and

Embedding with Hidden Markov Models," Proceedings of the

European Conference on Machine Learning, Philadelphia, PA, 3

to 6 December 2007.6、M. C. González et al., Nature 453, 779 (2008).7、D. Watts, Nature 445, 489 (2007).8、 L. Adamic, N. Glance, in Proceedings of the 3rd International

Workshop on Link Discovery (LINKDD 2005), pp. 36–43; 3; http://

doi.acm.org/10.1145/1134271.1134277.9、 J. Teevan, ACM Trans. Inform. Syst. 26, 1 (2008).10、 W. S. Bainbridge, Science 317, 472 (2007).11、K. Lewis et al., Social Networks 30, 330 (2008).12、C. Cardie, J. Wilkerson, J. Inf. Technol. Polit. 5, 1 (2008).13、M. Barbarao, T. Zeller Jr., "A face is exposed for AOL searcher

No. 4417749," New York Times, 9 August 2006, p. A1.14、National Research Council, Putting People on the Map: Protecting

Confidentiality with Linked Social-Spatial Data, M. P. Gutmann, P.

Stern, Eds. (National Academy Press, Washington, DC, 2007).15、J. Felch. "DNA databases blocked from the public," Los Angeles

Times, 29 August 2008, p. A31.16、N. Homer, S. Szelinger, M. Redman, D. Duggan, W. Tembe,

PLoS Genet. 4, e1000167 (2008).17、M. V. A. has applied for a patent on an algorithm for protecting

privacy of communication content.本文首发于微信公众号“集智俱乐部”(ID:swarma_org)第三章 计算社会科学简介 Computational Social Science作者 Claudio Cioffi-Revilla

乔治梅森大学,理学院教授,社会复杂性中心主任;致力于研究

应用于人类和社会复杂系统的定量数学模拟模型。译者 陈孟园校译 张 洪

社会科学是一门从认知、决策、行为、团体、组织、社团、和世界体系等多个层面上对人类行为、社会动态、社会组织进行调查分析的一门学科。计算社会科学是将社会调查与信息处理方法与高级计算媒介、复杂性科学等多门学科综合起来,形成一门综合的学问,目前,计算社会科学领域涉及到的内容有,自动信息提取系统、社交网络分析、社会地理信息系统(GIS),复杂性建模和社会模拟模型。就好比伽利略发明了望远镜作为更真实地理解宇宙的关键工具一样,计算社会科学家正在利用先进的、日益强大的工具计算技术了解一些超越传统学科分析范围的新鲜事物。

我们在这一章中主要是对计算社会科学的研究领域、与社会科学之间的关系、现有的主要的理论作简要的概述。虽然历史并不长,计算机社会科学已经涵盖了许多研究领域以及研究主题,其中有些领域与主题超出了社会科学以前在人类行为、社会动态的调查领域。越来越多的学者的加入这个学科,他们逐渐界定了这门学科的主题和研究范围。在这些学者的调查研究中,有的是重点研究最新的社会动态,有些则关注早期的基金会的形成与发展,或者是为了吸引读者,而不对计算科学一些深入的技术细节进行阐述的研究。计算社会科学

社会科学或社会科学学科调查各式各样的人类行为、社会动态、各级组织,根据调查的范围和侧重点的不同,传统的社会科学学科被分为了五个:社会科学、心理学、人类学、经济学、政治科学。而每一个社会学科又都包含几个分支专业,例如,人类学由体质人类学(又称,“自然人类学”、“人体学”)、文化人类学(又称为“社会人类学”)、考古学、语言人类学组成;政治科学包括比较政治学、国际关系、公共政策管理与方法等分支学科。统计作为科学的分析方法在所有的人文科学学科中发挥着重要的作用,不仅仅是社会科学及其分支专业中,还在地理学(人类和社会地理学)、历史(社会科学史和气候学)、语言学、管理科学等其他人文科学学科中扮演这重要的角色。在过去的两个世纪,自启蒙运动触发了对社会科学研究的启示以来,社会科学已经发展了三种当代社会科学研究方法:统计学、数学和计算。使用这些研究方法主要是为了描述和归纳(统计)、发展理论研究(数学)、和模拟复杂系统(计算),这些研究方法由于与社会科学相似的原因也被物理科学和生物科学所用。社会统计和社会数学是迄今为止三种方法中最古老的方法,他们包含传统的“政治算术学”的理论和概率理论。有意思的是,“统计学”曾经是“政治学”的原名,被作为国家的学科,统计学与政治学之间的关系,就好比经济学是经济的学科而语言学时语言的学科,这样的一种关系。

计算社会科学是一个较现代的学科,最远可以追溯到20世纪中后期电脑刚刚发明的时候,在20世纪60年代,社会科学家开始使用电脑进行统计数据分析,当时SPSS、SAS等分析工具才刚刚开始出现,也正是在这时,出现了计算社会科学的第一代创始人:Herbert A. Simon(1916-2001)、Karl W. Deutsch(1912-1992)、Harold Guetzkow(1915-2008)、Thomas C. Schelling(1921)、他们更偏向计算社会科学理论方面的研究。

计算社会科学通过信息处理和先进的计算方法对社会系统进行综合性的跨学科的研究。因此,社会科学中的计算范式需要满足双重的要求:实质性的(作为理论视角)和工具性的(作为一种方法论)。以前的信息处理和控制论方法是基于Ross Ashby, Norbert Wiener, Claude Shannon和Ludwig von Bertalanffy早期的研究,在这里,我们只谈论信息处理和控制论在计算社会科学中的应用。

就像伽利略利用望远镜作为关键的观察工具最终获得对物质世界更深刻、更真实的理解一样,计算社会科学家正在学习利用先进和日益强大的计算工具来超越传统的学科。因此,计算社会科学是一种实验仪器支持的科学学科,在这个方面,社会科学与微生物学、射电天文学或纳米科学类似,这些学科分别由显微镜、雷达和电子显微镜等仪器设备支持,来推动发现新的科学研究领域。在仪器支持的学科中,仪器都是推动这些学科理论和实践发展的关键调查工具。

计算机社会科学的组织形式是多个国际学会社团,其中包括北美计算社会及组织科学协会(NAACSOS),欧洲社会模拟协会(ESSA)以及亚太社会系统科学计算实验方法协会(PAAA)。每个区域协会都会举行年度会议并出版会议记录,此外每隔几年召开一次区域协会,2004年在日本京都理工学院举办,2006年在美国乔治梅森大学举办、2010年在德国卡塞尔大学举办。主要同行评审的专业期刊包括人工社会与社会仿真(JASSS)、计算数学组织理论(CMOT)、社会科学计算机评论(SSCR),复杂系统进展(Advances in Complex Systems)和经济互动与协调期刊(Journal of Economic Interaction and Coordination)。计算社会科学研究在许多社会科学期刊(如美国社会学杂志,美国政治科学评论和其他主流期刊)以及跨学科期刊(IEEE Transactions on Systems, Man and Cybernetics)中也越来越容易见到。计算社会科学研究方法

在本章的第一节中,我们提到,计算社会科学最重要的是在研究工具与研究方法上的革新,研究工具是各式各样的计算机软件,重要的是用什么研究方法去研究,目前,根据使用环境的不同,计算社会科学方法主要分为五个:

• 自动信息提取

• 社交网络分析(SNA)

• 地理空间分析(又被称为社会地理信息系统、地理信息系统、社会GIS)

• 复杂系统建模

• 社会模拟模型

同样的,每个方法下面也被系统的划分为多个模型,例如计算社会模拟模型包括系统动力学,微观分析模型,排队模型,细胞自动机,多智能体模型,学习和演化模型,包括一些混合动力[例如,结合系统动力学和代理模型(ABMs)]。另外,这五种方法之间的几种组合也很常见,如在由反弹道导弹模拟时引入表达社会复杂性的幂律分布模型,计算社会科学领域还如此的年轻,并非所有可组合协调的模型都已经尝试过,一些领域仍然有待探索,欢迎各位读者尝试。不久之后,数据可视化和“声处理”也将有可能成为计算社会科学的专业分支。最重要的是,每种计算方法都可能超越传统社会科学方法,甚至超越以前的统计和数学方法,从而提供解决问题的独特的科学见解。自动信息提取 Automated information extraction

文本分析曾经是一种非常普通的分析方法,它通过编码文档从中提取信息与数据。近来,文本分析方法不断演变,除了文字文本之外,还可以分析音频、图像、视频。由于政府界和学术界的不断推进,文本分析方法的计算效率在学术界有了一个很大的提升,但在实际应用方面仍存在着很大的缺陷。今天,伴随着人工智能和其他计算算法的出现,文本分析,信息提取将很有可能在实际应用上取得巨大的突破。自动化提取的主要用途之一,是获得“事件数据”(events data),使用时间序列分析、语义分析、隐马尔科夫模型、微波分析、事件生命周期建模等方法分析“事件数据”。这些方法经常与其他的方法结合使用,比如在下一节中提到的复杂系统理论的方法。除了这些方法,还有许多的自动文本提取算法和系统可以挖掘网络数据结构,比如从图论和社交网络分析中组合出来。在应用领域,自动信息提取技术由于可以挖掘实时的数据流,如新闻广播或其他电子报告,不仅可用于异常检测和预警,同时也可用于监测趋势和评估干预和项目执行等,若自动信息技术再完美些,应该能够成为日常工作系统升级或运营中心不可缺少的一部分。社会科学领域可以说是文字丰富但数据较差,因此自动信息提取技术和文本挖掘技术在该领域有大展身手的空间,如果能合理应用,将来一定会在计算社会科学调查中取得重大突破。社交网络分析 SNA

了一张社交网络。联盟、恐怖组织、贸易体系、认知信仰体系和国家现代的社交网络分析(以下简称SNA)以纯粹的数学理论为基础,社交网络图更像是一个数学图。我们首先来简单描述社交网络,社交网络将个人或一个社区看作一个点,个体(社区)与个体(社区)之间可能存在的相互依赖关系用连边表示,这样许多人(社区)就构成社会体系本身都是常见的社会网络,是社会科学家们感兴趣的研究对象,例如Stanley Milgram研究提出了著名“小世界”网络。社会科学家们提出许多研究SNA的计算算法,不仅方便了SNA结果的可视化,还方便了对网络适应性、功能性、弱点及网络分解的理解。例如SNA可以根据网络的节点和关系的结构模式,如弹性、脆弱性、可分解性、功能性等得出关于组织结构更深层次的信息,另外,SNA可以应用于设计更强大和可持续的网络如交通运输网络等。

通过社会科学家们深入的思考,SNA有了许多实际应用:

• 信仰系统,以了解极端主义思想和进程如激进化;

• 联盟和条约系统,以了解它们的历史沿革;

• 国际和跨国组织,例如可分析推测恐怖分子网络;

• 网络游戏,例如了解扩散者与反扩散者之间,非法贩运

• 者与政府之间的关系网。

网络在社会系统和任何重要的科学调查中都存在,同时也是许多政策问题的组成部分。图3-1:互联网构成的社交网络http://www.tooopen.com/view/1057706.html图片来源:社会地理空间分析 socio-GIS information systems

地理信息系统(GIS)最初是社会地理学家中的制图员研究地理现象的可视化工具和空间分析的工具。社会地理空间分析(以下简称社会GIS)目前在社会科学中有了许多应用,比如在犯罪学和区域经济学应用社会GIS可以有效的量化冲突,与其他的量化技术结合在一起可以产生一些使用数学和统计模型无法获得的有趣的见解。这一领域目前正在积极地向地理空间科学发展,Google地球及其数据设施的发展为社会GIS增加了另一个维度,带来了新的调查方法;而该领域另外一个重要的发展是成立了国家地理信息与分析中心,一个致力于地理信息科学及其相关技术(包括地理信息系统)基础研究和教育的独立研究联盟。复杂系统建模间 Complexity modeling

20世纪末,复杂系统科学兴起,这一新兴学科对生命系统、人脑系统、社会系统、经济系统等复杂的系统进行了研究。那什么是复杂系统呢?抽象的说是指个体之间的相互作用比较复杂的系统,比如常见的生态系统、经济市场、社会系统都属于复杂系统的范畴,系统之所以复杂,是由于系统表现出非线性、涌现、自适应等不同的特性,而导致系统不能使用普通的、简单的线性模型来表示。常见的复杂系统建模有神经网络建模、基于主体的建模方法、遗传算法、粒子群优化算法、蚁群优化算法等。复杂系统的理论模型为社会科学中的非均衡系统的动态分析提供了理论支持,非均衡动态系统的例子常常发生在全球最具有挑战的社会科学研究中,如恐怖袭击、发展中国家的财富和贫困,政治不稳定,外国援助分布和国内和国际冲突等。相比之下,均衡系统的特点是状态变量接近正态分布(高斯分布或“钟型”分布),很少偏离中心,而非均衡动态系统则被发现系统中的几个重要变量是遵循幂律分布的,如在战争中的死亡率服从幂律分布。

• 幂律分布是计算社会科学中国最常见的复杂系统模型。帕累

托首次将幂律分布函数应用于经济学中,给定变量X,则有p(x)

~x^(-a),其中a>0,是所谓的帕累托指数。图3-2 正态分布(“钟型”分布)图3-3 幂律分布社会仿真模型 Social simulations models

仿真(Simulation)又被翻译作模拟,泛指基于实验或训练为目的,将原本的系统、事物的关键特性或者行为功能予以系统化和公式化,从而对关键特征做模拟,从而达到预计系统的发展趋势,发展结果等效果。仿真不仅仅是一项技术,也是一种解决问题的方法。对于社会经济等系统,很难在真实的系统上进行实验。早期的计算社会科学的仿真模拟起源于对国家安全和国家政策的研究。计算机仿真模型在基础社会研究和政策分析一个特别有价值的应用特征是

能够运行当前的和备选的策略,观察不同策略对系统的影响,以评估不同策略效果。比如你要研究美国发动与俄罗斯之间的战争将会给美国带来多大的损害,不可能去真正的发动一场美国与俄罗斯之间的战争,这时使用计算机模拟仿真技术可以模拟一些不同的发动战争的策略,对战争引起国家的损失进行预估,从而寻找到最优的方案,另一个非常有价值的特征是仿真模型能够在模拟过程中对各个参数进行灵敏度分析,以观察各个参数的鲁棒性,或验证模型的性质和假设。假设在社会科学研究中非常的关键,验证假设的正确与否关系到研究的结果的正确与否。

系统动力学开始之初主要应用于工业企业管理、市场股票与市场增长的不稳定性等研究上,因此早期被称为“工业动力学”,起源于美国麻省理工学院Jay W. Forrester教授的名著《工业动力学》,随着研究范围的逐渐扩大,改称为系统动力学。所以系统动力学不应当理解为一个简单的模型,也不应当理解为计算机仿真模型下的一个分支,它是系统科学与管理科学交叉的一门学科,它将系统理论与计算机仿真模拟紧密结合形成了自己独特的一套理论。系统动力学从解决问题的角度出发,建立实际问题的计算机仿真模型系统,设计、测试选择解决问题的方案。常见的系统动力学案例有传染病模型、城市发展规划模型等,麻省理工学院的N. Choucri等人在论文(见延伸阅读Choucri N et. al)中提出了政治动态模型,使用系统仿真分析确定了一系列缓解叛乱的政策,通过传统的数据分析或其他传统的社会科学研究方法是无法获得这么有洞察力的结果的。

基于主体的仿真建模(ABMs)的本质是计算机模拟,它模拟一个给定的目标系统,包含系统中一系列可交互的参与者、互动规则、静态或动态的环境特征,对个体的行为准则进行建模,进而解释个体行为或集体和宏观行为的出现,它被广泛应用于集体、公众情绪影响范围。这些也是社会科学应当主要研究的领域。如果对基于主体的仿真建模有兴趣,建议读者们读一些有趣的故事:Bhavnani R等的《A hybrid model of decision-making in closed regimes》中的卢旺达种族灭绝模型;MASON RebeL的《An Agent-Based Model of Politics, Environment, and Insurgency》一文中提出的不规则的战争模型等。结语

在这一章中,我们从社会科学出发,逐步引入计算社会科学的概念,计算社会科学有别于以往的社会科学的地方就在于其借助大量新兴研制出来的计算机软件,如R语言、Python、Stella软件或Vensim软件,以及新开发的优化算法和模型。正如近代物理学中使用的实验工具大大推进了物理学的发展一样,应用这些新的软件模型或将使社会科学真正进入现代科学范畴,建立科学的研究范式。另外,我们向读者介绍了计算社会科学最主要的5种研究方法,自动信息提取系统、社交网络分析SNA、社会地理信息系统、复杂系统建模和社会仿真模型。这些模型必须符合内部和外部有效性标准。先进的社会科学研究方法越来越多,在当下和未来,我们可以预见到社会科学能够帮助我们分析和理解所面临的最复杂的社会问题。延伸阅读1、Choucri N, Goldsmith D, Madnick S, Bradley Morrison J, Siegel M.

Using system dynamics to model and better understand state

stability. International Conference of the System Dynamics

Society, at Boston, MA, 20072、Bhavnani R, Backer D, Riolo R. A hybrid model of decision-making

in closed regimes. In: Macal C, Sallach D, eds. Agent 2002

Workshop on Social Agents: Ecology, Exchange, and Evolution.

Chicago, IL:Argonne National Lab and University of Chicago;20023、Cioffi-Revilla C, Rouleau M. MASON RebeLand: An Agent-Based

Model of Politics, Environment, and Insurgency. International

Studies Review 2010本文首发于微信公众号“集智俱乐部”(ID:swarma_org)第四章 文化,观念,与社会影响 Culture, Opinion and Social Influence作者 施永仁施永仁,集智科学家,爱荷华大学社会学系助理教授。他于2016年康奈尔大学社会学系博士毕业,并在耶鲁大学人类本性实验室从事两年的博士后工作。目前研究重点在于理解线上与线下的群体行为,乡村社区中社会制度与社会网络,以及美国民众政治观念的演化。他的主要研究兴趣包括社会网络,定量与计算方法,组织社会学,公共卫生,与社会心理学。他的工作发表于《美国社会学评论》,《美国社会学杂志》,《自然-人类行为》等多种社会科学期刊。他的研究工作被连线杂志,英国卫报,BBC新闻,洛杉矶时报等多家媒体报道。人类本性实验室(Human Nature Lab)隶属于耶鲁网络科学研究所,由Nicholas Christakis任主任(《大连接》作者),从事生物医学,大数据计算,社会实验与社会网络的跨。学科研究

文化并非与生俱来,也不完全是从老一辈那里传承过来,更不是从上而下整齐划一的世界观,或狭隘意义上的知识与经验。周末看了哪本电影,平时在读什么书,最近喜欢喝哪种碳酸饮料,匆匆读了朋友圈转帖若有所思,随即按了转发键,这些都是文化的一部分。按照维基百科的定义,文化是一种“约定俗成潜意识的外在表现”。但是,问题来了。我们每个人所携带的文化与观念从何而来,又是如何改变?为什么你喜欢的电影,书籍,音乐,饮料,你所持有的政治观点,伦理标准,行为规范,你所关注的企业家和电子产品,使用的电子社区,订阅的公众号,可能与你父母的完全不同,却与千里之外的某个从未碰面的陌生人不谋而合?玩抖音的也许不懂玩快手的世界。在你频繁转发一席讲座视频的时候,却对朋友圈中的那几条关于人工智能的转帖毫无兴趣,置之不理。是什么决定了我们的观念与趣味,是自己内在的属性,比如教育水平在一定程度上决定了审美趣味?还是在日常生活与他人交流的过程中,我们的文化,行为与观念在不同程度上受到了影响?这种影响是如何决定的?如果我们把所有人作为节点,把他们之间的关系作为边,把整个社会结构比作一张无边的大网,那么,这张网的结构是什么样的?不同的文化,行为与观念在这张网上是如何分布的?当我们对社会网络的认知能否为我们带来有效的工具去改进社会生活中黑暗的角落?一个简单的社会影响模型

如果你认为自己是果断而独立,不会随波逐流,你可能高估了自己的判断力。心理学家Stanley Milgram(对,就是那位以权力服从实验和六度分离理论而闻名于世的社会心理学家!)和他的合作者们在上世纪六十年代末在曼哈顿市中心做了一项实验。在实验中,他们安排了数量不等的实验助手,让其假装为路人朝高楼张望,当然高楼上并没特别之处,而Milgram则在远处观察和记录路人的行为。实验结果发现匆匆而过的路人通常也会驻足张望,而安排的助手越多,停下脚步的路人也越多。社会心理学家Bibb Latane在八十年代初重新分析了连同Milgram实验在内的十多项群体心理的工作,发现几条有意思的规律。社会影响随着周遭人群规模变大而变大,但这种规律并非线性。第一个人对我们的影响是最大的,而后面每加一个人的影响总小于前面一个人。而第20个安插的实验助手对路人的影响几乎可忽β略。这种关系的数学表达即是幂率关系(I~N,其中I为个体受到的社会影响程度,N为周遭所持该行为的人群规模,β为介于0,1之间的指数。在Milgram的实验中,β=0.24)。

当然,对于Latane所谓“社会影响”(social influence)并不仅局限于行为模仿(别人驻足朝天张望会增加自己做同样行为的可能性),他发现幂率规律广泛地存在于各种社会行为中。比如当众演讲或表演时,我们都会或多或少的“怯场”,即面对观众时产生的紧张与焦虑,而紧张程度与观众规模的大小紧密联系。实验发现,口吃患者在面对0,1,2,4,8名观众朗诵时,因结巴而读错的字也与观众规模成幂率关系。观众越多,结巴程度越严重,而当观众的数量大到一定规模后,结巴程度并未显著增加。再比如,在遇见灾难或不公事件时,个人勇于站出来承担社会责任的可能性会随着所在群体规模的增加而以幂率降低。这即所谓旁观者效应(bystander effect)。2011年发生在广东佛山的“小悦悦事件”即为旁观者效应的典型案例。2岁女孩小悦悦被汽车撞到并被压在车下,之后的18名路人无一出手帮助,直到第19位路人救起小女孩,随后将其送往医院急救。是国人人性冷漠么?不尽然。类似的著名的旁观者悲剧也发生在纽约和加利福尼亚。Latane在七十年代通过一系列实验证实,当只有你一个人在场的时候,你更容易挺身而出,帮助受难者。但若周围有多位旁观者的时候,你的责任感就“稀释了”,即你伸出援手的可能性大为降低,而这可能性也受幂率支配。

除了周遭群体的规模,个人受到的影响也取决于对方的社会地位,权力,可信度,声望等。我们把这些因素称为影响源强度。影响源强度永远是相对的,因人而异,也因时因地而异。对于一个二年级有厌食症的小女孩,比较有效的改进方法可能不是父母的叮嘱和教导。如果把她与另一个三年级的小女孩组成“lunch buddy”,也许会有意想不到的成效,因为相对于父母,年级稍高的同龄人更能成为参照组。Latane将这个简单的社会影响模型称之为电灯泡模型(light bulb model;见图:4-1)。我们受到的社会影响不是受到某一个变量的控制,而是多个效应的综合。图中我们可以看到影响个体的因素有周遭人群的规模(圆圈数量),源的影响强度(圆圈大小),以及社会关系的强弱与远近(箭头长度与宽度)。在我们做出“理性的”决定前,无论是换何种手机,使用什么样的语言,或是否决定戒烟,我们的潜意识里已经在不同程度上受到了来自他人的影响。这种综合的社会影响可能通过改变我们的注意力,记忆或态度等认知能力来改变最终的决定。其中Source为影响源,即周遭的人群。Target为被影响的个体。图3-1中圆圈数量代表周遭人群的规模,圆圈大小代表源的影响强度,而箭头长度与宽度代表社会关系的强弱与远近。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载