译者序

2010年,微博元年。碎片化的微博数据如滔滔洪水般涌来,实时的转发互动,近在眼前的名人,屏幕右上角不断刷新的粉丝数,让无数人成为“微博控”。这里面包括一批研究自然语言处理和数据挖掘的计算机专家,还包括很多社会科学方面的研究者。专家们的兴趣不是做一个微博的发烧友用户,而是希望透过社会媒体去观察这个世界,如舆情的瞬息万变、消息的指数级传播、群体的聚合与分裂等。一时间,社会媒体大数据把“社会计算”的研究推向了高潮。

2012年12月8日,首届“全国社会媒体处理大会”(SMP 2012)通过在微博上通知和报名的方式组织召开。20位来自不同领域(计算机、社会学、传播学等)的学者、企业家发表演讲,吸引了数百名听众。这是国内学术界和企业界在“社会媒体处理”这个崭新的学术和技术处女地上一次标志性的聚集,很多平时只在微博上“见面”的网友开始了在现实中的合作。

转眼三年过去了,社会媒体的概念已经扩展到微博、微信、QQ、论坛、电商网站、视频网站等各种媒体。可以说,只要是背后有一张社会网络支撑的在线媒体都属于社会媒体,社会媒体是大数据时代最重要的数据来源之一。社会媒体处理是指利用人工智能技术对社会媒体进行分析、挖掘,是社会计算的重要组成部分。这些概念已经深入人心,而社会媒体处理的研究内容也深入到社区、传播、影响力、情感、推荐、预测等方方面面,越来越多的研究人员和学生进入这个领域,SMP 2014的听众超过800人。

要发展一个研究领域,迫切需要为这个领域培养青年人才,而编写和出版教材是其中非常重要的一环。美国亚利桑那州立大学教授、IEEE Fellow刘欢教授及其弟子们的新书Social Media Mining是一本非常及时的社会媒体处理领域的教材。该书深入浅出,既有基础的数学理论,又集成了部分前沿研究成果。我们很高兴接受图灵公司的邀请翻译此书,推荐给国内的读者,相信此书将对我国社会计算学科的发展提供帮助。

在本书的翻译过程中,除三位译者外,丁效等多位博士生、硕士生也参与了部分章节的翻译工作。本书还得到国家973项目“面向三元空间的互联网中文信息处理理论和方法”(项目编号:2014CB340503、2014CB340506),以及国家自然科学基金重点项目“篇章级中文语义分析理论与方法”(项目编号:61133012)的资助。

交叉学科的研究从来就不是一帆风顺的,不同领域的学者在研究对象、手段、评价标准上有着很大的差异。但富有远见的学者会深刻地意识到,在社会媒体大数据的推动下,计算技术与社会科学的历史性撞击所爆发出的能量,势必深远地影响诸多学科的未来,而投身于这一重大的文理交叉领域的研究者注定要承受着拓荒者的艰辛,也注定在用大数据的手段观测和预测人类社会的进程中发挥重要的作用。

由于译者水平有限,书中疏漏在所难免,敬请读者批评指正。

刘挺

2015年10月6日

目录

  • 译者序
  • 第1章 引言
  • 第一部分 基础知识
  • 第2章 图的基本要素
  • 第3章 网络度量 
  • 第4章 网络模型
  • 第5章 数据挖掘的基本要素 
  • 第二部分 社区和交互
  • 第6章 社区分析
  • 第7章 社会媒体中的信息传播
  • 第三部分 应用
  • 第8章 影响力和同质性 
  • 第9章 社会媒体中的推荐
  • 第10章 行为分析 
  • 参考文献