1.1 什么是社会媒体挖掘

社会媒体打破了现实世界与虚拟世界之间的界限。我们结合社会学理论与计算方法来学习人类个体(也就是社会原子,social atom)如何互相影响,以及社区(也就是社会分子,social molecule)是如何形成的。社会媒体数据的独特性需要我们开发出全新的数据挖掘技术,来处理带有丰富社会关系的用户创建内容。这些新技术的研究和发展是在社会媒体挖掘这一新兴的数据挖掘学科下进行的。社会媒体挖掘是从社会媒体数据中表示、分析和抽取可操作模式的过程。

本书介绍一些基本概念以及适用于研究大规模社会媒体数据的主要算法,并从不同的学科(如计算机科学、数据挖掘、机器学习、社会网络分析、网络科学、社会学、人种学、统计学、最优化以及数学)视角讨论相关理论和方法。此外,本书还会介绍一些有用的工具,这些工具能够从大规模社会媒体数据中形式化地表示、衡量、建模和挖掘有意义的模式。

社会媒体挖掘培养出了一类新的数据科学家(data scientist),这些科学家精通社会学和计算科学理论,能够分析棘手的社会媒体数据,并且熟练地运用已经掌握的技能和理论(社会学和计算科学理论)以及一些计算工具,帮助我们探索广阔的社会媒体世界。

目录