前言

前言

从金融系统和通信系统,到社会过程和生物过程,整个世界都是由联系驱动的。揭示这些联系背后的含义将推动各行各业在很多领域取得突破,例如识别诈骗团伙、优化建议以评估群组实力、预测级联故障等。

随着连接速度不断加快,人们对图算法的兴趣呈爆炸式增长,这不足为奇,因为图算法基于数学,其发展是为了洞悉数据间的关系。图分析可以揭示复杂系统和大规模网络的运作机制,这适用于任何组织。

图分析的实用性和重要性令人着迷,揭示复杂场景内部运作机制的过程充满乐趣。直到最近,采用图分析还需要大量专业知识和判断,因为工具的使用和集成非常困难,很少有人知道如何应用图算法来解除困惑。本书旨在改变这种现状,帮助组织更好地利用图分析,从中收获新发现,进而更快地研究出智能解决方案。

本书内容

对拥有 Apache Spark ™或 Neo4j 使用经验的开发人员和数据科学家来说,本书是帮助他们开始学习图算法的实用指南。书中的算法示例采用 Spark 和 Neo4j 两种平台来演示,但无论选择哪种图平台,本书都有助于理解常用的图概念。

前两章介绍图分析、图算法和图论。第 3 章简要介绍本书要使用的平台,第 4~6 章深入讨论经典的图算法,包括路径查找算法、中心性算法、社团发现算法等。最后两章介绍如何在工作流程中使用图算法:第 7 章介绍常规分析,第8 章讲解机器学习。

在介绍每种算法之前,本书都会给出一份速查表,可快速跳转到相应算法。对每种算法的介绍都包含以下内容:

  • 算法功能;
  • 算法的用例和参考资料,以便了解更多内容;
  • 示例代码,演示在 Spark、Neo4j(或两者都有)上应用算法的具体方法。

排版约定

本书使用以下排版约定。

  • 黑体

    表示新术语或重点强调的内容。

  • 等宽字体(constant width

    表示程序以及段落内引用的程序元素,如变量、函数、数据库、数据类型、环境变量、语句、关键字。

  • 等宽粗体(constant width bold

    表示应该由用户输入的命令或其他文本。

  • 等宽斜体(constant width italic

    表示应该被替换为由用户提供的值或由上下文确定的值的文本。

 该图标表示提示或建议。

 该图标表示普通的注记。

 该图标表示警告或警示。

使用示例代码

本书的附加资料(代码示例、练习等)可以从O'Reilly 网站1下载。

1也可以访问本书在图灵社区的页面并下载示例代码:http://ituring.cn/book/2694。——编者注

本书是要帮你完成工作的。一般来说,如果本书提供了示例代码,你可以把它用在自己的程序或文档中。除非你使用了很大一部分代码,否则无须联系我们获得许可。比如,用本书的几个代码片段写一个程序就无须获得许可,销售或分发 O'Reilly 图书的示例光盘则需要获得许可;引用本书中的示例代码回答问题无须获得许可,将书中大量的代码放到你的产品文档中则需要获得许可。

我们很希望但并不强制要求你在引用本书内容时加上引用说明。引用说明一般包括书名、作者、出版社和ISBN,例如Graph Algorithms by Mark Needham and Amy E. Hodler(O'Reilly). Copyright 2019 Mark Needham and Amy E. Hodler, 978-1-492-04768-1。如果你觉得自己对示例代码的用法超出了上述许可的范围,欢迎你通过 permissions@oreilly.com 与我们联系。

O'Reilly 在线学习平台(O'Reilly Online Learning)

近40 年来,O'Reilly Media 致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。

我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O'Reilly 的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O'Reilly 和200 多家其他出版商提供的大量文本和视频资源。有关的更多信息,请访问 https://oreilly.com

联系我们

请把对本书的评价和问题发给出版社。

美国:

  O'Reilly Media, Inc.

  1005 Gravenstein Highway North

  Sebastopol, CA 95472

中国:

  北京市西城区西直门南大街 2 号成铭大厦 C 座 807 室(100035)

  奥莱利技术咨询(北京)有限公司

对于本书的评论和技术性问题,请发送电子邮件到 bookquestions@oreilly.com

O'Reilly 的每一本书都有专属网页,你可以在那儿找到书的相关信息,包括勘误表2、示例代码以及其他信息。本书的网页地址 https://oreil.ly/graph-algorithms

2本书中文版勘误请到http://ituring.cn/book/2694 查看和提交。——编者

要了解 O'Reilly 图书、培训课程、会议和新闻的更多信息,请访问以下网站:https://www.oreilly.com

我们在 Facebook 的地址如下:http://facebook.com/oreilly

请关注我们的 Twitter 动态:http://twitter.com/oreillymedia

我们的 YouTube 视频地址如下:http://www.youtube.com/oreillymedia

致谢

我们非常享受写作本书的过程,在此感谢所有为本书撰写提供过帮助的人。特别感谢 Michael Hunger 的指导,也感谢 Jim Webber 细致的编辑和 Tomaz Bratanic 热忱的研究。最后,非常感谢 Yelp 允许我们使用其丰富的数据集,助力构建生动的示例。

电子书

扫描如下二维码,即可购买本书中文电子版。

目录

  • 版权声明
  • O'Reilly Media, Inc.介绍
  • 前言
  • 第 1 章 导论
  • 第 2 章 图论及其概念
  • 第 3 章 图平台和图处理
  • 第 4 章 路径查找算法和图搜索算法
  • 第 5 章 中心性算法
  • 第 6 章 社团发现算法
  • 第 7 章 图算法实战
  • 第 8 章 使用图算法增强机器学习
  • 附录 额外信息及资料
  • 关于作者
  • 关于封面