前言

前言

读者对象

本书面向工程师、开发人员、系统管理员、运维人员以及其他所有对系统监控和DevOps感兴趣的人。书中对现代应用程序和基础设施的监控艺术提供了简单、实用的介绍。读者应该具有基本的Unix/Linux技能,熟悉命令行和基本的网络操作,并能够熟练地编辑文件、安装软件包、管理服务。

致谢

  • 感谢Ruth Brown,我生命中最了不起的人。
  • 感谢Kyle Kingsbury开发了Riemann,并且在本书写作过程中随时为我解惑。
  • 感谢Pierre-Yves Ritschard为我提供有关Riemann和Clojure的帮助。
  • 感谢Ben Linsay对Clojure介绍材料的反馈。
  • 感谢Baron Schwartz、Dean Wilson、Brice Figureau、Marc Fournier针对本书提供建设性意见。
  • 感谢Jeff Danzinger同意本书使用他创作的关于平均值的漫画。
  • 感谢Simone Bottecchia、Katherine Daniels、Laurie Denness、Ryan Frantz、Kelvin Jasperson、Marc Fournier、Pierre-Yves Ritschard、Javier Uruen Val、Avleen Vig、John Vincent回答与监控相关的问题。
  • 感谢PagerDuty的员工在本书写作过程中免费提供平台。
  • 感谢Bimlendu Mishra编写的Grafana数据看板示例。
  • 感谢Michael Jakl提供RESTful Clojure示例应用程序。

技术审校者

Caitie McCaffrey

Caitie McCaffrey是Twitter的后端和分布式系统专家,她是系统可观测性研究团队的技术主管。在此之前,她多数时间致力于构建娱乐行业的大型系统和服务,曾就职于343 Industries、微软游戏工作室、HBO电视网。她拥有康奈尔大学的计算机科学学士学位,并参与了多款电子游戏的开发,包括《战争机器2》《战争机器3》《光环4》《光环5》。她在CaitieM.com上写博客,也经常在Twitter上讨论技术。她的Twitter账户名是@Caitie。

Paul Stack

Paul Stack是基础设施程序员,他热衷于实践持续集成、持续交付和良好的运维流程,以及如何使它们成为开发人员和系统管理员日常工作的一部分。他相信可靠地交付软件和开发软件一样重要。

Jamie Wilkinson

Jamie Wilkinson是谷歌存储基础设施团队的网站可靠性工程师。为了顺应其研究领域的跨学科性,他从1999年开始从事Linux系统管理,同时获得了计算机科学学士学位,并且为《SRE:Google运维解密》贡献了一章关于监控的内容。他目前和家人居住在澳大利亚悉尼。

编辑

Sid Orlando是作家兼编辑,目前在Kickstarter担任主编。自从开始从事更加注重技术的项目以来,她时常梦见用Docker容器来整理衣橱。

作者

詹姆斯·特恩布尔(James Turnbull)是一位作家和开源极客。除了本书以外,他最近出版的书还包括关于基础设施管理工具Terraform的The Terraform Book、关于Docker的《第一本Docker书》,以及关于流行的开源日志工具Logstash的The Logstash Book。他写了两本关于Puppet的书:《精通Puppet配置管理工具》和Pulling Strings with Puppet。另外,他还著有《Linux系统管理大全》、Pro Nagios 2.0Hardening Linux

他曾在Kickstarter担任首席技术官,在Docker担任服务和支持副总裁,在Venmo担任工程副总裁,并在Puppet Labs担任技术运维副总裁。他喜欢美食、美酒、阅读、摄影、猫,但不喜欢在海滩上散步。

排版约定

正文中的代码以等宽字体显示,例如inline code statement

代码块的格式如下所示。

代码清单 示例代码块

This is a code block

长代码会换行。

代码和示例

本书中的代码和示例配置可在以下GitHub仓库中找到1

1也可以访问图灵社区,下载示例代码、查看或提交勘误:http://ituring.cn/book/1955。——编者注

https://github.com/turnbullpublishing/aom-code

勘误

如果在本书中发现错误,请发送邮件至james+errata@lovedthanlost.net,或联系中文版译者(spark.li@qq.com)。

免责声明

本书仅供教育之用,并不作为对法律、会计或其他专业服务提供的建议。尽管已经尽力完善本书,但作者不对内容的准确性和完整性做任何形式的陈述或保证,在此强调不对任何特定用途的适用性做相关的暗示和保证。对于任何个人或组织使用本书所含信息或程序直接或间接造成的任何损失及附带损害,作者不承担任何责任。每个公司的情况都不一样,书中的建议和策略可能并不适合所有情况。在开始实施任何监控计划之前,都请咨询专业人士。

版本

此版本为本书的1.0.3版(0b5b213)。

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录

  • 版权声明
  • 前言
  • 第 1 章 引言
  • 第 2 章 监控框架
  • 第 3 章 使用Riemann管理事件和指标
  • 第 4 章 Graphite和Grafana
  • 第 5 章 监控主机
  • 第 6 章 在Riemann中使用collectd事件
  • 第 7 章 容器——另一种类型的主机
  • 第 8 章 日志
  • 第 9 章 构建可监控的应用程序
  • 第 10 章 通知
  • 第 11 章 监控之巅:监控Tornado
  • 第 12 章 监控Tornado:应用程序层
  • 第 13 章 监控Tornado:数据层
  • 附录 浅谈Clojure和函数式编程
  • 作者简介