图书

  • 凤凰项目:一个IT运维的传奇故事(修订版)

    吉恩 • 金   凯文 • 贝尔   乔治 • 斯帕福德   成小留   刘征   译

    本书讲述了一位IT经理临危受命,在未来董事的帮助和自己“三步工作法”理念的支撑下,最终挽救了一家具有悠久历史的...

  • Serverless架构应用开发:Python实现

    [印] 贾莱姆·拉杰·罗希特   安翔   译

    本书主要基于云架构的Python示例来讲解Serverless的概念。Serverless架构的核心思想是函数...

  • 基础设施即代码:云服务器管理

    Kief Morris   金明   钱伟   马博文   黄博文   禚娴静   译

    本书旨在解释如何利用“云时代”基础设施即代码的方法来管理IT基础设施。主要内容包括:组织在采用新一代基础设施技...

  • DevOps实践指南

    Gene Kim   Jez Humble   Patrick Debois   John Willis   刘征   王磊   马博文   曾朝京   译

    本书共分为6个部分:第一部分概述DevOps的历史和三个基本原则,即“三步工作法”;第二部分介绍开启DevOp...

  • Docker开发指南

    [英] Adrian Mouat   黄彦邦   译

    Docker容器轻量和可移植的特性尤其适用于动态和分布式的环境,它的兴起给软件开发流程带来了一场革命。本书对D...

  • Docker经典实例

    Sébastien Goasguen   刘斌   译

    【主要内容】 本书结构明晰,示例丰富详实,是全面实用的Docker入门教程。作者全面介绍了Docker相...

  • 监控的艺术

    James Turnbull  

    本书由前Docker员工、运维专家James Turnbull执笔,系统介绍现代应用、架构的监控和度量。全书共...

  • OneAPM官方技术博客 8推荐

    解谜谷歌 DevOps:什么特质可以打造世界级可靠系统?

    【编者按】本文是 Gene Kim 总结自对 Randy Shoup 两个小时的采访,主要关注谷歌 DevOps 的提升之道。本文系 [OneAPM ](http://www.oneapm.com/index.html?utm_source=Community&utm_…...

  • OneAPM官方技术博客 7推荐

    荣誉,还是苦逼?| 也议全栈工程师和DevOps

    引言 全栈工程师(本文称「全栈」开发者)和 DevOps 无疑是近期最火的词汇,无论是国外还是国内。而且火爆程度远超于想象。 全栈和 DevOps,究竟是我们的新职业方向,还是仅仅创业公司老板的心头所爱?且听本文理性分享。 Anyway,文末附赠 9 家把 DevOps …...

  • OneAPM官方技术博客 7推荐

    Cloud Insight 仪表盘上线 | 全面监控 Redis

    OneAPM 作为应用性能领域的新兴领军企业,近期发布了重量级新产品—— [Cloud Insight](http://www.oneapm.com… ...

  • OneAPM官方技术博客 6推荐

    全球说:要给 OneAlert 点100个赞

    客户背景 「全球说」 Talkmate,是北京酷语时代教育科技有限公司(酷语科技)旗下产品,酷语科技是一家诞生于中国的语言技术公司,致力于为全球用户提供一个全新的多语言学习和社交网络平台 。 全球说是典型的快速发展初创企业,心怀理想,恰如其创始人温荣辉提到: 全球说希望…...

  • OneAPM官方技术博客 6推荐

    Zabbix 集成 OneAlert 实现全方位告警

    1. 前言 告警将重要信息发送给运维「或者其他相关人」,及时发现并且处理问题。在所有开源监控软件里面,Zabbix 的告警方式无疑是最棒的。告警的方式各式各样,从 Email 告警到飞信、139/189邮箱、最后到微信甚至电话告警,接入存在各种问题以及困难,有没有什么软件能够…...

  • OneAPM官方技术博客 6推荐

    Nagios 安装及微信短信提醒

    引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法;这一点是 Nagios‘er 们非常喜欢的…...

  • OneAPM官方技术博客 6推荐

    如何深入理解 StatsD 与 Graphite ?

    **众所周知,StatsD 负责收集并聚合测量值。之后,它会将数据传给 Graphite,后者以时间序列为依据存储数据,并绘制图表。但是,我们不知道,基于 http 访问的图表在展示时,是基于每秒钟的请求数,每次留存的平均请求数还是其它。让我们就以此为目标,来一探究竟吧!本文系…...

  • OneAPM官方技术博客 6推荐

    别人7天乐,运维还苦逼值班?

    你被点名值班了吗?或者你的朋友、隔壁七大姑八大姨的侄子被点名值班了吗? 国庆将至,大家都开始研究各种度假攻略了,国内游、国外游、地球游、外星游。。。然而总有一票人,默默地职守着 -- tIT 公司运营支撑组/运维组。这票人的统一特征总结… ...

  • OneAPM官方技术博客 6推荐

    OneAPM 云监控部署与试用体验

    作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市场的火爆,我决定「放下身段」试用一次,并且会总结出它与开源监控之间差别在哪里。 运维经历的磨难 虽然都…...

  • OneAPM技术博客 6推荐

    运维神器-分分钟定位500错误!

    做过运维的小伙伴都知道,当用户浏览器上出现白屏、应用端API得到500错误、取到数据为空是非常崩溃的一件事情。500错误是服务器端非常常见的一个错误,有可能是开发时导致的语法错误,也有可能是文件引用导致的错误。当用户反馈了 500 错误之后,而我们运维童鞋们面对一个集群的后端服…...

  • OneAPM官方技术博客 5推荐

    中小企业 IT 运维福利:快速构建 on-call 机制

    大多 IT 运营支撑同学都有过深夜业务应用突然故障的经历,监控系统准确告警,但是白天筋疲力尽的运维同学在熟睡中,经常会遗漏告警提醒;往往是接到主管电话(用户投诉了)才处理。有什么办法解决该问题呢?大多人是这么做的: 建立7x24小时的一线值班团队,搞一个监控室,值班人员随时…...

  • yinchuan 3推荐

    加载默认未被lense关联的文件

    参考文章: [Manually associating lenses with files in Augeas][1] lenses是augeas用来分析文件的模板,定义了如何将文件解析成tree。默认的lenses保存在/usr/share/augeas/lenses/di…...

  • OneAPM官方技术博客 3推荐

    运维不容错过的4个关键指标!

    很难说,生活在这个数据大爆炸的时代对运维同学是福还是祸。灵活的监控系统、开放 API 和易用的数据可视化资源可以将任何想要的数据图表化地显示出来,但是,过多的数据容易产生干扰,反而不利于具体信息提取和操作。 关于监控哪些指标,以及为什么要从系统化的角度出发,我们进行过深入的思…...

  • OneAPM官方技术博客 3推荐

    谈 DevOps 自动化时,也应该考虑到 SOX 等法案

    **【编者按】作者 Aaron Volkmann 是 CERT Division 高级研究员,在本文中,他对 DevOps 自动化违反 SOX 法案进行了阐述。同时,也简单的提出了如何通过 CI 来避免这个问题,本文系[OneAPM](http://www.oneapm.com…...

  • OneAPM官方技术博客 3推荐

    站长、运维必备| 网站可用性监控产品 OneAPM Cloud Test 上线

    白天太忙,到了… ...

  • OneAPM官方技术博客 3推荐

    时间序列数据库武斗大会之 KairosDB 篇

    【编者按】 **刘斌,OneAPM后端研发工程师,拥有10多年编程经验,参与过大型金融、通信以及Android手机操作系的开发,熟悉Linux及后台开发技术。曾参与翻译过《第一本Docker书》、《GitHub入门与实践》、《Web应用安全权威指南》、《WEB+DB PRESS…...

  • OneAPM官方技术博客 2推荐

    机器学习在 IT 运维管理中的必要性!

    机器学习技术在监控工具中的应用已经成为 IT 运维与 DevOps 团队的一大热点话题。尽管相关的使用案例很多,对 IT 团队而已真正的「杀手级应用」是机器学习如何提高实时事件管理能力,从而帮助较大规模的企业提高服务质量。对此,关键在于在用户发现问题之前提早探测异常,进而减少生…...

  • OneAPM官方技术博客 2推荐

    如何把关联性的告警智能添加到 Nagios 上?(2)

    上节回顾 对于许多 IT 和运维团队来说,Nagios 既是一个福音也是一个诅咒。一方面,Naigos 在 IT 应用的工作领域中,给予了你可以实时查看告警数据的可能性;但是另一方面,Nagios 也能够生成超级多的告警,对于任何一个运维人员或是运维团队来说都是 hold 不…...

  • 英子 2推荐

    数据库与运维相关图书一览表

    SQL [SQL基础教程][1] [经典] [SQL必知必会(第4版)][2] (含电子版)[经典] Oracle [精通Oracle SQL(第2版)][3] [Oracle编程艺术:深入理解数据库体系结构(第3版)][4] (新书)[经典] [Oracle Da…...

  • OneAPM官方技术博客 2推荐

    MTTR是什么?或者说为什么别给婴儿喝白兰地

    在团队纷纷谈起工作效率的时候,对运维工作者,他们通常喜欢用「故障的平均解决时间」来衡量团队的工作效率。然而这往往是不正确的。一个迅速解决大量突发事故的团队十分高效,而实际上这更有可能意味着该团队的基础设施十分脆弱易损。那我们应该使用什么标准来衡量团队的工作效率呢? **本文系…...