图书

  • 基础设施即代码:云服务器管理

    Kief Morris   金明   钱伟   马博文   黄博文   禚娴静   译

    本书旨在解释如何利用“云时代”基础设施即代码的方法来管理IT基础设施。主要内容包括:组织在采用新一代基础设施技...

  • DevOps实践指南

    Gene Kim   Jez Humble   Patrick Debois   John Willis   刘征   王磊   马博文   曾朝京   译

    本书共分为6个部分:第一部分概述DevOps的历史和三个基本原则,即“三步工作法”;第二部分介绍开启DevOp...

  • Docker开发指南

    [英] Adrian Mouat   黄彦邦   译

    Docker容器轻量和可移植的特性尤其适用于动态和分布式的环境,它的兴起给软件开发流程带来了一场革命。本书对D...

  • Docker经典实例

    Sébastien Goasguen   刘斌   译

    【主要内容】 本书结构明晰,示例丰富详实,是全面实用的Docker入门教程。作者全面介绍了Docker相...

  • 监控的艺术

    James Turnbull  

    本书由前Docker员工、运维专家James Turnbull执笔,系统介绍现代应用、架构的监控和度量。全书共...

  • OneAPM官方技术博客 8推荐

    解谜谷歌 DevOps:什么特质可以打造世界级可靠系统?

    【编者按】本文是 Gene Kim 总结自对 Randy Shoup 两个小时的采访,主要关注谷歌 DevOps 的提升之道。本文系 [OneAPM ](http://www.oneapm.com/index.html?utm_source=Community&utm_…...

  • OneAPM官方技术博客 7推荐

    荣誉,还是苦逼?| 也议全栈工程师和DevOps

    引言 全栈工程师(本文称「全栈」开发者)和 DevOps 无疑是近期最火的词汇,无论是国外还是国内。而且火爆程度远超于想象。 全栈和 DevOps,究竟是我们的新职业方向,还是仅仅创业公司老板的心头所爱?且听本文理性分享。 Anyway,文末附赠 9 家把 DevOps …...

  • OneAPM官方技术博客 7推荐

    Cloud Insight 仪表盘上线 | 全面监控 Redis

    OneAPM 作为应用性能领域的新兴领军企业,近期发布了重量级新产品—— [Cloud Insight](http://www.oneapm.com… ...

  • OneAPM官方技术博客 6推荐

    全球说:要给 OneAlert 点100个赞

    客户背景 「全球说」 Talkmate,是北京酷语时代教育科技有限公司(酷语科技)旗下产品,酷语科技是一家诞生于中国的语言技术公司,致力于为全球用户提供一个全新的多语言学习和社交网络平台 。 全球说是典型的快速发展初创企业,心怀理想,恰如其创始人温荣辉提到: 全球说希望…...

  • OneAPM官方技术博客 6推荐

    Zabbix 集成 OneAlert 实现全方位告警

    1. 前言 告警将重要信息发送给运维「或者其他相关人」,及时发现并且处理问题。在所有开源监控软件里面,Zabbix 的告警方式无疑是最棒的。告警的方式各式各样,从 Email 告警到飞信、139/189邮箱、最后到微信甚至电话告警,接入存在各种问题以及困难,有没有什么软件能够…...

  • OneAPM官方技术博客 6推荐

    Nagios 安装及微信短信提醒

    引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法;这一点是 Nagios‘er 们非常喜欢的…...

  • OneAPM官方技术博客 6推荐

    如何深入理解 StatsD 与 Graphite ?

    **众所周知,StatsD 负责收集并聚合测量值。之后,它会将数据传给 Graphite,后者以时间序列为依据存储数据,并绘制图表。但是,我们不知道,基于 http 访问的图表在展示时,是基于每秒钟的请求数,每次留存的平均请求数还是其它。让我们就以此为目标,来一探究竟吧!本文系…...

  • OneAPM官方技术博客 6推荐

    别人7天乐,运维还苦逼值班?

    你被点名值班了吗?或者你的朋友、隔壁七大姑八大姨的侄子被点名值班了吗? 国庆将至,大家都开始研究各种度假攻略了,国内游、国外游、地球游、外星游。。。然而总有一票人,默默地职守着 -- tIT 公司运营支撑组/运维组。这票人的统一特征总结… ...

  • OneAPM官方技术博客 6推荐

    OneAPM 云监控部署与试用体验

    作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市场的火爆,我决定「放下身段」试用一次,并且会总结出它与开源监控之间差别在哪里。 运维经历的磨难 虽然都…...

  • OneAPM技术博客 6推荐

    运维神器-分分钟定位500错误!

    做过运维的小伙伴都知道,当用户浏览器上出现白屏、应用端API得到500错误、取到数据为空是非常崩溃的一件事情。500错误是服务器端非常常见的一个错误,有可能是开发时导致的语法错误,也有可能是文件引用导致的错误。当用户反馈了 500 错误之后,而我们运维童鞋们面对一个集群的后端服…...

  • OneAPM官方技术博客 5推荐

    中小企业 IT 运维福利:快速构建 on-call 机制

    大多 IT 运营支撑同学都有过深夜业务应用突然故障的经历,监控系统准确告警,但是白天筋疲力尽的运维同学在熟睡中,经常会遗漏告警提醒;往往是接到主管电话(用户投诉了)才处理。有什么办法解决该问题呢?大多人是这么做的: 建立7x24小时的一线值班团队,搞一个监控室,值班人员随时…...

  • yinchuan 3推荐

    加载默认未被lense关联的文件

    参考文章: [Manually associating lenses with files in Augeas][1] lenses是augeas用来分析文件的模板,定义了如何将文件解析成tree。默认的lenses保存在/usr/share/augeas/lenses/di…...

  • OneAPM官方技术博客 3推荐

    时间序列数据库武斗大会之 KairosDB 篇

    【编者按】 **刘斌,OneAPM后端研发工程师,拥有10多年编程经验,参与过大型金融、通信以及Android手机操作系的开发,熟悉Linux及后台开发技术。曾参与翻译过《第一本Docker书》、《GitHub入门与实践》、《Web应用安全权威指南》、《WEB+DB PRESS…...

  • OneAPM官方技术博客 3推荐

    谈 DevOps 自动化时,也应该考虑到 SOX 等法案

    **【编者按】作者 Aaron Volkmann 是 CERT Division 高级研究员,在本文中,他对 DevOps 自动化违反 SOX 法案进行了阐述。同时,也简单的提出了如何通过 CI 来避免这个问题,本文系[OneAPM](http://www.oneapm.com…...

  • OneAPM官方技术博客 3推荐

    站长、运维必备| 网站可用性监控产品 OneAPM Cloud Test 上线

    白天太忙,到了… ...

  • OneAPM官方技术博客 3推荐

    运维不容错过的4个关键指标!

    很难说,生活在这个数据大爆炸的时代对运维同学是福还是祸。灵活的监控系统、开放 API 和易用的数据可视化资源可以将任何想要的数据图表化地显示出来,但是,过多的数据容易产生干扰,反而不利于具体信息提取和操作。 关于监控哪些指标,以及为什么要从系统化的角度出发,我们进行过深入的思…...

  • OneAPM官方技术博客 2推荐

    MTTR是什么?或者说为什么别给婴儿喝白兰地

    在团队纷纷谈起工作效率的时候,对运维工作者,他们通常喜欢用「故障的平均解决时间」来衡量团队的工作效率。然而这往往是不正确的。一个迅速解决大量突发事故的团队十分高效,而实际上这更有可能意味着该团队的基础设施十分脆弱易损。那我们应该使用什么标准来衡量团队的工作效率呢? **本文系…...

  • OneAPM官方技术博客 2推荐

    告警分析:如何帮助运维团队快速做出最佳决策?

    「路漫漫其修远兮,吾将上下而求索」,「转身」不见得华丽,但我必须「转身」,不要安逸于现在的运维状况。 如果你运维一线人员,是否会遇到以下情况: 公司所有的服务器告警消息会塞满自己的整个邮箱,如果公司的运维团队有几个人到几十人不等,当你处理邮箱中的告警消息的时候,处理一半会…...

  • OneAPM官方技术博客 2推荐

    从零开始运维之旅:如何监控你的 Windows?

    小弟乃刚刚踏入运维圈的资深小白一枚,正所谓完事开头难,公司里怕我把生产系统搞坏就让我先在测试环境上先练练手。巧的是测试环境又是我熟悉的 Windows 环境,心中窃喜啊。但问题随之而来,运维从何下手呢。 同事正巧解囊相助,告诉我可以先从监控开始多了解下系统的性能参数等数据。这…...

  • OneAPM官方技术博客 2推荐

    仪表盘 hostmap 新玩法让运维工作越玩越 high

    [Cloud Insight](http://www.oneapm.com/ci/feature.html?utm_source=Community&utm_medium=Article&utm_term=%E4%BB%AA%E8%A1%A8%E7%9B%98%…...