您的位置:首页 > 业内资讯 > 谷歌是如何做到几乎从不宕机的?

谷歌是如何做到几乎从不宕机的?

来源:互联网 | 时间:2016-04-12 13:52:58 | 阅读:99 |  标签: 谷歌   | 分享到:

某一天,你需要使用Google,但Google并不可用——你上一次遇见这种情况是什么时候?

谷歌是如何做到几乎从不宕机的?

很有可能,这种情况根本没有发生过(译注:这文章是美国人写的)。的确,有时也会出现因为网络连接中断而用不上Google的情况;但是Google的基础性在线服务——从搜索引擎到Gmail再到Google Docs等等——几乎永远垂手可及。根据Google官方的数据,2015年该公司旗下的Google App套件在99.97%的时间里都处于可用状态。也许我们认为这是理所当然的,但它的确是一个了不起的事实;而全世界数十亿的Google用户似乎从来没有停下来想想:Google是如何把一件如此激动人心的事情处理得如此波澜不惊的。

用软件取代人工

Google用了这三个词来解释这个问题:Site Reliability Engineering(中文可译为:网站可靠性工程,后文简称SRE)。也许这三个词听起来并不是特别性感,但它们确实是(名字听起来更不性感)的Google在10年前就已经秉承的核心理念。这个理念很难用一两句话说清楚,不过可以归结到一个中心思想:让码农而非那些专门从事网络服务的IT人士来运营网络服务。如果这个思想得以执行,那么码农们就会开发出一种不需要人为介入的工具来帮助完成运营工作(这里所说的运营,主要是指维护服务的稳定和性能)。

“我们通过这种方法建立这样一个团队:大家都比较厌倦自己亲自动手去完成任务,而是通过写出软件来取代此前需要人工完成的事情。”一位名叫Ben Treynor Sloss的Google员工在一篇文章中写道。

对于硅谷的很多人来说,这似乎已经成为一个常识;从亚马逊到Box.com,这种方法已经被整个科技圈所采用。人们称其为DevOps(Development加上Operations)模式,意即通过某种努力将软件开发者与系统管理员联系起来。但是以Chef和Puppet为代表,自从DevOps模式从Google的SRE渐渐衍生出来之后已经发生了很大的改变。只不过Google在过去的十年里一直对SRE默不作声,但是过去它在应对大规模高效率的网络操作时的确是这么做的。

小编推荐阅读

好特网发布此文仅为传递信息,不代表好特网认同期限观点或证实其描述。

相关视频攻略

更多

扫二维码进入好特网手机版本!

扫二维码进入好特网微信公众号!

本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件admin@haote.com

湘ICP备2022002427号-10 湘公网安备:43070202000427号© 2013~2024 haote.com 好特网