51

昨天 GitHub 挂了两个小时

 3 years ago
source link: https://mp.weixin.qq.com/s/PI2XUCnFMMii_YyQevo5pw
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

URZNRb.gif

首先说下 www.githubstatus.com  可以实时的查看到 Github 服务的可用性状态 ,文中关于可用性的截图都来自这里。

下图就是今天 (2020年06月30)能看到的服务状态,可以看到昨天 github 的除了 Git Pages 服务,其他服务都出现了事故(incidence);其中 Git operations(就是我们的 git 相关的操作,比如git clone push)降级的时间长达 2 小时6 分钟。

iQNZVrf.png!web

目前 Github status 上关于本次事故的细节只有几个时间点。

QZRRr2e.png!web

简单翻译下:

06/29 11:38 UTC 服务完全恢复

06/29 11:21 UTC  服务正在恢复(pshu 的理解是: 此时服务开始恢复

06/2 9  09 :44   UTC  已经定位到错误发生的原因,并着手恢复

06/2 9  09 :14   UTC  发现报错数量和页面加载速度变慢, 开始调查错误

在问题发生的两个小时里面,git 的操作(clone push) 是不可用的,所以这个两个小时里面一些自动化部署和开发是直接受影响的。而其他的 web 相关的服务,也出现了两次降级,总共2 个多小时的持续时间。

总的来说这次事故给依赖于 Github 的开发者和企业带来一定的麻烦,在 twitter 上也有人在质疑说,在 被微软收购后 Github 越来越不稳定了。下面的twitter 翻译:

在被微软收购以后,Github 好像越来越不稳定了。我决定通过 github status 页面来验证下我的想法。在 2018 年 10 月收购前,github 的可用有性都是 100%的,慢慢就变得不顺畅了,从这个季度看事情基本是废了。(wheels fall of:不要直译成轮子掉了,一般翻译是事情搞砸了)。

RryEZnN.png!web

当然事情也没有这个推文说的这么严重,但是可用性只有 99 %对一个基础设施来说确实有点不应该。目前事故的原因还没有透露,如果有新的消息pshu 会继续跟进分享给大家的。

mYjEjav.jpg!web

欢迎大家点赞转发赞赏!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK