关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

谷歌云负载均衡系统瘫痪18个小时

发布时间:2017-09-02 12:53:17

美国、欧洲和亚洲等地区的虚拟机都无法“连接到后端”,负载均衡系统瘫痪18个小时后,谷歌云恢复了之前的版本,才得以慢慢恢复正常。

 

这次故障最先是在8月30日太平洋夏令时00:52时间予以报告的,截至19:18分还没有得到解决。


谷歌在努力解决这个故障。06:00,该公司表示已“查明了导致此问题的基础设施部件,目前正在积极抢修之中。”


可是到了07:00,谷歌官网上的消息改为“我们之前采取的行动并没有解决问题。我们在采取另外的解决办法。”


到08:30,消息又改为“我们已查明了引发这个问题的事件,正在恢复配置更改以修复该问题。”半小时后,该更改已落实,谷歌开始采取“进一步的措施,以彻底解决该问题。”


该修复办法意味着没有一个新的实例会出现问题,但是问题发生时在运行的实例仍受到影响。随后,谷歌建议用户应执行下列操作:创建一个新的TargetPool(目标池)。将区域中受影响的虚拟机添加到这个新的目标池。等待虚拟机开始在现有的负载均衡系统配置环境中运行。删除新的目标池。切勿删除现有的负载均衡系统配置,包括旧的目标池。没必要创建一个新的ForwardingRule(转发规则)。


这正是云用户掏钱以避免操心的那种事情,这番说明对一些用户来说也不够清楚,因为半小时后,谷歌重新编写了“格式更好”的操作说明。


截至本文截稿时,谷歌表示,“除了us-central1区域不到10%受影响的网络负载均衡系统外,应该已为所有区域解决了这个问题。”


谷歌几乎承认了自己进行的更新是造成这个混乱局面的根源,这可能是又一起自摆乌龙的事件:这家公司在之前的2016年6月、2016年8月、2016年8月和2016年9月曾搞砸过自己的云。



/template/Home/Zkeys/PC/Static