10

过去的 30 分钟到现在,阿里云 HK 的 C 区机器全部停摆

 2 years ago
source link: https://www.v2ex.com/t/903260
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  程序员

过去的 30 分钟到现在,阿里云 HK 的 C 区机器全部停摆

  Features · 4 小时 46 分钟前 · 3644 次点击
大家的业务有受到影响吗?

ZOE2x81c.jpeg
49 条回复    2022-12-18 16:38:55 +08:00
sbboy

sbboy      4 小时 37 分钟前

进控制台都看不到机器了。。。
mogutouer

mogutouer      4 小时 35 分钟前   ❤️ 2

VNC 连上去提示卡在
Booting from Hard Disk...

这么大的公司,这么大的事件,连个公告也不发,还要客户主动去排队等待客服回应,有没有搞错,起码要发个通知消息嘛

问了多久恢复和补偿方案,直接给我把线上对话转成工单了,也不回复我
scukmh

scukmh      4 小时 28 分钟前

朋友的业务全挂了。
Features

Features      4 小时 28 分钟前

感觉 HK 区和内地的服务差距很大,HK 是外包加盟的吗?
villivateur

villivateur      4 小时 27 分钟前

难怪,我这也挂了,刚准备上 V 站发帖。香港轻量云
fds

fds      4 小时 20 分钟前

影响了一些服务
darer

darer      4 小时 17 分钟前

雀魂我记得是运行在阿里云 HK 上的
现在好像也挂了
sunhuawei

sunhuawei      4 小时 11 分钟前

已经放弃使用阿里云香港轻量云了,ping 内地机器丢包率常年 60%+。换了一家走的 CN2 路线,便宜又好用
likunyan

likunyan      4 小时 7 分钟前

我以为硬盘满了,硬盘 I/O 都是 0 ,强制重启服务器都没成功,提交了工单。现在才发现我不是一个人。
billytom

billytom      4 小时 7 分钟前 via Android

@sunhuawei cn2 线路?请问是哪家
cest

cest      4 小时 6 分钟前   ❤️ 3

全阳了,一个临时工误操作删库,全员头昏脑胀层层一路 confirm 下去就真删库了的可能性为?
Chad0000

Chad0000      4 小时 6 分钟前

如何看出是 C 区?我的香港轻量应用实例没问题。
Features

Features      4 小时 4 分钟前

@Chad0000 我客户这边 D 区机器没问题,只有 C 区停了
Features

Features      4 小时 3 分钟前

@cest HK 不是一直都放开吗? 可能性不大吧?
unlsycn

unlsycn      3 小时 57 分钟前 via Android

雀魂挂了..
ZE3kr

ZE3kr      3 小时 55 分钟前 via iPhone

我这里监控发现从 2022-12-18 10:49 UTC+0800 开始,阿里云香港 C 区 ECS 就炸了……还以为是我的问题。还好我这里有容灭,报警后自动就切了解析,阿里香港炸了不影响实际业务可用性
ZE3kr

ZE3kr      3 小时 53 分钟前 via iPhone

而且现在云盘打快照都是失败的,始终是 0%进度,不知道数据是否还在
ZE3kr

ZE3kr      3 小时 53 分钟前 via iPhone

@sunhuawei 阿里云香港加钱上 CN2 精品网速度就快了
hvsy

hvsy      3 小时 50 分钟前

同样在等恢复的苦逼运维...
bruceczk

bruceczk      3 小时 44 分钟前

+1 ,B 区的服务器还是好的,C 区的挂了
alan0liang

alan0liang      3 小时 38 分钟前

今天早上我 hk 另一台机器连续收到了三条通知:

1. 09:25:50 阿里云 ECS-系统事件-非预期宕机开始通知: 您好!您的云服务器(实例 ID:xxx ,实例名称:xxx ,私网 IP:["172.x.x.x"])在北京时间 2022-12-18T09:24:27 出现宕机,阿里云正在进行重启恢复操作,恢复时会第一时间通知您,谢谢。
2. 09:26:16 云盘实例宕机恢复发送消息: 您好!阿里云已保障您的云服务器(实例 ID:xxx ,实例名称:xxx ,私网 IP:["172.x.x.x"])恢复运行,请检查您的应用是否正常,谢谢。
3. 09:27:51 ECS 主动运维云盘实例计划重启事件通知: 您好,我们检测到承载您的云服务器运行的物理机存在硬件异常风险,由于该风险随时可能导致实例宕机,建议您选择合适的时间通过重启该云服务器将其迁移至健康的物理机。
您可以登录阿里云 ECS 控制台,在 待处理事件 - 系统事件 标签栏中查看待处理的计划内运维事件,并根据业务需要选择立即重启实例,或预约在不晚于计划执行时间的某一时刻重启实例。
若您未对实例进行重启,且实例未因其他原因被重启,则系统大约将在 2022-12-20T01:26:58Z ( UTC+0 时区)前自动重启实例,该过程需要最长 15-20 分钟时间,迁移后 IP 地址不会发生变化。 为了确保您的业务稳定运转和数据安全,建议您在计划重启前及时备份重要数据。

不知道是不是有关系;现在这台被重启的机器还是好的,然而另外两台机器都挂了
whywaoxaks

whywaoxaks      3 小时 37 分钟前

me too 同挂
beyondex

beyondex      3 小时 36 分钟前

me too
echooo0

echooo0      3 小时 30 分钟前

看监控里面的 cpu 还以为被 D 了,但是带宽正常

结果一看阿里云后台,好家伙服务器列表都没机器了
learningman

learningman      3 小时 9 分钟前

轻量也寄,还以为过期了,开控制台一看没过期就没管了
daiv

daiv      3 小时 6 分钟前

@sunhuawei #15 带宽好小, 没有按流量收费呀
gfdhfghfghrr

gfdhfghfghrr      3 小时 5 分钟前

daiv

daiv      3 小时 5 分钟前

@sunhuawei #8 原来是 轻量, 是否支持 运行 科学上网, 谢谢
feiyunruyue

feiyunruyue      3 小时 4 分钟前

+1 ,也不知道啥时候恢复
sunhuawei

sunhuawei      3 小时 3 分钟前

@daiv #29 发现了会被封吧,我没试过
daiv

daiv      3 小时 0 分钟前

@sunhuawei #31 你是放网站? 你用了多久, 网络保证 cn2,更稳? (我是阿里云 t5 年付机器, 快到期了)
Aluhao

Aluhao      2 小时 55 分钟前

二个多小时了还没解决。
sunhuawei

sunhuawei      2 小时 53 分钟前

@daiv #32 我只用了 20 天,目前没碰到过丢包现象,你问问他们客服吧
Alan3

Alan3      2 小时 44 分钟前

[阿里云] 尊敬的 xxx:您的云服务器 /磁盘(实例 ID:xxx ,实例名称: ixxx ,磁盘 ID:xxx )出现 IOhang 的情况。该问题有概率导致 IO 操作异常,阿里云技术团队正在处理,恢复后会第一时间通知您,谢谢。
johnsken

johnsken      2 小时 33 分钟前

业务严重受阻,还以为是被 D 了,结果是整区瘫痪,苦逼坐等修复
suzic

suzic      2 小时 28 分钟前 via Android

我博客挂了
lishenglan1992

lishenglan1992      2 小时 13 分钟前

挂了四个多小时了现在还没恢复,这技术也是牛逼了,客服排队排上了也没人理,难不成都被裁掉了,真是太烂了,唉
likunyan

likunyan      2 小时 13 分钟前

工单 12 点到现在都没回复我。。。
coyove

coyove      2 小时 6 分钟前

我知道明天周会 cto 又会 bb 同城双活 异地多活 跨国备份了
beyondex

beyondex      1 小时 56 分钟前

@mogutouer 我的也是,转工单了,没回复说怎么着了
mengyifan

mengyifan      1 小时 48 分钟前 via iPhone

@learningman 香港早放开了
learningman

learningman      1 小时 47 分钟前

@mengyifan #43 阿里云的支持在内地,只是机房是香港的
wsseo

wsseo      1 小时 17 分钟前

@Features 他明显在阴阳怪气
um1ng

um1ng      13 分钟前

阿里云:有理由裁人了
emperinter

emperinter      6 分钟前

我这也挂了,目前没有任何反馈,希望数据没出啥问题。
xzysaber

xzysaber      2 分钟前

给我们提示是说硬盘有异常,发了很多条消息,当然也包括很多实例的。
mogutouer

mogutouer      1 分钟前

有没有搞错,已经过去 5 个小时了,还没修复,ECS 被停止了,无法启动

The request has failed due to a temporary failure of the server.

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK