|
|
) K! x3 h* D, I
) |4 f% N; R) N- Z% V' ?
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
; n. I9 B) V6 Q9 s' j1 f
: n" U1 `/ m* |% C! C3 j- 尊敬的用户:6 T! g9 ]3 n8 C
- 3 J) O; f# m) S$ o# H" X$ O
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:: v. L6 H9 v5 [
- . R s$ J3 J2 j
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
" D5 n3 F! H* g" {. V) D: i; M
! P4 D- {. d# w8 _- F- 14:08,操作切换DNS以恢复官网及控制台;
1 }: [: a3 x8 A5 J/ L - ( r. o9 O% k# o- ~ F
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启; K+ d' k* Z/ d0 `4 q
- 5 L6 n$ U0 M6 X8 {* t1 |" A
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
$ |; A; ~3 ~2 \, w+ e: t
) a d! {9 o+ D7 W" K- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;6 H; f6 y$ P( i; f c" D
$ g( n; v G- B. ~, `- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
/ d5 \5 n! o5 b - # ^/ y$ B2 F+ o$ K' \7 R
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。- G) f8 v$ P/ U+ \) @, j' S: k
- $ ~- {# @# o" T) U
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。8 o0 x( @" U5 H. C6 Q! Y8 [
- " s2 O. K; V! X) v# v1 ]
- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
7 s4 N9 Z3 p' C1 e1 w: _# e8 l - $ _& `* r8 a. d9 Z6 x
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明; v( d' ?4 w- n0 b4 A" |
- 6 k$ ?2 {+ ]! i) v
- 青云QingCloud
复制代码 8 W+ J- _9 Y5 C0 D- Y
. m1 ]) Y! P0 P* B0 U2 k2 q
认认真真做事。。必定能成功# Z8 y, |. w+ G! i, c
|
|