新闻资讯

“双十一”,零点背后的运筹帷幄

返回列表时间:2019-11-13 10:53     浏览:506

  红红火火的“双十一”购物狂欢节刚刚落下帷幕,2684亿成交额背后是无数 “剁手党”们疯狂的买买买。暴增的流量和海量的复杂数据交互给数据中心带来了巨大的挑战。可以毫不夸张的说,双十一是对全球电子商务平台综合技术保障能力的终极挑战。为保障数据处理的无延时性、准确性、不间断性,确保电商平台的设备能够无故障地进行交互运算,全国各地数以万计的运维人员及IT工程师们,是这场电商盛事背后当之无愧的功臣。

  作为各大电商平台长期以来的数据中心运维服务提供商,在今年的“双十一”期间从人员组织、设备系统稳定运行、 应急管理等各方面,全面组织落实相关保障工作,重点保障含有各大电商网络设备的数据中心,确保了双十一期间数据中心服务的稳定运行,为今年的数据中心机房运维大考验交出一份满分答卷。



全面排查·加强保障

10月中旬开始,各地运维人员便陆续开展了一系列的前期保障工作:检查柴油发电机、冷水机组、UPS、精密空调、蓄电池等全部设备,不放过任何一个死角,确保设备运行情况正常;进行培训、制定应急预案、开展应急演练......根据实际情况调整应急预案,提高应对突发事件的组织指挥能力和应急处理能力,保证应急指挥调度工作可以在第一时间迅速、高效地进行,确保各数据中心在“双11”活动期间安全平稳运行。


深圳观澜数据中心

11月8日,观澜运维团队召开部署大会,要求运维人员对机房设备务必进行仔细检查,对在双十一期间可能出现的紧急情况进行分析和预算,集中讨论预防和处置方案,确保运维人员熟悉每一个设备的应急处理方法,保障数据中心可以无故障地运行。

微信图片_20191112173703.jpg 微信图片_20191112173712.jpg 微信图片_20191112173716.jpg
                       检查配电柜                                     检查柴油发电机                                               检查UPS蓄电池


深圳横岗数据中心

从10月中旬开始,横岗运维团队开始对数据中心各设备进行检查,记录并核算运行数据是否在正常范围内,并加强巡检次数和频率,确保机楼的无故障运行。

1573614237709961.jpg 1573614271723357.jpg

                                检查燃油液位                                                                        检查柴发控制屏


1573614380576085.jpg 1573614567178114.jpg

                              扫描冷冻泵发热情况                                                                         检查冷机运行情况


北京科创数据中心

在大家反复计算怎么样用上最划算的折扣方式抢购商品时,北京运维人员也同样在“精打细算”着,他们精心照看好数据中心的每一台设备,仔细记录着每一台设备的实时数据,观察设备运行的状态是否正常,为电商平台客户服务器的安全、稳定运行又增添了一份保障。

1573614669921744.jpg 1573614705332994.jpg 

                             检查冷冻站冷水机组                                                            扫描冷冻泵发热情况

1573614825813881.jpg  1573614871247383.jpg 

                          值班平台密切关注告警情况                                                              检查UPS及精密空调发热情况



有序分工·高效运维



从11月1012点-11月12日09点,鲲鹏全国各区域运维经理、主管坐镇IDC现场,协调一切可调动的资源做好现场基础设施保障的具体安排工作,全方位严密监控,及时关注系统运行指标,保障系统的正常运行。


深圳观澜数据中心

观澜运维团队在“双11”保障期间始终保持高度集中的精神守护每一台设备,巡检设备、抄录数据、核对数据,任何步骤都不敢马虎。

众所周知,PUE(电源使用效率)值是衡量整个数据中心基础设施能耗的重要参数指标,其含义为数据中心消耗的所有能源与IT负载消耗的能源之比。该比值越接近于1,表明数据中心综合能效越高,表示一个数据中心的绿色化程度越高。

微信图片_20191112174304.jpg

典型数据中心能耗分布图


绿色,是数据中心的发展方向。相较其他行业,数据中心属于大型项目,无论从建厂选址还是设备采购,对设备节能的关注度尤为重视,对设备的能耗比也更为严苛。因此,对于数据中心的业主都有了更高的要求。

在“双11”庞大的数据交互、服务器高速运行的状态下,运维团队通过专业的技术支持,将观澜数据中心PUE值始终保持在1.26的高水准状态,既满足了客户对数据机房的保障需求,又实现了绿色节能。

1573615147683741.jpg 1573615178600228.jpg

                             检查配电室                                                                     抄录精密空调数据

深圳横岗数据中心

双11凌晨,横岗运维团队加强了巡检的力度和次数,时刻观察着现场数据变化,多次重点巡查机楼的供电、供冷以及动环、消防系统是否正常运行,及时抄录现场设备数据,保障了设备的高效与稳定运行。经过充分准备,本次横岗数据中心双十一重保工作顺利进行,期间未出现任何故障。

1573615336121511.jpg 1573615381130027.jpg

                           检查MCC室运行情况                                                                       检查精密空调运行情况

1573615515971771.jpg 1573615566231468.jpg

                                 检查气瓶压力情况                                                                   检查中压柜运行情况


全国智能运维管理中心

在双十一保障期间,深圳总部的运维人员在全国智能运维管理中心,对各地数据中心进行7*24小时监控,并安排专业专家随时待命,对各地数据中心进行远程指挥。
当显示大屏动环告警中心出现告警信息时,值班人员将第一时间通知现场运维人员,专家则通过“鲲鹏应急指挥系统”对现场故障进行远程指挥指导抢修。

全国智能运维管理中心作为全国数据中心的大本营,通过远程监控和专家指导,让各区域双十一保障工作更加安全可靠。

1573615656661988.jpg

深圳总部运维人员24小时远程值守


  在数据中心行业,运维人员作为数据中心的现场技术岗起着至关重要的作用。数据中心运维人员要对数据中心运行的稳定性负责,要保障数据中心业务不中断,又要及时完成新业务的部署、扩容、巡检等一系列工作。因此对运维人员的技术水平以及职业素养要求是极高的。

 “我们依靠团队精神达成我们的目标”,在这场双十一“重保大战”中,各区域数据中心集群全力保障双十一期间客户系统安全稳定的运行,全国参与双十一重保的数据中心和网络保障团队均达成“0故障”的目标,为客户业务的高速发展保驾护航,交出了一份令人满意的答卷。

  细节决定成败,只有运筹帷幄,才能决胜千里。将继续完善运维管理体系、优化客户服务体系,用实际行动履行对客户安全、专业化的承诺,继续在未来更多的重要时刻突破挑战,为客户业务的安全有效运行提供坚实保障。

新闻热点

客户服务热线:

0755-89899866

邮箱:sales@hjkpdata.com

地址:广东省深圳市龙岗区园山街道志鹤路100号邦彦技术绿谷1栋10-11楼

关注微信公众号