蓝盟云服务,操作和维护困难“上升到了一个新的水平” - 不存在!

发布者:上海IT外包 来源:www.linemore.com

       随着数据中心部署的不断发展,新技术不断更新,提供数据中心服务的网络变得更加复杂。为了适应数据中心服务的发展,数据中心网络不断更新和更改,这对运营和维护提出了重大挑战。数据中心停机事故也是不可避免的,这不仅增加了数据中心运营商的工作量,而且还给数据中心带来了巨大损失,而世界顶级互联网巨头经常享受这种待遇。 ”。
  互联网巨头利用机会,运营和维护操作将成为一个问题
  3月3日凌晨,阿里云崩溃,购买阿里云服务的企业网站或互联网公司APP无法正常使用。许多程序员,工作和任务必须在床上发生。根据阿里巴巴云的停工时间,58岁的首席建筑师沉健表示,事故持续了大约3个小时,之后观察了两个小时。
  5月3日凌晨3点43分,Microsoft Azure在全球范围内经历了大量停机,整个过程持续了近2个小时,并在5:30完全恢复。受Azure影响,使用了微软的关键服务,包括Microsoft 365,Dynamics和DevOps。
  6月3日凌晨2点58分,Google在全球范围内动荡不安,许多基于Google Cloud Architecture服务的Google服务受到影响,包括Gmail,YouTube和Google云端硬盘。用户使用各种错误警告访问Google服务,用户无法访问电子邮件,上传YouTube视频等。
  6月25日,亚马逊确认其官方网站上的云计算服务已关闭,这影响了一些网络用户与多个AWS区域之间的网络连接。失败的节点受到AWS East 1中总共33个服务的影响,其中9个服务完全停止服务。
  经常出现停机事故,“达到高水平”的操作和维护困难
  停机事件证明了数据中心运营和维护的重要性,但似乎是不可避免的。今天,随着技术的发展,数据中心作为一个重要的基础设施发挥着重要作用,但数据中心仅在中国开发了十多年,但在通用机房只有UPS,空调和IT设备。我们正在进入一个新技术的新时代,如互联网,大数据,人工智能,云服务和其他成千上万的机柜,天然冷风,风墙,水下数据中心和液体冷却服务器。结果,运营和维护面临更大的挑战,运营和维护的困难也升级到“更高的水平”。
  首先,它改变了大型数据中心的人员,组织和效率。在10,000平方米以内的先前数据中心中,在2-4小时内进行了数十万平方米的人工检查,这导致更多的运营商分布在各个责任领域,增加了管理难度和成本。其次,电压水平增加。增加安全风险。过去,O&M员工暴露在低压状态,现在电源,发电机和冷机械都提供高压,提高了维护安全要求,并且集中了浓度,风险集中,影响更大。例如,上述数据中心停机事件导致大规模的全球服务和应用程序中断,导致高损失,增加了运营和维护的负担。减少人为错误并提高您在操作和维护方面的专业知识。
  数据调查显示,70%的数据中心停机事故是由人为错误引起的,因此随着数据中心的增长,运营和维护人员需要提高应对数据中心事件的技能和专业知识水平。
  为了建立完整的员工技术评估体系,操作和维护人员的各方面技能,使操作和维护人员能够提高操作和维护技能,有效促进操作和维护人员的自动学习和维护。并评估技术。
  运营和维护经验包括建立在线学习,运营和维护经验基础,分享和交流在线运营和维护经验,以及提供在线实习和学习渠道的运营和维护知识。
  实际操作环境的在线模拟为操作和维护模拟提供了操作和操作环境,有效地隔离了操作风险并快速提高了实际操作和维护的水平。
  大规模IT云平台组件在线评估理论技能依赖于问题库,定期评估,随机问题,实时在线自动评估操作和操作理论功能。
  在线技术评估实用技能,轻量级在线操作和维护操作,在线编程环境,在线实时自动评估和运维技术的研发技术。
  自动评估,操作和维护理论,提高效率技术和实用技术的在线科学和自动评估提高了评估效率,并确保客观和公平的性能。
  进行了智能操作和维护,以弥补手动操作和维护的不足。
  在当今的数字时代,数据中心的规模和容量呈指数级增长,运营和维护的复杂性和难度也在不断增加。从脚本操作和维护,工具操作和维护到平台操作和维护。在劳动力达到极限后,智能操作和维护开始了。现在,腾讯,华为和京东等数据中心公司已将基于现有运营和维护数据(日志,监控信息,应用)的人工智能与运营和维护相结合,实现智能运营和维护浪潮开始增加研发工作。逐步取代手动操作和维护,提高操作和维护效率,例如机器学习方法的信息。我相信,未来数据中心将变得越来越智能化。
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部