400-166-0296
400-166-0296
新 闻
蒙帕智能运维,到底有什么不同?
. | 蒙帕官网 | 日期:2021-05-26 | 1067 次浏览 | 分享到:




      过去二十多年,随着信息化和数字化的全面推进,各大企业的IT系统规模不断扩大,IT基础设施呈现出规模庞大、结构复杂、品牌众多的特点,而对复杂IT系统和基础设施 的运维面临着巨大的挑战。

很多企业的IT运维工作主要依靠人力,采用人工定期巡查的方式,巡检方式程式化,耗时耗力不准确,不能及时有效的发现问题,而且机房环境、噪声等对运维人员的身体健康也有一定的影响。
 
人力巡查的方式,无法及时得到精准的运维数据,对于问题的定位和修复也造成挑战。很多企业依赖设备和系统厂商的技术人员进行问题定位和故障修复,而不能根据历史大数据快速定位问题,给出修复建议。

而且,IT运维普遍缺少有效的管控,如服务台、知识库、事件管理等基本运维管理流程缺失,缺少系统监控和展示系统,IT资产主管理要是纸质记录,缺乏集中式的资产管理,各个环节无法形成有效联动,不能及时、准确、全面反映与掌握信息系统的运行状态,从而造成IT运维效率低下。

为了实现信息资源合理配置和有效管理,确保系统安全可靠运行,IT运维管控平台的建设成为数字化建设的重点。随着近年人工智能、大数据、物联网等新一代信息技术的发展,运维模式面临着深层次的变革,针对上述挑战的智能运维管控平台AIOps呼之欲出。


__________________________ 蒙帕智能运维管控平台 _______________________________



蒙帕智能运维管控平台是上海蒙帕信息技术有限公司自主开发的新一代智能IT运维平台,简称:蒙帕AIOps。AIOps(Artificial Intelligence for IT Operations),即将AI应用于IT运维。

那么,相比传统的自动化IT运维系统,蒙帕AIOps有什么不同?

随着互联网数据规模的急剧膨胀,以及IT服务类型的复杂多样,基于“人为指定规则”的传统IT运维自动化系统逐渐变得力不从心,其瓶颈在于人脑,必须由一位长期从事IT运维的专家手动地将重复出现的、有迹可循的现象总结出来,形成规则。然而,这种简单的、基于人为制定规则的方法越来越不适应日益复杂的IT运维现状。 

蒙帕AIOps能够基于已有的运维数据(日志、监控信息、应用信息等),通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠,即便面对告警风暴,可以采用人工智能算法,去伪存真,直击问题核心。

蒙帕AIOps可以实现7*24小时的机房无人巡检,准确率达99%以上,实现运维工作的流程化、智能化、无人化,实现数据的深度学习,全面感知业务态势,对问题发现早、定位准、解决快,实现运营的数字化、可视化决策管理,形成有效的运维大数据资产。

目前,蒙帕AIOps平台已经成功应用于中国日报社(详见文章末尾)、中铁上海工程局、成都第二设计研究院等单位,起到了很好的运维效果,受到了用户的广泛好评。


蒙帕AIOps具体包括以下六大模块:




1. 蒙帕MOSS巡检机器人 
机房无人巡检,解放生产力,提高准确率

蒙帕MOSS巡检机器人结合多种先进传感器、多种智能识别算法,对机房动力环境、设备运行状态、线路进行全方位精细化感知、巡检,具体包括:机器人远程操作、状态指示灯识别、二维码资产识别、动环数据识别、有害气体识别、声纹识别、人脸识别、异物识别等功能。





2. 全面业务监控 
全面监控,告警必达


蒙帕AIOps平台可以从日常运维中实现对IT基础设施的实时监控、故障管理、性能分析及配置优化,从根本上确保业务的健康稳定运行,进一步提高网络支撑环境的运营质量,采用有效的维护手段,为业务的发展提供强有力的支撑和技术保障。





3. 统一运维管理 
程标准化,快捷高效,智能派修


蒙帕AIOps平台依据ITIL运维服务流程,融合、统一管理运维流程、可视化、环控管理,统一兼容监控管理系统资源,3D机房、机器人智能巡检以及机房轨迹管理,有效关联整合所有平台的数据信息。 

基于集中资产、配置、机房机柜、项目、事件管理为一体的IT服务管理,可以集中管理来自所有监控资源的异常事件,并能通过web接口集成第三方的告警信息到集中事件管理平台,包括:事件的确认流程、跟踪、处理、分析、关闭、知识库等。





4. 3D机房 
资产可视化,容量可视化,告警可视化,链路可视化


蒙帕AIOps平台通过采集、传输和管理设备,将数据中心机房内分散的多种专业监控、资产管理、运维流程管理等系统对数据中心资产设备和资源设备运行状况,融合在构建数据中心的3D全息图景中,建立统一监控、统一预警、统一资产管理以及统一空间规划,提供规范化的系统管理流程,改变运维数据孤岛现象,保障机房运维过程有据可依。




5. 运维大数据 
数据采集,智能分析,趋势预测


蒙帕AIOps平台整合IT运维的多种数据,包括机器人巡检数据、机房动环数据、设备系统性能数据、应用数据和数据库数据等,建立起有效的运维大数据资产,为智能运维(根因分析、智能预测等)提供全方位的数据支撑。

运维大数据模块融合了多种数据,提供智能分析功能,洞悉运维数据中的异常和关联,更早发现故障,问题定位更快,并能准确预测故障。此外,提供多维度、场景化展示,辅助运维人员决策,实现运维管理和运维工作效率的最大化。





6. 一体化大屏 
统一展示,全面检测,快速处理


蒙帕AIOps平台的一体化大屏模块提供全方位的定制化首页、智能运维、运维管理、业务监控、环控管理、3D机房、应急告警,通过图表化的方式呈现,形成一体化大屏中心视图看板,方便第一时间了解平台整体运行状态。




__________________________ 蒙帕AIOps的应用场景 _______________________________


蒙帕AIOps平台有两个典型的应用场景,包括智能机器人巡检和智能运维管理,具体如下所示:


场景1:智能机器人巡检





场景2:智能运维管理





蒙帕AIOps典型案例

蒙帕AIOps在中国日报社的成功应用:

随着中国日报社IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为信息化运维工作的重点之一。 

中国日报社在2019年开始基于蒙帕AIOps智能运维管控平台建设“安全运维管理平台”项目,实现了中国日报社超过800台设备的接入,涉及不同品牌,不同型号的小型机、服务器、存储设备、网络设备、光纤交换机和磁带库等设备。设备涉及的配件监控节点超过1000个,涉及的监控参数超过10万个。

在系统建成上线后,每月通过安全运维管理平台发现的硬件隐患或硬件故障超过23起,故障发现的时间较原来人工机房巡查缩短10倍以上,使数据中心硬件设备隐患在发展成故障,影响到业务生产之前,得以及时排查,大大增加了硬件故障风险隐患的可控性,实现了硬件设备从被动式故障处理到主动式健康管理的全面提升。 

中国日报的蒙帕AIOps智能运维管控平台上线前后的各项运维指标对比如下:









————————————————————————————————————————————————————————————————————————————————————