浪潮信息InManage是一款面向數據中心基礎設施的智能管理平臺,通過統一接口、協議,能夠納管多達400種不同廠商、不同型號的服務器、存儲、網絡等機型,設備規模最多可達10萬臺,為超 大規模數據中心運維提供智能均衡調度、實時精 準告警等管理功能。
浪潮信息InManage通過智能均衡作業調度平臺,能夠在秒級內處理超 大規模數據中心億級實時并發運維管理數據,并基于自研的告警管理框架,實現5秒內響應上千條告警風暴,降低告警誤報與漏報的風險。InManage不僅創造了金融行業單一數據中心帶外管理的*大紀錄,還實現了數據中心基礎設施全生命周期管理,整體運維效率提升兩倍,為超 大規模數據中心的穩定、高速運行奠定了重要基礎。
在面對10萬+超 大規模設備管理時,如何避免將系統產生的告警風暴強塞給客戶,如何進行根因定位并避免誤報、漏報,是數據中心統一管理的另一挑戰。為此,InManage提出了CDCAlarm告警管理框架,突破了告警集成管理技術,實現了告警的及時性、準 確性和全 面性,同時支持告警分析、聚合及根因分析等功能。該框架能夠為客戶呈現按優先級排序和分類聚合的告警,直觀易懂、方便用戶進一步處理。
InManage使用AI技術手段對告警進行分類、分批處理,實現告警按來源、種類的歸并聚合策略,在保證告警時序性的同時,提升了告警處理的整體吞吐量。同時使用基于AI的根因定位方法,快速從告警風暴中準確識別出故障根因,并呈現給客戶,解決了客戶在面對告警風暴時無從入手的局面。
同時,針對超 大規模監控場景下常見的誤報漏報等告警不準確、不及時問題,InManage也做了優化。