浪潮信息InManage是一款面向數(shù)據(jù)中心基礎(chǔ)設(shè)施的智能管理平臺,通過統(tǒng)一接口、協(xié)議,能夠納管多達400種不同廠商、不同型號的服務(wù)器、存儲、網(wǎng)絡(luò)等機型,設(shè)備規(guī)模最多可達10萬臺,為超 大規(guī)模數(shù)據(jù)中心運維提供智能均衡調(diào)度、實時精 準(zhǔn)告警等管理功能。
浪潮信息InManage通過智能均衡作業(yè)調(diào)度平臺,能夠在秒級內(nèi)處理超 大規(guī)模數(shù)據(jù)中心億級實時并發(fā)運維管理數(shù)據(jù),并基于自研的告警管理框架,實現(xiàn)5秒內(nèi)響應(yīng)上千條告警風(fēng)暴,降低告警誤報與漏報的風(fēng)險。InManage不僅創(chuàng)造了金融行業(yè)單一數(shù)據(jù)中心帶外管理的*大紀錄,還實現(xiàn)了數(shù)據(jù)中心基礎(chǔ)設(shè)施全生命周期管理,整體運維效率提升兩倍,為超 大規(guī)模數(shù)據(jù)中心的穩(wěn)定、高速運行奠定了重要基礎(chǔ)。
在面對10萬+超 大規(guī)模設(shè)備管理時,如何避免將系統(tǒng)產(chǎn)生的告警風(fēng)暴強塞給客戶,如何進行根因定位并避免誤報、漏報,是數(shù)據(jù)中心統(tǒng)一管理的另一挑戰(zhàn)。為此,InManage提出了CDCAlarm告警管理框架,突破了告警集成管理技術(shù),實現(xiàn)了告警的及時性、準(zhǔn) 確性和全 面性,同時支持告警分析、聚合及根因分析等功能。該框架能夠為客戶呈現(xiàn)按優(yōu)先級排序和分類聚合的告警,直觀易懂、方便用戶進一步處理。
InManage使用AI技術(shù)手段對告警進行分類、分批處理,實現(xiàn)告警按來源、種類的歸并聚合策略,在保證告警時序性的同時,提升了告警處理的整體吞吐量。同時使用基于AI的根因定位方法,快速從告警風(fēng)暴中準(zhǔn)確識別出故障根因,并呈現(xiàn)給客戶,解決了客戶在面對告警風(fēng)暴時無從入手的局面。
同時,針對超 大規(guī)模監(jiān)控場景下常見的誤報漏報等告警不準(zhǔn)確、不及時問題,InManage也做了優(yōu)化。