电信网综合告警系统设计

更新时间:2024-04-13 作者:用户投稿原创标记本站原创 点赞:8079 浏览:32607

【摘 要】电信网综合告警系统提供跨专业告警采集、处理和呈现功能,同时将告警信息进行跨专业关联性分析.

【关 键 词 】电信网;综合;告警;设计

一、前言

目前,三大电信运营商相互竞争的局面日趋激烈.为了保持已有客户、吸引新客户,在新的业务领域能够快速实现利润和价值的需要,各电信运营商需要建设一个面向全网,集综合性、智能性于一体的本地网综合化平台.

电信网综合告警系统应实现跨厂家、跨专业的,在统一界面、统一窗口内对告警、客户的集中管理,实现与资源信息、客户信息的互连和调用.系统管理的范围是全方位,跨越多厂商、多种技术,从功能上能够提供统一处理的同步性,从界面上实现在集成窗口统一对网管资源和客户的集中管理.

本文仅对电信网综合告警系统部分功能设计进行探讨,不涉及客户、业务信息关联部分.

二、系统总体架构

系统的设计遵照以下业务要求和技术要求:

1.采用分层设计思想,分为数据层,业务层,展现层.

2.采用C++/JA开发应用系统,以提高系统的可移植性和可扩展性.

3.提供面向用户Web方式的应用界面,以提高系统的可用性.对制作的各类报表,通过web方式向外提供查询接口.

数据采集层:实现各个专业网管(或网元)系统的接入,对告警进行采集,统一格式和收敛过滤.

数据处理层:包括告警处理,告警分析、告警存储、告警同步、安全管理以及与其他系统接口等功能.

数据展示层:实现告警实时显示,历史告警查询统计以及与其他的系统界面显示功能.

三、系统功能

综合告警管理提供跨专业告警采集、处理和呈现功能,同时将告警信息进行跨专业关联性分析.具体包括以下功能:

1.告警采集建立系统到各专业网管和网元的数据通路,从各专业网管系统和网元采集告警.提供多种接口和协议,从专业网管和网元采集告警数据:CORBA、SNMP、OSI/Q3、ASCII字符流等.支持多种接入方式:以太网、X.25、串口等.

数据采集模块应提供守护进程,监视采集通道是否正常.当采集通道发生故障恢复后,数据采集应能迅速自动恢复.

统一告警格式.告警采集后,应提供统一的告警标准模型进行告警分析、存储和呈现.该模型应符合国际、国内相关标准.

告警收敛及屏蔽.为了减少对系统的数据处理压力,应该在采集入口处按一定规则或条件,对相似告警进行收敛,对部分无关告警进行屏蔽阻断.

2.告警分析

告警分析部分应主要实现以下功能:

告警过滤和压缩.告警过滤是将接收的告警按照设备型号、告警类型、告警等级等要素进行过滤,符合过滤条件的将丢弃不处理;告警压缩主要针对在一段时间内的相关或相似告警进行压缩,只产生/保留一条告警,在新告警中同时记录这段时间的告警统计信息.被压缩的告警不再发送到客户端显示,但可以进行日志查询.告警过滤和告警压缩的条件可以由用户按权限、设备所属业务区域进行灵活配置.

告警相关性分析,包括专业内告警相关性分析和跨专业网管告警管理分析.告警相关性分析是指对不同专业或某专业内,对相同、不同设备产生的多个告警进行关联分析.根据预先设置的规则,关联分析时可以产生一条包括分析结果的新告警,对原告警可以按用户要求配置进行保留或删除.

告警根源分析.同一故障可能会同时产生多个告警,可能从一个网元或者从多个网元产生告警报告,在告警相关性分析的基础上,对告警进行根源分析.

3.告警处理

告警重定义.为了便于对网元特定告警信息进行监视、统计和分析,系统应支持操作员对告警的重定义功能,包括为告警事件指定告警级别、重新分配告警级别、重新进行告警分类等功能.当告警没有得到确认的时间过长时,应该对这些告警提高告警级别.应提供界面,可以由操作员对告警重定义的条件进行灵活配置.

告警注释.提供给维护人员,对告警的判断和处理信息输入的功能.

告警确认清除.系统应提供告警确认和取消确认功能,确认包括自动确认和手动确认两种方式.告警自动确认指的是当某些低级别的告警采集上来后,网管系统根据条件(自动确认告警的条件可由用户进行写作)对其进行自动确认.告警主动确认指的是网管系统应能支持操作员对告警信息进行手动确认,系统应记录手动确认者的身份.

告警通知.将重大告警信息转发至网管系统用户或维护人员的E-mail信箱、手机短信等.网管系统提供界面,供用户自定义告警通知的条件、通知方式、通知人群范围.告警通知应该支持自动和手动两种方式.

告警声音提示.为了及时通知管理人员告警的到来,系统应该提供对未确认的告警进行声音提示,操作员可以启动或者关闭新告警声音通知的功能.操作员应该可以自定义声音文件、声音的间隔.


4.告警显示

告警拓扑图呈现.系统应支持按网络拓扑的逻辑图展现,在告警拓扑图上,以不同的颜色区分不同级别的告警.

告警的列表显示.系统应支持对告警的列表展现,告警列表中可以显示告警数据各项基本信息及扩展信息.

告警分类显示.在多专业、多类型统一显示的基础上,系统应支持按专业、按类型、按属性等对网元告警进行分类显示或部分显示.

5.告警知识库

告警知识库:告警的知识库管理应该是一个可以积累的系统,网管系统应该提供手段,使管理人员能够将在网络运行维护过程积累的告警相关知识信息录入到知识库中,如告警的解决方案.系统的告警知识库应该提供友好的界面,以供管理人员快速的搜索、查找、察看相关告警的知识信息.

6.告警查询统计

告警查询:按照上报告警的所有要素和组合要素进行查询.

告警统计:按照上报告警的各要素和组合要素(包括历时和频次)进行统计,以列表和图形的方式呈现;统计报表的格式、数据源、计算方法等可以进行自由写作;对统计结果,可以向下查询到具体的告警信息.

转储数据的查询与统计.在查询统计中涉及已经转储的历史数据时,应提供现有系统中的数据和转储历史数据(也称归档数据)的统一查询功能.

7.告警存储

告警入库:在分析处理之后,告警应进行入库处理,以备日后的查询统计等.

告警数据备份:可以对指定时间段数据库中的数据进行导出备份,应支持按文本或EXCEL等格式导出.

8.告警同步

支持手动同步和系统定时同步两种方式.

手动同步:通过系统界面选择操作,可以发送告警同步命令到指定的一个或多个专业网管(或网元),同步当前活动告警.

定时同步:可以优先设置告警同步的时间、周期、同步对象等.

告警同步要考虑到怎么写作器性能和网络的负荷状况,对同步时间间隔要有一定的限制.

四、系统接口

至少需要实现同以下系统的接口.

1.专业网管系统的接口:从专业网管系统采集告警数据和设备配置事件数据.

2.与各专业性能管理的接口:接收性能告警,将性能告警和设备告警统一到电信网综合告警系统.

3.与资源管理系统的接口:从资源管理系统中提取网络资源数据,生成网络管理信息模型,以便进行告警关联分析.

4.其他:综合告警系统需符合一系列TMN国际标准的和TMF组织的建议,具有高可用性、可扩展性和安全性.