一、 问题描述
随着 LTE 网络的大规模建设, 以 RRU 为主的滴灌点已成为 LTE 网络的主要部署, 由于建设成本和现场限制大量的滴灌点均没有安装电池, 现网RRU 分两种 V3 平台和 KUNLUN平台, 其中 V3 平台无法准确上报停电告警, 由于网络中大量的 RRU 均为 V3 平台, 这个问题给 RRU 停电障碍判断、 停电数据后期分析以及备电建设、 规划和网优工作由于无法提供准确的一手数据带来了较大的麻烦。
二、 分析过程
RRU 停电检测基本原理:
RRU 掉电检测方案 1:检测 CPRI 链路状态, 射频模块直流掉电告警增强检测开关。当打开此开关时, 系统会监控 BBU 与 RRU 之间、 以及 RRU 与 RRU 之间的故障状态, 当监控到上级 RRU的光模块没有接收信号, 且 RRU 断链时, 则上报“ALM-26564 射频单元直流掉电告警”。RRU 掉电场景中上级 RRU 模块的故障状态与拔掉 RRU 光纤的故障状态是相同的, 因此打开DCALMSW 时, 对于更换光模块或更换 RRU 场景, 告警会误报为“ALM-26564 射频单元直流掉电告警”。
RRU 掉电检测方案 2:检测 RRU 输入口电压, 增加配置参数“射频模块直流掉电告警检测开关” 和“蓄电池输出欠压门限”。在“射频模块直流掉电告警检测开关” 配置为打开时, RRU输入口电压低于告警产生门限, 上报 ALM-26564 射频单元直流掉电告警, 检测到 RRU 输入口电压高于告警恢复门限, ALM-26564 射频单元直流掉电告警自动恢复。
RRU 掉电检测方案 3:当输入电压低于电源欠压门限(35V) 时, 立即向 BBU 发生 DC 掉电告警帧。BBU 实时接收到 RRU 上报的掉电告警状态后, 结合 RRU 在位情况, 综合判断是否上报RRU 掉电告警;如果判断 RRU 掉电告警成立, 则立即上报网管 RRU 掉电告警。
RRU 掉电检测方案 4:直流 RRU 掉电电源将掉电指示信号通知中频芯片。当芯片检测到直流掉电信号产生后, 认为直流掉电告警产生, 立即将芯片 RAM 中的直流掉电告警的 HDLC 数据帧发送给 BBU。BBU 检测到 RRU 维护链路断链, 并且接收到 RRU 上报的直流掉电告警后, 上报 RRU 直流掉电告警给用户。
三、 解决措施
解决措施包括 XX 网管侧操作判断、 现场 RRU 处理和外部监控系统。
一、网管侧判断 RRU 停电:
1、 KUNLUN 平台 RRU 可以直接检测并上报射频单元直流掉电告警, 无需任何配置;
2、 V3 平台 RRU 直流掉电检测区分是否有备电分为两种场景, 使用不同的掉电检测方案。
1) 无备电场景
通过检测 CPRI 链路状态来判断是否掉电, 对于更换光模块或更换 RRU 场景或光纤中断,告警可能会误报。告警恢复后, 查看告警恢复的清除类型, 正常掉电恢复类型显示为“正常清除”, 非掉电恢复类型为“相关性清除”。告警是否误判可以通过告警恢复的“清除类型”进行区分。
检测 CPRI 链路状态, 射频模块直流掉电告警增强检测开关。当打开此开关时, 系统会监控 BBU 与 RRU 之间、 以及 RRU 与 RRU 之间的故障状态, 当监控到上级 RRU 的光模块没有接收信号, 且 RRU 断链时, 则上报“ALM-26564 射频单元直流掉电告警”。
RRU 掉电场景中上级 RRU 模块的故障状态与拔掉 RRU 光纤的故障状态是相同的, 因此打开 DCALMSW 时, 对于更换光模块或更换 RRU 场景或光纤中 断, 告警会误报为“ALM-26564 射频单元直流掉电告警”。
功能开启命令:SET EQUIPMENT, 设置射频模块直流掉电告警增强检测开关为 ON(打开)
2) 有备电场景
检测 RRU 输入口电压实现直流 RRU 掉电告警监控功能, RRU 输入口电压低于告警产生门限, 上报 ALM-26564 射频单元直流掉电告警。
检测 RRU 输入口电压, 增加配置参数“射频模块直流掉电告警检测开关” 和“蓄电池输出欠压门限”。在“射频模块直流掉电告警检测开关” 配置为打开时, RRU 输入口电压低于告警产生门限, 上报 ALM-26564 射频单元直流掉电告警, 检测到 RRU 输入口电压高于告警恢复门限, ALM-26564 射频单元直流掉电告警自动恢复。
功能开启命令:MOD RRU, 选择需要配置命令的 RRU 柜框槽号, 然后修改下述截图中射频模块直流掉电告警检测开关为 ON(打开), 蓄电池输出欠压门限(0.1 伏特) 建议设置为 470;
注:上述两种方案涉及的功能不存在互相制约关系。但是如果两个功能都开启, 在有备电场景下, 会引入 RRU 光路中断带来的误判。
三、RRU 现场停电处理
现场处理一般分以下几个方面:
1、 增加备电手段;
2、 转供电改直供电, 增加供电稳定性;
3、 注意电源模块容量(即一个电源模块尽量带一个 RRU, 避免外配电源模块长期工作性能下降造成直流供电电压不稳定);
4、 注意接电位置、 空开和电源线隐患包括线径、 中间接头等。
四、利用铁塔动环系统监控交流停电
自从铁塔公司成立以来, 已完成大部分站点的动环系统建设, 其中滴灌点已基本建成动环系统, 而其中交流停电告警是其中之一的功能, 目前铁塔公司已对电信公司开发了实时查询、 统计分析功能, 电信公司在进行 LTERRU 障碍判断、 后期分析和备电建设中进行有效地参考, 无需新增任何投资。
具体安装图例:
停电告警后期分析:
五、经验总结
据每月 月 报统计,LTE RRU 停电因素一直在 LTE 网络中占比较高 71%左右, 可做到如下三个方面:
1、 如何有效地判断停电障碍, 可减少一线代维人员处理无效障碍的压力;
2、 如何准确获取停电原因的数据, 有利于分析各个滴灌点产生各类障碍的原因,对于后期管理和障碍管控提供可靠的依据;
3、 如何获取网络实际运营数据, 可为后期备电建设、 规划选点和网优工作提供坚强的保证。在解决停电障碍判断、 分析和处理手段方面, 如何最大化的利用现有网管和现场综合处理来提升停电障碍的判断能力, 特别是充分利用铁塔公司既有动环系统作为电信RRU 停电分析与处理的有益补充是一个有效地途径。