一、概况
随着SA网络几期规模性建设的完成,网络商用在即,目前运营商为 SA平稳商用展开本次多环节联合保障,旨在快速有效定位问题、解决问题、总结经验;为SA商用积累相关业务优化经验。
目前团队累计收集体验问题372个,具体定位13类30种问题现象, 已解决20种,遗留10种正在端到端定位整体收集问题中,语音问题占比64.5%,其中被叫不通占比77%。本文主要就语音相关问题的定位分析从原理策略,分析过程,解决方法等方面,联合核心侧系统性剖析问题,总结经验;以此保障即将到来的 SA 网络商用, 树立良好的运营商口碑形象。SA用户体验现阶段问题呢现象及分类如下:
(1)SA 用户体验问题:
(2) 语音业务问题分类:
二、策略原理与影响因素
2.1、语音回落策略原理
目前5G网络建设尚处于初步阶段,覆盖不连续,无法支持 VoNR 语音业务商用, 用户语音业务需通过EPSFB方式回落LTE完成。现阶段全网语音业务采用盲重定向策略的EPSFB方式。用户占用 NR 网络,触发语音业务时,通过NR基站的EPSFB策略配置,实现将5G状态下触发的语音业务迁回到LTE侧进行建立,以此保障现阶段的SA 用户语音业务体验;其原理流程如下:
EPSFB回落原理
2.2、语音呼叫流程
(1) NR 用户主叫流程:
-
NR 用户发起语音呼叫请求, 向IMS 网络发送 INVITE 消息, 网络侧通知其回落到LTE 网络。
-
NR 用户回落到 LTE 网络。
-
NR 用户进行 VOLTE 呼叫流程, 和普通 VOLTE 用户无异。
(2) NR 用户被叫流程:
-
NR 用户发起语音呼叫请求, 向IMS 网络发送 INVITE 消息, 网络侧通知其回落到LTE 网络。
-
NR 用户回落到 LTE 网络。
-
NR 用户进行 VOLTE 呼叫流程, 和普通 VOLTE 用户无异。
(3) 基于盲重定向的 EPSFB 触发流程:
终端占用NR 网络收到语音寻呼消息后, 5G 核心网请求基站侧建立 5QI1 用于语音业务,被拒后通过NRRelease 消息触发 5G 到 4G 盲重定向,NR 基站侧需要开启EPSFB 盲重定向开关,配置LTE 侧对应的频点优先级,该频点将在NR侧的RRCRelease消息中携带, 作为重定向到LTE的频点,基于盲重定向的EPSFB网元信令流程如下:
盲重定向流程解析:
基于盲重定向的 EPSFB 信令流程
1. UE 发起语音业务 Service Request。
2. UE 和gNodeB 完成 RRC 连接建立。具体包括如下消息:
-
通过RRCSetupRequest, RRCSetup 建立 SRB1 连接。
-
通过RRCSetupComplete 通知gNodeB RRC 连接建立完成, 并通过
-
RRCSetupComplete 携带 Service Request 消息。
3. gNodeB 通过INITIAL UE MESSAGE 发送Service Request 给 5GC。
4.UE 和 5GC 完成鉴权和 NAS 加密协商流程。
5. gNodeB 收到INITIAL CONTEXT SETUP REQUEST 建立 UE 上下文和 IMS 信令承载。
6. gNodeB 完成空口 AS 安全算法配置。
7. gNodeB 下发 UE 能力查询, UE 上报能力信息。具体包括如下消息:
a. gNodeB 至UE:UECapabilityEnquiry
b. UE 至gNodeB:UECapabilityInformation
8. gNodeB 发送INITIAL CONTEXT SETUP RESPONSE 指示 PDU Session 建立完成。
9. UE 发起SIP INVITE 消息给 5GC 请求建立语音会话。
10. gNodeB 收到PDU SESSION RESOURCE MODIFY REQUEST 消息, 指示 gNodeB 建立 5QI=1 的语音专用承载。
12. gNodeB 向 5GC 回复拒绝 PDU Session 修改, 并指示 IMS Voice Fallback。
13.gNodeB 向 5GC 发送UE CONTEXT RELEASE REQUEST 消息指示 5GC 释放UE 上下文信息。
14. gNodeB 收到 5GC 发送的UE CONTEXT RELEASE COMMAND 消息指示释放所有承载。
15. gNodeB 向UE 发送RRCRelease 消息, 携带目标 E-UTRAN 小区频点信息。
16. UE 在EPC 下发起 TAU 流程。
17. EPC 触发QCI=1 的语音专用承载的建立。后续流程同 VoLTE 信令流程
2.3、影响因素
2.3.1、参数配置
(1) 参数策略设置 :确立了回落策略后, 相关的参数设置至关重要, 采用盲重定向的语音回落需要在基站侧开启相关联的功能开关, 并且正确设置相关的回落频点、 门限参数等, 其中功能性开关直接关乎功能能否实现, 参数门限配置关联 NR2LTE 或 LTE2NR 的难易程度。详细的基站参数配置如下表:
(2) 邻区配置:前期基于切换模式下的 EPSFB 回落, 由于室内外信号差异性, 存在因SA 室外宏站覆盖到室内时, 因邻区漏配导致 5G->4G 回落失败, 导致未接通事件的发生。现阶段采用盲重定向的方式规避了这类情景。
示例:因SA 室外宏站覆盖到室内时, 因邻区频点漏配导致 5G->4G 回落失败, 导致未接通事件。
2.3.2、无线环境
任何时候网络无线空口环境好坏对 SA 语音业务从 5G 回落 4G 的影响尤为重要;而影响无线空口质量的因素众多, 当无线链路质差时, 信令的交互以及承载的建立会受到不同程度的影响;间接的会导致回落不了或者回落 LTE 后语音承载建立相关问题的产生。
任何时候无线环境的覆盖规划与优化应做到规划合理、 参数优配、 多维度 RF 优化, 以此减少现网网络中的弱覆盖、 过覆盖、 邻区、 干扰等问题带来的网络性能下降。
2.3.3、核心网配置
核心侧的相关网元策略及网元功能的完善至关重要, 目前 AMF 处于容灾机制考虑配置了 三条AMF 地址, 基站也同时配置了三条 AMF 地址,, 基站通过NG 口 连接到AMF, 早期新增 AMF 地址, 前端测试发现多种问题, 因此当后期若再新增 AMF 网元后, 相关的完善优化至关重要。类似的还应注意相关网元策略如:BSF 网元负荷分担方式、 PCF 网元的容灾策略等;UPF 网 元SIP 信令的转发等。
三、 典型案例分析
3.1、邻区模式(NrNetworkingOption) 设置问题
【问题描述】:用 户 HQ 占用 448294, 4G->5G 过程异常, 表现为 4G 基站携带NSA 的站点信息发切换请求给 MME 往 5GC 侧切换被拒;导致 4G->5G 切换失败。
【分析过程】 :根据占用的 LTE 基站 448294 发起的切换请求内容, 解析出请求切换的目标NR 站点(7070480) ;现网核查该站点为 NSA 站点, 不应该触发该类型的切换;进一步核查448294 到NR 的邻区配置发现 NrNetworkingOption 设置为了不受限模式。
【解决方案】 :修改核查站点 4G 站点添加 5G 的外部邻区的, NrNetworkingOption 设置为对应的模式(NSA 或SA) 。
3.2、DR 地址池与 BSF 的绑定问题
【问题描述】 :体验用户在邮电大厦做被叫时, 收到 IMS 网络的寻呼消息, 随后收到网络下发的 SIP CANCEL; 导致未接通;
【分析过程】 :结合正常的主叫挂机后的被叫流程, 发现异常被叫流程下 IMS 网元下发的‘AAA’消息无法传递;导致被叫侧未建立专载, 导致未接通。
【解决方案】 :经核心网&IMS 联合定位:核心网完善自身 DR 地址池与 BSF 的绑定问题解决。
3.3、不支持 CR611 协议, 鉴权失败, 导致 TAU 失败
【问题描述】 :用 户 mate30 终端做被叫时, 被叫终端无响应;核心网发现 5G 切到 4G 进行TAU 的过程中, 因不支持 CR611 协议, 鉴权失败, 导致 TAU 失败。
【分析过程】 :现在核心网遵从了 33501-cr0611 协议,终端需要升级版本支持(如果不支持会导致终端 5到4G后, 在4G侧鉴权失败) ;CR611 协议的变更影响5切4,5到4重选,和 EPSFB 流程;
【解决方案】 :升级终端版本为最新版本解决, mate30 系列 10.1 以后的版本都支持 ,P40 和P40pro 都只支持。
3.4、寻呼超时-SIP408, 未接通
【问题描述】 :主叫发起INVITE 请求后, 未收到 183 消息, 历时 10s 寻呼超时,网络下发SIP 408 导致未接通。
【分析过程】 :主叫侧在INVITE 超时前, 承载建立正常, 被叫侧SIP 信令缺失;结合被叫事件&L3 信令分析发现:被叫终端自上一次VoLTE 通话结束后, 重新定向回 5G 网络一直未收到寻呼 paging 建立 RRC 连接,无相应的承载建立, 处于空闲重选状态。
【解决方案】 :无线空口环境良好, 被叫未收到对应的寻呼消息, 建立 RRC 连接。需要继续联合核心网进一步联合抓包定位。
3.5、PRACK 重传, 会话流程终止
【问题描述】 :主/被叫未能完成update 信令消息交互;导致会话流程终止, 期间被叫侧多次 PRACK 重传:基站侧已经上发 PRACK 200OK, 但网络侧仍然下发 PRACK;
【分析过程】 :主叫侧SIP 信令:主叫收到PRACK 200 OK 后发起update 流程, 未收到网络侧回应 update 200OK。
被叫侧基站接口信令:被叫侧多次PRACK 重传, 基站侧已经上发PRACK 200OK, 但网络侧仍然下发 PRACK。
【解决方案】 :需要核心网侧排查因PRACK 重传问题, 导致“update 消息交互” 失败的问题。
3.6、网络下发 503, RAR 消息超时
【问题描述】 :DT 测试中,主叫未收到SIP183消息,网络下发 503, 原因值:RAR 消息超时, 导致未接通。
【分析过程】:依据前段信令分析可知主叫正常触发 5G->4G 回落, 并且成功;无线环境良好的情况下未收到被叫的 SIP 183 信息;此时被叫侧尚未收到寻呼, 信令缺失, 但是在主叫侧在承载的建立过程 IMS 与DRA 间的交互中用于建立承载的“AAR” 消息为得到“RAR” 回应。导致 IMS 网络下发 SIP 503;后续流程结束。
IMS 侧信令跟踪结果:
【解决方案】:需要进一步联合 IMS 核心网与 5GC 跟踪“RAR” 消息超时的原因。
3. 7终端上报 SIP 486 消息未接通
【问题描述】 :(1) 体验用户:终端主动上报 SIP 486(用户忙) , 导致未接通。
(2) 测试终端:同一终端, 做主被叫拨打流程冲突, 主叫侧发起 INVITE 寻呼后, 网络也下发了一次寻呼, 流程冲突导致未接通。
【分析过程】 :(1) 被叫终端收到寻呼消息后, 触发建立承载后, 正常上发 SIP180 消息后, 但是被叫终端异常上报 SIP 486(用户忙) 消息, 导致未接通。
(2) 同一终端, 做主/被叫拨打流程冲突, 主叫侧发起 INVITE 寻呼后, 网络也下发了一次寻呼, 流程冲突导致未接通。
【解决方案】 :体验用户SIP 486 问题经联系现场复测, 未发现类似问题, 初步判断为个人手机(或与相关 APP 有关) 问题。
3. 8主叫掉 2G, 被叫未接通&接通
【问题描述】 :(1) 主叫测试终端侧起呼后, 掉入 2G, 被叫未接通。
(2) 体验用户主叫侧起呼后, 掉 2G, 被叫接通
【分析过程】 :
(1) 测试终端, 主叫侧未建立QCI1, 且呼叫期间处于SIP 信令空档期 15s内, 初步判断, 主叫未在 IMS 完成注册。
(2) 体验用户, 主叫侧起呼后, 在建立专载过程中, 网络下发 SIP 503(RAR 超时) ;随后承载释放掉 2G 拨打通话。
【解决方案】 :需要联合定位RAR 消息超时, 同时优化 4->5G 处理过程, 避免 4G 处于拆链过程, 5G 尚未完成承载建立情况下, 拨打电话的流程冲突性题。
四、 总结推广
5G 网络建设尚需进一步的投资建设, 扩大规模;现阶段 5G 基站较少不能实现连续覆盖, 语音业务只能通过 EPS Fallback 回落 4G, 进行 VoLTE 通话;本文从 EPSFB 策略原理、 参数配置、 典型案例分析等多方面总结经验, 为后续商用的投诉优化处理提供方法借鉴, 为SA 的商用奠定网络优化基础。
-
现阶段成果:针对部分语音问题进行端到端分析, 确立了产生原因、 问题环节与解决方案。
-
后续计划:针对疑难点, 如“寻呼超时问题” 、 “RAR 超时导致的承载建立失败问题” 、 “SIP 消息重传问题” 等进一步采用端到端联合排查的形式分析定位,以形成有效的解决方案。