一、 SA 网络架构
任何一种通信系统演进的终极形态就是独立提供信息服务, 5G 系统也不例外。5G 采取独立组网架构, 从接入侧到核心网元都产生了一系列的变化。核心网采取基于服务的“总线式” 网络架构(SBA, Service-Based Architecture)。接入网与核心网、 接入网元之间定义了新的接口形态。接入网还可以按照 CU 和DU 子网元进行分离, 促进协议栈的切分和系统软件与硬件、 业务与资源的进一步解耦, 实现处理时延以及系统性能的优化提升, 如下图所示 。
5G NR 依然沿用 LTE 采取控制面、 用户面分离的设计理念, 在用户面新增了SDAP 子层, 主要用来提供核心网与数据无线承载(DRB) 的 QoS 映射关系。
二、 SA 接入流程与问题分类
2.1、SA 接入流程
5G SA 独立组网下, NR 的随机接入流程包含以下过程:
2.1.1、随机接入过程
随机接入过程主要由以下事件触发:来自 RRC_ IDLE 的初始访问、 RRC 连接重建过程、 当 UL 同步状态为“非同步” 时, 在 RRC_ _CONNECTED 期间到达 DL 或UL数据、 当没有用于 SR 的 PUCCH 资源时, 在 RRC_CONNECTED 期间 UL 数据到达、 SR失败、 RRC 在同步重新配置(例如, 切换)时的请求、 从 RRC_ INACTIVE 过渡、 在SCell 添加时建立时间对齐、 要求其他 SI、 Beam 故障恢复。此外, 随机接入过程采用两种不同的形式: 基于竞争的随机接入( CBRA ) 和非竞争随机接人( CFRA) , 如下图所示:
2.1.2、UE 专有 NG 连接
UE 专有 NG 连接建立如下图所示。
( 1 ) gNodeB 发送 InitialUEMessage 给 AMF, 携带 gNodeB 分配的 RAN UE NGAPD, 并携带 NAS PDU、 位置信息、 接人原因等;
(2) AMF 收到 InitialUEMessage 消息, 根据携带的信息决策一系列可选的 NAS过程, 例如身份认证、 鉴权、 NAS 安全等;并且根据 UE 是否有业务请求, 决策发起上下文建立的过程或者释放。
2.1.3、NAS 过程
-
下行 NAS 直传
下行 NAS 直传过程:
(1 ) AMF 通过 DOWNLINK NAS TRANSPORT 消息将下行 NAS PDU 发送给 gNodeB;
(2 ) gNodeB 通过 DLInformationTransfer 消息将下行 NASPDU 转发给 UE。
-
上行 NAS 直传
上行 NAS 直传过程:
( 1 ) UE 通过 ULInformationTransfer 消息将_上行 NAS PDU 发送给 gNodeB;
(2) gNodeB 通过 UPLINK NAS TRANSPORT 消息将上行 NAS PDU 发送给 AMF。
2.1.4、UE 能力查询
UE 能力查询过程如图所示:
(1) gNodeB 发送 UECapabilityEnquiry 消息给 UE, 携带需要查询的无线接人类型列表, 比如 NR, EUTRA-NR, E-UTRA;
(2) UE 回复 UECapabilityInformation 消息给 gNodeB, 根据 gNodeB 的要求提供 UE 所支持的无线能力;
(3)gNodeB 通过 UE RADIO CAPABILITY INFO INDICATION 消息携带给 AMF。
2.1.5、DRB 建立
-
初始上下文建立触发的 DRB 建立
初始上下文建立过程:
(1) AMF 发送 INITIAL CONTEXT SETUP REQUEST 消息触发 UE 上下文建立过程, 携带安全、 UE 无线能力(可选的)、 PDU Session Setup List (可选的) 等信息;
(2) gNodeB 收到 INITIAL CONTEXT SETUP REQUEST 消息, 进行 SRB2 建立、安全激活、 UE 能力查询(可选的)、 PDU Session 建立(可选的)等过程。
-
PDU Session 建立触发的 DRB 建立
(1) gNodeB 收到 AMF 的 PDU SESSION RESOURCE SETUP REQUEST, 消息中携带了需要建立的 PDU Session 列表, 每个要建立的 PDUSession 又包括要建立的 QoSFlow 列表;
(2) gNodeB 发送 RRCReconfiguration 消息给 UE, 携带要建立的 DRB 列表信息,UE 进行 DRB 各层资源的配置;
(3) UE 配置成功, 发送 RRCReconfigurationComplete 消息给 gNodeB;
(4) gNodeB 回复 AMF PDU SESSION RESOURCE SETUP RESPONSE 消息, 其中携带建立成功的 PDU Session 列表及失败的 PDU Session 列表。其中成功的 PDUSession 列表中携带成功和失败的 QosFlow 列表, 并且成功建立的 PDUSession需要携带下行 GTPU 信息。
2. 2、SA 接入问题分类
2.2.1、终端不发起 RRC 接入
常见的终端不乏其 RRC 接入的原因为小区禁止接入、 终端不支持当前小区频带以及小区 SSB 频点配置、 不满足小区驻留条件和 USIM 开户信息 PLMN 配置不正确。
判断方法:
1) 基站侧没有收到 RRCSetupReq, 需要在终端侧观察, 终端侧是否有发起RRC 接入;
2) 用户在 NR 不发起 RRC 接入, 从 L3 Message 窗口看到没有任何 UE 接入的消息。
2.2.2、随机接入失败
随机接入失败常见的典型原因通常为以下 4 点:
1) 小区根序列索引配置不满足规划要求;
2) 小区时隙配比和时隙结构配置不正确, 与周边站点产生干扰;
3) 超小区半径接入;
4) 存在弱覆盖或干扰问题。
问题定位:
1) 弱覆盖或干扰导致随机接入失败, 弱覆盖:可以通过终端侧监测小区 RSRP或者 MR 中上报的 RSRP, 判断是否为弱覆盖场景;干扰:可以通过 RSRP 及SINR, 或者通过网管干扰检测, 查看网络是否存在干扰;
2) 超小区半径接入, 通过后台查看小区半径:LST NRDUCELL, 终端超小区半径接入, 会导致随机接入失败;
3) 基础配置核查
首先根序列索引需要进行网络规划, 避免周边小区接收到 Preamble 下发 RAR消息, 对本小区产生下行干扰。时隙配比和时隙结构配置: 要求全网一致, 不-致会有. 上下行干扰问题, 可能导致随机接入异常。小区半径配置, 该配置会影响生成 Preamble 序列所使用的 NCS 参数, 如果配置过小会导致中远点用户无法接入。最后确认是否开启 PUSCH 占用 PRACH 功能。
2.2.3、RRC 建立失败
RRC 建立失败包括三种情况:
RRC Rej: UU 口检查收到 RRCSetupRequest, 没有下发 RRCSetup, 下发了RRCSetupRej;
RRC NoReply: UU 口检查收到 RRCSetupRequest, 下发了 RRCSetup, 但是等待 RRCSetupCpmplete 超时;或者下发 RRCSetup 后又立即下发了 RRCRel;
RRC 丢弃: UU 口检查收到 RRCSetupRequest 后, 直接丢弃, 没有进行下一步的处理。
1) RRC Rej 问题定位:
对于 RRC Rej 类问题, 需要排查的主要场景包括:是否是资源分配失败,SRS/PUCCH 等资源申请失败导致 RRC REJ;是否基站其他异常流程导致。
2) RRC 丢弃问题定位:
当小区接收到 UE 发送的 RRC Setup Request 消息时, 因为流控直接丢弃该消息时, 指标 N. RRC. SetupReq. Msg. Disc. FlowCtrl 加 1, 核查 GNB 是否启动流控;超规格接入导致 RRC 丢弃。
3) RRC NoReply 问题定位:
常见的为干扰以及弱覆盖等导致 RRC Noreply。
2.2.4、NGSig 及 NAS 异常问题
-
NGSig 及 NAS 异常问题判断方法
NGSig 问题现象:
1) 基站发送初始 UE 消息后, 但是核心网没有响应任何 NAS 消息或者上下文建立请求消息或者 MME 释放上下文消息, 这种场景需要联合核心网一起分析原因;
2) 基站发送初始 UE 消息后, 核心网直发送 NG_RESET 释放单用户, 导致NGSIG 廷立失败, 这种场景需要联合核心网一起分析原因;
3) 基站收到 MSG5 消息后, NG 链路被闭塞或者内部异常, 导致基站没有给核心网发送初始 UE 消息, 这种场景需要基站侧分析原因。
NGSig 问题现象:
1) NAS 过程异常, 核心网主动释放 UE;
2) 核心网没有发送 UE 上下文建立请求, 基站主动释放。
-
NGSig 及 NAS 异常问题定位
NGSig 问题定位:
1) 基站 NG 标口无初始 UE 消息:基站或配置问题;
2) 基站 NG 标口有初始 UE 消息:核心网 AMF 或传输问题。
NAS 问题定位:
1) 分析核心网释放前得下行和上行 NAS 消息的 Cause 原因, 根据 Cause 原因在协议 24. 501 中, 查找其大概含义。如果指向核心网则需要核心网侧分析, 如果指向终端侧则需要终端侧分析, 如果原因值指向终端, 也可以联系核心网分析其上下行 NAS 消息内容是否异常;
2) 核心网没有发送 UE 下行文建立请求, 基站主动释放。确认基站在问题时间段传输无告警以及传输正常, 则需要联系核心网给出原因。
2.2.5、上下文建立失败
-
上下文建立失败判断方法
1) 当 gNodeB 收到 AMF 发送的 INITIAL CONTEXT SETUP REQUEST 消息后, 在处理过程中产生错误, 导致上下文建立失败, 在向 AMF 发送 INITIALCONTEXT SETUP FAILURE 消息时, 根据不同原因统计对应指标;
2) 如果是无线层错误导致上下文建立失败, 统计 N. UECntx. FailEst. RNL指标, 无线层错误描述请参考 3GPP TS38. 413 协议定义。如果是无线资源不足导致上下文殆立失败, 统计 N. UECntx. FailEst. NoRadioRes 指标;
-
上下文建立失败问题定位
1) N. UE Cntx. FaolEst. NoRadioRes 无线资源不足导致上下文建立失败, 进一步检查基站空口资源情况;
2) N. UE Cntx. FaolEst. UENoReply UE 无响应导致上下文建立失败, 进一步检查空口覆盖、 干扰等情况或者异常终端;
3) 传输原因导致的上下文建立失败, 需要排查传输链路情况;一:排查是否有传输类告警;话统排查拥塞、 丢包、 重传、 特殊核心网传输参数配置;若收到交互失败响应消息, 则找对端共同分析。
2.2.6、PDU Session 建立失败
-
PDU Session 建立失败判断方法
1) 检查UE 是否有发出PDUSessionEstablishmentRequest 消息, 若未发出,需要终端进一步分析;
2) 检查 NG 口 AMF 是否有发送 PDU Session Resource Setup Request 消息,若没有, 找 AMF 进一步分析;
3) 检查UU 口Qos 是否建立成功, NG 口是否给AMF 响应PDU Session ResourceSetup Response, 若未有, 则基站进一步分析;
4) PDU Session Resource Setup Response 中若有携带原因值, 则 PDUSession 建立失败, 需要根据原因值进一步分析。
-
PDU Session 建立失败判断问题定位
1) 传输原因导致 QosFlow 建立失败, 排查 NG-U 链路及 Path 是否配置;
2) UE 不回复重配置完成消息导致 PDU Session 建立失败, 一是 UE 接收重配置消息但是解码错误导致一直不回复重配置完成消息, 一般是版本不配套导致 UE 解码出错;二是干扰以及弱覆盖问题。
三、 SA 接入优化案例
3.1、随机接入失败:License 受限导致无法正常接入
3.1.1、问题描述
新基建大会会议保障:现场共有 1 个 CPE pro 和 2 个 5G 终端, 测试发现两个 5G 终端无法正常同时占用 5G 网络。
3.1.2、问题分析
核查 4G 锚点站和 NR 侧基站无告警。
核查 X2 接口, DSP GNBCUX2INTERFACE, 4/5G X2 接口正常。
跟踪 4G UU 口信令、 S1 口信令和 5G X2 口信令。使用 TMSI 标示对齐 4/5G信令。
17: 31: 50(512), TMSI 标示:f3 8d 5c 67, 在 5G 终端接入之后, 基站正常下发 B1 测量。终端正常上报 B1 测量值为 86, 即 86-157=-71, 大于现网-105dbm门限, 发起 NR 切换, 锚点侧信令无异常。
核查 TMSI:f3 8d 5c 67 对应的 5G X2 信令, 17: 13: 50(723) 在发起 5G载 波 添 加 后 , 该 请 求 被 无 线 侧 拒 绝 , 拒 绝 原 因 为 :radioNetwork: no-radio-resources-available-in-target-cell。其余的 TMSI标示对应的 5G X2 信令均出现相同的问题。
跟踪 NR 侧的用户数, 始终不超过 1 个, 不存在小区过载的问题。
核查 RRC 连接用户数 license(DSP LICINFO), RRC 连接用户数分配值为 1,实际现网保障期间 5G 终端为 3 个, 由于 RRC 连接用户数受限导致其他 2 部终端接入失败。
3.1.3、解决方案
RRC 连接用户数受限, 只能保证 1 部终端接入正常, 其余终端 NR 接入全部失败。协调督导更新 RRC 连接用户数 license, 问题得已解决。
3.2、RRC 接入失败:request rejected unspecified
3.2.1、问题描述
测试中发现占用 SA 站点时无法占用正常接入, 核查小区状态正常, 无告警。根据测试 LOG 分析, 终端位置在小学位置, 无法正常接入 SA 5G , 换位置后均无法接入, 后台核查配置均无问题。测试 log 终端正常发起随机接入, 在建立 PDU Session 时失败, 失败原因是 SM CAUSE:request rejected unspecified。
3.2.2、问题分析
跟踪 NG 口信令, 终端收到来自 AMF 的去注册请求, 需要 AMF 分析。
从 NG 口信令跟踪来看, 终端携带了支持 VONR 能力导致被要求去注册。由于其他原因测试的 SA 网络不支持 VONR, 需要终端设置成不支持 VONR, 只支持 PSonly 模式。
测试终端通过 atsend 工具设置成 PS only 模式, 复测成功占用 SA 网络, 整站单验正常。
3.2.3、解决方案
测试网络模式不支持 VONR, 终端设置语音模式, 导致被 AMF 拒绝。需通过Atsend 工具将终端设置成 PS only 模式。
3. 3、NGSig 及NAS 异常问题:license 未配导致语音回落 LTE 失败
3.3.1、问题描述
5G 现场占用 NSA&SA小区XX后, 使用华为 mate30 pro固定 SA 模式测试 EPS FB, 语音回落 LTE 失败, 信令面一直重复发送 HandoverRequire。
3.3.2、问题分析
切换和重定向功能均已开启
查询 license 与配置数据一致性问题时, 站点开启 5-4 站点互操作参数时未添加对应 license;
3.3.3、解决方案
NSA&SA 站点开启 5-4 互操作功能后需要产品侧增加 License。
问题原因定位为:基站未加载“语音回落” license 导致语音回落 LTE 失败;加载 license 后复测语音回落 4G 正常。
3.4、NGSig 及 NAS 异常问题:核心网数据导致 SA 站点无法正常语音
EPS FB
3.4.1、问题描述
集团用户需求, 新开通 NSA&SA 双模站点:
目前 5G 语音业务解决主要分为三大类技术方案:
1、 VoLTE:与现有 VoLTE 基本相同;语音(主叫、 被叫) 都由 LTE/EPC 提供;暂不需考虑与 NR/NGC 的业务连续性互操作。
2、 VoNR:针对 NR 终端;语音(主叫、 被叫) 都由 NR/NGC 提供;在 NR 无覆盖或弱覆盖时, 需要考虑呼叫接通后与 VoLTE 的业务连续性互操作。
3、 EPS fallback:针对 NR 终端;在 NR 发起语音起呼时, 由 NR 网络控制下回退到 4G, 由 VoLTE 提供语音;需考虑在呼叫建立时与 VoLTE 的业务连续性互操作。
3. 4. 2、问题分析
在进行 SA 业务验过程中, 终端正常介入 SA 站点, 下载上传数据业务正常,但语音业务失败, EPS FB 失败。
NR 小区状态正常, 无告警;锚点小区状态正常, 无告警。
邻区问题:频点添加正确, 4-5 邻区添加正常, 5-4 邻区添加正常。
锚点侧 E-UTRAN 至 NG-RAN 系统间业务移动性开关开启, E-UTRAN 至 NG-RAN的快速返回开关开启, NR 重定向开关开启, NR 切换开关开启。
NR 侧 EUTRAN 切换开关开启, EUTRAN 重定向开关开启, 移动至 E-UTRAN 开关开启, EPS FB 模式设置为切换, 语音策略演进数据域回落开关开启。
测试过程中, 发起语音业务后, 信令出现 NRDe-registrationFail, UE 注册失败, 导致 NR 语音呼叫失败。
3. 4. 3、解决方案
经核查, 是由于核心网数据未添加, 导致无法注册。核心网数据添加完成后, 语音业务 EPS FB 正常。
3.5、NGSig 及NAS 异常问题:EPSFB 呼叫失败
3.5.1、问题描述
SA 终端 A 呼叫 SA 终端 B, 主叫呼叫成功, 被叫振铃接听后, 主叫立即挂断,被叫持续显示通话读秒中, 持续 8-15s 后挂断。信令流程中表现为主叫向核心网发送 SIP_CANCEL 200 请求或者异常 BYE 请求, 原因值 Media Bearer Released。
未关闭彩铃视频失败截图:
3.5.2、问题分析
核心网抓包发现 EPSFB 和视频彩铃流程互斥, 导致在呼叫过程中发生冲突,释放承载。
3.5.3、解决方案
当前核心网还是存在兼容性问题导致, 正在升级改造, 暂时关闭视频彩铃后,5G 打 5G 语音成功。
3.6、上下文建立失败:SA 组网 EPS FB 跟 Xn 切换流程冲突导致语音呼叫失败
3.6.1、问题描述
在软件园北园附近测试时, 终端在执行语音呼叫业务时, 概率性出现EPS FB 跟 Xn 切换流程冲突导致语音呼叫失败。
3.6.2、问题分析
后台查看该站点的当前告警, 基站状态正常。
查看该终端的 5G 网络模式选择, 终端为 SA 模式;语音/数据中心模式切换为:CS and PS。
通过分析 Probe 测试数据发现, 终端在发起 EPS FB 呼叫请求后, 未正常回落至 4G, 导致呼叫失败。
终端发起 EPS FB 流程, 正常流程如左图所示, 其中 EPS FB 流程发起, 通过5-4 切换回落 4G 后, 发起正常呼叫流程。终端呼叫失败信令流程如下, 其中 EPSFB 流程发起后, 流程冲突导致超时(提示 time out), 未正常回落 4G, 导致 EPSFB 呼叫失败。
核查该基站参数配置, 发现 EPS FB 流程与 Xn 切换流程冲突, 导致 EPS FB回落 4G 超时, 存在呼叫失败问题。
3.6.3、解决方案
基站修改配置 EPS FB 优先, 将 Xn 切换与 PDU 会话流程冲突处理开关:语音回落优先开关由关闭调整为打开。
MODGNBMOBILITYCOMMPARAM: HOPDUSESSCONFLHANDLINGSW=VOICE_FB_FIRST_SWITCH-1;
四、 经验总结
本文从 5G SA 组网下接入流程入手, 将接入问题从终端发起 RRC 接入请求开始,到 PDU 会话完成建立进行分类, 通过深入的理论研究, 将涉及到可能引起接入问题的原因进行了归纳, 最后结合现网中遇到的相关实例, 例如:以 request rejectedunspecified、 license 未配导致语音回落 LTE 失败、 EPSFB 呼叫失败以及核心网数据导致 SA 站点无法正常语音 EPS FB 等实例, 总结分析思路、 提出解决方法与优化建议, 为 5G SA 网络的接入问题优化提供了一定借鉴与参考作用。