PHY Processing Impairments ~ Wireless Signal Impairments¶
本部分主要论述了Slingshot为什么能够做到“无状态”迁移
核心洞察:处理中断等同于信号衰减
Slingshot的设计基于一个重要观察:在弹性事件中发生的短期PHY处理中断(例如丢失前一个TTI计算的软状态,或丢弃部分前传数据包),其影响与常规的无线信号质量变差极其相似
由于蜂窝网络本身就具备处理不良信号质量的天然能力,Slingshot巧妙地利用了这一点来在短暂中断期间维持网络连接
极低的发生概率与无状态迁移的可行性
无线网络由于其共享和不可靠的物理特性,UE(用户设备)天然会经历性能波动,哪怕是静止且视线良好的5G UE也可能经历高达4倍的吞吐量变化
相比之下,弹性事件引发的PHY中断概率微乎其微:假设每周进行一次计划内迁移,仅会影响约 \(10^{-9}\) 比例的TTI,这远低于超可靠网络允许的0.1%正常解码失败率
因此,Slingshot完全可以在两个PHY进程间迁移而不转移任何状态,且依然能满足10毫秒的可用性目标
基于TTI(传输时间间隔)边界的精确迁移
PHY层是以TTI(在其实验设置中为500微秒)为粒度来执行工作和处理请求的:
Slingshot被设计为仅在严格的TTI边界进行PHY迁移(例如,主PHY处理 0 到 \(i\) 的TTI,备用PHY处理 \(i\) 之后的TTI)
这种设计彻底免去了在迁移过程中传输任何TTI内部中间状态(如解码前的解调数据)的需要
安全丢弃跨TTI的软状态(以上行链路为例)
PHY仅维护跨越少数几个TTI的短期“软状态”,而长期“硬状态”均由vRAN的更高层维护
文章具体列举了两种可以安全丢弃的跨TTI软状态:
-
平均信噪比(SNR):
- def: PHY维护UE的移动平均SNR来检测断连
- 迁移时忽略此状态会导致目标PHY在滤波器重新收敛前(约25毫秒)使用陈旧或默认的SNR值
- 这是可以接受的,因为它与无线信道自身产生的信号损伤表现一致
-
重传缓冲区(HARQ):
- def: 现代RAN使用软合并重传机制(如5G的HARQ),PHY会保留最近未能解码的传输数据长达数个TTI
- Slingshot在迁移时会忽略HARQ缓冲区
- 这虽然会导致目标PHY的前向纠错解码失败并在RAN更高层触发重传,但这与正常的PHY操作毫无二致
- 因为商业网络本就允许一定比例的残余块错误率(如0.5-2%或0.1%)