四元数神经网络的万有逼近与逼近优势

吴锦辉; 姜远

doi:10.7544/issn1000-1239.202440410

四元数神经网络的万有逼近与逼近优势

吴锦辉,
姜远^,

计算机软件新技术全国重点实验室（南京大学）　南京　210023
南京大学人工智能学院　南京　210023

基金项目: 国家自然科学基金项目（62176117）；南京大学优秀博士研究生创新能力提升计划项目（202401A13）

详细信息

作者简介:
吴锦辉: 1998年生. 博士研究生. 主要研究方向为神经网络理论、机器学习

姜远: 1976年生. 博士，教授，博士生导师. 主要研究方向为人工智能、机器学习、智能医学应用

通讯作者:
姜远（jiangyuan@nju.edu.cn）

中图分类号: TP18
计量
- 文章访问数: 30
- HTML全文浏览量: 17
- PDF下载量: 11
出版历程
- 收稿日期: 2024-05-30
- 修回日期: 2024-10-07
- 录用日期: 2024-10-15
- 网络出版日期: 2024-10-15

Universal Approximation and Approximation Advantages of Quaternion-Valued Neural Networks

Wu Jinhui,
Jiang Yuan^,

National Key Laboratory for Novel Software Technology (Nanjing University), Nanjing 210023
School of Artificial Intelligence, Nanjing University, Nanjing 210023

Funds: This work was supported by the National Natural Science Foundation of China (62176117) and the Program for Outstanding PhD Candidates of Nanjing University (202401A13).

More Information

Author Bio:
Wu Jinhui: born in 1998. PhD candidate. His main research interests include neural network theories and machine learning

Jiang Yuan: born in 1976. PhD, professor, PhD supervisor. Her main research interests include artificial intelligence, machine learning, and intelligent medical applications

摘要

摘要:
四元数神经网络将实值神经网络推广到了四元数代数中，其在偏振合成孔径雷达奇异点补偿、口语理解、机器人控制等任务中取得了比实值神经网络更高的精度或更快的收敛速度. 四元数神经网络的性能在实验中已得到广泛验证，但四元数神经网络的理论性质及其相较于实值神经网络的优势还研究较少. 从表示能力的角度出发，研究四元数神经网络的理论性质及其相较于实值神经网络的优势. 首先，证明了四元数神经网络使用一个非分开激活的修正线性单元（rectified linear unit，ReLU）型激活函数时的万有逼近定理. 其次，研究了四元数神经网络相较于实值神经网络的逼近优势. 针对分开激活的ReLU型激活函数，证明了单隐层实值神经网络需要约4倍参数量才能生成与单隐层四元数神经网络相同的最大凸线性区域数. 针对非分开激活的ReLU型激活函数，证明了单隐层四元数神经网络与单隐层实值神经网络间的逼近分离：四元数神经网络可以用相同的隐层神经元数量与权重模长表示实值神经网络，而实值神经网络需要指数多个隐层神经元或指数大的参数才可能近似四元数神经网络. 最后，模拟实验验证了理论.
- 四元数神经网络 /
- 万有逼近 /
- 逼近优势 /
- 最大凸线性区域数 /
- 逼近分离 /
- 神经网络理论
Abstract:
Quaternion-valued neural networks extend real-valued neural networks to the algebra of quaternions. Quaternion-valued neural networks achieve higher accuracy or faster convergence than real-valued neural networks in some tasks, such as singular point compensation in polarimetric synthetic aperture, spoken language understanding, and radar robot control. The performance of quaternion-valued neural networks is widely supported by empirical studies, but there are few studies about theoretical properties of quaternion-valued neural networks, especially why quaternion-valued neural networks can be more efficient than real-valued neural networks. In this paper, we investigate theoretical properties of quaternion-valued neural networks and the advantages of quaternion-valued neural networks compared with real-valued neural networks from the perspective of approximation. Firstly, we prove the universal approximation of quaternion-valued neural networks with a non-split ReLU (rectified linear unit)-type activation function. Secondly, we demonstrate the approximation advantages of quaternion-valued neural networks compared with real-valued neural networks. For split ReLU-type activation functions, we show that one-hidden-layer real-valued neural networks need about 4 times the number of parameters to possess the same maximum number of convex linear regions as one-hidden-layer quaternion-valued neural networks. For the non-split ReLU-type activation function, we prove the approximation separation between one-hidden-layer quaternion-valued neural networks and one-hidden-layer real-valued neural networks, i.e., a quaternion-valued neural network can express a real-valued neural network using the same number of hidden neurons and the same parameter norm, while a real-valued neural network cannot approximate a quaternion-valued neural network unless the number of hidden neurons is exponentially large or the parameters are exponentially large. Finally, simulation experiments support our theoretical findings.
- quaternion-valued neural networks /
- universal approximation /
- approximation advantage /
- maximum number of convex linear regions /
- approximation separation /
- neural network theory

HTML全文

近年来，由于大气污染、人口老龄化以及新冠疫情等因素的影响，呼吸系统疾病的患病人数呈现逐年上升的趋势^[1]. 在呼吸系统健康评估过程中，呼吸率是反映个人生理状态和健康状况的重要指标之一，通过长时间监测呼吸的变化，专业人员能够及时发现和诊断呼吸系统疾病、心脏病、肺部疾病以及其他与呼吸相关的疾病. 因此，对个人的呼吸实施长期监测具有重要意义.

传统呼吸监测主要依赖可穿戴设备^[2]，但专用设备带来的硬件成本会降低用户接受度^[3]，并且由于可穿戴设备要求使用者必须在监测期间与设备保持接触，对于老人、小孩等特定人群并不友好. 因此，研究人员提出了一种基于移动摄像头^[4-6]的非接触式呼吸监测方法. 然而，该类方法通常需要用户手持摄像设备，并持续采集用户的面部图像，这可能导致隐私泄露问题.

近年来，随着WiFi通信技术的发展，基于WiFi构建物联网感知层形成新型的非接触式无线感知并将其应用于监测呼吸已成为当前研究的热点^[7]. 一方面，由于WiFi无线感知一般通过测量WiFi信号的信道状态信息（channel state information，CSI）获取信号可能受呼吸或其他运动影响的多径特征，无需部署专用监测设备；另一方面，WiFi无线感知可实现连续实时监控，有利于对监测目标的突发情况进行预警，更适合各种健康应用. 目前，基于WiFi的呼吸监测系统有很多. 例如：TVS^[8]利用时频域的CSI信息，准确地感知睡眠者的呼吸率和心率. TensorBeat^[9]利用CSI的相位差信息，然后结合CP分解和峰值检测方法来计算呼吸率. 此外，Yang等人^[10]将菲涅耳区模型与高斯模型结合，把人体睡眠时的运动建模为高斯模型，以实现多人睡眠呼吸监测.

上述研究表明了采用WiFi无线感知技术监测呼吸率具有可行性，然而，目前仍存在2个关键问题限制了该类方法的进一步应用推广. 首先，WiFi信号在传播过程中受多径效应^[11]和环境噪声^[12]等因素的影响，这限制了WiFi的有效监测范围（<3 m）. 其次，通过CSI实现呼吸监测本质上是分析由人体呼吸引起的微弱胸腔起伏导致的CSI变化. 而CSI是由多条反射路径叠加而成的，若环境中除了被监测人员外还存在其他运动的非监测目标人员，来自二者的反射信号将会叠加在一起，导致我们无法准确地从接收信号中识别出目标的呼吸信号. 因此，为了实现精准的呼吸监测，现有工作要求被监测目标尽量靠近收发设备并不能有其他移动的非监测目标出现^[13]. 然而，在日常家居环境中，更多可能是动态场景^[14]，即存在处于运动状态的非监测目标，这将严重干扰对目标的呼吸监测.

为了实现在动态场景下的呼吸监测，已有研究尝试采用时域上的功率时延谱（power delay profile，PDP）分离呼吸信号和其他运动成分信号^[15]. 这种方法的核心思想是假设静止的被监测目标与运动的非监测目标在空间上存在一定距离，利用呼吸多径和运动多径的到达时延差异区分监测目标和非监测目标. 而通过分析PDP可以确定信号在不同时延下的能量分布情况，可以揭示信号经过不同反射目标后的时延情况，从而区分不同的传播路径. 并且研究表明PDP区分不同传播路径的能力与信道带宽有关，信道带宽越大越有利于区分信道中不同时延的传播多径^[14].

由于商用WiFi设备一般只工作在1个信道，因此WiFi单信道带宽制约着PDP的区分能力，以常见的802.11 n为例，它可以提供20 MHz或40 MHz这2种带宽选择，大致对应50 ms或25 ms的时间分辨率（temporal resolution，TR）以及15 m或7.5 m的空间分辨率（spatial resolution，SR）^[16]来区分不同路径的信号. 然而，在日常生活或居家环境中，呼吸多径和运动多径往往小于7.5 m，因此，较低的SR难以有效分离呼吸多径和运动多径. 为了解决该问题，RespiRadio^[14]提出了一种多信道合并方法，通过合并5个信道采样的CSI数据，从而获得SR更高的PDP. 这种方法有效地区分了运动多径与呼吸多径，然而，来自多个信道的硬件噪声也随着信道的合并而累积，从而降低了识别精度. 为此，在我们先前的工作ExRadio^[17]中通过引入有线直连（wire direct connection，WDC）信道去除硬件噪声，提高了合并信道后在动态场景中的WiFi感知精度，然而即使这样，ExRadio一般只能在2 m内实现小于1 bpm的检测误差，随着距离的增加，ExRadio的性能会快速下降.

综上，目前尚缺乏一种能够在动态场景中监测远距离目标呼吸的方法. 在本文中，我们提出了一种名为FDRadio的基于商用WiFi设备的呼吸监测方法，可以在高动态场景中实现较远距离（>3 m）的呼吸监测. FDRadio分别利用扩展信道带宽和信号时-空分集技术实现对监测目标的呼吸信号的分离以及对接收信号感知能力的提升. 具体来说，为了提高对动态场景的适应能力，FDRadio采用快速切换信道的方法在不同信道采样并将其视为带宽扩展后的合并信道，然后通过WDC信道去除硬件噪声. 为了提高信号的感知能力，我们基于信号时间分集提出了一种2级消除环境噪声的方法，分别在信道切换过程中以及合并信道之后叠加连续时间上的样本，提高消噪性能. 此外，考虑到WiFi设备提供的多维度天线信息，我们设计并实现了一种基于信号空间分集的权值分配算法，为不同天线间的CSI比值信号分配不同的权值，并将它们对齐至相同的初始相位后进行组合来最大化动态反射信号功率. 通过上述措施，我们提高了信号的在动态场景中的感知能力，将感知范围从2 m以内提高到7 m以上.

综上，本文的主要贡献包括3点：

1）提出了一种2级消除环境噪声的方法，该方法利用信号时间分集对2个阶段的信号处理，最大化消除环境噪声.

2）设计并实现了一种权值分配算法，通过对齐不同CSI比值信号的初始相位以及合理叠加不同信号来增加动态反射信号功率.

3）在一套基于AMR架构的WiFi嵌入式设备上实现了FDRadio，并通过一系列实验验证了FDRadio在动态场景下可以有效扩大对呼吸信号的监测范围.

1. 相关工作

相较于传统基于可穿戴设备的呼吸监测方法，基于无线射频信号的方法具有非接触、抗干扰和隐私保护性高等优点. 现有基于射频的非接触式人体呼吸率监测系统可大致分为3类：基于雷达、基于RFID和基于WiFi设备.

雷达系统主要通过分析直接受胸腔运动影响的电磁回波来推断呼吸率. 例如：Zheng等人^[18]基于IR-UWB雷达实现了一个非接触式呼吸感知系统，该系统利用一种新颖的变分编码-解码器网络消除身体的动态干扰，即使在身体抖动的情况下，也能准确地恢复呼吸波形. Lv等人^[19]使用120 GHz的窄波束调频连续波（frequency modulated continuous wave，FMCW）雷达信号，极大减少环境中其他物体反射造成的干扰，并通过经验模态分解算法和快速独立分量成功实现了对人体的心率测量. mmRH^[20]基于FMCW毫米波雷达提出差分增强模块以减少呼吸谐波和噪声对心率估计的影响，实现准确可靠的呼吸频率与心率估计. 得益于雷达的大带宽（通常超过1 GHz），基于雷达的呼吸监测系统能够实现较高的准确率，但专用雷达的价格昂贵，限制了其广泛应用.

基于RFID实现呼吸率监测主要依赖于RFID读写器与RFID标签之间的无线射频（RF）信号通信. Yang等人^[21]提出了一种基于 RFID 的驾驶环境呼吸监测系统. 该系统从多个 RFID 标签采样的相位值来估计驾驶员的呼吸率，同时采用张量补全来处理相位值，克服跳频、随机采样、车辆振动和其他环境运动的影响，有效监测驾驶环境下驾驶员的呼吸率. RF-RMM^[22]使用一对标签来消除用户身体运动的影响，并融合配对标签的数据，消除身体运动的影响，只保留用户呼吸引起的位移. 不同用户呼吸率的平均误差为0.54 bpm，估计用户个体呼吸长度的平均相对误差小于13%.

近年来，WiFi设备广泛应用于室内环境中，在实现网络通信的同时支持各种无线感知应用，从粗粒度的入侵检测^[23-24]、室内定位^[25-26]、活动识别^[27]和跌倒检测^[28-29]到细粒度的嘴唇识别^[30]、手势识别^[31-32]以及呼吸监测^[9,33-38]等. 不同于基于雷达和基于RFID的方法，基于WiFi实现呼吸监测可复用现有网络基础设施，无需专用硬件设备，成本低廉. 例如：Wi-Sleep^[34]首次提出了一个利用CSI变化监测人体睡眠的系统，将采集的CSI数据经过汉佩尔滤波和小波变化去噪后，成功提取出呼吸的变化模式. Liu等人^[8]考虑了不同的睡眠姿势以及异常的呼吸模式，进一步改善了Wi-Sleep的性能. Guo等人^[35]通过混合聚类高斯-隐马尔可夫模型将呼吸引起的CSI振幅变化与呼吸带的变化模式保持一致，提供了更加细粒度的呼吸信息. Wi-Breath^[36]提出了一种基于支持向量机算法的信号选择方法，从幅度和相位差中选择合适的信号进行呼吸监测，呼吸监测准确率达到91.2%. 为了获得可靠的感知精度，文献[8, 34−36]方法通常要求待监测目标靠近收发设备（<2 m）. 为了扩大呼吸监测范围，TensorBeat^[9]和PhaseBeat^[33]利用不同天线的相位差去除硬件噪声，实现了5 m内的呼吸监测. FullBreathe^[13]使用共轭相乘的方法消除硬件噪声，结合CSI的振幅与相位信息实现呼吸感知，解决了“盲点”问题，然而，振幅上的脉冲噪声随着乘法运算被进一步放大. FarSense^[38]则通过2个天线的CSI比值消除CSI中的振幅噪声和随机相位偏移，提高了非视距场景下的呼吸传感性能，并在静态场景中实现8 m内的呼吸监测. DiverSense^[39]在使用不同天线之间的比值去除硬件噪声的基础上，结合所有CSI信号的子载波，有效去除了环境噪声，进一步在静态场景中将呼吸监测范围扩大到40 m. 然而，以无线信道作为参考信道虽然可以消除硬件噪声，但无法消除环境中其他运动物体的动态干扰，此外，叠加不同载波会破坏信号的时序特征，因此只适用于静态场景. Shi等人^[14]结合了多个WiFi信道扩展信道带宽，实现了在动态场景中的呼吸监测.

2. CSI测量的噪声分析

在本节中，我们分别讨论了硬件噪声和环境噪声对CSI测量的影响，并引入感知信噪比（sensing signal to noise ratio，SSNR）量化分析了动态反射信号功率与环境噪声的关系.

2.1 硬件噪声对CSI测量的影响

室内环境中，WiFi信号沿着多条传播路径从发射器到达接收器. CSI描述了不同子载波的多径效应，该效应是所有传播路径信号线性叠加的结果，理想环境中，CSI可以表示为：

$H\left(f,t\right)=\sum _{i=1}^{L}{\left|\right|H}_{i}\left(f,t\right)\left|\right|{\mathrm{e}}^{-\mathrm{j}\angle {H}_{i}\left(f,t\right)}\text{，}$

(1)

其中L表示传播路径数，t为对应时间，f为无线信道的载波频率. ${\left|\right|H}_{i}\left(f,t\right)\left|\right|$ 和 $\angle {H}_{i}\left(f,t\right)$ 分别表示第i条传播路径的振幅和相位信息. 如所示，无线信号的传播路径由静态物体反射的静态分量 ${H}_{\mathrm{s}}\left(f\right)$ 和由人体运动产生的动态分量 ${H}_{\mathrm{d}}\left(f,t\right)$ 组成^[40]. 因此，接收信号的CSI又可以表示为：

图 1 基于WiFi的呼吸感知示意图

Figure 1. WiFi-based respiration sensing diagram

下载: 全尺寸图片幻灯片

$H\left(f,t\right)={H}_{\mathrm{s}}\left(f\right)+{H}_{\mathrm{d}}\left(f,t\right) ={H}_{\mathrm{s}}\left(f\right)+a\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}\text{，}$

(2)

其中 $a\left(f\right)$ ， ${\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\lambda }_{f}}}$ 和 $d\left(t\right)$ 分别为动态分量 ${H}_{\mathrm{d}}\left(f,t\right)$ 的复衰减系数、相位偏移和反射路径长度. 相位变化 $\Delta \theta =\dfrac{2\mathrm{\pi }\Delta d\left(t\right)}{\lambda }$ ，当 $d\left(t\right)$ 改变时，CSI相位也会发生相应的变化，通过计算相位变化 $\Delta \theta$ ，我们可以获取反射路径长度变化 $\Delta d\left(t\right)$ 的信息，从而感知人体运动.

然而，对于商用WiFi设备，由于收发设备时钟不同步，接收到的CSI中包含了与信道无关的硬件噪声，包括振幅中的脉冲噪声^[40]和相位中的随机偏移^[41]，这些噪声都会影响由运动而引起的CSI变化. 因此，式（2）可改写为：

$H\left(f,t\right)=\delta \left(t\right){\mathrm{e}}^{-\mathrm{j}\theta \left(t\right)}\left({H}_{\mathrm{s}} (f)+a\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}\right)，$

(3)

其中 $\delta \left(t\right)$ 是振幅上的脉冲噪声， $\theta \left(t\right)$ 是随机相位偏移值. 在硬件噪声的干扰下，由运动引起的CSI变化在复平面上将随机变化，这极大程度地降低我们使用CSI进行细粒度感知的精度.

2.2 环境噪声对CSI测量的影响

在实际应用中，除了硬件噪声外，接收的CSI信号中还包含环境噪声^[12]，这些噪声都会影响由运动引起的CSI变化. 采集的CSI数据是理想的无线信道和噪声的组合，如式（4）所示.

$H\left(f,t\right)=\delta \left(t\right){\mathrm{e}}^{-\mathrm{j}\theta \left(t\right)}\left({H}_{\mathrm{s}}(f)+a\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}+ \varepsilon(f,t )\right)\text{，}$

(4)

其中 $\varepsilon(f,t)$ 表示时刻t子载波f中的环境噪声，通常被建模成均值为0、方差为 ${\sigma }^{2}\left(f\right)$ 的正态分布. 在 $\varepsilon(f,t)$ 的影响下，CSI将随机出现在复平面中，而不是由人体运动以及环境决定的. Li等人^[39]已经证明能否从接收的CSI中还原运动信息与静态分量的大小无关，而是取决于环境噪声与动态分量的相对大小. 对于细粒度的呼吸运动，环境噪声的值基本保持不变，然而，在目标远离收发设备的过程中，动态分量的强度逐渐降低，当动态分量小于环境噪声时，由人体运动产生的CSI变化就会被噪声掩盖. 此时，我们就难以从CSI中还原人体的运动.

为了确定信号的感知能力，Zeng等人^[42]提出了SSNR来量化动态反射信号的功率与噪声功率的关系，将其定义为动态反射信号的功率与噪声功率的比值，如式（5）所示.

$S S NR=\dfrac{{P}_{\mathrm{d}\mathrm{y}\mathrm{n}\mathrm{a}\mathrm{m}\mathrm{i}\mathrm{c}}}{{P}_{\mathrm{n}\mathrm{o}\mathrm{i}\mathrm{s}\mathrm{e}}}=\dfrac{{\left|a (f )\right|}^{2}}{{\sigma }^{2} (f )}.$

(5)

通过上述分析可知，较高的SSNR更有助于我们从CSI中还原目标运动信息. 虽然已有研究证明了提高SSNR有助于扩大静态环境下呼吸监测的监测范围^[39]，然而在动态环境中，我们需要将原始CSI转换为时域PDP从而分离动态干扰，目前还没有研究讨论较高的SSNR是否能够提高PDP的计算精度.

为了验证较高SSNR是否有助于提高PDP的计算精度，从而扩大动态环境下的监测范围，我们进行如下的仿真实验：首先，我们放置了一对WiFi收发设备和一根金属棒，并在不同距离下分别对合并信道进行300次扫频. 实验过程中以相同的频率移动金属棒，同时在金属棒的后方2 m处设置一个移动的小车来模仿动态干扰. 扫频结束后使用采集到的CSI计算PDP，并根据PDP选择周期性最高的多径信号作为金属棒运动引起的信号变化. 实验结果如（a）（b）所示，当金属棒距离收发设备1 m时，运动波形具有明显的周期性；当金属棒距离收发设备3 m时，在环境噪声的干扰下，运动波形的周期性明显降低. 为了进一步探究动态分量与PDP的关系，我们用更大的金属板 $\left(20\;\mathrm{c}\mathrm{m}\times 20\;\mathrm{c}\mathrm{m}\right)$ 替代金属棒来获得更大的动态分量，并在3 m的距离重复上述实验. 由菲涅尔区模型理论^[14]可知，CSI的幅值变化取决于物体运动切割菲涅尔区边界的数量，因此，在运动频率相同的情况下，CSI振幅图中产生的波峰和波谷数量在不同距离应保持一致，结果如图2（c）所示. 我们观察到，在距离收发设备相同距离的情况下，由金属板运动引起的CSI信号变化具有更明显的周期性，这说明提高信号的动态反射信号分量有助于提高PDP的计算精度.

图 2 不同物体及距离的幅值变化

Figure 2. The amplitude changes with different objects and distances

下载: 全尺寸图片幻灯片

结果表明，无论是降低环境噪声还是提高目标反射信号功率，均可以显著提高信号的感知能力，从而获得精度更高的PDP. 因此，为了提高SSNR，我们可以采取2种策略：一是降低环境噪声功率（3.2节介绍）；二是增强动态反射信号功率（3.3节介绍）.

3. FDRadio的设计与实现

在本节中，我们将着重介绍FDRadio的设计与实现，包括数据采集与预处理、环境噪声消除、动态反射信号功率增强、PDP谱图生成与呼吸多径识别4个模块构成.

3.1 数据采集与预处理

FDRadio使用Halperin等人^[43]开发的CSI工具，从接收端的3根天线中收集CSI数据，该工具可提供30个子载波的CSI.

由于一个人的呼吸率通常小于1 Hz^[13]，根据奈奎斯特定理，采样率至少是最大呼吸率的2倍，这意味着我们需要在0.5 s内完成信道合并. 为了实现快速的信道切换，我们使用WiFi的Monitor模式进行数据传输，在这种模式下，收发端能够在3 ms内同步完成信道切换过程^[17]，对不同信道的一轮扫频可以在50 ms内完成，这个采样率足以满足人类的呼吸感知.

经过上述方法，我们可以同步在多信道采样实现信道合并，然而，原始采样信号中包含硬件噪声，这可能会影响PDP的精确计算. 为了说明硬件噪声的影响，我们分别在静态环境下采集单信道以及合并信道的500条数据并计算其PDP谱图绘制在图3（a）（b）中. 通过比较这2幅图可以观察到，由于合并信道积累了多个单信道的硬件噪声，严重影响了PDP的计算准确性. 因此，消除合并信道中累积的硬件噪声至关重要.

图 3 静态环境下的PDP谱图

Figure 3. PDP spectrum under static environment

下载: 全尺寸图片幻灯片

自研究人员发现时变振幅脉冲噪声和随机相位偏移在接收端的不同天线之间是相同的，现有工作^[38]通过计算不同天线间的CSI比值来消除这些硬件噪声. 然而，在这个信号比的计算过程中，由于每个天线上接收到的信号都包含动态分量，因此在2个都包含动态分量的信号之间进行除法操作会破坏动态信号的时序特征与线性结构. 为了解决这个问题，我们采用WDC信道作为参考信道去除硬件噪声^[44]. WDC信道是单径时不变信道，其中包含的硬件噪声与无线信道中的硬件噪声相同，因此可以通过WDC信道去除硬件噪声. 以WDC信道作为参考信道的CSI比值可表示为：

$\begin{split} {H}_{\mathrm{r}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{o}}\left(f,t\right)=& \dfrac{H(f,t)}{{H}_{\mathrm{w}\mathrm{d}\mathrm{c}}(f,t)}=\\ & \dfrac{\delta \left(t\right){\mathrm{e}}^{-\mathrm{j}\theta \left(t\right)}\left({H}_{\mathrm{s}} (f)+a\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}+\varepsilon (f,t )\right)}{\delta \left(t\right){\mathrm{e}}^{-\mathrm{j}\theta \left(t\right)}\left({H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\right(f)+{\varepsilon }_{\mathrm{w}\mathrm{d}\mathrm{c}}(f,t)}\approx\\ & \dfrac{{H}_{\mathrm{s}}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}+\dfrac{a\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}+\dfrac{\varepsilon \left(f,t\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}\text{，}\\[-1pt] \end{split}$

(6)

其中 ${H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)$ 表示信号经过WDC信道产生的静态分量. 在WDC信道中，环境噪声通常比静态分量要小得多，因此我们可以忽略WDC信道中的环境噪声. 通过比较式（4）与式（6）可以观察到：以WDC信道作为参考信道构建的CSI信号在不破坏无线信道线性结构的同时，有效去除了其中的硬件噪声.

为了进一步说明该方法的有效性，我们在相同的环境中基于WDC信道收集同样数量的CSI数据并计算去噪后合并信道的PDP谱图. 图3（c）绘制了计算结果，可以看出，使用WDC信道作为参考信道可以有效去除硬件噪声. 多条PDP谱图在静态环境中表现出高度的一致性，这与信号多径传播不变的性质相符. 需要说明的是，下文提到的CSI信号均为经过上述方法处理后得到的CSI比值信号.

3.2 基于时间分集的噪声消除方法

在这个模块中，我们基于时间分集来消除CSI信号中的环境噪声. 该方法的核心思想是利用环境噪声的统计特性，通过叠加连续时间上的样本来消除噪声. 具体而言，假设 ${X}_{n}$ $(n=1,2,…)$ 是独立同分布的随机变量，其符合均值为 $\mu$ 、方差为 ${\sigma }^{2}$ 的正态分布，那么它们的平均值 $\bar{X}$ 则符合均值为 $\mu$ 、方差为 $\dfrac{{\sigma }^{2}}{n}$ 的正态分布，即

$\bar{X}\sim N\left(\mu ,\dfrac{{\sigma }^{2}}{n}\right).$

(7)

因此，通过叠加连续时间上的n个样本，我们可以降低噪声的方差，从而抑制环境噪声. 然而，目前还没有工作验证以WDC信道作为参考信道构建的CSI信号中环境噪声的正态性. 由于式（6）的结果是近似推导得到的，我们需要进一步验证这样的结果是否正确.

为了说明环境噪声的特性，我们需要将环境噪声从CSI信号中分离出来. 具体步骤为：首先，在静态环境下收集不含动态分量的CSI：

${H}_{\mathrm{s}\mathrm{t}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}\left(f,t\right)=\dfrac{{H}_{\mathrm{s}}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}+\dfrac{\varepsilon \left(f,t\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}\text{，}$

(8)

其中 ${H}_{\mathrm{s}}\left(f\right)$ 的取值在整个过程均为定值. 因此我们可以收集足够数量的 ${H}_{\mathrm{s}\mathrm{t}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}\left(f,t\right)$ 数据，并计算其平均值，如式（9）所示.

$\begin{split} E\left(f,t\right)= & \dfrac{1}{T}\sum _{t=1}^{T}{H}_{\mathrm{s}\mathrm{t}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}\left(f,t\right) =\dfrac{1}{T}\sum _{t=1}^{T}\dfrac{{H}_{\mathrm{s}}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}+ \\ &\dfrac{1}{T}\sum _{t=1}^{T}\dfrac{\varepsilon \left(f,t\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)} =\dfrac{{H}_{\mathrm{s}}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}\text{，} \end{split}$

(9)

其中T表示数据总量. 由于环境噪声的期望为0，因此噪声项可以被去除. 然后，我们从 ${H}_{\mathrm{s}\mathrm{t}\mathrm{a}\mathrm{t}\mathrm{i}c}\left(f,t\right)$ 中减去 $E\left(f,t\right)$ 以消除静态分量，结果可以表示为

${\tilde {H}\left(f,t\right)=H}_{\mathrm{s}\mathrm{t}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}\left(f,t\right)-E(f,t)=\dfrac{\varepsilon \left(f,t\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}.$

(10)

经过上述方法处理，我们就能从原始信号中分离出环境噪声. 由于CSI是一个复数，由实部和虚部组成，因此我们分别验证了 $\tilde {H}\left(f,t\right)$ 中实部和虚部环境噪声的正态性并绘制了经过归一化的分位数-分位数（quantile-quantile，Q-Q）图. 结果如图4所示，2部分的Q-Q图与标准正态分布近似为一条直线，因此可以认为以WDC信道作为参考信道构建的CSI信号中的环境噪声符合正态分布.

图 4 环境噪声的统计特性

Figure 4. The statistical characteristics of environmental noise

下载: 全尺寸图片幻灯片

在验证了正态性后，我们就能通过叠加样本的方法消除环境噪声. 由式（7）可知，消除环境噪声的效果与叠加样本的数量正相关. 因此，一种简单的思路是通过提高采样率来获得更多数据，从而更好地实现噪声消除效果. 然而，在FDRadio中由于需要合并信道，收发端设备同步信道切换过程需要一定的时间，因此信号的采样率受限，最高只能达到40 Hz. 此外，在ExRadio^[17]中的研究已经证明，对不同信道的单轮扫频需要在100 ms内完成才能保证数据间的相关性，即采样率至少需要10 Hz. 因此，仅通过提高采样率的方法难以达到有效消除环境噪声的效果.

受信道切换过程的启发，我们提出了一种2级环境噪声消除方法，该方法结合信道切换过程以及合并信道之后叠加连续时间上的样本来消除环境噪声. 具体来说，信道切换过程中，发送端在当前信道上广播信道切换请求消息，并在定时器（设置为10 ms）到期后切换到下一个信道重复广播该消息. 接收端被动地监听当前信道，一旦接收到消息就立即切换信道. 需要注意的是，信道切换通常可以在3 ms内完成，相较于发送端等待的10 ms，每个信道都有7 ms的空闲时间. 而数据传输可以在100 μs内完成，因此每个信道中有98%的时间是空闲的. 基于这一观察，我们的关键想法在于充分利用这些空闲时间，在7 ms内重复接收数据包并进行叠加. 为了实现这一目标，我们修改了收发端设备，发送端在定时器到期前重复发送数据包，而接收端则会重复接收信息并在切换信道前进行叠加处理，以消除环境噪声的影响.

通过结合上述2种方法，我们能够有效地消除环境噪声. 图5展示了叠加前和叠加后的噪声分布情况，其中蓝色表示叠加前环境噪声的分布，红色表示叠加后环境噪声的分布. 可以观察到，通过我们的方法可以显著降低噪声水平.

图 5 叠加前与叠加后环境噪声的分布

Figure 5. Distribution of environmental noise before and after superposition

下载: 全尺寸图片幻灯片

3.3 基于空间分集的动态反射信号功率增强

在这个模块中，我们基于信号空间分集提高信号的SSNR，通过结合WiFi硬件设备提供的多维度天线信息最大化动态反射信号功率.

在现代无线通信系统中，多输入多输出（multiple-input multiple-output，MIMO）技术被广泛应用于提高信道容量^[45]. 对于一个具有M条发射天线和N条接收天线的MIMO系统，我们可以在一个时间戳中获得 $T=M\times (N-1)$ 个CSI信号. 为了充分利用这些数据，我们希望将不同的CSI信号组合在一起，以增强动态反射信号功率. 然而，不同天线的CSI采样数据在每次启动收发器时都会在锁相环阶段引入不同的初始相位^[46]. 因此，简单组合不同的CSI信号可能会破坏动态反射信号功率. 如图6的例子所示，2个CSI信号组合后，动态分量被抵消.

图 6 将2个信号直接组合可能会导致动态分量抵消

Figure 6. Direct combination of two signals may result in the cancellation of dynamic components

下载: 全尺寸图片幻灯片

为了解决上述问题并实现最优的动态反射信号组合，我们将不同信号的相位进行对齐，并给它们分配不同的权值进行叠加. 具体而言，由于不同天线信号经历的多径效应和动态反射路径存在差异，其中含有不同程度与感知相关的动态信息. 因此，对于含有更多动态信息的天线，我们分配其较高的权值. 通过这种方式，可以更有效地利用多个天线的数据，将动态反射信号的功率最大化. 接下来，我们详细推导这一过程.

首先，我们将T个CSI信号以向量形式表示为

${\boldsymbol H}\left(f,t\right)={\boldsymbol a}\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}+{{\boldsymbol H}}_{\mathrm{s}}\left(f\right) \text{，}$

(11)

其中 ${\boldsymbol H}\left(f,t\right) = {{(\tilde {H}}_{1} \left(f,t\right),{\tilde {H}}_{2}\left(f,t\right),… ,{\tilde {H}}_{T}\left(f,t\right))}^{\mathrm{T}}$ 表示以WDC信道作为参考信道构造的所有CSI信号， ${{\boldsymbol H}}_{\mathrm{s}}\left(f\right)= {\left(\,\dfrac{{H}_{\mathrm{s},1}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)},\,\dfrac{{H}_{\mathrm{s},2}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)},\,… ,\,\dfrac{{H}_{s,t}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}\,\right)}^{\mathrm{T}}$ 表示静态分量， ${\boldsymbol a}\left(f\right)= {\left(\dfrac{{a}_{1}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)},\dfrac{{a}_{2}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)},… ,\dfrac{{a}_{t}\left(f\right)}{{H}_{\mathrm{s},\mathrm{w}\mathrm{d}\mathrm{c}}\left(f\right)}\right)}^{\mathrm{T}}$ 表示动态反射信号的复系数. 需要注意的是，在3.3节中，我们已经可以较大程度地消除环境噪声，因此，在这里我们可以忽略环境噪声的影响.

设 ${\boldsymbol W}=({w}_{1},{w}_{2},… {,w}_{T})$ 表示不同天线的归一化复权值，即 ${\left|\right|{\boldsymbol W}\left|\right|}_{2}=1$ . 因此，组合后的信号可表示为：

${H}_{\mathrm{c}\mathrm{o}\mathrm{m}\mathrm{b}}\left(f,t\right)={\boldsymbol W}{\boldsymbol H}\left(f,t\right) ={\boldsymbol W}{\boldsymbol a}\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}+{\boldsymbol W}{{\boldsymbol H}}_{\rm s}\left(f\right).$

(12)

根据式（5），组合后的动态反射信号功率为：

$\begin{split} {P}_{\mathrm{d}\mathrm{y}\mathrm{m}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}=& E\left({\big|{\boldsymbol W}{\boldsymbol a}\left(f\right){\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}\big|}^{2}\right) =\\ & {\left|{\boldsymbol W}{\boldsymbol a}\left(f\right)\right|}^{2}E\left({\big|{\mathrm{e}}^{-\mathrm{j}2\mathrm{\pi }\tfrac{d\left(t\right)}{{\mathrm{\lambda }}_{f}}}\big|}^{2}\right) ={\left|{\boldsymbol W}{\boldsymbol a}\right(f\left)\right|}^{2}\text{，} \end{split}$

(13)

其中E为期望值. 根据柯西-施瓦茨不等式^[47]

${\left|{\boldsymbol W}{\boldsymbol a}\right(f\left)\right|}^{2}\le {\left|\right|{\boldsymbol W}\left|\right|}_{2}^{2}\times {\left|\right|{\boldsymbol a}\left(f\right)\left|\right|}_{2}^{2} \text{，}$

(14)

当且仅当W和 $\boldsymbol a^*(f)$ 线性相关，即 ${\boldsymbol W}=m{{\boldsymbol a}}^{*}\left(f\right)$ 时，式（14）成立. 其中*表示共轭运算.

结合式（13）与式（14），可以得到动态反射信号功率的最大值：

$\mathrm{m}\mathrm{a}\mathrm{x}\left({P}_{\mathrm{d}\mathrm{y}\mathrm{m}\mathrm{a}\mathrm{t}\mathrm{i}\mathrm{c}}\right)=\sum _{i=1}^{T}{\left|{a}_{i}\right(f\left)\right|}^{2}.$

(15)

显然，组合信号中动态反射功率的最大值是所有CSI信号的动态反射信号功率之和. 通过对不同CSI号的合理组合，我们可以最大化动态反射信号功率.

接下来，我们介绍如何计算不同信号的最优组合权值. 由于 ${\left|\right|{\boldsymbol W}\left|\right|}_{2}=1$ ，我们可以得到 $\left|m\right|=\dfrac{1}{{\left|\left|{a}^{*}\left(f\right)\right|\right|}_{2}}$ . 因此，使组合信号的动态反射功率最优的权值可以表示为：

${W}_{i}={\mathrm{e}}^{\mathrm{j}{\theta }_{\mathrm{r}\mathrm{e}\mathrm{f}}}\dfrac{{a}_{i}^{*}\left(f\right)}{\sqrt{\displaystyle\sum _{i=1}^{T}{\left|{a}_{i}^{*}\right(f\left)\right|}^{2}}}\text{，}$

(16)

其中 ${W}_{i}$ 为最优权值向量W中的第i个元素， ${\theta }_{\mathrm{r}\mathrm{e}\mathrm{f}}$ 是参考相位，可以取任意实数.

基于式（16），我们只要知道每个天线上的动态反射信号的复系数 ${a}_{i}\left(f\right)$ ，就可以计算出构造组合的最优权值. 然而，从CSI中直接获取 ${a}_{i}\left(f\right)$ 是困难的，因为CSI不仅包含动态反射信号，还包含静态物体反射的静态分量. 幸运的是，在3.2节中，我们已经介绍了消除静态分量的方法，因此我们可以从获取的CSI中估计组合不同天线信号的最优权值.

3.4 PDP谱图生成与呼吸多径选择

在这个模块中，我们将经过上述方法处理后得到的CSI转化为时域PDP，从而在多径信号中识别呼吸诱导多径. 为了获得PDP的P(t)，要将CSI通过逆快速傅里叶变换（inverse fast Fourier transform，IFFT）转换为信道冲击响应C(t)，并进一步计算 ${\left|C\left(t\right)\right|}^{2}$ 获得^[48]，计算过程可表示为：

$P\left(t\right)={\left|C\left(t\right)\right|}^{2}=\sum _{i=1}^{L}{\left|{a}_{i}\right|}^{2}\delta \left(t-{t}_{i}\right)\text{，}$

(17)

其中 ${a}_{i}$ 和 ${t}_{i}$ 分别表示第i条路径的振幅和信号传播时延， $\delta \left(t\right)$ 表示狄拉克函数. 由于不同国家的规定，5 GHz频段上可用的信道是不均匀且不连续的. 由于IFFT只适用于均匀间隔的频率测量，因此在合并信道中简单地采用IFFT将来自不同可用信道的CSI转换为PDP是不可行的. 因此，在FDRadio中，我们采用最小二乘（least square，LS）法来计算PDP，该方法适用于非均匀间隔的信道. 由式（17）可知，不同时延下的信号强度可通过计算 ${\left|{a}_{i}\right|}^{2}$ 获得. 设H表示合并信道，我们可以将问题转化为

$\underset{{\boldsymbol a}}{\mathrm{arg}\,\,\mathrm{min}}{\left|\right|{\boldsymbol H}-{\boldsymbol F}{\boldsymbol a}\left|\right|}^{2}\text{，}$

(18)

其中F是傅里叶矩阵， ${\boldsymbol a}$ 表示我们试图找到的PDP. 其目标是寻找一个PDP的最优解，它可以最小化 ${\boldsymbol a}$ 的傅里叶变换和合并信道之间的差异. 对 ${\boldsymbol a}$ 的求解实际上是一个复数域下的LS问题，刘志平等人^[49]已经给出了解决方法.

在获得PDP后，下一步我们需要在PDP的不同时延信号中找到对应于目标的呼吸多径. 根据呼吸到达信号呈周期性变化，而干扰信号呈随机变化的特点，我们可以基于不同时延处信号强度变化的周期性来识别呼吸诱导多径.

在FDRadio中，我们采用FarSense^[38]中提出的呼吸信噪比（breathing-to-noise ratio，BNR）来衡量信号的周期性，其定义为呼吸能量与总能量的比值. BNR的计算过程如下：首先将窗口长度设置为30 s（对应300个样本）. 为了提高频率分辨率，通过零填充法将样本数据长度扩大为1 024. 然后，我们对填充后的数据进行快速傅里叶变换（fast Fourier transform，FFT），得到对应不同频率点的能量值. 由于正常人的呼吸频率为10~37 bpm，相应的频率范围为0.166 7~0.616 7 Hz，因此，我们在这个范围内寻找具有最大能量的FFT频率点. 最后，我们将该频率点的能量除以所有频率点的能量和，这样就可以得到BNR的值. 通过计算所有时延处信号的BNR，我们选择BNR值最高的信号作为呼吸诱导多径并进一步通过频谱分析来计算呼吸率.

4. 实验与分析

在本节中，我们将介绍FDRadio的硬件设置与实验场景，并进行全面的实验来评估FDRadio的性能.

4.1 实验设置

如图7（a）所示，我们使用2个安装了Intel 5300网卡的i.MX6Q开发板作为收发设备实现了FDRadio. 该开发板配备了一个4核的NXP A9处理器和一个2 GB DDR3存储器. 图7（b）展示了我们的硬件设置，其中发射器发出的射频信号经过功率放大器放大后输入到一个2路射频功分器，该功分器分别连接到无线信道以及接收端的1号端口组成WDC信道. 为了避免信号过饱和影响检测精度，我们在WDC信道中插入一个额外的信号衰减器. 通过对不同规格的功率放大器以及衰减器进行组合测试，我们选择17 dB的功率放大器和60 dB的衰减器作为我们的实验配置.

图 7 实验设备介绍

Figure 7. Introduction of experimental equipments

下载: 全尺寸图片幻灯片

在数据收集过程，若WiFi运行在AP模式下，信道切换至少要15 ms，难以保证不同信道间数据的相关性^[14]，因此，我们将发射器和接收器配置在Monitor模式下. 在该模式下，通过对nl80211网络接口重新编程，40 MHz信道切换可以在3 ms内完成^[17]. 我们设置信道合并的时间为25 ms，并在信道合并后叠加连续时间上的4个样本. 接收数据通过TCP连接传输到联想笔记本电脑上，并使用Matlab进行处理.

我们在如图8（a）的会议室中模拟了3种不同的动态场景进行相关实验，以评估FDRadio的性能，如图8（b）~（d）所示.

图 8 实验环境与场景介绍

Figure 8. Experimental environment and scene introduction

下载: 全尺寸图片幻灯片

1）场景1. 如图8（b）所示，环境中存在一个干扰人员，干扰人员沿着外围2 m×1 m的虚线方形轨迹移动.

2）场景2. 如图8（c）所示，环境中存在一个干扰人员，干扰人员的行走轨迹始终在实验人员的身后并保持1 m及以上距离.

3）场景3. 如图8（d）所示，环境中同时存在2个干扰人员，干扰人员1始终沿着1 m×2 m的方形轨迹移动，干扰人员2的行走轨迹与场景2一致.

其中场景1与场景2只存在单一干扰人员，我们将其视为“低动态场景”. 而场景3中存在多个干扰人员，在该场景中的动态干扰更为复杂，因此将其视为“高动态场景”. 为了充分评估FDRadio的性能，我们邀请了6名志愿者参与实验，每位志愿者分别在上述3种场景中进行呼吸测试. 实验过程中，收发设备间的距离设置为2 m，干扰人员按指定的路径移动. 而待检测人员坐在椅子上，面朝收发设备，在节拍器APP的帮助下有意识地控制呼吸频率，以获得真实的呼吸数据. 在每个场景中，我们以1 m的步长分别测试了将检测距离从1 m增加到7 m的检测误差，其中检测距离定义为待检测人员与收发设备视距（line of sight，LOS）中点的距离，检测误差为真实呼吸率与检测结果之间的差值.

4.2 系统综合性能评估

我们将FDRadio与2种最先进的基于WiFi的呼吸监测方法进行了比较. 其中FarSense^[38]利用2个天线之间的CSI比值信号进行感知，结合CSI比值的幅值和相位信息提取呼吸模式，然后融合多个子载波的自相关结果来估计呼吸率. 而ExRadio^[17]采用合并信道的方法扩展信道带宽，并通过滑动均值滤波去除噪声，最后使用PDP估计呼吸率.

我们以节拍器APP的数值为基准值，图9（a）（b）分别展示了3种方法在低动态场景中不同检测距离的检测误差. 我们可以观察到，在2种不同的低动态场景中，即使检测距离为7 m，FDRadio均能以小于0.5 bpm的误差准确识别受试者的呼吸率. 相比之下，尽管FarSense在静态环境中表现良好，但受限于WiFi单信道的信道带宽，FarSense无法消除非目标人员的干扰，这导致了超过2 bpm的检测误差. 而ExRadio也是通过合并多个WiFi信道扩展信道带宽以适应动态场景，因此在低动态场景中，当检测距离小于3 m时，ExRadio的感知精度与FDRadio相近. 然而，当检测距离大于3 m时，由于环境噪声的影响以及动态反射信号功率的衰减，ExRadio的检测误差超过1 bpm，而FDRadio的检测误差始终小于0.3 bpm. 需要注意的是，相较于场景1，FDRadio在场景2的识别精度更高，这是因为在场景1中，来自目标呼吸的信号反射路径长度与非目标运动的信号反射路径长度并不是时刻大于1.5 m的，这导致在某些时刻，二者的反射信号互相叠加在PDP的同一个时延信号中，影响实验结果. 我们进一步地在具有挑战性的高动态场景即场景3中进行实验，由于FarSense不适用于动态场景，因此我们不再对比该方法. 结果如图10所示.

图 9 低动态场景下不同方法的检测误差

Figure 9. Detection errors of different methods in low dynamic scenes

下载: 全尺寸图片幻灯片

图 10 高动态场景中不同检测距离的检测误差

Figure 10. Detection errors at different detection distances in high dynamic scenes

下载: 全尺寸图片幻灯片

图10显示，在高动态场景中，ExRadio仅能在1 m内识别目标的呼吸率，这可能是因为在复杂的高动态场景中，信号的多径效应更加显著，环境噪声随之增大，当检测距离增大时，来自目标的发射信号被环境噪声淹没，无法用于有效感知. 而FDRadio依然能够以小于0.5 bpm的检测误差准确识别目标的呼吸率.

综上所述，FDRadio在不同的场景中，均能在7 m内有效监测当前目标的呼吸率，足以满足真实的日常家居环境.

4.3 FDRadio的实时性能

为了说明FDRadio在边缘计算设备的实时性能，我们在嵌入式设备i.MX6Q上分别测量了FDRadio主要步骤的平均执行时间，包括硬件噪声消除（S₁）、2级消除环境噪声（S₂）、初始相位对齐与组合（S₃）、PDP谱图生成（S₄）以及呼吸多径识别与呼吸速率估计（S₅）.

实验结果如表1所示，在步骤S₁中，由于使用WDC信道作为参考信道消除硬件相关噪声，FDRadio无需传输任何额外的数据包，计算复杂度为O(Kn₁)，平均执行时间为27 ms. 其中，K为合并信道数量，n₁为每个信道的子载波数. 在步骤S₂中的执行时间包括在信道切换过程与合并信道后叠加连续时间上的样本时间，其中在信道切换过程中的执行时间包含在信道合并中. 因此，我们只关注合并信道后的执行时间，其计算复杂度为O(n₂)，平均执行时间仅为0.11 ms，其中n₂表示叠加样本的数量. 根据3.3节所述可知，步骤S₃的执行时间主要用于计算不同天线上的动态反射信号的复系数 ${a}_{i}\left(f\right)$ ，其平均执行时间为61.6 ms. 在步骤S₄中，FDRadio使用LS算法求解PDP，相较于传统的IFFT算法运行速度略慢，平均执行时间为7.74 ms，但其计算准确度高于IFFT.

表 1 FDRadio的实时性能

Table 1. Real-Time Performance of FDRadio ms

步骤	S₁	S₂	S₃	S₄	S₅
执行时间	26.98	0.11	61.62	7.74	70.8

下载: 导出CSV

| 显示表格

综上所述，FDRadio在边缘计算设备上表现出色，单次呼吸检测的平均执行时间仅为167.25 ms，对于正常的10~37 bpm呼吸率，能够满足实现检测呼吸的需求.

4.4 2级去噪算法的有效性验证

为了进一步验证2级消除环境噪声方法的有效性，我们分别对比了3种常用的去噪方法：小波变化、自适应滤波与移动平均滤波在不同距离下去除环境噪声的效果. 实验过程中2位志愿者（1男1女）处于如图8（b）所示的场景中，面向收发设备并静坐在椅子上，其中收发设备间的距离设置为2 m，志愿者分别在距离收发器2 m以及5 m处节拍器APP的帮助下匀速呼吸，接着通过不同的去噪方法从包含噪声的CSI中恢复呼吸模式. 需要说明的是，在应用不同去噪算法前，我们首先基于WDC信道去除硬件相关噪声，保证后续的数据中仅包含环境噪声.

去噪结果如图11所示，当志愿者与收发设备的距离为2 m时，自适应滤波与移动平均滤波均拥有良好的性能，而小波变化在去除噪声的同时丢失了呼吸信号的细节信息，平均检测误差超过0.5 bpm. 当志愿者与收发设备的距离增加到5 m时动态分量降低，环境噪声掩盖了由呼吸引起的信号变化，3种常用的去噪方法在这种情况下均难以有效去除环境噪声，平均检测误差超过1 bpm. 而本文提出的2级去除环境噪声的算法在上述2种情况下均能在去除环境噪声的同时，有效保留原有的呼吸模式，在2种距离下的检测误差均小于0.5 bpm，具有良好的鲁棒性.

图 11 常用去噪方法效果对比

Figure 11. Effective comparison of denoising methods

下载: 全尺寸图片幻灯片

4.5 不同因素对性能的影响

本节中，我们探讨了不同因素对FDRadio性能的影响.

1）收发设备LOS距离的影响. 我们在场景2中研究FDRadio在不同LOS距离下的性能. 实验过程中，将收发设备的LOS距离从1 m逐渐增加到3 m，步长设置为0.5 m. 结果如表2所示.

表 2 LOS距离对检测误差的影响

Table 2. Impact of LOS Distance on Detection Error

LOS距离/m	1	1.5	2	2.5	3
检测误差/bpm	0.32	0.26	0.23	0.22	0.35

下载: 导出CSV

| 显示表格

从表2中可以观察到，对于不同的LOS距离，FDRadio始终能够在3 m的距离内保持低于0.4 bpm的检测误差.

2）组合天线数量的影响. 为了进一步研究组合不同数量的CSI信号对FDRadio性能的影响，我们在上述3种不同的场景中分别测试了具有1×3，2×3，3×3配置的天线组合下的性能.

图12显示了在不同天线配置下的检测误差. 当采用1×3的天线配置时，可以得到2组CSI信号用于组合. 在这种情况下，FDRadio在场景1与场景2中的检测误差为0.6 bpm，而在场景3中约为0.8 bpm. 随着使用天线数量的增多，可供组合的CSI信号也随之增多，导致检测误差逐渐降低. 这是因为更多数量的CSI信号组合可以更有效地增强较弱的动态反射信号功率，从而显著提高检测的准确性.

图 12 不同场景下不同天线配置的检测误差

Figure 12. Detection errors with different antenna configurations in different scenarios

下载: 全尺寸图片幻灯片

3）不同夹角的影响. 为了进一步验证FDRadio的鲁棒性，我们测试了用户与收发设备成不同夹角时FDRadio的检测误差. 如图13（a）（b）所示实验场景，志愿者P₁~P₄在距收发设备2 m处分别面向收发设备并与收发设备成30°与45°夹角，实验过程中，志愿者在节拍器APP的帮助下匀速呼吸，干扰人员在收发设备的另一侧1 m外沿1 m×3 m的矩形轨迹运动.

图 13 收发设备与用户成不同夹角

Figure 13. Sending and receiving equipment is at different angles from the volunteers

下载: 全尺寸图片幻灯片

实验结果如表3所示，当志愿者与收发设备成一定夹角时，FDRadio的性能略有下降. 在志愿者与收发设备成30°夹角时，平均检测误差为0.41 bpm，在志愿者与收发设备成45°夹角时，平均检测误差为0.355 bpm. 其原因是当志愿者与收发设备之间存在夹角时，信号传播路径增加，产生多径效应，导致信号的相位偏移；此外，随着夹角的增大，收发设备用于接收信号反射的胸腔位移也会发生变化，由于接收到的信号变化取决于胸腔位移的大小，因此在这个过程中感知精度会逐渐降低.

表 3 不同位置的检测误差

Table 3. Detection Error at Different Locations bpm

位置	P₁	P₂	P₃	P₄
检测误差	0.43	0.39	0.33	0.38

下载: 导出CSV

| 显示表格

4）干扰变化的影响. 本文中合并信道的带宽为195 MHz，这意味在PDP中SR为1.538 m，反射路径长度差超过SR的不同路径信号将分布在不同时延的信号中. 为此，我们研究了当干扰信号与目标的呼吸信号的反射路径长度差小于SR时对呼吸感知的影响. 如图8（b）所示，我们改变了场景1中干扰人员的移动轨迹，干扰人员沿中心1 m×1 m的方形移动，待检测人员则在2 m外的位置呼吸，此时二者的信号反射路径长度差几乎都小于1.538 m.

实验结果表明，FDRadio的性能在该情况下严重下降，检测误差达到了1.4 bpm. 这说明尽管FDRadio可以提高信号的感知能力，但在动态场景中分离不同路径的反射信号仍然依赖于信道的带宽.

5）环境变化的影响. 我们研究了环境变化对FDRadio性能的影响. 我们在场景2中进行实验，在每次实验中随机移动场景中的若干条椅子，以改变室内的静态分量. 我们一共设计了10种不同的情况进行测试，并测量了检测误差的差值. 实验结果显示，这10种情况的检测误差差值在±0.1 bpm以内，说明环境变化对FDRadio的性能影响不显著.

5. 总　　结

本文通过理论推导以及一系列实验，验证了FDRadio在动态场景中扩大监测范围的有效性. 在FDRadio中，我们首先通过信道合并提高WiFi感知的分辨率，有效消除其他动态运动的干扰. 在此基础上，利用时间分集在信道切换过程中以及合并信道后2次叠加连续时间上的样本，消除环境噪声. 最后，经过理论推导，我们设计并实现了一种权值分配算法，通过对齐不同CSI的相位，并加权结合不同的CSI比值信号以最大化动态反射信号功率. 即在消除干扰的同时尽量提高CSI中有效分量所占的比重. 实验表明FDRadio即使在高动态场景中，也能以小于0.5 bpm的检测误差识别7 m以内的呼吸信号，具有良好的呼吸率检测精度和鲁棒性.

本文的研究虽然极大程度地缩短了干扰人员与待监测人员之间的距离要求，但仍然需要确保干扰人员与待监测人员保持一定的距离，未来我们将进一步尝试利用802.11 ax中定义80 MHz大带宽信道，以此提高WiFi感知过程中的空间分辨率，从而降低非监测目标运动带来的影响.

作者贡献声明：林逸群负责设计实验方案，完成实验并撰写论文；邱杰凡提出了论文的思路并对论文修改审核；周克众和方凯协助完成部分实验；张锦鸿负责前期的调研工作；刘晓莹和池凯凯提出方法改进意见.

图 1 1维子空间上的线性区域数

Figure 1. Number of linear regions on a 1-dimensional subspace

下载: 全尺寸图片幻灯片

图 2 学习实值神经网络的测试损失

Figure 2. Test loss of learning a real-valued neural network

下载: 全尺寸图片幻灯片

图 3 学习四元数神经网络的测试损失

Figure 3. Test loss of learning quaternion-value neural network

下载: 全尺寸图片幻灯片

参考文献(34)

[1]	Oyama K, Hirose A. Phasor quaternion neural networks for singular point compensation in polarimetric-interferometric synthetic aperture radar[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 57(5): 2510−2519
[2]	Parcollet T, Morchid M, Linares G. Deep quaternion neural networks for spoken language understanding [C] //Proc of the 2017 IEEE Automatic Speech Recognition and Understanding Workshop. Piscataway, NJ: IEEE, 2017: 504−511
[3]	武越,苑咏哲,岳铭煜,等. 点云配准中多维度信息融合的特征挖掘方法[J]. 计算机研究与发展,2022,59(8):1732−1741 Wu Yue, Yuan Yongzhe, Yue Mingyu, et al. Feature mining method of multi-dimensional information fusion in point cloud registration[J]. Journal of Computer Research and Development, 2022, 59(8): 1732−1741 (in Chinese)
[4]	Bayro-Corrochano E, Lechuga-Gutiérrez L, Garza-Burgos M. Geometric techniques for robotics and HMI: Interpolation and haptics in conformal geometric algebra and control using quaternion spike neural networks[J]. Robotics and Autonomous Systems, 2018, 104: 72−84 doi: 10.1016/j.robot.2018.02.015
[5]	Parcollet T, Ravanelli M, Morchid M, et al. Quaternion recurrent neural networks [C/OL] //Proc of the 7th Int Conf on Learning Representations. 2019 [2024-07-14]. https://openreview.net/pdf?id=ByMHvs0cFQ
[6]	Shoemake K. Animating rotation with quaternion curves [C] //Proc of the 12th Annual Conf on Computer Graphics and Interactive Techniques. New York: ACM, 1985: 245−254
[7]	Parcollet T, Morchid M, Linarès G. A survey of quaternion neural networks[J]. Artificial Intelligence Review, 2020, 53(4): 2957−2982 doi: 10.1007/s10462-019-09752-1
[8]	Arena P, Fortuna L, Muscato G, et al. Multilayer perceptrons to approximate quaternion valued functions[J]. Neural Networks, 1997, 10(2): 335−342 doi: 10.1016/S0893-6080(96)00048-2
[9]	Valle M E, Vital W L, Vieira G. Universal approximation theorem for vector- and hypercomplex-valued neural networks [J]. arXiv preprint, arXiv: 2401.02277, 2014
[10]	Ujang B C, Took C C, Mandic D P. Quaternion-valued nonlinear adaptive filtering[J]. IEEE Transactions on Neural Networks, 2011, 22(8): 1193−1206 doi: 10.1109/TNN.2011.2157358
[11]	Cybenko G. Approximation by superpositions of a sigmoidal function[J]. Mathematics of Control, Signals and Systems, 1989, 2(4): 303−314 doi: 10.1007/BF02551274
[12]	Funahashi K I. On the approximate realization of continuous mappings by neural networks[J]. Neural Networks, 1989, 2(3): 183−192 doi: 10.1016/0893-6080(89)90003-8
[13]	Hornik K, Stinchcombe M, White H. Multilayer feedforward networks are universal approximators[J]. Neural Networks, 1989, 2(5): 359−366 doi: 10.1016/0893-6080(89)90020-8
[14]	Leshno M, Lin V Y, Pinkus A, et al. Multilayer feedforward networks with a nonpolynomial activation function can approximate any function[J]. Neural Networks, 1993, 6(6): 861−867 doi: 10.1016/S0893-6080(05)80131-5
[15]	Seidl D R, Lorenz R D. A structure by which a recurrent neural network can approximate a nonlinear dynamic system [C] //Proc of the 1991 Int Joint Conf on Neural Networks. Piscataway, NJ: IEEE, 1991: 709−714
[16]	Funahashi K I, Nakamura Y. Approximation of dynamical systems by continuous time recurrent neural networks[J]. Neural Networks, 1993, 6(6): 801−806 doi: 10.1016/S0893-6080(05)80125-X
[17]	Chow T W, Li Xiaodong. Modeling of continuous time dynamical systems with input by recurrent neural networks[J]. IEEE Transactions on Circuits and Systems I: Fundamental Theory and Applications, 2000, 47(4): 575−578 doi: 10.1109/81.841860
[18]	Li Xiaodong, Ho J K, Chow T W. Approximation of dynamical time-variant systems by continuous-time recurrent neural networks[J]. IEEE Transactions on Circuits and Systems II: Express Briefs, 2005, 52(10): 656−660 doi: 10.1109/TCSII.2005.852006
[19]	Schäfer A M, Zimmermann H G. Recurrent neural networks are universal approximators [C] //Proc of the 16th Int Conf of Artificial Neural Networks. Berlin: Springer, 2006: 632−640
[20]	Zhou Dingxuan. Universality of deep convolutional neural networks[J]. Applied and Computational Harmonic Analysis, 2020, 48(2): 787−794 doi: 10.1016/j.acha.2019.06.004
[21]	Arena P, Fortuna L, Re R, et al. On the capability of neural networks with complex neurons in complex valued functions approximation [C] //Proc of the 1993 IEEE Int Symp on Circuits and Systems. Piscataway, NJ: IEEE, 1993: 2168−2171
[22]	Voigtlaender F. The universal approximation theorem for complex-valued neural networks[J]. Applied and Computational Harmonic Analysis, 2023, 64: 33−61 doi: 10.1016/j.acha.2022.12.002
[23]	Barron A R. Approximation and estimation bounds for artificial neural networks[J]. Machine Learning, 1994, 14(1): 115−133
[24]	Arora R, Basu A, Mianjy P, et al. Understanding deep neural networks with rectified linear units [C/OL] //Proc of the 6th Int Conf on Learning Representations. 2018 [2024-07-14]. https://openreview.net/pdf?id=B1J_rgWRW
[25]	Montufar G F, Pascanu R, Cho K, et al. On the number of linear regions of deep neural networks [C] //Advances in Neural Information Processing Systems 27. Cambridge, MA: MIT, 2014: 2924−2932
[26]	Goujon A, Etemadi A, Unser M. On the number of regions of piecewise linear neural networks[J]. Journal of Computational and Applied Mathematics, 2024, 441: 115667 doi: 10.1016/j.cam.2023.115667
[27]	Eldan R, Shamir O. The power of depth for feedforward neural networks [C] //Proc of the 29th Conf on Learning Theory. NewYork: PMLR, 2016: 907−940
[28]	Telgarsky M. Benefits of depth in neural networks [C] //Proc of the 29th Conf on Learning Theory. New York: PMLR, 2016: 1517−1539
[29]	Zhang Shaoqun, Gao Wei, Zhou Zhihua. Towards understanding theoretical advantages of complex-reaction networks[J]. Neural Networks, 2022, 151: 80−93 doi: 10.1016/j.neunet.2022.03.024
[30]	Wu Jinhui, Zhang Shaoqun, Jiang Yuan, et al. Theoretical exploration of flexible transmitter model[J]. IEEE Transactions on Neural Networks and Learning Systems, 2023, 35(3): 3674−3688
[31]	Fukushima K. Visual feature extraction by a multilayered network of analog threshold elements[J]. IEEE Transactions on Systems Science and Cybernetics, 1969, 5(4): 322−333 doi: 10.1109/TSSC.1969.300225
[32]	Maas A L, Hannun A Y, Ng A Y. Rectifier nonlinearities improve neural network acoustic models [C/OL] //Proc of the 2013 ICML Workshop on Deep Learning for Audio, Speech, and Language Processing. 2013 [2024-07-15]. http://robotics.stanford.edu/~amaas/papers/relu_hybrid_icml2013_final.pdf
[33]	He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification [C] //Proc of the 2015 IEEE Int Conf on Computer Vision. Piscataway , NJ: IEEE, 2015: 1026−1034
[34]	Zaslavsky T. Facing up to Arrangements: Face-count Formulas for Partitions of Space by Hyperplanes [M]. Providence, RI: American Mathematical Society, 1975