基于能量采集的分布式时分多址协议

徐 娟 张 茸 阚佳丽 张 妍

(同济大学电子与信息工程学院 上海 201804)

摘 要 纳米节点利用太赫兹通信能获得极高的传输速率,节点间的通信以及协调访问太赫兹信道都需要媒质接入控制(medium access control, MAC)协议.由于太赫兹信道的分子吸收噪声和纳米设备资源受限等特性,经典的MAC协议已不再适用.针对基于时域扩展开关键控(time spread on-off keying, TS-OOK)的太赫兹传感器网络的数据传输存在连续碰撞的问题以及纳米节点能量非常有限的问题,提出一种基于能量采集的分布式时分多址协议(distributed energy harvesting-based time division multiple access, DEH-TDMA).该协议引入压电式纳米能量采集系统,首先将纳米节点剩余能量和缓存区的数据包数量作为状态信息构建Markov决策过程模型,并根据节点的数据包传输量和能耗来设计收益函数,然后求解出最优策略,最终纳米节点根据自身状态和最优策略动态接入信道.仿真结果表明该协议在延长网络生命周期方面存在优势.

关键词 纳米网;太赫兹带;媒质接入控制;时分多址;能量采集

纳米技术的快速发展使得制造纳米级的传感器[1-2]变得实际可行,相比于传统的无线传感器网络(wireless sensor networks, WSNs),纳米传感器节点不仅尺寸微小而且具有纳米级的感知、存储、计算和通信能力.无线纳米传感器网络[3](wireless nano-sensor networks, WNSNs)正是一种将多个纳米设备以无线通信方式连接起来的新型传感器网络.网络中的纳米节点通过协作通信的方式执行感知任务,共享感知到的信息[4-5].目前无线纳米传感网在生物医学、环境监测以及军事防御等领域都具有巨大的应用前景,因此它成为了新的研究热点.

随着无线通信技术和信息化社会的快速发展,低频段的频谱资源已无法满足人们对超高速数据传输速率的要求,在这一趋势下太赫兹(THz)通信[6-10]的出现可以缓解频谱稀缺和现代无线系统传输容量的局限性.太赫兹波是介于毫米波与远红外光之间的电磁波,其频率范围是0.1~10THz.太赫兹带具有很宽的可用带宽,并且可以提供10 Gbps甚至更高的数据传输速率,但是太赫兹波在空气中传播时存在较严重的大气衰减[6],因此太赫兹通信被视为可以满足短距离超高速无线通信的关键技术.太赫兹无线通信具有很多微波通信和光通信所没有的独特优势,比如波束窄、方向性极强,可用于目标探测以及精确定位[7];极短的波长使其天线和收发系统的尺寸更小、更经济[8].使用新型纳米材料——石墨烯[11-13]制造的纳米天线和纳米收发机可工作在太赫兹带,因此太赫兹无线通信技术成为WNSNs物理层的理想选择.

文献[13]对基于时域扩展开关键控(time spread on-off keying, TS-OOK)的太赫兹纳米网中存在的数据碰撞问题进行了研究,研究表明由于分子吸收噪声和接收节点能量的波动,导致数据在传输过程中会发生连续性的碰撞,而且这种碰撞是不可避免的,从而大大降低了通信质量.因此需要研究适用于基于TS-OOK的太赫兹纳米传感器网络的媒质接入控制(medium access control, MAC)协议,从而能尽量降低产生数据碰撞的概率.考虑太赫兹信道的特性,传统的无线传感器网的经典MAC协议无法直接应用于WNSNs,因此研究适用于太赫兹纳米传感网的MAC协议是非常有意义的.

1 相关工作

目前国内外已经有学者研究出了一些适用于无线纳米传感器网络的MAC协议.文献[14]提出的物理层感知的MAC协议(a physical layer aware MAC protocol for electromagnetic nanonetworks in the terahertz band, PHLAME)通过纳米收发机共同选择物理层参数的最佳值、减少多用户干扰和降低能耗来保证可靠通信.虽然PHLAME协议在减少能耗和帧延时以及增大吞吐量方面都取得一定成效,但节点间通信仍存在发生连续冲突的问题;Wang等人[15]提出一种基于能量和频谱感知的MAC协议(energy and spectrum-aware MAC protocol for perpetual wireless nanosensor networks in the terahertz band),该协议让纳米节点搭载能量采集系统使网络的生命周期趋于无穷大,同时考虑太赫兹信道拥有很大带宽的特点,采用新的码元压缩调度算法使吞吐量最大化.但该协议只考虑了中心节点控制的集中式网络拓扑结构,尚未分析纳米节点以自组织方式通信的分布式模型;Mohrehkesh等人[16]针对以上2种协议均不能应用于分布式的自组织网络,提出由接收节点控制、基于能量采集的MAC协议(receiver-initiated harvesting-aware MAC for nanonetworks, RIH-MAC).RIH-MAC以节能为主要目标,引入纳米能量采集模型,采用由接收节点控制的通信模型取代传统的握手过程,然而该协议应用于分布式的自组织网络时仍存在隐藏终端问题,且纳米节点采集能量的过程耗时较长,仅适用于延时可容忍的场景;文献[17]提出了TCN-MAC协议(a timing channel-based MAC protocol for energy-efficient nanonetworks),该协议以定时信道为基础,并在定时信道的静默期对信息进行编码,接收机则根据静默期共享的编码映射表重新构建来自发送端的数据.最后通过对理论数值结果进行分析,验证了利用定时信道延长网络生命周期具有可行性,但并未在仿真平台或实际的网络环境中应用并验证该协议;Rikhtegar等人在文献[18]中针对移动多跳的无线纳米传感器网络提出了一种能量高效的MAC协议(energy efficient wireless nano sensor network, EEWNSN),该协议将纳米传感器节点进行分簇后利用时分多址(time division multiple access, TDMA)机制减小节点移动和传输碰撞带来的影响;文献[19]提出了一种负载感知的TDMA协议(load-aware TDMA, LA-TDMA),该协议根据当前网络中源节点的数目、业务量大小以及太赫兹信道的传输特性,在TDMA基础上实现动态分配时隙算法,在平均端到端时延和平均吞吐量方面具有明显的优势,可以应用于时延要求较苛刻的网络场景中,但是该协议并未考虑纳米节点的能耗问题.由于无线纳米传感网中的纳米设备资源受限,纳米电池只能存储有限的电量且多数应用场景中纳米电池难以更换,也无法充电,这是MAC协议设计所面临的挑战之一;能量采集技术作为一种可以为电池持续补充能量的技术手段,在满足系统可持续工作方面具有很重要的意义.由于技术受限,传统的能量采集机制如太阳能、风能或水能无法应用于纳米传感器节点,有学者提出了纳米级的能量采集系统[20],该系统利用ZnO纳米线的压电效应将采集到的振动能、声能以及电磁能转化为电能.

由于在纳米传感器中引入压电式能量采集系统既可以解决节点能量有限的瓶颈问题,又可以延长网络的生存期,因此本文考虑将压电式能量采集系统应用于无线纳米传感网.由于传统WSNs的MAC协议主要以降低节点能耗以及延长网络生存期为目标,而基于能量采集的WNSNs具有能量补充的特性,设计MAC协议时应该考虑在自供电节点永久工作的前提下最大化网络的性能,因此传统WSNs的MAC协议不再适用,需要重新研究基于能量采集的MAC协议.

为了保证网络运行的可持续性并提高系统传输的可靠性,本文提出一种基于能量采集的分布式TDMA协议(distributed energy harvesting-based TDMA, DEH-TDMA),该协议采用基于TDMA的时隙分配方式,并引入压电式纳米能量采集系统以突破节点能量有限的瓶颈.首先从纳米节点的角度,将其缓存区的数据包数量和剩余能量作为状态信息构建Markov决策过程[21](Markov decision process, MDP)模型,其中设计收益函数时将节点的数据包传输量和能耗作为考虑因素,然后离线求解出使整个网络数据包传输量最大化的最优时隙分配策略,最终在WNSNs生命周期趋于无穷大的条件下,纳米节点根据自身状态通过查表的方式获取最佳的信道接入方式.

2 系统模型

常见的WNSNs是由一个处理能力较强的纳米控制节点和多个普通传感器节点组成的单跳星型网络结构.网络中普通的纳米传感器节点负责采集数据,并直接与纳米控制节点进行数据传输,最后控制节点将融合后的数据发送给纳米接口设备.控制节点负责协调、管理普通的纳米节点以及融合纳米节点感知的数据.将算法中的复杂计算交给控制节点处理可弥补普通纳米节点计算能力有限的缺陷,因此本文采用集中式拓扑结构,控制节点和普通纳米节点之间的通信为单跳通信.

2.1 网络模型

DEH-TDMA协议采用基于单跳通信的星型拓扑结构.网络由一个具有较强计算和处理能力的纳米控制节点和若干个普通的纳米节点组成,用图G=(V,E)来表示WNSNs的网络拓扑结构,其中V={v0,v1,…,vn}表示纳米控制节点和所有纳米节点的集合,v0表示纳米控制节点,E表示节点之间单跳链路的集合.

网络模型存在3种假设:

1) 自供电的纳米节点随机分布于监测区域,且纳米节点和控制节点的位置均固定不变.

2) 纳米节点可以感知到自身纳米电池的剩余能量值,所有纳米节点都能够通过压电式能量采集系统从环境中采集到能量,纳米控制节点的能量则不受限;同时纳米节点将感知到的数据放在缓存队列中等待发送.

3) 纳米节点在采集、计算和传输数据的过程中,数据传输是其主要的能耗组成部分,计算能耗时将忽略纳米节点采集数据和计算处理所消耗的能量.

2.2 太赫兹信道容量

由于太赫兹信道存在分子吸收效应,不仅会引起较高的分子吸收损耗,而且数据在太赫兹信道中传输时会引入分子吸收噪声.

分子吸收噪声是太赫兹信道中的主要噪声源,其功率谱密度Na(d,f)可表示为

Na(d,f)=KBT0(1-e-k(f)d),

(1)

其中,KB表示玻尔兹曼常数,T0表示参考温度,k(f)表示分子吸收因子,根据文献[22]可得分子吸收因子为

(2)

其中,ki,g(f)表示在某一介质g中气体分子i的吸收因子.分子吸收因子的取值与介质中分子的组成成分有关,例如标准大气中含有氮分子、氧分子和水分子,不同的分子成分在太赫兹带内具有不同的共振频率,其中水分子对太赫兹波的吸收作用显著.

总的路径损耗Lp(d,f)由太赫兹波在介质中传播时所遭受的损耗和由分子吸收效应引起的损耗这2部分组成,路径损耗Lp(d,f)可以表示为

(3)

其中,fc表示中心频率,c表示真空中的光速,k(f)是分子吸收因子.

2.3 能耗模型

在基于TS-OOK调制的太赫兹通信系统中,纳米节点发送和接收单个数据包所消耗的能量可表示为

Etx(Nbit)=ωNbitEptx,

(4)

(5)

其中,Etx(Nbit),Erx(Nbit)分别表示纳米节点发送、接收长度为Nbit(单位为b)的数据包的能耗;EptxEprx分别表示发射和接收单个脉冲所消耗的能量;ω的取值与编码权重值有关,其表示Nbit数据中出现符号“1”的概率,通常为了使符号“1”和符号“0”等概率出现,设ω=0.5.对于超低功耗的纳米收发机而言,接收能耗Eprx通常被设为发射能耗Eptx值的110[23].本文用文献[24]提供的基于TS-OOK调制的太赫兹信道参数,即当纳米节点的通信范围为0.01 m 时,发射和接收单个脉冲所消耗的能量EptxEprx的取值分别为1 pJ和0.1 pJ.

2.4 能量采集模型

压电式纳米发电机主要由ZnO纳米线阵列、整流电路以及纳米超级电容组成.其主要的能量采集原理是将一些外界能量源如周围环境中的振动或人工产生的超声波转换为电能,具体来讲,环境中的振动会使纳米线周期性地收缩和伸展,每次伸缩过程中纳米线2端将产生正向和反向的电流,经适当整流后给电容充电.若纳米线经过ncr次伸缩之后,此时电容2端的电压值可以表示为关于周期数ncr的函数[22]

(6)

其中,Ucap(ncr)为充电过程中电容2端的电压值,它是一个关于周期数ncr的函数.U表示理想电压源的电压,ncr表示当前纳米线伸缩的周期数,ΔQ表示每个周期能够采集到的电量,Ccap表示纳米超级电容的总容量.通过计算可以得到电容中当前所存储的能量Ecap(ncr):

(7)

于是,根据式(7)可以得到纳米电池存储能量的最大值Emax

(8)

其中,CcapU分别是式(6)中电容的总容量和能量采集装置的电压值.

最终,纳米能量采集装置的采集速率λe

(9)

其中,λe是能量采集的速率,其含义是单位时间内可以获取的能量(Js);fv表示外界能量源的振动频率,也是能量采集装置中纳米线的伸缩频率,其取值与振动类型有关,例如空调冷气的振动频率为50 Hz,心跳的振动频率为1 Hz等.可见由于位置因素以及外界能量源的不同,各纳米节点的能量采集速度将有所差异.对于常见的振动源,其能量采集过程服从泊松分布[23],具体来讲,节点ni在持续时间为tf的1帧内采集的能量数x可用概率分布来描述:

PE(x)=Poisson(harvested energy=x)=

(10)

其中,λe表示式(9)中采集能量的平均到达速率.

2.5 数据包到达过程模型

本文采用泊松过程模型来描述WNSNs节点缓存中数据包的到达模型[25],且到达缓存区的数据包均遵循“先入先出”的排队原则.假设节点ni的数据包平均到达速率为λp,则在持续时间为tf的1帧内到达的数据包个数y服从概率分布:

PD(y)=Poisson(packets arrival=y)=

(11)

3 MDP的模型建立与求解

3.1 Markov决策过程

控制系统的决策者在时刻t观察到系统当前所处的状态,并根据该状态采取一个行动.此时,该行动会对系统运行产生2个影响:1)获得一个即得的收益;2)系统的状态会以与该行动有关的一个概率在时刻t+1转移到一个新的状态,这时决策者需选取时刻t+1的决策.Markov决策过程便是如此一步一步循环下去,不同的只是当前状态可能是一个新状态,而且可采取的行为集合将随着状态变化而改变[21].因此MDP可表示为由状态空间S、决策行为空间A、状态转移概率矩阵T和收益函数R组成的四元组[S,A,T,R],其中用T(sj|si,ak)表示在状态si在时刻t执行行动ak后在下一时刻t+1到达状态sj的概率,用R(si,ak)表示决策者在状态si执行行动ak而获得的收益.

状态转移概率可具体表示为

T(sj|si,ak)=Pr{st+1=sj|st=si,at=ak},
si,sjS,akA,

(12)

且满足:

0≤T(sj|si,ak)≤1,

(13)

由以上分析可知,MDP模型中的收益和状态转移概率并不依赖于过去的历史,而仅仅依赖于当前状态和决策者选取的行动.同样地,在基于能量采集的WNSNs中,纳米节点当前时刻的能量状态以及缓存区的数据包状态只与上一时刻的状态有关,因此符合Markov过程的属性,从而可将Markov决策过程应用于基于能量采集的MAC协议设计中,并且控制节点充当了模型中决策者的角色.

3.2 DEH-TDMA帧结构

本文提出的DEH-TDMA协议,其采用的帧结构如图1所示,其中网络初始化阶段主要用于控制节点与普通节点间的时钟同步和链路建立.每一帧由N个时隙块组成,而每个时隙块则包括T个时隙.其中1帧的长度以及每帧包含的时隙数N×T可由控制节点在时隙调度阶段广播,纳米节点在数据传输阶段根据自身缓存区数据包数量和剩余能量决策对应的信道接入方式.基于该帧的结构,数据传输量较大的源节点可使用各自时隙块的多个时隙发送有效数据给控制节点.具体的过程为:1)为纳米节点接入信道的决策行为构建具体的MDP模型,并采用离线的方式求解出局部最优的策略;2)纳米节点可根据自身实时的状态信息通过查表的方式获取对应的决策结果,进而选择睡眠或占用相应的时隙传输数据.我们将针对DEH-TDMA协议分别在3.3,3.4,3.5,3.6中建立MDP模型的系统状态、决策行为、状态转移概率和收益函数,最终以最大化整个网络的数据传输量为目标,对所建MDP模型求解出与节点状态相对应的决策行为集合.值得一提的是,DEH-TDMA协议只从纳米节点的角度考虑接入信道的行为而不对节点加以区分,因此分析均省略了下标ni.由于一帧持续时间较短,本文对数据传输量和能耗的分析均以帧长为单位,且假设纳米节点只能使用当前缓存的数据包以及剩余的能量,其在本帧期间到达的数据和能量均用于下一帧的传输.

Fig. 1 Frame structure of DEH-TDMA
图1 DEH-TDMA帧结构

单个数据传输时隙的长度tslot可表示为

(14)

其中,i∈{1,2,…,N},diLi分别表示源节点vi的传输距离和所发送数据包的长度,且本文设置所有源节点的数据包长度相同;v为信号的传播速度且本文设置v=3×108ms;max()是求最大值函数;C(di)表示节点vi传输链路的信道容量,表达式为

C(d)=

(15)

其中,C(d)表示传输距离为d 时的太赫兹信道容量;M 表示所有子带的数量;Δfw(d)表示传输距离为d 时不同的传输窗口,即每个子带的可用带宽;S(f)是传输信号的功率谱密度;Na(d,f)是信道中噪声的功率谱密度;LP(d,f)表示路径损耗.

3.3 节点的状态空间

在第f帧中,纳米节点ni的状态Sf是由节点缓存区数据包数量Df和剩余能量Ef组成的联合状态:

(16)

其中,Dmax表示节点缓存区数据包数量的最大值,Emin表示纳米节点正常工作所需的最小能量,本文将其值设置为收发单个数据包所消耗的能量,Emax表示式(8)中纳米电池储能的最大值.

为了计算方便,本文采用归一化的能量,即将纳米节点的剩余能量映射为当前能量约束下可供发送的数据包数量:

NEf=,

(17)

NT=,

(18)

其中,NEf∈{0,1,2,…,NT},NEf表示剩余能量为Ef时节点可发送的数据包数;NT是纳米节点的能量达到最大值Emax时所能发送的数据包数,将Emax代入式(18)即可得到NT的取值;Etx是节点发送Nbit数据包的能耗,可由式(4)计算得到;·是向下取整操作.

对于自供电的纳米节点ni,其缓存区的数据包数量和剩余能量可以表示为

Df+1=min(max(Df+St)-
αfPf,0),Dmax),

(19)

Ef+1=min(max(Ef+Ht)-
βfPfEtx,Emin),Emax),

(20)

其中,Df+1Df分别表示在帧f+1和帧f的开始时刻纳米节点缓存区的数据包数量;Ef+1Ef分别表示在帧f+1和帧f的开始时刻纳米节点的剩余能量值;Δt是上一帧f的长度,St)和Ht)分别表示在Δt时间内纳米节点从外界环境中感知的数据包数量以及通过能量采集系统获取的能量值;αfβf均为二值参数,若αf=βf=1,表示节点ni在上一帧f中处于活跃状态并参与了数据传输,否则αf=βf=0;Pf表示节点在帧f中的数据包传输量,Pf×Etx表示上一帧f中节点ni发送Pf个数据包的能耗,Etx由式(4)计算得到.

在Δt时间内感知的数据包数量St)和获取的能量值Ht)可以计算得到:

St)=λp×Δt,

(21)

Ht)=λe×Δt,

(22)

其中,λp是数据包的到达速率,λe是纳米节点的能量采集速率,可由式(9)求得.

由式(16)(18)可以看出,纳米节点的状态空间大小为(Dmax+1)×(NT+1).

3.4 节点的行为空间

DEH-TDMA协议用Af表示纳米节点ni的信道接入方式.纳米节点在数据传输阶段存在2种可操作行为(a0,a1),a0=0表示节点在当前帧因缺乏可用能量或缓存区无数据到达而进入休眠态,a1=1表示纳米电池中储备有充足的能量从而发送数据,因此Af∈{a0,a1}.

3.5 状态转移概率

一般情况下,基于能量采集的WNSNs中纳米节点的数据到达和能量采集过程是相互独立的,因此可假设节点的数据包状态转移概率和能量状态转移概率也是相互独立的,从而节点的系统状态转移概率可通过分别求解能量状态转移概率和数据包状态转移概率而得到.

首先,需量化节点在当前状态下执行相应行为时的数据传输量和能耗.纳米节点ni在状态Sf=(Df,Ef)下采取行为Af获得的数据包传输量和消耗的能量可表示为

P(Sf,Af)=min(T,min(Df,NEf)),

(23)

E(Sf,Af)=P(Sf,AfEtx,

(24)

T=min(Dmax,NT),

(25)

其中,P(Sf,Af)和E(Sf,Af)分别表示节点ni在帧f中传输的数据包个数和能耗;DfNEf分别表示本帧节点缓存的数据包数量和剩余能量为Ef时可发送的数据包数量;T表示图1所示的帧结构中一个时隙块包含的数据包传输量,为方便起见,本文假设节点在一个时隙内只能传输一个数据包,因此T在数值上等于一个时隙块包含的时隙数.为了使纳米节点尽可能多地将缓存数据包发送给控制节点,本文设置T的取值为节点在本帧内数据传输量的最大值,而该值则由节点缓存区数据包数量的最大值Dmax和剩余能量达到最大值时所能发送的数据包数量NT联合确定.

然后,根据以上对纳米节点数据传输量和能耗的定量分析,并结合系统状态转移前后的能量和数据状态,如式(19)(20)所示,我们可进一步计算节点的数据包状态转移概率和能量状态转移概率.状态转移期间节点缓存区到达的数据包数量以及纳米电池中到达的能量数可分别表示为

d=Df+1-Df+P(Sf,Af),

(26)

e=,

(27)

由于数据包数和能量数都是整数,且DEH-TDMA协议希望节点在能量充足的前提下尽可能多地传输数据,因此式(26)(27)需采用·向上取整操作.

将式(26)代入式(11)所描述的数据包到达过程模型中,则可得到节点的数据包状态转移概率[26]

Pd(Df+1|Df,Af)=P(arrival of d packets)=

(28)

其中,d是式(26)中状态转移期间到达的数据包数量,PD(d)表示式(11)中数据包到达服从的泊松分布.

Df+1=Dmax时,节点的数据包状态转移概率为

Pd(Df+1|Df,Af)=P(arrival>d)=

(29)

同理,将式(27)代入式(10)所描述的能量采集过程模型中,则可得到节点的能量状态转移概率[23]

(30)

其中,e是式(27)中状态转移期间到达的能量数,PE(e)表示式(10)中能量采集过程服从的泊松分布.

Ef+1=Emax时,节点的能量状态转移概率为

(31)

综合数据包状态转移概率和能量状态转移概率,纳米节点的状态转移概率为

P(Sf+1|Sf,Af)=
Pd(Df+1|Df,Af)Pe(Ef+1|Ef,Af),

(32)

其中,P(Sf+1|Sf,Af)表示纳米节点在状态Sf下采取行动Af后转移到Sf+1的概率.

3.6 收益函数

DEH-TDMA协议旨于综合考虑纳米节点缓存区的数据包数量和当前的剩余能量,使用MDP模型求解出最优策略来最大化整个网络的吞吐量,同时降低网络能耗,因此将数据传输量和能耗作为影响因子融入纳米节点收益函数的设计中.

(33)

其中,R(Sf,Af)表示节点ni在状态Sf下采取行为Af获得的收益函数,λp是数据包到达的平均速率,tf是1帧的长度,λp×tf则表示1帧内平均到达的数据包个数,P(Sf,Af)和E(Sf,Af)分别表示节点在本帧内的数据传输量和能耗,且分别由式(23)和式(24)计算得到,Ec,max表示节点收发能耗的最大值.式(33)采用相对的数据传输量和能耗来分析节点的收益.

3.7 MDP模型的经典求解

求解MDP模型的“有模型”方法有值函数迭代法(value function iteration)和策略迭代法(policy iteration)[27],两者均需要进行增强学习的两大步骤,即策略评估与策略改进,其中策略迭代的收敛速度更快一些,在状态空间较小时,选用策略迭代方法效率更高,当状态空间较大时,值函数迭代法的计算量更小一些,本文中纳米节点的状态空间大小为(Dmax+1)(NT+1),所以选用值函数迭代算法求解上述建立的MDP模型,最终得到一个状态空间Sf映射到决策行为空间Af的最优策略.在MDP模型中,值函数被用来度量执行给定策略的回报.对于给定的策略π(s),状态值函数V(s)和行为值函数Q(s,a)可用贝尔曼公式表示:

(34)

Qπ(s,a)=R(s,a)+

(35)

其中,Vπ(s)和Vπ(s′)分别表示当前状态s和下一个状态s′的状态值函数,Qπ(s,a)表示当前状态s下的行为值函数,R(s,π(s))和P(s′|s,π(s))分别表示纳米节点在状态s执行策略π(s)获得的收益以及转移到状态s′的概率,且分别由式(33)和式(32)计算得到,γ是折扣因子,它用以保证值函数的收敛性且满足γ∈[0,1).

最优策略π*(s)是指状态空间映射到决策行为,并且使值函数Vπ(s)或Qπ(s,a)最大的策略,值迭代算法的思想正是先根据式(34)或式(35)求出最大的值函数,然后反解得到最优策略.具体实现步骤如算法1所示,求解为


(36)


(37)

算法1. 值函数迭代算法.

输入:状态空间Sf、行为空间Af、状态转移概率矩阵T、收益函数R、折扣因子γ

输出:最优策略π*.

初始条件:f=0,V(s)=0,π*(s)=0,∀sSf

f=f+1;

for all sSfdo

计算式(35)中的Q函数;

用最大的Q函数更新值函数:

end for

end while

获得值函数最大值Vπ*(s);

return π*.

4 DEH-TDMA协议的建立步骤

DEH-TDMA协议的建立过程包括离线计算和网络运行2个阶段,其中离线计算包括建立并求解MDP模型,网络运行包括网络初始化和数据传输.

1) 离线计算.基于TDMA协议设计帧结构,然后综合考虑节点缓存区的数据包数量和剩余能量,从纳米节点的角度构建MDP模型.通过量化节点在一帧内获得的数据包传输量以及消耗的能量,同时结合状态转移前后的数据和能量状态来计算状态转移概率,并将数据传输量和能耗作为影响因子设计收益函数.接着使用值迭代算法离线求解出节点状态空间映射为具体决策行为的最优策略,纳米节点将策略数据保存在本地内存中.

2) 网络运行.网络初始化阶段主要用于控制节点与纳米节点间的时钟同步和链路建立;控制节点在时隙调度阶段广播一帧的长度tf以及每帧包含的时隙数N×T.纳米节点通过查表的方式获取与自身实时状态Sf=(Df,Ef)相对应的决策行为,若在本帧内无数据传输或因能量不足而无法发送数据,则可进入持续时间为tf的睡眠期;若有数据要发送且具备充足的能量,则在数据传输阶段使用相应的时隙资源.

由于DEH-TDMA协议采用离线的方式求解最优策略,待网络运行后,纳米节点只需通过查表就可获取决策结果,且每个节点的状态空间和行为空间都较小,决策所需的计算量、时间以及内存容量都很少,因此该协议能应用于计算和存储能力非常有限的纳米节点.

5 仿真分析

本节对DEH-TDMA协议进行仿真分析,选择经典的TDMA协议以及文献[19]中的LA-TDMA协议作为比较对象.

5.1 仿真统计量定义

仿真分析将分别从节点的平均剩余能量、平均端到端时延和数据包传输成功率3个方面衡量DEH-TDMA协议、TDMA协议和LA-TDMA协议的性能.

1) 平均剩余能量

节点的平均剩余能量反映了网络中能量的使用情况.

剩余能量的平均值:

(38)

其中,Eavg表示剩余能量的均值,Ei(t)表示第i个节点当前的剩余能量值,K表示网络中纳米节点的总数.

2) 平均端到端时延

平均端到端时延定义为数据包从源节点产生到控制节点成功接收所消耗的平均时间,包括处理时延、队列时延、传播时延和传输时延,它可表示为

(39)

其中,表示数据包的平均端到端时延,Tp表示单个数据包的平均处理时延,这里假设所有数据包的长度相同,因此每个数据包的平均处理时延Tp相同,Tq,idiCi分别表示源节点发送第i个数据包时的队列时延、传输距离和信道容量,v为信号的传播速度,Npacket是仿真实验中控制节点接收的数据包总个数.

值得一提的是,当包到达间隔较小时,单位时间内节点产生的数据包较多而可能导致某些数据包在当前帧内无法被传输,对应地,式(39)中的队列等待时延Tq,i增大,从而增加端到端的平均时延;当网络中的节点数增加时,帧长变长也会使Tq,i变大而导致数据包的平均端到端时延增大.

3) 数据包传输成功率

数据包传输成功率定义为控制节点成功接收的数据包数量与源节点发送的数据包总数之比.

5.2 仿真设置

仿真假设网络中有1个控制节点和100个纳米节点,仿真场景是面积为1 cm2的二维平面,控制节点位于平面中心,纳米节点则随机分布在该区域内.在仿真中,为了简化计算,考虑介质中水分子含量为10%的信道环境,此时式(2)中吸收因子k(f)取值为0.25[22].假设每个纳米节点的数据传输速率为1 Mbps,通信范围设为0.01 m,物理层仍采用基于100 fs长脉冲的TS-OOK调制技术,单个数据包长度设为128 b,纳米节点缓存的数据包上限Dmax设为5.

所有纳米节点采用压电式能量采集系统,采集装置的电压U=0.42 V,单位周期采集到的电量ΔQ=6 pC,纳米超级电容的总容量Ccap=9 nF,此时根据式(8)计算得到纳米电池的最大储能Emax=800 pJ,式(18)中储能最大时可发送的数据包数量NT=11.每个纳米节点的最小能量Emin和初始能量分别设为80 pJ和800 pJ.当外界能量源的振动频率fv=50 Hz时,式(9)中的能量采集速率λe≈17 pJs.

图1所示的帧结构总共有100个时隙块,根据式(25)得到每个时隙块包含5个时隙,其中单个时隙的长度设为200 μs.式(33)中节点能耗的最大值Ec,max=320 pJ,该值是纳米节点完全占用5个时隙即发送5个数据包所消耗的能量.MDP模型中,折扣因子γ和值迭代算法的终止门限ε分别设为0.9和0.01.

仿真系统的运行时间设置为3 000个帧长,即300 s.固定节点的能量采集速率为20 pJs,研究数据包产生间隔的变化对WNSNs的性能影响.

5.3 仿真结果分析

1) 节点的平均剩余能量

图2是对3种MAC协议的节点平均剩余能量比较.由图2可见,随着数据包产生间隔逐渐增大,节点的平均剩余能量均逐渐增大.这是因为当数据包产生间隔很小,也就是节点缓存区到达的数据包较多时,较大的网络负载造成了能耗的增加.

Fig. 2 Comparison of mean residual energy of nodes
图2 节点平均剩余能量比较

图2表明DEH-TDMA的节点平均剩余能量大于TDMA和LA-TDMA,这是因为经典的TDMA协议和LA-TDMA协议均未考虑能量补充的特性,纳米节点在传输一定量的数据后就会能量耗尽,而DEH-TDMA协议中,纳米节点可通过查表的方式获取与实时状态相对应的信道接入方式,即使数据包产生间隔很小时,节点的能耗速率远远大于能量采集速率,节点则选择不占用时隙而转入能量采集状态,待采集有足够的能量再进行数据传输.因此DEH-TDMA协议可通过纳米节点能量补充的特性延长网络生命周期,甚至使WNSNs的生命期趋于无穷大.

2) 平均端到端时延

Fig. 3 Average end-to-end delay comparison
图3 平均端到端时延比较

图3是对3种MAC协议的平均端到端时延比较.从图3中可以看出平均端到端时延随着包产生间隔的增大而减小,这是因为包产生间隔变大时,单位时间内到达节点缓存区的数据包变少,此时数据包在缓存区等待被传输的时间就缩短,从而降低了端到端时延.由于LA-TDMA协议可以根据纳米节点业务量的优先级顺序动态分配时隙,无数据发送的节点不分配时隙,为业务突发节点提供更多时隙,因此在减小端到端时延上较另外2种协议表现出明显的优势.在DEH-TDMA协议中,纳米节点需要花费较短的时间读取存放在本地内存中的决策结果,因此与传统的TDMA协议相比,它在平均端到端时延上性能稍差,但是与LA-TDMA的差距也仅在0.1~0.3 ms.

3) 数据包传输成功率

图4是对3种MAC协议的数据包传输成功率比较,这里是假设物理层是透明传输的,即假设信道是理想的,仿真实验未考虑信道衰落引起的丢包现象.由图4可见,数据包传输成功率不随数据包产生间隔变化,且传输成功率基本都达到了100%,因此纳米节点间不存在因冲突导致数据传输失败,说明本文设计的时隙长度是合理的,因为时隙长度中考虑了数据包传输距离引入的时延,从而可以避免不同位置节点发送的数据包在控制节点处可能带来的相邻时隙部分重叠所造成的码元碰撞.

Fig. 4 Comparison of packet transmission success rate
图4 数据包传输成功率比较

Fig. 5 Comparison of packet transmission success rate
图5 数据包传输成功率比较

图5则是考虑了太赫兹信道之后的数据包传输成功率比较,由图5可见,数据包传输成功率不随数据包产生间隔变化,这是因为3种MAC协议均实现了无碰撞传输,纳米节点间不存在因冲突导致数据传输失败;但由于太赫兹信道存在的分子吸收噪声以及信道衰落会引起丢包现象.

6 结 论

针对纳米节点能量非常有限无法保证WNSNs持续性运行的不足,本文引入压电式纳米能量采集系统,提出一种基于能量采集的分布式TDMA协议.该协议基于纳米节点缓存区数据包状态和剩余能量状态组成的联合状态构建Markov决策过程模型,并通过值迭代算法离线求解出最优策略.纳米节点根据自身状态通过查表的方式获取信道接入方式,从而大大减轻了节点的计算压力.最后仿真结果表明该协议在延长网络生命周期上存在相当明显的优势,非常适合将该协议应用于不易更换电池的场合,如体内,可以在体内搭建人体健康监测系统,但是该系统需要根据临床中人体健康数据的采集对网络拓扑进行适当的调整同时还需要考虑人体健康数据的优先级,这也将是本文未来的研究方向.

参考文献

[1]Rao Fubo, Zheng Fan, Dong Lixin, et al. Molecular nanosensors based on the inter-sheet tunneling effect of a bilayer graphene[C] Proc of IEEE Int Conf on NanoMolecular Medicine and Engineering. Piscataway, NJ: IEEE, 2010: 172-175

[2]Sorkin V, Zhang Yongwei. Graphene-based pressure nano-sensors[J]. Journal of Molecular Modeling, 2011, 17(11): 2825-2830

[3]Akyildiz I F, Brunetti F, Blázquez C. Nanonetworks: A new communication paradigm[J]. Computer Networks, 2008, 52(12): 2260-2279

[4]Jornet J M, Akyildiz I F. The internet of multimedia nano-things in the Terahertz band[J]. Nano Communication Networks, 2012, 3(4): 242-251

[5]Chopra N, Yang Ke, Upton J, et al. Understanding and characterizing nanonetworks for healthcare monitoring applications[C] Proc of IEEE MTT-S Int Microwave Workshop Series on RF and Wireless Technologies for Biomedical and Healthcare Applications. Piscataway, NJ: IEEE, 2014

[6]Song H, Nagatsuma T. Present and future of terahertz communications[J]. IEEE Transactions on Terahertz Science and Technology, 2011, 1(1): 256-263

[7]Kleine-Ostmann T, Nagatsuma T. A review on terahertz communications research[J]. Journal of Infrared, Millimeter, and Terahertz Waves, 2011, 32(2): 143-171

[8]Huang Kaocheng, Wang Zhaocheng. Terahertz terabit wireless communication[J]. Microwave Magazine, 2011, 12(4): 108-116

[9]Akyildiz I F, Jornet J M, Han Chong. Terahertz band: Next frontier for wireless communications[J]. Physical Communication, 2014, 12: 16-32

[10]Piesiewicz R, Kleine-Ostmann T, Krumbholz N, et al. Short-range ultra-broadband terahertz communications: Concepts and perspectives[J]. IEEE Antennas and Propagation Magazine, 2007, 49(6): 24-39

[11]Otsuji T, Tombet S B, Satou A, et al. Terahertz-wave generation using graphene: Toward new types of terahertz lasers[J]. IEEE Journal of Selected Topics in Quantum Electronics, 2013, 19(1): 8400209

[12]Geim A K, Novoselov K S. The rise of graphene[J]. Nature materials, 2007, 6(3): 183-191

[13]Islam N, Misra S, Mahapatro J, et al. Catastrophic collision in bio-nanosensor networks: Does it really matter?[C] Proc of the 15th IEEE Int Conf on e -Health Networking, Applications and Services. Piscataway, NJ: IEEE, 2013: 371-376

[14]Jornet J M, Pujol J C, Pareta J S. PHLAME: A physical layer aware mac protocol for electromagnetic nanonetworks in the terahertz band[J]. Nano Communication Networks, 2012, 3(1): 74-81

[15]Wang Pu, Jornet J M, Malik M G A, et al. Energy and spectrum-aware MAC protocol for perpetual wireless nanosensor networks in the Terahertz band[J]. Ad Hoc Networks, 2013, 11(8): 2541-2555

[16]Mohrehkesh S, Weigle M. RIH-MAC: Receiver-initiated harvesting-aware MAC for nanonetworks[C] Proc of the 1st ACM Annual Int Conf on Nanoscale Computing and Communication. New York: ACM, 2014

[17]Salvatore D, Galluccio L, Morabito G, et al. A timing channel-based MAC protocol for energy-efficient nanonetworks[J]. Nano Communication Networks, 2015, 6(2): 39-50

[18]Rikhtegar N, Keshtgari M, Ronaghi Z. EEWNSN: Energy efficient wireless nano sensor network MAC protocol for communications in the terahertz band[J]. Wireless Personal Communications, 2017, 97(1): 521-537

[19]Xu Juan, Zhao Yakun, Zhang Rong, et al. A load-aware TDMA protocol for Terahertz NanoSensor networks[J]. Journal of Tongji University (Natural Science), 2018: 46(11): 1565-1574 (in Chinese)(徐娟, 赵雅坤, 张茸, 等. 负载感知的太赫兹纳米传感网的TDMA协议[J]. 同济学报(自然科学版), 2018: 46(11): 1565-1574)

[20]Gammaitoni L, Neri I, Vocca H. Nonlinear oscillators for vibration energy harvesting[J]. Applied Physics Letters, 2009, 94(16): 164102

[21]Liu Ke. Practical Markov Decision Process[M]. Beijing: Tsinghua University Press, 2004 (in Chinese)(刘克. 实用Markov决策过程[M]. 北京: 清华大学出版社, 2004)

[22]Jornet J M, Akyildiz I F. Channel modeling and capacity analysis for electromagnetic wireless nanonetworks in the terahertz band[J]. IEEE Transactions on Wireless Communications, 2011, 10(10): 3211-3221

[23]Pierobon M, Jornet J M, Akkari N, et al. A routing framework for energy harvesting wireless nanosensor networks in the Terahertz band[J]. Wireless Networks, 2014, 20(5): 1169-1183

[24]Roundy S, Wright P K, Rabaey J M, Energy Scavenging for Wireless Sensor Networks: With Special Focus on Vibrations[M]. Norwell, MA: Kluwer Academic Publishers, 2004

[25]Shrestha B, Hossain E, Choi K W, et a1. A Markov decision process (MDP)-based congestion-aware medium access strategy for IEEE 802.15.4[C] Proc of the Global Telecommunications Conf (GLOBECOM 2011). Piscataway, NJ: IEEE, 2011

[26]Shi Ke. Research on agent decision problem based on Markov decision process theory[D]. Hefei: China University of Science and Technology, 2010 (in Chinese)(石轲. 基于Markov决策过程理论的Agent决策问题研究[D]. 合肥: 中国科学技术大学, 2010)

[27]Puterman M L. Markov Decision Processes: Discrete Stochastic Dynamic Programming[M]. Hoboken, NJ: John Wiley & Sons, 2009

Distributed Time Division Multiple Access Protocol Based on Energy Harvesting

Xu Juan, Zhang Rong, Kan Jiali, and Zhang Yan

(College of Electronics and Information Engineering, Tongji University, Shanghai 201804)

Abstract Terahertz wireless nanosensor networks (WNSNs) are novel networks interconnecting multiple nano-devices by means of wireless communication. Nanosensors can obtain ultra-high-speed transmission rates using communications in the terahertz band, and medium access control (MAC) protocols play an important role in regulating the access to the terahertz channel and coordinating transmission orders among nanosensors. However, classical MAC protocols are not applicable due to the existing molecular absorption noise in terahertz channel and the very limited energy of nanodevices. In this paper, a distributed energy harvesting-based time division multiple access (DEH-TDMA) protocol is proposed, which aims to overcome the energy limitations of nanosensors and the catastrophic collisions in terahertz WNSNs based on a modulation scheme called time spread on-off keying (TS-OOK). The protocol adopts the piezoelectric energy harvesting system, where a Markov decision process (MDP) model is firstly constructed by considering the remaining energy and the number of packets in the buffer as state information, then the number of transmitted packets and the energy consumption are considered as impacting factors in designing the reward function of MDP model, so each nanosensor can dynamically access the channel according to its own state after solving an optimal strategy. Simulation results show that DEH-TDMA has advantages in extending the network life cycle.

Key words nanonetworks; terahertz band; medium access control; time division multiple access; energy harvesting

(jxujuan@tongji.edu.cn)

收稿日期2019-05-05;修回日期: 2020-01-13

基金项目国家自然科学基金项目(61202384);中央高校基本科研业务费专项资金(221201700186)

This work was supported by the National Natural Science Foundation of China (61202384) and the Fundamental Research Funds for the Central Universities (221201700186).

中图法分类号 TP212.9; TN929.5

Xu Juan, born in 1973. PhD, associate professor, master supervisor. Her main research interests include wireless nanosensor networks, ultra wide band wireless sensor network, mobile ad hoc network.

Zhang Rong, born in 1992. Master. Her main research interests include wireless nano-sensor networks, MAC protocol.

Kan Jiali, born in 1995. Master. Her main research interests include wireless nano-sensor networks, in-vivo terahertz communication protocol.

Zhang Yan, born in 1996. Master sanditate. Her main research interests include terahertz wireless nano-sensor networks, simultaneous wireless information and power transfer.