Processing math: 0%
  • 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络

孙颖, 丁卫平, 黄嘉爽, 鞠恒荣, 李铭, 耿宇

孙颖, 丁卫平, 黄嘉爽, 鞠恒荣, 李铭, 耿宇. RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络[J]. 计算机研究与发展, 2023, 60(4): 947-961. DOI: 10.7544/issn1000-1239.202110735
引用本文: 孙颖, 丁卫平, 黄嘉爽, 鞠恒荣, 李铭, 耿宇. RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络[J]. 计算机研究与发展, 2023, 60(4): 947-961. DOI: 10.7544/issn1000-1239.202110735
Sun Ying, Ding Weiping, Huang Jiashuang, Ju Hengrong, Li Ming, Geng Yu. RCAR-UNet:Retinal Vessels Segmentation Network Based on Rough Channel Attention Mechanism[J]. Journal of Computer Research and Development, 2023, 60(4): 947-961. DOI: 10.7544/issn1000-1239.202110735
Citation: Sun Ying, Ding Weiping, Huang Jiashuang, Ju Hengrong, Li Ming, Geng Yu. RCAR-UNet:Retinal Vessels Segmentation Network Based on Rough Channel Attention Mechanism[J]. Journal of Computer Research and Development, 2023, 60(4): 947-961. DOI: 10.7544/issn1000-1239.202110735
孙颖, 丁卫平, 黄嘉爽, 鞠恒荣, 李铭, 耿宇. RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络[J]. 计算机研究与发展, 2023, 60(4): 947-961. CSTR: 32373.14.issn1000-1239.202110735
引用本文: 孙颖, 丁卫平, 黄嘉爽, 鞠恒荣, 李铭, 耿宇. RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络[J]. 计算机研究与发展, 2023, 60(4): 947-961. CSTR: 32373.14.issn1000-1239.202110735
Sun Ying, Ding Weiping, Huang Jiashuang, Ju Hengrong, Li Ming, Geng Yu. RCAR-UNet:Retinal Vessels Segmentation Network Based on Rough Channel Attention Mechanism[J]. Journal of Computer Research and Development, 2023, 60(4): 947-961. CSTR: 32373.14.issn1000-1239.202110735
Citation: Sun Ying, Ding Weiping, Huang Jiashuang, Ju Hengrong, Li Ming, Geng Yu. RCAR-UNet:Retinal Vessels Segmentation Network Based on Rough Channel Attention Mechanism[J]. Journal of Computer Research and Development, 2023, 60(4): 947-961. CSTR: 32373.14.issn1000-1239.202110735

RCAR-UNet:基于粗糙通道注意力机制的视网膜血管分割网络

基金项目: 国家自然科学基金面上项目(61976120);国家自然科学基金青年科学基金项目(62006128,62102199);江苏省自然科学基金项目(BK20191445);江苏省双创博士计划项目;江苏省研究生科研与实践创新计划项目(SJCX20_1150);江苏省高等学校自然科学研究重大项目(21KJA510004);江苏省高等学校自然科学基金面上项目(20KJB520009);南通市科技局基础科学研究项目(JC2020141,JC2021122);江苏“青蓝工程”项目
详细信息
    作者简介:

    孙颖: 1997年生. 硕士研究生. 主要研究方向为粒计算、粗糙集和深度学习

    丁卫平: 1979年生. 博士,教授,博士生导师,CCF高级会员. 主要研究方向为数据挖掘、机器学习、粒计算、演化计算和大数据分析

    黄嘉爽: 1988年生. 博士,讲师. 主要研究方向为脑网络分析和深度学习

    鞠恒荣: 1989年生. 博士,副教授. 主要研究方向为粒计算、粗糙集、机器学习和知识发现

    李铭: 1996年生. 硕士研究生. 主要研究方向为数据挖掘、粒度计算和大数据分析

    耿宇: 1998年生. 硕士研究生. 主要研究方向为粒计算、机器学习和深度学习

    通讯作者:

    丁卫平(dwp9988@163.com

  • 中图分类号: TP391

RCAR-UNet:Retinal Vessels Segmentation Network Based on Rough Channel Attention Mechanism

Funds: This work was supported by the General Program of the National Natural Science Foundation of China (61976120), the National Natural Science Foundation of China for Young Scientists (62006128, 62102199), the Natural Science Foundation of Jiangsu Province (BK20191445), the Double-Creation Doctoral Program of Jiangsu Province, the Postgraduate Research & Practice Innovation Program of Jiangsu Province (SJCX20_1150), the Major Program of the Natural Science Research of Jiangsu Province Higher Education Institutions (21KJA510004), the General Program of the Natural Science Foundation of Jiangsu Province Higher Education Institutions (20KJB520009), the Basic Science Research Program of Nantong Science and Technology Bureau (JC2020141, JC2021122), and the Qing Lan Project of Jiangsu Province.
More Information
    Author Bio:

    Sun Ying: born in 1997. Master candidate. Her main research interests include granular computing, rough sets, and deep learning

    Ding Weiping: born in 1979. PhD, professor, PhD supervisor. Senior member of CCF. His main research interests include data mining, machine learning, granular computing, evolutionary computing, and big data analytics

    Huang Jiashuang: born in 1988. PhD, lecturer. His main research interests include brain network analysis and deep learning. (hjshdym@163.com

    Ju Hengrong: born in 1989. PhD, associate professor. His main research interests include granular computing, rough sets, machine learning, and knowledge discovery. (juhengrong@ntu.edu.cn

    Li Ming: born in 1996. Master candidate. His main research interests include data mining, granular computing, and big data analytics. (liming_2014@163.com

    Geng Yu: born in 1998. Master candidate. His main research interests include granular computing, machine learning, and deep learning. (tian19981999@163.com

  • 摘要:

    眼底图像中视网膜血管的健康状况对早期诊断各种眼科疾病及糖尿病心脑血管疾病等具有重要意义,然而视网膜血管结构细微、边界模糊且分布不规则,对其进行准确分割存在较大的难度.针对视网膜血管的这些特征,提出一种粗糙通道注意力残差U型网——粗糙通道注意力残差U型网络(RCAR-UNet).该网络首先引入粗糙集理论中上下近似概念设计粗糙神经元;接着基于粗糙神经元构建粗糙通道注意力模块,该模块在U-Net跳跃连接中采用全局最大池化和全局平均池化构造上下近似神经元,并进行神经元间的加权求和,对所建立的通道依赖关系进行合理的粗糙化,该依赖关系不仅包含全局信息,同时具有局部特性,可有效实现对所提取视网膜血管特征的准确重标定;然后添加残差连接,将特征直接从低层传递给高层,有助于解决网络性能退化问题,并有效提取更加丰富的视网膜血管特征;最后为了验证所提视网膜分割网络的有效性,在3个眼底视网膜公开图像数据集上与U-Net,Attention U-Net等传统网络模型进行对比实验,实验结果表明,所提视网膜分割网络在血管分割准确率、灵敏度和相似度等方面具有较高的优越性.

    Abstract:

    The health of retinal vessels in fundus images is of great significance for the early diagnosis of various ophthalmic diseases and diabetic cardiovascular diseases, etc. However, the retinal blood vessels are delicate, distributed irregularly and the boundary is ambiguous. Therefore, it is difficult to accurately segment them. Based on the characteristics of retinal blood vessels, we propose a U-shaped network—rough channel attention residual U-Net (RCAR-UNet), which combines rough neurons and channel attention mechanism. Firstly, the network introduces the concept of upper and lower approximation in rough set theory to design rough neurons. Secondly, the rough channel attention module is constructed based on rough neurons, and the module uses global max pooling and global average pooling in U-Net skip connections to construct upper and lower approximation neurons, and performs weighted summation between neurons to reasonably rough the established channel dependencies, which not only contain global information but also have local characteristics, and can effectively achieve accurate rescaling of the extracted retinal vessels features. Then adding residual connections to transfer features directly from the lower to the higher layers, to help solve the network performance degradation problem and effectively extract richer retinal vascular features. Finally, in order to verify the effectiveness of the proposed RCAR-UNet model, comparison experiments are performed on three public fundus image datasets with traditional network models such as U-Net, Attention U-Net, etc. The results show that the RCAR-UNet model has high superiority in the accuracy, sensitivity and similarity of blood vessel segmentation.

  • 随着城市的不断快速发展,城市交通问题日益严峻,如交通拥堵等[1]. 为了解决这些问题,大量智能交通系统(intelligent transportation systems,ITSs)被广泛地部署,用于城市交通感知和监控[2]. 例如,澳大利亚新南威尔士州构建交通流量监控系统(taffic volume viewer system, TVVS)[3],部署超过600个交通感知站点. 然而,由于设备故障、数据传输和系统供电等问题,感知数据缺失问题在ITSs中普遍存在[4]. 例如,文献[5]统计分析发现,澳大利亚TVVS系统中约25%的站点感知数据缺失率超过60%,严重影响该系统的正常使用. 因此,准确实时地恢复大规模ITSs缺失感知数据对实现智慧城市的智能交通至关重要.

    本文提出基于边缘智能计算的大规模交通缺失感知数据恢复系统,既利用大量不同交通站点感知数据之间的相关性,又利用部署在感知站点附近的边缘节点强大的计算处理能力,从而实现大规模交通感知数据的精确自适应恢复. 但是,要实现该系统,需要解决2方面的挑战:

    1) 高计算复杂性的边缘节点部署. 边缘节点部署,既需要考虑部署在不同交通感知站点的成本与收益各不相同,还与交通感知数据分配策略紧密相关,从而使边缘节点最优部署问题更加复杂,在2.2节被证明是NP-hard问题. 所以,如何解决这个高计算复杂性问题以实现最优部署非常具有挑战性.

    2) 高时空动态的感知数据相关性. 交通感知数据的时空相关性具有动态性、时变性和复杂性,经常受道路拓扑、感知站点位置、天气以及社会事件等多方面因素的影响[6]. 因此,如何基于该动态的、时变的、难建模的时空相关性实现感知数据的精确恢复非常具有挑战性. 进一步地,数据之间的相关性影响各个交通感知站点的数据分配策略,如当感知数据之间的相关性较差时,需要增加边缘节点的分配数据量,以保证数据恢复的鲁棒性. 但是感知数据之间的高时空动态相关性使保证感知数据恢复精度的鲁棒性非常困难.

    为了解决上述2个挑战,本文提出基于边缘智能计算的城市交通感知数据自适应恢复系统,主要包括2部分:

    1) 具有理论下界的边缘节点次优部署分配. 针对挑战1,首先,通过问题等价转化,解耦边缘节点部署和感知数据分配之间的复杂关系. 然后,通过理论证明该问题具有非负的、单调的和子模的目标函数,以及p-独立系统的约束条件. 最后,基于该问题的性质分析,提出基于子模理论的边缘节点次优部署算法,能够在多项式时间复杂度内获得具有理论下界的近似最优解.

    2) 基于低秩理论的感知数据自适应精确恢复. 针对挑战2,首先,基于实际交通感知数据集,对感知数据进行时空维度的低秩分析;然后,基于该分析结果,提出基于低秩理论的时空维度联合数据恢复算法;最后,针对感知数据相关性的高时空动态变化,提出基于奇异值分解的感知数据非缺失下限估计. 基于该下限估计反馈,自适应地调整各交通感知站点的感知数据分配比例,以保证感知数据的精确恢复,从而提高系统数据恢复性能的鲁棒性.

    综上所述,本文主要具有3方面的创新和贡献:

    1) 提出基于边缘智能计算的城市交通感知数据自适应恢复系统,既利用基于子模优化理论的边缘计算,又利用基于低秩理论的智能计算,还基于非缺失下限估计反馈,自适应地调整交通站点感知数据分配比例,从而实现交通感知数据的“闭环”处理,提高系统的鲁棒性.

    2) 针对边缘节点部署NP-hard问题,基于子模优化理论,通过问题解耦转化和性质分析,提出近似比为1/(2+max的边缘节点次优部署分配算法,其中{c_{js}}表示任意一个边缘节点{e_s}部署在任意一个感知站点{\lambda _j}处的成本. 同时,提出缺失交通感知数据的自适应恢复算法,利用基于低秩理论的感知数据恢复,以及基于奇异值分解的非缺失下限估计反馈调整,实现缺失感知数据的自适应精确恢复.

    3) 基于澳大利亚600个交通感知站点1年的实际感知数据构建原型系统,并基于该系统进行全面且深入的实验评估. 结果表明,所提算法的边缘节点部署性能达到最优性能的90%以上,缺失数据恢复精度比3种方法至少提高43. 8%. 同时,自适应数据恢复精度平均提高40. 3%.

    为保障智能交通系统的正常运行,促进智慧城市的进一步发展,大量工作开始致力于研究城市交通感知数据的精确恢复. 因此本文提出了基于边缘智能计算的城市交通感知数据自适应恢复系统,所以下面将主要介绍交通感知数据恢复和边缘节点部署方面的研究工作.

    1) ITSs交通感知数据恢复. 智能交通系统在城市化进程不断深入的当下起着越来越重要的作用,然而交通感知数据的普遍缺失却极大地影响了ITSs的效用,为此越来越多的研究工作开始致力于交通感知数据的精确恢复. 例如,文献[7]利用真实数据和仿真数据,同时结合生成式对抗网络对交通感知数据进行恢复. 文献[8]中以高速公路交通数据为例,提出了一种数据融合方法,通过挖掘感知数据内在特性以重构缺失数据. 文献[9]中通过将交通感知数据恢复问题建模为一个高维张量补全问题,并采用奇异值分解来进一步了解感知数据的内在联系,以达到缺失数据补全的目的. 文献[4]将城市交通感知区域建模成一个具有时空相关性的张量,同时结合交通感知数据的城市特性完成对缺失数据的填补. 文献[10]中提出一种联合空间多核学习和非负矩阵分解的策略机制,去补全缺失感知数据. 该机制充分考虑了多感知区域间多层面的相关性,使得其能获得一个较好的数据恢复精度. 有别于文献[4, 7-10]的工作,本文提出基于边缘智能计算的城市交通感知数据自适应恢复系统,实现了交通感知数据的自适应动态精确恢复.

    2) 边缘计算中的节点部署. 由于感知数据恢复存在规模庞大和计算密集等问题,本文提出通过边缘计算来解决这一难题,充分利用边缘服务器强大的计算能力来完成对感知数据及时精准的恢复. 目前,也有很多其他关于边缘计算应用的研究. 例如,文献[11-12]中提出利用云端服务器和边缘节点协同处理任务;文献[13]中研究多个边缘节点协作优化任务卸载和服务缓存,以达到降低整体任务时延的目的;文献[14]中提出利用边缘计算来存储整理车辆的道路感知信息,以此为无人驾驶汽车提供及时准确的道路信息,确保驾驶的安全;文献[15]中研究了云服务和端服务之间通过事件机制进行的服务适配,并结合图论和排队论方法实现了服务的平均响应时间最小. 此外,关于边缘节点的相关研究也有很多,例如文献[16-17]中研究了关于节点部署成本最小的问题,文献[18-20]中也研究了在站点容量约束和带宽约束下最小化边缘节点部署成本的问题. 本文提出的部署方案主要为处理缺失感知数据而提出,对每个边缘节点都有一定的数据上传量下限要求. 因此,前人的研究成果并不适用于本文的研究. 虽然文献[5]中提出了一种边缘节点部署和数据恢复算法,但是没有考虑数据恢复结果对于边缘节点处的反馈. 与该工作不同,本文提出一种基于边缘智能计算的缺失感知数据自适应恢复系统,基于恢复结果的反馈,自适应调整恢复过程,从而保证数据恢复精度,提高系统恢复的鲁棒性.

    为解决大规模ITSs系统的感知数据缺失问题,本文提出基于边缘智能计算的大规模交通缺失感知数据动态自适应恢复系统模型架构,主要包括交通感知站点、边缘节点和云服务器.

    1) 交通感知站点. 在智能交通系统中,交通感知站点被部署在城市的各条道路或其交叉路口上,感知和监测道路实时的交通信息,如车流量、车速等[21] . 假设有N个站点,用{\lambda _i}表示第i个站点,其中i \in \{ 1, 2, … ,N\}. 此外,用{w_i}表示{\lambda _i}的感知数据规模大小. 表1给出本文主要数学符号说明.

    表  1  主要数学符号的说明
    Table  1.  Main Mathmatics Notations Description
    符号符号含义
    N,{\lambda _i},{w_i}交通站数量、第i个交通站点和其数据量
    S,{e_s},{d_s}边缘节点数量、第s个边缘节点和其容量上限
    {x_{js}},{c_{js}}表示边缘节点{e_s}是否被部署到交通站点{\lambda _j}和其部署成本
    {l_{ij}},{y_{ij}} {\lambda _i} 是否在{\lambda _j}覆盖范围内、分配数据量比例
    {\boldsymbol{x} },{\boldsymbol{y} }{\boldsymbol{x} } = ({x_{js} }){\boldsymbol{y} } = ({y_{ij} })
    \mathcal{G},\mathcal{A}交通站点和边缘节点配对集、可行的配对集
    { {\boldsymbol{M} }_{js} },{m_j}在交通站点{\lambda _j}处边缘节点{e_s}的缺失矩阵及其非缺失下限
    下载: 导出CSV 
    | 显示表格

    2) 边缘节点. 所有交通感知数据被传送至边缘节点进行缺失数据恢复处理. 考虑到部署的便捷性及部署成本问题,边缘节点将被部署在交通感知站点处. 假设共有S个边缘节点,用{e_s}表示第s个边缘节点,其中s \in \{ 1, 2, … ,S\}. 用{x_{js}} = 1或0表示边缘节点{e_s}是否被部署到交通站点{\lambda _j}处,{x_{js}} = 1表示被部署,否则{x_{js}} = 0. 每个节点的部署需耗费一定成本,用{c_{js}}表示边缘节点{e_s}部署到交通站点{\lambda _j}的成本. 不同的边缘节点有不同的计算存储容量,用{d_s}表示{e_s}的计算存储容量. 此外,用{y_{ij}}表示交通站点{\lambda _i}传输到部署在{\lambda _j}处边缘节点的数据比例,即{y_{ij}} \in [0,1]. 为方便处理,在进行缺失数据恢复时,边缘节点首先将各个站点上传的感知数据整合成一个含缺失数据的矩阵,即缺失矩阵,用 {{\boldsymbol{M}}_{js}} 表示{\lambda _j}处边缘节点e_s 整合的缺失矩阵. 同时,为保证恢复精度,缺失矩阵的元素缺失程度不能太大,即传送到边缘节点的非缺失感知数据量需满足一定下限,用{m_j}表示{\lambda _j}处边缘节点整合矩阵的非缺失下限. 特别地,矩阵非缺失下限值与矩阵的秩大小密切相关,具体见3.2.2节. 此外,由于外界因素,如环境、天气、节假日等的影响,感知数据矩阵的秩也将随之变化,进一步地将影响到数据最后的恢复精度. 为保证在变动的外界因素下,缺失数据的恢复精度依然能满足一定要求,边缘节点将依据恢复结果计算相应非缺失下限值,并基于非缺失下限值调整各交通站点的感知数据分配比例,以保证感知数据的自适应精确恢复. 此外,为提高恢复效率,边缘节点应能同时处理尽可能多的感知数据.

    3) 云服务器. 云服务器在整个系统中主要有2个功能: ①管理和控制边缘节点. 连接所有边缘节点,并灵活高效地控制和管理各个交通感知站点和边缘节点之间的数据传输和调度[22]. 具体地,首先,所有边缘节点根据恢复结果,计算非缺失下限值,并将该值发送至云服务器;然后,云服务器根据各个边缘节点上传的非缺失下限值重新计算感知数据分配方案,并反馈回各个边缘节点;最后,边缘节点通知各个交通感知站点新的感知数据分配比例. ②复杂的大规模数据处理[23-25]. 当边缘节点恢复缺失感知数据之后,利用完整的交通感知数据进一步地进行复杂的大规模数据分析和挖掘,如基于深度学习的交通感知大数据态势分析和挖掘等[26-27].

    基于2.1节所述的系统模型,本文研究的问题主要包括:1) 如何在部署成本约束下设计边缘节点部署方案,提高部署性能使其能更好地服务感知数据恢复,即能同时处理尽可能多的感知数据. 2) 如何基于边缘节点部署实现感知数据的动态自适应恢复.

    1) 子问题P1——边缘节点的次优部署. 已知边缘节点的计算存储容量\{ {d_s}|s \in \{1,2,…,S\}\}和交通感知站点的感知数据规模\{ {w_i}|i \in \{1,2,…,N\}\},如何设计S个边缘节点部署到N个交通感知站点的部署策略{\boldsymbol{x}} = ({x_{js}}{\text{|}}\forall j \in \{ 1,2, … ,N\} , \forall s \in \{ 1,2, … ,S\} ),和N个交通感知站点传输到已部署边缘节点的感知数据量分配方案{\boldsymbol{y}} = ({y_{ij}}{\text{|}}\forall i,j \in \{ 1,2, … ,N\} ),以在总部署成本预算{C_0}约束下,最大化所有部署边缘节点处理总数据量,即交通感知站点总上传数据量.

    ({\text{P1}})\mathop {\max }\limits_{{\boldsymbol{x}},{\boldsymbol{y}}} {\text{ }}\mathop \sum \limits_{i = 1}^N \mathop \sum \limits_{j = 1}^N {w_i}{y_{ij}}, (1)
    {\rm{s.t.}}\;\sum\limits_{j = 1}^N {{y_{ij}}} \leqslant 1,\forall i \in \{ 1,2, … ,N\} , (2)
    \sum\limits_{j = 1}^N {{x_{js}}} \leqslant 1,\forall s \in \{ 1,2,… ,S\} , (3)
    \sum\limits_{i = 1}^N {{w_i}} {y_{ij}} \leqslant \sum\limits_{s = 1}^S {{x_{js}}} {d_s},\forall j \in \{ 1,2, … ,N\} , (4)
    \sum\limits_{i = 1}^N {{w_i}} {y_{ij}} \geqslant \mathop \sum \limits_{s = 1}^S {x_{js}}{m_j},\forall j \in \{ 1,2, … ,N\} , (5)
    \sum\limits_{s = 1}^S {\sum\limits_{j = 1}^N {{x_{js}}} } {c_{js}} \leqslant {C_0},\;\;\: (6)
    {y_{ij}} \leqslant {l_{ij}},\forall i,j \in \{ 1,2, …,N\} . (7)

    其中:式(1)中\displaystyle\sum \limits_{i = 1}^N \displaystyle\sum \limits_{j = 1}^N {w_i}{y_{ij}}表示所有部署边缘节点同时处理的总数据量;式(2)表示{\lambda _j}将部分或全部感知数据上传到边缘节点进行处理;式(3)表示1个边缘节点最多被部署到1个交通站点处;式(4)表示{\lambda _j}处边缘节点接收到的总处理数据量不超过其计算存储容量上限;式(5)表示{\lambda _j}处边缘节点整合的感知数据矩阵其缺失数据量要满足一定的下限约束,以避免因缺失程度太大而导致无法精确地恢复;式(6)表示所有边缘节点的总部署成本需满足成本预算限制,特别地,由于通信成本远小于部署成本[28],所以本文不考虑数据传输带来的成本;式(7)表示交通感知站点之间距离较远时,其数据之间的空间相关性比较弱,对缺失数据恢复作用非常小[29],为此,只考虑作用范围内的感知站点,用{l_{ij}} = 1(0)表示{\lambda _i}是否在{\lambda _j}的作用范围内,如果是,则{l_{ij}} = 1,否则{l_{ij}} = 0.

    2) 子问题P2——感知数据的自适应恢复. 如何基于边缘节点整合的缺失矩阵,通过矩阵中完整元素恢复缺失元素. 同时基于恢复结果,估计当前感知数据相关性程度,通过该相关性程度大小计算保证精确恢复所需的非缺失感知数据下限值,从而基于下限值调节感知站点上传至各边缘节点感知数据比例,达到动态自适应精确恢复的目的. 用T表示矩阵 {{\boldsymbol{M}}_{js}} 的元素个数,用{v_t} {\hat v_t} 分别表示该矩阵第t个元素的实际值和估计值,t\in \{1,2,…,T\} . 因此,感知数据恢复问题可描述为:如何设计矩阵恢复函数 {\varPhi _t}( \cdot ) ,使得所有缺失感知数据的估计值与真实值之间的误差最小,形式化表示为:

    ({\text{P2}})\mathop {\min }\limits_{{\varPhi _t}( \cdot )} {\text{ }}\frac{1}{T}\sum\limits_{t = 1}^T {\left| {{v_t} - {{\hat v}_t}} \right|} , (8)
    {\rm{s.t.}}\;{\hat v_t} = {\varPhi _t}({{\boldsymbol{M}}_{js}}),\forall t \in \{ 1,2,…,T\} . (9)

    其中:式(8)表示感知数据的估计误差,即平均绝对值误差[30];式(9)表示感知数据的估计恢复, {\varPhi _t}({{\boldsymbol{M}}_{js}}) 表示利用矩阵恢复函数,基于 {{\boldsymbol{M}}_{js}} 中所有非缺失数据估计其第t个元素的值. 同时,为达到动态自适应精确恢复的目的,还需依据P2恢复结果,更新非缺失下限值,以保证感知数据的恢复精度.

    定理1. 边缘节点的最优部署分配问题{\text{P1}}是NP-hard问题.

    证明. 当每个交通站点的感知数据量规模\{ {w_i}\} 足够大,远大于所有边缘节点的存储容量上限\{ {d_s}\}时,式(2)(5)可被松弛. 原问题简化为

    \begin{aligned} &\mathop {\max }\limits_{\boldsymbol{x}} {\text{ }}\mathop \sum \limits_{s = 1}^S \mathop \sum \limits_{j = 1}^N {x_{js}}{d_s},\\ &{\rm{s.t.}}\;\; 式(3)(6) .\end{aligned} (10)

    S个边缘节点与N个交通站点的所有配对看成S\times N个物品\{ (j,s)|\forall s \in \{ 1,2, … ,S\} ,\forall j \in \{ 1,2, … ,N\} \},并将每个节点的配对集合分为一组,共S组. 因此,原问题可规约为一个经典的0-1背包问题:已知每个物品(j,s)的价值和成本分别为{d_s}{c_{js}}, 如何从每组物品中至多选择1个物品,使在总成本{C_0}约束下最大化物品价值\displaystyle\sum \limits_{s = 1}^S \displaystyle\sum \limits_{j = 1}^N {x_{js}}{d_s}. 因为该0-1背包问题是NP-hard问题[31],所以,问题{\text{P1}}也是NP-hard问题,证毕.

    为了解决2.2节所述的子问题P1和P2,本文提出基于边缘智能计算的城市交通感知数据动态自适应恢复系统. 如图1所示,该系统基于交通感知站点中存在缺失的交通感知数据和交通感知站点的交通拓扑网络图,利用边缘智能计算进行感知数据的动态自适应恢复,从而得到精确完整的交通感知数据. 具体地,该系统主要包括2个模块:

    图  1  基于边缘智能计算的城市交通感知数据自适应恢复系统
    Figure  1.  Intelligent edge computing-empowered adaptive urban traffic sensing data recovery system

    1) 具有理论下界的边缘节点次优部署(3.1节). 首先,通过问题等价转化,在3.1.1节分析{\text{P1}}问题的目标函数和约束条件性质;然后,基于理论分析结果,在3.1.2节提出基于子模理论的边缘节点次优部署算法,在多项式时间内能获得该NP-hard问题的具有理论下界的近似最优解.

    2) 基于低秩理论的感知数据自适应恢复(3.2节). 首先,分析交通感知数据的时空维度近似低秩特性,在3.2.1节提出基于低秩理论的交通感知数据恢复算法;然后,基于恢复结果,在3.2.2节利用奇异值分解和矩阵自由度理论估计交通感知数据的非缺失下限,依据此下限值更新感知数据分配比例,保证感知数据的精确恢复.

    1) 问题等价转化. 问题P1包含2类决策变量,即边缘节点部署决策变量{\boldsymbol{x}}和感知数据分配变量{\boldsymbol{y}}. 用{{\boldsymbol{y}}^*}({\boldsymbol{x}})表示给定边缘节点部署规划{\boldsymbol{x}}的最优感知数据分配方案. 通过理论分析,可得引理1.

    引理1. 对于问题P1,如果给定边缘节点部署方案,能够在多项式时间内获得最优的感知数据分配方案{\boldsymbol{y}}.

    证明. 给定任意的边缘节点部署策略{{\boldsymbol{x}}^0} = (x_{js}^0),问题P1转化为只关于{\boldsymbol{y}}的感知数据分配问题{\text{P}}{{\text{1}}' }

    \begin{aligned} &({\rm{P1'}})\mathop {\max }\limits_{\boldsymbol{y}} \displaystyle\sum \limits_{i = 1}^N \displaystyle\sum \limits_{j = 1}^N {w_i}{y_{ij}},\\ &{\text{ s}}{\text{.t}}{\text{.}}\;\;式(2)(7), \end{aligned} (11)
    \sum\limits_{i = 1}^N {{w_i}} {y_{ij}} \leqslant \sum\limits_{s = 1}^S {x_{js}^0} {d_s},\forall j \in \{ 1,2, … ,N\} , (12)
    \sum\limits_{i = 1}^N {{w_i}} {y_{ij}} \geqslant \sum\limits_{s = 1}^S {x_{js}^0} {m_j},\forall j \in \{ 1,2, … ,N\} . (13)

    {\text{P}}{{\text{1}}^\prime }是一个简单的线性规划问题,可利用多种经典的线性规划方法[32]在多项式时间内求得最优解,证毕.

    H({\boldsymbol{x}},{\boldsymbol{y}})表示问题P1的目标函数. 因此,根据引理1,可以将H({\boldsymbol{x}},{\boldsymbol{y}})转化为只关于决策变量{\boldsymbol{x}}的目标函数H({\boldsymbol{x}},{{\boldsymbol{y}}^*}({\boldsymbol{x}})). 进一步地,定义集合函数\mathcal{G}: = \{ (j,s)\mid \forall j \in \{ 1,2,… ,N\} ,s \in \{ 1,2,… ,S\} \}\mathcal{A}: = \{ (j,s)|{x_{js}} = 1,\forall j \in \{ 1, 2,… ,N\} ,s \in \{ 1,2,… ,S\} \} ,\;\;\:F(\mathcal{A}): =H({\boldsymbol{x}},{{\boldsymbol{y}}^*}({\boldsymbol{x}})). 因此,可将问题P1等价转化为集合函数优化问题{\text{P}}{{\text{1}}^{\prime \prime }}

    ({\text{P}}{{\text{1}}''})\mathop {\max }\limits_{\mathcal{A} \subseteq \mathcal{G}} {\text{ }}F(\mathcal{A}), (14)
    {\text{s}}{\text{.t}}{\text{. }}\sum\limits_{j:(j,s) \in \mathcal{A}} {} {1}_{(j,s) \in \mathcal{A}} \leqslant 1,\forall s \in \{ 1,2,… ,S\} , (15)
    \sum\limits_{(j,s) \in \mathcal{A}} {\;\;\:{c_{js}}} \leqslant {C_0}, (16)

    其中1( \cdot )表示指示函数.

    2) 问题性质分析. 下面基于定义1和定义2分别分析问题{\text{P}}{{\text{1}}^{\prime \prime }}的目标函数性质(如引理2)和约束条件性质(如引理3).

    定义1. 非负性、单调性和子模性[33]. 对于一个集合函数F( \cdot ):{2^\mathcal{R}} \to \mathbb{R}\mathcal{R}是一个有限集),如果F(\varnothing) = 0并且F(\mathcal{A}) \geqslant 0\;\;\:(\forall \mathcal{A} \subset \mathcal{R}),则集合函数F( \cdot )是非负的;如果\forall {\mathcal{A}_1} \subseteq {\mathcal{A}_2} \subseteq \mathcal{R}F({\mathcal{A}_1}) \leqslant F({\mathcal{A}_2}),则F( \cdot )是单调的;当且仅当\forall {\mathcal{A}_1} \subseteq {\mathcal{A}_2} \subseteq \mathcal{R}\forall e \in \mathcal{R}\backslash {\mathcal{A}_2}F({\mathcal{A}_1} \cup \{ e\} ) - F({\mathcal{A}_1})\geqslant F({\mathcal{A}_2} \cup \{ e\} )-F({\mathcal{A}_2})F( \cdot ) 是子模的.

    引理2. {\text{P}}{{\text{1}}^{\prime \prime }}的目标函数F(\mathcal{A})(\mathcal{A} \subseteq \mathcal{G})是非负的、单调的和子模的.

    证明. 首先,由于F(\mathcal{A})的物理含义是感知数据量,所以易证其是非负的和单调的.

    其次,证明F(\mathcal{A})是子模的. 根据定义1,要证其是子模的,需证明\forall {\mathcal{A}_1} \subseteq {\mathcal{A}_2} \subseteq \mathcal{G}\forall ({j_1},{s_1}) \in \mathcal{G}\backslash {\mathcal{A}_2},下列不等式恒成立:

    F({\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} ) - F({\mathcal{A}_1}) \geqslant
    F({\mathcal{A}_2} \cup \{ ({j_1},{s_1})\} ) - F({\mathcal{A}_2}). (17)

    {{\boldsymbol{y}}^{(1)}} = (y_{ij}^{(1)}){\hat {\boldsymbol{y}}^{(1)}} = (\hat y_{ij}^{(1)}){{\boldsymbol{y}}^{(2)}} = (y_{ij}^{(2)}){\hat{\boldsymbol{ y}}^{(2)}} = (\hat y_{ij}^{(2)})分别表示基于部署方案{\mathcal{A}_1}{\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} ,{\mathcal{A}_2}{\mathcal{A}_2} \cup \{ ({j_1},{s_1})\} ,求解问题{\text{P}}{{\text{1}}^\prime }所得到的最优感知数据分配解. 为便于后续表述,用{{\boldsymbol{z}}^{(1)}} = (z_{ijs}^{(1)}){{\hat {\boldsymbol z}}^{(1)}}_{} = ({\hat z^{(1)}}_{ijs}), {{\boldsymbol{z}}^{(2)}} = (z_{ijs}^{(2)}){\hat{\boldsymbol{ z}}^{(2)}}_{} = ({\hat z^{(2)}}_{ijs}),等价表示{{\boldsymbol{y}}^{(1)}} = (y_{ij}^{(1)}){\hat{\boldsymbol{ y}}^{(1)}}_{} = (\hat y_{ij}^{(1)}){{\boldsymbol{y}}^{(2)}} = (y_{ij}^{(2)}){\hat{\boldsymbol{ y}}^{(2)}}_{} = (\hat y_{ij}^{(2)}). 其中{z_{ijs}}表示交通感知站点{\lambda _i}上传至部署在{\lambda _j}处边缘节点{e_s}的感知数据比例. 因此可得

    F({\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} ) - F({\mathcal{A}_1}) = \displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(1)} - z_{ijs}^{(1)}) + \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)}.

    同理可得

    F({\mathcal{A}_2} \cup \{ ({j_1},{s_1})\} ) - F({\mathcal{A}_2}) = \displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_2}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(2)} - z_{ijs}^{(2)}) + \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}.

    特别地,由于问题{\text{P}}{{\text{1}}^\prime }是线性规划问题,它的最优感知数据分配解可能不唯一. 因此,为了分析方便,定义{{\boldsymbol{\hat z}}^{(1)}}_{} = ({\hat z^{(1)}}_{ijs}){{\boldsymbol{\hat z}}^{(2)}}_{} = ({\hat z^{(2)}}_{ijs})为所有最优分配解中节点({j_1},{s_1})上感知数据最小的解. 为证明不等式(17)成立,下面证明2个结论.

    1)证明

    \displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(1)} - z_{ijs}^{(1)}) =\displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_2}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(2)} - z_{ijs}^{(2)}).

    \displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(1)} - z_{ijs}^{(1)})\displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_2}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(2)} - z_{ijs}^{(2)}) 分别表示加入部署新节点({j_1},{s_1})后原部署方案{\mathcal{A}_1} {\mathcal{A}_2} 中边缘节点变化的感知数据量.

    首先,证明

    \displaystyle\sum\limits_{(j,s) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(1)} - z_{ijs}^{(1)})=0.

    因为(z_{ijs}^{(1)})是部署方案{\mathcal{A}_1}所对应的最优感知数据分配解,所以

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } (\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) \leqslant 0.

    然后利用反证法可证明

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } (\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) \geqslant 0.

    具体证明:假设该结论不成立,即

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } (\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) < 0.

    因此,该不等式表明加入节点({j_1},{s_1})后,{\mathcal{A}_1}中边缘节点的感知数据量减少. 然而,根据目标函数的单调非减性可知, {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 中节点的感知数据量不会减少. 因此,节点({j_1},{s_1})的感知数据量增加,所以可调整节点({j_1},{s_1})的感知数据到{\mathcal{A}_1}中的边缘节点. 所以 {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 对应的感知数据分配解不是所有最优解中({j_1},{s_1})数据量最小的解. 与结论的前提条件矛盾,即{{\boldsymbol{\hat z}}^{(1)}}_{} = ({\hat z^{(1)}}_{ijs})是所有最优解中({j_1},{s_1})数据量最小的解. 所以假设不成立,原结论成立,即

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} }(\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) \geqslant 0.

    进一步地,因为

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } (\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) \leqslant 0.

    所以,

    \displaystyle\sum\limits_{({j_1},{s_1}) \in {{\mathcal{A}}_1}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } (\hat z_{ijs}^{(1)} - z_{ijs}^{(1)}) = 0.

    同理可证

    \displaystyle\sum\limits_{(j,s) \in {\mathcal{A}_2}} {\displaystyle\sum\limits_{i = 1}^N {{w_i}} } ({\hat z_{ijs}}^{(2)} - z_{ijs}^{(2)}) = 0.

    综上,结论1)成立.

    2)证明

    \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)} \geqslant \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}.

    \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)}\displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}分别表示在部署方案{\mathcal{A}_1}{\mathcal{A}_2}下新节点({j_1},{s_1})分配的感知数据量. 因为{\mathcal{A}_1} \subseteq {\mathcal{A}_2},所以{\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} \cup ({\mathcal{A}_2}\backslash {\mathcal{A}_1})= {\mathcal{A}_2} \cup \{ ({j_1},{s_1})\}. 由结论1)可得,在 {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 中加入{\mathcal{A}_2}\backslash {\mathcal{A}_1}后, {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 感知数据量不变. 因此,利用反证法可证明

    \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)} \geqslant \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}.

    具体证明:假设该结论不成立,即

    \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)} < \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}.

    因此,该不等式表明 {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 加入{\mathcal{A}_2}\backslash {\mathcal{A}_1}后,节点({j_1},{s_1})的感知数据量增加. 由于 {\mathcal{A}_1} \cup \{ ({j_1},{s_1})\} 中边缘节点的感知数据量在{\mathcal{A}_2}\backslash {\mathcal{A}_1}加入前后保持不变,所以可调节({j_1},{s_1})上的感知数据到{\mathcal{A}_1}方案中的边缘节点. 所以, {\mathcal{A}_2} \cup \{ ({j_1},{s_1})\} 对应的感知数据分配解不是所有最优解中({j_1},{s_1})数据量最小的解. 所以假设不成立,原结论成立,即

    \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(1)} \geqslant \displaystyle\sum\limits_{i = 1}^N {{w_i}} \hat z_{i{j_1}{s_1}}^{(2)}.

    结论2)成立.

    基于上述2个结论,可得不等式(17)成立. 因此,F(\mathcal{A})是子模的. 证毕.

    定义2. p-独立系统[34]. 给定一个任意有限集合\mathcal{G},用\mathcal{I}表示\mathcal{G}的子集构成的集合族,即\mathcal{I} \subseteq {2^\mathcal{G}}. 则集合对(\mathcal{G},\mathcal{I})被称为独立系统,当且仅当满足2个条件:①\varnothing \in \mathcal{I};②如果\mathcal{A} \subseteq \mathcal{B} \in \mathcal{I},则\mathcal{A} \in \mathcal{I}.

    说明:\mathcal{I}中的元素被称为独立集. 同时,\forall \mathcal{A} \subseteq \mathcal{G},如果\mathcal{A}中的某个独立集不是\mathcal{A}中的任何一个独立集的子集,那么该独立集被称为\mathcal{A}的基. 用r(\mathcal{A})l(\mathcal{A})分别表示\mathcal{A}的最大基和最小基元素的个数. 对于一个任意独立系统(\mathcal{G},\mathcal{I})和任意集合\mathcal{A} \subseteq \mathcal{G},如果{\max\limits_{\mathcal{A} \subseteq \mathcal{G}}}(r(\mathcal{A})/l(\mathcal{A})) \leqslant p,则独立系统(\mathcal{G},\mathcal{I})被称为p-独立系统.

    引理3. 式(15)(16)构成p-独立系统,且p = 1 + \left\lceil {\max \{ {c_{js}}\} /\min \{ {c_{js}}\} } \right\rceil,其中{c_{js}}表示任意一个边缘节点{e_s}部署在任意一个交通站点{\lambda _j}的成本,\forall j \in \{ 1, 2, … ,N\} , \forall s \in \{ 1,2, … ,S\}.

    证明. 由定义2可知原证明等价于证明(\mathcal{G},{\mathcal{I}_p})构成p-独立系统,其中\mathcal{G}表示边缘节点和交通站点所有可能的配对集合,{\mathcal{I}_p}表示所有可行部署方案的集合. 首先,显然有\varnothing \in {\mathcal{I}_p}. 此外,对于任意2个部署方案\mathcal{X},\mathcal{Y},若其满足\mathcal{X} \subseteq \mathcal{Y} \in {\mathcal{I}_p},则由于满足问题约束条件的可行解的子集也必定满足约束条件,所以任意可行解的子集也必为可行解. 所以必有\mathcal{X} \in {\mathcal{I}_p}. 所以,根据定义2,(\mathcal{G},{\mathcal{I}_p})是一个独立系统.

    考虑任意集合\mathcal{A} \subseteq \mathcal{G},因为{\mathcal{I}_p}是可行解集合. 所以\mathcal{A}中独立集都是可行解. 用{\mathcal{A}_1}{\mathcal{A}_2}分别表示\mathcal{A}中任意2个最大可行解(即满足全部约束已无法再加入元素),现如果向{\mathcal{A}_2}中增加元素(j,s) \in {\mathcal{A}_1}\backslash {\mathcal{A}_2},就需要在{\mathcal{A}_2}中拿出一些元素来满足约束. 为满足式(15),需取出至多1个元素. 为了满足式(16),需取出至多\left\lceil {\max \{ {c_{js}}\} /\min \{ {c_{js}}\} } \right\rceil 个元素. 如此循环直到{\mathcal{A}_2} = {\mathcal{A}_1}. 当最差情况发生时,换入|{\mathcal{A}_1}|个元素需至多换出p|{\mathcal{A}_1}|个元素,即{\mathcal{A}_2}中元素个数至多为 {\mathcal{A}_1} 中元素个数的p倍,所以,根据定义2可得式(15)(16)构成p-独立系统.证毕.

    根据引理2和引理3可得,子问题P1具有非负的、单调的、子模的目标函数,以及p-独立系统的约束条件. 因此,基于文献[35]的启发,为求解子问题P1,本文提出基于子模理论的边缘节点次优部署算法. 如算法1所示.

    算法1. 具有理论下界的边缘节点次优部署算法.

    输入:边缘节点容量上限\{ {d_s}|s \in \{1,2,…,S\}\},交通站点数据规模\{ {w_i}| i\in \{1,2,…,N\}\} ,边缘节点部署成本集合\{ {c_{js}}\} , 总成本预算{C_0}

    输出:边缘节点部署方案{\boldsymbol{x}} = ({x_{js}}),感知数据分配方案{\boldsymbol{y}} = ({y_{ij}}).

    ① 初始化 \mathcal{G} = \{ {x_{js}} = 0|\forall j,s\}

    ② 初始化\mathcal{A} = \varnothing ,\mathcal{B} = \varnothing

    ③ while \mathcal{B} \ne \mathcal{G}

    ④  v=\underset{e\in \mathcal{G}\backslash \mathcal{B}\;\text{satisfying }(15)(16)}{\mathrm{arg}\;\mathrm{max}}F(\mathcal{A}\cup \{e\})

    ⑤  \mathcal{A} = \mathcal{A} \cup \{ v\} ,\mathcal{B} = \mathcal{B} \cup \{ v\}

    ⑥  for \forall e \in \mathcal{G}\backslash \mathcal{B}

    ⑦   if \mathcal{A} \cup \{ e\} 不满足式(15)或式(16)

    ⑧   \mathcal{B} = \mathcal{B} \cup \{ e\}

    ⑨   end if

    ⑩  end for

    ⑪ end while

    ⑫ 令 {x}_{js}=1,\forall (j,s)\in \mathcal{A};

    ⑬ 基于{\boldsymbol{x}} = ({x_{js}}),利用线性规划方法计算{\boldsymbol{y}}

    ⑭ 返回{\boldsymbol{x}},{\boldsymbol{y}}.

    算法1的核心思想是在每次迭代中,贪心地选择当前满足约束的、边际效益值最大的边缘节点部署方案. 具体主要包含2步:

    1) 添加新元素 (行④⑤). 计算\mathcal{G}\backslash \mathcal{B}中所有元素边际效益值,将其中边际效益值最大的元素加入解集\mathcal{A}中. 其中,\mathcal{B}表示当前加入\mathcal{A}中不满足约束的元素集合.

    2) 剔除冲突元素(行⑥~⑩). 在每次向解集\mathcal{A}中添加新元素后,遍历\mathcal{G}\backslash \mathcal{B},将当前无法再被添加至\mathcal{A}中的元素全添加至\mathcal{B}中. 当\mathcal{B} = \mathcal{G}时,表明当前已无可添加至解集\mathcal{A}的元素. 此时得到的\mathcal{A}即为最终解,而后基于\mathcal{A},进一步计算边缘部署方案{\boldsymbol{x}}和感知数据分配方案{\boldsymbol{y}}.

    分析算法1的时间复杂度及解最优性,可得定理2.

    定理2. 算法1能够在多项式时间内获得近似比为 1/(2 + \left\lceil {\max \{ {c_{js}}\} /\min \{ {c_{js}}\} } \right\rceil ) 的近似最优解.

    证明. 基于引理2和3,子问题{\text{P1}}是具有非负、单调和子模的目标函数及p-独立系统约束的优化问题. 由文献[35]可得,基于算法1,可求得近似比为1/ (1 + p)的近似最优解. 根据引理3得p = 1 + \left\lceil \max \{ {c_{js}}\} / \right. \left.\min \{ {c_{js}}\} \right\rceil,因此,算法1可获得近似比为1/(2 + \left\lceil \max \{ {c_{js}}\} /\right. \left.\min \{ {c_{js}}\} \right\rceil )的近似最优解. 此外,算法1最多迭代S次,每次迭代的时间复杂度为O(NS\Gamma ),其中,NS分别表示交通感知站点和边缘节点的数量,\Gamma 表示求解线性规划问题{\rm{P1}}'的多项式时间耗费[32]. 因此,算法1具有多项式时间复杂度,即O(N{S^2}\Gamma ),证毕.

    1) 基于低秩分析的问题转化. 利用实际智能交通感知数据集(详见4. 1节),分别基于时间维度和空间维度,分析不同时间和不同站点交通感知数据的低秩性. 首先,分析在时间维度上的低秩特性. 从数据集中随机选取4个交通站点52h的感知数据组成矩阵,并对该矩阵进行奇异值分解. 如图2(a)所示,矩阵前10个最大奇异值占全部奇异值之和的85%以上,即奇异值累积贡献率为85%. 类似地,分析交通感知数据在空间维度的低秩特性. 对25个交通站点感知数据构成的矩阵进行奇异值分解,如图2(b)所示,前5个最大奇异值占全部奇异值之和的90%以上. 根据低秩理论[36]:如果矩阵中存在少量奇异值之和占所有奇异值总和的比值较大,则该矩阵可以近似认为低秩矩阵. 因此分析可得,交通感知数据矩阵在时间维度和空间维度上都是近似低秩的.

    图  2  在时空维度下基于奇异值分解的交通感知数据低秩分析
    Figure  2.  Low-rank analysis of traffic sensing data matrix based SVD in terms of temporal and spatial dimensions

    基于上述结论可得, {{\boldsymbol{M}}_{js}} 在时空维度是近似低秩的. 由文献[37]可知,如果矩阵是近似低秩的,则通过采样其元素可以找到另一个低秩矩阵{\boldsymbol{X}}来近似表示该矩阵. 因此子问题{\text{P2}}可等价转化为:

    ({\text{P2}}')\min \;\:{\rm{rank}}({\boldsymbol{X}}), (18)
    {\text{s}}{\text{.t.}}\;\;{P_\varOmega }({\boldsymbol{X}}) = {P_\varOmega }({{\boldsymbol{M}}_{js}}), (19)

    其中{\rm{rank}}( · )表示矩阵的秩函数,{P_\varOmega }( · )表示投影采样算子. 因为该秩函数是非连续和非凸的,求解非常困难,且最小化矩阵秩即最小化矩阵非零奇异值个数,可近似看作最小化矩阵奇异值总和(即核范数最小)[37]. 因此,为便于求解,可用核范数\|{\boldsymbol{X}}\|^{*}函数近似代替目标秩函数{\rm{rank}}({\boldsymbol{X}}).

    2) 感知数据精确恢复. 受文献[38]启发,本文提出基于奇异值阈值截断(singular value thresholding, SVT)的缺失数据迭代恢复算法. 该算法的核心思想是在每次迭代中对矩阵进行奇异值分解,然后将较小奇异值置为0,构造新矩阵进行下一轮奇异值分解. 如算法2所示.

    算法2. 基于低秩理论的感知数据自适应恢复算法.

    输入:边缘节点整合的含缺失数据的矩阵{{\boldsymbol{M}}_{js}}

    输出:完整交通感知数据矩阵{{\boldsymbol{X}}^{{\rm{opt}}}}.

    ① 根据矩阵{{\boldsymbol{M}}_{js}}及其缺失元素生成投影采样算    子{P_\varOmega }({{\boldsymbol{M}}_{js}})

    ② 初始化{{\boldsymbol{Y}}^0} = {k_0}\delta {P_\varOmega }({{\boldsymbol{M}}_{js}})

    ③ for k = 1 to {k_{\max }}

    ④ 基于矩阵{{\boldsymbol{Y}}^{k - 1}}的奇异值分解,得到{{\boldsymbol{U}}^{k - 1}},{{\boldsymbol{\varSigma }}^{k - 1}},       {{\boldsymbol{V}}^{k - 1}}

    ⑤ 基于{{\boldsymbol{U}}^{k - 1}},{{\boldsymbol{\varSigma }}^{k - 1}},{{\boldsymbol{V}}^{k - 1}},根据式(21)(22)计算新     矩阵{{\boldsymbol{X}}^k}

    ⑥  if \Vert {P}_{\varOmega }({{\boldsymbol{X}}}^{k}-{{\boldsymbol{M}}}_{js}){\Vert }_{\text{F}}/\Vert {P}_{\varOmega }({{\boldsymbol{M}}}_{js}){\Vert }_{\text{F}}\le \varepsilon

    ⑦   {{\boldsymbol{X}}^{{\text{opt}}}} = {{\boldsymbol{X}}^k}

    ⑧   break;

    ⑨  else

    ⑩  根据式(20)计算新矩阵{{\boldsymbol{Y}}^k}

    ⑪  end if

    ⑫ end for

    ⑬ 基于{{\boldsymbol{X}}^{{\rm{opt}}}},根据式(26)估计恢复矩阵秩{r_{js}}

    ⑭ 根据矩阵的秩估计{r_{js}},计算非缺失下限{m_j},    反馈调整数据分配,更新矩阵{{\boldsymbol{M}}_{js}}.

    算法2主要包括2步:

    1)奇异值分解 (行④). 对{{\boldsymbol{Y}}^{k - 1}}进行奇异值分解为{{\boldsymbol{U}}^{k - 1}},{{\boldsymbol{\varSigma }}^{k - 1}},{{\boldsymbol{V}}^{k - 1}}.

    2)新矩阵构造(行⑤~⑩). 首先,用 \delta _b^{k - 1} 表示{{\boldsymbol{\varSigma }}^{k - 1}}中第b个对角元素即奇异值(总个数为B);然后,根据式(20),基于{{\boldsymbol{U}}^{k - 1}},{{\boldsymbol{\varSigma }}^{k - 1}},{{\boldsymbol{V}}^{k - 1}}构造用于下次迭代的新矩阵{{\boldsymbol{Y}}^k},其中\varOmega 为采样元素索引集合.

    {\boldsymbol{Y}}_{a,b}^k = \left\{ \begin{array}{*{20}{c}} {0,} & {\forall (a,b) \notin \varOmega ,}\\ {{\boldsymbol{Y}}_{a,b}^{k - 1} + \delta ({{({{\boldsymbol{M}}_{js}})}_{a,b}} - {\boldsymbol{X}}_{a,b}^k),} &{\forall (a,b) \in \varOmega ,} \end{array}\right. (20)
    {{\boldsymbol{X}}^k} = \displaystyle\sum_{b = 1}^B(\delta _b^{*k - 1} - \tau ){\boldsymbol{U}}_b^{k - 1}{\boldsymbol{V}}_b^{k - 1}, (21)
    \delta _b^{*k - 1} = \left\{ {\begin{aligned} &{0,}\quad {\forall \delta _b^{k - 1} \leqslant \tau ,} \\ &{\delta _b^{k - 1},} \quad {\forall \delta _b^{k - 1} > \tau . } \end{aligned}} \right. (22)

    以上2步相互迭代,直至满足以下任意一个迭代停止条件:①迭代达到最大次数{k_{\max }}(即行③);②恢复得到的矩阵 {{\boldsymbol{X}}^k} 与原矩阵{{\boldsymbol{M}}_{js}}误差不大于 \varepsilon (即行⑥).

    {{\boldsymbol{M}}_{js}}中缺失元素过多,即边缘节点{e_s}处感知数据量较少,而感知数据间的相关性程度又较小时,很难精确地进行缺失数据恢复. 因此,为保证数据恢复精度,每个边缘节点分配到的感知数据量需满足一定下限,即非缺失下限. 根据矩阵自由度理论[39],精确恢复一个含有缺失元素的矩阵需要的最少采样元素个数为

    N \geqslant r({n_1} + {n_2} - r), (23)

    其中r表示该矩阵的秩即元素间相关性程度,{n_1}{n_2}分别表示该矩阵的行列数. 由式(23)可知,矩阵元素间相关性程度越小,精确恢复缺失数据所需的最少采样元素个数越多.

    根据式(23),当计算基于算法2恢复得到的完整矩阵{{\boldsymbol{X}}^{{\rm{opt}}}}的非缺失下限{m_j}时,{n_1}{n_2}很容易基于其行列数得到. 而矩阵的秩{r_{js}}需进行估计,下面基于奇异值分解估计矩阵{{\boldsymbol{X}}^{{\rm{opt}}}}的秩{r_{js}}

    首先对矩阵{{\boldsymbol{X}}^{{\text{opt}}}}进行奇异值分解为

    {{\boldsymbol{X}}^{{\text{opt}}}} = {{\boldsymbol{U}}_{m \times m}}{{\boldsymbol{\varSigma }}_{m \times n}}{\boldsymbol{V}}_{n \times n}^{\text{T}}, (24)
    {\boldsymbol{\varSigma }} = \left( {\begin{array}{*{20}{c}} {{\sigma _1}}&{\;\;\:}&{\;\;\:} \\ {\;\;\:}& \ddots &{\;\;\:} \\ {\;\;\:}&{\;\;\:}&{{\sigma _n}} \end{array}} \right), (25)

    其中{\sigma }_{1}\geqslant {\sigma }_{2}\geqslant \cdots\geqslant {\sigma }_{n}\geqslant 0.

    由于矩阵的低秩性,因此,可用占全部奇异值总和比例为\eta {\text{ }}(\eta \in [0,1])的最少奇异值个数作为矩阵秩的估计值:

    {r}_{js}=\mathrm{min}\left\{{r\left|\frac{{\displaystyle \sum _{b=1}^{r}{\sigma }_{b}}}{\displaystyle\sum_{b=1}^{B}{\sigma }_{b}}\geqslant \eta\right.} \right\}, (26)

    其中B为矩阵非零奇异值总个数.

    最后,根据矩阵秩的估计值{r}_{js} ,基于式(23)计算非缺失下限,并将该结果反馈至云服务器重新调整感知数据分配方案(子问题{\text{P}}{{\text{1}}^\prime }),以保证缺失感知数据的精确恢复.

    1) 大规模智能交通感知数据集介绍. 本文利用澳大利亚新南威尔士州的交通流量监控系统TVVS的感知数据集进行实验评估. 该感知数据集由部署在道路旁的大约600个交通感知站点的交通监控感知系统产生,基本覆盖整个新南威尔士州. 本文主要采用每个交通站点的交通流量感知数据,采样间隔为1h,采样时间长度为12个月,即2018-01-01—2018-12-31.

    2) 实验方法介绍. 为评估边缘节点部署性能,本文参照实际场景,设定交通站点数据量规模和边缘节点容量等其他参数,同时通过变化交通站点数据量规模、边缘节点容量及部署成本预算,分别评估3种因素对边缘节点部署性能,即所有节点能同时处理的总感知数据量的影响. 在实验评估中,同时考虑了2种不同规模的网络,即大规模网络(N = 100, S = 20)和小规模网络(N = 10,S = 5).

    为了充分地评估交通感知数据恢复的性能,随机地选择24个交通感知站点,将它们中无缺失的感知数据组成实验数据矩阵. 进一步地,在评估过程中,首先变化缺失数据长度(即矩阵缺失元素个数);然后固定缺失数据长度,变化交通感知站点的数量,以评估站点数量对缺失感知数据恢复性能的影响.

    与当前多数边缘节点部署工作[19, 28,40]类似,为了全面地评估边缘节点的部署性能,本文采用3种性能不同的典型对比算法,即最优的、近似最优的、一般的对比算法. 1) OPT. 即最优的边缘节点部署方案,基于暴力搜索对所有可能的部署方案进行穷举以获得最优解. 由于本文的边缘节点部署问题是NP-hard问题,因此,OPT具有指数级计算复杂度,只能适用于小规模网络. 2) HEU[41]. 即基于遗传算法的近似最优启发式算法,将部署方案类比成生物种群,初始化若干方案,并通过模拟自然界种群进化的过程(即遗传、交叉和变异),不断迭代更新以得到近似最优解. 3) RAN. 即随机部署算法,将边缘节点随机地部署在任意交通站点处.

    为了充分评估缺失感知数据恢复性能,采用3种常用的数据恢复算法作为对比算法:1) MR. 即基于回归拟合的缺失数据恢复算法,利用非缺失数据拟合多项式,从而基于该多项式补全缺失数据. 2) KNN[42]. 基于K近邻的缺失数据恢复算法,利用感知数据的时空相关性,通过距离缺失元素最近的k个数据的平均值来估计该缺失值. 3) RF[43]. 基于随机森林回归的缺失感知数据恢复算法,即基于无缺失数据训练随机森林模型,用该模型预测缺失数据.

    在实验评估中,本文采用3种评估指标:1) 边缘节点处理总数据量,即所有部署边缘节点接收到的总感知数据量,如式(1);2) 平均绝对误差(mean absolute error, MAE),即补全数据矩阵元素的估计值与真值之间误差的绝对平均值,如式(27);3) 平均绝对百分比误差(mean absolute percentage error, MAPE),即补全数据矩阵元素的估计误差与真值的百分比平均值,如式(28).

    {{{{MAE}}}} = \frac{1}{T}\mathop \sum \limits_{t = 1}^T |{v_t} - {\hat v_t}|, (27)
    {{{{MAPE}}}} = \frac{1}{T}\mathop \sum \limits_{t = 1}^T \left|\frac{{{v_t} - {{\hat v}_t}}}{{{v_t}}}\right|. (28)

    1) 边缘节点部署性能评估

    ①评估不同交通感知站点的感知数据规模对边缘节点部署性能的影响. 如图3所示,变化交通站点数据规模为实际规模的1.0~2.0倍. 实验结果表明,在小规模网络场景下本文算法比RAN算法性能平均提升25%. 同时,本文算法与HEU算法都能达到OPT算法的95%以上. 主要原因是小规模网络场景中,满足约束的可行部署方案较少,使得HEU算法有较大概率获得性能较优的解,从而性能与本文算法以及OPT算法接近. 但是,在大规模网络场景中,本文算法比HEU算法平均提升性能8.8%,比RAN算法平均提升性能31.6%.

    图  3  不同交通站点感知数据规模对边缘节点部署性能的影响
    Figure  3.  Impact of different sensing data scales of traffic stations on the performance of edge node deployment

    ②评估不同边缘节点容量对边缘节点部署性能的影响. 如图4所示,本文算法比RAN算法,在小规模和大规模网络场景中性能分别平均提升25.9%和28.1%. 虽然本文算法和HEU算法在小规模网络场景中较为接近,都达到了OPT性能的95%以上,但是在大规模场景下本文算法比HEU性能平均提升10.3%.

    图  4  不同边缘节点容量对边缘节点部署性能的影响
    Figure  4.  Impact of different edge node capacities on the performance of edge node deployment

    ③评估不同部署成本预算对边缘节点部署性能的影响. 如图5所示,本文算法比RAN算法,在小规模和大规模网络场景中性能分别平均提升45.2%和32.5%. 同时,在小规模场景中,本文算法和HEU算法都能达到OPT性能的92%. 但是,在大规模网络场景下,本文算法的性能比HEU算法平均提高11.9%.

    图  5  不同总耗费预算对边缘节点部署性能的影响
    Figure  5.  Impact of different total consumption budgets on the performance of edge node deployment

    2) 交通感知数据恢复精度评估

    为了评估本文所提缺失感知数据恢复算法的性能,分别与3种常见缺失数据恢复算法在变化缺失长度和交通站点数量情况下进行比较.

    ①评估不同感知数据缺失长度对缺失数据恢复精度的影响. 如图6所示,实验结果表明,随着感知数据缺失长度的增大,缺失数据恢复的精度也不断降低. 该结果符合常理,即缺失的感知数据量越大,则数据所包含信息量就越小,因此,数据恢复的精度也就越差. 同时,与RF算法、MR算法和KNN算法比较,本文算法的MAE指标分别平均降低48.0%,65.1%, 74.8%,MAPE指标分别平均降低47.8%,62.4%,78.9%.

    图  6  不同缺失数据长度对缺失感知数据恢复精度的影响
    Figure  6.  Impact of different missing data lengths on the accuracy of missing sensing data recovery

    此外,当缺失数据长度较大时,MR和KNN算法恢复的结果不够理想,这是因为基于均值恢复和多项式拟合恢复数据的算法对数据的非缺失程度要求较高,所以当数据缺失程度较大时,选择SVT算法能够保证较好的补全精度.

    ②评估不同交通站点数量对缺失数据恢复精度的影响. 如图7所示,实验结果表明,随着交通站点数量的增多,缺失数据的恢复精度也不断提高. 这是因为随着交通站点数量的增加,矩阵中非缺失元素的比例增加,从而使得缺失数据的恢复精度也不断提高. 此外,与RF算法、MR算法和KNN算法比较,本文算法的MAPE指标分别平均降低50.2%,60.9%,43.8%,MAE指标分别平均降低51.2%,64.5%,47.1%. 同理,由于KNN和MR算法对矩阵中元素非缺失程度的依赖性,使得其在交通站点数量较少时表现出来的性能不够理想.

    图  7  不同交通站点数量对缺失感知数据恢复精度的影响
    Figure  7.  Impact of different number of traffic stations on the accuracy of missing sensing data recovery

    此外,本文还对SVT算法的收敛性进行了验证. 首先,随机选择24个交通站点24天的感知数据组成实验数据矩阵;然后,利用SVT算法,设定不同迭代次数对矩阵进行恢复,得到的结果如图8(a)所示. 可以发现当迭代次数达到90次后,感知数据的恢复精度基本保持不变.

    图  8  SVT 收敛性分析和交通感知数据矩阵秩的变化趋势
    Figure  8.  Convergence analysis of SVT and the trend of rank for traffic sensing data matrix

    ③评估缺失感知数据自适应恢复的性能. 具体地,随机选择16个交通站点14天内的感知数据组成组成实验数据矩阵.

    首先,在实验前,先探究了该矩阵秩随时间变化的情况,结果如图8(b)所示. 可以发现,矩阵秩大小会随时间而产生波动,如第3天(4月25日,澳大利亚退伍老兵日)、第6天和第7天(周末)的感知数据矩阵秩产生了较明显的下降.

    然后,分别采用本文提出的自适应缺失数据恢复算法,即根据恢复结果,计算非缺失下限并调整采样率和非自适应恢复算法,即采样率不随恢复结果自适应变化,对该矩阵进行数据恢复. 实验结果如图9所示,自适应恢复算法比非自适应恢复算法的MAE指标和MAPE指标分别平均降低40.3%和40.4%. 主要原因是感知数据矩阵的秩在随时间波动,即感知数据的相关性程度随时间发生了变化. 而非自适应恢复算法并没有根据相关性程度变化及时调整元素采样率,如当相关性程度减小时,提高采样率,增加非缺失元素的比例. 而本文所提的自适应恢复算法充分考虑了这一因素,因此保证了数据的恢复精度,提高了系统恢复性能的鲁棒性.

    图  9  缺失交通感知数据自适应恢复性能评估
    Figure  9.  Evaluation of adaptive recovery performance of missing traffic sensing data

    此外,本文基于澳大利亚TVVS系统中600个交通站点的感知数据,构建基于边缘智能计算的大规模交通感知数据恢复原型系统,如图10所示.

    图  10  大规模交通感知数据恢复原型系统
    Figure  10.  Large-scale traffic sensing data recovery prototype system

    本文提出一种基于边缘智能计算的城市交通感知数据自适应恢复系统,以解决高计算复杂度的边缘节点部署和高时空动态性的交通感知数据恢复问题. 首先,提出具有理论下界的边缘节点次优部署算法,以解决边缘节点部署这个NP-hard问题. 然后,提出基于低秩理论的缺失感知数据自适应恢复算法,利用低秩理论和奇异值分解,基于恢复结果估计感知数据矩阵的非缺失下限,并根据非缺失下限值的反馈,自适应调整交通站点感知数据分配,从而提高数据恢复的精确性和鲁棒性. 最后,基于实际大规模交通感知数据集构建原型系统,并进行实验评估,实验结果验证所提算法的有效性和鲁棒性.

    在将来的工作中,进一步改进和完善本文存在的缺点和不足,主要包括3个方面:1) 交通站点的拓扑关系与它们感知数据的相关性有关,因此,如何利用交通站点道路拓扑图来进一步提高缺失感知数据精度是下一步的研究工作. 2) 本文只是以交通流量这种典型的交通感知数据作为例子研究交通感知数据恢复且只考虑了来自静态交通感知站点的感知数据. 下一步将延伸和扩展到更多不同来源种类的感知数据,如来自无人机感知[44]和人群感知[45]的城市感知数据等. 3) 本文在恢复交通感知数据时,主要利用感知数据之间的时空相关性,但这些感知数据之间还存在其他多维度的联系,如数据类型等. 下一步将结合其他多维相关性进一步提高恢复精度.

    致 谢 感谢重庆大学计算机学院张乃凡、程梁华、李耀宇对本文所做的贡献!

    作者贡献声明:向朝参和程文辉提出了论文创新点,设计了论文实验方案,并撰写了论文;张昭实现了论文算法;焦贤龙、屈毓锛、陈超和戴海鹏指导了论文写作.

  • 图  1   Attention U-Net网络结构

    Figure  1.   Attention U-Net network architecture

    图  2   注意力门结构

    Figure  2.   Attention gate architecture

    图  3   粗糙神经元结构

    Figure  3.   Rough neuron architecture

    图  4   通道注意力机制

    Figure  4.   Channel attention mechanism

    图  5   RCAR-UNet模型结构

    Figure  5.   Architecture of RCAR-UNet

    图  6   粗糙通道注意力机制

    Figure  6.   Rough channel attention mechanism

    图  7   图像子块以及相对应的掩码子块图

    Figure  7.   Sub-image and corresponding mask sub-image

    图  8   不同模型在不同数据集上的ROC曲线对比

    Figure  8.   Comparison of ROC curves of different models on different datasets

    图  9   不同模型在不同数据集上的PR曲线对比

    Figure  9.   Comparison of PR curves of different models on different datasets

    图  10   各模型视网膜血管分割效果图

    Figure  10.   Segmentation effect diagram of retinal blood vessels of each model

    表  1   基于粗糙通道注意力U-Net模型结构

    Table  1   U-Net Model Architecture Based on Rough Channel Attention

    编号模块图像尺寸
    1输入模块输入层48 \times 48 \times 1
    2编码模块 1卷积层1(3 \times 3卷积核,激活函数ReLu)48 \times 48 \times 32
    卷积层2(3 \times 3卷积核,激活函数ReLu)48 \times 48 \times 32
    残差连接48 \times 48 \times 32
    2 \times 2最大池化层, 步长为224 \times 24 \times 32
    3编码模块 2卷积层3(3 \times 3卷积核,激活函数ReLu)24 \times 24 \times 64
    卷积层4(3 \times 3卷积核,激活函数ReLu)24 \times 24 \times 64
    残差连接24 \times 24 \times 64
    2 \times 2最大池化层, 步长为212 \times 12 \times 64
    编码模块3卷积层5(3 \times 3卷积核,激活函数ReLu)12 \times 12 \times 128
    4卷积层6(3 \times 3卷积核,激活函数ReLu)12 \times 12 \times 128
    残差连接12 \times 12 \times 128
    5解码模块12 \times 2上采样24 \times 24 \times 128
    拼接层1上采样1(24 \times 24 \times 128
    粗糙通道注意力1(24 \times 24 \times 64
    24 \times 24 \times 192
    卷积层7(3 \times 3卷积核,激活函数ReLu)24 \times 24 \times 64
    卷积层8(3 \times 3卷积核,激活函数ReLu)24 \times 24 \times 64
    残差连接24 \times 24 \times 64
    6解码模块22 \times 2上采样48 \times 48 \times 64
    拼接层2上采样2(48 \times 48 \times 64
    粗糙通道注意力2(48 \times 48 \times 32
    48 \times 48 \times 96
    卷积层9(3 \times 3卷积核,激活函数ReLu)48 \times 48 \times 32
    卷积层10(3 \times 3卷积核,激活函数ReLu)48 \times 48 \times 32
    残差连接48 \times 48 \times 32
    7卷积层11(1 \times 1卷积核)48 \times 48 \times 2
    8Softmax激活层48 \times 48 \times 2
    9输出模块输出层48 \times 48 \times 2
    下载: 导出CSV

    表  2   眼底视网膜血管图像数据集信息

    Table  2   Information of Retinal Vessels Image Datasets

    数据集原图金标准图掩码图
    DRIVE
    Stare
    CHASE DB1
    下载: 导出CSV

    表  3   原图与预处理图信息

    Table  3   Information of Original Images and Preprocessed Images

    数据集原图G通道均衡化伽马变换
    DRIVE
    Stare
    CHASE DB1
    下载: 导出CSV

    表  4   混淆矩阵

    Table  4   Confusion Matrix

    真实值预测为正类(血管)预测为负类(背景)
    标签为正类(血管){N_{ {{\rm{TP}}} } }{N_{{\rm{FN}}} }
    标签为负类(背景){N_{ {{\rm{FP}}} } }{N_{{\rm{TN}}} }
    下载: 导出CSV

    表  5   DRIVE数据集对比结果

    Table  5   Comparison Results on DRIVE Dataset

    方法AccS enS pePreJ{F_1}
    FCN0.90010.25890.99460.87540.24970.3996
    Seg-Net0.94400.69500.97740.82220.61930.7649
    U-Net0.95090.70310.98710.88820.64590.7849
    注:黑体数字表示最优值.
    下载: 导出CSV

    表  6   Stare数据集对比结果

    Table  6   Comparison Results on Stare Dataset

    方法AccS enS pePreJ{F_1}
    FCN0.92040.26810.99780.93790.26350.4171
    Seg-Net0.92890.36080.99630.92080.34990.5185
    U-Net0.95260.61240.99290.91180.57820.7327
    注:黑体数字表示最优值.
    下载: 导出CSV

    表  7   CHASE DB1数据集对比结果

    Table  7   Comparison Results on CHASE DB1 Dataset

    方法AccS enS pePreJ{F_1}
    FCN0.93400.47560.97840.68090.38890.5600
    Seg-Net0.93770.54390.97580.68560.43530.6066
    U-Net0.95170.63650.98220.76670.53790.6995
    注:黑体数字表示最优值.
    下载: 导出CSV

    表  8   DRIVE数据集对比结果

    Table  8   Comparison Results on DRIVE Dataset

    方法AccS enS pePreJ{F_1}
    U-Net0.95090.70310.98710.88820.64590.7849
    Attention U-Net0.95270.72970.98530.87860.66290.7973
    RCA-UNet0.95310.73280.98520.87880.66550.7992
    RCAR-UNet0.95370.74870.98360.86960.67320.8047
    注:黑体数字表示最优值.
    下载: 导出CSV

    表  9   Stare数据集对比结果

    Table  9   Comparison Results on Stare Dataset

    方法 { Acc } S en{ S pe } { Pre } J F_{1}
    U-Net0.95260.61240.99290.91180.57820.7327
    Attention U-Net0.95410.62910.99270.91090.59270.7442
    RCA-UNet0.95530.64140.99260.91190.60390.7530
    RCAR-UNet0.95940.69790.99050.90690.64610.7850
    注:黑体数字表示最优值.
    下载: 导出CSV

    表  10   CHASE DB1数据集对比结果

    Table  10   Comparison Results on CHASE DB1 Dataset

    方法 { Acc } S en{ S pe } { Pre } J F_{1}
    U-Net0.95170.63650.98220.76670.53790.6995
    Attention U-Net0.95300.73440.97420.73400.58000.7342
    RCA-UNet0.95560.73980.97650.75360.59570.7466
    RCAR-UNet0.95660.74750.97980.77470.59830.7470
    注:黑体数字表示最优值.
    下载: 导出CSV
  • [1] 梁礼明,黄朝林,石霏,等. 融合形状先验的水平集眼底图像血管分割[J]. 计算机学报,2018,41(7):1678−1692 doi: 10.11897/SP.J.1016.2018.01678

    Liang Liming, Huang Chaolin, Shi Fei, et al. Vessels segmentation of fundus images with level set fusion with shape priors[J]. Chinese Journal of Computers, 2018, 41(7): 1678−1692 (in Chinese) doi: 10.11897/SP.J.1016.2018.01678

    [2]

    Wu Yicheng, Xia Yong, Song Yang, et al. NFN+: A novel network followed network for retinal vessel segmentation[J]. Neural Networks, 2020, 126: 153−162 doi: 10.1016/j.neunet.2020.02.018

    [3]

    Li Xiang, Jiang Yuchen, Li Minglei, et al. Lightweight attention convolutional neural network for retinal vessel image segmentation[J]. IEEE Transactions on Industrial Informatics, 2021, 17(3): 1958−1967 doi: 10.1109/TII.2020.2993842

    [4]

    Cheung C Y, Xu Dejiang, Cheng Chingyun, et al. A deep-learning system for the assessment of cardiovascular disease risk via the measurement of retinal-vessel calibre[J]. Nature Biomedical Engineering, 2021, 5(6): 498−508

    [5]

    Abràmoff M D, Garvin M K, Sonka M. Retinal imaging and image analysis[J]. IEEE Reviews in Biomedical Engineering, 2010, 3: 169−208 doi: 10.1109/RBME.2010.2084567

    [6] 陈加,陈亚松,李伟浩,等. 深度学习在视频对象分割中的应用与展望[J]. 计算机学报,2021,44(3):609−631 doi: 10.11897/SP.J.1016.2021.00609

    Chen Jia, Chen Yasong, Li Weihao, et al. Application and prospect of deep learning in video object segmentation[J]. Chinese Journal of Computers, 2021, 44(3): 609−631 (in Chinese) doi: 10.11897/SP.J.1016.2021.00609

    [7]

    Sun Liang, Shao Wei, Wang Mingliang, et al. High-order feature learning for multi-atlas based label fusion: Application to brain segmentation with MRI[J]. IEEE Transactions on Image Processing, 2019, 29: 2702−2713

    [8]

    Sun Liang, Shao Wei, Zhang Daoqiang, et al. Anatomical attention guided deep networks for ROI segmentation of brain MR images[J]. IEEE Transactions on Medical Imaging, 2019, 39(6): 2000−2012

    [9]

    Hesamian M H, Jia Wenjing, He Xiangjian, et al. Deep learning techniques for medical image segmentation: Achievements and challenges[J]. Journal of Digital Imaging, 2019, 32(4): 582−596 doi: 10.1007/s10278-019-00227-x

    [10]

    Shelhamer E, Long J, Darrell T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 39(4): 640−651

    [11]

    Sun Jindong, Peng Yanjun, Guo Yanfei, et al. Segmentation of the multimodal brain tumor image used the multi-pathway architecture method based on 3D FCN[J]. Neurocomputing, 2021, 423: 34−45 doi: 10.1016/j.neucom.2020.10.031

    [12]

    Ding Henghui, Jiang Xudong, Shuai Bing, et al. Semantic segmentation with context encoding and multi-path decoding[J]. IEEE Transactions on Image Processing, 2020, 29: 3520−3533 doi: 10.1109/TIP.2019.2962685

    [13]

    Wu Congzhong, Sun Jun, Wang Jing, et al. Encoding-decoding network with pyramid self-attention module for retinal vessel segmentation[J]. International Journal of Automation and Computing, 2021, 18(6): 973−980 doi: 10.1007/s11633-020-1277-0

    [14] 何慧,陈胜. 改进预训练编码器U-Net模型的PET肿瘤自动分割[J]. 中国图象图形学报,2020,25(1):171−179 doi: 10.11834/jig.190058

    He Hui, Chen Sheng. Improved pretrained encoder U-Net model for automatic segmentation of PET tumors[J]. Chinese Journal of Image and Graphics, 2020, 25(1): 171−179 (in Chinese) doi: 10.11834/jig.190058

    [15]

    Rundo L, Han C, Nagano Y, et al. USE-Net: Incorporating squeeze-and-excitation blocks into U-Net for prostate zonal segmentation of multi-institutional MRI datasets[J]. Neurocomputing, 2019, 365: 31−43 doi: 10.1016/j.neucom.2019.07.006

    [16]

    Jin Qiangguo, Meng Zhaopeng, Pham T D, et al. DUNet: A deformable network for retinal vessel segmentation[J]. Knowledge-Based Systems, 2019, 178: 149−162 doi: 10.1016/j.knosys.2019.04.025

    [17]

    Basiri M E, Nemati S, Abdar M, et al. ABCDM: An attention-based bidirectional CNN-RNN deep model for sentiment analysis[J]. Future Generation Computer Systems, 2021, 115: 279−294 doi: 10.1016/j.future.2020.08.005

    [18]

    Haut J M, Paoletti M E, Plaza J, et al. Visual attention-driven hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(10): 8065−8080 doi: 10.1109/TGRS.2019.2918080

    [19]

    Guo Bangjun, He Xiuxiu, Lei Yang, et al. Automated left ventricular myocardium segmentation using 3D deeply supervised attention U-Net for coronary computed tomography angiography: CT myocardium segmentation[J]. Medical Physics, 2020, 47(4): 1775−1785 doi: 10.1002/mp.14066

    [20]

    Cui Hengfei, Yuwen Chang, Jiang Lei, et al. Multiscale attention guided U-Net architecture for cardiac segmentation in short-axis MRI images[J]. Computer Methods and Programs in Biomedicine, 2021, 206: 106142

    [21]

    Guo Changlu, Szemenyei M, Yi Yugen, et al. SA-UNet: Spatial attention U-Net for retinal vessel segmentation[C] //Proc of the 25th Int Conf on Pattern Recognition (ICPR2020). Piscataway, NJ: IEEE, 2021: 1236−1242

    [22]

    Tang Xianlun, Zhong Bing, Peng Jiangping, et al. Multi-scale channel importance sorting and spatial attention mechanism for retinal vessels segmentation[J]. Applied Soft Computing, 2020, 93: 106353

    [23]

    Gu Ran, Wang Guotian, Song Tao, et al. CA-Net: Comprehensive attention convolutional neural networks for explainable medical image segmentation[J]. IEEE Transactions on Medical Imaging, 2020, 40(2): 699−711

    [24]

    Mou Lei, Zhao Yitian, Chen Li, et al. CS-Net: Channel and spatial attention network for curvilinear structure segmentation[C] //Proc of the Int Conf on Medical Image Computing and Computer-Assisted Intervention. Berlin: Springer, 2019: 721−730

    [25]

    Pawlak Z. Rough sets[J]. International Journal of Computer and Information Sciences, 1982, 11(5): 341−356 doi: 10.1007/BF01001956

    [26] 刘文,米据生,孙妍. 一种新的犹豫模糊粗糙近似算子的公理刻画[J]. 计算机研究与发展,2021,58(9):2062−2070 doi: 10.7544/issn1000-1239.2021.20200517

    Liu Wen, Mi Jusheng, Sun Yan. Axiomatic characterization of new hesitant fuzzy rough approximation operators[J]. Journal of Computer Research and Development, 2021, 58(9): 2062−2070 (in Chinese) doi: 10.7544/issn1000-1239.2021.20200517

    [27] 苗夺谦,徐菲菲,姚一豫,等. 粒计算的集合论描述[J]. 计算机学报,2012,35(2):2351−2363

    Miao Duoqian, Xu Feifei, Yao Yiyu, et al. A set-theoretic description of granular computing[J]. Chinese Journal of Computers, 2012, 35(2): 2351−2363 (in Chinese)

    [28]

    Oktay O, Schlemper J, Folgoc L L, et al. Attention U-Net: Learning where to look for the pancreas[J]. arXiv preprint, arXiv: 1804.03999, 2018

    [29]

    Lingras P. Rough neural networks[C] //Proc of the 6th Int Conf on Information Processing and Management of Uncertainty in Knowledge Based Systems. Piscataway, NJ: IEEE, 1996: 1445 − 1450

    [30]

    Jelonek J, Krawiec K, Slowiński R. Rough set reduction of attributes, and their domains for neural networks[J]. Computational Intelligence, 1995, 11(2): 339−347 doi: 10.1111/j.1467-8640.1995.tb00036.x

    [31]

    Khodayar M, Kaynak O, Khodayar M E. Rough deep neural architecture for short-term wind speed forecasting[J]. IEEE Transactions on Industrial Informatics, 2017, 13(6): 2770−2779 doi: 10.1109/TII.2017.2730846

    [32]

    Cao Bin, Zhao Jianwei, Lv Zhihan, et al. Multiobjective evolution of fuzzy rough neural network via distributed parallelism for stock prediction[J]. IEEE Transactions on Fuzzy Systems, 2020, 28(5): 939−952 doi: 10.1109/TFUZZ.2020.2972207

    [33]

    Liao Hongmei, Ding Shifei, Wang Miaomiao, et al. An overview on rough neural networks[J]. Neural Computing and Applications, 2016, 27(7): 1805−1816 doi: 10.1007/s00521-015-2009-6

    [34]

    Jahangir H, Tayarani H, Baghali S, et al. A novel electricity price forecasting approach based on dimension reduction strategy and rough artificial neural networks[J]. IEEE Transactions on Industrial Informatics, 2019, 16(4): 2369−2381

    [35]

    Sabzalian M H, Mohammadzadeh A, Lin Shuyi, et al. A robust control of a class of induction motors using rough type-2 fuzzy neural networks[J]. Soft Computing, 2020, 24(13): 9809−9819 doi: 10.1007/s00500-019-04493-3

    [36] 宁尚明,滕飞,李天瑞. 基于多通道自注意力机制的电子病历实体关系抽取[J]. 计算机学报,2020,43(5):916−929 doi: 10.11897/SP.J.1016.2020.00916

    Ning Shangming, Teng Fei, Li Tianrui. Entity relation extraction from electronic medical records based on multi-channel self-attention mechanism[J]. Chinese Journal of Computers, 2020, 43(5): 916−929 (in Chinese) doi: 10.11897/SP.J.1016.2020.00916

    [37] 陈勇,刘曦,刘焕淋. 基于特征通道和空间联合注意机制的遮挡行人检测方法[J]. 电子与信息学报,2020,42(6):1486−1493 doi: 10.11999/JEIT190606

    Chen Yong, Liu Xi, Liu Huanlin. Occluded pedestrian detection method based on feature channel and spatial joint attention mechanism[J]. Journal of Electronics and Information, 2020, 42(6): 1486−1493 (in Chinese) doi: 10.11999/JEIT190606

    [38]

    Ma Jiayi, Zhang Hao, Yi Peng, et al. SCSCN: A separated channel-spatial convolution net with attention for single-view reconstruction[J]. IEEE Transactions on Industrial Electronics, 2019, 67(10): 8649−8658

    [39] 宋 杰,肖 亮,练智超,等. 基于深度学习的数字病理图像分割综述与展望[J]. 软件学报,2021,32(5):1427−1460 doi: 10.13328/j.cnki.jos.006205

    Song Jie, Xiao Liang, Lian Zhichao, et al. Review and prospect of digital pathology image segmentation based on deep learning[J]. Journal of Software, 2021, 32(5): 1427−1460 (in Chinese) doi: 10.13328/j.cnki.jos.006205

    [40] 梁礼明,刘博文,杨海龙,等. 基于多特征融合的有监督视网膜血管提取[J]. 计算机学报,2018,41(11):2566−2580 doi: 10.11897/SP.J.1016.2018.02566

    Liang Liming, Liu Bowen, Yang Hailong, et al. Supervised retinal vessel extraction based on multi-feature fusion[J]. Chinese Journal of Computers, 2018, 41(11): 2566−2580 (in Chinese) doi: 10.11897/SP.J.1016.2018.02566

    [41]

    Liskowski P, Krawiec K. Segmenting retinal blood vessels with deep neural networks[J]. IEEE Transactions on Medical Imaging, 2016, 35(11): 2369−2380 doi: 10.1109/TMI.2016.2546227

    [42]

    Badrinarayanan V, Kendall A, Cipolla R. SegNet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(12): 2481−2495 doi: 10.1109/TPAMI.2016.2644615

  • 期刊类型引用(4)

    1. 邱淼波,高晋,林述波,李椋,王刚,胡卫明,王以政. 线性分解注意力的边缘端高效Transformer跟踪. 中国图象图形学报. 2025(02): 485-502 . 百度学术
    2. 郭虎升,刘正琪,刘艳杰,王文剑. 时空特征强化与感知的视觉目标跟踪方法. 陕西师范大学学报(自然科学版). 2025(01): 60-70 . 百度学术
    3. 张忠林. 基于蒙特卡罗算法的海上目标搜索研究. 中国新通信. 2024(16): 10-12 . 百度学术
    4. 郭虎升. 目标检测综述:从传统方法到深度学习. 新兴科学和技术趋势. 2024(02): 128-145 . 百度学术

    其他类型引用(0)

图(10)  /  表(10)
计量
  • 文章访问数:  421
  • HTML全文浏览量:  96
  • PDF下载量:  198
  • 被引次数: 4
出版历程
  • 收稿日期:  2021-07-05
  • 修回日期:  2022-06-22
  • 网络出版日期:  2023-02-26
  • 刊出日期:  2023-03-31

目录

/

返回文章
返回