2022年 第59卷 第2期
2022, 59(2): 253-254.
DOI: 10.7544/issn1000-1239.2022.qy0201
摘要:
2019年,我国自然资源部发布《智慧城市时空大数据平台建设技术大纲》,强调依托空间数据智能处理,加速我国智慧城市建设进程.智慧城市建设旨在通过对城市大数据进行有效的采集、管理、分析以及挖掘,以强大的算法模型和计算能力为国家、城市、区域治理中的各个应用场景提供智慧赋能,从而提高城市智能管理水平.空间数据智能作为城市计算的基础与核心,在智慧城市建设中扮演关键角色.随着5G、大数据和人工智能等技术的整体推进与日益成熟,以及国家十四五“数据要素化”重大战略和地方政府“智慧城镇化”发展战略的布局实施,亟需探索并攻克“空间数据智能”在理论、方法和应用等多个层面存在的挑战与难题,通过空间数据智能处理打造新型智慧城市,从而推动我国智慧城市建设迈入未来空间智能时代.为此,我们组织了空间数据智能这一专题.本专题特邀空间数据智能领域的宋轩等5位专家学者共同撰写了“空间数据智能:概念、技术与挑战”前瞻论文,对空间数据智能领域的重要议题进行阐述:分别介绍了空间数据智能的概念,空间数据智能领域所面临的技术挑战及关键技术,以及空间数据智能在社会生活中的典型应用场景,并展望空间数据智能研究的发展.本专题公开征文,共收到有效投稿26篇,其中25篇论文通过了形式审查.特约编辑先后邀请了40多位专家参与审稿工作,每篇投稿至少邀请2位专家进行评审.论文最终有8篇论文被本专题录用.录用论文涉及空间数据智能相关的理论、技术、方法与应用研究,一定程度上反映了我国在该专题下的研究水平.根据主题,本专题论文大致可分为2类.
2019年,我国自然资源部发布《智慧城市时空大数据平台建设技术大纲》,强调依托空间数据智能处理,加速我国智慧城市建设进程.智慧城市建设旨在通过对城市大数据进行有效的采集、管理、分析以及挖掘,以强大的算法模型和计算能力为国家、城市、区域治理中的各个应用场景提供智慧赋能,从而提高城市智能管理水平.空间数据智能作为城市计算的基础与核心,在智慧城市建设中扮演关键角色.随着5G、大数据和人工智能等技术的整体推进与日益成熟,以及国家十四五“数据要素化”重大战略和地方政府“智慧城镇化”发展战略的布局实施,亟需探索并攻克“空间数据智能”在理论、方法和应用等多个层面存在的挑战与难题,通过空间数据智能处理打造新型智慧城市,从而推动我国智慧城市建设迈入未来空间智能时代.为此,我们组织了空间数据智能这一专题.本专题特邀空间数据智能领域的宋轩等5位专家学者共同撰写了“空间数据智能:概念、技术与挑战”前瞻论文,对空间数据智能领域的重要议题进行阐述:分别介绍了空间数据智能的概念,空间数据智能领域所面临的技术挑战及关键技术,以及空间数据智能在社会生活中的典型应用场景,并展望空间数据智能研究的发展.本专题公开征文,共收到有效投稿26篇,其中25篇论文通过了形式审查.特约编辑先后邀请了40多位专家参与审稿工作,每篇投稿至少邀请2位专家进行评审.论文最终有8篇论文被本专题录用.录用论文涉及空间数据智能相关的理论、技术、方法与应用研究,一定程度上反映了我国在该专题下的研究水平.根据主题,本专题论文大致可分为2类.
2022, 59(2): 255-263.
DOI: 10.7544/issn1000-1239.20220108
摘要:
随着空间数据体量的持续增长,空间数据所蕴含的价值巨大.传统的数据感知存储技术和处理分析方法已然不能充分挖掘海量空间数据的价值.因此,空间数据智能,一个专注于海量空间数据的研究与应用的多学科交叉的领域,正扮演着越来越重要的角色.介绍了空间数据智能的概念、空间数据智能领域所面临的技术挑战及空间数据智能的关键技术,同时介绍了空间数据智能在社会生活中的典型应用场景,最后对空间数据智能研究的发展做出了展望.
随着空间数据体量的持续增长,空间数据所蕴含的价值巨大.传统的数据感知存储技术和处理分析方法已然不能充分挖掘海量空间数据的价值.因此,空间数据智能,一个专注于海量空间数据的研究与应用的多学科交叉的领域,正扮演着越来越重要的角色.介绍了空间数据智能的概念、空间数据智能领域所面临的技术挑战及空间数据智能的关键技术,同时介绍了空间数据智能在社会生活中的典型应用场景,最后对空间数据智能研究的发展做出了展望.
2022, 59(2): 264-281.
DOI: 10.7544/issn1000-1239.20210913
摘要:
传统的空间并置模式挖掘旨在发现空间中实例频繁共存的特征子集.目前空间并置模式的大多数研究都将模式的频繁性作为兴趣度度量.然而,在实际应用场景中,用户往往不仅对特征集的频繁性感兴趣,而且对它的完整性也感兴趣.结合并置模式的频繁性和完整性,提出主导空间并置模式(dominant spatial co-location patterns, DSCPs),目的是为用户提供一组高质量的并置模式.具体地,在空间并置模式挖掘任务中引入了模式占有度,以衡量并置模式的完整性.我们通过同时考虑模式的完整性和频繁性形式化了主导并置模式挖掘的问题.设计了一个挖掘主导并置模式的基本算法,为了降低计算开销,提出了一系列的剪枝策略及新颖的数据结构改进基本算法的挖掘效率.在合成数据集和真实数据集上进行了实验,评估了所提出算法的效率和有效性,验证了剪枝策略能够大幅提高算法效率.在实际应用中的挖掘结果表明了主导并置模式挖掘的合理性和可用性.
传统的空间并置模式挖掘旨在发现空间中实例频繁共存的特征子集.目前空间并置模式的大多数研究都将模式的频繁性作为兴趣度度量.然而,在实际应用场景中,用户往往不仅对特征集的频繁性感兴趣,而且对它的完整性也感兴趣.结合并置模式的频繁性和完整性,提出主导空间并置模式(dominant spatial co-location patterns, DSCPs),目的是为用户提供一组高质量的并置模式.具体地,在空间并置模式挖掘任务中引入了模式占有度,以衡量并置模式的完整性.我们通过同时考虑模式的完整性和频繁性形式化了主导并置模式挖掘的问题.设计了一个挖掘主导并置模式的基本算法,为了降低计算开销,提出了一系列的剪枝策略及新颖的数据结构改进基本算法的挖掘效率.在合成数据集和真实数据集上进行了实验,评估了所提出算法的效率和有效性,验证了剪枝策略能够大幅提高算法效率.在实际应用中的挖掘结果表明了主导并置模式挖掘的合理性和可用性.
2022, 59(2): 282-293.
DOI: 10.7544/issn1000-1239.20210901
摘要:
交通问题不仅影响人们的出行,同时也会带来环境污染以及安全等问题,准确的交通流预测是构建智能交通系统、预防和缓解交通问题的关键.目前的预测方法大多没有考虑到交通流动态的时空相关性、周期性以及线性与非线性等特点.在充分考虑上述因素的基础上,提出一种基于信息增强传输的时空图神经网络模型,主要包含多特征注意力模块、信息增强传输模块、时间注意力模块以及线性与非线性融合模块.其中,多特征注意力模块捕获多种交通特征之间的内在联系,考虑交通流的周期性;信息增强传输模块充分利用了交通网络信息,以增强交通网络的信息传输能力,进而挖掘出复杂动态的空间依赖关系;时间注意力模块负责自适应地提取不同时间间隔之间的依赖关系;线性与非线性融合模块则同时考虑了数据的线性与非线性特征.论文在真实数据集上进行了大量对比实验,实验结果表明,对比目前较为先进的基线方法,提出的方法在交通流的预测性能方面,体现了较为明显的优势.
交通问题不仅影响人们的出行,同时也会带来环境污染以及安全等问题,准确的交通流预测是构建智能交通系统、预防和缓解交通问题的关键.目前的预测方法大多没有考虑到交通流动态的时空相关性、周期性以及线性与非线性等特点.在充分考虑上述因素的基础上,提出一种基于信息增强传输的时空图神经网络模型,主要包含多特征注意力模块、信息增强传输模块、时间注意力模块以及线性与非线性融合模块.其中,多特征注意力模块捕获多种交通特征之间的内在联系,考虑交通流的周期性;信息增强传输模块充分利用了交通网络信息,以增强交通网络的信息传输能力,进而挖掘出复杂动态的空间依赖关系;时间注意力模块负责自适应地提取不同时间间隔之间的依赖关系;线性与非线性融合模块则同时考虑了数据的线性与非线性特征.论文在真实数据集上进行了大量对比实验,实验结果表明,对比目前较为先进的基线方法,提出的方法在交通流的预测性能方面,体现了较为明显的优势.
2022, 59(2): 294-309.
DOI: 10.7544/issn1000-1239.20210891
摘要:
影响力最大化问题旨在从社交网络中寻找若干具有高影响力的用户节点(种子),以触发最大化的信息传播规模.目前绝大多数工作认为社交网络中所有用户都拥有相同的影响力推广价值.然而,在基于位置的营销活动中,影响力推广的主体通常为带有位置标签的空间对象,考虑到用户在物理世界中的移动受限问题,空间对象仅能吸引其邻近范围内的潜在用户.因此,为了最大化市场营销潜力,商家通常需要同时拥有多个营销目标,譬如,连锁店企业对旗下的多家门店进行联合推广.不同的推广内容以及不同的影响力种子选择都将对营销推广的效益产生切实的影响.鉴于此,综合考虑商家在营销过程中对推广门店位置的选择以及在线上部署影响力传播种子的策略,在地理社交网络中研究基于多目标组合优化的空间感知影响力联合推广问题.首先分析了问题的理论难度,阐明了其与传统影响力最大化问题的区别.为支持高效且准确的问题求解,根据用户推广权重的差异,拓展了现有反向影响力采样(reverse influence sampling, RIS)技术,对不同位置和种子组合下的影响力传播收益进行理论保证下的上下界评估,并基于此提出了迭代处理算法框架,在多个轮次下实现高置信度保障的近似最优求解.最后,通过多组真实数据集上的实验,证明了所研究问题能在多目标组合下有效地提升空间感知的影响力推广效果,并验证了所提出算法的良好性能.
影响力最大化问题旨在从社交网络中寻找若干具有高影响力的用户节点(种子),以触发最大化的信息传播规模.目前绝大多数工作认为社交网络中所有用户都拥有相同的影响力推广价值.然而,在基于位置的营销活动中,影响力推广的主体通常为带有位置标签的空间对象,考虑到用户在物理世界中的移动受限问题,空间对象仅能吸引其邻近范围内的潜在用户.因此,为了最大化市场营销潜力,商家通常需要同时拥有多个营销目标,譬如,连锁店企业对旗下的多家门店进行联合推广.不同的推广内容以及不同的影响力种子选择都将对营销推广的效益产生切实的影响.鉴于此,综合考虑商家在营销过程中对推广门店位置的选择以及在线上部署影响力传播种子的策略,在地理社交网络中研究基于多目标组合优化的空间感知影响力联合推广问题.首先分析了问题的理论难度,阐明了其与传统影响力最大化问题的区别.为支持高效且准确的问题求解,根据用户推广权重的差异,拓展了现有反向影响力采样(reverse influence sampling, RIS)技术,对不同位置和种子组合下的影响力传播收益进行理论保证下的上下界评估,并基于此提出了迭代处理算法框架,在多个轮次下实现高置信度保障的近似最优求解.最后,通过多组真实数据集上的实验,证明了所研究问题能在多目标组合下有效地提升空间感知的影响力推广效果,并验证了所提出算法的良好性能.
2022, 59(2): 310-328.
DOI: 10.7544/issn1000-1239.20210875
摘要:
空间众包技术在现实物理世界中有着丰富的应用场景,得到学术界和工业界的广泛关注.任务分配是空间众包的主要研究问题之一,即把工人分配给合适的任务.但是现有的任务分配方法大多假设众包工人和空间任务出现的位置和时间是已知的,忽略了真实的众包平台中众包工人和空间任务的动态变化,由于空间众包平台的强时效性,这种情况下设计的分配方式只能得到局部最优分配结果.提出最大价值最小成本任务分配的新问题,目标是对当前和未来的工人进行分配,使用最小的移动成本获得最大的分配价值.为解决这一问题,提出了基于轨迹的任务分布预测方法及基于核密度估计的工人分布预测方法,设计基于位置预测的任务分配算法来计算众包工人和空间任务的相对最优分配策略.所提位置预测方法利用图卷积神经网络和ConvLSTM模型进行预测,相较传统基于网格的位置分布预测更加精确和稳定.基于位置预测的启发式分配算法可以在线性时间内结合预测得到的位置信息完成任务分配,更加契合空间众包平台的强时效性.在真实数据集上进行大量实验来证明所提方法的有效性,相比于基于网格的预测方法,任务/工人位置预测准确率分别提高了15.7%和18.8%.
空间众包技术在现实物理世界中有着丰富的应用场景,得到学术界和工业界的广泛关注.任务分配是空间众包的主要研究问题之一,即把工人分配给合适的任务.但是现有的任务分配方法大多假设众包工人和空间任务出现的位置和时间是已知的,忽略了真实的众包平台中众包工人和空间任务的动态变化,由于空间众包平台的强时效性,这种情况下设计的分配方式只能得到局部最优分配结果.提出最大价值最小成本任务分配的新问题,目标是对当前和未来的工人进行分配,使用最小的移动成本获得最大的分配价值.为解决这一问题,提出了基于轨迹的任务分布预测方法及基于核密度估计的工人分布预测方法,设计基于位置预测的任务分配算法来计算众包工人和空间任务的相对最优分配策略.所提位置预测方法利用图卷积神经网络和ConvLSTM模型进行预测,相较传统基于网格的位置分布预测更加精确和稳定.基于位置预测的启发式分配算法可以在线性时间内结合预测得到的位置信息完成任务分配,更加契合空间众包平台的强时效性.在真实数据集上进行大量实验来证明所提方法的有效性,相比于基于网格的预测方法,任务/工人位置预测准确率分别提高了15.7%和18.8%.
2022, 59(2): 329-341.
DOI: 10.7544/issn1000-1239.20210905
摘要:
随着移动互联网的快速发展,许多利用手机App打车的网约车平台也应运而生.这些网约车平台大大减少了网约车的空驶时间和乘客等待时间,从而提高了交通效率.作为平台核心模块,网约车路径规划问题致力于调度空闲的网约车以服务潜在的乘客,从而提升平台的运营效率,近年来受到广泛关注.现有研究主要采用基于值函数的深度强化学习算法(如deep Q-network, DQN)来解决这一问题.然而,由于基于值函数的方法存在局限,无法应用到高维和连续的动作空间.提出了一种具有动作采样策略的执行者-评论者(actor-critic with action sampling policy, AS-AC)算法来学习最优的空驶网约车调度策略,该方法能够感知路网中的供需分布,并根据供需不匹配度来确定最终的调度位置.在纽约市和海口市的网约车订单数据集上的实验表明,该算法取得了比对比算法更低的请求拒绝率.
随着移动互联网的快速发展,许多利用手机App打车的网约车平台也应运而生.这些网约车平台大大减少了网约车的空驶时间和乘客等待时间,从而提高了交通效率.作为平台核心模块,网约车路径规划问题致力于调度空闲的网约车以服务潜在的乘客,从而提升平台的运营效率,近年来受到广泛关注.现有研究主要采用基于值函数的深度强化学习算法(如deep Q-network, DQN)来解决这一问题.然而,由于基于值函数的方法存在局限,无法应用到高维和连续的动作空间.提出了一种具有动作采样策略的执行者-评论者(actor-critic with action sampling policy, AS-AC)算法来学习最优的空驶网约车调度策略,该方法能够感知路网中的供需分布,并根据供需不匹配度来确定最终的调度位置.在纽约市和海口市的网约车订单数据集上的实验表明,该算法取得了比对比算法更低的请求拒绝率.
2022, 59(2): 342-361.
DOI: 10.7544/issn1000-1239.20210904
摘要:
地图匹配是轨迹数据挖掘的基本操作,在许多空间数据智能场景中都非常有用.基于隐马尔可夫模型(hidden Markov model, HMM)的地图匹配算法具有较高的准确率,应用最为广泛,但其计算效率较低,难以应对实时性要求较高的大规模轨迹情形.提出了一个基于路网层次收缩的分布式地图匹配框架CHMM,能够对大规模的轨迹数据实现快速地图匹配.具体而言,提出了一个简单但有效的分区方案,能够解决分布式场景下轨迹数据分布不平衡的问题;提出了一个基于路网层次收缩的多对多最短路径查询算法,能够保证结果不变的情况下,显著提升基于HMM的地图匹配算法的效率.采用真实的路网数据和轨迹数据做了充分的实验,实验结果表明:CHMM算法具有更快的计算效率和更强的可扩展性.CHMM算法落回到了真实的产品中,支持了多个项目的落地.我们也开源了核心代码,并提供了一个在线演示系统.
地图匹配是轨迹数据挖掘的基本操作,在许多空间数据智能场景中都非常有用.基于隐马尔可夫模型(hidden Markov model, HMM)的地图匹配算法具有较高的准确率,应用最为广泛,但其计算效率较低,难以应对实时性要求较高的大规模轨迹情形.提出了一个基于路网层次收缩的分布式地图匹配框架CHMM,能够对大规模的轨迹数据实现快速地图匹配.具体而言,提出了一个简单但有效的分区方案,能够解决分布式场景下轨迹数据分布不平衡的问题;提出了一个基于路网层次收缩的多对多最短路径查询算法,能够保证结果不变的情况下,显著提升基于HMM的地图匹配算法的效率.采用真实的路网数据和轨迹数据做了充分的实验,实验结果表明:CHMM算法具有更快的计算效率和更强的可扩展性.CHMM算法落回到了真实的产品中,支持了多个项目的落地.我们也开源了核心代码,并提供了一个在线演示系统.
2022, 59(2): 362-375.
DOI: 10.7544/issn1000-1239.20210893
摘要:
最短路径查询问题已被研究多年,然而,目前已有大部分工作主要集中在普通图上,针对时态图最短路径查询的研究工作相对较少.时态图中,2个顶点之间有多条边,每条边附带有时态区间,记录着边上代表事件的发生时间和结束时间.时态图最短路径查询在城市交通路径规划、社交网络分析、通信网络挖掘等领域有着广泛的应用.由于最短时态路径的子路径不能保证是最优子结构,传统的普通图最短路径计算方法不再适用于时态图.因此提出了基于压缩转化图树(CTG-tree)索引的查询方法,该方法包含预处理和在线查询2个阶段.预处理阶段将时态图转化为普通图,提出了一种无损压缩方法将转化图压缩以减小图规模,采用层次划分技术将压缩有向图分解为若干个子图,并基于子图建立CTG-tree索引.CTG-tree中的节点保存相应子图内部分顶点之间的最短路径、孩子节点对应子图的边界点之间的最短路径、孩子节点对应子图的边界点与当前节点相应子图的边界点之间的最短路径信息.在线查询阶段基于构建的CTG-tree索引,提出了一种高效的最短路径查询方法.基于4个真实的时态图数据集实验结果表明,与现有方法相比,提出的方法具有更优的查询性能.
最短路径查询问题已被研究多年,然而,目前已有大部分工作主要集中在普通图上,针对时态图最短路径查询的研究工作相对较少.时态图中,2个顶点之间有多条边,每条边附带有时态区间,记录着边上代表事件的发生时间和结束时间.时态图最短路径查询在城市交通路径规划、社交网络分析、通信网络挖掘等领域有着广泛的应用.由于最短时态路径的子路径不能保证是最优子结构,传统的普通图最短路径计算方法不再适用于时态图.因此提出了基于压缩转化图树(CTG-tree)索引的查询方法,该方法包含预处理和在线查询2个阶段.预处理阶段将时态图转化为普通图,提出了一种无损压缩方法将转化图压缩以减小图规模,采用层次划分技术将压缩有向图分解为若干个子图,并基于子图建立CTG-tree索引.CTG-tree中的节点保存相应子图内部分顶点之间的最短路径、孩子节点对应子图的边界点之间的最短路径、孩子节点对应子图的边界点与当前节点相应子图的边界点之间的最短路径信息.在线查询阶段基于构建的CTG-tree索引,提出了一种高效的最短路径查询方法.基于4个真实的时态图数据集实验结果表明,与现有方法相比,提出的方法具有更优的查询性能.
2022, 59(2): 376-389.
DOI: 10.7544/issn1000-1239.20210892
摘要:
作为图论中的基本操作之一,最短路径查询已被广泛应用于路径规划、GPS导航和个性化推荐等基于道路网的相关应用中.针对道路网中在线最短路径查询所面临的计算成本高、查询速度慢等问题,现有方案通常采用缓存技术来优化其性能.考虑到道路网的边权重具有频繁变化的特性,现有工作未能有效地实现缓存数据的快速更新,忽略了缓存数据的时效性,从而导致缓存命中率不高.鉴于此,首先提出一种新的缓存存储结构,能够有效平衡最短路径的整体查询速度与缓存数据更新速度之间的关系;其次,结合路径共享能力及路径多样性设计了新的缓存存储策略,优化缓存收益,继而提高缓存命中率;最后,提出基于缓存的时变最短路径查询(cache-based time-varying shortest path query, CTSPQ)算法.在真实数据集上的实验结果验证了CTSPQ算法的有效性和可扩展性.
作为图论中的基本操作之一,最短路径查询已被广泛应用于路径规划、GPS导航和个性化推荐等基于道路网的相关应用中.针对道路网中在线最短路径查询所面临的计算成本高、查询速度慢等问题,现有方案通常采用缓存技术来优化其性能.考虑到道路网的边权重具有频繁变化的特性,现有工作未能有效地实现缓存数据的快速更新,忽略了缓存数据的时效性,从而导致缓存命中率不高.鉴于此,首先提出一种新的缓存存储结构,能够有效平衡最短路径的整体查询速度与缓存数据更新速度之间的关系;其次,结合路径共享能力及路径多样性设计了新的缓存存储策略,优化缓存收益,继而提高缓存命中率;最后,提出基于缓存的时变最短路径查询(cache-based time-varying shortest path query, CTSPQ)算法.在真实数据集上的实验结果验证了CTSPQ算法的有效性和可扩展性.
2022, 59(2): 390-402.
DOI: 10.7544/issn1000-1239.20200843
摘要:
随着位置服务的不断发展,位置隐私保护已成为隐私保护研究的一个热点.当前已经提出了一系列位置隐私保护方案,这些隐私保护方案大多是基于空间扰动技术来实现的.然而,现有的位置隐私保护研究存在2方面的问题:首先大部分位置隐私保护方案在进行空间扰动时,未考虑用户轨迹点间复杂的关联关系,这样的位置隐私保护方案通常会低估脱敏轨迹的破解风险;其次,脱敏轨迹的破解风险缺乏量化的度量,尽管差分隐私在这一方面做了相当的努力,然而复杂关联关系的存在使得该模型未必能够客观地描述隐私保护的程度.如果不能量化脱敏轨迹的破解风险,也就不能对隐私保护方案建立一个定量的评估指标.因此,首先利用具有关联关系的位置信息,分别设计了利用简单关联关系的Markov攻击算法和利用复杂关联关系的深度神经网络攻击算法,对脱敏轨迹进行了攻击;其次对脱敏轨迹的破解风险进行量化,建立了一个定量的评估方案,用于评估攻击算法对隐私保护方案的威胁程度;最后将这2类攻击算法对Geo-Indistinguishability隐私保护方案进行了攻击,并对攻击效果进行了评估,结果表明Geo-Indistinguishability隐私保护方案抵御了Markov攻击算法的攻击,但未能抵御深度神经网络攻击算法的攻击.
随着位置服务的不断发展,位置隐私保护已成为隐私保护研究的一个热点.当前已经提出了一系列位置隐私保护方案,这些隐私保护方案大多是基于空间扰动技术来实现的.然而,现有的位置隐私保护研究存在2方面的问题:首先大部分位置隐私保护方案在进行空间扰动时,未考虑用户轨迹点间复杂的关联关系,这样的位置隐私保护方案通常会低估脱敏轨迹的破解风险;其次,脱敏轨迹的破解风险缺乏量化的度量,尽管差分隐私在这一方面做了相当的努力,然而复杂关联关系的存在使得该模型未必能够客观地描述隐私保护的程度.如果不能量化脱敏轨迹的破解风险,也就不能对隐私保护方案建立一个定量的评估指标.因此,首先利用具有关联关系的位置信息,分别设计了利用简单关联关系的Markov攻击算法和利用复杂关联关系的深度神经网络攻击算法,对脱敏轨迹进行了攻击;其次对脱敏轨迹的破解风险进行量化,建立了一个定量的评估方案,用于评估攻击算法对隐私保护方案的威胁程度;最后将这2类攻击算法对Geo-Indistinguishability隐私保护方案进行了攻击,并对攻击效果进行了评估,结果表明Geo-Indistinguishability隐私保护方案抵御了Markov攻击算法的攻击,但未能抵御深度神经网络攻击算法的攻击.
2022, 59(2): 403-417.
DOI: 10.7544/issn1000-1239.20200537
摘要:
同时多线程(simultaneous multi-threading, SMT)技术是提升线程级并行度的重要微架构优化技术之一,SMT技术能够在1个物理核上实现2个逻辑核,提升处理器的整体性能.然而,以共享执行端口为代表的SMT环境下特有的时间侧信道安全问题也陆续出现.提出了一种基于动态资源使用策略的SMT环境下执行端口时间侧信道攻击防护方法,基于SMT技术对数据结构资源的不同处理方式设计动态策略调整算法,通过改进处理器端口绑定及调度选择算法以防护SMT环境下执行端口时间侧信道攻击.防护设计实现了端口冲突矩阵、分支过滤器和动态资源使用策略修改器3个组件,该方法在防护有效性上可以达到关闭SMT技术的防护效果且性能开销大大降低,同时硬件开销可控,具有较高的应用价值.
同时多线程(simultaneous multi-threading, SMT)技术是提升线程级并行度的重要微架构优化技术之一,SMT技术能够在1个物理核上实现2个逻辑核,提升处理器的整体性能.然而,以共享执行端口为代表的SMT环境下特有的时间侧信道安全问题也陆续出现.提出了一种基于动态资源使用策略的SMT环境下执行端口时间侧信道攻击防护方法,基于SMT技术对数据结构资源的不同处理方式设计动态策略调整算法,通过改进处理器端口绑定及调度选择算法以防护SMT环境下执行端口时间侧信道攻击.防护设计实现了端口冲突矩阵、分支过滤器和动态资源使用策略修改器3个组件,该方法在防护有效性上可以达到关闭SMT技术的防护效果且性能开销大大降低,同时硬件开销可控,具有较高的应用价值.
2022, 59(2): 418-429.
DOI: 10.7544/issn1000-1239.20200825
摘要:
深度学习与入侵检测相结合已成为当今网络空间安全的热点话题,面临不稳定的网络安全局势,如何能够准确检测出异常流量是入侵检测的重要任务.入侵数据中的每一条样本包含着多个特征,但并不是每一个特征都会决定样本的最终性质,并且某些特征反而会影响模型的判断能力.为了解决这个问题,提出了一种基于残差的双重路由深层胶囊网络的入侵检测模型.该模型使用深层胶囊网络,增强对特征的识别提取,可提取出更高维度的数据特征;使用混合注意力机制对原始数据进行处理,使模型着重关注影响因素大的特征;通过双重路由算法多方位捕捉基于向量表示的特征,并将特征进行聚类;采取残差连接和设置噪音胶囊2个策略来稳定动态路由的过程,以减轻噪音特征的干扰.最后在NSL-KDD数据集和CICIDS2017数据集上进行实验,结果表明准确率最高可达90.31%和99.23%.
深度学习与入侵检测相结合已成为当今网络空间安全的热点话题,面临不稳定的网络安全局势,如何能够准确检测出异常流量是入侵检测的重要任务.入侵数据中的每一条样本包含着多个特征,但并不是每一个特征都会决定样本的最终性质,并且某些特征反而会影响模型的判断能力.为了解决这个问题,提出了一种基于残差的双重路由深层胶囊网络的入侵检测模型.该模型使用深层胶囊网络,增强对特征的识别提取,可提取出更高维度的数据特征;使用混合注意力机制对原始数据进行处理,使模型着重关注影响因素大的特征;通过双重路由算法多方位捕捉基于向量表示的特征,并将特征进行聚类;采取残差连接和设置噪音胶囊2个策略来稳定动态路由的过程,以减轻噪音特征的干扰.最后在NSL-KDD数据集和CICIDS2017数据集上进行实验,结果表明准确率最高可达90.31%和99.23%.
2022, 59(2): 430-439.
DOI: 10.7544/issn1000-1239.20200717
摘要:
本地差分隐私作为一种隐私保护技术,被广泛用于连续数值型数据的均值估计,使用的扰动机制将直接影响均值的准确度.为进一步提高均值估计的准确性,提出了一种满足差分隐私的分类变换扰动机制.该机制对连续数值型数据划分变换范围并进行分段,根据分段将其变换为1维二元分类数据.转换后使用随机响应机制进行扰动,再根据扰动后的数据标识的数值段从中随机均匀抽取数值作为扰动值.在真实数据和合成数据中的均值估计实验结果表明该机制极大地提高了准确性.除此之外,将分类变换扰动机制用于构建满足本地差分隐私的小批量梯度下降算法,并完成线性回归学习任务,实验结果证明该方法同样优于其他已有机制,可得到更小的均方误差.
本地差分隐私作为一种隐私保护技术,被广泛用于连续数值型数据的均值估计,使用的扰动机制将直接影响均值的准确度.为进一步提高均值估计的准确性,提出了一种满足差分隐私的分类变换扰动机制.该机制对连续数值型数据划分变换范围并进行分段,根据分段将其变换为1维二元分类数据.转换后使用随机响应机制进行扰动,再根据扰动后的数据标识的数值段从中随机均匀抽取数值作为扰动值.在真实数据和合成数据中的均值估计实验结果表明该机制极大地提高了准确性.除此之外,将分类变换扰动机制用于构建满足本地差分隐私的小批量梯度下降算法,并完成线性回归学习任务,实验结果证明该方法同样优于其他已有机制,可得到更小的均方误差.
2022, 59(2): 440-451.
DOI: 10.7544/issn1000-1239.20200487
摘要:
车联网是智慧城市的重要组成部分,它能够提供道路安全、交通管理、自动驾驶和互联网内容分发服务.其中,内容分发服务是针对车辆或其驾乘人员的互联网增值服务,它面临着比传统互联网服务更严苛的安全挑战.面向车联网增值服务的密钥协商协议能够为其安全通信初始化会话密钥,但已有的多服务器协议大多存在匿名性和前向安全性脆弱的缺点.最近,Vasudev等人使用Hash函数设计了一种面向车联网增值服务的轻量级认证协议.密码分析显示该协议除了匿名性和前向安全性脆弱之外还存在因智能卡丢失导致系统主密钥泄露的致命缺陷.为了弥补这些不足,使用椭圆曲线密码和Hash函数设计了一种适用于车联网增值服务的认证密钥协商协议.安全分析显示,该提案能够满足随机预言模型下的认证密钥协商安全性,具有强匿名性和前向安全性,并且能够抵抗已知的互联网攻击.性能分析显示,所提协议安全性能优于同类协议、用户侧的通信开销至少降低了34%.
车联网是智慧城市的重要组成部分,它能够提供道路安全、交通管理、自动驾驶和互联网内容分发服务.其中,内容分发服务是针对车辆或其驾乘人员的互联网增值服务,它面临着比传统互联网服务更严苛的安全挑战.面向车联网增值服务的密钥协商协议能够为其安全通信初始化会话密钥,但已有的多服务器协议大多存在匿名性和前向安全性脆弱的缺点.最近,Vasudev等人使用Hash函数设计了一种面向车联网增值服务的轻量级认证协议.密码分析显示该协议除了匿名性和前向安全性脆弱之外还存在因智能卡丢失导致系统主密钥泄露的致命缺陷.为了弥补这些不足,使用椭圆曲线密码和Hash函数设计了一种适用于车联网增值服务的认证密钥协商协议.安全分析显示,该提案能够满足随机预言模型下的认证密钥协商安全性,具有强匿名性和前向安全性,并且能够抵抗已知的互联网攻击.性能分析显示,所提协议安全性能优于同类协议、用户侧的通信开销至少降低了34%.
2022, 59(2): 452-462.
DOI: 10.7544/issn1000-1239.20200669
摘要:
无线基础设施的广泛部署使得基于WiFi的指纹定位方法成为了最具普适性的定位方法之一.然而,指纹库构建过程的耗时费力阻碍了基于接收信号强度(received signal strength indication, RSSI)指纹定位的发展.针对指纹库构建难问题,提出了一种基于众包的低成本、高效率的多楼层指纹库构建方法-MCSLoc.首先将室内平面地图转换为室内语义地图;然后采集众包用户智能手机内置惯性传感单元(inertial measurement unit, IMU)数据,采用卡尔曼滤波(Kalman filter, KF)融合算法划分传感数据到所属楼层.提出分段式轨迹获取方法,根据传感数据获取用户相对轨迹和RSSI值序列;最后利用隐马尔可夫模型(hidden Markov model, HMM)和轨迹匹配维特比(track matching Viterbi, TM-Viterbi)算法将相对轨迹与室内语义地图主路径相匹配,为RSSI值序列标注楼层标签和物理位置标签.MCSLoc方法的HMM地图匹配算法无需用户初始位置,实现众包用户弱意识参与.实验结果表明MCSLoc可以快速获取轨迹绝对初始位置,有效构建多楼层指纹库,提高多楼层定位效率.
无线基础设施的广泛部署使得基于WiFi的指纹定位方法成为了最具普适性的定位方法之一.然而,指纹库构建过程的耗时费力阻碍了基于接收信号强度(received signal strength indication, RSSI)指纹定位的发展.针对指纹库构建难问题,提出了一种基于众包的低成本、高效率的多楼层指纹库构建方法-MCSLoc.首先将室内平面地图转换为室内语义地图;然后采集众包用户智能手机内置惯性传感单元(inertial measurement unit, IMU)数据,采用卡尔曼滤波(Kalman filter, KF)融合算法划分传感数据到所属楼层.提出分段式轨迹获取方法,根据传感数据获取用户相对轨迹和RSSI值序列;最后利用隐马尔可夫模型(hidden Markov model, HMM)和轨迹匹配维特比(track matching Viterbi, TM-Viterbi)算法将相对轨迹与室内语义地图主路径相匹配,为RSSI值序列标注楼层标签和物理位置标签.MCSLoc方法的HMM地图匹配算法无需用户初始位置,实现众包用户弱意识参与.实验结果表明MCSLoc可以快速获取轨迹绝对初始位置,有效构建多楼层指纹库,提高多楼层定位效率.
2022, 59(2): 463-477.
DOI: 10.7544/issn1000-1239.20200671
摘要:
人机交互是物联网迈向智能化的重要途径,而人体动作识别已成为智能环境实现的关键环节.由于WiFi具有良好的用户体验和极高的普适性以及低廉的部署成本,基于WiFi的人体运动识别技术从众多交互技术中脱颖而出,已在智能安防、运动保健、老年活跃检测等领域展现了巨大的应用价值.现有的WiFi动作识别工作中,动作识别受人体的运动方向影响严重,为了确保识别精度往往需要固定动作方向,这种方向依赖性对基于WiFi的动作识别技术造成了极大的阻碍.为了克服这一限制,提出一种方向无关的动作识别模型.该模型利用天线分集消除随机的相位偏移,将人体运动在频域上造成的多普勒频移与快速傅里叶变换值作为识别特征,并引入注意力机制的双向GRU(gate recurrent unit)来对运动进行分类识别.该模型将空间特征集成到时间模型中,提升了无线信号对人体动作识别的鲁棒性与准确性.在典型室内环境下的实验结果显示了优越的性能与93%的准确率,验证了该模型优于之前的识别模型.
人机交互是物联网迈向智能化的重要途径,而人体动作识别已成为智能环境实现的关键环节.由于WiFi具有良好的用户体验和极高的普适性以及低廉的部署成本,基于WiFi的人体运动识别技术从众多交互技术中脱颖而出,已在智能安防、运动保健、老年活跃检测等领域展现了巨大的应用价值.现有的WiFi动作识别工作中,动作识别受人体的运动方向影响严重,为了确保识别精度往往需要固定动作方向,这种方向依赖性对基于WiFi的动作识别技术造成了极大的阻碍.为了克服这一限制,提出一种方向无关的动作识别模型.该模型利用天线分集消除随机的相位偏移,将人体运动在频域上造成的多普勒频移与快速傅里叶变换值作为识别特征,并引入注意力机制的双向GRU(gate recurrent unit)来对运动进行分类识别.该模型将空间特征集成到时间模型中,提升了无线信号对人体动作识别的鲁棒性与准确性.在典型室内环境下的实验结果显示了优越的性能与93%的准确率,验证了该模型优于之前的识别模型.
2022, 59(2): 478-487.
DOI: 10.7544/issn1000-1239.20200668
摘要:
随着科技的迅猛发展,具有计算和存储能力的边缘设备数量不断增加,产生的数据流量更是呈指数式增长,这使得以云计算为核心的集中式处理模式难以高效处理边缘设备产生的数据.另外,由于边缘网络设备的多样性以及数据表示手段的不断丰富,多模态数据广泛存在.为充分利用边缘设备上的异构数据,解决边缘计算中由于数据隐私引起的“数据通信壁垒”问题,提出了一种联邦学习中基于Tucker分解的多源异构数据融合算法.该算法针对异构数据在无交互条件下的融合问题,引入张量Tucker分解理论,通过构建一个具有异构空间维度特性的高阶张量以捕捉异构数据的高维特征,从而实现联邦学习中多源异构数据的融合.最后,在MOSI数据集上验证了算法的有效性.
随着科技的迅猛发展,具有计算和存储能力的边缘设备数量不断增加,产生的数据流量更是呈指数式增长,这使得以云计算为核心的集中式处理模式难以高效处理边缘设备产生的数据.另外,由于边缘网络设备的多样性以及数据表示手段的不断丰富,多模态数据广泛存在.为充分利用边缘设备上的异构数据,解决边缘计算中由于数据隐私引起的“数据通信壁垒”问题,提出了一种联邦学习中基于Tucker分解的多源异构数据融合算法.该算法针对异构数据在无交互条件下的融合问题,引入张量Tucker分解理论,通过构建一个具有异构空间维度特性的高阶张量以捕捉异构数据的高维特征,从而实现联邦学习中多源异构数据的融合.最后,在MOSI数据集上验证了算法的有效性.