ISSN 1000-1239 CN 11-1777/TP

    2022空间数据智能专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 空间数据智能专题前言
    孟小峰, 高云君, 关庆锋, 李勇
    计算机研究与发展    2022, 59 (2): 253-254.   doi: 10.7544/issn1000-1239.2022.qy0201
    录用日期: 2022-01-28

    摘要596)   HTML7)    PDF (219KB)(293)   
    2019年,我国自然资源部发布《智慧城市时空大数据平台建设技术大纲》,强调依托空间数据智能处理,加速我国智慧城市建设进程.智慧城市建设旨在通过对城市大数据进行有效的采集、管理、分析以及挖掘,以强大的算法模型和计算能力为国家、城市、区域治理中的各个应用场景提供智慧赋能,从而提高城市智能管理水平.空间数据智能作为城市计算的基础与核心,在智慧城市建设中扮演关键角色.随着5G、大数据和人工智能等技术的整体推进与日益成熟,以及国家十四五“数据要素化”重大战略和地方政府“智慧城镇化”发展战略的布局实施,亟需探索并攻克“空间数据智能”在理论、方法和应用等多个层面存在的挑战与难题,通过空间数据智能处理打造新型智慧城市,从而推动我国智慧城市建设迈入未来空间智能时代.为此,我们组织了空间数据智能这一专题.本专题特邀空间数据智能领域的宋轩等5位专家学者共同撰写了“空间数据智能:概念、技术与挑战”前瞻论文,对空间数据智能领域的重要议题进行阐述:分别介绍了空间数据智能的概念,空间数据智能领域所面临的技术挑战及关键技术,以及空间数据智能在社会生活中的典型应用场景,并展望空间数据智能研究的发展.本专题公开征文,共收到有效投稿26篇,其中25篇论文通过了形式审查.特约编辑先后邀请了40多位专家参与审稿工作,每篇投稿至少邀请2位专家进行评审.论文最终有8篇论文被本专题录用.录用论文涉及空间数据智能相关的理论、技术、方法与应用研究,一定程度上反映了我国在该专题下的研究水平.根据主题,本专题论文大致可分为2类.
    相关文章 | 计量指标
    2. 空间数据智能:概念、技术与挑战
    宋轩, 高云君, 李勇, 关庆锋, 孟小峰
    计算机研究与发展    2022, 59 (2): 255-263.   doi: 10.7544/issn1000-1239.20220108
    摘要919)   HTML25)    PDF (690KB)(637)   
    随着空间数据体量的持续增长,空间数据所蕴含的价值巨大.传统的数据感知存储技术和处理分析方法已然不能充分挖掘海量空间数据的价值.因此,空间数据智能,一个专注于海量空间数据的研究与应用的多学科交叉的领域,正扮演着越来越重要的角色.介绍了空间数据智能的概念、空间数据智能领域所面临的技术挑战及空间数据智能的关键技术,同时介绍了空间数据智能在社会生活中的典型应用场景,最后对空间数据智能研究的发展做出了展望.
    相关文章 | 计量指标
    3. 基于空间占有度的主导并置模式挖掘
    方圆, 王丽珍, 王晓璇, 杨培忠
    计算机研究与发展    2022, 59 (2): 264-281.   doi: 10.7544/issn1000-1239.20210913
    摘要230)   HTML6)    PDF (4254KB)(184)   
    传统的空间并置模式挖掘旨在发现空间中实例频繁共存的特征子集.目前空间并置模式的大多数研究都将模式的频繁性作为兴趣度度量.然而,在实际应用场景中,用户往往不仅对特征集的频繁性感兴趣,而且对它的完整性也感兴趣.结合并置模式的频繁性和完整性,提出主导空间并置模式(dominant spatial co-location patterns, DSCPs),目的是为用户提供一组高质量的并置模式.具体地,在空间并置模式挖掘任务中引入了模式占有度,以衡量并置模式的完整性.我们通过同时考虑模式的完整性和频繁性形式化了主导并置模式挖掘的问题.设计了一个挖掘主导并置模式的基本算法,为了降低计算开销,提出了一系列的剪枝策略及新颖的数据结构改进基本算法的挖掘效率.在合成数据集和真实数据集上进行了实验,评估了所提出算法的效率和有效性,验证了剪枝策略能够大幅提高算法效率.在实际应用中的挖掘结果表明了主导并置模式挖掘的合理性和可用性.
    相关文章 | 计量指标
    4. 基于信息增强传输的时空图神经网络交通流预测
    倪庆剑, 彭文强, 张志政, 翟玉庆
    计算机研究与发展    2022, 59 (2): 282-293.   doi: 10.7544/issn1000-1239.20210901
    摘要462)   HTML9)    PDF (1313KB)(404)   
    交通问题不仅影响人们的出行,同时也会带来环境污染以及安全等问题,准确的交通流预测是构建智能交通系统、预防和缓解交通问题的关键.目前的预测方法大多没有考虑到交通流动态的时空相关性、周期性以及线性与非线性等特点.在充分考虑上述因素的基础上,提出一种基于信息增强传输的时空图神经网络模型,主要包含多特征注意力模块、信息增强传输模块、时间注意力模块以及线性与非线性融合模块.其中,多特征注意力模块捕获多种交通特征之间的内在联系,考虑交通流的周期性;信息增强传输模块充分利用了交通网络信息,以增强交通网络的信息传输能力,进而挖掘出复杂动态的空间依赖关系;时间注意力模块负责自适应地提取不同时间间隔之间的依赖关系;线性与非线性融合模块则同时考虑了数据的线性与非线性特征.论文在真实数据集上进行了大量对比实验,实验结果表明,对比目前较为先进的基线方法,提出的方法在交通流的预测性能方面,体现了较为明显的优势.
    相关文章 | 计量指标
    5. 地理社交网络中基于多目标组合优化的空间感知影响力联合最大化
    金鹏飞, 常雪芹, 房子荃, 李淼
    计算机研究与发展    2022, 59 (2): 294-309.   doi: 10.7544/issn1000-1239.20210891
    摘要179)   HTML4)    PDF (4256KB)(159)   
    影响力最大化问题旨在从社交网络中寻找若干具有高影响力的用户节点(种子),以触发最大化的信息传播规模.目前绝大多数工作认为社交网络中所有用户都拥有相同的影响力推广价值.然而,在基于位置的营销活动中,影响力推广的主体通常为带有位置标签的空间对象,考虑到用户在物理世界中的移动受限问题,空间对象仅能吸引其邻近范围内的潜在用户.因此,为了最大化市场营销潜力,商家通常需要同时拥有多个营销目标,譬如,连锁店企业对旗下的多家门店进行联合推广.不同的推广内容以及不同的影响力种子选择都将对营销推广的效益产生切实的影响.鉴于此,综合考虑商家在营销过程中对推广门店位置的选择以及在线上部署影响力传播种子的策略,在地理社交网络中研究基于多目标组合优化的空间感知影响力联合推广问题.首先分析了问题的理论难度,阐明了其与传统影响力最大化问题的区别.为支持高效且准确的问题求解,根据用户推广权重的差异,拓展了现有反向影响力采样(reverse influence sampling, RIS)技术,对不同位置和种子组合下的影响力传播收益进行理论保证下的上下界评估,并基于此提出了迭代处理算法框架,在多个轮次下实现高置信度保障的近似最优求解.最后,通过多组真实数据集上的实验,证明了所研究问题能在多目标组合下有效地提升空间感知的影响力推广效果,并验证了所提出算法的良好性能.
    相关文章 | 计量指标
    6. 一种基于时空位置预测的空间众包任务分配方法
    徐天承, 乔少杰, 武俊, 韩楠, 岳昆, 易玉根, 黄发良, 元昌安
    计算机研究与发展    2022, 59 (2): 310-328.   doi: 10.7544/issn1000-1239.20210875
    摘要288)   HTML13)    PDF (2947KB)(204)   
    空间众包技术在现实物理世界中有着丰富的应用场景,得到学术界和工业界的广泛关注.任务分配是空间众包的主要研究问题之一,即把工人分配给合适的任务.但是现有的任务分配方法大多假设众包工人和空间任务出现的位置和时间是已知的,忽略了真实的众包平台中众包工人和空间任务的动态变化,由于空间众包平台的强时效性,这种情况下设计的分配方式只能得到局部最优分配结果.提出最大价值最小成本任务分配的新问题,目标是对当前和未来的工人进行分配,使用最小的移动成本获得最大的分配价值.为解决这一问题,提出了基于轨迹的任务分布预测方法及基于核密度估计的工人分布预测方法,设计基于位置预测的任务分配算法来计算众包工人和空间任务的相对最优分配策略.所提位置预测方法利用图卷积神经网络和ConvLSTM模型进行预测,相较传统基于网格的位置分布预测更加精确和稳定.基于位置预测的启发式分配算法可以在线性时间内结合预测得到的位置信息完成任务分配,更加契合空间众包平台的强时效性.在真实数据集上进行大量实验来证明所提方法的有效性,相比于基于网格的预测方法,任务/工人位置预测准确率分别提高了15.7%和18.8%.
    相关文章 | 计量指标
    7. 基于深度强化学习的网约车动态路径规划
    郑渤龙, 明岭峰, 胡琦, 方一向, 郑凯, 李国徽
    计算机研究与发展    2022, 59 (2): 329-341.   doi: 10.7544/issn1000-1239.20210905
    摘要755)   HTML22)    PDF (2081KB)(598)   
    随着移动互联网的快速发展,许多利用手机App打车的网约车平台也应运而生.这些网约车平台大大减少了网约车的空驶时间和乘客等待时间,从而提高了交通效率.作为平台核心模块,网约车路径规划问题致力于调度空闲的网约车以服务潜在的乘客,从而提升平台的运营效率,近年来受到广泛关注.现有研究主要采用基于值函数的深度强化学习算法(如deep Q-network, DQN)来解决这一问题.然而,由于基于值函数的方法存在局限,无法应用到高维和连续的动作空间.提出了一种具有动作采样策略的执行者-评论者(actor-critic with action sampling policy, AS-AC)算法来学习最优的空驶网约车调度策略,该方法能够感知路网中的供需分布,并根据供需不匹配度来确定最终的调度位置.在纽约市和海口市的网约车订单数据集上的实验表明,该算法取得了比对比算法更低的请求拒绝率.
    相关文章 | 计量指标
    8. 基于路网层次收缩的快速分布式地图匹配算法
    李瑞远, 朱浩文, 王如斌, 陈超, 郑宇
    计算机研究与发展    2022, 59 (2): 342-361.   doi: 10.7544/issn1000-1239.20210904
    摘要385)   HTML11)    PDF (3130KB)(237)   
    地图匹配是轨迹数据挖掘的基本操作,在许多空间数据智能场景中都非常有用.基于隐马尔可夫模型(hidden Markov model, HMM)的地图匹配算法具有较高的准确率,应用最为广泛,但其计算效率较低,难以应对实时性要求较高的大规模轨迹情形.提出了一个基于路网层次收缩的分布式地图匹配框架CHMM,能够对大规模的轨迹数据实现快速地图匹配.具体而言,提出了一个简单但有效的分区方案,能够解决分布式场景下轨迹数据分布不平衡的问题;提出了一个基于路网层次收缩的多对多最短路径查询算法,能够保证结果不变的情况下,显著提升基于HMM的地图匹配算法的效率.采用真实的路网数据和轨迹数据做了充分的实验,实验结果表明:CHMM算法具有更快的计算效率和更强的可扩展性.CHMM算法落回到了真实的产品中,支持了多个项目的落地.我们也开源了核心代码,并提供了一个在线演示系统.
    相关文章 | 计量指标
    9. 时态图最短路径查询方法
    张天明, 徐一恒, 蔡鑫伟, 范菁
    计算机研究与发展    2022, 59 (2): 362-375.   doi: 10.7544/issn1000-1239.20210893
    摘要268)   HTML4)    PDF (1242KB)(153)   
    最短路径查询问题已被研究多年,然而,目前已有大部分工作主要集中在普通图上,针对时态图最短路径查询的研究工作相对较少.时态图中,2个顶点之间有多条边,每条边附带有时态区间,记录着边上代表事件的发生时间和结束时间.时态图最短路径查询在城市交通路径规划、社交网络分析、通信网络挖掘等领域有着广泛的应用.由于最短时态路径的子路径不能保证是最优子结构,传统的普通图最短路径计算方法不再适用于时态图.因此提出了基于压缩转化图树(CTG-tree)索引的查询方法,该方法包含预处理和在线查询2个阶段.预处理阶段将时态图转化为普通图,提出了一种无损压缩方法将转化图压缩以减小图规模,采用层次划分技术将压缩有向图分解为若干个子图,并基于子图建立CTG-tree索引.CTG-tree中的节点保存相应子图内部分顶点之间的最短路径、孩子节点对应子图的边界点之间的最短路径、孩子节点对应子图的边界点与当前节点相应子图的边界点之间的最短路径信息.在线查询阶段基于构建的CTG-tree索引,提出了一种高效的最短路径查询方法.基于4个真实的时态图数据集实验结果表明,与现有方法相比,提出的方法具有更优的查询性能.
    相关文章 | 计量指标
    10. 基于缓存的时变道路网最短路径查询算法
    黄阳, 周旭, 杨志邦, 余婷, 张吉, 曾源远, 李肯立
    计算机研究与发展    2022, 59 (2): 376-389.   doi: 10.7544/issn1000-1239.20210892
    摘要181)   HTML3)    PDF (2328KB)(125)   
    作为图论中的基本操作之一,最短路径查询已被广泛应用于路径规划、GPS导航和个性化推荐等基于道路网的相关应用中.针对道路网中在线最短路径查询所面临的计算成本高、查询速度慢等问题,现有方案通常采用缓存技术来优化其性能.考虑到道路网的边权重具有频繁变化的特性,现有工作未能有效地实现缓存数据的快速更新,忽略了缓存数据的时效性,从而导致缓存命中率不高.鉴于此,首先提出一种新的缓存存储结构,能够有效平衡最短路径的整体查询速度与缓存数据更新速度之间的关系;其次,结合路径共享能力及路径多样性设计了新的缓存存储策略,优化缓存收益,继而提高缓存命中率;最后,提出基于缓存的时变最短路径查询(cache-based time-varying shortest path query, CTSPQ)算法.在真实数据集上的实验结果验证了CTSPQ算法的有效性和可扩展性.
    相关文章 | 计量指标