• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

分布式RDF数据管理综述

邹磊, 彭鹏

邹磊, 彭鹏. 分布式RDF数据管理综述[J]. 计算机研究与发展, 2017, 54(6): 1213-1224. DOI: 10.7544/issn1000-1239.2017.20160908
引用本文: 邹磊, 彭鹏. 分布式RDF数据管理综述[J]. 计算机研究与发展, 2017, 54(6): 1213-1224. DOI: 10.7544/issn1000-1239.2017.20160908
Zou Lei, Peng Peng. A Survey of Distributed RDF Data Management[J]. Journal of Computer Research and Development, 2017, 54(6): 1213-1224. DOI: 10.7544/issn1000-1239.2017.20160908
Citation: Zou Lei, Peng Peng. A Survey of Distributed RDF Data Management[J]. Journal of Computer Research and Development, 2017, 54(6): 1213-1224. DOI: 10.7544/issn1000-1239.2017.20160908
邹磊, 彭鹏. 分布式RDF数据管理综述[J]. 计算机研究与发展, 2017, 54(6): 1213-1224. CSTR: 32373.14.issn1000-1239.2017.20160908
引用本文: 邹磊, 彭鹏. 分布式RDF数据管理综述[J]. 计算机研究与发展, 2017, 54(6): 1213-1224. CSTR: 32373.14.issn1000-1239.2017.20160908
Zou Lei, Peng Peng. A Survey of Distributed RDF Data Management[J]. Journal of Computer Research and Development, 2017, 54(6): 1213-1224. CSTR: 32373.14.issn1000-1239.2017.20160908
Citation: Zou Lei, Peng Peng. A Survey of Distributed RDF Data Management[J]. Journal of Computer Research and Development, 2017, 54(6): 1213-1224. CSTR: 32373.14.issn1000-1239.2017.20160908

分布式RDF数据管理综述

基金项目: 国家自然科学基金优秀青年科学基金项目(61622201)
详细信息
  • 中图分类号: TP392

A Survey of Distributed RDF Data Management

  • 摘要: 资源描述框架(resource description framework, RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行查询检索.随着RDF数据规模的日益增长,在现有RDF数据库上进行SPARQL查询处理已经超出了单机的处理能力.于是,人们需要设计出高性能的分布式RDF数据库以支持对SPARQL查询进行高效的处理.当前,已经有大量的工作来讨论如何搭建分布式RDF数据管理系统.对这些不同的分布式RDF数据管理方法进行综述,将现有的分布式RDF数据管理方法分成3类:基于云计算平台的分布式RDF数据管理方法、基于数据划分的分布式RDF数据管理方法和联邦式系统.基于云计算平台的分布式RDF数据管理方法利用已有云平台进行RDF数据的管理;基于数据划分的分布式RDF数据管理方法首先将RDF数据图划分成若干子图,然后将这些子图分配到不同计算节点上;联邦式系统的特点是数据已经分布在不同节点上,数据管理系统无法控制数据的分布.在每类分布式RDF数据管理方法的介绍中,将深入讨论以帮助读者了解各种方法的特点.
    Abstract: Recently, RDF (resource description framework) has been widely used to expose, share, and connect pieces of data on the Web, while SPARQL (simple protocol and RDF query language) is a structured query language to access RDF repository. As RDF datasets increase in size, evaluating SPARQL queries over current RDF repositories is beyond the capacity of a single machine. As a result, a high performance distributed RDF database system is needed to efficiently evaluate SPARQL queries. There are a huge number of works for distributed RDF data management following different approaches. In this paper we provide an overview of these works. This survey considers three kinds of distributed data management approaches, including cloud-based distributed data management approaches, partitioning-based distributed data management approaches and federated RDF systems. Simply speaking, cloud-based distributed data management approaches use existing cloud platforms to manage large RDF datasets; partitioning-based distributed data management approaches divide an RDF graph into several fragments and place each fragment at a different site in a distributed system; and federated RDF systems disallow for re-partitioning the data, since the data has been distributed over their own autonomous sites. In each kind of distributed data management approaches, further discussions are also provided to help readers to understand the characteristics of different approaches.
  • 期刊类型引用(18)

    1. 罗宇哲,李玲,侯朋朋,于佳耕,程丽敏,张常有,武延军,赵琛. 面向AIoT的协同智能综述. 计算机研究与发展. 2025(01): 179-206 . 本站查看
    2. 程钰. 拓扑约束下基于双过滤机制的拜占庭容错分布式学习分析. 集成电路应用. 2025(02): 102-103 . 百度学术
    3. 王恩东,闫瑞栋,郭振华,赵雅倩. 分布式训练系统及其优化算法综述. 计算机学报. 2024(01): 1-28 . 百度学术
    4. 黎恺嘉,贺晋,曹佳宝,张栋威,刘浩. 基于Seq-GRU的建筑能耗预测方法研究. 物联网技术. 2024(04): 55-60 . 百度学术
    5. 胡涛,王中杰,张连明,陈晓锁. 基于深度学习的非结构化大数据密度聚类仿真. 计算机仿真. 2024(05): 501-505 . 百度学术
    6. 巨涛,康贺廷,刘帅,火久元. 深度神经网络动态分层梯度稀疏化及梯度合并优化方法. 西安交通大学学报. 2024(09): 105-116 . 百度学术
    7. 巨涛,刘帅,王志强,李林娟. 深度神经网络模型任务切分及并行优化方法. 北京航空航天大学学报. 2024(09): 2739-2752 . 百度学术
    8. 房鑫,陈兵旗,彭书博,张雄楚,李永正. 基于改进YOLOv4的前方车辆检测方法. 传感器与微系统. 2024(10): 155-159 . 百度学术
    9. 唐春娜. 深度学习在主机分布式集群负载均衡中的技术应用. 信息与电脑(理论版). 2024(17): 59-61 . 百度学术
    10. 巨涛,刘帅,火久元,张学军. 深度神经网络模型并行自适应计算任务调度方法. 吉林大学学报(工学版). 2024(12): 3601-3613 . 百度学术
    11. 巨涛,赵宇阳,刘帅,杨阳,杨文杰. 面向图片识别的深度学习模型并行优化方法. 西安交通大学学报. 2023(01): 141-151 . 百度学术
    12. 王睿,王岩,尹朴,齐建鹏,孙叶桃,李倩,张易达,张梅奎. 面向边缘智能的协同训练研究进展. 工程科学学报. 2023(08): 1400-1416 . 百度学术
    13. 韩忠华,黎恺嘉,周晓锋,王继娜,孙亮亮. 基于深度学习的柔性流水车间排产优化问题研究. 智能系统学报. 2023(03): 468-478 . 百度学术
    14. 任刚,李鑫,刘小杰,张阳,郜广兰,肖东栩. 基于Spark大数据计算模型的遗传算法深度前馈神经网络训练算法. 河南工学院学报. 2023(05): 14-22 . 百度学术
    15. 马翔,申国伟,郭春,崔允贺,陈意. 面向异构分布式机器学习的动态自适应并行加速方法. 智能系统学报. 2023(05): 1099-1107 . 百度学术
    16. 彭琨,丁小波,蔡茂贞,钟地秀,黎蕴玉. 分布式图像解析系统的设计与研究. 现代计算机. 2022(11): 31-34+40 . 百度学术
    17. 李新春,詹德川. 使用多分类器的分布式模型重用技术. 计算机科学与探索. 2022(10): 2310-2319 . 百度学术
    18. 钟运琴,朱月琴,焦守涛. 边缘大数据分析预测建模方法研究. 高技术通讯. 2022(10): 1067-1075 . 百度学术

    其他类型引用(48)

计量
  • 文章访问数:  1987
  • HTML全文浏览量:  1
  • PDF下载量:  1228
  • 被引次数: 66
出版历程
  • 发布日期:  2017-05-31

目录

    /

    返回文章
    返回