计算机研究与发展 ›› 2015, Vol. 52 ›› Issue (9): 1965-1975.doi: 10.7544/issn1000-1239.2015.20140832
王晓燕1,2,3, 陈晋川1, 郭小燕4, 杜小勇1,3,5
Wang Xiaoyan1,2,3, Chen Jinchuan1, Guo Xiaoyan4, Du Xiaoyong1,3,5
摘要: 大数据时代的来临为数据存储与管理提出了新的挑战.随着数据量的迅猛增加,自动数据分布逐渐成为分布式系统中的研究重点和难点.根据对数据分布问题中数据、负载和节点3个要素的研究和分析,将数据分布问题抽象为称为DaWN(data,workload,node)的三角模型,并将3要素之间的相互关联关系抽象为数据分片、数据分配和负载执行3条纽带;据此,提出了解决自动数据分布问题的基本架构,对各功能模块的协动关系进行探讨;同时,结合已有的研究工作,采用Nash-Pareto优化均衡策略使得前述各机制相得益彰,实验结果验证了其有效性.为使研究工作更多地应用于实践,设计并实现了自动数据分布辅助原型工具ADDvisor(automatic data distribution advisor),协同支持自动数据分布的执行,共同促进大规模分布式联机事务处理系统的并行性能和自动化管理技术的发展.
中图分类号: