• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

2023年  第60卷  第3期

栏目
前沿亮点
摘要:

近年来以RISC-V为代表的开源指令集引领了开源处理器的设计潮流. 然而,目前国内外的开源处理器性能尚未满足学术界和工业界的需求. 为填补空白,香山处理器项目启动. 香山是一款开源高性能RISC-V处理器,采用6发射超标量乱序执行设计,目前在著名开源项目托管平台GitHub上获得超过3200个星标(Star),形成超过400个分支(Fork),成为国际上最热门的开源硬件项目之一,得到国内外企业和研究者的积极支持. 香山处理器在近两年时间中历经两代版本演进,第一代“雁栖湖”微架构已经成功流片,回片性能符合预期;第二代“南湖”微架构已进入最后的优化迭代阶段,即将投片,据已知消息,其仿真评估性能在当前开源处理器中排名第一. 主要讨论香山前两代微架构的实现细节与设计演进,并系统介绍开发香山过程中的各类挑战与经验.

大数据存储与智能分析专题
摘要:

随着多云时代的到来,云际智能运维能够提前检测处理云平台的故障,从而确保其高可用性. 由于云系统的复杂性,运维数据在数据局部性和数据全局性上呈现出多样的时间依赖和维度间依赖,这给多维时间序列异常检测带来很大的挑战. 然而,现有的多维时间序列异常检测方法大多是从正常时序数据中学习到特征表示并基于重构误差或预测误差检测异常,这些方法无法同时捕获多维时间序列在局部性和全局性上的信息依赖,从而导致异常检测效果差. 针对上述问题,提出了一种基于融合学习的无监督多维时间序列异常检测方法,同时对多维时间序列的数据局部特征和数据全局特征进行建模,得到更加丰富的时序重构信息,并基于重构误差检测异常. 具体地,通过在时域卷积网络中引入自注意力机制使得模型在构建局部关联性的同时更加关注数据全局特征,并在时域卷积模块和自注意力模块间加入信息共享机制实现信息融合,从而能够更好地对多维时序的正常模式进行重构. 在多个多维时间序列真实数据集上的实验结果表明,相较于之前的多维时间序列异常检测,提出的方法在F1分数上提升了高达0.0882.

摘要:

ZNS SSD是近年来提出的一种新型固态硬盘(solid state drive,SSD),它以分区(Zone)的方式管理和存取SSD内的数据.相比于传统SSD,ZNS SSD可以有效提升SSD的读写吞吐,降低写放大,减少SSD的预留空间.但是,ZNS SSD要求Zone内必须采用顺序写模式,并且Zone上的空间分配、垃圾回收等任务都需要用户自行控制.ZNS SSD的这些特性对于传统数据库系统的存储管理、索引、缓存等技术均提出了新的挑战.针对如何使传统的B+-tree索引结构适配ZNS SSD的问题,提出了一种ZNS SSD感知的新型索引结构——ZB+-tree (ZNS-aware B+-tree).ZB+-tree是目前已知的首个ZNS SSD感知的索引,它以B+-tree为基础,利用ZNS SSD内部支持少量随机写的常规Zone(conventional zone,Cov-Zone)和只支持顺序写的顺序Zone(sequential zone,Seq-Zone),通过常规Zone来吸收对ZNS SSD的随机写操作.ZB+-tree将索引节点分散存储在常规Zone和顺序Zone中,并为2种Zone内的节点分别设计了节点结构,使ZB+-tree不仅能够吸收对索引的随机写操作,而且又可以保证顺序Zone内的顺序写要求.在实验中利用null_blk和libzbd模拟ZNS SSD设备,并将现有的CoW B+-tree修改后作为对比索引.结果表明,ZB+-tree在运行时间、空间利用率等多个指标上均优于CoW B+-tree.

摘要:

数据规模的爆发式增长使得分布式存储广泛应用,长期以来分布式存储直接使用本地文件系统访问本地存储资源,随着高性能NVMe SSD、持久内存(persistent memory,PMEM)、异构加速设备的出现,本地文件系统难以发挥新型器件的特性和性能优势. 现有很多研究针对SSD或者PMEM的硬件特性在软件层面进行优化和改进. 然而,这些工作兼容性和扩展性差,不能灵活适配硬件环境变化,缺乏面向新型硬件的统一解决方案. 提出了一种兼容多种存储介质的统一存储系统UStore,可根据业务场景灵活选择存储介质,并针对PMEM、KVS加速卡、NVMe SSD等典型硬件进行组合设计优化,充分利用其硬件特性,满足多层次的业务需求;通过一种与物理存储介质形态解耦的元数据设计,使其适应不同硬件的性能和原子更新能力差异,实现灵活的元数据存储策略;通过高效的数据管理机制和更新策略,实现无日志的数据原子写保证,消除了现有系统的写放大以及性能抖动等问题.实验结果表明,相比于BlueStore,UStore的4KB随机读性能提升了3.2倍,4KB随机写提高了8.2倍,3种典型硬件组合下UStore表现出与之相匹配的数据访问特征,充分发挥了存储硬件的特性和性能.

摘要:

为了应对磁盘和固态硬盘随机写和顺序写性能差异较大的问题,文件系统和块存储系统通常采用日志结构(log-structured)技术将随机写转换为顺序写. 因此,对于日志结构存储系统数据和元数据的修改都以异地写的方式执行. 在日志结构存储系统中,B+ tree常被用于管理元数据,这就会导致wandering B+ tree问题,即树结点异地更新会导致树结构递归更新. 目前,现有工作主要通过分离树结点的逻辑索引和物理地址,并使用额外的数据结构和物理设备空间存放树结点逻辑索引和物理地址的映射,从而避免递归更新树结构. 但现有方法既引入额外空间开销,又存在额外物理设备空间非顺序写的问题. 提出IBT B+ tree,将树结点逻辑索引和物理地址均存放在树结构中. 同时,基于IBT B+ tree结构引入dirty链表设计,并提出了非递归更新的IBT B+ tree下刷算法. IBT B+ tree既解决了wandering B+ tree问题,又不引入额外的数据结构和物理设备空间,消除了固定物理设备空间的非顺序写. 分别实现IBT B+ tree和基于F2FS中NAT设计的B+ tree,在此基础上设计实现Monty-Dev块存储系统以评价2棵B+ tree. 实验表明,在HDD和SSD介质上,IBT B+ tree在写放大和下刷效率方面均优于NAT B+ tree.

摘要:

得益于高密度闪存技术发展、高并行存储架构以及良好的接口技术支持,多个租户共享使用一个固态盘已经成为提高存储资源利用率和降低运营成本的常见方式.然而,多个租户竞争使用固态盘内有限的存储资源,产生相互干扰,因此如何保障多租户固态盘服务质量成为近年来的研究热点.首先,分析多租户固态盘服务质量保障面临性能干扰、性能不公平及总体性能损失三大问题;然后,从如何保障性能隔离、如何保障性能公平及如何优化总体性能3类目标,对现有工作进行全面分类介绍,并梳理它们的技术演进方向;最后,对多租户固态盘服务质量保障技术的研究现状进行总结,并展望潜在的未来研究方向.

摘要:

大数据爆发的时代产生了各种新的业务类型,业务数据驱动着事务管理系统创新性的迭代发展.由于传统持久化介质的制约,传统的事务管理系统无法高效执行事务.并且,解决事务冲突的额外开销仍然会限制事务管理系统的吞吐. 新型硬件的商业化应用为事务管理系统注入了更多的可能性,在学术界和工业界均得到了广泛关注. 硬件事务内存可以为事务管理系统提供硬件级别的事务冲突检测.而且,相对于固态硬盘,非易失性内存的字节寻址和持久化特性可以显著降低事务延迟并提升事务管理系统的性能. 但是,现有的事务管理系统技术无法充分地利用硬件本身带来的性能提升,因此需要重构事务架构来解决这个问题.首先对新型硬件环境下的事务管理系统进行总结分析;之后总结了当前基于新型硬件事务管理系统的技术路线,明确了硬件事务内存和非易失性存储硬件下的事务管理系统的优势和不足;最后指明了新型硬件环境中事务管理系统未来可能的发展方向以及新的挑战.

网络技术
摘要:

物联网系统架构的核心是逻辑控制器,逻辑控制器中使用规则控制业务逻辑,减少物联网系统的开发、维护成本,提高物联网设备的灵活性. 但随着物联网系统的规模扩大,规则间的关系变得复杂,从而可能产生规则冲突. 为避免规则发生冲突,一些研究者提出了规则冲突检测方法. 但是,以往的规则冲突检测方法还存在规则冲突类型分析不全面、检测结果准确性较低的问题. 为此提出一种针对物联网系统控制逻辑的形式化规则冲突检测方法(formal rule conflict detection,FRCD). 该方法首先形式化定义规则及规则冲突,其中将规则定义为控制主体、动作、触发条件、符号的组合;然后根据规则对系统的影响以及规则的结构特征,总结出7类规则冲突类型;最后设计规则冲突检测的算法,并介绍规则冲突检测的详细过程. 在2个物联网系统上开展实验,与已有的3种典型的物联网规则冲突检测方法进行对比. 这3种方法分别是基于用户、触发器、环境实体和作动器的冲突检测方法(user, triggers, environment entities, and actuators, UTEA)、基于Web语义的策略冲突检测方法(semantic Web-based policy interaction detection with rules, SPIDER)和半形式化的冲突检测方法(identifying requirements interactions using semiformal, IRIS). 实验结果显示,FRCD规则冲突检测方法效果更好.

摘要:

在软件定义网络(software-defined networking, SDN)中,OpenFlow交换机通常采用三态内容可寻址存储器(ternary content addressable memory, TCAM)存储流表,以支持快速通配查找. 然而,TCAM采用并行查找方式,查找能耗高,因此有必要为OpenFlow交换机选择合适的TCAM容量,以平衡分组转发时延和能耗. 针对软件定义数据中心网络(software-defined data center network, SD-DCN)这一典型应用场景,利用多优先级M/G/1排队模型刻画OpenFlow交换机的分组处理过程,进而建立OpenFlow分组转发时延模型. 同时,基于网络流分布特性,建立TCAM流表命中率模型,以求解OpenFlow分组转发时延与TCAM容量的关系式. 在此基础上,结合TCAM查找能耗,建立OpenFlow分组转发能效联合优化模型,并设计优化算法求解TCAM最优容量. 实验结果表明:所提时延模型比现有模型更能准确刻画OpenFlow分组转发时延. 同时,利用优化算法求解不同参数配置下的TCAM最优容量,为SD-DCN实际部署提供参考依据.

摘要:

智能交通系统(intelligent transportation systems, ITSs)被广泛用于智慧城市中,却普遍存在感知数据缺失问题.而交通感知站点有限的存储计算能力严重制约感知数据的恢复,极大影响ITSs的正常使用.虽然可以利用边缘节点强大的存储计算能力解决这个困境,但边缘节点部署的高复杂性和感知数据时空相关性的高动态性对数据精确恢复提出挑战.为了解决上述挑战,提出基于边缘智能计算的城市交通感知数据自适应恢复系统.具体地,首先利用子模优化理论,提出具有理论下界的边缘节点次优部署分配算法.然后,基于低秩理论恢复感知数据,并基于恢复结果估计非缺失下限,通过反馈自适应调整感知站点的数据上传比例,从而保证数据精确恢复.最后,基于澳大利亚600个交通站点1年的感知数据构建原型系统,对所提算法进行评估.实验结果表明,所提算法的边缘节点部署性能达到最优性能的90%以上,缺失数据恢复精度比3种对比方法提高43.8%以上.同时,自适应数据恢复能够平均提高精度40.3%.

软件技术
摘要:

数据库系统具有大量的配置参数,参数配置不同会导致系统运行时很大的性能差异. 参数优化技术通过选择合适的参数配置,能够提升数据库对当前场景的适应性,因此得到国内外研究人员的广泛关注. 通过对现有的数据库参数调优方法进行总结分析,根据参数优化方法是否具有应对环境变化的能力,将现有工作分为固定环境下的数据库参数优化方法和变化环境下的数据库参数优化方法2类. 对于固定环境下的参数优化方法,按照方法是否具有从历史任务中学习的能力将研究工作分为传统的参数优化方法和基于机器学习的参数优化方法2类并分别进行介绍. 对于变化环境下的参数优化方法,按照不同的变化场景对现有工作进行分类介绍. 最后,总结了现有工作中各类方法的优缺点,并对目前研究中待解决的问题和可能发展的方向进行了讨论.

摘要:

大规模图的复杂挖掘算法通常需要高频迭代分析,而在计算与存储方面扩展性良好的分布式计算是提高处理效率的有效方案. 然而,图顶点之间存在自由分布的边关系,会在分布式计算任务之间产生大量消息,由此在迭代过程中产生的巨大通信开销严重制约性能收益. 已有工作在传统消息推送框架下采用合并和备份等技术降低通信代价,但主要面向结构简单、易优化的单维消息类算法,并不适用于结构复杂的多维消息类算法,也难以与当前最先进的消息按需拉取框架兼容. 因此提出一种新型轻量级顶点备份机制,通过备份顶点的按需同步以及本地消息的按需生成,可完美继承拉取框架在容错和内存管控等方面的系统优势,同时显著降低通信代价. 此外,通过考虑通信收益与负载偏斜代价,可计算最优阈值以提高整体性能. 最后在大量真实数据集上验证了相关技术的有效性.

摘要:

高置信度的数据可视分析对于大规模数值模拟至关重要,但是当前高性能计算机的存储瓶颈导致可视分析应用获取原始高分辨率网格数据越来越困难. 基于统计建模的方法能够极大降低高分辨数据存储成本,但是重建数据的不确定性高. 为此,提出了一种大规模结构网格数据的相关性统计建模轻量化方法,用于对并行数值模拟生成的大规模多块体数据进行高效分析与可视化. 该方法的技术核心是通过数据块间的统计相关性,指导邻接数据块的统计建模,从而有效地保留数据统计特征,且不需要对不同并行计算节点中的数据块进行合并与重新分块. 通过耦合数据块的数值分布信息、空间分布信息和相关性信息,该方法可以更精确地重建原始数据,降低可视化的不确定性. 实验测试采用了最大10亿网格规模的5组科学数据,定量分析结果显示,在相同数据压缩比下,该方法相比现有方法可将数据重建精度最大提升近2个数量级.

人工智能
摘要:

为突破传统融合规则带来的性能瓶颈,提出一个基于特征空间多类别对抗机制的红外与可见光图像融合网络. 相较于现存方法,其融合规则更合理且性能更好. 首先,训练一个引入注意力机制的自编码器网络实现特征提取和图像重建. 然后,采用生成式对抗网络(generative adversarial network, GAN)在训练好的编码器提取的特征空间上进行融合规则的学习. 具体来说,设计一个特征融合网络作为生成器融合从源图像中提取的特征,然后将一个多分类器作为鉴别器. 这种多分类对抗学习可使得融合特征同时逼近红外和可见光2种模态的概率分布,从而保留源图像中最显著的特征. 最后,使用训练好的译码器从特征融合网络输出的融合特征重建出融合图像. 实验结果表明:与最新的所有主流红外与可见光图像融合方法包括GTF, MDLatLRR, DenseFuse, FusionGAN, U2Fusion相比,所提方法主观效果更好,客观指标最优个数为U2Fusion的2倍,融合速度是其他方法的5倍以上.

摘要:

链路预测是指通过已知的网络拓扑和节点信息来预测未来时刻节点之间的潜在关系,链路预测能够帮助在各种存在链路的应用领域更加合理地分配资源、降低资源开销.移动社会网络属于动态网络的一种,其网络结构总是随着节点和链路的出现、消失以及时间推移而不断演变.针对移动社会网络的特点,当前已有的研究使用愈加复杂的模型来分析链路之间的联系,然而复杂的模型不但空间复杂度大而且容易造成过拟合问题. 为了解决以上问题,提出一种基于门控循环单元的移动社会网络链路预测方法.首先对输入数据集进行排序筛选,将目标网络划分为快照图,并按一定的规则转化为邻接矩阵形成样本集,然后基于自动编码器和门控循环单元构建预测模型,提取出移动社会网络的时间变化特征.在KONECT数据集上,与其他模型的对比实验结果表明,该方法能够保持预测性能几乎不变的情况下,使模型训练效率提升49.81%.