图卷积增强多路解码的实体关系联合抽取模型

乔勇鹏; 于亚新; 刘树越; 王子腾; 夏子芳; 乔佳琪

doi:10.7544/issn1000-1239.202110767

图卷积增强多路解码的实体关系联合抽取模型

东北大学计算机科学与工程学院　沈阳　110169
医学影像智能计算教育部重点实验室（东北大学）　沈阳　110169

基金项目: 国家自然科学基金项目（61871106，61973059）；国家重点研发计划项目（2016YFC0101500）

详细信息

作者简介:
乔勇鹏: 1997年生.硕士.主要研究方向为知识图谱和自然语言处理

于亚新: 1971年生.博士，副教授，硕士生导师.IEEE，ACM，CCF会员.主要研究方向为数据挖掘、社交网络

刘树越: 1997年生.硕士.主要研究方向为强化学习、推荐系统和知识图谱

王子腾: 1998年生.硕士研究生.主要研究方向为深度强化学习和迁移学习

夏子芳: 1998年生.硕士研究生.主要研究方向为推荐系统、因果关系推理、知识图谱

乔佳琪: 1998年生.硕士研究生.主要研究方向为自然语言处理和计算机视觉

通讯作者:
于亚新（yuyx@mail.neu.edu.cn）

中图分类号: TP311
计量
- 文章访问数: 235
- HTML全文浏览量: 37
- PDF下载量: 117
出版历程
- 收稿日期: 2021-07-14
- 修回日期: 2022-03-21
- 网络出版日期: 2023-02-10
- 刊出日期: 2022-12-31

Graph Convolution-Enhanced Multi-Channel Decoding Joint Entity and Relation Extraction Model

School of Computer Science and Engineering, Northeastern University, Shenyang 110169
Key Laboratory of Intelligent Computing in Medical Image (Northeastern University), Ministry of Education, Shenyang 110169

Funds: This work was supported by the National Natural Science Foundation of China (61871106，61973059) and the National Key Research and Development Program of China (2016YFC0101500).

摘要

摘要:
从无结构化自然语言文本中抽取实体关系三元组是构建大型知识图谱中最为关键的一步，但现有研究仍存在3方面问题：1）忽略文本中因多个三元组共享同一实体而产生的实体关系重叠问题；2）当前以编码器−解码器为基础的联合抽取模型未充分考虑文本语句词之间的依赖关系；3）部分三元组序列过长导致误差累积与传播，影响实体关系抽取的精度和效率.基于此，提出基于图卷积增强多路解码的实体关系联合抽取模型 (graph convolution-enhanced multi-channel decoding joint entity and relation extraction model, GMCD-JERE).首先，基于BiLSTM作为模型编码器，强化文本中词的双向特征融合；其次，通过图卷积多跳特征融合句中词之间的依赖关系，提高关系抽取准确性；此外，改进传统模型按三元组先后顺序的解码机制，通过多路解码三元组机制，解决实体关系重叠问题，同时缓解三元组序列过长造成误差累积、传播的影响；最后，实验选用当前3个主流模型进行性能验证，在NYT (New York times)数据集上结果表明在精确率、召回率和F1这3个指标上分别提升了4.3%，5.1%，4.8%，同时在WebNLG (Web natural language generation)数据集上验证以关系为开始的抽取顺序.
- 关系抽取 /
- 编码器–解码器 /
- 多路解码 /
- 关系重叠 /
- 图卷积神经网络
Abstract:
Extracting relational triplets from unstructured natural language texts are the most critical step in building a large-scale knowledge graph, but existing researches still have the following problems: 1) Existing models ignore the problem of relation overlapping caused by multiple triplets sharing the same entity in text; 2) The current joint extraction model based on encoder-decoder does not fully consider the dependency relationship among words in the text; 3) The excessively long sequence of triplets leads to the accumulation and propagation of errors, which affects the precision and efficiency of relation extraction in entity. Based on this, a graph convolution-enhanced multi-channel decoding joint entity and relation extraction model (GMCD-JERE) is proposed. First, the BiLSTM is introduced as a model encoder to strengthen the two-way feature fusion of words in the text; second, the dependency relationship between the words in the sentence is merged through the graph convolution multi-hop mechanism to improve the accuracy of relation classification; third, through multi-channel decoding mechanism, the model solves the problem of relation overlapping, and alleviates the effect of error accumulation and propagation at the same time; fourth, the experiment selects the current three mainstream models for performance verification, and the results on the NYT (New York times) dataset show that the accuracy rate, recall rate, and F1 are increased by 4.3%, 5.1% and 4.8%. Also, the extraction order starting with the relation is verified in the WebNLG (Web natural language generation) dataset.
- relation extraction /
- encoder-decoder /
- multi-channel decoding /
- relation overlapping /
- graph convolution neural network

HTML全文

随着大数据时代的到来和发展，数据量呈现爆炸式增长. 根据IDC（International Data Corporation）的预测，全球数据领域将从2018年的33ZB增长到2025年的175ZB^[1]. 为了满足数据存储的需求，数据存储系统的规模和存储介质的容量都在不断地增长. 各大存储设备厂商纷纷推出大容量存储设备来满足大量数据存储的需求. 例如，西部数据已经推出单盘容量达18TB的机械硬盘（hard disk drive，HDD）^[2]，和单盘容量达20TB的瓦记录磁盘（shingled write disk，SWD）^[3]. 存储厂商Nimbus Data推出单盘最大容量高达100TB的固态硬盘（solid state disk，SSD）^[4].

对于HDD，文献[5]提到，Unix文件系统只能利用5%~10%的磁盘写带宽，其他时间都消耗在磁盘寻道上. Sprite LFS^[5]（log-structured file system）采用日志结构（log-structured）技术，该系统假设：文件都缓存在内存中，容量逐渐增大的内存可以很有效地满足读请求的处理需求. 基于该假设，Sprite LFS着重优化写性能. Sprite LFS的物理地址分配方式为写时分配，文件系统的元数据和数据的更新方式均为异地写（out-of-place write）. Sprite LFS将所有的写请求转换为顺序写后，几乎可以消除所有的磁盘寻道开销. 基于Sprite LFS，NILFS^[6]在Linux系统上实现了日志结构文件系统.

对于SSD，文献[7-8]的研究表明：频繁地随机写请求处理，会导致严重的内部碎片，影响SSD的持续性能表现. SFS^[9]研究发现：SSD的随机写带宽和顺序写带宽的差异超过10倍；随机写会增加单位写请求的闪存块平均擦除次数，从而减少SSD的使用寿命. 为解决上述问题，SFS以NILFS为基础针对闪存介质特性，实现新的文件系统，提升系统吞吐率，降低闪存块平均擦除次数，减少SSD元数据管理开销，从而提升SSD寿命.

近年来，业界又先后推出了JFFS^[10]，F2FS^[11-14]等日志结构文件系统. 除了文件系统外，日志结构技术还被应用于块存储系统，例如BW-RAID^[15]存储系统的ASD子系统^[16-17]，ASD系统向上提供标准块设备接口，将上层写请求转换为本地磁盘RAID的顺序写，以提升BW-RAID系统的吞吐率. 本文把这类系统统称为日志结构存储系统.

虽然日志结构存储系统可以将所有的写请求转换为顺序写，但是因为日志结构存储系统要求数据和元数据的修改都采用异地更新的方式，它面临元数据异地更新带来的连锁更新问题. 树状结构通常被用于保存元数据，例如B+ tree，RB-tree（red-black tree），而一旦树状结构的某个结点执行了异地更新，就会触发递归更新树状结构，这一问题通常被称作wandering tree问题^[18]. 因为B+ tree被广泛应用于存储系统中，所以本文主要关注wandering B+ tree问题.

针对wandering tree问题，现有日志结构存储系统均提出了各自的解决方法：例如，NILFS2^[19]使用B+ tree管理所有元数据，引入特殊的内部文件DAT（data address translation file）管理所有B+ tree树结点；DAT文件的每个数据块为B+ tree的树结点，在文件内的偏移作为B+ tree树结点的逻辑索引（用于索引在内存中的树结点）. 但是，DAT文件的地址映射关系仍然使用B+ tree维护，以此保存逻辑索引和物理地址的映射（元数据块和数据块在物理设备上的地址），因此当DAT文件更新时，DAT文件的映射管理仍然面临wandering B+ tree的问题.

F2FS采用多级间接索引管理文件映射，同样面临元数据结构递归更新问题. 为了缓解这一问题带来的性能影响，F2FS使用物理设备上固定的NAT（node address table）^[11]区域存放元数据块逻辑索引和物理地址的映射关系. 1个设备上共有2个交替使用的NAT区域，目的是为了确保每次下刷NAT块均为原子操作. 此外，对于采用日志结构技术的块存储系统ASD而言，它采用2层RB-tree管理地址映射，通过固定区域存放地址映射的反向映射来解决wandering RB-tree问题.

综上，上述系统均使用额外的数据结构和物理设备空间管理树结点逻辑索引和物理地址的映射，以此解决元数据管理的wandering tree问题. 但引入额外的数据结构和物理设备空间，会增加系统设计的复杂度、降低写物理设备的连续度.

采用日志结构设计的文件系统和块设备系统在业界均有广泛的应用，然而针对大容量块存储系统，若采用高扇出、树操作效率高的B+ tree管理块设备逻辑地址和物理地址的映射关系，则需要解决wandering B+ tree问题，现有的块设备解决方法及日志结构文件系统的解决方法均需要引入额外的数据结构和物理设备空间. 为解决wandering B+ tree问题，本文提出IBT（internal node based translation） B+ tree. 本文的主要贡献有3个方面：

1）提出IBT B+ tree树结构. 中间结点记录孩子结点的逻辑索引和物理地址，避免引入额外数据结构和物理设备空间.

2）提出IBT B+ tree下刷算法. 引入每层dirty链表按层次管理所有dirty树结点，自底向上按层次下刷IBT B+ tree，避免递归更新树结构.

3）设计实现Monty-Dev块存储系统，评价IBT B+ tree在写放大和下刷效率方面的优化效果.

1. 相关工作

对于树状数据结构，父亲结点需要记录孩子结点的地址信息. 对于需要持久化到物理设备的树结构，则需要通过在中间结点中记录的孩子结点信息，确定孩子结点的物理地址. 本文将树结点在内存中的唯一标识称作树结点逻辑索引，将树结点在物理设备上的地址称作树结点物理地址. Linux内核中的ext4，dm-btree等模块的树状数据结构，通过中间结点记录孩子结点的物理地址访问孩子结点，因此树结点逻辑索引和物理地址相同. 其中，dm-btree使用RB-tree组织缓存在内存中的树结点，访问孩子结点时首先检查孩子结点是否在RB-tree中，如果在则直接访问树结点，否则需要从物理设备加载.

日志结构存储系统要求树结点的更新方式为异地写，且为写时分配物理地址. 如果树结点逻辑索引和物理地址相同，则在树结点下刷时需要递归更新祖先结点中记录的孩子结点物理地址，因此存在wandering tree问题. 本节分别介绍NILFS2，F2FS，ASD系统针对wandering tree问题的解决方法.

1.1 NILFS2

NILFS2使用B+ tree管理文件映射和inode. 对于wandering B+ tree问题，NILFS2的解决方法是：普通文件映射及管理inode的B+ tree树结点，由一个文件名为DAT的特殊文件管理；所有管理用户文件映射的B+ tree树结点是DAT文件的一个数据块；DAT文件的地址映射也由B+ tree管理，该B+ tree的树结点逻辑索引与物理地址相同.

图1介绍NILFS2的解决方法.图1（a）为管理普通用户文件映射的B+ tree示意图，树结点逻辑索引为vblocknr，即树结点在DAT文件中的偏移；图1（b）为管理DAT文件映射的B+ tree示意图，树结点逻辑索引和物理地址为blocknr.

图 1 NILFS2的用户文件和DAT文件映射案例^[19]

Figure 1. The case of NILFS2 user file and DAT file mapping ^[19]

下载: 全尺寸图片幻灯片

若要读取用户文件逻辑地址为0的块，则需要查找图1（a）所示的B+ tree，访问结点R_f确定下一个要访问的孩子结点vblocknr = 1；若DAT文件的第1号块不在内存，则通过图1（b）中所示的B+ tree查找映射，自上至下访问结点A_d，确定DAT文件第1号块的物理地址为4，即为结点A_f的物理地址；通过查找结点A_f，可确定用户文件第0号逻辑块的物理地址为0.

图1（a）中树结点修改下刷只需要修改DAT文件，无需递归更新图1（a）；而图1（b）中树结点修改下刷时，仍然需要递归更新.

综上，NILFS2可以解决除管理DAT文件映射的B+ tree之外所有元数据面临的wandering B+ tree问题. 因此，NILFS2的方法可以部分解决wandering B+ tree问题，但仍然存在递归更新B+ tree树结点的问题.

1.2 F2FS

F2FS将底层设备划分为多个segment，segment是F2FS管理的最小单元. 除物理设备头部固定空间占用外，剩余每个segment用来存放数据或者元数据，F2FS的元数据主要包括2类：inode块和间接索引块. F2FS通过inode块存放文件信息，使用多级间接索引管理文件的地址映射. 多级间接索引有着索引管理简单的优点，但是不抗稀疏，不能支持Extent. 由于使用了多级间接索引，F2FS也存在wandering tree问题.

F2FS的解决方法是：引入NAT的设计，将文件系统元数据块的逻辑索引和物理地址分离；使用固定的NAT区域存放NAT ID和物理地址的映射关系，避免修改一个元数据块就需要递归更新上级元数据块中记录的下级元数据块物理地址；F2FS在格式化时，按照设备大小计算出管理既定物理设备空间所需的NAT块个数上限，NAT区域中块数量为上限的2倍，2个空间存放NAT块的不同版本，交替使用.

NAT块管理示意图如图2所示，图中有4个segment，每个segment包括512个块，每个块大小均为4KB；每个块包括455个NAT entry，即455个NAT ID到物理地址的转换；由于使用固定物理空间存放NAT，因此可通过每个NAT entry相对于NAT区域起始地址的差值计算得到NAT ID；每2个连续的segment存放512个有效NAT 块，NAT 块更新时写不同的segment，由version bitmap标识某一个NAT块的最新版本在哪个segment中. 因此，通过2个segment和bitmap的设计，可确保NAT块每次更新均为异地写.

图 2 NAT块和version bitmap^[11]

Figure 2. NAT block and version bitmap^[11]

下载: 全尺寸图片幻灯片

随着设备的增大，文件系统的元数据量也在增大，因此NAT区域就需要管理更多的NAT块. 但NAT的随机修改会导致严重的写放大，为解决该问题，引入了journal的设计，将最近对NAT的修改记录在CP区域中，journal无可用空间时再更新NAT并下刷.

综上，F2FS采用NAT和journal的设计解决了wandering tree问题. 但NAT设计无法利用负载的空间局部性，随着NAT空间的增大，写放大问题会更严重，且物理设备的访问模式不是顺序写.

1.3 ASD

ASD系统提供Linux标准块设备语义，以虚拟块设备（virtual device，VD）的形式提供存储服务. ASD系统在物理设备之上创建一个日志结构存储池，存储池之上有多个逻辑地址空间，每个逻辑地址空间对应一个虚拟块设备VD，每个VD向上提供存储服务. 对于块设备，最重要的元数据信息是逻辑地址和物理地址的映射关系.

ASD的元数据管理结构如图3所示. ASD系统使用Extent管理一段逻辑地址连续且物理地址连续的映射关系. 定长逻辑空间内的多个Extent组成一个Subtree，多个Subtree组成一个Group，多个Group组成整个逻辑地址空间. Group信息常驻内存，Subtree和Extent信息在内存中的缓存可在内存压力大的时候释放. 由于Group信息与设备容量相关，因此随着设备容量的增大，内存占用也会增大；另外，由于采用Extent的方式管理，一个Extent作为一个单独的内存分配单元，大量分配Extent后回收、释放可能存在内部碎片问题，释放了多个Extent但是内存占用却没有减少，且内存占用上限越大内部碎片越严重.

图 3 ASD系统元数据结构^[16-17]

Figure 3. ASD system metadata structure^[16-17]

下载: 全尺寸图片幻灯片

上述Extent，Subtree，Group结构均采用RB-tree进行组织，每个Group在内存中索引多个Extent. 对于Group信息的下刷，需要先调整树结构，使得一个Group索引到的Extent信息可以记录到物理设备上一个定长的数据块中，Group的下刷方式为异地写. 因此，ASD也存在wandering tree的问题，ASD的解决方法是：

1） Group信息写到物理设备上之后，将多个Group的逻辑索引和物理地址的映射以异地写的方式更新到数据区域；

2）将Group信息的物理地址及其归属信息写入物理设备头部固定的反向表区域；

3）系统重启时通过扫描固定区域重构RB-tree.

综上，ASD采用2级逻辑索引和物理地址的映射解决wandering RB-tree问题. 该方法的优点是固定位置写较少，但管理复杂度过高.

2. wandering B+ tree问题分析和结构设计

本节首先分析wandering B+ tree问题，提出该问题的解决方法：IBT B+ tree. 分别通过B+ tree树结点布局、链表设计和树操作设计，以及第3节提出的IBT B+ tree下刷算法论述wandering B+ tree的解决方法.

2.1 wandering B+ tree问题分析

首先，通过图4介绍wandering B+ tree问题，并明确解决问题的难点. 图4展示了1棵树结点逻辑索引与物理地址相同的3阶B+ tree树结点更新过程. 图4左图下刷结点A时，需要为结点A分配新的物理地址生成结点A₁；图4中间的图，生成结点A₁后，分配结点D₁使其指向结点A₁；图4右图分配结点R₁同理. 因此，非树根结点分配物理地址需要递归更新父亲结点至树根结点，严重影响B+ tree下刷效率.

图 4 wandering B+ tree问题案例

Figure 4. Example of wandering B+ tree problem

下载: 全尺寸图片幻灯片

综上，要解决wandering B+ tree，需要满足日志结构系统设计需求：树结点写时分配物理地址，且更新方式为异地写；同时，避免B+ tree树结点下刷时递归更新非叶子结点.

如第1节所述，针对wandering tree问题，NILFS2, F2FS, ASD解决方法的共同点是：树结点逻辑索引和物理地址不同，即树结点的逻辑索引和物理地址分离，额外的数据结构和物理设备空间维护树结点逻辑索引和物理地址的映射关系.

因此，解决wandering B+ tree问题的难点是：

1）支持树结点逻辑索引和物理地址分离，且不引入新的数据结构和物理设备空间，降低复杂度；

2）避免B+ tree下刷时递归更新树结构.

针对这2个难点，2.2节提出第1个难点的解决方法，2.3节和2.4节支撑第3节提出的IBT B+ tree下刷算法解决第2个难点.

2.2 IBT B+ tree树结点布局

IBT B+ tree的中间结点和叶子结点结构图如图5所示，图5中各字段的含义如表1所示. 接下来，分别介绍表1中各字段的用途.

图 5 IBT B+ tree中间结点和叶子结点

Figure 5. The internal node and leaf node of IBT B+ tree

下载: 全尺寸图片幻灯片

表 1 图5各字段的含义

Table 1. The Meaning of the Fields in Fig.5

字段	含义
blkid	块设备的逻辑地址
state	孩子结点状态，dirty/clean
index	树结点逻辑索引
pbid	物理地址
Header	树结点的汇总信息

下载: 导出CSV

| 显示表格

1） state字段为孩子结点的状态，dirty代表孩子结点需要持久化到物理设备，clean代表孩子结点已经持久化且可以在内存紧张时回收. 因此，state仅描述内存中的树结点内容是否与设备上的一致.

2）如图5所示，中间结点记录孩子结点的逻辑索引index，随着树高的增长，所有非树根结点的index和pbid都会存放在其父亲结点中，只有树根结点的index和pbid不存放在树结构中. 因此，需要额外的数据结构和物理设备空间存放树根信息，记作Superblock，包括index, pbid, height（见2.4节）. 由于所有树结点的更新方式均为异地写，因此树根结点需要记录在物理设备的固定位置上，B+ tree初始化时才能找到树根.

3）中间结点记录孩子结点的index和pbid，在内存中的B+ tree树结点，以index为关键字，使用红黑树进行组织. 各类B+ tree操作执行过程中，如果树结点不在红黑树中，则需要通过pbid从底层设备读取树结点.

2.3 IBT B+ tree链表设计

2.2节提出树结点逻辑索引和物理地址分离的方法，通过树结点逻辑索引管理内存中的树结点，通过物理地址加载不在内存中的树结点，从而支持写时分配物理地址. 因此，需要在此基础上解决2.1节提出的第2个难点：设计非递归更新的IBT B+ tree下刷算法. 主要思路是：按照层次管理B+ tree dirty树结点，使得IBT B+ tree能够按照层次进行下刷. 本节主要论述按照层次管理dirty树结点的方法，IBT B+ tree下刷算法在第3节论述.

扩展并修改B+ tree链表维护方法. 传统B+ tree只维护叶子结点链表，用来管理所有叶子结点，按照关键字升序或降序排列. 本文修改并扩展树结点链表：B+ tree的每一层均有一个dirty链表；引入全局clean链表. 2类链表设计主要有2个特点：

1） B+ tree各层dirty链表管理相应层中状态为dirty的树结点，dirty树结点按照LRU的方式管理，而非按照关键字排序；

2） clean链表管理所有状态为clean的树结点，clean链表也采用LRU的方式管理，目的是为了在内存紧张时释放不经常访问的树结点.

链表的使用，特别是dirty链表，将在2.4节介绍. 第3节将介绍如何通过dirty链表更新树结点物理地址.

2.4 IBT B+ tree基本操作设计

B+ tree在插入、查找、删除操作中对key-value的管理，与采用shadow-clone设计的B+ tree^[20-21]没有差异. 为使用lock-coupling细粒度加锁协议支持B+ tree并发操作^[22]，B+ tree采用预先rebalance、分裂的方式调整树结构，避免B+ tree树操作执行过程中对孩子结点的修改导致父亲结点rebalance、分裂.

对于wandering B+ tree问题的解决方法，2.2节已经给出支持树结点逻辑索引和物理地址分离的树结构设计. 本节主要从支撑写时分配物理地址、更新物理地址的角度进行论述. 支撑上述特性的主要解决方法是dirty和clean链表设计. 本节从B+ tree树操作的角度介绍2类链表的管理. 由于clean链表用来管理clean树结点、支撑内存回收，只需要维护树结点的LRU逻辑即可. 因此，本节主要介绍dirty链表的管理.

dirty链表的变化主要源自插入操作和删除操作. 下面分别通过案例介绍这2个操作中dirty链表的管理. 本节所有的案例均围绕图4所示的3阶B+ tree进行介绍，B+ tree树结点的key-value按照key（逻辑地址）升序排序.

2.4.1 插入操作

图6为将〈10, 11〉映射插入1棵3阶B+ tree的主要步骤. 下面分步介绍插入操作：

图 6 插入操作（插入〈10, 11〉）

Figure 6. Insert operation （insert〈10, 11〉）

下载: 全尺寸图片幻灯片

1）初始状态如图6（a）所示，所有树结点状态均为clean.

2）图6（b）将结点R标记为dirty，并将结点R插入list[0]；由于结点R的key-value数量达到上限，因此需要分裂结点R，分配D和E这2个结点. 将结点R的key-value平均分配给结点D和E. 将结点D和E中记录的最小key与结点D和E的逻辑索引分别作为key和value插入到结点R中. 此时不需要为结点D和E分配物理地址. 树高加1，相应地调整链表.

3）图6（c）和图6（d），逐层向下访问到结点A，将〈10, 11〉插入到结点A中.

如图6（b）所示，新创建的链表为B+ tree的第2层. 因为除树根结点外，B+ tree其他任何层都可能存在兄弟结点，为降低B+ tree树操作复杂度，仅允许树根结点分裂出孩子结点. 综上，新插入的dirty链表只发生在第2层，这一特性适用于任何高度大于1的B+ tree.

图6所示的每个阶段操作过程中，都将所有需要访问的树结点状态标识为dirty，同时除树根结点外，将所有dirty树结点在其父亲结点中的状态标识为dirty.

由于dirty链表的引入，2个并发的插入操作①和②，①先执行，②后执行；如果插入②导致树高加1，①获得的树高信息不正确，则树结点可能插入错误的链表. 因此，B+ tree无法支持插入和插入的并发. 由于clean链表对树高不敏感，B+ tree仍可支持插入和查找操作并发执行.

2.4.2 删除操作

以图7（a）所示的3阶B+ tree为例，介绍删除〈10, 11〉映射：

图 7 删除操作（删除〈10, 11〉）

Figure 7. Remove operation （remove 〈10, 11〉）

下载: 全尺寸图片幻灯片

1）访问树根结点R，将结点R标记为dirty，并加入到dirty链表list[0]中.

2）图7（b），结点R只有1个孩子. 因此，将结点D中记录的key-value拷贝到结点R中，删除结点D和相应的链表. 同时，结点R继承结点D的类型，图7（b）中D为中间结点，也存在结点R只有1个孩子且为叶子结点的情况. 因此，结点R也可能成唯一的叶子结点.

3）图7（c）和图7（d），逐级向下访问到结点A，将〈10, 11〉从结点A中删除.

如图7（b）所示，被删除的dirty链表为B+ tree的第2层. 与插入操作同理，dirty链表删除操作仅删除第2层链表，这一特性适用于任何高度大于1的B+ tree.

删除操作可能引起树高的修改，因此删除操作与删除操作、删除与插入操作均不能并发执行.

3. IBT B+ tree下刷

本节针对2.1节提到的第2个难点，提出非递归更新的IBT B+ tree下刷算法，从而解决wandering B+ tree问题. 通过第2节中IBT B+ tree的相关介绍可知，IBT B+ tree除树根结点外有如下特性：所有状态为dirty的树结点的父亲结点状态均为dirty；dirty结点的状态对父亲结点不透明. 利用上述2个特性，下面分别通过下刷算法和具体案例介绍IBT B+ tree的下刷.

B+ tree下刷存在2种情况：下刷所有树结点，包括B+ tree创建完成并插入多次关键字之后的状态和B+ tree非首次下刷且所有树结点状态均为dirty；部分下刷，包括部分B+ tree树结点为dirty的情况和经过多次删除后B+ tree为空.

多次插入、删除操作后，dirty树结点的内存占用或下刷时间间隔达到一定阈值，需要将B+ tree所有状态为dirty的树结点下刷到物理设备.

为避免递归更新B+ tree树结构，IBT B+ tree下刷采用2阶段提交的方式.

第1阶段，自dirty链表的倒数第2层向上下刷所有的dirty链表：

1）根据该dirty链表上所有树结点，下刷该树结点所有状态为dirty的孩子；

2）为孩子结点分配物理地址并下刷，将孩子结点的物理地址记录到父结点中，并更新父结点中记录的状态.

第2阶段，将Superblock写到固定的物理设备空间.

B+ tree下刷算法如算法1所示：

算法1. IBT B+ tree 下刷算法.

① procedure flush_dirty_nodes（A）

② 　for child ← A do

③ 　　 if is_dirty（child） then

④ 　　　　write（child）；

⑤ 　　　　更新结点A中child的物理地址；

⑥ 　　 end if

⑦ 　end for

⑧ end procedure

⑨ procedure flush_dirty_lists（tree）

⑩ 　i ← depth（tree）；

⑪ 　while i−1 > 0 do

⑫　　 for A ← dirty_list[i−1] do

⑬ 　　　　flush_dirty_nodes（A）；

⑭　　 end for

⑮　　 i−−；

⑯ 　end while

⑰ end procedure

⑱ procedure flush_btree（tree）

⑲ 　flush_dirty_lists（tree）；

⑳ 　write（root）；/*第1阶段提交*/

㉑　将树根的物理地址记录在superblock中；

㉒　write（superblock）；/*第2阶段提交*/

㉓ end procedure

图8展示了B+ tree下刷的重要阶段. 接下来，以图6（d）所示的3阶B+ tree为例，结合算法1和图8介绍B+ tree的下刷.

图 8 下刷IBT B+ tree的dirty结点

Figure 8. Flush dirty node of IBT B+ tree

下载: 全尺寸图片幻灯片

1）对于图6（d）的B+ tree，调用算法1中的函数flush_btree下刷整棵B+ tree. flush_btree调用flush_dirty_lists自list[1]开始至树根链表，下刷所有dirty链表.

2）如图8（a）所示，对于list[1]的结点D，调用函数flush_dirty_nodes，结点D只有一个状态为dirty的孩子结点A. 因此，如图8（b）所示，为结点A分配物理地址并记录在结点D中，同时将结点D中记录的结点A状态标更新为clean. 同样的方式处理list[1]上所有树结点.

3）图8（c）下刷list[0]，为结点D和E分配物理地址并下刷. 至此，函数flush_dirty_lists执行完成.

4）图8（d）为树根结点R分配物理地址15，写树根结点R并更新Superblock，完成第1阶段提交.

5）下刷Superblock完成第2阶段提交.

4. IBT B+ tree评价系统设计实现

本文以日志结构块设备系统为背景，在第2节和第3节提出了IBT B+ tree，解决了wandering B+ tree问题. 但是，仅有IBT B+ tree只可进行树操作测试，难以测试在不同负载下的表现.

为全面评价IBT B+ tree在Fio和Filebench场景下的写放大和下刷效率表现，需要设计实现能够覆盖IBT B+ tree支持的各类树操作和下刷，且避免I/O上下文干扰的日志结构块存储系统Monty-Dev.

为对比评价第3节所提出解决方法的效果，拟将IBT B+ tree与采用NAT方案设计的B+ tree（后文称作NAT B+ tree）进行对比. 其中，NAT方案设计参考Linux内核5.14版本^[19]F2FS的实现. 由于NAT块通过F2FS内部inode以文件映射的方式管理，因此这部分不能完全复用，转而使用radix-tree管理所有缓存的NAT块，基本与F2FS的实现方式等价；其余部分均参考F2FS. 另外，对于NAT块的version bitmap需要为每个树结点预留1 b，计算方法与f2fs-tools^[23]中格式化操作的计算方法不同.

本文以Linux系统为平台，设计实现Linux内核标准块设备Monty-Dev系统. 下面分别介绍评价系统Monty-Dev的总体设计、元数据管理和系统layout.

4.1 Monty-Dev系统整体架构

该设计暂不考虑宕机恢复和下刷数据块的反向映射信息，B+ tree树结点和NAT块均缓存在内存中，本文聚焦写放大和固定物理设备空间非顺序写开销的评价. 为评价删除操作的影响，Monty-Dev系统支持Linux内核中通用块层的Discard I/O语义.

Monty-Dev系统总体架构如图9所示. 使用横向的虚线标识系统的分层，下面逐层介绍. “用户接口”用来管理Monty-Dev系统，比如创建、删除设备和修改系统配置等. 其他系统可通过“标准块设备接口”，直接向Monty-Dev提交读写I/O请求. ext4/xfs等文件系统实例，可向通用块层提交读写I/O、Discard I/O请求，Discard I/O用来支持文件系统的trim操作.

图 9 Monty-Dev系统整体架构

Figure 9. Architecture of Monty-Dev system

下载: 全尺寸图片幻灯片

Monty-Dev核心模块实现了通用块层的部分接口，处理上层发往通用块层的请求. 基于Monty-Dev系统可执行Fio测试，将Monty-Dev设备格式化为特定文件系统可支持Filebench测试.

因此，通过Monty-Dev系统测试Fio和Filebench负载，可覆盖B+ tree的查找、插入、删除操作及其并发，以及元数据下刷.

4.2 元数据管理模块

Monty-Dev的元数据管理模块结构图如图10所示，后文称作Meta tree.

图 10 Meta tree结构图

Figure 10. Structure diagram of Meta tree

下载: 全尺寸图片幻灯片

Meta tree管理块设备逻辑地址和物理地址的映射关系，支持系列元数据操作，如查询、插入、更新、UNMAP. Meta tree包括2部分，为方便描述分别称作Disk tree和Memory tree，其中Disk tree为NAT B+ tree或IBT B+ tree，本文评测中树结点大小和数据块大小均为4KB.

仅通过IBT B+ tree或者NAT B+ tree管理元数据，元数据下刷会阻塞I/O回调时对元数据的修改，影响数据和元数据写并发，无法评价元数据下刷对用户I/O的影响. 因此，本文引入Memory tree，包括log0 tree和log1 tree，统称为log tree. log tree采用文献[24]提出的基于lock-coupling扩展协议的B+ tree，2棵树常驻内存，仅记录映射关系修改的log，用来聚合log（映射关系的修改，包括插入、更新、UNMAP）. 2棵树交替使用，活跃log tree处理元数据修改，非活跃log tree进行合并. Disk tree需要下刷到物理设备，存储所有映射关系.

log tree功能需求有：

1）将上层写I/O对元数据的修改以log的方式记录下来，记录的内容为逻辑块号和对映射关系的修改操作.

2） log tree的内存占用达到一定阈值或其他条件触发下刷，如设备关闭、下刷超时. Meta tree下刷时需要遍历log tree中所有log将映射关系的修改按照log类型在Disk tree上执行相应的树操作. 合并结束后，删除log tree.

3）查询操作时，先查询log tree再查询Disk tree，因为最新的映射关系修改都记录在log tree中.

综上，log tree需要提供如下功能：插入、更新、遍历. 这些需求文献[24]提出的B+ tree都可以满足，且有着映射关系插入、查找可并发的优点.

通过Meta tree管理元数据，解决B+ tree下刷时不能更新映射关系的问题，从而避免元数据下刷阻塞用户I/O请求，影响系统整体性能表现，同时也避免了I/O上下文对元数据下刷的干扰.

4.3 Monty-Dev系统layout

使用IBT B+ tree管理逻辑地址和物理地址的映射关系，则需要预留空间满足第3节中所述的2阶段提交下刷B+ tree的需求，以及存储块设备系统的必要信息.

使用NAT B+ tree，则需要NAT区域和Checkpoint区域：NAT区域与F2FS中NAT区域的功能相同；Checkpoint区域记录NAT块的version bitmap.

5. 测评与分析

本节基于第4节提出的分别采用NAT B+ tree和IBT B+ tree管理元数据的2个版本Monty-Dev系统（为方便描述，后文分别称作NAT版本和IBT版本）进行评测. 本节主要通过Fio^[25]和Filebench^[26]进行测试，以评价在不同负载下，NAT版本和IBT版本在元数据写放大和下刷效率方面的差异.

5.1 测试环境

第5节的相关测试均在表2所示的测试环境上进行. 5.2节和5.3节的测试均分别在SSD和HDD上进行测试，以验证IBT B+ tree在2种介质上的优化效果.

表 2 测试服务器硬件配置

Table 2. The Hardware Configuration of Testing Server

类别	参数
CPU	Intel（R） Xeon（R） E5645@2.40GHz，2路，24线程
内存	Ramaxel DDR3，32GB，1333MHz
磁盘	Seagate Constellation ES ST1000NM0011，1TB，SATA
SSD	Intel SSD DC P3700 Series，400 GB，NVMe

下载: 导出CSV

| 显示表格

测试的软件环境如表3所示. 由于NAT版本和IBT版本的元数据构成存在差异：NAT版本的元数据包括NAT块和B+ tree树结点，而IBT版本仅包括B+ tree树结点. 因此，NAT版本和IBT版本在相同测试用例下，元数据的下刷量可能存在差异. 此外，NAT版本存在固定物理设备空间随机写的问题，而IBT版本不存在. 因此，元数据下刷效率也可能存在差异.

表 3 测试服务器软件配置

Table 3. The Software Configuration of Testing Server

类别	版本
操作系统	CentOS Linux 7.8.2003，内核3.10.0-957.12.2
Fio	3.1
Filebench	1.4.9.1

下载: 导出CSV

| 显示表格

5.2 Fio测试

2个版本的Monty-Dev系统，采用精简配置设计，读测试和读写混合测试均存在空读的问题，且B+ tree树结点均缓存在内存中，IBT B+ tree和NAT B+ tree的查询效率没有差异，因此仅测试Fio随机写.

Fio测试的参数如表4所示，以表4中参数连续测试2次，分别测试首次写和覆盖写的吞吐率表现，测试3次取平均值. 由于Fio随机写测试发送的I/O请求为伪随机请求序列，因此在参数不变的情况下每次Fio测试的I/O序列均相同. 第2轮测试即为覆盖写，覆盖写测试对于IBT B+ tree和NAT B+ tree而言均为插入更新操作. 因此，该测试用例可先后评价NAT版本和IBT版本在插入和插入更新场景下的差异.

表 4 Fio配置参数

Table 4. Fio Configuration Parameters

参数类别	参数取值
设备大小/TB	4
iodepth	512
粒度/KB	4
engine	libaio
读写	randwrite
数据量/GB	200

下载: 导出CSV

| 显示表格

Meta tree合并下刷频率受2个因素制约：log tree内存占用上限；B+ tree的dirty树结点内存占用上限. 其中，log tree内存占用上限越小，下刷频率越高；dirty树结点内存占用上限影响一轮元数据下刷量，上限越小，一轮元数据下刷量越小，下刷越频繁. 因此，本文分别测试log tree内存占用上限为10 MB, 20 MB, 30 MB的情况下，dirty树结点内存占用上限为65 MB, 85 MB, 105 MB时，NAT版本和IBT版本首次写和覆盖写的吞吐率表现和元数据下刷的写放大. 下面分别在SSD和HDD上进行测试分析.

由于NAT版本和IBT版本的有效元数据量相同，因此本节通过元数据下刷量评价元数据下刷写放大.

5.2.1 基于SSD的Fio测试

Fio测试中，首次写和覆盖写的吞吐率、元数据下刷量对比如图11所示.观察分析图11，可得出4个结论：

图 11 基于SSD的吞吐率、元数据下刷量对比

Figure 11. Comparison of throughput and the total amount of flushed metadata based on SSD

下载: 全尺寸图片幻灯片

1）对于元数据下刷量，IBT版本在大多数情况下均优于NAT版本，但差异很小；

2） log tree内存占用上限越大，元数据下刷量越小；

3） NAT版本和IBT版本，在覆盖写测试中log tree内存占用上限越大，吞吐率越大；

4） log tree大小相同时，dirty树结点内存占用上限对元数据下刷量影响很小.

对于第4个结论，若在Meta tree合并过程中，dirty树结点内存占用超过上限，需要下刷后再合并剩余映射. 由于log tree将映射关系按照逻辑地址排序，下刷后再合并剩余映射时，不会修改已下刷叶子结点，但可能会修改部分已下刷的中间结点. 而中间结点总量较少，因此dirty树结点的内存占用上限对元数据下刷量影响很小.

由于NAT版本和IBT版本B+ tree插入更新复杂度基本相同，因此只需要考虑Meta tree合并下刷时的差异. 由于吞吐率表现基本相同，因此NAT版本和IBT版本的元数据下刷效率对性能的影响基本相同. 为此，本节主要通过分析元数据下刷量评价NAT版本和IBT版本的元数据写放大. 表5统计了图11（a）中，dirty树结点内存占用上限为85 MB时，2轮测试期间的元数据下刷量.

表 5 基于SSD的Fio测试中2个版本元数据下刷总量

Table 5. Total Amount of 2 Versions Flushed Metadata Under Fio Test Based on SSD GB

轮次	NAT版本	IBT版本
首次写	108.1	107.2
覆盖写	153.3	152.7

下载: 导出CSV

| 显示表格

从表5可以看出，IBT版本的元数据下刷量略低于NAT版本，但NAT B+ tree下刷时存在非顺序写. NAT版本的元数据包括NAT块和B+ tree树结点，NAT块下刷的物理设备访问模式为固定物理设备空间的非顺序写，而数据写为顺序写，NAT块和数据可并发写. 2轮测试中NAT块下刷情况如表6所示.

表 6 基于SSD的Fio测试中NAT块下刷统计

Table 6. Statistics of Flushed NAT Block Under Fio Test Based on SSD

轮次	NAT块下刷量/GB	比例/%
首次写	1.66	1.5
覆盖写	3.8	2.5

下载: 导出CSV

| 显示表格

覆盖写测试中NAT块的写入量和比例都有所增加. 主要原因是B+ tree树结点总量增多，导致NAT块总数增多，随机修改NAT块的范围增大. 但由于NAT块写相对于顺序写的比例较小，对用户数据写性能影响较小，所以NAT版本和IBT版本的吞吐率差异很小. 然而，随机写会导致闪存块碎片增多，降低闪存性能和寿命，这在短期测试中不能体现出来.

NAT B+ tree下刷需要下刷叶子结点和NAT块，IBT B+ tree对于状态为dirty的叶子结点，其查询路径上所有的祖先结点一定为dirty，而IBT版本的元数据下刷量小于NAT版本. 因此，IBT版本虽然理论上存在一定的写放大，但由于NAT块的写开销，IBT版本实际表现与NAT版本相当或优于NAT版本.

5.2.2 基于HDD的Fio测试

Fio测试经过首次写和覆盖写2轮测试后，吞吐率、元数据下刷量对比如图12所示.观察分析图12，可得出5个结论：

图 12 基于HDD的吞吐率、元数据下刷量对比

Figure 12. Comparison of throughput and the total amount of flushed metadata based on HDD

下载: 全尺寸图片幻灯片

1）对于元数据下刷量，IBT版本在大多数情况下均优于NAT版本；

2）对于吞吐率，相对于NAT版本，IBT版本首次写提升4.7%~13.8%，覆盖写提升10.7%~20.3%，内存占用越少提升越大；

3） IBT版本吞吐率表现几乎不受dirty树结点内存占用上限影响，而NAT版本受影响较大，特别是图12（b）；

4） log tree内存占用上限越大，吞吐率越大；

5） log tree内存占用上限相同，大多数情况下，dirty树结点内存占用上限越大，元数据下刷量越小.

以图12（a）dirty树结点内存占用上限为85MB为例，分析元数据下刷与吞吐率的关系. 相对于NAT版本，IBT版本2轮测试吞吐率提升分别为9.3%和15.3%. 相较于5.2.1节中基于SSD的测试，提升比例更高. 同5.2.1节，需要关注Meta tree合并下刷对性能造成的影响. 2轮测试期间元数据下刷量如表7所示.

表 7 基于HDD的Fio测试中2个版本元数据下刷总量

Table 7. Total Amount of 2 Versions Flushed Metadata Under Fio Test Based on HDD GB

轮次	NAT版本	IBT版本
首次写	110.6	109.1
覆盖写	155.0	154.5

下载: 导出CSV

| 显示表格

IBT版本比NAT版本元数据下刷量略小，但由于NAT 块下刷不是顺序写，且HDD的吞吐率受I/O连续度的影响较SSD更大，少量的非顺序写也会造成磁头的抖动，因此导致吞吐率提升比例更大. 表8中展示了2轮测试中NAT块下刷情况.

表 8 基于HDD的Fio测试中NAT块下刷统计

Table 8. Statistics of Flushed NAT Block Under Fio Test Based on HDD

轮次	NAT块下刷量/GB	比例/%
首次写	1.8	1.6
覆盖写	4.0	2.5

下载: 导出CSV

| 显示表格

如表8所示，覆盖写测试中NAT块的写入量和比例都增加了，从而导致固定位置非顺序写请求增多. IBT B+ tree叶子结点需要下刷，其父亲结点必须下刷，对于局部性比较好的树操作，多个被修改的叶子结点可能有相同的祖先结点. 而NAT块的设计不确保1个块涵盖的多个树结点在一轮元数据下刷时同时下刷，所以局部性较好的树操作不一定能减少NAT块的下刷量.

综上，IBT B+ tree的设计能够更好地利用空间局部性降低元数据的下刷量，避免随机访问提升元数据的下刷效率. NAT版本，B+ tree树结点总量越多，更新NAT块越多，写放大越严重，增加HDD寻道时间从而降低系统吞吐率. 因此，IBT版本在元数据写放大和下刷效率方面的表现均优于NAT版本.

5.3 Filebench测试

为避免空读，测试查询、插入、更新、删除操作的综合性能，使用Filebench进行测试，该组测试主要选取varmail, fileserver这2个负载. 为充分测试对比IBT B+ tree和NAT B+ tree的综合性能，同时适配当前服务器环境，对Filebench中标准wml脚本的测试时间、线程数、文件大小、文件数量均作了修改. 这些负载均首先分配一个文件集合，2类负载的行为如下：

1）varmail，模拟邮件服务器的I/O负载，该负载多线程执行相同任务. 顺序执行删除、创建—追加—同步、读—追加—同步、读操作.

2）fileserver，模拟文件服务器上的I/O负载，该负载多线程执行相同任务. 顺序创建、写整个文件、追加写、读整个文件、删除文件、查看文件状态.

测试方法为：分别基于HDD和SSD创建4TB的Monty-Dev设备，格式化为ext4文件系统，使用discard选项挂载文件系统以测试B+ tree的删除操作，每类负载执行1 h，每个测试执行3次，结果取平均值.

5.3.1 基于SSD的Filebench测试

Filebench测试结果，IBT版本和NAT版本基本相同，差异较小. 主要原因有：文件系统并不会将写请求直接转发至底层设备，设备利用率低；文件系统下发的写请求基本为顺序写，2个版本差异较小. 因此，本节及5.3.2节主要通过元数据下刷量评价IBT版本和NAT版本. 由于Filebench测试按照指定时长进行测试，不同测试中Monty-Dev设备收到的I/O请求数量存在差异，因此，本节及5.3.2节使用元数据下刷比例指标评价元数据的写放大情况：

$元数据下刷比例\text=\frac{元数据下刷量}{写数据总量}\times 100\text{%} .$

(1)

通过式（1）的计算方法，计算结果如图13所示.

图 13 基于SSD的Filebench测试对比

Figure 13. Comparison of Filebench test based on SSD

下载: 全尺寸图片幻灯片

相对于NAT版本，IBT版本在varmail负载和fileserver负载测试中，元数据下刷比例分别减少0.67%和0.69%. 经统计，若元数据写比例仅统计树结点下刷量，则2类负载测试中IBT版本均大于NAT版本，该现象符合IBT版本和NAT版本设计的差异. 因此，导致NAT版本元数据下刷比例高的主要原因是NAT块下刷的开销大. 接下来，具体分析NAT版本元数据下刷量的组成.

如表9所示，NAT块下刷量占元数据下刷比例较表6所示的更高. 较Fio负载，Filebench负载支持discard I/O请求，系列删除操作完成后，一些树结点需要被释放，释放树结点需要将NAT块中的记录更新为无效映射. 经统计，varmail和fileserver负载测试中discard I/O占写I/O请求的比例分别为81.5%和76%. 因此，删除操作会严重影响NAT版本的NAT块下刷量，从而影响元数据下刷比例，导致NAT版本写放大更加严重.

表 9 基于SSD的Filebench测试不同负载NAT块下刷统计

Table 9. Statistics of Flushed NAT Block for Different Loads Under Filebench Test Based on SSD

负载	NAT块下刷量/GB	比例/%
varmail	6.9	34.3
fileserver	8.2	36.0

下载: 导出CSV

| 显示表格

5.3.2 基于HDD的Filebench测试

评价方法与SSD上测试相同，元数据下刷比例对比结果如图14所示.

图 14 基于HDD的Filebench测试对比

Figure 14. Comparison of Filebench test based on HDD

下载: 全尺寸图片幻灯片

相对于NAT版本，IBT版本在varmail负载和fileserver负载测试中，元数据下刷比例分别减少0.11%和0.19%. HDD上IBT版本降低比例较SSD上测试低的主要原因是：Filebench测试预先写入的数据量相同，HDD上测试varmail负载和fileserver负载分别比SSD上测试执行的操作数少约92%和86%. 根据5.3.1节分析，删除操作是造成元数据下刷量差异的主要原因. 经统计，varmail和fileserver负载测试中discard I/O占写I/O请求的比例分别为26%和32.2%，均低于SSD上的测试结果. 造成discard I/O比例低的主要原因是：discard I/O操作元数据处理开销较大，HDD上处理较SSD慢，在测试结束后，ext4文件系统仍然在发送discard I/O. 因此，造成HDD上测试IBT版本元数据下刷比例降低的主要因素也是删除操作，造成降低比例较SSD测试低的原因是删除操作比例较低.

NAT块下刷量相对于元数据下刷量的比例如表10所示. discard I/O占比的差异与NAT块占比为正相关. 综上，在元数据写放大方面，相对于NAT版本，IBT版本在删除操作中的表现也更优.

表 10 基于HDD的Filebench测试不同负载NAT块下刷统计

Table 10. Statistics of Flushed NAT Block for Different Loads Under Filebench Test Based on HDD

负载	NAT块下刷量/GB	占比/%
varmail	0.4	17.3
fileserver	0.63	20.7

下载: 导出CSV

| 显示表格

综上，进行了Fio测试和Filebench测试，IBT版本相对于NAT版本：在HDD上的吞吐率和元数据下刷写放大方面，较SSD上的优化效果更显著；在处理大规模随机更新和删除操作时，开销更小.

6. 总　　结

本文主要研究了使用B+ tree管理日志结构块存储系统的地址映射面临的wandering B+ tree问题. B+ tree具有扇出大、综合效率高的优点，被广泛应用于各类存储系统中. 对于日志结构块存储系统，使用B+ tree管理逻辑地址和物理地址的映射需要解决：支持树结点下刷方式为异地写，并避免递归更新B+ tree树结构. 本文从树结构和树操作设计的角度出发，提出了IBT B+ tree，将树结点物理地址嵌入树结构的设计，引入dirty链表设计，定义IBT B+ tree插入、删除操作，并提出了非递归更新算法，既解决了wandering B+ tree问题，又不引入额外的数据结构和固定物理设备空间. 设计实现块设备存储系统Monty-Dev，将IBT B+ tree与NAT B+ tree进行对比，实验结果表明在不同的负载下IBT B+ tree的写放大表现与NAT B+ tree相当或更优，下刷效率更高. IBT B+ tree可应用于日志结构块设备系统，如ASD系统；也可应用于日志结构文件系统管理文件的地址映射，如NILFS2文件系统.

作者贡献声明：杨勇鹏负责论文撰写、部分实验方案设计、实验执行和论文修订；蒋德钧负责部分实验方案设计和论文修订.

图 1 实体关系重叠类型

Figure 1. Types of entity relationship overlapping

下载: 全尺寸图片幻灯片

图 2 相关模型技术对比

Figure 2. Comparison of related model techniques

下载: 全尺寸图片幻灯片

图 3 GMCD-JERE模型整体架构图

Figure 3. Overall architecture diagram of GMCD-JERE model

下载: 全尺寸图片幻灯片

图 4 基准模型框架对比

Figure 4. Comparison of baseline model architecture

下载: 全尺寸图片幻灯片

图 5 NYT不同抽取顺序下模型性能

Figure 5. Model performance under different extraction sequences in NYT

下载: 全尺寸图片幻灯片

图 6 WebNLG不同抽取顺序下模型性能

Figure 6. Model performance under different extraction sequences in WebNLG

下载: 全尺寸图片幻灯片

表 1 GMCD-JERE模型变量定义

Table 1 Variable Definitions for the GMCD-JERE

符号	描述
${\boldsymbol{h}}_i^{\text{E} }$	语句上下文特征
${{s} _{{ij} }}$	语句序列第i个和第j个词间注意力
${{M} _{{ij} }}$	语句序列第i个和第j个词间依赖权重
${\boldsymbol{h}}_{i} ^{l}$	第i个词在第l层卷积后的隐层状态
${{\boldsymbol{o}}^{ {(1)} } }$	解码器第1阶段的输出
${\boldsymbol{o} }_{ {{\rm{relation}}} }^{}$	句中各关系存在的概率
${{\boldsymbol{o}}^{ {(2)} } }$	解码器第2阶段的输出
${\boldsymbol{h}}_\lambda ^{}$	关系嵌入向量
${\boldsymbol{o} }_{ {{\rm{head}}} }^{ {{\rm{start}}} }$	头实体首位置在语句中各位置的概率
${\boldsymbol{o} }_{ {{\rm{head}}} }^{ {{\rm{end}}} }$	头实体尾位置在语句中各位置的概率
${{\boldsymbol{o}}^{ {(3)} } }$	解码器第3阶段的输出
${\boldsymbol{o} }_{ {{\rm{tail}}} }^{ {{\rm{start}}} }$	尾实体首位置在语句中各位置的概率
${\boldsymbol{o} }_{ {{\rm{tail}}} }^{ {{\rm{end}}} }$	尾实体尾位置在语句中各位置的概率
$\bar {\boldsymbol{o} }_{ {{\rm{head}}} }^{ {{\rm{start}}} }$	头实体首位置真实值
$\bar {\boldsymbol{o} }_{ {{\rm{head}}} }^{ {{\rm{end}}} }$	头实体尾位置真实值
$\bar {\boldsymbol{o} }_{ {{\rm{tail}}} }^{ {{\rm{start}}} }$	尾实体首位置真实值
$\bar {\boldsymbol{o} }_{ { {\rm{tail} } } }^{ { {\rm{end} } } }$	尾实体尾位置真实值
$\bar {\boldsymbol{o} }_{ { {\rm{relation} } } }^{}$	对应关系真实值

下载: 导出CSV

表 2 NYT和WebNLG数据集相关信息

Table 2 Related Information of NYT and WebNLG Datasets

类型	NYT			WebNLG
类型	训练	验证	测试	训练	验证	测试
Normal	35703	3208	3136	1600	182	246
EPO	11991	1030	1168	227	16	26
SEO	8502	762	696	3192	302	431
总计	56196	5000	5000	5019	500	703

下载: 导出CSV

表 3 模型性能对比

Table 3 Performance Comparison of the Models %

模型	NYT			WebNLG
模型	Precision	Recall	F1	Precision	Recall	F1
CopyRE_One	59.4	53.1	56.0	32.2	28.9	30.5
CopyRE_Mul	61.0	56.6	58.7	37.7	36.4	37.1
GraphRel_1p	62.9	57.3	60.0	42.3	39.2	40.7
GraphRel_2p	63.9	60.0	61.9	44.7	41.1	42.9
CopyMTL_One	72.7	69.2	70.9	57.8	60.1	58.9
CopyMTL_Mul	75.7	68.7	72.0	58.0	54.9	56.4
GMCD-JERE	80.0	73.8	76.8	43.9	42.7	43.3

下载: 导出CSV

参考文献(43)

[1]	李冬梅,张扬,李东远,等. 实体关系抽取方法研究综述[J]. 计算机研究与发展,2020,57(7):1424−1448 doi: 10.7544/issn1000-1239.2020.20190358 Li Dongmei, Zhang Yang, Li Dongyuan, et al. Review of entity relation extraction methods[J]. Journal of Computer Research and Development, 2020, 57(7): 1424−1448 (in Chinese) doi: 10.7544/issn1000-1239.2020.20190358
[2]	Zeng Daojian, Liu Kang, Lai Siwei, et al. Relation classification via convolutional deep neural network[C] //Proc of the 25th Int Conf on Computational Linguistics. Stroudsburg, PA: ACL, 2014: 2335−2344
[3]	Xu Kun, Feng Yansong, Huang Songfang, et al. Semantic relation classification via convolutional neural networks with simple negative sampling[C] //Proc of the 2015 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2015: 536−540
[4]	Chan S Y, Roth D. Exploiting syntactico-semantic structures for relation extraction[C] //Proc of the 49th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2011: 551−560
[5]	Li Qi, Ji Heng. Incremental joint extraction of entity mentions and relations[C] //Proc of the 52nd Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2014: 402−412
[6]	Miwa M, Bansal M. End-to-end relation extraction using LSTMs on sequences and tree structures[C] //Proc of the 54th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2016: 1105−1116
[7]	曹明宇,杨志豪,罗凌,等. 基于神经网络的药物实体与关系联合抽取[J]. 计算机研究与发展,2019,56(7):1432−1440 doi: 10.7544/issn1000-1239.2019.20180714 Cao Mingyu, Yang Zhihao, Luo Ling, et al. Joint drug entities and relations extraction based on neural networks[J]. Journal of Computer Research and Development, 2019, 56(7): 1432−1440 (in Chinese) doi: 10.7544/issn1000-1239.2019.20180714
[8]	Zhang Meishan, Zhang Yue, Fu Guohong. End-to-end neural relation extraction with global optimization[C] //Proc of the 2017 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2017: 1730−1740
[9]	Gupta P, Schtze H, Andrassy B. Table filling multi-task recurrent neural network for joint entity and relation extraction[C] //Proc of the 26th Int Conf on Computational Linguistics. Stroudsburg, PA: ACL, 2016: 2537−2547
[10]	Zheng Suncong, Wang Feng, Bao Hongyun, et al. Joint extraction of entities and relations based on a novel tagging scheme[C] //Proc of the 55th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2017: 1227−1236
[11]	Zeng Xiangrong, Zeng Daojian, He Shizhu, et al. Extracting relational facts by an end-to-end neural model with copy mechanism[C] //Proc of the 56th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2018: 506−514
[12]	Peng Nanyun, Hoifung P, Chris Q, et al. Cross-sentence n-ary relation extraction with graph LSTMs[J]. Transactions of the ACL, 2017, 5: 101–115
[13]	Sahu K S, Christopoulou F, Miwa M, et al. Inter-sentence relation extraction with document-level graph convolutional neural network[C] //Proc of the 57th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2019: 4309−4316
[14]	Dai Dai, Xiao Xinyan, Lu Yajuan, et al. Joint extraction of entities and overlapping relations using position-attentive sequence labeling[C] //Proc of the 33rd AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2019: 6300−6308
[15]	Nayak T, Ng H T. Effective modeling of encoder-decoder architecture for joint entity and relation extraction[C] //Proc of the 34th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2020: 8528−8535
[16]	甘丽新,万常选,刘德喜,等. 基于句法语义特征的中文实体关系抽取[J]. 计算机研究与发展,2016,53(2):284−302 doi: 10.7544/issn1000-1239.2016.20150842 Gan Lixin, Wan Changxuan, Liu Dexi, et al. Chinese named entity relation extraction based on syntactic and semantic features[J]. Journal of Computer Research and Development, 2016, 53(2): 284−302 (in Chinese) doi: 10.7544/issn1000-1239.2016.20150842
[17]	田驰远,陈德华,王梅,等. 基于依存句法分析的病例报告结构化处理方法[J]. 计算机研究与发展,2016,52(12):2669−2680 doi: 10.7544/issn1000-1239.2016.20160611 Tian Chiyuan, Chen Dehua, Wang Mei, et al. Structured processing for pathological reports based on dependency parsing[J]. Journal of Computer Research and Development, 2016, 52(12): 2669−2680 (in Chinese) doi: 10.7544/issn1000-1239.2016.20160611
[18]	刘克彬,李芳,刘磊,等. 基于核函数中文关系自动抽取系统的实现[J]. 计算机研究与发展,2007,44(8):1406−1411 doi: 10.1360/crad20070818 Liu Kebin, Li Fang, Liu Lei, et al. Implement of a kernel-based chinese relation extraction system[J]. Journal of Computer Research and Development, 2007, 44(8): 1406−1411 (in Chinese) doi: 10.1360/crad20070818
[19]	Zelenko D, Aone C, Richardella A. Kernel methods for relation extraction[C] //Proc of the 2002 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2002: 71−78
[20]	Hendrickx I, Kim N S, Kozareva Z, et al. Semeval-2010 task 8: Multi-way classification of semantic relations between pairs of nominals[C] //Proc of the 5th Int Workshop on Semantic Evaluation. Stroudsburg, PA: ACL, 2010: 33−38
[21]	Xu Yan, Mou Lili, Li Ge, et al. Classifying relations via long short term memory networks along shortest dependency paths[C] //Proc of the 2015 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2015: 1785−1794
[22]	Florian R, Jing Hongyan, Kambhatla N, et al. Factorizing complex models: A case study in mention detection[C] //Proc of the 44th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2006: 473−480
[23]	Florian R, Pitrelli J, Roukos S. et al. Improving mention detection robustness to noisy input[C] //Proc of the 2010 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2010: 335−345
[24]	Zhao Shubin, Grishman R. Extracting relations with integrated information using kernel methods[C] //Proc of the 43rd Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2005: 419−426
[25]	Jiang Jing, Zhai Chengxiang. A systematic exploration of the feature space for relation extraction[C] //Proc of the 2007 Conf of the North American Chapter of the ACL. Stroudsburg, PA: ACL, 2007: 113−120
[26]	Sun A, Grishman R, Sekine S. Semi-supervised relation extraction with large-scale word clustering[C] //Proc of the 49th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2011: 521−529
[27]	Plank B, Moschitti A. Embedding semantic similarity in tree kernels for domain adaptation of relation extraction[C] //Proc of the 51st Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2013: 1498−1507
[28]	Mintz M, Bills S, Snow R, et al. Distant supervision for relation extraction without labeled data[C] //Proc of the Conf of the 47th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2009: 1003−1011
[29]	Cai Rui, Zhang Xiaodong, Wang Houfang. Bidirectional recurrent convolutional neural network for relation classification[C] //Proc of the 54th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2016: 756−765
[30]	Christopoulou F, Miwa M, Ananiadou S. A walk-based model on entity graphs for relation extraction[C] //Proc of the 56th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2018: 81−88
[31]	Qin Pengda, Xu Weiran, Wang Yang William. Robust distant supervision relation extraction via deep reinforcement learning[C] //Proc of the 56th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2018: 2137−2147
[32]	Yu Xiaofeng, Lam W. Jointly identifying entities and extracting relations in encyclopedia text via a graphical model approach[C] //Proc of the 2010 Conf on Computational Linguistics. Stroudsburg, PA: ACL, 2010: 1399−1407
[33]	Miwa M, Sasaki Y. Modeling joint entity and relation extraction with table representation[C] //Proc of the 2014 Conf on EMNLP. Stroudsburg, PA: ACL, 2014: 1858−1869
[34]	Ren Xiang, Wu Zeqiu, He Wenqi, et al. CoType: Joint extraction of typed entities and relations with knowledge bases[C] //Proc of the 26th Int Conf on World Wide Web. New York: ACM, 2017: 1015−1024
[35]	黄培馨,赵翔,方阳,等. 融合对抗训练的端到端知识三元组联合抽取[J]. 计算机研究与发展,2019,56(12):2536−2548 doi: 10.7544/issn1000-1239.2019.20190640 Huang Peixin, Zhao Xiang, Fang Yang, et al. End-to-end knowledge triplet extraction combined with adversarial training[J]. Journal of Computer Research and Development, 2019, 56(12): 2536−2548 (in Chinese) doi: 10.7544/issn1000-1239.2019.20190640
[36]	Fu T J, Li P, Ma W Y. GraphRel: Modeling text as relational graphs for joint entity and relation extraction[C] //Proc of the 57th Annual Meeting of the ACL. Stroudsburg, PA: ACL, 2019: 1409−1418
[37]	Zeng Daojian, Zhang Haoran, Liu Qianying. CopyMTL: Copy mechanism for joint extraction of entities and relations with multi-task learning[C] //Proc of the 34th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2020: 9507−9514
[38]	Marcheggiani D, Titov I. Encoding sentences with graph convolutional networks for semantic role labeling[C] //Proc of the 2017 Conf on EMNLP. Stroudsburg, PA: ACL, 2017: 1506−1515
[39]	Liu Bang, Zhang Ting, Niu Di, et al. Matching long text documents via graph convolutional networks[J]. arXiv preprint, arXiv: 1802.07459, 2018
[40]	Cetoli A, Bragaglia S, O’Harney A, et al. Graph convolutional networks for named entity recognition[C] //Proc of the 16th Int Workshop on Treebanks and Linguistic Theories. Stroudsburg, PA: ACL, 2018: 37−45
[41]	Zhang Yuhao, Qi Peng, Christopher D M. Graph convolution over pruned dependency trees improves relation extraction[C] //Proc of the 2018 Conf on EMNLP. Stroudsburg, PA: ACL, 2018: 2205−2215
[42]	Luan Yi, Wadden D, He Luheng, et al. A general framework for information extraction using dynamic span graphs[C] //Proc of the 2019 Conf of the North American Chapter of the ACL. Stroudsburg, PA: ACL, 2019: 3036−3046
[43]	Qian Yujie, Santus E, Jin Zhijing, et al. GraphIE: A graph-based framework for information extraction[C] //Proc of the 2019 Conf of the North American Chapter of the ACL. Stroudsburg, PA: ACL, 2019: 751−761

施引文献(2)

期刊类型引用(2)

1.	李斌，刘思尧. 基于LSM树的视频数据扩容存储系统设计. 电子设计工程. 2025(01): 31-35 . 百度学术
2.	杨勇鹏，蒋德钧. 一种日志结构块存储系统一致性模型. 高技术通讯. 2024(04): 366-378 . 百度学术

其他类型引用(0)

资源附件(0)

图(6) / 表(3)

计量

文章访问数: 235
HTML全文浏览量: 37
PDF下载量: 117
被引次数: 2

1. 相关工作
1.1 NILFS2
1.2 F2FS
1.3 ASD
2. wandering B+ tree问题分析和结构设计
2.1 wandering B+ tree问题分析
2.2 IBT B+ tree树结点布局
2.3 IBT B+ tree链表设计
2.4 IBT B+ tree基本操作设计
2.4.1 插入操作
2.4.2 删除操作
3. IBT B+ tree下刷
4. IBT B+ tree评价系统设计实现
4.1 Monty-Dev系统整体架构
4.2 元数据管理模块
4.3 Monty-Dev系统layout
5. 测评与分析
5.1 测试环境
5.2 Fio测试
5.2.1 基于SSD的Fio测试
5.2.2 基于HDD的Fio测试
5.3 Filebench测试
5.3.1 基于SSD的Filebench测试
5.3.2 基于HDD的Filebench测试
6. 总　　结

1. 相关工作
1.1 NILFS2
1.2 F2FS
1.3 ASD
2. wandering B+ tree问题分析和结构设计
2.1 wandering B+ tree问题分析
2.2 IBT B+ tree树结点布局
2.3 IBT B+ tree链表设计
2.4 IBT B+ tree基本操作设计
2.4.1 插入操作
2.4.2 删除操作
3. IBT B+ tree下刷
4. IBT B+ tree评价系统设计实现
4.1 Monty-Dev系统整体架构
4.2 元数据管理模块
4.3 Monty-Dev系统layout
5. 测评与分析
5.1 测试环境
5.2 Fio测试
5.2.1 基于SSD的Fio测试
5.2.2 基于HDD的Fio测试
5.3 Filebench测试
5.3.1 基于SSD的Filebench测试
5.3.2 基于HDD的Filebench测试
6. 总　　结

参考文献(43)

施引文献(2)

资源附件(0)

图卷积增强多路解码的实体关系联合抽取模型

通讯作者: 于亚新（yuyx@mail.neu.edu.cn）

计量

出版历程

Graph Convolution-Enhanced Multi-Channel Decoding Joint Entity and Relation Extraction Model

1. 相关工作

1.1 NILFS2

1.2 F2FS

1.3 ASD

2. wandering B+ tree问题分析和结构设计

2.1 wandering B+ tree问题分析

2.2 IBT B+ tree树结点布局

2.3 IBT B+ tree链表设计

2.4 IBT B+ tree基本操作设计

2.4.1 插入操作

2.4.2 删除操作

3. IBT B+ tree下刷

4. IBT B+ tree评价系统设计实现

4.1 Monty-Dev系统整体架构

4.2 元数据管理模块

4.3 Monty-Dev系统layout

5. 测评与分析

5.1 测试环境

5.2 Fio测试

5.2.1 基于SSD的Fio测试

5.2.2 基于HDD的Fio测试

5.3 Filebench测试

5.3.1 基于SSD的Filebench测试

5.3.2 基于HDD的Filebench测试

6. 总 结

期刊类型引用(2)

其他类型引用(0)

计量

出版历程

目录

1. 相关工作

1.1 NILFS2

1.2 F2FS

1.3 ASD

2. wandering B+ tree问题分析和结构设计

2.1 wandering B+ tree问题分析

2.2 IBT B+ tree树结点布局

2.3 IBT B+ tree链表设计

2.4 IBT B+ tree基本操作设计

2.4.1 插入操作

2.4.2 删除操作

3. IBT B+ tree下刷

4. IBT B+ tree评价系统设计实现

4.1 Monty-Dev系统整体架构

4.2 元数据管理模块

4.3 Monty-Dev系统layout

5. 测评与分析

5.1 测试环境

5.2 Fio测试

5.2.1 基于SSD的Fio测试

5.2.2 基于HDD的Fio测试

5.3 Filebench测试

5.3.1 基于SSD的Filebench测试

5.3.2 基于HDD的Filebench测试

6. 总 结

通讯作者:
于亚新（yuyx@mail.neu.edu.cn）

6. 总　　结

6. 总　　结