基于顶点划分和坐标标准化的密文域3维网格模型可逆信息隐藏

吕皖丽; 唐运; 殷赵霞; 罗斌

doi:10.7544/issn1000-1239.202221040

基于顶点划分和坐标标准化的密文域3维网格模型可逆信息隐藏

吕皖丽^1,,
唐运¹,
殷赵霞^2, ,,
罗斌¹

1.
智能计算与信号处理教育部重点实验室（安徽大学）　合肥　230601
2.
华东师范大学通信与电子工程学院　上海　200241

基金项目: 国家自然科学基金项目（62172001,61872003）；安徽省高等学校科学研究项目（2022AH50120）

详细信息

作者简介:
吕皖丽: 1974年生. 博士，副教授. 主要研究方向为图像处理、数值水印、信息安全

唐运: 1999年生. 硕士研究生. 主要研究方向为密文域3维网格模型可逆信息隐藏

殷赵霞: 1983年生. 博士，教授. 主要研究方向为信息隐藏、人工智能安全和多媒体内容保护

罗斌: 1963年生. 博士，教授. 主要研究方向为模式识别、数字图像处理

通讯作者:
殷赵霞（zxyin@cee.ecnu.edu.cn）

中图分类号: TP309
计量
- 文章访问数: 131
- HTML全文浏览量: 13
- PDF下载量: 53
出版历程
- 收稿日期: 2022-12-29
- 修回日期: 2023-08-15
- 网络出版日期: 2024-03-13
- 刊出日期: 2024-05-31

Reversible Data Hiding for 3D Mesh Model in Encrypted Domain Based on Vertex Partition and Coordinate Standardization

1.
Key Laboratory of Intelligent Computing and Signal Processing (Anhui University), Ministry of Education, Hefei 230601
2.
School of Communication & Electronic Engineering, East China Normal University, Shanghai 200241

Funds: This work was supported by the National Natural Science Foundation of China (62172001,61872003) and the Research Project of Anhui Provincial Department of Education (2022AH50120).

More Information

Author Bio:
Lü Wanli: born in 1974. PhD, associate professor. Her main research interests include image processing, digital watermarking, and information security

Tang Yun: born in 1999. Master candidate. His main research interest includes reversible data hiding in 3D mesh models in encrypted domain

Yin Zhaoxia: born in 1983. PhD, professor. Her main research interests include data hiding, privacy&security of multimedia and artificial intelligence

Luo Bin: born in 1963. PhD, professor. His main research interests include patterns recognition and digital image processing

摘要

摘要:
密文可逆信息隐藏技术可以在加密载体中利用冗余空间额外嵌入信息，在传输过程中保障载体和信息的隐私安全，载体接收者还可以实现无损地提取信息和恢复载体.3维网格模型作为新型的数字媒体，其文件结构与传统的图像等数字媒体存在着不同，并且在该领域的研究相对较少. 如何提升模型的嵌入容量是目前需要解决的问题. 将图像领域多个高有效位预测算法直接迁移到3维模型中应用时，由于数据的存储格式与图像媒体不同，使得算法的预测性能受到了限制. 因此，提出了将顶点坐标值标准化处理，消除符号位带来的影响，提升了预测算法的性能. 为了进一步减少无用的辅助信息，嵌入集顶点的筛选被加入实验中，成功地为有效载荷腾出空间. 实验表明，提出的方法与现有方法相比，在保证无损和可分离地恢复模型与所嵌入的信息的同时，获得了最高的嵌入容量.
- 3维网格模型 /
- 可逆信息隐藏 /
- 密文域 /
- 预测误差 /
- 嵌入容量
Abstract:
Reversible data hiding in encrypted domain enables the secure and confidential embedding of additional information in encrypted multimedia, ensuring the privacy and integrity of both the carrier and the embedded data during transmission. The authorized recipients can extract the data without any loss and recover the media successfully. In the realm of digital media, 3D mesh models, being a relatively nascent form, possesses a distinctive file structure markedly different from that of conventional image media. Consequently, limited research has been conducted in this domain. Augmenting the embedding capacity of 3D mesh models in the encrypted domain poses an enduring challenge. The direct application of multiple most significant bit prediction algorithm from the image domain to 3D mesh models is impeded by disparities in data storage formats, thus encumbering the predictive performance of algorithms. To effectively tackle this issue, we propose the adoption of coordinate standardization to eliminate the influence of the sign bit and ameliorate the prediction algorithm’s overall performance. In order to further mitigate the inclusion of redundant auxiliary information, we introduce the integration of the selection of embedding set vertices into our experiments, which effectively generates additional payload space. The experimental results affirm that our purposed methodology attains the maximum embedding capacity while guaranteeing lossless and separable recovery of both the model and the embedded information, surpassing the capabilities of existing techniques.
- 3D mesh model /
- reversible data hiding /
- encrypted domain /
- prediction error /
- embedding capacity

HTML全文

现实世界中的大量问题都可以抽象成图模型（graph model），也就是节点和边的集合，包括自然语言处理^[1]、异常检测^[2-3]、学术网络分析、生物医疗、推荐系统等. 图是一种不同规则的非欧氏几何数据，图数据的结构错综复杂，包含大量的信息，比如结构信息、节点特征信息等. 通过学习基于图形的嵌入表示，可以获取结构化数据的顺序、拓扑、几何和其他关系特征. 近年来，图深度学习的研究是学术界和产业界的一个热点，主要集中在节点分类^[4]、链路预测^[5]、图分类等. 本文将重点关注的是图分类任务. 图分类任务的关键是学习图与对应标签的映射关系. 图分类在生物化学方面有着广泛的应用，例如对一些化学分子图进行分类来判断其活性、水溶性、毒性等. 因此研究图分类问题有着重要意义.

图分类的重要方法之一是图核方法，它是一种计算图之间相似度的重要方法，把一些在低维空间下非线性不可分的数据转化到高维空间中，使得这些数据线性可分，是专门针对图数据的一种特殊方法. 图核函数一般是根据专家知识设计的，它考虑了不同子结构的相似性，例如随机游走核和最短路径核. 不同的图核函数之间也能相互融合，例如多图核学习^[6]. 这就为图分类引入不同的相似度度量方法和不同的偏差，从而生成具有不同性能的图分类模型. 然而在缺乏专家知识的情况下，执行图分类任务时很难确定选择哪种图核函数是最好的.

随着深度学习的兴起，图卷积神经网络（graph convolution neural networks, GCN）^[7]成为图数据挖掘领域最重要的方法之一. GCN首次提出了卷积的方式融合图结构特征，提供了一个全新的视角，即在节点嵌入表示中将邻域节点的特征融入其中，与将节点特征直接通过全连接层分类的方法相比，在节点分类准确度上得到了很大提升. 然而GCN存在共享权重、灵活性差、可扩展性不强的缺点，此外当网络层数增加时，会出现过平滑现象，导致每个节点的特征结果十分相似. 为了解决GCN领域聚合时权值共享问题，带有注意力机制的图注意力网络（graph attention network, GAT）^[8]被提出，GAT具有高效低存储的优点，GAT是基于邻居节点的计算方式，它属于一种归纳的学习方式. GAT的缺点就是只归纳了1阶邻居，导致GAT的感受野必须依赖深层的网络. 为了解决GCN扩展性差的问题， GraphSAGE（graph sample and aggregate）^[9]提出了多种节点采样和聚合的方法，使图的嵌入表示更加灵活，当图中有新的节点加入时，固定的节点采样方式使得GraphSAGE无需对所有的节点进行重新训练，便可获取最新的嵌入. 图神经网络（graph neural network，GNN）主要是针对节点特征的更新与提取，图分类要在此基础上增加图池化的操作，图池化主要是在图节点嵌入的基础上得到整个图的嵌入，其中主流的图池化方法有2种，即全局池化和分层池化. 全局池化是在叠加图卷积之后运用全局池化操作（如最大池化和平均池化）选出能代表整张图表示的节点信息. 分层池化借鉴了CNN中的池化，每次池化都会缩小数据的规模，对于图数据来说，就是通过某种算法减少节点的数目来完成逐层的抽取，从而实现图的池化，这种算法有Top-k^[10]、图聚类池化等. 图神经网络用于图分类的整个过程如图1所示.

图 1 基于图神经网络的图分类过程

Figure 1. The process of graph classification based on graph neural networks

下载: 全尺寸图片幻灯片

为了提升图神经网络的图分类性能，近年来，一些研究人员致力于把图核与图神经进行融合，提出了许多基于图核的图神经网络框架. 例如图卷积核网络（graph convolutional kernel network，GCKN）^[11]采用随机游走核提取路径并投影到核空间中，然后把核空间中路径信息聚合到起始节点上. 图结构核网络（graph structural kernel network，GSKN）^[12]在GCKN的基础上增加了匿名随机游走核，使得提取局部子结构的能力得到了进一步的加强. 这2种框架虽然能在一定程度上提升表达能力，但提取路径的操作耗费大量时间. 核图神经网络（kernel graph neural network，KerGNN）^[13]也是采用随机游走核与图神经网络进行融合，与先前工作不同的是，它采用可训练隐藏图作为图滤波器，与子图进行结合，并利用图核更新节点嵌入，使得图神经网络具有一定的可解释性，降低了图核计算的时间复杂度，然而对于图分类的性能提升不大.

影响图分类性能主要有2个方面：1）对图节点的特征编码；2）对图的结构编码. 在一些化学分子图中，结构对性能的影响占比很大，这类图的性质与特定子图结构的相关性比较强，对于一些社交网络图，这类图不依赖于特定的局部结构，节点特征分布对图分类性能影响较大. 基于图核的方法，对图的结构编码的方法重点关注图之间的结构相似性，本质上来说也是对图的一种结构相似性编码，因此图核方法在一些化学分子图上表现出良好的性能，但对于一些社交网络图表现出的性能相对较差. 而基于图神经网络的模型更加关注节点的特征. 其本质上也是基于消息传递的框架. 当今的一些图神经网络框架存在3个问题：1）在图神经网络的邻域聚合的过程中，获取了图的树形结构信息和邻域内的节点特征信息，却无法区分例如多元环等高阶子结构；2）为了获得更好的性能，图神经网络会叠加多层特征信息，但是这个层数的设置很难把握，如果设置过大，会产生过平滑问题，也即是，它使得深层的节点嵌入表示都十分相似，因此，把这些相似的节点嵌入堆叠会破坏图节点特征编码与图标签的单射关系，最终会导致图分类性能下降；3）以往图核和图神经网络融合的工作主要是采用随机游走核来提升节点获取邻域内高阶子结构信息的能力，但是这种方法的时间复杂度较大. 此外，随机游走核具有不确定性，无法保证每一次游走的路径都包含了高阶子结构信息. 为了解决这3个问题，本文将WL（Weisfeiler-Lehman）^[14]核与图神经网络融合起来，WL核对图数据进行结构相似性编码，图同构网络（graph isomorphism network，GIN）^[15]对图的节点特征进行编码，并将这2部分编码通过注意力加权方式进行融合，相当于在基于消息传递的图神经网络中增加了图的结构相似性信息，提升图神经网络的表达能力.

本文的主要贡献包括4个方面：

1）提供了一个新的视角，将WL核应用到图神经网络领域中，通过GIN与WL 核方法进行融合，丰富图的结构特征和节点特征，提升GIN对高阶图结构的判别能力；

2）针对不同类型的图数据集，提出基于注意力机制的图结构相似编码和图节点特征编码的融合方法，完成两者权重的自适应学习；

3）在图核中，使用Nyström方法构建一个低秩矩阵去近似原核矩阵，从而大大降低图核矩阵的维度，解决图核矩阵在计算中运算代价大的问题；

4）在7个公开的图数据集上，与一些当前已知性能最好的多种代表性的图分类基准模型相比，所提出的模型在大多数数据集上可以表现出更好的性能.

1. 相关工作

1.1 基于WL核的图分类方法

WL核是当前应用最广泛的图核方法之一，它是基于子树的图核方法，其主要思想是对图进行子树分解，使用子树间的相似度来代替图的相似度，它是一种基于1-WL图同构测试所提出的一种快速特征提取算法，详细的操作步骤为：对于拥有多个节点标签的离散图，首先对各个节点进行邻域聚合；然后对邻居节点进行排序，与此同时，节点标签和排序后的邻居标签共同组成多重集，并对这些多重集进行压缩映射，生成对应的新标签，进而将这些新标签赋给节点，这样就完成了一次迭代. 在迭代过程中，重新标记的过程以及多重集的压缩是所有输入图同时进行的，并且所有图共享标签压缩的对应关系.

具有H次迭代的2个图 ${G_1}$ 和图 ${G_2}$ 上的WL子树核被定义为

$K_{{\mathrm{sub}}}^h({G_1},{G_2}) = \left\langle {\phi _{{\mathrm{WL}}}^h({G_1}),\phi _{{\mathrm{WL}}}^h({G_2})} \right\rangle \text{，}$

(1)

$\phi _{{\mathrm{WL}}}^h(G) = ({c_0}(G,{\sigma _{01}}),{c_1}(G,{\sigma _{02}}), …,{c_h}(G,{\sigma _{0\left| {{\Sigma _h}} \right|}})) \text{，}$

(2)

其中 $\phi _{{\mathrm{WL}}}^h(G)$ 表示 $h$ 次迭代中节点标签出现的次数， ${c_i}(G,{\sigma _{ij}})$ 表示节点 ${\sigma _{ij}}$ 在图 $G$ 中出现的次数. WL核的图同构测试能力被证明是图神经网络的上限，图同构是图论中用来描述2个图在拓扑结构上是否完全等价的一个概念，如果2个图 ${G_1}$ 和 ${G_2}$ 完全等价，那么就称 ${G_1}$ 和 ${G_2}$ 是同构的. 判断2个图是否为同构是一个非常困难的问题，目前还没有一个可以在多项式时间内求解的算法. 除了一些极端的情况外，WL测试可以被用来判断2个图是否同构. 与一些传统的图核方法，如随机游走核^[16]、最短路径核^[17]或REGK核^[18]相比，WL测试的同构检测能力是该领域的一个重要进步，该方法的运行时间仅与节点和边的数量呈线性关系，同时在各种统计学习任务中表现出良好的性能.

1.2 基于图同构网络（GIN）的图分类方法

图神经网络的任务主要是进行图节点表征学习，并基于学习到的节点表征进行下游的任务，例如节点分类或者链路预测等. 而GIN提出了图级别表示学习，即图表征学习. 图表征学习要求根据节点属性、边和边的属性（如果有的话）生成一个向量作为图的表征，基于图表征可以做图的预测. 基于GIN的图表征学习主要包含2个过程：1）计算得到图的节点特征，即每一个节点的特征依次聚合各个邻居节点的特征，常用的图神经网络节点聚集函数有求和函数、平均函数和最大化函数. 2）在GIN中，节点聚集函数选择的是求和函数，而不是选择平均函数，原因是平均函数不能识别某一节点出现的次数，不能精确描述多重集，它只能捕捉实体的特征分布，而最大化函数适合捕捉具有代表性的元素或“骨架”，而不能区分确切的结构或分布的任务. 图神经网络还有其他的节点聚合函数，如加权平均、LSTM池化等，而对判断同构问题来说，本文使用了基于注意力机制的自适应加权求和方法，此方法具有较强的表征能力.

为了实现图节点特征编码与图标签的单射，GIN使用加法作为聚合函数，并使用多层感知机来模拟函数的组合，实现每层之间的映射关系，更新GIN节点表示函数为：

${\boldsymbol{h}}_v^{(k)} = ML{P^{(k)}}\left((1 + {\varepsilon ^{(k)}}){\boldsymbol{h}}_v^{(k - 1)} + \sum_{u \in N(v)} {{\boldsymbol{h}}_u^{(k - 1)}} \right) \text{，}$

(3)

其中 ${\boldsymbol{h}}_v^{(k)}$ 表示在第k层节点v的特征表示，N(v)表示节点v的邻居节点， $\varepsilon$ 为一个可学习的参数或者一个固定的标量，进一步对图上各个节点的表征进行图池化（graph pooling）或图读出（graph readout），得到整个图的表征（graph representation），并将所有层读出的图表征拼接起来：

${{\boldsymbol{h}}_G} = Concat\left( {Readout\left(\left\{ { {{\boldsymbol{h}}_v^{(k)}} |v \in G} \right\}\right)} |k = 0,1, … ,K\right) ，$

(4)

其中 ${{\boldsymbol{h}}_G}$ 是整个图的嵌入表示，这里的读出函数分别使用了求和、求平均和MLP.

1.3 Nyström方法

图核方法的计算代价比较大，对于一个有n个图的数据集，得到的图核矩阵是n²个元素，当n非常大时，图的结构编码维度就比较大，Nyström方法^[19]是作为一种使用简单正交规则离散积分方程的方法而被提出的，是一种广泛使用的降维方法，用于给定的列采样子集逼近核矩阵^[20]. Nyström常用在核空间的计算问题中，对于一个样本集合 $\{ {x_1},{x_2}, …,{x_n}\}$ ,以及它们的核矩阵 ${\boldsymbol{K}} \in {\mathbb{R}^{n \times n}}$ ，Nyström可通过采样的方式，构建一个低秩矩阵去近似表示原核矩阵，降低核矩阵在计算中的运算代价. Nyström可以作为一种无监督的降维编码. 同时，也可以得到核空间中样本的矩阵表示 $\tilde {\boldsymbol{K}} \in {\mathbb{R}^{n \times d}}$ .

2. 图核同构网络KerGIN

本节将重点介绍KerGIN，该模型以GIN为基础，借助图核方法，将图的结构特征和节点特征进行深度融合. 本文提出的模型框架如所示，整个模型分为3个部分：GIN编码器、图核和注意力模块，下面将对模型的每一部分进行详细的介绍. 首先介绍关于图核和相关图同构网络模型的一些基本概念. 一个图可以表示为 $g = (V,\;{\boldsymbol{X}},\;{\boldsymbol{A}})$ ，其中 $V = \{ {v_1}, {v_2}, …,{v_N}\}$ 表示图节点的集合， ${\boldsymbol{X}} \in {\mathbb{R}^{N \times d}}$ 表示图中节点的特征，总共有 $N$ 个节点，每个节点的特征维度都是 $d$ ， ${\boldsymbol{A}} \in {\mathbb{R}^{N \times N}}$ 表示图的邻接矩阵，本文所研究的图都是无权无向图，如果节点 ${v_i}$ 与 ${v_j}$ 之间存在边，则 ${A_{ij}} = 1$ ，否则 ${A_{ij}} = 0$ . 对于图分类问题，给定一个数据集 $\{ ({g_1},{y_1}),({g_2},{y_2}), …,({g_n},{y_n})\}$ ，其中 $y$ 表示图的标签. 图分类任务的目的就是学习到由图 $g$ 到标签 $y$ 的映射函数 ${y_g} = f(g)$ . 本文使用one-hot编码处理离散标签. 例如4个标签分别由4维向量(1, 0, 0, 0)，(0, 1, 0, 0)，(0, 0, 1, 0)，(0, 0, 0, 1)来表示.

图 2 KerGIN总体框架

Figure 2. The overall architecture of KerGIN

下载: 全尺寸图片幻灯片

2.1 GIN编码

根据图的邻接矩阵 ${\boldsymbol{A}}$ 和图的特征 ${\boldsymbol{X}}$ ，使用GIN对图进行编码，首先对每个节点进行邻居的采样和聚合，采样一个节点的所有邻居，聚合邻居采用求和函数，即每个节点的特征加上邻居节点的特征. 节点特征采样函数和聚合函数分别为：

${\boldsymbol{a}}_v^{(k)} = Aggregat{e^{(k)}}(\{ {\boldsymbol{h}}_u^{(k - 1)}:u \in N(v)\} ) \text{，}$

(5)

${\boldsymbol{h}}_u^{(k)} = Combin{e^{(k)}}({\boldsymbol{h}}_u^{(k - 1)},{\boldsymbol{a}}_v^{(k)}) \text{，}$

(6)

其中 $Aggregate$ ()是采样邻居节点函数， $Combine$ ()是求和函数，因为GIN已经证明了求和函数是单射的. 进一步在k层得到的特征向量 ${\boldsymbol{h}}_v^{(k)}$ 经过一个多层感知机：

${\boldsymbol{H}}_v^{(k)} = ML{P^{(k)}}({\boldsymbol{h}}_v^{(k)}) \text{，}$

(7)

这样即可得到每个节点经过消息传递后的特征向量 ${\boldsymbol{H}}_v^{(k)}$ ，然后再将每一层得到的特征向量相加，即把每一层求和后的特征向量拼接起来，这样就得到了图的特征编码 ${{\boldsymbol{H}}_G}$ ，该过程采用的函数表达式为：

${{\boldsymbol{H}}^{(k)}} = \sum\limits_{v \in V} {{\boldsymbol{H}}_v^{(k)}} \text{，}$

(8)

${{\boldsymbol{H}}_G} = Concat(\{ \left. {{{\boldsymbol{H}}^{(k)}}} \right|k = 0,1, …,m\} ) .$

(9)

2.2 WL图核矩阵的生成

在2.1节中GIN已经对图进行了节点特征编码，在本节中重点关注对于图的结构特征编码. 由于GIN对图的结构表征能力有限，所以引入一个图核矩阵即图的结构相似性编码来增强GIN的结构表征能力.

图核用于计算2个图的相似度，对于一个图数据集 $G = \{ {g_1},{g_2}, …,{g_N}\}$ ，计算每2个图的核值，构成核矩阵 ${\boldsymbol{ K}} \in {\mathbb{R}^{N \times N}}$ ，图核矩阵中的 $i$ 行表示的图与其他图 ${g_i}$ 的结构相似度，相当于对图 ${g_i}$ 的结构相似性编码，本文使用的图核是不带节点标签的WL核，即输入2个图的邻接矩阵 ${\boldsymbol{A}} \in {\mathbb{R}^{N \times N}}$ ，不需要节点的特征或者节点的标签. 如图3所示，对于2个原始的图，聚合其邻居节点，然后对聚合后的每一个节点进行重新的哈希编码，即对节点使用新的颜色来表示，这是进行1次迭代所得到的结果，然后按颜色来统计所有节点的个数，这样就把图转化为特征向量，最后2个向量之间求内积，即得到2个图的相似度，求2个图的核值函数为：

图 3 WL核执行过程图

Figure 3. Diagram of the implementation process of WL kernel

下载: 全尺寸图片幻灯片

${K_{{\mathrm{WL}}}}({g_i},{g_j}) = \sum\limits_{i = 0}^k {K_{{\mathrm{subtree}}}^{(i)}} ({g_i},{g_j}) \text{，}$

(10)

$K_{{\mathrm{subtree}}}^{(i)} = \sum\limits_{u \in {V_i}} {\sum\limits_{u' \in {V_j}} {k_{{\mathrm{subtree}}}^{(i)}} } (u,u') .$

(11)

在WL核的计算过程中，用内积来度量2个图的子树模式向量. 本文也选取了其他常用的图核函数进行了对比实验，如最短路径（shortest path, SP）核、随机游走（random walk, RW）核，详见3.4节，最后采用了效果最优的WL核.

2.3 Nyström降秩分解

在2.2节中得到了图数据集的核矩阵，这里的图核矩阵的维度通常较大，空间复杂度为 $O({N^2})$ ，如果图数据集的数量庞大，将导致后续的计算代价很大. Nyström方法常用在核空间的计算问题中，通过降秩分解，可以显著降低核矩阵的维度. 核矩阵 ${\boldsymbol{K}} \in {\mathbb{R}^{N \times N}}$ 是对称正定矩阵，核矩阵的分解过程为：

${{\boldsymbol{K}}} = \left( {\begin{array}{*{20}{c}} {{\boldsymbol{A}}}&{{{{\boldsymbol{B}}}^{\mathrm{T}}}} \\ {{\boldsymbol{B}}}&{{\boldsymbol{C}}} \end{array}} \right)\text{，}$

(12)

其中 ${{\boldsymbol{A}}} \in {\mathbb{R}^{k \times k}}$ ， $k \lt n$ ，假设 ${\boldsymbol{K}} = {\boldsymbol{U}}{\boldsymbol{\varLambda}} {{\boldsymbol{U}}^{\mathrm{T}}}$ ， ${\boldsymbol{ A}} = {{\boldsymbol{U}}_A}{{\boldsymbol{\varLambda}} _A}{\boldsymbol{U}}_A^{\mathrm{T}}$ ，令

$\tilde {\boldsymbol{U}} = \left( {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_A}} \\ {{\boldsymbol{B}}{{\boldsymbol{U}}_A}{\boldsymbol{\varLambda}} _A^{ - 1}} \end{array}} \right) \text{，}$

(13)

则

$\tilde {\boldsymbol{K}} = \tilde {\boldsymbol{U}}{{\boldsymbol{\varLambda}} _A}{\tilde {\boldsymbol{U}}^{\rm{T}}} = \left( {\begin{array}{*{20}{c}} {\boldsymbol{A}}&{{{\boldsymbol{B}}^{\rm{T}}}} \\ {\boldsymbol{B}}&{{\boldsymbol{B}}{{\boldsymbol{A}}^{ - 1}}{{\boldsymbol{B}}^{\rm{T}}}} \end{array}} \right) \text{，}$

(14)

易得

$\left\| {{\boldsymbol{K}} - \tilde {\boldsymbol{K}}} \right\| = \left\| {{\boldsymbol{C}} - {\boldsymbol{B}}{{\boldsymbol{A}}^{ - 1}}{{\boldsymbol{B}}^{\mathrm{T}}}} \right\| \text{，}$

(15)

此时得到的核矩阵 $\tilde {\boldsymbol{K}}$ 近似于原核矩阵 ${\boldsymbol{K}}$ ，由矩阵分解可得 $\tilde {\boldsymbol{K}} \approx {\boldsymbol{Q}}{{\boldsymbol{Q}}^{\mathrm{T}}}$ ， ${\boldsymbol{Q}}$ 的维度是 ${\boldsymbol{Q}} \in {\mathbb{R}^{N \times k}}$ ，其中 $k \ll N$ ，这时核矩阵的空间复杂度由 $O({N^2})$ 降为 $O(Nk)$ ，从而降低了运算代价.

由于降维后的核矩阵与2.1节中GIN编码维度不一致，在这里使用神经网络对核矩阵的维度与GIN编码的向量对齐，定义一个2层的神经网络，共享1个隐藏层，为了防止梯度消失或梯度爆炸现象的出现，需要对核矩阵 $\tilde {\boldsymbol{K}}$ 中的每一行进行规范化，并使用最小值中心化的方法进行归一化，再经过全连接神经网络得到图核嵌入向量 ${{\boldsymbol{h}}_k}$ ，即图的结构编码，计算的函数表达式为：

$\tilde K'[i,j] = \frac{{\tilde K[i,j] - \min ({r_i}(\tilde {\boldsymbol{K}}))}}{{\max ({r_i}(\tilde {\boldsymbol{K}})) - \min ({r_i}(\tilde {\boldsymbol{K}}))}} \text{，}$

(16)

${{\boldsymbol{h}}_k} = {{{Softmax}}} (ReLU(\tilde {\boldsymbol{K}}'{{\boldsymbol{W}}^0}){{\boldsymbol{W}}^1}) ，$

(17)

其中 $\tilde K[i,j]$ 表示核矩阵 $\tilde {\boldsymbol{K}}$ 中归一化后的第i行第j列元素的值， ${\boldsymbol{W}}$ 是一个可学习的权重矩阵，使得计算更加平滑， ${{\boldsymbol{h}}_k}$ 是经过2层全连接神经网络后所得到的图结构的嵌入表示，与经过GIN得到的图特征编码 ${{\boldsymbol{H}}_G}$ 维度保持一致，这为图分类的下游任务做准备.

2.4 GIN编码和WL核编码的融合

在2.2~2.3节中，通过GIN和图核分别得到了第 $i$ 个图的特征编码 ${\boldsymbol{H}}_G^i \in {\mathbb{R}^{1 \times d}}$ 和图的结构编码 ${\boldsymbol{h}}_k^i \in {\mathbb{R}^{1 \times d}}$ （取核矩阵 $\tilde {\boldsymbol{K}}$ 的第 $i$ 行），将 ${\boldsymbol{H}}_G^i$ 与 ${\boldsymbol{h}}_k^i$ 进行注意力加权求和，函数表达式为：

${{\boldsymbol{H}}_1} = \left( {\begin{array}{*{20}{c}} {{{\boldsymbol{H}}_G}} \\ {{{\boldsymbol{h}}_k}} \end{array}} \right){\boldsymbol{W}} \text{，}$

(18)

${\boldsymbol{c}} = {{{Softmax}}} ({{\boldsymbol{H}}_1}{\boldsymbol{a}}) \text{，}$

(19)

${\boldsymbol{H}} = {\left( {\begin{array}{*{20}{c}} {{{\boldsymbol{H}}_G}} \\ {{{\boldsymbol{h}}_k}} \end{array}} \right)^{\mathrm{T}}}{\boldsymbol{c}} ，$

(20)

其中 ${\boldsymbol{W}} \in {\mathbb{R}^{d \times d}}$ 为权重向量，它可以使图的嵌入计算更加平滑， ${\boldsymbol{a}} \in {\mathbb{R}^{d \times 1}}$ 为注意力权重向量， ${\boldsymbol{c}} \in {\mathbb{R}^{2 \times 1}}$ 为注意力系数， ${\boldsymbol{H}} \in {\mathbb{R}^{d \times 1}}$ 为图特征编码和图结构编码的注意力加权融合后的向量表示，进一步将 ${\boldsymbol{H}}$ 输入到多层感知机或者支持向量机中进行图分类任务.

KerGIN提取图特征的算法描述见算法1，输入为一组图数据集以及图的邻接矩阵和节点的特征. 对每个图使用GIN进行特征编码，即对每一个节点进行邻域聚合，得到节点的嵌入表示，然后把所有节点的嵌入表示加起来，这样就得到了图的表征向量. 与此同时使用WL核求每2个图之间的核值，即对于每一个节点进行h次迭代的哈希编码，这样就把整个图映射成一个向量，将2个图的向量表示进行内积运算，这样就得到了2个图的相似度，也即得到了图的结构编码. 进一步使用注意力机制将图的特征编码和图的结构编码进行加权求和，进而得到图的特征向量表示，并对所有的图都进行上述的操作，最后将这些图的向量表示输入到多层感知机或支持向量机中进行下游的分类任务.

算法1. KerGIN提取特征.

输入：图数据集 $G = \{ {g_1},{g_2}, …,{g_n}\}$ ，其中 $g = (V, E,{\boldsymbol{X}})$ ；

输出：图的嵌入表示 ${\boldsymbol{\phi}} (G) \in {\mathbb{R}^{n \times d}}$ .

①初始化节点嵌入 ${{\boldsymbol{h}}_0} = {\boldsymbol{X}}$ ，核矩阵 ${\boldsymbol{K}} \in {\mathbb{R}^{n \times n}}$ ，标量参数 $\varepsilon = {\varepsilon _0}$ ；

② for $k = 1,2, …,m$ do

③ 　聚合邻居节点的特征 ${\boldsymbol{h}}_v^{(k)}$ ；/*式（3）*/

④ 　将节点特征相加得到图的嵌入表示 ${{\boldsymbol{h}}^{(k)}}$ ；

⑤ 　将 ${{\boldsymbol{h}}^{(k)}}$ 进行拼接得到图的嵌入表示 ${{\boldsymbol{H}}_G}$ ；

⑥ end for

⑦ for $i = 1,2, …,n$ do

⑧ 　for $j = 1,2, …,n$ do

⑨ 　　计算图 ${g_i}$ 和 ${g_j}$ 的结构相似度 $K[{g_i},{g_j}]$ ；

⑩ 　end for

⑪ end for

⑫ 借助Nyström方法对 ${\boldsymbol{K}}$ 进行分解得到 $\tilde {\boldsymbol{K}}$ ；

⑬ 将 ${{\boldsymbol{H}}_G}$ 与 $\tilde {\boldsymbol{K}}$ 通过注意力机制加权求和得到图的嵌入表示 ${\boldsymbol{ \phi }}(G)$ . /*式（18）~（20）*/

3. 实　　验

3.1 数据集的介绍和实验设置

1）数据集. 本文使用7个公开的图分类数据集进行实验，分别为MUTAG^[21]，PTC^[22]，PROTEINS^[23]，NCI1^[24]，IMDB-B^[25]，IMDB-M^[25]，COLLAB^[25]. 前4个为化学分子数据集，后3个为社交网络数据集. 7个数据集的简介为：

① MUTAG^[21]. 该数据集包含了188个化合物结构图，依据它们对细菌的诱变作用，可被分为2类. 图中的节点和节点标签分别表示原子和原子种类，包括C, N, O, F, I, Cl, Br.

② PTC^[22]. 该数据集全称是预测毒理学挑战，用来发展先进的SAR技术预测毒理学模型. 这个数据集包含了针对啮齿动物的致癌性标记的化合物. 图中有2个类别的标签，分别表示有致癌性和无致癌性.

③ PROTEINS. 该数据集^[23]中有1113个蛋白质结构图，图的标签分为2类，分别表示酶或者非酶. 节点表示蛋白质的2级结构，根据2级结构在氨基酸序列或者蛋白质3维空间中是否为邻居来确定节点之间边的存在性.

④ NCI1^[24]. 该数据集是一个关于化学分子的数据集，是根据非小细胞肺癌活性筛选的，图的标签分为2类，表示具有或不具有抗癌活性，共包含4110个化合物的图结构.

⑤ IMDB-B^[25]. 该数据集是一个电影合作数据集，来源于互联网电影数据库IMDB. 图中的节点表示演员，如果2个演员在同一部电影中出现，则他们对应的节点之间就存在一条边，这些合作图分为动作和浪漫2种类型. 合作图是以每个演员为中心的网络图，图分类的任务是判断这些自我中心网络图属于动作类型还是浪漫类型. 此外该数据集还有一个多类型版本.

⑥ IMDB-M^[25]. 该数据集的任务也是对演员子网络图按电影类型进行分类.

⑦ COLLAB^[25]. 该数据集是一个关于科研合作的数据集，涵盖了高能物理、凝聚态物理和天文物理3个领域中生成的不同研究人员的自我中心网络(ego-network)图、对应的图标签为研究人员所属的研究领域. 分类的任务是确定这些自我中心网络图对应的研究人员所属的研究领域.

实验中使用的7个图数据集的信息统计结果如表1所示.

表 1 数据集的信息统计

Table 1. Information Statistic of Datasets

数据集	类型	图数量	平均节点数	平均边数	种类	节点属性	属性维度
MUTAG	化学分子	188	18	20	2	Disc.	1
PTC	化学分子	344	26	51	2	Disc.	1
PROTEINS	化学分子	1113	39	73	2	Disc.	1
NCI1	化学分子	4110	30	65	2	Disc.	1
IMDB-B	社交网络	1000	20	97	2	No	2
IMDB-M	社交网络	1500	13	66	3	No	3
COLLAB	社交网络	5000	74	2458	3	No	5

下载: 导出CSV

| 显示表格

2）基准方法. 本文将选择当前已知性能最好的多种代表性图分类方法作为基准方法进行实验对比，分别为基于图核的方法、基于图神经网络的分类方法、基于图池化的分类方法以及近几年一些与图核结合的图神经网络方法，以此来证明本文模型的有效性. 基于图核的图分类方法有WL核^[14]和DGK核^[25]，基于图神经网络的图分类方法包括GIN^[15]，DCNN^[26]，PATCHY-SAN^[27]. 基于图池化的图分类方法有SUGAR^[28]、AVCN(H)^[29]，SLIM^[30]. 基于图核与图神经网络融合的图分类方法有GCKN^[11]，GSKN^[12]，GSNN^[31]. 本文的分类任务属于有监督学习.

3）参数设置. 模型训练过程中采用常用的参数设置，设置学习率lr=0.0001，训练批次batch_size=16，epoch=600，Nyström方法^[19]中对核矩阵降秩分解后的维度d为数据集中图数量的1/2，全连接层神经网络中隐藏层维度分别为16和8. WL核的迭代次数h=3. 数据集中90%作为训练集，其余的10%作为测试集.

3.2 实验结果

本节将在7个数据集上对KerGIN和其他所有基准方法进行分类评估. 本文采用10次10交叉验证，即将数据集分成10份，每次取1份作为测试集，剩下的9份作为训练集；然后对这10次的结果求平均. 每个数据集的分类准确度如表2所示.

表 2 在各个公开数据集上的分类准确度

Table 2. Classification Accuracy on Each Public Dataset %

方法	数据集
方法	MUTAG	PTC	PROTEINS	NCI1	IMDB-B	IMDB-M	COLLAB
WL	90.4(8)	59.9(8)	75.0(9)	86.0(2)	73.8(7)	50.9(5)	78.9(5)
DGK	82.6(11)	57.3(9)	71.6(10)	62.2(9)	66.9 (10)	44.5(7)	73.1(7)
GIN	89.4(9)	64.6(6)	76.2(6)	82.7(4)	75.1(6)	52.3(4)	80.2(4)
DCNN	67.0(12)	56.6(10)	61.3(11)	62.6(8)	49.1(9)	33.5(8)	52.1(9)
PATCHY-SAN	92.6(6)	60.0(7)	75.9(7)	78.6(7)	71.0(8)	45.2(6)	72.6(8)
SUGAR	96.7(1)	77.5(3)	81.3(3)	84.3(3)
GCKN	91.6(7)	68.4(5)	76.2(6)	82.0(5)	76.5(5)	53.3(3)	82.9(2)
GSKN	93.3(4)	85.2(2)	82.3(2)		79.9(2)	59.3(2)	81.8(3)
GSNN	94.7(3)		78.4(4)		78.1(3)
AVCN(H)	89.3(10)	62.3(8)	75.7(8)		73.4(8)	50.9(5)	80.2(4)
SLIM	93.2(5)	72.4(4)	77.4(5)	80.5(6)	77.2(4)	53.3(3)	78.2(6)
KerGIN（本文）	95.2(2)	88.5(1)	88.4(1)	86.8(1)	81.6(1)	60.1(1)	83.2(1)
注：加粗数字表示最优结果，括号里的数字表示该方法在每个数据集上的分类准确度排名.

下载: 导出CSV

| 显示表格

表2展示所有方法在7个公开数据集的测试准确度. KerGIN在大多数数据集上的表现优于基准方法. 其中MUTAG数据集的平均准确度为95.2%，高于除SUGAR外的所有基准方法. 与GSKN相比，KerGIN的准确度在PTC数据集上提升了3.3个百分比. 在PROTEINS数据集上，KerGIN的准确度相比GSKN方法提升了6.1个百分比. 对于NCI1数据集，KerGIN的准确度比GCKN提升了4.8个百分比. 在IMDB-B和IMDB-M数据集上，KerGIN的准确度比准确度排名第2的GSKN方法分别提升了1.7个百分比和0.8个百分比. 在COLLAB数据集上，KerGIN准确度接近于最先进的GCKN方法. 特别是在一些化学分子数据集上KerGIN表现更突出，与最新的2个基于图核的图神经网络方法相比，KerGIN具有更优越的性能.

为了比较不同方法的综合性能，分别统计了不同方法的平均排名，即对每一个方法，求出其在各个数据集上分类准确度的平均排名情况，相关的计算公式为：

$\overline{R}=\dfrac{1}{n}\left(\sum\limits_{i=1}^nrank(d_i)\right)，$

(21)

其中 $\bar R$ 表示平均排名， $rank({d_i})$ 表示在第i个数据集上的分类准确度排名，n表示数据集的数量.

在图4（a）中，与所有基准方法比较，KerGIN在7个公开的图分类数据集上，相比较最优的基准方法，准确度的平均排名为1. 由此可知KerGIN的图分类性能要优于大多数基准方法. 如图4（b）所示，KerGIN相较于最优的基准方法在6个数据集上的分类准确度都有不同程度的提升. 由于KerGIN在MUTAG数据集上没有提升，所以在图4（b）中只选择了有提升的6个数据集进行展示. 其中，在PROTEINS数据集上提升了7.5%，在IMDB-B数据集上提升了约2.1%，在PTC数据集上提升了约3.8%，在NCI1数据集上提升了0.93%，在IMDB-M数据集上提升了1.34%，在COLLAB数据集上提升了0.36%.

图 4 各种方法的平均排名和KerGIN的准确度提升率

Figure 4. Average rank and accuracy improvement rate of various methods

下载: 全尺寸图片幻灯片

3.3 消融实验

为了验证图核模块是否在整个模型中起关键作用以及MLP对分类准确度的影响，设计了一组消融实验，即将KerGIN模型中的图核模块（GIN-MLP），与本文方法KerGIN和基准模型GIN进行比较. 从表3可以看出，GIN-MLP和GIN的图分类准确度差异并不大，说明在KerGIN中起到关键作用的不是MLP. 比较GIN-MLP和KerGIN模型的图分类准确度可以得出：图核模块在整个模型中起了关键作用.

表 3 基于MLP与图核的消融实验

Table 3. Ablation Experiment Based on MLP and Graph Kernel

方法	MUTAG	PTC	PROTEINS	NCI1	IMDB-B	IMDB-M	COLLAB
WL	90.4	59.9	75.0	86.0	73.8	50.9	78.9
GIN	89.4	68.4	76.2	82.7	75.1	52.3	80.2
GIN-MLP	88.7	68.5	76.8	81.9	75.4	52.6	79.8
KerGIN（本文）	95.2	88.5	88.4	86.8	81.6	60.1	83.2
注：最优结果用加粗数字标识.

下载: 导出CSV

| 显示表格

为了研究注意力机制对图分类结果的影响及注意力机制的作用，选择了2种常见的融合策略进行对比实验，分别为拼接和求和，即把图结构编码和图特征编码拼接或者求和. 如表4所示， KerGIN-con表示采用拼接策略，KerGIN-sum表示采用求和策略，KerGIN-att表示采用注意力机制策略. 可以看出，采用拼接策略的分类效果不及求和策略和注意力机制策略，而采用注意力机制策略的分类准确度在这3种策略中最高. 因此，在本文中注意力机制是较适宜的融合策略. 这是因为不同数据集对于图结构编码和图特征编码的偏重程度不同，因此简单拼接和求和很难获得好的实验效果.

表 4 使用不同融合策略的消融实验

Table 4. Ablation Experiment Using with Different Fusion Strategies

策略	MUTAG	PTC	PROTEINS	NCI1	IMDB-B	IMDB-M	COLLAB
KerGIN-con	94.7	85.2	86.8	86.3	78.9	56.8	79.6
KerGIN-sum	94.9	86.3	87.5	86.3	79.4	58.6	81.7
KerGIN-att（本文）	95.2	88.5	88.4	86.8	81.6	60.1	83.2
注：最优结果用加粗数字标识.

下载: 导出CSV

| 显示表格

3.4 实验分析

本节将分析模型训练的过程以及图结构编码和图特征编码在不同类型数据集上的变化情况. 图5展示了MUTAG，PTC，PROTEINS，NCI1，IMDB-B，IMDB-M这6个数据集在训练和测试过程中的损失值随训练轮数的变化情况. 为便于排版，本文选择了前6个数据集的损失变化情况进行图例展示. 这6个数据集整体在100个训练轮数时损失下降得比较快，在400个训练轮数时损失下降的幅度较少，在600个训练轮数时基本趋向于收敛. 其中MUTAG数据集在500个训练轮数时收敛，PTC数据集在450个训练轮数时收敛，PROTEINS数据集在200个训练轮数时开始收敛，NCI1数据集在100个训练轮数时收敛. IMDB-B数据集大约在600个训练轮数时收敛，IMDB-M在200个训练轮数时开始收敛. 6个数据集在训练的过程中，训练集损失值和测试集损失值之间的差距很小，所以在训练过程中没有过拟合或欠拟合现象.

图 5 6个数据集上训练与测试的损失值变化

Figure 5. Variation of loss values for training and testing on six datasets

下载: 全尺寸图片幻灯片

任何图神经网络编码器都能用作图特征编码，本文除了实验中使用的GIN编码器，还使用了2种流行的图神经网络框架：GCN和图注意力网络GAT进行了对比实验. 实验结果如图6（a）所示，可以观察到GIN的编码效果要好于GCN和GAT. 这可能是因为GIN的图表达能力更加强大，更适用于图的特征编码. 此外，又研究了图核编码器的长度对图分类性能的影响，图6（b）显示了在7个公开数据集上16~160的不同图核编码长度的KerGIN的准确度. 可以看出，在一定范围内，图分类的准确度会随图核编码器长度的增加而增加，当图核编码器长度大于160时，图核编码器长度对图分类准确度的影响较小，所以在一定范围内核编码器长度对分类准确度有重要影响，因此适当降低核编码器的维度不会影响图分类的准确度.

图 6 基于不同图编码器的KerGIN和基于不同长度图核编码器的KerGIN

Figure 6. KerGIN based on different graph encoders and KerGIN based on different length kernel encoders

下载: 全尺寸图片幻灯片

如图7（a）所示，7个数据集权重系数都不相同，但是可以明显看出前4个数据集的图结构编码的权重大于图特征编码，后3个数据集的图结构编码的权重小于图特征编码. 由于前4种图数据集为化学分子、后3种图数据集为社交网络，因此在这2种数据集上，图结构编码和图特征编码的权重系数不同. 进一步，又探讨了不同图核函数对KerGIN分类准确度的影响，因为图核函数的选择通常是根据专家经验进行选取，很难直接确定KerGIN更适用于哪种图核函数，因此，本文选择了3种类型的图核函数RW，SP，WL，并通过实验对比展示了哪种图核更适用于KerGIN的图结构编码. 在图7（b）中，由于RW核在大数据集上运行时间过长，所以选择了在4个小数据集上进行实验. 可以清楚地看出WL核在4个数据集上综合表现最好，其次是SP核，RW核实验效果最差，此外RW核时间复杂度比较大，在一定的时间内无法完成一些大规模图数据集的实验.

图 7 图特征编码和结构编码的权重占比和不同图核下的分类准确度

Figure 7. The weight ratio of graph feature coding and structure coding, and the classification accuracy under different graph kernels

下载: 全尺寸图片幻灯片

通过以上实验分析可以得出，本文方法在化学分子数据集上的分类准确度比在社交网络数据集上具有明显的优势，因此本文方法更适用于化学分子的图分类任务. 此外，化学分子的特性受特定局部子结构的影响较大，所以图结构编码对其分类准确度起至关重要的作用，甚至1个局部子结构就可以成为其分类的主要依据，比如官能团（functional group）. 而对于社交网络数据集来说，它对图特定子结构的依赖性相对较小，而对图节点特征依赖性较大.

4. 结　　论

本文提出了一种基于GIN、图核以及注意力机制相融合的图表征学习和图分类的方法，该方法提升了GIN对图中特定结构的判别能力. 实验结果表明，图结构编码对图分类结果影响较大，将图核作为图结构编码，在一定程度上解决了基于消息传递的图神经网络无法识别图中高阶信息的问题，本文方法能够自适应调节图特征编码与图结构编码的权重，对图分类的准确度有较大的提升，在分类准确度上优于所选的一些基准方法.

作者贡献声明：徐立祥提出了算法思路和实验方案，并撰写论文；葛伟负责完成实验验证，并整理论文；陈恩红和罗斌提出指导意见并修改论文.

图 1 密文域3维网格可逆信息隐藏算法框架

Figure 1. Framework for 3D mesh reversible data hiding algorithm in encrypted domain

下载: 全尺寸图片幻灯片

图 2 所提方法的流程图

Figure 2. Flowchart of our proposed method

下载: 全尺寸图片幻灯片

图 3 多MSB预测方法

Figure 3. Multi-MSB prediction method

下载: 全尺寸图片幻灯片

图 4 信息嵌入过程

Figure 4. Process of information embedding

下载: 全尺寸图片幻灯片

图 5 测试模型的视觉质量

Figure 5. The visual quality of test model

下载: 全尺寸图片幻灯片

SNR和Hausdorff 距离随着 $m$ 值变化结果

Result of SNR and Hausdorff distance varying with $m$ values

下载: 全尺寸图片幻灯片

4张测试模型在不同 $m$ 值下的ER

ER of 4 tested models under different $m$ values

下载: 全尺寸图片幻灯片

表 1 坐标标准化和顶点划分的消融实验

Table 1 Ablation Experiment of Coordinate Standardization and Vertex Partitioning

测试模型	ER/bpv
测试模型	IWDW 2022^[20]	坐标标准化	顶点划分	坐标标准化+ 顶点划分
Mushroom	22.53	24.01	22.53	24.01
Cow	32.04	35.14	32.11	35.22
Beetle	31.75	36.5	31.96	36.87
Elephant	38.93	41.05	39.36	41.98

下载: 导出CSV

表 2 与现有方法特征的对比

Table 2 Comparison of Features with Existing Methods

方法	ER /bpv	加密方式	可分离性	信息准确提取	模型完全恢复
TMM2017^[16]	0.34	流加密	×	×	×
AJSE2018^[21]	6	同态加密	√	√	√
ICIP2021^[22]	16	同态加密	√	√	√
TMM2021^[23]	7.68	流加密	√	×	√
CognitComput2022^[17]	1.06	流加密	√	√	√
PRCV2021^[18]	14.25	流加密	√	√	√
SIGPRO2022^[19]	25.65	流加密	√	√	√
IWDW2022^[20]	33.15	流加密	√	√	√
本文	36.52	流加密	√	√	√

下载: 导出CSV

参考文献(27)

[1]	张新鹏,殷赵霞. 多媒体信息隐藏技术[J]. 自然杂志,2017,39(2):87−95 Zhang Xinpeng, Yin Zhaoxia. Data hiding in multimedia[J]. Chinese Journal of Nature, 2017, 39(2): 87−95 (in Chinese)
[2]	周航,陈可江,张卫明,等. 3D网格隐写与隐写分析回顾与展望[J]. 中国图象图形学报,2022,27(1):150−162 Zhou Hang, Chen Kejiang, Zhang Weiming, et al. 3D mesh steganography and steganalysis: Review and prospect[J]. Journal of Image and Graphics, 2022, 27(1): 150−162 (in Chinese)
[3]	陈君夫,付章杰,张卫明,等. 基于深度学习的图像隐写分析综述[J]. 软件学报,2021,32(2):551−578 Chen Junfu, Fu Zhangjie, Zhang Weiming, et a1. Review of image steganalysis based on deep learning[J]. Journal of Software, 2021, 32(2): 551−578 (in Chinese)
[4]	苏文桂,沈玉龙,王祥. 双层差值扩展可逆数字水印算法[J]. 计算机研究与发展,2019,56(7):1498−1505 Su Wengui, Shen Yulong, Wang Xiang. Two-layer reversible watermarking algorithm using difference expansion[J]. Journal of Computer Research and Developmen, 2019, 56(7): 1498−1505 (in Chinese)
[5]	巩道福,刘粉林,罗向阳. 一种变容量的自嵌入图像易碎水印算法[J]. 计算机研究与发展,2014,5l(11):2505−2512 Gong Daofu, Liu Fenlin, Luo Xiangyang. A variable payload self embedding fragile watermarking algorithm for image[J]. Journal of Computer Research and Development, 2014, 5l(11): 2505−2512 (in Chinese)
[6]	Shi Yunqing, Li Xiaolong, Zhang Xinpeng, et al. Reversible data hiding: advances in the past two decades[J]. IEEE Access, 2016, 4: 3210−3237 doi: 10.1109/ACCESS.2016.2573308
[7]	欧博,殷赵霞,项世军. 明文图像可逆信息隐藏综述[J]. 中国图象图形学报,2022,27(1):111−124 Ou Bo, Yin Zhaoxia, Xiang Shijun. Overview of reversible data hiding in plaintext image[J]. Journal of Image and Graphics, 2022, 27(1): 111−124 (in Chinese)
[8]	罗雅婷,和红杰,陈帆,等. 基于非0比特个数特征的冗余转移图像加密安全性分析[J]. 计算机研究与发展,2022,59(11):2606−2617 Luo Yating, He Hongjie, Chen Fan, et al. Security analysis of image encryption for redundant transfer based on non-zero-bit number feature[J]. Journal of Computer Research and Development, 2022, 59(11): 2606−2617 (in Chinese)
[9]	佘晓萌,杜洋,马文静,等. 基于像素预测和块标记的图像密文可逆信息隐藏[J]. 计算机研究与发展,2022,59(9):2089−2100 She Xiaomeng, Du Yang, Ma Wenjing, et al. Reversible data hiding in encrypted images based on pixel prediction and block labeling[J]. Journal of Computer Research and Development, 2022, 59(9): 2089−2100 (in Chinese)
[10]	杨尧林,和红杰,陈帆,等. 基于预测误差自适应编码的图像加密可逆数据隐藏[J]. 计算机研究与发展,2021,58(6):1340−1350 Yang Yaolin, He Hongjie, Chen Fan, et al. Reversible data hiding of image encryption based on prediction error adaptive coding[J]. Journal of Computer Research and Development, 2021, 58(6): 1340−1350 (in Chinese)
[11]	吴友情,马文静,殷赵霞,等. 基于预测误差位平面压缩的密文图像可逆信息隐藏[J]. 通信学报,2022,43(8):219−230 Wu Youqing, Ma Wenjing, Yin Zhaoxia, et al. Reversible data hiding in encrypted images based on bit-plane com-pression of prediction error[J]. Journal on Communications, 2022, 43(8): 219−230 (in Chinese)
[12]	Puteaux P, Ong S, Wong K, et a1. A survey of reversible data hiding in encrypted images the first 12 years[J]. Journal of Visual Communication and image Representation, 2021, 77: 103085 doi: 10.1016/j.jvcir.2021.103085
[13]	Pucci J U, Christophe B R, Sisti J A, et al. Three-dimensional printing: Technologies, applications, and limitations in neurosurgery[J]. Biotechnology Advances, 2017, 35(5): 521−529 doi: 10.1016/j.biotechadv.2017.05.007
[14]	Ni Jiahua, Ling Haonan, Zhang Shiming, et al. Three-dimensional printing of metals for biomedical applications[J]. Materials Today Bio, 2019, 3: 100024 doi: 10.1016/j.mtbio.2019.100024
[15]	Yu Mingji, Yao Heng, Qin Chuan, et al. A comprehensive analysis method for reversible data hiding in stream-cipher-encrypted images[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2022, 32(10): 7241−7254 doi: 10.1109/TCSVT.2022.3172226
[16]	Jiang Ruiqi, Zhou Hang, Yu Nenghai. Reversible data hiding in encrypted three-dimensional mesh models[J]. IEEE Transactions on Multimedia, 2017, 20(1): 55−67
[17]	Xu Na, Tang Jin, Luo Bin, et al. Separable reversible data hiding based on integer mapping and MSB prediction for encrypted 3D mesh models[J]. Cognitive Computation, 2022, 14(3): 1172−1181 doi: 10.1007/s12559-021-09919-5
[18]	Yin Zhaoxia, Xu Na, Wang Feng, et al. Separable reversible data hiding based on integer mapping and multi-MSB prediction for encrypted 3D mesh models[C]//Proc of the 4th Chinese Conf on Pattern Recognition and Computer Vision. Berlin: Springer, 2021: 336–348
[19]	Lv Wanli. Cheng Lulu, Yin Zhaoxia. High-capacity reversible data hiding in encrypted 3D mesh models based on multi-MSB prediction[J]. Signal Processing, 2022, 201: 108686 doi: 10.1016/j.sigpro.2022.108686
[20]	Tang Yun, Cheng Lulu, Lv Wanli, et al. High capacity reversible data hiding for encrypted 3D mesh models based on topology[C]//Proc of the 21st Int Workshop on Digital Watermarking. Berlin: Springer, 2022: 205−218
[21]	Shah M, Zhang Weiming, Hu Honggang, et al. Homomorphic encryption-based reversible data hiding for 3D mesh models[J]. Arabian Journal for Science and Engineering, 2018, 43(12): 8145−8157 doi: 10.1007/s13369-018-3354-4
[22]	Jansen van Rensburg B, Pauline P, Puech W, et al. Homomorphic two tier reversible data hiding in encrypted 3D objects[C]//Proc of the 28th IEEE Int Conf on Image Processing. Piscataway, NJ: IEEE, 2021: 3068−3072
[23]	Tsai Y. Separable reversible data hiding for encrypted three-dimensional models based on spatial subdivision and space encoding[J]. IEEE Transactions on Multimedia, 2020, 23: 2286−2296
[24]	Modigari N, Valarmathi M, Jani A. Watermarking techniques for three-dimensional (3D) mesh models: A survey[J]. Multimedia Systems, 2022, 28(2): 623−641 doi: 10.1007/s00530-021-00860-z
[25]	Deering M. Geometry compression[C]//Proc of the 22nd Annual Conf on Computer Graphics and Interactive Techniques. New York: ACM, 1995: 13−20
[26]	Yin Zhaoxia, Xiang Youzhi, Zhang Xinpeng. Reversible data hiding in encrypted images based on muhi MSB prediction and Huffman coding[J]. IEEE Transactions on Muhimedia, 2020, 22(4): 874−884
[27]	Philip S, Patrick M, Michael K, et al. The Princeton shape benchmark[C]//Proc of the 6th Shape Modeling Applications. Piscataway, NJ: IEEE, 2004: 167−178