深度学习模型供应链的安全性研究综述

陈若曦; 陈晋音; 郑海斌; 阳雪燕; 纪守领; 陈铁明

doi:10.7544/issn1000-1239.202440327

深度学习模型供应链的安全性研究综述

陈若曦^1,,
陈晋音^{2, 1, ,},
郑海斌^{2, 1},
阳雪燕¹,
纪守领³,
陈铁明⁴

1.
浙江工业大学信息工程学院　杭州　310023
2.
浙江工业大学网络空间安全研究院　杭州　310023
3.
浙江大学计算机科学与技术学院　杭州　310007
4.
浙江工业大学计算机科学与技术学院　杭州　310023

基金项目: 浙江省自然科学基金项目（LDQ23F020001）；国家自然科学基金项目（62072406，62406286）；浙江省重点研发计划（2022C01018）国家重点研发计划(2018AAA010081).

详细信息

作者简介:
陈若曦: 1998年生. 博士研究生. CCF学生会员. 主要研究方向为深度学习和人工智能安全

陈晋音: 1982年生. 博士，教授，CCF会员. 主要研究方向为人工智能安全、图数据挖掘和进化计算

郑海斌: 1995年生. 博士，讲师，CCF会员. 主要研究方向为深度学习、人工智能安全和公平性算法

阳雪燕: 2003年生. 本科生. 主要研究方向为深度学习和人工智能安全

纪守领: 1986年生. 博士，CCF高级会员，浙江大学“百人计划”研究员. 主要研究方向为数据驱动安全和隐私、AI隐私和大数据分析

陈铁明: 1978年生. 博士，教授. 主要研究方向为网络信息安全

通讯作者:
陈晋音（chenjinyin@zjut.edu.cn）

中图分类号: TP391
计量
- 文章访问数: 56
- HTML全文浏览量: 15
- PDF下载量: 17
出版历程
- 收稿日期: 2024-05-20
- 修回日期: 2024-08-01
- 录用日期: 2025-01-08
- 网络出版日期: 2025-01-08

Security of Deep Neural Network Supply Chains: A Survey

1.
College of Information Engineering, Zhejiang University of Technology University, Hangzhou 310023
2.
College of Institute of Cyberspace Security, Zhejiang University of Technology University, Hangzhou 310023
3.
College of Computer Science and Technology, Zhejiang University, Hangzhou 310007
4.
College of Computer Science and Technology, Zhejiang University of Technology University, Hangzhou 310023

Funds: This work was supported by the Zhejiang Provincial Natural Science Foundation (LDQ23F020001), the National Natural Science Foundation of China (62072406, 62406286), the Key R&D Projects in Zhejiang Province (2022C01018), and the National Key R&D Projects of China (2018AAA0100801).

More Information

Author Bio:
Chen Ruoxi: born in 1998. PhD student. Student member of CCF. Her main research interests include deep learning and artificial intelligence security

Chen Jinyin: born in 1982. PhD. Professor. Member of CCF. Her main research interests include artificial intelligence security, graph data mining and evolutionary computing

Zheng Haibin: born in 1995. PhD. Member of CCF. His main research interests include deep learning, artificial intelligence security, and fairness algorithm

Yang Xueyan: born in 2003. Undergraduate student. Her main research interests include deep learning and artificial intelligence security

Ji Shouling: born in 1986. PhD. Senior member of CCF. ZJU 100-Young Professor in the College of Computer Science and Technology at Zhejiang University. His current research interests include Data-driven Security and Privacy, AI Security and Big Data Analytics

Chen Tieming: born in 1978. PhD. Professor. His main research interests include network and information security

摘要

摘要:
预训练模缓解了训练数据和算力受限的问题，也催生了模型开发和应用的新范式——深度学习模型供应链. 在这一供应链中，预训练模型由原始发布者上传，并经二次开发者进行必要的迁移、压缩与部署，以适应不同的应用需求. 然而，这一过程引入了新的环节和多元要素，随之产生了数据泄露和计算安全等风险. 尽管深度学习模型供应链已被广泛采纳，目前对于其安全性威胁的系统性研究仍然不足. 针对这一研究空白，概括了深度学习模型供应链的概念及其基本框架，调研了相关的研究工作. 依据模型生命周期的不同阶段，详细分析了设计、二次开发、部署和使用各环节的安全脆弱点，对可能遭遇的安全性攻击手段进行了系统的梳理、比较和总结，并探讨了相应的防护策略. 为了帮助读者更好地使用预训练模型，对现有预训练模型仓库进行了比较. 最后，基于目前深度学习模型供应链所面临的挑战，从安全性审查、实时检测和问题溯源等不同角度分析和讨论了未来可能的研究发展方向，为更安全可靠地开发和使用预训练模型提供了思路. 涉及论文方法和相关代码归纳整理在https://github.com/Dipsy0830/DNN-supply-chain-survey，方便研究人员下载使用.
- 深度学习模型供应链 /
- 预训练模型 /
- 安全风险 /
- 安全与隐私 /
- 深度神经网络 /
- 深度学习
Abstract:
Pre-trained models have mitigated the challenges posed by extensive training data and computational resources, and also give birth to the new paradigm of model development and application, which we refer to as model supply chain. In this framework, a pre-trained model is uploaded by its publisher and subsequently transferred, compressed, and deployed by secondary developers to meet various application needs. This emerging model supply chain introduces additional stages and multiple elements, inevitably leading to security concerns and privacy risks. Despite the widespread adoption of model supply chains, there is currently a lack of systematic review of security threats in them. To address this research gap, in this paper, we provide a comprehensive overview of the deep learning model supply chain, introducing its concept and fundamental structure. We conduct an in-depth analysis of vulnerabilities at various stages of the model’s lifecycle, including design, development, deployment, and usage. Furthermore, we compare and summarize prevalent attack methods, alongside introducing corresponding security protection strategies. To assist readers in effectively utilizing pre-trained models, we review and compare publicly available model repositories. Finally, we discuss potential future research avenues in areas such as security checks, real-time detection, and problem tracing. It aims to offer insights for safer and more reliable development and use of pre-training models. For the benefit of ongoing research, related papers and open-source codes of the methods discussed are accessible at https://github.com/Dipsy0830/DNN-supply-chain-survey.
- model supply chain /
- pre-trained models /
- security threats /
- security and privacy /
- deep neural networks /
- deep learning

HTML全文

在实时嵌入式系统领域中，最坏执行时间（worst-case execution time，WCET）分析一直是研究的重点. 一个程序的WCET是指其代码片段在特定硬件平台上单独执行所需的最长时间^[1-2]. 现有的WCET分析尝试计算出程序WCET的一个安全且紧致的上界，主要有2种办法^[3]：一种是基于测量的分析方法，通过在特定的硬件或者模拟器上反复执行需要测量的程序，得到程序的WCET；另一种是静态分析的方法分析程序的代码，并构建出其中的基本块以及控制流图，根据硬件的执行模型来计算出整个程序的执行时间. 一个紧致而安全的 WCET分析结果，不仅关乎系统资源的利用率，还决定着实时系统中程序时间行为的正确性. 然而，在目前绝大部分高性能平台、特别是具备多级缓存架构以及超标量处理器的系统中，WCET分析陷入了两难的境地：要么因为体系结构的不确定性而难以获得一个紧致的分析结果，要么就因为复杂的处理器架构而使得WCET分析时所需要搜索的状态空间爆炸，从而无法在可接受的时间内完成分析.

因此，现有的WCET分析技术^[4-10]都尽可能地减少需要搜索的状态空间来优化WCET分析的过程，实现更短的分析时间并得到更紧致的分析结果. 传统的WCET 分析方法假设如果在分析中取每条指令的最长执行时间，那么从直觉上来说，其对应的程序执行路径的执行时间就是程序的WCET. 但是，Lundqvist 和Stenström最早在1999 年指出，这种直觉是错误的^[11]. 在一个允许动态指令调度的处理器中，如果一条指令在执行时有更长的执行时间，反而可能会使程序总的执行时间减小.

如图1所示，4条指令依次到达2个资源上执行，其中指令A和D使用资源1，指令B和C使用资源2，指令A与B之间、C与D之间存在图中箭头所示的依赖关系. 若增加指令A的执行时间（图1（a）），则相较于另一个执行（图1（b）），反而会减少整串指令的执行时间.

图 1 时序异常示例图

Figure 1. Example diagram of timing anomaly

下载: 全尺寸图片幻灯片

Lundqvist等人^[11]将这种反直觉的现象称为时序异常（timing anomaly，TA），这也是时序异常这一概念被首次提出. 时序异常的存在意味着在WCET分析中，不能仅仅搜索局部执行时间较长的那些执行，而是要完整地遍历所有可能的执行状态，这需要花费大量的时间与资源. 但是如果能够确保系统中不存在时序异常，就能够安全地在WCET分析中抛弃其他状态，大大减少WCET分析所要花费的时间. 因此，如何在现有的实时嵌入式系统中避免时序异常、消除时序异常，或是验证某个系统是否存在时序异常就显得至关重要. 随着时序异常成为实时领域中的一个热点，越来越多的针对时序异常的定义、探究与证明也被提出^[12-16]. 然而，学术界至今尚未形成一个对时序异常的统一定义与认识.

1. 时序异常的定义

1.1 原始时序异常定义

在时序异常的概念被提出之前，Graham^[17]最早就于1966 年发现了在多核系统中任务的调度存在异常：将一个存在依赖关系的任务集交给n个相同的处理器来执行，如果增加处理器数目或是放松依赖关系亦或是减少单个任务执行时间，都有可能增加整个任务集的执行时间. 当时的文献将其称为多处理器异常，而非时序异常. 但是从现今的对时序异常的定义来看，这种异常实际上就是时序异常在多核系统下的一种表现.

时序异常这一概念来自于WCET分析，早期时序异常的定义是基于程序执行时间的变化，如图2所示. Lundqvist等人^[11]最早提出了2种对时序异常的定义：考虑一串指令被执行的情况，假设在该串指令执行时，指令序列中的第1条指令的执行延时发生了2种不同的变化. 在第1种情况下，这个执行延时增加了i个时钟周期，而在第2种情况下执行延时减少了d个时钟周期. 如果设C为整串指令的执行时间在这2种情况下发生的变化，那么时序异常可定义为：

图 2 时序异常在执行时间上的表现

Figure 2. Behavior of timing anomaly on execution time

下载: 全尺寸图片幻灯片

定义1. 时序异常为下述2种情况之一^[11].

1）C > i或者C < 0；

2）C < −d或者C > 0.

如图2所示，无论哪种情况，时序异常都描述了第1条指令的执行时间变化，对指令序列的总执行时间产生了过大的影响（图2（a）（c））或是相反的影响（图2（b）（d））.

定义1并不是一个严格的形式化定义，但是它直观地描述出时序异常在执行时间上的表现. 在后续针对时序异常定义的研究中，时序异常往往被定义为2类：第1类是图2（a）（c）所描述的时序异常（一些论文称其为“强影响时序异常（strong impact timing anomaly）”^[18]以及“时序放大（timing amplification）”^[19]）；第2类是图2（b）（d）所描述的时序异常（一些论文称其为“非直接影响（counter-directive impact）”^[18]以及“反直觉时序行为（counterintuitive timing behavior）”^[19]）. 为了统一起见，本文称第1类为放大型时序异常，第2类为反直觉型时序异常.

1.2 反直觉型时序异常

根据反直觉型时序异常的定义，指令序列中第1条指令执行时间的增加（或减小），会导致总执行时间的减小（或增加），即发生与预期相反的变化. 这一特性使得WCET分析不能仅仅搜索那些在短期内有着较长执行时间的状态，必须遍历所有可能的执行，从而使得WCET分析需要搜索的路径数量指数级增加. 反过来说，如果能确保某一程序在特定平台上执行时不会发生时序异常，那么WCET分析就可以安全地抛弃那些局部执行时间非最长的状态，大大减少分析时间. 因此，反直觉型时序异常得到了大量的研究，并被提出了各式各样的定义.

1.2.1 原始定义的初步形式化

为了寻找导致时序异常的原因，Wenzel 等人^[18]将时序异常采用更加形式化的语言来表述：假设执行的程序为一个指令序列I₁，I₂，…，I_n，每一条指令都有着一个在对应的功能单元上执行所需的延时 ${t}_{{I}_{i}}$ ， $i\in\{1，2，…，n\}$ . 执行整个指令序列所需要的时间记为C，指令序列中第1条指令的延时变化大小为 $\mathrm{\Delta } t$ ，变化后整个指令序列的执行延时记为C′，指令序列变化后的时间为 ${t}_{{I}_{1}}+\mathrm{\Delta }t,\;{t}_{{I}_{2}},… ,{t}_{{I}_{n}}$ ，记这两者的时间差为 $\mathrm{\Delta } C=C'-C$ . 则时序异常定义见定义2.

定义2. 一个时序异常定义为下述两者之一成立的情形^[18].

1）第1条指令的执行延时增加时：

${\Delta } t > 0 \to (\Delta C > \Delta t) \vee (\Delta C < 0)$ ；

2）第1条指令的执行延时减小时：

${\Delta } t < 0 \to (\Delta C < \Delta t) \vee (\Delta C > 0)$ .

定义2与定义1所描述的含义基本相同，其区别在于，定义2 细化了对指令执行时间的描述，并将这个执行时间的粒度限制在单条指令在功能单元执行的延时上. 此外，定义2在更加具体地描述执行时间的同时，也隐含地给时序异常的定义增加了约束，即指令序列中除了第1条指令外，后续的指令执行时间必须保持不变^[16]，而定义1中的时序异常的情况可能不满足这个约束.

定义1和定义2还存在着一个相同的问题，即执行时间的来源. 在现代更加复杂的处理器中，无论是一段程序还是单条指令的执行时间，可能由处理器中多个不同功能单元上的延时组成，它们之间还可能存在着重叠、间隔，但是这2个定义并没有告知如何将这些细粒度的延时与定义中的指令执行时间相关联. 因此，这2个定义仅适合在概念上对时序异常的理解，却不便于在实际分析中应用.

1.2.2 基于微操作的定义

先前所描述的时序异常仅仅从一个理想的角度形式化地描述了时序异常的表现，对于稍加复杂的系统，如何描述指令执行时间的问题就显露了出来. Reineke等人^[12]即以兼容不同系统的硬件特征为目标提出了新的形式化时序异常定义，为了兼容不同系统的硬件特征，该定义采用一个转移系统来抽象描述系统执行的过程. 简单地来说，将一个硬件平台所有可能具备的状态抽象成一个集合，硬件执行程序的过程就是转移系统在不同状态之间转移的过程，并可以根据系统所途经的状态得到一个状态序列. 如图3所示，π和π′就是转移系统执行相同的指令流时2个可能存在的状态序列，其中每个小方块都代表系统的一个状态.

图 3 Reineke定义的时序异常示例

Figure 3. Example of timing anomaly defined by Reineke

下载: 全尺寸图片幻灯片

Reineke等人^[12]还提出指令的局部执行时间应当在系统的微操作方面来进行描述（如取指、执行操作等）. 在这个概念下，“局部更坏”可以由微操作表达为：如果在某一执行状态序列中，每个微操作的长度都大于其余所有序列中微操作的长度，则该执行状态序列被称为一个“局部更坏”的序列. 由此，提出的基于微操作的时序异常定义如下：

定义3. 一个硬件模型存在时序异常，当且仅当存在1个程序以及程序中的1个指令序列，使得该指令序列下存在一个非局部更坏的执行状态序列，其总执行时间是所有序列中最长的.

如在图3中，微操作1 与微操作2 在2个不同的执行状态序列下消耗了不同的执行时间，状态序列π中2个微操作都比在序列π′消耗的执行时间更长，因而根据局部性的定义，序列π是一个局部更坏的执行序列. 然而，π′序列最终有着更长的总执行时间，π作为局部更坏的执行序列反而全局更优，因而这个系统存在着反直觉时序异常.

Reineke等人^[12]提出的基于微操作的反直觉时序异常定义，从局部性角度入手，在一个更细的执行粒度上描述了它在系统中的表现. 然而，该定义仍然存在着一些问题，Binder 等人^[14]指出，在系统中同时发生多个局部更坏的执行情况时，这个定义无法识别出实际存在的反直觉型时序异常.

比如在图4中，序列π的微操作1比在序列π′中的执行时间更长，微操作2 则相反. 根据微操作下局部最坏执行状态序列的定义，只有当一个序列中的每个微操作的执行时间都比另一个序列中对应的微操作的执行时间更长时，才称之为局部更坏的执行序列. 因而图4中的2个执行序列互相令对方不为局部更坏的序列，进而不满足基于微操作的时序异常的定义，然而从微操作1 或微操作2各自的角度来看，系统本身是存在时序异常的，基于微操作的定义却无法覆盖到这种情况. 这一问题的本质在于该定义对局部更坏的执行序列要求过于严格，使得其无法处理多个局部更坏的微操作同时发生的场景.

图 4 Reineke定义的时序异常缺陷

Figure 4. Drawback of timing anomaly defined by Reineke

下载: 全尺寸图片幻灯片

1.2.3 基于执行trace的定义

Cassez 等人^[16]指出，微操作定义的时序异常仍然存在一些不足：它们仅要求系统所执行的指令流相同，但是一个系统实际执行时，往往还需要从外界输入或输出数据. 因此，在定义时序异常时，还有必要要求系统执行时从外界接受的数据也相同.

此外，Cassez 等人^[16]还认为，对系统进行过度的抽象会导致一些形式化模型中存在虚假的时序异常，因此，时序异常应当在具体的而非抽象过后的硬件模型中定义. 为此，他们采用硬件系统执行时的踪迹（trace）作为时序异常的描述方法.

在Cassez等人^[16]的工作中，为了保证系统执行的指令流严格且唯一，系统执行时的trace被定义为在特定程序与数据输入的情况下一个带编号的指令序列. 硬件系统则通过一个带有时间与事件标签的转移系统来描述. 这样一来，系统在各个状态之间的转移所构成的标签序列就是指令流随着时间在硬件系统中执行的过程. 根据这些信息可以计算出每条指令（相对于开始执行时的）在trace中的完成时间. 在这个结果下，无时序异常系统被定义如下^[16]：

定义4. 一个系统相对于某一程序和输入的数据是无时序异常的，当且仅当系统中指令的完成时间在不同状态之间满足“单调性”，即系统从某一状态下执行时，每条指令的完成时间都大于等于其余所有状态下的完成时间.

图5分别展示了系统在相同程序和数据输入的情况下，从3个不同的初始状态开始，执行trace： [1→A，2→B，3→C] 的过程. A，B，C这3条指令在图5（a）中的完成时间分别为2，4，6，在图5（b）中的完成时间则分别为2，4，7. 如果不考虑图5（c），则图5（b）初始状态下每条指令的完成时间都大于其他所有初始状态（在本例中只有图5（a）状态）下每条指令的完成时间，Cassez 等人^[16]称这一性质为“一致更慢（consistently as slow）”. 因此根据定义4，在不考虑图5（c）状态的情况下，这个系统是无时序异常的. 如果考虑图5（c）状态，不难发现任一初始状态都不满足“一致更慢”这一性质的要求，因此表明系统中存在时序异常.

图 5 Cassez定义的时序异常示例^[16]

注：FU表示功能单元.

Figure 5. Example of timing anomaly defined by Cassez^[16]

下载: 全尺寸图片幻灯片

Cassez等人^[16]提出的定义重点在于，存在时序异常的执行不仅需要有相同的指令序列，还要有相同的数据输入，否则不构成发生时序异常的条件. 因为如果输入数据不同，可能导致指令的实际执行情况发生变化. 以ARM指令集架构为例，若图5中A，B，C指令分别是以下3条指令：A：MUL R₀，R₀，R₁；B：MULNZ R₂，R₂，R₁；C：MULNZ R₂，R₂，R₁. 其中B和C是条件执行指令，只有当R₀不为0 的时候才会进行运算. 因此，若输入数据使R₀不为0 时，系统的执行过程为图5（a），当输入数据使R₀为0 时，系统的执行过程为图5（c）. 用不同的定义对这2个执行进行判断，就产生了截然相反的结果：定义3仅考虑到了2个执行的指令流相同，因此认为这2个执行是一个时序异常；而定义4认为因为2次执行有着不同的输入数据，因此不满足构成时序异常的条件.

总得来说，Cassez等人^[16]使用指令的完成时间作为判断局部更坏性质的依据，相较于Reineke等人^[12]的方法粒度更粗，但是它避免了传统定义中如何将单条指令的执行时间映射到硬件这一问题，具有一定的意义.

1.2.4 基于因果关系的定义

随着对时序异常的关注不断加深，越来越多的针对反直觉型时序异常的定义被提出^{[12,15-16,20]}. 然而，大部分定义都只描述了时序异常在抽象硬件模型上的表现，无法描述时序异常复杂的硬件架构（特别是超标量处理器的架构）下的表现^[14]. 因此，Binder 等人^[14]从指令运行时在各个部件之间因果关系的角度，提出了一个适用于具体架构下精确的时序异常定义.

基于因果关系的时序异常的定义将硬件视为各个功能部件组成的集合，程序在硬件系统上的一次执行由发生在功能部件上由指令、部件、时刻构成的事件构成，描述了在该时刻下某条指令获取或释放了一个部件. 根据不同事件之间的依赖关系（如资源竞争、指令流顺序、数据依赖等），可以构成一个以事件为节点、依赖关系为有向边的图，Binder 等人^[14]称其为事件时间依赖图（event time-dependence graph， ETDG）. 从事件时间依赖图中修剪去无关的边，即可得到程序在硬件上执行的因果关系图（causality graph，CG）^[14]. 根据因果关系图，可以精确地确定每一个事件会影响后续哪些事件的执行，确定其影响范围.

基于执行事件之间的因果关系，Binder 等人^[14]将时序异常定义如下：

定义5. 一个时序异常是指，在α执行中存在一个资源，它的执行时间比在β中更短，且在其因果事件范围内，β执行中存在一个发生时间比α更长的事件.

定义5可以精确地界定时序异常的范围，并根据因果关系推导出导致时序异常的指令或部件. 一个例子就是它能够排除一些虚假的时序异常. 如图6所示，α与β是指令流A到指令流E在某一硬件平台上的2个不同的执行，根据Reineke等人^[12]提出的时序异常定义（定义3），α执行构成了一个时序异常. 然而，从因果关系的角度来看，α执行之所以有着更长的总执行时间，是因为指令E在IF段消耗了更长的执行时间. 根据因果关系图，指令A在FU₁段执行事件的因果范围仅仅局限在指令A提交事件的范围内（图6中的浅灰色部分），这与直觉上的因果关系是一致的. 因而从因果关系的角度来看，图6的2个执行无法构成1个时序异常.

图 6 虚假的时序异常示例^[14]

Figure 6. Example of fake timing anomaly^[14]

下载: 全尺寸图片幻灯片

基于因果关系的定义没有提到局部执行时间与全局执行时间的概念，相对应地，它采用一个事件所花费的时间以及事件之间的时间，来刻画一次执行时间变化对整个执行的影响. 这种细粒度的描述方式使得该定义有着许多优点，包括：

1）指出其他定义中存在的虚假时序异常实例；

2）发现先前定义所遗漏的时序异常实例；

3）处理事件组合、交错等情况下的时序异常.

此外，Binder等人^[14]还首次提出了在时间变化组合下定义时序异常的问题，这是先前定义所从未涉及的.

1.3 放大型时序异常

放大型时序异常指在一次局部执行时间变化的情况下，全局执行时间的变化比局部执行时间的变化要更大，导致了一种“放大”局部变化的效果. 显然，放大型时序异常不会影响WCET分析时的决策，因为一次局部时间更长的执行仍然有着更长的全局执行时间，WCET 分析时只需继续沿着该分支进行搜索即可. 也正因如此，放大型时序异常一直是WCET分析中的冷门研究，鲜有对它的严格定义.

近几年来，在针对时间可组合性的研究中，Jan等人^[19]指出，要实现时间可组合的WCET分析，处理器必须要消除放大型时序异常. 时间可组合性是指在存在多个组件的系统中，系统整体的WCET可以通过组合各组件的WCET来得到，比如在一个包含高速缓存的处理器中，可以单独地分析流水线和高速缓存WCET的上界，然后结合调度策略将它们各自的结果组合到一起，得到整个系统的WCET 的上界. 然而，如果存在放大型时序异常，组合后的WCET可能不再安全：一次缓存命中到缓存缺失的变化所产生的延时，可能对组合后总WCET的变化有着更大的影响，从而影响计算结果的安全性.

为了描述放大型时序异常，Jan 等人^[19]使用一个标准流水线模型模拟处理器执行时的过程. 如图7所示.

图 7 标准流水线模型^[19]

Figure 7. Canonical pipeline model^[19]

下载: 全尺寸图片幻灯片

在标准流水线模型中，程序在流水线中执行的过程就是指令在各个流水段之间进行状态转移的过程，一条指令的状态被定义为如下的六元组^[19]：

$\langle type,\; {\boldsymbol{vl}},\; stage, \; latency, \; delay, \; progress \rangle，$

其中type描述了指令的类型，vl是包含着该指令在流水线中每个段延时的向量，latency是指令在当前流水段stage剩余的执行时间，即图7中的延时. delay描述了指令在先前各个流水段中因为流水线停顿而导致的累计延时（对应与图7中的累计延时）. progress是一个决定流水线是否停顿的布尔值.

在标准流水线模型中，放大型时序异常即为指令在某一流水段执行延时的增长，导致了整个指令序列执行时间更大的增长^[19]（类似执行时间减少的情况）. 相较于反直觉型时序异常的定义，放大型时序异常的定义仍然具有很多不完善的地方，如整个指令序列的执行时间在模型中的计算方式、模型的初始状态与转移又该如何形式化地表达，均缺少严格定义. 现有的放大型时序异常定义还局限在提供概念理解以及满足可组合性分析的工作^[21]上.

1.4 有界时序异常

前述介绍的各类时序异常定义均为对系统的定性描述，即系统中要么存在时序异常，要么不存在. 本节介绍有关在时序异常方面进行定量分析的工作，即有界时序异常.

1.4.1 多米诺效应

在介绍有界时序异常之前，需要先说明时序异常的多米诺效应. 多米诺效应在最早关于时序异常的文献中就有被提出. Lundqvist等人^[11]和 Wilhelm等人^[22]指出，在存在时序异常的体系结构中，如果时序异常位于某一循环内，可能会使程序WCET的变化受到循环次数的影响，从而无法有界地被确定，这一现象即被称为多米诺效应.

图8展示了一个因静态预测取指未命中所导致的反直觉型时序异常，其中分支来自指令A和指令C之间的循环. 嵌套在循环中的时序异常进一步导致了多米诺效应：随着每一次循环的执行，时序异常反复地出现，使得指令A命中缓存下的执行时间与未命中缓存下的执行时间的差值随着循环次数线性增加. 在无法确定循环次数的情况下，这2种执行的时间差可能达到任意大小.

图 8 多米诺效应示意图

Figure 8. Illustration of Domino effect

下载: 全尺寸图片幻灯片

遗憾的是，目前许多硬件系统都存在着多米诺效应^[15,22]，Schneider^[23]曾证明 MPC755 处理器的流水线存在多米诺效应，此外，Berg^[24]证明了常见的几种缓存替换策略，如round-robin、FIFO （first in first out）、伪LRU（least recently used）都受多米诺效应的影响，只有LRU替换策略例外.

多米诺效应实际上描述了时序异常“无界”的性质，即一些时序异常对程序WCET的影响可能是任意大小的. 那么相对地，是否在某些场景下，时序异常仅能对程序的WCET产生有限的影响？这就是有界时序异常.

1.4.2 k-有界的时序异常

根据多米诺效应的定义，时序异常对系统的影响程度直接取决于执行时间的变化程度. Gebhard^[15]从程序的执行时间出发，提出了一个时序异常的形式化定义：

在基于执行时间的定义中，程序在硬件上的一次执行被视为（硬件状态，指令编号）二元组到正实数域上的映射，它将程序中的每条指令按照编号映射到在硬件状态下的相对执行时间. 将每条指令的相对执行时间累加，就得到了指令从初始硬件状态开始的绝对执行时间. 不难发现，指令的相对执行时间描述了局部执行特征，指令的绝对执行时间则对应于全局下的表现. 因此，基于执行时间的时序异常被描述为^[15]定义6.

定义6. 当系统中存在一个硬件状态θ和2条编号不同的指令i，n，i< n，使得指令i在状态θ下的相对执行时间小于其余任意硬件状态下的执行时间，且指令n在状态θ下的绝对执行时间大于其余任意硬件状态下的执行时间，则状态θ是时序异常的.

如图9所示，状态θ执行是时序异常的，因为相较于状态η执行，指令i的相对执行时间更短，但是状态θ在后续有总的更长的执行时间（即指令n的绝对执行时间）. 如果要求状态θ中，指令n的绝对执行时间至多比在状态η中（或者说其余任意执行）大k，则状态θ就构成了一个k-有界的时序异常状态. 从这个角度来说，k-有界时序异常本质上是反直觉型时序异常的一个分类.

图 9 k-有界的时序异常示例

Figure 9. Example of k-bounded timing anomaly

下载: 全尺寸图片幻灯片

k-有界时序异常的意义在于，如果某一类时序异常满足k-有界时序异常的定义，则在WCET 分析中，可以通过往WCET分析结果上增加常量k的方式，安全地抛弃一些有着大量状态的执行分支，从而减少WCET分析所需的计算量. 如果k-有界时序异常中的常数k可以以某种方式得到足够小的结果，则分析出的WCET结果也相对地更加紧致. 这为解决WCET分析中的时序异常问题提供了一个新的研究方向.

尽管如此，目前针对k-有界时序异常的工作仍然较少. 如前所述，相当一部分体系结构中已被证明存在多米诺效应，因而不适用于这种分析方法. 此外，由于k-有界时序异常的定义仍然停留在抽象执行模型的层次，难以直接应用于具体的体系结构与分析工具，这导致如何发现与证明k-有界时序异常的相关工作也没有得到有效开展.

1.5 并行时序异常

Lundqvist等人^[11]从指令在WCET 分析中线性组合的角度提出了时序异常. 大部分对时序异常的定义也都集中在指令流的线性分析中. 然而，对硬件平台的分析也是WCET分析中重要的一环. 由于硬件系统的复杂性，硬件平台的分析往往通过分而治之的方式，先分析出每个子组件的时间行为，然后再将它们组合到一起，得到整个系统的时间行为. Kirner 等人^[20,25]提出，在分解组合和组件之间的时间行为时，也可能会发生时序异常，即并行时序异常.

并行时序异常和指令流分析中时序异常的主要区别在于，指令流分析中时序异常描述的对象是指令以及程序的执行时间，这两者之间往往存在着（不严格的）线性关系；并行时序异常针对的是硬件系统中组件与整体的执行时间，显然，组件之间是并行执行的，时间行为的组合方式也取决它们之间的依赖关系. 并行时序异常的存在与否直接影响在WCET分析中各个组件的时间行为是否可组合.

类似于定义1，并行时序异常也被分为并形反直觉型时序异常和并形放大型时序异常（Kirner等人^[25]称其为并行反转（parallel inversion）异常与并行放大（parallel amplification）异常）. 只不过判断对象由指令和程序变成了组件和整体. 并行反直觉型时序异常定义如下^[25]：

定义7. 设系统可以被分解为2个组件A与P，若存在某一程序，使得其在A上2个不同初始状态a与a′下执行时间的大小关系，与在A与P上2个不同的初始状态（a，p）与（a′，p）下执行时间的大小关系相反，则称系统中存在并行反直觉型时序异常.

并行放大型时序异常的定义可由定义7稍加修改得到，除此之外，Pedersen 等人^[26]还给出了一个在半马尔可夫过程下并行时序异常的形式化定义，此处均不再赘述.

相较于面向指令流的时序异常，并行时序异常的影响更容易规避，Kirner 等人^[25]已证明，当系统中仅存在特定的时序异常时，通过调整组件之间组合时间行为的方式，可以规避时序异常的影响，得到一个安全的WCET 分析结果. 因此，针对并行时序异常的研究有望成为满足可组合性，以及实现 WCET分析分解的关键.

1.6 时序异常定义小结

本节介绍了自时序异常被提出以来，各类时序异常的定义. 本节将前述介绍的定义汇总如表1所示. 在对时序异常现象的抽象方式上面，虽然各个定义对执行时的抽象方式不同，但是本质上都是在对比执行时间，只不过所取的粒度不同. 如在局部执行时间变化的粒度方面，原始定义^[11,18]和 Gebhard^[15]的定义都采用单条指令的执行时长作为局部执行时间变化的单位，这使得无法较好地将定义和实际执行关联起来，即因为流水线等技术的实现，指令之间的执行时间是互相重叠的，而并非像指令集架构层所假设的那样，只有一条指令执行完之后下一条指令才会开始执行. 值得注意的是，虽然Cassez等人^[16]的定义采取的粒度也为单条指令，但是在实际描述中采用的是每条指令结束执行的时刻，而非指令的执行时长，这使得他们的定义能够较好地与具体执行过程相联系.

表 1 不同时序异常定义的对比

Table 1. Comparison of Different Definitions of Timing Anomalies

时序异常属性	原始时序异常定义^[11,18]	Reineke等人^[12]的时序异常定义	Cassez等人^[16]的时序异常定义	Binder等人^[14]的时序异常定义	Gebhard^[15]的时序异常定义	并行时序异常定义^[25-26]
抽象对象	指令执行时间	指令微操作的执行时间	指令执行trace	指令微操作间的因果关系	指令执行时间	组件执行时间
能否表示反直觉型时序异常	是	是	是	是	是	是
能否表示放大型时序异常	是	否	否	否	否	是
局部执行时间变化的粒度	指令	微操作	指令	微操作	指令	（子）组件
全局执行时间变化的粒度	程序（指令片段）	程序（指令片段）	指令	微操作	程序（指令片段）	复合组件
是否要求输入数据一致	否	否	是	否	否	是（取决于抽象程度）
是否适用于多个局部执行时间同时发生的情况	不适用	有误判（图4）	适用	适用	不适用	不适用
时序异常组合分析	不适用	不适用	不适用	适用	不适用	不适用

下载: 导出CSV

| 显示表格

在全局执行时间变化的粒度方面，大部分定义采用整个程序执行时间为粒度，这在直觉上是正确的，因为时序异常最终影响的就是程序的WCET 分析结果. Cassez等人^[16]与Binder等人^[14]的定义则将全局性与局部性的粒度保持一致，其中Cassez等人^[16]的定义并没有直接描述程序整体的执行时间，而是通过“始终更慢”这一性质来间接地描述全局执行时间上的变化. Binder等人^[14]则将程序整体执行时间的变化视为程序中最后一条指令微操作执行时间（相较于局部事件）的变化，从而实现在局部粒度下描述全局执行时间^[27]. 然而，这样做也存在着一些问题，不直接使用程序执行时间作为全局执行时间变化的粒度，无法保证模型定义的执行时间变化与程序实际执行时间的变化是一致的. 如Binder等人^[14]基于因果关系的定义，在实验时检测到了其他定义所没有发现的时序异常（如文献[14]中图6），这本质上就是因为使用微操作表述的全局执行时间与程序的执行时间存在偏差，从而检测出与其他定义不一致的时序异常. 并行时序异常着眼的对象为系统组件，因而局部执行时间和全局执行时间的粒度都是以组件为单位.

此外，在不同的时序异常定义之间，只有 Cassez等人^[16]的定义要求时序异常必须在外界输入保持一致的情况下才能成立. Binder 等人^[14]的定义仅在分析中提到了这一点，没有在时序异常的定义中加上对应的约束. 并行时序异常由于仅考虑时间相关的动态计算机状态（timing-relevant dynamic computer state，TRDCS）^[25]，因而是否满足数据一致性取决于与数据相关的状态是否被包含在TRDCS 内. 其余定义均没有要求输入数据的一致性，所以在面对诸如条件执行等情况时，有可能错误地检出时序异常.

在复杂的执行情况下（如有多个局部执行时间同时发生变化，或者数个时序异常重叠），Reineke等人^[12]的定义就显得过于严格，因此无法识别在复杂情况下的时序异常. Cassez等人^[16]的定义虽然能够识别出时序异常，但是无法区别它们. 基于因果关系的定义在这一方面最为完善，它不仅可以检出这些复杂情况下的时序异常，还能正确地区分不同类型的时序异常，并界定它们的影响范围.

从时序异常的表达能力来看，所有时序异常定义都描述了反直觉型时序异常的概念，却少有定义涉及放大型时序异常. 实际上，如果允许稍加修改，表1中大部分定义都能够描述放大型时序异常. 这也反映出在WCET分析中，反直觉型时序异常的影响最为重要，也受到了最多的关注. 此外，表1中没有涉及k-有界时序异常的相关内容，这是因为本文认为k-有界时序异常本质上是对时序异常的一种分类，而非一种新的形式化定义，故此处没有提及.

2. 导致时序异常的原因

各种时序异常的存在给体系结构的WCET分析带来了巨大的困难，为了消除时序异常，就必须确定导致时序异常的原因. 尽管学界尚未有一个统一的时序异常定义，目前已经确定了数种特定情况下导致时序异常的原因.

Reineke等人^[12]在一篇关于时序异常定义与分类的文章中，将时序异常分为了（至少）3类，分别是调度型时序异常、高速缓存型时序异常以及超标量型时序异常. 巧合的是，从导致时序异常的原因来看，它们也基本满足这3个分类（对于超标量型时序异常，本文认为其原因来自于处理器组件）. 本节即从调度、高速缓存以及处理器组件的角度，分析导致时序异常的原因.

2.1 调度型时序异常的原因

在Lundqvist等人^[11]最早提出时序异常的文章中，给出的时序异常范例就是因调度策略产生的时序异常，Reineke等人^[12]将该种时序异常称为 “调度型时序异常”，即在2个构成时序异常的执行之间，它们执行时间的变化是由于指令在资源的分配顺序上发生变化所导致的. 如图1所示，在资源2 上指令B和C的执行顺序颠倒，因此图1所示的时序异常即为调度型时序异常.

调度型时序异常的发生主要来自于调度策略. 现今绝大部分处理器在满足数据依赖关系的情况下，都使用贪婪的策略为指令分配现有的执行资源. 特别是对一众超标量处理器，指令无需等待前序指令执行结束即可开始执行. 时序异常的发现者Lundqvist等人^[11]提出，正是指令在处理器中的乱序执行才导致了时序异常的出现，如果一个处理器仅包含顺序执行的资源（in-order resources），则不会产生时序异常.

Lundqvist等人^[11]将顺序执行资源定义为一类只能按照程序顺序分配给指令的资源，如处理器中的寄存器堆就一定是顺序执行的资源，否则程序执行的结果将会不正确. 与之相对的乱序执行资源则可以按照任意顺序执行已发射的指令，如通常的计算单元、乘除法器、存储控制器等处理器中的功能组件. 他们提出，如果处理器中的所有资源都是顺序执行的，那么前一条指令的执行延时一定会使后续指令对该资源的使用产生影响，在最理想的情况下（即后续没有指令需要使用前一条指令的资源），2个执行的时间差为0，不会出现反直觉型时序异常.

但是这一结论缺乏严格的证明，在 Lundqvist等人^[28]后续的文献中，将导致时序异常的原因的描述修改为：如果一个处理器包含乱序执行的资源，则动态调度指令执行将会产生时序异常. 这一修改表示，仅包含顺序执行的资源不再是处理器无时序异常的充分条件. 此外，Gebhard^[15]以 LEON2 处理器架构为例，说明了即使在仅包含顺序执行资源的处理器中，也有可能发生时序异常. 他们提出的反例是一个因处理器中高速缓存命中与未命中情况下的执行导致的时序异常，其本质上可被分类为因高速缓存所导致的时序异常，对于该反例的详细说明见2.2节.

本文认为， Lundqvist等人^[11]提出导致调度型时序异常的原因之所以遭到否定，并非是因为其在论述过程中出现了错误，而是缺少对调度型时序异常的严格描述. 调度型时序异常应当是指因指令在资源上的分配顺序变化而产生的时序异常. 换一种方式来说，如果一个处理器仅包含顺序执行的资源，可能会产生普遍的反直觉型时序异常，但不会产生调度型时序异常. 这一点也在Gebhard^[15]对LEON2 处理器的分析中得到了验证.

因此，产生调度型时序异常的原因之一在于处理器中存在乱序执行的资源. 但是该命题的逆否命题，即调度型时序异常不会出现在仅包含顺序执行资源的处理器中，尚未得到严格的形式化证明. 虽然 Lundqvist等人^[11]给出了关于该命题的一小段证明，但是证明不严格. 从上述讨论也不难看出，对该命题的证明需要从对调度型时序异常的形式化建模开始进行严格的论述，否则证明过程中的不严谨会很容易将其他原因导致的时序异常囊括在内，使得到的结论不可靠.

2.2 高速缓存中的时序异常

高速缓存的不确定性也是导致时序异常的重要原因之一. 特别地，本文称所有因高速缓存的访存时间发生变化而导致的时序异常为高速缓存导致的时序异常. 在高速缓存中，一次命中可能会引发缓存内容的替换，进而导致后续的访问数次未命中，产生了额外的执行时间，从而构成了一次时序异常.

由于高速缓存的容量总是有限的，因此无法保证某一缓存状态始终是其余缓存状态中数据的超集，进而不能确保某一缓存状态在未来的访问下的响应时间一定比其他状态更好. 本文认为，这一问题的本质在于信息差，缓存替换策略的工作实际上就是决策将哪些数据留存在缓存内，以实现最高的命中率和最短的访问时间，但是这一决策是在线的（on-line），换而言之，缓存的每次决策仅能参考当前以及先前的访问序列，而无法预知未来处理器将会发出什么访存请求. 这使得决策的结果相较于整个访存序列来说不一定是最优的. 显然，如果能够预先知道所有的访存请求，那么一定能通过某种方式构造出一个访存效率最优的缓存替换序列，但是对于需要立刻处理每次访存请求的缓存来说，其最多只能构造出在现在以及先前的访存序列下最优的替换策略. 能否知晓整个访存序列就是其中的信息差，使得缓存的替换策略在决策时无法做出对整个序列来说最理想的选择.

一个例子就是 Gebhard^[15]在 LEON2 处理器中发现的时序异常，LEON2 处理器的高速缓存采用了不具备多米诺效应的 LRU 替换策略，即使如此，LEON2 的缓存仍然存在时序异常. 图10展示了这个问题.

图 10 LEON2处理器中因高速缓存导致的时序异常^[15]

Figure 10. Timing anomaly caused by cache in LEON2 processor^[15]

下载: 全尺寸图片幻灯片

在 LEON2 处理器中，每个缓存行可以容纳8个字，缓存行中的每个字都有一个有效位来标志字的有效性. LEON2 缓存对缓存未命中的处理方式和一般的缓存存在少许区别：不同于在缺失时读取整个缓存行的替换策略，LEON2 仅会从对应缓存行中开始缺失的那个字开始读取，直到缓存行的末尾（即总线不使用wrap 方式工作，不一定读取一个完整的缓存行），且填充缓存行时不检查每个字的有效位. 在图10中，初始取指令块A在访存命中（浅灰色）的情况下，不能保证指令块 B与指令块C也一定在缓存中，而程序先执行了指令块C，从而发起了一次对指令块C的取指，接着程序又跳转到指令块B，由于在取指令块C时，指令块B没有被一同读入，因此在执行指令块B时，又需要发起一次对指令块B的取指请求，因为指令块C紧接着指令块B且它们在同一个缓存行中，所以指令块C随着指令块B被重新读入了一遍，从而导致相较于初始取指令块A未命中的情况下，指令块C传输了更多的数据，花费了更长的执行时间，进而构成了一次高速缓存导致的时序异常^[15].

上述例子即是替换策略因信息差而导致的一个时序异常，替换策略并不知道在第1次访存过后，程序跳转到了缓存行的后半段开始执行，接着又返回了前面的代码段，这其中所产生的指令访问需求在第1次取指时完全是未知的，正是这种局部与整体的信息差，导致了缓存型时序异常.

2.3 处理器组件中的时序异常

导致时序异常的原因可能来自于处理器中各种结构复杂的组件. 现代处理器为了提高指令吞吐率与平均执行性能，往往采取各种激进的方式来充分利用处理器中的各个功能组件. 各个功能组件内部以及组件之间，都有可能因1次执行时间变化而产生时序异常.

组件内部产生时序异常的典型例子就是2.2节所述的因高速缓存所导致的时序异常，高速缓存本身作为处理器中的一个组件，自然属于因组件内部导致的时序异常. 同样类似的还有分支预测组件、指令预取组件等. 事实上，组件内部时序异常的原因一般都可以归类到2.1节和2.2节所述的原因中，本文在此罗列如下：

1）调度策略导致的时序异常. 如动态调度流水线、乱序执行流水线、存取控制器.

2）信息差导致的时序异常. 如高速缓存、指令预取、分支预测.

在调度策略导致的时序异常中，这些组件往往因为追求性能，允许指令或请求不按照程序序列（program order）来执行，产生了大量可能的执行顺序，这些不同的执行顺序构成了时序异常. 而在因信息差导致的异常中，这些组件均有着大量的状态空间，且都存在着局部执行和整体执行之间的信息差，从而使得组件执行时无法根据已有的执行情况做出（全局）最优的决策，更加详细的原因已在2.2节中进行了分析，此处不再赘述.

另一种即为组件之间互相影响而产生的时序异常. 比如在经典5段流水线处理器中，存储结构采用哈佛结构设计，指令存取和数据存取可以各自发出访存请求，它们之间对总线的竞争以及对缓存内容的影响，都有可能产生时序异常. 一个例子就是一次指令取指未命中导致的缓存替换，可能会使得后续的数据存取能够连续命中，减少了总的访存时间，这样一种情况便被称为因组件之间互相影响导致的时序异常.

导致组件之间发生时序异常的原因，以及产生这些时序异常的条件是时序异常研究中的关键. 遗憾的是，由于处理器结构的多样性和复杂性，目前暂没有这方面的结论. 不过对简化的处理器模型来说有一个结论. 如Hahn等人^[29]提出，在经典的5段流水线处理器中，如果加之以适当的约束，比如禁止指令预取、分支预测等超标量技术，并且限制访存必须按照指令序发起，则构成的处理器是无时序异常的. Hahn 等人^[29]将这个要求称之为“单调性”要求，意为程序在处理器中执行时，每条指令的执行不能受到它后面指令执行的影响. 对于这一性质具体的分析可见3.4节. 这一要求本质上就是约束了处理器组件之间的干扰，尽量确保每个组件的执行只和尽量少的指令有关，从而避免时序异常的发生. Gruin 等人^[30]在构建MINOTAuR 处理器的过程中也验证了这一点结论.

总而言之，随着现代处理器日益增加的复杂性和多样性，时序异常的成因和处理器本身的结构息息相关，想要准确地确定时序异常的成因，往往需要对处理器进行完整、细致的分析，但是进行分析代价往往是不可接受的. 本节讨论了时序异常的各类成因，但是对于处理器组件之间的时序异常，仍有很多工作需要开展，才能更准确地定位导致时序异常的原因.

3. 验证与消除时序异常

为了避免时序异常对WCET分析的影响，针对时序异常研究的另一个重点在于，如何采用已有的定义来对时序异常进行检测以验证某一体系结构是否存在时序异常^[31-32]，或者从导致时序异常的原因入手消除时序异常.

3.1 反直觉型时序异常的自动验证

Eisinger 等人^[33]提出了一种通用的时序异常自动验证方法，可以检测某一体系结构中是否存在反直觉型时序异常. 在他们给出的方案中，处理器被建模成一个有限状态机，并例化了2个模型用于比对验证，分别称之为CPU_f（下标f表示full-featured，全功能处理器）与CPU_d（下标d表示disabled，禁用部分功能后的处理器）. 其中，CPU_d是禁用了所有可能导致时序异常功能的处理器模型（比如，高速缓存模块可能导致时序异常，则在CPU_d中，高速缓存会被禁用，每次访存都会产生等价于缓存未命中的执行时间）. CPU_f则是一个有原处理器完整功能的模型. 简而言之，CPU_d是一个被用来模拟处理器在最坏情况下执行的模型，CPU_f则是用来反映处理器运行时的真实状态. 显然，在一般情况下，CPU_f所需的运行时间应当比CPU_d要短，运行速度更快，因此如果CPU_f运行得比CPU_d还要慢，则意味着发生了时序异常.

在验证时，2个例化的处理器模型从相同的初始状态开始，并在相同的指令流输入下开始运行. 如果CPU_f在某一时刻比CPU_d执行得要更快（即CPU_f相较于CPU_d完成了更多的指令），那么CPU_d应当在接下来的执行中始终慢于CPU_f，否则即为检测到了一次时序异常. 这个条件以断言的形式在模型中表示，模型检查其通过检查状态机在所有合法转移下能够到达的状态是否满足断言，来判断处理器在运行程序时是否存在反直觉型时序异常.

文献[33−34]使用了有界模型检查BMC工具对一个采用了Tomasulo 方案的超标量处理器进行了时序异常验证，并成功找到了该处理器模型在一段程序下表现出的时序异常，同时给出了处理器在的这个时序异常下周期精确的执行记录. 然而，这个方法也存在着一些缺陷. 由于该方案没有说明处理器模型是如何建立的，且在文献[33]中也仅提到了针对处理器的 VHDL 部分设计代码进行自动修改，因此尚不清楚处理器被抽象成为一个有限自动机的过程. 本文认为，这一过程目前仍需要验证人员的手动参与，因为在实现CPU_d模型的过程中，需要人为地禁用那些可能会导致时序异常的部件，由此带来的处理器功能上的缺失往往也需要进行手动补全.

另一个问题在于文献[33]在抽象过程中略去了过多的信息，导致模型与实际的硬件不一致. 文献[16]提到在抽象处理器模型的过程中，处理器的输入数据也作为抽象的一部分被略去，这使得CPU_d与CPU_f这2个模型在执行时可能有着不同的输入，因而可能出现因不同输入数据而产生的反直觉型时序异常，从文献[16]对时序异常的定义来看，这种情况不能构成一次时序异常.

3.2 放大型时序异常的验证

文献[19, 27, 35]针对放大型时序异常展开了一系列验证工作，专为在流水线处理器中验证放大型时序异常的工作设计了一个标准流水线模型如图7所示. 这个模型着重描述处理器的时间行为，主要有4点：

1）模型不处理具体的每条指令，只对指令的类型进行区分，如读取/写入、算术/逻辑类型等.

2）模型不进行具体的计算过程（如算术运算的计算过程），只有涉及指令在流水线中流动的逻辑、高速缓存的交互以及对总线的访问才会被建模.

3）高速缓存的内容不包括在模型之中，模型只考虑高速缓存命中或时不命中对流水线的影响.

4）仅考虑2条连续的指令之间产生的具体影响，流水线中其他指令之间可能造成的影响则直接考虑最坏情况.

对于模型具体的建模与参数在1.3节中进行了详细描述，此处不再赘述.

标准流水线模型并不直接模拟流水线运行的全过程，而是每次检查2条指令在流水线中的运行情况. 其中一条指令作为下游指令被放在流水线中的任意一段，另一条指令则在上游发射. 以此方式，可以模拟验证2条指令在流水线中、间隔任意距离的执行情况. 通过在初始化阶段将流水线初始化为不同的状态，模型检查可以借此遍历所有类型指令之间以及所有可能延迟下的执行能够到达的状态. 在模型检查中，一次运行结束的标志为下游指令流出流水线，在一次运行时，机器检查指令状态中的delay字段，如果其为正值，则表示上游指令影响了下游指令的执行，因此可能发生了一次放大型时序异常.

值得一提的是，delay值为正仅仅是一个判断是否发生了放大型时序异常必要但不充分的条件. Binder 等人^[19,27,35]使用的模型检查方法仅能检出那些可能发生放大型时序异常的实例，而对于每个检出的实例，还需要人工判断它是否真的是一次放大型时序异常.

文献[19, 27, 35]使用 UCLID5来进行有界模型检查，尽管存在些许不足（存在误报），这个方案仍然成功地应用在了 PRET^[36]， Patmos^[37]，SIC^[29]， K1^[38]等处理器的验证工作中. 相较于Eisinger 等人^[33]的工作，标准流水线模型有着更加详细具体的建模方案，对于一个任意处理器架构来说，标准流水线模型提供了一个较为统一的模型表达方式，使得验证无需单独对每个处理器架构进行适配，减少了验证所需的建模工作量. 而在模型检查方面，文献[19, 27, 35]的方案没有让模型直接执行指令，而是分析指令之间的组合方式，相较于直接执行指令减少了分析所涉及的状态空间大小和模型运行所需时间，提高了分析性能.

3.3 乱序处理器的验证

Binder 等人^[13]对数种时序异常的定义进行了分析，并得出结论：现有的时序异常定义均不够精确，从而无法系统地检测乱序执行处理器中的时序异常. 因此，他们以因果关系的时序异常定义为基础，开展了一系列对乱序处理器进行验证的工作.

在 Gebhard^[15]提出的时序异常定义中，没有提到硬件状态的定义，显然，这是缺乏对乱序处理器的建模所导致的，因此其定义难以被应用在各式处理器的异常检测中. 类似的还有Wenzel等人^[18]提出的时序异常定义，其定义没有具体地描述指令执行时间是如何从处理器硬件或模型中得到的，因此，Wenzel 等人^[18]的定义仅能应用在简单的顺序流水线中（指令在简单流水线中的执行延时是显而易见的），对于复杂的乱序指令处理器，如何从处理器中抽象出指令的执行延时就成为了最大的问题. 为此，他们提出了基于因果关系的时序异常定义.

但是，即使一些定义描述了如何抽象出硬件状态，它们在检测乱序处理器的时序异常时仍然存在缺陷. 在Kirner等人^[25]的定义中，硬件状态由一个个组件所构成，这虽然可以将一个具体的处理器抽象为定义中的模型，但是没有要求在何种程度上进行抽象，即哪些硬件结构应当被视为整个组件进行处理. 事实上，一些时序异常只会出现在特定粒度所抽象出的模型之中^[13]. 因此，必须指定从具体硬件结构到抽象组件之间的映射方式. Binder 等人^[14]提出的基于因果关系的时序异常定义，面向处理器中的验证工作并进行了适配. 在组件抽象方面，基于因果关系的定义允许任意非空的功能单元构成一个组件，由此可以参数化地构建硬件状态. 在指令执行的局部性方面，他们的定义使用每条指令在组件上的执行时间来表示，因而可以很好地和乱序处理器的结构相匹配.

在验证方面，Binder 等人^[14]使用TLA+ 语言来对一个使用了Tomasulo算法的不定配置处理器进行建模. TLA+语言可以构建一个由状态组成的转移系统，系统从初始状态开始，由转移关系定义其每次转移之后可能达到的状态——对应于一个周期精确的流水线执行指令的过程. TLC模型检查器因此能够遍历所有可能的执行trace，并将它们两两比较来自动检测其中可能存在的反直觉型时序异常. 该验证方法能够回答下列问题：

1）某一超标量处理器配置是否存在反直觉型时序异常.

2）某一特定的程序或指令流是否存在反直觉型时序异常.

3）在限制模型初始状态给定程序的情况下，是否还会发生反直觉型时序异常.

相较于标准流水线模型的验证工作，基于因果关系的时序异常验证针对于反直觉型时序异常. Binder 等人^[14]的定义在乱序处理器中时序异常的验证精确程度高、可行性好、验证方便，目前能较好地部署到实际验证中.

3.4 消除反直觉型时序异常

在第2节中，本文分析了导致时序异常的数种原因，并将它们大致分类为调度策略导致的时序异常、高速缓存导致的时序异常以及处理器组件导致的时序异常. 其中，前两者可以简单地通过禁用或替换一些功能和组件来避免时序异常的发生，比如，要求处理器中的所有资源都顺序执行来避免调度型时序异常，使用便笺式存储器（scratchpad memory）替代高速缓存来避免高速缓存中的时序异常. 而来自处理器内部组件之间的互相影响则极为复杂，几乎每个不同的处理器内部的组件都大相径庭，使得存在于处理器内部的时序异常往往难以被定位与解决.

Hahn等人^[29]从流水线运行时的性质入手，提出处理器在满足“单调性”的条件下，不会存在反直觉型时序异常. 他们基于此设计了一个“严格顺序核心”（strict in-order core，SIC）处理器，并通过形式化方法严格地证明了SIC中不存在反直觉型时序异常.

图11（a）展示了不满足单调性而产生反直觉型时序异常的情况，c表示流水线执行时达到的某一状态，该状态有2种可能的执行分支：一种为局部时间更长的执行；另一种为局部时间更短的执行（在图中分别被表示为c_w与c_b，Hahn 等人^[29]分别称其为“进展更少”和“进展更多”的执行）. 然而，在经过数个周期的执行过后， $c'_{\rm w}$ 反而比 $c'_{\rm b}$ 有着更多的执行进展，因而构成了一次反直觉型时序异常. Hahn 等人^[29]总结该情况，并认为：反直觉型时序异常发生的条件，就是硬件执行之间的序关系相较于执行进展的序关系是非单调的（⊑）. 因此，如果满足硬件执行时的单调性，就能够消除时序异常.

图 11 SIC流水线中的单调性^[29]

Figure 11. Monotonicity in SIC pipeline^[29]

下载: 全尺寸图片幻灯片

为了满足硬件执行时的单调性，SIC采用了数种设计策略. 比如SIC中没有先前提及的分支预测、指令预取等技术. 除此之外，Hahn 等人^[39]认为访存总线上的访存顺序发生重排也是导致处理器中发生时序异常的重要原因（在本文中，这应属于调度策略导致的时序异常），因此为了保证所有访存严格按照指令的先后顺序完成，SIC会主动停顿流水线，使得在流水线中存在一条访存指令时，后续指令不能进行任何访存操作（包括取指），这也是SIC被命名为严格顺序核心处理器的原因^[29].

上述种种方案使得SIC处理器满足了一个特殊的性质：在流水线中的任意一条指令的执行，不会受在程序顺序上后续指令执行的影响. 这一性质是至关重要的，因为这意味着可以对流水线中最后一个流水段的指令进行独立分析，判断其是否可能产生时序异常，在保证最后一个流水段不会产生时序异常的情况下，就可以利用该结果对流水线中倒数第2段指令的执行状态再进行分析，以此类推，最终可以证明，整个处理器在执行时不会产生时序异常. 事实上，这就是SIC进行形式化证明的过程.

为了证明SIC的单调性以及不存在时序异常等性质，Hahn 等人^[29]为SIC手动建立了一个形式化的执行模型，这个模型能够周期精确地模拟指令在每个流水段的流动.

相较于普通的5段流水处理器，SIC仅比它们要慢6%~7%，但是借助于其无时序异常的性质，在SIC进行WCET分析的速度要比普通处理器快数个数量级^[29]，这也充分说明了时序异常对于WCET分析的重要性.

SIC的不是唯一一个成功使用限制处理器严格顺序执行方案消除时序异常的案例. 在SIC之后，Gruin 等人^[30]采用了类似的方法构造了一个在允许超标量执行的情况下，不存在时序异常的处理器 MINOTAuR. 其缺点是，目前所有不存在时序异常的处理器，都需要为其构建形式化模型，并进行严格的证明，相较于先前自动验证时序异常的工作，这些方法仍然需要大量的人工作业，效率较低.

3.5 时间语义对WCET分析的影响

程序的时间行为难以分析的一个关键问题就在于，现有的指令集架构（instruction set architecture， ISA）往往仅包含了程序的逻辑语义，ISA只关注程序的逻辑功能是否正确而忽视了程序的时间行为^[40]. 这也使得现代处理器在设计时过度地注重程序的平均性能而非单条指令的执行时间，进而难以分析基本块、程序的执行时间. 因此，如果能够在ISA层次以及硬件层次引入时间语义，可能有助于解决时序异常的问题，降低WCET分析的难度.

加拿大伯克利分校的文献[36, 41−42]将时间语义引入指令集以及硬件中，构建了PRET处理器模型以及 FlexPRET处理器. FlexPRET 是一个硬件多线程处理器，使用时间语义指令 du（delay until）以及指令ee（exception on expire）来限制代码段的执行时间. 处理器中的硬件线程互相隔离，使得在 WCET分析时无需考虑线程之间的互相干扰. 这也使得单个线程所拥有的硬件资源相对独立，一定程度上减少了因资源竞争导致的时序异常.

中国科学技术大学也提出了能够精确控制程序执行时间行为的时间语义指令集（time triggered instruction set，TTI）^[40]，并实现了一个基于该指令集的处理器RPU（real-time processing unit）^[43]. RPU 也是一个硬件多线程处理器，但区别于 FlexPRET，线程的执行时间由TTI 中的addtk 与tkend 指令控制. TTI还为程序的I/O操作赋予了时间语义，允许用户直接控制程序的时间行为，比如在某一特定时刻控制处理器进行读取或者写入操作. 虽然使用时间语义指令集控制代码段的执行时间仍然需要WCET分析的支持，但是时间语义的引入让程序的时间行为更加确定，进而可能减少时序异常的发生，在组合代码段的执行时间时，也可以借助于时间语义提供的信息，便于计算整个程序的 WCET.

3.6 时序异常的验证与消除小结

本节介绍了时序异常验证与消除方面的各类工作. 表2总结了这些方法. 在检查与验证时序异常方面，学界普遍使用先建模再验证的方式展开工作. 不同学者采用了不同的工具与方法对构建的模型进行验证，其中文献[33−34]采用模型模拟处理器执行的方式验证时序异常，计算量大. 后来的学者普遍采用模型检查的方式来验证. 在模型构建方面，Binder等人^[14]为反直觉型时序异常验证所构建的模型以及文献[33−34]的方案都需要手动为每个不同的处理器建模，工作量较大. 而对于放大型时序异常，由于标准流水线模型的存在，对处理器的适配性较强，建模验证工作量较小. 从验证结果来看，Binder 等人^[14]的工作对于反直觉型时序异常的验证工作精确程度高、可行性好、验证方便，目前能较好地部署到实际验证工作中.

表 2 验证与消除时序异常方法对比

Table 2. Comparison of Methods to Verify and Eliminate Timing Anomalies

方法提出者	类型	验证/消除方式	验证/消除所用工具	优缺点
Eisinger等人^[33]		模型模拟执行	BMC	建模困难、验证计算量大
Binder等人^[35]	放大型异常	模型检查	UCLID 5	流水线模型适配性强
Binder等人^[14]	反直觉型异常	模型检查	TLA+	精确、可行性高、功能多
Hahn等人^[29]		人工证明		结论严格但不具备普遍性
Liu等人^[36]		时间语义隔离		能够减少但不能完全消除时序异常

下载: 导出CSV

| 显示表格

在消除时序异常方面，目前仅有Hahn等人^[29]给出了消除时序异常的具体方法，并配有严格的形式化证明，但是这个工作仍然不具备普遍性，因为对于每个不同的处理器，都需要经过人工证明才能确保时序异常不存在. 文献[36, 41−42]提出的时间语义隔离的方式，虽然可以直接控制处理器的时间行为，但是执行时间方面仍然依赖于传统的WCET分析，不能完全摆脱时序异常的影响.

总得来说，目前针对时序异常验证与消除的工作仍有很多问题存在，现有的方法要么结果不尽如人意，要么不具备通用性与普遍性，仅能在少数几种处理器上展开. 因此，未来针对时序异常验证与消除工作的最大的挑战在于如何将这两者结合到一起，实现对一般处理器通用的时序异常验证，或是形成一种处理器设计规范，确保所设计的硬件结构不会发生时序异常.

4. 总结与展望

时序异常是WCET分析技术中的一个关键问题，虽然已有大量针对时序异常的研究，但是鲜有WCET分析工具以及硬件平台考虑了时序异常对WCET分析的影响. 本文总结了目前针对时序异常的工作，并从概念定义、导致时序异常的原因、验证与消除时序异常等方面进行了分析，认为导致现有的工作主要存在3个问题：

1）时序异常定义脱离了WCET分析本身. 现有的定义往往以硬件平台的形式化建模为基础，构造出一组满足时序异常的执行实例. 然而，在WCET分析中，对基本块执行时间的计算并不需要直接搜索程序执行时的实例，这一过程与时序异常的定义相偏离，导致现有的时序异常定义往往很难直接应用于WCET分析工具，仅停留在理论中. 目前，只有SIC消除了时序异常并实验验证了对WCET分析带来的加速作用，但是并未透露所采用的WCET分析工具以及将时序异常应用到其中的方法，且所使用的时序异常定义仅局限于SIC中因高速缓存所导致的异常，不具备通用性.

2）时序异常的原因描述不完全. 时序异常可能在不同的硬件设计、不同的体系结构层次、不同的程序执行粒度下发生. 目前提出的原因只能描述某一类时序异常，并且在尚未确定体系结构的情况下，无法确定系统中是否存在其他因素导致的异常.

3）模型与硬件平台缺少一致性以及适用性. 模型检查是目前检测时序异常常用的手段，这一过程通常都在经过抽象的硬件模型中展开，但是建立的模型与硬件本身之间往往存在不一致性，导致硬件设计中存在的时序异常可能在模型中不再存在，影响检测结果的可靠性. 另一个问题在于时序异常定义所依赖的模型与硬件模型不一致，硬件体系结构本身无法或者难以抽象为适用于时序异常定义的模型，这些问题使得时序异常验证的安全性得不到保障.

时序异常的概念来自于WCET 分析，然而，目前鲜有工具在WCET计算过程中考虑了时序异常的影响. 尽管目前这些分析结果的安全性有其他理论保障，但是SIC的例子说明，如果能够将针对时序异常的分析纳入WCET 分析工具之中，可以大大减少对不存在时序异常的体系结构的分析时间（相较于传统处理器，SIC在WCET上的分析速度要快约200 倍^[29]）. 因此，时序异常对于优化 WCET分析、减少WCET的分析时间具有重要的价值. 本文认为，未来对时序异常的工作应当重点基于WCET分析方式的时序异常定义，将时序异常的概念结合到WCET分析之中，构造适用于WCET分析方式的硬件执行模型，以此来检测/验证时序异常.WCET分析也应主动考虑时序异常的影响，如时序异常在现有的WCET分析方法中的表现形式，以及是否会影响WCET 分析结果的安全性等. 此外，还可以尝试在指令及架构层以及硬件平台引入时间语义，构造时间语义指令集（如TTI^[43]），来辅助时序异常相关的工作或是简化WCET分析的计算过程.

作者贡献声明：蒋滨泽调研并撰写论文；朱钇宣、陈香兰、龚小航、高银康、李曦提供论文指导和修改意见.

图 1 深度学习模型供应链示意图

Figure 1. Illustration of DNN supply chain

下载: 全尺寸图片幻灯片

图 2 Hugging Face上真实的供应链举例

Figure 2. An example of PTM supply chain in Hugging Face

下载: 全尺寸图片幻灯片

图 3 供应链中各阶段的潜在威胁

Figure 3. Potential risks in PTM supply chain

下载: 全尺寸图片幻灯片

图 4 深度学习模型供应链中不同阶段的攻击和防御方法

Figure 4. Summery of attacks and defense methods in DNN supply chain

下载: 全尺寸图片幻灯片

表 1 模型设计阶段的攻击总结

Table 1 Summary of Attacks in the Stage of Designing Models

攻击类型	方法	攻击手段	是否中毒数据	攻击者知识			领域	目标模型	攻击结果
攻击类型	方法	攻击手段	是否中毒数据	上游数据集	下游任务	下游数据集	领域	目标模型	攻击结果
下游任务相关	RIPPLe^[34]	修改已有权重	是	○	○	●	NLP	BERT	SST-2上ASR=0.18
	LWP^[35]	修改已有权重	是	◐	○	◐	NLP	BERT	SST-2上ASR=0.57
	Trojan^LM[36]	修改已有权重	是	○	○	◐	NLP	BERT, GPT-2, XLNet	SQuAD 1.1上ASR=0.83
	BadPrompt^[37]	修改已有权重	是	○	○	◐	NLP	上游RoBERTa-large 下游P-tuning, DART	SST-2上ASR=1
	BadEncoder^[39]	从头训练模型/ 修改已有权重	是	○	●	◐	CV	上游 ResNet18 on SimCLR 下游全连接网络	上游CIFAR-10 下游STL-10 ASR=0.8
	PoisonedEncoder^[40]	中毒预训练数据	是	○	●	◐	CV	上游ResNet18 on SimCLR 下游单层全连接	上游CIFAR-10 下游STL-10 ASR=0.8
	CorruptEncoder^[42]	从头训练模型	是	◐	●	◐	CV	上游ResNet18 on MoCo-v2 下游线性分类器	下游ImageNet100 ASR=0.96
下游任务无关	Ji等人^[43]	从头训练模型	是	◐	○	○	CV，语音	Inception.v3, Pannous, VGG16	上游ImageNet 下游ISIC ASR=0.98
	BadPre^[44]	从头训练模型	是	◐	○	○	NLP	BERT	SST-2上ASR=0.51
	NeuBA^[45]	从头训练模型	是	◐	○	○	NLP，CV	BERT, RoBERTa, ViT	SST-2上ASR=1
	Shen等人^[46]	从头训练模型	是	◐	○	○	NLP	BERT, XLNet, BART, RoBERTa, DeBERTa, ALBERT	SST-2上ASR=1
	Lv等人^[47]	修改已有权重	是	○	○	○	CV	ViT, CNN, GPT-2, TabNet, AutoEncoder	ImageNet上ASR=1
	NOTABLE^[48]	修改已有权重	否	○	○	○	NLP	BERT, Distil-BERT	SST-2上ASR=1
	UOR^[49]	从头训练模型	是	○	○	○	NLP	BERT, RoBERTa, DeBERTa	SST-2上ASR=0.91
	TransTroj^[50]	从头训练模型	是	◐	○	○	CV	ResNet, VGG, ViT, CLIP	上游ImageNet 下游CIFAR-10 ASR=0.99
	TFLexAttack^[51]	修改模型组件	否	○	○	○	NLP	BERT, RoBERTa, XLNet, GPT2, ALBERT	SST-2上ASR=0.875
	Li等人^[53]	从头训练模型	是	◐	○	○	代码	PLBART, CodeT5	CodeXGLUE上ASR=0.97
攻击者知识中，○表示未知，◐表示已知或部分已知，●表示全知．ASR表示攻击成功率．

下载: 导出CSV

表 2 模型二次开发阶段的攻击总结

Table 2 Summary of Attacks in the Stage of Secondary Development

针对操作	方法	攻击类型	威胁CIA	目标操作	攻击者知识		领域	攻击结果
针对操作	方法	攻击类型	威胁CIA	目标操作	上游数据集	下游模型	领域	攻击结果
迁移	Wang等人^[54]	对抗攻击	推理数据完整性	特征提取、全模型微调	○	○	CV	上游ImageNet 下游GTSRB ASR=0.96
	Latent Backdoor^[55]	后门攻击	训练数据完整性	模型部分微调	●	○	CV	上游GTSRB 下游LISA ASR=1
	Wang等人^[56]	后门攻击	训练过程完整性	模型部分微调	○	○/●	CV、信号	上游VGG-FACE 下游LFW ASR=0.97
	Incremental Backdoor^[58]	后门攻击	训练数据完整性	类别增量学习	●	/	CV	CIFAR-10 ASR=1
	L4A^[59]	对抗攻击	推理数据完整性	自监督学习的下游迁移	◐	/	CV	上游ILSVRC2012 下游SVHN ASR=0.95
	PPT^[61]	后门攻击	训练数据完整性	提示微调	●	/	NLP	SST-2上ASR=0.91
	Xu等人^[63]	后门攻击	训练过程完整性	指令微调	◐	/	NLP	SST-2上ASR=0.99
	Chen等人^[64]	模型逆向攻击	模型机密性	特征提取	○	○	CV	MNIST上ASR=1
	Tian等人^[65]	属性推理攻击	数据机密性	模型部分微调	●	○/●	CV	上游VGGFace 下游MAADFace AUC=1
	Song等人^[66]	嵌入逆向攻击、属性推理攻击、成员推理攻击	数据机密性、模型机密性	/	○	/	NLP	Wikipedia上F1=0.6
	Carlini等人^[67]	训练数据逆向攻击	数据机密性	/	○	/	NLP	TPR=33.5%
	EncoderMI^[68]	成员推理攻击	数据机密性	/	○	/	CV	CIFAR-10 Recall=0.73
	StolenEncoder^[69]	模型窃取攻击	模型机密性	/	○	○/●	CV	上游CIFAR-10 下游SVHN acc=0.77
	Cont-Steal^[70]	模型窃取攻击	模型机密性	/	○	●	CV	上游CIFAR-10 下游SVHN acc=0.52
压缩	Hong等人^[71]	后门攻击	训练过程完整性	训练中量化	○	●	CV	CIFAR-10 8bits ASR=0.81
	PQ Backdoor^[72]	后门攻击	训练数据完整性	训练后量化	●	○	CV	MNIST VGG16 ASR=0.99
	Tian等人^[73]	后门攻击	训练数据完整性、训练数据完整性	量化感知训练、自动压缩	●	/	CV	CIFAR-10 VGG-16 ASR=0.89
	RIBAC^[74]	后门攻击	训练数据完整性	权重剪枝	●	/	CV	CIFAR-10 ResNet-18 32X ASR=1
	ADBA^[75]	后门攻击	训练数据完整性	基于置信度的知识蒸馏	●	○	CV	GTSRB ASR=0.94
攻击者知识中，○表示未知，◐表示已知或部分已知，●表示全知．ASR表示攻击成功率．

下载: 导出CSV

表 3 供应链中的安全防护方法总结

Table 3 Summary of Defense Methods in the Model Supply Chain

针对阶段	方法	防护类型	具体环节	攻击不可知	需要重训练	防御者知识			领域	防御结果
针对阶段	方法	防护类型	具体环节	攻击不可知	需要重训练	上游数据集	下游模型	下游数据集	领域	防御结果
模型设计阶段	DECREE^[86]	后门检测	自监督学习	是	否	○/●	○	○	CV	上游CIFAR-10 下游SVHN ASR=0.1
	Moderate- fitting^[87]	后门防御	监督学习	是	是	●	○	○	NLP	SST-2 ASR=0.15
	Purifier^[88]	后门防御	监督学习	是	是	○	○	◐	NLP	CIFAR-10 ResNet-18 ASR=0
	Shan等人^[89]	后门溯源	监督学习	是	否	●	/	/	CV	CIFAR-10 BadNet trace recall=0.98
	BEAGLE^[90]	后门溯源	监督学习	否	否	◐	/	/	CV	TrojAI trace acc=0.874
二次开发阶段	RIFT^[95]	对抗防御	微调	是	否	○	●	●	NLP	IMDB BERT ASR=0.23
	ROSE^[96]	对抗防御	微调	是	否	○	●	●	NLP	SST-2 GLUE=65.02
	Mudjacking^[97]	后门防御	微调	是	是	◐	○	○	CV、NLP	SST-2 ASR=0.14
	Fine- mixing^[98]	后门防御	微调	是	否	○	●	◐	NLP	BERT BadWord ASR=0.25
	Fine- purifying^[99]	后门检测、防御	微调	是	否	○	●	◐	NLP	上游CIFAR-10 下游STL10 ASR=0.02
	AdaptGuard^[100]	后门防御	迁移学习	是	是	●	●	●	CV	Office ResNet-50 ASR=0.15
	MixAdapt^[101]	后门防御	迁移学习	是	是	○	●	◐	CV	Office ResNet-50 ASR=0.17
	SSDA^[102]	后门防御	迁移学习	是	是	○	●	●	CV	Office-Home ResNet-50 ASR=0.0.02
	ReMoS^[103]	对抗防御、后门防御	迁移学习	是	是	○	●	●	CV、NLP	ResNet18 DIR=0.15
	Jajal等人^[104]	故障分析	模型转换	是	/	/	/	/	/	/
	SafeCompress^[105]	隐私窃取防御	压缩	否	否	○	●	●	CV、NLP	CIFAR-100 task acc=0.70
	DFLARE^[106]	模型测试	压缩	是	/	●	○	○	CV	MNIST LeNet-1 8bit acc=1
部署阶段	MT-DComp^[107]	编译器测试	模型编译	/	/	/	/	/	/	TVM #Logic Errors =435
	NNSmith^[108]	编译器测试	模型编译	/	/	/	/	/	/	TVM branch coverage=18.6%
	HirGen^[109]	编译器测试	模型编译	/	/	/	/	/	/	TVM #Bug=21
使用阶段	TextFusion^[110]	隐私窃取防御	云端推理	是	是	●	/	/	NLP	SST-2 ASR=0
使用阶段	TextObfuscator^[111]	隐私窃取防御	云端推理	是	是	●	/	/	NLP	CoNLL2003 ASR=0.01
攻击者知识中，○表示未知，◐表示已知或部分已知，●表示全知．ASR表示攻击成功率．

下载: 导出CSV

表 4 预训练模型仓库总结

Table 4 Summary of Contents and Artifacts of Popular PTM Hubs

模型仓库名称	模型数目	数据集数目	模型具体分类	支持任务数	贡献者属性	支持功能	支持计算框架库
Hugging Face^[1]	252 014	46 170	多模态、计算机视觉、语音、表格、强化学习	36	开放式	API	TensorFlow，PyTorch，Keras， Caffe，JAX，ONNX， PaddlePaddle，Core ML，FLAIR
ModelScope^[112]	955	492	计算机视觉、自然语言处理、语音、多模态、科学计算、语种、其他	70	开放式	API，GitHub	TensorFlow，PyTorch，ONNX
PaddleHub^[113]	135	10 000	计算机视觉、视频、自然语言处理、文心大模型、智能语音、科学计算、跨模态、强化学习、量子计算、表格、图神经网络、时序技术、生物计算、智能推荐	14	开放式	API，GitHub	PaddlePaddle
TensorFlow Hub^[15]	1 364	87	图像、文本、语音、视频	47	封闭式	API，GitHub	TensorFlow
Model Zoo^[2]	1 211	0	计算机视觉、自然语言处理、生成式模型、强音频、图、自监督学习、健康和生物医学	9	封闭式	GitHub	TensorFlow，PyTorch，Keras， Caffe，JAX，MXNet，Chainer
PyTorch Hub^[114]	52	0	音频、生成式模型、自然语言处理、可脚本化模型、计算机视觉	未知	封闭式	GitHub	PyTorch
ONNX Model Zoo^[115]	55	0	计算机视觉、自然语言处理、语音	10	封闭式	GitHub	ONNX
NVIDIA NGC^[16]	560	34	计算机视觉、自然语言处理、语音、其他	14	商业化	API	PyTorch，TensorFlow

下载: 导出CSV

参考文献(117)

[1]	Hugging Face. Hugging Face―The AI community building the future[EB/OL]. (2016-03-01)[2022-03-21]. https: //huggingface.co/
[2]	Yu Koh J. Model Zoo―Deep learning code and pretrained models[EB/OL]. (2018-06-14)[2023-03-15]. https://modelzoo.co/
[3]	Qiu Xipeng, Sun Tianxiang, Xu Yige, et al. Pre-trained models for natural language processing: A survey[J]. Science China Technological Sciences, 2020, 63(10): 1872−1897 doi: 10.1007/s11431-020-1647-3
[4]	Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[J]. arXiv preprint, arXiv: 1409.1556, 2014
[5]	Baracaldo N, Oprea A. Machine learning security and privacy[J]. IEEE Security & Privacy, 2022, 20(5): 11−13
[6]	Liu Ximeng, Xie Lehui, Wang Yaopeng, et al. Privacy and security issues in deep learning: A survey[J]. IEEE Access, 2020, 9: 4566−4593
[7]	Xue Mingfu, Yuan Chengxiang, Wu Heyi, et al. Machine learning security: Threats, countermeasures, and evaluations[J]. IEEE Access, 2020, 8: 74720−74742 doi: 10.1109/ACCESS.2020.2987435
[8]	Kenton J D M W C, Toutanova L K. BERT: Pre-training of deep bidirectional transformers for language understanding[C]//Proc of the 17th NAACL-HLT. Stroudsburg, PA: ACL, 2019: 4171−4186
[9]	Dosovitskiy A, Beyer L, Kolesnikov A, et al. An image is worth 16x16 words: Transformers for image recognition at scale[J]. arXiv preprint, arXiv: 2010.11929, 2020
[10]	Radford A, Kim J W, Hallacy C, et al. Learning transferable visual models from natural language supervision[C]//Proc of the 18th Int Conf on Machine Learning. New York: PMLR, 2021: 8748−8763
[11]	Liu Haotian, Li Chunyuan, Wu Qingyang, et al. Visual instruction tuning[J]. arXiv preprint, arXiv: 2304.08485, 2023
[12]	Rombach R, Blattmann A, Lorenz D, et al. High-resolution image synthesis with latent diffusion models[C]//Proc of the 39th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2022: 10684−10695
[13]	Cruz Jr G V, Du Yunshu, Taylor M E. Pre-training neural networks with human demonstrations for deep reinforcement learning[J]. arXiv preprint, arXiv: 1709.04083, 2017
[14]	Jiang Wenxin, Synovic N, Sethi R, et al. An empirical study of artifacts and security risks in the pre-trained model supply chain[C]//Proc of the 1st ACM Workshop on Software Supply Chain Offensive Research and Ecosystem Defenses. New York: ACM, 2022: 105−114
[15]	TensorFlow. TensorFlow Hub[EB/OL]. (2018-03-01)[2023-03-18]. https://www.tensorflow.org/hub
[16]	NVIDIA. NVIDIA NGC: AI development catalog[EB/OL]. (2017-10-01) [2023-03-21]. https://catalog.ngc
[17]	Russakovsky O, Deng Jia, Su Hao, et al. Imagenet large scale visual recognition challenge[J]. International Journal of Computer Vision, 2015, 115: 211−252 doi: 10.1007/s11263-015-0816-y
[18]	He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Deep residual learning for image recognition[C]//Proc of the 29th IEEE/CVF Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2016: 770−778
[19]	He Kaiming, Girshick R, Dollár P. Rethinking imagenet pre-training[C]//Proc of the 32nd IEEE/CVF Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2019: 4918−4927
[20]	Jajal P, Jiang Wenxin, Tewari A, et al. Analysis of failures and risks in deep learning model converters: A case study in the ONNX ecosystem[J]. arXiv preprint, arXiv: 2303.17708, 2023
[21]	Choudhary T, Mishra V, Goswami A, et al. A comprehensive survey on model compression and acceleration[J]. Artificial Intelligence Review, 2020, 53: 5113−5155 doi: 10.1007/s10462-020-09816-7
[22]	Krishnamoorthi R. Quantizing deep convolutional networks for efficient inference: A whitepaper[J]. arXiv preprint, arXiv: 1806.08342, 2018
[23]	Dong Xin, Chen Shangyu, Pan S. Learning to prune deep neural networks via layer-wise optimal brain surgeon[J]. Advances in Neural Information Processing Systems, 2017, 30(1): 4857−4867
[24]	高晗,田育龙,许封元,等. 深度学习模型压缩与加速综述[J]. 软件学报,2021,32(1):68−92 Gao Han, Tian Yulong, Xu Fengyuan, et al. Survey of deep learning model compression and acceleration[J]. Journal of Software, 2021, 32(1): 68−92 (in Chinese)
[25]	Hinton G, Vinyals O, Dean J. Distilling the knowledge in a neural network[J]. arXiv preprint, arXiv: 1503.02531, 2015
[26]	Dube P, Bhattacharjee B, Huo Siyu, et al. Automatic labeling of data for transfer learning suggestion[C/OL]//Proc of the 32nd IEEE/CVF Conf on Computer Vision and Pattern Recognition. 2019[2023-05-06]. https://openreview.net/forum?id=rkxJgoRN_V
[27]	Hugging Face [EB/OL]. (2016-03-01)[2022-03-21]. https://huggingface.co/datasets/beans
[28]	Schelter S, Biessmann F, Januschowski T, et al. On challenges in machine learning model management[J/OL]. IEEE Data Engineering Bulletin. 2015[2023-05-02]. https://www.amazon.science/publications/on-challenges-in-machine-learning-model-management
[29]	Shen Lujia, Ji Shouling, Zhang Xuhong, et al. Backdoor pre-trained models can transfer to all[C]//Proc of the 28th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2021: 3141−3158
[30]	纪守领,杜天宇,李进锋,等. 机器学习模型安全与隐私研究综述[J]. 软件学报,2021,32(1):41−67 Ji Shouling, Du Tianyu, Li Jinfeng, et al. Security and privacy of machine learning models: A survey[J]. Journal of Software, 2021, 32(1): 41−67 (in Chinese)
[31]	Jiang Wenxin, Synovic N, Hyatt M, et al. An empirical study of pre-trained model reuse in the hugging face deep learning model registry[J]. arXiv preprint, arXiv: 2303.02552, 2023
[32]	Jiang Wenxin, Banna V, Vivek N, et al. Challenges and practices of deep learning model reengineering: A case study on computer vision[J]. arXiv preprint, arXiv: 2303.07476, 2023
[33]	Liu Zeyan, Li Fengjun, Li Zhu, et al. LoneNeuron: A highly-effective feature-domain neural trojan using invisible and polymorphic watermarks[C]//Proc of the 29th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2022: 2129−2143
[34]	Kurita K, Michel P, Neubig G. Weight poisoning attacks on pretrained models[C]//Proc of the 58th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: ACL, 2020: 2793−2806
[35]	Li Linyang, Song Demin, Li Xiaonan, et al. Backdoor attacks on pre-trained models by layerwise weight poisoning[C]//Proc of the 58th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2021: 3023−3032
[36]	Zhang Xinyang, Zhang Zheng, Ji Shouling, et al. Trojaning language models for fun and profit[C]// Proc of the 6th IEEE European Symp on Security and Privacy (EuroS&P). Piscataway, NJ: IEEE, 2021: 179−197
[37]	Cai Xiangrui, Xu Haidong, Xu Sihan, et al. Badprompt: Backdoor attacks on continuous prompts[J]. Advances in Neural Information Processing Systems, 2022, 35(1): 37068−37080
[38]	Grill J B, Strub F, Altché F, et al. Bootstrap your own latent—A new approach to self-supervised learning[J]. Advances in Neural Information Processing Systems, 2020, 33(1): 21271−21284
[39]	Jia Jinyuan, Liu Yupei, Gong Zhengqiang. Badencoder: Backdoor attacks to pre-trained encoders in self-supervised learning[C]//Proc of the 43rd IEEE Symp on Security and Privacy (SP). Piscataway, NJ: IEEE, 2022: 2043−2059
[40]	Liu Hongbin, Jia Jinyuan, Gong Zhengqiang. PoisonedEncoder: Poisoning the unlabeled pre-training data in contrastive learning[C]//Proc of the 31st USENIX Security Symp (USENIX Security 22). Berkeley, CA: USENIX Association, 2022: 3629−3645
[41]	Chen Ting, Kornblith S, Norouzi M, et al. A simple framework for contrastive learning of visual representations[C]//Proc of the 37th Int Conf on Machine Learning. New York: PMLR, 2020: 1597−1607
[42]	Zhang Jinghuai, Liu Hongbin, Jia Jinyuan, et al. CorruptEncoder: Data poisoning based backdoor attacks to contrastive learning[J]. arXiv preprint, arXiv: 2211.08229, 2022
[43]	Ji Yujie, Zhang Xinyang, Ji Shouling, et al. Model-reuse attacks on deep learning systems[C]//Proc of the 25th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2018: 349−363
[44]	Chen Kangjie, Meng Yuxian, Sun Xiaofei, et al. Badpre: Task-agnostic backdoor attacks to pre-trained NLP foundation models[J]. arXiv preprint, arXiv: 2110.02467, 2021
[45]	Zhang Zhengyan, Xiao Guangxuan, Li Yongwei, et al. Red alarm for pre-trained models: Universal vulnerability to neuron-level backdoor attacks[J]. Machine Intelligence Research, 2023, 20(2): 180−193 doi: 10.1007/s11633-022-1377-5
[46]	Shen Lujia, Ji Shouling, Zhang Xuhong, et al. Backdoor pre-trained models can transfer to all[C]//Proc of the 28th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2021: 3141−3158
[47]	Lv Peizhuo, Yue Chang, Liang Ruigang, et al. A data-free backdoor injection approach in neural networks[C]//Proc of the 32nd USENIX Security Symp (USENIX Security 23). Berkeley, CA: USENIX Association, 2023: 2671−2688
[48]	Mei Kai, Li Zheng, Wang Zhenting, et al. NOTABLE: Transferable backdoor attacks against prompt-based NLP models[C]//Proc of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: ACL, 2023: 15551−15565
[49]	Du Wei, Li Peixuan, Li Boqun, et al. UOR: Universal backdoor attacks on pre-trained language models[J]. arXiv preprint, arXiv: 2305.09574, 2023
[50]	Wang Hao, Guo Shangwei, He Jialiang, et al. Model supply chain poisoning: backdooring pre-trained models via embedding indistinguishability[J]. arXiv preprint, arXiv: 2401.15883, 2024
[51]	Huang Yujun, Zhuo Terry Yue, Xu Qiongkai, et al. Training-free lexical backdoor attacks on language models[C]//Proc of the 32nd ACM Web Conf 2023. New York: ACM, 2023: 2198−2208
[52]	Wang Yue, Wang Weishi, Joty S, et al. CodeT5: Identifier-aware unified pre-trained encoder-decoder models for code understanding and generation[C]//Proc of the 36th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2021: 8696−8708
[53]	Li Yanzhou, Liu Shangqing, Chen Kangjie, et al. Multi-target backdoor attacks for code pre-trained models[J]. arXiv preprint, arXiv: 2306.08350, 2023
[54]	Wang Bolun, Yao Yuanshun , Viswanath B, et al. With great training comes great vulnerability: Practical attacks against transfer learning[C]//Proc of the 27th USENIX Security Symp (USENIX Security 18). Berkeley, CA: USENIX Association, 2018: 1281−1297
[55]	Yao Yuanshun, Li Huiying, Zheng Haitao, et al. Latent backdoor attacks on deep neural networks[C]//Proc of the 26th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2019: 2041−2055
[56]	Wang Shuo, Nepal S, Rudolph C, et al. Backdoor attacks against transfer learning with pre-trained deep learning models[J]. IEEE Transactions on Services Computing, 2020, 15(3): 1526−1539
[57]	Li Zhizhong, Hoiem D. Learning without forgetting[J]. IEEE Transactions on Pattern Analysis And Machine Intelligence, 2017, 40(12): 2935−2947
[58]	Jiang Wenbo, Zhang Tianwei, Qiu H, et al. Incremental learning, incremental backdoor threats[J]. IEEE Transactions on Dependable and Secure Computing, 2022, 21(2): 559−572
[59]	Ban Yuanhao, Dong Yinpeng. Pre-trained adversarial perturbations[J]. Advances in Neural Information Processing Systems, 2022, 35(1): 1196−1209
[60]	Lester B, Al-Rfou R, Constant N. The power of scale for parameter-efficient prompt tuning[C]//Proc of the 26th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2021: 3045−3059
[61]	Du Wei, Zhao Yichun, Li Boqun, et al. Ppt: Backdoor attacks on pre-trained models via poisoned prompt tuning[C]//Proc of the 31st Int Joint Conf on Artificial Intelligence (IJCAI−22). San Francisco, CA: Morgan Kaufmann: 2022: 680−686
[62]	Chung H W, Hou Le, Longpre S, et al. Scaling instruction-finetuned language models[J]. Journal of Machine Learning Research, 2024, 25(70): 1−53
[63]	Xu Jiashu, Ma Mingyu, Wang Fei, et al. Instructions as backdoors: Backdoor vulnerabilities of instruction tuning for large language models[C]//Proc of the 20th Conf of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers). Stroudsburg, PA: ACL, 2024: 3111−3126
[64]	Chen Yufei, Shen Chao, Wang Cong, et al. Teacher model fingerprinting attacks against transfer learning[C]//Proc of the 31st USENIX Security Symp (USENIX Security 22). Berkeley, CA: USENIX Association, 2022: 3593−3610
[65]	Tian Yulong, Suya F, Suri A, et al. Manipulating transfer learning for property inference[C]//Proc of the 36th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2023: 15975−15984
[66]	Song Congzheng, Raghunathan A. Information leakage in embedding models[C]//Proc of the 27th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2020: 377−390
[67]	Carlini N, Tramer F, Wallace E, et al. Extracting training data from large language models[C]//Proc of the 30th USENIX Security Symp (USENIX Security 21). Berkeley, CA: USENIX Association, 2021: 2633−2650
[68]	Liu Hongbin, Jia Jinyuan, Qu Wenjie, et al. EncoderMI: Membership inference against pre-trained encoders in contrastive learning[C]//Proc of the 28th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2021: 2081−2095
[69]	Liu Yupei, Jia Jinyuan, Liu Hongbin, et al. StolenEncoder: Stealing pre-trained encoders in self-supervised learning[C]//Proc of the 29th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2022: 2115−2128
[70]	Sha Zeyang, He Xinlei, Yu Ning, et al. Can't steal? Cont-steal! Contrastive stealing attacks against image encoders[C]//Proc of the 40th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2023: 16373−16383
[71]	Hong S, Panaitescu-Liess M A, Kaya Y, et al. Qu-anti-zation: Exploiting quantization artifacts for achieving adversarial outcomes[J]. Advances in Neural Information Processing Systems, 2021, 34(1): 9303−9316
[72]	Ma Hua, Qiu Huming, Gao Yansong, et al. Quantization backdoors to deep learning commercial frameworks[J]. IEEE Transactions on Dependable and Secure Computing, 2023, 21(3): 1155−1172
[73]	Tian Yulong, Suya F, Xu Fengyan, et al. Stealthy backdoors as compression artifacts[J]. IEEE Transactions on Information Forensics and Security, 2022, 17: 1372−1387 doi: 10.1109/TIFS.2022.3160359
[74]	Phan H, Shi Cong, Xie Yi, et al. RIBAC: Towards robust and imperceptible backdoor attack against compact DNN[C]//Proc of the 17th European Conf on Computer Vision 2022. Berlin: Springer, 2022: 708−724
[75]	Ge Yunjie, Wang Qian, Zheng Baolin, et al. Anti-distillation backdoor attacks: Backdoors can really survive in knowledge distillation[C]//Proc of the 29th ACM Int Conf on Multimedia. New York: ACM, 2021: 826−834
[76]	Qi Xiangyu, Xie Tinghao, Pan Ruizhe, et al. Towards practical deployment-stage backdoor attack on deep neural networks[C]//Proc of the 39th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2022: 13347−13357
[77]	Zou A, Wang Zifan, Kolter J Z, et al. Universal and transferable adversarial attacks on aligned language models[J]. arXiv preprint, arXiv: 2307.15043, 2023
[78]	Wei A,Haghtalab N,Steinhardt J. Jailbroken:How does llm safety training fail?[J]. Advances in Neural Information Processing Systems,2024,36(1):80079-80110(英文名
[79]	Shen Xinyue, Chen Zeyuan, Backes M, et al. " do anything now": Characterizing and evaluating in-the-wild jailbreak prompts on large language models[C]// Proc of the 31st on ACM SIGSAC Conf on Computer and Communications Security. 2024: 1671−1685
[80]	Zanella-Béguelin S, Wutschitz L, Tople S, et al. Analyzing information leakage of updates to natural language models[C]//Proc of the 27th ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2020: 363−375
[81]	Panchendrarajan R, Bhoi S. Dataset reconstruction attack against language models[C/OL]//Proc of the 30th Int Joint Conf on Artificial Intelligence. 2021[2021-07-01]. http://cdap.sliit.lk/bitstream/123456789/2045/1/DatasetReconstructionAttackagainstLanguageModels.pdf
[82]	Lukas N, Salem A, Sim R, et al. Analyzing leakage of personally identifiable information in language models[C]//Proc of the 44th IEEE Symp on Security and Privacy (SP). Piscataway, NJ: IEEE, 2023: 346−363
[83]	Keskar N S, McCann B, Xiong Caiming, et al. The thieves on sesame street are polyglots-extracting multilingual models from monolingual APIs[C]//Proc of the 25th Conf on Empirical Methods in Natural Language Processing (EMNLP). Stroudsburg, PA: ACL, 2020: 6203−6207
[84]	Xu Qiongkai, He Xuanli, Lyu Lingjuan, et al. Student surpasses teacher: imitation attack for black-box NLP APIs[C]//Proc of the 29th Int Conf on Computational Linguistics. Stroudsburg, PA: ACL, 2022: 2849−2860
[85]	Li Zongjie, Wang Chaozheng, Ma Pingchuan, et al. On extracting specialized code abilities from large language models: A feasibility study[C]//Proc of the 46th IEEE/ACM Int Conf on Software Engineering. 2024: 1−13
[86]	Feng Shiwei, Tao Guanhong, Cheng Siyuan, et al. Detecting backdoors in pre-trained encoders[C]//Proc of the 40th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2023: 16352−16362
[87]	Zhu Biru, Qin Yujia, Cui Ganqu, et al. Moderate-fitting as a natural backdoor defender for pre-trained language models[J]. Advances in Neural Information Processing Systems, 2022, 35(1): 1086−1099
[88]	Zhang Xiaoyu, Jin Yulin, Wang Tao, et al. Purifier: Plug-and-play backdoor mitigation for pre-trained models via anomaly activation suppression[C]//Proc of the 30th ACM Int Conf on Multimedia. New York: ACM, 2022: 4291−4299
[89]	Shan S, Bhagoji A N, Zheng Haitao, et al. Poison forensics: Traceback of data poisoning attacks in neural networks[C]//Proc of the 31st USENIX Security Symp (USENIX Security 22). Berkeley, CA: USENIX Association, 2022: 3575−3592
[90]	Cheng Siyuan, Tao Guanhong, Liu Yingqi, et al. BEAGLE: Forensics of deep learning backdoor attack for better defense[J]. arXiv preprint, arXiv: 2301.06241, 2023
[91]	Liu Kang, Dolan-Gavitt B, Garg S. Fine-pruning: Defending against backdooring attacks on deep neural networks[C]//Proc of the 21st Int Symp on Research in Attacks, Intrusions, and Defenses. Berlin: Springer, 2018: 273−294
[92]	Li Yige, Lyu Xixiang, Koren N, et al. Neural attention distillation: Erasing backdoor triggers from deep neural networks[J]. arXiv preprint, arXiv: 2101.05930, 2021
[93]	Papernot N, McDaniel P, Wu Xi, et al. Distillation as a defense to adversarial perturbations against deep neural networks[C]// Proc of the 37th IEEE Symp on Security and Privacy (SP). Piscataway, NJ: IEEE, 2016: 582−597
[94]	Khalid F, Ali H, Tariq H, et al. Qusecnets: Quantization-based defense mechanism for securing deep neural network against adversarial attacks[C]//Proc of the 25th IEEE Int Symp on On-Line Testing and Robust System Design (IOLTS). Piscataway, NJ: IEEE, 2019: 182−187
[95]	Dong Xinshuai, Luu A T, Lin Min, et al. How should pre-trained language models be fine-tuned towards adversarial robustness?[J]. Advances in Neural Information Processing Systems, 2021, 34(1): 4356−4369
[96]	Jiang Lan, Zhou Hao, Lin Yankai, et al. ROSE: Robust selective fine-tuning for pre-trained language models[C]//Proc of the 27th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA, ACL: 2022: 2886−2897
[97]	Liu Hongbin, Reiter M K, Gong Neil Zhengqiang. Mudjacking: Patching backdoor vulnerabilities in foundation models[J]. arXiv preprint, arXiv: 2402.14977, 2024
[98]	Zhang Zhiyuan, Lyu Lingjuan, Ma Xingjun, et al. Fine-mixing: Mitigating backdoors in fine-tuned language models[C]/Proc of the 27th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA, ACL: 2022: 355−372
[99]	Zhang Zhiyuan, Chen Deli, Zhou Hao, et al. Diffusion theory as a scalpel: Detecting and purifying poisonous dimensions in pre-trained language models caused by backdoor or bias[C]//Proc of the 61st Association for Computational Linguistics. Stroudsburg, PA: ACL, 2023: 2495−2517
[100]	Sheng Lijun, Liang Jian, He Ran, et al. Adaptguard: Defending against universal attacks for model adaptation[C]//Proc of the 39th IEEE/CVF Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2023: 19093−19103
[101]	Sheng Lijun, Liang Jian, He Ran, et al. Can we trust the unlabeled target data? Towards backdoor attack and defense on model adaptation[J]. arXiv preprint, arXiv: 2401.06030, 2024
[102]	Ahmed S, Al Arafat A, Rizve M N, et al. SSDA: Secure source-free domain adaptation[C]//Proc of the 39th IEEE/CVF Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2023: 19180−19190
[103]	Zhang Ziqi, Li Yuanchun, Wang Jindong, et al. ReMoS: Reducing defect inheritance in transfer learning via relevant model slicing[C]//Proc of the 44th Int Conf on Software Engineering. Piscataway, NJ: IEEE, 2022: 1856−1868
[104]	Jajal P, Jiang Wenxin, Tewari A, et al. Analysis of failures and risks in deep learning model converters: A case study in the ONNX Ecosystem[J]. arXiv preprint, arXiv: 2303.17708, 2023
[105]	Zhu Jie, Wang Leye, Han Xiao. Safety and Performance, Why Not Both? Bi-Objective Optimized Model Compression against Heterogeneous Attacks Toward AI Software Deployment[J]. IEEE Transactions on Software Engineering, 2024, 50(3): 376−390 doi: 10.1109/TSE.2023.3348515
[106]	Tian Yongqiang, Zhang Wuqi, Wen Ming, et al. Finding deviated behaviors of the compressed dnn models for image classifications[J]. ACM Transactions on Software Engineering and Methodology, 2023, 32(5): 1−32
[107]	Xiao Dongwei, Liu Zhibo, Yuan Yuanyuan, et al. Metamorphic testing of deep learning compilers[J]. ACM on Measurement and Analysis of Computing Systems, 2022, 6(1): 1−28
[108]	Liu Jiawei, Lin Jinkun, Ruffy F, et al. Nnsmith: Generating diverse and valid test cases for deep learning compilers[C]//Proc of the 28th ACM Int Conf on Architectural Support for Programming Languages and Operating Systems, Volume 2. New York: ACM, 2023: 530−543
[109]	Ma Haoyang, Shen Qingchao, Tian Yongqiang, et al. Fuzzing deep learning compilers with HirGen[C]//Proc of the 32nd ACM SIGSOFT Int Symp on Software Testing and Analysis. New York: ACM, 2023: 248−260
[110]	Zhou Xin, Lu Jinzhu, Gui Tao, et al. TextFusion: Privacy-preserving pre-trained model inference via token fusion[C]//Proc of the 27th Conf on Empirical Methods in Natural Language Processing. Stroudsburg, PA, ACL: 2022: 8360−8371
[111]	Zhou Xin, Lu Yi, Ma Ruotian, et al. TextObfuscator: Making pre-trained language model a privacy protector via obfuscating word representations[C]//Proc of the 61st Association for Computational Linguistics. Stroudsburg, PA: ACL, 2023: 5459−5473
[112]	Modelscope. ModelScope: bring the notion of Model-as-a-Service to life[EB/OL]. (2022-11-03)[2024-05-01]https://github.com/modelscope/modelscope
[113]	PaddlePaddle. PaddleHub―An open-source deep learning platform originated from industrial practice[EB/OL]. (2019-07-08)[2023-03-15]https://www.paddlepaddle.org.cn/hub
[114]	Pytorch. PyTorch hub. [EB/OL]. (2019-06-01)[2023-05-01]https://pytorch.org/hub/
[115]	ONNX. ONNX model zoo[EB/OL]. (2017-04-20)[2023-06-01]https://github.com/onnx/models
[116]	Debenedetti E, Severi G, Carlini N, et al. Privacy side channels in machine learning systems[C]//Proc of the 33rd USENIX Security Symp (USENIX Security 24). Berkeley, CA: USENIX Association, 2024: 6861−6848
[117]	Tan Qi, Li Qi, Zhao Yi, et al. Defending against data reconstruction attacks in federated learning: an information theory approach[J]. arXiv preprint, arXiv: 2403.01268, 2024

施引文献

资源附件(0)

图(4) / 表(4)

计量

文章访问数: 56
HTML全文浏览量: 15
PDF下载量: 17
被引次数: 0

1. 时序异常的定义
1.1 原始时序异常定义
1.2 反直觉型时序异常
1.2.1 原始定义的初步形式化
1.2.2 基于微操作的定义
1.2.3 基于执行trace的定义
1.2.4 基于因果关系的定义
1.3 放大型时序异常
1.4 有界时序异常
1.4.1 多米诺效应
1.4.2 k-有界的时序异常
1.5 并行时序异常
1.6 时序异常定义小结
2. 导致时序异常的原因
2.1 调度型时序异常的原因
2.2 高速缓存中的时序异常
2.3 处理器组件中的时序异常
3. 验证与消除时序异常
3.1 反直觉型时序异常的自动验证
3.2 放大型时序异常的验证
3.3 乱序处理器的验证
3.4 消除反直觉型时序异常
3.5 时间语义对WCET分析的影响
3.6 时序异常的验证与消除小结
4. 总结与展望

1. 时序异常的定义
1.1 原始时序异常定义
1.2 反直觉型时序异常
1.2.1 原始定义的初步形式化
1.2.2 基于微操作的定义
1.2.3 基于执行trace的定义
1.2.4 基于因果关系的定义
1.3 放大型时序异常
1.4 有界时序异常
1.4.1 多米诺效应
1.4.2 k-有界的时序异常
1.5 并行时序异常
1.6 时序异常定义小结
2. 导致时序异常的原因
2.1 调度型时序异常的原因
2.2 高速缓存中的时序异常
2.3 处理器组件中的时序异常
3. 验证与消除时序异常
3.1 反直觉型时序异常的自动验证
3.2 放大型时序异常的验证
3.3 乱序处理器的验证
3.4 消除反直觉型时序异常
3.5 时间语义对WCET分析的影响
3.6 时序异常的验证与消除小结
4. 总结与展望

参考文献(117)

施引文献

资源附件(0)

深度学习模型供应链的安全性研究综述

通讯作者: 陈晋音（chenjinyin@zjut.edu.cn）

计量

出版历程

Security of Deep Neural Network Supply Chains: A Survey

1. 时序异常的定义

1.1 原始时序异常定义

1.2 反直觉型时序异常

1.2.1 原始定义的初步形式化

1.2.2 基于微操作的定义

1.2.3 基于执行trace的定义

1.2.4 基于因果关系的定义

1.3 放大型时序异常

1.4 有界时序异常

1.4.1 多米诺效应

1.4.2 k-有界的时序异常

1.5 并行时序异常

1.6 时序异常定义小结

2. 导致时序异常的原因

2.1 调度型时序异常的原因

2.2 高速缓存中的时序异常

2.3 处理器组件中的时序异常

3. 验证与消除时序异常

3.1 反直觉型时序异常的自动验证

3.2 放大型时序异常的验证

3.3 乱序处理器的验证

3.4 消除反直觉型时序异常

3.5 时间语义对WCET分析的影响

3.6 时序异常的验证与消除小结

4. 总结与展望

计量

出版历程

目录

1. 时序异常的定义

1.1 原始时序异常定义

1.2 反直觉型时序异常

1.2.1 原始定义的初步形式化

1.2.2 基于微操作的定义

1.2.3 基于执行trace的定义

1.2.4 基于因果关系的定义

1.3 放大型时序异常

1.4 有界时序异常

1.4.1 多米诺效应

1.4.2 k-有界的时序异常

1.5 并行时序异常

1.6 时序异常定义小结

2. 导致时序异常的原因

2.1 调度型时序异常的原因

2.2 高速缓存中的时序异常

2.3 处理器组件中的时序异常

3. 验证与消除时序异常

3.1 反直觉型时序异常的自动验证

3.2 放大型时序异常的验证

3.3 乱序处理器的验证

3.4 消除反直觉型时序异常

3.5 时间语义对WCET分析的影响

3.6 时序异常的验证与消除小结

4. 总结与展望

通讯作者:
陈晋音（chenjinyin@zjut.edu.cn）