一种基于在线蒸馏的轻量化噪声标签学习方法

黄贻望; 黄雨鑫; 刘声

doi:10.7544/issn1000-1239.202330382

一种基于在线蒸馏的轻量化噪声标签学习方法

黄贻望^{1, 2, 3, ,},
黄雨鑫^2,,
刘声^{1, 3}

1.
铜仁学院大数据学院　贵州铜仁　554300
2.
福建理工大学计算机科学与数学学院　福州　350001
3.
贵州省公共大数据重点实验室（贵州大学）　贵阳　550025

基金项目: 国家自然科学基金项目（62066040, 62261047）；贵州省公共大数据重点实验室开放基金项目（2018BDKFJJ011）；铜仁市科技局项目（铜仁市科研[2022]5号）

详细信息

作者简介:
黄贻望: 1978年生. 博士，教授，硕士生导师，CCF会员. 主要研究方向为人工智能、业务过程管理、软件形式化方法

黄雨鑫: 1998年生. 硕士研究生. CCF会员. 主要研究方向为计算机视觉、标签噪声处理

刘声: 1984年生. 博士，教授. 主要研究方向为信息处理

通讯作者:
黄贻望（yjsyhyw@gztrc.edu.cn）

中图分类号: TP181
计量
- 文章访问数: 188
- HTML全文浏览量: 19
- PDF下载量: 89
出版历程
- 收稿日期: 2023-05-14
- 修回日期: 2023-12-03
- 网络出版日期: 2024-05-16
- 刊出日期: 2024-11-30

A Lightweight Noise Label Learning Method Based on Online Distillation

Huang Yiwang^{1, 2, 3, ,},
Huang Yuxin^2,,
Liu Sheng^{1, 3}

1.
School of Data Science , Tongren University, Tongren , Guizhou 554300
2.
School of Computer Science and Mathematics, Fujian University of Technology, Fuzhou 350001
3.
Guizhou Provincial Key Laboratory of Public Big Data (Guizhou University), Guiyang 550025

Funds: This work was supported by the National Natural Science Foundation of China (62066040, 62261047), the Foundation of Guizhou Provincial Key Laboratory of Public Big Data (2018BDKFJJ011), and the project of Tongren Science and Technology Bureau (Tongren City Scientific Research [2022]5).

More Information

Author Bio:
Huang Yiwang: born in 1978. PhD, professor, Master supervisor. Member of CCF. His main research interests include artificial intelligence, business process management, and software formalization method

Huang Yuxin: born in 1998. Master candidate. Member of CCF. His research interests include computer vision and label noise learning

Liu Sheng: born in 1984. PhD, professor. His research interest includes information processing

摘要

摘要:
利用含有有损标签的噪声数据来训练深度学习模型是机器学习中的研究热点. 研究表明深度学习模型训练易受噪声数据的影响而产生过拟合现象. 最近，一种将元学习与标签校正相结合的方法能够使模型更好地适应噪声数据以减缓过拟合现象，然而这种元标签校正方法依赖于模型的性能，同时轻量化模型在噪声数据下不具备良好的泛化性能. 针对这一问题，本文结合元学习提出一种基于在线蒸馏的轻量化噪声标签学习方法KDMLC（knowledge distillation-based meta-label correction learning），该方法将深度神经网络与多层感知机构成的元标签校正（meta label correction，MLC）模型视为教师模型，对噪声标签进行校正并指导轻量化模型进行训练，同时采用双层优化策略训练并增强教师模型的泛化能力，从而生成更高质量的伪标签用于训练轻量化模型. 实验表明，KDMLC在高噪声水平下对比MLC方法准确率提高了5.50个百分点；同时对CIFAR10数据集使用Cutout数据增强，KDMLC在高噪声水平下对比MLC准确率提升了9.11个百分点，而在真实噪声数据集Clothing1M上的实验，KDMLC也优于其他方法，验证了KDMLC的可行性和有效性.
- 伪标签 /
- 标签校正 /
- 元学习 /
- 知识蒸馏 /
- 噪声数据
Abstract:
Training deep learning models with noisy data containing lossy labels is a hot research topic in machine learning. Studies have shown that deep learning model training is susceptible to overfitting due to noisy data. Recently, a method combining meta-learning and label correction can make the model better adapt to the noisy data to mitigate the overfitting phenomenon. However, this meta-label correction method relies on the model’s performance, and the lightweight model does not have good generalization performance under noisy data. To address this problem, we propose a knowledge distillation-based meta-label correction learning method (KDMLC), which treats the meta label correction model (MLC) composed of a deep neural network and a multilayer perceptron as a teacher model to correct the noise labels and guide the training of the lightweight model, and at the same time, KDMLC adopts a two-layer optimization strategy to train and enhance the generalization ability of the teacher model, so as to generate a higher-quality pseudo-labels for training the lightweight model. The experiments show that KDMLC improves the test accuracy by 5.50% compared with MLC method at high noise level; meanwhile, using Cutout data enhancement on the CIFAR10 dataset, KDMLC improves the test accuracy by 9.11% compared with MLC at high noise level, and the experiments on the real noisy dataset, Clothing1M, also show that KDMLC outperforms the other methods, verifying that KDMLC is better than the other methods, which verifies the feasibility and validity of KDMLC method.
- pseudo labels /
- label correction /
- meta learning /
- knowledge distillation /
- noise data

HTML全文

软件系统是现代信息基础设施的重要部分，已经渗透到现代社会的方方面面. 软件系统的安全性与可靠性，不但保证了整个信息基础设施的稳定运行，更是关系到国计民生的重要课题^[1]. 近年来，随着万物互联时代的到来，物联网^[2]、区块链^[3-4]、边缘计算^[5]、函数即服务（function as a service，FAAS）^[6]等复杂多样的新型计算场景不断涌现，这些场景对高安全、高效率和可移植的通用二进制代码格式提出了更加迫切的需求，而传统的x86和A-RM等本地二进制格式、Java字节码^[7]和. Net^[8]等中间代码格式，由于其安全脆弱性、执行效率低或平台强依赖强等内在技术局限性，已经无法适应快速发展的新型计算场景的需求.

WebAssembly（Wasm^[9]）是为了适应万物互联时代日益复杂多样的程序运行场景而提出的一种安全、高效、可移植的二进制指令集体系结构和代码分发格式. 首先，Wasm通过在设计中引入强类型系统^[10]、软件故障隔离^[11]、安全控制流^[12]、线性内存^[13]等多种安全语言特性，保证了程序运行的安全性. 其次，Wasm采用基于栈式虚拟机的抽象指令集，并在设计中兼顾了空间占用与执行效率，使其能够充分利用各种平台上的硬件功能，实现了接近原生代码的高执行效率. 最后，Wasm是一种与高级语言和具体执行平台都无关的指令格式，并且依靠其丰富的语言生态，以及多种编译工具链与虚拟机的支持，Wasm程序可以快速部署到各种运行环境中，从而实现了良好的可移植性.

因其安全、高效、可移植的先进特性，Wasm已经在Web领域与非Web领域都得到了广泛应用. 首先，在Web领域，Wasm已经成为继HTML，CSS，JavaScript 后的第4个Web语言标准规范^[14]，并且已经得到所有主流浏览器的支持^[15]. 其次，在非Web领域，随着WebAssembly系统接口（WebAssembly system interface，WASI）^[16]技术的出现，Wasm程序可以通过调用本地函数直接与底层操作系统交互，这使得Wasm程序能够脱离浏览器，直接独立地运行在主机、云或者边缘计算环境中^[17-21]. 伴随着Wasm生态系统和应用领域的快速发展，Wasm有望在将来成为最重要的通用二进制代码格式之一.

虽然Wasm的重要设计目标是通过引入多种安全特性来保证和实现安全性，但是，已有关于Wasm安全的研究成果表明，Wasm的新特性也带来了全新的安全风险与攻击面，进而导致了新的安全问题^[22-24]. 由于这些安全问题遍布于Wasm生态系统的各个层面，并且该研究领域具有一定的前瞻性和新颖性，所以目前尚未有研究工作对Wasm安全的相关问题与研究进展进行系统的梳理、分析及总结，也尚未指出当前还存在的亟待解决的科学问题，并讨论未来可能的研究方向.

本文的研究目标是通过对Wasm安全研究领域的最新研究进展进行系统的研究、梳理、讨论和总结，提炼重点研究方向，提出关键研究问题，并探讨未来可能的研究方向和机会，从而为Wasm生态安全以及二进制安全研究领域的研究者提供有价值的参考.

为了对该领域的研究工作进行系统地调研、分析和总结，我们首先按照4个步骤收集并筛选自2017年以来（Wasm于2017年正式对外发布）正式公开发表的研究文献：1）使用Google学术搜索引擎，以及ACM，IEEE，Springer，CNKI等论文数据库；2）检索关键字，包括英文搜索引擎中的“WebAssembly security”和中文搜索引擎中的“WebAssembly安全”等；3）检索从2017年至今的全部文献；4）对按照1~3步骤检索得到的论文进行人工筛选和复核，筛选重要的研究论文，并总结该领域活跃的研究方向. 最终，我们通过筛选得到了共计42篇论文.

根据对文献的调研与分析结果，结合对Wasm安全特性的研究与分析，本文提出了Wasm安全威胁模型，系统总结了Wasm可能受到的14类重要安全威胁，并将这些安全威胁系统划分为高级语言支持、编译工具链、二进制表示和语言虚拟机4个层面，且对每一层面的安全威胁进行了详细讨论. 此外，本文将Wasm安全研究工作总结归纳为4个重要研究方向：1）安全实证研究，主要采用实证研究方法，针对高级语言支持、编译工具链以及二进制表示3个方面展开研究；2）Wasm漏洞检测与利用研究，主要采用程序分析、模糊测试、深度学习等技术，研究对Wasm安全漏洞进行静态或动态检测的有效技术，以及对Wasm漏洞的利用方法；3）Wasm安全增强研究，主要使用代码混淆、访问控制、硬件增强等技术，对Wasm程序及运行时进行安全增强；4）Wasm形式语义与程序验证研究，主要使用形式语义以及程序验证技术，对Wasm进行形式化语义描述以及程序属性证明. 本文对这4个方面的研究都进行了综述、深入分析和总结，指出了现有研究的不足和该领域亟待解决的科学问题，并展望了5个潜在的研究方向.

本文系统研究和总结Wasm安全相关研究进展，主要贡献有3点：

1）系统研究和总结了Wasm的核心安全特性，并首次提出了包括高级语言支持、编译工具链、二进制表示和语言虚拟机的4层安全威胁模型；

2）提出了Wasm安全研究的分类学，将已有研究划分为安全实证研究、漏洞检测与利用、安全增强、形式语义与程序验证4个热点方向，并对每个方向都进行了深入分析和总结；

3）指出了该领域亟待解决的重要科学问题，并展望了5个潜在的研究方向.

1. Wasm概述

Wasm是一种新兴的二进制指令集体系结构和代码分发格式，本节对其进行概述：首先介绍Wasm的历史、概况和生态系统；然后总结和分析Wasm的主要安全特性；最后对已有的Wasm安全研究工作进行概述和分类.

1.1 Wasm历史与概况

Wasm是一种新兴的、仍在快速演进和发展的二进制指令集体系结构和和代码分发格式. 2015年， Google和Mozilla团队正式提出Wasm的设计^[25]，通过吸收借鉴NaCl^[26]的沙箱执行和Asm.js^[27]的类型化等先进设计理念和实践经验，给Wasm确立了安全、高效、可移植的主要设计目标. 2017年，Firefox，Chrome，Safari，Microsoft Edge 这4大主流浏览器在Wasm的标准上达成共识，Wasm成为浏览器上的事实标准^[15]. 2018年，Wasm核心规范1.0版本正式发布^[28]，对Wasm进行了完整的形式化定义. 2019年，W3C正式宣布Wasm成为官方Web标准，这标志着Wasm成为继HTML，CSS，JavaScript之后的第4种Web语言^[14]. 同年，WASI^[29]的标准化工作正式启动，旨在为Wasm在Web领域之外的应用定义一种安全的官方标准. 2022年，Wasm核心规范2.0版本草案正式发布^[30]，该草案对Wasm进行了类型和指令扩展，旨在进一步增强Wasm的表达能力和提高其执行效率.

由于Wasm兼具安全、高效、可移植等先进特性，已经在Web领域和非Web领域都得到了广泛应用. 首先，在Web领域^[31]，目前所有主流浏览器都已经支持Wasm^[32]，并且，随着Wasm官方标准^[30]的完善，Wasm在Web领域内的应用已日趋完善和成熟. 其次，在非Web领域，随着WASI^[16]等新特性的引入，Wasm作为一种独立于高级语言以及硬件平台的通用二进制指令格式，已经被广泛应用到无服务器云计算^[33-36]、物联网和嵌入式设备^[20]、区块链^[37-38]、边缘计算^[17,19,21]、机器学习^[39]、游戏引擎^[40]等新型计算场景中. 可以预见，随着WASI相关标准的不断完善和增强，Wasm将会在更多领域得到广泛应用.

1.2 Wasm生态系统

随着Wasm核心规范的不断完善和在应用领域的不断拓展，Wasm已经构建了一个完整而强大的生态系统. 本文认为，Wasm的生态系统可划分为4个层面：高级语言支持、编译工具链、二进制表示以及语言虚拟机. 图1给出了Wasm生态系统4个层面的划分，以及每个层面中应用较为广泛和典型的技术.

图 1 Wasm生态系统概况

Figure 1. Overview of Wasm ecosystem

下载: 全尺寸图片幻灯片

1.2.1 高级语言支持

Wasm作为一种通用编译目标，正在得到越来越多高级语言的支持. 尽管Wasm发布的时间不长，但目前已经成熟稳定地支持C/C++，Rust，Go，Python，TypeScript等10余种高级语言^[41]，这些语言涵盖了系统编程、数据科学、云计算、人工智能和Web等广泛的领域. Wasm不仅为这些语言提供了通用编译目标，其先进特性也进一步增强了高级语言的功能. 例如，对于Python程序，开发者可以将热点模块编译为Wasm来运行，从而利用Wasm高效率的特性来显著提升Python应用程序的执行效率^[42].

但另一方面，不安全的高级语言（如C/C++等）很容易导致程序出现安全漏洞^[43-44]；而安全的高级语言，也可能包含不安全的语言子集（如Rust中的unsafe机制^[45]）或包括不安全的外部函数接口（如Python的Python/C接口^[46]）等. 高级语言层的这些安全漏洞或脆弱性，会进一步传播到Wasm生态系统的其余各层，威胁到整个Wasm生态系统的安全性.

1.2.2 编译工具链

编译工具链将各种高级语言编写的高层源程序，高效正确地编译为等价的底层Wasm目标程序. 目前，支持C/C++，Rust，TypeScript，Go等高级语言到 Wasm的编译工具链Emscripten^[47]，Rustc/Wasm-bin-dgen^[48-49]，AssemblyScript^[50]，TinyGo/LLVM^[51]等已经得到了广泛应用，并且仍在快速迭代中.

但另一方面，由于高级语言与Wasm在类型系统、内存模型、并发编程机制等方面有显著差异^[10-13]，因此将高级语言程序编译为安全、高效、等价的Wasm程序是编译工具链设计面临的一大挑战. 不正确或包含漏洞的Wasm编译工具链不仅可能改变编译后目标程序的语义，甚至可能引入安全漏洞^[22]，对Wasm生态系统安全造成威胁.

1.2.3 二进制表示

Wasm的二进制表示规定了指令集体系结构定义和二进制格式规范. Wasm的二进制表示主要包括4个组成部分：Wasm 核心规范^[30,52]、Wasm Web接口^[53]、Wasm JavaScript接口^[54]和Wasm系统接口WASI^[16]. Wasm的二进制表示充分吸收借鉴了底层安全语言设计的理论成果和实践经验^[7,26-27]，在规范和接口定义中大量使用了严格的形式化理论和方法^[55]，这为Wasm实现其安全性的设计目标奠定了坚实基础.

但另一方面，为追求极致运行性能，Wasm在二进制表示中舍弃了许多重要的安全防御机制. 例如， Wasm不提供金丝雀等栈溢出检查安全机制，这可能进一步导致缓冲区溢出漏洞^[24]. Wasm二进制表示中重要安全机制的缺失，给二进制程序带来了易被利用的攻击面，进而给整个Wasm生态系统带来严重的安全威胁^[43-44].

1.2.4 语言虚拟机

作为一种虚拟指令集体系结构， Wasm程序运行在Wasm语言虚拟机上. Wasm虚拟机包括字节码编译、内存管理、接口实现等重要组件，负责执行Wasm 程序并和执行环境交互. Web领域的Wasm虚拟机，如Google V8^[56]，SpiderMonkey^[57]等，已经实现了对Wasm的完整支持. 而随着WASI接口规范的推出和完善，在区块链、物联网等非Web领域也涌现出一系列的Wasm虚拟机实现^[58]，包括 WasmEdge^[21]，EOS VM^[59]，WAMR^[60]，Wasmtime^[61]，Wasmer^[62]等. 这些语言虚拟机，对于Wasm生态系统起到了基础性支撑作用.

但另一方面，Wasm虚拟机也存在易被利用的攻击面. 首先，为追求极致执行性能，许多广泛使用的Wasm虚拟机用C/C++等不安全的语言实现，这容易导致虚拟机实现本身出现安全漏洞^[63]. 其次，Wasm虚拟机的实现还可能包括逻辑错误和漏洞，如机器码生成错误^[64]、沙箱逃逸^[65]等，这些错误和漏洞也对Wasm生态系统构成了安全威胁.

1.3 Wasm核心安全特性

Wasm作为底层字节码指令格式，充分吸收借鉴了安全语言设计^[7,66-67]及软件安全领域^[68]的最新研究成果，引入了一系列核心安全特性，在保证高执行效率的前提下实现了语言安全性. 这些核心安全特性包括强类型系统、安全控制流、软件故障隔离、线性内存等. 本节对Wasm的核心安全特性进行提炼和总结.

1.3.1 强类型系统

Wasm的初始设计^[55]就引入了静态强类型系统，并证明了该类型系统的类型安全性^[69]. 和已有类型系统相关研究相比，Wasm的强类型系统具有4个方面的技术特点和优势：1）Wasm的类型系统更加简单，这使得其安全性更容易保证和证明. 例如，和Java字节码^[7]等包括类和接口等特性的复杂类型系统相比，Wasm只有4种基本类型，即32位和64位整数（i32，i64）以及32位和64位浮点数（f32，f64）^[10]. 高级语言中的复杂类型都在编译阶段被编译为这类基本类型. 2）Wasm中的操作数栈具有确定的静态类型^[13]，类型检查的过程不涉及复杂耗时的类型推断^[70]，因此类型检查过程更加高效. 而已有研究，如类型化汇编语言（typed assembly language，TAL）^[66]或携带证明的代码（proof-carrying code，PCC）^[67]等，都需要维护变量的类型环境，类型检查过程相对复杂且低效. 3）Wasm的强类型系统强调在静态时完成程序的安全性检查，减少了非必要的运行时检查. 因此，与其前身Asm.js的弱类型系统^[27]相比，Wasm的强类型系统设计有助于在不牺牲安全性的前提下，进一步提高程序的执行性能. 而且，Wasm类型系统相对简洁的设计，令其更容易支撑各种不同抽象层级高级语言的编译^[47-51].

1.3.2 安全的控制流

Wasm引入了2个技术来实现控制流安全性：结构化控制流和控制流完整性检查.

1）结构化控制流. Wasm的控制流是结构化的^[71]，即引入了loop循环语句和if条件语句，而没有其他底层语言^[72]中常见的goto等非结构化控制流语句. Wasm的结构化控制流特性，保证其能够阻止经典的控制流攻击^[24]，最终实现控制流的安全性. 例如：经典的Shellcode注入^[73]攻击通过对二进制程序进行代码注入，从而使被攻击程序执行任意的恶意指令，而Wasm结构化控制流的设计，使得攻击者即使注入了恶意代码，也无法令控制流跳转到该代码，从而实现有效的安全防御.

2）控制流完整性检查. Wasm控制流完整性检查，包括直接函数调用检查、函数返回检查以及间接函数调用检查3个方面^[74]. 首先，Wasm直接函数调用检查通过函数索引空间^[55]中的索引来指定被调用函数并进行函数签名校验，如果函数签名不匹配，则该调用会触发校验异常并终止调用；其次，Wasm函数返回检查通过使用托管内存的调用栈，来保护函数返回地址；最后，Wasm间接函数调用检查通过在运行前对函数进行类型检查，保证了基于类型的粗粒度的控制流完整性.

1.3.3 软件故障隔离

软件故障隔离（software fault isolation，SFI）^[68]将存储、读取和跳转等指令沙箱化到独立的内存段，从而安全地运行不受信任的代码. Wasm在设计中采用了软件故障隔离技术，将每个模块都运行在沙箱环境中，Wasm代码与外部环境交互只能通过特定的WASI接口进行^[16]. 本文认为，Wasm采用基于沙箱的软件故障隔离技术，同时实现了安全性和高执行性能. 首先，该技术实现了沙箱内的 Wasm模块之间、沙箱和浏览器等宿主环境之间的隔离，有效提高了安全性；其次，Wasm沙箱都运行在同一进程中，有效降低了沙箱启动和切换的时间开销. Wasm 在安全和性能这2方面的优势，对于其在物联网^[20]和FAAS^[18]等领域的成功应用，起到了关键的支撑作用.

1.3.4 线性内存

Wasm的内存模型包括托管内存和线性（非托管）内存2部分. 托管内存由Wasm虚拟机直接管理，包括局部变量表、全局变量表等；而Wasm线性内存为专门存储Wasm程序中的变量开辟的一段按字节寻址的连续存储空间，其由辅助栈、堆和静态数据等组成^[30]. 作为示例，图2给出了一个由C程序编译得到的Wasm程序，以及该Wasm程序在Wasm虚拟机中执行时的内存模型. 首先，Wasm虚拟机在托管内存为Wasm程序建立全局变量表，其中存储了全局变量的地址，全局变量自身，如变量A的值则存储在线性内存中；其次，当函数被调用时，虚拟机在托管内存的局部变量表中给被调用的函数，如函数foo建立栈帧，栈帧包含了函数的参数，如参数a、函数返回地址等信息；同时，Wasm虚拟机在线性内存中的辅助栈中为被调用的函数也被分配1个栈帧，如函数foo的栈帧，该栈帧上存储了函数的所有局部变量，如变量b，c，buf等，特别地，函数参数也被拷贝到辅助栈的栈帧上，如参数a. 总之，Wasm通过对每个函数引入2个栈帧，将函数的返回地址和函数局部变量分别放置在托管内存栈帧和线性内存栈帧上，从而实现了二者的分离.

图 2 Wasm程序与内存模型

Figure 2. Program and memory model of Wasm

下载: 全尺寸图片幻灯片

Wasm线性内存的独特设计，实现了沙箱隔离、越界检查以及索引请求数据等3方面的安全保证^[55]. 首先，Wasm程序的线性内存是沙箱隔离的，它与其他Wasm程序的托管内存以及Wasm虚拟机的堆栈、操作数栈等数据结构相互独立，即Wasm程序不能破坏其执行环境、不能跳转到内存的其他任意位置或执行其他未定义的访存行为；其次，Wasm会动态检查所有内存访问，确保所有访问都不会越界（即不能超过max）；最后，Wasm程序不能直接访问线性内存中的数据，只能通过虚拟机向托管内存请求数据地址索引，再根据索引获取Wasm线性内存中的数据，这使得攻击者无法通过内存地址直接对线性内存中的数据进行修改.

1.4 研究框架

尽管Wasm引入了一系列安全特性，以期实现其安全性的设计目标，但是已有研究结果表明，Wasm仍然存在许多安全漏洞，而且这些安全漏洞来自 Wasm生态系统的各个层面，Wasm安全研究已经成为当前的研究热点. 本文基于对该领域已有研究的全面调研、深入分析和总结，提出了Wasm的安全威胁模型和对现有研究的分类方法学. 首先，本文将Wasm安全威胁模型分为4层，即高级语言支持、编译工具链、二进制表示和语言虚拟机，主要包括14类安全漏洞和攻击面. 其次，本文将已有Wasm安全研究总结凝练成4个大的研究方向：1）安全实证研究；2）漏洞检测与利用研究；3）安全增强研究；4）形式语义与程序验证研究.

这4个研究方向是Wasm安全研究的不同方面，同时它们又具有非常紧密的内在联系. Wasm安全实证研究的结果对于其他研究方向，包括漏洞检测与利用、安全增强和程序验证，都具有重要指导意义；根据Wasm安全实证研究的结果，可以提出有效的漏洞检测技术来发现并修复软件系统中的安全漏洞. 对于已知的安全漏洞，对应的安全增强技术可以阻止漏洞的发生，从而增强软件系统的安全性. 形式语义与程序验证技术通过严格的数学方法和证明来验证Wasm软件系统的安全属性或功能正确性，从而为软件系统提供更强的安全保证.

按照上述研究方向分类，表1给出了对已发表文献的分类统计. 通过对表中的数据进行分析得出：漏洞检测与利用研究的占比最高，达到 52.27%，而安全实证研究、安全增强研究和形式语义与程序验证研究的占比分别为9.09%，20.46%，18.18%. 在接下来的各节，本文将分别对Wasm安全威胁模型以及上述4个研究方向进行综述、深入分析和总结，指出现有研究的不足，并提出潜在的科学问题以及未来重要研究方向.

表 1 Wasm安全研究分类统计

Table 1. Classification Statistics of Wasm Security Research

研究方向	篇数	占比/%
安全实证	4	9.52
漏洞检测与利用	21	50.00
安全增强	9	21.43
形式语义与程序验证	8	19.05

下载: 导出CSV

| 显示表格

2. Wasm安全威胁模型

Wasm的新特性以及丰富的生态系统，为其引入了新的安全威胁和更大的攻击面. 基于本文提出的Wasm生态系统划分，Wasm的安全威胁模型也包括高级语言支持、编译工具链、二进制表示和语言虚拟机4个层面. 本节将详细分析这4个层面，共计14类主要安全漏洞. 详细的安全威胁模型和具体漏洞分布如表2所示.

表 2 Wasm安全威胁模型

Table 2. Security Threat Model of Wasm

威胁层面	安全漏洞	根因分析
高级语言支持	越界访问、	由高级语言的不安全特性引入，编译后得到的Wasm程序包含易被利用的漏洞.
	格式化字符串、
	整型溢出、
	释放后使用
编译工具链	内存分配器缺陷、	编译工具链无法对高级语言与Wasm的差异进行正确转换.
	类型转换错误、
	危险库函数
二进制表示	非托管栈溢出、	Wasm线性内存的必要安全检查缺失.
	非托管栈上的缓冲区溢出、
	堆元数据损坏、
	间接调用重定向
语言虚拟机	主机环境注入、	Wasm虚拟机或即时编译器的安全检查缺失或实现错误.
	侧信道攻击、
	沙箱逃逸

下载: 导出CSV

| 显示表格

2.1 高级语言支持

高级语言支持是Wasm生态中的重要组成部分，高级语言的不安全特性带来的安全问题，也会为Wasm引入安全威胁. 本文认为，高级语言支持对Wasm构成的安全威胁主要有2个来源：高级语言本身的脆弱性和代码漏洞. 本文将典型的由高级语言支持导致的安全漏洞划分为4类：越界访问漏洞、格式化字符串漏洞、整型溢出漏洞和释放后使用漏洞.

1）越界访问漏洞. 如果程序对内存的读写超过了合法的范围，则会导致越界访问漏洞. 由于C/C++缺乏必要的边界检查机制，极易出现由越界访问漏洞导致的安全问题. 图3展示了一个经典的越界访问漏洞，由于第4行缺少了边界检查，不安全的函数strcpy可以写越过数组b的边界，而将数据写入数组a中，并进而覆盖其他内存的数据. 而Wasm对C/C++的支持，使得C/C++程序中的越界访问漏洞成为Wasm生态中的一个严重攻击面^[24]. 攻击者可以利用越界访问漏洞，实现对Wasm非托管栈上的缓冲区溢出攻击，导致线性内存中的重要数据被覆盖. 越界访问漏洞的严重性主要体现在攻击者可以利用它作为起点，最终在Wasm中实现一系列端到端的高级攻击，如跨站脚本攻击、远程代码执行和任意文件写入等.

图 3 越界访问漏洞例子

Figure 3. An example of out-of-bounds access vulnerabilities

下载: 全尺寸图片幻灯片

2）格式化字符串漏洞. 如果攻击者能够控制格式化字符串的输入，则容易导致格式化字符串漏洞. 该漏洞可导致敏感信息泄露或被篡改、缓冲区溢出等安全问题. 高级语言程序中存在的格式化字符串漏洞，会导致Wasm线性内存中的数据发生泄露^[23]. 并且，由于Wasm的线性内存缺少必要的内存保护机制^[23]，格式化字符串漏洞会导致任意内存读写，从而引发更严重的后果.

3）整型溢出漏洞. 当整型运算的结果超过整型数的可表示范围，会导致整型溢出漏洞. 整型溢出除了影响运算结果本身的正确性外，还会进一步导致内存越界访问等其他错误^[75]，引发安全漏洞. 由于目前最新的Wasm的标准规范^[30]仍然缺少对整数运算的溢出检查保护机制，因此，高级语言程序中存在的整型溢出漏洞，在编译得到的Wasm程序中仍然存在，而Wasm程序中的整型溢出漏洞会进一步导致数据覆盖、缓冲区溢出等安全问题^[23].

4）释放后使用漏洞. 若程序访问一个已经被释放的指针，则会导致指针的释放后使用漏洞. 由于Wasm缺少了对指针的有效性检查，因此在高级语言程序中存在的指针释放后使用漏洞在Wasm中依旧存在^[76]. 一旦释放后使用漏洞被攻击者利用，则会引起重要数据破坏、内存块合并、任意地址写入等安全问题.

2.2 编译工具链

Wasm生态中丰富的编译工具链，实现了对多种高级语言的有效支持. 但是，Wasm本身的新特性及其与高级语言间的语义差异性，给Wasm编译工具链带来了独特挑战，并引入了新的安全问题^[22]. 本文认为，编译工具链给Wasm生态带来的安全漏洞和威胁主要包括3个方面：内存分配器缺陷、类型转换错误、危险库函数.

1）内存分配器缺陷. 由于Wasm的运行环境没有提供默认的内存分配器，因此Wasm编译工具链提供了特定的内存分配器支持. 但这类内存分配器的实现缺陷或漏洞，给Wasm带来了攻击面和安全威胁. 例如，Emscripten编译器基于dlmalloc内存分配器^[77]设计并实现了emmalloc内存分配器，但emmalloc对数据边界检查的缺失，导致如果一个堆块的数据发生溢出，会直接影响其相邻块的堆块^[24]，并引发内存安全漏洞^[78].

2）类型转换错误. Wasm编译器需要将源语言类型编译为Wasm支持的类型，而编译过程中引入的类型转换错误将导致安全漏洞和攻击面. 例如，JavaScript本身并不支持64位整型数，为了让Wasm程序调用JavaScript的库，Emscripten编译器需要将Wasm中的1个64位整型数转换为JavaScript中的2个32位整型数. 如图4^[22]所示，Emscripten为了绕过浏览器沙盒的文件读取限制，而提供了一个使用JavaScript实现的文件系统库FS，若在fseek()的执行路径中涉及到多个JavaScript模块代码，尽管第1个模块中导出函数的类型是64位整数，但中间的JavaScript函数不能接受该类型的参数，从而导致类型冲突错误^[22].

图 4 类型转换错误例子

Figure 4. An example of type coversion error

下载: 全尺寸图片幻灯片

3）危险库函数. 由于Wasm和高级语言特性间的差异性，编译工具链需要模拟提供一些特殊的库函数^[79]来实现Wasm不支持的操作，而这些库函数中的漏洞给Wasm带来了安全威胁. Wasm引入库函数中的安全漏洞包括隐式依赖、错误路径解析、数据截断等. 此外，目前的Wasm的官方标准中还不支持多线程并发机制^[15]，因此，为支持多线程而引入线程库也容易导致并发安全漏洞^[22].

2.3 二进制表示

虽然Wasm引入了许多新特性来保证安全性，但对这些新特性的不正确使用会导致安全漏洞和攻击面的出现. 本文认为，在二进制表示层面，Wasm安全漏洞主要包括4类：非托管栈溢出、非托管栈上的缓冲区溢出、堆元数据损坏以及间接调用重定向.

1）非托管栈溢出. 如图5所示，Wasm利用线性内存中的辅助栈（也称为非托管栈）^[30]完成函数调用，辅助栈的主要作用是存储Wasm函数中非基本数据类型的数据（即非32位或64位的整型和浮点型数据）. 辅助栈的空间从_heap_base开始，向低地址增长，一直到_data_end结束. 若非托管栈的地址空间占用超过可允许的最大范围（即Top < _data_end），则非托管栈发生溢出. 攻击者一般可通过2种方式造成非托管栈的溢出：一是控制栈分配变量的大小，导致其超过栈帧的最大允许范围；二是利用函数的过多或无限递归，导致非托管栈的空间用尽，进而发生溢出. 非托管栈溢出会覆盖栈外的全局数据或堆等其他数据区中的数据，这可以进一步导致堆溢出、关键数据被覆盖等其他安全漏洞^[24].

图 5 Wasm 线性内存面临的攻击面

Figure 5. The attack surface faced by Wasm linear memory

下载: 全尺寸图片幻灯片

2）非托管栈上的缓冲区溢出. 如图5所示，Wasm将函数中的缓冲区放置在非托管栈的栈帧上（假设在栈帧1上），若缓冲区发生溢出，则会覆盖本栈帧（即栈帧1）或相邻栈帧（即栈帧0）中的数据，甚至会覆盖除非托管栈外的其他内存区域中的数据^[24]. 和传统C/C++程序中的缓冲区溢出相比，对Wasm非托管栈上的缓冲区溢出进行检测和防护存在2个技术挑战：首先，由于Wasm缺少栈金丝雀^[80]等栈保护措施，使得检测非托管栈上的缓冲区溢出较为困难；其次，Wasm的线性内存缺少读写权限的细粒度保护，因此难以利用传统的栈不可执行等防护技术^[81].

3）堆元数据损坏. Wasm的内存分配器会在线性内存的堆中执行堆空间分配，分配的堆元数据中包括使用位、块大小等元信息. 如图5所示，Wasm堆元数据损坏是指堆上的元数据可能会因为数据的溢出而被更改或破坏，导致元数据错误或失效. 由于Wasm缺少堆元数据块间的边界检查，使得攻击者可以通过内存拷贝导致的数据溢出，损坏堆的元数据，进而实现任意地址写入等攻击^[24].

4）间接调用重定向. Wasm引入了间接调用函数索引表^[30]，以支持高级语言中的函数指针以及虚函数等特性，其典型结构如图6所示^[24]. Wasm中的间接调用重定向攻击是指攻击者可以通过覆盖线性内存中对应存储的索引号数据，使得间接调用指令call_indirect指向攻击者设定的恶意函数. 例如，在图6中，索引号offset=32所对应线性内存的数据由0被覆盖成了3，则其指向的函数索引表由第0个表项变成了第3个表项，则被调用的函数从func1重定向到了func2. 尽管Wasm会对间接调用做类型检查，但是如果被重定向到的函数参数类型和原函数一致，则会发生控制流劫持攻击，并导致执行恶意代码片段^[24].

图 6 间接调用重定向

Figure 6. Indirect call redirection

下载: 全尺寸图片幻灯片

2.4 语言虚拟机

Wasm在语言虚拟机层面的安全威胁主要来自2个方面：一是攻击者通过利用Wasm程序中的漏洞实现对主机环境的注入攻击；二是攻击者利用硬件与操作系统的漏洞，对Wasm虚拟机自身进行攻击. 本文认为，在语言虚拟机层面的Wasm安全漏洞主要包括3类：主机环境注入^[23-24]、侧信道攻击^[82]和沙箱逃逸^[83].

1）主机环境注入. 由于Wasm可以通过JavaScript接口或WASI^[16]与浏览器或主机环境进行交互，因此，攻击者可以利用Wasm模块与主机环境间的接口存在的安全漏洞来实现对主机环境的注入攻击. 例如，攻击者可以通过调用JavaScript的函数eval^[84]，实现对Wasm主机环境的代码注入^[24].

2）侧信道攻击. 攻击者通过分析加密算法所需的执行时间，来破坏加密系统完整性和可靠性的恶意攻击称为定时侧信道攻击^[82]. 如果Wasm虚拟机中缺少对程序的恒定时间执行的限制，则攻击者能够通过对Wasm虚拟机进行定时侧信道攻击以获取Wasm程序中的加密信息，造成重要信息的泄露.

3）沙箱逃逸. 攻击者可以利用特定的漏洞，使得Wasm程序能够脱离沙箱的限制，从而实现沙箱逃逸. 攻击者可以实现的典型沙箱逃逸是利用幽灵攻击^[83]，通过混淆硬件控制流预测的组件（条件分支预测、分支目标缓冲区等）来对沙箱边界外的代码进行推测执行访问. 同时，由于Wasm的每个模块都独立运行在同一个进程的沙箱之中，因此Wasm正在设计中的多线程特性^[15]也可能引发沙箱逃逸相关的安全问题.

2.5 本节小结

本节介绍了Wasm的安全威胁模型，该模型完整涵盖了Wasm生态系统的4个层面，即高级语言支持、编译工具链、二进制表示以及语言虚拟机；详细分析了这4个层面中共计14种典型安全漏洞. 通过研究和建立Wasm生态系统的安全威胁模型，研究者可以深入理解Wasm生态系统的脆弱点和安全风险，从而为系统开展安全实证、漏洞检测和安全增强等研究奠定基础.

3. Wasm安全实证研究

实证研究强调在观察和实验的经验事实上，通过经验观察的数据和实验研究的手段，来揭示一般结论、归纳事物的本质属性和发展规律. 对于Wasm这种新型的底层二进制代码格式，安全实证研究是Wasm安全研究的一个重要方向，通过对Wasm安全机理的理解和把握，分析漏洞形成的根因和潜在攻击面，从而为研究有效的漏洞检测与利用、安全增强、程序验证等技术奠定基础.

本文将现有Wasm安全实证研究分为3类：对高级语言支持、对编译工具链以及对二进制表示的研究，并对相关工作从研究内容、数据集、分析方法和主要结论等方面进行对比和总结，结果如表3所示. 本节将讨论Wasm安全实证研究的研究进展、已有成果和未来研究方向.

表 3 Wasm 安全实证研究工作总结分析

Table 3. Summary and Analysis of Empirical Studies on Wasm Security

研究内容	研究工作	研究数据集	分析方法	开源	主要结论
高级语言支持	Stiévenart等人^[43]	4469个具有缓冲区溢出漏洞的C程序	定量+定性	√	相同C程序对应的x86程序和Wasm程序的运行结果可能不同，其主要原因在于x86和Wasm在标准库的实现、所提供的安全保护机制和运行环境上存在差异.
高级语言支持	Stiévenart等人^[44]	17802个存在漏洞的 C程序	定量+定性	√
编译工具链	Romano等人^[22]	Emscripten的146 个Wasm相关漏洞报告	定量+定性	√	编译工具链中的漏洞主要来自高级语言与Wasm的同步机制差异、数据类型不兼容、内存模型差异等方面.
二进制表示	Hilbig等人^[85]	来自包管理器和实时网站的8461个Wasm 二进制文件	定量+定性	√	Wasm二进制表示层面的安全威胁主要来自不安全的高级语言特性、非托管栈的错误使用、不安全的外部接口等.

下载: 导出CSV

| 显示表格

3.1 对高级语言支持的实证研究

目前，Wasm已经成熟稳定地支持C/C++，Rust，Go等10余种高级语言. 通过实证研究可以了解高级语言程序中的漏洞对Wasm程序的影响，以及从高级语言编译到Wasm的过程中存在的安全威胁. 因此，实证研究的结果对于Wasm安全特性的不断完善和基础设施的不断演进具有重要指导意义.

为了研究高级语言程序中的漏洞对Wasm程序的影响，Stiévenart等人^[43]将4469个存在缓冲区溢出漏洞的C程序，分别编译为x86程序和Wasm程序，并对它们的运行结果进行对比. 实验结果表明：在4469个C程序中，有1088个程序对应的x86程序和Wasm程序的运行结果存在差异，即存在缓冲区溢出漏洞的x86程序在运行时会崩溃，而对应的Wasm程序仍会正常执行. 该研究还指出，导致运行结果差异的根本原因在于Wasm缺少栈金丝雀^[80]等安全保护机制.

为了进行更全面和深入的分析，Stiévenart等人^[44]又对上述研究进行了扩展，采用了更大的数据集，覆盖了更多漏洞类型，并对运行结果差异的根因进行了深入分析. Stiévenart等人^[44]从Juliet测试套件^[86]中选取了17802个C程序，并比较其对应的x86程序和Wasm程序的运行结果. 实验结果表明：测试集中有4911个C程序的运行结果不同，导致运行结果差异的原因可归纳为3类：1）x86程序使用的标准库与Wasm通过WASI^[16]使用的标准库之间存在差异；2）Wasm缺少x86中的栈金丝雀等安全保护机制；3）x86和Wasm的运行环境差异. 但是，该研究没有将不同漏洞类型对运行结果的影响进行区分，也没有从漏洞产生机理层面分析高级语言程序中的漏洞对Wasm程序的影响.

3.2 对编译工具链的实证研究

Wasm编译工具链需要处理不同高级语言与Wasm在类型系统、内存模型等方面的巨大差异^[10,13]. Wasm编译工具链的错误不仅可能改变源程序的语义，还可能引入安全漏洞，对Wasm生态系统造成安全威胁. 因此，对Wasm编译工具链的实证研究有助于深入理解编译工具链的错误，从而帮助编译器开发人员确定开发和测试工作的重点，促进Wasm编译工具链的完善和迭代.

为了分析Wasm编译工具链中漏洞的根因和影响，Romano等人^[22]首先对编译工具链Emscripten的146个Wasm相关漏洞报告进行了深入的定性分析，将导致这些漏洞的根因总结为9类：同步机制差异、数据类型不兼容、内存模型差异、其他基础设施错误、模拟本地环境错误、Web API支持错误、跨语言优化错误、虚拟机实现差异和不支持的原语. Romano等人^[22]还对AssemblyScript，Emscripten，Rustc/Wasm- Bindgen三个编译工具链中已报告的1054个漏洞进行了定量分析研究. 研究结果表明：部分错误报告没有包含关键信息，这导致调试和修复的时间开销增大；43%的漏洞会导致编译后的Wasm程序出现运行时错误，这些错误难以定位和修复.

本文认为，上述研究的主要不足在于深入定性分析所采用的研究目标和数据集规模较小，容易产生过拟合问题. 目前支持不同高级语言的Wasm编译工具链已有10余种^[41]，而上述研究^[22]只定性分析了面向C/C++的编译工具链Emscripten中的146个漏洞报告. 并且，在分析得到的漏洞根因中，同步机制差异、内存模型差异、不支持的原语等根因与C/C++的具体特性强相关，所以该研究提出的漏洞分类不适用于其他编译工具链和其他高级语言.

3.3 对二进制表示的实证研究

Wasm二进制表示的主要设计目标是在保证运行效率的前提下实现安全性，因此，对Wasm二进制表示的安全实证研究对于Wasm二进制安全特性的设计与演进具有重要指导意义.

为了探索Wasm二进制表示层面的潜在安全威胁，Hilbig等人^[85]从高级语言、安全属性等方面，对来自包管理器和实时网站的8461个Wasm二进制文件进行了实证研究. 该研究主要有5点重要发现：1）64.2%的Wasm二进制文件是从C/C++这类内存不安全的高级语言编译而来的，这类语言中的安全漏洞容易对Wasm二进制表示安全性构成威胁；2）约80.0%的二进制文件是通过LLVM工具链^[87]编译而来，因此，如果LLVM工具链对Wasm提供栈金丝雀这类安全保护机制，将有效提升Wasm二进制表示乃至整个Wasm生态系统的安全性；3）65.0%的二进制文件使用了非托管栈^[24]，攻击者可能会通过非托管栈对Wasm程序进行栈溢出等攻击；4）38.6%的二进制文件使用了自定义的内存分配器，引入了针对内存分配器的潜在攻击面；5）21.2%的二进制文件从主机环境导入了有潜在风险的接口，这可能会导致主机环境注入攻击.

本文认为，上述研究的局限性主要体现在2个方面：一是所使用数据集的覆盖面窄，仅来自包管理器和实时网站等Web领域；二是没有对潜在的安全威胁提出可行的解决方案. 鉴于Wasm已经在物联网、边缘计算、区块链等非Web领域得到了广泛应用，对Wasm二进制表示在这些领域面临的特有安全威胁进行深入的实证研究，将有助于推动Wasm在非Web领域的应用和发展.

3.4 本节小结

Wasm安全实证研究可以揭示Wasm威胁模型中各层面临的安全问题及其产生机理，其结果对于研究有效的漏洞检测技术、安全增强技术和程序验证技术具有重要指导意义. 目前Wasm安全实证研究主要针对高级语言支持、编译工具链和二进制表示，并且初步获得了有价值的发现. 但是，相关研究都存在数据集覆盖面窄、结论不具通用性等问题. 本文认为，随着Wasm的应用场景越来越广泛，针对Wasm的安全实证研究应该覆盖包括语言虚拟机在内的完整生态系统，同时还应该对Wasm语言特性与安全威胁的内在联系进行深入研究，提出对语言特性的最佳安全实践.

4. Wasm漏洞检测与利用研究

漏洞检测与利用是软件安全的重要研究领域，也是Wasm安全研究的重要方向. 目前已有大量针对Wasm安全漏洞的检测与利用研究，本节将对这一领域的研究成果和进展进行全面梳理和总结，深入讨论相关研究的局限性和未来研究方向.

4.1 漏洞检测

漏洞检测针对需要检测的程序和安全性质，采用程序分析、模糊测试等技术，来检测程序可能的状态和行为是否满足安全规范. 漏洞检测是提高软件安全性的重要手段，也是 Wasm 安全领域的重要研究方向.

Wasm作为一种底层二进制代码格式，与高级语言在语法、内存模型等方面有着显著不同，这使得传统的针对高级语言的漏洞检测技术和工具无法直接用于Wasm，这给Wasm漏洞检测研究提出了新的挑战. 本文对Wasm漏洞检测已有研究进行了全面、深入地分析，并按照检测技术将现有研究分为静态检测、动态检测和混合检测三大类，并对其中的代表性工作从检测技术、程序表示、漏洞类型、准确率、是否开源等方面进行了总结和对比，结果如表4所示.

表 4 Wasm 漏洞检测研究工作总结分析

Table 4. Summary and Analysis of Research Work on Wasm Vulnerability Detection

检测方法	主要技术	研究工作	具体技术	程序表示	漏洞类型	准确率/%	开源
静态检测	程序分析	Wassail^[88]	信息流分析+污点分析	控制流图		64	√
		Wasmati^[89-90]	数据流分析	代码属性图	内存安全漏洞	92.6	√
		VeriWasm^[91]	抽象解释	控制流图	内存安全漏洞	100	√
		MinerRay^[92]	控制流分析+语义分析	控制流图	加密劫持	99.3	√
		WANA^[93]	符号执行+执行信息分析	二进制程序	智能合约安全	100	√
	深度学习	MINOS^[94]	深度学习	二进制程序	加密劫持	99.0	×
动态检测	模糊测试	WAFL^[95]	模糊测试+虚拟机快照	二进制程序			√
		Fuzzm^[96]	灰盒模糊测试+金丝雀插桩	二进制程序	内存安全漏洞		√
		WASAI^[97]	混合模糊测试+符号执行	二进制程序	虚假转账	96.6	√
		WASMAFL^[98]	灰盒模糊测试+分层变异算法	虚拟机源程序			×
		WasmFuzzer^[99]	模糊测试+字节码变异算法	虚拟机源程序			×
	运行时特征分析	MineThrottle^[100]	重复执行指令序列分析	二进制程序	加密劫持	69.9	×
		CoinSpy^[101]	CPU、内存分析+深度学习	二进制程序	加密劫持	100	×
		MineSweeper^[102]	缓存行为分析+加密原语分析	二进制程序	加密劫持	100	√
	污点分析	Szanto等人^[103]	运行时污点追踪	二进制程序		100	×
	污点分析	TaintAssembly^[104]	运行时污点追踪	二进制程序	跨语言安全		√
混合检测		Wasabi^[105]	函数调用插桩+运行时分析	二进制程序			√
混合检测		EVulHunter^[106]	控制流分析+运行时检查	控制流图	虚假转账	86.0	√

下载: 导出CSV

| 显示表格

4.1.1 静态检测

静态检测是指在不运行Wasm程序的前提下，对程序进行抽象和建模，再通过分析程序的属性来完成漏洞检测. 本文将Wasm静态检测研究总结为2类：基于程序分析的静态检测和基于深度学习的静态检测，并对相关工作进行归纳总结和对比.

1）基于程序分析的静态检测

程序分析技术通过扫描程序或中间表示、对程序的运行流程进行抽象、构建程序状态的模型、推导程序可能的行为来获取程序的特征与属性，以检查程序的安全性或正确性. 现有基于程序分析的Wasm静态检测研究主要使用了控制流分析、数据流分析、信息流分析以及符号执行等技术.

Stiévenart等人^[88]提出了一个针对Wasm程序的信息流分析算法，该算法首先基于控制流图和调用图为Wasm程序的每个函数生成摘要，摘要描述了函数的参数、返回值和全局变量间的信息流信息，然后通过不动点算法获得Wasm全程序的信息流近似. 该研究实现了自动化的信息流分析原型系统Wassail. 实验结果表明：Wassail在56.13 s内完成了对196157行程序的分析，平均精度为64%. 本文认为，虽然该算法可以进行过程间分析，但是其本质还是一个粗粒度的信息流分析算法，因为函数摘要信息中没有包含所有函数执行期间的信息流，将导致一定程度的精度损失.

代码属性图^[107]是一种同时包含了抽象语法树、控制流图和程序依赖图的数据结构. Lopes等人^[89-90]基于代码属性图，提出了针对Wasm的漏洞检测框架Wasmati，其架构如图7所示. 首先生成Wasm二进制程序的代码属性图，然后通过查询规范语言遍历该代码属性图来检测程序中的安全漏洞. 该研究还对Wasm的代码属性图进行了形式化定义，实现了4种查询规范语言来完成对10种常见内存安全漏洞的查询. 实验结果表明：在已知漏洞集上，Wasmati的准确率达到92.6%；同时，Wasmati还在真实的Wasm二进制文件中发现了潜在的漏洞. 但是，Wasmati只能分析单个Wasm模块，而无法检测出由多模块交互和多语言交互产生的漏洞. 此外，Wasmati只能检测释放后使用、缓冲区溢出等具有通用错误模式的漏洞，难以检测特定场景下的漏洞.

图 7 Wasmati架构图

Figure 7. Architecture diagram of Wasmati

下载: 全尺寸图片幻灯片

为了检测Wasm程序中的内存安全错误，Johnson等人^[91]提出了一个基于抽象解释的漏洞检测框架VeriWasm. VeriWasm 通过对由 Wasm 编译得到的x86-64程序进行控制流分析来检测Wasm程序是否满足控制流安全、线性内存隔离、栈帧完整性和栈隔离等内存安全性质. 该研究还利用Coq定理证明器证明了VeriWasm的可靠性. 在119个Wasm二进制模块上的实验结果表明：VeriWasm可以有效检测出内存安全错误，每个模块的平均检测时间为8.6 s，没有假阳性. 本文认为，VeriWasm仍然存在3点不足：首先，它的检测结果依赖未经验证的反汇编器；其次，它采用的控制流分析算法难以扩展到大型的复杂函数，因此VeriWasm无法用于具有低延迟需求的实时应用；最后，分析算法特定于Lucet编译器^[108]，无法扩展到Wasm生态系统.

文献[88–91]都是针对Wasm二进制程序的通用程序分析框架. 针对Wasm在浏览器、区块链等特定应用场景中所表现出的独特错误模式，Romano等人^[92]提出了一个跨Wasm和JavaScript的静态程序分析算法，用于检测浏览器中的加密劫持攻击. 该算法首先将同时包含Wasm和JavaScript的程序统一转换为Wasm程序分析，判断程序是否具有与加密劫持攻击相匹配的语义. 该研究实现了检测工具MinerRay，对120万个网站的实验结果表明，该工具成功检测出901个遭受加密劫持攻击的网站. 本文认为，MinerRay主要存在2点不足：一是工具的鲁棒性不够高，MinerRay对于编码、混淆^[109]或加密后的程序无效；二是工具可扩展性较低，算法使用的自定义中间表示只支持Wasm和JavaScript，如果要支持新的语言，需要改变或重新设计中间表示.

智能合约漏洞检测通常针对特定平台，但是，主流智能合约平台EOSIO和以太坊对Wasm的支持为跨平台漏洞检测提供了可能性. WANA^[93]是一个基于符号执行技术的跨平台智能合约漏洞检测框架，该框架首先将EOSIO和以太坊智能合约编译为Wasm程序，然后基于对Wasm程序的符号执行完成漏洞检测. WANA还通过设置循环上限来缓解路径爆炸问题，从而提高执行效率. 实验结果表明，WANA在3964个合约中成功检测出了411个漏洞，平均检测时间为0.21 s. 本文认为，WANA的局限性主要体现在2个方面：首先，WANA适用范围有限，它只支持Wasm核心规范1.0的一个子集，不支持目前最新的规范2.0；其次，WANA分析范围有限，它只能分析单个模块，如果模块中存在对其他 API函数或模块外函数的调用，WANA只会根据返回值类型生成一个随机值，进而导致误报.

2）基于深度学习的静态检测

近年来，深度学习技术的快速发展和广泛应用为Wasm静态检测研究注入了新的活力. 基于深度学习的静态检测借助深度学习提供的数据挖掘能力，挖掘Wasm二进制代码蕴含的各种信息，包括控制流信息、数据流信息、依赖信息等，并使用深度学习模型进行漏洞检测.

MINOS^[94]是一个基于深度学习的轻量级加密劫持检测系统. MINOS首先将Wasm二进制程序转换为灰度图像表示，然后利用训练好的基于卷积神经网络^[110]的Wasm程序分类器对灰度图像表示进行分类，从而识别出存在加密劫持漏洞的Wasm二进制程序. 实验结果表明：MINOS从675个网站中成功检测出67个存在加密劫持的恶意网站，准确率达到 98.97%，平均检测时间为25.9 ms. 但是，MINOS只能检测针对浏览器端的加密劫持攻击，对于其他常见Wasm安全漏洞的深度学习检测模型的研究，是一个亟待探索的研究方向.

Wasm静态检测已有研究主要基于程序分析技术和深度学习技术，并且大多针对Wasm在区块链领域特有的虚假转账、加密劫持等安全威胁，以及由高级语言引入的常见内存安全漏洞. 而实际上，Wasm面临的安全威胁遍布整个Wasm生态系统. 本文在对已有静态检测研究进行深入分析后认为，未来有3个研究方向值得进一步探索：1）对更多Wasm安全漏洞类型的检测；2）对利用了WASI标准的程序，包括跨Wasm和高级语言的混合程序检测技术的研究；3）将程序分析和深度学习相结合的研究，即利用程序分析技术挖掘Wasm程序的显式特征，使用深度学习挖掘程序的隐式特征，将这2种特征相结合，形成互补，为程序的漏洞检测提供更加强有力的支撑.

4.1.2 动态检测

动态检测是通过为目标程序提供特定输入，观察程序运行时的行为通过分析程序的执行结果、异常行为和崩溃等信息，从而判断程序中是否存在漏洞. 对Wasm安全漏洞的动态检测研究主要使用了3类技术：模糊测试、运行时特征分析和污点分析.

1）模糊测试

模糊测试是一种重要的动态漏洞检测技术，其核心思想是通过为程序提供大量测试用例，在程序执行过程中监控异常行为，从而发现程序漏洞. 模糊测试技术已经被用于Wasm漏洞检测研究. 本文将基于模糊测试的Wasm漏洞检测研究总结为2类：针对Wasm二进制程序的模糊测试和针对Wasm虚拟机的模糊测试，并按此分类对现有工作进行梳理和对比.

①对Wasm二进制程序的模糊测试. WAFL^[95]是第1个针对Wasm二进制程序的模糊测试研究. WAFL利用模糊测试工具AFL++^[111]为目标程序生成输入，然后通过修改Wasm虚拟机来记录路径覆盖信息，最后通过虚拟机快照来保存内存状态，从而快速恢复虚拟机状态，提高执行效率. 实验结果表明，WAFL的执行效率超过了x86-64原生二进制程序，执行1次程序的平均耗时为55 μs. 本文认为，尽管WAFL通过虚拟机快照提升了执行效率，但是该研究仍然存在2点不足：一是WAFL的实现复杂，需要修改Wasm虚拟机，这限制了WAFL在不同虚拟机上的普适性；二是该研究没有在真实的Wasm应用程序上进行大规模实验，因此没有表明WAFL在真实的Wasm二进制程序上进行漏洞检测的有效性.

Fuzzm^[96]也是一个基于模糊测试的Wasm漏洞检测框架，不同于WAFL，Fuzzm主要检测Wasm内存安全漏洞. 由于Wasm不提供栈金丝雀等对缓冲区溢出的检查机制，Fuzzm首先向Wasm二进制程序中插入栈金丝雀，然后基于模糊测试工具AFL++ ^[111]为目标二进制程序生成测试用例，再使用Wasm虚拟机执行插桩后的代码. 在真实的Wasm二进制文件上的实验结果表明，Fuzzm在24 h内覆盖了1232条路径，触发了40个不同的程序崩溃，其中50.0%的崩溃由插入的栈金丝雀导致；插桩后程序的平均执行时间为原来的1.05~1.06倍.

文献[95–96]都是针对Wasm二进制程序的通用漏洞检测框架. Chen等人^[97]提出了一个针对Wasm智能合约的模糊测试框架Wasai. Wasai首先在Wasm二进制程序上进行插桩来记录程序的执行路径，然后使用EOSVM模拟器对程序进行符号执行，并通过构建函数模型和跳过冗余路径来缓解符号执行的路径爆炸问题. Wasai在已部署的991个Wasm智能合约上进行了实验，结果表明：超过70%的智能合约存在安全风险. 但是，Wasai为了获得了更大的吞吐量，限制了约束求解器的资源，进而影响了漏洞检测的准确率.

本文认为，对Wasm二进制程序的模糊测试研究都采用了类似的技术路线，即先基于现有模糊测试工具生成大量测试用例，再使用Wasm虚拟机来执行目标程序并进行漏洞检测. 但是，已有的相关研究都存在计算资源需求大、检测效率低等不足. 未来有2个可能的研究方向：一是通过针对具体漏洞设计插桩算法，来进一步提高检测效率；二是通过自动生成漏洞利用，来降低为定位漏洞而进行的手动分析程序异常的成本.

②对Wasm虚拟机的模糊测试. 林敏等人^[98]提出了对EOS的Wasm虚拟机进行模糊测试的方案WASMAFL. 如图8所示，该方案提出了分层变异算法，用于生成合法测试用例，算法首先通过对Wasm文件的分解、对模块间的组合和修改来进行高级结构层面的变异，然后通过改变初始化数据、打乱指令序列来进行代码段层面的变异，使得测试用例能够覆盖更多的路径. WASMAFL是基于AFL实现的Wasm模糊测试工具，实验结果表明：WASMAFL在24 h内覆盖了3153条程序执行路径，触发了258个程序崩溃，成功发现了2种段类型错误.

图 8 WASMAFL 架构图

Figure 8. Architecture diagram of WASMAFL

下载: 全尺寸图片幻灯片

WasmFuzzer^[99]也是一个针对Wasm虚拟机的模糊测试框架. WasmFuzzer提供了1组变异算子，用于在不同粒度上系统地变异Wasm模块，还设计了一种自适应的变异策略，可以为不同的Wasm虚拟机寻找最佳变异算子. 实验结果表明，WasmFuzzer在3个Wasm虚拟机上共计触发了235个崩溃，在路径覆盖率和触发程序崩溃方面都优于AFL.

现有针对Wasm虚拟机的模糊测试研究的重点都集中在测试用例生成阶段. 有效的测试用例不仅需要具有良好的脆弱性导向，还需要具有高路径覆盖率，才能有效提高漏洞检测的针对性和效率. 本文认为，未来一个重要的研究方向是将模糊测试与深度学习技术紧密结合，先使用Wasm程序训练深度学习模型，再利用模型来指导高质量的测试用例生成，缓解模糊测试中常见的路径爆炸和盲目性问题.

2）运行时特征分析

在区块链领域，加密劫持是指攻击者在未经所有者授权的情况下，利用其设备的计算能力来挖掘加密货币. 由于Wasm的高执行效率以及浏览器缺少对恶意Wasm代码的防护能力，近年来，Wasm已经被广泛用于加密劫持攻击，严重影响Wasm生态安全^[112]. 运行时特征分析是一种通过分析Wasm程序的运行时行为，提取与安全漏洞相关的运行时特征，从而进行漏洞检测的技术. 目前已经有许多基于运行时特征分析的Wasm加密劫持检测研究.

Bian等人^[101]提出通过对用于加密劫持的Wasm 程序的执行序列进行分析，确定可能存在加密劫持攻击的指令子序列模式，再通过模式匹配进行检测的技术. 并开发了一个基于该技术的运行时特征分析工具MineThrottle，对正在进行加密货币挖掘的Wasm程序进行实时安全检测. MineThrottle在Alexa排名前100万的网站中成功检测出109个存在加密劫持的网站. 在这个方向的工作中，CoinSpy^[101]是一个结合CPU、内存、网络行为分析和深度学习的Wasm加密劫持检测框架；而MineSweeper^[102]则通过分辨Wasm程序的加密原语和运行时的缓存行为来检测加密劫持.

3）污点分析

污点分析技术通过对程序的敏感数据进行标记，并且跟踪被标记数据在程序执行过程中的传播，从而实现精确的数据流分析，来发现软件系统中存在的安全问题. 污点分析技术已经被用于Wasm漏洞检测.

Szanto等人^[103]设计并实现了一个Wasm污点追踪系统，该系统通过为内存中的每个变量设置一个污点标记，来追踪敏感数据在程序运行时的流动. 此外，该系统还引入了间接污点来表示局部变量之间敏感信息的隐式流动. 实验结果表明：该污点追踪系统引入的额外时间和内存开销是线性有界的. 但是，该系统只支持Wasm的一个子集，不支持浮点数计算、导入等常见Wasm操作，因此，该系统在实际生产环境中的可用性有待进一步研究.

文献[103]只能对Wasm程序进行污点追踪，而在实际应用中Wasm程序常常需要与JavaScript程序交互. 虽然Wasm的沙箱运行环境提供了安全保证，但是Wasm与JavaScript的交互仍然会引入安全威胁^[24]. TaintAssembly^[104]是一个检测跨Wasm和JavaScript的不安全行为的污点追踪系统. TaintAssembly通过为Wasm程序中的每个值增加一个污点标记来追踪Wasm和JavaScript之间的数据流. 实验结果表明，TaintAssembly增加了5%~12%的运行时开销. 本文认为，TaintAssembly仍存在3方面的局限性：首先，它的污点传播语义不完备，不包括比较操作符等常见操作；其次，污点追踪过程依赖于随机数生成，这使其不适用于计算密集型场景；最后，它没有为Wasm的线性内存实现有效的污点追踪.

4.1.3 混合检测

混合检测是一种将静态检测和动态检测相结合的漏洞检测技术，也被用于Wasm漏洞检测.

Wasabi^[105]是第1个基于混合检测的通用Wasm漏洞检测框架. 如图9所示，Wasabi首先进行静态插桩，将特定分析函数插桩到Wasm二进制程序；然后在程序运行时进行动态分析. Wasabi实现了8种分析，包括基本块分析、内存访问跟踪、调用图分析和污点分析等. 在计算密集型程序测试集和真实的Web应用程序上的实验结果表明：Wasabi引起的代码膨胀率为1%~742%，运行时开销增加了1.02~163倍. 本文认为，Wasabi主要有2点不足：一是最大运行时开销较大；二是不能进行Wasm和JavaScript的跨语言分析.

图 9 Wasabi 架构图

Figure 9. Architecture diagram of Wasabi

下载: 全尺寸图片幻灯片

EVulHunter^[106]是一个基于程序分析和运行时检查的EOSIO智能合约虚假转账漏洞检测框架. 它首先解析EOSIO合约的Wasm程序生成控制流图，然后基于控制流图和预定义的漏洞模式进行程序分析来检测合约中的虚假转账漏洞. 为了进行更精确的分析，它还需要与Wasm虚拟机交互来获取运行时信息. 实验结果表明：EVulHunter的检测准确率达到86%，且检测时间随合约规模的增大线性增长. 但该研究仍然具有3方面的局限性：首先，EVulHunter不具普适性，目前只能针对某一类漏洞，而无法适用于其他类型的漏洞；其次，系统没有在大量的真实合约上进行实验，无法证明EVulHunter在实际的生产环境中的可用性；最后，系统的运行时检查带来了可观的额外时间开销.

4.2 漏洞利用

漏洞利用是指通过分析程序的漏洞信息，绕过系统的安全防护机制，生成漏洞利用代码来获取目标计算机系统的控制权限，最终达到实现软件的非预期功能的目的.

尽管Wasm引入了沙箱隔离等特性来保证安全性，但是由于Wasm缺少栈金丝雀、内存权限防护等漏洞缓解机制，Wasm程序中仍然可能会出现缓冲区溢出、栈溢出等漏洞，攻击者可以利用这些漏洞来实现攻击. 本节将对现有Wasm漏洞利用研究进行梳理和总结.

McFadden等人^[23]对主流Wasm编译工具链Emscripten的漏洞缓解措施进行了研究，研究结果表明，Emscripten为Wasm程序提供了控制流完整性检查、堆保护等安全机制来缓解常见的控制流劫持等攻击. 该研究进一步总结了Wasm中仍然可能存在的3类安全漏洞，包括整数溢出、格式化字符串攻击和基于栈的缓冲区溢出. 该研究还利用Wasm的间接函数调用、缓冲区溢出漏洞实现了服务端的远程代码执行攻击和浏览器端的跨站脚本攻击.

Lehmann等人^[24]对Wasm二进制安全进行了深入研究，研究结果表明，由于Wasm的线性内存缺少页保护标记、栈金丝雀等安全防护机制，所以在Wasm二进制表示层面可能存在缓冲区溢出、栈溢出和堆元数据损坏等漏洞. 在此基础上，该研究提出了3种攻击原语，包括任意内存写入、重写安全相关数据以及通过转移控制流和操作主机环境，来触发恶意行为. 进一步，该研究还利用这些攻击原语在不同主机平台上实现了3种端到端攻击：浏览器上的跨站脚本攻击、Node.js上的远程代码执行攻击和虚拟机上的任意文件写入攻击. 该研究证明由于Wasm中缺少对常见漏洞的缓解措施，攻击者可以利用漏洞实现对Wasm的真实攻击.

漏洞利用是安全研究的重要方向，通过理解漏洞被利用的根因，可以制定相应的安全防护方案，提高软件安全性. 现有研究表明，在Wasm的编译工具链和二进制表示层面都存在可以被利用的漏洞，并且已有相关研究利用这些漏洞在Wasm的不同应用领域实现了攻击. 本文认为，一个重要的未来研究方向是Wasm自动化漏洞利用研究. 通过自动生成漏洞利用代码和补丁，实现对Wasm软件系统的自动漏洞修复和积极防御，缩短漏洞的生命周期，增强软件系统的安全性.

4.3 本节小结

漏洞检测与利用是软件安全领域的重要研究方向，也是Wasm安全研究中最活跃的方向，研究工作已经取得积极进展. 但是现有漏洞检测研究大多针对区块链领域的加密劫持和虚假转账等漏洞，而对于第2节中Wasm安全威胁模型涉及的重要安全漏洞，目前缺乏全面有效的检测技术. 同时，目前对于Wasm漏洞利用的研究局限于人工进行漏洞分析与利用，没有自动化漏洞利用相关研究. 随着Wasm应用领域的不断拓展，以及软件复杂性、漏洞类型与数量的不断增加，漏洞检测与利用也面临更大的挑战，因此，Wasm漏洞检测与利用是一个非常重要但仍亟待探索的重要研究方向.

5. Wasm安全增强研究

安全增强是安全研究的重要组成部分，对于程序中的安全漏洞，安全增强研究利用相关实证研究和漏洞检测研究的结果，通过在软件或系统中引入特定安全机制，增强软件系统的防御功能，防止或阻断漏洞的发生.

按照安全增强技术的应用时机，本文将已有的Wasm安全增强研究分为静态安全增强和动态安全增强两大类. 表5分别列出了其中的重要研究工作，对每项研究工作，本文从关键技术、运行时开销、能够应对的安全威胁、是否开源可用4个维度进行了全面对比.

表 5 Wasm 安全增强研究工作总结分析

Table 5. Summary and Analysis of Research Work on Wasm Security Enhancement

类别	研究工作	关键技术	运行时开销/%	应对的安全威胁	开源	研究进展总结
静态安全增强	CROW^[113]	代码多样化		代码破解	√	Wasm静态安全增强主要通过对Wasm核心特性和硬件辅助2方面设计安全策略来实现.
	Swivel^[114]	控制流一致性+硬件防护	3.3~240.2	幽灵攻击	√
	MS-Wasm^[115]	段式内存 + ARM MTE	35~60	内存安全问题	×
	Vassena^[116]	内存标记		内存安全问题	×
动态安全增强	Aerogel^[117]	访问控制	18.8~45.9	访问控制缺失	√	Wasm 动态安全增强主要通过利用运行时和硬件的安全特性来实现.
	SELWasm^[118]	自检、加解密、延迟加载	3.45	代码破解	×
	TWINE^[119]	Intel SGX	0.9~426.0	执行环境不可信	√
	WATZ^[120]	ARM TrustZone	0.02~5	执行环境不可信	√
	VeriZero^[121]	零成本软件故障隔离	22.5~25	上下文转换错误	√

下载: 导出CSV

| 显示表格

5.1 静态安全增强

目前Wasm静态安全增强研究主要用到了3种技术：1）通过对Wasm二进制程序直接进行改写和变形，以达到代码多样化的目的；2）通过对Wasm编译工具链的改写，在编译生成的代码中插桩保护代码，保证编译得到的Wasm程序的控制流安全以及实现软件错误隔离；3）通过使用硬件防护技术，保证Wasm程序的控制流安全及内存安全.

在Web应用场景中，Wasm程序以二进制形式分发到用户的浏览器中，因此，若攻击者发现了Wasm程序中的漏洞，则可以向下载了该二进制程序的所有用户发起攻击. 为解决这一攻击和防御间的不对称性挑战，Arteaga等人^[113]提出了CROW系统，用代码多样化技术^[122]来对代码进行静态变形，以实现对基于同一源代码分发的Wasm二进制代码的独特性目标， CROW的工作流如图10所示. CROW基于LLVM框架^[87]实现，依靠 Souper^[123]对LLVM字节码进行变形，并使用Z3约束求解器^[124]保证变形的语义等价性. 在303个C程序以及在libsodium^[125]上的实验结果表明：CROW能够有效对239个（79%）程序生成变体. 本文认为，该研究主要有3个方面的不足：首先，CROW只能用于源代码而无法直接用于 Wasm二进制代码；其次，CROW只对基于LLVM编译工具链的C/C++程序有效，而无法用于其他语言和编译工具链；最后，CROW无法在运行时对程序进行增强，因此难以用于诸如Chrome V8 TurboFan^[126]等主流的即时编译器中.

图 10 CROW的工作流

Figure 10. Workflow of CROW

下载: 全尺寸图片幻灯片

为了抵御针对Wasm的幽灵攻击^[83]，Narayan等人^[116]提出了一个基于编译器技术的静态安全增强框架Swivel. Swivel引入了2种防护技术：Swivel-SFI和Swivel-CET. Swivel-SFI使用了控制流一致性（control flow integrity，CFI）检查和软件错误隔离技术，即检查每条直接或间接跳转指令时，都只能跳转到基本块的开头. Swivel-CET使用Intel第11代CPU开始引入的2个最新的硬件防护机制：控制流强制技术（control enforcement technology，CET）和内存保护秘钥（memory protection key，MPK），CET用基于硬件的影子栈保证返回地址不被改写；MPK将内存划分为附加了不同保护秘钥的分区，这些分区具有不同的读写访问权限. 文献[116]修改了Lucet编译器^[108]中的Wasm到x86的代码生成器，并进行了实验. 实验结果表明：Swivel的运行时开销介于3.3%~240.2%之间. 本文认为，该工作主要有3点不足：1）该工作需要重写Wasm到具体二进制代码的编译器实现，以便引入基于软件和硬件的防御，工作量相对较大；2）硬件防护机制导致了可观的运行时开销，难以适用于性能敏感的应用场景；3）硬件防御技术需要使用Intel最新的硬件平台（即11代之后的最新CPU），因此无法实现对老硬件的向后兼容，也无法直接适用于非Intel架构的硬件.

由于Wasm缺乏数组边界检查等关键安全机制，导致Wasm程序易出现缓冲区等攻击面；并且，由于最新的基于硬件防护的机制，如Intel的内存保护秘钥和ARM的内存标记扩展（memory tagging extension，MTE）等，都需要使用数组的边界大小等信息，而Wasm中数组边界信息的缺失，使得相关研究很难利用这些最新的硬件安全防护机制. 为此，Disselkoen等人^[115]提出了MS-Wasm，即内存安全的Wasm，其对标准Wasm 的内存模型进行了扩展，引入了段内存的概念. 本质上，段内存标记了指针的基地址和界限等额外的元信息，从而使得Wasm虚拟机能够在运行时利用ARM的MTE等硬件机制，对指针的有效性进行安全检查. 和基于纯软件的防护技术^[127-129]相比，MS-Wasm不但保证了内存安全性，而且具有更低的运行时开销. 但本文认为，MS-Wasm的不足之处主要有2点：1）只在最新的具有特定硬件防护机制（如ARM）的平台上有效，不具有普适性；2）对Wasm的标准进行了扩展和修改，失去了和Wasm标准的兼容性，并且会进一步导致Wasm生态系统的碎片化.

受MS-Wasm设计的启发，Vassena等人^[116]提出一个以MS-Wasm为编译目标的可信编译器设计方案和思路. 但是，该研究并未给出具体的实现和实验结果，因此，无法评估该工作在实际中的有效性和运行开销.

本文认为，Wasm静态安全增强研究在2个方面亟待深入探索：1）对Wasm二进制通用表示的研究和构建，即研究针对Wasm的一套面向二进制的中间表示基础设施，这将极大方便在二进制层直接对Wasm进行操作和分析，给Wasm的静态安全增强提供保障；已有的在Java字节码^[130-131]等方向的研究为这一方向的探索提供了可行的思路；2）对Wasm编译工具链的安全增强和扩展，即扩展和增强目前的Wasm编译工具链^[41]，加入对控制流完整性、内存安全等特性的自动代码插桩的支持.

5.2 动态安全增强

目前Wasm动态安全增强的相关研究主要利用2种技术：1）通过在Wasm虚拟机中增加核心安全机制，如访问控制、代码加解密等，来增强Wasm虚拟机的安全防护能力；2）利用硬件的可信执行特性，如Intel的SGX^[132]技术等，为Wasm提供可信执行环境^[133].

尽管Wasm提供了进程内的沙箱隔离，但是没有提供细粒度的访问控制机制. 针对这一问题，Liu等人^[117]对物联网外围设备的访问控制这一问题进行了研究，提出了运行时访问控制框架Aerogel. Aerogel利用Wasm沙箱为物联网外围设备提供隔离，同时，基于领域专用语言和自定义配置文件的方式，对这些外围设备的功耗、处理器时间、内存消耗等进行控制. 在MCU开发板（nRF52840）上，基于QEMU模拟器^[134]进行的实验表明：Aerogel带来0.19%~1.04%的额外执行时间开销以及18.8%~45.9%的额外能耗开销. 本文认为，Aerogel在基于Wasm构建物联网设备的访问控制机制方面进行了有益的探索，但其较高的能耗消耗使其难以应用到边缘计算等应用场景中的低电量设备上；同时，Aerogel缺少了针对侧信道攻击的安全防御，无法防御针对内存的侧信道攻击^[24].

为解决Wasm代码在Web上分发时的代码保护和对抗逆向问题，Sun等人^[118]提出了运行时防护框架SELWasm，其包含3部分的核心机制：运行时执行环境检查、运行时代码加解密以及延迟加载. 本文认为，SELWasm的主要不足有2点：1）其加解密功能依赖于JavaScript实现，和浏览器形成了紧耦合，因此难以应用到独立的缺少JavaScript支持的Wasm虚拟机中；2）Wasm代码的加解密功能以及环境自检等功能的加入，显著增大了Wasm代码的规模（文献[118]中报告了最多4倍的增长），进而降低了执行效率.

为了支持分布式系统中的可信代码执行，Ménétrey等人^[120]提出了TWINE，TWINE利用Intel SGX ^[132]机制提供的可信执行能力^[133]，为Wasm虚拟机提供了可信执行环境. TWINE依赖于WAMR虚拟机^[60]，并通过WASI接口实现了与安全文件系统的交互，其架构如图11所示. 实验结果表明：基于TWINE实现的SQLite^[135]，与SGX-LKL^[136]中实现的SQLite平均性能开销接近. 本文认为，TWINE仍有3点不足：首先，由于Intel SGX缺少了对侧信道攻击的防护^[133]，因此TWINE上运行的Wasm程序仍可能遭受侧信道攻击^[82]；其次，由于Intel SGX 技术的加密特性带来的性能开销，TWINE的运行速度相比于WAMR虚拟机有一定差距；最后，TWINE的内存消耗可观（在部分测例上超过了80 MiB），这使得其难以用于物联网或边缘计算的小微型设备上.

图 11 TWINE 架构图

Figure 11. Architecture diagram of TWINE

下载: 全尺寸图片幻灯片

为了实现程序的安全远程执行，Ménétrey等人^[120]基于ARM TrustZone^[137]可信执行环境，设计并实现了轻量级的可信Wasm虚拟机WATZ. WATZ不仅利用ARM TrustZone提供了安全、高效的Wasm运行时环境，还集成了远程证明系统^[138]，可以在Wasm程序执行前进行验证和优化，从而在远程执行中为共享密钥等机密数据提供安全保证. 实验结果表明：在物联网设备上，WATZ与Wasm虚拟机WAMR^[60]的性能开销接近. 本文认为，虽然WATZ具有的高执行效率、低内存占用的特性，但ARM TrustZone 缺乏了对易失性内存数据的保护，因此也可能会遭受来自硬件的攻击^[83]或侧信道攻击^[82].

Wasm采用软件故障隔离技术来将Wasm程序运行于沙箱环境中，但Wasm程序与主机环境交互时的上下文转换是易错的且开销较大. 为了实现安全的零成本软件故障隔离^[68]，Kolosick等人^[121]提出了一个安全的零成本上下文转换模型，该模型通过良好的控制流来保证机器状态转换的机密性和完整性，确保程序返回到真实的调用点，同时对零成本转换条件进行了精确的形式化定义. 该研究通过修改Wasm编译器和虚拟机实现了一个零成本验证器VeriZero，可以有效检查Wasm程序是否满足模型的要求. 实验结果显示：VeriZero将Firefox的图像解码和字体渲染速度分别提升了29.7%和10%. 但是，该研究仍然存在局限性：VeriZero不支持用户定义的可变函数参数，也不支持JIT编译.

本文认为，Wasm动态安全增强研究还可以在2个方向加强探索：1）除了已有研究使用的SGX和TrustZone等技术外，还可以将其他提供可信执行环境的硬件特性，如AMD SME^[139]，RISC-V Keystone^[140]等用于Wasm安全增强；2）研究针对侧信道攻击的动态安全增强技术.

5.3 本节小结

安全增强是提升Wasm程序安全性的重要手段，也是Wasm安全研究的重要目标. 已有研究利用代码多样化、代码插桩等技术，实现对Wasm程序的静态安全增强；通过向Wasm虚拟机增加安全防护机制以及利用硬件的可信执行环境等特性，实现对Wasm程序的动态增强.

6. Wasm形式语义与程序验证研究

Wasm形式语义与程序验证研究是Wasm安全领域的热点方向. 形式语义与程序验证研究和Wasm语言安全研究的其他方向具有紧密联系：对于Wasm中可能存在的安全漏洞和缺陷，可以通过为其定义严格的形式语义来证明Wasm语言设计的可靠性；而对于经过漏洞检测和安全增强的Wasm软件系统，可以利用程序验证技术来进一步严格证明其安全性或功能正确性.

本节将对现有形式语义和程序验证相关工作从发表时间、验证技术、验证工具、被验证的性质、实验数据集和是否开源等方面进行分析对比，结果如表6所示. 本节将对2类研究分别进行梳理和总结，并讨论现有工作的不足以及未来可能的研究方向.

表 6 Wasm 形式语义与程序验证研究工作总结分析

Table 6. Summary and Analysis of Research Work on Wasm Formal Semantics and Program Verification

研究类别	研究工作	发表时间	验证技术	验证工具	被验证的性质	实验数据集	开源
形式语义	Haas等人^[55]	2017-06			执行时间	PolyBenchC	√
	Watt^[141]	2018-01	演绎推理	Isabelle^[142]	类型系统可靠性		√
	Wasm Logic^[143]	2018-11	一阶逻辑推理	Isabelle	控制流安全	WebAssembly B树库	×
	CT-Wasm^[144]	2019-01	演绎推理	Isabelle	信息流安全	加密算法库	√
	Watt等人^[145]	2019-10	约束求解		SC-DRF		×
程序验证	Sjölén^[146]	2020-09	关系符号执行	Z3	恒定时间安全	Salsa20	√
	Vivienne^[147]	2021-09	关系符号执行	Z3，CVC4	恒定时间安全	加密算法库	√
	WASP^[148]	2022-06	混合执行	Z3	功能正确性	B树库、加密库	×

下载: 导出CSV

| 显示表格

6.1 Wasm形式语义研究

形式语义^[149]是以数学为方法和工具，形式化地定义和解释程序设计语言语义的学科. Wasm形式语义研究可以通过对Wasm语义的形式化定义指导语言设计，为Wasm程序验证奠定基础. 本节将按照时间顺序和相关研究之间的承接关系，梳理并总结Wasm形式语义研究及其发展脉络.

Haas等人^[55]进行了Wasm形式语义的奠基性研究，该研究讨论了Wasm的设计理念，并形式化定义了Wasm的类型系统和操作语义. 该研究还从执行时间和二进制代码大小2个方面将Wasm代码和原生代码进行对比. 结果表明：Wasm代码的执行时间与原生代码的差距在10%以内；Wasm代码大小平均是x86-64代码大小的85.3%. 但是，该工作存在2点不足：1）形式语义模型不完备，例如，模型中没有讨论 Wasm与主机环境的交互；2）没有对Wasm类型系统的可靠性进行严格的机械化证明.

为了解决上述研究的局限性，Watt等人^[141]提出了完整的Wasm形式化语义模型，并证明了Wasm类型系统的可靠性. 研究结果表明，Wasm最初官方规范里的类型系统并不可靠，可能导致异常传播、函数返回错误以及主机函数与Wasm程序交互崩溃3类严重错误. 这些设计缺陷已经报告给Wasm工作组并被成功修复. 本文认为，随着Wasm语言设计的不断演进，Wasm规范中增加的零成本异常、并发机制、单指令多数据流指令等新特性，对Wasm形式化模型的扩展和安全性证明提出了新的需求和挑战，是一个重要的未来研究方向.

随后，Watt等人^[143]又提出了第1个针对 Wasm的程序逻辑Wasm Logic，该研究基于Wasm的栈式抽象机器操作语义和强类型系统设计了一种新的断言语法，并且通过扩展分离逻辑三元组和证明规则来证明Wasm程序的控制流安全. 本文认为，该研究仍然存在2点局限性：1）Wasm Logic只能处理单个模块，对于多个模块的处理需要修改程序逻辑；2）Wasm Logic只支持一阶Wasm程序推理，因此无法处理跨语言交互等需要高阶推理的操作.

为了将Wasm用于安全加密算法实现，Watt等人^[144]提出了对Wasm的扩展系统CT-Wasm. CT-Wasm扩展了Wasm的类型系统和语义，通过把密钥等安全数据与普通数据在类型级别上进行严格区分，来抵御侧信道攻击，保证信息流安全. 实验结果表明，CT-Wasm可以有效防止信息泄露，并且额外性能开销低于1%. 本文认为，该工作主要存在2点不足：1）实际使用中，需要先验证CT-Wasm程序的安全性，再重写为Wasm来执行，这导致CT-Wasm在实际使用中比较复杂；2）Wasm虚拟机的优化策略可能会破环CT-Wasm的安全保证.

为了支持并发程序到的Wasm的正确编译，Watt等人^[145]对Wasm的形式化模型进行了并发扩展. 首先，该研究定义了Wasm并发扩展的形式语义，包括线程、原子操作、引用和可变表等；其次，该研究提出了一个弱内存模型，并证明了内存模型对于无数据竞争程序的顺序一致性（sequentially consistent for data race free，SC-DRF）^[150]. 本文认为，该研究提出的Wasm并发模型是基于共享内存的，对于其他并发模型的Wasm扩展将是一个重要的未来研究方向，尤其是，对于边缘计算领域的通信顺序进程（communicating sequential processes，CSP）^[151]的Wasm并发扩展，是一个亟待研究的问题.

现有Wasm形式语义研究致力于对Wasm的语义进行抽象和严格定义，并进行安全性的严格证明，从而为Wasm程序验证和分析奠定基础. 随着Wasm核心规范的不断扩展^[15]，对Wasm新特性的形式语义研究将会成为一个重要的未来研究方向，有助于进一步推动Wasm在各领域的广泛应用，促进Wasm生态系统的繁荣发展.

6.2 Wasm程序验证研究

程序验证^[152]基于严格数学方法，验证程序是否符合预期的设计属性和安全规范. 程序验证在形式语义和形式规约的基础上，将程序的分析和验证问题转化为逻辑推理问题或形式模型的判定问题，利用定理证明器^[142,153]或者约束求解器^[124]来进行验证. 本节将按照时间顺序梳理并总结程序验证相关工作.

Sjölén^[146]开展了基于关系符号执行技术^[154]的Wasm程序验证研究. 该研究实现了一个Wasm关系符号解释器，并定义了解释器的形式语义. 实验结果表明：解释器可以在59 s内完成对流加密算法Salsa20^[155]的恒定时间安全性验证. 本文认为，该研究所实现的解释器难以成为通用的Wasm程序验证工具，其局限性主要体现在3个方面：1）解释器只能验证恒定时间安全性，无法验证其他Wasm安全性质或功能正确性；2）解释器能够处理的Wasm 语法不完备，需要对Wasm的类型、函数调用等进行简化或移除；3）所采用的实验数据集规模较小且结构简单，因此实验结果只能代表解释器在最理想情况下的表现.

随后，Tsoupidi等人^[147]也提出了一个基于关系符号执行的Wasm恒定时间安全验证框架Vivienne，其架构如图12所示. Vivienne接收Wasm模块、安全策略和入口函数作为输入，经过关系符号执行模块生成逻辑公式，并调用SMT求解器对逻辑公式进行求解，最后输出验证结果. 此外，Vivienne会尝试对循环生成不变量. 在57个真实的加密算法库上的实验结果表明：Vivienne能够在不重构代码的前提下，有效验证Wasm程序是否满足恒定时间安全，成功率达到96%且没有假阳性.

图 12 Vivienne架构图

Figure 12. Architecture diagram of Vivienne

下载: 全尺寸图片幻灯片

文献[146–147]都只能验证Wasm程序的恒定时间安全. 为研究通用的Wasm符号执行框架，Marques等人^[148]将符号执行与具体执行相结合，设计并实现了一个Wasm混合执行框架WASP. 对于带有功能标注的Wasm程序，WASP按3个步骤进行混合执行：首先，WASP解析Wasm二进制文件，生成抽象语法树传递给混合执行解释器；其次，混合解释器执行程序指令，记录具体执行和符号执行状态，并成相应的路径条件；最后，混合执行结束时，WASP调用Z3求解器进行命题求解和程序验证.

现有Wasm程序验证主要基于符号执行技术来验证恒定时间安全和功能正确性. 本文认为，在该领域有2个重要的未来研究方向：1）将定理证明、模型检测和抽象解释等其他程序验证技术用于构建面向Wasm的通用程序验证框架；2）通过将多技术深度融合提出Wasm自动化程序验证工具，例如将插值技术和可满足性模理论结合、将抽象解释和模型检测结合等，在现有技术的基础上提出可配置的程序验证框架，并在框架中集成多种验证技术和求解器，从而提高框架的可扩展性和验证能力.

6.3 本节小结

形式语义与程序验证研究是严格证明Wasm语言设计的可靠性，以及证明基于Wasm构建的软件系统满足特定安全规范的重要基础. 本文认为，这个研究领域中有2个重要的未来研究方向：1）随着Wasm规范的演进和新特性的增加，对新规范和语言的新特性展开形式语义的研究；2）采用多种验证技术融合，进一步开展对Wasm程序的自动或半自动的程序验证研究. 随着Wasm的快速发展以及应用领域的快速扩展，这2个方向的研究都亟待开展.

7. 未来研究方向展望

随着Wasm的持续演进，及其应用领域的不断扩展，Wasm安全仍将是未来的热点研究方向. 通过系统梳理、分析并总结已有研究，本文认为，该研究领域还有5个重要的未来研究方向：对Wasm生态系统的安全实证研究；通用Wasm中间表示和程序分析框架的研究和构建；对Wasm程序漏洞的自动修复研究；对Wasm线性内存的安全增强研究；Wasm自动化程序验证研究.

1）对Wasm生态系统的安全实证研究. 安全实证研究可以为Wasm漏洞检测、安全增强等提供经验数据，对于Wasm安全研究的开展具有指导意义. 但是，现有实证研究只覆盖了高级语言支持^[43-44]、编译工具链^[22]及二进制表示^[85] 3个层面，且相关研究都存在数据集覆盖面窄、结论不通用等局限性. 因此，对包括语言虚拟机在内的Wasm全生态系统的全面、深入的安全实证研究是一个重要的未来研究方向. 未来针对Wasm实证研究不仅应该包括语言虚拟机在内的全生态系统，还应该覆盖物联网、边缘计算等Wasm的典型应用领域，同时对Wasm的语言设计与安全威胁的内在联系进行深入探索，提出Wasm的最佳安全实践，指导Wasm的持续演化.

2）通用Wasm中间表示和程序分析框架的研究和构建. 在Wasm安全研究中，通用的中间表示和程序分析框架起到关键作用，它们不但可以为漏洞检测研究提供基础、为Wasm动态和静态分析框架的构建提供核心能力，还可以为研究成果的持续积累和演进提供必要的基础设施支撑. 但已有研究尚未建立统一的中间表示和程序分析基础设施. 最近，Wasmati^[90]提出了一种融合抽象语法树、控制流图和程序依赖图的中间表示，这为Wasm程序分析基础框架的研究提供了新的可行思路. 但是，研究和构建面向Wasm的通用中间表示和程序分析基础设施，仍是一个非常有挑战性但亟待解决的研究问题.

3）对Wasm程序漏洞的自动修复研究. 研究表明^[156]，在现代软件开发中，漏洞修复成本占开发过程总成本的50%~70%. 因此，对程序漏洞的自动化修复研究，对于保证软件质量、提高软件开发效率有积极意义. 但是，目前并没有针对Wasm软件漏洞的自动修复研究. 一种可行的解决方案是借鉴已有漏洞修复理论和技术（如针对Java字节码^[72,157]的修复技术以及变异测试^[158]等），来研究和构建针对Wasm程序漏洞的自动修复理论和技术，有效提高漏洞修复的效率和降低漏洞修复成本.

4）对Wasm线性内存的安全增强研究. Wasm线性内存的独特设计，实现了沙箱隔离和越界检查等安全保证，但由于Wasm缺少对线性内存自身的安全检查，可能导致新的安全漏洞，引入潜在的攻击面. 第2节的安全威胁模型中，许多安全漏洞都与线性内存的安全保护机制缺失相关，因此，有效的线性内存安全增强理论和技术将会极大提升Wasm软件系统的安全性，促进Wasm在各领域的应用及发展. 对线性内存的安全增强可以从2个层面进行：一是在编译器层面控制内存的分配与布局，同时为Wasm程序插入必要的安全检查指令^[24]；二是在虚拟机层面添加越界检查机制^[105].

5）Wasm自动化程序验证研究. 对于面向Wasm的自动化程序验证研究，目前只有WASP^[148]尝试基于符号执行来验证Wasm程序的功能正确性. 基于近年来自动化程序验证器领域最新研究进展（如Dafny^[159]，Why3^[160]，VeriFast^[161] 等），通过定制从Wasm到特定程序验证器所需输入的专用编译器，从而可以有效地将已有的自动化程序验证器用于Wasm程序验证，这是一个亟待探索的重要研究方向.

8. 结　　语

WebAssembly作为最新一代安全、高效、可移植的二进制指令集体系结构和代码分发格式，正在成为最有前景的跨平台公共语言标准之一. 随着WebAssembly的快速发展和越来越广泛的应用， WebAssembly安全已经成为近年来的热点研究领域. 本文首先总结了WebAssembly的核心安全特性，并提出了WebAssembly安全威胁模型；随后，本文提出了WebAssembly安全研究的分类学，将已有工作分为安全实证研究、漏洞检测与利用、安全增强以及形式语义与程序验证4类，并分别对这4类研究进行了综述和总结，分析了不足和亟待开展的工作. 最后，本文对WebAssembly安全的未来研究方向进行了展望，指出了5个潜在的研究方向，以期为相关领域的研究者提供有价值的参考.

作者贡献声明：庄骏杰和胡霜共同完成文献调研、内容整理和论文撰写；华保健和汪炀对论文选题、研究展开和论文撰写提供了指导；潘志中参与了本文部分内容研究和论文撰写.庄骏杰和胡霜为共同第一作者，华保健和汪炀为共同通信作者.

图 1 MLC框架

Figure 1. MLC framework

下载: 全尺寸图片幻灯片

图 2 基于响应的知识蒸馏框架

Figure 2. Response based knowledge distillation framework

下载: 全尺寸图片幻灯片

图 3 KDMLC框架

Figure 3. Framework of KDMLC

下载: 全尺寸图片幻灯片

图 4 模型在CIFAR10数据集下的准确率对比

Figure 4. Accuracy comparison of model on CIFAR10 dataset

下载: 全尺寸图片幻灯片

图 5 在UNIF噪声类型下CIFAR10数据集的准确率对比

Figure 5. Accuracy comparison of CIFAR10 dataset with UNIF noise type

下载: 全尺寸图片幻灯片

图 6 在40%噪声水平的UNIF噪声类型下CIFAR10数据集的噪声转移矩阵

Figure 6. Noise transition matrix for CIFAR10 dataset under UNIF noise type with a 40% noise level

下载: 全尺寸图片幻灯片

图 7 在CIFAR100数据集的不同参数设置下测试准确率对比

Figure 7. Comparison of testing accuracy on CIFAR100 dataset under different parameter settings

下载: 全尺寸图片幻灯片

图 8 在FLIP噪声类型下CIFAR100数据集的准确率对比

Figure 8. Accuracy comparison of CIFAR100 dataset with FLIP noise type

下载: 全尺寸图片幻灯片

图 9 训练时间对比

Figure 9. Comparison of training time

下载: 全尺寸图片幻灯片

图 10 在FLIP噪声类型下CIFAR100数据集上对不同类型标签训练准确率对比

Figure 10. Comparison of training accuracy for different types of labels on CIFAR100 dataset with FLIP noise type

下载: 全尺寸图片幻灯片

图 11 在Cutout数据增强下模型测试准确率对比

Figure 11. Comparison of model testing accuracy under Cutout data enhancement

下载: 全尺寸图片幻灯片

表 1 基于知识蒸馏的标签校正方法对比

Table 1 Comparison of Label Correction Methods Based on Knowledge Distillation

	MPL^[13]	Li等人^[19] 所提方法	KDMLC（本文）
在线蒸馏策略	√	×	√
轻量化模型性能提升	×	√	√
教师模型性能提升	√	×	√
教师模型的训练数据类型	噪声数据	干净数据	噪声数据

下载: 导出CSV

表 2 数据集样本个数设置

Table 2 Settings of Sample Numbers in the Dataset

数据集类型	数据集(类别数)
数据集类型	CIFAR10(10)	CIFAR100(100)	Clothing1M(14)
训练集	50×10³	50×10³	1050×10³
测试集	10×10³	10×10³	10×10³
干净数据集	1×10³	1×10³	50×10³
噪声数据集	49×10³	49×10³	1000×10³

下载: 导出CSV

表 3 KDMLC与不同方法在CIFAR10数据集的性能对比

Table 3 Performance Comparison of KDMLC and Different Methods on CIFAR10 Dataset %

方法	UNIF噪声的4种噪声水平				FLIP噪声的2种噪声水平
方法	20%	40%	60%	80%	20%	40%
Fine-tuning	91.17	87.34	83.75	69.28	93.11	91.04
GEC^[29]	90.27	88.50	83.70	57.27	90.11	85.24
Co-teaching^[31]	86.05	75.15	73.31		83.68	75.62
L2RW^[32]		87.11	82.60		87.86	85.66
GLC^[18]	91.47	88.52	84.08	64.21	92.46	91.74
MW-Net^[30]	91.48	87.77	81.98	65.88	91.47	91.64
MLC^[8]	89.83	87.32	83.92	74.43	91.81	91.35
KDMLC_NT	89.97	88.16	85.13	77.34	92.08	91.62
KDMLC_NS	90.25	89.78	86.76	79.93	92.87	92.48
注：NT与NS分别代表教师模型与学生模型，黑体数值表示最优分类准确率.

下载: 导出CSV

表 4 KDMLC与MLC在2种噪声类型下CIFAR100数据集的准确率对比

Table 4 Accuracy Comparison of KDMLC and MLC on CIFAR100 Dataset with Two Types of Noise %

方法	UNIF噪声的4种噪声水平				FLIP噪声的2种噪声水平
方法	20%	40%	60%	80%	20%	40%
MLC	58.51	36.43	23.59	16.50	60.19	55.69
KDMLC_NT	63.26	44.92	28.74	19.65	64.84	63.88
KDMLC_NS	67.79	50.61	31.33	19.83	68.73	67.59
注：黑体数值表示最优值.

下载: 导出CSV

表 5 KDMLC消融实验准确率对比

Table 5 Comparison of Accuracy in KDMLC Ablation Experiments %

训练策略	模型	数据集/噪声类型/噪声水平
训练策略	模型	CIFAR10/UNIF/80%	CIFAR100/FLIP/40%
无学生反馈	KDMLC_NT	74.51	55.73
无学生反馈	KDMLC_NS	76.48	59.61
KDMLC方法	KDMLC_NT	77.34	63.88
KDMLC方法	KDMLC_NS	79.93	67.59
注：黑体数值表示最优值.

下载: 导出CSV

表 6 KDMLC与MLC在2种噪声类型下的准确率对比

Table 6 Accuracy Comparison of KDMLC and MLC with Two Types of Noise %

本文方法	UNIF噪声的3种噪声水平			FLIP噪声的3种噪声水平
本文方法	40%	60%	80%	20%	30%	40%
KDMLC_NT	88.16	85.13	77.34	64.84	64.37	63.88
KDMLC_NS	89.78	86.76	79.93	68.73	68.23	67.59
CNT	89.05	86.37	82.28	64.67	64.18	63.91
CNS	90.26	87.44	83.54	68.59	67.98	67.76
注：黑体数值表示最优分类准确率.

下载: 导出CSV

表 7 Clothing1M测试准确率对比

Table 7 Testing Accuracy Comparison of Clothing1M %

方法	准确率	方法	准确率
Joint Optimization^[33]	72.23	Bootstrap^[34]	69.12
U-correction^[35]	71.00	Forward^[17]	69.84
MW-Net^[30]	73.72	MSLC^[36]	74.02
GLC^[18]	73.69	KDMLC_NS（本文）	74.23
注：黑体数值表示最优值.

下载: 导出CSV

参考文献(36)

[1]	Zhang Chiyuan, Bengio S, Hardt M, et al. Understanding deep learning (still) requires rethinking generalization[J]. Communications of the ACM, 2021, 64(3): 107−115 doi: 10.1145/3446776
[2]	Nakkiran P, Kaplun G, Bansal Y, et al. Deep double descent: Where bigger models and more data hurt[J]. Journal of Statistical Mechanics: Theory and Experiment, 2021, 2021(12): 124003
[3]	Jindal I, Nokleby M, Chen Xuewen. Learning deep networks from noisy labels with dropout regularization[C]//Proc of the 16th IEEE Int Conf on Data Mining. Piscataway, NJ: IEEE, 2016: 967−972
[4]	Pereyra G, Tucker G, Chorowski J, et al. Regularizing neural networks by penalizing confident output distributions[J]. arXiv preprint, arXiv: 1701.06548, 2017
[5]	欧阳宵,陶红,范瑞东,等. 利用标签相关性先验的弱监督多标签学习方法[J]. 软件学报,2023,34(4):1732−1748 Ouyang Xiao, Tao Hong, Fan Ruidong, et al. Weakly supervised multi-label learning using prior label correlation information[J]. Journal of Software, 2023, 34(4): 1732−1748 (in Chinese)
[6]	苗壮,王亚鹏,李阳,等. 一种鲁棒的双教师自监督蒸馏哈希学习方法[J]. 计算机科学,2022,49(10):159−168 Miao Zhuang, Wang Yapeng, Li Yang, et al. Robust Hash learning method based on dual-teacher self-supervised distillation[J]. Computer Science, 2022, 49(10): 159−168 (in Chinese)
[7]	Jiang Lu, Zhou Zhengyuan, Leung T, et al. Mentornet: Learning data-driven curriculum for very deep neural networks on labels[C]//Proc of the 35th Int Conf on Machine Learning. New York: ACM, 2018: 2304−2313
[8]	Zheng Guoqing, Awadallah A H, Dumais S. Meta label correction for noisy label learning[C]//Proc of the 35th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2021: 11053−11061
[9]	Finn C, Abbeel P, Levine S. Model-agnostic meta-learning for fast adaptation of deep networks[C]//Proc of the 34th Int Conf on Machine Learning. New York: ACM, 2017: 1126−1135
[10]	纪荣嵘,林绍辉,晁飞,等. 深度神经网络压缩与加速综述[J]. 计算机研究与发展,2018,55(9):1871−1888 Ji Rongrong, Lin Shaohui, Chao Fei, et al. Deep neural network compression and acceleration: A review[J]. Journal of Computer Research and Development, 2018, 55(9): 1871−1888 (in Chinese)
[11]	Hinton G, Vinyals O, Dean J. Distilling the knowledge in a neural network[J]. arXiv preprint, arXiv: 1503.02531, 2015
[12]	Yang Zhendong, Li Zhe, Gong Yuan, et al. Rethinking knowledge distillation via cross-entropy[J]. arXiv preprint, arXiv: 2208.10139, 2022
[13]	Pham H, Dai Zihang, Xie Qizhe, et al. Meta pseudo labels[C]//Proc of the 34th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2021: 11557−11568
[14]	丁家满,刘楠,周蜀杰,等. 基于正则化的半监督弱标签分类方法[J]. 计算机学报,2022,45(1):69−81 Ding Jiaman, Liu Nan, Zhou Shujie, et al. Semi-supervised weak-label classification method by regularization[J]. Chinese Journal of Computer, 2022, 45(1): 69−81 (in Chinese)
[15]	Van Rooyen B, Williamson R C. A Theory of learning with corrupted labels[J]. Journal of Machine Learning Research, 2017, 18(1): 8501−8550
[16]	Goldberger J, Ben-Reuven E. Training deep neural-networks using a noise adaptation layer[C/OL]//Proc of the 5th Int Conf on Learning Representations. 2017[2023-01-13].https://openreview.net/forum?id=H12GRgcxg
[17]	Patrini G, Rozza A, Krishna Menon A, et al. Making deep neural networks robust to label noise: A loss correction approach[C]//Proc of the 16th IEEE Int Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2017: 1944−1952
[18]	Hendrycks D, Mazeika M, Wilson D, et al. Using trusted data to train deep networks on labels corrupted by severe noise[C]//Proc of the 31st Advances in Neural Information Processing Systems. Cambridge, MA: MIT, 2018: 10456−10465
[19]	Li Yuncheng, Yang Jianchao, Song Yale, et al. Learning from noisy labels with distillation[C]//Proc of the 16th IEEE Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2017: 1910−1918
[20]	Algan G, Ulusoy I. Meta soft label generation for noisy labels[C]//Proc of the 25th IEEE Int Conf on Pattern Recognition. Piscataway, NJ: IEEE, 2021: 7142−7148
[21]	Wang Zhen, Hu Guosheng, Hu Qinghua. Training noise-robust deep neural networks via meta-learning[C]//Proc of the 33rd IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2020: 4524−4533
[22]	Passban P, Wu Yimeng, Rezagholizadeh M, et al. Alp-KD: Attention-based layer projection for knowledge distillation[C]//Proc of the 35th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2021: 13657−13665
[23]	Passalis N, Tzelepi M, Tefas A. Heterogeneous knowledge distillation using information flow modeling[C]//Proc of the 33rd IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2020: 2339−2348
[24]	Heo B, Lee M, Yun S, et al. Knowledge distillation with adversarial samples supporting decision boundary[C]//Proc of the 33rd AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2019: 3771−3778
[25]	Fang Gongfan, Mo Kanya, Wang Xinchao, et al. Up to 100x faster data-free knowledge distillation[C]//Proc of the 36th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2022: 6597−6604
[26]	魏秀参,徐书林,安鹏,等. 面向增量分类的多示例学习[J]. 计算机研究与发展,2022,59(8):1723−1731 Wei Xiushen, Xu Shulin, An Peng, et al. Multi-instance learning with incremental classes[J]. Journal of Computer Research and Development, 2022, 59(8): 1723−1731 (in Chinese)
[27]	Chen Pengguang, Liu Shu, Zhao Hengshuang, et al. Distilling knowledge via knowledge review[C]//Proc of the 34th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2021: 5008−5017
[28]	Xiao Tong, Xia Tian, Yang Yi, et al. Learning from massive noisy labeled data for image classification[C]//Proc of the 28th IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2015: 2691−2699
[29]	Zhang Zhilu, Sabuncu M. Generalized cross entropy loss for training deep neural networks with noisy labels[C]//Proc of the 31st Advances in Neural Information Processing Systems. Cambridge, MA: MIT, 2018: 8778-8788
[30]	Shu Jun, Xie Qi, Yi Lixuan, et al. Meta-weight-Net: Learning an explicit mapping for sample weighting[C]//Proc of the 32nd Advances in Neural Information Processing Systems. Cambridge, MA: MIT, 2019: 1917−1928
[31]	Han Bo, Yao Quanming, Yu Xingrui, et al. Co-teaching: Robust training of deep neural networks with extremely noisy labels[C]//Proc of the 31st Advances in Neural Information Processing Systems. Cambridge, MA: MIT, 2018: 8527−8537
[32]	Ren Mengye, Zeng Wenyuan, Yang Bin, et al. Learning to reweight examples for robust deep learning[C]//Proc of the 35th Int Conf on Machine Learning. New York: ACM, 2018: 4334−4343
[33]	Tanaka D, Ikami D, Yamasaki T, et al. Joint optimization framework for learning with noisy labels[C]//Proc of the 31st IEEE/CVF Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2018: 5552−5560
[34]	Reed S, Lee H, Anguelov D, et al. Training deep neural networks on noisy labels with bootstrapping[J]. arXiv preprint, arXiv: 1412.6596, 2014
[35]	Arazo E, Ortego D, Albert P, et al. Unsupervised label noise modeling and loss correction[C]//Proc of the 36th Int Conf on Machine Learning. New York: ACM, 2019: 312−321
[36]	Wu Yichen, Shu Jun, Xie Qi, et al. Learning to purify noisy labels via meta soft label corrector[C]//Proc of the 35th AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2021: 10388−10396

施引文献

资源附件(0)

图(11) / 表(7)

计量

文章访问数: 188
HTML全文浏览量: 19
PDF下载量: 89
被引次数: 0

1. Wasm概述
1.1 Wasm历史与概况
1.2 Wasm生态系统
1.2.1 高级语言支持
1.2.2 编译工具链
1.2.3 二进制表示
1.2.4 语言虚拟机
1.3 Wasm核心安全特性
1.3.1 强类型系统
1.3.2 安全的控制流
1.3.3 软件故障隔离
1.3.4 线性内存
1.4 研究框架
2. Wasm安全威胁模型
2.1 高级语言支持
2.2 编译工具链
2.3 二进制表示
2.4 语言虚拟机
2.5 本节小结
3. Wasm安全实证研究
3.1 对高级语言支持的实证研究
3.2 对编译工具链的实证研究
3.3 对二进制表示的实证研究
3.4 本节小结
4. Wasm漏洞检测与利用研究
4.1 漏洞检测
4.1.1 静态检测
4.1.2 动态检测
4.1.3 混合检测
4.2 漏洞利用
4.3 本节小结
5. Wasm安全增强研究
5.1 静态安全增强
5.2 动态安全增强
5.3 本节小结
6. Wasm形式语义与程序验证研究
6.1 Wasm形式语义研究
6.2 Wasm程序验证研究
6.3 本节小结
7. 未来研究方向展望
8. 结　　语

1. Wasm概述
1.1 Wasm历史与概况
1.2 Wasm生态系统
1.2.1 高级语言支持
1.2.2 编译工具链
1.2.3 二进制表示
1.2.4 语言虚拟机
1.3 Wasm核心安全特性
1.3.1 强类型系统
1.3.2 安全的控制流
1.3.3 软件故障隔离
1.3.4 线性内存
1.4 研究框架
2. Wasm安全威胁模型
2.1 高级语言支持
2.2 编译工具链
2.3 二进制表示
2.4 语言虚拟机
2.5 本节小结
3. Wasm安全实证研究
3.1 对高级语言支持的实证研究
3.2 对编译工具链的实证研究
3.3 对二进制表示的实证研究
3.4 本节小结
4. Wasm漏洞检测与利用研究
4.1 漏洞检测
4.1.1 静态检测
4.1.2 动态检测
4.1.3 混合检测
4.2 漏洞利用
4.3 本节小结
5. Wasm安全增强研究
5.1 静态安全增强
5.2 动态安全增强
5.3 本节小结
6. Wasm形式语义与程序验证研究
6.1 Wasm形式语义研究
6.2 Wasm程序验证研究
6.3 本节小结
7. 未来研究方向展望
8. 结　　语

参考文献(36)

施引文献

资源附件(0)

一种基于在线蒸馏的轻量化噪声标签学习方法

通讯作者: 黄贻望（yjsyhyw@gztrc.edu.cn）

计量

出版历程

A Lightweight Noise Label Learning Method Based on Online Distillation

1. Wasm概述

1.1 Wasm历史与概况

1.2 Wasm生态系统

1.2.1 高级语言支持

1.2.2 编译工具链

1.2.3 二进制表示

1.2.4 语言虚拟机

1.3 Wasm核心安全特性

1.3.1 强类型系统

1.3.2 安全的控制流

1.3.3 软件故障隔离

1.3.4 线性内存

1.4 研究框架

2. Wasm安全威胁模型

2.1 高级语言支持

2.2 编译工具链

2.3 二进制表示

2.4 语言虚拟机

2.5 本节小结

3. Wasm安全实证研究

3.1 对高级语言支持的实证研究

3.2 对编译工具链的实证研究

3.3 对二进制表示的实证研究

3.4 本节小结

4. Wasm漏洞检测与利用研究

4.1 漏洞检测

4.1.1 静态检测

4.1.2 动态检测

4.1.3 混合检测

4.2 漏洞利用

4.3 本节小结

5. Wasm安全增强研究

5.1 静态安全增强

5.2 动态安全增强

5.3 本节小结

6. Wasm形式语义与程序验证研究

6.1 Wasm形式语义研究

6.2 Wasm程序验证研究

6.3 本节小结

7. 未来研究方向展望

8. 结 语

计量

出版历程

目录

1. Wasm概述

1.1 Wasm历史与概况

1.2 Wasm生态系统

1.2.1 高级语言支持

1.2.2 编译工具链

1.2.3 二进制表示

1.2.4 语言虚拟机

1.3 Wasm核心安全特性

1.3.1 强类型系统

1.3.2 安全的控制流

1.3.3 软件故障隔离

1.3.4 线性内存

1.4 研究框架

2. Wasm安全威胁模型

2.1 高级语言支持

2.2 编译工具链

2.3 二进制表示

2.4 语言虚拟机

2.5 本节小结

3. Wasm安全实证研究

3.1 对高级语言支持的实证研究

3.2 对编译工具链的实证研究

3.3 对二进制表示的实证研究

3.4 本节小结

4. Wasm漏洞检测与利用研究

4.1 漏洞检测

4.1.1 静态检测

4.1.2 动态检测

4.1.3 混合检测

4.2 漏洞利用

4.3 本节小结

通讯作者:
黄贻望（yjsyhyw@gztrc.edu.cn）

8. 结　　语

8. 结　　语