基于多目标混合蚁狮优化的算法选择方法

李庚松; 刘艺; 郑奇斌; 李翔; 刘坤; 秦伟; 王强; 杨长虹

doi:10.7544/issn1000-1239.202220769

基于多目标混合蚁狮优化的算法选择方法

李庚松^1,,
刘艺^2, ,,
郑奇斌²,
李翔²,
刘坤²,
秦伟²,
王强²,
杨长虹³

1.
国防科技创新研究院　北京　100071
2.
军事科学院　北京　100091
3.
天津（滨海）人工智能创新中心　天津　300457

基金项目: 科技部科技创新2030—重大项目(2020AAA0104802)；国家自然科学基金项目(91948303)；国家自然科学基金青年科学基金项目(61802426)

详细信息

作者简介:
李庚松: 1999年生. 硕士. 主要研究方向为算法选择和大数据

刘艺: 1990年生. 博士，助理研究员. 主要研究方向为机器人操作系统、大数据技术和演化算法

郑奇斌: 1990年生. 博士，助理研究员. 主要研究方向为数据工程、数据挖掘和机器学习

李翔: 1988年生. 博士，助理研究员. 主要研究方向为大数据

刘坤: 1982年生. 博士，副研究员. 主要研究方向为大数据

秦伟: 1983年生. 硕士，助理研究员. 主要研究方向为智能信息系统管理

王强: 1972年生. 硕士，副研究员. 主要研究方向为大数据

杨长虹: 1967年生. 硕士，高级工程师. 主要研究方向为计算机软件

通讯作者:
刘艺（albertliu20th@163.com）

中图分类号: TP181
计量
- 文章访问数: 221
- HTML全文浏览量: 26
- PDF下载量: 108
出版历程
- 收稿日期: 2022-08-27
- 修回日期: 2023-01-31
- 网络出版日期: 2023-04-17
- 刊出日期: 2023-06-30

Algorithm Selection Method Based on Multi-Objective Hybrid Ant Lion Optimizer

1.
National Innovation Institute of Defense Technology, Beijing 100071
2.
Academy of Military Sciences, Beijing 100091
3.
Tianjin Artificial Intelligence Innovation Center, Tianjin 300457

Funds: This work was supported by the Science and Technology Innovation 2030 Major Project of China (2020AAA0104802), the National Natural Science Foundation of China (91948303), and the National Natural Science Foundation of China for Young Scientists (61802426).

More Information

Author Bio:
Li Gengsong: born in 1999. Master. His main research interests include algorithm selection and big data

Liu Yi: born in 1990. PhD, assistant professor. His main research interests include robot operating system, big data technologies, and evolutionary algorithms.

Zheng Qibin: born in 1990. PhD, assistant professor. His main research interests include data engineering, data mining, and machine learning

Li Xiang: born in 1988. PhD, assistant professor. His main research interest includes big data

Liu Kun: born in 1982. PhD, associate professor. His main research interest includes big data

Qin Wei: born in 1983. Master, assistant professor. His main research interest includes intelligent information system management

Wang Qiang: born in 1972. Master, associate professor. His main research interest includes big data

Yang Changhong: born in 1967. Master, senior engineer. His main research interest includes computer software

摘要

摘要:
算法选择是指从可行算法中为给定问题选择满足需求的算法，基于元学习的算法选择是应用较为广泛的方法，元特征和元算法是其中的关键内容，而现有研究难以充分利用元特征的互补性和元算法的多样性，不利于进一步提升方法性能. 为了解决上述问题，提出基于多目标混合蚁狮优化的算法选择方法（SAMO），设计算法选择模型，以集成元算法的准确性和多样性作为优化目标，引入元特征选择和选择性集成，同时选择元特征和异构元算法以构建集成元算法；提出多目标混合蚁狮算法对模型进行优化，使用离散型编码选择元特征子集，通过连续型编码构建集成元算法，应用增强游走策略和偏好精英选择机制提升寻优性能. 使用260个数据集、150种元特征和9种候选算法构建分类算法选择问题来进行测试，分析方法的参数敏感性，将多目标混合蚁狮算法与4种演化算法进行比较，通过对8种对比方法与所提方法进行对比实验，结果验证了所提方法的有效性和优越性.
- 算法选择 /
- 多目标蚁狮优化 /
- 元特征选择 /
- 选择性集成 /
- 元学习 /
- 分类
Abstract:
Algorithm selection refers to selecting an algorithm that satisfies the requirements for a given problem from feasible algorithms, and algorithm selection based on meta-learning is a widely used method, in which the key components are meta-features and meta-learners. However, existing research is difficult to make full use of the complementarity of meta-features and the diversity of meta-learners, which are not conducive to further improving the method performance. To solve the above problems, a selective ensemble algorithm selection method based on multi-objective hybrid ant lion optimizer (SAMO) is proposed. It designs an algorithm selection model, which sets the accuracy and diversity of the ensemble meta-learners as the optimization objectives, introduces meta-feature selection and selective ensemble, and chooses meta-features and heterogeneous meta-learners simultaneously to construct ensemble meta-learners; it proposes a multi-objective hybrid ant lion optimizer to optimize the model, which uses discrete code to select meta-feature subsets and constructs ensemble meta-learners by continuous code, and applies the enhanced walk strategy and the preference elite selection mechanism to improve the optimization performance. We utilize 260 datasets, 150 meta-features, and 9 candidate algorithms to construct classification algorithm selection problems and conduct test experiments, and the parameter sensitivity of the method is analyzed, the multi-objective hybrid ant lion optimizer is compared with four evolutionary algorithms, 8 comparative methods are compared with the proposed method, and the results verify the effectiveness and superiority of the method.
- algorithm selection /
- multi-objective ant lion optimizer /
- meta-feature selection /
- selective ensemble /
- meta-learning /
- classification

HTML全文

无人驾驶系统（autonomous driving system, ADS）可通过各类的车载传感器（如相机、激光雷达、超声波雷达等）进行实时的驾驶环境感知，并进一步根据目标驾驶任务进行驾驶行为的规划与决策，以此控制车辆的自动化行进. 作为交通领域中的颠覆性智能技术，无人驾驶已展示出广泛的应用场景，如物流配送、军事探勘、公共交通等. 鉴于此，众多科技公司、整车厂商与政府部门正积极推动无人驾驶的技术落地，期望实现公开道路的无人驾驶车辆部署.

然而现如今，安全性作为无人驾驶系统重要的预期属性，已然成为了其大规模落地的瓶颈. 在无人驾驶车辆的试运行过程中，因无人驾驶系统缺陷导致的交通事故不断发生，造成了严重程度不一的财产损失与人身伤害. 例如，截止2023年1月6日，美国加州交管局^[1]（Department of Motor Vehicles, DMV）已接收并公布了546件无人驾驶车辆相关的交通事故^[2]. 同时，建立无人驾驶功能安全相关的测评标准已成为国内外标准化组织的重点工作. 例如，国际标准化组织发布了ISO 21448^[3]以规范无人驾驶的安全测试流程，作为跟进，我国的国家标准计划《道路车辆预期功能安全》^[4]也在积极筹备之中.

为有效提高无人驾驶的安全性并满足合规检测需求，各大厂商与监管机构正积极采用2类测试方案，即道路测试^[5-6]和仿真测试^[7–10]，来挖掘并整治无人驾驶系统中可能导致交通事故的系统缺陷. 道路测试指在封闭的真实道路上长久地运行无人驾驶车辆，并监控其驾驶行为. 然而，道路测试存在着较大的限制：一方面，布置各种封闭道路场景的成本较高，且测试周期较长；另一方面，道路测试难以验证无人驾驶系统在极端驾驶场景（如极端天气与路况）中的可靠性. 与道路测试不同的是，仿真测试指在仿真器中配置虚拟的驾驶场景来验证无人驾驶系统的安全性. 相较于传统的道路测试，因仿真测试可任意指定虚拟场景的配置（如天气环境、地图道路和交通车流等），能以更低的成本灵活地验证在真实道路上难以挖掘到的危险驾驶场景. 鉴于该优势，仿真测试已被学术界和产业界广泛使用来评估无人驾驶系统的安全性.

显然，仿真测试的有效性直接由虚拟场景配置的质量决定，即安全测试人员能否设计出易导致无人驾驶安全事故的虚拟场景. 然而，设计事故场景绝非易事. 其原因在于，虚拟场景中包含着种类丰富的待配置要素，包括天气环境、道路地图和交通车流等，这些要素的排列组合将构成难以估量的场景搜索空间. 直观地说，从这样庞大的搜索空间中有效挖掘事故场景配置无异于大海捞针. 截止当前，这仍然是困扰学术界^[11–13]和工业界^[14]的棘手难题.

为有效应对该难题，前沿的研究工作^[15–20]尝试将模糊测试技术^[21-22]与仿真测试相结合，构建出面向无人驾驶系统的仿真模糊测试技术（simulation-based fuzzing）. 该技术的基本原理是：给定数量有限的初始场景配置（称之为种子场景），通过类模糊测试的变异操作来自动调整种子场景中的可配置要素（如将天气参数由晴天变更为雨天），以此源源不断地生成新的更易导致事故的场景配置. 基于此原理，仿真模糊测试技术即可自动化地探索庞大的场景搜索空间，并从中挖掘出易导致无人车事故的驾驶场景. 例如，AV-FUZZER^[16]提出了与遗传算法相结合的模糊测试方案，通过改变无人车周围车辆的变道行为和驾驶速度，寻找直道上因车距过近而导致的无人车事故场景；AutoFuzz^[18]利用神经网络来指导仿真模糊测试，其首先将场景配置向量化，并通过梯度下降算法变异各类场景要素，以此生成导致无人车碰撞的驾驶场景.

尽管已有的仿真模糊测试工作已经在高级别无人驾驶系统（high-level autonomous driving system）的安全测评中展示出了良好的应用成效，即发现了数十乃至数百例主流开源无人驾驶系统Apollo和Autoware的事故场景，它们仍然存在数个缺陷与不足，直接制约了它们提升无人驾驶系统安全性的能力. 例如，现有的仿真模糊测试工作在准备种子场景时，普遍采用手工的方式构建极其简易的驾驶场景，该类质量低下的种子极大地限制了现有工具的事故挖掘能力. 又如，现有的仿真模式测试工作的事故分类机制缺乏完善的设计，大量冗余重复的事故为进一步的系统缺陷归因溯源造成巨大阻碍.

鉴于此，本文旨在系统性地总结现有工作的不足，指明完善这些不足之处的技术方向，并最终给出可行的解决方案，以此为该领域的后续工作提供可靠的指导建议.

本文的主要贡献包括3个方面：

1）调研了面向无人驾驶系统的仿真模糊测试技术，并总结了该类技术的一般架构，该架构分为种子场景生成、事故挖掘、事故分类与事故根源分析四大关键模块.

2）面向这4个关键模块，剖析了现有工作的不足，以及解决这些不足所面临的技术挑战.

3）针对现有工作的不足提出了可行的优化方案，并在主流无人驾驶系统上进行了可行性的实验论证，以此指明该领域的未来发展方向.

1. 背景知识

1.1 无人驾驶系统

为了区分不同自动驾驶系统的能力，国际汽车工程学会（Society of Automotive Engineers, SAE）将无人驾驶系统分为6个等级^[23]，从L0（无自动驾驶）到L5（完全自动驾驶）. 其中，L4与L5的无人驾驶系统又称高级别无人驾驶系统. 因高级别无人驾驶系统在多样的驾驶场景中都具备自主运行能力，许多制造商正致力于该类系统的开发部署与安全测试. 具体地说，高级别无人驾驶系统通常是由多个功能模块组成，这些模块协同工作，以实现实时的自动驾驶. 如图1所示，高级别无人驾驶系统主要包含4个关键模块：

图 1 无人驾驶系统仿真测试架构

Figure 1. Architecture of simulation testing for autonomous driving systems

下载: 全尺寸图片幻灯片

1）感知（Perception）模块. 通过接收来自摄像头、激光雷达和超声波雷达等车载传感器的数据，基于机器学习算法探知车身周围障碍物的位置和类型.

2）预测（Prediction）模块. 基于上述障碍物探知信息，运用机器学习算法进一步预测周边障碍物的未来运动轨迹.

3）规划（Planning）模块. 结合目标驾驶任务与驾驶环境的感知预测结果，为无人驾驶车辆规划出可达目的地的安全行驶轨迹.

4）控制（Control）模块. 基于规划的轨迹和车辆的当前状态，使用不同的控制算法生成一系列车身控制命令，如加速、刹车和转向等.

这4类功能模块通常以异步的形式高频运作，并在运行时依赖高性能中间件框架（如Cyber-RT^[24]和ROS^[25]）进行模块间的通信. 此外，该框架还负责无人驾驶系统和车载硬件之间的信息交互.

1.2 无人驾驶系统仿真测试

为了提高无人驾驶系统的安全性，许多研究工作着眼于测试单个系统模块（如感知模块^[26–31]）的鲁棒性，即假设攻击者或罕见的驾驶情况可能导致单个系统模块的故障. 例如，攻击者伪造的传感器数据可能会导致错误的障碍物感知结果. 然而，因无法从宏观的层面对无人驾驶系统整体进行测试^[32]，该类工作往往无法发现由多个模块共同导致的系统故障.

与上述工作不同的是，无人驾驶系统仿真测试是面向无人驾驶系统整体而非单点模块的测试方法. 在虚拟的仿真环境下，安全分析人员可灵活指定场景的各类要素，并通过待测无人驾驶系统的实时计算来控制仿真无人车在该场景下的运动. 图1描述了无人驾驶系统仿真平台的整体框架. 其中，驾驶模拟器通常建立在图形渲染引擎（如Unity^[33]和Unreal^[34]）上，包含3个用于仿真测试的重要组件：

1）无人车模拟组件. 该组件主要负责模拟目标无人车在虚拟场景中的驾驶行为. 仿真环境中的无人车配置了各种虚拟传感器，这些虚拟传感器可以产生与仿真环境对应的传感器数据（如摄像头数据、激光雷达数据和GPS数据）. 随后，驾驶模拟器会通过通信网桥将这些数据作为输入连续地传输给无人驾驶系统. 同样，经过无人驾驶系统计算后生成的车辆控制指令（如油门和转向）也会通过通信网桥实时地发送给驾驶模拟器，进而控制无人车在仿真环境中的运动.

2）环境模拟组件. 该组件允许配置多样的驾驶环境，主要包括环境的物理属性和静态的地图元素. 这些配置决定了仿真环境的渲染，同时也是虚拟无人车传感器生成实时传感器数据的重要根据.

3）交通模拟组件. 该组件旨在模拟无人车周围具有特定动态行为的交通参与者. 根据交通行为者的类型，交通模拟可以分为车辆交通模拟（如汽车和公共汽车）和非车辆交通模拟（如自行车和行人）.

1.3 仿真场景配置

驾驶模拟器具有3个重要组件，即无人车模拟组件、环境模拟组件和交通模拟组件. 在实际的仿真测试过程中，测试人员须正确配置这3个组件的必要参数以保证仿真测试的正常开展：

1）环境模拟参数. 该参数主要用于定制化场景的自然物理属性和地图元素. 最常见的自然物理属性包括天气情况与光照情况. 地图元素通常指的是具有特定结构和地理坐标的道路网络，其中包含必要的道路基础设施如交通标志牌与交通信号灯等.

2）无人车模拟参数. 该参数主要指定待测无人车的物理学模型与动力学模型. 此外，该参数还须指定无人车驾驶的起点、目的地以及初始速度.

3）交通模拟参数. 该参数需指定各交通参与方的动态行为. 常见的方式是令车辆与行人等沿着给定的轨迹坐标点运动.

为保证这3个参数配置的可移植性，现有工作普遍采用不同的领域特定语言（domain-specific language, DSL）实例化参数配置. 例如，GeoScenario^[35]和OpenSCENARIO^[36]利用面向对象的语言来描述仿真场景的各项参数. 此外，这些DSL通常会结合其他标准（如OpenDRIVE^[37]，OSM^[38]和Lanelets^[39]）来描述道路地图. 最终，这些格式良好的场景参数配置会被保存为与系统无关的文件格式（如XML文件或JSON文件），本文将此类文件统称为场景配置文件.

2. 面向无人驾驶系统的仿真模糊测试

2.1 仿真模糊测试架构

现有工作^[15–20]在实现面向无人驾驶系统的仿真模糊测试时，主要利用了模糊测试的随机性和仿真测试的灵活性，在仅有少数初始场景配置的情况下，自动化地生成并验证海量未知的仿真驾驶场景. 通过对现有工作的系统性总结，本文将仿真模糊测试的一般架构解构为4个关键模块，分别为种子场景生成模块、事故挖掘模块、事故分类模块和事故归因分析模块，如图2所示.

图 2 仿真模糊测试框架

Figure 2. Architecture of simulation-based fuzzing

下载: 全尺寸图片幻灯片

1）种子场景生成模块. 进行模糊测试的首要条件是准备一定量的初始输入作为种子，从而可以通过种子的变异或调整源源不断地生成新的测试输入. 在无人驾驶系统仿真测试的语境下，种子指代的是初始的仿真场景配置文件，其指明了驾驶仿真器在实现无人车模拟、环境模拟以及交通模拟时所依赖的必要参数.

2）事故挖掘模块. 在给定种子场景的情况下，事故挖掘模块的预期功能是通过变异种子场景的各项配置来生成新的待测场景，并通过监控各待测场景的仿真执行结果，验证变异后的场景是否会造成无人驾驶车辆的不当行为，如车辆碰撞或交通违规等. 在传统的软件模糊测试领域，现有工作^[40–45]通常制定“变异-反馈”机制来避免盲目的种子生成与验证，即在变异过程中筛选出高质量的种子，引导种子向更优异的方向持续演进. 同样地，这类反馈机制也存在于面向无人驾驶系统的仿真模糊测试中，其旨在遴选出更接近事故发生的仿真驾驶场景.

3）事故分类模块. 在传统的软件模糊测试领域，崩溃去重^[46-47]是必不可少的重要步骤. 在收集完所有能够触发程序崩溃的种子后，该步骤旨在筛除有相似崩溃行为的冗余种子，以此减少安全人员的分析开销. 类似地，仿真模糊测试的事故分类模块旨在去除同类的无人车事故场景，以此辅助安全分析人员更快定位和治理无人驾驶系统中的不同缺陷.

4）事故归因分析模块. 传统模糊测试通常可依赖内存错误检测工具（如AddressSanitizer^[48]）来定位导致程序崩溃的代码位置. 然而，因无人驾驶系统的碰撞事故通常由逻辑缺陷（如算法设计缺陷或模型运算错误）导致，其不会出现显式的内存崩溃. 因此，仿真模糊测试通常需要额外的事故归因步骤来确认导致事故的系统模块、模型或代码片段等.

2.2 现有工作概述

近年来，不少前沿的学术工作^[15–20]尝试设计面向无人驾驶系统的仿真模糊测试技术，以挖掘和整治无人驾驶系统的功能安全威胁. 如表1所示，根据2.1节所述的四大模块，本文尝试对现有工作的技术方案进行模块化拆解，分别介绍这些工作实现的各关键模块的具体方案.

表 1 现有的面向无人驾驶系统的仿真模糊测试工作

Table 1. Existing Work in Simulation-based Fuzzing for Autonomous Driving Systems

现有工作	场景语料库生成	事故挖掘	事故分类	事故归因分析
MFT^[15]	人工构建	在前方道路上随机放置静态障碍物	无	无
AV-FUZZER^[16]	人工构建	改变NPC的变道策略和速度；计算安全距离来评估场景	人工分类	无
ASF^[17]	随机生成	一定范围内新增或修改NPC坐标数据，随机改变场景元素状态；计算轨迹覆盖率来评估场景	无	人工分析
AutoFuzz^[18]	随机生成	使用梯度下降算法变异NPC和环境参数；使用神经网络分类器来评估场景	基于场景属性的自动化分类	无
DriveFuzz^[19]	随机生成	提出4种变异策略变异不同的属性值和约束值；检测碰撞、违规、停滞3种不当行为，并量化鲁莽驾驶的因素来评估场景	无	人工分析
MOSAT^[20]	随机生成	定义了4种行为模式，在变异过程中随机选择；提出了多目标的场景评估策略	人工分类	无

下载: 导出CSV

| 显示表格

1）针对种子场景生成模块，已有工作主要采用2类方案，一类是根据人工经验配置简单的驾驶场景，另一类是设计随机算法以生成初始的场景配置. MFT^[15]和AV-FUZZER^[16]人工构建了1～2个简单的直道驾驶场景作为初始种子，场景中仅包含少量的动态运行车辆与静态障碍物. 其余工作则依据先验知识，通过随机采样的方式生成一定数量的仿真场景作为初始种子. 更具体地说，ASF^[17]尝试完全随机生成符合场景配置格式的初始场景；AutoFuzz^[18]从驾驶模拟器的API规范中提取出场景配置参数的相关约束，并通过随机采样生成有效的场景配置；DriveFuzz^[19]设计了一套可达性分析算法，为无人车在地图上随机选取有效的起点和目的地；MOSAT^[20]在指定NPC的数量和距离范围后随机生成初始场景.

2）针对事故挖掘模块，已有工作基于无人驾驶测试的领域知识，设计了多样且有效的“变异-反馈”机制，以便将初始的种子场景更快地变异为诱发无人驾驶事故的场景. 同时，在挖掘事故场景时，已有工作普遍关注车辆碰撞这一严重的安全事故类型. MFT尝试在无人车的行进道路上随机放置新的静态障碍物，通过增加无人车与周边场景元素的交互来提高事故发生的概率. AV-FUZZER尝试改变无人车周围虚拟车辆 (NPC) 车辆的变道策略和速度，计算NPC车辆和无人车的安全距离作为遗传算法的适应度函数，用于发现更苛刻的行驶场景. MOSAT则根据NPC车辆与无人车的位置关系，定义了4种场景变异模式来增加无人车路径规划的难度，此外还提出了多目标的适应度函数，通过考虑事故的多样性和无人车驾驶行为的不稳定性等来引导变异的流程. ASF在一定范围内新增NPC车辆并修改原有NPC车辆的起始位置，以无人车驾驶的轨迹覆盖率为导向，尝试触发更多样的无人车驾驶行为以挖掘不同的事故场景. AutoFuzz将场景配置参数向量化的同时，创新性地利用梯度下降算法变异参数向量，并使用神经网络分类器来遴选更危险的驾驶场景. DriveFuzz在场景变异过程中，设计了更多样的NPC车辆驾驶行为（如变道插队），通过观测无人车的危险驾驶操作（如急刹车和急转弯）来量化各场景的危险程度.

3）针对事故分类模块，AV-FUZZER和MOSAT通过观察所有事故场景的仿真运行流程，根据无人车的驾驶行为特征，以人工的方式主观地将碰撞事故归为不同的类别. 更进一步地，AutoFuzz首次尝试实现自动化的事故场景去重. 给定任意2个事故场景，AutoFuzz通过判断仿真场景配置文件的差异程度来决定两者是否等价，即当差异程度超过预设的阈值时，则认为2个事故场景属于不同的类别.

4）针对事故归因分析模块，目前所有的工作都缺乏自动化分析事故场景根源缺陷的能力. ASF针对一例事故展开了详细的人工归因分析，并最终定位到导致事故的缺陷代码位置. DriveFuzz以人工分析的方式，将事故的根源归纳为不同的种类，包括仿真器缺陷、系统逻辑缺陷和系统功能不足等. 此外，ASF和DriveFuzz仅描述了事故归因分析的结果，但并未详细阐释归因分析的方法论与具体步骤.

2.3 现有工作的缺陷

根据2.2节的阐述不难发现，现有的仿真模糊测试技术主要关注事故挖掘模块的设计，即尝试借鉴传统软件模糊测试的“变异-反馈”机制，融合遗传算法或神经网络等前沿方法，以便更快地挖掘到无人车事故场景. 然而，相比之下，种子场景生成模块、事故分类模块与事故归因分析模块的设计则普遍依赖启发式的规则或人工分析来实现. 值得注意的是，这4个关键模块协同工作才能构成仿真模糊测试的闭环，换言之，单个模块的设计缺陷将直接影响到仿真模糊测试的有效性和可靠性. 下面本文将详细剖析不同模块的设计缺陷.

1）种子场景的质量低下且依赖个人经验手工构造. 长期以来，初始种子的质量已被广泛证明对模糊测试的结果存在显著影响^[49-50]. 然而，在开展面向无人驾驶系统的仿真模糊测试时，现有工作普遍根据专家经验或个人经验，主观地选择数量有限的简单场景作为种子，没有重视或评估种子场景对于测试结果可能存在的影响. 其次，现有工作普遍采用手工构造的方式来创建初始场景. 正如1.3节所述，场景的配置涉及种类繁多的参数，且不同参数的格式与内涵相差甚远，即需要耗费可观的人力与时间才能完成参数的逐一配置. 虽然部分工作尝试使用随机生成的方式来减少人工开销，但这些工作仍然需要人工总结出场景模板或场景约束来指导场景的生成.

2）缺乏可靠的自动化事故分类. 现有的仿真模糊测试工作在各自的实验评估中均成功发现了主流开源无人驾驶系统的多例事故场景. 然而，这些工作普遍缺乏自动化的事故分类方法，导致分析人员难以从众多的事故案例中遴选出典型的案例作为进一步分析和诊断的目标. AutoFuzz虽然尝试提出自动化的聚类方法，但该方法仅通过仿真场景配置的相似度来判断事故是否类似. 因缺乏事故相关的分析（如事故主体和事故特性），AutoFuzz在事故分类中极易产生错误.

3）缺乏可靠的自动化事故归因分析. 现有的仿真模糊测试在汇报了事故场景后，无法通过可靠的自动化归因分析来定位系统缺陷点（即代码位置）. 这使得事故的确认与修复受到了极大的阻碍. ASF和DriveFuzz尝试通过人工的方式进行系统缺陷点的定位. 显然，该类方式需要极强的无人驾驶领域知识，以及对目标无人驾驶系统代码实现的深入理解. 此外，因ASF与DriveFuzz并未阐明人工归因分析的具体流程与方法论，这使得归因分析结果的准确性难以得到保证.

为切实提高仿真模糊测试的可用性和可靠性，本文面向上述3大缺陷提出针对性的解决思路. 具体而言，在第3～5节中，本文分别剖析了优化种子场景生成模块、事故分类模块与事故归因模块所面临的挑战，并提供了可行的解决思路. 为论证这些思路的可行性与先进性，本文尝试在主流开源无人驾驶系统Apollo和Autoware开展实验并与现有工作的方案进行对比. 此外，本文将根据实验论证的结果进一步展望仿真模糊测试领域的发展方向.

3. 种子场景生成：挑战、实践与展望

3.1 挑　战

如2.1节所述，仿真模糊测试依赖种子场景作为初始输入. 然而，现有的无人驾驶相关的公开数据集^[51–59]主要提供原始传感器数据（如相机、激光雷达等），这些数据可以用于训练和测试无人驾驶系统内的机器学习算法（如对象检测和追踪），但不能直接用于仿真测试. 因此，现有的仿真模糊测试工作中所使用的种子场景普遍是研究者根据自身经验手动或随机构建的简单场景，极大地限制了仿真模糊测试的事故场景挖掘能力. 然而，为仿真模糊测试自动化准备高质量的种子场景绝非易事，所构建的种子场景应该满足2个基本特性：

挑战1. 满足高保真性. 仿真场景是现实世界驾驶场景的数字化版本，其应当符合真实世界中可能存在的驾驶情况. 为了满足该需求，安全测试人员通常需要参考已有的交通事故报告或路测报告，以繁重的人工成本在仿真环境中进行等价的还原.

挑战2. 满足语法正确性. 对于仿真测试而言，虚拟场景的参数配置应该被编码成规范的格式（如OpenSCENARIO^[36]），否则仿真器不能接受其作为输入. 这些格式规范往往有着复杂的语法约束，例如，一个简单的变道超车场景需要200多行格式良好的代码来进行参数配置.

3.2 基本思路

针对3.1节所述的2个挑战，本文提出了一种自动化的种子场景构建方法. 该方法的核心思路是，从真实世界的交通轨迹数据集^[60-61]中收集指定路段上可能出现的交通参与方（车辆或行人）的运动行为，以此作为仿真场景参数配置的数据参考. 这类轨迹数据通常由车端或路端记录仪在真实道路上实时捕捉所得，因此可以准确地反映真实世界中可能存在的复杂交通流模式. 参考这类数据来配置仿真场景的交通模拟参数可以极大地确保场景的保真性.

交通轨迹数据集主要以带时间戳的GPS坐标序列来描述各交通参与方的行为：

$\{{Entity}_{i}:\left[\left({gps}_{{i}_{0}},{t}_{{i}_{0}}\right),\left({gps}_{{i}_{1}},{t}_{{i}_{1}}\right),… \right],{Entity}_{j}:\left[… \right],… \},$

其中，Entity表示交通参与方，gps表示经纬地理坐标，t表示时间戳.

在构建种子场景时，本文尝试基于现有的地图转换工具^[62]，将交通轨迹相关的路段地图（如Lanelets格式^[39]）转换为等价的仿真地图格式（如OpenDrive格式^[37]），并在该仿真地图上灵活地布置这些具有特定运动行为的交通参与方，以此完成交通模拟参数的配置. 然而，这些轨迹数据通常被存储于自定义格式的CSV文件中，并不兼容仿真场景参数配置的格式规范（见1.3节）. 此外，这些轨迹数据的坐标系通常与仿真场景所需的坐标系不同. 因此，为进一步保证仿真场景配置的语法正确性，交通参与方的GPS坐标序列须进行正确的坐标转换（如从UTM坐标系转换为局部坐标系），并按照仿真场景的语法格式规范进行参数配置.

图3展示了自动化种子场景构建的一般流程. 值得注意的是，除交通模拟参数和地图参数外，本文将随机生成仿真场景的自然环境参数（如天气），使用仿真器和无人驾驶系统提供的无人车物理学和动力学模型，并随机生成其余无人车模拟参数（如驾驶的起始位置）. 最终，基于仿真场景描述性语言（如OpenSCENARIO^[36]）的语法模板（如XSD文件），本文将上述参数实例化为种子场景配置文件（如XML文件），以作为模糊测试的输入.

图 3 自动化种子场景构建概览

Figure 3. Overview of automated seed scenario construction

下载: 全尺寸图片幻灯片

3.3 实验设计

本文尝试证明3.2节所述的方法所得的种子场景能够提升仿真模糊测试技术的事故场景挖掘能力. 为实现该目标，本文尝试将所得种子场景与现有工作使用的种子场景分别作为同一款仿真模糊测试工具的输入，并面向相同的无人驾驶系统进行事故场景挖掘.

在仿真模糊测试工具方面：本文基于LGSVL模拟器实现，通过4 000行左右的Python代码实现了基本的仿真模糊测试工具. 在实现该工具时，本文参考了领域内的前沿工作DriveFuzz^[19]，并进一步丰富了其场景变异的模式（如变更光照强度等）. 值得注意的是，该实验的目标是衡量种子质量对于模糊测试结果的影响. 因此，参考传统模糊测试领域的实践方式^[47]，本文禁用了DriveFuzz的种子调度机制，以免对实验结果造成干扰.

在待测无人驾驶系统方面：本文挑选了2款主流的高级别无人驾驶系统作为测试对象，Apollo 6.0和Autoware 1.15.

在待测种子场景方面：实验生成了50个适用于模拟器LGSVL的仿真场景作为待测种子. 这些种子场景基于数十种地图进行构建，拥有不同的道路结构（如单车道、合并车道、交通路口等）、车流模式（如跟车、转弯、变道超车、紧急停车等）、车辆类型（如汽车、卡车、自行车等）和天气状况（如晴天、雨天、雾天）等.

另外，本文尝试从现有工作中获取可用的种子场景用于实验对比. 此处，只有AV-FUZZER和AutoFuzz开源了可用的场景配置文件. 因此，本文最终获取了AV-FUZZER的2个种子场景和AutoFuzz的4个种子场景，并以这6个种子场景作为实验的参照组.

为便于理解，图4直观地展示了来自AV-FUZZER、AutoFuzz及本文构建的部分场景种子的俯视图（蓝色车辆为无人车，蓝色箭头代表预期驾驶任务）.

图 4 现有工作和本文工作的种子场景对比

Figure 4. Comparison of seed scenarios from existing works and our work

下载: 全尺寸图片幻灯片

在实验设置与环境方面：以各种子场景作为仿真模糊测试工具的输入，本文独立进行时长为3 h的仿真模糊测试，并收集产生的事故场景数量. 所有的实验评估都在Ubuntu 18.04服务器上进行，该服务器有314 GB 内存、4个GPU核心（NVIDIA GeForce RTX 2080 Ti）和40 个 CPU 核心（Intel Xeon Gold 5215，2.50 GHz）.

3.4 实验结果与分析

如表2所示，参照本文思路构建的各种子场景在3 h内平均可发现Apollo的80.3例事故场景和Autoware的84.9例事故场景，远高于AV-FUZZER和AutoFuzz的种子场景在相同实验配置下产生的事故数量. 例如，本文种子场景在Apollo系统上的碰撞数量相较现有工作的种子场景分别提升了203%和351%. 该数据直观地表明本文构建的种子场景更利于事故场景的挖掘.

表 2 种子场景质量的评估结果

Table 2. Assessment Results on Seed Scenarios Quality

种子来源	种子数量	3 h平均碰撞数量（Apollo）	3 h平均碰撞数量（Autoware）
本文思路	50	80.3	84.9
AV-FUZZER	2	26.5	0.5
AutoFuzz	4	17.8	26.5

下载: 导出CSV

| 显示表格

经分析，本文发现导致该差异的主要原因是，现有工作使用的初始场景往往交通状况简单且场景元素匮乏，故需要进行繁多的变异操作后才能增加无人车与周围环境或交通参与方的交互频率，以此提高事故发生的概率. 然而相比之下，依照本文思路构建的种子场景反映了真实世界的交通路况，其场景元素复杂且交通参与方行为多样，即初始的场景配置就对无人驾驶系统的感知、规划与控制造成了不小的挑战. 因此，该类场景仅需少量的变异操作，就极有可能触发无人驾驶系统的缺陷，继而导致事故的发生.

3.5 未来展望

如表2所示，本文构建的种子场景的平均事故挖掘能力远高于现有工作的种子场景. 然而，本文发现，不同种子的事故挖掘能力存在巨大差异. 例如，在本文构建的50个种子场景中，某种子场景在3h内无法挖掘到任何事故，而某种子场景可成功挖掘到200余例事故场景. 鉴于此，若能在仿真模式测试前对种子场景的事故挖掘能力进行预测，则能够极大地提升测试的有效性. 在二进制模糊测试的领域，现有工作^[49,63]往往在测试前基于代码覆盖率对种子质量进行预测评估. 与此不同的是，无人驾驶仿真测试具有更多可参考的信息要素（如场景语义和系统代码），如何妥当地利用这些要素实现种子场景的遴选是该领域内有待探索的方向之一.

4. 事故分类：挑战、实践与展望

4.1 挑　战

在传统的模糊测试领域，长时间的测试极有可能产生大量的程序崩溃，且其中不乏相似的崩溃. 为避免不必要的分析开销，相关工作普遍依赖崩溃去重技术^[46-47]实现相似崩溃的聚类. 类似地，如3.4节的实验结果所示，面向无人驾驶系统的仿真模糊测试也极有可能挖掘到大量的事故场景，亟需事故分类技术实现相似事故的聚类.

挑战：事故场景元素众多，难以自动确认事故相关要素. 在交通领域^[64]，相关人员通常需要确认事故主体（对事故发生产生直接或间接影响的交通参与方）和事故特性（地点与危害程度）来完成交通事故的分类. 然而，在仿真事故场景中，场景元素通常复杂繁多，难以实现对该类信息的提取与甄别，进而导致仿真事故场景的分类困难.

4.2 基本思路

针对4.1节所述的难点，本文提出了一种自动化的事故要素分析（即事故主体与事故特性）与事故场景分类方案，该方案主要适用于碰撞类事故. 首先，当在仿真环境中观测到无人车碰撞事故时，本文会立即通过仿真器所提供的应用程序接口 (API) 记录必要的事故特性. 这些特性主要包括：碰撞发生的具体地点（如车辆所在的道路编号）、碰撞的角度（如两车车头的夹角）和碰撞速度. 随后，本文尝试分析各交通参与方与事故发生之间的关联性，从而确认事故主体. 具体而言，该方法将逐个变更交通参与方的运动行为（随机改变速度和轨迹点），若行为变更后碰撞事故不再发生或事故特性改变，则认为该交通参与方为事故主体之一. 通过上述这种“调整-重放”式的分析策略，本文能够可信地确认交通参与方的运动行为与事故发生之间的相关性.

最终，本文根据事故特性和事故主体的一致性，实现碰撞事故的自动化聚类. 具体地说，本文提取发生碰撞所在道路序号来标识碰撞地点，以追尾（0°~60°）、侧撞（60°~120°）与对撞（120°~180°）这3类情况来描述碰撞角度，以低速碰撞（0~30 km/h）、中速碰撞（30~60 km/h）和高速碰撞（60 km/h以上）这3类情况来描述碰撞速度. 当且仅当碰撞所在的道路序号、碰撞角度情况和碰撞速度情况都相同时，2例无人车碰撞事故才被认为具有相同的事故特性. 对于事故主体的一致性分析，本文主要判断主体类型和主体数量是否一致.

4.3 实验设计

本文尝试证明4.2节所述的方案能够帮助实现准确的事故分类. 因现有的仿真模糊测试工作中仅AutoFuzz尝试实现自动化的事故分类，本文尝试将本文所提方案与AutoFuzz进行对比，以体现其优势.

在AutoFuzz事故分类方案方面：AutoFuzz提出，如果2个事故场景配置的参数中至少有x%是不同的（x%是人工设置的阈值），则认为这2个事故场景不是同一类型. 参照AutoFuzz的原文^[18]实现，本文将该阈值设置为10%. 与本文所提方案的区别在于，AutoFuzz并不会区分事故主体，也不会甄别事故特性，其考虑仿真场景中所有的元素作为事故相似性的判断依据.

在待分类事故场景方面：本文从第3节的仿真模糊测试结果中人工标注并筛选出了50种不同类型的碰撞事故，每个事故种类包含了10例事故场景. 基于这500例事故场景，本文尝试开展AutoFuzz事故分类方案和本文所提方案的对比实验.

在分类评估指标方面：为了评估事故分类的效果，本文主要使用了聚类分析领域的常用指标^[65]，即平均准确率（又称纯净度）和平均召回率（又称倒纯净度）. 具体地说，平均准确率可以有效衡量不同类型的事故是否会被错误地分到同一类中，平均召回率可以有效衡量同一类型的事故是否会被错误地分到不同类中. 因这2个指标涵盖了事故分类中所有可能出现的分类错误情况，本文可以客观地衡量不同分类方案的可靠性. 基于上述定义，平均准确率和平均召回率的计算方式为：

${Precision}_{{\rm{avg}}}=\sum_{{j}}\frac{\left|{{C}}_{j}\right|}{{N}}\underset{i}{\mathrm{max}}\left\{\frac{\left|{L}_{i}\cap {C}_{j}\right|}{\left|{C}_{j}\right|}\right\}$

${Recall}_{{\rm{avg}}}=\sum_{{i}}\frac{\left|{{L}}_{{i}}\right|}{{N}}\underset{j}{\mathrm{max}}\left\{\frac{\left|{L}_{i}\cap {C}_{j}\right|}{\left|{L}_{i}\right|}\right\}$

其中， ${C}_{j}$ 是第 ${j}$ 个实验聚类， ${L}_{i}$ 是第 ${i}$ 个基准分类，N是聚类中的元素总数.

在实验设置与环境方面：本文使用3.3节中介绍的服务器开展该实验.

4.4 实验结果与分析

本实验的评估结果如表3所示. 由该表可知，本文方案的平均准确率和平均召回率远高于AutoFuzz. 为了便于理解，下面将通过2个反例分析AutoFuzz分类效果不佳的根本原因.

表 3 事故分类的评估结果

Table 3. Assessment Results on Accident Triage

分类方法	分类数	平均准确率/%	平均召回率/%
本文思路	74	100.0	94.8
AutoFuzz	196	52.4	55.4
注：如4.3节所述，基准分类数应为50.

下载: 导出CSV

| 显示表格

1）AutoFuzz平均准确率较低. 如图5所示，对于参数配置高度相似但实则代表不同事故的场景，AutoFuzz会错误地将其归类为同一类型的事故. 其根本原因在于，AutoFuzz无法鉴别事故主体与事故特性.

图 5 不同事故误分为同一类

Figure 5. Inequivalent accidents misclassified into the same category

下载: 全尺寸图片幻灯片

2）AutoFuzz平均召回率较低. 类似地，如图6所示，当场景中存在较多事故无关的主体时，AutoFuzz极有可能认为2个事故场景代表着不同类型的交通事故.

图 6 同种事故误分为不同类

Figure 6. Equivalent accidents misclassified into different categories

下载: 全尺寸图片幻灯片

此外，本文方案也存在将同一类型事故错误分到不同类别的情况，即平均召回率并非100%. 经过细致的案例分析，本文发现其主要的原因在于，部分无人车相关的碰撞事故是概率性的. 如4.2节所述，本文主要通过多次的事故重放来推断各交通参与方是否为事故主体. 因概率性事故的重放结果并不稳定，这极易导致事故主体的判断错误，进而误导事故分类.

4.5 未来展望

值得注意的是，本文在进行事故分类时，仅参考仿真场景的语义信息（事故主体和事故特性），而忽略了无人驾驶系统的内部执行状态. 这意味着，不同系统缺陷导致的交通事故有可能被归为同一类，进而在后续的缺陷确认环节中被忽略. 因此，如何结合场景的语义信息与系统内部的执行信息来完成鲁棒的事故分类也是亟待探索的课题之一.

5. 事故归因分析：挑战、实践与展望

5.1 挑　战

传统的模糊测试工具通常依赖内存错误检测工具（如AddressSanitizer^[48]）来确认崩溃发生的代码位置，以此辅助程序缺陷的确认与修复. 同样地，对于仿真模糊测试而言，定位导致交通事故的系统缺陷位置对无人驾驶安全性的提升至关重要. 然而，据现有研究^[66]显示，无人驾驶系统中易致使交通事故的缺陷通常为逻辑缺陷，其不会引发显式的内存错误或系统崩溃，因此无法用常规的内存错误检测工具来进行缺陷代码位置的定位. 鉴于此，仿真模糊测试亟需定制化的事故归因分析能力来提升其安全应用价值.

挑战：无人驾驶系统的复杂性. 无人驾驶系统是代码和模型深度耦合的复杂智能系统，其往往具有庞大的代码量，使得藏匿其中的系统缺陷难以被发现. 例如，Apollo开源无人驾驶系统拥有数十万行的代码. 现有的仿真模糊测试工作（如ASF和DriveFuzz）依赖专家经验进行人工的缺陷定位，这不仅需要对无人驾驶系统的模块架构具有深入的了解，还需要对海量的被执行代码进行准确逻辑语义分析. 同时，因这些工作并未提供人工分析的方法论和细节步骤，其可借鉴性十分有限.

5.2 基本思路

尽管不同的高级别无人驾驶系统在代码实现上截然不同，但如1.1节所述，它们的系统模块结构和各模块的预期功能普遍高度相似. 其中，感知模块主要负责确认车身周围障碍物位置；预测模块主要推断障碍物未来的运行轨迹；规划模块主要确定无人车的安全行驶路线；控制模块主要根据规划路线生成对应的车辆控制指令. 鉴于此，本文实现了模块级别的自动化缺陷定位，以此提高该方案在不同无人驾驶系统间的可移植性. 该类模块级别的缺陷定位可极大地辅助缺陷的诊断与修复.

该方案的核心思路为：实时地监控并比对仿真场景中各元素的真实状态（仅考虑事故主体，见4.2节）以及无人驾驶系统的模块执行信息，以此判断无人驾驶系统各功能模块实际运行效果与预期功能的差距（简称为模块功能差距），最终将功能差距最大的模块视为事故主责模块（即缺陷模块）. 为准确地定义模块功能差距，本文归纳了不同系统模块的预期功能，并借助仿真模糊测试可实时观测、可重放的特性实现了模块功能差距的计算，具体为：

1）感知模块功能差距. 正常运作的感知模块旨在准确定位无人车周围所有障碍物的具体位置. 为计算该模块的功能差距，本文在仿真器中实时观测各障碍物的真实位置信息作为预期数据，同时在无人驾驶系统中截取感知模块计算所得的障碍物位置信息作为实际运行数据，最终计算这2类信息中各障碍物的位置坐标的平均距离作为感知模块功能差距.

2）预测模块功能差距. 正常运作的预测模块旨在准确预测无人车周围物体的未来运动轨迹. 为计算该模块的功能差距，本文尝试重放事故场景，记录仿真器中每一时刻各物体的真实未来运动轨迹作为预期数据，同时截取预测模块计算所得的未来轨迹作为实际运行数据，最终计算这2类信息中平均的轨迹差异作为预测模块功能差距. 在衡量轨迹之间的差异时，本文主要计算两轨迹上具有相同时间戳的坐标点之间的平均距离.

3）控制模块功能差距. 正常运作的控制模块旨在准确按照无人驾驶系统规划的行驶路径来控制无人车的行进. 为计算该模块的功能差距，本文截取规划模块计算所得的行驶路径作为预期数据，同时在仿真器中记录无人车的真实运行轨迹作为实际运行数据，最终计算这2类信息中无人车的轨迹差异作为控制模块功能差距. 类似地，此处仍然计算2轨迹上具有相同时间戳的坐标点之间的平均距离作为轨迹差异.

4）规划模块缺陷判断. 值得注意的是，正常运作的规划模块旨在计算出可达目的地的安全驾驶路径. 在没有任何人工分析的辅助下，该模块的预期表现是难以定性的. 因此，本文在进行归因分析时，首先依次计算上述3种模块的功能差距. 若这3种模块的功能差距都小于一定阈值（阈值的设置见5.3节），即认为缺陷不存在于这3种模块中，并参考现有工作^[67-68]计算各时间节点无人车的可行驶空间，以此判断是否为规划模块缺陷. 具体地说，若不存在任何可行驶空间但仍然发生了碰撞（例如堵车时被后车追尾），则认为这不是无人车负主责的事故，即该事故不是由规划模块缺陷导致；反之，本文则认为规划模块是该碰撞事故的主责模块.

5.3 实验设计

现有的仿真模糊测试在汇报了事故场景后，通常仅依靠纯人工的方式进行归因分析. 因此，在本实验中，本文尝试将所提归因分析方案与人工分析做对比，以体现本文方案优势.

在人工事故归因分析方面：给定仿真环境下的无人车碰撞事故，本文总计邀请了4位无人驾驶系统领域的专家来分析事故对应的缺陷模块. 他们都曾为主流开源无人驾驶系统Apollo或Autoware提交过漏洞修复的commit，对这2款无人驾驶系统的模块结构与代码实现有着较深的了解. 具体地说，为避免人工分析的错误，各事故场景的归因分析结果将由2位专家进行交叉验证. 该人工验证所得的事故主责模块也将作为衡量本文所提方案的基准数据.

在待归因事故场景方面：本文从4.3节所述的50类交通事故中，各随机挑选了1例事故场景作为待归因分析的对象. 同类事故中，虽然不同事故场景的场景参数不同，但它们的事故特性和事故主体一致，极大概率是由相同的无人车系统缺陷导致的碰撞. 因此，本文仅从每类事故中选取1例作为归因分析的对象. 此外，这50例碰撞事故涵盖了不同的交通路况、无人车驾驶任务以及环境状态，能够全面且可信地评估事故归因分析方案的可靠性.

在阈值设置方面：在该实验中，本文统一将感知模块、预测模块以及控制模块的功能差距阈值设置为1 m. 特别地，若感知模块或预测模块出现了严重的运行时错误（如完全无法探知某物体的存在与运动轨迹或认为空旷处存在某物体），本文直接将相应的模块视作事故主责模块.

在实验环境方面：本文使用3.3节和3.4节中介绍的服务器开展该实验.

5.4 实验结果与分析

表4展示了本实验的评估结果. 本文能够正确分析出44例事故的主责模块. 虽然该准确率（44/50）略低于专家分析，但本文所提的自动化工具不要求测试人员具有丰富的无人驾驶安全领域知识，具有高度的灵活性与可用性. 本文分析了6例归因错误的事故场景，发现错误原因主要有2类：1）其中4例由可行驶空间计算的错误导致. 具体地说，在计算可行驶空间时，本文并未考虑无人车所在道路是否可以变道或逆行，结果导致无法规避的碰撞事故被错误地认为是由规划模块缺陷导致的事故. 2）剩余2例事故场景中，本文发现功能差距最大的模块并非事故主责模块. 这2例事故均为高速驾驶场景，在碰撞前空旷路段的直线高速行驶过程中，因不可避免的系统延时导致控制模块的功能差距高达2.3 m以上. 然而，碰撞发生的关键原因是，无人驾驶系统没有准确预测前车的减速行为. 虽然该预测误差仅为0.9 m左右，但直接导致了无人车没有及时刹车，造成追尾碰撞.

表 4 事故归因分析的评估结果

Table 4. Assessment Results on Accident Root Cause Analysis

归因方法	事故数	归因正确的事故数	准确率/%	平均分析时间/h
本文思路	50	44	88	0.05
人工分析	50	47	94	4.40
注：在人工分析过程中，有3例事故经专家交叉验证后才定位到了正确的事故主责模块.

下载: 导出CSV

| 显示表格

此外，由表4可知，本文所提的自动化方案平均仅需0.05 h就可完成1例事故场景的归因分析. 相比之下，具有丰富领域知识的安全专家需要约4.4 h才可完成这一分析任务. 这直接表明，本文工作能够大幅度地提高事故归因分析的效率，降低事故分析的人工成本.

5.5 案例分析

图7展示了本文工作从Apollo 6.0中找到的1处代码缺陷，场景如图7（b）所示. 在无人车经过一处交叉路口时，右侧同时横向驶来一辆速度极慢的灰色车辆，无人车理应观察并预测到该车辆将出现在前方规划的道路上，并做出减速决策. 然而，Apollo系统并没有对该车辆进行任何的轨迹预测，导致无人车径直驶过十字路口，并最终与灰色车辆产生碰撞.

图 7 Apollo 6.0中的设计缺陷示例

Figure 7. An example design flaw in Apollo 6.0

下载: 全尺寸图片幻灯片

本文通过采用所提的事故归因分析方法，将导致该场景的缺陷定位于预测模块. 随后，经过人工的模块内代码分析，定位于缺陷代码的位置. 如图7（a）所示，在对周围驾驶车辆进行预测时，Apollo定义了静止障碍物速度阈值来对抗扰动，将低于该速度的车辆统一认定为静止的障碍物. 然而，Apollo关于该阈值的默认值（3.6 km/h）较高. 该不合理的设置将导致系统无法对一些低速车辆进行轨迹预测，从而有可能导致交通事故的发生.

5.6 未来展望

本文所提的归因分析方案仅能定位到事故的缺陷模块，而非具体的代码片段. 虽然该模块定位信息能够辅助缺陷的确认与修复，但仍然需要较多的人力进行模块内代码的溯源分析. 鉴于此，本文认为未来工作可以着眼于模块内的缺陷根源分析，通过充分理解事故场景的语义信息，结合模块内代码执行的控制流与数据流信息，实现更细粒度的缺陷定位.

6. 总　　结

面向无人驾驶系统的仿真模糊测试技术旨在将传统的模糊测试技术与仿真测试技术结合，自动地挖掘与分析易导致交通事故的无人驾驶系统缺陷. 然而，该研究领域仍处于起步阶段，现有工作仍然存在较大缺陷，制约了其安全应用. 鉴于此，本文首先尝试构建仿真模糊测试的框架，其包含种子场景生成、事故挖掘、事故分类和事故归因分析四大关键模块. 随后，本文系统性地分析了现有工作在实现四大模块时的不足之处. 最终，本文尝试提出可行的解决思路，并将这些思路直接用于主流开源无人驾驶系统的安全测评，以体现其可行性和优越性. 结合实际的安全测评结果，本文进一步指出该领域未来可能的发展方向，为后续的研究工作提供可靠的指导意见.

作者贡献声明：戴嘉润负责论文的框架设计、实验设计以及论文撰写；李忠睿负责论文初稿撰写、图表绘制和实验数据统计；张琬琪参与了论文的修改润色；张源与杨珉关于论文选题和写作提供了指导性建议.

图 1 基于元学习的算法选择框架

Figure 1. Framework of algorithm selection based on meta-learning

下载: 全尺寸图片幻灯片

图 2 SAMO算法选择流程

Figure 2. Algorithm selection process of SAMO

下载: 全尺寸图片幻灯片

图 3 集成元算法构建过程

Figure 3. Construction process of ensemble meta-learner

下载: 全尺寸图片幻灯片

图 4 个体编码方式

Figure 4. Coding pattern of individuals

下载: 全尺寸图片幻灯片

图 5 m(t)变化趋势

Figure 5. Change trend of m(t)

下载: 全尺寸图片幻灯片

图 6 搜索边界变化趋势

Figure 6. Change trend of search boundary

下载: 全尺寸图片幻灯片

图 7 稀疏度计算示意图

Figure 7. Schematic diagram of sparsity calculation

下载: 全尺寸图片幻灯片

图 8 SAMO流程

Figure 8. Process of SAMO

下载: 全尺寸图片幻灯片

图 9 不同多样性指标时的帕累托解数量

Figure 9. Pareto solution numbers of different diversity indicators

下载: 全尺寸图片幻灯片

图 10 不同基分类器个数时的错误率

Figure 10. Error rates of different base classifier numbers

下载: 全尺寸图片幻灯片

表 1 预测结果列联表

Table 1 Contingency Table of Prediction Results

b_j预测结果	b_i预测结果
b_j预测结果	b_i（x_k）= y_k	b_i（x_k）≠ y_k
b_j（x_k）= y_k	c	p
b_j（x_k）≠ y_k	q	d

下载: 导出CSV

表 2 实验数据集信息

Table 2 Information of Experimental Datasets

序号	数据集	属性数	实例数	类数	序号	数据集	属性数	实例数	类数	序号	数据集	属性数	实例数	类数
1	abalone	8	4177	29	88	divorce	54	170	2	175	online-shoppers	17	12330	2
2	absenteeism	20	740	18	89	dna	180	3186	3	176	optdigits	64	3823	10
3	ada-agnostic	48	4562	2	90	dry-bean	16	13611	7	177	ozone-1hr	72	2536	2
4	advertisement	1558	3279	2	91	echocardiogram	11	75	3	178	ozone-8hr	72	2534	2
5	aids	4	50	2	92	ecoli	7	336	8	179	page-blocks	10	5473	5
6	allrep	29	3772	4	93	eeg-eyestate	14	14980	2	180	parkinson-speech	26	1040	2
7	amazon-employ	9	32769		94	electricity	8	45132	2	181	pc1	21	1109	2
8	acd-assessment	15	13	4	95	energy-eff	9	768	37	182	pc3	37	1563	2
9	acd-authorship	70	841	4	96	engine1	5	383	3	183	pc4	37	1458	2
10	acd-bankruptcy	6	50	2	97	eucalyptus	19	736	5	184	penbased	16	10992	10
11	acd-birthday	3	365	7	98	fabert	800	8237	7	185	phishing-websites	30	2456	2
12	acd-bondrate	11	57	5	99	first-order	51	6118	6	186	phoneme	5	5404	2
13	acd-boxing1	3	120	2	100	flag	28	194	8	187	pima	8	768	2
14	acd-boxing2	3	132	2	101	flare	11	1066	6	188	polish-bankruptcy1	64	7027	2
15	acd-braziltour	8	412	7	102	gas-drift	128	13910	6	189	polish-bankruptcy5	64	5500	2
16	acd-broadway	9	95	5	103	german	20	1000	2	190	popularkids	10	478	3
17	acd-broadwaym	7	285	7	104	gesture-phase	32	9873	5	191	post-operative	8	90	3
18	acd-chall101	2	138	2	105	gina-prior2	784	3468	10	192	primary-tumor	17	339	22
19	acd-creditscore	6	100	2	106	glass	9	214	7	193	prnn-fglass	9	214	6
20	acd-currency	3	31	7	107	haberman	3	306	2	194	ring	20	7400	2
21	acd-cyyoung8	10	97	2	108	hayes-roth-test	4	28	4	195	risk-factors	35	858	26
22	acd-cyyoung9	10	92	2	109	hayes-roth-train	4	132	4	196	rmftsa-sleep	2	1024	4
23	acd-dmft	4	797	6	110	hcv-egyptian	28	1385	4	197	robot-failures-lp4	90	117	3
24	acd-draft	4	365	12	111	heart-statlog	13	270	2	198	saheart	9	462	2
25	acd-esr	2	32	2	112	helena	27	65196	100	199	sat11-hand-runtime	115	296	14
26	acd-germangss	5	400	4	113	hepatitis	19	155	2	200	satimage	36	6435	7
27	acd-halloffame	17	1340	3	114	hill-valley	100	1212	2	201	sat-test	36	2000	6
28	acd-homerun	26	162	2	115	horse-colic-test	27	68	2	202	sat-train	36	4435	6
29	acd-lawsuit	4	264	2	116	horse-colic-train	27	300	2	203	seeds	7	210	3
30	acd-mapleleafs	1	84	3	117	house-votes	16	232	2	204	semeion	256	1593	10
31	acd-marketing	32	310	5	118	ilpd	10	583	2	205	sensor-readings-24	24	5456	4
32	acd-supreme	7	4052	10	119	image-seg-test	19	210	7	206	sensor-readings-4	4	5456	4
33	acd-votesurvey	4	48	4	120	image-seg-train	19	2100	7	207	servo	4	167	2
34	anneal	38	798	6	121	indian-pines	220	9144	8	208	shuttle	9	58000	7
35	anomalydata-5	4	1050	2	122	internet-usage	70	10108	46	209	shuttle-landing	6	15	2
36	anomalydata-5h	10	1050	2	123	ionosphere	34	351	2	210	smartphone-har	66	180	6
37	appendicitis	7	106	2	124	iris	4	150	3	211	socmob	5	1156	2
38	arrhythmia	279	452	16	125	isolet1234	617	6238	26	212	sonar	60	208	2
39	artificial-charac	7	10218	10	126	isolet5	617	1559	26	213	soybean-large	35	307	19
40	asp-potassco	140	1294	11	127	japanese-vowels	14	9961	9	214	soybean-small	35	47	4
41	audiology	69	226	24	128	jungle-chess-l-e	46	4704	3	215	spambase	57	4597	2
42	australian	14	690	2	129	jungle-chess-p-l	46	4704	3	216	spect-test	22	187	2
43	autism-adult	20	704	2	130	jungle-chess-r-e	46	5880	3	217	spect-train	22	80	2
44	autohorse-fixed	68	201	186	131	kc1	21	2109	2	218	spectf-test	44	269	2
45	automobile	25	205	7	132	kc2	21	522	2	219	spectf-train	44	80	2
46	autouniv1-1000	20	1000	2	133	kr-vs-kp	36	3196	2	220	spectrometer	101	531	48
47	autouniv4-2500	100	2500	3	134	kropt	6	28056	18	221	speech	400	3686	2
48	autouniv6-1000	40	1000	8	135	leaf	15	340	30	222	splice	60	3190	3
49	autouniv6-750	40	750	8	136	leaves-margin	64	1600	100	223	steel-plates-faults	27	1941	7
50	autouniv7-1100	12	1100	5	137	leaves-shape	64	1600	100	224	student-mat	30	395	21
51	autouniv7-500	12	500	5	138	leaves-texture	64	1600	100	225	student-por	30	649	21
52	bach-choral	16	5665	102	139	led24	24	3200	10	226	surveillance	7	15	3
53	balance-scale	4	625	3	140	led7digit	7	500	10	227	synthetic-control	60	600	6
54	ballon	4	16	2	141	lense	5	24	3	228	tae	5	151	3
55	banana	2	5300	2	142	letter	16	20000	26	229	tamilnadu	3	45781	20
56	bank-marketing	16	45211	2	143	libras-move	90	360	15	230	texture	40	5000	11
57	banknote	4	1372	2	144	lung-cancer	56	32	3	231	thyroid	21	7200	3
58	biodeg	41	1055	2	145	lupus	3	87	2	232	thyroid-allbp	26	2800	5
59	blood-trans	4	748	2	146	lymphography	18	148	4	233	thyroid-allhyper	26	2800	5
60	breast-cancer	9	286	2	147	madelon	500	2600	2	234	tic-tac-toe	9	958	2
61	breast-cancer-w	9	699	2	148	magic	10	19020	2	235	titanic	3	2201	2
62	bupa	6	345	2	149	marketing	13	8993	9	236	toronto-apartment	6	1124	188
63	cacao	8	1795	42	150	mc1	38	9466	2	237	touch2	10	265	8
64	calendar-dow	32	399	5	151	meta-all	62	71	6	238	trains	32	10	2
65	car	6	1728	4	152	meta-stream	74	45164	13	239	twonorm	20	7400	2
66	car-evaluation	21	1728	4	153	mfeat-fac	216	2000	10	240	unix-user	2	9100	9
67	cardiotocograph	35	2126	3	154	mfeat-fou	76	2000	10	241	user-knowledge	5	403	5
68	castmetal1	37	327	2	155	mfeat-kar	64	2000	10	242	usps	256	9298	10
69	chess	36	3196	2	156	mfeat-mor	6	2000	10	243	vehicle	18	846	4
70	churn	20	5000	2	157	mfeat-pix	240	2000	10	244	vehicle-reproduced	18	846	4
71	clean2	165	6598	2	158	mfeat-zer	47	2000	10	245	volcanoes-a1	3	3252	4
72	cleveland	13	297	5	159	miceprotein	76	1080	8	246	volcanoes-d2	3	9172	4
73	click-prediction	9	39948	2	160	micro-a2	20	20000	5	247	volcanoes-e2	3	1080	4
74	climate-model	20	540	2	161	micro-mass	1300	571	20	248	vowel	13	990	11
75	cmc	9	1473	3	162	monks1-test	6	122	2	249	walking-activity	4	149332	22
76	cnae9	856	1080	9	163	monks1-train	6	124	2	250	waveform	21	5000	3
77	coil2000	85	9822	2	164	monks2-test	6	432	2	251	waveform-noise	40	5000	3
78	colleges-aaup	14	1161	4	165	monks2-train	6	169	2	252	wdbc	30	569	2
79	collins	19	1000	30	166	monks3-test	6	432	2	253	wifi-localization	7	2000	4
80	contraceptive	9	1473	3	167	monks3-train	6	122	2	254	wilt	5	4339	2
81	cpmp-2015	24	527	4	168	mozilla4	5	15545	2	255	wine	13	178	3
82	credit-card	23	30000	2	169	mushroom	22	8124	2	256	winequality-r	11	1599	10
83	crx	15	653	2	170	newthyroid	5	215	3	257	winequality-w	11	4898	10
84	cylinder-bands	19	539	2	171	nursery	8	12960	5	258	wpbc	32	198	2
85	dbworld-bodies	64	3721	2	172	obs-network	20	1075	4	259	yeast	8	1484	13
86	dermatology	34	366	6	173	oil-spill	49	937	2	260	zoo	16	101	7
87	diggle-table-a2	8	310	9	174	olivetti-faces	4096	400	40

下载: 导出CSV

表 3 元特征信息

Table 3 Information of Meta-Features

元特征类型	元特征名称
基于统计和信息论的元特征	attr_conc.mean，attr_conc.sd，attr_ent.mean，attr_ent.sd，attr_to_inst，can_cor.mean，can_cor.sd，cat_to_num，class_conc.mean，class_conc.sd，class_ent，cor.mean，cor.sd，cov.mean，cov.sd，eigenvalues.mean，eigenvalues.sd，eq_num_attr，freq_class.mean，freq_class.sd，g_mean.mean，g_mean.sd，gravity，h_mean.mean，h_mean.sd，inst_to_attr，iq_range.mean，iq_range.sd，joint_ent.mean，joint_ent.sd，kurtosis.mean，kurtosis.sd，lh_trace，mad.mean，mad.sd，max.mean，max.sd，mean.mean，mean.sd，median.mean，median.sd，min.mean，min.sd，mut_inf.mean，mut_inf.sd，nr_attr，nr_bin，nr_cat，nr_class，nr_cor_attr，nr_disc，nr_inst，nr_norm，nr_num，nr_outliers，ns_ratio，num_to_cat，one_itemset.mean，one_itemset.sd，p_trace，range.mean，range.sd，roy_root，sd.mean，sd.sd，sd_ratio，skewness.mean，skewness.sd，sparsity.mean，sparsity.sd，t_mean.mean，t_mean.sd，two_itemset.mean，two_itemset.sd，var.mean，var.sd，w_lambda
基于决策树的元特征	leaves，leaves_branch.mean，leaves_branch.sd，leaves_corrob.mean，leaves_corrob.sd，leaves_homo.mean，leaves_homo.sd，leaves_per_class.mean，leaves_per_class.sd，nodes，nodes_per_attr，nodes_per_inst，nodes_per_level.mean，nodes_per_level.sd，nodes_repeated.mean，nodes_repeated.sd，tree_depth.mean，tree_depth.sd，tree_imbalance.mean，tree_imbalance.sd，tree_shape.mean，tree_shape.sd，var_importance.mean，var_importance.sd
基于基准的元特征	best_node.mean，best_node.sd，elite_nn.mean，elite_nn.sd，linear_discr.mean，linear_discr.sd，naive_bayes.mean，naive_bayes.sd，one_nn.mean，one_nn.sd，random_node.mean，random_node.sd，worst_node.mean，worst_node.sd
基于问题复杂度的元特征	c1，c2，cls_coef，density，f1.mean，f1.sd，f1v.mean，f1v.sd，f2.mean，f2.sd，f3.mean，f3.sd，f4.mean，f4.sd，hubs.mean，hubs.sd，l1.mean，l1.sd，l2.mean，l2.sd，l3.mean，l3.sd，lsc，n1，n2.mean，n2.sd，n3.mean，n3.sd，n4.mean，n4.sd，t1.mean，t1.sd，t2，t3，t4

下载: 导出CSV

表 4 候选算法胜出次数

Table 4 Win Times of the Candidate Algorithms

候选算法	元数据集
候选算法	$D_{Acc}$	$D_{Pre }$	$D_{Rec }$	$D_{F{\rm{1}} }$	$D_{AR{R_{{1}}}}$	$D_{AR{R_{ {2} } } }$	$D_{AR{R_{ {3} } } }$
kNN	10	15	13	16	45	21	8
RF	106	100	84	94	10	66	98
SVM	37	28	20	21	21	32	32
LR	27	26	25	22	2	21	26
NB	11	13	21	13	51	17	14
LDA	20	24	26	25	66	40	22
ID3	21	27	38	38	65	46	34
MLP	23	18	23	24	0	14	21
CNN	5	9	10	7	0	3	5
注：黑体数值表示最多胜出次数.

下载: 导出CSV

表 5 各算法错误率结果

Table 5 Error Rate Results of the Algorithms %

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	50.3	52.4	54.0	54.4	53.8
D_Pre	54.1	56.7	57.1	57.7	57.2
D_Rec	56.3	58.2	60.1	61.2	59.8
D_F1	51.7	54.4	55.5	56.3	55.8
$D_{AR{R_{ {1} } } }$	51.6	54.3	57.8	59.2	58.9
$D_{AR{R_{ {2} } } }$	55.7	57.9	60.5	60.9	60.8
$D_{AR{R_{ {3} } } }$	50.9	52.2	53.9	54.2	53.8
注：黑体数值表示最优结果.

下载: 导出CSV

表 6 各算法多样性指标结果

Table 6 Diversity Indicator Results of the Algorithms

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	0.561	0.590	0.654	0.64	0.651
D_Pre	0.592	0.628	0.668	0.665	0.662
D_Rec	0.560	0.601	0.636	0.631	0.639
D_F1	0.549	0.582	0.634	0.627	0.637
$D_{AR{R_{ {1} } } }$	0.501	0.521	0.587	0.584	0.579
$D_{AR{R_{ {2} } } }$	0.568	0.601	0.646	0.646	0.657
$D_{AR{R_{ {3} } } }$	0.561	0.598	0.647	0.642	0.638
注：黑体数值表示最优结果.

下载: 导出CSV

表 7 各算法帕累托解数量结果

Table 7 Pareto Solution Number Results of the Algorithms

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	12.6	5.9	6.2	7.2	6.6
D_Pre	9.3	5.5	5.8	7.2	5.8
D_Rec	10.4	5.4	6.1	5.9	6.2
D_F1	12.2	5.6	6.1	5.9	5.7
$D_{AR{R_{ {1} } } }$	9.0	5.2	4.9	5.1	4.8
$D_{AR{R_{ {2} } } }$	10.2	5.7	5.5	6.0	5.1
$D_{AR{R_{ {3} } } }$	11.0	6.0	6.6	6.8	6.3
注：黑体数值表示最优结果.

下载: 导出CSV

表 8 各算法NR结果

Table 8 NR Results of the Algorithms

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	0.743	0.252	0	0.010	0
D_Pre	0.834	0.166	0	0	0
D_Rec	0.713	0.297	0	0	0
D_F1	0.778	0.225	0	0	0
$D_{AR{R_{ {1} } } }$	0.711	0.289	0	0	0
$D_{AR{R_{ {2} } } }$	0.764	0.229	0.010	0	0
$D_{AR{R_{ {3} } } }$	0.757	0.229	0.010	0	0
注：黑体数值表示最优结果.

下载: 导出CSV

表 9 各算法HV结果

Table 9 HV Results of the Algorithms

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	0.209	0.190	0.157	0.160	0.158
D_Pre	0.181	0.158	0.140	0.139	0.142
D_Rec	0.184	0.164	0.141	0.139	0.141
D_F1	0.208	0.186	0.159	0.158	0.157
$D_{AR{R_{ {1} } } }$	0.235	0.215	0.171	0.167	0.170
$D_{AR{R_{ {2} } } }$	0.184	0.164	0.137	0.135	0.132
$D_{AR{R_{ {3} } } }$	0.206	0.186	0.159	0.160	0.162
注：黑体数值表示最优结果.

下载: 导出CSV

表 10 各算法SP结果

Table 10 SP Results of the Algorithms

元数据集	本文算法	MALO	NSGA2	SMPSO	SPEA2
D_Acc	0.013	0.019	0.017	0.024	0.021
D_Pre	0.018	0.014	0.020	0.016	0.018
D_Rec	0.012	0.011	0.019	0.018	0.014
D_F1	0.013	0.021	0.015	0.016	0.022
$D_{AR{R_{ {1} } } }$	0.015	0.016	0.017	0.017	0.022
$D_{AR{R_{ {2} } } }$	0.013	0.011	0.018	0.014	0.018
$D_{AR{R_{ {3} } } }$	0.016	0.023	0.019	0.017	0.018
注：黑体数值表示最优结果.

下载: 导出CSV

表 11 各方法ER结果

Table 11 ER Results of the Methods %

方法	元数据集							排名
方法	$D_{Acc }$	$D_{Pre}$	$D_{Rec}$	$D_{F{\rm{1} } }$	$D_{AR{R_{ {1} } } }$	$D_{AR{R_{ {2} } } }$	$D_{AR{R_{ {3} } } }$	排名
SAMO	50.3	54.1	56.3	51.7	51.6	55.7	50.9	1
kNN	59.2	66.5	68.5	63.8	74.6	73.5	59.6	7
SVM	59.6	61.9	66.9	63.1	78.1	75.4	63.1	8
CART	69.6	71.9	76.2	69.6	64.6	73.1	69.2	9
SVR	59.2	61.5	67.3	63.8	75.0	75.0	62.7	6
RF	55.8	55.4	58.8	54.2	54.2	57.7	54.6	2
RFR	60.0	62.3	63.8	60.8	66.5	71.2	66.9	5
XGB	59.6	57.7	56.9	54.2	54.2	58.1	56.5	4
LGBM	57.7	53.8	60	55.8	53.5	58.8	56.5	3
注：黑体数值表示最优结果.

下载: 导出CSV

表 12 各方法查准率结果

Table 12 Precision Results of the Methods %

方法	元数据集							排名
方法	$D_{Acc }$	$D_{Pre}$	$D_{Rec}$	$D_{F{\rm{1}} }$	$D_{AR{R_{ {1} } } }$	$D_{AR{R_{ {2} } } }$	$D_{AR{R_{ {3} } } }$	排名
SAMO	35.7	35.9	38.5	37.7	38.6	32.8	32.8	1
kNN	16.1	14.2	18.6	21.3	17.4	16.7	18.3	7
SVM	5.0	4.4	7.0	7.5	5.1	2.9	4.4	8
CART	19.9	18.0	17.3	19.7	30.1	21.4	22.3	6
SVR	5.0	4.4	4.7	5.3	7.3	3.0	4.4	9
RF	27.1	42.4	35.9	36.1	34.8	28.8	29.5	2
RFR	27.9	21.0	25.7	23.6	22.9	15.9	12.7	5
XGB	26.7	26.6	40.6	36.3	36.2	30.2	31.1	4
LGBM	27.7	37.3	36.9	37.3	38.1	27.0	29.1	3
注：黑体数值表示最优结果.

下载: 导出CSV

表 13 各方法查全率结果

Table 13 Recall Results of the Methods %

方法	元数据集							排名
方法	$D_{Acc }$	$D_{Pre}$	$D_{Rec}$	$D_{F{\rm{1} } }$	$D_{AR{R_{ {1} } } }$	$D_{AR{R_{ {2} } } }$	$D_{AR{R_{ {3} } } }$	排名
SAMO	28.0	29.7	30.9	31.6	38.9	31.2	27.4	1
kNN	18.8	16.1	17.8	18.9	17.7	17.0	20.8	7
SVM	11.9	11.3	11.9	12.1	15.8	11.3	11.4	8
CART	19.9	20.6	20.5	26.1	31.2	23.1	22.2	6
SVR	12.0	11.4	11.4	11.6	15.8	11.5	11.6	9
RF	22.8	28.9	31.2	29.4	33.4	28.7	25.7	4
RFR	29.4	25.7	25.7	26.5	24.9	17.7	13.9	5
XGB	23.7	27.4	36.3	34.0	34.7	31.2	27.0	2
LGBM	24.4	31.9	31.6	30.6	34.8	29.2	25.9	3
注：黑体数值表示最优结果.

下载: 导出CSV

表 14 各方法F1得分结果

Table 14 F1 Score Results of the Methods %

方法	元数据集							排名
方法	$D_{Acc }$	$D_{Pre}$	$D_{Rec}$	$D_{F{\rm{1} } }$	$D_{AR{R_{ {1} } } }$	$D_{AR{R_{ {2} } } }$	$D_{AR{R_{ {3} } } }$	排名
SAMO	28.0	28.8	29.5	30.4	36.6	29.5	26.4	1
kNN	16.3	13.8	15.0	16.5	16.4	15.0	18.4	7
SVM	7.0	6.2	6.7	7.2	6.1	4.6	6.3	8
CART	18.7	17.8	17.2	20.7	27.9	21.1	20.6	5
SVR	7.0	6.3	5.9	6.4	6.9	4.7	6.4	9
RF	22.5	30	29.6	27.5	32.1	26.5	24.5	4
RFR	25.0	20.9	22.7	22.1	22.0	14.8	11.5	6
XGB	23.3	25.4	34.8	31.6	33.1	29.3	26.6	2
LGBM	24.4	30.7	30.8	29.9	33.6	27.0	25.4	3
注：黑体数值表示最优结果.

下载: 导出CSV

参考文献(48)

[1]	Adam S P, Alexandropoulos S-A N, Pardalos P M, et al. No free lunch theorem: A review[M]//Approximation and Optimization. Cham, Switzerland: Springer, 2019: 57−82
[2]	Kerschke P, Hoos H H, Neumann F, et al. Automated algorithm selection: Survey and perspectives[J]. Evolutionary Computation, 2019, 27(1): 3−45 doi: 10.1162/evco_a_00242
[3]	Brazdil P, Giraud-Carrier C. Metalearning and algorithm selection: Progress, state of the art and introduction to the 2018 special issue[J]. Machine Learning, 2018, 107(1): 1−14 doi: 10.1007/s10994-017-5692-y
[4]	Yang Chengrun, Akimoto Y, Kim D W, et al. OBOE: Collaborative filtering for AutoML model selection[C]//Proc of the 25th ACM SIGKDD Int Conf on Knowledge Discovery & Data Mining. New York: ACM, 2019: 1173−1183
[5]	Dias L V, Miranda P B C, Nascimento A C A, et al. ImageDataset2Vec: An image dataset embedding for algorithm selection[J]. Expert Systems with Applications, 2021, 180: 115053 doi: 10.1016/j.eswa.2021.115053
[6]	Shahoud S, Winter M, Khalloof H, et al. An extended meta learning approach for automating model selection in big data environments using microservice and container virtualizationz technologies[J]. Internet of Things, 2021, 16: 100432 doi: 10.1016/j.iot.2021.100432
[7]	Aguiar G J, Santana E J, De Carvalho A C P F L, et al. Using meta-learning for multi-target regression[J]. Information Sciences, 2022, 584: 665−684 doi: 10.1016/j.ins.2021.11.003
[8]	Arjmand A, Samizadeh R, Dehghani Saryazdi M. Meta-learning in multivariate load demand forecasting with exogenous meta-features[J]. Energy Efficiency, 2020, 13(5): 871−887 doi: 10.1007/s12053-020-09851-x
[9]	Li Li, Wang Yong, Xu Ying, et al. Meta-learning based industrial intelligence of feature nearest algorithm selection framework for classification problems[J]. Journal of Manufacturing Systems, 2022, 62: 767−776 doi: 10.1016/j.jmsy.2021.03.007
[10]	Chalé M, Bastian N D, Weir J. Algorithm selection framework for cyber attack detection[C]//Proc of the 2nd ACM Workshop on Wireless Security and Machine Learning. New York: ACM, 2020: 37−42
[11]	Mu Tianyu, Wang Hongzhi, Zheng Shenghe, et al. Assassin: An automatic classification system based on algorithm selection[J]. Proceedings of the VLDB Endowment, 2021, 14(12): 2751−2754 doi: 10.14778/3476311.3476336
[12]	Garcia L P F, Lorena A C, De Souto M C P, et al. Classifier recommendation using data complexity measures[C]//Proc of the 24th Int Conf on Pattern Recognition. Piscataway, NJ: IEEE, 2018: 874−879
[13]	Aguiar G J, Mantovani R G, Mastelini S M, et al. A meta-learning approach for selecting image segmentation algorithm[J]. Pattern Recognition Letters, 2019, 128: 480−487 doi: 10.1016/j.patrec.2019.10.018
[14]	Aduviri R, Matos D, Villanueva E. Feature selection algorithm recommendation for gene expression data through gradient boosting and neural network metamodels[C]//Proc of the 12th IEEE Int Conf on Bioinformatics and Biomedicine. Los Alamitos, CA: IEEE Computer Society, 2018: 2726−2728
[15]	孟军,张晶,姜丁菱,等. 结合近邻传播聚类的选择性集成分类方法[J]. 计算机研究与发展,2018,55(5):986−993 doi: 10.7544/issn1000-1239.2018.20170077 Meng Jun, Zhang Jing, Jiang Dingling, et al. Selective ensemble classification integrated with affinity propagation clustering[J]. Journal of Computer Research and Development, 2018, 55(5): 986−993 (in Chinese) doi: 10.7544/issn1000-1239.2018.20170077
[16]	Jan Z, Munos J C, Ali A. A novel method for creating an optimized ensemble classifier by introducing cluster size reduction and diversity[J]. IEEE Transactions on Knowledge and Data Engineering, 2020, 34(7): 3072−3081
[17]	Xu Yuhong, Yu Zhiwen, Cao Wenming, et al. Adaptive classifier ensemble method based on spatial perception for high-dimensional data classification[J]. IEEE Transactions on Knowledge and Data Engineering, 2021, 33(7): 2847−2862 doi: 10.1109/TKDE.2019.2961076
[18]	Mohammed A M, Onieva E, Woźniak M, et al. An analysis of heuristic metrics for classifier ensemble pruning based on ordered aggregation[J]. Pattern Recognition, 2022, 124: 108493 doi: 10.1016/j.patcog.2021.108493
[19]	胡毅,瞿博阳,梁静,等. 进化集成学习算法综述[J]. 智能科学与技术学报,2021,3(1):18−33 doi: 10.11959/j.issn.2096-6652.202103 Hu Yi, Qu Boyang, Liang Jing, et al. A survey on evolutionary ensemble learning algorithm[J]. Chinese Journal of Intelligent Science and Technology, 2021, 3(1): 18−33 (in Chinese) doi: 10.11959/j.issn.2096-6652.202103
[20]	刘艺,刁兴春,曹建军,等. 基于集成分类的高维数据实体分辨[J]. 计算机应用研究,2018,35(3):689−693 Liu Yi, Diao Xingchun, Cao Jianjun, et al. High-dimensional data entity resolution based on ensemble classifying[J]. Application Research of Computers, 2018, 35(3): 689−693 (in Chinese)
[21]	Qasem A, Sheikh Abdullah S N H, Sahran S, et al. An improved ensemble pruning for mammogram classification using modified bees algorithm[J]. Neural Computing and Applications, 2022, 34: 10093−10116 doi: 10.1007/s00521-022-06995-y
[22]	Zhu Xuhui, Ni Zhiwei, Ni Liping, et al. Ensemble pruning of ELM via migratory binary glowworm swarm optimization and margin distance minimization[J]. Neural Processing Letters, 2020, 52(3): 2043−2067 doi: 10.1007/s11063-020-10336-2
[23]	Mirjalili S. The ant lion optimizer[J]. Advances in Engineering Software, 2015, 83(C): 80−98
[24]	Niu Guoqiang, Li Xiaoyong, Wan Xin, et al. Dynamic optimization of wastewater treatment process based on novel multi-objective ant lion optimization and deep learning algorithm[J]. Journal of Cleaner Production, 2022, 345: 131140 doi: 10.1016/j.jclepro.2022.131140
[25]	Abualigah L, Shehab M, Alshinwan M, et al. Ant lion optimizer: A comprehensive survey of its variants and applications[J]. Archives of Computational Methods in Engineering, 2021, 28(3): 1397−1416 doi: 10.1007/s11831-020-09420-6
[26]	Liu Yi, Qin Wei, Zhang Jinhui, et al. Multi-objective ant lion optimizer based on time weight[J]. IEICE Transactions on Information and Systems, 2021, E104.D(6): 901−904 doi: 10.1587/transinf.2021EDL8009
[27]	Khan I, Zhang Xianchao, Mobashar R, et al. A literature survey and empirical study of meta-learning for classifier selection[J]. IEEE Access, 2020, 8: 10262−10281 doi: 10.1109/ACCESS.2020.2964726
[28]	曾子林,张宏军,张睿,等. 基于元学习思想的算法选择问题综述[J]. 控制与决策,2014,29(6):961−968 doi: 10.13195/j.kzyjc.2013.1297 Zeng Zilin, Zhang Hongjun, Zhang Rui, et al. Summary of algorithm selection problem based on meta-learning[J]. Control and Decision, 2014, 29(6): 961−968 (in Chinese) doi: 10.13195/j.kzyjc.2013.1297
[29]	Rivolli A, Garcia L P F, Soares C, et al. Meta-features for meta-learning[J]. Knowledge-Based Systems, 2022, 240: 108101 doi: 10.1016/j.knosys.2021.108101
[30]	Lorena A C, Garcia L P F, Lehmann J, et al. How complex is your classification problem: A survey on measuring classification complexity[J]. ACM Computing Surveys, 2019, 52(5): 1−34
[31]	刁兴春,刘艺,曹建军,等. 多目标蚁群优化研究综述[J]. 计算机科学,2017,44(10):7−13,25 doi: 10.11896/j.issn.1002-137X.2017.10.002 Diao Xingchun, Liu Yi, Cao Jianjun, et al. Reviews of multiobjective ant colony optimization[J]. Computer Science, 2017, 44(10): 7−13,25 (in Chinese) doi: 10.11896/j.issn.1002-137X.2017.10.002
[32]	Dua D, Graff C. UCI machine learning repository[EB/OL]. 2017[2022-03-19].https://archive.ics.uci.edu/ml/index.php
[33]	Alcalá-Fdez J, Fernández A, Luengo J, et al. Keel data-mining software tool: Data set repository, integration of algorithms and experimental analysis framework[J]. Journal of Multiple-Valued Logic & Soft Computing, 2011, 17: 255−287
[34]	Kooperberg C. StatLib: An archive for statistical software, datasets, and information[J]. The American Statistician, 1997, 51(1): 98−98 doi: 10.2307/2684710
[35]	Vanschoren J, Van Rijn J N, Bischl B, et al. OpenML: Networked science in machine learning[J]. ACM SIGKDD Explorations Newsletter, 2014, 15(2): 49−60 doi: 10.1145/2641190.2641198
[36]	Alcobaça E, Siqueira F, Rivolli A, et al. MFE: Towards reproducible meta-feature extraction[J]. Journal of Machine Learning Research, 2020, 21: 1−5
[37]	Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit-learn: Machine learning in Python[J]. Journal of Machine Learning Research, 2011, 12: 2825−2830
[38]	Chollet F. Keras[EB/OL]. 2015[2022-07-16].https://keras.io
[39]	Brazdil P B, Soares C. Ranking learning algorithms: Using IBL and meta-learning on accuracy and time results[J]. Machine Learning, 2003, 50(3): 251−277 doi: 10.1023/A:1021713901879
[40]	李洪奇,徐青松,朱丽萍,等. 基于数据集相似性的分类算法推荐[J]. 计算机应用与软件,2016,33(8):62−66 doi: 10.3969/j.issn.1000-386x.2016.08.014 Li Hongqi, Xu Qingsong, Zhu Liping, et al. Classification algorithms recommendation based on dataset similarity[J]. Computer Applications and Software, 2016, 33(8): 62−66 (in Chinese) doi: 10.3969/j.issn.1000-386x.2016.08.014
[41]	Mirjalili S, Jangir P, Saremi S. Multi-objective ant lion optimizer: A multi-objective optimization algorithm for solving engineering problems[J]. Applied Intelligence, 2017, 46(1): 79−95 doi: 10.1007/s10489-016-0825-8
[42]	Deb K, Pratap A, Agarwal S, et al. A fast and elitist multiobjective genetic algorithm: NSGA2[J]. IEEE Transactions on Evolutionary Computation, 2002, 6(2): 182−197 doi: 10.1109/4235.996017
[43]	Nebro A J, Durillo J J, Garcia-Nieto J, et al. SMPSO: A new PSO-based metaheuristic for multi-objective optimization[C]//Proc of the 2009 IEEE Symp on Computational Intelligence in Milti-Criteria Decision-Making. Piscataway, NJ: IEEE, 2009: 66−73
[44]	Zitzler E, Laumanns M, Thiele L. SPEA2: Improving the strength pareto evolutionary algorithm, 103[R]. Zurich: Swiss Federal Institute of Technology, 2001
[45]	Benítez-Hidalgo A, Nebro A J, García-Nieto J, et al. jMetalPy: A Python framework for multi-objective optimization with metaheuristics[J]. Swarm and Evolutionary Computation, 2019, 51: 100598 doi: 10.1016/j.swevo.2019.100598
[46]	Goh C-K, Tan K C. A competitive-cooperative coevolutionary paradigm for dynamic multiobjective optimization[J]. IEEE Transactions on Evolutionary Computation, 2009, 13(1): 103−127 doi: 10.1109/TEVC.2008.920671
[47]	Zitzler E, Thiele L. Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach[J]. IEEE Transactions on Evolutionary Computation, 1999, 3(4): 257−271 doi: 10.1109/4235.797969
[48]	Schott J R. Fault tolerant design using single and multicriteria genetic algorithm optimization[D]. Cambridge, MA: Department of Aeronautics and Astronautics, Massachusetts Institute of Technology, 1995

施引文献(75)

期刊类型引用(72)

1.	袁良志，海佳丽，汪润，邓文萍，肖勇，常凯. 知识图谱驱动的中医药标准数字化探索与实践. 中医药导报. 2025(01): 225-230 . 百度学术
2.	范定容，王倩倩，沈奥，彭露. 从ChatGPT到Sora：人工智能在医学教育中的应用潜力与挑战. 中国医学教育技术. 2025(01): 33-40 . 百度学术
3.	刘园园，王银刚. ChatGPT影响大学生判断能力：双向机理与对策. 湖北成人教育学院学报. 2025(01): 29-34 . 百度学术
4.	魏昱，刘卫. 人工智能生成内容在服装设计中的应用现状. 毛纺科技. 2025(01): 134-142 . 百度学术
5.	李冰，鲜勇，雷刚，苏娟. ChatGPT架构下课程智能教学助手建设探讨. 教育教学论坛. 2025(03): 45-48 . 百度学术
6.	梁炜，许振宇. 大语言模型赋能舆情治理现代化：价值、风险与路径. 中国应急管理科学. 2025(01): 93-103 . 百度学术
7.	刘邦奇，聂小林，王亚飞，袁婷婷，赵子琪，张国强. 生成式AI赋能教育：技术框架、应用场域及价值——2024智能教育发展研究报告. 中国电化教育. 2025(03): 61-70 . 百度学术
8.	王乐，庄雨岳. 数智时代新兴技术对图书馆用户服务的影响力评价. 图书情报工作. 2025(06): 18-32 . 百度学术
9.	杨湘睿，汪少华，詹晔康，姚杰，曹强. 面向高性能纠删码的内存数据布局优化研究. 小型微型计算机系统. 2025(04): 1003-1013 . 百度学术
10.	李彦，李昂. 从“人机交互”到“人机共生”——后人类主义语境下的翻译技术再思考. 翻译研究与教学. 2025(01): 112-118 . 百度学术
11.	范慧迪，刘长君. ChatGpt赋能医疗健康行业的机遇、风险与规制. 卫生法学. 2025(03): 30-39 . 百度学术
12.	林树建. 人工智能司法辅助地位的技术制约和规范审视. 北京警察学院学报. 2025(02): 10-20 . 百度学术
13.	刘邦奇，聂小林，王士进，袁婷婷，朱洪军，赵子琪，朱广袤. 生成式人工智能与未来教育形态重塑：技术框架、能力特征及应用趋势. 电化教育研究. 2024(01): 13-20 . 百度学术
14.	秦涛，杜尚恒，常元元，王晨旭. ChatGPT的工作原理、关键技术及未来发展趋势. 西安交通大学学报. 2024(01): 1-12 . 百度学术
15.	张小朝. AIGC在商旅行业中的应用探索. 广东通信技术. 2024(01): 75-79 . 百度学术
16.	廉霄兴，宋勇，朱军，王淑玲，叶晓舟，欧阳晔. 基于双通道理论的通信认知增强技术研究. 电信科学. 2024(01): 123-135 . 百度学术
17.	杨永恒. 人工智能时代社会科学研究的“变”与“不变”. 人民论坛·学术前沿. 2024(04): 96-105 . 百度学术
18.	刘英祥，张琳. 生成式人工智能技术在海事管理工作中的应用探索. 航海. 2024(02): 62-64 . 百度学术
19.	吕静，何平，王永芬，冉朝霞，曹钦兴，古文帆，彭敏，田敏. ChatGPT在医学领域研究态势的文献计量学分析. 医学与哲学. 2024(07): 30-35 . 百度学术
20.	王益君，董韵美. 公众对人工智能的认知与情感态度——以ChatGPT为例. 知识管理论坛. 2024(01): 16-29 . 百度学术
21.	陈雷. ChatGPT在公安院校教育教学中的应用及影响. 太原城市职业技术学院学报. 2024(02): 85-88 . 百度学术
22.	尤冲，李彦兵. 基于ChatGPT大语言模型应用的公共体育服务智能化:指征、风险及其规制. 南京体育学院学报. 2024(02): 1-12 . 百度学术
23.	杨胜钦. 从ChatGPT看AI对电信网络诈骗犯罪治理的影响. 犯罪与改造研究. 2024(05): 26-33 . 百度学术
24.	王春英，姚亚妮，滕白莹. 生成式人工智能嵌入敏捷政府建设：影响、风险与应对. 北京行政学院学报. 2024(03): 73-83 . 百度学术
25.	王雯，李永智. 国际生成式人工智能教育应用与省思. 开放教育研究. 2024(03): 37-44 . 百度学术
26.	张智义. 体认语言学视阈下ChatGPT语言生成及性能研究. 外语研究. 2024(03): 20-25+43+112 . 百度学术
27.	余淑珍，单俊豪，闫寒冰. 情感计算赋能个性化教学：逻辑框架、问题解构与多元重塑. 现代远距离教育. 2024(02): 53-61 . 百度学术
28.	高尚. 大语言模型与中台：共融还是替代？. 科技与金融. 2024(05): 59-62 . 百度学术
29.	郭亚军，马慧芳，张鑫迪，冯思倩. ChatGPT赋能图书馆知识服务：原理、场景与进路. 图书馆建设. 2024(03): 60-68 . 百度学术
30.	高雪松，黄蕴华，王斌. 基于专利数据的生成式人工智能技术栈创新态势研究. 东北财经大学学报. 2024(04): 53-61 . 百度学术
31.	张渊. ChatGPT文本的生成机制与文本特性分析. 重庆文理学院学报(社会科学版). 2024(04): 105-114 . 百度学术
32.	罗仕鉴，于慧伶，易珮琦. 数智时代工业设计知识生产新范式. 机械设计. 2024(08): 6-10 . 百度学术
33.	徐炳文. 基于ChatGPT的人工智能交互技术工业物联网平台研究. 工业控制计算机. 2024(08): 132-134 . 百度学术
34.	Deyi Li，Jialun Yin，Tianlei Zhang，Wei Han，Hong Bao. The Four Most Basic Elements In Machine Cognition. Data Intelligence. 2024(02): 297-319 . 必应学术
35.	黄语，刘海洋，常海军，杨远松. 基于ChatGPT工作模式的AI工具在BIM技术中的潜在应用与实现途径. 科技创新与应用. 2024(26): 181-184+188 . 百度学术
36.	李琳娜，丁楷，韩红旗，王力，李艾丹. 基于知识图谱的中文科技文献问答系统构建研究. 中国科技资源导刊. 2024(04): 51-62 . 百度学术
37.	裴炳森，李欣，蒋章涛，刘明帅. 基于大语言模型的公安专业小样本知识抽取方法研究. 计算机科学与探索. 2024(10): 2630-2642 . 百度学术
38.	李克寒，余丽媛，邵企能，蒋可，乌丹旦. 大语言模型在口腔住院医师规范化培训中的应用构想. 中国卫生产业. 2024(07): 155-158 . 百度学术
39.	钟厚涛. 生成式人工智能给翻译实践带来的机遇与挑战. 北京翻译. 2024(00): 238-250 . 百度学术
40.	张夏恒，马妍. AIGC在应急情报服务中的应用研究. 图书馆工作与研究. 2024(11): 60-67 . 百度学术
41.	崔金满，李冬梅，田萱，孟湘皓，杨宇，崔晓晖. 提示学习研究综述. 计算机工程与应用. 2024(23): 1-27 . 百度学术
42.	周代数，魏杉汀. 人工智能驱动的科学研究第五范式：演进、机制与影响. 中国科技论坛. 2024(12): 97-107 . 百度学术
43.	钱力，张智雄，伍大勇，常志军，于倩倩，胡懋地，刘熠. 科技文献大模型:方法、框架与应用. 中国图书馆学报. 2024(06): 45-58 . 百度学术
44.	潘崇佩，廖康启，孔勇发. 生成式人工智能背景下的近代物理实验教学改革. 实验室研究与探索. 2024(12): 117-122 . 百度学术
45.	李德毅，刘玉超，殷嘉伦. 认知机器如何创造. 中国基础科学. 2024(06): 1-11 . 百度学术
46.	李德毅，张天雷，韩威，海丹，鲍泓，高洪波. 认知机器的结构和激活. 智能系统学报. 2024(06): 1604-1613 . 百度学术
47.	蔡昌，庞思诚. ChatGPT的智能性及其在财税领域的应用. 商业会计. 2023(09): 41-46 . 百度学术
48.	于书娟，卢小雪，赵磊磊. 教育人工智能变革的基本逻辑与发展进路. 当代教育科学. 2023(05): 40-49 . 百度学术
49.	曹克亮. ChatGPT：意识形态家的机器学转向及后果. 统一战线学研究. 2023(04): 134-144 . 百度学术
50.	宋恺，屈蕾蕾，杨萌科. 生成式人工智能的治理策略研究. 信息通信技术与政策. 2023(07): 83-88 . 百度学术
51.	陈凌云，姚宽达，王茜，方安，李刚. ChatGPT:研究进展、模型创新及医学信息研究应用场景优化. 医学信息学杂志. 2023(07): 18-23+29 . 百度学术
52.	彭强，李羿卫. 自然用户界面在智能家居系统中的应用路径创新研究：生成式人工智能技术的调节作用. 包装工程. 2023(16): 454-463 . 百度学术
53.	杨军农，王少波. 类ChatGPT技术嵌入政务服务网的应用场景、风险隐患与实施建议. 信息与电脑(理论版). 2023(10): 183-186 . 百度学术
54.	政光景，吕鹏. 生成式人工智能与哲学社会科学新范式的涌现. 江海学刊. 2023(04): 132-142+256 . 百度学术
55.	吴梦妮. 社交媒体传播视域下玩具企业应用AI技术实施营销的实践路径. 玩具世界. 2023(04): 144-146 . 百度学术
56.	李德毅，殷嘉伦，张天雷，韩威，鲍泓. 机器认知四要素说. 中国基础科学. 2023(03): 1-10+22 . 百度学术
57.	王洁. ChatGPT对知识服务的五大变革. 图书馆. 2023(09): 10-16 . 百度学术
58.	刘乃嘉. 基于ChatGPT的矿山工程风险评估预警系统实现探讨. 企业科技与发展. 2023(08): 44-47 . 百度学术
59.	裴炳森，李欣，吴越. 基于ChatGPT的电信诈骗案件类型影响力评估. 计算机科学与探索. 2023(10): 2413-2425 . 百度学术
60.	张新新，丁靖佳. 生成式智能出版的技术原理与流程革新. 图书情报知识. 2023(05): 68-76 . 百度学术
61.	张新新，黄如花. 生成式智能出版的应用场景、风险挑战与调治路径. 图书情报知识. 2023(05): 77-86+27 . 百度学术
62.	陈靖. ChatGPT的类人想象与安全风险分析. 网络空间安全. 2023(04): 8-12 . 百度学术
63.	李佩芳，陈佳丽，宁宁，王立群，张涵旎. ChatGPT在医学领域的应用进展及思考. 华西医学. 2023(10): 1456-1460 . 百度学术
64.	朱敏锐，郜云帆，黄勇. 以新时代优良学风涵养新时代外语人才. 北京教育(高教). 2023(11): 35-37 . 百度学术
65.	丁红菊. 消解与重构：人工智能技术对新闻业的影响——基于对ChatGPT的研究. 运城学院学报. 2023(05): 57-62 . 百度学术
66.	李钥，淮盼盼，杨辉. ChatGPT在护理教育中的应用状况及优劣分析. 护理学杂志. 2023(21): 117-121 . 百度学术
67.	张绍龙. 基于ChatGPT的人工智能技术应用. 集成电路应用. 2023(11): 200-201 . 百度学术
68.	崔克克，孙冲，李辉，赵凌飞. 浅谈水泥企业数字化转型发展. 中国水泥. 2023(12): 28-33 . 百度学术
69.	单琳，王文娟，刘舒萌. ChatGPT在医学分子生物学教学中的应用. 基础医学教育. 2023(12): 1084-1086 . 百度学术
70.	李德毅，刘玉超，任璐. 人工智能看智慧. 科学与社会. 2023(04): 131-149 . 百度学术
71.	付翔，魏晓伟，张浩，徐宁. 数字安全角度下审视和剖析ChatGPT. 航空兵器. 2023(06): 117-122 . 百度学术
72.	黄婷，刘力凯. 基于大模型的数智化语言教学探索与应用. 连云港职业技术学院学报. 2023(04): 73-79 . 百度学术

其他类型引用(3)

资源附件(0)

图(10) / 表(14)

计量

文章访问数: 221
HTML全文浏览量: 26
PDF下载量: 108
被引次数: 75

1. 背景知识
1.1 无人驾驶系统
1.2 无人驾驶系统仿真测试
1.3 仿真场景配置
2. 面向无人驾驶系统的仿真模糊测试
2.1 仿真模糊测试架构
2.2 现有工作概述
2.3 现有工作的缺陷
3. 种子场景生成：挑战、实践与展望
3.1 挑　战
3.2 基本思路
3.3 实验设计
3.4 实验结果与分析
3.5 未来展望
4. 事故分类：挑战、实践与展望
4.1 挑　战
4.2 基本思路
4.3 实验设计
4.4 实验结果与分析
4.5 未来展望
5. 事故归因分析：挑战、实践与展望
5.1 挑　战
5.2 基本思路
5.3 实验设计
5.4 实验结果与分析
5.5 案例分析
5.6 未来展望
6. 总　　结

1. 背景知识
1.1 无人驾驶系统
1.2 无人驾驶系统仿真测试
1.3 仿真场景配置
2. 面向无人驾驶系统的仿真模糊测试
2.1 仿真模糊测试架构
2.2 现有工作概述
2.3 现有工作的缺陷
3. 种子场景生成：挑战、实践与展望
3.1 挑　战
3.2 基本思路
3.3 实验设计
3.4 实验结果与分析
3.5 未来展望
4. 事故分类：挑战、实践与展望
4.1 挑　战
4.2 基本思路
4.3 实验设计
4.4 实验结果与分析
4.5 未来展望
5. 事故归因分析：挑战、实践与展望
5.1 挑　战
5.2 基本思路
5.3 实验设计
5.4 实验结果与分析
5.5 案例分析
5.6 未来展望
6. 总　　结

参考文献(48)

施引文献(75)

资源附件(0)

基于多目标混合蚁狮优化的算法选择方法

通讯作者: 刘艺（albertliu20th@163.com）

计量

出版历程

Algorithm Selection Method Based on Multi-Objective Hybrid Ant Lion Optimizer

1. 背景知识

1.1 无人驾驶系统

1.2 无人驾驶系统仿真测试

1.3 仿真场景配置

2. 面向无人驾驶系统的仿真模糊测试

2.1 仿真模糊测试架构

2.2 现有工作概述

2.3 现有工作的缺陷

3. 种子场景生成：挑战、实践与展望

3.1 挑 战

3.2 基本思路

3.3 实验设计

3.4 实验结果与分析

3.5 未来展望

4. 事故分类：挑战、实践与展望

4.1 挑 战

4.2 基本思路

4.3 实验设计

4.4 实验结果与分析

4.5 未来展望

5. 事故归因分析：挑战、实践与展望

5.1 挑 战

5.2 基本思路

5.3 实验设计

5.4 实验结果与分析

5.5 案例分析

5.6 未来展望

6. 总 结

期刊类型引用(72)

其他类型引用(3)

计量

出版历程

目录

1. 背景知识

1.1 无人驾驶系统

1.2 无人驾驶系统仿真测试

1.3 仿真场景配置

2. 面向无人驾驶系统的仿真模糊测试

2.1 仿真模糊测试架构

2.2 现有工作概述

2.3 现有工作的缺陷

3. 种子场景生成：挑战、实践与展望

3.1 挑 战

3.2 基本思路

3.3 实验设计

3.4 实验结果与分析

3.5 未来展望

4. 事故分类：挑战、实践与展望

4.1 挑 战

4.2 基本思路

4.3 实验设计

4.4 实验结果与分析

4.5 未来展望

5. 事故归因分析：挑战、实践与展望

5.1 挑 战

5.2 基本思路

5.3 实验设计

5.4 实验结果与分析

5.5 案例分析

5.6 未来展望

6. 总 结

通讯作者:
刘艺（albertliu20th@163.com）

3.1 挑　战

4.1 挑　战

5.1 挑　战

6. 总　　结

3.1 挑　战

4.1 挑　战

5.1 挑　战

6. 总　　结