针对目标检测器的假阳性对抗样本

袁小鑫1,2 胡军1,2 黄永洪3

1(计算智能重庆市重点实验室(重庆邮电大学) 重庆 400065) 2(重庆邮电大学计算机科学与技术学院重庆 400065) 3(重庆邮电大学网络空间安全与信息法学院重庆 400065)

摘要目标检测器现已被广泛应用在各类智能系统中，主要用于对图像中的物体进行识别与定位.然而，近年来的研究表明，目标检测器与DNNs分类器都易受数字对抗样本和物理对抗样本的影响.YOLOv3是实时检测任务中一种主流的目标检测器，现有攻击YOLOv3的物理对抗样本的构造方式大多是将生成的较大对抗性扰动打印出来再粘贴在特定类别的物体表面.最近的研究中出现的假阳性对抗样本(false positive adversarial example, FPAE)可通过目标模型直接生成得到，人无法识别出该对抗样本图像中的内容，但目标检测器却以高置信度将其误识别为攻击者指定的目标类.现有以YOLOv3为目标模型生成FPAE的方法仅有AA(appearing attack)方法一种，该方法在生成FPAE的过程中，为提升FPAE的鲁棒性，会在迭代优化过程中加入EOT(expectation over transformation)图像变换来模拟各种物理条件，但是并未考虑拍摄时可能出现的运动模糊(motion blur)情况，进而影响到对抗样本的攻击效果.此外，生成的FPAE在对除YOLOv3外的目标检测器进行黑盒攻击时的攻击成功率并不高.为生成性能更好的FPAE，以揭示现有目标检测器存在的弱点和测试现有目标检测器的安全性，以YOLOv3目标检测器为目标模型，提出RTFP(robust and transferable false positive)对抗攻击方法.该方法在迭代优化过程中，除了加入典型的图像变换外，还新加入了运动模糊变换.同时，在损失函数的设计上，借鉴了C&W攻击中损失函数的设计思想，并将目标模型在FPAE的中心所在的网格预测出的边界框与FPAE所在的真实边界框之间的重合度(intersection over union, IOU)作为预测的边界框的类别损失的权重项.在现实世界中的多角度、多距离拍摄测试以及实际道路上的驾车拍摄测试中，RTFP方法生成的FPAE能够保持较强的鲁棒性且迁移性强于现有方法生成的FPAE.

关键词假阳性对抗样本；鲁棒性与迁移性；目标检测器；物理对抗攻击；实时检测

近年来，随着深度学习的相关理论技术和计算能力的发展，深度神经网络(deep neural networks, DNNs)模型在计算机视觉领域的各项任务中表现出色，基于DNNs模型的目标检测器逐渐被应用在人脸识别[1]、行人跟踪[2]以及无人驾驶[3]等领域.然而，近年来的研究表明DNNs模型易受攻击者精心设计的对抗样本的攻击，从而输出不正确的预测结果，所以DNNs架构的目标检测器本身的安全性也越来越受到研究者的关注.YOLOv3[4]是实时检测任务中一种主流的目标检测器，比如用YOLOv3实时检测交通信号灯[5]以及交通标志[6]，现有针对YOLOv3或其他目标检测器的物理对抗攻击的方式大多是先通过特定的目标模型生成较大的对抗性扰动，再将生成的对抗性扰动打印出来并贴在特定类别的物体上构成物理对抗样本.但是在最近的研究中，出现了一种针对目标检测器的新型对抗样本——假阳性对抗样本(false positive adversarial example, FPAE)[7]，此类对抗样本是通过目标模型直接生成得到的，人无法识别该对抗样本图像中的内容，但目标检测器却以高置信度将该对抗样本误识别为攻击者指定的目标类.研究FPAE的生成有助于发现YOLOv3及其他目标检测器存在的弱点.现有以YOLOv3为目标模型生成FPAE的方法仅有Zhao等人[8]提出的AA(appearing attack)方法，该方法在生成过程中为提升对抗样本的鲁棒性，使用了典型的EOT(expectation over transformation)图像变换方法[9]来模拟各种物理条件，但是并未包含运动模糊变换，然而在实际的拍摄过程中，如果摄像头与对抗样本之间发生较快的相对运动，对抗样本在拍摄出来的照片上就会出现运动模糊进而影响到对抗样本的攻击效果.此外，该方法生成的FPAE在除目标模型外的其他模型上进行黑盒攻击的成功率并不高.

为生成性能更好的FPAE，以揭示现有目标检测器存在的弱点和测试现有目标检测器的安全性，本文以YOLOv3为目标模型，提出了鲁棒且可迁移的假阳性(robust and transferable false positive, RTFP)对抗攻击方法，该方法在迭代优化过程中，除了加入典型的图像变换外，还新加入了运动模糊变换，在设计损失函数时，借鉴了C&W攻击[10]中损失函数的设计思想，并考虑了目标模型预测出的每个边界框与FPAE所在的真实边界框之间的重合度(intersection over union, IOU)，将目标模型在FPAE的中心所在的网格预测出的边界框与FPAE所在的真实边界框之间的IOU作为预测的边界框的类别损失的权重项.在现实世界中的多角度、多距离拍摄测试以及实际道路上的驾车拍摄测试中，RTFP方法生成的FPAE均能保持较强的鲁棒性且迁移性强于现有方法生成的FPAE.

本文的主要贡献有2个方面：

1) 提出了一种新的生成FPAE的RTFP方法，该方法在生成FPAE的过程中，通过新加入的运动模糊变换和借鉴C&W攻击思想设计出的全新的损失函数克服了由于运动模糊造成的FPAE鲁棒性不足以及FPAE在其他目标检测器上的迁移性差的问题;

2) 设计了现实世界中的多角度、多距离拍摄测试以及驾车拍摄测试，在实际场景下对RTFP方法生成的对抗样本的攻击效果进行了全面的评估.

1 相关工作

根据对抗样本所适用的场景，可以将现有的针对目标检测器的对抗样本分为数字对抗样本和物理对抗攻样本，本节主要回顾现有研究中针对目标检测器的数字对抗样本和物理对抗样本.

1.1 针对目标检测器的数字对抗样本

在计算机视觉领域，自Szegedy等人[11]指出DNNs分类器易受对抗样本影响的特性之后，相继有研究者陆续提出针对DNNs分类器的对抗攻击方法，比如生成数字图像对抗样本的FGSM[12]、C&W方法和生成物理对抗样本的BPA-PSO[13]、RP2方法[14].在针对图像分类器的对抗攻击研究取得一定成果后，研究者开始研究针对目标检测器的对抗攻击.2017年，Xie等人[15]提出了针对目标检测器的DAG对抗攻击方法，该算法首先获得图像中每个物体的正确类别，然后给每个物体分别设定一个不正确的类别，通过最大化不正确类别的置信度，同时最小化正确类别的置信度，达到生成对抗样本的目的.Lu等人[16]以Faster R-CNN[17]目标检测器为目标模型，从拍摄视频中抽取出包含STOP交通标志的帧作为训练样本，通过最小化目标检测器对STOP交通标志的平均预测分数，设计出对抗性STOP交通标志图像.Li等人[18]提出RAP对抗攻击算法，该算法主要攻击目标检测器中的区域建议网络RPN，并且在设计损失函数时，设计了针对RPN网络的分类损失和回归损失.Liu等人[19]分别在有目标对抗攻击和无目标对抗攻击的情况下设计出不同的对抗性扰动，当向原始图像添加相应的对抗性扰动之后可以使Faster R-CNN目标检测器对图像中的物体错误识别.Wei等人[20]提出UEA对抗攻击算法，该算法通过构造生成对抗网络来快速地生成图像和视频对抗样本，为了提高对抗样本的迁移性，在训练生成对抗网络中的生成器时，结合了目标检测器的类别损失和特征损失.Li等人[21]研究了目标检测器中SSM模块的脆弱性，指出SSM模块易受背景图像中的对抗性扰动的影响，并利用SSM这一弱点，设计出添加在背景图像区域的对抗性扰动.

1.2 针对目标检测器的物理对抗样本

部署在现实世界中的目标检测器大多是以摄像头拍摄到的画面作为输入，现实中的各种环境因素都会影响对抗样本的攻击效果，为进一步提升对抗样本的鲁棒性，使之能在物理世界也能欺骗目标检测器，研究者进一步提出针对目标检测器的物理对抗样本.Eykholt等人[22]将针对分类器的RP2对抗攻击算法进行拓展，将其应用于YOLOv2目标检测器[23]，将生成的对抗性扰动打印出来并贴到正常的STOP交通标志上的相应位置后，YOLOv2目标检测器便不能检测到STOP交通标志.Chen等人[24]在设计针对Faster R-CNN目标检测器的对抗性STOP交通标志图像时，提出了ShapeShifter方法，该方法在生成对抗性扰动的过程中使用了EOT变换，并将添加的扰动限制在STOP交通标志图像中除文字之外的其余区域.Huang等人[25]以Faster R-CNN为目标模型将对抗性扰动设计成广告牌的形式，发现将扰动打印出来并贴在STOP交通标志牌的下方时同样具有攻击效果.上述针对目标检测器的物理对抗样本的构造方式，均是将生成的对抗性扰动添加在目标类别的物体表面或者周围构造出来的，但是最近有研究者发现通过直接生成对抗样本的方式也可以欺骗目标检测器，Kotuliak等人[7]以Faster R-CNN目标检测器为目标模型，生成人无法识别却能使目标检测器产生误判的假阳性对抗样本(FPAE)，但是该方法生成的对抗样本只在很短的距离内有攻击效果.Zhao等人[8]以YOLOv3为目标模型提出AA方法，并在生成对抗样本的过程中采用了EOT变换，提升了对抗样本的鲁棒性，但是并未考虑拍摄时出现的运动模糊因素对FPAE攻击效果的影响，导致在发生运动模糊的情况下攻击效果变差，同时在对其他目标检测器进行黑盒攻击时攻击成功率也不高.

2 目标检测器介绍

2.1 现有的主流目标检测器的分类

给定输入图像，目标检测器需要预测出图像中包含的多个物体的类别、类别置信度和包围物体的最小边界框的坐标.目前主流的目标检测器可分为2种类型：一种是单阶段目标检测器，比如YOLOv2，YOLOv3和SSD[26]；另外一种是2阶段目标检测器，比如Fast R-CNN[27]和Faster R-CNN.其中，单阶段目标检测器使用单个DNNs网络同时预测图像中的物体类别和所在的位置，2阶段目标检测器先通过CNN神经网络提取图像特征得到特征图并产生可能包含物体的候选区域，再对候选区域包含的物体进行进一步的分类以及调整物体的位置坐标.一般单阶段目标检测器的推理时间会比2阶段目标检测器的推理时间更短，而2阶段目标检测器的准确度比单阶段目标检测器的准确度更高.

2.2 YOLOv3目标检测器

对于给定的输入图像，YOLOv3首先将其缩放为统一的尺寸，然后送入到特征提取网络中进行处理，最终得到相对输入图像32倍下采样、16倍下采样和8倍下采样的3个不同尺度的输出特征图.对于每个尺度的输出特征图，YOLOv3会对输入图像中每个划分出的网格预测出3个边界框，每个边界框的预测向量中包含边界框的位置信息(tx,ty,tw,th)、盒置信度分数(scoreobj)以及边界框中的物体分别属于训练集中每个类的类别置信度分数(score1,score2,…,scoren)，所以每个边界框对应的预测向量的形式为

(tx,ty,tw,th,scoreobj,score1,score2,…,scoren).

(1)

其中，tx表示边界框在当前图像中的左上角顶点的横坐标，ty表示边界框在当前图像中的左上角顶点的纵坐标，tw表示边界框的宽度，th表示边界框的高度，n代表训练集中的类别数，而每个尺度的输出特征图上的单位点都与原图中对应位置上划分出的网格相对应，将网格中预测出的3个边界框的预测向量拼接起来就得到单位点所在位置的预测向量.

3 RTFP方法

为提升FPAE的鲁棒性和迁移性以进一步揭示现有目标检测器的弱点，本文提出RTFP方法，本节主要介绍RTFP方法的具体内容.

3.1 威胁模型

本文以YOLOv3为目标模型，采用白盒有目标攻击生成对抗样本，即假定攻击者可以获取到目标模型的结构和参数信息，同时设定目标类，也就是攻击者期望攻击成功后目标模型将对抗样本识别为指定的类别.在实验中，除对目标模型进行白盒攻击外，为评估对抗样本的迁移性，本文还将白盒攻击方式生成的对抗样本对除目标模型之外的其他目标检测器进行黑盒攻击，即假定攻击者不知道这些目标检测器的结构和参数信息，其目标类与白盒攻击的目标类相同，如果这些目标检测器将对抗样本识别为设定的目标类则认为攻击成功.此外，本文假定攻击者只能通过在现实世界中部署物理对抗样本来达到攻击目标检测器的目的，而不能对输入到目标检测器中的数字图像添加对抗性扰动.

3.2 RTFP方法总体流程

Fig. 1 The workflow of RTFP method
图1 RTFP方法的工作流程

RTFP方法的主要原理是在优化过程中对FPAE使用一系列的图像变换并将其覆盖在随机的背景图像上，再计算出目标检测器对背景图像中FPAE的预测损失，通过不断优化损失函数得到最终生成的FPAE.该方法工作流程如图1所示，先将FPAE用U(0,1)随机初始化为待优化的方形图像p，为模拟现实世界中各种不同的物理条件，需要对图像p施加一系列图像变换，变换后得到的图像记为ptf.同时，为模拟现实世界中各种不同的场景，在每次迭代优化过程中都会从MS-COCO数据集[28]中随机选取不同的图像作为背景图像xbg，并将所选的背景图像xbg缩放至YOLOv3要求的输入图像的尺寸，再将ptf覆盖在背景图像xbg上得到xbp，将xbp送入YOLOv3目标检测器后得到模型对xbp中的ptf的预测结果，再使用Adam优化器结合模型的预测结果以及p的图像平滑度损失Losstv对图像p不断优化，最终得到FPAE，在优化过程中始终保证目标检测器的权重固定，每次只更新图像p.

3.3 RTFP方法中使用的图像变换

由于现实世界中的目标检测器是对摄像头拍摄到的图像进行检测，摄像头在拍摄过程中，物体与摄像头之间的距离、角度以及物体周围的光照条件都在不断变化，这些环境因素都会影响FPAE的攻击效果.因此，为了使生成的FPAE更加鲁棒，需要在每次迭代优化过程中对当前生成的图像p使用一系列图像变换模拟不同的物理条件.典型的图形变换方法是Athalye等人[9]提出的EOT变换，其中包含有常见的亮度和对比度变换、缩放变换、旋转变换和加性高斯白噪声变换.在实际应用场景中，摄像头在拍摄过程中如果与放置在现实世界中的FPAE之间发生较快的相对运动，那么FPAE在拍摄到的图像上就会出现运动模糊进而影响到FPAE的攻击效果.为避免FPAE在发生运动模糊的情况下的攻击效果受到较大的影响，RTFP方法在已有的图像变换的基础上新加入了运动模糊变换.在RTFP方法的优化过程中，待优化的图像p经过一系列图像变换后得到图像ptf，即ptf=t(p)，t是图像变换函数，包括5种可微的图像变换方法.

1) 亮度和对比度变换.在拍摄过程中，由于对抗样本周围的光照强度会不断变化，所以，在每次迭代优化过程中，通过随机调整图像p的亮度和对比度模拟对抗样本在不同光照条件下的状态.

2) 缩放变换.当摄像头从远处向对抗样本靠近时，对抗样本在拍摄到的图像中的大小就会不断变化，并且原始图像在经YOLOv3网络处理之前，会先将原始图像等比例缩放至YOLOv3要求的输入图像的尺寸，现实中的摄像头拍摄出的原始图像的长宽比一般不相等，典型的长宽比是4∶3和16∶9，这就导致对原始图像进行等比例缩放之后，其中的对抗样本的长宽比就不再相等，为了使不同尺寸和长宽比的对抗样本都能欺骗目标检测器，RTFP方法在优化过程中将对抗样本图像的尺寸进行随机调整，同时将长宽比的变化范围设定在典型4∶3和16∶9 之间，以此来模拟对抗样本在不同的距离被拍摄时尺寸的变化情况.

3) 旋转变换.在实际拍摄过程中，对抗样本会在拍摄到的图像上旋转一定的角度，因此，每次通过随机旋转图像p的角度可以模拟对抗样本在拍摄到的图像上出现旋转时的状态.

4) 加性高斯噪声变换.在拍摄对抗样本时会因为摄像设备的问题导致拍摄的图像上出现多余的噪声，通过对图像p添加随机的高斯噪声，可模拟拍摄到的对抗样本在受到此类噪声影响时的状态.

5) 运动模糊变换.考虑到摄像头与物体之间发生较快的相对运动时，对抗样本会在拍摄到的图像中出现运动模糊的情况，因此，RTFP方法在每次优化过程中均对图像p施加随机的运动模糊变换，以此来模拟对抗样本在拍摄到的图像上出现运动模糊时的状态.

3.4 RTFP方法中损失函数的设计

在3.2节中所描述的迭代优化过程中，在将覆盖有ptf的背景图像xbp送入YOLOv3目标检测器后会得到3个不同尺度的输出特征图，分别对应将输入图像xbp中划分出3种不同数量的网格时的预测结果.对于某个尺度为s(s的取值为1,2,3,分别对应3个不同的尺度)的输出特征图，先计算出输入图像xbp中图像ptf的中心所在的网格位置cellpt，进而得到输出特征图中与cellpt对应的单位点的位置Is，在Is处的单位点包含的向量就是YOLOv3在cellpt处的网格中预测出的边界框的预测向量，攻击者最终目的是让YOLOv3检测到图像ptf并将其分类为指定的目标类别y，因此，就需要增加cellpt位置的边界框的预测向量中盒置信度分数scoreobj与目标类别y的类别置信度分数scorey.已有的研究表明C&W攻击生成的对抗样本具有较好的攻击效果[29-30]，因此，RTFP方法在优化YOLOv3预测出的类别置信度时，借鉴了C&W攻击中损失函数的设计思想，同时为尽量优化与FPAE最相关的预测边界框，RTFP方法中根据模型在cellpt位置预测出的各个边界框与ptf在输出特征图上对应的真实边界框之间的IOU为每个预测边界框的损失值设置了相应的权重，因此在尺度s下对应的优化问题为

(t(p)⊕xbg))·(1+IO)]+λLosstv(p)，

(2)

优化式(2)中的损失函数的目的是让目标检测器将输入图像中的ptf检测并识别为指定的类别y.其中，损失函数中的p是最终要优化的图像;t是图像变换函数;xbg是从背景图像集B中随机选取的一张背景图像;t(p)是将p经一系列图像变换后得到的图像;⊕表示将t(p)覆盖在背景图像xbg上的操作;对于尺度为s的特征图，YOLOv3在cellpt位置的网格预测出的边界框的数量为n(这里n=3)，和分别表示在尺度为s的特征图中，Is位置处的预测向量中第i个边界框的盒置信度分数(在计算概率值之前的logit值)损失与第i个边界框的类别置信度分数损失;Z表示模型的logit输出;y是指定的目标类;常数K为正数，用于控制模型将ptf分类为目标类别y的置信度分数的大小;损失函数中的IO表示在尺度为s的特征图中，Is位置处的第i个预测边界框与当前的ptf在输出特征图上对应的真实边界框之间的重合度;Losstv表示图像平滑度损失，可以抑制p在优化过程中产生过多的噪声像素点，RTFP方法将Losstv表达式中的β值设为2；λ参数权衡图像平滑度损失、前面的盒置信度分数损失与类别置信度分数损失之和的重要度，在RTFP方法中λ=0.01. 因为RTFP方法考虑了每个尺度的输出特征图对应的各个边界框的损失，在将所有尺度考虑后的优化问题为

(3)

3.5 RTFP方法生成FPAE的过程

算法1. calcLoss(x,p,y). /*对于当前所选的背景图像数据集，计算YOLOv3对所有背景图像中的FPAE的预测值的损失之和loss*/

输入：背景图像集x、当前生成的FPAE图像p、目标类别y;

输出：损失值loss.

① loss=0;

② for xiin x do

③ ptf←t(p); /*t是图像变换函数*/

④ xpat←(ptf⊕xi); /*将ptf随机覆盖在xi上，⊕表示覆盖操作*/

⑤ loss←loss+J(xpat,y); /*J是RTFP方法的损失函数*/

⑥ end for

⑦ return loss.

算法2. getBatchData(xbg,j,k). /*获取输入的背景图像数据集中某个批次的背景图像数据*/

输入：背景图像数据集xbg、当前欲获取的批次j、总的批次数k;

输出：获取到的数据batchData和下一个批次jnext.

① batchData=0;

② if j>k

③ batchData←xbg中第1个批次的图像;

④ jnext=2;

⑤ else

⑥ batchData←xbg中第j个批次的图像;

⑦ jnext=j+1;

⑧ return batchData,jnext.

算法3. RTFP方法生成FPAE的过程.

输入：最大迭代次数e、设定的目标类别y、阈值threshold、训练集Btrain和验证集Bval(Btrain和Bval均来自背景图像数据集B)，Btrain对应的总批次数为k;

输出：最终生成的FPAE图像bestP.

① 使用U(0,1)随机初始化一张图像p;

② 将minLoss设置为无穷大;

③ bestP=p;

④ j=1;

⑤ for i=1,2,…,e do

⑥ totalLoss=calcLoss(Bval,p,y);

⑦ if totalLoss≤threshold

⑧ bestP=p;

⑨ break;

⑩ else

width=17,height=14,dpi=110 if totalLoss≤minLoss

width=17,height=14,dpi=110 minLoss=totalLoss;

width=17,height=14,dpi=110 bestP=p;

width=17,height=14,dpi=110 end if

width=17,height=14,dpi=110 Btrainj,j=getBatchData(Btrain,j,k);

/*Btrain,j,k分别对应getBatchData 中的xbg,j,k*/

width=17,height=14,dpi=110 curLoss←calcLoss(Btrainj,p,y);

/*Btrainj,p,y分别对应calcLoss中的x,p,y*/

width=17,height=14,dpi=110 p←Adam(curLoss,p); /*使用Adam优化器优化curLoss并更新图像p*/

width=17,height=14,dpi=110 end for

width=17,height=14,dpi=110 return bestP.

4 实验设计与实验结果

为测试RTFP方法生成的FPAE的鲁棒性和迁移性，本文在现实场景中分别进行了多角度、多距离拍摄测试以及真实道路上的驾车拍摄测试，本节主要介绍实验设置以及实验结果.

4.1 实验设置

考虑到YOLOv3可被应用在无人车的实时处理系统中对摄像头拍摄到的图像进行实时检测，无人车周围的交通标志对无人车的行驶安全非常重要，因此，实验将目标类设定为MS-COCO数据集中的STOP交通标志，目标模型是在MS-COCO数据集上预训练好的YOLOv3目标检测器，其骨干网是Darknet-53，输入到YOLOv3模型中的图像被统一缩放成608×608的尺寸，模型的类别置信度阈值设置为0.5，即当FPAE被目标检测器错误地检测并分类为STOP标志的置信度高于0.5时，才认为FPAE成功欺骗了目标检测器.

在对其他目标检测器进行黑盒攻击测试时，所选的目标检测器包括Faster R-CNN ResNet-101，Faster R-CNN Inception v2，Mask R-CNN Inception v2[31]，SSD Inception-v2，SSD MobileNet v2. 这些目标检测器均是TensorFlow官方模型库[32]中提供的在MS-COCO数据集上预训练好的目标检测器，并且在现有研究中也被作为典型的测试模型，这些模型的类别置信度阈值同样设置为0.5，模型的其他参数均按照模型默认的参数进行设置.在现有的使用YOLOv3作为目标模型生成FPAE的研究中，与本文所做的工作最接近的仅有Zhao等人[8]提出的AA方法，因此本文选择AA方法与RTFP方法进行对比，实验中所使用的拍摄设备为OPPO A92s，图2是这2种方法生成的FPAE图像.

Fig. 2 FPAE generated by two methods
图2 2种方法生成的FPAE

4.2 多角度、多距离拍摄测试

为在现实世界中测试RTFP方法生成的FPAE在多个不同的距离和角度下的攻击效果，本实验将RTFP方法生成的FPAE打印出来，进行多角度、多距离的拍摄测试.我们将RTFP方法生成的FPAE打印成50 cm×50 cm的大小，然后将距离对抗样本1～25 m的直线距离范围分成5个距离段，每个距离段的范围分别设置为1～5 m，5～10 m，10～15 m，15～20 m，20～25 m.在每个距离段内，以对抗样本正对拍摄者为0°，在对抗样本分别向左和向右偏转0°，15°，30°，45°，60°(向左偏的角度记为负，向右偏的角度记为正)的情况下，在沿着当前直线距离段匀速前进的过程中拍摄对抗样本，最后将拍摄得到的视频送入各目标检测器测试FPAE的攻击效果.首先对目标模型YOLOv3进行白盒攻击测试，然后对其他目标检测器进行黑盒攻击测试，最后计算在每个距离段范围内每个偏转角度下拍摄的视频帧的攻击成功率(attacking success rate, ASR).ASR计算为

(4)

其中,Nsuccess表示当前拍摄到的视频中成功欺骗目标检测器的帧数，Nall表示拍摄到的视频中的总帧数.同时，本实验将AA方法生成的对抗样本也打印成相同的尺寸，并采用同样的拍摄设备和拍摄方法进行拍摄，最后计算2种方法在白盒攻击和黑盒攻击中的ASR.

表1是RTFP方法生成的FPAE对目标模型YOLOv3进行白盒攻击的ASR.可以看到,偏转角度一定，FPAE与摄像机之间的距离不断变化时，总体变化趋势是距离越远，ASR越低，因为随着拍摄距离的增大，FPAE的特征就更不容易被目标检测器捕获，也就更不容易欺骗目标检测器.从表1中的数据可以得到在1～15 m范围内，ASR相对较高，而在大于15 m的范围内，ASR相对较低，其中1～10 m范围内的ASR均达到了100%，在10～15 m范围内，ASR开始下降，总体范围在45%～100%之间，在15～20 m范围内的ASR在0%～45%之间，在20～25 m范围内的ASR均为0%.当FPAE与摄像机之间的距离段一定，FPAE的偏转角度不断变化时可以看到，在1～10 m的距离范围内，随着FPAE的偏转角度不断变化，FPAE在每个偏转角度下的ASR均是100%;而在10～20 m的距离范围内，总体变化趋势是ASR随着偏转角度的增大而减小，这是因为随着距离的变远和FPAE的偏转角度的增大，FPAE在拍摄到的图像上的尺寸变小加之有部分特征并未被拍摄到，进而导致FPAE的特征更加难以欺骗目标检测器，所以ASR降低.此外，由于RTFP方法生成的FPAE并非是左右对称的图像，因此，FPAE在向左偏转和向右偏转时，目标检测器捕获到的特征不同，所以，在10～20 m距离范围内的ASR并非是关于0°对称的.

Table 1 ASR of FPAE Generated by RTFP Method on YOLOv3
表1 RTFP方法生成的FPAE在YOLOv3上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～51001001001001001001001001005～1010010010010010010010010010010～15489687100949796874515～200812313145164020～25000000000

表2～6是RTFP方法生成的FPAE对其他模型进行黑盒攻击的ASR.可以看到FPAE在Faster R-CNN ResNet-101，Faster R-CNN Inception v2，Mask R-CNN Inception v2这3个模型上都能保持较高的攻击成功率，反映出RTFP方法生成的FPAE的具有较强的迁移性;同时，在距离较远的情况下，FPAE同样可以欺骗这些目标检测器，这是由于这些目标检测器在设计时，相比于推理时间，更注重识别物体的精度，因此，这些目标检测器善于捕捉图像中小尺寸物体的特征，对交通标志本身的特征也更敏感，所以即使在距离较远时，FPAE上的对抗性特征也能被这些目标检测器捕获，从而可以进一步欺骗这些目标检测器;但是SSD Inception v2和SSD MobileNet v2并不善于检测图像中的小尺寸物体，所以，在距离相对比较远时，这2种目标检测器便难以捕获到FPAE的特征，也就无法被FPAE欺骗.

Table 2 ASR of FPAE Generated by RTFP Method on Faster R-CNN ResNet-101
表2 RTFP方法生成的FPAE在Faster R-CNN ResNet-101上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～597999894979397100975～1094959598949999978710～1590828799779981737715～2079829486459062843720～25234950393354312647

Table 3 ASR of FPAE Generated by RTFP Method on Faster R-CNN Inception v2
表3 RTFP方法生成的FPAE在Faster R-CNN Inception v2上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～56858504045444365665～1094969999999999999510～1588979996979894928115～20841726865695630320～25002435203

Table 4 ASR of FPAE Generated by RTFP Method on Mask R-CNN Inception v2
表4 RTFP方法生成的FPAE在Mask R-CNN Inception v2上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～55639242013201727385～1087849085908275705010～1576796591767771766515～2060736470656691827320～259929354234552741

Table 5 ASR of FPAE Generated by RTFP Method on SSD Inception v2
表5 RTFP方法生成的FPAE在SSD Inception v2上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～55158787983747962335～10636467762774114010～1500000000015～2000000000020～25000000000

Table 6 ASR of FPAE Generated by RTFP Method on SSD MobileNet v2
表6 RTFP方法生成的FPAE在SSD MobileNet v2上的ASR %

距离∕m偏转角度∕(°)-60-45-30-150153045601～5232234456155522535～1011240403023193010～1500000000015～2000000000020～25000000000

Fig. 3 AASR of FPAE on YOLOv3 at different
distance ranges
图3 在不同距离范围内FPAE在YOLOv3上
的AASR

Fig. 4 AASR of FPAE on Faster R-CNN ResNet-101
at different distance ranges
图4 在不同距离范围内FPAE在Faster R-CNN
ResNet-101上的AASR

Fig. 5 AASR of FPAE on Faster R-CNN Inception v2
at different distance ranges
图5 在不同距离范围内FPAE在Faster R-CNN
Inception v2上的AASR

Fig. 6 AASR of FPAE on Mask R-CNN Inception v2
at different distance ranges
图6 在不同距离范围内FPAE在Mask R-CNN
Inception v2上的AASR

Fig. 7 AASR of FPAE on SSD Inception v2
at different distance ranges
图7 在不同距离范围内FPAE在SSD Inception v2
上的AASR

Fig. 8 AASR of FPAE on SSD MobileNet v2
at different distance ranges
图8 在不同距离范围内FPAE在SSD MobileNet v2
上的AASR

图3是RTFP方法与AA方法生成的FPAE在各个距离段内在目标模型YOLOv3上的平均攻击成功率(average attacking success rate, AASR)的对比结果，图4～8是RTFP方法与AA方法生成的FPAE在各个距离段内在其他模型上的AASR的对比结果.AASR计算为

(5)

其中，Nas是当前距离段内各个角度下拍摄到的视频中成功欺骗目标检测器的帧数之和，Ndis是当前距离段内各个角度下拍摄到的视频的总帧数.

图3的结果表明，对于目标模型YOLOv3，2种方法生成的FPAE在各个距离段内的AASR大致相同，表明2种FPAE在目标模型上的鲁棒性相当.但是从图4～8的对比结果可以看出，RTFP方法生成的FPAE在其他模型上的每个距离段内的AASR均高于AA方法生成的FPAE的AASR，表明RTFP方法生成的FPAE的迁移性强于AA方法生成的FPAE的迁移性.此外，对于除目标模型YOLOv3之外的其他模型，在距离相对较近时，特别是在1～5 m距离范围内，AA方法生成的FPAE在各个模型上的AASR普遍较低，而RTFP方法生成的FPAE依然可以保持相对较高的AASR.这是由于AA方法的损失函数中并没有设计图像平滑度损失，从而导致生成的FPAE上出现较多的噪声像素点，这些噪声像素点是以YOLOv3为目标模型生成的，所以不会显著影响FPAE对YOLOv3的攻击效果，但是这些噪声像素特征会影响FPAE对其他目标检测器进行黑盒攻击的效果，尤其是在距离较近时，这些像素点在拍摄到的图像上非常明显，因此FPAE会对其他模型进行黑盒攻击的效果有较大影响，而RTFP方法在优化损失函数时加入了图像平滑度损失，所以生成的对抗样本更加平滑，降低了噪声像素点的影响，从而在距离较近时，RTFP方法生成的FPAE依然可以保持相对较高的AASR.

4.3 真实道路上的驾车拍摄测试

为在实际的道路上测试RTFP方法生成的FPAE的攻击效果，本文将生成好的FPAE竖立在真实道路的右侧，然后在距离FPAE较远处驾车匀速(速度的误差在1 km/h内)驶向FPAE，在保持匀速行驶后，在距FPAE所在位置20 m处开始拍摄，直至驶过FPAE，最后，将拍摄的视频中所有包含FPAE的帧送入YOLOv3进行白盒攻击测试，再送入其他目标检测器进行黑盒攻击测试，并计算在各个目标检测器上的攻击成功率ASR. 图9是RTFP方法生成的FPAE在15 km/h，20 km/h，25 km/h，30 km/h的速度下，在目标模型YOLOv3和其他目标检测器上的ASR.可以看出，在不同速度下拍摄的FPAE在各个目标检测器上均能攻击成功，并且对于每个模型，FPAE在不同速度下的ASR大致相同，表明FPAE在不同的速度下仍可以保持较好的鲁棒性和迁移性.图10是RTFP方法与AA方法生成的FPAE在15 km/h，20 km/h，25 km/h，30 km/h的行驶速度下对YOLOv3进行白盒攻击的ASR.从图10中可以看出，RTFP方法生成的FPAE的ASR相对较高，表明RTFP方法生成的FPAE在不同速度下的鲁棒性强于AA方法生成的FPAE.图11～14是RTFP与AA方法生成的FPAE分别在15 km/h，20 km/h，25 km/h，30 km/h的速度下对除YOLOv3之外的其他目标检测器进行黑盒攻击的ASR.从这4组对比结果可以看出，RTFP方法生成的FPAE在各个速度下对各个模型进行黑盒攻击的ASR相对较高，表明RTFP方法生成的FPAE在各个速度下的迁移性强于AA方法生成的FPAE.道路上的驾车拍摄测试近似反映了RTFP方法和AA方法生成的FPAE在实际的驾驶场景中的攻击效果，测试结果表明RTFP方法生成的FPAE在不同的行驶速度下可以保持较强的鲁棒性和迁移性且强于AA方法生成的FPAE.

Fig. 9 ASR of FPAE on YOLOv3 and other object
detectors at different speeds
图9 在不同速度下FPAE在YOLOv3和其他目标
检测器上的ASR

Fig. 10 ASR of FPAE on YOLOv3 at 4 different
speeds
图10 在4种不同速度下FPAE在YOLOv3上的
ASR

Fig. 11 ASR of FPAE in the black-box attack test at
speed of 15 km/h
图11 速度为15 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 12 ASR of FPAE in the black-box attack test at
speed of 20 km/h
图12 速度为20 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 13 ASR of FPAE in the black-box attack test
at speed of 25 km/h
图13 速度为25 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 14 ASR of FPAE in the black-box attack test
at speed of 30 km/h
图14 速度为30 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 15 ASR of FPAE at 4 different speeds
图15 FPAE在4种不同速度下的ASR

Fig. 16 ASR of FPAE in the black-box attack test at
speed of 15 km/h
图16 速度为15 km/h时FPAE在黑盒攻击测试
中的ASR

此外，在驾车拍摄的过程中，摄像头和FPAE之间会发生较快的相对运动，在这种情况下，FPAE在拍摄出来的图像上极易发生运动模糊，因此，为验证RTFP方法中加入的运动模糊变换的有效性，本测试还进行了消融实验.也就是将完整的RTFP方法生成的FPAE与将RTFP方法中的运动模糊变换去除之后(将该方法记为RTFP-wmb方法)生成的FPAE使用同样的拍摄方法进行拍摄，然后测试这2种FPAE在各目标检测器上的ASR.图15是RTFP方法与RTFP-wmb方法生成的FPAE分别在15 km/h，20 km/h，25 km/h，30 km/h的行驶速度下对YOLOv3进行白盒攻击的ASR.从实验结果可以看出，完整的RTFP方法在目标模型上的ASR更高，说明完整的RTFP方法生成的FPAE的鲁棒性强于RTFP-wmb方法生成的FPAE.图16～19是RTFP方法与RTFP-wmb方法生成的FPAE分别在15 km/h，20 km/h，25 km/h，30 km/h的速度下对其他目标检测器进行黑盒攻击的ASR.从这4组对比结果可以看出，在不同的行驶速度下，RTFP方法生成的FPAE的ASR在Faster R-CNN ResNet-101，Faster R-CNN Inception v2，Mask R-CNN Inception v2这3个模型上的ASR较高，而在SSD Inception v2和SSD MobileNet v2这2个模型上的ASR与RTFP-wmb方法生成的FPAE的ASR大致相同，表明RTFP方法生成的FPAE只在部分模型上的迁移性强于RTFP-wmb生成的FPAE，这是因为RTFP方法中加入的运动模糊变换的主要作用是提高FPAE抵抗运动模糊的能力，也就是侧重于提高FPAE的鲁棒性，但是并不能显著提升FPAE的迁移性.图20是RTFP方法生成的FPAE成功欺骗YOLOv3目标检测器的样例帧.

Fig. 17 ASR of FPAE in the black-box attack test
at speed of 20 km/h
图17 速度为20 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 18 ASR of FPAE in the black-box attack test at
speed of 25 km/h
图18 速度为25 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 19 ASR of FPAE in the black-box attack test at
speed of 30 km/h
图19 速度为30 km/h时FPAE在黑盒攻击测试
中的ASR

Fig. 20 Sample frames of FPAE successfully fool
YOLOv3
图20 FPAE成功欺骗YOLOv3目标检测器的
样例帧

5 结论

本文提出一种可生成具有较强的鲁棒性和迁移性的假阳性对抗样本(FPAE)的RTFP方法，该方法在迭代优化过程中考虑了运动模糊对FPAE的攻击效果的影响，除了加入典型的图像变换方法之外，还新加入了运动模糊变换.此外，在设计损失函数时，借鉴了C&W攻击中损失函数的设计思想，将目标检测器在对抗样本所在位置预测出的多个边界框的类别损失设计为适用于生成FPAE的损失函数，并且为防止生成的FPAE出现过多的噪声像素点，在整个损失函数中加入了图像平滑度损失.本文在现实场景中对RTFP方法生成的FPAE进行了多角度、多距离的拍摄测试以及实际道路上的驾车拍摄测试，用每次拍摄得到的视频对目标模型YOLOv3和其他目标检测器分别进行了白盒攻击测试和黑盒攻击测试，并且与现有的AA方法生成的FPAE的攻击成功率进行了对比.在多角度、多距离的拍摄测试中，RTFP方法生成的FPAE在相对较远的距离和较大的偏转角度下依然可以欺骗YOLOv3以及其他目标检测器.实际道路上的驾车拍摄测试表明在4种不同的行驶速度下，RTFP方法生成的FPAE依然能够对YOLOv3和其他目标检测器进行欺骗，且攻击成功率高于现有的AA方法生成的FPAE的攻击成功率，并且，驾车拍摄测试中的消融实验表明RTFP方法生成的FPAE的鲁棒性强于不加入运动模糊变换的RTFP-wmb方法生成的FPAE的鲁棒性，说明了RTFP方法中所加入的运动模糊变换的有效性.综合的实验结果表明RTFP方法生成的FPAE具有较强的鲁棒性和迁移性.

作者贡献声明：袁小鑫进行文献调研，提出论文的创新点，负责实验的实施与分析以及论文的撰写；胡军提供选题来源，设计研究思路，指导实验的设计与论文的撰写；黄永洪提供选题来源，指导实验设计，参加论文研讨.

参考文献

[1]Zhang Kaipeng, Zhang Zhanpeng, Li Zhifeng, et al. Joint face detection and alignment using multitask cascaded convolutional networks[J]. IEEE Signal Processing Letters, 2016, 23(10): 1499-1503

[2]Wang Ziye, Miao Duoqian, Zhao Cairong, et al. A pedestrian tracking algorithm based on multi-granularity feature[J]. Journal of Computer Research and Development, 2020, 57(5): 996-1002 (in Chinese)(王子晔, 苗夺谦, 赵才荣, 等. 基于多粒度特征的行人跟踪检测结合算法[J]. 计算机研究与发展, 2020, 57(5): 996-1002)

[3]Chen Yaran, Zhao Dongbin, Lü Le, et al. Multi-task learning for dangerous object detection in autonomous driving[J]. Information Sciences, 2018, 432: 559-571

[4]Redmon J, Farhadi A. YOLOv3: An incremental improvement[J]. arXiv preprint, arXiv:1804.02767, 2018

[5]Du Luyao, Chen Wei, Fu Shuaizhi, et al. Real-time detection of vehicle and traffic light for intelligent and connected vehicles based on YOLOv3 network[C] //Proc of the 5th Int Conf on Transportation Information and Safety. Piscataway, NJ: IEEE, 2019: 388-392

[6]Rajendran S P, Shine L, Pradeep R, et al. Real-time traffic sign recognition using YOLOv3 based detector[C/OL] //Proc of the 10th Int Conf on Computing, Communication and Networking Technologies. Piscataway, NJ: IEEE,2019 [2021-10-19]. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8944890

[7]Kotuliak M, Schoenborn S E, Dan A. Synthesizing unrestricted false positive adversarial objects using generative models[J]. arXiv preprint, arXiv:2005.09294, 2020

[8]Zhao Yue, Zhu Hong, Liang Ruigang, et al. Seeing isn’t believing: Towards more robust adversarial attack against real world object detectors[C] //Proc of the 2019 ACM SIGSAC Conf on Computer and Communications Security. New York: ACM, 2019: 1989-2004

[9]Athalye A, Engstrom L, Ilyas A, et al. Synthesizing robust adversarial examples[C] //Proc of the 35th Int Conf on Machine Learning. Sydney, Australia: PMLR, 2018: 284-293

[10]Carlini N, Wagner D. Towards evaluating the robustness of neural networks[C] //Proc of the 38th IEEE Symp on Security and Privacy. Piscataway, NJ: IEEE, 2017: 39-57

[11]Szegedy C, Zaremba W, Sutskever I, et al. Intriguing properties of neural networks[C/OL] //Proc of the 2nd Int Conf on Learning Representations. La Jolla, CA: ICLR, 2014 [2021-10-19]. https://arxiv.org/pdf/1312.6199.pdf

[12]Goodfellow I J, Shlens J, Szegedy C. Explaining and harnessing adversarial examples[C/OL] //Proc of the 36th Int Conf on Learning Representations. La Jolla, CA: ICLR, 2015 [2021-10-19]. https://arxiv.org/pdf/1412.6572.pdf

[13]Chen Jinyin, Chen Zhiqing, Zheng Haibin, et al. Black-box adversarial attack against road sign recognition model via PSO[J]. Journal of Software, 2020, 31(9): 2785-2801 (in Chinese)(陈晋音, 陈治清, 郑海斌, 等. 基于PSO的路牌识别模型黑盒对抗攻击方法[J]. 软件学报, 2020, 31(9): 2785-2801)

[14]Eykholt K, Evtimov I, Fernandes E, et al. Robust physical-world attacks on deep learning visual classification[C] //Proc of the 31st IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2018: 1625-1634

[15]Xie Cihang, Wang Jianyu, Zhang Zhishuai, et al. Adversarial examples for semantic segmentation and object detection[C] //Proc of the 16th IEEE Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2017: 1369-1378

[16]Lu Jiajun, Sibai H, Fabry E. Adversarial examples that fool detectors[J]. arXiv preprint, arXiv:1712.02494, 2017

[17]Ren Shaoqing, He Kaiming, Girshick R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149

[18]Li Yuezun, Tian Daniel, Chang Mingching, et al. Robust adversarial perturbation on deep proposal-based models[J]. arXiv preprint, arXiv:1809.05962, 2018

[19]Liu Xin, Yang Huanrui, Liu Ziwei, et al. Dpatch: An adversarial patch attack on object detectors[J]. arXiv preprint, arXiv:1806.02299, 2018

[20]Wei Xingxing, Liang Siyuan, Cao Xiaochun, et al. Transferable adversarial attacks for image and video object detection[J]. arXiv preprint, arXiv:1811.12641, 2018

[21]Li Yuezun, Bian Xiao, Chang Mingching, et al. Exploring the vulnerability of single shot module in object detectors via imperceptible background patches[J]. arXiv preprint, arXiv:1809.05966, 2018

[22]Eykholt K, Evtimov I, Fernandes E, et al. Physical adversarial examples for object detectors[C/OL] //Proc of the 12th USENIX Workshop on Offensive Technologies. Berkeley, CA: USENIX Association, 2018 [2021-10-19]. https://arxiv.org/pdf/1807.07769v1.pdf

[23]Redmon J, Farhadi A. YOLO9000: Better, faster, stronger[C] //Proc of the 30th IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2017: 7263-7271

[24]Chen Shang-tse, Cornelius C, Martin J, et al. ShapeShifter: Robust physical adversarial attack on faster R-CNN object detector[C] //Proc of the Joint European Conf on Machine Learning and Knowledge Discovery in Databases. Berlin: Springer, 2018: 52-68

[25]Huang Yi, Kong A W, Lam K. Adversarial signboard against object detector[C/OL] //Proc of the 30th British Machine Vision Conf. British Machine Vision Association, 2019: 231-241 [2021-10-19]. https://bmvc2019.org/wp-content/uploads/papers/1017-paper.pdf

[26]Liu Wei, Anguelov D, Erhan D, et al. SSD: Single shot multibox detector[C] //Proc of the 14th European Conf on Computer Vision. Berlin: Springer, 2016: 21-37

[27]Girshick R. Fast R-CNN[C] //Proc of the IEEE Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2015: 1440-1448

[28]Lin Tsung-yi, Maire M, Belongie S, et al. Microsoft COCO: Common objects in context[C] //Proc of the 13th European Conf on Computer Vision. Berlin: Springer, 2014: 740-755

[29]Serban A, Poll E, Visser J. Adversarial examples on object recognition: A comprehensive survey[J]. ACM Computing Surveys, 2020, 53(3): 1-38

[30]Akhtar N, Mian A. Threat of adversarial attacks on deep learning in computer vision: A survey[J]. IEEE Access, 2018, 6: 14410-14430

[31]He Kaiming, Gkioxari G, Dollár P, et al. Mask R-CNN[C] //Proc of the 16th IEEE Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2017: 2961-2969

[32]Huang Jonathan, Rathod V, Sun Chen, et al. Speed/accuracy trade-offs for modern convolutional object detectors[C] //Proc of the 30th IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2017: 7310-7311

False Positive Adversarial Example Against Object Detectors

Yuan Xiaoxin1,2, Hu Jun1,2, and Huang Yonghong3

1(Chongqing Key Laboratory of Computational Intelligence(Chongqing University of Posts and Telecommunications), Chongqing 400065) 2(College of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065) 3(College of Cyber Security and Information Law, Chongqing University of Posts and Telecommunications, Chongqing 400065)

Abstract Object detectors have been widely applied in various intelligent systems, and mainly used to classify and locate objects in images. However, recent studies show that object detectors are as susceptible to digital adversarial examples and physical adversarial examples as DNNs classifiers. YOLOv3 is a mainstream object detector used in real-time detection tasks. Most of the existing physical adversarial examples for attacking YOLOv3 are constructed by printing out the large adversarial perturbations and pasting them on the surface of a specific class of object. The false positive adversarial example(FPAE) that appeared in recent research can be directly generated by the target model, which are unrecognizable to humans but can cause the object detectors to recognize them as the target class specified by the attacker with high confidence. The existing method to generate FPAE with YOLOv3 as the target model is only the AA(appearing attack) method. In the process of generating FPAE through the AA method, in order to improve the robustness of FPAE, EOT(expectation over transformation) image transformation will be added in the iterative optimization process to simulate various physical conditions, but motion blur that may occur during shooting is not considered, which in turn affects the attack effect of adversarial examples. In addition, the generated FPAE has a low attack success rate when it performs black-box attack on object detectors other than YOLOv3. In order to generate a better performance FPAE to reveal the weaknesses of existing object detectors and test the security of existing object detectors, we take the YOLOv3 object detector as the target model, and propose the RTFP(robust and transferable false positive) adversarial attack method. In the iterative optimization process of this method, in addition to using typical image transformation, motion blur transformation is added. At the same time, in the design of the loss function, this method draws on the design idea of the loss function in the C&W attack, and takes the IOU(intersection over union) between the bounding boxes predicted by the target model in the grid cell where the center of the FPAE is located and the real bounding box where the FPAE is located as the weight item of the classification loss of the predicted bounding boxes. In the experiment of the multiple distance-angle combinations shooting tests and the driving shooting tests in the real world, the FPAE generated by RTFP method can maintain good robustness, and its transferability is better than the FPAE generated by the existing methods.

Key words false positive adversarial example (FPAE); robustness and transferability; object detectors; physical adversarial attack; real-time detection

中图法分类号 TP391

收稿日期：2021-06-11；修回日期：2021-11-15

基金项目：国家自然科学基金项目(61772096，61876201，61876027)；重庆市自然科学基金项目(cstc2019jcyj-cxttX0002，cstc2021ycjh-bgzxm0013)；重庆市教委重点合作项目(HZ2021008)

This work was supported by the National Natural Science Foundation of China (61772096, 61876201, 61876027), the Natural Science Foundation of Chongqing (cstc2019jcyj-cxttX0002, cstc2021ycjh-bgzxm0013), and the Key Cooperation Project of Chongqing Municipal Education Commission (HZ2021008).

通信作者：胡军(hujun@cqupt.edu.cn)

(fyyjyx@163.com)

Yuan Xiaoxin, born in 1996. Master. His main research interest is artificial intelligence security.

袁小鑫，1996年生.硕士.主要研究方向为人工智能安全.

Hu Jun, born in 1977. PhD, professor, PhD supervisor. Senior member of CCF. His main research interests include granular computing, rough set, intelligent information processing and data mining.

胡军，1977年生.博士，教授，博士生导师.CCF高级会员.主要研究方向为粒计算、粗糙集、智能信息处理和数据挖掘.

Huang Yonghong, born in 1974. Master, lecturer. His main research interests include security operating system and artificial intelligence security.

黄永洪，1974年生.硕士，讲师.主要研究方向为安全操作系统、人工智能安全.