Processing math: 0%
  • 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于集合效用边际贡献学习的可解释薪酬预测算法

孙莹, 章玉婷, 庄福振, 祝恒书, 何清, 熊辉

孙莹, 章玉婷, 庄福振, 祝恒书, 何清, 熊辉. 基于集合效用边际贡献学习的可解释薪酬预测算法[J]. 计算机研究与发展, 2024, 61(5): 1276-1289. DOI: 10.7544/issn1000-1239.202330133
引用本文: 孙莹, 章玉婷, 庄福振, 祝恒书, 何清, 熊辉. 基于集合效用边际贡献学习的可解释薪酬预测算法[J]. 计算机研究与发展, 2024, 61(5): 1276-1289. DOI: 10.7544/issn1000-1239.202330133
Sun Ying, Zhang Yuting, Zhuang Fuzhen, Zhu Hengshu, He Qing, Xiong Hui. Interpretable Salary Prediction Algorithm Based on Set Utility Marginal Contribution Learning[J]. Journal of Computer Research and Development, 2024, 61(5): 1276-1289. DOI: 10.7544/issn1000-1239.202330133
Citation: Sun Ying, Zhang Yuting, Zhuang Fuzhen, Zhu Hengshu, He Qing, Xiong Hui. Interpretable Salary Prediction Algorithm Based on Set Utility Marginal Contribution Learning[J]. Journal of Computer Research and Development, 2024, 61(5): 1276-1289. DOI: 10.7544/issn1000-1239.202330133
孙莹, 章玉婷, 庄福振, 祝恒书, 何清, 熊辉. 基于集合效用边际贡献学习的可解释薪酬预测算法[J]. 计算机研究与发展, 2024, 61(5): 1276-1289. CSTR: 32373.14.issn1000-1239.202330133
引用本文: 孙莹, 章玉婷, 庄福振, 祝恒书, 何清, 熊辉. 基于集合效用边际贡献学习的可解释薪酬预测算法[J]. 计算机研究与发展, 2024, 61(5): 1276-1289. CSTR: 32373.14.issn1000-1239.202330133
Sun Ying, Zhang Yuting, Zhuang Fuzhen, Zhu Hengshu, He Qing, Xiong Hui. Interpretable Salary Prediction Algorithm Based on Set Utility Marginal Contribution Learning[J]. Journal of Computer Research and Development, 2024, 61(5): 1276-1289. CSTR: 32373.14.issn1000-1239.202330133
Citation: Sun Ying, Zhang Yuting, Zhuang Fuzhen, Zhu Hengshu, He Qing, Xiong Hui. Interpretable Salary Prediction Algorithm Based on Set Utility Marginal Contribution Learning[J]. Journal of Computer Research and Development, 2024, 61(5): 1276-1289. CSTR: 32373.14.issn1000-1239.202330133

基于集合效用边际贡献学习的可解释薪酬预测算法

基金项目: 国家自然科学基金项目(62176014, 61836013);广州市科技计划市校联合资助项目 (2023A03J0141);中央高校基本科研业务费专项资金
详细信息
    作者简介:

    孙莹: 1994年生. 博士,助理教授,博士生导师. CCF会员. 主要研究方向为机器学习、数据挖掘

    章玉婷: 1998年生. 硕士研究生. 主要研究方向为机器学习、数据挖掘

    庄福振: 1983年生. 博士,教授,博士生导师. CCF高级会员. 主要研究方向为机器学习、数据挖掘

    祝恒书: 1986年生. 博士,高级工程师(正研级).CCF高级会员. 主要研究方向为机器学习、数据挖掘

    何清: 1965年生. 博士,研究员,博士生导师. CCF高级会员. 主要研究方向为机器学习、数据挖掘

    熊辉: 1972年生. 博士,教授,博士生导师. CCF高级会员. 主要研究方向为数据与知识工程

  • 中图分类号: TP391

Interpretable Salary Prediction Algorithm Based on Set Utility Marginal Contribution Learning

Funds: This work was supported by the National Natural Science Foundation of China (62176014, 61836013), the City-University Joint Funding Project of Guangzhou Science and Technology Plan (2023A03J0141), and the Fundamental Research Funds for the Central Universities.
More Information
    Author Bio:

    Sun Ying: born in 1994. PhD, assistant professor, PhD supervisor. Member of CCF. Her main research interests include machine learning and data mining

    Zhang Yuting: born in 1998. Master candidate. Her main research interests include machine learning and data mining

    Zhuang Fuzhen: born in 1983. PhD, professor, PhD supervisor. Senior member of CCF. His main research interests include machine learning and data mining

    Zhu Hengshu: born in 1986. PhD, professor of engineering. Senior member of CCF. His main research interests include machine learning and data mining

    He Qing: born in 1965. PhD, professor, PhD supervisor. Senior member of CCF. His main research interests include machine learning and data mining

    Xiong Hui: born in 1972. PhD, professor, PhD supervisor. Senior member of CCF. His main research interest includes data and knowledge engineering

  • 摘要:

    知识技能对薪酬影响作用视为一种多变量影响下高维元素集合的效用建模问题. 深度神经网络为解决复杂问题提供了新的机遇,但针对知识导向的细粒度薪酬预测问题,仍缺乏能够对复杂变量影响下的集合效用进行准确、可解释建模的神经网络结构. 为此,提出一种基于边际贡献的增量式集合效用网络 (marginal contribution-based incremental set utility network,MCISUN)来拟合元素加入时的效用增量,从而灵活且可解释地建模集合效用. 区别于以往基于池化层的排列不变性建模算法,MCISUN构建顺序敏感的中间结果,利用集合的排列不变性实现数据增强,有效提升模型数据效率及泛化性. 最后,大规模真实薪酬数据上的实验结果表明所提模型在基于技能的薪酬预测任务上比最先进的(state-of-the-art, SOTA)模型效果提升超过30%. 同时,定性实验证明模型能够为技能设置合理的贡献值且发现技能间的关联.

    Abstract:

    Accurately quantifying the relationship between skills and salary is essential to improve reasonable job salary setting and promote talent attraction and retention. However, the relationship between skills and salary is complex because it involves modeling set utility in a high-dimensional space with massive possible elements. Deep neural networks offer a new solution for complex fitting problems. However, for skill-based fine-grained salary prediction, there still lacks interpretable neural networks that can effectively model set utility under the influence of complex variables. To address this issue, we propose a marginal contribution-based incremental set utility network (MCISUN). MCISUN models the marginal contribution of elements when they are added to the set. In this way, the set utility can be naturally obtained in a flexible and interpretable way. In particular, rather than relying on pooling structures to ensure permutation invariance, MCISUN constructs order-sensitive intermediate results through recurrent attention neural networks and takes advantage of the sets’ permutation invariance property to achieve data augmentation, thus improving the model’s robustness. We conduct extensive experiments on a real-world large-scale salary dataset. The experimental results show that MCISUN outperforms state-of-the-art models by 30% for skill-based salary prediction. Qualitative experiments show that our model can recognize reasonable skill contribution values and capture the relationship between skills.

  • 小目标检测作为目标检测中的难点技术,被广泛应用于自动驾驶、医学领域、无人机导航、卫星定位和工业检测等视觉任务中. 近些年基于深度学习的目标检测算法发展迅猛. 以YOLO(You Only Look Once)[1]和SSD(Single Shot MultiBox Detector)[2]为代表的一阶段算法直接预测出目标的位置和类别,具有较快的速度. 而二阶段算法[3-4]在生成候选框的基础上再回归出目标区域,具有更高的精度.但是这些算法在检测只含有较少像素的小目标(小于32×32像素)时表现较差,检测率甚至不到较大目标的一半. 因此,小目标检测仍然具有很大的改进空间.

    小目标检测效果差主要是由于网络本身的局限性以及训练数据不平衡所导致[5]. 为了获得较强的语义信息和较大的感受野,检测网络不断堆叠下采样层,使得小目标信息在前向传播的过程中逐渐丢失[6],限制了小目标的检测性能. 特征金字塔网络(feature pyramid network, FPN)[7]将低层特征图和高层特征横向融合,可以在一定程度上缓解信息丢失的问题[1-2]. 然而FPN直接融合不同层级的特征会造成语义冲突,限制多尺度特征的表达,使小目标容易淹没于冲突信息中. 同时,目前主流的公开数据集中,小目标的数量远远小于较大目标,使得小目标对损失的贡献小,网络收敛的方向不断向较大目标倾斜.

    针对小目标检测效果差的问题,本文提出一种上下文增强和特征提纯相结合的复合FPN结构,该结构主要包括上下文增强模块(context augmentation module, CAM)和特征提纯模块(feature refinement module, FRM). 同时,提出一种复制—缩小—粘贴(copy-reduce-paste)的数据增强方法,具体有3点:

    1)CAM融合多尺度空洞卷积特征以获取丰富的上下文信息,补充检测所需信息;

    2)FRM引入通道和空间自适应融合的特征提纯机制以抑制特征中的冲突信息;

    3)通过copy-reduce-paste数据增强来提高小目标在训练过程中对损失的贡献率.

    目标检测是一种基础的计算机视觉任务,经过多年的发展,基于卷积神经网络(convolutional neural network, CNN)的目标检测器逐渐成为主流. RCNN[3]首先生成候选区域以匹配不同尺寸的目标,然后通过CNN筛选候选区域. FasterR-CNN[4]将候选区域生成阶段和分类阶段结合在一起,以提高检测速度. EFPN[8]提出超分辨率FPN结构以放大小目标的特征[9]. 一阶段网络SSD将锚盒密集的布置在图像上以回归出目标框,同时充分利用不同尺度的特征,以检测较小目标. YOLOV3[1]利用特征金字塔的3层输出分别检测大、中、小目标,明显提高小目标检测性能. RefineDet[10]引入一种新的损失函数以解决简单样本和复杂样本不平衡的问题. 同时也有研究者提出基于anchor-free架构的检测器[11].尽管目标检测算法发展迅速,但是小目标检测率却一直较低. 本文选用带有FPN的YOLOV3作为基础网络,并在此基础上做出改进.

    多尺度特征是一种提高小目标检测率的有效方法. SSD[2]首次尝试在多尺度特征上预测目标位置和类别. FPN[7]自上而下地将含有丰富语义信息的高层特征图和含有丰富几何信息的低层特征图横向融合. PANet[12]在FPN的基础上添加了额外的自下而上的连接以更高效地传递浅层信息到高层. NAS-FPN[13]利用神经架构搜索技术搜索出了一种新的连接方式. BiFPN[14]改良了PANet的连接方式,使其更加高效,并在连接处引入了简单的注意力机制. 虽然文献[1214]中的结构都能提升网络多尺度表达的能力,但是都忽略了不同尺度特征之间冲突信息的存在可能会阻碍性能的进一步提升,本文则充分考虑了冲突信息对检测精度的影响.

    深度学习是基于数据的方法,因而对训练数据的预处理是其关键的一环. 常见的数据预处理方法如旋转、变形、随机擦除、随机遮挡和光照畸变等. Stitcher[15]将4张训练图像缩小为原图的1/4,并且将它们拼接为1张图像来实现小目标的数据增强,同时将损失值作为反馈信号以指导数据增强的进行. YOLOV4[16]将4张训练图像缩小为不同大小并且拼接为1张来实现小目标的数据增强. 文献[1516]中的方式对于目标尺寸普遍很大的图像来说,会将大目标图像缩小为中等目标大小,最终提高中等目标图像的检测率. Kisantal等人[5]采用将图像的小目标区域复制然后粘贴回原图的方式实现小目标数据增强. 但这种方式只能增加小目标个数而不能增加含有小目标的图像个数,也会造成一定的不平衡. 本文提出的数据增强算法则基于较大目标广泛分布于训练的各个批次的事实,保证训练平衡进行. 本文算法结构图如图1所示:

    图  1  FPN总体网络结构
    Figure  1.  Overall network structure of FPN

    图1中{C2, C3C4C5}分别表示图像经过{4, 8, 16, 32}倍下采样后的特征图,{C3C4C5}经过1层卷积后分别生成{F1F2F3},其中C2由于含有大量噪声而未被使用. {L1L2L3}分别是{F1F2F3}经过FPN后的结果,{P1P2P3}为{L1L2L3}经过FRM的输出.

    CAM启发于人类识别物体的模式. 如,我们很难分辨很高天空中的小鸟,但是考虑天空作为其背景,我们就很容易分辨出,因为从我们学习到的知识中可知,在天空背景下的微小目标很有可能是小鸟,而这种背景信息,即是目标的上下文信息.因此如果目标检测网络也在图像中学习到这样的“知识”将会有助于检测小目标.

    由于FPN不同层的特征密度不同,因而含有大量的语义差异,在实现信息共享的同时也引入了很多冲突信息. 因此,本文提出了FRM用于过滤冲突信息,减少语义差异. FRM通过将不同层间的特征自适应融合,以达到抑制层间冲突信息的目的.

    针对小目标对损失贡献低的问题,提出了一种copy-reduce-paste数据增强方法,以提高小目标对损失的贡献.

    目标检测需要定位信息也需要语义信息,处于FPN最低层的L3含有较多的定位信息而缺少语义信息. FPN自上而下的信息共享结构在通道数减少之后才进行融合,使得L3未能获取充分的语义信息. 为此我们利用不同空洞卷积率的空洞卷积来获取上下文信息,并将其注入到FPN中,以补充上下文信息.

    图2(a)是CAM的结构图. 对于大小为[bs, C, H, W]的输入分别进行空洞卷积率为1,3,5的空洞卷积[17]. bs, C, H, W分别为特征图的批次大小、通道数、高和宽.由于该模块输入的尺寸较小,为了获取更多的细节特征,不宜使用大卷积,因此选用3×3的卷积.同时为了避免引入较多的参数量,选取卷积核的个数为C/4,即首先压缩通道数为输入的1/4,然后再通过1×1的卷积扩张通道数为C,得到3种大小相同而感受野不同的输出,最后融合得到的特征. 特征融合可采用的方式如图2(b)~(d)所示. 图2(b),(c)分别为拼接融合和加权融合,即分别在通道和空间维度上直接拼接和相加. 图2(d)是自适应融合方式,即通过卷积、拼接和归一化等操作将输入特征图压缩为通道为3的空间权重,3个通道分别与3个输入一一对应,计算输入特征和空间权重的加权和可以将上下文信息聚合到输出中.

    图  2  CAM结构图
    Figure  2.  The structure of CAM

    本文通过消融实验验证各个融合方式的有效性,实验结果如表1所示.

    表  1  CAM消融实验结果
    Table  1.  Ablation Experimental Results of CAM %
    算法AP(IOU=0.5)AR(IOU=0.5)
    APsAPmARsARm
    基线模型34.860.557.978.7
    相加融合35.663.060.581.8
    自适应融合36.063.158.981.0
    拼接融合36.661.059.879.5
    注:基线模型为YOLOV3,测试数据集为VOC,IOU为交并比. APsAPm分别指小目标、中目标的平均精度;ARsARm分别指小目标、中目标的平均召回率.
    下载: 导出CSV 
    | 显示表格

    表1可知,对于小目标来说,拼接融合所取得的增益最大,APsARs分别提高了1.8%和1.9%. 自适应融合对中目标的提升最为明显,APm提升了2.6%. 相加融合带来的提升则基本介于拼接融合和自适应融合两者之间,因此本文选择拼接融合的方式.

    本文将部分特征图可视化以说明CAM的效果,可视化结果如图3所示.

    图  3  上下文信息增强效果图
    Figure  3.  Context information augmentation effect diagrams

    图3(b)为CAM输入特征图,从中可以发现在图像的目标处有微小响应,呈现为较小的“白点”. 图3(c)为CAM输出特征图,可以明显看到目标处的响应明显增强,并且响应范围更大,这是因为CAM将目标周围的上下文信息也融入特征中,使得目标处的响应更强. 因此将CAM提取的上下文信息注入网络中将有助于小目标的检测.

    FPN用于融合不同尺度大小的特征,然而不同尺度的特征具有不可忽视的语义差异,将不同尺度的特征直接融合可能引入大量的冗余信息和冲突信息,降低多尺度表达的能力. 为了抑制冲突信息,本文提出FRM,该模块结构如图4所示.

    图  4  FRM结构
    Figure  4.  The structure of FRM

    图4(a)为接在FPN第2层后的FRM结构图. 从图(4)可看出,{\boldsymbol{X}}^1 {\boldsymbol{X}}^2 {\boldsymbol{X}}^3 (FPN的3层输出)为该模块的输入,首先将{\boldsymbol{X}}^1 {\boldsymbol{X}}^2 {\boldsymbol{X}}^3 3个输入缩放到同一大小,分别为{\boldsymbol{R}}^1 {\boldsymbol{R}}^2 {\boldsymbol{R}}^3 ,然后再利用拼接和卷积操作将所有输入特征的通道数压缩为3,随后接上并联的通道提纯模块和空间提纯模块.

    通道提纯模块的具体结构如图4(b)所示,为了计算通道注意力,采用平均池化和最大池化相结合的方式来聚合图像的全局空间信息. 用{\boldsymbol{X}}^m 表示FRM的第m(m∈{1,2,3})层输入特征图,其输出可表示为

    {\boldsymbol{U}} = {\boldsymbol{\alpha }} \times RS({{\boldsymbol{X}}^1}) + {\boldsymbol{\beta }} \times {{\boldsymbol{X}}^2} + {\boldsymbol{\gamma }} \times RS({{\boldsymbol{X}}^3}). (1)

    其中RS表示resize函数,在式(1)中将{\boldsymbol{X}}^1 {\boldsymbol{X}}^3特征缩放到和{\boldsymbol{X}}^2同一尺度. {\boldsymbol{\alpha }}{\boldsymbol{\beta }}, {\boldsymbol{\gamma }}为通道自适应权重,其尺度为1×1×1. 经过归一化的{\boldsymbol{\alpha }}{\boldsymbol{\beta }}, {\boldsymbol{\gamma }} 代表3个输入的相对权重,这3个值越大表示具有更大的响应,将它们与输入相乘,响应大的输入将被放大,响应小的输入将被抑制,以此将更加有用的信息增强而抑制不重要的噪声. {\boldsymbol{\alpha }}{\boldsymbol{\beta }}, {\boldsymbol{\gamma }}可表示为

    {\text{[}}{\boldsymbol{\alpha }},{\boldsymbol{\beta }},{\boldsymbol{\gamma }}{\text{]}} = sigmoid{\kern 1pt} {\kern 1pt} {\text{[}}{AvgPool} {\text{(}}{\boldsymbol{F}}{\text{)}} + {MaxPool} {\text{(}}{\boldsymbol{F}}{\text{)]}}. (2)

    其中F图4(a)中标识的特征图,AvgPoolMaxPool分别为平均池化和最大池化操作.

    空间提纯模块利用softmax函数将特征图在空间上归一化,得到特征图中某点关于其他所有位置的相对权重,然后将其与输入分别相乘. 其输出可表示为

    \begin{split} {\boldsymbol{D}} =\;& {{\boldsymbol{\mu }}_{{\text{(}}x,y{\text{)}}}} \times RS\left( {{\boldsymbol{X}}_{{\text{(}}x,y{\text{)}}}^1} \right) + \;{{\boldsymbol{\nu }}_{{\text{(}}x,y{\text{)}}}} \times {\boldsymbol{X}}_{{\text{(}}x,y{\text{)}}}^2+ \\ &{{\boldsymbol{\omega }}_{{\text{(}}x,y{\text{)}}}} \times RS\left( {{\boldsymbol{X}}_{{\text{(}}x,y{\text{)}}}^3} \right). \end{split} (3)

    (x,y)表示特征图的空间坐标. {\boldsymbol{\mu }}{\boldsymbol{\nu }}{\boldsymbol{\omega }}为空间自适应权重,目标区域的响应较大,将会获得更大的权重,反之背景区域获得的权重较小. {\boldsymbol{\mu }}{\boldsymbol{\nu }}{\boldsymbol{\omega }}与输入具有相同的空间大小,因此将它们和输入直接相乘可以达到将目标特征放大和背景噪声抑制的目的. {\boldsymbol{\mu }}{\boldsymbol{\nu }}{\boldsymbol{\omega }}可由式(4)表示.

    [{\boldsymbol{\mu }},{\boldsymbol{\nu }},{\boldsymbol{\omega }}] = {\text{soft}}\max ({\boldsymbol{F}}). (4)

    softmax函数用于归一化特征参数以提高模型的泛化能力.那么此模块的总输出为

    {\boldsymbol{P}} = {\boldsymbol{U}} + {\boldsymbol{D}}. (5)

    FPN所有层的特征都在自适应权重的引导下融合,融合的结果作为整个网络的输出.

    为更加直观地说明特征提纯模块的作用,图5展示了部分可视化的特征图. 由于小目标的检测由FPN的最低层主导,因此我们仅可视化了最低层的特征. 图5F3L3P3分别对应图1中的标签F3L3P3.

    图  5  FRM可视化结果
    Figure  5.  Visualization results of FRM

    图5可知,F3特征可大致定位目标位置,但是包含较多背景噪声,具有较大误检的可能. L3相比于F3,背景信息明显减少,这是FPN融合高层信息的结果. 高层信息更加关注于物体的抽象信息而不关注背景信息,因此背景信息会被中和. 但是由于特征的细腻度不同,引入了冲突信息,使得目标的响应被削弱.而P3的目标特征被强化,并且目标和背景之间的边界更加明显. 由可视化分析可知,本文提出的FRM可减少干扰小目标的冲突信息,提高判别性,以此提高小目标的检测率.

    当前主流的公开数据集中,小目标的数量或包含小目标的图片数量远远小于较大目标的,如VOC数据集,统计情况如表2所示. 同时,如图6(a)所示,小目标产生的正样本数量远远小于较大目标的,因而小目标对损失的贡献率远远小于较大目标的,使得网络收敛的方向不断向较大目标倾斜.

    表  2  VOC数据集目标尺寸统计结果
    Table  2.  Statistical Results of Target Size on VOC Datebase %
    统计值小目标中目标大目标
    目标数量占比10.016.673.4
    图片数量占比8.216.275.6
    下载: 导出CSV 
    | 显示表格

    为了缓解这个问题,我们在训练过程中复制、缩小、粘贴图像中的目标,以增加小目标产生的正样本数量以及对损失的贡献值,使得训练更为平衡. 数据增强效果如图6(b)和图6(c)所示.

    图  6  数据增强示例
    Figure  6.  Data augmentation examples

    图6(b),图6(c)是粘贴1次的结果示例,实线框是原有的目标,虚线框为粘贴的目标. 首先复制大目标图像块,然后对图像块进行缩小,最后粘贴到原图的不同位置.我们提出的数据增强方法并没有直接复制小目标图像区域粘贴到不同位置,这是考虑到数据集中含有小目标的图像数量较少,如果仅仅复制粘贴小目标,在很多批次中小目标对损失的贡献仍然很低. 此外,我们研究了粘贴次数对小目标检测性能的影响, 实验结果如表3所示.

    表  3  数据增强消融实验结果
    Table  3.  Ablation Experimental Results of Data Augmentation %
    粘贴次数AP(IOU=0.5)AR(IOU=0.5)
    APsAPmARsARm
    0(基线模型)34.860.557.978.7
    137.362.759.880.9
    236.862.658.081.0
    333.259.758.079.8
    注:基线模型为YOLOV3IOU为交并比.APsAPm分别指小目标、中目标的平均精度;ARsARm分别指小目标、中目标的平均召回率.
    下载: 导出CSV 
    | 显示表格

    表3中可知,随着粘贴次数的增加,小目标的检测率逐渐减小,甚至会造成低于基线模型的情况.这可能是由于随着粘贴次数的增加,逐渐破坏了原始数据的分布,使得在测试集的表现较差. 在粘贴1次时,APs提高了2.5%,ARs提高了1.9%,同时中目标的检测率也略有提升,结果表明粘贴1个目标是最佳的设定.

    本文实验在VOC和TinyPerson两种数据集[18]上进行. VOC有22136张训练图像和4952张测试图像,共20个类别. TinyPerson数据集包含2个类别,798张训练图片和816张测试图片,其场景多为远距离大背景下的图像,所标注目标的平均大小为18像素,是一个真正意义上的小目标数据集.

    本文所使用的评估指标为:

    精度(precision, P),用来检测结果中相关类别占总结果的比重;

    召回率(recall, R),用来检测结果中相关类别占总类别的比重. 由P-R曲线可计算所有大、中、小目标平均检测精度的均值(mAP):

    mAP = \frac{{\text{1}}}{k}\sum\limits_{n = 1}^N {P\left( n \right) \times\Delta r\left( n \right)} . (6)

    其中N为测试集总数,P(n)表示n张图像的精确度,∆r(n)表示从n−1增加到n时召回率的变化量,k为类别数. 同时,使用下标s,m,l分别表示在小尺度、中尺度和大尺度目标上的性能. 本文所有的实验在同样的软件和硬件条件下进行(pytorch[19]框架,Intel Core i7-5820k CPU@3.30 GHz处理器,16 GB内存,GeForce GTX TITAN显卡).

    图7为训练时的损失变化曲线,我们采用SGD优化器训练50轮次(前2个轮次预热),批次设定为8,学习率初始值为 0.0001,训练的损失值平滑下降.部分特征可视化结果如图8所示.

    图  7  损失曲线
    Figure  7.  The curve of loss
    图  8  训练特征图可视化效果
    Figure  8.  Visualization results of feature maps in training

    图8所示,图8(b)为浅层特征,网络更关注物体的纹理信息. 图8(c)为深层特征,图像的信息逐渐抽象,网络更关注物体的高层语义信息.

    为验证本文算法在小目标检测上的有效性,本文在TinyPerson和VOC数据集上分别进行了实验.

    本文复现了4种算法在TinyPerson数据集上的检测结果,由于该数据集几乎全是小目标,因此只进行APs指标的对比,对比结果如表4所示.

    表  4  TinyPerson数据集上的检测结果
    Table  4.  Detection Results on TinyPerson Dataset %
    算法主干网络APs
    MaskR-CNN[20]ResNet5042.5
    AL-MDN[21]AGG1634.1
    DSFD[22]ResNet15251.6
    YOLOV5[23]CSPDarkNet54.3
    本文算法Darknet5355.1
    注:APs指小目标的平均精度.
    下载: 导出CSV 
    | 显示表格

    表4可知,本文算法在该数据集上的APs达到55.1%. 相比YOLOV5和DSFD算法,本文算法分别有0.8%和3.5%的提升,而相比于AL-MDN和MaskR-CNN则分别高出21%和12.6%.

    本文复现了3种较为前沿的目标检测算法在VOC上的结果,并且比较这些算法在小目标、中目标上的APAR,实验结果如表5所示:

    表  5  VOC数据集上的小目标检测结果
    Table  5.  Results of Small Targets Detection on VOC Dataset %
    算法 AP(IOU \in [0.5,0.95]) AR(IOU \in [0.5,0.95])
    APsAPmARsARm
    RefineDet[10]11.634.920.239.9
    CenterNet[24]9.231.317.443.0
    YOLOV4[16]13.034.518.142.8
    本文算法16.933.429.445.8
    注:IOU为交并比.APsAPm分别指小目标、中目标的平均精度;ARsARm分别指小目标、中目标的平均召回率.
    下载: 导出CSV 
    | 显示表格

    表5可知,本文算法相比于YOLOV4,APs高3.9%,ARs高11.3%;相比于RefineDet,APs高5.3%,ARs高9.2%;而相比于CenterNet,本文算法的APsARs分别具有7.7%和12.0%的优势. 不难发现,本文算法在小目标的召回率上具有较大优势,说明本文算法具有较强的小目标查找能力.

    将本文算法和近几年的一阶段算法和二阶段算法在VOC数据集上的mAP进行对比,对比结果如表6所示.

    表  6  VOC数据集上的实验结果(IOU=0.5)
    Table  6.  Experimental Results on VOC Dataset (IOU=0.5)
    类型算法主干网络输入尺寸mAP/%
    二阶段
    Faster R-CNN[4]ResNet1011000×60076.4
    R-FCN[3]ResNet1011000×60080.5
    HyperNet[25]VGG161000×60076.3
    CoupleNet[26]ResNet1011000×60082.7
    Reconfig[27]ResNet1011000×60082.4
    IPG-Net[28]IPGNet1011000×60084.8
    一阶段
    SSD[2]VGG16512×51279.8
    RefineDet[10]VGG16512×51281.8
    RFBNet[29]VGG16512×51282.2
    ScratchDet[30]RestNet34320×32080.4
    PFPNet[31]VGG16512×51282.3
    本文算法Darknet53448×44883.6
    本文算法+Darknet53448×44885.1
    注:“+”表示多尺度测试.
    下载: 导出CSV 
    | 显示表格

    表6可知,与一阶段算法相比,本文算法比PFPNet的mAP高1.3%,具有最好的表现. 与二阶段算法相比,本文算法优于大部分的二阶段算法,但比IPG-Net的mAP低1.2%,这主要是由于本文算法的主干网络性能较差以及输入图像大小较小. 如果本文采用多尺度测试的方法,则在VOC数据集上的检测率可达到85.1%,高于所有的对比算法.

    本文算法对小目标的检测具有较大优势,不管是总体检测效果还是小目标的检测率、召回率都表现良好,优于大多数检测算法.

    本文以消融实验验证每个模块的贡献.通过逐个添加数据增强方法、CAM和FRM到基线模型YOLOV3中,得出实验结果如表7所示:

    表  7  消融实验结果
    Table  7.  Ablation Experimental Results
    基线模型增强CAMFRMAP/% (IOU = 0.5)AR/% (IOU = 0.5)
    APsAPmAPlARsARmARl
    34.860.583.657.978.792.8
    37.362.783.459.880.993.0
    36.661.084.259.879.593.1
    37.662.183.959.079.192.6
    40.264.184.664.881.093.9
    注:√表示包含该模块,IOU为交并比.APsAPmAPl分别指小目标、中目标和大目标的平均精度;ARsARmARl分别指小目标、中目标和大目标的平均召回率.
    下载: 导出CSV 
    | 显示表格

    总体来说,本文提出的算法可显著提高目标检测率,尤其是小目标和中等目标的检测率,这也符合本文算法的初衷. 如表7所示,APs提升5.4%,APm提升3.6%,而APl提升1.0%. 同时对于不同尺度目标的召回率也有不同程度的提升. 具体来说,ARs提升6.9%,ARm提升1.3%,ARl提升1.1%.

    copy-reduce-paste数据增强方法将APsAPm分别提高2.5%和2.2%.而APl略有下降. 由此可知,该方法可有效提高小目标检测率.

    CAM分别提高小目标的APsARs 1.8%和0.6%.证实了补充上下文信息对于小目标检测的重要性.

    FRM将APsAPm分别提高2.8%和1.6%,而APl基本持平. 由此可见,FRM可滤除特征的冲突信息,提高较小目标特征的判别性.

    小目标特征模糊,能够提取的特征少,是目标检测领域的难点. 为了解决小目标特征消散的问题,本文引入CAM,通过不同空洞卷积率的空洞卷积提取上下文信息,以补充小目标的上下文信息. 由于小目标容易淹没在冲突信息中,本文提出FRM,该模块结合通道和空间自适应融合来抑制冲突信息,提高特征的判别性. 同时,提出一种copy-reduce-paste的小目标增强方法来提高小目标对损失函数的贡献,使得训练更加平衡.通过实验结果可知,本文提出的小目标检测网络在TinyPerson和VOC数据集上均表现良好,优于大多数的目标检测算法.

    致谢 感谢武汉大学超级计算中心对本文的数值计算提供的支持.

    作者贡献声明:肖进胜和赵陶设计网络并实践;肖进胜和周剑负责论文撰写;乐秋平和杨力衡提供数据支持和文章的润色

  • 图  1   MCISUN总体框架

    Figure  1.   Overall framework of MCISUN

    图  2   基于边际贡献的增量式集合效用建模的主要思想

    Figure  2.   Main idea of marginal contribution-based incremental set utility modeling

    图  3   注意力头数超参数实验结果

    Figure  3.   Hyperparameter experimental result of the number of attention head

    图  4   LSTM神经元超参数实验结果

    Figure  4.   Hyperparameter experimental result of the number of LSTM units

    图  5   数据效率实验

    Figure  5.   Data efficiency experiment

    图  6   排列消融实验

    Figure  6.   Permutation ablation experiment

    图  7   互联网公司中的技能贡献箱线图

    Figure  7.   Boxplots of skill contributions for different Internet companies

    图  8   技能贡献随时间的分布

    Figure  8.   Distribution of skill contributions over time

    图  9   薪酬随技能变化情况

    Figure  9.   The changes of salary with skills

    图  10   技能对样例岗位的平均贡献

    Figure  10.   The average contributions of skills for the sample job post

    图  11   技能间注意力值热力图

    Figure  11.   The heatmap of attention value between skills

    图  12   前置技能对机器学习技能贡献的影响

    Figure  12.   The impact of prerequisite skills on the contribution of machine learning skill

    表  1   超参数设置

    Table  1   Hyper-Parameter Configuration

    参数参数值参数参数值
    嵌入大小128LSTM 神经元个数1024
    MLP层数3MLP隐藏单元128
    注意力头数16注意力层维度64
    下载: 导出CSV

    表  2   IT数据集上薪酬预测误差

    Table  2   Salary Prediction Errors on IT Dataset

    模型 薪酬下限 薪酬上限
    RMSE MAE RMSE MAE
    SVM 5.675±0.215 4.120±0.028 10.404±1.202 7.177±0.038
    LR 5.386±0.021 4.033±0.013 9.545±0.049 7.139±0.028
    GBDT 4.878±0.023 3.651±0.017 8.763±0.032 6.568±0.027
    DNN 6.498±0.031 4.999±0.036 11.801±0.021 9.460±0.020
    HSBMF 5.291±0.017 3.939±0.015 9.188±0.036 6.800±0.028
    TextCNN 4.999±0.028 3.712±0.018 8.800±0.057 6.554±0.057
    HAN 4.761±0.043 3.497±0.054 8.333±0.069 6.111±0.092
    Transformer-XL 5.459±0.016 4.097±0.045 9.663±0.061 7.278±0.074
    BERT 4.592±0.010 3.331±0.011 8.110±0.136 5.841±0.137
    RoBERTa 4.642±0.014 3.377±0.011 8.400±0.076 6.122±0.058
    XLNet 4.566±0.015 3.333±0.011 8.254±0.060 5.995±0.044
    SSCN 4.435±0.061 3.244±0.048 7.686±0.086 5.627±0.060
    MCISUN(DeepSet)
    (本文)
    3.439±0.018 2.413±0.015 5.909±0.036 4.193±0.028
    MCISUN (w/o l)
    (本文)
    4.336±0.096 3.187±0.092 7.172±0.070 5.273±0.057
    MCISUN (w/o a)
    (本文)
    3.243±0.015 2.148±0.014 5.640±0.028 3.778±0.019
    MCISUN(本文) 3.169±0.017 2.118±0.012 5.505±0.025 3.718±0.022
    注:黑体表示最低误差.
    下载: 导出CSV

    表  3   Designer数据集上薪酬预测误差

    Table  3   Salary Prediction Errors on Designer Dataset

    模型 薪酬下限 薪酬上限
    RMSE MAE RMSE MAE
    SVM 4.271±0.067 3.137±0.030 7.361±0.101 5.441±0.050
    LR 4.183±0.053 3.089±0.029 7.343±0.131 5.436±0.075
    GBDT 3.534±0.066 2.585±0.035 6.295±0.110 4.657±0.068
    DNN 5.181±0.039 4.117±0.039 9.209±0.107 7.307±0.065
    HSBMF 4.587±0.086 3.347±0.036 7.874±0.095 5.814±0.074
    TextCNN 4.282±0.148 3.151±0.064 8.800±0.057 5.542±0.107
    HAN 4.032±0.123 2.983±0.120 7.126±0.189 5.308±0.139
    Transformer-XL 5.075±0.124 3.909±0.132 9.141±0.379 7.151±0.336
    BERT 3.797±0.044 2.807±0.027 10.646±0.109 8.343±0.131
    RoBERTa 4.272±0.142 3.136±0.075 9.187±0.389 7.522±0.622
    XLNet 3.852±0.069 2.864±0.037 4.498±0.009 3.312±0.014
    SSCN 3.316±0.036 2.408±0.025 5.887±0.139 4.294±0.107
    MCISUN(DeepSet)
    (本文)
    2.604±0.031 1.765±0.030 4.473±0.066 3.110±0.056
    MCISUN(w/o l)
    (本文)
    2.939±0.025 2.047±0.024 5.477±0.064 3.738±0.037
    MCISUN (w/o a)
    (本文)
    2.657±0.024 1.791±0.017 4.353±0.020 2.940±0.017
    MCISUN
    (本文)
    2.521±0.020 1.639±0.012 4.170±0.025 2.784±0.019
    注:黑体表示最低误差.
    下载: 导出CSV

    表  4   对不同编程技能影响最大的前置技能

    Table  4   Prerequisite Skills That Have the Greatest Impact on the Different Skills

    编程技能 Top-5
    Python R语言、数据分析、 数学、 数据仓库、统计
    C++ IOS、 Android、 客户端、 数学、C语言
    Java 项目管理、 Android、 推荐系统、 IOS、 大型软件
    下载: 导出CSV

    表  5   案例岗位内容

    Table  5   A Sample Job Post Content

    内容条目 内容明细
    发布时间 2018年10月
    薪酬范围 1.5~3.0万元
    工作地点 北京
    技能集 Python、 编程、 编译、 C、 数据结构、
    机器学习、 Java、 NLP、算法、 C++
    下载: 导出CSV
  • [1]

    Hamlen K R, Hamlen W A. Faculty salary as a predictor of student outgoing salaries from MBA programs[J]. Journal of Education for Business, 2016, 91(1): 38−44 doi: 10.1080/08832323.2015.1110552

    [2]

    Khongchai P, Songmuang P. Implement of salary prediction system to improve student motivation using data mining technique[C/OL]//Proc of the 11th Int Conf on Knowledge, Information and Creativity Support Systems (KICSS). Piscataway, NJ: IEEE, 2016[2023-06-25].https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7951419

    [3]

    Khongchai P, Songmuang P. Random forest for salary prediction system to improve students’ motivation[C]//Proc of the 12th Int Conf on Signal-Image Technology and Internet-Based Systems (SITIS). Piscataway, NJ: IEEE, 2016: 637−642

    [4]

    Bansal U, Narang A, Sachdeva A, et al. Empirical analysis of regression techniques by house price and salary prediction[C/OL]// Proc of the IOP Conf Series: Materials Science and Engineering. 2021[2023-06-25].https://iopscience.iop.org/article/10.1088/1757-899X/1022/1/012110/pdf

    [5] 马新宇,范意兴,郭嘉丰,等. 关于短文本匹配的泛化性和迁移性的研究分析[J]. 计算机研究与发展,2022,59(1):118−126

    Ma Xinyu, Fan Yixing, Guo Jiafeng, et al. An empirical investigaion of generalization and transfer in short text matching[J]. Journal of Computer Research and Development, 2022, 59(1): 118−126 (in Chinese)

    [6] 潘博,张青川,于重重,等. Doc2vec 在薪水预测中的应用研究[J]. 计算机应用研究,2018,35(1):155−157 doi: 10.3969/j.issn.1001-3695.2018.01.032

    Pan Bo, Zhang Qingchuan, Yu Chongchong, et al. Research on the application of Doc2vec in salary forecast[J]. Application Research of Computers, 2018, 35(1): 155−157 (in Chinese) doi: 10.3969/j.issn.1001-3695.2018.01.032

    [7]

    More A, Naik A, Rathod S. Predict-nation skills based salary prediction for freshers[C/OL]//Proc of the 4th Int Conf on Advances in Science & Technology (ICAST2021). Berlin: Springer, 2021[2023-06-25].https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3866758

    [8]

    Martín I, Mariello A, Battiti R, et al. Salary prediction in the IT job market with few high-dimensional samples: A spanish case study[J]. International Journal of Computational Intelligence Systems, 2018, 11(1): 1192−1209 doi: 10.2991/ijcis.11.1.90

    [9]

    Sun Ying, Zhuang Fuzhen, Zhu Hengshu, et al. Market-oriented job skill valuation with cooperative composition neural network[J]. Nature Communications, 2021, 12(1): 1−12 doi: 10.1038/s41467-020-20314-w

    [10]

    Zaheer M, Kottur S, Ravanbakhsh S, et al. Deep sets[C]//Advances in Neural Information Processing Systems 30. Cambridge, MA: MIT, 2017[2023-06-25].https://proceedings.neurips.cc/paper/2017/file/f22e4747da1aa27e363d86d40ff442fe-Paper.pdf

    [11]

    Vinyals O, Bengio S, Kudlur M. Order matters: Sequence to sequence for sets[J]. arXiv preprint, arXiv: 1511.06391, 2015

    [12]

    Lee J, Lee Y, Kim J, et al. Set Transformer: A framework for attention-based permutation-invariant neural networks[C]// Proc of the 36th Int Conf on Machine Learning. New York: ACM, 2019: 3744−3753

    [13]

    Zhang Yan, Hare J, Prügel-Bennett A. FSPool: Learning set representations with featurewise sort pooling[C/OL]//Proc of the 8th Int Conf on Learning Representations. 2020[2023-06-25].https://openreview.net/forum?id=HJgBA2VYwH

    [14]

    Murphy R L, Srinivasan B, Rao V, et al. Janossy Pooling: Learning deep permutation-invariant functions for variable-size inputs[C/OL]//Proc of the 8th Int Conf on Learning Representations. 2020[2023-06-25].https://openreview.net/forum?id=BJluy2RcFm

    [15]

    Yang Bo, Wang Sen, Markham A, et al. Robust attentional aggregation of deep feature sets for multi-view 3D reconstruction[J]. International Journal of Computer Vision, 2020, 128(1): 53−73

    [16]

    Saito Y, Nakamura T, Hachiya H, et al. Exchangeable deep neural networks for set-to-set matching and learning[C]//Proc of the 17th European Conf on Computer Vision. Berlin: Springer, 2020: 626−646

    [17]

    Zhang Yan, Hare J, Prügel-Bennett A. Learning representations of sets through optimized permutations[C/OL]//Proc of the 7th Int Conf on Learning Representations. 2019[2023-06-25].https://openreview.net/forum?id=HJMCcjAcYX

    [18]

    Blankmeyer E, LeSage J P, Stutzman J R, et al. Peer ‐ group dependence in salary benchmarking: A statistical model[J]. Managerial and Decision Economics, 2011, 32(2): 91−104

    [19]

    Kenthapadi K, Ambler S, Zhang Liang, et al. Bringing salary transparency to the world: Computing robust compensation insights via LinkedIn Salary[C]//Proc of the 26th ACM on Conf on Information and Knowledge Management. New York: ACM, 2017: 447−455

    [20] 张浩宇. 基于文本相似度与协同过滤的岗位薪资预测[D]. 广州:中南财经政法大学,2018

    Zhang Haoyu. Job salary prediction based on text similarity and collaborative filtering[D]. Guangzhou: Zhongnan University of Economics and Law, 2018 (in Chinese)

    [21]

    Meng Qingxin, Xiao Keli, Shen Dazhong, et al. Fine-grained job salary benchmarking with a nonparametric Dirichlet process–based latent factor model[J]. INFORMS Journal on Computing, 2022, 34(5): 2443−2463 doi: 10.1287/ijoc.2022.1182

    [22]

    Meng Qingxin, Zhu Hengshu, Xiao Keli, et al. Intelligent salary benchmarking for talent recruitment: A holistic matrix factorization approach[C]//Proc of the 2018 IEEE Int Conf on Data Mining (ICDM). Piscataway, NJ: IEEE, 2018: 337−346

    [23]

    Wang Zhongsheng, Sugaya S, Nguyen D P T. Salary prediction using bidirectional-GRU-CNN model[C/OL]//Proc of the 25th Annual Meeting of the Association for Natural Language Processing. 2019[2023-06-25].https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/F3-1.pdf

    [24]

    Guo Huifeng, Tang Ruiming, Ye Yunming, et al. DeepFM: A factorization-machine based neural network for CTR prediction [C]//Proc of the 26th Int Joint Conf on Artificial Intelligence. San Francisco, CA: Morgan Kaufmann, 2017: 1725−1731

    [25]

    Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735−1780 doi: 10.1162/neco.1997.9.8.1735

    [26]

    Sun Ying, Zhuang Fuzhen, Zhu Hengshu, et al. Job posting data[CP/OL]. 2021[2023-06-25].https://figshare.com/articles/dataset/Job_Posting_Data/14060498/

    [27]

    Glorot X, Bengio Y. Understanding the difficulty of training deep feedforward neural networks[C/OL]//Proc of the 30th Int Conf on Artificial Intelligence and Statistics. New York: ACM, 2010[2023-06-25]. http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf

    [28]

    Kingma D P, Ba J. Adam: A method for stochastic optimization[C/OL]//Proc of the 3rd Int Conf on Learning Representations (Poster). 2015[2023-06-25].https://iclr.cc/archive/www/doku.php%3Fid=iclr2015:accepted-main.html

    [29]

    Xu Bing, Wang Naiyan, Chen Tianqi, et al. Empirical evaluation of rectified activations in convolutional network[J]. arXiv preprint, arXiv: 1505.00853, 2015

    [30]

    Noble W S. What is a support vector machine?[J]. Nature Biotechnology, 2006, 24(12): 1565−1567 doi: 10.1038/nbt1206-1565

    [31]

    Montgomery D C, Peck E A, Vining G G. Introduction to Linear Regression Analysis[M]. Hoboken: John Wiley & Sons, 2021

    [32]

    Mason L, Baxter J, Bartlett P, et al. Boosting algorithms as gradient descent[C/OL]//Advances in Neural Information Processing Systems 12. Cambridge, MA: MIT, 1999[2023-06-25].https://proceedings.neurips.cc/paper/1999/file/96a93ba89a5b5c6c226e49b88973f46e-Paper.pdf

    [33]

    Gardner M W, Dorling S R. Artificial neural networks (the multilayer perceptron)—A review of applications in the atmospheric sciences[J]. Atmospheric Environment, 1998, 32(14/15): 2627−2636

    [34]

    Chen Yahui. Convolutional neural network for sentence classification[D]. Waterloo: University of Waterloo, 2015

    [35]

    Zhang Xiang, Zhao Junbo, LeCun Y. Character-level convolutional networks for text classification[C/OL]//Advances in Neural Information Processing Systems 28. Cambridge, MA: MIT, 2015[2023-06-25]. https://proceedings.neurips.cc/paper/2015/file/250cf8b51c773f3f8dc8b4be867a9a02-Paper.pdf

    [36]

    Yang Zichao, Yang Diyi, Dyer C, et al. Hierarchical attention networks for document classification[C]//Proc of the 15th North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA: ACL, 2016: 1480−1489

    [37]

    Dai Zihang, Yang Zhilin, Yang Yiming, et al. Transformer-Xl: Attentive language models beyond a fixed-length context[C/OL]//Proc of the 57th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: ACL, 2019[2023-06-25].https://arxiv.org/pdf/1901.02860.pdf%3Ffbclid%3DIwAR3nwzQA7VyD36J6u8nEOatG0CeW4FwEU_upvvrgXSES1f0Kd-

    [38]

    Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[C]//Proc of the 17th Annual Conf of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA: ACL, 2019: 4171−4186

    [39]

    Liu Yinhan, Ott M, Goyal N, et al. RoBERTa: A robustly optimized BERT pretraining approach[J]. arXiv preprint, arXiv: 1907.11692, 2019

    [40]

    Yang Zhilin, Dai Zihang, Yang Yiming, et al. XLNet: Generalized autoregressive pretraining for language understanding[C/OL]//Advances in Neural Information Processing Systems 32. Cambridge, MA: MIT, 2019[2023-06-25].https://proceedings.neurips.cc/paper/2019/file/dc6a7e655d7e5840e66733e9ee67cc69-Paper.pdf

    [41]

    Zhang Yan, Hare J, Prugel-Bennett A. Deep set prediction networks[C/OL]//Advances in Neural Information Processing Systems 32. Cambridge, MA: MIT, 2019 [2024-03-29]. https://proceedings.neurips.cc/paper_files/paper/2019/file/6e79ed05baec2754e25b4eac73a332d2-Paper.pdf

    [42]

    Botchkarev A. A new typology design of performance metrics to measure errors in machine learning regression algorithms[J]. Interdisciplinary Journal of Information, Knowledge, and Management, 2019, 14: 45−79

    [43]

    Blum A, Kalai A, Langford J. Beating the hold-out: Bounds for k-fold and progressive cross-validation[C]//Proc of the 12th Annual Conf on Computational Learning Theory. New York: ACM, 1999: 203−208

  • 期刊类型引用(13)

    1. 田青,王颖,张正,羊强. 改进YOLOv8n的选通图像目标检测算法. 计算机工程与应用. 2025(02): 124-134 . 百度学术
    2. 鞠伟强,曹立华. 基于改进的YOLOv7小目标检测算法. 计算机工程与设计. 2025(01): 145-151 . 百度学术
    3. 郝佳,姚国英,周剑,王斯远,肖进胜. 基于图像和点云融合的三维小目标检测方法. 测绘通报. 2025(03): 33-38 . 百度学术
    4. 杨新秀,徐黎明,冯正勇. 基于YOLOv5全局注意力和上下文增强的遥感图像目标检测方法. 西华师范大学学报(自然科学版). 2024(03): 321-326 . 百度学术
    5. 杨帅鹏,李贺,刘金江,付主木,张锐,贾会梅. 基于多尺度特征融合和注意力机制的水面死鱼检测方法. 郑州大学学报(理学版). 2024(06): 32-38 . 百度学术
    6. 李耀. 基于YOLOv5-PNCM的飞鸟目标检测算法研究. 现代计算机. 2024(11): 9-15+22 . 百度学术
    7. 冉庆东,郑力新. 基于改进YOLOv5的锂电池极片缺陷检测方法. 浙江大学学报(工学版). 2024(09): 1811-1821 . 百度学术
    8. 郭虎升. 目标检测综述:从传统方法到深度学习. 新兴科学和技术趋势. 2024(02): 128-145 . 百度学术
    9. 马枫,石子慧,孙杰,陈晨,毛显斌,严新平. 自注意力机制驱动的轻量化高鲁棒船舶目标检测方法. 中国舰船研究. 2024(05): 188-199 . 百度学术
    10. 周楝淞,邵发明,杨洁,彭泓力,李赛野,孙夏声. 基于区域预推荐和特征富集的SOD R-CNN交通标志检测网络. 信息安全与通信保密. 2024(10): 115-126 . 百度学术
    11. 贾帅帅,田明浩,路红阳. 基于数据增强的组合神经网络异常检测算法. 信息技术与信息化. 2023(04): 187-190 . 百度学术
    12. 潘晓英,贾凝心,穆元震,高炫蓉. 小目标检测研究综述. 中国图象图形学报. 2023(09): 2587-2615 . 百度学术
    13. 齐向明,柴蕊,高一萌. 重构SPPCSPC与优化下采样的小目标检测算法. 计算机工程与应用. 2023(20): 158-166 . 百度学术

    其他类型引用(16)

图(12)  /  表(5)
计量
  • 文章访问数:  222
  • HTML全文浏览量:  38
  • PDF下载量:  82
  • 被引次数: 29
出版历程
  • 收稿日期:  2023-03-09
  • 修回日期:  2023-07-25
  • 网络出版日期:  2024-03-06
  • 刊出日期:  2024-05-13

目录

/

返回文章
返回