Processing math: 0%
  • 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

搜索服务响应时间异常诊断

夏思博, 马明华, 金鹏翔, 崔丽月, 张圣林, 金娃, 孙永谦, 裴丹

夏思博, 马明华, 金鹏翔, 崔丽月, 张圣林, 金娃, 孙永谦, 裴丹. 搜索服务响应时间异常诊断[J]. 计算机研究与发展, 2024, 61(6): 1573-1584. DOI: 10.7544/issn1000-1239.202330054
引用本文: 夏思博, 马明华, 金鹏翔, 崔丽月, 张圣林, 金娃, 孙永谦, 裴丹. 搜索服务响应时间异常诊断[J]. 计算机研究与发展, 2024, 61(6): 1573-1584. DOI: 10.7544/issn1000-1239.202330054
Xia Sibo, Ma Minghua, Jin Pengxiang, Cui Liyue, Zhang Shenglin, Jin Wa, Sun Yongqian, Pei Dan. Response Time Anomaly Diagnosis for Search Service[J]. Journal of Computer Research and Development, 2024, 61(6): 1573-1584. DOI: 10.7544/issn1000-1239.202330054
Citation: Xia Sibo, Ma Minghua, Jin Pengxiang, Cui Liyue, Zhang Shenglin, Jin Wa, Sun Yongqian, Pei Dan. Response Time Anomaly Diagnosis for Search Service[J]. Journal of Computer Research and Development, 2024, 61(6): 1573-1584. DOI: 10.7544/issn1000-1239.202330054
夏思博, 马明华, 金鹏翔, 崔丽月, 张圣林, 金娃, 孙永谦, 裴丹. 搜索服务响应时间异常诊断[J]. 计算机研究与发展, 2024, 61(6): 1573-1584. CSTR: 32373.14.issn1000-1239.202330054
引用本文: 夏思博, 马明华, 金鹏翔, 崔丽月, 张圣林, 金娃, 孙永谦, 裴丹. 搜索服务响应时间异常诊断[J]. 计算机研究与发展, 2024, 61(6): 1573-1584. CSTR: 32373.14.issn1000-1239.202330054
Xia Sibo, Ma Minghua, Jin Pengxiang, Cui Liyue, Zhang Shenglin, Jin Wa, Sun Yongqian, Pei Dan. Response Time Anomaly Diagnosis for Search Service[J]. Journal of Computer Research and Development, 2024, 61(6): 1573-1584. CSTR: 32373.14.issn1000-1239.202330054
Citation: Xia Sibo, Ma Minghua, Jin Pengxiang, Cui Liyue, Zhang Shenglin, Jin Wa, Sun Yongqian, Pei Dan. Response Time Anomaly Diagnosis for Search Service[J]. Journal of Computer Research and Development, 2024, 61(6): 1573-1584. CSTR: 32373.14.issn1000-1239.202330054

搜索服务响应时间异常诊断

基金项目: 国家自然科学基金青年科学基金项目(61902200,62072264);天津市自然科学基金项目(21JCQNJC00180)
详细信息
    作者简介:

    夏思博: 2000年生. 硕士研究生. 主要研究方向为知识图谱、故障检测与诊断

    马明华: 1993年生. 博士. 微软亚洲研究院研究员. 主要研究方向为云智能、智能运维

    金鹏翔: 1998年生. 硕士. 主要研究方向为故障诊断、根因分析

    崔丽月: 1997年生. 硕士. 主要研究方向为异常检测、故障诊断、机器学习

    张圣林: 1989年生. 博士,副教授. CCF会员、IEEE会员、ACM会员. 主要研究方向为数据中心网络中的故障检测、诊断与预测

    金娃: 2001年生. 学士. 主要研究方向为故障诊断、根因分析

    孙永谦: 1988年生. 博士,副教授. CCF会员、IEEE会员、ACM会员. 主要研究方向为服务管理中的异常检测、根因分析、故障诊断

    裴丹: 1973年生. 博士,副教授. CCF会员、IEEE高级会员、ACM高级会员. 主要研究方向为网络和服务管理

    通讯作者:

    张圣林(zhangsl@nankai.edu.cn

  • 中图分类号: TP311

Response Time Anomaly Diagnosis for Search Service

Funds: This work was supported by the National Natural Science Foundation of China for Yong Scientists (61902200, 62072264) and the Natural Science Foundation of Tianjin (21JCQNJC00180).
More Information
    Author Bio:

    Xia Sibo: born in 2000. Master candidate. His main research interests include knowledge graph, and failure detection and diagnosis

    Ma Minghua: born in 1993. PhD. Researcher at Microsoft Research Lab Asia. His main research interests include cloud intelligence and AIOps

    Jin Pengxiang: born in 1998. Master. His main research interests include failure diagnosis and root cause analysis

    Cui Liyue: born in 1997. Master. Her main research interests include anomaly detection, failure diagnosis, and machine learning

    Zhang Shenglin: born in 1989. PhD, associate professor. Member of CCF, IEEE, and ACM. His main research interests include failure detection, and diagnosis and prediction in data center networks

    Jin Wa: born in 2001. Bachelor. Her main research interests include failure diagnosis and root cause analysis

    Sun Yongqian: born in 1988. PhD, associate professor. Member of CCF, IEEE, and ACM. His main research interest includes anomaly detection, root cause analysis, and failure diagnosis in service management

    Pei Dan: born in 1973. PhD, associate professor. Member of CCF. Senior member of IEEE and ACM. His main research interest includes network and service management

  • 摘要:

    较低的网络服务响应时间对提升用户体验至关重要. 以搜索引擎这一典型的网络服务场景为例,服务提供商应确保网络服务(搜索)响应时间在1 s以内. 在实践中,服务响应时间会受到用户浏览器、运营商、页面加载方式等诸多服务属性的影响. 为了进行针对性的优化,服务提供商需要找出使服务响应时间过长的规则,即一些属性的组合. 然而现有研究工作遇到了3方面挑战:1)搜索日志数据量大;2)搜索日志数据分布不平衡;3)要求泛化度高的规则. 因此设计了Miner(multi-dimensional extraction of rules),一种新型服务响应时间异常诊断框架. Miner使用自步采样机制应对第1个挑战和第2个挑战. 针对第3个挑战,Miner使用Corels算法挖掘出泛化率高且召回率高的规则. 使用2家国内顶级搜索引擎服务提供商的响应时间日志数据评估了Miner性能,结果显示Miner的泛化率和召回率均高于现有方法,并证明了Miner挖掘出的规则可被运维人员采纳并做针对性的优化.

    Abstract:

    The timely response of network services is crucial to improving user experience. Taking search engine as a typical example of network services, service providers need to ensure that the search response time is within one second. In practice, the search response time can be affected by many service attributes, such as user browsers, ISPs, and page loading methods. To optimize effectively, service providers need to identify the rules that cause high search response time, which are combinations of the above attributes. However, existing work encounters three challenges. First, the amount of search logs is large. Second, the search logs are unevenly distributed. Third, the rules with high generality are needed. Therefore, we propose a framework called Miner (multi-dimensional extraction of rules). Miner takes advantage of self-paced sampling to overcome the first and second challenges. To address the third challenge, Miner employs Corels to generate rules with high generality and recall. Our experiments use search logs provided from two top-tier search engine companies in China. The results show that Miner outperforms the state-of-the-art methods in terms of generality and recall. Operators adopt rules generated by Miner and optimize the performance of the search engine.

  • 随着科学技术的快速发展,许多数据以数据流的形式快速产生,例如传感器产生的实时数据、用户的网络社交数据和某个地区的天气数据等,这些源源不断的数据构成了流数据(streaming data). 与静态离线数据相比,流数据具有快速、无限、不稳定及动态变化等特性[1-3].

    在流数据挖掘任务中,实际目标场景往往处于不断变化的状态,例如传感器数据会随着设备老化而发生缓慢变化,用户的聊天主题会随着用户喜好而发生改变,天气会随着季节更替而发生周期性变化,这些都导致所产生的流数据具有不稳定性,即不同时间段数据流分布特征不再满足独立同分布条件,此时数据流的联合概率分布会随着时间推移而发生变化,这种现象叫“概念漂移”[4-5],其中,“概念”可以理解为某一时刻所有样本的分布情况. 要学习的概念或者函数被称为目标概念,可以用数据的联合概率分布 P(xy)表示,其中 x表示样本的d 维特征向量,y表示对应样本的标签. 若当前时刻t发生了概念漂移,可以将其形式化表示为:∃xPt–1(xy)≠Pt(xy). 概念漂移是流数据挖掘在现实世界中的一个重要特性,也是流数据分析挖掘中不可避免的难点问题,打破了传统机器学习中类别标签分布固定的假设,其典型特征是实时数据分布与训练数据分布不一致,并已受到越来越多的关注和研究.

    传统的概念漂移处理方法大都基于简单的非线性分类器,如支持向量机、决策树和朴素贝叶斯等. 简单分类器对于复杂流数据的拟合能力较差,且无法快速适应概念漂移发生后流数据的分布变化. 近年来,神经网络技术在图像分割、目标检测和文本翻译等领域得到了广泛应用. 与传统方法相比,神经网络具备较强的学习能力,并且神经网络层数很多、宽度很广,对复杂数据变化的适应性较强,因此神经网络是处理流数据概念漂移的一种有效方法.

    为提高流数据信息提取能力且充分考虑流数据所包含的时序特性,本文提出了一种基于混合特征提取的流数据概念漂移处理方法(concept drift processing method of streaming data based on mixed feature extraction,MFECD). 该方法首先采用不同尺度的卷积核对流数据进行建模以获得拼接特征,采用门控机制融合浅层输入与拼接特征,然后自适应集成不同层次的数据信息以获得复杂的数据特征. 在此基础上,通过时间注意力机制和相似度计算,获得对流数据关键位点增强的时序特性. 本文的主要贡献有2点:

    1)提取不同尺度和不同层次的数据特性,提高了对数据流演化特性的学习能力和对分布变化的适应能力.

    2)使用时间注意力机制和相似度计算评估流数据不同时刻的重要性,增强了关键位点的时序特性,提高了模型对漂移的处理能力.

    目前针对流数据概念漂移处理的常见策略大体上可分为基于主动检测的方法和基于被动自适应的方法[6].

    基于主动检测的概念漂移处理方法通过引入概念漂移检测机制,对流数据分布的稳定性进行检测或者通过模型实时性能指标的变化来判断是否有概念漂移发生. 当检测到流数据中发生概念漂移时,通过触发相应的概念漂移处理机制适应新的数据分布. 常见的主动检测方法包括基于滑动窗口的处理方法、基于模型性能的处理方法和基于数据分布的处理方法等. 基于滑动窗口的方法采用单个或多个滑动窗口来存储处理数据,使当前滑动窗口中容纳最新数据分布的样本,通过不断向前滑动窗口与旧分布数据相比判断是否有概念漂移发生. 典型的如:基于自适应窗口的方法[7]、使用自适应滑动窗口上的熵方法[8]、基于多窗口协同滑动的方法[9-10]. 基于模型性能的概念漂移处理方法大都基于模型的分类性能,当检测到模型性能发生较大程度下降时,表明流数据中发生了概念漂移,进而调整模型适应新的数据分布[11-14]. 基于数据分布的概念漂移处理方法使用统计学方法检验最新样本与过去时刻样本的统计学差异性,如果零假设(两者之间数据分布是相同的)被拒绝,则表明当前时刻存在概念漂移[15-16].

    基于被动自适应的概念漂移处理方法并不使用漂移检测机制来判断流数据中是否发生概念漂移,而是通过不断调整模型以适应新的数据分布. 现有的被动自适应方法绝大多基于集成学习思想,按照学习单元大小可分为基于数据块的集成和基于单个数据的集成. 基于数据块的集成方法为每个新到达的数据块建立一个基分类器,通过不断添加到集成模型中替换性能最差的基分类器,以适应最新的数据分布[17-19]. 基于单个数据的集成方法首先初始化一组基分类器,每次仅处理1个样本,并对集成模型进行在线更新,同时对基分类器进行加权组合[20-21].

    虽然文献[6-21]方法在处理概念漂移方面发挥了重要作用,但这些方法大多采用线性或简单的非线性分类器,表示能力较差,无法处理复杂的非线性数据流挖掘问题. 目前,已有研究采用深度学习解决复杂分布式流数据中的概念漂移问题. 根据网络结构是否可以动态调整,现有的方法可以分为基于动态调整的在线深度学习和基于稳定结构的在线深度学习. 前者不断调整模型结构以适应最新的数据分布,并根据模型在最新实例上的表现控制模型的自适应率,典型的方法主要有ADL[22],Spiking-NN[23],SEOA[24]. 后者不直接调整模型结构,而是采用集成学习,不断调整基分类器的权值,以适应带有概念漂移的流数据,典型的方法主要有HBP[25]和NN-Patching[26]. 这些方法利用深度学习处理流数据,可以处理复杂的非线性分布数据,但在概念漂移发生时,容易受到神经网络固有缺陷的影响,对复杂流数据的信息提取能力有限,无法快速适应漂移发生时的最新数据分布,且在概念漂移处理过程中忽略了流数据所包含的时序特性.

    本文提出了MFECD方法,与传统方法相比,该方法首先自适应融合不同尺度和不同层次的数据特征,弥补概念漂移丢失的信息;又通过时间注意力和相似度计算获取流数据包含的时序特征,充分考虑流数据中包含的时间上下文信息,利用流数据中的混合特征来解决流数据中的概念漂移问题,提高概念漂移的处理能力.

    本文提出的MFECD方法首先采用不同尺度的卷积核提取到样本的拼接特征,利用门控机制将浅层输入与拼接特征融合得到样本的多尺度融合特征,并将其作为网络不同层次的输入进行在线自适应集成,最终得到复杂数据特征. 在此基础上,使用时间注意力机制和相似度计算,获得流数据时序特征的同时对其中重要时刻的特征进行有效增强. 利用复杂数据特征和时序特征来提高流数据的信息提取能力和概念漂移处理能力. MFECD方法的整体结构如图1 所示.

    图  1  MFECD方法整体结构图
    Figure  1.  Overall structure diagram of MFECD method

    神经网络在许多领域已经得到了广泛应用. 虽然可以使用神经网络作为基本模型处理流数据,但神经网络的特征提取能力由固定个数的神经元决定,神经网络的每一层仅能提取固定尺度的特征,导致平稳状态下对复杂流数据的特征提取能力有限. 同时,在概念漂移发生之后,不同层次的神经网络集成时无法快速收敛适应新的数据分布,导致对概念漂移问题的处理性能较差.

    首先采用不同尺度的卷积核对样本数据进行特征提取得到拼接特征,使用注意力机制评估不同尺度特征的重要性,并采用门控机制控制不同信息流的输入比例. 在此基础上在线自适应集成不同层次的数据特征. 这样不仅有效提高了神经网络在平稳阶段对流数据的特征信息提取能力,而且能够依据当前时刻的数据分布变化自适应更新融合权重,从而避免不同层次神经网络集成时存在的无法快速收敛问题.

    图2所示,对于当前时刻的输入数据x,首先将其输入3个大小分别为1,3,5的深度可分离卷积层[27],得到3个不同尺度的特征x1x3x5,将得到的3个特征拼接得到拼接特征m

    图  2  基于自适应集成的数据特征融合结构图
    Figure  2.  Data feature fusion structure diagram based on adaptive integration
    {\boldsymbol{m}} = Concat({{\boldsymbol{x}}_1},{{\boldsymbol{x}}_3},{{\boldsymbol{x}}_5}) \text{,} (1)

    其中Concat表示按通道拼接. 为了减少参数计算量,对拼接特征m进行卷积运算,将拼接特征的通道进行压缩,得到压缩特征c.

    本文引入通道注意力机制[28]处理不同通道的资源分配关系,由于每个通道都被认为是一个特征检测器. 对于压缩特征c,每个通道对应数据的不同尺度信息,因此需要对重要通道进行关注,向其分配更多的资源. 对压缩特征c使用通道注意力,利用全局最大池化和全局平均池化进行权重分析,在通道维度上对压缩特征进行权重分配,将得到的通道权重与压缩特征相乘得到通道注意力特征:

    {\boldsymbol{s}} = {\boldsymbol{c}} \times \sigma (MLP(AvgPool({\boldsymbol{c}})) + MLP(MaxPool({\boldsymbol{c}}))) \text{,} (2)

    其中 \sigma 表示Sigmoid激活函数,MLP代表多层感知机网络.

    然后使用门控机制控制不同信息流的输入比例,利用给定的浅层输入x作为门控信号,经过一个全连接层(FC)和Sigmoid激活函数得到权值向量g,将浅层输入和通道注意力特征分别乘以对应的权值并相加得到多尺度融合特征h

    {\boldsymbol{h}} = {\boldsymbol{s}} \times {\boldsymbol{g}} + {\boldsymbol{x}} \times ({ {\textit{1}}} - {\boldsymbol{g}}) \text{,} (3)
    {\boldsymbol{g}} = \sigma (Fc({\boldsymbol{x}})) = \sigma ({w_g}{\boldsymbol{x}} + {b_g}) . (4)

    当概念漂移发生后,为了能够及时适应新的数据分布,本文引入在线学习,将多尺度融合特征的提取结构作为基本单元,并将若干个基本单元按照层次进行在线自适应集成. 由L个基本单元进行在线自适应集成,其向前传播过程为

    {{\boldsymbol{h}}^l} = {\boldsymbol{s}} \times {\boldsymbol{g}} + {{\boldsymbol{h}}^{l - 1}} \times ({ {\textit{1}}} - {\boldsymbol{g}}),\;l = 2,3,…,L \text{,} (5)

    其中 {{\boldsymbol{h}}^l} 表示第l个基本单元的输出,{{\boldsymbol{h}}^1} = {\boldsymbol{x}}.

    在线集成时,{\boldsymbol{h}}_t^l 表示时刻tl个基本单元的输出,每个基本单元均有一个融合权值{\boldsymbol{\alpha}}_t^l 与之对应,在初始阶段,融合权值均匀分布,即{\boldsymbol{\alpha}}_{t = 1}^l = \dfrac{1}{L},则时刻t的输出为融合特征{{\boldsymbol{f}}_t}

    {{\boldsymbol{f}}_t} = \sum\limits_{l = 1}^L {{\boldsymbol{\alpha}}_t^l \times {\boldsymbol{h}}_t^l} . (6)

    根据每个基本单元的输出和对应的标签计算损失,根据损失采用对冲方法[29]更新下一时刻各基本单元对应的融合权值:

    {\boldsymbol{\alpha}}_{t + 1}^l = {\boldsymbol{\alpha}}_t^l \times {\beta ^{L_t^l({\boldsymbol{h}}_t^l,{\boldsymbol{y}}_t^l)}} \text{,} (7)

    其中 \beta 是在线缩放因子,{\boldsymbol{y}}_t^l 表示时刻tl个基本单元输出所对应的标签,L_t^l({\boldsymbol{h}}_t^l,{\boldsymbol{y}}_t^l) 表示时刻tl个基本单元的损失.

    流数据中的数据元都是随着时间的顺序出现的,数据之间具有时间序列相关性. 在以往的流数据处理方法中,忽略了不同时刻数据之间的相互关系. 当概念漂移发生时,提取流数据包含的时序特征,有助于概念漂移问题的处理;同时使用重要时刻的特征信息可以进一步提高概念漂移的处理能力,因为并不是每个时刻的数据都对概念漂移处理起积极作用,起消极作用的数据反而会加剧概念漂移.

    在流数据中,连续时刻的数据通常变化平稳,具有高度的时间依赖性. 首先将得到的不同时刻的复杂数据特征按时间顺序组成序列特征:

    {\boldsymbol{u}} = ({{\boldsymbol{f}}_{t - n}},{{\boldsymbol{f}}_{t - n - 1}},…,{{\boldsymbol{f}}_{t - 2}},{{\boldsymbol{f}}_{t - 1}},{{\boldsymbol{f}}_t}) . (8)

    在此基础上,本文通过构建时间注意力机制模块,对不同时刻的数据特征建模,如图3所示.

    图  3  时间注意力机制图
    Figure  3.  Time attention mechanism diagram

    首先使用挤压(squeeze)操作,将每个时刻的数据特征进行全局平均池化计算,通过挤压操作,将跨空间维度H×W的特征映射进行聚合,全局信息压缩到1维特征z中,使得这些一维特征可以被其他层利用:

    \boldsymbol{z}=F_{sq\rm{ }}(\boldsymbol{u})=\frac{1}{H\times W}\sum\limits_{i=1}^H\sum\limits_{j=1}^W\boldsymbol{u}(i,j). (9)

    为了利用挤压操作的信息和利用通道间的信息依赖,接下来进行激励(excitation)操作. 为了降低模型复杂度以及提升泛化能力,采用2个全连接层,其中:第1个FC层起到降维的作用,采用ReLU函数激活;第2个FC层恢复原始的维度,对每个通道的重要性进行预测,为每个特征通道生成权重. 然后使用缩放(reweight)操作,将激励操作后输出的权重v 通过乘法逐通道加权到序列特征上,得到时间注意力特征q:

    \boldsymbol{v}=F_{ex}(\boldsymbol{z})=\sigma(FC(\boldsymbol{z},\boldsymbol{W}))=\sigma(\boldsymbol{W}_2\delta(\boldsymbol{W}_1\boldsymbol{z})), (10)
    \boldsymbol{q}=F_{re}(\boldsymbol{u},\boldsymbol{v})=\boldsymbol{u}_c\boldsymbol{v}_c, (11)

    其中 \delta 表示ReLU函数.

    在流数据中,不同时刻的数据包含不同的信息. 当发生概念漂移时,部分时刻的数据可能包含干扰信息或者噪声,会加剧概念漂移. 因此选择对概念漂移处理有积极作用的关键数据是非常有必要的. 本文将每个时刻的数据特征与初始数据特征进行相似度计算,相似度越高,证明两者的重叠信息越多,对概念漂移处理越有积极作用,则赋予其较大的权重,最终将序列特征与相似度权重相乘融合得到相似度特征:

    {\boldsymbol{p}} = \sum\limits_{i = t - n}^t {{{\boldsymbol{f}}_i}({{\boldsymbol{f}}_i} * {{\boldsymbol{X}}_{t = 1}})} \text{,} (12)

    其中*表示相似度计算,Xt=1表示初始时刻的数据特征,n为选取的流数据时间长度.

    使用注意力机制得到时间注意力特征q,并将每个时刻的数据与初始数据进行相似度计算得到相似度特征p,将两者融合得到每个时刻的时序特征r,时序特征增强结构如图4所示.

    图  4  时序特征增强结构图
    Figure  4.  Temporal feature enhancement structure diagram

    MFECD方法首先提取不同卷积尺度的样本特征,然后对不同层次的数据特征进行在线自适应集成得到复杂数据特征. 在此基础上,通过注意力机制和相似度计算提取流数据的时序特征. 利用混合特征提高对流数据信息的提取能力和对概念漂移问题的处理能力. 基于混合特征提取的流数据概念漂移处理方法的过程具体如算法1所示.

    算法1. 基于混合特征提取的概念漂移处理方法.

    输入:数据流SD,缩放因子β,选取时间长度n,一个L层的神经网络;

    输出:每个时刻的复杂数据特征f和时序特征r.

    ① for t=1,2,…,T do

    ② 从数据流SD中获取当前数据x,对其采用  通道注意力和门控机制得到多尺度融合  特征:

    {\boldsymbol{h}} = {\boldsymbol{s}} \times {\boldsymbol{g}} + {\boldsymbol{x}} \times ({ {\textit{1}}} - {\boldsymbol{g}}) \text{;}

    ③ 将不同层数据特征进行自适应集成得到复  杂数据特征f

    {{\boldsymbol{f}}_t} = \sum\limits_{l = 1}^L {{\boldsymbol{\alpha }}_t^l \times {\boldsymbol{h}}_t^l} _{ }\text{;}

    ④ 根据当前损失对下一时刻的集成权重 {\boldsymbol{\alpha }} 进  行更新:

    {\boldsymbol{\alpha}}_{t + 1}^l = {\boldsymbol{\alpha}}_t^l \times {\beta ^{L_t^l({\boldsymbol{h}}_t^l,{\boldsymbol{y}}_t^l)}} \text{;}

    ⑤ 根据时间长度n对当前时刻的数据特征构  建序列特征:

    {\boldsymbol{u}} = ({{\boldsymbol{f}}_{t - n}},{{\boldsymbol{f}}_{t - n - 1}},…,{{\boldsymbol{f}}_{t - 2}},{{\boldsymbol{f}}_{t - 1}},{{\boldsymbol{f}}_t}) \text{;}

    ⑥ 分别经过映射到1维空间(squeeze)、预测  通道权值(excitation)和通道加权(reweight)  操作,得到时间注意力特征q

    squeeze:

    {\boldsymbol{z}} = {F_{\rm sq}}({\boldsymbol{u}}) = \frac{1}{{H \times W}}\sum\limits_{i = 1}^H {\sum\limits_{j = 1}^W {{\boldsymbol{u}}(i,j)} } \text{;}

    excitation:

    {\boldsymbol{v}} = \sigma (FC({\boldsymbol{z}},{\boldsymbol{W}})) = \sigma ({{\boldsymbol{W}}_2}\delta ({{\boldsymbol{W}}_1}{\boldsymbol{z}})) \text{;}

    reweight: {\boldsymbol{q}} = {F_{{\mathrm{re}}}}({\boldsymbol{u}},{\boldsymbol{v}}) = {{\boldsymbol{u}}_c}{{\boldsymbol{v}}_c}

    ⑦ 计算不同时刻数据与初始数据的相似度,  得到相似度特征p

    {\boldsymbol{p}} = \sum\limits_{i = t - n}^t {{{\boldsymbol{f}}_i}({{\boldsymbol{f}}_i} * {{\boldsymbol{X}}_{t = 1}})} \text{;}

    ⑧ 时间注意力特征与相似度特征融合得到每  个时刻的时序特征r

    {\boldsymbol{r}} = {\boldsymbol{q}} + {\boldsymbol{p}} \text{;}

    ⑨ 将时序特征与样本特征融合,提高模型的  概念漂移处理能力;

    ⑩ end for

    视频数据作为一种典型的流数据,目前受到了广泛关注,视频目标跟踪的任务是对目标进行精准跟踪,但由于多种因素影响,跟踪过程中会出现多种概念漂移问题,例如遮挡、快速运动、背景杂乱、平面内(外)旋转等,都对目标的跟踪造成了干扰. 因此为了验证所提方法的性能,本文在多个含概念漂移场景的视频目标跟踪数据集上进行了验证.

    实验硬件环境为NVIDIA-A100,软件使用Python 和Pytorch.训练集包含ImageNet DET[30],COCO[31],ImageNet VID,YouTube-BB[32],LaSOT[33]. 为了保持方法稳定性和动态性之间的平衡,设置视频序列中时间长度n=4,缩放因子β=0.99.

    1)OTB100[34]数据集. OTB100数据集由22个对象类别的100个视频组成,包含有11种漂移属性,分别是背景杂乱(background clutters)、形变(deformation)、平面内旋转(in-plane rotation)、平面外旋转(out-of-plane rotation)、光照变化(illumination variation)、快速运动(fast motion)、运动模糊(motion blur)、遮挡(occlusion)、低分辨率(low resolution)、视野外(out-of-view)和尺度变化(scale variation). 每个视频序列包含不同的属性,OTB100数据集的平均分辨率为356×530,视频长度在71~3872帧之间.

    OTB100数据集评估基于2个指标:精确率和成功率. 跟踪精确率计算跟踪方法预测的目标位置中心点与真实标注的中心点之间的距离小于给定阈值的视频帧所占的百分比. 跟踪成功率反映跟踪方法预测的目标位置与真实标注位置之间的重合程度,当某一帧的重合程度大于设定的阈值时,则该帧被视为成功的,成功帧的总数占所有帧的百分比即为跟踪成功率.

    2)UAV123[35]数据集. UAV123是一个新的航拍视频数据集,包含123个由9个不同对象类别组成的序列,最小帧数为109,最大帧数为3085,所有序列都用垂直边框完全注释. 漂移属性包含:纵横比变化、背景杂波、相机运动、快速运动、完全遮挡、光照变化、低分辨率、视野外、部分遮挡、相似目标、尺度变化和视角变化. 与OTB100数据集一样,UAV123数据集评价基于2个指标:精确率和成功率.

    3)LaSOT数据集. 这是一个用于长期跟踪的大规模、高质量、注释密集的数据集. 为了减少潜在的类偏差,它为每个类别提供相同数量的序列. LaSOT具有较长的序列,平均每个序列有2500帧,甚至更多,比短期跟踪数据集更具挑战性. LaSOT使用精确率、成功率和归一化精度评估跟踪性能. 精确率和成功率评估标准与OTB100数据集一致. 由于精度指标对目标尺寸和图像分辨率敏感,因此LaSOT使用归一化的精度方法,计算相对于目标大小的误差,而不是考虑绝对距离,归一化精度用于对跟踪器进行排序.

    将本文提出的MFECD方法与SiamCAR[36],SiamRPN++[37],Ocean-online[38],SiamR-CNN[39],ATOM[40],SiamFC[41],SRDCF[42],MDNet[43],KCF[44] 这9种方法进行比较. 测试实验中,设置参数L=9. 如图5所示,成功率曲线图例中的数字表示该曲线下的面积,其作为该跟踪方法的成功率值,精确率曲线图例中的数字表示跟踪方法位置错误阈值取20时对应的精确率值,其作为该跟踪方法的精确率值对于这个被广泛研究的数据集OTB100,本文方法成功率达到0.699,精确率达到0.913.

    图  5  OTB100数据集上的整体实验结果
    Figure  5.  Overall experimental results on OTB100 dataset

    图6图7为本文方法与其他方法在OTB100数据集上部分漂移属性的成功率和精确率对比. 本文方法在快速运动、光照变化、平面内旋转、运动模糊和遮挡等漂移属性下结果都取得了最优,这是由于本文方法充分利用提取到的复杂数据特征和时序特征,在概念漂移发生时,有效应对目标的多种变化,从而提高目标跟踪的成功率和精确率.

    图  6  OTB100 数据集上部分漂移属性的成功率对比结果
    Figure  6.  Comparison results of success ratio of partial drift features on OTB100 dataset
    图  7  OTB100数据集在部分漂移属性的精确率对比结果
    Figure  7.  Comparison results of precision of partial drift features on OTB100 dataset

    为进一步说明本文方法的有效性,本文选取了不同的典型视频序列进行实际效果展示,如图8所示. 在Basketball, Girl 2, Jump视频数据中,分别存在相似物干扰、遮挡、旋转和形变等典型的漂移属性. 从结果可以看出,ATOM, SiamFC, Ocean-online方法均在漂移发生后出现了目标跟踪失败,而MFECD方法由于融合了流数据的复杂样本特征和时间特征,可以有效应对不同的分布变化,从而解决数据流中存在的概念漂移问题.

    图  8  实际跟踪效果比较
    Figure  8.  Comparison of actual tracking effect

    在UAV123上,将MFECD方法与SiamCAR,SiamRPN++,SiamFC,ECO[45],SAMF[46],HiFT[47],MEEM[48],SiamDW[49]等多种跟踪方法进行比较,实验中参数L=5. 从图9可以看出,MFECD方法成功率达到0.62,精确率达到0.81,这2个评价指标上都优于其他跟踪方法.

    图  9  UAV123数据集上的整体实验结果
    Figure  9.  Overall experimental results on UAV123 dataset

    图10图11为MFECD方法与其他方法在多种漂移属性上的成功率和精确率对比结果. 可以看出,在纵横比变化、快速运动、完全遮挡、光照变化和尺度变化5种漂移场景下,MFECD方法的结果都取得了最优,充分表明MFECD方法在多种漂移场景下具有较强的鲁棒性,可以有效解决目标跟踪任务中出现的概念漂移问题,提高目标跟踪的成功率和精确率.

    图  10  UAV123 数据集上部分漂移属性的成功率对比结果
    Figure  10.  Comparison results of success ratio of partial drift features on UAV123 dataset
    图  11  UAV123 数据集上部分漂移属性的精确率对比结果
    Figure  11.  Comparison results of precision of partial drift features on UAV123 dataset

    在LaSOT 数据集上,将MFECD方法与SiamCAR,SiamBAN[50],ATOM,CLNet[51],SiamRPN++,SPLT[52],SiamFC,DSiam[53],ASRCF[54],SINT[55],STRCF[56],ECO,CFNet[57],Staple[58]等多种跟踪方法进行比较,设置参数L=3. 表1为在LaSOT数据集上测试得到的实验结果.

    表  1  LaSOT数据集上的实验结果
    Table  1.  Experimental Results on LaSOT Dataset
    方法 归一化精度 精确率 成功率 方法 归一化精度 精确率 成功率
    MFECD 0.620 0.532 0.525 DSiam 0.405 0.322 0.333
    SiamCAR 0.605 0.520 0.512 ASRCF 0.391 0.337 0.359
    SiamBAN 0.598 0.521 0.514 SINT 0.354 0.295 0.314
    ATOM 0.576 0.505 0.515 STRCF 0.340 0.298 0.308
    CLNet 0.574 0.494 0.499 ECO 0.338 0.301 0.324
    SiamRPN++ 0.569 0.491 0.496 CFNet 0.312 0.259 0.275
    SPLT 0.494 0.396 0.426 Staple 0.278 0.239 0.243
    SiamFC 0.420 0.339 0.336
    下载: 导出CSV 
    | 显示表格

    可以看出,MFECD方法的归一化精度达到0.620,精确率达到0.532,成功率达到0.525,结果均为最优. 与经典在线跟踪方法ATOM相比,归一化精度提高了0.04,这是由于MFECD方法可根据数据的实时变化对模型及时更新,利用流数据的混合特征,有效解决目标跟踪中出现的概念漂移.

    为了更好地验证不同参数对MFECD方法的影响,本文在3个测试集上采用不同的参数进行实验,参数包含基本单元的数量L和时间长度n.

    表2可以看出,OTB100,UAV123,LaSOT 这3个测试集分别在L=9,L=5,L=3取得了最优结果. 实验结果说明对于不同长度的视频序列,视频帧数越多,采用越少的基本单元数量,方法更容易收敛以及达到最优的结果.

    表  2  不同基本单元数量下的实验结果
    Table  2.  Experimental Results Under Different Numbers of Basic Units
    L OTB100 UAV123 LaSOT
    成功率 精确率 成功率 精确率 成功率 精确率
    3 0.695 0.905 0.613 0.804 0.525 0.532
    5 0.698 0.912 0.62 0.81 0.516 0.525
    7 0.694 0.905 0.616 0.805 0.515 0.522
    9 0.699 0.913 0.619 0.81 0.519 0.528
    注:加粗数字表示最优结果.
    下载: 导出CSV 
    | 显示表格

    表3可以看出,在3个测试集上,当n=4时,跟踪结果都达到了最高. 实验结果说明结合适当数量的历史帧,既可以排除视频序列中所包含的干扰信息,又可以充分考虑时间上下文信息,利用有效的时间信息提高目标的跟踪成功率和精确率.

    表  3  不同时间长度下的实验结果
    Table  3.  Experimental Results Under Different Time Lengths
    n OTB100 UAV123 LaSOT
    成功率 精确率 成功率 精确率 成功率 精确率
    2 0.697 0.909 0.602 0.786 0.517 0.526
    4 0.699 0.913 0.62 0.81 0.525 0.532
    6 0.695 0.907 0.612 0.801 0.522 0.532
    8 0.695 0.907 0.612 0.8 0.514 0.522
    注:加粗数字表示最优结果.
    下载: 导出CSV 
    | 显示表格

    针对概念漂移处理过程中存在的信息提取能力有限且未充分考虑流数据包含的时序特性等问题,本文提出一种基于混合特征提取的流数据概念漂移处理方法MFECD.该方法首先采用不同尺度的卷积核构建拼接特征,采用门控机制将浅层输入和拼接特征进行融合,并且自适应集成不同层次的数据信息以获得复杂数据特征. 在此基础上,采用时间注意力和相似度计算获得流数据的时序特征,并对关键位点进行有效增强. 该方法利用复杂数据特征与时序特征,提高了神经网络的信息提取能力和对流数据概念漂移的处理能力.

    作者贡献声明:郭虎升提出设计思想、方法设计,撰写和修改论文;刘艳杰负责代码实现、数据测试、论文撰写及修改;王文剑负责写作指导、修改审定.

  • 图  1   图片数量和搜索响应时间的关联性

    Figure  1.   Correlation between image numbers and search response time

    图  2   分类属性维度和搜索响应时间的关联性

    Figure  2.   Correlation between categorical attribute dimension and search response time

    图  3   搜索响应时间过长的诊断框架

    Figure  3.   The diagnostic framework of long search response time

    图  4   数据集A中的诊断效果比较

    Figure  4.   Comparison of diagnostic effectiveness in dataset A

    图  5   数据集B中的诊断效果比较

    Figure  5.   Comparison of diagnostic effectiveness in dataset B

    图  6   Miner运行时长与数据量的关系

    Figure  6.   Relationship of runtime and data sizes on Miner

    图  7   Miner运行时长与特征维数的关系

    Figure  7.   Relationship of runtime and attribute dimensions on Miner

    图  8   Miner各步骤的作用

    Figure  8.   Contribution of each step of Miner

    表  1   搜索响应时间日志示例

    Table  1   Examples of Search Response Time Logs

    Timestamp #Image UA Ad ISP Province PageType SRT/ms
    1 411 315 200 0 Chrome 无广告 CRTC Heilongjiang sync 2011.14
    1 411 315 200 13 Chrome 无广告 CHINANET Guangdong async 686.0
    1 411 315 200 24 Chrome 无广告 UNICOM Hunan async 787.0
    1 411 315 200 4 Safari 无广告 OTHER Guangdong async 811.0
    1 411 315 200 25 Safari 有广告 UNICOM Jiangsu async 2203.0
    下载: 导出CSV

    表  2   Miner参数设置

    Table  2   Parameters Setting of Miner

    超参数 说明 取值
    m 最优特征子集大小 5
    k 难度分桶数目 5
    size 采样数量 1500
    P 自步采样迭代次数 5
    max_iter 反向筛选最大轮次数 5
    下载: 导出CSV

    表  3   实验平台

    Table  3   Experiment Platform

    软硬件配置
    CPUE5-2650, 2.20 GHz
    内存DDR4, 128 GB, 2400 MHz
    GPUMatrox Electronics Systems Ltd. G200eR2
    操作系统Ubuntu 16.04.7
    下载: 导出CSV
  • [1]

    Schurman E, Brutlag J. The user and business impact of server delays, additional bytes, and http chunking in web search[C/OL]//Proc of the Velocity Web Performance and Operations Conf. Sebastopol, CA: O'Reilly Media, 2009[2023-07-19].https://www.researchgate.net/publication/280113406

    [2]

    Sundaresan S, Magharei N, Feamster N, et al. Web performance bottlenecks in broadband access networks[C]//Proc of the 2013 ACM SIGMETRICS/Int Conf on Measurement and Modeling of Computer Systems. New York: ACM, 2013: 383−384

    [3]

    Yoon D Y, Niu N, Mozafari B. DBSherlock: A performance diagnostic tool for transactional databases[C]//Proc of the 2016 Int Conf on Management of Data. New York: ACM, 2016: 1599−1614

    [4]

    Jiang Junchen, Sekar V, Stoica I, et al. Shedding light on the structure of internet video quality problems in the wild[C]//Proc of the 9th ACM Conf on Emerging Networking Experiments and Technologies. New York: ACM, 2013: 357−368

    [5]

    Liu Dapeng, Zhao Youjian, Pei Dan, et al. Narrowing down the debugging space of slow search response time[C/OL]//Proc of the 34th Int Performance Computing and Communications Conf. Piscataway, NJ: IEEE, 2015[2023-07-19].https://ieeexplore.ieee.org/abstract/document/7410318

    [6]

    Liu Dapeng, Zhao Youjian, Sui Kaixin, et al. FOCUS: Shedding light on the high search response time in the wild[C]//Proc of the 35th Annual IEEE Int Conf on Computer Communications. Piscataway, NJ: IEEE, 2016: 1−9

    [7]

    Angelino E, Larus-Stone N, Alabi D, et al. Learning certifiably optimal rule lists for categorical data[J]. arXiv preprint, arXiv: 1704.01701, 2018

    [8]

    Khoussainova N, Balazinska M, Balazinska M. PerfXplain: Debugging mapreduce job performance[J]. arXiv preprint, arXiv: 1203.6400, 2012

    [9]

    Bansal C, Renganathan S, Asudani A, et al. DeCaf: Diagnosing and triaging performance issues in large-scale cloud services[C]//Proc of the 42nd ACM/IEEE Int Conf on Software Engineering: Software Engineering in Practice. New York: ACM, 2020: 201−210

    [10]

    Zhang Xu, Du Chao, Li Yifan, et al. HALO: Hierarchy-aware fault localization for cloud systems[C]//Proc of the 27th ACM SIGKDD Conf on Knowledge Discovery & Data Mining. New York: ACM, 2021: 3948−3958

    [11]

    Castelluccio M, Sansone C, Verdoliva L, et al. Automatically analyzing groups of crashes for finding correlations[C]//Proc of the 11th Joint Meeting on Foundations of Software Engineering. New York: ACM, 2017: 717−726

    [12]

    Lin F, Muzumdar K, Laptev N P, et al. Fast dimensional analysis for root cause investigation in a large-scale service environment[J/OL]. Proceedings of the ACM on Measurement and Analysis of Computing Systems, 2020[2023-07-19].https://dl.acm.org/doi/abs/10.1145/3392149

    [13]

    Liu Zhining, Cao Wei, Gao Zhifeng, et al. Self-paced ensemble for highly imbalanced massive data classification[C]//Proc of the 36th IEEE Int Conf on Data Engineering. Piscataway, NJ: IEEE, 2020: 841−852

    [14]

    Cheng Li, Wang Yijie, Liu Xinwang, et al. Outlier detection ensemble with embedded feature selection[C]//Proc of the 34th AAAl Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2020: 3503−3512

图(8)  /  表(3)
计量
  • 文章访问数:  130
  • HTML全文浏览量:  9
  • PDF下载量:  53
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-01-29
  • 修回日期:  2023-07-24
  • 网络出版日期:  2024-03-13
  • 刊出日期:  2024-05-31

目录

/

返回文章
返回