2019年 第56卷 第11期
2019, 56(11): 2299-2314.
DOI: 10.7544/issn1000-1239.2019.20190341
摘要:
漏洞是系统安全与攻防对抗的核心要素,漏洞的自动发现、分析、利用是长期以来研究的热点和难点,现有研究主要集中在模糊测试、污点分析、符号执行等方面.当前研究一方面主要从漏洞的发现、分析和利用的不同环节提出了一系列解决方案,缺乏系统性的研究和实现;另一方面相关方法未考虑现实环境的有限资源条件, 其中模糊测试主要基于大规模的服务器集群实施,污点分析和符号执行方法时间与空间复杂度高,且容易出现状态爆炸.针对有限资源条件下的漏洞自动挖掘与利用问题,建立了Weak-Tainted程序运行时漏洞模型,提出了一套面向漏洞自动挖掘、分析、利用的完整解决方案;提出了污点传播分析优化方法和基于输出特征反馈的输入求解方法等有限资源条件下的分析方案,提升了漏洞挖掘分析与利用生成能力;实现了漏洞自动挖掘和利用原型系统,单台服务器设备可并发运行25个漏洞挖掘与分析任务.对2018年BCTF比赛样本进行了实验对比测试,该输入求解方法在求解atoi,hex,base64编码的能力均优于ANGR, 同等漏洞挖掘能力条件下效率比AFL提高45.7%,测试的50个样本中有24个能够自动生成利用代码,验证了Weak-Tainted漏洞描述模型用于漏洞自动挖掘和利用生成的优势.
漏洞是系统安全与攻防对抗的核心要素,漏洞的自动发现、分析、利用是长期以来研究的热点和难点,现有研究主要集中在模糊测试、污点分析、符号执行等方面.当前研究一方面主要从漏洞的发现、分析和利用的不同环节提出了一系列解决方案,缺乏系统性的研究和实现;另一方面相关方法未考虑现实环境的有限资源条件, 其中模糊测试主要基于大规模的服务器集群实施,污点分析和符号执行方法时间与空间复杂度高,且容易出现状态爆炸.针对有限资源条件下的漏洞自动挖掘与利用问题,建立了Weak-Tainted程序运行时漏洞模型,提出了一套面向漏洞自动挖掘、分析、利用的完整解决方案;提出了污点传播分析优化方法和基于输出特征反馈的输入求解方法等有限资源条件下的分析方案,提升了漏洞挖掘分析与利用生成能力;实现了漏洞自动挖掘和利用原型系统,单台服务器设备可并发运行25个漏洞挖掘与分析任务.对2018年BCTF比赛样本进行了实验对比测试,该输入求解方法在求解atoi,hex,base64编码的能力均优于ANGR, 同等漏洞挖掘能力条件下效率比AFL提高45.7%,测试的50个样本中有24个能够自动生成利用代码,验证了Weak-Tainted漏洞描述模型用于漏洞自动挖掘和利用生成的优势.
2019, 56(11): 2315-2329.
DOI: 10.7544/issn1000-1239.2019.20190348
摘要:
为了使开发者能安全准确地使用第三库接口,库设计者提供了各种类型的安全提示(安全规约),进而保护应用程序免受因库函数的误用而造成的安全攻击.然而,研究表明:开发者经常性不遵守这些安全规约,导致应用程序中引入了各种各样的安全漏洞.为了评估该问题的影响与规模,进行了系统性的、大规模的对安全规约在安卓应用程序中违反情况的研究.结果表明:已有的安全规约由于不精确的描述、误导性的代码示例、错误的默认设置、碎片化以及缺少强制性检查等原因而大大影响了其在实际运用中的有效性.为了使开发者能更好地遵守安全规约,提出了TipTracer,一个自动化的通用漏洞分析框架.TipTracer主要包含2个部分:1)TipTracer定义了一个能形式化描述安全规约的安全性语言,并利用该语言对已知的安全规约进行形式化表述;2)TipTracer实现了一个静态代码分析器,用于检查应用程序是否满足安全规约.最后,通过大规模的实验分析,证明了TipTracer能有效且准确地对大规模的真实应用程序进行安全性分析.
为了使开发者能安全准确地使用第三库接口,库设计者提供了各种类型的安全提示(安全规约),进而保护应用程序免受因库函数的误用而造成的安全攻击.然而,研究表明:开发者经常性不遵守这些安全规约,导致应用程序中引入了各种各样的安全漏洞.为了评估该问题的影响与规模,进行了系统性的、大规模的对安全规约在安卓应用程序中违反情况的研究.结果表明:已有的安全规约由于不精确的描述、误导性的代码示例、错误的默认设置、碎片化以及缺少强制性检查等原因而大大影响了其在实际运用中的有效性.为了使开发者能更好地遵守安全规约,提出了TipTracer,一个自动化的通用漏洞分析框架.TipTracer主要包含2个部分:1)TipTracer定义了一个能形式化描述安全规约的安全性语言,并利用该语言对已知的安全规约进行形式化表述;2)TipTracer实现了一个静态代码分析器,用于检查应用程序是否满足安全规约.最后,通过大规模的实验分析,证明了TipTracer能有效且准确地对大规模的真实应用程序进行安全性分析.
2019, 56(11): 2330-2338.
DOI: 10.7544/issn1000-1239.2019.20190376
摘要:
入侵检测技术旨在有效地检测网络中异常的攻击,对网络安全至关重要.针对传统的入侵检测方法难以从工业控制系统通信数据中提取有效数据特征的问题,提出一种基于相关信息熵和CNN-BiLSTM的入侵检测模型,该模型将基于相关信息熵的特征选择和融合的深度学习算法相结合,因此能够有效去除噪声冗余,减少计算量,提高检测精度.首先针对不平衡样本等问题进行相应预处理,并通过基于相关信息熵的算法进行特征选择,达到去除噪声数据和冗余特征的目的;然后分别运用卷积神经网络(CNN)和双向长短期记忆神经网络(BiLSTM)从时间和空间维度提取数据特征,通过多头注意力机制进行特征融合,进而得出最终检测结果;最后通过单一变量原则和交叉验证方式获得最优的模型.通过与其他传统入侵检测方法实验对比得出:该模型具有更高的准确率(99.21%)和较低的漏报率(0.77%).
入侵检测技术旨在有效地检测网络中异常的攻击,对网络安全至关重要.针对传统的入侵检测方法难以从工业控制系统通信数据中提取有效数据特征的问题,提出一种基于相关信息熵和CNN-BiLSTM的入侵检测模型,该模型将基于相关信息熵的特征选择和融合的深度学习算法相结合,因此能够有效去除噪声冗余,减少计算量,提高检测精度.首先针对不平衡样本等问题进行相应预处理,并通过基于相关信息熵的算法进行特征选择,达到去除噪声数据和冗余特征的目的;然后分别运用卷积神经网络(CNN)和双向长短期记忆神经网络(BiLSTM)从时间和空间维度提取数据特征,通过多头注意力机制进行特征融合,进而得出最终检测结果;最后通过单一变量原则和交叉验证方式获得最优的模型.通过与其他传统入侵检测方法实验对比得出:该模型具有更高的准确率(99.21%)和较低的漏报率(0.77%).
2019, 56(11): 2339-2348.
DOI: 10.7544/issn1000-1239.2019.20190393
摘要:
在当前复杂网络环境下,恶意代码通过各种方式快速传播,入侵用户终端设备或网络设备、非法窃取用户隐私数据,对网络和互联网用户造成了严重的安全威胁.传统检测方法难以检测未知恶意代码,而恶意代码变体的多样性和庞大数量也对未知恶意代码检测构成了巨大挑战.提出了一种无监督的恶意代码识别方法,通过分析反汇编PE文件给出汇编指令标准化规则,结合潜在狄立克雷分布(latent Dirichlet allocation, LDA)获得汇编指令中潜在的“文档-主题”、“主题-词”的分布.再以“主题分布”构造恶意样本特征,产生一个全新的恶意代码检测框架.结合“困惑度”和变化的步长给出了最优“主题”数目的快速评价和自动确定方法,解决了LDA模型中主题数目需要预先指定的问题.同时解析了“文档-主题”、“主题-词”聚集结果的语义可解释性,说明了该方法获得的样本特征具有潜在的语义.实验结果表明:与其他方法相比该方法具有相当的或更好的恶意代码鉴别能力,同时能够准确地识别恶意代码的新变体.
在当前复杂网络环境下,恶意代码通过各种方式快速传播,入侵用户终端设备或网络设备、非法窃取用户隐私数据,对网络和互联网用户造成了严重的安全威胁.传统检测方法难以检测未知恶意代码,而恶意代码变体的多样性和庞大数量也对未知恶意代码检测构成了巨大挑战.提出了一种无监督的恶意代码识别方法,通过分析反汇编PE文件给出汇编指令标准化规则,结合潜在狄立克雷分布(latent Dirichlet allocation, LDA)获得汇编指令中潜在的“文档-主题”、“主题-词”的分布.再以“主题分布”构造恶意样本特征,产生一个全新的恶意代码检测框架.结合“困惑度”和变化的步长给出了最优“主题”数目的快速评价和自动确定方法,解决了LDA模型中主题数目需要预先指定的问题.同时解析了“文档-主题”、“主题-词”聚集结果的语义可解释性,说明了该方法获得的样本特征具有潜在的语义.实验结果表明:与其他方法相比该方法具有相当的或更好的恶意代码鉴别能力,同时能够准确地识别恶意代码的新变体.
2019, 56(11): 2349-2364.
DOI: 10.7544/issn1000-1239.2019.20190412
摘要:
作为物联网技术的典型应用,智能家居平台正逐步走进千家万户,但其存在的安全问题阻碍了其进一步的部署.研究者对智能家居平台的安全问题研究处于起步阶段,同时大量安全威胁被迅速提出.回顾了当前智能家居平台的典型架构,并分析了其各个组成部分存在的攻击接口.在信息接口安全方面,分析了存在于如智能摄像头的图像接口与语音控制系统的对抗样本攻击问题;在云端后台安全方面,分析了执行云端智能应用时对安全规则的破坏,以及造成的隐私泄露等问题.回顾了对这些安全问题所提出的解决方案,并指出现有工作存在的问题.针对存在于智能家居中的恶意应用问题,提出了一种基于无线流量分析的第三方恶意软件检测系统,能够在不修改智能家居平台的情况下,实现对恶意应用的精准检测.介绍了该系统的相关设计方案,并在三星SmartThings平台上验证了其准确性,并针对该系统给出一个隐私保护机制.
作为物联网技术的典型应用,智能家居平台正逐步走进千家万户,但其存在的安全问题阻碍了其进一步的部署.研究者对智能家居平台的安全问题研究处于起步阶段,同时大量安全威胁被迅速提出.回顾了当前智能家居平台的典型架构,并分析了其各个组成部分存在的攻击接口.在信息接口安全方面,分析了存在于如智能摄像头的图像接口与语音控制系统的对抗样本攻击问题;在云端后台安全方面,分析了执行云端智能应用时对安全规则的破坏,以及造成的隐私泄露等问题.回顾了对这些安全问题所提出的解决方案,并指出现有工作存在的问题.针对存在于智能家居中的恶意应用问题,提出了一种基于无线流量分析的第三方恶意软件检测系统,能够在不修改智能家居平台的情况下,实现对恶意应用的精准检测.介绍了该系统的相关设计方案,并在三星SmartThings平台上验证了其准确性,并针对该系统给出一个隐私保护机制.
2019, 56(11): 2365-2374.
DOI: 10.7544/issn1000-1239.2019.20190365
摘要:
以机器学习、人工智能、物联网等技术所构建的智能环境正在改变人们的生活、工作及思维方式.智能环境下数据存储和处理的方式也在不断改变,其中安全和效率是2个重要的因素.就安全而言,在数据共享的前提下保护隐私势在必行.就效率而言,智能环境中存在诸多资源受限的设备,针对这些设备如何设计高效的算法或协议直接决定其可行性.从以上2个需求出发,研究适用于智能环境中的安全高效模式匹配问题.传统的安全模式匹配协议中模式持有方需要执行大量的公钥操作,因此不适用于手机等资源受限设备作为模式持有方的场景.首次在双云服务器辅助的安全两方计算模型下给出安全模式匹配协议的功能函数,并基于茫然传输(oblivious transfer, OT)给出协议的具体构造.假设云服务器和参与方之间不合谋,协议在半诚实敌手模型下是安全的.协议需要4轮交互,模式方仅需要执行少量的异或操作,而复杂的OT协议主要集中在数据库方和云服务器之间.此外,使用OT扩展(OT extension)技术可以将所有OT协议的数量从O(nm)降至O(k),其中n和m是数据库方和模式方的输入长度,k是OT扩展协议中基础OT的数目,其远小于nm.
以机器学习、人工智能、物联网等技术所构建的智能环境正在改变人们的生活、工作及思维方式.智能环境下数据存储和处理的方式也在不断改变,其中安全和效率是2个重要的因素.就安全而言,在数据共享的前提下保护隐私势在必行.就效率而言,智能环境中存在诸多资源受限的设备,针对这些设备如何设计高效的算法或协议直接决定其可行性.从以上2个需求出发,研究适用于智能环境中的安全高效模式匹配问题.传统的安全模式匹配协议中模式持有方需要执行大量的公钥操作,因此不适用于手机等资源受限设备作为模式持有方的场景.首次在双云服务器辅助的安全两方计算模型下给出安全模式匹配协议的功能函数,并基于茫然传输(oblivious transfer, OT)给出协议的具体构造.假设云服务器和参与方之间不合谋,协议在半诚实敌手模型下是安全的.协议需要4轮交互,模式方仅需要执行少量的异或操作,而复杂的OT协议主要集中在数据库方和云服务器之间.此外,使用OT扩展(OT extension)技术可以将所有OT协议的数量从O(nm)降至O(k),其中n和m是数据库方和模式方的输入长度,k是OT扩展协议中基础OT的数目,其远小于nm.
2019, 56(11): 2375-2383.
DOI: 10.7544/issn1000-1239.2019.20190293
摘要:
分布式生物特征认证系统因不依赖弱口令或硬件标识物而获得高的可靠性、安全性和便利性,但也因生物特征存在永久失效和隐私泄露的风险而面临更多的安全威胁.基于同态加密技术的生物特征认证方案允许特征向量在密文域匹配以保护向量安全和用户隐私,但也因此要在密文域执行昂贵的乘法运算,而且还可能因为向量封装不当而遭受安全攻击.在Brakerski等人同态加密方案的基础上提出了一种安全向量匹配方法,并在该方法的基础上设计了一个口令辅助的生物特征同态认证协议.该协议无需令牌等硬件标识物,注册时只需将带有辅助向量的特征模板密文和辅助向量外包存储,认证时服务器使用辅助向量匹配法完成模板向量和请求向量的相似性评估即可实现用户身份认证.基于Dolev-Yao攻击者模型变种和分布式生物特征认证系统所面临的主要攻击手段对协议进行了安全性分析,并通过和另外2个基于RLWE(learning with error over ring)同态的生物特征认证协议的对比分析,证明了新协议在隐私保护和向量匹配效率方面更具优势.
分布式生物特征认证系统因不依赖弱口令或硬件标识物而获得高的可靠性、安全性和便利性,但也因生物特征存在永久失效和隐私泄露的风险而面临更多的安全威胁.基于同态加密技术的生物特征认证方案允许特征向量在密文域匹配以保护向量安全和用户隐私,但也因此要在密文域执行昂贵的乘法运算,而且还可能因为向量封装不当而遭受安全攻击.在Brakerski等人同态加密方案的基础上提出了一种安全向量匹配方法,并在该方法的基础上设计了一个口令辅助的生物特征同态认证协议.该协议无需令牌等硬件标识物,注册时只需将带有辅助向量的特征模板密文和辅助向量外包存储,认证时服务器使用辅助向量匹配法完成模板向量和请求向量的相似性评估即可实现用户身份认证.基于Dolev-Yao攻击者模型变种和分布式生物特征认证系统所面临的主要攻击手段对协议进行了安全性分析,并通过和另外2个基于RLWE(learning with error over ring)同态的生物特征认证协议的对比分析,证明了新协议在隐私保护和向量匹配效率方面更具优势.
2019, 56(11): 2384-2395.
DOI: 10.7544/issn1000-1239.2019.20180823
摘要:
特定方面情感分析已经成为自然语言处理领域的研究热点,其通过学习文本上下文的信息判别文本中特定方面的情感极性,可以更加有效地帮助人们了解用户对不同方面的情感表达.当前,将注意力机制和神经网络相结合的模型在解决特定方面情感分析任务时大多仅考虑单一层面的注意力信息,并且卷积神经网络无法获取全局结构信息、循环神经网络训练时间过长且单词间的依赖程度随着距离增加而逐渐减弱.针对上述问题,提出一种面向双注意力网络的特定方面情感分析(dual-attention networks for aspect-level sentiment analysis, DANSA)模型.首先,引入多头注意力机制,通过对输入进行多次不同的线性变换操作,获取更全面的注意力信息,同时,多头注意力机制可以实现并行化计算,保证了DANSA的训练速度.其次,DANSA引入自注意力机制,通过计算输入中每个单词与其他所有单词的注意力得分获取全局结构信息,并且单词间的依赖程度不会受到时间和句子长度的影响.最后,融合上下文自注意力信息与特定方面单词注意力信息,共同作为特定方面情感预测的依据,最终实现特定方面情感极性的预测.相比结合注意力机制的神经网络,DANSA弥补了注意力信息单一问题,不仅可以有效获取全局结构信息,还能够实现并行化计算,大大降低了训练时间.在SemEval2014数据集和Twitter数据集上进行实验,DANSA获得了更好的分类效果,进一步证明了DANSA的有效性.
特定方面情感分析已经成为自然语言处理领域的研究热点,其通过学习文本上下文的信息判别文本中特定方面的情感极性,可以更加有效地帮助人们了解用户对不同方面的情感表达.当前,将注意力机制和神经网络相结合的模型在解决特定方面情感分析任务时大多仅考虑单一层面的注意力信息,并且卷积神经网络无法获取全局结构信息、循环神经网络训练时间过长且单词间的依赖程度随着距离增加而逐渐减弱.针对上述问题,提出一种面向双注意力网络的特定方面情感分析(dual-attention networks for aspect-level sentiment analysis, DANSA)模型.首先,引入多头注意力机制,通过对输入进行多次不同的线性变换操作,获取更全面的注意力信息,同时,多头注意力机制可以实现并行化计算,保证了DANSA的训练速度.其次,DANSA引入自注意力机制,通过计算输入中每个单词与其他所有单词的注意力得分获取全局结构信息,并且单词间的依赖程度不会受到时间和句子长度的影响.最后,融合上下文自注意力信息与特定方面单词注意力信息,共同作为特定方面情感预测的依据,最终实现特定方面情感极性的预测.相比结合注意力机制的神经网络,DANSA弥补了注意力信息单一问题,不仅可以有效获取全局结构信息,还能够实现并行化计算,大大降低了训练时间.在SemEval2014数据集和Twitter数据集上进行实验,DANSA获得了更好的分类效果,进一步证明了DANSA的有效性.
2019, 56(11): 2396-2409.
DOI: 10.7544/issn1000-1239.2019.20180880
摘要:
通过增加模型的深度以及训练数据的样本数量,深度神经网络模型能够在多个机器学习任务中获得更好的性能,然而这些必要的操作会使得深度神经网络模型训练的开销相应增大.因此为了更好地应对大量的训练开销,在分布式计算环境中对深度神经网络模型的训练过程进行加速成为了研发人员最常用的手段.随机梯度下降(stochastic gradient descent, SGD)算法是当前深度神经网络模型中最常见的训练算法之一,然而SGD在进行并行化的时候容易产生梯度过时问题,从而影响算法的整体收敛性.现有解决方案大部分针对的是各节点性能差别较小的高性能计算(high performance computing, HPC)环境,很少有研究考虑过各节点性能差别较大的集群环境.针对上述问题进行研究并提出了一种基于性能感知技术的动态batch size随机梯度下降算法(dynamic batch size SGD, DBS-SGD).该算法通过分析各节点的计算能力,对各节点的minibatch进行动态分配,从而保证了节点间每次迭代更新的时间基本一致,进而降低了节点的平均梯度过时值.提出的算法能够有效优化异步更新策略中存在的梯度过时问题.选用常用的图像分类基准Mnist和cifar10作为训练数据集,将该算法与异步随机梯度下降(asynchronous SGD, ASGD)算法、n-soft算法进行了对比.实验结果表明:在不损失加速比的情况下,Mnist数据集的loss函数值降低了60%,cifar数据集的准确率提升了约10%,loss函数值降低了10%,其性能高于ASGD算法和n-soft算法,接近同步策略下的收敛曲线.
通过增加模型的深度以及训练数据的样本数量,深度神经网络模型能够在多个机器学习任务中获得更好的性能,然而这些必要的操作会使得深度神经网络模型训练的开销相应增大.因此为了更好地应对大量的训练开销,在分布式计算环境中对深度神经网络模型的训练过程进行加速成为了研发人员最常用的手段.随机梯度下降(stochastic gradient descent, SGD)算法是当前深度神经网络模型中最常见的训练算法之一,然而SGD在进行并行化的时候容易产生梯度过时问题,从而影响算法的整体收敛性.现有解决方案大部分针对的是各节点性能差别较小的高性能计算(high performance computing, HPC)环境,很少有研究考虑过各节点性能差别较大的集群环境.针对上述问题进行研究并提出了一种基于性能感知技术的动态batch size随机梯度下降算法(dynamic batch size SGD, DBS-SGD).该算法通过分析各节点的计算能力,对各节点的minibatch进行动态分配,从而保证了节点间每次迭代更新的时间基本一致,进而降低了节点的平均梯度过时值.提出的算法能够有效优化异步更新策略中存在的梯度过时问题.选用常用的图像分类基准Mnist和cifar10作为训练数据集,将该算法与异步随机梯度下降(asynchronous SGD, ASGD)算法、n-soft算法进行了对比.实验结果表明:在不损失加速比的情况下,Mnist数据集的loss函数值降低了60%,cifar数据集的准确率提升了约10%,loss函数值降低了10%,其性能高于ASGD算法和n-soft算法,接近同步策略下的收敛曲线.
2019, 56(11): 2410-2423.
DOI: 10.7544/issn1000-1239.2019.20180793
摘要:
垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于三支决策模型,二分类模型会产生较大的错分代价.作为三支决策的一个重要分支,基于决策理论粗糙集的三支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能.然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响.因此,在基于决策理论粗糙集的三支决策模型的基础上,提出了一种基于相似度量的自适应三支垃圾邮件分类模型.该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法.实验结果表明所提模型在垃圾邮件过滤领域表现优异.
垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于三支决策模型,二分类模型会产生较大的错分代价.作为三支决策的一个重要分支,基于决策理论粗糙集的三支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能.然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响.因此,在基于决策理论粗糙集的三支决策模型的基础上,提出了一种基于相似度量的自适应三支垃圾邮件分类模型.该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法.实验结果表明所提模型在垃圾邮件过滤领域表现优异.
2019, 56(11): 2424-2437.
DOI: 10.7544/issn1000-1239.2019.20180740
摘要:
行人再识别是指在具有不重叠视域的摄像机监控网络中根据行人外观进行身份关联的任务.由于在视频监控系统中具有广泛的应用前景,受到了计算机视觉与机器学习领域的广泛关注.当前的行人再识别研究主要关注从行人图像中提取判别性的特征描述子或学习距离度量.然而不同摄像机视角下行人的外观常常存在很大差异,同一摄像机下还会有行人外观相近的情况,这使得特征描述子或距离度量的表达能力受到了很大的影响.为了增强它们的表达能力并提升行人再识别的准确率,提出了一种基于跨视角判别性词典嵌入的行人再识别算法.在该算法中不仅学习了跨视角的词典还同时联合学习了一个距离度量矩阵,从而将两者的优势结合起来.该算法模型有效地挖掘了不同视角下词典表达的内在联系与距离约束,从而能够使用学习到的表达能力更强的特征在嵌入子空间中进行行人再识别.为了避免不均衡训练样本带来的度量矩阵偏差问题,在度量矩阵的学习中还引入了自适应的权重分配策略.在模型优化上,采用了高效的交替优化方法来求解词典与距离度量等模型参数.在VIPeR,GRID,3DPeS等数据集上的实验结果表明本文算法取得了非常优秀的行人再识别性能.
行人再识别是指在具有不重叠视域的摄像机监控网络中根据行人外观进行身份关联的任务.由于在视频监控系统中具有广泛的应用前景,受到了计算机视觉与机器学习领域的广泛关注.当前的行人再识别研究主要关注从行人图像中提取判别性的特征描述子或学习距离度量.然而不同摄像机视角下行人的外观常常存在很大差异,同一摄像机下还会有行人外观相近的情况,这使得特征描述子或距离度量的表达能力受到了很大的影响.为了增强它们的表达能力并提升行人再识别的准确率,提出了一种基于跨视角判别性词典嵌入的行人再识别算法.在该算法中不仅学习了跨视角的词典还同时联合学习了一个距离度量矩阵,从而将两者的优势结合起来.该算法模型有效地挖掘了不同视角下词典表达的内在联系与距离约束,从而能够使用学习到的表达能力更强的特征在嵌入子空间中进行行人再识别.为了避免不均衡训练样本带来的度量矩阵偏差问题,在度量矩阵的学习中还引入了自适应的权重分配策略.在模型优化上,采用了高效的交替优化方法来求解词典与距离度量等模型参数.在VIPeR,GRID,3DPeS等数据集上的实验结果表明本文算法取得了非常优秀的行人再识别性能.
2019, 56(11): 2438-2447.
DOI: 10.7544/issn1000-1239.2019.20180314
摘要:
区间犹豫模糊集是区间数和犹豫模糊集的推广,通常用以描述不确定信息具备的不完备性与犹豫性.近年来,区间犹豫模糊多属性决策问题受到了学者们的广泛关注.针对属性间同时具有关联性与优先关系的区间犹豫模糊多属性决策问题,利用模糊图可通过顶点间的边表示属性间关联性的优势,研究基于区间犹豫模糊图的多属性决策方法.首先从定义、运算规则及映射关系的角度建立区间犹豫模糊图的相关概念.在此基础上,提出考虑关联性与优先关系的区间犹豫模糊图多属性决策方法.最后用实例及对比性分析阐述所提多属性决策方法的可行性与有效性.结果表明:相较于经典区间犹豫模糊多属性决策方法,所提方法能够合理求解属性间同时具有关联性与优先关系的区间犹豫模糊多属性决策问题.
区间犹豫模糊集是区间数和犹豫模糊集的推广,通常用以描述不确定信息具备的不完备性与犹豫性.近年来,区间犹豫模糊多属性决策问题受到了学者们的广泛关注.针对属性间同时具有关联性与优先关系的区间犹豫模糊多属性决策问题,利用模糊图可通过顶点间的边表示属性间关联性的优势,研究基于区间犹豫模糊图的多属性决策方法.首先从定义、运算规则及映射关系的角度建立区间犹豫模糊图的相关概念.在此基础上,提出考虑关联性与优先关系的区间犹豫模糊图多属性决策方法.最后用实例及对比性分析阐述所提多属性决策方法的可行性与有效性.结果表明:相较于经典区间犹豫模糊多属性决策方法,所提方法能够合理求解属性间同时具有关联性与优先关系的区间犹豫模糊多属性决策问题.
2019, 56(11): 2448-2457.
DOI: 10.7544/issn1000-1239.2019.20180754
摘要:
自动测试向量生成的目的是对特定的故障模型确定1个高质量测试向量集使得芯片(设计)的故障覆盖率达到期望值,在芯片测试中是非常重要的环节.TetraMAX ATPG 2018是众多ATPG工具中功能最强、最易于使用的自动测试向量生成工具,可以在很短的时间内生成具有高故障覆盖率的高质量测试向量集.提出基于极小碰集求解算法的极小完全测试向量集求解算法,通过对测试向量集约简问题重新建模,利用极小碰集求解算法对TetraMAX ATPG 2018产生的测试向量集进行约简.利用这一算法可以有效地缩减测试向量集规模,且保证其故障覆盖率不变,对降低芯片的测试成本有着重要的现实意义.实验针对固定型故障,结果表明:该算法具有良好的约简效果,而且可以保证所得测试向量集中不包含冗余的测试向量.
自动测试向量生成的目的是对特定的故障模型确定1个高质量测试向量集使得芯片(设计)的故障覆盖率达到期望值,在芯片测试中是非常重要的环节.TetraMAX ATPG 2018是众多ATPG工具中功能最强、最易于使用的自动测试向量生成工具,可以在很短的时间内生成具有高故障覆盖率的高质量测试向量集.提出基于极小碰集求解算法的极小完全测试向量集求解算法,通过对测试向量集约简问题重新建模,利用极小碰集求解算法对TetraMAX ATPG 2018产生的测试向量集进行约简.利用这一算法可以有效地缩减测试向量集规模,且保证其故障覆盖率不变,对降低芯片的测试成本有着重要的现实意义.实验针对固定型故障,结果表明:该算法具有良好的约简效果,而且可以保证所得测试向量集中不包含冗余的测试向量.
2019, 56(11): 2458-2468.
DOI: 10.7544/issn1000-1239.2019.20180617
摘要:
现有的高斯-脉冲混合噪声降噪算法多基于正则化技术采用迭代求解最优目标函数值的方式实现,执行效率普遍比较低,严重限制了其实际应用范围.为此,以卷积神经网络(convolutional neural network, CNN)为核心技术提出了一种基于图像质量感知的快速盲降噪算法(image quality-aware fast blind denoising algorithm, IQA-FBDA).在训练阶段,首先基于浅层CNN卷积神经网络设计图像质量评估模型来预测待降噪图像的图像质量值;然后,依据在大量噪声图像训练集合上获得的图像质量值统计分布规律构建混合噪声模式分类字典;最后,基于该分类字典将噪声图像集合划分为16个子集并训练与各个子集相匹配的深层CNN卷积神经网络专用降噪模型.在降噪阶段,首先利用图像质量评估模型估计给定待降噪图像的质量值,然后依据所预测的图像质量值查找噪声模式分类字典并调用与之相匹配预先训练好的深层CNN降噪模型即可快速地完成盲降噪任务.实验数据表明:IQA-FBDA算法在降噪效果方面的性能达到了与主流高斯-脉冲混合噪声降噪算法相当的水平,而在执行效率方面则有极大提高,更具实用价值.
现有的高斯-脉冲混合噪声降噪算法多基于正则化技术采用迭代求解最优目标函数值的方式实现,执行效率普遍比较低,严重限制了其实际应用范围.为此,以卷积神经网络(convolutional neural network, CNN)为核心技术提出了一种基于图像质量感知的快速盲降噪算法(image quality-aware fast blind denoising algorithm, IQA-FBDA).在训练阶段,首先基于浅层CNN卷积神经网络设计图像质量评估模型来预测待降噪图像的图像质量值;然后,依据在大量噪声图像训练集合上获得的图像质量值统计分布规律构建混合噪声模式分类字典;最后,基于该分类字典将噪声图像集合划分为16个子集并训练与各个子集相匹配的深层CNN卷积神经网络专用降噪模型.在降噪阶段,首先利用图像质量评估模型估计给定待降噪图像的质量值,然后依据所预测的图像质量值查找噪声模式分类字典并调用与之相匹配预先训练好的深层CNN降噪模型即可快速地完成盲降噪任务.实验数据表明:IQA-FBDA算法在降噪效果方面的性能达到了与主流高斯-脉冲混合噪声降噪算法相当的水平,而在执行效率方面则有极大提高,更具实用价值.
2019, 56(11): 2469-2484.
DOI: 10.7544/issn1000-1239.2019.20180699
摘要:
为降低传统弹性运动估计的计算复杂度,提出一种2 b深度像素的弹性运动估计方法.首先,利用Prewitt算子提取视频帧的梯度,借助梯度模长的均值和标准差将像素深度从8 b降采样为2 b.其次,引进基于位操作的矩阵乘法和基于比较操作的偏导运算,提出了2 b深度像素的弹性运动模型以及求解该模型的简化高斯-牛顿法,避免了黑塞矩阵及其逆矩阵的重复计算.同时,采用1阶线性逼近,得出阻尼步长与运动向量增量、运动补偿误差之间的函数关系以及初始步长的近似计算策略,进而以菱形搜索为初始搜索,给出了2 b深度像素的弹性运动模型的快速求解算法.实验表明:该算法的平均峰值信噪比和计算效率明显优于8 b全搜索、2 b全搜索和传统8 b弹性运动估计.
为降低传统弹性运动估计的计算复杂度,提出一种2 b深度像素的弹性运动估计方法.首先,利用Prewitt算子提取视频帧的梯度,借助梯度模长的均值和标准差将像素深度从8 b降采样为2 b.其次,引进基于位操作的矩阵乘法和基于比较操作的偏导运算,提出了2 b深度像素的弹性运动模型以及求解该模型的简化高斯-牛顿法,避免了黑塞矩阵及其逆矩阵的重复计算.同时,采用1阶线性逼近,得出阻尼步长与运动向量增量、运动补偿误差之间的函数关系以及初始步长的近似计算策略,进而以菱形搜索为初始搜索,给出了2 b深度像素的弹性运动模型的快速求解算法.实验表明:该算法的平均峰值信噪比和计算效率明显优于8 b全搜索、2 b全搜索和传统8 b弹性运动估计.
2019, 56(11): 2485-2493.
DOI: 10.7544/issn1000-1239.2019.20180656
摘要:
最近对神经网络模型的研究在图像修复任务中显示出巨大的潜力,其核心任务是理解图像语义信息并重建缺失的图像内容.这些研究可以生成语义和内容上合理的结构和纹理,但通常会导致与孔洞周围区域不一致的扭曲结构或模糊纹理,特别是人脸图像修复问题.人脸图像修复工作经常需要为包含大量外观元素以及局部属性的缺失区域(例如眼睛或嘴巴)生成语义上的新内容,这些缺失区域往往具有独特的属性和语义信息从而导致生成内容不合理.为了解决以上问题,提出了一个有效的深度神经网络模型,模型的生成器结合全连接卷积和U-net网络的优越特性,同时提出局部属性辨别器使修复内容具有创新性的同时也能够使整体与局部保持语义一致性.模型不仅提升了对于人脸图像整体语义信息的感知能力,同时也基于局部属性能够有效地修复人脸关键部位,通过在CelebA数据集上的实验证明了该模型能够有效地修复人脸缺失部分并且能够生成新颖的修复内容.
最近对神经网络模型的研究在图像修复任务中显示出巨大的潜力,其核心任务是理解图像语义信息并重建缺失的图像内容.这些研究可以生成语义和内容上合理的结构和纹理,但通常会导致与孔洞周围区域不一致的扭曲结构或模糊纹理,特别是人脸图像修复问题.人脸图像修复工作经常需要为包含大量外观元素以及局部属性的缺失区域(例如眼睛或嘴巴)生成语义上的新内容,这些缺失区域往往具有独特的属性和语义信息从而导致生成内容不合理.为了解决以上问题,提出了一个有效的深度神经网络模型,模型的生成器结合全连接卷积和U-net网络的优越特性,同时提出局部属性辨别器使修复内容具有创新性的同时也能够使整体与局部保持语义一致性.模型不仅提升了对于人脸图像整体语义信息的感知能力,同时也基于局部属性能够有效地修复人脸关键部位,通过在CelebA数据集上的实验证明了该模型能够有效地修复人脸缺失部分并且能够生成新颖的修复内容.
2019, 56(11): 2494-2505.
DOI: 10.7544/issn1000-1239.2019.20180750
摘要:
机会移动社交网络(opportunistic mobile social networks, OMSNs)是一种利用节点的相遇机会进行端到端无线数据传输的网络.随着人们使用移动智能终端数量的剧增,为建立泛在的数据传输基础设施提供了机会,因此研究机会移动社交网络的数据传输机制具有重要意义.为了提高机会移动社交网络的数据传输性能,提出了一种基于群组构造的数据分发机制(data dissemination mechanism based on group structure, DDMGS).首先,基于用户的行为属性,即节点重要性、兴趣相似度和通信关系紧密度,设计关系度量模型.其次,依据不同的行为属性关系构成的网络拓扑特征设计群组构造算法:基于位置关系的拓扑结构具有周期稳定性,基于兴趣关系的拓扑结构具有长期稳定性,而基于通信关系的拓扑结构具有动态性.为进一步提高数据分发性能和网络的整体性能,还设计了节点缓冲区管理机制,引入了合作博弈理论加强节点之间的合作能力,规避节点的自私行为.仿真验证表明DDMGS与直接投递路由、先知路由以及Simbet路由和Epidemic路由相比具有较好的性能,提高了消息传输成功率,减少了平均跳数,该算法是可行的.
机会移动社交网络(opportunistic mobile social networks, OMSNs)是一种利用节点的相遇机会进行端到端无线数据传输的网络.随着人们使用移动智能终端数量的剧增,为建立泛在的数据传输基础设施提供了机会,因此研究机会移动社交网络的数据传输机制具有重要意义.为了提高机会移动社交网络的数据传输性能,提出了一种基于群组构造的数据分发机制(data dissemination mechanism based on group structure, DDMGS).首先,基于用户的行为属性,即节点重要性、兴趣相似度和通信关系紧密度,设计关系度量模型.其次,依据不同的行为属性关系构成的网络拓扑特征设计群组构造算法:基于位置关系的拓扑结构具有周期稳定性,基于兴趣关系的拓扑结构具有长期稳定性,而基于通信关系的拓扑结构具有动态性.为进一步提高数据分发性能和网络的整体性能,还设计了节点缓冲区管理机制,引入了合作博弈理论加强节点之间的合作能力,规避节点的自私行为.仿真验证表明DDMGS与直接投递路由、先知路由以及Simbet路由和Epidemic路由相比具有较好的性能,提高了消息传输成功率,减少了平均跳数,该算法是可行的.
2019, 56(11): 2506-2517.
DOI: 10.7544/issn1000-1239.2019.20180673
摘要:
近年来,异质网络中的社区发现逐渐成为人们关注的研究热点,然而现有大多数非重叠或重叠的社区发现方法都局限于考虑单一类型的网络结构,而无法适用于包含多模实体及其多维关系的异质网络,基于位置的社交网络(location based social network, LBSN)作为最近兴起的一种新型异质网络,如何有效发现其含有多维关系的复杂社区结构对现有研究来说是一个挑战性的难题.为此,提出了一种融合用户与位置实体及其多维关系的社区发现方法MRNMF(multi-relational nonnegative matrix factorization),该方法通过建立基于非负矩阵分解的联合聚类目标函数,并考虑融入用户社交关系、用户-位置签到关系以及兴趣点特征等多维度的影响因素,能同时获得紧密关联的用户模糊社区与兴趣点聚簇结构,以有效缓解推荐中的数据稀疏问题.在2种真实LBSN数据集上的实验结果表明,所提出的MRNMF方法同时在兴趣点与朋友这双重推荐上比其他传统方法具有更优越的推荐性能.
近年来,异质网络中的社区发现逐渐成为人们关注的研究热点,然而现有大多数非重叠或重叠的社区发现方法都局限于考虑单一类型的网络结构,而无法适用于包含多模实体及其多维关系的异质网络,基于位置的社交网络(location based social network, LBSN)作为最近兴起的一种新型异质网络,如何有效发现其含有多维关系的复杂社区结构对现有研究来说是一个挑战性的难题.为此,提出了一种融合用户与位置实体及其多维关系的社区发现方法MRNMF(multi-relational nonnegative matrix factorization),该方法通过建立基于非负矩阵分解的联合聚类目标函数,并考虑融入用户社交关系、用户-位置签到关系以及兴趣点特征等多维度的影响因素,能同时获得紧密关联的用户模糊社区与兴趣点聚簇结构,以有效缓解推荐中的数据稀疏问题.在2种真实LBSN数据集上的实验结果表明,所提出的MRNMF方法同时在兴趣点与朋友这双重推荐上比其他传统方法具有更优越的推荐性能.