2019年 第56卷 第5期
摘要:
人工智能的迅速发展将深刻改变人类社会生活,改变世界。网络与人工智能的融合发展必将会在互联网学术界和产业界掀起一场革命,也必将给我国打造自主、可控、安全的新型互联网提供重要的历史机遇。人工智能开始越来越多地应用于网络领域,例如,网络管理,网络安全,网络优化,等等。网络与人工智能基础理论与关键技术为加快新一代互联网技术的发展、全面提升网络智能化水平、实现智能化网络提供了重要途径。基于以上背景,为促进网络与人工智能融合方面的研究与交流,《计算机研究与发展》推出了本期“智能网络理论与关键技术”专题,分别在多个方向上展示了网络与人工智能融合的相关研究问题、研究现状以及研究结果。本期专题共收录了6篇论文,分别涵盖了智能网络安全、智能网络数据分析技术、智能网络部署与优化问题等方面的研究主题,期望能够为从事相关研究工作的读者提供有益的参考。
人工智能的迅速发展将深刻改变人类社会生活,改变世界。网络与人工智能的融合发展必将会在互联网学术界和产业界掀起一场革命,也必将给我国打造自主、可控、安全的新型互联网提供重要的历史机遇。人工智能开始越来越多地应用于网络领域,例如,网络管理,网络安全,网络优化,等等。网络与人工智能基础理论与关键技术为加快新一代互联网技术的发展、全面提升网络智能化水平、实现智能化网络提供了重要途径。基于以上背景,为促进网络与人工智能融合方面的研究与交流,《计算机研究与发展》推出了本期“智能网络理论与关键技术”专题,分别在多个方向上展示了网络与人工智能融合的相关研究问题、研究现状以及研究结果。本期专题共收录了6篇论文,分别涵盖了智能网络安全、智能网络数据分析技术、智能网络部署与优化问题等方面的研究主题,期望能够为从事相关研究工作的读者提供有益的参考。
2019, 56(5): 909-918.
DOI: 10.7544/issn1000-1239.2019.20190017
摘要:
软件定义网络(software defined networking, SDN)解耦了网络的数据层与控制层,同时控制器也面临“单点失效”的危险.攻击者可以发起分布式拒绝服务攻击(distributed denial of service, DDoS)使控制器失效,影响网络安全.为解决SDN中的DDoS流量检测问题,创新性地提出了基于信息熵与深度神经网络(deep neural network, DNN)的DDoS检测模型.该模型包括基于信息熵的初检模块和基于深度神经网络DNN的DDoS流量检测模块.初检模块通过计算数据包源、目的IP地址的信息熵值初步发现网络中的可疑流量,并利用基于DNN的DDoS检测模块对疑似异常流量进行进一步确认,从而发现DDoS攻击.实验表明:该模型对DDoS流量的识别率达到99%以上,准确率也有显著提高,误报率明显优于基于信息熵的检测方法.同时,该模型还能缩短检测时间,提高资源使用效率.
软件定义网络(software defined networking, SDN)解耦了网络的数据层与控制层,同时控制器也面临“单点失效”的危险.攻击者可以发起分布式拒绝服务攻击(distributed denial of service, DDoS)使控制器失效,影响网络安全.为解决SDN中的DDoS流量检测问题,创新性地提出了基于信息熵与深度神经网络(deep neural network, DNN)的DDoS检测模型.该模型包括基于信息熵的初检模块和基于深度神经网络DNN的DDoS流量检测模块.初检模块通过计算数据包源、目的IP地址的信息熵值初步发现网络中的可疑流量,并利用基于DNN的DDoS检测模块对疑似异常流量进行进一步确认,从而发现DDoS攻击.实验表明:该模型对DDoS流量的识别率达到99%以上,准确率也有显著提高,误报率明显优于基于信息熵的检测方法.同时,该模型还能缩短检测时间,提高资源使用效率.
2019, 56(5): 919-928.
DOI: 10.7544/issn1000-1239.2019.20190016
摘要:
海洋观测数据的获取是海洋环境保护、防灾减灾、资源开发以及科学研究等的依托与保障.观测节点上传数据的请求的接入调度问题是海洋观测系统的重要研究内容,其根源在于观测节点对稀缺无线通信资源的争用.尽管目前已有大量研究,但是现有技术应用于观测节点快速移动接入上传数据时性能不尽人意.研究解决海量移动观测节点有效的上传接入控制方法迫在眉睫.基于移动接入请求抽象的时空动态模型以及截止时间内被调度的随机性的分析,研究解决保证观测数据延迟容忍且收益最大的移动接入优化调度问题.不幸的是,该问题是NP难的(详见定理1).因此,提出了一种基于动态规划思想的增强接入控制的近似算法(P-RSA)来解决该问题.首先,基于观测接入请求的历史数据分析并构建抽象其动态特征的时空数据模型;其次,基于“流”请求截止时间内经过AP通信覆盖区域的随机性分析,对其“未来收益”进行量化并将其引入优化目标;最后通过模拟实验对截止时间内在不同的AP负载条件下,基于“收益”这个泛化指标对移动接入调度性能进行评估,实验结果验证了该方法的有效性.
海洋观测数据的获取是海洋环境保护、防灾减灾、资源开发以及科学研究等的依托与保障.观测节点上传数据的请求的接入调度问题是海洋观测系统的重要研究内容,其根源在于观测节点对稀缺无线通信资源的争用.尽管目前已有大量研究,但是现有技术应用于观测节点快速移动接入上传数据时性能不尽人意.研究解决海量移动观测节点有效的上传接入控制方法迫在眉睫.基于移动接入请求抽象的时空动态模型以及截止时间内被调度的随机性的分析,研究解决保证观测数据延迟容忍且收益最大的移动接入优化调度问题.不幸的是,该问题是NP难的(详见定理1).因此,提出了一种基于动态规划思想的增强接入控制的近似算法(P-RSA)来解决该问题.首先,基于观测接入请求的历史数据分析并构建抽象其动态特征的时空数据模型;其次,基于“流”请求截止时间内经过AP通信覆盖区域的随机性分析,对其“未来收益”进行量化并将其引入优化目标;最后通过模拟实验对截止时间内在不同的AP负载条件下,基于“收益”这个泛化指标对移动接入调度性能进行评估,实验结果验证了该方法的有效性.
2019, 56(5): 929-941.
DOI: 10.7544/issn1000-1239.2019.20190012
摘要:
在考虑未知攻击和内部攻击条件下,为进一步提高最优渗透路径生成效率,提出一种智能高效的最优渗透路径生成方法.首先给出双层威胁渗透图(two-layer threat penetration graphs, TLTPG)模型,其下层为主机威胁渗透图(host threat penetration graph, HTPG),其上层为网络威胁渗透图(network threat penetration graph, NTPG);然后,基于知识图谱,构建主机资源知识图谱(host resource knowledge graph, HRKG),用于智能高效推理生成HTPG;进一步,利用HTPG,设计智能化的基于渗透信息交换的NTPG生成算法;最后依据TLTPG,设计任意2个主机间的最优渗透路径生成算法.实验结果表明:该方法能够描述未知攻击和内部攻击,且可提高最优渗透路径的生成效率.
在考虑未知攻击和内部攻击条件下,为进一步提高最优渗透路径生成效率,提出一种智能高效的最优渗透路径生成方法.首先给出双层威胁渗透图(two-layer threat penetration graphs, TLTPG)模型,其下层为主机威胁渗透图(host threat penetration graph, HTPG),其上层为网络威胁渗透图(network threat penetration graph, NTPG);然后,基于知识图谱,构建主机资源知识图谱(host resource knowledge graph, HRKG),用于智能高效推理生成HTPG;进一步,利用HTPG,设计智能化的基于渗透信息交换的NTPG生成算法;最后依据TLTPG,设计任意2个主机间的最优渗透路径生成算法.实验结果表明:该方法能够描述未知攻击和内部攻击,且可提高最优渗透路径的生成效率.
2019, 56(5): 942-954.
DOI: 10.7544/issn1000-1239.2019.20180877
摘要:
当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.
当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.
2019, 56(5): 955-966.
DOI: 10.7544/issn1000-1239.2019.20190019
摘要:
网络安全对于现代信息社会越来越重要,随之而来的是网络安全的代价也越来越高.如何在保证网络安全的前提下,尽可能降低网络安全的开销是一个挑战性的任务.基于不同的用户群体具有不同安全需求的事实,提出了根据用户安全等级不同而提供有差别的安全服务的模型DiffSec,论证了该模型能够有效降低网络安全服务开销和提升网络性能,能够适应网络安全技术长期发展的需要.基于该模型,采用NFV和SDN结合的技术设计了安全接入网络(SANet)的结构和相应的智能控制方法,实现了原型系统.原型系统的实验结果表明:SANet不仅能够提供灵活、正确的网络安全功能,也具有良好的网络性能和实用价值.
网络安全对于现代信息社会越来越重要,随之而来的是网络安全的代价也越来越高.如何在保证网络安全的前提下,尽可能降低网络安全的开销是一个挑战性的任务.基于不同的用户群体具有不同安全需求的事实,提出了根据用户安全等级不同而提供有差别的安全服务的模型DiffSec,论证了该模型能够有效降低网络安全服务开销和提升网络性能,能够适应网络安全技术长期发展的需要.基于该模型,采用NFV和SDN结合的技术设计了安全接入网络(SANet)的结构和相应的智能控制方法,实现了原型系统.原型系统的实验结果表明:SANet不仅能够提供灵活、正确的网络安全功能,也具有良好的网络性能和实用价值.
2019, 56(5): 967-976.
DOI: 10.7544/issn1000-1239.2019.20180866
摘要:
无线mesh网络的冗余式设计往往导致WiFi AP的带宽资源不能得到充分利用.由于无线广播的特性,报文会同时被多个节点所接收.在协作式网络中,这些冗余的WiFi AP可以作为辅助节点帮助其他链路进行数据传输.这种协作式路由在传统网络中给资源受限的WiFi AP带来了额外的通信和计算开销,从而实现较为困难.软件定义无线网络(software defined wireless networking, SDWN)集中式架构提供了辅助节点之间及辅助节点与控制器之间的通信机制,使得最佳辅助节点的全局化选择成为可能.在分析现有协作式路由的基础上,提出了基于软件定义无线网络协作式路由算法,其中路由发现由WiFi AP完成,而路由有效性验证、辅助节点的选取和链路干扰模型的更新等全局且计算负载较大的工作由软件定义无线网络中的控制器进行.通过对现有OpenFlow协议的扩展,在测试平台上验证并实现了基于软件定义无线网络的协作式路由.测试结果表明:该面向服务质量的协作式路由相比传统路由能够显著提高网络传输带宽和降低报文传输延迟.
无线mesh网络的冗余式设计往往导致WiFi AP的带宽资源不能得到充分利用.由于无线广播的特性,报文会同时被多个节点所接收.在协作式网络中,这些冗余的WiFi AP可以作为辅助节点帮助其他链路进行数据传输.这种协作式路由在传统网络中给资源受限的WiFi AP带来了额外的通信和计算开销,从而实现较为困难.软件定义无线网络(software defined wireless networking, SDWN)集中式架构提供了辅助节点之间及辅助节点与控制器之间的通信机制,使得最佳辅助节点的全局化选择成为可能.在分析现有协作式路由的基础上,提出了基于软件定义无线网络协作式路由算法,其中路由发现由WiFi AP完成,而路由有效性验证、辅助节点的选取和链路干扰模型的更新等全局且计算负载较大的工作由软件定义无线网络中的控制器进行.通过对现有OpenFlow协议的扩展,在测试平台上验证并实现了基于软件定义无线网络的协作式路由.测试结果表明:该面向服务质量的协作式路由相比传统路由能够显著提高网络传输带宽和降低报文传输延迟.
2019, 56(5): 977-991.
DOI: 10.7544/issn1000-1239.2019.20170979
摘要:
为了有效解决障碍空间中的不确定数据聚类的问题,引入计算几何中的Voronoi图对数据空间进行划分,提出障碍空间中基于Voronoi图的不确定数据聚类算法.根据Voronoi图的性质,提出4项聚类规则.利用KL距离进行相似性度量.根据障碍集合是否发生变化,提出了静态障碍环境下和动态障碍环境下的不确定数据聚类算法.理论研究和实验表明:静态障碍物环境中的不确定精炼聚类算法(简称STAO_RVUBSCAN算法)、障碍物动态增加情况下的不确定聚类算法(简称DYNOC_VUBSCAN算法)、障碍物动态减少情况下的不确定聚类算法(简称DYNOR_VUBSCAN算法)和障碍物动态移动情况下的不确定数据聚类算法(简称DYNOM_VUBSCAN算法)都具有较高的效率.
为了有效解决障碍空间中的不确定数据聚类的问题,引入计算几何中的Voronoi图对数据空间进行划分,提出障碍空间中基于Voronoi图的不确定数据聚类算法.根据Voronoi图的性质,提出4项聚类规则.利用KL距离进行相似性度量.根据障碍集合是否发生变化,提出了静态障碍环境下和动态障碍环境下的不确定数据聚类算法.理论研究和实验表明:静态障碍物环境中的不确定精炼聚类算法(简称STAO_RVUBSCAN算法)、障碍物动态增加情况下的不确定聚类算法(简称DYNOC_VUBSCAN算法)、障碍物动态减少情况下的不确定聚类算法(简称DYNOR_VUBSCAN算法)和障碍物动态移动情况下的不确定数据聚类算法(简称DYNOM_VUBSCAN算法)都具有较高的效率.
2019, 56(5): 992-1006.
DOI: 10.7544/issn1000-1239.2019.20180276
摘要:
序列是一种重要的数据类型,在诸多应用领域广泛存在.基于序列的特征选择具有广阔的现实应用场景.交互特征是指一组整体具有显著强于单独个体与目标相关性的特征集合.从大规模序列中挖掘交互特征面临着位点的“组合爆炸”问题,计算挑战性极大.针对该问题,以生物领域高通量测序数据为背景,提出了一种新的基于并行处理和演化计算的高阶交互特征挖掘算法.位点数是制约交互作用挖掘效率的根本因素.摈弃了现有方法基于序列分块的并行策略,采用基于位点分块的并行思想,具有天然的效率优势.进一步,提出了极大等位公共子序列(maximal allelic common subsequence, MACS)的概念并设计了基于MACS的特征区域划分策略.该策略能将交互特征的查找范围缩小至许多“碎片”空间,并保证不同“碎片”间不存在交互特征,避免计算耦合引起的高额通信代价.利用基于置换搜索的并行蚁群算法,执行交互特征选择.大量真实数据集和合成数据集上的实验结果,证实提出的PACOIFS算法在有效性和效率上优于同类其他算法.
序列是一种重要的数据类型,在诸多应用领域广泛存在.基于序列的特征选择具有广阔的现实应用场景.交互特征是指一组整体具有显著强于单独个体与目标相关性的特征集合.从大规模序列中挖掘交互特征面临着位点的“组合爆炸”问题,计算挑战性极大.针对该问题,以生物领域高通量测序数据为背景,提出了一种新的基于并行处理和演化计算的高阶交互特征挖掘算法.位点数是制约交互作用挖掘效率的根本因素.摈弃了现有方法基于序列分块的并行策略,采用基于位点分块的并行思想,具有天然的效率优势.进一步,提出了极大等位公共子序列(maximal allelic common subsequence, MACS)的概念并设计了基于MACS的特征区域划分策略.该策略能将交互特征的查找范围缩小至许多“碎片”空间,并保证不同“碎片”间不存在交互特征,避免计算耦合引起的高额通信代价.利用基于置换搜索的并行蚁群算法,执行交互特征选择.大量真实数据集和合成数据集上的实验结果,证实提出的PACOIFS算法在有效性和效率上优于同类其他算法.
2019, 56(5): 1007-1019.
DOI: 10.7544/issn1000-1239.2019.20180366
摘要:
现代化国家题库系统建设是教育考试改革发展的重要保障,也是促进我国教育考试现代化的重要手段.试题难度是入库试题的核心参数,对于命题、组卷、分数报告甚至是考试公平性保障都有着直接影响.由于我国国家考试的特点,很难通过类似国外考试机构的考前试测等方式提前获取试题难度参数,传统的试题难度评估任务通常由人工完成,即由命题专家对试题难度进行评估.这样的做法耗时耗力,且难以保证客观性,因此借助先进信息技术手段探索试题难度的自动化判断具有较大的研究意义,更是体现着中国特色教育考试背景下的中国智慧和中国解决方案.以利用试题文本和答题记录数据实现数据驱动的数学试题难度自动化预测模型为目标,提出了分别基于卷积神经网络(convolutional neural network, CNN)和循环神经网络(recurrent neural network, RNN)的数学试题难度预测模型C-MIDP(CNN for mathematical item difficulty prediction)和R-MIDP(RNN for mathematical item difficulty prediction),以及二者的混合模型H-MIDP(hybrid model for mathematical item difficulty prediction).具体地,利用所提出的模型直接学习试题文本表征,将考试试题得分率作为标签训练模型,整个过程不需要提供知识标注等教育先验信息.然后,考虑到不同考试中学生群体的不可比性,在训练时提出一种基于context的训练方式;最后,可通过输入试题特征到训练好的模型中进行难度预测.模型在真实的试题数据上取得了较好的实验结果.
现代化国家题库系统建设是教育考试改革发展的重要保障,也是促进我国教育考试现代化的重要手段.试题难度是入库试题的核心参数,对于命题、组卷、分数报告甚至是考试公平性保障都有着直接影响.由于我国国家考试的特点,很难通过类似国外考试机构的考前试测等方式提前获取试题难度参数,传统的试题难度评估任务通常由人工完成,即由命题专家对试题难度进行评估.这样的做法耗时耗力,且难以保证客观性,因此借助先进信息技术手段探索试题难度的自动化判断具有较大的研究意义,更是体现着中国特色教育考试背景下的中国智慧和中国解决方案.以利用试题文本和答题记录数据实现数据驱动的数学试题难度自动化预测模型为目标,提出了分别基于卷积神经网络(convolutional neural network, CNN)和循环神经网络(recurrent neural network, RNN)的数学试题难度预测模型C-MIDP(CNN for mathematical item difficulty prediction)和R-MIDP(RNN for mathematical item difficulty prediction),以及二者的混合模型H-MIDP(hybrid model for mathematical item difficulty prediction).具体地,利用所提出的模型直接学习试题文本表征,将考试试题得分率作为标签训练模型,整个过程不需要提供知识标注等教育先验信息.然后,考虑到不同考试中学生群体的不可比性,在训练时提出一种基于context的训练方式;最后,可通过输入试题特征到训练好的模型中进行难度预测.模型在真实的试题数据上取得了较好的实验结果.
2019, 56(5): 1020-1033.
DOI: 10.7544/issn1000-1239.2019.20180274
摘要:
蛋白质是细胞生命活动中最重要和最多样的一种大分子物质.因此,研究蛋白质功能对于破解生命密码具有重要的意义.以往的研究表明蛋白质功能预测问题本质上是一个多标签分类问题,但庞大的功能标签数量使得各种多标签分类器在蛋白质功能预测中的应用面临巨大挑战.针对蛋白质功能标签数量庞大且标签关联性较高的特点,提出了一种基于布尔矩阵分解的蛋白质功能预测框架(protein function prediction based on Boolean matrix decomposition, PFP-BMD).同时,针对目前布尔矩阵分解算法中精确分解和列利用条件难以同时满足的问题,提出一种基于标签簇的精确布尔矩阵分解算法,使其通过标签关联矩阵实现标签的层次扩展聚簇,并通过相关推论证明了该算法可实现最优的精确布尔矩阵分解.实验结果表明:提出的布尔矩阵分解算法在计算复杂度上具有较大优势,且应用了该算法的蛋白质功能预测框架可有效提升蛋白质功能预测的准确率,为各种多标签分类器在蛋白质功能预测中的高效应用奠定了基础.
蛋白质是细胞生命活动中最重要和最多样的一种大分子物质.因此,研究蛋白质功能对于破解生命密码具有重要的意义.以往的研究表明蛋白质功能预测问题本质上是一个多标签分类问题,但庞大的功能标签数量使得各种多标签分类器在蛋白质功能预测中的应用面临巨大挑战.针对蛋白质功能标签数量庞大且标签关联性较高的特点,提出了一种基于布尔矩阵分解的蛋白质功能预测框架(protein function prediction based on Boolean matrix decomposition, PFP-BMD).同时,针对目前布尔矩阵分解算法中精确分解和列利用条件难以同时满足的问题,提出一种基于标签簇的精确布尔矩阵分解算法,使其通过标签关联矩阵实现标签的层次扩展聚簇,并通过相关推论证明了该算法可实现最优的精确布尔矩阵分解.实验结果表明:提出的布尔矩阵分解算法在计算复杂度上具有较大优势,且应用了该算法的蛋白质功能预测框架可有效提升蛋白质功能预测的准确率,为各种多标签分类器在蛋白质功能预测中的高效应用奠定了基础.
2019, 56(5): 1034-1047.
DOI: 10.7544/issn1000-1239.2019.20180461
摘要:
随着电子商务网站的快速发展,数据特征和现实需求均发生了较大变化.以大规模、多源性、异构性为主要特征的数据发挥着更加重要的作用.然而,电子商务系统中数据所具有的特性使得大多数协同过滤方法较难直接用于物品推荐.如何整合多源异构数据来实现数据的价值最大化是当前推荐系统亟待解决的问题.针对这一问题,首先分析了多源异构数据中各类数据的特点,并根据各自特点为其设计了不同的建模方式.其次,提出一种新颖的推荐模型用于评分预测任务,它通过融合多关系数据和视觉信息来缓解数据稀疏问题.最后,设计了一种高效的算法MSRA(multi-source heterogeneous information based recommendation algorithm)用于求解所提模型的参数.在多个亚马逊数据集上的实验结果表明:1)面向多源异构数据的推荐算法其性能明显优于当前主流协同过滤算法; 2)该算法不仅可以有效缓解物品的冷启动问题,而且能够更好地预测不同类型物品的实际评分.
随着电子商务网站的快速发展,数据特征和现实需求均发生了较大变化.以大规模、多源性、异构性为主要特征的数据发挥着更加重要的作用.然而,电子商务系统中数据所具有的特性使得大多数协同过滤方法较难直接用于物品推荐.如何整合多源异构数据来实现数据的价值最大化是当前推荐系统亟待解决的问题.针对这一问题,首先分析了多源异构数据中各类数据的特点,并根据各自特点为其设计了不同的建模方式.其次,提出一种新颖的推荐模型用于评分预测任务,它通过融合多关系数据和视觉信息来缓解数据稀疏问题.最后,设计了一种高效的算法MSRA(multi-source heterogeneous information based recommendation algorithm)用于求解所提模型的参数.在多个亚马逊数据集上的实验结果表明:1)面向多源异构数据的推荐算法其性能明显优于当前主流协同过滤算法; 2)该算法不仅可以有效缓解物品的冷启动问题,而且能够更好地预测不同类型物品的实际评分.
2019, 56(5): 1048-1059.
DOI: 10.7544/issn1000-1239.2019.20180099
摘要:
异常检测算法在诸多领域都发挥着重要的作用.基于模糊C-均值(fuzzy C-means, FCM)的异常检测是其代表方法之一.FCM对初始值的选取很敏感,而且容易陷入局部极值.基于此的异常检测算法检测效果也不甚理想.因此,引入具有较强全局搜索能力的人工鱼群算法,对其加入自适应机制,自适应调整Visual取值范围,从而提高AFSA局部和全局寻优能力,减少算法迭代的次数.然后将其应用于FCM中,利用自适应人工鱼群算法得到的最优解进行FCM聚类分析,从而解决以上FCM存在的种种问题.最后,设计基于自适应人工鱼群FCM的异常检测算法,充分利用自适应人工鱼群的优势来提高异常检测算法的检测性能.实验表明:该算法在提高对数据的检测效率的基础上,检测性能也表现出了很好的水平,为解决异常检测模型中的检测率和虚警率相关问题提供了一种有效解决方案.
异常检测算法在诸多领域都发挥着重要的作用.基于模糊C-均值(fuzzy C-means, FCM)的异常检测是其代表方法之一.FCM对初始值的选取很敏感,而且容易陷入局部极值.基于此的异常检测算法检测效果也不甚理想.因此,引入具有较强全局搜索能力的人工鱼群算法,对其加入自适应机制,自适应调整Visual取值范围,从而提高AFSA局部和全局寻优能力,减少算法迭代的次数.然后将其应用于FCM中,利用自适应人工鱼群算法得到的最优解进行FCM聚类分析,从而解决以上FCM存在的种种问题.最后,设计基于自适应人工鱼群FCM的异常检测算法,充分利用自适应人工鱼群的优势来提高异常检测算法的检测性能.实验表明:该算法在提高对数据的检测效率的基础上,检测性能也表现出了很好的水平,为解决异常检测模型中的检测率和虚警率相关问题提供了一种有效解决方案.
2019, 56(5): 1060-1070.
DOI: 10.7544/issn1000-1239.2019.20180185
摘要:
现有的噪声水平估计(noise level estimation, NLE)算法通常采取先将图像内容信号与噪声信号分离,然后基于分离出的噪声信号估计出图像噪声水平值的实现策略.由于仅有噪声图像本身的信息可以利用,这些算法为保证噪声分离的准确性设计了各种复杂的处理过程,导致其执行效率偏低.为此,提出一种新的基于卷积神经网络噪声分离模型的NLE算法.首先,对大量原始无失真图像施加不同噪声水平的高斯噪声获得噪声图像集合,然后利用卷积神经网络构建一个专门从噪声图像中分离噪声信号获得噪声映射图(noise mapping)的预测模型.考虑到噪声映射图的系数值具有类高斯分布特性,利用广义高斯分布(generalized Gaussian distribution, GGD)模型对噪声映射图建模并以模型参数值作为反映图像噪声水平高低的特征值.最后,利用改进的BP神经网络将该特征值映射为最终的噪声水平预测值.大量实验数据表明:所提出的NLE算法在预测准确度和执行效率2个方面的综合性能优于现有的NLE算法,更具实用价值.
现有的噪声水平估计(noise level estimation, NLE)算法通常采取先将图像内容信号与噪声信号分离,然后基于分离出的噪声信号估计出图像噪声水平值的实现策略.由于仅有噪声图像本身的信息可以利用,这些算法为保证噪声分离的准确性设计了各种复杂的处理过程,导致其执行效率偏低.为此,提出一种新的基于卷积神经网络噪声分离模型的NLE算法.首先,对大量原始无失真图像施加不同噪声水平的高斯噪声获得噪声图像集合,然后利用卷积神经网络构建一个专门从噪声图像中分离噪声信号获得噪声映射图(noise mapping)的预测模型.考虑到噪声映射图的系数值具有类高斯分布特性,利用广义高斯分布(generalized Gaussian distribution, GGD)模型对噪声映射图建模并以模型参数值作为反映图像噪声水平高低的特征值.最后,利用改进的BP神经网络将该特征值映射为最终的噪声水平预测值.大量实验数据表明:所提出的NLE算法在预测准确度和执行效率2个方面的综合性能优于现有的NLE算法,更具实用价值.
2019, 56(5): 1071-1081.
DOI: 10.7544/issn1000-1239.2019.20180463
摘要:
随着在线视频应用的流行,互联网上的视频数量快速增长.面对互联网上海量的视频,人们对视频检索的要求也越来越精细化.如何按照合适的语义概念对视频进行组织和管理,从而帮助用户更高效、更准确地获取所需视频,成为亟待解决的问题.在大量的应用场景下,需要声音和视觉同时出现才能确定某个视频事件.因此,提出具有视听信息的多模态概念的检测工作.首先,以名词-动词二元组的形式定义多模态概念,其中名词表达了视觉信息,动词表达了听觉信息,且名词和动词具有语义相关性,共同表达语义概念所描述的事件.其次,利用卷积神经网络,以多模态概念的视听相关性为目标训练多模态联合网络,进行端到端的多模态概念检测.实验表明:在多模态概念检测任务上,通过视听相关的联合网络的性能超过了单独的视觉网络和听觉网络.同时,联合网络能够学习到精细化的特征表示,利用该网络提取的视觉特征,在Huawei视频数据集某些特定的类别上超过ImageNet预训练的神经网络特征;联合网络提取的音频特征,在ESC50数据集上,也超过在Youtube8m上训练的神经网络音频特征约5.7%.
随着在线视频应用的流行,互联网上的视频数量快速增长.面对互联网上海量的视频,人们对视频检索的要求也越来越精细化.如何按照合适的语义概念对视频进行组织和管理,从而帮助用户更高效、更准确地获取所需视频,成为亟待解决的问题.在大量的应用场景下,需要声音和视觉同时出现才能确定某个视频事件.因此,提出具有视听信息的多模态概念的检测工作.首先,以名词-动词二元组的形式定义多模态概念,其中名词表达了视觉信息,动词表达了听觉信息,且名词和动词具有语义相关性,共同表达语义概念所描述的事件.其次,利用卷积神经网络,以多模态概念的视听相关性为目标训练多模态联合网络,进行端到端的多模态概念检测.实验表明:在多模态概念检测任务上,通过视听相关的联合网络的性能超过了单独的视觉网络和听觉网络.同时,联合网络能够学习到精细化的特征表示,利用该网络提取的视觉特征,在Huawei视频数据集某些特定的类别上超过ImageNet预训练的神经网络特征;联合网络提取的音频特征,在ESC50数据集上,也超过在Youtube8m上训练的神经网络音频特征约5.7%.
2019, 56(5): 1082-1091.
DOI: 10.7544/issn1000-1239.2019.20180471
摘要:
在语种识别中,当训练语音与测试语音长度失配时,系统的识别性能会出现严重下降.基于降噪自动编码器(denoising auto-encoder, DAE)的方法对不同长度测试语音的语种特征进行补偿,把不同长度的语音特征都映射为固定长度的语音特征,一定程度上解决了长度失配和音素分配不平衡的问题.具体分为4个环节:1)语音信号经过分帧、变换得到底层声学特征;2)提取语音信号的原始i-vector,同时计算其音素向量;3)对原始i-vector和音素向量进行拼接,送入基于DAE的语种特征补偿处理单元得到补偿后的i-vector;4)将补偿后的i-vector和原始i-vector分别送入后端分类器得到2个分数向量,并将其在得分域融合后进行判决.在NIST-LRE07上的实验结果表明:所提出的语种特征补偿算法在各种测试语音时长上的识别性能均有提升.相比传统的语种识别系统,测试语音时长为30 s时性能相对提升3.16%,测试语音时长为10 s时性能相对提升2.90%.相比端到端语种识别系统,测试语音时长为3 s时性能相对提升3.21%.
在语种识别中,当训练语音与测试语音长度失配时,系统的识别性能会出现严重下降.基于降噪自动编码器(denoising auto-encoder, DAE)的方法对不同长度测试语音的语种特征进行补偿,把不同长度的语音特征都映射为固定长度的语音特征,一定程度上解决了长度失配和音素分配不平衡的问题.具体分为4个环节:1)语音信号经过分帧、变换得到底层声学特征;2)提取语音信号的原始i-vector,同时计算其音素向量;3)对原始i-vector和音素向量进行拼接,送入基于DAE的语种特征补偿处理单元得到补偿后的i-vector;4)将补偿后的i-vector和原始i-vector分别送入后端分类器得到2个分数向量,并将其在得分域融合后进行判决.在NIST-LRE07上的实验结果表明:所提出的语种特征补偿算法在各种测试语音时长上的识别性能均有提升.相比传统的语种识别系统,测试语音时长为30 s时性能相对提升3.16%,测试语音时长为10 s时性能相对提升2.90%.相比端到端语种识别系统,测试语音时长为3 s时性能相对提升3.21%.
2019, 56(5): 1092-1100.
DOI: 10.7544/issn1000-1239.2019.20180472
摘要:
图片问答是计算机视觉与自然语言处理交叉的多模态学习任务.为了解决该任务,研究人员提出堆叠注意力网络(stacked attention networks, SANs).研究发现该模型易陷入不好的局部最优解,引发较高的问答错误率.为了解决该问题,提出基于图片问答的静态重启随机梯度下降算法.实验结果和分析表明:它的准确率比基准算法提高0.29%,但其收敛速度慢于基准算法.为了验证改善性能的显著性,对实验结果进行统计假设检验.T检验结果证明它的改善性能是极其显著的.为了验证它在同类算法中的有效性,将该算法和当前最好的一阶优化算法进行有效性实验,实验结果和分析证明它更有效.为了验证它的泛化性能和推广价值,在经典的Cifar-10数据集上进行图像识别实验.实验结果和T检验结果证明:它具有良好的泛化性能和较好的推广价值.
图片问答是计算机视觉与自然语言处理交叉的多模态学习任务.为了解决该任务,研究人员提出堆叠注意力网络(stacked attention networks, SANs).研究发现该模型易陷入不好的局部最优解,引发较高的问答错误率.为了解决该问题,提出基于图片问答的静态重启随机梯度下降算法.实验结果和分析表明:它的准确率比基准算法提高0.29%,但其收敛速度慢于基准算法.为了验证改善性能的显著性,对实验结果进行统计假设检验.T检验结果证明它的改善性能是极其显著的.为了验证它在同类算法中的有效性,将该算法和当前最好的一阶优化算法进行有效性实验,实验结果和分析证明它更有效.为了验证它的泛化性能和推广价值,在经典的Cifar-10数据集上进行图像识别实验.实验结果和T检验结果证明:它具有良好的泛化性能和较好的推广价值.
2019, 56(5): 1101-1111.
DOI: 10.7544/issn1000-1239.2019.20180130
摘要:
多重签密是指2个以上参与方对同一则消息进行签密,并且要求签密结果不能因为签密者数目增多而呈线性增长.普通的ElGamal型多重签名虽然具有不可伪造性,但不能抵制多个签名者的联合攻击.为了克服现有ElGamal型多重签名的缺点,将ElGamal型多重签名和公钥签密组合在一起研究.提出了一种新的ElGamal型广播多重签密(ElGamal broadcasting multi-signcryption, EBMSC)协议,并给出了该协议的算法定义和安全模型,也在随机预言模型中证明了该协议在离散对数和计算性Diffie-Hellman假设下是语义安全的;然后在通用可复合框架下定义了ElGamal型广播多重签密协议的理想函数和现实协议,进而证明了现实协议能够实现广播多重签密协议的理想功能,同时还证明了现实协议是满足选择消息攻击下的不可伪造性;最后给出了ElGamal型广播多重签密协议与其他协议的效率比较.结果表明:该协议不仅在效率上要优于现有方案,而且在通用可复合框架下实现了多重签密功能.该协议适合应用在电子商务、合同签署、网上交易和财务出账等方面.
多重签密是指2个以上参与方对同一则消息进行签密,并且要求签密结果不能因为签密者数目增多而呈线性增长.普通的ElGamal型多重签名虽然具有不可伪造性,但不能抵制多个签名者的联合攻击.为了克服现有ElGamal型多重签名的缺点,将ElGamal型多重签名和公钥签密组合在一起研究.提出了一种新的ElGamal型广播多重签密(ElGamal broadcasting multi-signcryption, EBMSC)协议,并给出了该协议的算法定义和安全模型,也在随机预言模型中证明了该协议在离散对数和计算性Diffie-Hellman假设下是语义安全的;然后在通用可复合框架下定义了ElGamal型广播多重签密协议的理想函数和现实协议,进而证明了现实协议能够实现广播多重签密协议的理想功能,同时还证明了现实协议是满足选择消息攻击下的不可伪造性;最后给出了ElGamal型广播多重签密协议与其他协议的效率比较.结果表明:该协议不仅在效率上要优于现有方案,而且在通用可复合框架下实现了多重签密功能.该协议适合应用在电子商务、合同签署、网上交易和财务出账等方面.
2019, 56(5): 1112-1122.
DOI: 10.7544/issn1000-1239.2019.20180217
摘要:
窄带物联网(narrowband Internet of things, NB-IoT)是互联网中的一个重要分支.NB-IoT依托云计算强大的资源处理能力提供应用层的各项服务以及实现信息智能化.然而由于数据异地存储,云平台服务提供商并不完全可信,用户数据暴露在不完全安全的环境下,带来了诸多安全问题,比如被外部用户恶意攻击、云服务器共谋攻击等.针对NB-IoT终端节点极易受到攻击、资源不足、功耗受限等问题,提出一种基于属性的云存储快速访问控制方案.在多个属性授权机构的背景下,以高效可验证的轻量级加密方案为目标,借鉴在线/离线加密思想,并结合外包解密技术,构造了具备选择明文攻击(chosen-plaintext attack, CPA)安全的在线/离线加密和外包解密的多机构密文策略属性基加密方案(online/offline and outsourced multi-authority ciphertext-policy attribute-based encryptin scheme, OO-MA-CP-ABE),提高加解密算法效率的同时最小化用户的计算开销,很适合计算能力弱且资源受限的终端设备.并进一步通过验证算法确保外包计算的正确性.还给出了云计算环境下轻量级NB-IoT应用系统安全性分析,保证资源共享过程中,灵活可扩展的访问控制策略以及用户数据的机密性和隐私保护.最后,给出了OO-MA-CP-ABE方案的性能分析,从功能性、计算开销和通信开销3个方面同现有方案进行比较.
窄带物联网(narrowband Internet of things, NB-IoT)是互联网中的一个重要分支.NB-IoT依托云计算强大的资源处理能力提供应用层的各项服务以及实现信息智能化.然而由于数据异地存储,云平台服务提供商并不完全可信,用户数据暴露在不完全安全的环境下,带来了诸多安全问题,比如被外部用户恶意攻击、云服务器共谋攻击等.针对NB-IoT终端节点极易受到攻击、资源不足、功耗受限等问题,提出一种基于属性的云存储快速访问控制方案.在多个属性授权机构的背景下,以高效可验证的轻量级加密方案为目标,借鉴在线/离线加密思想,并结合外包解密技术,构造了具备选择明文攻击(chosen-plaintext attack, CPA)安全的在线/离线加密和外包解密的多机构密文策略属性基加密方案(online/offline and outsourced multi-authority ciphertext-policy attribute-based encryptin scheme, OO-MA-CP-ABE),提高加解密算法效率的同时最小化用户的计算开销,很适合计算能力弱且资源受限的终端设备.并进一步通过验证算法确保外包计算的正确性.还给出了云计算环境下轻量级NB-IoT应用系统安全性分析,保证资源共享过程中,灵活可扩展的访问控制策略以及用户数据的机密性和隐私保护.最后,给出了OO-MA-CP-ABE方案的性能分析,从功能性、计算开销和通信开销3个方面同现有方案进行比较.
2019, 56(5): 1123-1131.
DOI: 10.7544/issn1000-1239.2019.20180191
摘要:
针对外包求解大规模线性方程组问题,在完全恶意模型中提出一种新的高效低存储开销可验证外包求解大规模线性方程组(efficient verifiable outsourcing of solving large-scale linear equations with low storage overhead, EVLE-LS)方案.首先利用严格对角优势矩阵和伪随机数生成器,构造了伪随机可逆稀疏矩阵生成算法.又将该算法与稀疏矩阵对稠密矩阵的编码解码过程相结合,给出了新的外包线性方程组方案.该方案只需要用户与服务器进行一轮交互,用户检测出云服务器的恶意行为的概率为1,实现完全可验证.此外,与之前已有的需要昂贵存储开销的方案相比,该方案在保证安全性的前提下将用户所需存储开销降到了常数级.最后将方案与其他3种方案进行对比,说明该方案在效率、可验证性和存储开销方面均优于已有方案.
针对外包求解大规模线性方程组问题,在完全恶意模型中提出一种新的高效低存储开销可验证外包求解大规模线性方程组(efficient verifiable outsourcing of solving large-scale linear equations with low storage overhead, EVLE-LS)方案.首先利用严格对角优势矩阵和伪随机数生成器,构造了伪随机可逆稀疏矩阵生成算法.又将该算法与稀疏矩阵对稠密矩阵的编码解码过程相结合,给出了新的外包线性方程组方案.该方案只需要用户与服务器进行一轮交互,用户检测出云服务器的恶意行为的概率为1,实现完全可验证.此外,与之前已有的需要昂贵存储开销的方案相比,该方案在保证安全性的前提下将用户所需存储开销降到了常数级.最后将方案与其他3种方案进行对比,说明该方案在效率、可验证性和存储开销方面均优于已有方案.