Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2020年 第57卷 第4期    出版日期:2020-04-01
网络技术
2020数据驱动网络专题前言
崔勇, 马华东, 陈凯, 俞敏岚, 刘洪强
2020, 57(4):  669-670.  doi:10.7544/issn1000-1239.2020.qy0401
摘要 ( 665 )   HTML ( 51)   PDF (215KB) ( 343 )  
相关文章 | 计量指标

     随着互联网的快速发展,作为互联网底层支撑的网络技术也面临着诸多挑战. 在线上业务极速发展的背景下,各类应用层出不穷,底层网络需要不断升级以满足应用的需求. 在大数据的时代,海量数据能为网络的优化提供有效反馈,为网络技术的提升注入了新的动力同时近年来机器学习技术的兴起,为网络领域带来了新的技术思维. 换言之,网络技术的发展同样也面临着新的机遇.

     为了分享国内学者在网络技术方面的最新研究成果,推动国内网络领域新兴技术的交流,加强我国在数据与网络结合方面的研究,《计算机研究与发展》推出了此次数据驱动网络专题. 本期专题共录用了10篇论文,分别展示了网络加速机器学习、机器学习加速网络以及基于数据进行网络优化等方面的研究现状和最新成果. 希望本期的论文能为相关领域的研究提供一些启发和帮助.
基于机器学习的智能路由算法综述
刘辰屹, 徐明伟, 耿男, 张翔
2020, 57(4):  671-687.  doi:10.7544/issn1000-1239.2020.20190866
摘要 ( 2773 )   HTML ( 104)   PDF (2198KB) ( 1907 )  
相关文章 | 计量指标
互联网的飞速发展催生了很多新型网络应用,其中包括实时多媒体流服务、远程云服务等.现有尽力而为的路由转发算法难以满足这些应用所带来的多样化的网络服务质量需求.随着近些年将机器学习方法应用于游戏、计算机视觉、自然语言处理获得了巨大的成功,很多人尝试基于机器学习方法去设计智能路由算法.相比于传统数学模型驱动的分布式路由算法而言,基于机器学习的路由算法通常是数据驱动的,这使得其能够适应动态变化的网络环境以及多样的性能评价指标优化需求.基于机器学习的数据驱动智能路由算法目前已经展示出了巨大的潜力,未来很有希望成为下一代互联网的重要组成部分.然而现有对于智能路由的研究仍然处于初步阶段.首先介绍了现有数据驱动智能路由算法的相关研究,展现了这些方法的核心思想和应用场景并分析了这些工作的优势与不足.分析表明,现有基于机器学习的智能路由算法研究主要针对算法原理,这些路由算法距离真实环境下部署仍然很遥远.因此接下来分析了不同的真实场景智能路由算法训练和部署方案并提出了2种合理的训练部署框架以使得智能路由算法能够低成本、高可靠性地在真实场景被部署.最后分析了基于机器学习的智能路由算法未来发展中所面临的机遇与挑战并给出了未来的研究方向.
机器学习在SDN路由优化中的应用研究综述
王桂芝, 吕光宏, 贾吾财, 贾创辉, 张建申
2020, 57(4):  688-698.  doi:10.7544/issn1000-1239.2020.20190837
摘要 ( 1145 )   HTML ( 46)   PDF (1513KB) ( 801 )  
相关文章 | 计量指标
随着网络技术的迅速发展和新型应用的不断出现,网络数据的急剧增加导致网络管理变得极其复杂.传统网络中的设备多种多样,配置复杂,难于管理,而软件定义网络(software defined networking, SDN)这种新型网络架构的出现给网络管理带来了曙光,该架构摆脱了硬件设备对网络的限制,使网络具有灵活、可编程性等优点.一个好的路由机制影响着整个网络的性能,软件定义网络的集中控制特性给机器学习在路由机制方面的应用带来了新的研究方向.首先论述了SDN路由优化的现状,然后从监督学习和强化学习2个方面概述了近年来机器学习在SDN路由方面的研究,最后为了满足不同应用的服务质量(quality of service, QoS)以及不同用户的体验质量(quality of experience, QoE),提出了数据驱动认知路由的发展趋势.通过赋予网络节点感知、记忆、查找、决策、推理、解释等认知行为,加快寻路过程,优化路由选择,完善网络管理.
异构YANG模型驱动的网络领域知识图谱构建
董永强, 王鑫, 刘永博, 杨望
2020, 57(4):  699-708.  doi:10.7544/issn1000-1239.2020.20190882
摘要 ( 1083 )   HTML ( 30)   PDF (4066KB) ( 432 )  
相关文章 | 计量指标
随着网络规模持续扩大,复杂且异构的网络环境给网络的自动化配置管理带来了严峻的挑战,现有的网络智能化运维方案缺少知识层面的统一数据模型,难以有效进行网络大数据处理.YANG作为一种数据建模语言,用于对网络配置管理协议NETCONF传输的配置与状态数据进行建模.提出一种YANG模型驱动的网络领域知识图谱构建方案,该方案基于YANG语言规范,提出网络知识本体构建的基本原则,形成包含51个类、70余种属性的本体结构;随后对来自不同标准化组织和厂商的异构YANG模型,进行数据抽取和实例化生成单源知识图谱,进而利用YANG模型之间存在的异构共指特性,采用实体对齐方法建立模型间的语义映射关系,形成网络领域知识图谱.该知识图谱可为网络运维大数据的生成与维护提供统一的语义框架,无须再进行手工的运维本体构建,从而极大地简化网络的配置管理与运行维护,为网络性能优化和异常检测等运维难题提供新的解决思路.
面向异构IoT设备协作的DNN推断加速研究
孙胜, 李叙晶, 刘敏, 杨博, 过晓冰
2020, 57(4):  709-722.  doi:10.7544/issn1000-1239.2020.20190863
摘要 ( 605 )   HTML ( 14)   PDF (2695KB) ( 276 )  
相关文章 | 计量指标
深度神经网络(deep neural network, DNN)已经广泛应用于各种智能应用,如图像和视频识别.然而,由于DNN任务计算量大,资源受限的物联网(Internet of things, IoT)设备难以本地单独执行DNN推断任务.现有云协助方法容易受到通信延迟无法预测和远程服务器性能不稳定等因素的影响.一种非常有前景的方法是利用IoT设备协作实现分布式、可扩展DNN任务推断.然而,现有工作仅研究IoT设备同构情况下的静态拆分策略.因此,迫切需要研究如何在能力异构且资源受限的IoT设备间自适应地拆分DNN任务,协作执行任务推断.上述研究问题面临2个重要挑战:1)DNN任务多层推断延迟难以准确预测;2)难以在异构动态的多设备环境中实时智能调整协作推断策略.为此,首先提出细粒度可解释的多层延迟预测模型.进一步,利用进化增强学习(evolutionary reinforcement learning, ERL)自适应确定DNN推断任务的近似最优拆分策略.实验结果表明:该方法能够在异构动态环境中实现显著DNN推断加速.
公交数据驱动的城市车联网转发机制
唐晓岚, 顼尧, 陈文龙
2020, 57(4):  723-735.  doi:10.7544/issn1000-1239.2020.20190876
摘要 ( 501 )   HTML ( 15)   PDF (2736KB) ( 197 )  
相关文章 | 计量指标
在城市车联网中,由于交通状况复杂多变和出行路线多样性等特点,网络拓扑动态变化,车辆之间通信链路不稳定,影响着车联网数据传输性能.作为城市中重要的公共交通设施,公交车具有固定的行驶路线和发车时间,且公交线路广泛覆盖城市街道.与私家车相比,公交车是更好的数据携带者和转发者,有助于实现更可靠的车车通信.为此,提出公交数据驱动的城市车联网转发机制,简称BUF,旨在通过分析公交线路数据,选择合适的公交车做为转发节点,提高城市车联网数据传输效率.首先构建公交站点拓扑图,以目标场景中所有公交站点为顶点,在公交线路连续通过的站点之间连边,依据2个站点之间的预期公交车数量和距离计算边权值,进而使用迪杰斯特拉算法计算由源站点到目的站点的最优传输路径.为保证数据沿最优路径传输,优先选择与最优路径的后续站点重合度大于零的邻居骨干公交做为转发节点,且重合度越大越优先转发;当不存在骨干公交时,选择后续将经过期望的下一站点的邻居公交为转发节点,称为候补公交.针对不存在骨干公交和候补公交的场景,利用私家车建立多跳链路来寻找合适的公交转发节点,从而加速数据转发.使用北京市真实路网和公交线路数据的实验结果表明:与其他方案相比,BUF机制实现了更高的数据传输率和更短的传输时延.
面向低维工控网数据集的对抗样本攻击分析
周文, 张世琨, 丁勇, 陈曦
2020, 57(4):  736-745.  doi:10.7544/issn1000-1239.2020.20190844
摘要 ( 562 )   HTML ( 27)   PDF (1903KB) ( 231 )  
相关文章 | 计量指标
针对工业控制系统的网络攻击日趋增加,凸显工业控制网络入侵异常检测的必需性.研究工作者已经提出了各种基于机器学习算法的工控网流量异常检测模型,然而对抗样本攻击阻碍了机器学习模型的广泛应用.目前关于对抗样本攻击的成果集中在特征丰富的数据集上.然而,工控系统由于网络拓扑结构相对固定,所以数据集特征较少.针对一个低维(特征少)的天然气工控网数据集,通过实验分析4个常见优化算法SGD,RMSProp,AdaDelta和Adam与对抗样本攻击能力的关系,分析典型机器学习算法防御对抗样本攻击的能力,并研究对抗训练对提高深度学习算法抗对抗样本白盒攻击的能力.此外,提出了一个新指标“同比损失率”来评估对抗样本的白盒攻击能力.大量实验结果表明:对于这个低维数据集,优化算法确实影响了对抗样本的白盒攻击能力;对抗样本对各典型机器学习算法具有黑盒攻击能力;和决策树、随机森林,支持向量机、AdaBoost、逻辑回归、卷积神经网络(CNN)等典型分类器相比,循环神经网络(RNN)具有最强的防对抗样本黑盒攻击能力;此外,对抗样本训练能够提高深度学习模型防御对抗样本白盒攻击的能力.
基于深度神经网络burst特征分析的网站指纹攻击方法
马陈城, 杜学绘, 曹利峰, 吴蓓
2020, 57(4):  746-766.  doi:10.7544/issn1000-1239.2020.20190860
摘要 ( 865 )   HTML ( 32)   PDF (3969KB) ( 629 )  
相关文章 | 计量指标
以Tor为代表的匿名网络是一种隐匿用户数据传输行为的通信中介网络.不法分子利用匿名网络从事网络犯罪,对网络监管造成了极大的困难.网站指纹攻击技术是破解匿名通信的可行技术,可用于发现基于匿名网络秘密访问敏感网站的内网用户行为,是网络监管的重要手段.神经网络在网站指纹攻击技术上的应用突破了传统方法的性能瓶颈,但现有的研究未充分考虑根据突发流量(burst)特征等Tor流量特征对神经网络结构进行设计,存在网络过于复杂和分析模块冗余导致特征提取和分析不彻底、运行缓慢等问题.在对Tor流量特征进行研究和分析的基础上,设计了轻便的基于一维卷积网络的burst特征提取和分析模块,提出了基于深度神经网络分析burst特征的网站指纹攻击方法.进一步,针对在开放世界场景中仅使用阈值法简单分析指纹向量的不足,设计了基于随机森林算法的指纹向量分析模型.改进后的模型分类准确率达到了99.87%,在缓解概念漂移、绕过网站指纹攻击防御机制、识别Tor隐藏网站、小样本训练模型和运行速度等方面均有优异的性能表现,提高了网站指纹攻击技术应用到真实网络的可实践性.
基于随机博弈与禁忌搜索的网络防御策略选取
孙骞, 薛雷琦, 高岭, 王海, 王宇翔
2020, 57(4):  767-777.  doi:10.7544/issn1000-1239.2020.20190870
摘要 ( 456 )   HTML ( 15)   PDF (1861KB) ( 219 )  
相关文章 | 计量指标
网络防御策略是决定网络安全防护效果的关键因素,现有的网络防御决策研究的是完全理性前提条件以及攻防效益函数参数选择等方面,对实际网络攻防中信息不对称、法律惩戒等因素存在模型偏差,降低了策略的实用性与可靠性.结合实际问题,在有限理性的前置条件基础上构建禁忌随机博弈模型,引入了禁忌搜索方法对随机博弈进行有限理性的分析,并设计具有记忆功能的搜索方法,通过禁忌表数据结构实现记忆功能,并利用数据驱动的记忆结合博弈模型得出最优防御策略.实验结果表明:该方法在攻防收益量化方面提高了精准度,防御效益相对于现有典型的方法提高了准确度,方法空间复杂度优于强化学习等典型方法.
面向云数据中心多语法日志通用异常检测机制
张圣林, 李东闻, 孙永谦, 孟伟彬, 张宇哲, 张玉志, 刘莹, 裴丹
2020, 57(4):  778-790.  doi:10.7544/issn1000-1239.2020.20190875
摘要 ( 629 )   HTML ( 21)   PDF (3113KB) ( 306 )  
相关文章 | 计量指标
得益于自然语言处理和机器学习方法的快速发展,基于日志对云数据中心软硬件系统进行自动异常检测变得越来越流行.无监督学习方法不需要标记异常日志,但通常存在准确性较低、仍需标注大量正常日志的问题.尽管有监督学习方法的准确性较高,但由于不同软硬件系统产生不同类型的、语法各异的日志,导致有监督学习方法需要为每一类型日志标注足够多的异常日志以训练相应的异常检测模型,这极大地增加了标注异常日志的人力成本.与此同时,不同类型日志在发生异常时往往具有相同或相似的语义.因此,提出了一种跨日志类型的通用异常检测机制——LogMerge.该机制通过学习多语法日志的语义相似性,可实现日志异常模式的跨日志类型迁移,从而大大减少了异常标注开销.LogMerge采用词嵌入方法先后构建单词和模板的向量,然后使用聚类方法将语义相同或相近的模板聚成一类,解决了不同类型日志语法不同带来的挑战.此外,LogMerge结合CNN与LSTM方法构建异常检测模型,既有效提取了日志序列的前后依赖性,又显著降低了日志序列中噪声带来的影响.使用公开日志数据集的实验表明,相比于当前的有监督学习方法和无监督学习方法,LogMerge取得了更高的准确性.实验还验证了LogMerge能够显著减少异常标注工作量——在目标类型日志异常标注较少时,依然能够取得较高的准确性.
基于半监督学习的无线网络攻击行为检测优化方法
王婷, 王娜, 崔运鹏, 李欢
2020, 57(4):  791-802.  doi:10.7544/issn1000-1239.2020.20190880
摘要 ( 660 )   HTML ( 38)   PDF (2130KB) ( 373 )  
相关文章 | 计量指标
针对如何优化深度学习技术在海量高维复杂的无线网络流量数据中有效发现异常攻击行为的问题,提出一种基于半监督学习的无线网络攻击行为检测优化方法(WiFi network attacks detection optimization method, WiFi-ADOM).首先基于无监督学习模型栈式稀疏自编码器提出2种网络流量特征表示向量:新特征值向量和原始特征权重值向量.然后利用原始特征权重值向量初始化监督学习模型深度神经网络的权重值得到网络攻击类型的预判结果,并通过无监督学习聚类方法Bi-kmeans对网络流量的新特征值向量进行聚类以生成未知攻击类型判别纠正项.最后结合预判结果和未知攻击类型判别纠正项,得到网络攻击类型的最终判定结果.通过和已有研究方法对比,在公开无线网络攻击行为数据集AWID上验证了WiFi-ADOM方法对网络攻击行为检测的优化性能,同时探索了与网络攻击检测相关的重要特征属性的问题.实验结果表明:WiFi-ADOM方法在保证准确率等检测性能的同时能够有效检测未知攻击类型,具备优化网络攻击行为检测的能力.
信息安全
涌现视角下的网络空间安全挑战
屈蕾蕾, 肖若瑾, 石文昌, 梁彬, 秦波
2020, 57(4):  803-823.  doi:10.7544/issn1000-1239.2020.20190379
摘要 ( 464 )   HTML ( 10)   PDF (1781KB) ( 234 )  
相关文章 | 计量指标
网络空间的安全性属于涌现属性,该属性给网络空间安全带来了严峻的挑战.国内外已有不少研究者关注网络空间安全的涌现现象,迄今已取得不少成果.然而,人们对网络空间安全涌现性的认识还非常不足.针对这一状况,从涌现性的视角对网络空间安全挑战进行全面考察,旨在促进网络空间安全新思想、新理论的发展.首先,从系统科学中的涌现性的本意出发,揭示网络空间安全涌现性的基本思想;其次,从攻击、漏洞和防御3个角度,考察网络空间中存在的涌现式安全挑战;然后,按描述性、指导性和操作性3种类型,分析网络空间安全涌现性研究的发展状况;最后,从基础理论、基本模型和实用工具3个方面,讨论开展未来工作的基本途径.
访问驱动下的Cache侧信道攻击研究综述
苗新亮, 蒋烈辉, 常瑞
2020, 57(4):  824-835.  doi:10.7544/issn1000-1239.2020.20190581
摘要 ( 604 )   HTML ( 28)   PDF (1953KB) ( 477 )  
相关文章 | 计量指标
近年来,海量异构的物联网终端设备承载着核心功能,更易成为攻击者的直接目标.Cache侧信道攻击越来越多地出现在终端设备和云平台中,该攻击通过构建细粒度、高隐蔽性的Cache侧信道从目标设备中提取加密密钥等敏感数据,打破设备的隔离保护机制.在综述中,针对访问驱动下的Cache侧信道攻击技术展开研究,介绍了Cache侧信道攻击技术的基本原理和研究现状,通过理论分析和实例验证的方式重点研究了“清除+重载”攻击、“填充+探测”攻击、“刷新+重载”攻击的攻击原理、攻击过程和攻击效果.以攻击特点、攻击范围和对应的防御方案为切入点,对上述3种攻击进行对比分析,指出不同攻击的优缺点和适用场景;进一步探讨攻击过程中存在的问题,提出了攻击最后一级缓存(last-level cache, LLC)和噪声处理方面面临的挑战.最后结合万物互联时代下,从Cache层次结构的逐步转变、云平台的海量数据存储、以及终端设备上可信应用环境的广泛部署等现状,讨论了未来可能的研究方向.
基于区块链的网络安全威胁情报共享模型
黄克振, 连一峰, 冯登国, 张海霞, 刘玉岭, 马向亮
2020, 57(4):  836-846.  doi:10.7544/issn1000-1239.2020.20190404
摘要 ( 1338 )   HTML ( 57)   PDF (3685KB) ( 854 )  
相关文章 | 计量指标
在不断加剧的网络安全攻防对抗过程中,攻防双方存在着天然的不对称性,网络安全威胁情报共享利用是一种有效提高防护方响应能力和效果的手段.然而威胁情报共享利用中的隐私保护需求与构建完整攻击链的需求之间存在矛盾.针对上述矛盾点,提出一种基于区块链的网络安全威胁情报共享模型,利用了区块链技术的账户匿名性和不可篡改性,使用单向加密函数保护情报中的隐私信息,基于加密后的情报构建完整攻击链,借助区块链的回溯能力完成攻击链中攻击源的解密.最后,通过实验验证了该模型的可行性和有效性.
基于本地差分隐私的空间范围查询方法
张啸剑, 付楠, 孟小峰
2020, 57(4):  847-858.  doi:10.7544/issn1000-1239.2020.20190360
摘要 ( 462 )   HTML ( 14)   PDF (5032KB) ( 250 )  
相关文章 | 计量指标
基于本地差分隐私的用户数据收集与分析得到了研究者的广泛关注.用户数据的值域大小、编码机制以及扰动机制直接制约着空间范围查询的精度.针对现有编码机制与扰动机制难以有效响应空间范围查询的不足,提出了一种基于网格分割与四分树索引的空间范围查询响应方法GT-R(grid-based quadtree range query),该方法利用网格对用户数据的值域进行均匀分割,产生大小均等的单元格区域.同时利用四分树结构对所有单元格区域进行索引.每个用户结合服务器共享的四分树副本,对所拥有的数据进行编码.借助于编码后的四分树进行层次随机采样,并利用优化随机应答机制对所采层次中的结点进行本地扰动处理.服务器利用每个用户的报告值重构四分树索引结构,并响应空间范围查询.GT-R与现有的编码机制与扰动机制在真实的大规模空间数据集上实验结果表明,其分割精度以及响应范围查询效果优于同类算法.
图形图像
基于深度学习的场景分割算法研究综述
张蕊, 李锦涛
2020, 57(4):  859-875.  doi:10.7544/issn1000-1239.2020.20190513
摘要 ( 1176 )   HTML ( 68)   PDF (4042KB) ( 747 )  
相关文章 | 计量指标
场景分割的目标是判断场景图像中每个像素的类别.场景分割是计算机视觉领域重要的基本问题之一,对场景图像的分析和理解具有重要意义,同时在自动驾驶、视频监控、增强现实等诸多领域具有广泛的应用价值.近年来,基于深度学习的场景分割技术取得了突破性进展,与传统场景分割算法相比获得分割精度的大幅度提升.首先分析和描述场景分割问题面临的3个主要难点:分割粒度细、尺度变化多样、空间相关性强;其次着重介绍了目前大部分基于深度学习的场景分割算法采用的“卷积-反卷积”结构;在此基础上,对近年来出现的基于深度学习的场景分割算法进行梳理,介绍针对场景分割问题的3个主要难点,分别提出基于高分辨率语义特征图、基于多尺度信息和基于空间上下文等场景分割算法;简要介绍常用的场景分割公开数据集;最后对基于深度学习的场景分割算法的研究前景进行总结和展望.
基于类别相关的领域自适应交通图像语义分割方法
贾颖霞, 郎丛妍, 冯松鹤
2020, 57(4):  876-887.  doi:10.7544/issn1000-1239.2020.20190475
摘要 ( 525 )   HTML ( 25)   PDF (2589KB) ( 331 )  
相关文章 | 计量指标
图像语义分割作为机器视觉领域一个重要研究问题,其目的是对一张彩色图像中的每个像素点进行分类,将图像中每个像素预测其对应的语义标签.现有的基于全监督学习的语义分割方法依赖于精准标注的训练样本;现有的基于弱监督、半监督学习的分割方法虽然可以融入未标记样本,但由于缺少对空间语义信息的有效利用,常出现语义不一致或类别错分现象,且难以直接应用于其他的跨域无标注数据集.针对跨域无标注数据集语义分割问题,提出一种基于领域自适应的图像语义分割方法.其中,提出的方法首先通过采用优化上采样方法和提出基于focal loss的损失函数,有效改进了现有方法中数据量较小的类别难以被正确分割的问题;其次,通过有效利用所提出的类别相关的领域自适应方法,来解决不同数据集跨域语义分割问题,使无标注图像的语义分割平均交并比较现有方法的均值提升6%.提出的方法在5个数据集上进行验证实验,实验结果充分表明了方法的有效性和泛化性.
最小熵迁移对抗散列方法
卓君宝, 苏驰, 王树徽, 黄庆明
2020, 57(4):  888-896.  doi:10.7544/issn1000-1239.2020.20190476
摘要 ( 368 )   HTML ( 8)   PDF (2278KB) ( 128 )  
相关文章 | 计量指标
散列算法具有高效的存储和查询特性,被广泛应用于大规模的图像检索.大多数现有的深度散列方法都基于独立同分布的假设,即训练集(源域)和测试集(目标域)的分布一致.然而在现实应用中,源域和目标域往往存在较大的差异,即跨域检索.因此有些研究工作开始将跨域识别的方法引入到跨域检索中,以增强所学散列函数的泛化性.现有跨域检索方法仍存在散列码的判别力不足和域不变能力不足2个问题.提出语义保持模块和最小熵损失来解决这2个问题.语义保持模块是1个分类子网络,该模块可以充分利用源域的类别标注信息,并将该语义信息传递给散列学习子网络使得学习到的散列码包含更多的语义信息,即增强判别力.此外,对于无标注的目标域,熵表征目标域样本的分类响应的集中程度,理想的散列码经过语义保持模块后得到的分类响应应该集中于某一个类别,即最小熵状态.引入最小熵损失促使目标域样本与源域样本在类别响应这一空间上分布更加对齐,进而使得散列码更具域不变性.通过引入语义保持模块和最小熵损失,在现有方法的基础上构建了端到端的跨域检索网络,并在2个数据集上进行了大量实验,与领域内现有主要模型进行了详尽的对比,实验证明所提模型取得了更优的性能.