ISSN 1000-1239 CN 11-1777/TP

    2020数据驱动网络专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 2020数据驱动网络专题前言
    崔勇, 马华东, 陈凯, 俞敏岚, 刘洪强
    计算机研究与发展    2020, 57 (4): 669-670.   doi: 10.7544/issn1000-1239.2020.qy0401
    录用日期: 2020-04-01

    摘要748)   HTML53)    PDF (215KB)(358)   

         随着互联网的快速发展,作为互联网底层支撑的网络技术也面临着诸多挑战. 在线上业务极速发展的背景下,各类应用层出不穷,底层网络需要不断升级以满足应用的需求. 在大数据的时代,海量数据能为网络的优化提供有效反馈,为网络技术的提升注入了新的动力同时近年来机器学习技术的兴起,为网络领域带来了新的技术思维. 换言之,网络技术的发展同样也面临着新的机遇.

         为了分享国内学者在网络技术方面的最新研究成果,推动国内网络领域新兴技术的交流,加强我国在数据与网络结合方面的研究,《计算机研究与发展》推出了此次数据驱动网络专题. 本期专题共录用了10篇论文,分别展示了网络加速机器学习、机器学习加速网络以及基于数据进行网络优化等方面的研究现状和最新成果. 希望本期的论文能为相关领域的研究提供一些启发和帮助.
    相关文章 | 计量指标
    2. 基于机器学习的智能路由算法综述
    刘辰屹, 徐明伟, 耿男, 张翔
    计算机研究与发展    2020, 57 (4): 671-687.   doi: 10.7544/issn1000-1239.2020.20190866
    摘要2966)   HTML110)    PDF (2198KB)(2217)   
    互联网的飞速发展催生了很多新型网络应用,其中包括实时多媒体流服务、远程云服务等.现有尽力而为的路由转发算法难以满足这些应用所带来的多样化的网络服务质量需求.随着近些年将机器学习方法应用于游戏、计算机视觉、自然语言处理获得了巨大的成功,很多人尝试基于机器学习方法去设计智能路由算法.相比于传统数学模型驱动的分布式路由算法而言,基于机器学习的路由算法通常是数据驱动的,这使得其能够适应动态变化的网络环境以及多样的性能评价指标优化需求.基于机器学习的数据驱动智能路由算法目前已经展示出了巨大的潜力,未来很有希望成为下一代互联网的重要组成部分.然而现有对于智能路由的研究仍然处于初步阶段.首先介绍了现有数据驱动智能路由算法的相关研究,展现了这些方法的核心思想和应用场景并分析了这些工作的优势与不足.分析表明,现有基于机器学习的智能路由算法研究主要针对算法原理,这些路由算法距离真实环境下部署仍然很遥远.因此接下来分析了不同的真实场景智能路由算法训练和部署方案并提出了2种合理的训练部署框架以使得智能路由算法能够低成本、高可靠性地在真实场景被部署.最后分析了基于机器学习的智能路由算法未来发展中所面临的机遇与挑战并给出了未来的研究方向.
    相关文章 | 计量指标
    3. 机器学习在SDN路由优化中的应用研究综述
    王桂芝, 吕光宏, 贾吾财, 贾创辉, 张建申
    计算机研究与发展    2020, 57 (4): 688-698.   doi: 10.7544/issn1000-1239.2020.20190837
    摘要1255)   HTML47)    PDF (1513KB)(946)   
    随着网络技术的迅速发展和新型应用的不断出现,网络数据的急剧增加导致网络管理变得极其复杂.传统网络中的设备多种多样,配置复杂,难于管理,而软件定义网络(software defined networking, SDN)这种新型网络架构的出现给网络管理带来了曙光,该架构摆脱了硬件设备对网络的限制,使网络具有灵活、可编程性等优点.一个好的路由机制影响着整个网络的性能,软件定义网络的集中控制特性给机器学习在路由机制方面的应用带来了新的研究方向.首先论述了SDN路由优化的现状,然后从监督学习和强化学习2个方面概述了近年来机器学习在SDN路由方面的研究,最后为了满足不同应用的服务质量(quality of service, QoS)以及不同用户的体验质量(quality of experience, QoE),提出了数据驱动认知路由的发展趋势.通过赋予网络节点感知、记忆、查找、决策、推理、解释等认知行为,加快寻路过程,优化路由选择,完善网络管理.
    相关文章 | 计量指标
    4. 异构YANG模型驱动的网络领域知识图谱构建
    董永强, 王鑫, 刘永博, 杨望
    计算机研究与发展    2020, 57 (4): 699-708.   doi: 10.7544/issn1000-1239.2020.20190882
    摘要1196)   HTML31)    PDF (4066KB)(562)   
    随着网络规模持续扩大,复杂且异构的网络环境给网络的自动化配置管理带来了严峻的挑战,现有的网络智能化运维方案缺少知识层面的统一数据模型,难以有效进行网络大数据处理.YANG作为一种数据建模语言,用于对网络配置管理协议NETCONF传输的配置与状态数据进行建模.提出一种YANG模型驱动的网络领域知识图谱构建方案,该方案基于YANG语言规范,提出网络知识本体构建的基本原则,形成包含51个类、70余种属性的本体结构;随后对来自不同标准化组织和厂商的异构YANG模型,进行数据抽取和实例化生成单源知识图谱,进而利用YANG模型之间存在的异构共指特性,采用实体对齐方法建立模型间的语义映射关系,形成网络领域知识图谱.该知识图谱可为网络运维大数据的生成与维护提供统一的语义框架,无须再进行手工的运维本体构建,从而极大地简化网络的配置管理与运行维护,为网络性能优化和异常检测等运维难题提供新的解决思路.
    相关文章 | 计量指标
    5. 面向异构IoT设备协作的DNN推断加速研究
    孙胜, 李叙晶, 刘敏, 杨博, 过晓冰
    计算机研究与发展    2020, 57 (4): 709-722.   doi: 10.7544/issn1000-1239.2020.20190863
    摘要699)   HTML16)    PDF (2695KB)(321)   
    深度神经网络(deep neural network, DNN)已经广泛应用于各种智能应用,如图像和视频识别.然而,由于DNN任务计算量大,资源受限的物联网(Internet of things, IoT)设备难以本地单独执行DNN推断任务.现有云协助方法容易受到通信延迟无法预测和远程服务器性能不稳定等因素的影响.一种非常有前景的方法是利用IoT设备协作实现分布式、可扩展DNN任务推断.然而,现有工作仅研究IoT设备同构情况下的静态拆分策略.因此,迫切需要研究如何在能力异构且资源受限的IoT设备间自适应地拆分DNN任务,协作执行任务推断.上述研究问题面临2个重要挑战:1)DNN任务多层推断延迟难以准确预测;2)难以在异构动态的多设备环境中实时智能调整协作推断策略.为此,首先提出细粒度可解释的多层延迟预测模型.进一步,利用进化增强学习(evolutionary reinforcement learning, ERL)自适应确定DNN推断任务的近似最优拆分策略.实验结果表明:该方法能够在异构动态环境中实现显著DNN推断加速.
    相关文章 | 计量指标
    6. 公交数据驱动的城市车联网转发机制
    唐晓岚, 顼尧, 陈文龙
    计算机研究与发展    2020, 57 (4): 723-735.   doi: 10.7544/issn1000-1239.2020.20190876
    摘要567)   HTML16)    PDF (2736KB)(216)   
    在城市车联网中,由于交通状况复杂多变和出行路线多样性等特点,网络拓扑动态变化,车辆之间通信链路不稳定,影响着车联网数据传输性能.作为城市中重要的公共交通设施,公交车具有固定的行驶路线和发车时间,且公交线路广泛覆盖城市街道.与私家车相比,公交车是更好的数据携带者和转发者,有助于实现更可靠的车车通信.为此,提出公交数据驱动的城市车联网转发机制,简称BUF,旨在通过分析公交线路数据,选择合适的公交车做为转发节点,提高城市车联网数据传输效率.首先构建公交站点拓扑图,以目标场景中所有公交站点为顶点,在公交线路连续通过的站点之间连边,依据2个站点之间的预期公交车数量和距离计算边权值,进而使用迪杰斯特拉算法计算由源站点到目的站点的最优传输路径.为保证数据沿最优路径传输,优先选择与最优路径的后续站点重合度大于零的邻居骨干公交做为转发节点,且重合度越大越优先转发;当不存在骨干公交时,选择后续将经过期望的下一站点的邻居公交为转发节点,称为候补公交.针对不存在骨干公交和候补公交的场景,利用私家车建立多跳链路来寻找合适的公交转发节点,从而加速数据转发.使用北京市真实路网和公交线路数据的实验结果表明:与其他方案相比,BUF机制实现了更高的数据传输率和更短的传输时延.
    相关文章 | 计量指标
    7. 面向低维工控网数据集的对抗样本攻击分析
    周文, 张世琨, 丁勇, 陈曦
    计算机研究与发展    2020, 57 (4): 736-745.   doi: 10.7544/issn1000-1239.2020.20190844
    摘要615)   HTML27)    PDF (1903KB)(254)   
    针对工业控制系统的网络攻击日趋增加,凸显工业控制网络入侵异常检测的必需性.研究工作者已经提出了各种基于机器学习算法的工控网流量异常检测模型,然而对抗样本攻击阻碍了机器学习模型的广泛应用.目前关于对抗样本攻击的成果集中在特征丰富的数据集上.然而,工控系统由于网络拓扑结构相对固定,所以数据集特征较少.针对一个低维(特征少)的天然气工控网数据集,通过实验分析4个常见优化算法SGD,RMSProp,AdaDelta和Adam与对抗样本攻击能力的关系,分析典型机器学习算法防御对抗样本攻击的能力,并研究对抗训练对提高深度学习算法抗对抗样本白盒攻击的能力.此外,提出了一个新指标“同比损失率”来评估对抗样本的白盒攻击能力.大量实验结果表明:对于这个低维数据集,优化算法确实影响了对抗样本的白盒攻击能力;对抗样本对各典型机器学习算法具有黑盒攻击能力;和决策树、随机森林,支持向量机、AdaBoost、逻辑回归、卷积神经网络(CNN)等典型分类器相比,循环神经网络(RNN)具有最强的防对抗样本黑盒攻击能力;此外,对抗样本训练能够提高深度学习模型防御对抗样本白盒攻击的能力.
    相关文章 | 计量指标
    8. 基于深度神经网络burst特征分析的网站指纹攻击方法
    马陈城, 杜学绘, 曹利峰, 吴蓓
    计算机研究与发展    2020, 57 (4): 746-766.   doi: 10.7544/issn1000-1239.2020.20190860
    摘要958)   HTML34)    PDF (3969KB)(671)   
    以Tor为代表的匿名网络是一种隐匿用户数据传输行为的通信中介网络.不法分子利用匿名网络从事网络犯罪,对网络监管造成了极大的困难.网站指纹攻击技术是破解匿名通信的可行技术,可用于发现基于匿名网络秘密访问敏感网站的内网用户行为,是网络监管的重要手段.神经网络在网站指纹攻击技术上的应用突破了传统方法的性能瓶颈,但现有的研究未充分考虑根据突发流量(burst)特征等Tor流量特征对神经网络结构进行设计,存在网络过于复杂和分析模块冗余导致特征提取和分析不彻底、运行缓慢等问题.在对Tor流量特征进行研究和分析的基础上,设计了轻便的基于一维卷积网络的burst特征提取和分析模块,提出了基于深度神经网络分析burst特征的网站指纹攻击方法.进一步,针对在开放世界场景中仅使用阈值法简单分析指纹向量的不足,设计了基于随机森林算法的指纹向量分析模型.改进后的模型分类准确率达到了99.87%,在缓解概念漂移、绕过网站指纹攻击防御机制、识别Tor隐藏网站、小样本训练模型和运行速度等方面均有优异的性能表现,提高了网站指纹攻击技术应用到真实网络的可实践性.
    相关文章 | 计量指标
    9. 基于随机博弈与禁忌搜索的网络防御策略选取
    孙骞, 薛雷琦, 高岭, 王海, 王宇翔
    计算机研究与发展    2020, 57 (4): 767-777.   doi: 10.7544/issn1000-1239.2020.20190870
    摘要533)   HTML17)    PDF (1861KB)(247)   
    网络防御策略是决定网络安全防护效果的关键因素,现有的网络防御决策研究的是完全理性前提条件以及攻防效益函数参数选择等方面,对实际网络攻防中信息不对称、法律惩戒等因素存在模型偏差,降低了策略的实用性与可靠性.结合实际问题,在有限理性的前置条件基础上构建禁忌随机博弈模型,引入了禁忌搜索方法对随机博弈进行有限理性的分析,并设计具有记忆功能的搜索方法,通过禁忌表数据结构实现记忆功能,并利用数据驱动的记忆结合博弈模型得出最优防御策略.实验结果表明:该方法在攻防收益量化方面提高了精准度,防御效益相对于现有典型的方法提高了准确度,方法空间复杂度优于强化学习等典型方法.
    相关文章 | 计量指标
    10. 面向云数据中心多语法日志通用异常检测机制
    张圣林, 李东闻, 孙永谦, 孟伟彬, 张宇哲, 张玉志, 刘莹, 裴丹
    计算机研究与发展    2020, 57 (4): 778-790.   doi: 10.7544/issn1000-1239.2020.20190875
    摘要709)   HTML21)    PDF (3113KB)(367)   
    得益于自然语言处理和机器学习方法的快速发展,基于日志对云数据中心软硬件系统进行自动异常检测变得越来越流行.无监督学习方法不需要标记异常日志,但通常存在准确性较低、仍需标注大量正常日志的问题.尽管有监督学习方法的准确性较高,但由于不同软硬件系统产生不同类型的、语法各异的日志,导致有监督学习方法需要为每一类型日志标注足够多的异常日志以训练相应的异常检测模型,这极大地增加了标注异常日志的人力成本.与此同时,不同类型日志在发生异常时往往具有相同或相似的语义.因此,提出了一种跨日志类型的通用异常检测机制——LogMerge.该机制通过学习多语法日志的语义相似性,可实现日志异常模式的跨日志类型迁移,从而大大减少了异常标注开销.LogMerge采用词嵌入方法先后构建单词和模板的向量,然后使用聚类方法将语义相同或相近的模板聚成一类,解决了不同类型日志语法不同带来的挑战.此外,LogMerge结合CNN与LSTM方法构建异常检测模型,既有效提取了日志序列的前后依赖性,又显著降低了日志序列中噪声带来的影响.使用公开日志数据集的实验表明,相比于当前的有监督学习方法和无监督学习方法,LogMerge取得了更高的准确性.实验还验证了LogMerge能够显著减少异常标注工作量——在目标类型日志异常标注较少时,依然能够取得较高的准确性.
    相关文章 | 计量指标
    11. 基于半监督学习的无线网络攻击行为检测优化方法
    王婷, 王娜, 崔运鹏, 李欢
    计算机研究与发展    2020, 57 (4): 791-802.   doi: 10.7544/issn1000-1239.2020.20190880
    摘要749)   HTML42)    PDF (2130KB)(403)   
    针对如何优化深度学习技术在海量高维复杂的无线网络流量数据中有效发现异常攻击行为的问题,提出一种基于半监督学习的无线网络攻击行为检测优化方法(WiFi network attacks detection optimization method, WiFi-ADOM).首先基于无监督学习模型栈式稀疏自编码器提出2种网络流量特征表示向量:新特征值向量和原始特征权重值向量.然后利用原始特征权重值向量初始化监督学习模型深度神经网络的权重值得到网络攻击类型的预判结果,并通过无监督学习聚类方法Bi-kmeans对网络流量的新特征值向量进行聚类以生成未知攻击类型判别纠正项.最后结合预判结果和未知攻击类型判别纠正项,得到网络攻击类型的最终判定结果.通过和已有研究方法对比,在公开无线网络攻击行为数据集AWID上验证了WiFi-ADOM方法对网络攻击行为检测的优化性能,同时探索了与网络攻击检测相关的重要特征属性的问题.实验结果表明:WiFi-ADOM方法在保证准确率等检测性能的同时能够有效检测未知攻击类型,具备优化网络攻击行为检测的能力.
    相关文章 | 计量指标