计算机研究与发展 ›› 2020, Vol. 57 ›› Issue (4): 767-777.doi: 10.7544/issn1000-1239.2020.20190870
所属专题: 2020数据驱动网络专题
孙骞1,2,薛雷琦2,高岭2,3, 王海2,王宇翔1
Sun Qian1,2, Xue Leiqi2, Gao Ling2,3, Wang Hai2, Wang Yuxiang1
摘要: 网络防御策略是决定网络安全防护效果的关键因素,现有的网络防御决策研究的是完全理性前提条件以及攻防效益函数参数选择等方面,对实际网络攻防中信息不对称、法律惩戒等因素存在模型偏差,降低了策略的实用性与可靠性.结合实际问题,在有限理性的前置条件基础上构建禁忌随机博弈模型,引入了禁忌搜索方法对随机博弈进行有限理性的分析,并设计具有记忆功能的搜索方法,通过禁忌表数据结构实现记忆功能,并利用数据驱动的记忆结合博弈模型得出最优防御策略.实验结果表明:该方法在攻防收益量化方面提高了精准度,防御效益相对于现有典型的方法提高了准确度,方法空间复杂度优于强化学习等典型方法.
中图分类号: