计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (7): 1498-1507.doi: 10.7544/issn1000-1239.2018.20180078
所属专题: 2018物联网安全专题
陈昱1,2,3,刘中金4,赵威威5,马原1,2,3,石志强1,2,3,孙利民1,2,3
Chen Yu1,2,3, Liu Zhongjin4, Zhao Weiwei5, Ma Yuan1,2,3, Shi Zhiqiang1,2,3, Sun Limin1,2,3
摘要: 近年来由于代码的交叉复用,同源二进制文件广泛存在于物联网设备固件中.当某个固件被爆出漏洞二进制文件时,则包含该同源二进制文件的其他固件也将处于高风险中.因此同源二进制文件检索对于物联网固件的安全分析与应急响应具有重要意义.然而,目前缺少一种大规模且有效的针对嵌入式设备二进制文件的大规检索方法.传统的基于“一对一”关联匹配的同源检索方法的时间复杂度是O(N),不能满足大规模同源检索的需求.设计和实现了一种时间复杂度为O(lgN)的面向物联网设备固件的同源二进制文件检索方法.该方法的核心思想是通过深度学习网络编码二进制文件中的可读字符串,然后对编码向量生成局部敏感Hash从而实现快速检索.按照16种不同的编译参数编译了893个开源组件,共生成71 129对带标签的二进制文件来训练和测试网络模型.结果表明:该方法的ROC特性好于传统方法.此外,实际应用案例表明:该方法只需不到1 s的时间即可完成一次针对22 594个固件的同源二进制文件检索任务.
中图分类号: