计算机研究与发展 ›› 2015, Vol. 52 ›› Issue (9): 2025-2032.doi: 10.7544/issn1000-1239.2015.20140694
张兴忠1, 王运生1, 曾智2, 牛保宁1
Zhang Xingzhong1, Wang Yunsheng1, Zeng Zhi2, Niu Baoning1
摘要: 针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibonacci Hashing检索相比提高检索速度约130倍;并设计了一种基于阈值的固定间隔抽样匹配方法,大幅减少匹配计算量,进一步提高检索速度可达140倍.实验结果显示:使用该方法在约10万首音频中对不同时长的音频片段进行批量检索,平均检索时间均小于1s;对音频进行MP3转换、重采样、随机剪切后再检索,召回率均在99.47%以上,理论准确率接近100%.
中图分类号: