• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于降噪自动编码器的语种特征补偿方法

苗晓晓, 徐及, 王剑

苗晓晓, 徐及, 王剑. 基于降噪自动编码器的语种特征补偿方法[J]. 计算机研究与发展, 2019, 56(5): 1082-1091. DOI: 10.7544/issn1000-1239.2019.20180471
引用本文: 苗晓晓, 徐及, 王剑. 基于降噪自动编码器的语种特征补偿方法[J]. 计算机研究与发展, 2019, 56(5): 1082-1091. DOI: 10.7544/issn1000-1239.2019.20180471
Miao Xiaoxiao, Xu Ji, Wang Jian. Denoising Autoencoder-Based Language Feature Compensation[J]. Journal of Computer Research and Development, 2019, 56(5): 1082-1091. DOI: 10.7544/issn1000-1239.2019.20180471
Citation: Miao Xiaoxiao, Xu Ji, Wang Jian. Denoising Autoencoder-Based Language Feature Compensation[J]. Journal of Computer Research and Development, 2019, 56(5): 1082-1091. DOI: 10.7544/issn1000-1239.2019.20180471
苗晓晓, 徐及, 王剑. 基于降噪自动编码器的语种特征补偿方法[J]. 计算机研究与发展, 2019, 56(5): 1082-1091. CSTR: 32373.14.issn1000-1239.2019.20180471
引用本文: 苗晓晓, 徐及, 王剑. 基于降噪自动编码器的语种特征补偿方法[J]. 计算机研究与发展, 2019, 56(5): 1082-1091. CSTR: 32373.14.issn1000-1239.2019.20180471
Miao Xiaoxiao, Xu Ji, Wang Jian. Denoising Autoencoder-Based Language Feature Compensation[J]. Journal of Computer Research and Development, 2019, 56(5): 1082-1091. CSTR: 32373.14.issn1000-1239.2019.20180471
Citation: Miao Xiaoxiao, Xu Ji, Wang Jian. Denoising Autoencoder-Based Language Feature Compensation[J]. Journal of Computer Research and Development, 2019, 56(5): 1082-1091. CSTR: 32373.14.issn1000-1239.2019.20180471

基于降噪自动编码器的语种特征补偿方法

基金项目: 国家重点研发计划项目(2016YFB0801203,2016YFB0801200)
详细信息
  • 中图分类号: TN912.3; TP18

Denoising Autoencoder-Based Language Feature Compensation

  • 摘要: 在语种识别中,当训练语音与测试语音长度失配时,系统的识别性能会出现严重下降.基于降噪自动编码器(denoising auto-encoder, DAE)的方法对不同长度测试语音的语种特征进行补偿,把不同长度的语音特征都映射为固定长度的语音特征,一定程度上解决了长度失配和音素分配不平衡的问题.具体分为4个环节:1)语音信号经过分帧、变换得到底层声学特征;2)提取语音信号的原始i-vector,同时计算其音素向量;3)对原始i-vector和音素向量进行拼接,送入基于DAE的语种特征补偿处理单元得到补偿后的i-vector;4)将补偿后的i-vector和原始i-vector分别送入后端分类器得到2个分数向量,并将其在得分域融合后进行判决.在NIST-LRE07上的实验结果表明:所提出的语种特征补偿算法在各种测试语音时长上的识别性能均有提升.相比传统的语种识别系统,测试语音时长为30 s时性能相对提升3.16%,测试语音时长为10 s时性能相对提升2.90%.相比端到端语种识别系统,测试语音时长为3 s时性能相对提升3.21%.
    Abstract: Language identification (LID) accuracy is often significantly reduced when the duration of the test data and the training data are mismatched. This paper proposes a method to compensate language features using a denoising autoencoder (DAE). Use of denoising autoencoder-based language feature compensation can map language features from variable length utterances into a fixed length representation. Therefore the problem of length mismatch and unbalanced phoneme distribution can be mitigated. The algorithm first converts the speech signal to low level acoustic features by framing and transforming, and then estimates its i-vector and phonetic vector. These two vectors are then concatenated and fed into the DAE-based language feature compensation processing unit. The compensated i-vector from the output of the DAE, and the original i-vector, are presented to the back-end classifier to obtain two score vectors. These two score vectors are finally fused at a score level to obtain a final result. Tests on NIST-LRE07 demonstrate that this feature compensation method improves identification performance over various test speech durations. Compared with traditional LID systems, the performance for 30 s test utterances improves by 3.16%, while the performance for 10 s test utterances improves by 2.90%. Compared with the end-to-end LID system, the performance on 3 s test utterances is increased by 3.21%.
  • 期刊类型引用(12)

    1. 郭锋,刘飞洋,刘鸽. LoongArch处理器存储管理技术研究与实现. 电脑编程技巧与维护. 2025(03): 82-84 . 百度学术
    2. 邢世远,张见齐,王焕东,吴学智,吴瑞阳. 片间互连总线协议层关键技术研究. 高技术通讯. 2025(02): 113-123 . 百度学术
    3. 舒燕君,郑翔宇,徐成华,黄沛,王永琪,周凡,张展,左德承. 面向LoongArch边界检查访存指令的GCC优化. 计算机研究与发展. 2025(05): 1136-1150 . 本站查看
    4. 孙东华,刘亚冬. 基于龙芯3A5000的全国产化EtherCAT主站控制器设计. 现代信息科技. 2025(08): 16-19+24 . 百度学术
    5. 谢汶兵,田雪,漆锋滨,武成岗,王俊,罗巧玲. 二进制翻译技术综述. 软件学报. 2024(06): 2687-2723 . 百度学术
    6. 谢君,陈汉云,袁璐,张梦娇,王增,石锐. 基于信创的医院自助服务系统建设探索. 中国数字医学. 2024(07): 41-45+69 . 百度学术
    7. 谭弘泽,王剑. 基于动态压缩的高存储效率末级分支目标缓冲. 高技术通讯. 2024(07): 671-680 . 百度学术
    8. 刘登峰,李东亚,柴志雷,周浩杰,丁海峰. 基于QEMU的SIMD指令替换浮点指令框架. 湖南大学学报(自然科学版). 2024(08): 70-77 . 百度学术
    9. 陈国良,汤晓宇,尤帅,姚小良,梅超君,林时俊,刘尚东,吴少刚,孙雅薇,王汝传,季一木. 基于国产处理器的智能大数据一体机架构及应用研究. 南京邮电大学学报(自然科学版). 2024(04): 1-16 . 百度学术
    10. 贾金成,朱家鑫,唐震,王志鹏,王伟. 映射字典导向的64位ARM到RISC-V汇编翻译. 小型微型计算机系统. 2024(08): 2041-2048 . 百度学术
    11. 游英杰,刘宣佑,唐文武,张统兵,王岩. 基于CPU的PCIe驱动及与DSP和FPGA的交互设计. 火控雷达技术. 2024(04): 88-93+123 . 百度学术
    12. 王一泠,吴琦,安军社. 支持MIPS架构的轻量型开源鸿蒙系统移植. 计算机工程. 2023(12): 25-34+45 . 百度学术

    其他类型引用(23)

计量
  • 文章访问数:  943
  • HTML全文浏览量:  11
  • PDF下载量:  311
  • 被引次数: 35
出版历程
  • 发布日期:  2019-04-30

目录

    /

    返回文章
    返回