• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

一种只利用序列信息预测RNA结合蛋白的深度学习模型

李洪顺, 于华, 宫秀军

李洪顺, 于华, 宫秀军. 一种只利用序列信息预测RNA结合蛋白的深度学习模型[J]. 计算机研究与发展, 2018, 55(1): 93-101. DOI: 10.7544/issn1000-1239.2018.20160508
引用本文: 李洪顺, 于华, 宫秀军. 一种只利用序列信息预测RNA结合蛋白的深度学习模型[J]. 计算机研究与发展, 2018, 55(1): 93-101. DOI: 10.7544/issn1000-1239.2018.20160508
Li Hongshun, Yu Hua, Gong Xiujun. A Deep Learning Model for Predicting RNA-Binding Proteins Only from Primary Sequences[J]. Journal of Computer Research and Development, 2018, 55(1): 93-101. DOI: 10.7544/issn1000-1239.2018.20160508
Citation: Li Hongshun, Yu Hua, Gong Xiujun. A Deep Learning Model for Predicting RNA-Binding Proteins Only from Primary Sequences[J]. Journal of Computer Research and Development, 2018, 55(1): 93-101. DOI: 10.7544/issn1000-1239.2018.20160508
李洪顺, 于华, 宫秀军. 一种只利用序列信息预测RNA结合蛋白的深度学习模型[J]. 计算机研究与发展, 2018, 55(1): 93-101. CSTR: 32373.14.issn1000-1239.2018.20160508
引用本文: 李洪顺, 于华, 宫秀军. 一种只利用序列信息预测RNA结合蛋白的深度学习模型[J]. 计算机研究与发展, 2018, 55(1): 93-101. CSTR: 32373.14.issn1000-1239.2018.20160508
Li Hongshun, Yu Hua, Gong Xiujun. A Deep Learning Model for Predicting RNA-Binding Proteins Only from Primary Sequences[J]. Journal of Computer Research and Development, 2018, 55(1): 93-101. CSTR: 32373.14.issn1000-1239.2018.20160508
Citation: Li Hongshun, Yu Hua, Gong Xiujun. A Deep Learning Model for Predicting RNA-Binding Proteins Only from Primary Sequences[J]. Journal of Computer Research and Development, 2018, 55(1): 93-101. CSTR: 32373.14.issn1000-1239.2018.20160508

一种只利用序列信息预测RNA结合蛋白的深度学习模型

基金项目: 国家自然科学基金项目(61930007);国家“八六三”高技术研究发展计划基金项目(2015BA3005);国家“九七三”重点基础研究发展计划基金项目 (2013CB32930X)
详细信息
  • 中图分类号: TP183

A Deep Learning Model for Predicting RNA-Binding Proteins Only from Primary Sequences

  • 摘要: RNA结合蛋白在选择性剪贴、RNA编辑及甲基化等多种生物功能中发挥非常重要的作用,从氨基酸序列预测这些蛋白的功能成为基因组功能注释领域的重要挑战之一. 传统的预测方法往往从序列中提取氨基酸的理化特性作为初始特征,忽略了motif及motif之间的位置信息,同时由于训练数据规模小、噪声大,导致预测的精度及可信度降低. 在此提出了一种从序列预测RNA结合蛋白的深度学习模型. 该模型利用2阶段卷积神经网络探测蛋白质序列的功能域,利用长短期记忆网络获得序列的定长特征表示并且能够学习到功能域之间的长短期依赖关系.预测算法中所用到的特征均是通过“学习”自动获得,克服了传统机器学习中特征选择过程过多的人工干预. 实验结果表明:模型在处理大规模序列数据时具有明显的优势.
    Abstract: RNA-binding proteins (RNA-BPs) play pivotal roles in alternative splicing, RNA editing, methylating and many other biological functions. Predicting functions of these proteins from primary amino acids sequences are becoming one of the major challenges in functional annotation of genomes. Traditional prediction methods often devote themselves to extracting physicochemical features from sequences but ignoring motif information and location information between motifs. Meanwhile, the small scale of data volumes and large noises in training data result in lower accuracy and reliability of predictions. In this paper, we propose a new deep learning based model to predict RNA-binding proteins from primary sequences. The model utilizes two stages of convolutional neutral network(CNN) to detect the function domain of protein sequences, and long short-term memory neural network(LSTM) to obtain the length-fixed feature representation of sequences and learn long short-term dependencies between function domains of protein sequences. It overcomes more human intervention in feature selection procedure than in traditional machine learning method, since all features are learned automatically. The experimental results show its priority in processing large scale of sequence data.
  • 期刊类型引用(27)

    1. 高改梅,张瑾,刘春霞,党伟超,白尚旺. 基于区块链与CP-ABE策略隐藏的众包测试任务隐私保护方案. 计算机应用. 2024(03): 811-818 . 百度学术
    2. 景旭,邢胜飞. 基于PBFT的猕猴桃溯源联盟链应用访问控制方案. 农业机械学报. 2023(01): 183-195 . 百度学术
    3. 宋智明,余益民,王贵文,陈韬伟. 基于区块链智能合约的数字身份可验证凭证零知识认证和管理架构. 信息安全学报. 2023(01): 55-77 . 百度学术
    4. 田秀霞,杨明夷. 家庭物联网中基于智能合约的访问控制机制. 计算机工程. 2023(03): 18-28 . 百度学术
    5. 王少泫,彭俊利. 云存储数据安全技术研究. 网络安全技术与应用. 2023(06): 69-72 . 百度学术
    6. 王茜,朱俊伟,张晓东. 电子材料可控共享控制模型——基于政务联盟链. 计算机应用与软件. 2023(07): 342-349 . 百度学术
    7. 谢毅,张晓燕,黄娟娟,吴谋凡,陈林. 基于区块链可信认证的准入管控技术应用. 数字通信世界. 2023(11): 133-135 . 百度学术
    8. 刘孝保,孙海彬,阴艳超,姚廷强,杨林. 面向制造业产业链图状区块链模型. 计算机集成制造系统. 2023(12): 4267-4281 . 百度学术
    9. 陈立全,贾继广,王泽雨,于坤良. 基于区块链上策略密文检索的属性访问控制方案. 密码学报. 2023(06): 1165-1182 . 百度学术
    10. 孔祥科,李树彬,李青桐. 物联网环境下共享停车区块链模型研究. 山东建筑大学学报. 2022(01): 92-99 . 百度学术
    11. 张金龙,员青泽. 一种云计算系统信任度访问控制方法仿真. 计算机仿真. 2022(02): 472-475+486 . 百度学术
    12. 李叶宏. 基于区块链技术的司法执行创新研究. 西北民族大学学报(哲学社会科学版). 2022(02): 76-86 . 百度学术
    13. 张晓东,陈韬伟,余益民,王会源. 基于区块链和密文属性加密的访问控制方案. 计算机应用研究. 2022(04): 986-991 . 百度学术
    14. 刘炜,盛朝阳,佘维,田钊. 基于智能合约的分类分级属性访问控制方法. 计算机应用研究. 2022(05): 1313-1318 . 百度学术
    15. MIAO Siwei,ZHANG Xiaojuan,LIU Zhe. Fine-Grained Access Control Mechanism of Energy Internet. Wuhan University Journal of Natural Sciences. 2022(03): 231-239 . 必应学术
    16. 刘峰,杨杰,齐佳音. 区块链密码学隐私保护技术综述. 网络与信息安全学报. 2022(04): 29-44 . 百度学术
    17. 刘奇旭,靳泽,陈灿华,高新博,郑宁军,方仪伟,冯云. 物联网访问控制安全性综述. 计算机研究与发展. 2022(10): 2190-2211 . 本站查看
    18. 吴斌,严建峰. 基于区块链技术的分布式可信网络接入认证. 计算机仿真. 2021(01): 277-281 . 百度学术
    19. 姚中原,潘恒,祝卫华,斯雪明. 区块链物联网融合:研究现状与展望. 应用科学学报. 2021(01): 174-184 . 百度学术
    20. 闾海荣,姜楠,许瑞坤,周容辰. 区块链在物联网中的应用态势分析. 数据与计算发展前沿. 2021(01): 34-47 . 百度学术
    21. 刘炜,彭宇飞,田钊,盛朝阳,李阳,佘维. 基于区块链的医疗信息隐私保护研究综述. 郑州大学学报(理学版). 2021(02): 1-18 . 百度学术
    22. 沈海波,陈强,黄海. 语义区块链研究综述. 计算机应用研究. 2021(07): 1937-1942 . 百度学术
    23. 郭显,王雨悦,冯涛,曹来成,蒋泳波,张迪. 基于区块链的工业控制系统角色委派访问控制机制. 计算机科学. 2021(09): 306-316 . 百度学术
    24. 梁晓艳,杜瑞忠. IoT下CapBAC规则语义表示及其时间间隔粗糙性分析. 通信学报. 2021(09): 43-53 . 百度学术
    25. 魏占祯,彭星源,赵洪. SDN中基于用户信任度的资源访问控制方案. 信息网络安全. 2021(10): 33-40 . 百度学术
    26. 王金威. 基于IPv6环境的网络信息安全访问控制模型设计. 黑龙江工业学院学报(综合版). 2021(11): 79-84 . 百度学术
    27. 谢绒娜,李晖,史国振,郭云川,张铭,董秀则. 基于区块链的可溯源访问控制机制. 通信学报. 2020(12): 82-93 . 百度学术

    其他类型引用(40)

计量
  • 文章访问数:  2431
  • HTML全文浏览量:  2
  • PDF下载量:  1528
  • 被引次数: 67
出版历程
  • 发布日期:  2017-12-31

目录

    /

    返回文章
    返回