计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (8): 1674-1682.doi: 10.7544/issn1000-1239.2018.20180361
所属专题: 2018数据挖掘前沿进展专题
吴建盛1,冯巧遇2,袁京洲1,胡海峰2,周家特1,高昊1
Wu Jiansheng1, Feng Qiaoyu2, Yuan Jingzhou1, Hu Haifeng2, Zhou Jiate1,Gao Hao1
摘要: G蛋白偶联受体(G protein-coupled receptors, GPCRs)是人类中最庞大的膜蛋白家族,也是很多药物的重要靶点,准确了解GPCRs生物学功能是理解它们参与的生物学过程及其药物作用机制的关键.以前的研究表明,蛋白质功能预测可抽象为多示例多标记学习(multi-instance multi-label learning, MIML)问题.设计了一种基于快速多示例多标记学习方法MIMLfast的GPCRs生物学功能预测模型.该模型采用了一种新的混合特征,它考虑了GPCRs结构域的三联氨基酸、氨基酸关联、进化、二级结构关联、信号肽及无序残基等多种信息.实验结果证明,该模型获得了很好的性能,优于目前最优的多示例多标记学习、多标记学习的预测方法和CAFA蛋白质功能预测方法.
中图分类号: