计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (8): 1683-1693.doi: 10.7544/issn1000-1239.2018.20180365
所属专题: 2018数据挖掘前沿进展专题
郭颖婕1,刘晓燕1,吴辰熙2,郭茂祖1,3,李傲1
Guo Yingjie1, Liu Xiaoyan1, Wu Chenxi2, Guo Maozu1,3,Li Ao1
摘要: 在全基因组关联研究GWAS中,多数方法对疾病与单核苷酸多态性位点之间的互作关系形式给出了强假设,这降低了相关方法的挖掘能力.近几年,以基因作为研究单位的基因-基因相互作用检测方法,因其在统计效力与生物可解释性方面的优势受到重视.针对已有方法检测相互作用类型时存在的局限性,提出一种基于U统计值与集成学习器的假设检验方法GBUtrees,通过构造统计量用于表征疾病性状与2个基因之间关系偏离加性模型的程度,检测以基因为单位的基因-基因相互作用.该统计量在不同子样例集下结果的平均值满足U统计量理论,从而可以利用U统计量的渐进正态分布性质获得所构造统计量的分布信息.GBUtrees对相互作用的形式不作假设,增强该方法对不同形式相互作用的挖掘能力.仿真与真实实验结果表明:该方法能够有效地进行不同类型相互作用的挖掘,可以应用于全基因组关联研究.
中图分类号: