• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

一种小样本数据的特征选择方法

许行, 张凯, 王文剑

许行, 张凯, 王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展, 2018, 55(10): 2321-2330. DOI: 10.7544/issn1000-1239.2018.20170748
引用本文: 许行, 张凯, 王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展, 2018, 55(10): 2321-2330. DOI: 10.7544/issn1000-1239.2018.20170748
Xu Hang, Zhang Kai, Wang Wenjian. A Feature Selection Method for Small Samples[J]. Journal of Computer Research and Development, 2018, 55(10): 2321-2330. DOI: 10.7544/issn1000-1239.2018.20170748
Citation: Xu Hang, Zhang Kai, Wang Wenjian. A Feature Selection Method for Small Samples[J]. Journal of Computer Research and Development, 2018, 55(10): 2321-2330. DOI: 10.7544/issn1000-1239.2018.20170748
许行, 张凯, 王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展, 2018, 55(10): 2321-2330. CSTR: 32373.14.issn1000-1239.2018.20170748
引用本文: 许行, 张凯, 王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展, 2018, 55(10): 2321-2330. CSTR: 32373.14.issn1000-1239.2018.20170748
Xu Hang, Zhang Kai, Wang Wenjian. A Feature Selection Method for Small Samples[J]. Journal of Computer Research and Development, 2018, 55(10): 2321-2330. CSTR: 32373.14.issn1000-1239.2018.20170748
Citation: Xu Hang, Zhang Kai, Wang Wenjian. A Feature Selection Method for Small Samples[J]. Journal of Computer Research and Development, 2018, 55(10): 2321-2330. CSTR: 32373.14.issn1000-1239.2018.20170748

一种小样本数据的特征选择方法

基金项目: 国家自然科学基金项目(61673249);山西省回国留学人员科研基金项目(2016-004);赛尔网络下一代互联网技术创新项目(NGII20170601)
详细信息
  • 中图分类号: TP181

A Feature Selection Method for Small Samples

  • 摘要: 小样本数据由于其特征维数相对于样本数目较多,且常包含不相关或冗余特征,使得常用的机器学习算法处理小样本数据时无法得到好的效果,通过特征选择来降低数据维数是解决该问题的一种有效途径.针对小样本数据,提出一种基于互信息的过滤型特征选择方法,首先定义了基于互信息的特征分组标准,该标准同时考虑特征与类别的相关性和不同特征之间的冗余性,根据该标准对特征分组后,在各组内选出与类别相关性最大的特征构成候选特征子集,保证了算法具有较低的时间复杂度,之后采用Boruta算法,在候选特征子集中自动确定最佳特征子集,从而大幅度降低数据的维数.通过与5种经典的特征选择算法比较,在标准数据集上采用3种分类器的实验结果表明提出的方法选出的特征子集具有较好的运行效率和分类性能.
    Abstract: For small samples, the common machine learning algorithms may not obtain good results as the feature dimension of small samples is often larger than the number of samples and some irrelevant or redundant features are often existed. It is an effective way to solve this problem by reducing the feature dimension through feature selection. This paper proposes a filter feature selection method based on mutual information for the small samples. First, the criterion of feature grouping based on the mutual information is defined. Both the correlations between features and the class and the redundancy among different features are considered in this criterion, according to which the features are grouped. Then those features that have maximal correlation with the class in each group will be chosen to compose a candidate feature subset. Meanwhile, it is ensured that the time complexity of this algorithm is low. After that, the feature selection method based on feature grouping is combined with Boruta algorithm to determine the optimal feature subset automatically from the candidate feature subset. In this way, the feature dimension can be reduced greatly. Compared with the five classical feature selection algorithms, experimental results on benchmark data sets demonstrate that the feature subset selected by the proposed method has better classification performance and running efficiency on three kinds of classifiers.
  • 期刊类型引用(21)

    1. 杜晓丽,李登峰. 基于大老板博弈的国际贸易物流区块链网络共识研究. 中国管理科学. 2024(04): 120-129 . 百度学术
    2. 徐吟歌,郑康宁,周鎏瑜. 基于共识机制的供应链金融信息共享合作博弈研究. 现代商业. 2024(18): 41-45 . 百度学术
    3. 杨朝东,关景火,米群,孙文军,张艳波,刘源淞. 基于区块链DPoS共识机制的三七溯源体系研究. 云南农业科技. 2024(05): 9-15 . 百度学术
    4. 王捷,葛丽娜,张桂芬. 区块链的激励机制权益证明共识算法改进方案. 郑州大学学报(工学版). 2023(05): 62-68 . 百度学术
    5. 谭春桥,杨慧娟,易文桃. 基于纳什谈判的共享经济区块链网络Po S共识传播博弈分析. 控制与决策. 2022(01): 219-229 . 百度学术
    6. 邓小鸿,王智强,李娟,王俊彬,黎康婷. 主流区块链共识算法对比研究. 计算机应用研究. 2022(01): 1-8 . 百度学术
    7. 张沁楠,朱建明,高胜,熊泽辉,丁庆洋,朴桂荣. 基于区块链和贝叶斯博弈的联邦学习激励机制. 中国科学:信息科学. 2022(06): 971-991 . 百度学术
    8. 张旺,葛云生. 基于节点分组的权益证明共识机制. 计算机应用与软件. 2022(05): 267-272+298 . 百度学术
    9. 何帅,黄襄念. 基于信誉授权的DPoS共识机制改进研究. 四川轻化工大学学报(自然科学版). 2022(03): 66-75 . 百度学术
    10. 付晓东,漆鑫鑫,刘骊,彭玮,丁家满,代飞. 基于权力指数的DPoS共谋攻击检测与预防. 通信学报. 2022(12): 123-133 . 百度学术
    11. 康海燕,邓婕. 区块链数据隐私保护研究综述. 山东大学学报(理学版). 2021(05): 92-110 . 百度学术
    12. 李凌霄,袁莎,金银玉. 基于区块链的联邦学习技术综述. 计算机应用研究. 2021(11): 3222-3230 . 百度学术
    13. 何帅,黄襄念,刘谦博,江杨靖. DPoS区块链共识机制的改进研究. 计算机应用研究. 2021(12): 3551-3557 . 百度学术
    14. 孙晶,徐晓雅,赵会群. 基于PSO优化博弈的区块链共识算法. 计算机应用与软件. 2021(12): 251-261+340 . 百度学术
    15. 杨坤桥,王煜翔,郭兵,李强. 委托股权证明共识机制的改进研究. 计算机工程与应用. 2021(24): 107-114 . 百度学术
    16. 陈梦蓉,林英,兰微,单今朝. 基于“奖励制度”的DPoS共识机制改进. 计算机科学. 2020(02): 269-275 . 百度学术
    17. 李萌,武帅,谭建. 基于区块链技术的供应链金融平台优化设计. 信息技术与信息化. 2020(03): 95-97 . 百度学术
    18. 付瑶瑶,李盛恩. 授权股份证明共识机制的改进方案. 计算机工程与应用. 2020(19): 48-54 . 百度学术
    19. 赖英旭,薄尊旭,刘静. 基于改进PBFT算法防御区块链中sybil攻击的研究. 通信学报. 2020(09): 104-117 . 百度学术
    20. 江雨燕,郑炜晨,邵金. 基于改进PBFT算法的区块链技术在供应链溯源中的应用. 南阳理工学院学报. 2020(04): 23-29 . 百度学术
    21. 连耿雄. 基于区块链的可信移动应用市场. 计算机与现代化. 2019(03): 58-61+67 . 百度学术

    其他类型引用(54)

计量
  • 文章访问数:  2084
  • HTML全文浏览量:  7
  • PDF下载量:  816
  • 被引次数: 75
出版历程
  • 发布日期:  2018-09-30

目录

    /

    返回文章
    返回