• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于多群体公平模型的特征选择算法

杨昙, 冯翔, 虞慧群

杨昙, 冯翔, 虞慧群. 基于多群体公平模型的特征选择算法[J]. 计算机研究与发展, 2015, 52(8): 1742-1756. DOI: 10.7544/issn1000-1239.2015.20150245
引用本文: 杨昙, 冯翔, 虞慧群. 基于多群体公平模型的特征选择算法[J]. 计算机研究与发展, 2015, 52(8): 1742-1756. DOI: 10.7544/issn1000-1239.2015.20150245
Yang Tan, Feng Xiang, Yu Huiqun. Feature Selection Algorithm Based on the Multi-Colony Fairness Model[J]. Journal of Computer Research and Development, 2015, 52(8): 1742-1756. DOI: 10.7544/issn1000-1239.2015.20150245
Citation: Yang Tan, Feng Xiang, Yu Huiqun. Feature Selection Algorithm Based on the Multi-Colony Fairness Model[J]. Journal of Computer Research and Development, 2015, 52(8): 1742-1756. DOI: 10.7544/issn1000-1239.2015.20150245
杨昙, 冯翔, 虞慧群. 基于多群体公平模型的特征选择算法[J]. 计算机研究与发展, 2015, 52(8): 1742-1756. CSTR: 32373.14.issn1000-1239.2015.20150245
引用本文: 杨昙, 冯翔, 虞慧群. 基于多群体公平模型的特征选择算法[J]. 计算机研究与发展, 2015, 52(8): 1742-1756. CSTR: 32373.14.issn1000-1239.2015.20150245
Yang Tan, Feng Xiang, Yu Huiqun. Feature Selection Algorithm Based on the Multi-Colony Fairness Model[J]. Journal of Computer Research and Development, 2015, 52(8): 1742-1756. CSTR: 32373.14.issn1000-1239.2015.20150245
Citation: Yang Tan, Feng Xiang, Yu Huiqun. Feature Selection Algorithm Based on the Multi-Colony Fairness Model[J]. Journal of Computer Research and Development, 2015, 52(8): 1742-1756. CSTR: 32373.14.issn1000-1239.2015.20150245

基于多群体公平模型的特征选择算法

基金项目: 国家自然科学基金项目(60905043,61073107,61173048,61272198)
详细信息
  • 中图分类号: TP18

Feature Selection Algorithm Based on the Multi-Colony Fairness Model

  • 摘要: 随着当今世界逐渐从信息化转型为数据化,模式识别和数据挖掘等领域面临越来越大的挑战.爆炸式增大的数据量使得特征选择过程成为大数据模式识别等领域必不可少的环节.受动物界资源争夺行为启发,在由特征选择模型转变为资源分配问题模型中加入个体的资源争夺行为,提出多群体公平算法(multi-colony fairness algorithm, MCFA)对该行为进行评判和处理,用以取得更优的分配方案(即更优特征子集),其有机融合随机搜索和启发式搜索,且将filter方法和wrapper方法相结合,降低计算量的同时获得更高的分类准确率.对提出的多群体公平算法进行了分析,从理论上证明了算法的收敛性和有效性;UCI机器学习数据库数据集与4种经典特征选择算法:顺序前向搜索算法(sequential forward selection, SFS)、顺序后向搜索算法(sequential backward selection, SBS)、顺序前向浮动搜索算法(sequential floating forward selection, SFFS)、顺序后向浮动搜索算法(sequential floating backward selection, SBFS)和3种主流特征选择算法:相关性-冗余度特征选择算法(relevance-redundancy feature selection, RRFS)、最大相关最小冗余算法(minimal-redundancy-maximal-relevance, mRMR)、ReliefF算法的对比实验表明,提出的多群体公平算法能够有效选择规模和性能都比较好的特征子集.
    Abstract: As the world gradually transforms from the information world to the data-driven world, the areas of pattern recognition and date mining are facing more and more challenges. Feature subset selection process becomes a necessary part of big-data pattern recognition due to the data with explosive growth. Inspired by the behavior of grabbing resources in animals, the paper adds personal grabbing-resource behavior into the model of resource distribution transformed from the model of feature selection and proposes multi-colony fairness algorithm(MCFA) to deal with this behavior in order to obtain a better distribution scheme (i.e. to obtain a better feature subset). The algorithm effectively fuses the strategies of the random search and the heuristic search. In addition, it combines the methods of filter and wrapper so as to reduce the amount of calculation while improving the classification accuracy. The convergence and the effectiveness of the proposed algorithm are verified both from mathematical and experimental aspects. MCFA is compared with the other four classic feature selection algorithms SFS(sequential forward selection), SBS(sequential backward selection), SFFS(sequential floating forward selection), SBFS(sequential floating backward selection) and three mainstream feature selection algorithms RRFS(relevance-redundancy feature selection), mRMR(minimal-redundancy-maximal-relevance), ReliefF. The comparison results show that the proposed algorithm can obtain better feature subsets both in the aspects of feature subset length and the classification accuracy which indicates the efficiency and the effectiveness of the proposed algorithm.
  • 期刊类型引用(38)

    1. 曾运强. 基于宽带网络信息安全规划的备案隔离管理系统研究. 自动化技术与应用. 2024(01): 103-107 . 百度学术
    2. 史慧,石桓印,郭晨禧. 信息化时代局域网运维管理探究. 三晋基层治理. 2024(01): 98-101 . 百度学术
    3. 柏松,王晓勇,胡胜利. 基于区块链和代理重加密的医疗物联网数据安全管理系统. 中国计量大学学报. 2024(01): 80-88 . 百度学术
    4. 杨小东,陈艾佳,汪志松,廖泽帆,王彩芬. 基于区块链的多授权密文策略属性基等值测试加密方案. 电子学报. 2024(03): 898-908 . 百度学术
    5. 王明龙. 基于多属性同态加密的医院电子档案信息安全防护算法. 电脑知识与技术. 2024(34): 80-82 . 百度学术
    6. 张志强,朱友文,王箭,张玉书. 基于内积谓词的属性基隐私保护加密方案. 电子与信息学报. 2023(03): 828-835 . 百度学术
    7. 王皓然,付鋆,刘俊荣. 多级访问安全下电网综合运维信息加密共享. 信息技术. 2023(08): 88-93 . 百度学术
    8. 张学旺,姚亚宁,付佳丽,谢昊飞. 策略隐藏的高效多授权机构CP-ABE物联网数据共享方案. 计算机研究与发展. 2023(10): 2193-2202 . 本站查看
    9. 崔蕾,周湘贞,王枚. 基于区块链和雾计算的IoT轻量级身份验证和访问控制. 贵阳学院学报(自然科学版). 2023(03): 33-39 . 百度学术
    10. 赵小凡,李情. 基于元数据管理的半结构化数据安全转换方法. 自动化仪表. 2022(03): 65-68+74 . 百度学术
    11. 陈丽莎,李雪莲,高军涛. 支持数据完整性验证的可问责数据交易方案. 系统工程与电子技术. 2022(04): 1364-1371 . 百度学术
    12. 万磊. 面向泛在感知网络数据中台的属性加密机制与应用. 信息安全研究. 2022(04): 351-356 . 百度学术
    13. 陈迪荣,包晓安,杜鹏,胡逸飞,苏鸿斌. 基于BSDiff的改进远程增量更新方案. 电子科技. 2022(07): 52-57 . 百度学术
    14. 李莉,陈云鹏,杨祉坤,吴怡. 个人健康记录中隐私数据分层访问控制方法. 计算机仿真. 2022(08): 398-402 . 百度学术
    15. 梁盈威,杨秋勇,谢瀚阳. 物联网环境下数据开放性共享安全保障体系. 微型电脑应用. 2022(09): 194-197 . 百度学术
    16. 李琳. 基于区块链的可验证外包解密属性基加密方案. 郑州航空工业管理学院学报. 2022(05): 86-91+107 . 百度学术
    17. 杨青,于大为. 考虑用户隐私保护范围的物联网海量混合数据查询方法. 物联网技术. 2022(11): 69-73 . 百度学术
    18. 李慧. 基于配电物联网的通信组网及数据处理技术研究. 自动化技术与应用. 2022(12): 112-115+119 . 百度学术
    19. 李浩光. 基于同态映射的密钥协商协议加密系统设计. 电子设计工程. 2021(02): 38-42 . 百度学术
    20. 王学周. 多跳网络中多通道敏感数据全同态加密方法研究. 内蒙古民族大学学报(自然科学版). 2021(01): 25-30 . 百度学术
    21. 陈宏君,蒋建军. 基于光通信技术的物联网数据加密技术研究. 激光杂志. 2021(05): 116-119 . 百度学术
    22. 蔡志锋,陈伟. 关于大规模物联网的多变量公钥安全传输研究. 计算机仿真. 2021(06): 109-112+267 . 百度学术
    23. 胡绍方,陈闯闯. 基于属性加密的网间数据安全交换技术优化. 网络安全技术与应用. 2021(09): 27-29 . 百度学术
    24. 陶永才,李哲,石磊,卫琳,杨淑博. 一种可信的车联网区块链数据共享模型. 小型微型计算机系统. 2021(10): 2131-2139 . 百度学术
    25. 米红波. 基于双重触发的嵌入式内核安全访问控制仿真. 计算机仿真. 2021(11): 445-449 . 百度学术
    26. 马浩. 数据加密技术在计算机网络安全中的应用. 信息技术与信息化. 2020(01): 124-126 . 百度学术
    27. 贾瑞龙,曹亚州,苗俊青,赵沛. 基于改进CP-ABE模型的医疗数据隐私保护管理设计与应用. 计算机测量与控制. 2020(01): 200-204+209 . 百度学术
    28. 张倩. 船用物联网的网络安全问题研究. 舰船科学技术. 2020(04): 208-210 . 百度学术
    29. 周显春. 舰船信息共享网络隐私数据防篡改方法. 舰船科学技术. 2020(08): 121-123 . 百度学术
    30. 陈力,臧笑宇,黄锋涛. 数据篡改攻击下配电网数据传输加密研究. 信息技术. 2020(06): 56-59 . 百度学术
    31. 刘艳,陈滢生. 基于物联网的智慧教室设计方案评价研究. 现代电子技术. 2020(19): 163-166 . 百度学术
    32. 史西兵. 云信任驱动的物联网信息共享安全机制仿真. 计算机仿真. 2020(09): 140-144 . 百度学术
    33. 侯晓磊. 物联网环境下远程舰船通信网络数据安全存储方法. 舰船科学技术. 2020(12): 151-153 . 百度学术
    34. 赵勃. 基于匿名区域构造的物联网隐私安全保护模型及仿真. 自动化与仪器仪表. 2020(10): 51-54+58 . 百度学术
    35. 鲍海燕,芦彩林. 基于改进RSA算法的隐私数据集同态加密方法. 太赫兹科学与电子信息学报. 2020(05): 929-933 . 百度学术
    36. 刘俊勇,潘力,何迈. 能源物联网及其关键技术. 物联网学报. 2020(04): 9-16 . 百度学术
    37. 林木. 企业数据仓库平台的技术架构研究与设计. 软件. 2020(12): 175-179 . 百度学术
    38. 李文迪,陈华伟,伍权,徐卫平. 设备上云技术研究现状与展望. 机床与液压. 2020(15): 194-198 . 百度学术

    其他类型引用(28)

计量
  • 文章访问数:  1454
  • HTML全文浏览量:  0
  • PDF下载量:  882
  • 被引次数: 66
出版历程
  • 发布日期:  2015-07-31

目录

    /

    返回文章
    返回