• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于数据纵向分布的隐私保护逻辑回归

宋蕾, 马春光, 段广晗, 袁琪

宋蕾, 马春光, 段广晗, 袁琪. 基于数据纵向分布的隐私保护逻辑回归[J]. 计算机研究与发展, 2019, 56(10): 2243-2249. DOI: 10.7544/issn1000-1239.2019.20190414
引用本文: 宋蕾, 马春光, 段广晗, 袁琪. 基于数据纵向分布的隐私保护逻辑回归[J]. 计算机研究与发展, 2019, 56(10): 2243-2249. DOI: 10.7544/issn1000-1239.2019.20190414
Song Lei, Ma Chunguang, Duan Guanghan, Yuan Qi. Privacy-Preserving Logistic Regression on Vertically Partitioned Data[J]. Journal of Computer Research and Development, 2019, 56(10): 2243-2249. DOI: 10.7544/issn1000-1239.2019.20190414
Citation: Song Lei, Ma Chunguang, Duan Guanghan, Yuan Qi. Privacy-Preserving Logistic Regression on Vertically Partitioned Data[J]. Journal of Computer Research and Development, 2019, 56(10): 2243-2249. DOI: 10.7544/issn1000-1239.2019.20190414

基于数据纵向分布的隐私保护逻辑回归

基金项目: 国家自然科学基金项目(61472097);黑龙江省自然科学基金项目(JJ2019LH1770)
详细信息
  • 中图分类号: TP391

Privacy-Preserving Logistic Regression on Vertically Partitioned Data

  • 摘要: 逻辑回归是机器学习的重要算法之一,为解决集中式训练方式不能保护隐私的问题,提出隐私保护的逻辑回归解决方案,该方案适用于数据以特征维度进行划分,纵向分布在两方情况下,两方进行协作式训练学习到共享的模型结构.两方在本地数据集上进行训练,通过交换中间计算结果而不直接暴露私有数据,利用加法同态加密算法在密文下进行运算保证计算安全,保证在交互中不能获取对方的敏感信息.同时,提供隐私保护的预测方法,保证模型部署服务器不能获取询问者的私有数据.经过分析与实验验证,在几乎不损失精度的前提下,该案可以在两方均是半诚实参与者情况下提供隐私保护.
    Abstract: Logistic regression is the important algorithms of machine learning. Traditional training methods require centralized collection of training data which will cause privacy issues. To solve this problem, this paper proposes privacy-preserving logistic regression. This scheme is suitable for dividing data by feature dimension, and the training data is shared between two parties. The two parties conduct collaborative training and learn a shared model. In this scheme, the two parties train the model locally on private data set while exchanging the intermediate calculation results without directly exposing their private data. Additionally, the additively homomorphic scheme can ensure the calculation security which can be performed on the cipher text. During the training process, the participants can only obtain zero knowledge of each other and cannot get any information about model parameters and training data of another participant. At the same time, a privacy protection prediction method is provided to ensure that the model deployment server cannot obtain the private data of the inquirer. After analysis and experimental verification, within the tolerable loss of precision, the scheme is secure against semi-honest participants and provide privacy protection.
  • 期刊类型引用(15)

    1. 徐胜超,邓斌涛. 强混合样本面板数据模型回归样条估计. 信息技术. 2024(02): 73-77 . 百度学术
    2. 赵建民,张珺博,崔佳鑫. 基于Stacking的套损预测方法研究. 计算机与数字工程. 2024(06): 1685-1690 . 百度学术
    3. 王大星,周强,滕济凯. 基于同态加密和牛顿迭代法的数据隐私保护模型. 湖南科技大学学报(自然科学版). 2024(02): 69-74 . 百度学术
    4. 产院东,沈鸿喆,张欣怡,杨留磊,胡杰,夏爽. 一种基于机器学习的内部威胁检测算法. 信息化研究. 2024(05): 25-31 . 百度学术
    5. 唐敏,张宇浩,邓国强. 一种高效的非交互式隐私保护逻辑回归模型. 计算机工程. 2023(04): 32-42+51 . 百度学术
    6. 李国,张秋杰. 基于纵向联邦学习的航班延误预测. 计算机工程与设计. 2023(05): 1594-1601 . 百度学术
    7. 史汶泽,陆林,秦文杰,于涛. 一种可信执行环境下的联邦逻辑回归评分卡系统. 应用科学学报. 2023(03): 488-499 . 百度学术
    8. 陈晶,彭长根,谭伟杰,许德权. 基于差分隐私和秘密共享的多服务器联邦学习方案. 信息网络安全. 2023(07): 98-110 . 百度学术
    9. 王炎,段成阁. 基于大数据技术的用户个人信息隐私数据保护研究. 情报科学. 2023(07): 100-105 . 百度学术
    10. 张泽辉,李庆丹,富瑶,何宁昕,高铁杠. 面向非独立同分布数据的自适应联邦深度学习算法. 自动化学报. 2023(12): 2493-2506 . 百度学术
    11. 王坤庆,刘婧,李晨,赵语杭,吕浩然,李鹏,刘炳莹. 联邦学习安全威胁综述. 信息安全研究. 2022(03): 223-234 . 百度学术
    12. 产院东,孟剑萍,郭乔进,吴其华,梁中岩,胡杰. 基于机器学习的恶意软件分析算法. 信息化研究. 2022(03): 23-30 . 百度学术
    13. 孙爽,李晓会,刘妍,张兴. 不同场景的联邦学习安全与隐私保护研究综述. 计算机应用研究. 2021(12): 3527-3534 . 百度学术
    14. 黄晓文,王政杰,崔硕硕,张宇浩,邓国强. 一种基于随机掩码的低通信量Logistic回归外包训练方案. 科技资讯. 2021(34): 5-9 . 百度学术
    15. 邓正义. 基于同态加密技术的实验室开放管理系统研究. 产业科技创新. 2019(35): 106-108 . 百度学术

    其他类型引用(13)

计量
  • 文章访问数:  1552
  • HTML全文浏览量:  1
  • PDF下载量:  1171
  • 被引次数: 28
出版历程
  • 发布日期:  2019-09-30

目录

    /

    返回文章
    返回