ISSN 1000-1239 CN 11-1777/TP

    2021数据治理与数据透明专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 数据治理与数据透明专题前言
    孟小峰, 冯登国
    计算机研究与发展    2021, 58 (2): 235-236.   doi: 10.7544/issn1000-1239.2021.qy0201
    摘要410)   HTML9)    PDF (192KB)(272)   
    2020年4月,中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,提出要加快培育数据要素市场的概念,进一步突出了数据在经济发展、科技进步和生产生活等各方面的重要性.但与此同时,人们对自身产生的数据失去掌控权,以及对大数据决策深度依赖,由此导致用户数据滥用、隐私泄露、数据垄断和决策公平等数据伦理问题层出不穷,严重影响了数据生产者和数据消费者等参与主体的权益.传统的数据治理体系与方法已经不能解决当下数据治理面临的难题,亟待新思想和新方法等突破性进展的出现.目前来看,建立数据透明化的数据治理体系是一条有效途径,即通过增加大数据价值发现过程中的透明性来保障各方参与主体的权益. 鉴于此,《计算机研究与发展》推出“数据治理与数据透明”专题,侧重数据透明、数据伦理、数据决策公平、数据决策可解释、数据垄断、数据隐私保护等方面,探讨当下数据治理的新体系与新方法,展望未来的发展趋势.本专题最终收录了4篇论文,内容涵盖数据伦理判别、数据决策公平、隐私保护新方法和数据透明4个方面,反映了国内学术领域在数据治理方面的主要工作.
    相关文章 | 计量指标
    2. 基于区块链的数据透明化:问题与挑战
    孟小峰, 刘立新
    计算机研究与发展    2021, 58 (2): 237-252.   doi: 10.7544/issn1000-1239.2021.20200017
    摘要1295)   HTML26)    PDF (1812KB)(945)   
    物联网、穿戴设备和移动通信等技术的高速发展促使数据源源不断地产生并汇聚至多方数据收集者,由此带来更严峻的隐私泄露问题, 然而传统的差分隐私、加密和匿名等隐私保护技术还不足以应对.更进一步,数据的自主汇聚导致数据垄断问题,严重影响了大数据价值实现.此外,大数据决策过程中,数据非真实产生、被篡改和质量管理过程中的单点失败等问题导致数据决策不可信.如何使这些问题得到有效治理,使数据被正确和规范地使用是大数据发展面临的主要挑战.首先,提出数据透明化的概念和研究框架,旨在增加大数据价值实现过程的透明性,从而为上述问题提供解决方案.然后,指出数据透明化的实现需求与区块链的特性天然契合,并对目前基于区块链的数据透明化研究现状进行总结.最后,对基于区块链的数据透明化可能面临的挑战进行分析.
    相关文章 | 计量指标
    3. 基于社会新闻数据集的伦理行为判别方法
    古天龙, 冯旋, 李龙, 包旭光, 李云辉
    计算机研究与发展    2021, 58 (2): 253-263.   doi: 10.7544/issn1000-1239.2021.20200727
    摘要531)   HTML15)    PDF (979KB)(335)   
    人工智能(artificial intelligence, AI)应用的伦理风险和挑战引起了人们的普遍关注,如何从技术实现角度开发出遵守人类价值观和伦理规范的AI系统,即,符合伦理的AI设计,是亟需解决的重要问题之一.基于机器学习的伦理与道德判别是此方面的有益探索.社会新闻数据具有丰富的伦理和道德的内容及知识,为机器学习的训练数据开发提供了可能.鉴于此,本文构建了具有人类行为伦理和道德属性的社会新闻数据集,附之以法律与行为规范数据集,用以机器学习的训练和测试;建立了基于使用信息实体的增强语言表示(enhanced language representation of information entities, ERNIE)和卷积神经网络(convolutional neural network, CNN)的伦理行为判别模型ERNIE-CNN,通过词的向量表示计算语义相似度来提取关于行为的伦理判断.实验结果表明,提出的模型具有比基准模型更好的性能,验证了方法和模型的有效性.
    相关文章 | 计量指标
    4. 面向深度学习的公平性研究综述
    陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶
    计算机研究与发展    2021, 58 (2): 264-280.   doi: 10.7544/issn1000-1239.2021.20200758
    摘要980)   HTML25)    PDF (1752KB)(817)   
    深度学习是机器学习研究中的一个重要领域,它具有强大的特征提取能力,且在许多应用中表现出先进的性能,因此在工业界中被广泛应用.然而,由于训练数据标注和模型设计存在偏见,现有的研究表明深度学习在某些应用中可能会强化人类的偏见和歧视,导致决策过程中的不公平现象产生,从而对个人和社会产生潜在的负面影响.为提高深度学习的应用可靠性、推动其在公平领域的发展,针对已有的研究工作,从数据和模型2方面出发,综述了深度学习应用中的偏见来源、针对不同类型偏见的去偏方法、评估去偏效果的公平性评价指标、以及目前主流的去偏平台,最后总结现有公平性研究领域存在的开放问题以及未来的发展趋势.
    相关文章 | 计量指标
    5. 一种基于区块链的泛用型数据隐私保护的安全多方计算协议
    刘峰, 杨杰, 李志斌, 齐佳音
    计算机研究与发展    2021, 58 (2): 281-290.   doi: 10.7544/issn1000-1239.2021.20200751
    摘要865)   HTML37)    PDF (1496KB)(739)   
    近年来,如何合理有效地在区块链上实现用户隐私数据保护是区块链技术领域的一个关键性问题.针对此问题,设计出一种基于Pedersen承诺与Schnorr协议的安全多方计算协议(protocol of blockchain based on Pedersen commitment linked Schnorr protocol for multi-party computation,BPLSM).通过构筑该协议架构并进行形式化证明演算,表明了该协议能够融入区块链网络、能够在匿名情况下合并不同隐私消息并进行高效签署的特点.此外分析了协议的性质与安全性,证明了在区块链中应用BPLSM协议的泛用型隐私计算方案计算上的低算力开销,并具备良好的信息隐蔽性.最后对协议进行实验仿真,结果表明:在小范围人数固定的多方计算中,BPLSM协议验签的时间成本比当前主流的BLS签名节省约83.5%.
    相关文章 | 计量指标