2022年 第59卷 第9期
2022, 59(9): 1867-1868.
DOI: 10.7544/issn1000-1239.qy20220901
摘要:
万物互联、数据驱动的智能化时代来临.软件系统帮助人类定义更快的网络、更智能地控制设备、采集更多样的数据、完成更丰富的处理和分析,从而提升人类的工作效率和生活体验. 软件的智能化,以及软件开发和质量保证技术的智能化控制是越来越重要的研究与实践主题. 智能化软件的研发可以从经典的控制理论得到丰富的模型借鉴,因为智能软件系统的反馈和优化本质上就是自动控制领域长久以来追求的目标.软件控制论从提出之日起,始终倡导计算机软件领域与控制领域的跨学科交叉研究,其核心科学问题是,建立软件系统行为的控制模型、设计方法和控制理论,实现对软件制品及其研发过程进行有效、定量化的控制 . 软件控制论通过将软件(软件工程)问题归结为控制问题,以及将控制理论引入到软件领域,研究这2个领域的交叉与融合发展,并共同服务于新时期技术进步.研究智能化时代的智能化软件和软件控制论对未来信息技术的持续发展具有重要意义.
万物互联、数据驱动的智能化时代来临.软件系统帮助人类定义更快的网络、更智能地控制设备、采集更多样的数据、完成更丰富的处理和分析,从而提升人类的工作效率和生活体验. 软件的智能化,以及软件开发和质量保证技术的智能化控制是越来越重要的研究与实践主题. 智能化软件的研发可以从经典的控制理论得到丰富的模型借鉴,因为智能软件系统的反馈和优化本质上就是自动控制领域长久以来追求的目标.软件控制论从提出之日起,始终倡导计算机软件领域与控制领域的跨学科交叉研究,其核心科学问题是,建立软件系统行为的控制模型、设计方法和控制理论,实现对软件制品及其研发过程进行有效、定量化的控制 . 软件控制论通过将软件(软件工程)问题归结为控制问题,以及将控制理论引入到软件领域,研究这2个领域的交叉与融合发展,并共同服务于新时期技术进步.研究智能化时代的智能化软件和软件控制论对未来信息技术的持续发展具有重要意义.
2022, 59(9): 1869-1886.
DOI: 10.7544/issn1000-1239.20220012
摘要:
在物联网与大数据应用蓬勃发展的背景下,各类感知设备产生海量的时序数据,设备管理软件版本的快速迭代导致时序数据的模式演化问题日益凸显.模式演化要求对数据模式进行版本管理,使数据进行模式变更时不产生信息损失,且支持对数据跨模式版本进行读写操作.结合流行的时序数据库管理系统,调研总结了各类数据库管理系统对模式演化的支持情况,对时序数据及其模式进行了形式化表述,对其模式演化的过程进行了分析,设计了一种面向时序数据的模式演化跟踪及查询方法,形式化表达了模式跟踪及跨模式版本查询的整体框架与关键步骤,并在时序数据库Apache IoTDB上进行了实现与测试.最后,分析了实现系统的性能,并展望了未来研究方向.
在物联网与大数据应用蓬勃发展的背景下,各类感知设备产生海量的时序数据,设备管理软件版本的快速迭代导致时序数据的模式演化问题日益凸显.模式演化要求对数据模式进行版本管理,使数据进行模式变更时不产生信息损失,且支持对数据跨模式版本进行读写操作.结合流行的时序数据库管理系统,调研总结了各类数据库管理系统对模式演化的支持情况,对时序数据及其模式进行了形式化表述,对其模式演化的过程进行了分析,设计了一种面向时序数据的模式演化跟踪及查询方法,形式化表达了模式跟踪及跨模式版本查询的整体框架与关键步骤,并在时序数据库Apache IoTDB上进行了实现与测试.最后,分析了实现系统的性能,并展望了未来研究方向.
2022, 59(9): 1887-1901.
DOI: 10.7544/issn1000-1239.20220023
摘要:
随着智能化时代的到来,以自动饮料售卖机、自动地铁售票机、ATM机等为代表的智能服务终端对人们的生活起到了越来越重要的作用,对智能服务终端进行全面有效的测试以防止其可能出现的各种错误,提升用户体验变得十分重要.针对目前软件版本更新频繁、开发与测试难以对接、边开发边测试导致的测试工作量庞大且难以规范化等问题,根据智能服务终端状态及状态迁移特征明显的特点,提出一种在规格说明不充分、软件快速迭代需要不断回归测试情况下仍能被高效使用的测试方案——基于FSM(finite state machine)的探索性自适应测试.该方法首先通过探索性测试获得待测系统的状态及迁移信息,然后把它们建模成FSM,根据模型及已经执行过的测试用例,以状态及状态迁移覆盖为准则生成测试用例,在测试过程中不断地对测试模型及相应的测试用例进行自适应调整.基于该方法,通过集成开源软件Graphwalker,搭建了一个实验平台,选择了10种不同种类的常用智能服务终端,通过实验评估其有效性.实验结果表明,该方法生成的测试用例数量少,测试充分性程度高,可以高效地发现智能服务终端系统中存在的缺陷和问题.
随着智能化时代的到来,以自动饮料售卖机、自动地铁售票机、ATM机等为代表的智能服务终端对人们的生活起到了越来越重要的作用,对智能服务终端进行全面有效的测试以防止其可能出现的各种错误,提升用户体验变得十分重要.针对目前软件版本更新频繁、开发与测试难以对接、边开发边测试导致的测试工作量庞大且难以规范化等问题,根据智能服务终端状态及状态迁移特征明显的特点,提出一种在规格说明不充分、软件快速迭代需要不断回归测试情况下仍能被高效使用的测试方案——基于FSM(finite state machine)的探索性自适应测试.该方法首先通过探索性测试获得待测系统的状态及迁移信息,然后把它们建模成FSM,根据模型及已经执行过的测试用例,以状态及状态迁移覆盖为准则生成测试用例,在测试过程中不断地对测试模型及相应的测试用例进行自适应调整.基于该方法,通过集成开源软件Graphwalker,搭建了一个实验平台,选择了10种不同种类的常用智能服务终端,通过实验评估其有效性.实验结果表明,该方法生成的测试用例数量少,测试充分性程度高,可以高效地发现智能服务终端系统中存在的缺陷和问题.
2022, 59(9): 1902-1913.
DOI: 10.7544/issn1000-1239.20220016
摘要:
为了提高服务效率和实现更多样的功能,越来越多的软件系统选择将业务或服务部署在不同的物理设备上,使用互联网通信协作,这类软件系统被称为网络化软件,然而此类软件高度分布的特点为系统的调控带来了难题.基于博弈理论解决网络化软件的优化决策问题,让系统中的软件节点交换信息,并根据收益函数调整自身状态,实现系统的整体优化;同时,通过多智能体一致性理论克服优化过程中可能存在通信的问题,让软件节点使用不完全的系统信息做出决策;此外,提出了自适应步长机制和强制协调机制,基于节点间的估计误差值对部分参数进行合理调整,有效缓解了此类方法容易发散、参数选择困难的问题,实现了状态寻优和估计误差修正间的有效协同,提高了方法的收敛速度.
为了提高服务效率和实现更多样的功能,越来越多的软件系统选择将业务或服务部署在不同的物理设备上,使用互联网通信协作,这类软件系统被称为网络化软件,然而此类软件高度分布的特点为系统的调控带来了难题.基于博弈理论解决网络化软件的优化决策问题,让系统中的软件节点交换信息,并根据收益函数调整自身状态,实现系统的整体优化;同时,通过多智能体一致性理论克服优化过程中可能存在通信的问题,让软件节点使用不完全的系统信息做出决策;此外,提出了自适应步长机制和强制协调机制,基于节点间的估计误差值对部分参数进行合理调整,有效缓解了此类方法容易发散、参数选择困难的问题,实现了状态寻优和估计误差修正间的有效协同,提高了方法的收敛速度.
2022, 59(9): 1914-1928.
DOI: 10.7544/issn1000-1239.20220014
摘要:
针对目前已有的基于深度学习的数据竞争检测方法提取特征单一和准确率低的问题,提出一种基于深度学习的数据竞争检测方法DeleRace,该方法首先利用程序静态分析工具WALA从多个实际应用程序中提取指令、方法和文件等多个级别的特征,对其向量化并构造训练样本数据;然后通过ConRacer工具对真实数据竞争进行判定进而标记样本数据,采用SMOTE增强算法使正负数据样本分布均衡化;最后构建并训练CNN-LSTM深度神经网络进行数据竞争检测.从DaCapo,JGF,IBM Contest,PJBench基准测试程序套件中分别选取26个不同应用领域的基准测试程序进行训练数据样本抽取和数据竞争检测,结果表明DeleRace的数据竞争检测准确率为96.79%,与目前已有的基于深度学习的检测方法DeepRace相比提升了4.65%.此外还将DeleRace与已有的动态数据竞争检测工具(Said和RVPredict)和静态数据竞争检测工具(SRD和ConRacer)进行比较,验证了DeleRace的有效性.
针对目前已有的基于深度学习的数据竞争检测方法提取特征单一和准确率低的问题,提出一种基于深度学习的数据竞争检测方法DeleRace,该方法首先利用程序静态分析工具WALA从多个实际应用程序中提取指令、方法和文件等多个级别的特征,对其向量化并构造训练样本数据;然后通过ConRacer工具对真实数据竞争进行判定进而标记样本数据,采用SMOTE增强算法使正负数据样本分布均衡化;最后构建并训练CNN-LSTM深度神经网络进行数据竞争检测.从DaCapo,JGF,IBM Contest,PJBench基准测试程序套件中分别选取26个不同应用领域的基准测试程序进行训练数据样本抽取和数据竞争检测,结果表明DeleRace的数据竞争检测准确率为96.79%,与目前已有的基于深度学习的检测方法DeepRace相比提升了4.65%.此外还将DeleRace与已有的动态数据竞争检测工具(Said和RVPredict)和静态数据竞争检测工具(SRD和ConRacer)进行比较,验证了DeleRace的有效性.
2022, 59(9): 1929-1946.
DOI: 10.7544/issn1000-1239.20220015
摘要:
自适应软件系统的模型偏差会导致诸多可靠性问题.对控制型自适应软件系统而言,其面临的模型偏差源自描述软件系统的标称模型在非确定运行环境中的漂移现象.现有模型偏差检测方法往往忽视了不同模型偏差之间的差异性,导致用户难以为其特定的应用场景选择合适的检测方法.针对这一问题,提出了一套特性指标,用于评估模型偏差检测方法在不同模型偏差场景下的适用性.该特性指标基于提出的模型偏差检测框架,系统分析了模型偏差检测过程中的重要因素,并提取控制信号强度、环境输入强度和非确定性强度作为量化的特性指标.基于这些特性指标,实验研究4种主流模型偏差检测方法在不同场景下的检测效果,并总结不同模型偏差检测方法对于自适应软件系统不同特性场景的适用性.
自适应软件系统的模型偏差会导致诸多可靠性问题.对控制型自适应软件系统而言,其面临的模型偏差源自描述软件系统的标称模型在非确定运行环境中的漂移现象.现有模型偏差检测方法往往忽视了不同模型偏差之间的差异性,导致用户难以为其特定的应用场景选择合适的检测方法.针对这一问题,提出了一套特性指标,用于评估模型偏差检测方法在不同模型偏差场景下的适用性.该特性指标基于提出的模型偏差检测框架,系统分析了模型偏差检测过程中的重要因素,并提取控制信号强度、环境输入强度和非确定性强度作为量化的特性指标.基于这些特性指标,实验研究4种主流模型偏差检测方法在不同场景下的检测效果,并总结不同模型偏差检测方法对于自适应软件系统不同特性场景的适用性.
2022, 59(9): 1947-1965.
DOI: 10.7544/issn1000-1239.20210829
摘要:
近年来,国内外在新一代知识图谱的关键技术和理论方面取得了一定进展,以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手等.然而,在大数据环境和新基建背景下,数据对象和交互方式的日益丰富和变化,对新一代知识图谱在基础理论、体系架构、关键技术等方面提出新的需求,带来新的挑战.将综述国内外新一代知识图谱的关键技术研究发展现状,重点从非结构化多模态数据组织与理解、大规模动态图谱表示学习与预训练模型、神经符号结合的知识更新与推理3方面对国内外研究的最新进展进行归纳、比较和分析.最后,就未来的技术挑战和研究方向进行展望.
近年来,国内外在新一代知识图谱的关键技术和理论方面取得了一定进展,以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手等.然而,在大数据环境和新基建背景下,数据对象和交互方式的日益丰富和变化,对新一代知识图谱在基础理论、体系架构、关键技术等方面提出新的需求,带来新的挑战.将综述国内外新一代知识图谱的关键技术研究发展现状,重点从非结构化多模态数据组织与理解、大规模动态图谱表示学习与预训练模型、神经符号结合的知识更新与推理3方面对国内外研究的最新进展进行归纳、比较和分析.最后,就未来的技术挑战和研究方向进行展望.
2022, 59(9): 1966-1979.
DOI: 10.7544/issn1000-1239.20210651
摘要:
知识图谱表示学习旨在通过学习的方法将知识图谱中的实体和关系映射到一个连续的低维向量空间而获得其向量表示.已有的知识图谱表示学习方法大多仅从三元组角度考虑实体间的单步关系,未能有效利用多步关系路径及其实体描述等重要信息,从而影响性能.针对上述问题,提出了一种融合关系路径与实体描述的知识图谱表示学习模型.首先,对知识图谱中的多步关系路径进行联合表示,将路径上的所有关系和实体相加,得到关系路径信息的表示;其次,使用BERT(bidirectional encoder representations from transformers)模型对实体描述信息进行编码,得到相对应的语义表示;最后,对知识图谱中的三元组表示、实体描述的语义表示以及关系路径的表示进行融合训练,得到融合向量表示.在FB15K,WN18,FB15K-237,WN18RR数据集上,对提出的模型和基准模型进行链接预测和三元组分类任务,实验结果表明,与现有的基准模型相比,该模型在2项任务中均具有更高的准确性,证明了方法的有效性和优越性.
知识图谱表示学习旨在通过学习的方法将知识图谱中的实体和关系映射到一个连续的低维向量空间而获得其向量表示.已有的知识图谱表示学习方法大多仅从三元组角度考虑实体间的单步关系,未能有效利用多步关系路径及其实体描述等重要信息,从而影响性能.针对上述问题,提出了一种融合关系路径与实体描述的知识图谱表示学习模型.首先,对知识图谱中的多步关系路径进行联合表示,将路径上的所有关系和实体相加,得到关系路径信息的表示;其次,使用BERT(bidirectional encoder representations from transformers)模型对实体描述信息进行编码,得到相对应的语义表示;最后,对知识图谱中的三元组表示、实体描述的语义表示以及关系路径的表示进行融合训练,得到融合向量表示.在FB15K,WN18,FB15K-237,WN18RR数据集上,对提出的模型和基准模型进行链接预测和三元组分类任务,实验结果表明,与现有的基准模型相比,该模型在2项任务中均具有更高的准确性,证明了方法的有效性和优越性.
2022, 59(9): 1980-1992.
DOI: 10.7544/issn1000-1239.20210078
摘要:
实体关系联合抽取的目的是从非结构化文本中同时提取实体提及和关系事实,是知识图构建的关键步骤,也是许多自然语言处理中高级任务的基础.现有工作大都采用了分阶段的联合抽取方法来处理文本中同时存在的多个三元组和实体重叠情况下的三元组抽取问题,虽然取得了合理的性能提升,但都存在严重的曝光偏差问题.对此,提出了一种名为融合关系表达向量(fusional relation expression embedding, FREE)的新方法,通过融合关系表达向量来有效缓解曝光偏差问题.此外,提出了一种称为条件层规范化层的新特征融合层来更有效地融合先验信息.在2个广泛使用的数据集上进行了大量对比实验,结果表明该方法相较于当前最先进的基线方法具有显著优势,可以更有效地处理各种情况,并在不牺牲效率的前提下取得了与当前针对曝光偏差问题的先进方法相当的性能.
实体关系联合抽取的目的是从非结构化文本中同时提取实体提及和关系事实,是知识图构建的关键步骤,也是许多自然语言处理中高级任务的基础.现有工作大都采用了分阶段的联合抽取方法来处理文本中同时存在的多个三元组和实体重叠情况下的三元组抽取问题,虽然取得了合理的性能提升,但都存在严重的曝光偏差问题.对此,提出了一种名为融合关系表达向量(fusional relation expression embedding, FREE)的新方法,通过融合关系表达向量来有效缓解曝光偏差问题.此外,提出了一种称为条件层规范化层的新特征融合层来更有效地融合先验信息.在2个广泛使用的数据集上进行了大量对比实验,结果表明该方法相较于当前最先进的基线方法具有显著优势,可以更有效地处理各种情况,并在不牺牲效率的前提下取得了与当前针对曝光偏差问题的先进方法相当的性能.
2022, 59(9): 1993-2002.
DOI: 10.7544/issn1000-1239.20210475
摘要:
深度学习的快速发展和关联学习的深度研究,使得跨模态检索的性能有了很大提升.跨模态检索研究面临的挑战是:不同模态的数据在高层语义上具有关联关系,但在底层特征上存在异构鸿沟.现有方法主要通过单个相关性约束将不同模态的特征映射到具有一定相关性的特征空间中来解决底层特征上的异构鸿沟问题.然而,表征学习表明,不同层次的特征在帮助模型最终性能的提升上都会起作用.所以,现有方法学习到的单一特征空间的关联性是弱的,即该特征空间可能不是最优的检索空间.为解决该问题,提出了基于关联特征传播的跨模态检索模型,其基本思想是强化深度网络各层之间的关联性,即前一层具有一定关联的特征经过非线性变化传到后一层,有利于找到使2种模态关联性更强的特征空间.通过在Wikipedia,Pascal数据集上的大量实验验证得到,该方法提升了平均精度均值.
深度学习的快速发展和关联学习的深度研究,使得跨模态检索的性能有了很大提升.跨模态检索研究面临的挑战是:不同模态的数据在高层语义上具有关联关系,但在底层特征上存在异构鸿沟.现有方法主要通过单个相关性约束将不同模态的特征映射到具有一定相关性的特征空间中来解决底层特征上的异构鸿沟问题.然而,表征学习表明,不同层次的特征在帮助模型最终性能的提升上都会起作用.所以,现有方法学习到的单一特征空间的关联性是弱的,即该特征空间可能不是最优的检索空间.为解决该问题,提出了基于关联特征传播的跨模态检索模型,其基本思想是强化深度网络各层之间的关联性,即前一层具有一定关联的特征经过非线性变化传到后一层,有利于找到使2种模态关联性更强的特征空间.通过在Wikipedia,Pascal数据集上的大量实验验证得到,该方法提升了平均精度均值.
2022, 59(9): 2003-2014.
DOI: 10.7544/issn1000-1239.20210699
摘要:
文本情感分类是自然语言处理领域的挑战性研究课题.基于词典的方法和传统基于机器学习方法分别依赖高质量的情感词典和鲁棒的特征工程,而多数深度学习方法的性能则依赖大规模人工标注数据集.幸运的是,不同社交平台用户生成了大量带标签的舆情文本,这些文本可以作为弱标注数据集被用于情感分类任务,但是弱标注数据集中的噪声样本会对训练过程产生负面影响.提出了一种用于小样本情感分类任务的弱监督对比学习(weakly-supervised contrastive learning, WCL)框架,旨在学习海量带噪声的用户标记数据中的情感语义,同时挖掘少量人工标注数据中潜在的类间对比模式.该框架包括2个步骤:首先,设计了一种弱监督预训练策略来削弱噪声数据的影响;其次,在有监督微调阶段引入对比学习策略来捕获少量有标注数据的对比模式.在亚马逊评论数据集上评估了所提出的方法,实验结果表明所提出的方法显著优于其他同类对比方法.在仅使用0.5%(即32个样本)比例的有标注数据集进行微调的情况下,所提出方法的性能依然超出其他深度方法.
文本情感分类是自然语言处理领域的挑战性研究课题.基于词典的方法和传统基于机器学习方法分别依赖高质量的情感词典和鲁棒的特征工程,而多数深度学习方法的性能则依赖大规模人工标注数据集.幸运的是,不同社交平台用户生成了大量带标签的舆情文本,这些文本可以作为弱标注数据集被用于情感分类任务,但是弱标注数据集中的噪声样本会对训练过程产生负面影响.提出了一种用于小样本情感分类任务的弱监督对比学习(weakly-supervised contrastive learning, WCL)框架,旨在学习海量带噪声的用户标记数据中的情感语义,同时挖掘少量人工标注数据中潜在的类间对比模式.该框架包括2个步骤:首先,设计了一种弱监督预训练策略来削弱噪声数据的影响;其次,在有监督微调阶段引入对比学习策略来捕获少量有标注数据的对比模式.在亚马逊评论数据集上评估了所提出的方法,实验结果表明所提出的方法显著优于其他同类对比方法.在仅使用0.5%(即32个样本)比例的有标注数据集进行微调的情况下,所提出方法的性能依然超出其他深度方法.
2022, 59(9): 2015-2026.
DOI: 10.7544/issn1000-1239.20210467
摘要:
信任预测常用于推荐系统及交易平台,大多数学者研究基于某一个网络的信任预测,目前由于大多数网络缺乏标签,所以通过某一网络预测另一个网络的社会关系很有必要.利用BP神经网络结合非对称tri-training构建模型的方法存在2个问题:1)BP神经网络反向传播调整误差需要时间长;2)该模型只有2个分类器产生伪标签,这需要设置专家阈值.针对该模型存在的结构和速度问题,提出了改进的基于tri-training和极限学习机的跨领域信任预测模型,结合tri-training模型和非对称tri-training模型进行类似迁移学习的方法对网络进行预测,采用速度更快的极限学习机分类器,根据“少数服从多数”的投票机制,利用tri-training模型产生伪标签.实验测试特殊特征加入的影响,且在6个数据集上与其他已有算法进行对比,实验表明模型在召回率和稳定性方面优于其他算法.
信任预测常用于推荐系统及交易平台,大多数学者研究基于某一个网络的信任预测,目前由于大多数网络缺乏标签,所以通过某一网络预测另一个网络的社会关系很有必要.利用BP神经网络结合非对称tri-training构建模型的方法存在2个问题:1)BP神经网络反向传播调整误差需要时间长;2)该模型只有2个分类器产生伪标签,这需要设置专家阈值.针对该模型存在的结构和速度问题,提出了改进的基于tri-training和极限学习机的跨领域信任预测模型,结合tri-training模型和非对称tri-training模型进行类似迁移学习的方法对网络进行预测,采用速度更快的极限学习机分类器,根据“少数服从多数”的投票机制,利用tri-training模型产生伪标签.实验测试特殊特征加入的影响,且在6个数据集上与其他已有算法进行对比,实验表明模型在召回率和稳定性方面优于其他算法.
2022, 59(9): 2027-2038.
DOI: 10.7544/issn1000-1239.20210196
摘要:
为了在不同的粒度下对同一对象进行观察、表示、分析和决策,提出了多尺度信息系统.考虑到一个对象在属性的各个尺度上的取值为多值的情况,多尺度信息系统被进一步扩展到多尺度集值信息系统.然而,在现有的多尺度集值信息系统中,所有属性必须具有相同的尺度级数,使得每个属性都只能在同一个尺度下进行组合.并且,最优尺度选择仅考虑决策系统的一致性或不确定性,忽略了实际应用中的决策代价问题.针对上述问题,定义了一种具有代价的广义多尺度集值决策系统,分析了决策系统的不确定性和代价随尺度组合的变化趋势.然后,为了提高最优尺度选择的时间效率,提出了一种基于三支决策思想的尺度空间更新方法.最后,结合用户需求,给出了最小化不确定性和代价的最优尺度选择方法.实验结果表明,该方法不仅可以结合不确定性和代价得到最优尺度解,并且与传统的Lattic Mode相比,能有效地提高计算效率.
为了在不同的粒度下对同一对象进行观察、表示、分析和决策,提出了多尺度信息系统.考虑到一个对象在属性的各个尺度上的取值为多值的情况,多尺度信息系统被进一步扩展到多尺度集值信息系统.然而,在现有的多尺度集值信息系统中,所有属性必须具有相同的尺度级数,使得每个属性都只能在同一个尺度下进行组合.并且,最优尺度选择仅考虑决策系统的一致性或不确定性,忽略了实际应用中的决策代价问题.针对上述问题,定义了一种具有代价的广义多尺度集值决策系统,分析了决策系统的不确定性和代价随尺度组合的变化趋势.然后,为了提高最优尺度选择的时间效率,提出了一种基于三支决策思想的尺度空间更新方法.最后,结合用户需求,给出了最小化不确定性和代价的最优尺度选择方法.实验结果表明,该方法不仅可以结合不确定性和代价得到最优尺度解,并且与传统的Lattic Mode相比,能有效地提高计算效率.
2022, 59(9): 2039-2050.
DOI: 10.7544/issn1000-1239.20210474
摘要:
自动驾驶汽车、看护机器人等形式多样的智能体在人类生活中扮演着越来越重要的角色,其伦理问题受到了广泛关注.为使智能体具备遵守人类伦理规范的能力,提出了一种基于众包和强化学习的伦理智能体训练方法.首先,采用众包获取行为示例数据集,并借助于文本聚类、关联分析等技术生成情节图及轨迹树,以定义智能体的基本行为空间、表明行为的发生顺序;其次,提出元伦理行为的概念,通过对不同场景中的相似行为进行概括,扩展伦理智能体的行为空间,进一步基于《中学生日常行为规范》提取了9种元伦理行为;最后,提出了行为分级机制及与之对应的强化学习奖惩函数,以此为基础完成伦理智能体训练.通过模拟人类生活中的买药场景,分别使用Q-learning算法及DQN(deep Q-networks)算法完成了伦理智能体的训练实验.实验结果表明,训练后的智能体能够以符合伦理的行为方式完成预期任务,验证了所提方法的合理性与有效性.
自动驾驶汽车、看护机器人等形式多样的智能体在人类生活中扮演着越来越重要的角色,其伦理问题受到了广泛关注.为使智能体具备遵守人类伦理规范的能力,提出了一种基于众包和强化学习的伦理智能体训练方法.首先,采用众包获取行为示例数据集,并借助于文本聚类、关联分析等技术生成情节图及轨迹树,以定义智能体的基本行为空间、表明行为的发生顺序;其次,提出元伦理行为的概念,通过对不同场景中的相似行为进行概括,扩展伦理智能体的行为空间,进一步基于《中学生日常行为规范》提取了9种元伦理行为;最后,提出了行为分级机制及与之对应的强化学习奖惩函数,以此为基础完成伦理智能体训练.通过模拟人类生活中的买药场景,分别使用Q-learning算法及DQN(deep Q-networks)算法完成了伦理智能体的训练实验.实验结果表明,训练后的智能体能够以符合伦理的行为方式完成预期任务,验证了所提方法的合理性与有效性.
2022, 59(9): 2051-2065.
DOI: 10.7544/issn1000-1239.20210134
摘要:
药物一般通过抑制或激活人体中某些蛋白活性反应进而发挥效能,因此预测蛋白和药物的相互作用对新药开发的筛选工作极为关键.然而,基于传统方法在湿实验中进行该类实验需要耗费巨大的人力和物力.为解决这一问题,提出了一种基于自注意力机制和多药物特征融合的蛋白质-药物相互作用预测算法.首先,合理融合基于药物分子结构特征的Morgan指纹、Mol2Vec表示向量以及消息传递网络所提特征;随后,将融合结果对由密集型卷积所提取的蛋白特征做注意力加权;接着综合两者特征,利用自注意力机制和双向门控循环单元预测蛋白质药物相互作用;最后,根据训练模型设计了可应用的预测系统,并展示了其在筛选治愈阿尔兹海默症药物的具体使用方法和效果.实验结果表明,较现有的预测方法,新方法在BindingDB,Kinase,Human,C.elegans数据集上均达到了更好的预测效果.最优的AUC分别达到了0.963,0.937,0.983,0.990,较同类方法具有十分明显的优势.
药物一般通过抑制或激活人体中某些蛋白活性反应进而发挥效能,因此预测蛋白和药物的相互作用对新药开发的筛选工作极为关键.然而,基于传统方法在湿实验中进行该类实验需要耗费巨大的人力和物力.为解决这一问题,提出了一种基于自注意力机制和多药物特征融合的蛋白质-药物相互作用预测算法.首先,合理融合基于药物分子结构特征的Morgan指纹、Mol2Vec表示向量以及消息传递网络所提特征;随后,将融合结果对由密集型卷积所提取的蛋白特征做注意力加权;接着综合两者特征,利用自注意力机制和双向门控循环单元预测蛋白质药物相互作用;最后,根据训练模型设计了可应用的预测系统,并展示了其在筛选治愈阿尔兹海默症药物的具体使用方法和效果.实验结果表明,较现有的预测方法,新方法在BindingDB,Kinase,Human,C.elegans数据集上均达到了更好的预测效果.最优的AUC分别达到了0.963,0.937,0.983,0.990,较同类方法具有十分明显的优势.
2022, 59(9): 2066-2074.
DOI: 10.7544/issn1000-1239.20210539
摘要:
智能决策是人工智能的重要组成部分.在形式概念分析中,决策表现为决策背景上的决策蕴涵,模糊决策蕴涵则是建立在模糊决策背景上的决策蕴涵,其前件和后件分别为条件属性和决策属性.因为模糊决策蕴涵可以避免条件属性之间和决策属性之间生成模糊属性蕴涵,因而具有更广泛的应用意义.确定化、无调节的知识获取方式对实际应用的适应性差.因此,需要将不可调节的知识发现方式拓展到参数化可调节的知识发现方式.语气真值算子和阈值作为2种参数化策略在具有模糊属性的形式概念分析中发挥着重要的作用.现有的模糊决策蕴涵模型仅考虑到语气真值算子的可变,可调节性较差,考虑阈值参数化策略的研究较少.以完备剩余格为参考框架,将语气真值算子和阈值2种参数化策略引入模糊决策蕴涵,提出含参模糊决策蕴涵,研究其语义特征,证明一些基本性质,并提出3条推理规则,证明其合理性和完备性.在实际生活中,用户可以选择合适的阈值来获取需要的知识,并且可以使用推理规则来进行知识推理,提升模糊决策蕴涵的可调节性和应用价值.
智能决策是人工智能的重要组成部分.在形式概念分析中,决策表现为决策背景上的决策蕴涵,模糊决策蕴涵则是建立在模糊决策背景上的决策蕴涵,其前件和后件分别为条件属性和决策属性.因为模糊决策蕴涵可以避免条件属性之间和决策属性之间生成模糊属性蕴涵,因而具有更广泛的应用意义.确定化、无调节的知识获取方式对实际应用的适应性差.因此,需要将不可调节的知识发现方式拓展到参数化可调节的知识发现方式.语气真值算子和阈值作为2种参数化策略在具有模糊属性的形式概念分析中发挥着重要的作用.现有的模糊决策蕴涵模型仅考虑到语气真值算子的可变,可调节性较差,考虑阈值参数化策略的研究较少.以完备剩余格为参考框架,将语气真值算子和阈值2种参数化策略引入模糊决策蕴涵,提出含参模糊决策蕴涵,研究其语义特征,证明一些基本性质,并提出3条推理规则,证明其合理性和完备性.在实际生活中,用户可以选择合适的阈值来获取需要的知识,并且可以使用推理规则来进行知识推理,提升模糊决策蕴涵的可调节性和应用价值.
2022, 59(9): 2075-2088.
DOI: 10.7544/issn1000-1239.20210009
摘要:
在由锚节点和目标点组成的节点定位网络中,传统的隐私保护求和(privacy-preserving summation, PPS)算法要求所有参与通信的节点均生成并传输1组干扰矩阵,导致了非必要的通信开销.为打破该局限,提出了k型隐私保护求和(privacy-preserving summation with k, PPS-k)算法,随机指定k个节点生成和传输干扰矩阵,干扰矩阵的生成和传输过程可通过改变k值动态调整.PPS-k兼顾隐私保护能力与通信量限制,具有较高的灵活性.之后,将PPS-k应用于具体的定位场景,提出对应的隐私保护节点定位协议.提出隐私保护率的概念,利用估计其他节点隐私信息所需要的额外方程数与隐私信息中未知量个数之比评估隐私保护能力.与传统的评估标准相比,消除了隐私信息维度对算法隐私保护性能评估结果的影响.仿真结果验证了理论分析的有效性.
在由锚节点和目标点组成的节点定位网络中,传统的隐私保护求和(privacy-preserving summation, PPS)算法要求所有参与通信的节点均生成并传输1组干扰矩阵,导致了非必要的通信开销.为打破该局限,提出了k型隐私保护求和(privacy-preserving summation with k, PPS-k)算法,随机指定k个节点生成和传输干扰矩阵,干扰矩阵的生成和传输过程可通过改变k值动态调整.PPS-k兼顾隐私保护能力与通信量限制,具有较高的灵活性.之后,将PPS-k应用于具体的定位场景,提出对应的隐私保护节点定位协议.提出隐私保护率的概念,利用估计其他节点隐私信息所需要的额外方程数与隐私信息中未知量个数之比评估隐私保护能力.与传统的评估标准相比,消除了隐私信息维度对算法隐私保护性能评估结果的影响.仿真结果验证了理论分析的有效性.
2022, 59(9): 2089-2100.
DOI: 10.7544/issn1000-1239.20210495
摘要:
图像密文可逆信息隐藏是一种在加密图像上嵌入附加的信息,并能无损地提取信息和恢复原始图像的技术.由于该技术不仅能有效地实现信息传递,还能保障传输载体的安全性,所以随着云计算的发展和对隐私保护的需求的日益增长,近年来图像密文可逆信息隐藏逐渐得到广泛的关注.基于像素预测和分块标记的图像密文可逆信息隐藏算法,重点研究如何在保障安全性的同时,实现高嵌入容量和完全可逆性.在预处理阶段,采用中值预测的方法计算得到图像的预测误差.不同于之前的算法,该算法使用最高有效位表示预测误差的符号位,其余位平面表示数值位后得到预测误差位平面,并将预测误差位平面分块后自适应地标记.所得到的标记序列具有稀疏特征,可以使用算术编码有效压缩.在加密阶段,使用密钥生成伪随机矩阵,对原始图像的像素执行异或操作.在信息隐藏阶段,对于每种分块使用不同方法嵌入附加信息.最后根据相应密钥即可无损地提取信息并恢复原始图像.实验结果表明,提出算法的最终结果相较于此前的同类算法而言,在保证安全性和可逆性的同时,嵌入容量得到明显提升.
图像密文可逆信息隐藏是一种在加密图像上嵌入附加的信息,并能无损地提取信息和恢复原始图像的技术.由于该技术不仅能有效地实现信息传递,还能保障传输载体的安全性,所以随着云计算的发展和对隐私保护的需求的日益增长,近年来图像密文可逆信息隐藏逐渐得到广泛的关注.基于像素预测和分块标记的图像密文可逆信息隐藏算法,重点研究如何在保障安全性的同时,实现高嵌入容量和完全可逆性.在预处理阶段,采用中值预测的方法计算得到图像的预测误差.不同于之前的算法,该算法使用最高有效位表示预测误差的符号位,其余位平面表示数值位后得到预测误差位平面,并将预测误差位平面分块后自适应地标记.所得到的标记序列具有稀疏特征,可以使用算术编码有效压缩.在加密阶段,使用密钥生成伪随机矩阵,对原始图像的像素执行异或操作.在信息隐藏阶段,对于每种分块使用不同方法嵌入附加信息.最后根据相应密钥即可无损地提取信息并恢复原始图像.实验结果表明,提出算法的最终结果相较于此前的同类算法而言,在保证安全性和可逆性的同时,嵌入容量得到明显提升.