2012年 第49卷 第6期
摘要:
信息-物理融合系统(Cyber-Physical System,CPS)集成了计算系统与物理系统,并通过嵌入式计算机与网络实现了两者之间的协作和融合,将对人们的生产和生活方式产生重要影响.CPS是一个全新的研究领域,利用现有基础理论和技术设计CPS时面临着众多问题.介绍了CPS的概念、特点和体系结构,分析了与嵌入式系统、网络的关联,从计算系统、网络系统和控制系统3个方面概括了CPS设计面临的主要挑战,并着重探讨了当前一些可用于CPS设计的理论和技术以及CPS研究的最新进展,指出CPS当前的发展应以解决系统抽象层次设计、系统建模、体系结构设计、数据传输和管理、子系统集成方面的问题作为其下一步发展主要的研究方向,并提出了一些可行的解决办法,可为相关研究提供参考.
信息-物理融合系统(Cyber-Physical System,CPS)集成了计算系统与物理系统,并通过嵌入式计算机与网络实现了两者之间的协作和融合,将对人们的生产和生活方式产生重要影响.CPS是一个全新的研究领域,利用现有基础理论和技术设计CPS时面临着众多问题.介绍了CPS的概念、特点和体系结构,分析了与嵌入式系统、网络的关联,从计算系统、网络系统和控制系统3个方面概括了CPS设计面临的主要挑战,并着重探讨了当前一些可用于CPS设计的理论和技术以及CPS研究的最新进展,指出CPS当前的发展应以解决系统抽象层次设计、系统建模、体系结构设计、数据传输和管理、子系统集成方面的问题作为其下一步发展主要的研究方向,并提出了一些可行的解决办法,可为相关研究提供参考.
摘要:
主动学习算法通过选择信息含量大的未标记样例交由专家进行标记,多次循环使分类器的正确率逐步提高,进而在标记总代价最小的情况下获得分类器的强泛化能力,这一技术引起了国内外研究人员的关注.侧重从采样策略的角度,详细介绍了主动学习中学习引擎和采样引擎的工作过程,总结了主动学习算法的理论研究成果,详细评述了主动学习的研究现状和发展动态.首先,针对采样策略选择样例的不同方式将主动学习算法划分为不同类型,进而,对基于不同采样策略的主动学习算法进行了深入地分析和比较,讨论了各种算法适用的应用领域及其优缺点.最后指出了存在的开放性问题和进一步的研究方向.
主动学习算法通过选择信息含量大的未标记样例交由专家进行标记,多次循环使分类器的正确率逐步提高,进而在标记总代价最小的情况下获得分类器的强泛化能力,这一技术引起了国内外研究人员的关注.侧重从采样策略的角度,详细介绍了主动学习中学习引擎和采样引擎的工作过程,总结了主动学习算法的理论研究成果,详细评述了主动学习的研究现状和发展动态.首先,针对采样策略选择样例的不同方式将主动学习算法划分为不同类型,进而,对基于不同采样策略的主动学习算法进行了深入地分析和比较,讨论了各种算法适用的应用领域及其优缺点.最后指出了存在的开放性问题和进一步的研究方向.
摘要:
网络编码在提高多射频无线Mesh网组播吞吐量的同时也增加了组播传输时延.针对该问题,在建模分析基于网络编码的多射频无线Mesh网组播传输时延特征的基础上,设计了平均组播传输时延(AMTD)的计算方法并给出时延整体优化方案.首先提出1个由双排队系统串联构成的多射频组播模型.其次,运用该模型对组播传输时延特征进行分析,通过计算每个排队系统平均等待时间之和给出AMTD计算公式,得到时延与各网络参数之间的量化关系.最后通过理论分析和仿真实验指明如何调整多个网络参数以优化平均组播传输时延.结果表明,网络状态确定时,同样的射频比例在不同网络编码体积下未必总是最优,应用提出的AMTD公式恰当调整射频用于收/发的比值,可以最优化平均组播传输时延.
网络编码在提高多射频无线Mesh网组播吞吐量的同时也增加了组播传输时延.针对该问题,在建模分析基于网络编码的多射频无线Mesh网组播传输时延特征的基础上,设计了平均组播传输时延(AMTD)的计算方法并给出时延整体优化方案.首先提出1个由双排队系统串联构成的多射频组播模型.其次,运用该模型对组播传输时延特征进行分析,通过计算每个排队系统平均等待时间之和给出AMTD计算公式,得到时延与各网络参数之间的量化关系.最后通过理论分析和仿真实验指明如何调整多个网络参数以优化平均组播传输时延.结果表明,网络状态确定时,同样的射频比例在不同网络编码体积下未必总是最优,应用提出的AMTD公式恰当调整射频用于收/发的比值,可以最优化平均组播传输时延.
摘要:
无稳定拓扑使时延容忍网络(delay tolerant networks, DTN)路由协议主要通过增加冗余数据包副本提高路由性能.社交网络是DTN的一种典型应用场景,但由于其网络规模相对较大,当网络负载高时,通常的DTN路由不能有效控制数据包副本的数量,从而产生大量丢包导致性能下降.借鉴MANET网络中利用分簇结构控制网络冗余路由数据包的思想,通过分析社交网络中节点的移动模型,定义了在社交关系的约束下,聚合移动规律相近的节点构成最近社交圈的节点簇组成策略.提出了一种基于该分簇结构的分为簇外喷射、簇间转发和簇内传染3个阶段的社交时延网络路由协议.实验证明,这种基于最近社交圈分簇结构的路由能有效地控制冗余数据包副本的产生,并在高网络负载的情况下仍然能够达到较好的性能.
无稳定拓扑使时延容忍网络(delay tolerant networks, DTN)路由协议主要通过增加冗余数据包副本提高路由性能.社交网络是DTN的一种典型应用场景,但由于其网络规模相对较大,当网络负载高时,通常的DTN路由不能有效控制数据包副本的数量,从而产生大量丢包导致性能下降.借鉴MANET网络中利用分簇结构控制网络冗余路由数据包的思想,通过分析社交网络中节点的移动模型,定义了在社交关系的约束下,聚合移动规律相近的节点构成最近社交圈的节点簇组成策略.提出了一种基于该分簇结构的分为簇外喷射、簇间转发和簇内传染3个阶段的社交时延网络路由协议.实验证明,这种基于最近社交圈分簇结构的路由能有效地控制冗余数据包副本的产生,并在高网络负载的情况下仍然能够达到较好的性能.
摘要:
由于节点部署不均匀,传感器网络存在覆盖漏洞即监测盲区,监测盲区影响被监测区域环境数据收集的精确性,给无线传感器网络各种应用带来了巨大困难.以往解决这一问题的主要手段之一是从覆盖率出发,部署新节点缩小监测盲区.但随着传感器网络的规模增大,这种依赖部署新节点达到全面覆盖监测环境的方法很难实现.另一种方法则是通过盲区邻域节点对盲区插值预测,评价盲区的数据.为此,提出一种新的滑动邻域插值盲区评价算法,该算法基于三角剖分技术,迭代筛选出与预测点空间相关性强的传感节点集,然后利用节点采样值对预测点进行估算,以获取插值点误差最小的估计值.实验结果表明,所提出的滑动邻域插值算法能有效估计监测盲区预测点的数据与缺失数据,具有可靠、稳定的估计性能,并可支持网内任意点的实时估计.
由于节点部署不均匀,传感器网络存在覆盖漏洞即监测盲区,监测盲区影响被监测区域环境数据收集的精确性,给无线传感器网络各种应用带来了巨大困难.以往解决这一问题的主要手段之一是从覆盖率出发,部署新节点缩小监测盲区.但随着传感器网络的规模增大,这种依赖部署新节点达到全面覆盖监测环境的方法很难实现.另一种方法则是通过盲区邻域节点对盲区插值预测,评价盲区的数据.为此,提出一种新的滑动邻域插值盲区评价算法,该算法基于三角剖分技术,迭代筛选出与预测点空间相关性强的传感节点集,然后利用节点采样值对预测点进行估算,以获取插值点误差最小的估计值.实验结果表明,所提出的滑动邻域插值算法能有效估计监测盲区预测点的数据与缺失数据,具有可靠、稳定的估计性能,并可支持网内任意点的实时估计.
摘要:
BitTorrent系统中节点的搭便车行为严重影响系统的健壮性和稳定性.针对BitTorrent系统中搭便车行为抑制机制存在的不足,提出一种基于节点全局信任值的区分服务机制.在该机制中,Tracker服务器依据节点反馈的本地信任值计算节点全局信任值,依据全局信任值识别贡献节点与搭便车节点,对两类节点采取区分服务策略:为贡献节点与搭便车节点分别返回其同类对等节点,使搭便车节点无法与贡献节点建立连接进而获取文件资源;在贡献节点中又进一步区分高贡献节点和普通贡献节点,引入返回比例因子为其提供差异服务,使高贡献节点获得更快的下载速度.实验表明,该机制能有效隔离并惩罚搭便车节点,奖励高贡献节点.
BitTorrent系统中节点的搭便车行为严重影响系统的健壮性和稳定性.针对BitTorrent系统中搭便车行为抑制机制存在的不足,提出一种基于节点全局信任值的区分服务机制.在该机制中,Tracker服务器依据节点反馈的本地信任值计算节点全局信任值,依据全局信任值识别贡献节点与搭便车节点,对两类节点采取区分服务策略:为贡献节点与搭便车节点分别返回其同类对等节点,使搭便车节点无法与贡献节点建立连接进而获取文件资源;在贡献节点中又进一步区分高贡献节点和普通贡献节点,引入返回比例因子为其提供差异服务,使高贡献节点获得更快的下载速度.实验表明,该机制能有效隔离并惩罚搭便车节点,奖励高贡献节点.
摘要:
基于扩展有限状态机(EFSM)模型自动生成测试序列可以提高测试效率.由于EFSM模型包含丰富的变量和谓词条件,它们之间的冲突可能导致自动生成的测试序列不可执行.对EFSM变迁及变迁之间的关联关系进行了详细的讨论和分析,定义了一个邻接变迁关联图,提出了一种自适应EFSM可执行测试序列生成算法.新算法首先根据变量和谓词包含情况对变迁进行分类,然后深入挖掘了邻接变迁之间的关联关系,最后,基于自适应预测搜索函数启发式引导可达性分析树扩展生成可执行的测试序列.实验数据表明,与宽度优先可达性分析方法相比,新算法可以有效降低可达性分析过程中产生状态空间爆炸问题的概率,从而提高测试序列自动生成的效率.在最坏的情况下,新算法的计算时空复杂度也等同于宽度优先算法.
基于扩展有限状态机(EFSM)模型自动生成测试序列可以提高测试效率.由于EFSM模型包含丰富的变量和谓词条件,它们之间的冲突可能导致自动生成的测试序列不可执行.对EFSM变迁及变迁之间的关联关系进行了详细的讨论和分析,定义了一个邻接变迁关联图,提出了一种自适应EFSM可执行测试序列生成算法.新算法首先根据变量和谓词包含情况对变迁进行分类,然后深入挖掘了邻接变迁之间的关联关系,最后,基于自适应预测搜索函数启发式引导可达性分析树扩展生成可执行的测试序列.实验数据表明,与宽度优先可达性分析方法相比,新算法可以有效降低可达性分析过程中产生状态空间爆炸问题的概率,从而提高测试序列自动生成的效率.在最坏的情况下,新算法的计算时空复杂度也等同于宽度优先算法.
摘要:
为解决Byte-Focal结构存在的计算复杂度较高及“伪队头阻塞”等问题,提出一种基于隐式Flow Splitter的负载均衡交换结构(load balanced switch based on implicit flow splitter, LB-IFS).LB-IFS在输入端引入双缓冲模式和两步调度策略,较好地解决了“伪队头阻塞”问题且能使信元以不失序的状态离开第1级crossbar,同时输入端设置隐式Flow Splitter为每个信元分配一个理论转发路径;输出端利用VIQ(virtual input queuing)结构的重排序缓存,结合理论转发路径,方便地实现信元的有序转发.理论分析和仿真都表明:LB-IFS能保证全流程计算复杂度均为O(1)且其时延性能优于Byte-Focal.
为解决Byte-Focal结构存在的计算复杂度较高及“伪队头阻塞”等问题,提出一种基于隐式Flow Splitter的负载均衡交换结构(load balanced switch based on implicit flow splitter, LB-IFS).LB-IFS在输入端引入双缓冲模式和两步调度策略,较好地解决了“伪队头阻塞”问题且能使信元以不失序的状态离开第1级crossbar,同时输入端设置隐式Flow Splitter为每个信元分配一个理论转发路径;输出端利用VIQ(virtual input queuing)结构的重排序缓存,结合理论转发路径,方便地实现信元的有序转发.理论分析和仿真都表明:LB-IFS能保证全流程计算复杂度均为O(1)且其时延性能优于Byte-Focal.
摘要:
无线传感器网络是一种没有基础设施的无线自组织网络,它在军事、环境检测和智能家居等诸多领域具有广泛的应用.在无线传感器网络的绝大多数应用中,只有当节点和被感知的物体的位置是可知的,节点获得的信息才有意义.因此,节点定位技术是无线传感器网络的关键技术之一.近年来,粒子群优化算法(particle swarm optimization, PSO)等智能算法被用于无线传感器网络节点定位技术的研究.在粒子群优化算法定位技术研究的基础上,提出的带有罚函数的无线传感器网络粒子群定位算法(particle swarm optimization with penalty function, PSOPF)利用罚函数来加快算法的收敛速度和提高定位算法的定位精度.实验结果表明,和原有的PSO定位算法相比较,PSOPF算法具有更高的定位精度和更快的收敛速度.
无线传感器网络是一种没有基础设施的无线自组织网络,它在军事、环境检测和智能家居等诸多领域具有广泛的应用.在无线传感器网络的绝大多数应用中,只有当节点和被感知的物体的位置是可知的,节点获得的信息才有意义.因此,节点定位技术是无线传感器网络的关键技术之一.近年来,粒子群优化算法(particle swarm optimization, PSO)等智能算法被用于无线传感器网络节点定位技术的研究.在粒子群优化算法定位技术研究的基础上,提出的带有罚函数的无线传感器网络粒子群定位算法(particle swarm optimization with penalty function, PSOPF)利用罚函数来加快算法的收敛速度和提高定位算法的定位精度.实验结果表明,和原有的PSO定位算法相比较,PSOPF算法具有更高的定位精度和更快的收敛速度.
摘要:
随着信息化的发展,“信息孤岛”成为阻碍跨部门、跨域信息资源共享的主要问题,而解决这个问题的关键技术就是互操作.不同部门之间实现互操作的前提是建立良好的信任关系.以信息系统互操作为背景,从组织信任关系的角度,对互操作的信任机制进行了研究.在构建互操作联盟的基础上,一方面,从组织信任关系背景下,分析了影响互操作信任的定性和定量的因素,建立了互操作信任评价指标体系;另一方面,为符合互操作局部自治和动态变化的特点,研究了基于模糊变权理论的互操作信任动态综合评价方法.最后,通过仿真对上述研究内容的可行性进行了验证.通过分析证明该方法能够实现互操作信任的动态变化以及基于信任的互操作逻辑重构.
随着信息化的发展,“信息孤岛”成为阻碍跨部门、跨域信息资源共享的主要问题,而解决这个问题的关键技术就是互操作.不同部门之间实现互操作的前提是建立良好的信任关系.以信息系统互操作为背景,从组织信任关系的角度,对互操作的信任机制进行了研究.在构建互操作联盟的基础上,一方面,从组织信任关系背景下,分析了影响互操作信任的定性和定量的因素,建立了互操作信任评价指标体系;另一方面,为符合互操作局部自治和动态变化的特点,研究了基于模糊变权理论的互操作信任动态综合评价方法.最后,通过仿真对上述研究内容的可行性进行了验证.通过分析证明该方法能够实现互操作信任的动态变化以及基于信任的互操作逻辑重构.
摘要:
在流密码和分组密码的设计中,所用布尔函数应该具有好的密码学性质来抵抗已知的各种有效攻击.布尔函数的低次零化子空间维数与其补函数低次零化子空间维数之和是评价该函数抵抗代数攻击能力的一个重要参数.根据Maiorana-McFarland's(M-M)Bent函数和布尔置换之间的一一对应关系,给出了一组布尔函数组并证明了它们是线性无关的.借助所给的线性无关布尔函数组和布尔置换中向量函数非零线性组合均是平衡函数的特性,给出了一类特殊M-M Bent函数低次零化子空间的维数与其补函数低次零化子空间的维数之和的一个上限.就这类特殊M-M Bent函数而言,该上限低于已知的限.进一步给出了适合所有M-M Bent函数的新上限.
在流密码和分组密码的设计中,所用布尔函数应该具有好的密码学性质来抵抗已知的各种有效攻击.布尔函数的低次零化子空间维数与其补函数低次零化子空间维数之和是评价该函数抵抗代数攻击能力的一个重要参数.根据Maiorana-McFarland's(M-M)Bent函数和布尔置换之间的一一对应关系,给出了一组布尔函数组并证明了它们是线性无关的.借助所给的线性无关布尔函数组和布尔置换中向量函数非零线性组合均是平衡函数的特性,给出了一类特殊M-M Bent函数低次零化子空间的维数与其补函数低次零化子空间的维数之和的一个上限.就这类特殊M-M Bent函数而言,该上限低于已知的限.进一步给出了适合所有M-M Bent函数的新上限.
摘要:
模型选择问题是支持向量机的基本问题. 基于核矩阵近似计算和正则化路径,提出一个新的支持向量机模型选择方法. 首先,发展初步的近似模型选择理论,包括给出核矩阵近似算法KMA-α,证明KMA-α的近似误差界定理,进而得到支持向量机的模型近似误差界. 然后,提出近似模型选择算法AMSRP. 该算法应用KMA-α计算的核矩阵的低秩近似来提高支持向量机求解的效率,同时应用正则化路径算法来提高惩罚因子C参数调节的效率. 最后,通过标准数据集上的对比实验,验证了AMSRP的可行性和计算效率. 实验结果显示,AMSRP可在保证测试集准确率的前提下,显著地提高支持向量机模型选择的效率. 理论分析与实验结果表明,AMSRP是一合理、高效的模型选择算法.
模型选择问题是支持向量机的基本问题. 基于核矩阵近似计算和正则化路径,提出一个新的支持向量机模型选择方法. 首先,发展初步的近似模型选择理论,包括给出核矩阵近似算法KMA-α,证明KMA-α的近似误差界定理,进而得到支持向量机的模型近似误差界. 然后,提出近似模型选择算法AMSRP. 该算法应用KMA-α计算的核矩阵的低秩近似来提高支持向量机求解的效率,同时应用正则化路径算法来提高惩罚因子C参数调节的效率. 最后,通过标准数据集上的对比实验,验证了AMSRP的可行性和计算效率. 实验结果显示,AMSRP可在保证测试集准确率的前提下,显著地提高支持向量机模型选择的效率. 理论分析与实验结果表明,AMSRP是一合理、高效的模型选择算法.
摘要:
在信息检索和机器学习领域,大部分排序学习方法假设查询中的各个对象均满足独立同分布.虽然该假设简化了排序问题,却未能利用目标对象之间隐藏的相关性信息.在全监督排序和直推式排序2个问题中分别提出了新的方法,充分地利用了对象间的关系.在全监督排序问题中,将对象相关性映射为RBF Kernel,作为约束项加入优化目标,使得优化过程中越相似的对象打分越接近,即全局一致性思想.在直推式排序问题中,利用对象相关性将每个查询映射为图结构,设计了新的基于图结构的查询相似度度量,使得优化过程中越相似的查询,该查询内的对象对预测查询的影响越大.实验结果表明,加入对象之间的相关性提升了全监督排序算法和直推式排序算法的性能.
在信息检索和机器学习领域,大部分排序学习方法假设查询中的各个对象均满足独立同分布.虽然该假设简化了排序问题,却未能利用目标对象之间隐藏的相关性信息.在全监督排序和直推式排序2个问题中分别提出了新的方法,充分地利用了对象间的关系.在全监督排序问题中,将对象相关性映射为RBF Kernel,作为约束项加入优化目标,使得优化过程中越相似的对象打分越接近,即全局一致性思想.在直推式排序问题中,利用对象相关性将每个查询映射为图结构,设计了新的基于图结构的查询相似度度量,使得优化过程中越相似的查询,该查询内的对象对预测查询的影响越大.实验结果表明,加入对象之间的相关性提升了全监督排序算法和直推式排序算法的性能.
摘要:
在多目标最优化问题中,如何求解一组均匀散布在前沿界面上的有效解具有重要意义. MOEA/D是最近出现的一种杰出的多目标进化算法,当前沿界面的形状是某种已知的类型时,MOEA/D使用高级分解的方法容易求出均匀散布在前沿界面上的有效解. 然而,多目标优化问题的前沿界面的形状通常是未知的. 为了使MOEA/D能求出一般多目标优化问题的均匀散布的有效解,利用幂函数对目标进行数学变换,使变换后的多目标优化问题的前沿界面在算法的进化过程中逐渐接近希望得到的形状,提出了一种求解一般的多目标优化问题的MOEA/D算法的权重设计方法,并且讨论了经过数学变换后前沿界面的保距性问题. 采用建议的权重设计方法,MOEA/D更容易求出一般的多目标优化问题均匀散布的有效解. 数值结果验证了算法的有效性.
在多目标最优化问题中,如何求解一组均匀散布在前沿界面上的有效解具有重要意义. MOEA/D是最近出现的一种杰出的多目标进化算法,当前沿界面的形状是某种已知的类型时,MOEA/D使用高级分解的方法容易求出均匀散布在前沿界面上的有效解. 然而,多目标优化问题的前沿界面的形状通常是未知的. 为了使MOEA/D能求出一般多目标优化问题的均匀散布的有效解,利用幂函数对目标进行数学变换,使变换后的多目标优化问题的前沿界面在算法的进化过程中逐渐接近希望得到的形状,提出了一种求解一般的多目标优化问题的MOEA/D算法的权重设计方法,并且讨论了经过数学变换后前沿界面的保距性问题. 采用建议的权重设计方法,MOEA/D更容易求出一般的多目标优化问题均匀散布的有效解. 数值结果验证了算法的有效性.
摘要:
多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出, 然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方法的有效性.
多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出, 然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方法的有效性.
摘要:
为压缩一致性规划的状态空间,并加快一致性规划的求解速度,将常量引入到一致性规划中,定义一致性规划中的常量,形成新的知识表示“多值一致性规划任务”,定义多值一致性规划动作模型,提出一致性规划常量合成方法,给出一致性规划常量合成算法.该方法利用常量的特性在所有初始世界状态和所有实例动作中猜测、验证常量.理论分析和实验结果表明该算法能合成正确的一致性规划常量,生成多值一致性规划任务.为说明一致性规划常量的应用效果,把生成的多值一致性规划任务与规划解重用启发式结合求一致性规划解,并与规划系统CFF进行对比实验.实验结果表明求解质量和效率较高.
为压缩一致性规划的状态空间,并加快一致性规划的求解速度,将常量引入到一致性规划中,定义一致性规划中的常量,形成新的知识表示“多值一致性规划任务”,定义多值一致性规划动作模型,提出一致性规划常量合成方法,给出一致性规划常量合成算法.该方法利用常量的特性在所有初始世界状态和所有实例动作中猜测、验证常量.理论分析和实验结果表明该算法能合成正确的一致性规划常量,生成多值一致性规划任务.为说明一致性规划常量的应用效果,把生成的多值一致性规划任务与规划解重用启发式结合求一致性规划解,并与规划系统CFF进行对比实验.实验结果表明求解质量和效率较高.
摘要:
针对差分进化算法在复杂优化问题求解时后期收敛速度慢、易陷入局部最优和参数设置繁琐等问题,提出一种基于新变异策略的动态自适应差分进化算法p-ADE.首先,新变异策略中通过利用种群的全局最优解和目标个体的历史最优解引导种群搜索方向,为下一代个体的生成引入更多有效的方向性信息,避免差分向量中个体随机选择导致的搜索盲目性.其次,为加快收敛速度、提高算法稳定性、避免参数设置的繁琐与不精确,提出一种参数动态自适应调整策略,动态平衡算法局部搜索与全局搜索间的关系,有效调节个体在进化过程中的变异程度.在10个Benchmark函数上的实验结果表明,p-ADE相对于多种先进DE优化策略和全局优化算法在收敛精度、速度和鲁棒性上均具有明显优势.
针对差分进化算法在复杂优化问题求解时后期收敛速度慢、易陷入局部最优和参数设置繁琐等问题,提出一种基于新变异策略的动态自适应差分进化算法p-ADE.首先,新变异策略中通过利用种群的全局最优解和目标个体的历史最优解引导种群搜索方向,为下一代个体的生成引入更多有效的方向性信息,避免差分向量中个体随机选择导致的搜索盲目性.其次,为加快收敛速度、提高算法稳定性、避免参数设置的繁琐与不精确,提出一种参数动态自适应调整策略,动态平衡算法局部搜索与全局搜索间的关系,有效调节个体在进化过程中的变异程度.在10个Benchmark函数上的实验结果表明,p-ADE相对于多种先进DE优化策略和全局优化算法在收敛精度、速度和鲁棒性上均具有明显优势.
摘要:
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性.
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性.
摘要:
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
摘要:
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH (disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法.
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH (disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法.
摘要:
针对效用网格下的工作流时间约束-费用优化问题,分层算法将工作流进行分层并逐层进行优化调度,取得了良好效果.然而,这类分层算法由于缺乏更有效的截止时间确定策略来保证时间约束而使得算法的适用性受限.在已有算法截止期约束的逆向分层算法(deadline bottom level, DBL)的基础上,研究工作流的时序特征,并基于任务的一致性状态对费用进行优化,提出了基于时序一致的截止期约束逆向分层算法(temporal consistency based deadline bottom level, TCDBL).TCDBL通过一致性时间点来保证时间约束,解决了DBL的适用性受限问题;同时基于各层并行度分配冗余时间,基于宽松时间约束策略进行费用优化,达到了进一步减少工作流执行费用的目标.实验结果表明TCDBL的费用优化效果比DBL改进了约14%.
针对效用网格下的工作流时间约束-费用优化问题,分层算法将工作流进行分层并逐层进行优化调度,取得了良好效果.然而,这类分层算法由于缺乏更有效的截止时间确定策略来保证时间约束而使得算法的适用性受限.在已有算法截止期约束的逆向分层算法(deadline bottom level, DBL)的基础上,研究工作流的时序特征,并基于任务的一致性状态对费用进行优化,提出了基于时序一致的截止期约束逆向分层算法(temporal consistency based deadline bottom level, TCDBL).TCDBL通过一致性时间点来保证时间约束,解决了DBL的适用性受限问题;同时基于各层并行度分配冗余时间,基于宽松时间约束策略进行费用优化,达到了进一步减少工作流执行费用的目标.实验结果表明TCDBL的费用优化效果比DBL改进了约14%.
摘要:
基于简化的受控Markov链软件自适应测试模型大多是研究如何以最小的期望成本检测并移除所有的缺陷,并在构建模型时对部分条件进行特殊化和理想化处理.针对受控Markov链软件测试模型适用范围小、效率低的缺陷,在软件控制论思想基础上,对制约条件进行了一系列新的转换,提出一种改进的、资源约束的受控Markov链模型,该模型能够在高效性、复杂性和适用性3方面达到一个平衡.根据该模型设计一种新的软件缺陷优化测试策略,再通过参数估计对优化测试策略进行在线调整的方法,以构造软件自适应测试策略.为了证明其有效,利用该模型得到的新的软件自适应测试策略进行仿真实验,进一步得到了有效结果.
基于简化的受控Markov链软件自适应测试模型大多是研究如何以最小的期望成本检测并移除所有的缺陷,并在构建模型时对部分条件进行特殊化和理想化处理.针对受控Markov链软件测试模型适用范围小、效率低的缺陷,在软件控制论思想基础上,对制约条件进行了一系列新的转换,提出一种改进的、资源约束的受控Markov链模型,该模型能够在高效性、复杂性和适用性3方面达到一个平衡.根据该模型设计一种新的软件缺陷优化测试策略,再通过参数估计对优化测试策略进行在线调整的方法,以构造软件自适应测试策略.为了证明其有效,利用该模型得到的新的软件自适应测试策略进行仿真实验,进一步得到了有效结果.
摘要:
随着活动轮廓模型的不断成熟和发展,模型的抗噪能力又成为重要的研究课题.为了精确地分割图像的同时去除图像的噪声,针对噪声图像用非负稳健函数作为边缘保持函数,从而保证图像在去噪的过程中边缘和纹理信息不被模糊.首先创造性地将分类器中的Fisher准则函数引入到图像分割中,从分类的角度对C-V模型给出了Fisher解释.把Fisher准则作为分割的标准来建立一个基于区域和边缘相结合的同时完成去噪和分割变分水平集分割模型.其次详细讨论了该模型的数值求解方法.最后实验验证了用Fisher值来衡量分割标准的理论的正确性和可靠性以及模型中正则项约束在去噪过程中的边缘保持功能.通过3组实验检验了提出的模型对噪声图像的去噪和分割比聚类算法、松弛迭代算法、Mean Shift算法有更好的效果.
随着活动轮廓模型的不断成熟和发展,模型的抗噪能力又成为重要的研究课题.为了精确地分割图像的同时去除图像的噪声,针对噪声图像用非负稳健函数作为边缘保持函数,从而保证图像在去噪的过程中边缘和纹理信息不被模糊.首先创造性地将分类器中的Fisher准则函数引入到图像分割中,从分类的角度对C-V模型给出了Fisher解释.把Fisher准则作为分割的标准来建立一个基于区域和边缘相结合的同时完成去噪和分割变分水平集分割模型.其次详细讨论了该模型的数值求解方法.最后实验验证了用Fisher值来衡量分割标准的理论的正确性和可靠性以及模型中正则项约束在去噪过程中的边缘保持功能.通过3组实验检验了提出的模型对噪声图像的去噪和分割比聚类算法、松弛迭代算法、Mean Shift算法有更好的效果.
摘要:
针对图像的真伪问题,提出了一种基于数字签名方式的图像真伪鉴别算法.首先对图像进行预处理来提高图像的抗JPEG压缩性,然后把图像等分成2个区域,分别从2个区域中提取块均值的高5位映射为GF(25)域中的元素来构造RS编码,生成的校验码经Arnold变换置乱后作为数字签名对图像进行真伪鉴别.实验结果表明,该算法不但能够有效地检测出图像内容是否被篡改,并且能够准确定位篡改位置,提高了图像对JPEG压缩的稳健性,有效地区分JPEG压缩操作和蓄意篡改.
针对图像的真伪问题,提出了一种基于数字签名方式的图像真伪鉴别算法.首先对图像进行预处理来提高图像的抗JPEG压缩性,然后把图像等分成2个区域,分别从2个区域中提取块均值的高5位映射为GF(25)域中的元素来构造RS编码,生成的校验码经Arnold变换置乱后作为数字签名对图像进行真伪鉴别.实验结果表明,该算法不但能够有效地检测出图像内容是否被篡改,并且能够准确定位篡改位置,提高了图像对JPEG压缩的稳健性,有效地区分JPEG压缩操作和蓄意篡改.
摘要:
空间信息服务链由于其空间数据操作对时间的要求以及其应用于工作流对接口要求的特殊性,使得传统的工作流很难调度空间信息服务链,主要的问题在于接口不匹配以及运行效率低下.在传统WPS服务链的基础上,针对其不足提出了基于图形工作流的空间信息服务链聚合模型.通过分析工作流调度空间信息服务链存在的主要问题,提出相应的接口改进方法,以及基于地址引用、压缩GML的数据调度策略.并结合Kepler工作流引擎,给出了空间信息服务链聚合的具体过程.经过实验证明:基于图形工作流环境,不但突破了以往空间信息服务应用于工作流的接口瓶颈,而且改进的数据流调度策略有助于空间信息服务链执行效率的提高.
空间信息服务链由于其空间数据操作对时间的要求以及其应用于工作流对接口要求的特殊性,使得传统的工作流很难调度空间信息服务链,主要的问题在于接口不匹配以及运行效率低下.在传统WPS服务链的基础上,针对其不足提出了基于图形工作流的空间信息服务链聚合模型.通过分析工作流调度空间信息服务链存在的主要问题,提出相应的接口改进方法,以及基于地址引用、压缩GML的数据调度策略.并结合Kepler工作流引擎,给出了空间信息服务链聚合的具体过程.经过实验证明:基于图形工作流环境,不但突破了以往空间信息服务应用于工作流的接口瓶颈,而且改进的数据流调度策略有助于空间信息服务链执行效率的提高.
摘要:
流编程模型是一种近年来被广泛研究的并行编程模型,它在基于软件管理的流式存储器,如流寄存器文件的流体系结构上得到了良好的应用.但同时也有研究指出流编程模型同样适合于基于硬件管理的一致性cache的体系结构.流编程模型目前最重要的应用背景GPGPU在发展中也逐渐引入通用的数据cache,因此发掘流程序的cache局部性就成为在这类体系结构上提高流程序性能的关键.由于流程序特殊的执行模型,其重用向局部性转化的过程与传统的串行程序不一致,无法直接使用传统的局部性分析方法直接对流程序进行分析.在深入分析了重用向局部性转化过程的基础上,提出了“迭代序”的概念用于描述流和串行程序重用向局部性转化时的不同,同时结合流程序的执行特点面向并行扩展了传统的局部性分析理论,给出了基于迭代序的局部性分析方法.此外,结合局部性分析模型还提出了两种流程序的cache局部性优化方法.在GPGPUSim模拟平台上进行的验证结果表明对流程序局部性的定量分析是有效的,并且提出的优化方法也可以有效改善流程序的cache局部性,提高流程序的性能.
流编程模型是一种近年来被广泛研究的并行编程模型,它在基于软件管理的流式存储器,如流寄存器文件的流体系结构上得到了良好的应用.但同时也有研究指出流编程模型同样适合于基于硬件管理的一致性cache的体系结构.流编程模型目前最重要的应用背景GPGPU在发展中也逐渐引入通用的数据cache,因此发掘流程序的cache局部性就成为在这类体系结构上提高流程序性能的关键.由于流程序特殊的执行模型,其重用向局部性转化的过程与传统的串行程序不一致,无法直接使用传统的局部性分析方法直接对流程序进行分析.在深入分析了重用向局部性转化过程的基础上,提出了“迭代序”的概念用于描述流和串行程序重用向局部性转化时的不同,同时结合流程序的执行特点面向并行扩展了传统的局部性分析理论,给出了基于迭代序的局部性分析方法.此外,结合局部性分析模型还提出了两种流程序的cache局部性优化方法.在GPGPUSim模拟平台上进行的验证结果表明对流程序局部性的定量分析是有效的,并且提出的优化方法也可以有效改善流程序的cache局部性,提高流程序的性能.