Processing math: 62%
  • 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统

瞿治国, 陈韦龙, 孙乐, 刘文杰, 张彦春

瞿治国, 陈韦龙, 孙乐, 刘文杰, 张彦春. ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统[J]. 计算机研究与发展. DOI: 10.7544/issn1000-1239.202440527
引用本文: 瞿治国, 陈韦龙, 孙乐, 刘文杰, 张彦春. ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统[J]. 计算机研究与发展. DOI: 10.7544/issn1000-1239.202440527
Qu Zhiguo, Chen Weilong, Sun Le, Liu Wenjie, Zhang Yanchun. ECG-QGAN: A ECG Generative Information System Based on Quantum Generative Adversarial Networks[J]. Journal of Computer Research and Development. DOI: 10.7544/issn1000-1239.202440527
Citation: Qu Zhiguo, Chen Weilong, Sun Le, Liu Wenjie, Zhang Yanchun. ECG-QGAN: A ECG Generative Information System Based on Quantum Generative Adversarial Networks[J]. Journal of Computer Research and Development. DOI: 10.7544/issn1000-1239.202440527
瞿治国, 陈韦龙, 孙乐, 刘文杰, 张彦春. ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统[J]. 计算机研究与发展. CSTR: 32373.14.issn1000-1239.202440527
引用本文: 瞿治国, 陈韦龙, 孙乐, 刘文杰, 张彦春. ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统[J]. 计算机研究与发展. CSTR: 32373.14.issn1000-1239.202440527
Qu Zhiguo, Chen Weilong, Sun Le, Liu Wenjie, Zhang Yanchun. ECG-QGAN: A ECG Generative Information System Based on Quantum Generative Adversarial Networks[J]. Journal of Computer Research and Development. CSTR: 32373.14.issn1000-1239.202440527
Citation: Qu Zhiguo, Chen Weilong, Sun Le, Liu Wenjie, Zhang Yanchun. ECG-QGAN: A ECG Generative Information System Based on Quantum Generative Adversarial Networks[J]. Journal of Computer Research and Development. CSTR: 32373.14.issn1000-1239.202440527

ECG-QGAN:基于量子生成对抗网络的心电图生成式信息系统

基金项目: 科技创新2030重大项目(2021ZD0302901);国家自然科学基金面上项目(61373131, 62071240);北京邮电大学网络与交换技术国家重点实验室开放基金项目(SKLNST-2020-1-17);江苏省高校优势学科建设工程项目;江苏省大气环境与装备技术协同创新中心项目
详细信息
    作者简介:

    瞿治国: 1976年生. 博士,副教授,CCF会员. 主要研究方向为量子机器学习、深度学习、区块链和量子区块链、量子安全通信

    陈韦龙: 2000年生. 硕士. 主要研究方向为量子神经网络

    孙乐: 1987年生. 博士,教授,CCF会员. 主要研究方向为图神经网络、节能智能医疗、数据挖掘

    刘文杰: 1979年生. 博士,副教授,CCF会员. 主要研究方向为量子安全多方计算、量子密码分析、量子机器学习、知识图谱与图神经网络、大模型

    张彦春: 1958年生. 博士,教授. 主要研究方向为数据库、数据挖掘、健康信息学、网络信息系统和网络服务

    通讯作者:

    孙乐(002813@nuist.edu.cn

  • 中图分类号: TP391

ECG-QGAN: A ECG Generative Information System Based on Quantum Generative Adversarial Networks

Funds: This work was supported by the Science and Technology Innovation 2030- Major Project (2021ZD0302901), the National Natural Science Foundation of China (61373131, 62071240), the Open Foundation of State Key Laboratory of Networking and Switching Technology (SKLNST-2020-1-17), the Priority Academic Program Development of Jiangsu Higher Education Institutions, and the Jiangsu Collaborative Innovation Center of Atmospheric Environment and Equipment Technology.
More Information
    Author Bio:

    Qu Zhiguo: born in 1976. PhD, associate professor. Member of CCF. His main research interests include quantum machine learning, deep learning, blockchain and quantum blockchain, quantum secure communication

    Chen Weilong: born in 2000. Master. His main research interests include quantum neural networks

    Sun Le: born in 1987. PhD, professor. Member of CCF. Her main research interests include graph neural networks, energy-efficient smart healthcare, data mining

    Liu Wenjie: born in 1979. PhD, associate professor. Member of CCF. His main research interests include quantum secure multi-party computation; quantum cryptanalysis; quantum machine learning; knowledge graph and graph neural network; large model

    Zhang Yanchun: born in 1958. PhD, professor. His main research interests include database, data mining, health informatics, web information systems, and web services

  • 摘要:

    据统计,我国心血管疾病患病人数约达3.3亿,每年因为心血管疾病死亡的人数占总死亡人数的40%. 在这种背景下,心脏病辅助诊断系统的发展显得尤为重要,但其开发受限于缺乏既不含患者隐私信息又由医疗专家标注的大量心电图(electrocardiogram, ECG)临床数据. 作为一门新兴学科,量子计算可通过利用量子叠加和纠缠特性,能够探索更大、更复杂的状态空间,进而有利于生成同临床数据一样的高质量和多样化的心电图数据. 为此,提出了一种基于量子生成对抗网络的心电图生成式信息系统,简称为ECG-QGAN.其中量子生成对抗网络由量子双向门控循环单元(quantum bidirectional gated recurrent unit, QBiGRU)和量子卷积神经网络(quantum convolutional neural network, QCNN)组成. 该系统利用量子的纠缠特性提高生成能力,以生成与现有临床数据一致的ECG数据,从而可以保留心脏病患者的心跳特征. 该系统的生成器和判别器分别采用QBiGRU和 QCNN,并应用了基于矩阵乘积状态(matrix product state, MPS)和树形张量网络(tree tensor network, TTN)所设计的变分量子电路(variational quantum circuit , VQC). 它可以使该系统在较少的量子资源下,更高效地捕捉ECG数据信息,生成合格的ECG数据. 此外,该系统应用了量子Dropout技术,以避免训练过程中出现过拟合问题. 最后,实验结果表明,与其他生成ECG数据的模型相比,ECG-QGAN生成的ECG数据具有更高的平均分类准确率. 同时它在量子位数量和电路深度方面对当前噪声较大的中尺度量子(noise intermediate scale quantum, NISQ)计算机是友好的.

    Abstract:

    According to statistics, the number of people suffering from cardiovascular diseases in China is about 330 million, and the number of deaths caused by cardiovascular diseases accounts for 40% of the total number of deaths each year. Under this circumstance, the development of heart disease assisted diagnosis systems is particularly important, but its development is limited by the lack of a large amount of electrocardiogram (ECG) clinical data that does not contain patient privacy information and needs to be annotated by medical experts. As an emerging discipline, quantum computing can explore larger and more complex state spaces by utilizing quantum superposition and entanglement properties, which is beneficial for generating high-quality and diverse electrocardiogram data similar to real clinical data. Therefore, we propose an electrocardiogram generative information system based on quantum generative adversarial networks, abbreviated as ECG-QGAN. The quantum generative adversarial network consists of a quantum bidirectional gated recurrent unit (QBiGRU) and a quantum convolutional neural network (QCNN). The system utilizes the entanglement property of quantum to improve the generative capability to produce ECG data that is consistent with the existing clinical data so that the heartbeat characteristics of cardiac patients can be preserved. The generator and discriminator of this system use QBiGRU and QCNN, respectively. The variational quantum circuit (VQC) designed based on matrix product state (MPS) and tree tensor network (TTN) is adopted, which enables the system to capture ECG data information more efficiently and generate qualified ECG data with fewer quantum resources. In addition, the system applies quantum Dropout technology to avoid overfitting issues during the training process. Finally, the experimental results show that the ECGs generated by ECG-QGAN have a higher average classification accuracy compared to other models for generating ECGs. It is also friendly to the current noisy intermediate scale quantum (NISQ) computers in terms of the number of quantum bits and circuit depth.

  • 科学研究在推动社会发展和技术进步中起着至关重要的作用. 科学假设的生成是科研过程中的一个基础环节,它为实验设计和理论探索提供了方向. 然而,随着科学文献数量的急剧增加和研究领域的不断深化,研究人员在提出科学假设时面临着巨大的挑战. 一方面,研究人员需要从大量的文献中提取有价值的信息,这是一个耗时且劳力密集的过程[1];另一方面,创新的科学假设往往需要跨学科的知识和深入的洞察力[2],而这些难以通过传统方法迅速实现.

    在这种背景下,人工智能(artificial intelligence,AI),尤其是大语言模型(large language models,LLMs),因其强大的数据处理能力和信息整合能力,成为科学研究中的一种重要工具. LLMs通过在大量的文本数据上进行训练,能够理解和生成复杂的文本信息,表现出在不同任务上处理和生成知识的能力[3]. 例如,GPT-4等模型不仅在文本生成上表现出色,还在诸如编程[4]、法律[5]和生物医药[6]等专业领域展示了其应用潜力. 在科学研究领域,LLMs已被用于各种任务,包括药物发现、医疗诊断和材料性能预测[7],为研究人员提供了强大的支持,特别是在快速浏览和整理大量科学文献时显示出其独特优势. 例如,LLMs能够自动识别文献中的关键概念和关联,从而加速文献综述的编写过程.

    在当前的科学研究与工程实践中,大部分研究关注于如何使用LLMs将已有的理论或技术从初步阶段快速推进到成熟阶段[8],以此提升科学研究的效率,即从“1~100”的过程. 这包括一些过程繁杂但对创新要求较低的任务,如自动化文献总结、科学文章撰写以及代码实现等. 尽管这一阶段的研究对技术发展和应用普及至关重要,但它依赖于已有的框架和理论基础. 然而,科学探索从无到有的初始阶段,即从“0~1”的过程,在许多情况下被忽视. 这一阶段涉及到新假设的提出、初步概念的形成以及新理论的构建. 正是这些活动定义了科学研究的前沿性和创新性,好的科学假设的提出是科学进步的启动器和基石[9].

    科学假设生成指的是在科学研究的前期阶段,系统地整合现有知识并探索新的理论路径,以提出具有创新性的主张与思路的过程. 尽管LLMs在科学研究中提供了强大的支持,它们在生成科学假设的应用上还是存在明显的不足和局限. 首先,LLMs依赖于大量预训练数据,这些数据无法及时反映科学前沿的最新进展,而学术界的知识更新非常迅速,尤其是在如计算机、生物、材料等快速发展的领域,导致模型在生成假设时依赖于过时或不完整的信息[10],无法站在科学前沿的“巨人肩膀”上进行有效创新. 其次,虽然LLMs能生成看似复杂的科学内容,但这些内容在科学内容的准确性和深度上显得不足,缺乏真正的创新性和深度,倾向于重复训练数据中的模式,而不是提出创新的科学理论或方法[11]. 这些挑战主要源于LLMs的固有局限性和科学研究的复杂需求. 这也表明,尽管LLMs为科学假设的生成提供了新的可能,但要实现其在科学研究中的有效应用,生成具备研究深度与创新性的假设,仍需深入探索和改进.

    科学假设决定着整个研究的质量和方向,高质量的科学假设应当能够在已有研究的基础上进一步深化和创新. 在这个步骤中,如何让LLMs产生创新,则成为最关键的问题. Guilford[12]在结构智力理论中提出,创新产生于思维的发散和收敛过程之中. 发散思维是指从一个问题或主题出发,能够生成多种可能的答案或解决方案的能力. 这种思维模式强调的是想象力、创造力和多样性的生成. 收敛思维则是指针对特定问题找到具体、正确答案的能力. 这种思维模式更多关注逻辑推理、精确度和效率. 科学研究的创新思路就来源于对研究问题的发散思考和收敛具化. 发散过程需要在一定信息基础上,对问题和解决方案进行扩展与探索,这一过程通常通过交流、讨论和辩论来激发;而收敛过程则需要深入理解问题并对特定方向进行深入探索,而这依赖于人类专家具备的高阶洞见能力. 这些正是LLMs在创新过程中面临的挑战,导致发散的角度不够广泛、收敛的方向不够精准和可靠.

    为了解决LLMs在生成科学假设中存在的问题,本文基于结构智力理论,提出了基于人机协作的多智能体框架(human-in-the-loop multi-agent framework, HILMA). 如图1所示,HILMA框架包括基于引文网络的文献系统化检索增强、知识增强型LLMs研究想法生成、人机协作的多智能体辩论迭代3个模块. 首先,针对LLMs在知识动态更新上的不足这一问题,本文通过检索增强的方法为LLMs注入最新的科研相关知识,在无需对模型进行昂贵的重新训练或复杂的微调的情况下,通过低成本的上下文提示来弥补LLMs在动态知识更新上的不足,从而使其在生成科学假设时具备最新且完备的科学研究进展. 其次,通过引入基于多智能体辩论的假设迭代增强方法,以辩论方式模拟人类的发散思维,激发LLMs的能力,使用发散思维来产生尽可能多的初步假设. 在该框架中,不同的智能体角色负责从多个角度审视和辩论初始假设,通过丰富的讨论和批评性反馈,增加假设的多样性和深度. 这种方法模拟了科学界的同行评审过程,提升了假设的科学性和实用性. 最后,为了进一步提升LLMs的专业性和针对性,HILMA框架结合了人类专家的高阶洞察力和模型的数据处理能力. 通过在辩论过程中实时引入人类学者的直觉和专业知识,以指导模型的假设生成过程,并通过收敛思维从中选择最有潜力的方案进行进一步深化和精炼. 这种协作旨在最大化利用了LLMs潜力和人类的洞察力,以生成更符合实际研究需求的科学假设. 这一综合策略的应用,能够显著提升LLMs在科学研究领域中的应用效果,使得生成的假设在质量和创新性方面满足科学研究的要求.

    图  1  HILMA框架示意图
    Figure  1.  Illustration of HILMA framework

    综上所述,本文的主要贡献包括4个方面:

    1) 本文系统地分析了LLMs在处理科学创造性问题时所面临的局限性,揭示了其在发散思维和收敛思维等方面的不足;

    2) 本文提出了科学文献的结构化组织查询方法,通过对文献引文网络的自适应组织和构建,有效地整合了最新的科学研究成果,确保为LLMs提供全面且前沿的知识;

    3) 受结构智力理论的启发,提出了人机协作的多智能体辩论框架,可在多智能体和人类的协作下,模仿人类的发散思维和收敛思维过程,有效地产生和精炼科学假设,提升其质量与创新性;

    4) 通过基于人类和模型的系列评估,实验结果证明了所提HILMA框架的优越性,相较于现有LLMs驱动的基线模型,HILMA生成的科学假设在创新性、实用性、可行性等方面均有显著提升.

    本节讨论聚焦于3个与本研究密切相关的研究方向:科学假设生成、知识增强的LLMs,以及人机协作的智能系统. 这些领域的发展为本研究奠定了理论基础,提供了技术前沿.

    基于人工智能的科学假设生成是AI4Science领域的核心问题,旨在利用人工智能辅助或自动化科学探索的初始阶段[13-14]. 已有研究主要集中在研发能够从现有数据中预测新科学现象的算法和模型[15]. 近年来,随着机器学习技术的蓬勃发展,尤其是深度神经网络在众多数据密集型任务上的成功应用,科学假设生成的研究也扩展到更复杂的科学问题求解中. LLMs是这一趋势的新发展,如何利用其所保有的参数化知识提出合理有用的科学假设,成为了一个备受关注的问题[16-17];例如,Shojaee等人[18]研究借助LLMs的编程能力,以有效发现科学方程. Lu 等人[19]提出了关于 AI 科学家的构想,其通过设定初始模板,促使LLMs生成众多研究思路. 与此同时,将这些思路与现有文献中的方法进行对比,进而筛选出评分较高的研究思路,以应用于后续的实验中. 尽管在科学研究的求解和应用中对LLMs的探索不断深入[20],但它们生成的科学假设在创新性和深度方面仍存在较大不足.

    本研究基于结构智力理论中的发散思维和收敛思维,提出人机协作的多智能体框架. 通过结合实时的系统化知识检索增强机制,动态整合最新科研进展,为模型提供前沿完备的信息基础. 同时,通过多智能体辩论和人机协作,进一步优化和精炼生成的假设,增强假设的多样性和论证深度.

    LLMs的生成阶段存在幻觉[21-22]、有害性[23]、伪事实性[24]和缺乏长时记忆[25]等问题,知识增强被认为是克服这些局限性的有效方法[26]. 知识增强的LLMs首先使用外部检索器从特定的知识源(如百科、图谱和数据库等)检索相关的结构化和非结构化知识,然后将检索到的知识作为LLMs的外部上下文信息,引导LLMs生成以知识为基础的回答[27].

    已有研究关注于检索器和阅读器的优化,研究人员使用稀疏检索器,如BM25[28]和TF-IDF[29]进行相关性计算并检索. 然而,稀疏方法在提取文本内容的语义特征方面存在不足[30]. 为解决问题,研究人员提出基于语言模型的密集检索方法,通过将文档和查询编码为稠密向量,有效地表示文本内容的语义特征[31-32]. 一些近期研究探索LLMs作为检索器的性能,Shen等人[33]首次证明LLMs可以在多个基准数据集上作为零样本检索器使用,而Ma等人[34]提出了一种利用LLMs的Listwise Reranker,在不使用任务特定训练数据的情况下实现了强大的重新排序效果. Sun等人[35]探究了LLMs的相关性排名,发现经过引导的LLMs能够达到最先进的监督方法的性能.

    知识增强模型能够准确捕捉和应用专业知识,在需要深度领域知识的科学研究中尤为重要. Jeong等人[36]在生物医学领域引入知识增强的LLMs,通过检索特定领域的文档和让LLMs自我反思,能够生成准确且有解释性的答案,有效地支撑了生物医学领域的发展. 此外,一些研究尝试实时更新模型的知识库,以保证其输出的时效性和准确性[37]. 通过知识增强,不仅提高了LLMs在特定领域内的表现,还能够适应快速变化的科研环境,生成与当前研究前沿对齐的内容.

    人机协作的智能系统强调智能系统与人类的互补性,旨在将人类的创造力和决策能力与机器的计算能力和数据处理速度相结合[38],协同完成特定任务. 传统研究主要集中于提高人与机器人、人工智能系统等智能体交互的效率,以满足人类需求[39]. LLMs的兴起标志着该领域的重大转变,人类的反馈和推理在增强智能体能力方面的作用日益彰显,能够显著提升智能体的表现. 最近的研究采用启发式规则或可学习的算法引导智能体寻求人类的帮助[40-41]. 此外,研究者开始重视探究特定的引导提示,以激励基于LLMs的智能体主动寻求人类的输入,从而在这些协作系统中构建更具互动性和协作性的应用[42-43]. Feng等人[44]设计了一种通用可学习的方法,通过直接规划的形式,实现人类与LLMs之间的高效协作. Dhillon等人[45]的研究表明,通过提供AI辅助,可以显著提升人类用户的写作质量和效率. Li等人[46]探讨了LLMs在人机协同软件开发与演化中的应用及其带来的挑战,强调了人在软件开发与演化中的主导地位和可信保障的重要性. 在需求工程领域,Jin等人[47]提出了ChatModeler框架,通过LLMs和人类的协同合作,优化了需求获取和建模过程. 该框架利用模型自动处理任务,减轻人类的负担,同时能根据反馈进行调整,提高需求模型的质量和交互效率.

    在科学研究领域,人机协作系统具备重要意义. 复杂科学问题的研究要求同时具备深厚的专业知识和高效的信息处理能力,而人类与LLMs在这一过程中各自具备独特的优势. 通过人机协作,能够提高科学假设的质量和创新性,共同创造出符合科学标准且创新性强的科学假设.

    本研究提出了一种新的科学假设生成框架HILMA,旨在通过人机协作和多智能体技术,从海量的科学文献中提取和生成有价值的科学假设. 首先,HILMA通过关键词查找与研究主题相关的文献,并且基于文献引用关系网络进行拓展和筛选,确保输入数据的质量和相关性;然后,基于系统化的文献信息,使用LLMs进行深入探索与分析,生成初步的科学假设;最后,利用人机协作的多智能体系统进行科学假设迭代,模拟创新孕育的思维发散和收敛过程,最终实现科学假设生成的准确性和创新性.

    为了给LLMs提供系统化的科学知识,本节提出了基于引文网络的文献系统化检索增强方法. 通过对文献引文网络的自适应组织和构建,有效地整合了最新和广泛的科学研究成果,系统性地梳理不同研究点的研究脉络,确保为LLMs提供的知识具备前沿性和系统性. 方法主要分为2个部分:自顶向下的子图引文网络构建从相关研究关键词出发,查找相关中心文献,并且基于中心文献深入挖掘,构建子图引文网络;自底向上的文献网络综述生成则从各个子图引文网络出发,汇总每个子图网络的研究脉络和现状,形成高阶的子图研究综述. 二者相结合,能够实现对特定领域文献的深入挖掘和梳理,为LLMs提供系统可靠的文献知识来源,图2展示了基于引文网络的文献系统化检索增强流程.

    图  2  基于引文网络的文献系统化检索增强流程示意图
    Figure  2.  Illustration of systematic literature retrieval enhancement process

    为了在科学文献领域进行系统化检索增强,采用基于引文网络的方法,旨在构建一个结构化的文献组织和查询系统. 本节详细介绍了自顶向下的子图引文网络构建过程,包括关键词检索、文献筛选和网络拓展等步骤.

    首先,利用 Semantic Scholar API[48]进行核心关键词的检索,以获取与研究内容相关的文献的数字对象唯一标识符(digital object unique identifier, DOI). 这一步骤的关键在于选择能够准确代表研究领域核心的关键词,以确保检索结果的准确性和全面性. 由于检索结果数量庞大且杂乱,需要对文献进行筛选,保留具有重要性和影响力的中心文献. 这一步骤借助文献的被引次数,文献类型以及文献来源来进行评估和排序. 具体地,定义中心文献集合为{c1,c2,,cm},其中m表示中心文献的数量.

    基于确定的中心文献,将从引文、被引和相关文献3个维度进行子图网络的拓展与构建. 具体地,通过文献的引用关系、被引关系、相关关系来构建基于特定中心文献c的子图引文网络,表示为Gc=(Vc,Ec),其中V表示网络的节点集合,E表示边集合. 引用网络、被引网络、相关网络的构建过程可以通过以下公式表示:

    Ecite={(vi,vc)|viVcite,ic}, (1)
    Ecited={(vi,vc)|viVcited,ic}, (2)
    Erelated={(vi,vc)|viVrelated,ic}, (3)
    Gc=(VciteVcitedVrelated,EciteEcitedErelated), (4)

    通过以上步骤,能够从一个中心文献构建出一个结构化、多维度的文献网络,该网络以中心文献为核心,囊括了与研究内容密切相关的文献,以及研究的发展脉络和趋势. 为进一步的研究提供了深入的信息基础和理论支持.

    尽管经过筛选,所构建的每个子图引文网络仍然较为庞大(数十篇). 考虑到LLMs上下文窗口长度以及计算效率,本文采取自底而上的文献网络综述生成方法,将每个子图引文网络中的文献进行汇总,让LLMs生成该研究的综述.

    对于每个子图引文网络Gi=(Vi,Ei),其每个节点表示一篇文献,LLMs将利用节点中的文献文本信息,结合其对研究领域的深入理解,撰写研究综述. 这些综述将涵盖该子图引文网络所涉及的研究主题、研究方法、研究成果等方面. 在撰写综述的过程中,LLMs将考虑到文献之间的相互关系,以及其在研究领域中的重要性和影响力.

    经由上述过程,每个子图引文网络Gi都拥有一个对应研究综述si,其中i{1,2,,m},这些综述将为LLMs提供科学假设生成和辩论的信息基础,避免不必要的计算和重复查询. 同时,这些综述还可以为用户提供全面而系统的研究概览,促进其对后续假设生成的理解.

    通过自顶向下的子图引文网络构建和自底向上的文献网络综述生成,建立了一个结构化、系统化的知识库,囊括了完善的具体文献和不同子领域的文献综述,为后续的假设生成和验证提供坚实的基础.

    在构建了基于引文网络的文献系统化检索增强机制后,本节将探讨如何应用知识增强型LLMs来生成具有深度和创新性的研究想法. 该过程旨在整合结构化和系统化的文献知识,直接融入模型的推理和生成能力中,以克服传统LLMs生成创新科学假设的局限性.

    首先,利用自上而下的子图引文网络构建方法,得到了围绕特定中心文献组织的高度结构化的文献子集. 这些子集形成了多维度的信息,为LLMs提供了丰富的背景知识和上下文信息. 每个子图都是围绕其核心文献构建的. 通过分析每个子图的研究综述{s1,s2,,sm},LLMs能够从研究意义、潜在的研究空间、未来发展趋势等角度进行评分,从而选择出最具研究潜力和价值的子图. 该选择过程可以形式化表示为

    argmax (5)

    其中score表示LLMs对综述的评分.

    选定研究目标后,将对应的目标子图{G_t}中的文献进行进一步的结构化组织,使LLMs能够充分获取该领域的发展脉络与研究现状. 在此基础上,LLMs将综合这些文献中的知识和其自身的语言生成能力,生成全面而有效的研究想法. 该想法生成过程可以用以下公式表示:

    {h_0} = LLM(P,{G_t},{s_t}), (6)

    其中{h_0}表示初始生成的科学假设,P为指令提示(prompt),{G_t}为选定的目标引文子图,{S_t}{G_t}的研究综述.

    通过这种知识增强的方法,LLMs生成的研究提案不仅具有更高的可信度和创新性,而且能够提升研究提案的整体质量. 知识增强型LLMs不仅可以加速研究想法的生成过程,而且为科学发现的第一阶段提供了更高效的支持.

    在严谨的科学研究探索中,创新性假设的孵化是一个动态且迭代的过程,要求不断质疑、修正与深化. 本节介绍一种创新的人机协作策略,通过多智能体辩论迭代机制,旨在实现科学假设的深度精炼与优化. 此方法的核心在于利用来自不同背景和专业知识的智能体(包括LLMs和人类专家)的多样化视角,通过辩论和批判性思考来迭代地精炼和增强初步生成的研究想法,确保每个假设都经过全面的考量和验证.

    多智能体辩论迭代的过程设计如下:

    1)角色分配. 每个智能体被分配一个特定角色,包括假设提出者、审阅者和中立分析师. 这些角色帮助结构化辩论,使每个智能体可以从不同的角度审视问题.

    2)初始假设生成. 基于3.2节知识增强型LLMs的输出,首先形成一组初步的科学假设.

    3)开放式辩论. 智能体之间进行开放式辩论,每个智能体根据其角色提出支持或反对假设的论点. 此阶段旨在揭示假设的潜在弱点和未考虑的变量. 人类专家在过程中参与并且引导智能体的辩论方向.

    4)证据集成. 辩论中提出的有效点将用于修改或强化假设. 该过程包括请求更多引文子图、重新分析已有数据或引入新的科学理论. 人类专家在此过程中扮演仲裁者的角色,适时引导辩论的深度与广度,同时根据辩论进程中的关键发现,向知识增强型LLMs提出数据查询或模型调整的需求,以获取更多支持或反驳假设的证据.

    5)迭代循环. 这一过程可以多次迭代,每次辩论后都对假设进行评估和调整,直到达到预定的科学严格性和创新性标准. 每回合辩论后,整合者智能体汇总辩论要点,与人类专家共同评估假设的改进空间,从而迭代生成更加成熟与精细的假设版本.

    多智能体辩论迭代的主要目的是利用集体智慧来提高假设的质量和可靠性. 每个假设都经过详尽的挑战和防御,从而确保其在逻辑上的健全性和实证基础上的坚实性,有助于揭示那些可能未被单一智能体注意到的新的研究方向或方法论问题.

    在研究框架中,人机协作是关键的一步,它结合了人类专家的创造性思维和高阶决策能力与LLMs的高效数据处理与整合的能力. 此环节的核心目的是充分发挥人类与LLMs智能体各自的优势,共同创造出符合科学标准且创新性强的科学假设. 在这一过程中,人类专家负责提供方向性指导、深入分析和复杂决策,这包括指出未被发现的假设漏洞、提供额外的专业知识或重新定义问题的边界,而多智能体则在大数据处理、假设迭代和模式提取方面发挥作用. 人机协作模式不仅加速了科学假设的生成过程,还增强了假设的适用性和准确性,确保生成的科学假设既有深度又有广度,同时能够适应复杂多变的科研环境.

    图3所示,本研究开发了一个人机协作科学假设生成平台,旨在提升科研人员在科学假设生成过程中的效率和准确性. 平台由功能区和对话区组成. 在功能区,用户可以选择LLMs基座和文献检索源,并控制智能体之间的对话进程及最终结论的汇总. 在对话区,用户可通过对话框输入想要探索的研究主题或科学问题,平台能够根据输入自主开展系统化的文献检索、增强总结,并生成初步的科学假设.

    图  3  人机协作假设生成平台
    Figure  3.  Human-machine collaboration hypothesis generation platform

    平台允许研究人员实时监控和管理多智能体协同生成的科学假设,并在多智能体对话过程中进行介入和调整. 实时监控功能不仅让研究人员能够全面了解假设生成的进展,还允许他们对生成的假设进行实时评估和调整,从而确保最终生成的假设更加符合实际科研需求.

    在本节中,将描述数据集、模型、评估设置和实施细节.

    通过Semantic Scholar的API接口获取实时的学术文献信息. 在HILMA框架中,使用Qwen-Max作为基座LLMs,版本为qwen-max-0403,top_k设置为0.8,temperature设置为0.85. 本文以材料学科为例,让20名材料专业的研究生就各自的研究领域提出5个真实的研究问题,共获得100个不同的研究主题.

    基于100个材料科学的研究问题,使用3.2节提到的基线模型生成对应的科学假设. 每个基线共获得100个科学假设用于评测,共计600个生成的科学假设用于评估.

    由于科学假设生成是一个全新任务,尚无直接可用的对比基线. 因此,将完整的HILMA框架,与下列通用基线以及消融变体进行比较:

    1) ChatGPT[49]. ChatGPT是由OpenAI开发的LLMs,能够生成连贯且具有创造性的文本,广泛应用于对话系统、内容创作和文本生成任务. 本基线使用ChatGPT直接生成科学假设.

    2) CoT[50]. CoT(chain-of-thought)是一种提示工程方法,旨在引导LLMs逐步思考,以生成更加可靠的回答. 在实验中,本基线通过在提示词中加入逐步思考的指令,引导LLMs进行科学假设生成.

    3) ICL[51]. ICL(in-context learning)是一种通过上下文提示进行学习和生成的技术,依赖于提供给模型的输入上下文,以便生成相关的输出. 在实验中,使用人工撰写科学假设样例作为上下文提示,让模型参考这些示例生成科学假设.

    4) RAG. RAG(retrieval-augmented generation)是一种结合检索和生成的技术,通过在生成过程中动态检索相关文献来增强模型的生成能力. 通过主题关键词实时检索相关的科研论文摘要,选取前10篇提供给LLMs作为辅助参考. 这一方法能够在一定程度上缓解LLMs知识更新不及时的问题,提供更为新颖和前沿的科研信息.

    5) Multi-Agent. 多智能体系统通过多个具有不同角色和功能的智能体协同工作来实现复杂任务. 本研究设计了多智能体框架基线,其中不同的智能体负责不同的任务,包括假设提出者、批评者或中立分析师. 通过智能体之间的自动化协作和辩论,迭代生成科学假设. 该方法旨在最大化利用集体智慧,提高假设的科学性和创新性.

    鉴于科学假设生成是一个新任务,没有已知基准可以衡量生成质量. 因此,采用基于模型的自动评估与人类评估相结合的方法,来验证实验基准上的不同模型.

    基于模型的评估:参考最近使用LLM判断输出文本质量的范式[52-53],使用GPT-4来判断生成的科学假设的质量. 以5个不同的标准衡量科学假设的质量,然后要求评估模型对每个标准的生成思路进行5点李克特量表评分[54]. 表1中提供了用于引导评估的详细的专家制定的标准和提示.

    表  1  模型评估中使用的5点李克特评分量表
    Table  1.  The 5-Point Likert Scale Used in Model Evaluation
    评估指标 评分 描述
    创新性1没有任何新颖之处,重复已有的研究成果.
    2有少量新颖之处,但大部分内容是已有知识的延伸.
    3有一些新的观点或方法,但总体仍基于已有的框架.
    4提出了较为新颖的观点或方法,有显著的创新点.
    5极具创新性,提出了全新的观点或方法,
    可能引发领域内的重大变革.
    实用性1完全没有实际应用价值,难以转化为实际应用.
    2有一定的理论价值,但实际应用价值有限.
    3有一定的实际应用潜力,但需进一步研究和验证.
    4具备较高的实际应用价值,具有较好的转化前景.
    5极具实际应用价值,能够迅速转化为具体
    应用并产生显著效益.
    可行性1完全不可行,技术或资源方面难以实现.
    2可行性较低,面临较大的技术或资源挑战.
    3有一定的可行性,但需要克服一些技术或资源障碍.
    4基本可行,技术和资源要求在可控范围内.
    5完全可行,现有技术和资源可以支持其实现.
    数据支持1完全缺乏数据支持,无法验证假设.
    2数据支持有限,无法充分验证假设.
    3有一定的数据支持,但不完全,需进一步数据验证.
    4有较充分的数据支持,能够验证假设的大部分内容.
    5数据支持非常充分,能够全面验证假设.
    理论基础1缺乏理论基础,无法与现有科学理论相一致.
    2理论基础薄弱,与现有科学理论存在较大矛盾.
    3有一定的理论基础,但与现有科学理论存在
    一些不一致.
    4具有较好的理论基础,能够与现有科学理论相结合.
    5理论基础非常坚实,与现有科学理论完全一致,
    并有可能推动理论的发展.
    整体评价1整体评价很差,假设缺乏科学价值和实际意义.
    2整体评价较差,假设存在较多不足之处.
    3整体评价一般,假设有一定价值但需改进.
    4整体评价较好,假设具备较高的科学价值和实际意义.
    5整体评价非常好,假设具有重要的科学
    价值和实际意义.
    下载: 导出CSV 
    | 显示表格

    基于人类的评估:类似于基于模型的评估,同一个主题下不同基线模型生成的科学假设将被两两配对,让人类评注者在2个隐去了模型信息的回答之间进行成对比较,选择质量更高的科学假设. 为了实现这一目标,本研究开发了在线评估平台(如图4所示),标注者登录平台后,平台会自动推送针对同一个主题的匿名答案对,评注者通过点击按钮即可实现标注,协同能够自动保存并统计评注者的偏好选择结果. 为了保证人类评估的质量,专家评注者均为熟悉该领域的硕士与博士研究生,且至少发表过1篇学术论文. 评估过程共由5位专家评注者进行.

    图  4  构建的人工在线评测平台
    Figure  4.  The constructed artificial online evaluation platform

    为了比较本文模型与基准方法的效果差异,对生成的科学假设数据进行了基于LLMs评分测试. 表2展示了不同基线模型李克特量表的GPT-4评分结果.

    表  2  不同基线的模型评估效果
    Table  2.  Comparison of Different Baselines
    模型创新性实用性可行性数据支持理论基础总体评价
    ChatGPT3.293.412.802.273.273.07
    CoT3.813.982.942.373.643.32
    ICL4.094.073.212.603.723.70
    RAG4.103.943.182.653.803.61
    Multi-Agent4.514.203.132.464.083.96
    HILMA
    (本文)
    4.604.253.402.804.204.10
    下载: 导出CSV 
    | 显示表格

    首先,从基线模型的整体评分来看,LLMs生成的科学假设在实用性和理论基础方面取得了相对较高的分数,这主要归因于LLMs在海量文本上的预训练,能够掌握大量基础理论和常识知识. 然而,在创新性、可行性和数据支持3个评分维度上效果不佳. 这是因为LLMs局限于已经见过的重复知识和模式,缺乏创新性思维,并且容易提出不切实际的想法,缺乏可行性和理论支持.

    其次,通过对比CoT,ICL,ChatGPT的表现,可以发现通过引导LLMs逐步思考和提供具体的科学假设样例,其能够有效的提升生成假设的质量,这说明通用的LLMs能力提升方法对科学假设任务也是适用的;通过检索最新的相关文献,RAG方法能够显著提升生成的科学假设质量,这得益于模型能够获取最新的科研进展,有效地提升了创新性和数据支撑评分,使得生成的科学假设具备前沿性和有效性. 此外,得益于多智能体迭代讨论,Multi-Agent取得了更优的模型评分,说明通过最大化利用集体智慧,能够提高假设的科学性和创新性.

    本文的HILMA框架显著优于所有的基线模型,创新性评分达到了4.6分,总评分是所有基线中唯一突破4分的模型,达到了“具备较高的科学价值和实际意义”的标准. 实验结果表明通过充分利用人类与LLMs智能体各自的优势,有助于创造出符合科学标准且创新性强的科学假设. 此外,实验结果突出了人机协作的重要性,在这一过程中,人类专家负责提供方向性指导、深入分析和复杂决策,而LLMs则通过引文网络构建、多智能体迭代等不断优化假设,增强了假设的适用性和准确性,确保生成的科学假设既有深度也有广度.

    为了进一步验证人机协作的重要性,首先使用HILMA框架生成了未经讨论的初始假设,然后基于此进行人机协作迭代生成最终的科学假设,以对比二者的评分差异. 如图5 所示,实验结果表明,通过人机协作迭代能够在所有指标上显著提升模型的生成效果. 这是因为人类专家能够提供方向性指导,帮助LLMs进行复杂决策和启发新思路. 在人机迭代过程中,一些细节错误和假设不合理的地方也能够被及时发现和改正,进一步提升假设的整体质量.

    图  5  初始假设与人机协作后的假设对比
    Figure  5.  Comparison of initial hypotheses and hypotheses After human-machine collaboration

    图6展示了基于子图引文网络生成的科学假设与基于LLMs本身的科学假设的雷达图对比. 经过了子图引文网络能够显著增强LLMs生成科学假设的创新性与总体评价,表明子图引文网络能够为LLMs提供最新的科学文献与研究进展,帮助LLMs从最新研究中探索创新思路与前沿方法.

    图  6  子图引文网络的引入对生成质量的影响
    Figure  6.  The impact of subgraph citation network introduction on generation quality

    为验证多轮辩论迭代的效果,开展了多轮评估实验. 基于相同的初始假设,在不同的迭代轮次终止并生成科学假设,以观察其质量随迭代轮次的变化. 如图7所示,经过多轮迭代,Multi-Agent和HILMA方法的整体质量均有所提升,这是因为在多轮辩论中,假设中存在的明显缺陷和不足能够被发现和纠正.

    图  7  迭代次数与人机协作的影响
    Figure  7.  The impact of iteration count on human-machine collaboration

    然而,注意到 Multi-Agent方法在迭代2轮后质量有所提升,但在后续轮次中出现了停滞甚至下降的现象. 这主要是由于多智能体缺乏对科研的深刻理解,在讨论中容易集体跑偏,过度关注无关细节,忽略了科学假设的核心内容. 相比之下,HILMA方法的假设质量随着迭代次数的增加表现出更高的稳定性. 人类专家的高阶洞见能够及时纠正讨论中的偏差,指出问题所在,不断提升科学假设的总体质量. 这突显了人机协作的重要性.

    表3展示了HILMA在开源模型Llama 3(llama3-70b-instruct[55])、Qwen 72B(qwen1.5-72b-chat[56])和闭源模型GPT-3.5(gpt-3.5-turbo[57])、通义千问(Qwen-Max[58])上的实验效果. 结果表明,生成的假设质量与模型本身的能力密切相关,基座模型越强,生成的假设质量越高. 其中,Qwen-Max表现出最佳的效果.

    表  3  不同基座大语言模型的生成效果对比
    Table  3.  Comparison of Different Large Language Models
    基座模型创新性实用性可行性数据
    支持
    理论
    基础
    整体
    评价
    GPT-3.54.054.013.122.453.693.57
    Llama 34.084.083.072.283.873.62
    Qwen 72B4.174.003.142.513.963.77
    Qwen Max4.604.253.402.804.204.10
    下载: 导出CSV 
    | 显示表格

    对基线模型进行人工评估,图8展示了不同模型初始假设与人机协作后假设的对比情况. 热力图展示了在人工评测中,两两模型评测的胜率.

    图  8  基于人工评估的模型胜率热力图
    Figure  8.  Heatmap of model win rates from human evaluation

    图8所示,HILMA框架生成假设在与其他模型的对比中胜率显著,说明其整体质量优于其他基线模型. 在初始假设的对比中,ChatGPT,RAG,Multi-Agent,HILMA的质量依次递增,其中HILMA框架的初始假设质量最高. 这与3.4节的模型评估结果一致,进一步验证了HILMA框架在科学假设生成中的优越性和潜力.

    表4展示了以“氮化硅陶瓷”为主题词,ChatGPT,RAG,Multi-Agent,HILMA生成的科学假设. 其中,ChatGPT的假设提出了结合材料科学和电子工程的设计思路,但缺乏对如何实现这种结合的具体细节. RAG通过检索增强的方法,提出了微系统的概念,但同样缺少具体的实施步骤和技术细节,使得这些假设在转化为研究方案时存在一定难度.

    表  4  以“氮化硅陶瓷”为研究主题的科学假设生成案例
    Table  4.  Case Study of Scientific Hypothesis Generation on "Silicon Nitride Ceramics"
    模型 科学假设
    ChatGPT我建议在硅氮化陶瓷的研究中,结合材料科学和电子工程的领域. 利用电子工程中传感器技术和材料科学中的纳米结构设计原理,设计并研发一种新型的硅氮化陶瓷传感器. 该传感器可用于高温、高压或腐蚀性环境下的测量,并具有更高的灵敏度和精准度. 这一想法受到材料科学中硅氮化陶瓷的高温稳定性和电子工程中传感器技术的启发.
    RAG我提议开发一种集成的硅氮化物微系统,该系统利用辐射热交换和优化的热响应时间来提高传感器对温度变化的敏感性. 受上述关于自由站立硅氮化物膜热耦合特性的研究启发,我们可以设计微机械谐振器,其中辐射热交换被刻意管理和利用,以增强其作为温度传感器的性能. 通过精确控制膜的尺寸、厚度和发射率,可以调整辐射热交换在总热耦合中的贡献. 此外,结合高真空环境中的实验验证,我们可以创建一个模拟平台来预测和优化这些微系统的热噪声和频率噪声特性. 这样,我们不仅可以提高现有传感器的性能,还能为未来的温度感应和热管理应用开辟新途径.
    Multi-Agent我提议结合氮化硅陶瓷的研究和实验,探索其在腐蚀抑制领域的应用潜力. 氮化硅陶瓷具有优异的耐磨、耐腐蚀和高温稳定性,因此可以作为一种新型的腐蚀抑制材料,特别适用于极端环境下的金属保护.

    首先,可以通过化学合成方法,制备不同形貌和结构的氮化硅陶瓷颗粒或涂层,并使用表征技术(如SEM,TEM,XRD)对其进行详细的形貌和结构分析. 这有助于优化氮化硅陶瓷材料的合成方法,从而提高其实际应用价值.

    其次,利用电化学技术(如EIS和PDP),评估氮化硅陶瓷材料对金属表面腐蚀的抑制效果,并研究其与金属表面的电化学反应动力学和机理. 这将有助于深入理解氮化硅陶瓷材料的腐蚀抑制机理,从而提高其实际应用效果.

    进一步,结合量子化学计算方法(如DFT),预测氮化硅陶瓷材料在不同腐蚀介质下的吸附行为和电子转移机制,以深入理解其腐蚀抑制机理. 这有助于优化氮化硅陶瓷材料的设计和应用范围,提高其实际应用效果.

    最后,探索氮化硅陶瓷与其他腐蚀抑制剂(例如有机分子或无机纳米材料)的复合应用,以期望获得协同效应,提高金属表面的腐蚀防护性能. 这将为腐蚀抑制领域提供新的思路和方法,推动相关交叉研究的进一步探索.

    这一系列综合研究将有助于拓展氮化硅陶瓷材料在腐蚀抑制领域的应用范围,为开发新型高效的金属腐蚀抑制策略提供新的理论和实践基础. 期待这一综合性研究能够为相关领域的科学研究和工程实践带来积极的影响.
    HILMA
    (Ours)
    我提议,通过设计一种多级结构的氮化硅陶瓷复合材料,该材料同时整合了微纳尺度的增强相和智能响应型腐蚀抑制剂,以实现超耐腐蚀、自适应修复及显著提高机械性能的革新目标. 此复合材料的核心设计包括以下几个层次:

    1)基层优化. 首先,对氮化硅基层进行成分与微观结构的双重优化,采用Y2O3稳定的α-Si3N4为主相,结合溶胶-凝胶法制备的超细晶粒(< 500 nm),以确保材料本体的高强度和高韧性. 通过梯度分布的晶粒尺寸设计,从表面到内部逐步增大晶粒,以获得更好的表面耐磨性及整体抗裂纹扩展能力.

    2)微米级增强相分散. 在基层内均匀分散碳化硅(SiC)晶须或短纤维作为第2相增强材料,利用其高模量和优异的界面粘结性,进一步提升复合材料的断裂韧性和耐磨性. 通过控制其体积分数和定向排列,可以有效引导裂纹偏转和桥接,减少裂纹扩展.

    3)纳米级智能抑制剂包覆. 在表面微结构层,将智能响应型有机抑制剂(如温敏或pH敏感型聚合物包裹的苯并咪唑衍生物)通过原位聚合法包覆在纳米粒子(如SiO2)表面,随后嵌入到氮化硅表面层. 这些智能抑制剂在遇到腐蚀介质时能自动释放活性分子,迅速封闭陶瓷表面的微裂纹或缺陷,同时在介质条件恢复时重新吸附回纳米载体,实现自适应的腐蚀防护.

    4)梯度功能涂层. 最外层采用CVD技术沉积一层梯度功能涂层,从富含智能抑制剂的表面逐渐过渡到富含耐磨增强颗粒(如类金刚石碳)的底层,旨在结合化学抑制与物理阻挡的双重防护机制,进一步提升耐腐蚀与耐磨性能.

    通过综合运用先进材料科学、纳米技术和智能材料设计理念,此多级结构氮化硅陶瓷复合材料有望在极端环境下展现前所未有的耐久性和可靠性,特别适用于航空航天、深海探索及高级能源系统等对材料性能要求极高的领域. 实验验证将涵盖从材料合成、微观结构表征、腐蚀行为评估到机械性能测试的全方位研究,以全面评估该创新方案的有效性和潜在应用价值.
    下载: 导出CSV 
    | 显示表格

    相比之下,Multi-Agent和HILMA生成的科学假设则更加具体且具有可操作性. Multi-Agent详细描述了化学合成、电化学技术、量子化学计算等实验方法,并提供了清晰的研究路径. HILMA的假设则更为全面和深入,它提出了一种多级结构的氮化硅陶瓷复合材料设计,详细阐述了每一层级材料设计的方法,给出了预期的微观结构和性能提升的理论解释. 这些详细的方法和步骤使这一假设更容易转化为实际的科研实践,具备较高的可操作性和可实施性,更符合使用者的预期.

    在当今科学研究不断发展的背景下,创新性假设的生成变得尤为重要. 然而,面对海量科学文献和复杂的跨学科知识体系,传统的科研方法在信息处理与知识整合方面面临巨大挑战. 本文提出了一种基于人机协作的多智能体科学假设生成框架,通过结合结构智力理论中的发散思维和收敛思维,有效地提升了科学假设的生成质量和创新性. 实验结果表明,与现有的基线模型相比,HILMA框架在生成高质量科学假设方面展现出了显著的优势. 这不仅在理论上验证了结构智力理论在科学研究中的应用价值,更在实践中证明了人机协作在科学创新中的潜力.

    本框架结合了多智能体和人类协作,具备广泛的可扩展性,但仍然存在一些不足,主要体现在系统化检索效率与人机协调难度上. 为了让LLMs具备充足且系统化的知识,HILMA需要对大量文献进行检索、筛选和总结,这一过程涉及多次的文献API检索和LLMs的调用,耗时较长,可能影响用户体验;在人机协作上,当前市面上可用的LLMs均为助理模型,存在过度倾向于满足人类的指令的问题,因此,人类的微小意见可能对整个协作的走向和最终生成内容产生较大影响,进而影响科学假设的完整性. 因此,如何更好地均衡人类和多智能体之间的协作需要进一步的探索研究. 此外,虽然HILMA是通用的科学假设生成框架,但是受限于原始数据和评测条件,目前只在材料科学领域验证了HILMA的效果,并且缺少实际实验结果的支撑,需要结合材料合成实验来进一步验证科学假设的可行性和效果.

    未来,拓展 HILMA框架至不同的学科领域将成为重点探索的方向. 鉴于不同学科在研究内容和方式上存在较大差异,单一框架难以在所有学科均取得理想效果. 从数据视角来看,对于像医学影像、电子信号、语音学等这类在数据处理方面对图像、信号、音视频等有着巨大需求的专业,单纯的文本增强生成往往难以达成良好的成效. 探索如何利用多模态LLMs实现多模态的系统化检索增强,是一个值得深入研究的方向. 多元的数据能够进一步提升假设生成的可靠性和完整性.

    此外,伴随各个学科的理论和技术不断相互交叉与融合,学科交叉已成为显著趋势. 如何针对不同领域构建专家智能体,针对同一课题分配多领域角色以实现学科交叉讨论,也将是一个值得深入探究的重要内容. 通过进一步优化人机协作机制和智能体辩论策略,科学研究的效率和创新性有望得到进一步提升,为解决复杂的科学问题和推动技术进步提供新的思路和方法.

    作者贡献声明:陈子阳提出了算法思路和实验方案,并撰写论文;赵翔提出指导意见,完成论文的修改和校对;赵润豪参与了文献调研和论文修订工作;倪子淇完成了文献调研、实验数据收集和论文修订工作;叶益聪提出指导意见.

  • 图  1   ECG-QGAN总体框架

    Figure  1.   Overall framework of ECG-QGAN

    图  2   数据预处理示意图

    Figure  2.   Illustration of data pretreatment

    图  3   生成器结构图

    Figure  3.   Generator structure diagram

    图  4   MPS量子电路图

    Figure  4.   MPS quantum circuit

    图  5   判别器结构图

    Figure  5.   Discriminator structure

    图  6   TTN量子电路图

    Figure  6.   TTN quantum circuit

    图  7   Dropout示意图

    Figure  7.   Illustration of Dropout

    图  8   生成器Loss变化图

    Figure  8.   Loss variation graph of generator

    图  9   生成ECG数据的判别器Loss变化图

    Figure  9.   Discriminator Loss variation diagram for generating ECG data

    图  10   生成S类ECG数据的判别器Loss变化图

    Figure  10.   Discriminator Loss variation diagram for generating ECG data of class S

    图  11   3种模型生成ECG数据与真实ECG数据对比

    Figure  11.   Comparison of ECG data generated by three models and real ECG data

    图  12   生成的ECG数据分类表现

    Figure  12.   Classification performance of generated ECG data

    图  13   在4种量子噪声下的理论错误和实验错误对比

    Figure  13.   Comparison of theoretical errors and experimental errors under four types of quantum noise

    表  1   实验中使用的数据集以及其具体属性

    Table  1   Datasets Used in the Experiment and Their Specific Properties

    数据集 频率/Hz 记录数 时间/h 标记
    文献[31] 360 48 0.5 全部
    文献[32] 360 28 不固定 全部
    文献[33] 250 90 2 全部
    文献[34] 250 23 7~25 部分
    下载: 导出CSV

    表  2   模型生成ECG信号在PCC上对比

    Table  2   Comparison of ECG Signals Generated by Models on PCC

    模型N类S类V类F类Q类
    DCGAN0.13460.13200.06470.03780.4389
    QPatch-GAN0.15310.10730.13860.03120.5438
    QCGAN-ECG0.17440.17400.15150.03420.6323
    BiGRU-CNN GAN0.15690.17980.13480.04360.5596
    BiLSTM-CNN GAN0.16590.15140.14900.04070.5850
    ECG-QGAN(本文)0.21870.23390.15240.05160.6067
    下载: 导出CSV

    表  4   模型生成ECG信号在RMSE上对比

    Table  4   Comparison of ECG Signals Generated by Models on RMSE

    模型N类S类V类F类Q类
    DCGAN0.57250.35220.79040.56430.4857
    QPatch-GAN0.58020.32820.77380.81990.5279
    QCGAN-ECG0.56230.30670.71230.75030.4921
    BiGRU-CNN GAN0.29970.12600.71320.50510.4431
    BiLSTM-CNN GAN0.19330.11890.72500.50430.4422
    ECG-QGAN(本文)0.37630.14590.71540.50140.4418
    下载: 导出CSV

    表  3   模型生成ECG信号在PRD上对比

    Table  3   Comparison of ECG Signals Generated by Models on PRD

    模型N类S类V类F类Q类
    DCGAN1.8021.5141.4801.7791.508
    QPatch-GAN1.0771.1341.3541.1830.873
    QCGAN-ECG1.0611.1281.4441.1160.896
    BiGRU-CNN GAN1.2361.0161.1731.1290.830
    BiLSTM-CNN GAN1.0950.9921.1311.0540.829
    ECG-QGAN(本文)0.9841.0181.0851.0550.752
    下载: 导出CSV
  • [1]

    Mensah G A, Fuster V, Murray C J L, et al. Global burden of cardiovascular diseases and risks, 1990-2022[J]. Journal of the American College of Cardiology, 2023, 82(25): 2350−2473

    [2] 闫璟辉,宗成庆,徐金安. 中文医疗文本中的嵌套实体识别方法[J]. 软件学报,2024,35(6):2923−2935

    Yan Jinghui, Zong Chengqing, Xu Jin’an. Configurable text-based image editing by autoencoder-based generative adversarial networks[J]. Journal of Software, 2024, 35(6): 2923−2935 (in Chinese)

    [3] 蔡德润,李红燕. 基于度量学习的无监督域适应方法及其在死亡风险预测上的应用[J]. 计算机研究与发展,2022,59(3):674−682 doi: 10.7544/issn1000-1239.20200693

    Cai Derun, Li Hongyan. A metric learning based unsupervised domain adaptation method with its application on mortality prediction[J]. Journal of Computer Research and Development, 2022, 59(3): 674−682 (in Chinese) doi: 10.7544/issn1000-1239.20200693

    [4] 韩京宇,陈伟,赵静等. 基于异常特征模式的心电数据标签清洗方法[J]. 计算机研究与发展,2023,60(11):2594−2610 doi: 10.7544/issn1000-1239.202220334

    Han Jingyu, Chen Wei, Zhao Jing, et al. A label cleaning method of ECG data based on abnormality-feature patterns[J]. Journal of Computer Research and Development, 2023, 60(11): 2594−2610 (in Chinese) doi: 10.7544/issn1000-1239.202220334

    [5]

    Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[J]. Communications of the ACM, 2020, 63(11): 139−144

    [6] 吴福祥,程俊. 基于自编码器生成对抗网络的可配置文本图像编辑. 软件学报[J],2022,33(9):3139−3151

    Wu Fuxiang, Cheng Jun. Configurable text-based image editing by autoencoder-based generative adversarial networks[J]. Journal of Software, 2022, 33(9): 3139−3151 (in Chinese)

    [7] 于海涛,杨小汕,徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展,2020,57(7):1522−1530 doi: 10.7544/issn1000-1239.2020.20190479

    Yu Haitao, Yang Xiaoshan, Xu Changsheng. Antagonistic video generation method based on multimodal input[J]. Journal of Computer Research and Development, 2020, 57(7): 1522−1530 (in Chinese) doi: 10.7544/issn1000-1239.2020.20190479

    [8] 蒋斌,刘虹雨,杨超. 一种基于局部属性生成对抗网络的人脸修复算法[J]. 计算机研究与发展,2019,56(11):2485−2493 doi: 10.7544/issn1000-1239.2019.20180656

    Jiang Bin, Liu Hongyu, Yang Chao. A face inpainting algorithm with local attribute generative adversarial networks[J]. Journal of Computer Research and Development, 2019, 56(11): 2485−2493 (in Chinese) doi: 10.7544/issn1000-1239.2019.20180656

    [9] 戴臣超,王洪元,倪彤光. 基于深度卷积生成对抗网络和拓展近邻重排序的行人重识别[J]. 计算机研究与发展,2019,56(8):1632−1641 doi: 10.7544/issn1000-1239.2019.20190195

    Dai Chenchao, Wang Hongyuan, Ni Tongguang. Person reidentification based on deep convolutional generative adversarial network and expanded neighbor reranking[J]. Journal of Computer Research and Development, 2019, 56(8): 1632−1641 (in Chinese) doi: 10.7544/issn1000-1239.2019.20190195

    [10]

    Brophy E, Wang Zhengwei, She Qi, et al. Generative adversarial networks in time series: A systematic literature review[J]. ACM Computing Surveys, 2023, 55(10): 1−31

    [11]

    Boixo S, Isakov S V, Smelyanskiy V N, et al. Characterizing quantum supremacy in near-term devices[J]. Nature Physics, 2018, 14(6): 595−600

    [12]

    Biamonte J, Wittek P, Pancotti N, et al. Quantum machine learning[J]. Nature, 2017, 549(7671): 195−202

    [13]

    Preskill J. Quantum computing in the NISQ era and beyond[J]. Quantum, 2018, 2: 79−88

    [14]

    Schuld M, Sinayskiy I, Petruccione F. An introduction to quantum machine learning[J]. Contemporary Physics, 2015, 56(2): 172−185

    [15]

    Ciliberto C, Herbster M, Ialongo A D, et al. Quantum machine learning: A classical perspective[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2018, 474(2209): 20170551

    [16] 李盼池,周红岩. 基于受控Hadamard门的量子神经网络模型及算法[J]. 计算机研究与发展,2015,52(1):211−220 doi: 10.7544/issn1000-1239.2015.20131016

    Li Panchi, Zhou Hongyan. Model and algorithm of quantum neural network based on the controlled Hadamard gates[J]. Journal of Computer Research and Development, 2015, 52(1): 211−220 (in Chinese) doi: 10.7544/issn1000-1239.2015.20131016

    [17]

    Benedetti M, Lloyd E, Sack S, et al. Parameterized quantum circuits as machine learning models[J]. Quantum Science and Technology, 2019, 4(4): 043001

    [18]

    Delaney A M, Brophy E, Ward T E. Synthesis of realistic ECG using generative adversarial networks[J]. arXiv preprint, arXiv: 1909.09150, 2019

    [19]

    Golany T, Radinsky K. Pgans: Personalized generative adversarial networks for ECG synthesis to improve patient-specific deep ECG classification[C] // Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2019: 557−564

    [20]

    Golany T, Radinsky K, Freedman D. SimGANs: Simulator-based generative adversarial networks for ECG synthesis to improve deep ECG classification[C] // Proc of the Int Conf on Machine Learning. New York: ACM, 2020: 3597−3606

    [21]

    Vo K, Naeini E K, Naderi A, et al. P2E-WGAN: ECG waveform synthesis from PPG with conditional Wasserstein generative adversarial networks[C] //Proc of the 36th Annual ACM Symp on Applied Computing. New York: ACM, 2021: 1030−1036

    [22]

    Adib E, Fernandez A S, Afghah F, et al. Synthetic ECG signal generation using probabilistic diffusion models[J]. IEEE Access, 2023, 11: 75818−75828

    [23]

    Lloyd S, Weedbrook C. Quantum generative adversarial learning[J]. Physical Review Letters, 2018, 121(4): 040502

    [24]

    Dallaire-Demers PL, Killoran N. Quantum generative adversarial networks[J]. Physical Review A, 2018, 98(1): 012324

    [25]

    Benedetti M, Garcia-Pintos D, Perdomo O, et al. A generative modeling approach for benchmarking and training shallow quantum circuits[J]. NPJ Quantum Information, 2019, 5(1): 45−56

    [26]

    Huang Heliang, Du Yuxuan, Gong Ming, et al. Experimental quantum generative adversarial networks for image generation[J]. Physical Review Applied, 2021, 16(2): 024051

    [27]

    Silver D, Patel T, Cutler W, et al. Mosaiq: Quantum generative adversarial networks for image generation on NISQ computers[C] //Proc of the IEEE/CVF Int Conf on Computer Vision. Piscataway, NJ: IEEE, 2023: 7030−7039

    [28]

    Qu Zhiguo, Shi Wenke, Tiwari P. Quantum conditional generative adversarial network based on patch method for abnormal electrocardiogram generation[J]. Computers in Biology and Medicine, 2023, 166: 107549

    [29] 韩京宇,陈伟,赵静. 基于异常特征模式的心电数据标签清洗方法[J]. 计算机研究与发展,2023,60(11):2594−2610 doi: 10.7544/issn1000-1239.202220334

    Han Jingyu, Chen Wei, Zhao Jing. A label cleaning method of ECG data based on abnormality-feature patterns[J]. Journal of Computer Research and Development, 2023, 60(11): 2594−2610 (in Chinese) doi: 10.7544/issn1000-1239.202220334

    [30]

    Arjovsky M, Chintala S, Bottou L. Wasserstein generative adversarial networks[C] // Proc of the 34th Int Conf on Machine Learning. New York: PMLR, 2017: 214−223

    [31]

    George M. MIT-BIH arrhythmia database [DB/OL]. [2024-05-01]. https://physionet.org/content/mitdb/1.0.0/

    [32]

    Paul A. MIT-BIH ST change database [DB/OL]. [2024-05-01]. https://physionet.org/content/stdb/1.0.0/

    [33]

    Taddei A. European ST-T database [DB/OL]. [2024-05-01]. https://physionet.org/content/edb/1.0.0/

    [34]

    Greenwald SD. Sudden cardiac death holter database [DB/OL]. [2024-05-01]. https://physionet.org/content/sddb/1.0.0/

    [35]

    Borji A. Pros and cons of GAN evaluation measures[J]. Computer Vision and Image Understanding, 2019, 179: 41−65 doi: 10.1016/j.cviu.2018.10.009

    [36]

    Radford A, Metz L, Chintala S. Unsupervised representation learning with deep convolutional generative adversarial networks[J]. arXiv preprint, arXiv: 1511.06434, 2015

图(13)  /  表(4)
计量
  • 文章访问数:  23
  • HTML全文浏览量:  7
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-05-31
  • 修回日期:  2025-02-27
  • 录用日期:  2025-04-02
  • 网络出版日期:  2025-04-02

目录

/

返回文章
返回