• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

面向企业信用风险评估的多视角异质图神经网络方法

魏少朋, 梁婷, 赵宇, 庄福振, 任福继

魏少朋, 梁婷, 赵宇, 庄福振, 任福继. 面向企业信用风险评估的多视角异质图神经网络方法[J]. 计算机研究与发展, 2024, 61(8): 1957-1967. DOI: 10.7544/issn1000-1239.202440126
引用本文: 魏少朋, 梁婷, 赵宇, 庄福振, 任福继. 面向企业信用风险评估的多视角异质图神经网络方法[J]. 计算机研究与发展, 2024, 61(8): 1957-1967. DOI: 10.7544/issn1000-1239.202440126
Wei Shaopeng, Liang Ting, Zhao Yu, Zhuang Fuzhen, Ren Fuji. Multi-View Heterogeneous Graph Neural Network Method for Enterprise Credit Risk Assessment[J]. Journal of Computer Research and Development, 2024, 61(8): 1957-1967. DOI: 10.7544/issn1000-1239.202440126
Citation: Wei Shaopeng, Liang Ting, Zhao Yu, Zhuang Fuzhen, Ren Fuji. Multi-View Heterogeneous Graph Neural Network Method for Enterprise Credit Risk Assessment[J]. Journal of Computer Research and Development, 2024, 61(8): 1957-1967. DOI: 10.7544/issn1000-1239.202440126

面向企业信用风险评估的多视角异质图神经网络方法

基金项目: 国家自然科学基金项目(62376227)
详细信息
    作者简介:

    魏少朋: 1997年生. 博士. 主要研究方向为图学习及其在金融科技场景的应用

    梁婷: 1979年生. 博士,副教授. 主要研究方向为财务会计、公司财务、跨文化交流

    赵宇: 1985年生. 博士,教授. 主要研究方向为机器学习、自然语言处理、知识图谱、金融科技

    庄福振: 1983年生. 博士,教授. 主要研究方向为迁移学习、多任务学习、多视角学习、推荐系统、知识图谱

    任福继: 1959年生. 博士,教授. 主要研究方向为情感计算、人工智能

    通讯作者:

    庄福振(zhuangfuzhen@buaa.edu.cn

  • 中图分类号: TP391

Multi-View Heterogeneous Graph Neural Network Method for Enterprise Credit Risk Assessment

Funds: This work was supported by the National Natural Science Foundation of China (62376227).
More Information
    Author Bio:

    Wei Shaopeng: born in 1997. PhD. His main research interest includes graph learning and its applications on Fintech

    Liang Ting: born in 1979. PhD, associate professor. Her main research interests include financial accounting, corporate finance, and interculture communication

    Zhao Yu: born in 1985. PhD, professor. His main research interests include machine learning, NLP, knowledge graph, and Fintech

    Zhuang Fuzhen: born in 1983. PhD, professor. His main research interests include transfer learning, multi-task learning, multi-view learning, recommendation systems, and knowledge graph

    Ren Fuji: born in 1959. PhD, professor. His main research interests include affective computing and artificial intelligence

  • 摘要:

    企业信用风险评估是一个重要且具有挑战的问题. 由于金融市场中存在大量的异质关联关系,使得异质图神经网络天然适合建模企业信用风险. 然而,现有大部分研究不能充分捕捉到复杂金融网络中企业的综合信用风险. 针对此问题,提出了一个面向企业信用风险评估的多视角异质图神经网络方法——CRGNN. 该方法包含自身风险编码器以及传染风险编码器,其中自身风险编码器建模基于企业特征信息的自身风险,传染风险编码器由新提出的分层异质图Transformer网络和分层异质图特征注意力网络2个子模块组成. 这2个模块分别挖掘基于企业不同邻居视角的传染风险和基于不同特征维度视角的传染风险. 为了充分利用异质关系信息,2个模块都采用了分层机制. 在企业破产预测数据集SMEsD和企业信用评估数据集ECAD上进行了大量的实验,AUC指标相比最优基线模型分别提高了3.98个百分点和3.47个百分点.

    Abstract:

    Credit risk assessment for enterprises is a critical issue, significantly impacting investor decisions. It also plays a crucial role in enabling government warnings and the handling of financial risks in a timely manner. Given the numerous heterogeneous relationships in the financial market, graph neural networks are naturally suitable for modeling enterprise credit risk. However, most existing research primarily focuses on modeling either the intra-risk of enterprises based on their financial information or the inter-enterprise contagion risk using simulation methods. Therefore, these approaches fail to fully capture the comprehensive credit risk of enterprises in complex financial networks. To address this limitation in current research, we propose a multi-perspective heterogeneous graph neural network method CRGNN for enterprise credit risk assessment. This method includes an enterprise intra-risk encoder and an enterprise contagion risk encoder, where the enterprise intra-risk encoder models the intra-risk based on enterprise feature information, and the enterprise contagion risk encoder consists of two sub-modules: a hierarchical heterogeneous graph Transformer network and a hierarchical heterogeneous graph feature attention network newly proposed in this paper. These two modules respectively explore contagion risks from the views of different neighbors and different feature dimensions. To fully utilize heterogeneous relationship information, both modules employ hierarchical mechanisms. With these designs, the model proposed in this study can adequately capture the comprehensive credit risk faced by enterprises. Extensive experiments are conducted on the SMEsD bankruptcy prediction dataset and the ECAD enterprise credit assessment dataset, resulting in an improvement of 3.98% and 3.47% in AUC compared with the best baseline model, respectively.

  • 企业信用风险主要由企业自身风险和传染风险组成,包含了企业破产、违约、股价崩盘等不同方面的含义,众多机构和个人投资者都将企业信用风险评估作为债券和股票交易决策的重要考量之一. 更重要的是,政府机构可以依赖企业信用风险评估及时预警和处理辖内可能的经济和金融隐患问题,这对于经济和金融的稳定和健康发展具有重要的现实意义.

    异质图神经网络(heterogeneous graph neural networks)由于其建模复杂网络的出色能力,成为了理解和建模复杂金融网络的重要工具之一. 企业多关系异质图(参考定义1)就是一种典型的复杂金融网络,其中包含企业间复杂的关联关系,例如投资、持股、担保和供应链等异质关系. 当企业由于自身经营不善或者各种外部环境冲击导致企业面临违约或者破产风险,企业的这种状态势必会在当下或者未来影响到其关联的企业,例如供应链的上下游企业或者其他利益相关企业. 当企业经营业绩良好,企业的这种状态同样会影响到其关联的公司,比如其控股公司可以获得更多的收益,因此降低了关联企业的风险.

    然而,先前关于企业信用风险评估的研究大多基于企业财务指标获得企业自身风险[1],或者通过仿真模拟得到企业风险传染的模式[2],无法充分建模企业面临的综合信用风险. 更重要的是,基于图神经网络的方法通常采用实体级的注意力机制,忽视了特征维度层面的信息聚集,而这对于企业信用风险的细粒度挖掘是十分重要的. 图1展示了一个企业多关系异质图示例,其中包含目标企业A和它的邻居企业BCD. 企业间有投资和分支2种关联关系. 每个企业有4个维度的特征,分别体现企业盈利能力、营运能力、偿债能力和诉讼数量. 由于C企业包含3个维度的高风险指标(图中深色方格),因此在实体级的注意力机制下,C企业会被分配一个较大的权重(图中加粗的虚线箭头). 相比之下,B企业则会被分配一个极小的权重(图中较细的虚线箭头). 然而,值得注意的是,B企业仍拥有较多的诉讼数量,这一重要信息可能在基于实体级注意力的模型中被忽略.

    图  1  企业多关系异质图示例
    Figure  1.  An example of enterprise multi-relation heterogeneous graph

    为了解决这一重要问题,本文提出了一种面向企业信用风险评估的多视角异质图神经网络方法——CRGNN(credit risk graph neural network),该方法首先建模企业自身风险,然后从企业不同邻居视角和不同特征维度视角建模企业传染风险,得到企业的综合信用风险表征.

    具体而言,本文首先使用自身风险编码器从企业特征信息中得到企业的自身风险表征. 然后,使用传染风险编码器对企业面临的传染风险进行建模. 本文考虑2个视角的传染风险,即不同邻居实体视角的传染风险和不同特征维度视角的传染风险,本文分别使用分层异质图Transformer网络和分层异质图特征注意力网络2个子模块来对2类传染风险进行建模.

    分层异质图Transformer网络从邻居实体视角建模企业传染风险. 具体而言,该模块为异质关系下的不同邻居节点分配实体级别的重要性权重. 本文使用Transformer风格的注意力机制来实现邻居节点重要性的计算,与此同时,由于同一种异质关系下,中心节点仍可能存在多个邻居节点,为了充分利用异质关系信息,本文采用了分层机制来充分利用异质关系信息.

    分层异质图特征注意力网络从特征维度视角建模企业传染风险. 值得注意的是,先前的研究大多忽略了一个重要事实:不同的特征维度蕴含不同的风险信息,因而具有不同程度的重要性. 因此,这些研究未能充分挖掘到细粒度的风险信息. 具体而言,在企业信用风险场景下,企业的初始特征通常为企业不同方面的财务指标. 如果忽视这些不同维度所蕴含的风险信息,而仅仅考虑企业整体层面的风险水平,则在信息传递过程中损失了这些细粒度的风险信息,进而导致模型无法达到最优的性能表现. 因此,本文在分层异质图特征注意力网络中使用了创新的特征维度注意力机制来为不同的特征维度分配重要性权重,并基于此进行信息聚集. 类似于分层异质图Transformer网络,分层异质图特征注意力网络同样采用了分层机制来充分利用异质关系信息.

    总之,本文研究的贡献包含3个方面:

    1)提出了一种面向企业信用风险评估的框架,该框架首先建模企业特征信息中蕴含的企业自身风险,然后建模企业多关系异质图中蕴含的企业传染风险.

    2) 为了充分利用企业多关系异质图中的结构信息来建模企业传染风险,本文研究提出了新的分层异质图Transformer网络和分层异质图特征注意力网络分别从邻居视角和特征维度视角来进行细粒度的异质信息聚集.

    3) 在企业破产预测数据集SMEsD和企业信用评级数据集ECAD这2个公开数据集上进行了大量的实验,验证了本文所提出方法的有效性.

    传统的企业信用评估方法主要关注企业自身的财务指标,进而使用多元判别分析方法进行预测[1]. 随着机器学习研究的迅速发展,更多的企业信用评估研究开始利用机器学习方法对这些指标进行分析,包括支持向量机(SVM)[3]、决策树[4]和人工神经网络[5]等. 例如,Zhang等人[3]构建了一个指标系统来描述供应链中的头部企业状态以及在供应链中与其他企业的联系,并基于这些指标使用支持向量机来预测企业的信用风险水平. 值得注意的是,其中描述企业状态的指标大多仍为企业的财务指标. Chen等人[6]则基于专家对企业财务数据的主观评价,进一步利用多目标群决策方法对专家意见进行分析,得到房地产企业的信用风险水平. 伴随着人工智能技术的进一步发展,研究者们不仅可以使用财务指标等数值型信息来预测企业信用风险水平,还可以利用文本、多媒体信息来挖掘更多维度的风险指标. 例如,Borochin等人[7]发现公司电话会议的语气与股票期权市场中公司价值不确定性呈负相关. Craja等人[8]在财务指标的基础上,利用分层注意力网络从结构化文本(如年度报告)中提取与风险相关的信息,并将二者融合,用于检测财务报表欺诈行为. Borchert等人[9]利用深度神经网络从网络文本内容中学习企业风险表征来预测企业破产. Li等人[10]对企业的财报电话会议记录进行了文本分析来量化公司层面面临的气候变化风险冲击.

    然而,文献[1, 3-10]研究大多关注于充分的财务信息和文本信息,无法有效利用重要的关系信息.

    企业的传染风险同样是评估企业信用风险水平的一个重要方面. 在当前市场经济环境中,大部分企业都作为供应链或者生产体系中的一环存在,几乎没有一家企业独自完成生产的全部过程. 企业间的关联关系错综复杂,对企业的经营发展具有重要的影响. 因此,很多研究开始关注企业间的关联关系与企业信用风险水平或金融系统的稳定之间的联系. 例如,Elsinger等人[11]使用银行间贷款的网络模型来评估金融系统的稳定性水平. Kou等人[12]也证实了基于支付网络的信息对于预测中小企业破产的重要性. Buraschi等人[13]再次从实证的角度验证了基于网络的风险溢出效应. Xie等人[14]研究发现企业使用双渠道融资,即同时向银行贷款和向供应商寻求贸易信贷,在缓解资本约束的同时可以减少供应链信用风险的传染效应. Lin等人[15]以5个波动率指数为指标,研究了股票市场之间的风险传染,发现发达经济体主要充当网络中的净风险传递者.

    然而,先前的研究大多数基于仿真模拟来探讨传染风险的影响,距离真实世界的场景具有较大的差距,因而无法被广泛应用在实际环境中.

    图神经网络(graph neural networks,GNNs)使用深度学习的方式来建模节点间的信息传递过程. 早期的图神经网络关注同质图的建模[16-17]. 然而,真实世界的网络通常由异质图,即包含不同类型的节点和边构成. 因此,当前的图神经网络研究更多地关注异质图的建模. 例如,Schlichtkrull等人[18]提出了RGCN模型,利用不同的关系映射矩阵来建模包含复杂关系的知识图谱. Hu等人[19]提出HGT算法来建模大规模的异质图网络. MM-GNN[20]利用多阶矩来计算邻居信息的分布,然后使用注意力机制融合不同的矩信息. 焦鹏飞等人[21]根据历史信息,使用异质层次化注意力机制来生成未来邻居节点的表征,然后使用对比学习的方式来捕捉图中全局和局部的信息. Chen等人[22]同样基于对比学习来建模异质图网络,并应用在推荐系统中. Yang等人[23]基于异质图上的元路径关系建模节点间信息传递过程,所提出的模型简单且有效. Gao等人[24]利用基于强化学习的神经结构搜索技术自动地设计异质图神经网络结构,该算法降低了候选网络结构的数量,并且降低了搜索的时间.

    在企业信用评估场景中,企业之间相互关联,共同构成了一个大型的企业多关系异质图,其中包括企业、个人以及它们之间的关联关系. 许多学者关注到了这一点,开始使用异质图神经网络来建模各类信用风险. 例如,SemiGNN[25]利用标记和未标记的多视图数据进行欺诈检测. Hu等人[26]通过对各种关系、对象、节点和边的丰富属性建模进行了贷款违约预测. Cheng等人[27]使用时间间隔注意力网络计算传染链的风险分数. 在违约预测方面,Yang等人[28]基于收集到的供应链数据集进行破产预测. Zheng等人[29]考虑基于元路径的邻居,采用3层注意力网络进行破产预测. Bi等人[30]利用股东信息和财经新闻构建了一个社区网络,并采用2个层级的模型进行风险评估. Cheng等人[31]还提出了一种基于图网络的深度强化学习方法,用于寻找银行业中的关键公司以遏制传染风险. Cai等人[32]综合供应链企业的基本业务特征、文本语义特征以及通过供应链网络嵌入得到的拓扑结构特征对企业风险进行评估,并应用在供应链中断风险识别中.

    然而,很少有研究人员同时考虑到企业信用风险评估中的自身风险和传染风险. 此外,大多数研究未能考虑到特征维度视角的细粒度传染风险信息.

    本节首先定义企业多关系异质图和企业信用评估任务,然后介绍新提出的企业信用风险评估方法CRGNN.

    定义1. 企业多关系异质图. 企业多关系异质图被定义为一个连接图G=(V,E,R). 其中,V表示所有节点的集合,E表示边的集合. 边涉及一个类型映射函数:ϕ:ER,其中R为边类型的集合,|R|>2.

    定义2. 企业信用风险评估. 给定企业多源异构风险数据,包含企业的基本情报信息H和企业多关系异质图G,本文旨在通过建模企业的自身风险与传染风险来评估企业的信用风险水平.

    图2所示,CRGNN包含3部分:1)自身风险编码器;2)传染风险编码器;3)信用风险分类器. 其中,传染风险编码器又包含分层异质图Transformer网络和分层异质图特征注意力网络.

    图  2  CRGNN模型示意图
    Figure  2.  Illustration of CRGNN model

    本节首先介绍自身风险编码器. 自身风险编码器旨在从企业节点原始的属性特征HRN×d中自动提取风险相关的信息. 具体来说,本文首先对节点的输入特征进行线性映射,使其进入相同的潜在向量空间. 为了使节点的向量表征在后续的训练中稳定,本文对所有节点表征进行了归一化(normalization)操作. 接着,本文让所有节点的向量表征经过激活函数层. 具体的实现为:

    H=σ(Norm(HW+bT))
    (1)

    其中,Wb为可学习的参数矩阵,σ为激活函数,H为映射后新的节点表征.

    在本文研究中,传染风险编码器包含2个部分:分层异质图Transformer网络和分层异质图特征注意力网络,分别用于学习异质关系下不同邻居视角和不同特征维度视角的信用风险表征.

    分层异质图Transformer网络包含关系层和节点层这2层注意力网络. 在节点层注意力网络中,本文首先根据目标节点与邻居节点的关系类型选择对应的映射向量将二者的信息映射为一个权重,具体计算为:

    eij=wϕkT[hihj],
    (2)

    其中,ϕk是节点i和节点j之间的关系,wϕkR2d×1是与关系ϕk相关的可学习的参数向量,为拼接操作,eij为映射后的向量表征.

    本文使用Softmax函数计算归一化的权重,具体计算为:

    αϕkij=Softmax(eij)=exp(eij)mNϕkiexp(eim)
    (3)

    其中,Nϕki表示节点i在关系ϕk下的邻居节点集合. 然后,本文对分层异质图Transformer网络中的关系层的信息进行聚集,计算为:

    rϕki=σ(jNϕkiαϕkijhj)
    (4)

    其中,rϕki为节点i基于关系ϕk聚集得到的关系层风险向量表征. σ为激活函数,本文在这里选择Leaky Relu激活函数.

    本文采用Transformer风格的注意力机制计算分层异质图Transformer网络中节点层的风险向量表征. 首先,本文将关系层的风险向量表征映射到不同的空间,计算为:

    {qϕki=WϕkQhi+bϕkQkϕki=WϕkKrϕki+bϕkK
    (5)

    其中,WϕkQbϕkQWϕkKbϕkK均为可训练的参数矩阵或向量. 接下来,本文计算不同关系的重要性:

    gϕki=kϕkiTqϕkiμϕkd
    (6)

    其中,μϕk是可训练的参数. μϕkd的目的是控制计算结果在数值上的规模. 然后,本文通过Softmax函数归一化不同关系的重要性,计算过程为:

    βϕki=Softmax(gϕki)=exp(gϕki)ϕrRexp(gϕri).
    (7)

    本文聚集不同关系的信息得到节点层级的风险向量表征:

    ˜hi=ϕpRβϕpi(WVrϕpi+bV)
    (8)

    其中,WVbV分别是可训练的参数矩阵和向量. ϕpR表示节点i的任意一种邻居关系. 本文使用残差连接让学习到的风险表征更加稳定,计算为:

    hHGi=ησ(hi)+˜hi
    (9)

    其中,η为可学习的参数,用于平衡原始风险嵌入和基于异质关系聚集得到的风险嵌入之间的重要性. σ为激活函数,本文在这里选择GELU激活函数. hHGi为节点i更新后的基于异质关系的风险表征.

    接下来本文介绍分层异质图特征注意力网络. 与分层异质图Transformer网络类似,分层异质图特征注意力网络也包含2层:第1层基于不同的异质关系计算不同维度的特征重要性,并基于此进行信息融合;第2层将不同的异质关系信息基于维度重要性进行融合. 本文首先根据不同的异质关系将节点风险特征映射到新的向量空间,计算为:

    fϕkij=Wϕkfahj
    (10)

    其中,hj为节点i在关系ϕk下的任意邻居节点的风险表征,Wϕkfa是基于关系ϕk的可训练的参数矩阵. 不同关系下基于特征维度的重要性计算为:

    αϕk,lij=Softmax(fϕk,lij)=exp(fϕk,lij)mNϕkiexp(fϕk,lim)
    (11)

    其中,fϕk,lij表示节点i和节点j在关系ϕk下产生的边信息fϕkij的第l个维度的值,αϕk,lij则为计算得到的维度l的重要性. 本文基于计算得到的特征维度重要性作为边信息聚集的权重进行计算:

    tϕk,li=jNϕkiαϕk,lijh,lj
    (12)

    其中,tϕk,li是聚合信息tϕkil维度元素. Nϕki表示节点i在关系ϕk下的邻居节点集合. 接着,本文进行节点层级的信息聚集. 首先计算每种关系在特征注意力机制下的重要性,具体过程为:

    ˜fϕki=tϕkTiwfa
    (13)

    其中,wfa是与关系类型相关的可训练参数向量.

    本文使用Softmax函数对计算的结果进行归一化,计算过程为:

    αϕki=Softmax(˜fϕki)=exp(˜fϕki)ϕmRexp(˜fϕmi).
    (14)

    基于归一化后的重要性,本文聚集不同关系的信息,其计算过程为:

    hFAi=ϕkRαϕkitϕki
    (15)

    其中,hFAi表示基于特征注意力计算得到的节点信用风险表征,为了得到最终的、全面的风险表征,本文将以上通过分层异质图Transformer网络和分层异质图特征注意力网络计算得到的风险表征进行融合,计算过程为:

    hfi=Dropout(σ(Wf(hHGi+βhFAi)+bf))
    (16)

    其中,β是可训练的参数,用于平衡2类风险表征各自的相对重要性. Wfbf均为可训练的参数. σ为激活函数,本文在这里选用Relu激活函数. 本文还使用了Dropout层来降低模型过拟合的可能. hfi是模型融合自身风险和传染风险最终得到的企业综合风险 表征.

    本节介绍信用风险分类器及其优化. 在得到节点的综合风险表征以后,本文将该表征投影到信用风险的类别,具体计算为:

    ˆyic=Softmax(MLP(hfi))
    (17)

    其中,MLP为多层感知机,起到节点表征映射的作用. Softmax函数在此处的作用是归一化模型在各个类别输出的概率. ˆyic是模型为节点i预测的属于类别c的概率. 本文使用交叉熵损失函数对模型进行优化,具体的计算为:

    L=iVLyilog(ˆyi)
    (18)

    其中,yi为节点i的真实类别,L为所有节点损失之和.

    本文使用企业破产预测数据集SMEsD[33]和企业信用评级数据集ECAD 1来评估本文研究所提出的模型. 数据集的描述性统计如表1所示. 这2个数据集均包含企业的多源风险信息和企业多关系异质图. 其中,SMEsD数据集基于889个初始种子节点抽样得到,并被进一步划分为训练集、验证集和测试集. SMEsD数据集包含企业间的5种异质关系,每一个企业都有对应的标签,即破产或者存续. ECAD数据集则是基于500个初始种子节点抽样得到. 与SMEsD数据集不同的是,ECAD数据集关注中型企业,每一家企业的规模更大,关联公司更多. 因此,抽样得到的数据集包含48758家企业,以及企业间的3种异质关系. ECAD数据集同样被划分为训练集、验证集和测试集,但并非所有的企业都具有信用评级. 事实上,仅有1274家企业具有信用评级,总共包含3个等级,即优秀(AAA)、良好(AA)和差(A,BBB等其他评级).

    表  1  数据集统计
    Table  1.  Statistics of the Datasets
    数据集 项目 训练集 验证集 测试集
    SMEsD 节点数量 3976
    关系数量 高管 3944
    股东 5722
    利益相关者 6402
    投资 9408
    分支 768
    标签数量 破产 1621 354 318
    存续 1195 367 173
    ECAD 节点数量 48758
    关系数量 投资 77572
    分支 12764
    利益相关者 1302415
    标签数量 327 122 117
    378 108 91
    74 28 29
    下载: 导出CSV 
    | 显示表格

    本文比较了3类共计11种基线模型,包括机器学习(ML)方法、同质图神经网络(homogeneous GNNs,HomoG)方法以及异质图神经网络(heterogeneous GNNs,HeteG)方法. 这些方法的具体介绍如下:

    1)机器学习方法包括:①逻辑回归(LR)[34]. 该方法利用Sigmoid函数将线性回归模型的输出映射到0~1,得到对类别的预测概率. ②支持向量机(SVM)[35]. 该方法是一种可以应用在分类问题和回归问题的有监督学习模型. 在分类问题中,支持向量机的目标是找到一个最优的超平面,将不同类别的样本分开,并且使得离超平面最近的样本点的间隔最大化. ③决策树(DT)[36]. 该方法同样是一种常用于分类问题的有监督学习模型,其原理类似于对实例进行一系列的逻辑判定,并基于此进行分类.

    2)同质图神经网络方法包括:①图卷积网络(GCN)[16]. 这是最经典的图深度学习模型之一,该模型将卷积操作扩展到图神经网络研究中. 具体而言,在信息传递过程中,每一个中心节点平均地聚集其周围邻居节点的表征. ②图注意力网络(GAT)[17]. 该模型在GCN模型的基础上引入了注意力机制,即在信息传递过程中,每一个中心节点加权地聚集其邻居节点的信息,其中权重由模型自动计算得到.

    3)异质图神经网络方法包括:①关系图卷积网络(RGCN)[18]. 该方法在GCN模型的基础上引入对异质关系信息的建模,从而实现了对异质图更好地表征. ②异质图注意力网络(HAN)[37]. 该模型最初被用于建模推荐系统,但是由于其高效的分层注意力机制,该模型在其他领域也取得了良好的性能表现.③异质图Transformer(HGT)[19]. 该模型借鉴了Transformer中的注意力机制,并将其应用在图神经网络中,能够高效地对异质图进行建模. ④MM-GNN [20]. 该模型的核心思想是学习周围邻居节点特征的分布. 具体而言,该模型借鉴了统计理论中的矩方法并应用在节点信息聚集过程中. ⑤基于异质注意力网络的模型(HAT)[29]. 该模型进一步扩展了分层机制,在中小企业破产预测中使用三级注意力来充分建模异质关系信息. ⑥用于企业破产预测的异质图神经网络模型(ComRisk)[33]. 该模型利用异质超图和异质图建模企业间的传染风险,进而用于企业破产预测.

    本文参考文献[33]中的设定,所有企业节点的初始特征由多源风险信息按照一定的规则转化为数值特征来作为所有模型的输入. 本文使用PyTorch和PyTorch Geometric(PyG)实现CRGNN. 本文使用所有基线模型的官方代码,并在它们的基础上微调超参数,包括隐藏维度、层数量和多头数量,以获得模型最佳的性能,最终得到在2个数据集上的结果. 所有基于图神经网络的模型均使用Adam优化器[38]来更新模型参数的梯度,以及使用余弦退火学习率调度器[39]来调整训练过程中的学习率. 本文在SMEsD数据集上运行400个epoch,在ECAD数据集上运行200个epoch,分别根据验证集上的准确率来判断最优的模型,并在测试集上测试.

    表2所示,本文对不同模型在2个数据集SMEsD和ECAD上的性能进行了比较. 显示了所有模型在2个信用风险评估任务上5次测试的平均结果和标准差.在SMEsD数据集上,CRGNN模型相较于基线模型的最优结果在准确率(accuracy)、F1分数和AUC等3个综合指标上均取得了显著提升,分别提高了2.09个百分点、4.07个百分点和3.98个百分点. 在ECAD数据集上,CRGNN相较基线模型的最优结果提升也十分明显,准确率提高了约3.24个百分点,F1分数提高了约3.59个百分点,AUC提高了3.47个百分点. 除此之外,CRGNN相较于所有基线模型,在2个数据集上的精度(precision)和召回率(recall)指标上也取得了最佳的表现.

    表  2  信用风险评估实验结果
    Table  2.  Credit Risk Assessment Experimental Results %
    模型 具体方法 SMEsD ECAD
    准确率 精度 召回率 F1 AUC 准确率 精度 召回率 F1 AUC
    ML LR 74.57 75.49 43.75 55.40 80.84 57.81 38.92 43.26 64.84 60.92
    SVM 65.38 71.43 5.68 10.53 52.21 60.76 42.10 44.77 42.17 65.67
    DT 74.34 70.16 49.43 58.00 68.84 61.60 59.20 53.64 54.98 77.82
    HomoG GCN 75.24
    (1.75)
    70.00
    (3.73)
    54.46
    (3.53)
    61.17
    (2.8)
    70.18
    (2.72)
    66.67
    (0.60)
    57.60
    (16.10)
    50.67
    (0.55)
    47.89
    (0.98)
    80.46
    (1.99)
    GAT 76.04
    (0.72)
    70.32
    (2.36)
    57.67
    (2.19)
    63.30
    (0.79)
    73.36
    (2.23)
    62.53
    (1.40)
    44.86
    (4.90)
    46.97
    (1.67)
    44.56
    (1.90)
    80.64
    (0.50)
    HeteG RGCN 75.87
    (1.87)
    69.74
    (4.68)
    58.81
    (6.47)
    63.46
    (3.49)
    78.83
    (2.31)
    62.19
    (0.87)
    62.12
    (3.60)
    50.88
    (3.38)
    51.19
    (5.04)
    69.53
    (3.12)
    HAN 76.46
    (1.55)
    72.86
    (4.23)
    55.36
    (4.42)
    62.70
    (2.81)
    77.87
    (2.98)
    63.61
    (0.46)
    52.73
    (10.17)
    50.42
    (4.33)
    49.27
    (6.47)
    80.29
    (0.57)
    HGT 76.14
    (0.86)
    68.95
    (1.48)
    60.89
    (2.55)
    64.63
    (1.61)
    80.87
    (0.7)
    66.88
    (0.70)
    65.72
    (1.21)
    62.11
    (0.46)
    63.43
    (0.71)
    78.71
    (1.04)
    HAT 77.27
    (0.54)
    73.55
    (2.58)
    57.50
    (2.97)
    64.43
    (1.06)
    78.19
    (2.23)
    64.84
    (0.98)
    62.95
    (7.36)
    55.93
    (3.83)
    57.64
    (4.35)
    74.02
    (1.57)
    MM-GNN 75.80
    (0.89)
    71.21
    (1.28)
    54.55
    (3.09)
    61.72
    (2.12)
    70.09
    (2.03)
    60.99
    (2.96)
    41.71
    (2.73)
    44.40
    (2.03)
    42.37
    (1.87)
    67.53
    (5.16)
    ComRisk 77.11
    (0.61)
    74.15
    (2.36)
    55.80
    (4.24)
    63.51
    (2.26)
    79.48
    (2.46)
    68.57
    (0.88)
    71.86
    (8.22)
    62.22
    (5.09)
    64.07
    (6.32)
    78.63
    (3.63)
    CRGNN 79.36
    (1.02)
    75.22
    (2.11)
    63.64
    (6.08)
    68.70
    (3.02)
    84.85
    (0.75)
    71.81
    (1.05)
    72.28
    (2.78)
    66.29
    (1.18)
    68.43
    (1.49)
    84.11
    (0.99)
    注:最佳结果和次优结果分别用加粗和下划线数值表示;括号里数字表示标准差.
    下载: 导出CSV 
    | 显示表格

    与此同时,本文观察到机器学习方法在SMEsD和ECAD数据集上都取得了不错的效果,这是因为企业的多源风险信息充分刻画了企业的自身风险. 本文还观察到图神经网络模型的效果整体优于传统机器学习方法,这是因为图神经网络方法利用了企业间的复杂关联关系,能够建模重要的传染风险. 此外,异质图神经网络方法优于同质图神经网络方法,这是由于异质图神经网络可以充分建模企业间的多种异质关系,而不同的异质关系对于企业传染风险的建模贡献不同.

    为了更加直观地体现模型学习到的节点表征的有效性,本文进行了可视化分析实验. 首先将CRGNN模型以及各个图神经网络基线模型在ECAD数据集的测试集上进行前馈传播,得到各个模型学习到的企业节点的风险表征,然后使用t-SNE算法[40]将企业节点的表征投影到二维空间中. 如图3所示,绿色节点表示AAA企业,蓝色节点表示AA企业,红色表示其他信用等级的企业,这3类企业在图中越容易被区分,表明模型学习到的节点表征效果越好. 从图3(a)中可以看出,3类企业分别聚集成簇,相比于其他模型的可视化结果,CRGNN模型学习到的节点表征展示出了更强的可区分性.

    图  3  可视化结果
    Figure  3.  Visualization results

    为了进一步验证CRGNN模型的性能,本文在SMEsD数据集上进行了无监督的聚类实验. 具体而言,首先让每一个图神经网络模型进行前馈传播,得到每个模型在测试集上的节点风险表征. 接下来,本文使用K均值聚类的方法得到节点预测的类别,并将这些节点的真实类别与预测类别进行比较,使用归一化互信息(normalized mutual information,NMI)和调整兰德系数(adjusted Rand index,ARI)来评估聚类的效果. 由于结果往往受到初始质心的影响,本文重复以上过程20次,并在表3中报告实验结果. 如表3所示,CRGNN模型在聚类实验中优于所有的基线模型. 具体而言,CRGNN模型相比于最优的基线模型HAT在ARI指标和NMI指标上分别提升了4.56个百分点和3.45个百分点.

    表  3  聚类实验结果
    Table  3.  Clustering Experimental Results
    指标 GCN GAT RGCN HAN HGT MM-GNN HAT ComRisk CRGNN
    ARI –0.0047 –0.0061 –0.0004 0.0430 0.1785 0.1444 0.2833 0.1907 0.3289
    NMI 0.0048 0.0044 0.0000 0.0417 0.1571 0.1416 0.1951 0.1484 0.2296
    下载: 导出CSV 
    | 显示表格

    为了验证CRGNN各个子模块的有效性,本文在2个信用评估数据集上分别进行了消融实验. 本文为原始CRGNN模型生成了3种变体,分别是:1)w/o HeteRel. 该模型删除了分层异质图Transformer网络中对异质关系的处理. 2)w/o HeteGNN. 该模型删除了分层异质图Transformer网络模块. 3)w/o FA. 该模型删除了分层异质图特征注意力模块. 本文将实验结果呈现在图4中,从中可以看出所有删除子模块的变体相比于原始的CRGNN模型在不同数据集和绝大多数指标上的性能都有所下降. 具体而言,可以观察到w/o HeteRel相比于CRGNN性能下降,这是因为w/o HeteRel损失了一部分对异质关系建模的能力. 同时,还可以观察到w/o HeteGNN的性能表现下降最多,这一方面说明了异质关系对于建模企业信用风险的重要性,另一方面也说明了CRGNN网络对建模异质关系的有效性. 本文还观察到w/o FA相比于CRGNN也产生了性能下降,尤其是在ECAD数据集上,这验证了CRGNN的有效性.

    图  4  消融实验
    Figure  4.  Ablation study

    模型的超参数通常对模型的效果也会产生比较大的影响. 对于CRGNN模型而言,参数β平衡不同邻居视角的传染风险和不同特征维度视角的传染风险在最终风险表征中的占比,对于最终的模型性能表现有重要的影响. 本实验旨在分析模型在不同的β设定下的表现. 具体而言,比较了CRGNN模型在SMEsD数据集和ECAD数据集上,β{0.01,0.1,0.5,1.0,10,100}的表现. 如图5所示,β=10β=1时,模型的性能在SMEsD数据集和ECAD数据集上分别达到最佳,这可能是因为过小的β值不能让模型充分利用不同特征维度视角的传染风险,而过大的β值则限制了不同邻居实体视角的传染风险占比,同样损害了模型的性能表现,因此本文认为实践中使用相对折中的β值有助于实现最佳的模型效果.

    图  5  参数分析
    Figure  5.  Parameter analysis

    本文研究针对企业信用风险评估问题提出了一个统一的框架来融合企业自身风险和传染风险,从而充分建模企业的信用风险表征. 具体而言,本文研究提出了CRGNN模型,其包含一个自身风险编码器和一个传染风险编码器. 其中传染风险编码器又包括了分层异质图Transformer网络和分层异质图特征注意力网络2个子模块,旨在分别学习不同邻居实体和不同维度特征2个视角的传染风险. 为了验证本文研究所提出模型的有效性,本文在2个信用评估数据集:企业破产预测数据集SMEsD和企业信用评级数据集ECAD上进行了大量的实验,验证了CRGNN的风险表征能力. 未来,我们还将继续研究大规模和动态图上的企业信用风险表征,以及基于图神经网络的企业风险挖掘方法的可解释性.

    作者贡献声明:魏少朋负责调研相关文献,提出思路,完成实验并撰写论文;梁婷和赵宇提供理论指导,确定论文整体框架并给予论文撰写指导;庄福振和任福继提出论文修改意见并最终审核论文.

    https://anonymous.4open. science/r/GDAN/
  • 图  1   企业多关系异质图示例

    Figure  1.   An example of enterprise multi-relation heterogeneous graph

    图  2   CRGNN模型示意图

    Figure  2.   Illustration of CRGNN model

    图  3   可视化结果

    Figure  3.   Visualization results

    图  4   消融实验

    Figure  4.   Ablation study

    图  5   参数分析

    Figure  5.   Parameter analysis

    表  1   数据集统计

    Table  1   Statistics of the Datasets

    数据集 项目 训练集 验证集 测试集
    SMEsD 节点数量 3976
    关系数量 高管 3944
    股东 5722
    利益相关者 6402
    投资 9408
    分支 768
    标签数量 破产 1621 354 318
    存续 1195 367 173
    ECAD 节点数量 48758
    关系数量 投资 77572
    分支 12764
    利益相关者 1302415
    标签数量 327 122 117
    378 108 91
    74 28 29
    下载: 导出CSV

    表  2   信用风险评估实验结果

    Table  2   Credit Risk Assessment Experimental Results %

    模型 具体方法 SMEsD ECAD
    准确率 精度 召回率 F1 AUC 准确率 精度 召回率 F1 AUC
    ML LR 74.57 75.49 43.75 55.40 80.84 57.81 38.92 43.26 64.84 60.92
    SVM 65.38 71.43 5.68 10.53 52.21 60.76 42.10 44.77 42.17 65.67
    DT 74.34 70.16 49.43 58.00 68.84 61.60 59.20 53.64 54.98 77.82
    HomoG GCN 75.24
    (1.75)
    70.00
    (3.73)
    54.46
    (3.53)
    61.17
    (2.8)
    70.18
    (2.72)
    66.67
    (0.60)
    57.60
    (16.10)
    50.67
    (0.55)
    47.89
    (0.98)
    80.46
    (1.99)
    GAT 76.04
    (0.72)
    70.32
    (2.36)
    57.67
    (2.19)
    63.30
    (0.79)
    73.36
    (2.23)
    62.53
    (1.40)
    44.86
    (4.90)
    46.97
    (1.67)
    44.56
    (1.90)
    80.64
    (0.50)
    HeteG RGCN 75.87
    (1.87)
    69.74
    (4.68)
    58.81
    (6.47)
    63.46
    (3.49)
    78.83
    (2.31)
    62.19
    (0.87)
    62.12
    (3.60)
    50.88
    (3.38)
    51.19
    (5.04)
    69.53
    (3.12)
    HAN 76.46
    (1.55)
    72.86
    (4.23)
    55.36
    (4.42)
    62.70
    (2.81)
    77.87
    (2.98)
    63.61
    (0.46)
    52.73
    (10.17)
    50.42
    (4.33)
    49.27
    (6.47)
    80.29
    (0.57)
    HGT 76.14
    (0.86)
    68.95
    (1.48)
    60.89
    (2.55)
    64.63
    (1.61)
    80.87
    (0.7)
    66.88
    (0.70)
    65.72
    (1.21)
    62.11
    (0.46)
    63.43
    (0.71)
    78.71
    (1.04)
    HAT 77.27
    (0.54)
    73.55
    (2.58)
    57.50
    (2.97)
    64.43
    (1.06)
    78.19
    (2.23)
    64.84
    (0.98)
    62.95
    (7.36)
    55.93
    (3.83)
    57.64
    (4.35)
    74.02
    (1.57)
    MM-GNN 75.80
    (0.89)
    71.21
    (1.28)
    54.55
    (3.09)
    61.72
    (2.12)
    70.09
    (2.03)
    60.99
    (2.96)
    41.71
    (2.73)
    44.40
    (2.03)
    42.37
    (1.87)
    67.53
    (5.16)
    ComRisk 77.11
    (0.61)
    74.15
    (2.36)
    55.80
    (4.24)
    63.51
    (2.26)
    79.48
    (2.46)
    68.57
    (0.88)
    71.86
    (8.22)
    62.22
    (5.09)
    64.07
    (6.32)
    78.63
    (3.63)
    CRGNN 79.36
    (1.02)
    75.22
    (2.11)
    63.64
    (6.08)
    68.70
    (3.02)
    84.85
    (0.75)
    71.81
    (1.05)
    72.28
    (2.78)
    66.29
    (1.18)
    68.43
    (1.49)
    84.11
    (0.99)
    注:最佳结果和次优结果分别用加粗和下划线数值表示;括号里数字表示标准差.
    下载: 导出CSV

    表  3   聚类实验结果

    Table  3   Clustering Experimental Results

    指标 GCN GAT RGCN HAN HGT MM-GNN HAT ComRisk CRGNN
    ARI –0.0047 –0.0061 –0.0004 0.0430 0.1785 0.1444 0.2833 0.1907 0.3289
    NMI 0.0048 0.0044 0.0000 0.0417 0.1571 0.1416 0.1951 0.1484 0.2296
    下载: 导出CSV
  • [1]

    Lee S, Choi W. A multi-industry bankruptcy prediction model using back-propagation neural network and multivariate discriminant analysis[J]. Expert Systems with Applications, 2013, 40(8): 2941−2946 doi: 10.1016/j.eswa.2012.12.009

    [2]

    Basole R, Bellamy M. Supply network structure, visibility, and risk diffusion: A computational approach[J]. Decision Sciences, 2014, 45(4): 753−789 doi: 10.1111/deci.12099

    [3]

    Zhang Lang, Hu Haiqing, Zhang Dan. A credit risk assessment model based on SVM for small and medium enterprises in supply chain finance[J]. Financial Innovation, 2015, 1: 1−21 doi: 10.1186/s40854-015-0007-4

    [4]

    Olson D, Delen D, Meng Y. Comparative analysis of data mining methods for bankruptcy prediction[J]. Decision Support Systems, 2012, 52(2): 464−473 doi: 10.1016/j.dss.2011.10.007

    [5]

    Hosaka T. Bankruptcy prediction using imaged financial ratios and convolutional neural networks[J]. Expert Systems with Applications, 2019, 117: 287−299 doi: 10.1016/j.eswa.2018.09.039

    [6]

    Chen Zhensong, Zhou Jia, Zhu Chenye, et al. Prioritizing real estate enterprises based on credit risk assessment: An integrated multi-criteria group decision support framework[J]. Financial Innovation, 2023, 9(1): 120 doi: 10.1186/s40854-023-00517-y

    [7]

    Borochin P, Cicon J, DeLisle R, et al. The effects of conference call tones on market perceptions of value uncertainty[J]. Journal of Financial Markets, 2018, 40: 75−91 doi: 10.1016/j.finmar.2017.12.003

    [8]

    Craja P, Kim A, Lessmann S. Deep learning for detecting financial statement fraud[J]. Decision Support Systems, 2020, 139: 113421 doi: 10.1016/j.dss.2020.113421

    [9]

    Borchert P, Coussement K, De Caigny A, et al. Extending business failure prediction models with textual website content using deep learning[J]. European Journal of Operational Research, 2023, 306(1): 348−357 doi: 10.1016/j.ejor.2022.06.060

    [10]

    Li Qing, Shan Hongyu, Tang Yuehua, et al. Corporate climate risk: Measurements and responses[J]. The Review of Financial Studies, 2024, 37(6): 1778−1830

    [11]

    Elsinger H, Lehar A, Summer M. Risk assessment for banking systems[J]. Management Science, 2006, 52(9): 1301−1314 doi: 10.1287/mnsc.1060.0531

    [12]

    Kou Gang, Xu Yong, Peng Yi, et al. Bankruptcy prediction for SMEs using transactional data and two-stage multiobjective feature selection[J]. Decision Support Systems, 2021, 140: 113429 doi: 10.1016/j.dss.2020.113429

    [13]

    Buraschi A, Tebaldi C. Financial contagion in network economies and asset prices[J]. Management Science, 2024, 70(1): 484−506 doi: 10.1287/mnsc.2023.4687

    [14]

    Xie Xiaofeng, Shi Xinyu, Gu Jing, et al. Examining the contagion effect of credit risk in a supply chain under trade credit and bank loan offering[J]. Omega, 2023, 115: 102751 doi: 10.1016/j.omega.2022.102751

    [15]

    Lin Weinan, Ouyang Ruolan, Zhang Xuan, et al. Network analysis of international financial markets contagion based on volatility indexes[J]. Finance Research Letters, 2023, 56: 104039

    [16]

    Kipf T, Welling M. Semi-supervised classification with graph convolutional networks[C]//Proc of Int Conf on Learning Representations. Toulon, France: OpenReview. net, 2017

    [17]

    Velickovic P, Cucurull G, Casanova A, et al. Graph attention networks[C]//Proc of Int Conf on Learning Representations. Vancouver, Canada: OpenReview. net, 2018

    [18]

    Schlichtkrull M, Kipf T, Bloem P, et al. Modeling relational data with graph convolutional networks[C]//Proc of Extended Semantic Web Conf. Berlin: Springer, 2018: 593−607

    [19]

    Hu Ziniu, Dong Yuxiao, Wang Kuansan, et al. Heterogeneous graph transformer[C]//Proc of the Web Conf. New York: ACM, 2020: 2704−2710

    [20]

    Bi Wendong, Du Lun, Fu Qiang, et al. MM-GNN: Mix-moment graph neural network towards modeling neighborhood feature distribution[C]//Proc of the 16th ACM Int Conf on Web Search and Data Mining. New York: ACM, 2023: 132−140

    [21] 焦鹏飞,刘欢,吕乐,等. 基于对比学习的全局增强动态异质图神经网络[J]. 计算机研究与发展. 2023, 60(8): 1808−1821

    Jiao Pengfei, Liu Huan, Lü Le, et al. Globally enhanced heterogeneous temporal graph neural networks based on contrastive learning [J]. Journal of Computer Research and Development, 2023, 60(8): 1808−1821 (in Chinese)

    [22]

    Chen Mengru, Huang Chao, Xia Lianghao, et al. Heterogeneous graph contrastive learning for recommendation[C]//Proc of the 16th ACM Int Conf on Web Search and Data Mining. New York: ACM, 2023: 544–552

    [23]

    Yang Xiaocheng, Yan Mingyu, Pan Shirui, et al. Simple and efficient heterogeneous graph neural network[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2023, 37(9): 10816−10824

    [24]

    Gao Yang, Zhang Peng, Zhou Chuan, et al. HGNAS++: Efficient architecture search for heterogeneous graph neural networks[J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35(9): 9448−9461

    [25]

    Wang Daixin, Lin Jianbin, Cui Peng, et al. A semi-supervised graph attentive network for financial fraud detection[C]//Proc of IEEE Int Conf on Data Mining. Piscataway, NJ: IEEE, 2019: 598−607

    [26]

    Hu Binbin, Zhang Zhiqiang, Zhou Jun, et al. Loan default analysis with multiplex graph learning [C]// Proc of the 29th ACM Int Conf on Information and Knowledge Management. New York: ACM, 2020: 2525−2532

    [27]

    Cheng Dawei, Niu Zhibin, Zhang Yiyi. Contagious chain risk rating for networked-guarantee loans[C]//Proc of the 26th Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2020: 2715−2723

    [28]

    Yang Shuo, Zhang Zhiqiang, Zhou Jun, et al. Financial risk analysis for SMEs with graph-based supply chain mining[C]//Proc of the 29th Int Conf on Int Joint Conf on Artificial Intelligence. San Francisco, CA: Morgan Kaufmann, 2021: 4661−4667

    [29]

    Zheng Yizhen, Lee V C, Wu Zonghan, et al. Heterogeneous graph attention network for small and medium-sized enterprises bankruptcy prediction[C]//Proc of Pacific-Asia Conf on Knowledge Discovery and Data Mining. Berlin: Springer, 2021: 140−151

    [30]

    Bi Wendong, Xu Bingbing, Sun Xiaoqian, et al. Company-as-tribe: Company financial risk assessment on tribe-style graph with hierarchical graph neural networks[C]//Proc of the 28th Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2022: 2712−2720

    [31]

    Cheng Dawei, Niu Zhibin, Zhang Jianfu, et al. Critical firms prediction for stemming contagion risk in networked-loans through graph-based deep reinforcement learning[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2023, 37(12): 14205−14213

    [32]

    Cai Chengcheng, Pan Limin, Li Xinshuai, et al. A risk identification model for ICT supply chain based on network embedding and text encoding[J]. Expert Systems with Applications, 2023, 228: 120459 doi: 10.1016/j.eswa.2023.120459

    [33]

    Wei Shaopeng, Lv Jia, Guo Yu , et al. Combining intra-risk and contagion risk for enterprise bankruptcy prediction using graph neural networks [J]. Information Sciences, 2024, 659: 120081

    [34]

    Hosmer J D W, Lemeshow S, Sturdivant R X. Applied Logistic Regression[M]. Hoboken, NJ: John Wiley & Sons, 2013

    [35]

    Suykens J A K, Vandewalle J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9: 293−300 doi: 10.1023/A:1018628609742

    [36]

    Breiman L. Classification and Regression Trees [M]. New York: Routledge, 2017

    [37]

    Wang Xiao, Ji Houye, Shi Chuan, et al. Heterogeneous graph attention network[C]//Proc of the World Wide Web Conf. New York: ACM, 2019: 2022−2032

    [38]

    Kingma D P, Ba J. A method for stochastic optimization[C]//Proc of Int Conf on Learning Representations. Toulon, France: OpenReview. net, 2015

    [39]

    Loshchilov I and Hutter F. SGDR: Stochastic gradient descent with warm restarts [C]//Proc of Int Conf on Learning Representations. Toulon, France: OpenReview. net, 2017

    [40]

    Van der M L, Hinton G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9: 2579−2605

图(5)  /  表(3)
计量
  • 文章访问数:  188
  • HTML全文浏览量:  18
  • PDF下载量:  69
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-02-28
  • 修回日期:  2024-05-13
  • 网络出版日期:  2024-07-04
  • 刊出日期:  2024-07-31

目录

/

返回文章
返回