融合非稀疏信任网络的时间底限变动的智能体协商模型

王金迪 童向荣

(烟台大学计算机与控制工程学院 山东烟台 264005)(wangjindi117@163.com)

摘 要 在多Agent协商过程中,信任值是一个较少被关注的问题.实际上,信任值对协商的效用和策略会有直接的影响.之前的研究多以直接信任为基础,然而直接信任关系的缺失会导致信任关系矩阵的稀疏,从而降低信任关系的使用效率.同时,大多数研究忽略了信任对协商策略和协商轮次的影响.针对此问题,可以通过信任传递将间接信任与直接信任一同考虑,形成非稀疏的信任网络.Agent将根据信任值的大小选择可靠的协商对手.面对不同信任值的协商对手,Agent采取的协商策略也有所不同.因此结合信任对协商模型中的轮次底限和回价让步方式都进行了改进.Agent将对信任值高的对手有更大的协商耐心,所以协商中的轮次底限和让步空间都会适当增加,而对信任值低的协商对手则相反.多个实验验证了相比之前未考虑信任的协商模型,新提出的协商模型更适用于现实生活中的协商模式.同时,协商成功率和协商效用等方面也取得了更好的效果.

关键词 协商模型;信任网络;协商轮次;协商策略;多Agent系统

Agent协商越来越广泛地应用在电子商务、资源分配等许多领域[1].在协商问题的研究中,从单议题协商模型[1]到多议题协商模型[2-4],研究的热点是如何选择更好的协商策略使得协商更快地达成一致.同时,还应该保证协商参与者能够获得更大的效用.多议题协商的研究考虑了不同Agent之间的偏好差异,从而可以进行多议题之间的折中优化,使得协商更快地达成一致,获得更优的协商效用.

实际上,Agent协商是一个拟人化的过程.人类在进行协商时会带有自己的主观因素,其中一个主观因素是对对方的信任,而信任会对协商达成一致所用时间和效用有直接的影响.直观上,信任值高的协商者之间的合作底限可适当变长,而信任值低则会适当缩短.同时,调整后的底限又会对协商成功率和协商效用产生影响,进而会造成信任值高的协商者之间成功率更高,效用亦更大,同理,Agent之间会倾向于维持较大的信任值,此时系统就是一个良性循环的整体.

有学者将信任关系用来选择协商对手[5],从而提高协商效用,但是并没有对协商模型和协商策略,尤其是回价函数进行相应的改进,缺少进一步的研究.

之前的研究中,有学者将直接信任或间接信任应用于协商中[6-9].但是存在直接信任关系的Agent较少,可用的信任值缺失较多,导致了稀疏的信任网络[10],这样就容易出现信任关系难以计算的情况,对于已有的数据也无法很好地利用.在密集的信任网络下,信任关系是比较好构建的.但是在稀疏的信任网络中,只通过直接信任的方式难以算出Agent之间的信任值.

针对以上问题,本文考虑了信任对协商过程的影响,将信任值作为一个参数加入到协商中.首先通过信任传递将间接信任与直接信任一起考虑,从而形成了非稀疏的信任网络;然后通过信任值来选择协商对手,并将信任值融入到协商的时间底限和回价函数中,通过对协商时间底限(即协商轮次底限)的适当改动,使得协商轮次的底限在信任值的影响下弹性变动;再次,本文重新定义了协商出价模型中的回价让步函数,信任关系好的协商者可以让步幅度大一些,信任关系不好的协商者让步幅度小一些,使得协商中的回价策略更加符合现实情况;最后,本文通过大量的实验验证了所提方法的优越性,验证了信任值对协商效用和协商达成一致所用时间的影响.

本文的主要贡献有3个方面:

1)之前的研究中,一般假设协商时间底限是固定的,实际上该底限与双方的容忍度有很大的关系,信任关系好,可以适当延长底限,信任关系不好,则必然缩短底限.本文提出的融合信任的时间底限变动的协商模型,信任值高的协商对手会有更长的协商轮次底限,更符合实际的协商情形,因而提高了协商成功率和协商效率.

2)将信任因素加入到回价函数,重新定义了回价让步函数.根据Agent对协商对手的信任值不同,其在协商中做出的回价以及协商中的让步也是不相同的,根据信任值的大小将Agent分为3种类型,不同的类型会有不同风格的回价方式.通过这种方式来优化回价策略,从而保障协商可以得到更好的结果.

3)一般认为信任网络应该是具有大规模节点分布的,这样可以保证数据的可信性.在之前的基于信任的协商研究中,一般只考虑了直接信任关系,较少考虑信任传递形成的间接信任,这就造成了信任网络的稀疏性,可用数据较少.本文考虑了信任传递形成的信任网络,从而将间接信任纳入信任关系,使得信任关系矩阵更稠密,形成了非稀疏的信任矩阵网络,提高了数据的可利用性,由此可以有效地提高融合信任的Agent协商成功率和效率.

1 相关工作

协商一直是多Agent系统中的一个热点研究问题,其目的是在面对共同的利益需求时,通过妥协某些问题达成相互有利的一致.而在如何达成这种一致上存在着很多矛盾,协商研究重点问题之一即为平衡这些矛盾使得协商参与者都得到尽可能大的利益.

Jennings等人[1]提出Agent协商研究问题时,将协商根据议题个数分为单议题协商和多议题协商.协商主要有3个内容:协商协议、协商均衡目标和协商策略,其中协商策略是之后研究的热点.后续研究中Fatima等人[2-3]提出了多种方法将协商的效用、策略等问题进行了相应完善.

Fatima等人[2]的协商模型将设为Agent i在第t轮对Agent j的出价.表示轮数t时Agent j对出价的反应决策.Ta为两者协商的初始时间底限,即最大轮数.Agent j的反应决策为

(1)

当协商轮数(negotiation round)t超过最大协商轮数Ta时,说明双方没有在要求时间内达成一致,协商失败.如果在第t轮Agent i对Agent j的出价使得Agent j得到的效用比在接下来第t+1轮Agent j对Agent i出价得到的效用高,Agent j接受出价,协商成功.若协商没有成功且没有达到时间底限,则Agent j提出新的出价,重新进行效用比较,直到协商成功或到达时间底限失败.这种协商方式是博弈论中的经典交替报价的方式.

在协商模型中,效用是一个重要的判断依据.效用函数是根据初始出价IPaj和保留出价RPaj以及双方每一轮协商的出价来制定的.IPaj为Agent j的初始出价,RPaj为Agent j的保留出价.效用是Agent的主观收益数量,与每次协商的所得收益有关.Ren等人[11]提出的式(2)和式(3)为协商中的效用函数.由于买卖双方在交易时的心态与目的不同,所以效用函数的设定方式也有所不同.表示在价格下Agent j作为卖方时的效用,计算方式为

(2)

表示在价格下,Agent i作为买方时的效用计算方式为

(3)

在Fatima等人[2]的文章中提出的出价函数为

(4)

通过式(4)可以看出,回价策略是根据初始出价和保留出价决定以及协商让步函数决定的,买卖双方具有不同的回价策略.协商让步函数为

(5)

其中,ka为[0,1]的1个常数,ka的值控制Agent的初始出价.θ取值不同,代表协商者的类型不相同,在之前的研究中是将协商者分为了Boulware,Linear,Conceder三类,不同的协商者在面对对手协商时所做出的让步也有所不同.

Ren等人[12]也提出了不同的出价函数,在Ren等人的研究中,考虑到了协商环境对于出价的影响.利用协商买卖双方的数量计算出市场情况,市场情况不同,协商买卖双方的优势也不相同.Agent会根据自己的优势情况在协商中做出不同的回价策略,cot为Agent在下一轮t′时提出的回价.具体回价函数为

(6)

其中,oini为Agent的初始出价;cot为Agent在当前轮数收到的报价;为Agent在下一轮时刻t′能够得到最大效用的报价,其计算方式与市场情况相关联;τ是协商的轮次底限.

童向荣等人[13]在对Agent信任模型的研究中,考虑到时间分段与协商历史共同对信任模型的影响,通过这些影响因素可以优化Agent选择对手或合作伙伴的方式,使得Agent的交互活动更加合理化.Ren[11-12]等人在单议题协商上进行了更深入的研究,与以往大部分研究线性效用函数不同,Ren等人充分考虑了非线性效用函数和离散型效用函数,提出了3D-协商模型.并且在协商时充分考虑协商的市场环境,根据市场供求关系来制定Agent的出价方式.

Braynov等人[14] 提出如果协商双方的信任值达到对方的要求,那么协商效用、社会福利、交易量等都会相比之前的协商方式有所提升.王黎明等人[5]提出了一个信任-声誉模型,通过协商历史等信息通过信任度和声誉度去选择协商的对手.在协商历史信息不足的情况下,利用机器学习中经典的K臂赌博机问题结合信任值进行协商对象的选择,以达到更好的协商结果.利用2种方式选择协商对象,提高了方法的实用性和有效性.Khayyam等人[15]提出了启用社交网络的协商服务,通过计算服务节点之间的信任度和相似度作为协商对象选择的重要因素,在选择对手后进行的协商策略和结果都有了一定程度的优化.

Sanzi等人[6]的研究通过将信任因素加入协商过程,改变了Agent的访问权限,信任值高或者有固定身份标签的Agent可以访问协商过程中的历史信息,使得协商信任时间减少,在解决一些时间紧急的协商事件中取得了较好的成果.Pérez等人[16]在对协商问题的研究中提出,应当将协商中的决策环境建立成为一个动态环境,在以往的研究中影响决策动态性的参数一般是对议题的偏好,而Pérez等人提出应当将多个不同参数作为动态协商的调整因素,对后续的协商研究有很好的启发性.

之前的学者分别对Agent信任、协商或信任与协商结合等问题进行了深入的研究,但是鲜少有文章指出信任值对于参与者的决策以及协商的结果具体会产生什么样的影响.本文提出的融合信任的协商模型详细阐述了信任值对于协商模型中协商轮数和协商决策的影响,改进了Jennings等人[1-3]关于Agent协商的工作.

2 基本定义

本节中分别介绍了直接信任和间接信任值的计算方式,以及融合信任的协商模型的基本内容.我们先给出5个基本定义.

定义1.协商参与者集合.将A={a1,a2,…,an}作为参与协商的Agent集合,Agent之间可能存在直接信任关系,也可能存在间接信任关系.

定义2.协商历史信息.定义集合为协商历史信息集.其中包括2个Agent的协商总次数、协商成功次数、协商时间等.表示Agent i和Agent j历史协商的总次数,表示Agent i和Agent j历史协商中成功的次数.mn为当前协商的时间节点,为Agent i和Agent j第1次协商的时间节点,为Agent i和Agent j最后一次协商的时间节点.

定义3.时间影响函数.设Dij(1≤Dij≤2)为时间影响函数,此函数是根据参数计算的,具体计算方式:

(7)

其中,时间节点之差以月为单位进行运算.由于信任具有时效性,则当前时间节点与最后一次协商时间节点的差值越大,意味着信任值会越小.

定义4.信任.信任是2个人之间的一种关系,我们也可以将这种关系应用在多Agent系统之中.为了方便计算Agent之间的信任关系(relationship),本文使用概率表示信任值的大小.信任值的取值在[0,1]范围内,0表示完全不信任的关系,1表示完全信任的关系,值越大则信任程度越大.在本文设定中,直接信任受协商历史的影响,只有曾经发生过协商的Agent之间才具有直接信任值.直接信任值的计算和时间影响函数有关,根据协商场景的不同,时间影响函数也会有不同的表达方式,需要根据实际场景对Dij进行改动.

1)直接信任.Agent之间的直接信任值与协商历史中的次数信息和交易时间相关,协商历史中的成功次数占比越高,协商时间差越短,则信任值越大.定义符号Xij为Agent i与Agent j之间的信任值(trust value),直接信任Xij的计算:

(8)

2)间接信任.对没有发生过协商交易的Agent之间的信任值可以用间接信任来表示.间接信任的取值方式是根据Agent之间的信任值的传递性决定的.如图1所示,在信任网络中,Agent i与Agent j没有发生过协商交易,但Agent i与Agent m发生过协商交易,Agent m与Agent n发生过协商交易,Agent n与Agent j发生过协商交易,即Agent i与Agent m有间接信任关系.图1表示的是Agent之间的间接信任关系图.信任值将根据中间Agent数量的增加而不断减小.若Agent之间没有任何关系,则Xij=0.5.

Fig.1 Indirect trust relationship diagram
图1 间接信任关系图

间接信任值的计算:

(9)

其中,Agent m和Agent n为Agent i与Agent j信任路径中有直接信任关系的Agent,其信任值为Xmn.

R为Agent i与Agent j之间信任路径(path)的跳数,根据斯坦利·米尔格兰姆提出的6度分割理论,设定R∈[0,6] ,即超过6歩的信任路径则没有计算价值,视为无联系的Agent.wmn为每条路径的权重值(weight),根据艾宾浩斯遗忘曲线[17]和距离衰减函数设定了每条信任路径的权重值,即Agent j之间距离Agent i 越远,连接的路径权重越低,两者之间的信任值也越低.权重函数为

(10)

权重函数曲线如图2所示:

Fig.2 Weight function curve in indirect trust model
图2 间接信任模型中的权重函数曲线

例1.如图1所示,Agent i和Agent j分别为协商参与者的买方与卖方.Agent i和Agent j无直接信任的关系,但两者通过2个相关联的Agent连接,分别是Agent m和Agent n.相关参数如表1所示:

Table 1 Parameter List of Trust Calculation
表1 信任计算相关参数表

RelationshipTrustRelationshipTrustValuePathWeightAgent i and Agent mXim0.4wim1Agent m and Agent nXmn1wmn0.61Agent n and Agent jXnj0.8wnj0.51

计算Xij

定义5.协商者信息.每个参与协商Agent的参数集合为C={IP,RP,Xij,Ta}.包含的信息有Agent的初始出价、保留出价以及对对手的信任值和时间底限.

3 融合信任的协商模型

3.1 协商对象选择与时间底限调整模型

本节详细介绍了融合信任后的协商模型中的相关内容.

在协商过程的最开始,可以先对协商对象进行初始选择,通过选择合作对象可以提高效益.例如消费者想去美食广场就餐,若饭店评论很差便会降低消费者想要光顾的欲望,若评论很好则会提升消费者的光顾欲望.

同样地,在本文融合信任的协商模型中也考虑到了协商对象的选择问题,与顾客喜欢选择高评分店家一样,Agent会优先选择拥有较高信任值的对手进行协商.后续实验验证了,Agent优先与信任值高的对手合作,协商的成功率更高,同时,达成协商所用的轮次更少.合作对手E的选择策略:

(11)

完成协商对象的选择后,则正式开始进行协商.在本文中,根据双方信任关系的不同,将最大协商轮数进行了适当的调整,具体调整方式:

Tn=┌┐.

(12)

在时间底限调整函数中,运用了神经网络中的Sigmoid改进函数来进行调整,根据信任值Xij的不同,函数会呈现一个分段状态.

Xij∈(0,0.5)时,由于Agent双方的信任值较低,所以设定协商者对对手的忍耐度会降低,因此协商的时间底限也会有所缩减.为了防止协商轮数太少,将函数中的最小轮数的阈值设为初始轮数Ta的1/2.

Xij=0.5时,双方信任值为1个折中值,协商的时间底限不会有所改变,依然是Ta.

Xij∈(0.5,1]时,协商双方的信任值较高,我们设定协商者对协商对手的容忍度较高,因此协商的时间底限可以有所增加.

根据信任值的大小程度进行了时间底限调整函数的计算,根据信任值的不同,最终协商的时间底限也会有所改变.最终时间底限的变动与信任值的关系如图3所示:

Fig.3 Round limit change chart
图3 时间底限变动图

改进后的协商决策模型:

(13)

与以往相关研究不同,本文将时间底限设置成一个变量,参考在生活中交往的2人的情况,若是对交易的对手有较高的信任程度,在直觉上会认为交易成功的概率较大,往往也会有比较高的容忍度,可以接受的协商轮次也会有所增加,反之亦然.因此本文利用时间底限调整函数将时间底限做了调整,使得协商环境中的最大协商轮次将根据信任值进行弹性变动,使其更加符合真实情况.针对此问题,我们在后续实验中选择了1组数据,验证了改动后的时间底限模型的优越性.具体示例情况如表2所示:

Table 2 Example Table of Negotiation Round Adjustment
表2 出价模型示例表

GenreTaXijXjiTnRoundResultNDF555FailHigh50.70.597Success

通过表2可以发现,在初始设定的协商轮次较低时,传统的NDF(negotiation decision function)方法[2]由于协商底限的固定性,导致协商在达到最大轮次时没有达成一致而失败.而通过本文对协商底限模型的弹性改动,较高的信任值使得协商底限延长,让双方有机会进一步协商,进而使得协商成功.

3.2 协商出价模型

通过式(13)可以看出,协商能否成功与协商对手的出价有关.如果对手的出价带来的效用能够满足Agent自身的要求,那么协商很容易成功.协商中的出价方式是一种协商策略,在以往研究中都是一个非常重要的影响因素,如何出价才能更快、更好地达成协商一直是研究者们考虑的问题.

在Fatima等人[2]所提出的式(5)的基础之上,本文进行了一些改进,将信任因素加入,重新定义了出价让步函数.根据Agent对协商对手的信任值不同,那么他在协商中做出的出价以及协商中的让步也是不相同的.本文提出一个新的出价让步函数,在函数中引入信任值,通过信任值的大小将Agent分为3种类型,不同的类型会有不同风格的出价方式,通过这种方式来优化出价策略以使得协商可以得到更好的结果.综合各种参考因素,出价函数是根据初始出价、保留出价、协商时间底限以及协商双方之间的信任值决定的.融合信任后的出价让步函数:

(14)

出价让步函数根据双方信任值的不同,会有不同的回价策略.分析3个方面:

1)0<Xij<0.5 时,双方信任值比较低,使得协商时协商者之间的初始协商出价的让步比较小,在协商后期会将让步逐步扩大一些.在多次让步后没有取得结果时,时间底限由于信任值较低而减小,协商很容易到达时间底限而结束.

2)Xij=0.5 时,双方信任值为1个折中值,双方的让步比较平缓,没有大规模的增加,时间底限也是1个不轻易变的属性.

3)Xij>0.5 时,双方信任值比较高,使得协商时协商者之间的初始协商出价让步比较大,在协商后期会将让步逐步减小一些.在多次让步没有取得结果时,时间底限由于信任值的较高而增加,协商可以持续的时间长久一些.

在后续实验中选择了1组数据以验证本文提出方法的优越性.具体实验数值如表3所示:

Table 3 Example Table of Bidding Model
表3 出价模型示例表

GenreTaXijXjiTnRoundResultHigh120.90.9243SuccessMiddle120.50.5125SuccessLow120.30.476Success

为了方便观察信任值对出价让步以及协商轮次的影响,本例选取的实验数据为在其他参数相同且协商全部成功的情况下,信任值不同会导致协商者的让步方式不同.如果对于协商对手的信任值较高,则协商者让步较大,所以协商达成一致的轮数也会降低;当信任值中等时,让步会稍小一些,协商轮数有小的增加;而信任值较低时,协商者的让步较小,所以协商达成一致的轮数会增加.通过本例也可以发现,如果在协商时优先选择信任值高的对手,会使得协商在取得更高成功率的同时减少协商轮次以达到降低时间成本的作用.

3.3 协商流程

算法1.融合信任的协商算法.

输入:买方Agent信息Ci、卖方Agent信息Cj

输出:isSuccess协商是否成功.

① 计算 TaiTaj

Tn←min(Tai,Taj);

③ Agent fRandom(Ci,Cj);/*随机产生第1轮出价方*/

④ while (t<Tn)

⑤ 计算

⑥ 计算计算下一轮Agent i的出价*/

⑦ 计算计算下一轮Agent i的出价后的效用*/

isSuccess=True;

⑩ break;

else

isSuccess=False;

重复进行步骤⑤~

end if

end while

Return isSuccess.

算法1的计算复杂度为多项式级,即:

O(n)=6n+5.

4 实验与结果

本节对多个协商模型的协商结果进行了验证和对比:基础实验的实验设置、对比验证不同信任情况下的协商结果、介绍新提出的融合信任的协商模型与NDF协商模型[2]和OMIA(opponent modeling with information adaptation)协商模型[18]的协商结果对比.

4.1 基础实验设置

为了更好地去验证实验结果,实验设置了最大Agent数为30个,其中买方Agent有15个,卖方Agent有15个.每次协商都是随机抽取1个买方Agent与1个卖方Agent进行交易.每选取50对为1组,共进行了8组实验.协商的议题为衣服的价格.对于买方Agent来说,它的初始出价在1 500~4 500元的范围内随机选择,保守出价在5 000~15 000元的范围内随机选择.对于卖方Agent来说,它的初始出价在5 000~15 000元的范围内随机选择,它的保守出价在1 500~4 500元的范围内随机选择.所有Agent的初始协商轮数在5~20轮的范围内随机选择.本文中分析了6种评价指标[12],分别是买方Agent平均效用BAU(buyers’ average utility)、卖方Agent平均效用SAU(sellers’ average utility)、所有成功Agent平均效用AAU(all agents’ average utility)、协商成功率SR(success rate)、总效用AU(all utility)、协商达到成功时的轮数Round.其中AU是综合了AAUSR的总效用,在计算总效用时考虑了总体协商的成功率,将成功率作为一种奖励算进了总体效用之中.评价指标中的相关参数有:所有协商成功买方Agent的效用Uasb、所有协商成功买方Agent的个数numberasb、所有协商成功卖方Agent的效用Uass、所有协商成功卖方Agent的个数numberass、所有协商成功Agent的效用Uasa、所有协商成功Agent的个数numberasa、协商成功次数NTsuccess、协商总次数NTall、协商成功时的轮数ts.评价指标的具体计算:






Round=ts.

4.2 不同信任情况下的实验对比

1)对手选择

本实验验证了根据信任值的高低优先对协商对手进行选择的协商情况.实验设定了1个买方Agent和30个卖方Agent,买方Agent对30个卖方Agent的信任值各不相同,由低到高分别标号为1~30,卖方Agent对买方Agent的信任值都设为中间值0.5.表5显示了实验的相关数据.在实验中,优先选择出信任值最高的10个Agent进行序号排序,之后使买方Agent与30个卖方Agent全部进行协商,将协商后的买方获得的效用按大小进行排序并记录序号.利用推荐系统中的评价指标,我们计算了选择对手这一过程的准确率P、召回率R以及综合指标F值.

通过本组实验数据可以发现,实验的准确率P能够达到0.9,综合指标F值达到0.45.通过表4中的位次排序也可以发现排序与最优结果有一定误差,通过数据比较可以发现位次的误差率是比较小的,这个结果可以验证我们的选择是有效的,即在优先选择信任值高的协商对手后,交易双方可以获得的效用也越高.

Table 4 Negotiation Parameter Sorting Table After Selecting an Opponent
表4 选择对手后的协商参数排序表

RankingSerial Number ofAgent(Trust)Serial Number ofAgent(Utility)130292293032828427275262662525724248232292221102120

2)成功次数

在验证双方信任值不同情况下对Agent协商结果的影响实验中,延续使用了4.1节中的实验设置,不同的是本实验将所有可能出现的信任值组合进行了协商实验,即对买方Agent与卖方Agent分别取信任值{0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1}时的协商类型,共有121组组合,每种类型各实验50次,取其成功次数来验证买卖双方不同信任值下协商的成功率.实验结果如图4所示:

Fig.4 Number of negotiation success times under different trust values
图4 不同信任值情况下的协商成功次数图

通过图4可以明显地发现成功次数的增长趋势.在信任值交互较低的区域内,成功次数也非常少,出现这种情况的原因与新定义的协商底限变动模型和出价让步模型有关.因为信任值较低,协商底限也会变短,其主要目的是为了避免耗时多、效用低的低质量协商.随着信任值的增加,成功次数开始逐步增加.我们发现当信任值高达0.8以上时,成功次数几乎达到了最大值.在新定义的时间底限调整模型中,设置的信任值高的双方更具耐心,可以适当增加协商的轮数底限,而在协商过程中,信任值高的双方让步也更大,这2种方式都增加了协商的成功次数.

本实验验证了不同信任值对协商成功率会有不同的影响:当协商双方的信任值较低时协商的成功率会比较低;相反,协商双方的信任值较高时协商的成功率会比较高.

3)协商轮数

本实验验证了双方信任值不同情况下对协商轮数的影响.实验中的数据根据信任值的不同分为4种情况:Random,High,Middle,Low.其中Random表示本组所有Agent对对手的信任值的大小是从[0,1]范围内随机设定的;High表示本组所有Agent对对手的信任值大小是从[0.6,1]范围内随机设定的;Middle表示本组所有Agent对对手的信任值大小设定为0.5;Low表示本组所有Agent对对手的信任值大小是从[0,0.4]范围内随机设定的.对4种不同情况的Agent组分别进行了50组的实验,实验结果如表5所示:

Table 5 Average Number of Negotiated Rounds
表5 不同实验类型的平均协商轮数表

GenreAverage Number of RoundsHigh5.52Middle6.54Low7.33

通过表5可以发现不同信任值类型的Agent组的协商轮数也并不相同,实验中只选取了所有成功协商过程的平均协商轮数.对比3组数据可以发现,High组即信任值比较高的Agent组的平均协商轮次较少,Middle组即信任值为中间值0.5的Agent组平均协商轮数要比High组稍高而比Low组稍低.Low组即信任值比较低的Agent组协商成功时的协商轮次最高.出现这种实验结果的原因是重新定义的出价让步函数与信任值有关.信任值越高,出价时的让步越高,导致协商达成一致的时间也会缩短;信任值越低,出价时的让步越少,协商达成一致的时间就会增加.这模拟了交易者在现实生活中的讨价还价心理:对于常常交易的老顾客,卖家更喜欢直接给一个优惠的价格;而对于新光顾的顾客,卖家会多次少量的给出优惠.

本实验验证了Agent的信任值会影响最终的协商轮数,买卖双方的信任值越高,协商达成一致的时间越短,买卖双方的信任值越低,协商达成一致的时间越长.

4.3 与NDF模型的对比实验

1)成功率

为了展示协商模型的实验结果,本文分别选取经典的NDF协商模型[2]、OMIA模型[1]与融合信任的协商模型进行了实验对比.其中,融合信任的协商模型根据信任值的不同又分为了4种情况,分别是:Random,High,Middle,Low.其分组依据与4.2节的实验中相同.通过图5可以观察到6种协商模型的成功率.

Fig.5 Negotiation success rate result chart
图5 协商成功率结果图

通过对比可以看出,High组融合信任的协商模型成功率比NDF协商模型高出8.0%,比OMIA模型高出13.25%.因为Agent双方的信任值增加,使得协商轮数底限也相应增加,使得协商的成功率明显提升.

Low组融合信任的协商模型成功率比NDF协商模型低71.75%,比OMIA模型低66.50%.这种结果在直觉上是很好理解的,当交易者对对方信任程度低时,协商交互的耐心也会明显变低.因此,信任值变低时,协商成功率也会大幅度降低.

Random组融合信任的协商模型成功率比NDF协商模型低35.50%,比OMIA模型低30.25%.在Random组中,因为信任值的大小在[0,1]区间内随机选择,也使得协商的成功率在50.0%左右,因为低信任值的Agent在协商时会拉低协商成功率.

Middle组融合信任的协商模型成功率低于NDF协商模型0.25%,高于OMIA模型5.0%.成功率相差较小.Middle组的信任值取值为0.5,是一种折中情况,与不考虑信任值的NDF协商模型的协商结果比较相似.

通过6组实验协商成功率的对比,可以发现,在考虑信任因素后,Agent的协商方式更加贴合人类在对待不同对手时的交互方式,使得Agent的决策更加细化和拟人化.

2)效用

协商者的效用也是协商问题中的一个重要参数,在本文中融合信任的协商模型中,买方与卖方的效用函数是根据初始出价和保留出价以及双方的最终协商价格决定的,数值比实际上是实际成交价格与预期价格的一个预期比,比值越高说明协商者对交易价格越满意.表6表示5种实验计算出的4种效用的具体数值,我们可以看出:实验中效用差距不太明显.通过细微的差距可以发现在未考虑成功率前,Low组的AAU的反而更高.通过分析实验数据,发现在Low组取得成功的协商中,随机数据初始出价IP和保留出价RP的差距比较小,所以成交价格也可以使Agent达到更高的效用值.但是当初始出价IP和保守出价RP的差距比较大时,Low组的信任值影响了时间底限,导致协商容易失败,所以在计算总效用AU时,Low组的总效用较低.而NDF方法和High组由于协商成功率较高,总效用也随之提高.

Table 6 Relevant Utility of Different Types of Experiments
表6 不同实验类型的相关效用表

GenreBAUSAUAAUAUNDF0.5090.5281.0991.545OMIA0.3140.7310.9351.366Random0.5360.5471.0821.333High0.4640.5100.9751.493Low0.6530.5951.3101.419Middle0.4980.5281.0261.484

5 总 结

本文提出了融合非稀疏信任网络的时间底限变动的Agent协商模型,主要解决的问题是电子商务中交易双方Agent的协商问题.从2个方面对模型进行了改进:1)通过融合信任值的方法对传统协商模型中的协商底限函数进行了改动.与以往固定的协商底限不同,改动后的协商底限将根据信任值进行弹性变动.2)将协商中的回价函数与信任值进行了融合,使得Agent的协商方式更加贴合现实中的协商交互情况.本文通过多组实验也验证了所提方案的合理性.

本文通过对协商底限的改动,有效地避免了多耗能、低效率的协商,从而可以节省时间,促进更多低耗能、高效率的协商.本文提出的融合信任值的回价函数,可以使Agent的回价行为更加拟人化,从而提高了协商的成功率和协商效用.

由于协商问题的多样性和复杂性,仍有许多问题值得深入探讨.例如如何将深度学习与协商结合得到更好的协商结果、如何将信任应用于多议题的协商等.

参考文献

[1]Jennings N,Fatima S,Lomuscio A,et al.Automated negotiation:Prospects,methods and challenges[J].Group Decision and Negotiation,2001,10(2):199-215

[2]Fatima S,Wooldridge M,Jennings N.An agenda-based framework for multi-issue negotiation[J].Artificial Intelligence,2004,152(1):1-45

[3]Fatima S,Wooldridge M,Jennings N.An analysis of feasible solutions for multi-issue negotiation involving non-linear utility functions[C/OL] //Proc of the 8th Int Conf on Autonomous Agents &Multi Agent Systems.2009 [2019-03-01].http:/ifaamas.org/Proceedings/aamas09/pdf/01_Full %20Papers/22_123_FP_0120.pdf

[4]Hou Wei,Dong Hongbin,Yin Guisheng.An adaptive and optimized negotiation model based on Bayesian learning[J].Journal of Computer Research and Development,2014,51(4):721-730 (in Chinese)(侯薇,董红斌,印桂生.基于Bayesian学习的适应性优化协商模型[J].计算机研究与发展,2014,51(4):721-730)

[5]Wang Liming,Huang Houkuan,Chai Yumei.Choosing multi-issue negotiating object based on trust and K-armed bandit problem[J].Journal of Software,2006,17(12):2537-2546 (in Chinese)(王黎明,黄厚宽,柴玉梅.基于信任和K臂赌博机问题选择多问题协商对象[J].软件学报,2006,17(12):2537-2546)

[6]Sanzi E,Demurjian S,Billings J.Integrating trust profiles,trust negotiation,and attribute based access control[C] //Proc of the 5th Int Conf on Mobile Cloud Computing,Services and Engineering.Los Alamitos:IEEE Computer Society,2017

[7]Schaffer J,Donovan J,Marusich L,et al.A study of dynamic information display and decision-making in abstract trust games[J].International Journal of Human-Computer Studies,2018,113:1-14

[8]Gui Jinsong,Wu Min.A game control scheme based on prediction of trust and service for wireless access service[J].Journal of Computer Research and Development,2012,49(2):231-242 (in Chinese)(桂劲松,吴敏.基于信任和服务预测的无线接入服务博弈控制方案[J].计算机研究与发展,2012,49(2):231-242)

[9]Li Haiyan.Dynamic trust game model between venture capitalists and entrepreneurs based on reinforcement learning theory[J/OL].Cluster Computing,2018[2019-08-14].https://doi.org/10.1007/s10586-017-1666-x

[10]Azadjalal M,Moradi P,Abdollahpouri A,et al.A trust-aware recommendation method based on Pareto dominance and confidence concepts[J].Knowledge-Based Systems,2016,116:130-143

[11]Ren Fenghui,Zhang Minjie.Bilateral single-issue negotiation model considering nonlinear utility and time constraint[J].Decision Support Systems,2014,60(1):29-38

[12]Ren Fenghui,Zhang Minjie.A single issue negotiation model for agents bargaining in dynamic electronic markets[J].Decision Support Systems,2014,60(1):55-67

[13]Tong Xiangrong,Huang Houkuan,Zhang Wei.Prediction and abnormal behavior detection of agent dynamic interaction trust[J].Journal of Computer Research and Development,2009,46(8):1364-1370 (in Chinese)(童向荣,黄厚宽,张伟.Agent动态交互信任预测与行为异常检测模型[J].计算机研究与发展,2009,46(8):1364-1370)

[14]Braynov S,Sandholm T.Contracting with uncertain level of trust[J].Computer Intelligence,2002,18(4):501-514

[15]Khayyam H,Zaki M,Erfan N,et al.SNRNeg:A social network enabled negotiation service[J].Information Sciences,2016,349-350:248-262

[16]Pérez I,Cabrerizo F,Alonso S,et al.On dynamic consensus processes in group decision making problems[J].Preprint Submitted to Information Sciences,2018,459:20-35

[17]Wang Yingjie,Cai Zhipeng,Tong Xiangrong,et al.Truthful incentive mechanism with location privacy-preserving for mobile crowdsourcing systems[J].Computer Networks,2018,135:32-43

[18]Wang Yuchen,Ren fenghui,Zhang Minjie.Opponent modeling with information adaptation (OMIA)in automated negotiations[C] //Proc of the 16th Int Conf on Autonomous Agents and Multi-agent Systems.Berlin:Springer,2017:21-35

Agent Negotiation Model Based on Round Limit Change of Non-Sparse Trust Networks

Wang Jindi and Tong Xiangrong

(School of Computer and Control Engineering,Yantai University,Yantai,Shandong 264005)

Abstract In the process of multiple Agent negotiation,trust value attracted less attention in related works.In fact,trust value will directly affect the utility and strategy of negotiation.Most of previous works researched direct trust.However,it will lead to the sparse of trust relationship matrix if lacks the direct trust relationship,which may reduce the using efficiency of trust relationships.In addition,most related works ignored the influence of trust on negotiation strategy and negotiation rounds.According to the problems,this paper considers the indirect trust and direct trust through trust transfer to form a non-sparse trust network.Therefore,Agent could select reliable negotiation rivals based on the trust values of bidders.Facing the negotiation rivals with different trust values,Agent will adopt different strategies.The paper improves the round limit function and bidding function in negotiation model.Agent will pay more patience to the rivals with high trust values.Therefore,the round limit and bidding space will be extended and bidding will be properly increased,while the rivals with low trust values will be conducted reverse operations.Comparison experiments prove that new model is more reliable than those models that do not consider trust attribute.The negotiation model has better performance on success rate and utility of negotiation.

Key words negotiation model;trust network;negotiation round;negotiation strategy;multi-agent system

中图法分类号 TP18

收稿日期2019-03-19;修回日期:2019-08-28

基金项目国家自然科学基金项目(61572418)

This work was supported by the National Natural Science Foundation of China(61572418).

通信作者童向荣(xr_tong@163.com)

Wang Jindi,born in 1994.Master candidate.Her main research interests include negotiation models of multi-agent systems.

Tong Xiangrong,born in 1975.PhD,professor,and master supervisor.Member of CCF.His main research interests include multi-agent systems,intelligent information processing and social networks.