即时车辆共乘问题的多策略解空间图搜索算法

郭羽含 张 宇 沈学利 于俊宇

(辽宁工程技术大学软件学院 辽宁葫芦岛 125100)

摘 要 车辆共乘旨在通过降低车辆空载率以提升运输效率、缓解交通拥堵、降低环境污染并节省出行资源.首先针对即时车辆共乘问题构建了数学模型,以共享路程比率和绕行距离约束为手段对车辆合乘中车主资源的利用效率进行评估.然后提出离散排列问题的解空间图理论并对其原理进行了阐述和分析,继而基于此理论构建一种多策略解空间图搜索算法.该算法以并行化结构生成价值矩阵显著提升了传统方法的效率,并以多种控制策略操纵结合离散排列问题特点设计的不同搜索算子,指导搜索过程在解空间图中向更高价值方向移动以高效获取高质量的匹配方案.实验结果表明,该算法的求解质量可达最优解的95%以上,且求解效率明显优于对比实验中的其他算法.

关键词 车辆共乘;解空间图;多策略搜索算法;离散排列问题;组合优化算法

车辆共乘(ride-sharing),也称车辆合乘,指对一定时空范围内的车主和乘客进行匹配组合和路径规划,以降低车辆空载率,从而提升运输效率、缓解交通拥堵、降低环境污染并节省出行资源.车辆共乘根据车主属性可分为顺风车模式(hitch-mode)和出租车模式(taxi-mode).在顺风车模式中,车主和乘客均指定自身所在地和目的地,需最大化车主乘客对的匹配价值之和.而在出租车模式中,车主以运输乘客赚取利润为目的,即只有当前所在地而无自身目的地,该种模式下仅需最小化车主所在地与乘客所在地间的低效能路程.即时车辆共乘则指车主和乘客在发布出行信息后即时出发,需尽可能最小化其等待时间,因此需在相对较短时间内生成车主乘客匹配方案,对计算速度有一定敏感性.本文针对顺风车模式的即时车辆共乘进行研究.相对于经典路径规划问题[1-2],国内外对于车辆共乘问题的研究较少,文献[3-4]对本问题进行了综述,将其研究方向主要归纳为问题模型[5-12]和求解算法[13-19]2方面.在问题模型方面,Baldacci等人[5]提出一种最小化总行驶距离的精确算法模型.Ece等人[6]设计了一种最小化总行驶时间的模型.齐观德等人[7]对乘客候车时间进行了模拟和预测.Schilde等人[8]针对时间性和随机性因素对行驶速度的影响提出2套元启发式解决方案.谭家美等人[9]研究了信任水平对动态共乘匹配效果在仿真模型上的影响.Stiglic等人[10]以一种基于会面点的模型来提高匹配方案的效率和灵活性.Ta等人[11]建立了一种最大化共享路程比率的模型.肖强等人[12]基于泊松分布对出租车合乘概率及等待时间进行了模拟.在求解算法方面,Agatz等人[13]提出一种Rolling Horizon策略.Kleiner等人[14]设计了一种基于拍卖机制的激励兼容DRS解决方案.邵增珍等人[15]以一种2阶段聚类启发式优化算法解决该问题.Pelzer等人[16]使用了一种基于分区的动态共乘匹配算法.杨志家等人[17]针对车辆共乘问题设计一种2阶段的分布式估计算法.Alonso-Mora等人[18]构建了一种实时大容量乘坐共享数学模型的约束优化算法.郭会等人[19]提出基于个性化需求的匹配算法.其他一些研究工作则针对更为具体的案例进行了分析以弥补通用模型中的空白,如Calvo等人[20]和Ma等人[21]分别对城市公共交通问题构建了出租车共享系统,Winter等人[22]结合移动地理传感器网络对车辆共乘进行了研究.Amey[23]通过数据驱动的方法在组织级数据规模上估计了车辆共乘的可行性.付瑶等人[24]发现通过城市出行需求量和交通需求聚集度可以确定交通模式是否可以达到稳定状态.

文献中提出的模型在评估匹配质量方面主要使用3个指标之一:1)最小化总行驶距离[5,10,13-16,20,23];2)最小化总行驶时间[6-9,21];3)最大化共享路径比率[11,19].然而,指标1和指标2忽略了车主和乘客间行程的相似性,无法高效利用交通资源,且降低了车主的收入和乘客的满意度.指标3无法控制绕行距离,导致车主额外驾驶路径可能过长,严重降低了实际应用中的可行性.

车辆共乘匹配问题需对所有乘客与车主通过价值函数生成乘客车主对的价值二分图,然后使用二分图最大权匹配算法求出最优匹配方案及匹配后子图权边总和[7].在大型城市的高峰时段,算法需要在短时间内匹配数以万计的车主与乘客,因此对算法的求解效率要求极高.二分图最大权匹配算法时间复杂度较高,因而当算例较大时,该方法的运行时间将成超线性趋势增长.而文献中提出的近似算法也未能较好地解决求解大算例时的效率问题.

本文针对固定时空范围内的即时车辆共乘匹配问题展开研究,提出一种多策略解空间图搜索算法(multi-strategy solution space graph search algorithm).首先在模型层面提出一种约束绕行距离的价值评估方法,然后以一种并行化的价值矩阵生成方案来改进原本低效的生成方法,最后设计多种策略指导算法在解空间图中进行高效搜索.实验结果表明,该算法的求解质量可达最优解的95%以上,且求解效率明显优于实验中对比的其他算法.

本研究的主要贡献有3个方面:

1) 提出了一种基于共享路程比率(shared route percentage, SRP)和绕行距离的价值评估方法.该方法侧重资源利用率的同时兼顾了司机的收益期望.

2) 提出了离散排列问题的解空间图理论,并基于此理论构建了一种多策略搜索算法来解决即时共乘问题,并阐述了其正确性.

3) 基于大量算例进行了实验测试,证明了本算法可以高效求解大型算例并提供高质量的匹配方案.

1 问题建模

1.1 问题形式化

在固定时空范围内,以无向加权全连通图G=P,E表示一个道路网络.其中,顶点集P={pi|i∈[1,nnode]∩}为道路节点集合,其中元素数量为nnode;无向边集合E={(pi,pj)|i∈[1,nnode]∩,j∈[1,nnode]∩,ij},其中元素数量为nedge.边(pi,pj)的距离为eij.以集合D={di|i∈[1,m]∩}表示车主集,其中di代表车主i,每个车主具有所在节点ldi和目的节点adi.以集合R={rj|j∈[1,n]∩}表示乘客集,其中rj代表乘客j,每个乘客具有所在节点lrj和目的节点arj.车主和乘客具有身份唯一性,因此DR=∅.匹配车主与乘客时,以共享路径比率来评价车主与乘客的匹配价值,定义车主i与乘客j匹配的价值为vij.问题的目标即为求得一种匹配方案,使得所有车主乘客匹配对的价值总和最大.因此,可将本问题的目标函数定义为

(1)

,

(2)

,

(3)

xij∈{0,1},∀i,j,

(4)

其中,xij表示车主i与乘客j是否匹配,vij表示车主i与乘客j的匹配价值.式(2)~(4)为匹配互斥性约束,式(2)表示每个乘客至多与一个车主匹配,式(3)表示每个车主至多与一个乘客匹配,式(4)限定x取值范围,0表示不匹配,1表示匹配.研究涉及的变量如表1所示:

Table 1 Variables
表1 变量表

SymbolsMeaningGWeighted undirected road graphPThe node set of G with the size of nnodeEThe edge set of G with the size of nedgeDDriver set with the size of mRRider set with the size of nXSolution matrix (m×n)VValue matrix (m×n)SSolution vector with the size of nsolutionTSet of elements in S

Continued (Table 1)

SymbolsMeaningDTPossible value set of elements in SpiNode i of G,i∈[1,nnode]∩NNeijThe edge from i to j,i,j∈[1,nnode]∩NN,i≠jdiDriver i,i∈[1,m]∩NNriRider i,i∈[1,n]∩NNlhiThe location of hi,hi∈D∪R,lhi∈PahiThe destination of hi,hi∈D∪R,ahi∈Pdis(pi,pj)The shortest path from pi to pj,pi,pj∈pxijBoolean value indicates whether driver i and rider j is matchedvijFitness of pair between driver i and rider jCDLValue of detour lengthsiValue of dimension i in SμDriver s profit rate

1.2 价值评估

本文使用共享路程比率[7](SRP)作为对车主这一主要资源的利用效率的评价标准,并以绕行距离(detour length, DL)对其进行约束,以达到共享效率和方案可行性的平衡.车主与乘客的SRP为乘客的期望路程与车主的总路程的比值.SRP反映出共享资源的利用效率.乘客的期望路程是共享的、高价值的,而车主独自行驶的路程是非共享的、低价值的,因此,该值越大则表示车主的低价值路程相对越短,共享资源利用效率越高,反之则表示车主把大量路程浪费在共享路程之外,对共享资源的利用效率低下.

设有车主dj和乘客存在于道路图G中,则该车主与乘客的共享路程比率为

(5)

s.t.dis(pi,pj)≥0,i,j∈[1,nnode]∩,ij,

(6)

lriari,

(7)

ldiadi,

(8)

CDL=dis(ldj,lri)+dis(lri,ari)+dis(ari,adj)-
dis(ldj,adj),CDLμ×dis(lri,ari)

(9)

其中,dis表示2点之间的路径长度,l表示车主或乘客的所在节点,a表示车主或乘客的目标节点,p表示节点,μ表示车主的利润率.式(6)约束了图的边必定是非负边.式(7)(8)为起点终点互斥性约束,一个车主或乘客的起点和终点应是不同的.式(9)表示车辆的绕行距离及约束,其中CDL表示车主的绕行距离,μ为车主载乘客行驶每公里的收益与车主行驶每公里的花费之比率,式(9)能够约束车主的共享过程处于收益状态之内.

2 多策略单步移动解空间图搜索算法

2.1 算法理论基础

本问题的解可表达为

S=(s1,s2,…,snsolution),

(10)

s.t.siDT,

(11)

sisj,ij,

(12)

其中,S表示问题的一个解向量,即一种全局匹配方案,si表示S在向量维度i的值;DT表示S中元素的可取值集合.本文定义该类解的问题为离散排列向量解问题(discrete permutation vector solution problem, DPVSP),简称离散排列问题.当集合DT中的元素数量等于解向量S的维度nsolution时,称该问题为简单离散排列向量解问题(simple discrete permutation vector solution problem, SDPVSP),否则称为拓展的离散排解向量解问题(extend discrete permutation vector solution problem, EDPVSP),以下首先讨论SDPVSP的求解方法,然后再论述在EDPVSP下对该求解方法的拓展.

定义1.对SDPVSP的解Sα.通过交换解向量中第i和第j位置的值转化为一个新解Sβ,定义这种操作为单步交换操作(single step exchange oper-ation, SSEO),过程为

(13)

1) 对于DT元素数量大于向量维度nsolution的情况,将SSEO拓展为

(14)

其中DT-T表示DTS各维度值的集合T的差集.拓展SSEO过程为,任意2个位置交换,或是某位置与DT中未被该解使用的离散值进行交换.经过拓展之后,仍满足上述性质.

2) 对于DT元素数量小于向量维度nsolution的情况,则对式(11)添加拓展元素null,则:

siDT∪{null}, i∈[1, nsolution]∩,

(15)

将约束式(12)变更为

si=sj,ijsi=sj=null,

(16)

对SSEO操作追加约束,则:

SSEOi,j s.t.si≠null∨sj≠null.

(17)

式(16)表示null元素的可重用性,null元素可被重复使用;式(17)表明null元素的自身不可交换性,null元素不可与其他位置的null交换.

解空间图的解节点数量增多时,解空间图的结构会变得异常复杂,因而搜索高质量解也变得尤为困难.本文基于SDPVSP和单步交换操作解空间图(SSEOSSG),提出一种多策略解空间图搜索算法,简称解空间图搜索算法.该算法能够对解空间图进行快速且高效的搜索.

2.2 并行初始化价值矩阵与最短路径算法

设车主数量为m,乘客数量为n,以价值函数生成m×n的价值矩阵V,其中元素vij表示车主i 和乘客j的价值.定义匹配方案矩阵X(m×n),矩阵中元素xij表示车主i与乘客j是否匹配且满足匹配互斥约束性.以下步骤均基于上述假设.

计算共享路程比率SRP过程中最大的计算开销为最短路径的计算.求解无负边的最短路径算法主要有Dijkstra算法和Floyd算法.对于本问题,Dijkstra算法的时间复杂度相较于Floyd算法更低.然而对于大型算例,Dijkstra算法计算开销仍然过大,因此本文对Dijkstra算法进行拆解并与价值矩阵的循环进行合并,可以在很大程度上降低时间开销.

原价值矩阵生成算法流程如算法1所示:

算法1.原价值矩阵生成算法.

输入:车主集合D,m=len(D)、乘客集合R,n=len(R);

输出:价值矩阵V.

① 初始化价值矩阵V[m][n];

② for d in D

③ for r in R

Dis1=shortest_path(loc(r),dst(r));

/*r所在节点至目的节点的最短路径*/

Dis2=shortest_path(loc(d),loc(r));

/* d所在节点至r所在节点的最短路径*/

Dis3=shortest_path(dst(r),dst(d));

/*r目的节点至d目的节点的最短路径*/

V[d][r]=SRP(Dis1,Dis2,Dis3);

/*根据Dis1,Dis2,Dis3求出dr的SRP*/

⑧ end for

⑨ end for

Dijkstra算法可拆解为2个元操作:

1) 路径元操作.求所在节点至所有节点的最短路径.

2) 检索元操作.检索所在节点至目标节点的最短路径.

算法1的主要时间消耗在路径元操作.在对乘客进行遍历时,由于车主的所在节点和目标节点不变,因此可将路径元操作转移车主循环层级,即行②~⑨,这样可以减少n-1次路径元操作的计算次数,大幅降低时间开销.由于乘客循环和车主循环的顺序不影响结果,当车主数量少于乘客时,将车主作为外层循环也可降低路径元操作的计算次数.算法过程如算法2.

算法2.改进的价值矩阵生成算法.

输入:司机集合 D,m=len(D)、乘客集合 R,n=len(R);

输出:价值矩阵V.

① 初始化价值矩阵V[m][n];

② if m<n

③ for d in D

Dis2Map=shortest_path(loc(d),all); /*d所在节点至所有节点的最短路径*/

Dis3Map=shortest_path(all,dst(d));

/*所有节点至d目标节点的最短路径*/

⑥ for r in R

Dis1=shortest_path(loc(r),dst(r));

/*r所在节点至目的节点的最短路径*/

Dis2=dis2Map[loc(d)][loc(r)];

/*从Dis2表中检索d所在节点至r所在节点的最短路径*/

Dis3=dis3Map[dst(r)][dst(d)];

V[d][r]=SRP(Dis1,Dis2,Dis3);

/*根据Dis1,Dis2,Dis3求出dr的SRP*/

end for

end for

else

for r in R

Dis2Map=shortest_path(all,dst(r));

/*所有节点至r所在节点的最短路径*/

Dis3Map=shortest_path(loc(r),all);

/*r目标节点至所有节点的最短路径*/

for d in D

Dis1=dis3Map[loc(r)][dst(r)];

Dis2=dis2Map[loc(d)][loc(r)];

Dis3=dis3Map[dst(r)][dst(d)];

V[d][r]=SRP(Dis1,Dis2,Dis3);

end for

end for

end if

时间复杂度分析:在时间上,设道路图中的节点数量为nnode,边数量为nedge,乘客数量为n,车主数量为m,则对于原算法,单次Dijkstra算法使用邻接表和堆结构的时间复杂度为O(nedge×lb nnode),需要执行m×n次,故总体时间复杂度为O(m×n×nedge×lb nnode),通过缩减循环,实际总体执行Dijkstra算法的次数为min(m,n),故时间复杂度为O(nedge×lb nnode×min(m,n)).同时需要强调的是,以上处理并未增加空间开销.

2.3 大值优先算法生成初始解

算法在解空间图从1个初始节点开始迭代,初始节点的选择对算法的迭代速度有较大影响.为了保证算法对大算例的求解效率,初始解的生成方式必须是快速而高效的.本文设计一种大值优先算法来构造初始解,其过程如下:

对给定价值矩阵V,初始化解决方案数组X的所有元素置为0.对价值矩阵V的行进行遍历,对当前行所有数值进行排序,从最大值开始进行遍历,对于当前大值,判断匹配方案X中的该索引列的总和是否等于0,若是则将X中的该行该列置为1并跳过本行循环,否则对该行的下一个大值进行判断.重复上述过程,直到满足矩阵X的所有行之和都为1或者所有列之和都为1.算法过程如算法3所示.

算法3.大值优先算法.

输入:价值矩阵V

输出:匹配方案X.

① 初始化X=zeros[m×n] /*Xm×n的矩阵,且初值为0*/

② for row in V

③ if sum(X.rows)>0 or sum(X.cols)>0 break;

④ end if /*如果X的所有行都大于0或者所有列都大于0则结束*/

new_row=order_desc(row); /*对该行进行降序排序*/

⑥ for location in new_row /*对排序列进行遍历*/

⑦ if sum(X.col(location))=0

X[location]=1;

⑨ continue; /*如果当前值在价值矩阵中的位置,对应在匹配方案中的位置列之和为0,则将匹配方案中该位置置为1,并跳过此行*/

⑩ end if

end for

end for

2.4 迭代算子

迭代算子是迭代优化算法的重要组成部分,对于离散排列向量解问题中,任何迭代算子的实质都是做1步或者多步SSEO操作.

本文使用解集覆盖性和收敛性对算子的特性进行分析.解集覆盖性越广,则算法对解集合的覆盖程度的期望越高,从而具有对解空间图更广的搜索范围,可在一定程度上避免解陷入局部最优.收敛性则指解向更优解移动的速度,具有该性质保证了算法在宏观上是收敛的,该性质越强,算法的收敛速度越快,但越容易陷入局部最优.解集覆盖性和收敛性是宏观互斥的.

1) 随机交换算子(random exchange operator, REO)

随机交换算子选取矩阵解X中的任意2行中匹配的位置的列进行交换.该交换算子的实质是使当前解在解空间图中向随机方向做1次SSEO,该算子的解集覆盖性非常强,但收敛性较弱.

数学公式描述为

选择

xij,xkl:

(18)

s.t.xij=1,xkl=1,

(19)

i,k∈[1,m],j,l∈[1,n],i,j,k,l,

(20)

ik,jl.

(21)

执行:

xij=0,xkl=0,xil=1,xkj=1.

(22)

时间复杂度分析:整个过程无循环,时间复杂度为O(1).

2) 上山交换算子(up-hill exchange operator, UEO)

该算子随机寻找矩阵解X某行,找到该行的匹配位置xij与某个价值比匹配位置大的xil,找到xil对应列l的匹配位置xkl,对xijxkl所在行或列进行试探交换(行列的交换结果相同),如果2个位置交换后总体价值与交换前总体价值之差值非负,则提交交换操作.该算子的实质是向限制方向做1次SSEO.该算子的收敛性较强,解集覆盖性较弱.

数学公式描述为

选择

xij,xkl:

(23)

s.t.xij=1,xkl=1,

(24)

i,k∈[1,m],j,l∈[1,n] i,j,k,l,

(25)

ik,jl,

(26)

vilvij.

(27)

如果

vil+vkjvij+vkl

(28)

执行:

xij=0,xkl=0,xil=1,xkj=1.

(29)

时间复杂度分析:过程中需对矩阵解X的行进行检索,时间复杂度为X行数O(n).

3) 概率上山交换算子(probability up-hill exchange operator, PUEO)

概率上山算子在随机找到第1行的匹配位置后,依据该行所有位置与当前匹配位置的差值,择取所有差值为正值的位置并依据差值做概率分布来随机选取下个位置,2个位置如果交换后价值增加,则进行交换.该算子的实质是向限制方向做1次SSEO.该算子的收敛性比上山交换算子更强,解集覆盖性则较弱.

数学公式描述为

选择

xij,xkl:

(30)

s.t.xij=1,xkl=1,

(31)

i,k∈[1,m],j,l∈[1,n],i,j,k,l,

(32)

ik,jl,

(33)

vilvij

(34)



t,tj.

(35)

如果

vil+vkjvij+vkl

(36)

执行:

xij=0,xkl=0,xil=1,xkj=1.

(37)

其中pil表示位置il被选中的概率,当匹配位置价值vij等于最大值时,pij为所有等于最大值位置的数量的倒数,在其他情况下则为该位置与匹配位置价值插值与所有大于匹配位置的价值与匹配位置差值之和的比率.

时间复杂度分析:过程中需对矩阵解X的行进行检索,时间复杂度为X行数O(n).

Fig.1 Random operator strategy flowchart
图1 随机算子策略流程图

2.5 搜索策略

在迭代算子中已经提出,算子的解集覆盖性和收敛性是互斥的,因此本文定义一种结构来指导如何使用算子,通过调度多种算子来综合算法宏观的解集覆盖性和收敛性,使其2方面都达到较好的效果.本文把这种结构称为搜索策略.

搜索策略的终止条件在对比试验中可设为达到最优解一定比率停止,而在实际情况中可设置为固定迭代次数.

1) 随机算子策略(random operator strategy, ROS)

该策略随机使用3种算子,随机算子保证了算法的解集覆盖性,而另外2种算子则保证了算法的收敛性.流程图如图1所示.

2) 终点加速策略(end-charging strategy, ECS)

该策略随机使用随机算子和上山算子,在最后的数次迭代中,使用收敛性最强的的概率上山算子.随机使用随机算子和上山算子使得算法宏观的解集覆盖性较强,在终点前的加速又保证其收敛性.流程图如图2所示:

Fig.2 End-charging strategy flowchart
图2 终点加速策略流程图

3) 自适应策略(adaptive strategy, AS)

自适应策略基于当前解的迭代轨迹来指导解的搜索.策略监督解的收敛趋势,定义轨迹为每次迭代的解值的记录.由于迭代次数通常数量庞大而单次效果微小,因此只需每隔轨迹步长代数记录1次.自适应策略根据最近记忆长度次迭代值来分析当前收敛趋势,求记忆的轨迹中前几次值的均值与最近1次的值的差值,如果该差值高于高阈值,说明解正处于

收敛高势期,这时的解需要快速向最优解收敛,因此此时采用收敛性最强的概率上山算子,如果处于高低阈值之间,则说明解处于匀势上升期,使用上山算子即可,如果差值低于低阈值,说明解已经陷入局部最优,此时应该使用发散代数次随机算子发散解,使其随机移动到解空间的其他位置,跳出局部最优峰值后继续收敛.流程图如图3所示:

Fig.3 Adaptive strategy flowchart
图3 自适应策略流程图

3 实验与分析

本文使用模拟数据进行实验,采用的评估指标是算法运行时间和解的质量.模拟数据中,道路图数据通过OpenStreetMap Overpass API[注]http://www.overpass-api.de/获取,数据范围涵盖成都市2环内路网,并对道路节点进行了筛选和处理,节点与边的数量均为10 000,路网源数据的可视化如图4所示;车主乘客数据基于滴滴盖亚数据开放计划(didi chuxing gaia initiative[注]https://gaia.didichuxing.com ),自成都市二环内局部区域轨迹数据中随机选取20/100/200/400/1000/2000/4000/6000名参与者,并随机指定50%为车主,50%为乘客,其中1 000和2 000数据规模的模拟分布图如图5所示.仿真语言为Python3.5,实验运行环境为2.50 GHz Intel Core i5-7300HQ CPU,8 GB RAM.最优解由KM算法[25]得出.

Fig.4 Visualization of path network original data
图4 路网源数据可视化

Fig.5 Distribution of drivers and riders
图5 车主乘客分布

3.1 价值矩阵生成时间对比

并行的价值矩阵生成算法与普通的价值矩阵生成算法的时间比较见图6和表2.表2记录了乘客车主对数量、普通价值矩阵生成算法和并行的价值矩阵生成算法的运行时间.

Fig.6 Graph of running time between concurrence
value matrix generation and normal generation
图6 并行价值矩阵生成与普通生成的运行时间图

Table 2 Table of Running Time Between Parallel Value Matrix Generation and Normal Generation
表2 并行价值矩阵生成与普通生成的运行时间表

ParticipantNumber∕pairRunning Time∕sParallel GenerationNormal Generation100.946.67504.67144.121009.42563.1220018.492267.7850047.5613712.901000108.36

通过实验结果可以看出,该算法大幅度节省了时间.在处理500对乘客车主的算例时,改进算法的运行时间仅为普通算法的0.35%.

3.2 随机算子策略

图7和表3展示了对随机算子策略的评估结果.表3记录了乘客车主对数量、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值、最优算法时间.

Fig.7 Random operator strategy contrast graph
图7 随机算子策略对照图

分析所得数据,可以发现随机算子策略获取近似解速度较快,且随着数据规模的增大,该策略与最优算法的时间消耗差异明显.实验结果表明:随机算子策略可以显著提升给出较优方案的时间.在求解规模为500对的算例时,随机算子策略的运行时间为最优算法的61.85%,当算例增大到3 000对时,随机算子策略所需时间仅为最优算法的25.04%.

Table 3 Random Operator Strategy Data Size Table
表3 随机算子策略数据规模表

PN∕pairSolution Time∕sSolution Quality Rate∕%12345AVG12345AVGOART∕s1000.080.080.080.080.080.0897.1399.20100.0095.8899.2098.320.0950016.1615.8118.0619.0913.3316.4995.0995.1395.2595.0495.0695.1126.66100073.1991.5973.4290.1574.2980.5395.0195.0495.0895.0095.1295.05162.732000196.51240.68262.39223.43258.72236.3595.0195.0095.0695.0295.1295.04518.093000638.38901.68814.30893.491005.28850.6395.0095.0195.0195.0195.0195.013396.54

Notes: PN represents participant number; OART represents optimal algorithm running time.

3.3 终点加速策略

3.3.1 终点加速策略中终点距离的影响

本节测试终点距离对算法的影响,对终点距离的实验都是在1 000对乘客与车主的数据规模之下的,实验结果如表4所示.表4记录了终点距离代数、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值.

实验结果表明这个参数并不会显著地影响该策略的速度,运行时间存在的少许差异可能是运行过程的随机性或者是误差造成的.

Table 4 Charge Length for End-Charging Strategy Table
表4 终点加速策略终点长度表

CLSolution Time∕sSolution Quality Rate∕%12345AVG12345AVG1075.01122.6986.1786.8899.8993.9395.0095.0495.0395.0695.0395.0320136.74107.6888.03118.36109.03111.9795.0995.0295.0195.0295.0295.033097.03106.67142.79103.2590.62108.0795.0495.0395.0095.0395.0495.044086.9385.9787.25102.9383.7889.3595.0395.0395.0395.0495.0495.045095.3486.9078.0785.38106.2490.3995.0195.0295.1195.0095.0395.04

Notes: CL represents charging length.

3.3.2 终点加速策略在不同实验规模下的效果

经过终点长度的实验后,选择长度50作为接下来在不同数据规模下该策略的运行时间的实验,结果如表5所示,对照图如图8所示.表5记录了乘客车主对数量、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值、最优算法时间.

Table 5 End-charging Strategy in Different Data Size Table
表5 终点加速策略数据规模表

PN∕pairSolution Time∕sSolution Quality Rate∕%12345AVG12345AVGOART∕s1000.130.130.140.140.140.1495.8899.0099.2099.2095.8897.830.0950018.8123.3717.4722.8617.0719.7695.1095.1495.0195.2995.1195.1226.66100088.10142.1073.7096.8682.5896.6795.0495.1195.0095.0895.1095.07162.732000209.83292.55216.76279.92377.91275.4395.0595.1495.1995.1495.0295.11518.093000840.07782.95809.23771.72742.66789.3395.0195.0095.0095.0295.0195.013396.54

Notes: PN represents participant number; OART represents optimal algorithm running time.

Fig.8 End-Charging strategy contrast graph
图8 终点加速策略对照图

终点加速策略也比最优算法运行时间短,但在小算例速度比随机算子策略慢,分析这个过程,终点加速策略中收敛性最强的概率上山算子的运行次数相对较少,这说明概率上山算子对小算例的收敛速度提升的效果较为显著,大算例时概率上山算子对速度的影响变差.当算例超过3 000对时,终点加速策略的运行时间优于随机算子策略.

3.4 自适应策略

3.4.1 自适应策略中发散代数的影响

本节研究发散代数对该策略的影响,实验参数为:步长为100,记忆长度为2,高阈值为10-4,低阈值为10-10,乘客车主对数量为1 000对.实验结果如表6所示.表6记录了发散代数、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值.

从实验结果中可以发现,这个参数对运行速度有影响.以50代的平均运行时间为标准,其他代数运行时间约为50代平均运行时间的80%~140%(不考虑缺省值).从实验结果还可以看出,当发散代数超过90代时开始出现发散现象,此时算法过程不再收敛.

3.4.2 自适应策略中记忆长度的影响

本节研究记忆长度对自适应策略的影响,本节其他参数为步长100,发散代数为20,高阈值为10-4,低阈值为10-10,发散代数为20,乘客车主对数量为1 000对.实验结果如表7所示.

表7记录了记忆长度、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值.

Table 6 Divergence Length for Adaptive Strategy Table
表6 自适应策略发散代数表

DLSolution Time∕sSolution Quality Rate∕%12345AVG12345AVG1070.4762.5089.4472.23176.9695.1295.0795.1395.0195.0395.0495.0620164.05163.2198.6694.7274.22118.9795.0595.0095.0195.0895.0295.0330139.4487.93137.13149.37128.87128.5595.0295.0295.0195.1195.0295.0340135.55114.91137.5391.46115.67119.0395.0495.0795.0095.0095.0095.035084.12116.07107.00121.56153.23116.4095.0495.0595.0195.0095.0095.0260156.13166.58104.36123.2187.40127.5495.0195.0195.0095.0395.0495.0270185.54124.89124.61109.71135.76136.1095.0295.0395.0195.0895.0295.0380163.58179.45169.60192.70110.23163.1195.0195.0495.0095.0495.0395.0290112.20136.7395.0495.0610074.4795.07

Notes: DL represents divergence length.

Table 7 Memory Length for Adaptive Strategy Table
表7 自适应策略记忆长度表

MLSolution Time∕sSolution Quality Rate∕%12345AVG12345AVG253.4885.0664.3554.4061.6963.7995.0595.0095.0295.0295.0495.03364.3269.8169.5382.1350.8467.3395.0395.0295.0195.0395.0495.03572.9572.5967.7682.4570.9073.3395.0295.0295.0395.0195.0195.02779.55100.2287.6257.84104.1485.8795.0295.0795.0995.0995.0095.05991.52101.2683.0479.10102.2791.4495.0495.1295.0095.0295.0095.04

Notes: ML represents memory length.

实验结果表明记忆长度变大会增涨算法的运行时间,记忆长度为9时的平均运行时间是长度为2时的143.35%.

3.4.3 自适应策略中阈值的影响

本节研究高低阈值对结果的影响,由于高低阈值之间存在约束,所以将其放在一起实验.本节其他参数为步长100,记忆长度为2,发散代数20,乘客车主对数量为1 000对.实验结果如表8所示.

表8记录了记忆长度、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值.

Table 8 Threshold for Adaptive Strategy Table
表8 自适应策略阈值表

HTLTSolution Time∕sSolution Quality Rate∕%12345AVG12345AVG1874.9863.4163.3080.7380.7972.6495.0295.0195.0795.0795.0295.042865.2296.0081.5880.2382.2081.0595.0195.0195.0295.0195.0295.013868.3286.3952.2363.6972.2568.5795.0095.0595.0995.0495.0495.044858.0668.8754.2777.4873.4166.4295.0295.0295.0195.1095.0795.052348.8476.3671.1873.8173.6568.7795.0095.0695.1095.0195.0095.032687.9467.0947.5261.4556.1864.0495.0195.0795.0395.0095.0095.022865.2296.0081.5880.2382.2081.0595.0195.0195.0295.0195.0295.0121068.2555.6187.9579.8668.8072.1095.0195.0195.0595.0195.0195.02

Notes: HT represents negative base-10 logarithm of high threshold; LT represents negative base-10 logarithm of low threshold.

实验结果表明:高低阈值能在一定程度内降低过程的消耗时间.以高阈值为10-2,低阈值为10-8为标况下,高阈值变化会使结果在81.95%~100%范围浮动,而低阈值则处于79.01%~100%.它们的效果都不是特别显著.

3.4.4 自适应策略在不同实验规模下的效果

本节考察自适应策略在不同算例下的运行结果.实验参数为:步长为100,高阈值为10-4,低阈值为10-10,发散代数为20,记忆长度为2.实验结果见图9和表9.表9记录了乘客车主对数量、5组达到最优解95%的较优解的时间、占最优解价值的比率及其均值、最优算法时间.

分析实验结果,自适应策略在1 000对以下,虽然劣于随机算子策略,但此时运行时间较短,差距不超过3 s.自适应策略在1 000对算例以上运行时间开始显著优于随机算子策略和终点加速策略.在1 000对算例时,自适应策略的平均运行时间为随机算子策略的77.67%,标准算法的38.44%.在3 000对算例时,自适应策略的平均运行时间为随机算子策略的72.76%,终点加速策略的78.41%,标准算法的18.22%.

Fig.9 Adaptive strategy contrast graph
图9 自适应策略对照图

Table 9 Adaptive Strategy in Different Data Size Table
表9 自适应策略数据规模表

PN∕pairSolution Time∕sSolution Quality Rate∕%12345AVG12345AVGOART∕s1000.080.080.080.150.140.1197.3195.8898.6195.8897.3197.000.0950021.5621.5116.9119.5614.8018.8795.0395.0195.1795.0195.1395.0726.66100058.1172.4271.6771.7838.7562.5595.0795.0495.0095.0195.0195.02162.732000119.14143.10112.94112.98191.43135.7295.0695.0095.1095.0095.0195.03518.093000685.11609.79596.64609.45593.70618.9495.0295.0095.0295.0295.0295.013396.54

Notes: PN represents participant number; OART represents optimal algorithm running time.

Fig.10 Convergence trend of multiple strategy in iterations times
图10 各策略的迭代次数收敛趋势

3.5 模式收敛趋势及共享匹配结果

3种模式的收敛趋势如图10和图11所示.表10展示了在不同的乘客司机对的数量之下不使用共享匹配的总行驶路程、使用共享匹配后的总行驶路程、共享匹配后总节约路程.图12则展示了部分乘客与车主的匹配结果.

Fig.11 Convergence trend of multiple strategy in running time
图11 各策略的运行时间收敛趋势

Table 10 Route Contrast Table
表10 路程对比表

ParticipantNumber∕pairTotal DistanceUnshared WayShared WaySavedDistance5069806435545100140341163923952002771921749597050066332487291760310001322689188240386

Fig.12 Matching result of partial drivers and riders
图12 部分车主乘客匹配效果图

3.6 本文算法和一种基于连接的近似值方法的比较

本节对本文算法和一种较新的近似值方法[11]进行实验以比较求解效率和质量.

本节选取的策略为自适应策略,参数为:步长为100,发散代数为50,高阈值为10-3,低阈值为10-6,记忆长度为2,迭代次数为10万次.近似值方法的参数为:分区为10区,拟合率为1.05(保证该算法的求解质量达到最优解的95.24%以上).

需要指出的是,本文的问题模型与文献[11]中的模型不同,因此删去了其模型中车主的要求SRP值.此外,该近似方法可能发生退化,在发生退化时,其可获得真实乘客车主二分图的价值矩阵,并使用最优解算法来寻找最优解.

实验结果如表11所示.表11记录了乘客车主数量、自适应策略2个阶段及总体的运行时间、自适应策略的解的SRP值、最优解SRP值、自适应策略的解占最优解的比率、近似值方法2个阶段及总体的运行时间(不包括退化后使用最优算法的时间)、近似值方法是否退化.

Table 11 Comparison Between Adaptive Strategy and Approximate Algorithm for Join-based RS
表11 自适应策略与基于连接的车辆共乘近似值方法比较表

PN∕pairAdaptive StrategyApproximate AlgorithmRunning Time∕sSolutionRunning Time∕s12SUMCurrentOptimal Rate∕%12SUMBD101.0313.9614.994.934.93100.0043.480.7244.20No504.9818.4423.4227.9528.2299.0443.29215.22258.50Yes1009.8523.5233.3759.2959.7999.1743.63856.50900.13Yes20019.6633.3553.01125.93126.6599.4344.433792.543836.96Yes50049.2464.93114.17333.67339.5798.2649.6543523.3043572.95Yes1000103.01123.54226.55703.10717.6097.9848.58Yes

Notes: PN represents participant number; Rate represents the ratio of current solution to optimal solution in percentage; BD represents whether approximate algorithm has degenerated.

从实验结果中可以看出,本文方法的速度相较于近似值算法有较大提升,在10对算例下,自适应策略运行时间为近似值算法的33.91%,算例达到500对时,自适应策略运行时间仅为近似值算法的0.26%.

4 总结与展望

本文提出了一种基于单步交换操作解空间图的解搜索算法.首先,提出了一种兼顾资源利用率和方案可行性的价值评估方法;然后对价值矩阵的生成方式作出了改进;接着提出了3种搜索算子,并根据3种搜索算子设计了3种搜索策略;最后通过实验测试了各策略对其相应参数的敏感性,并与标准算法及一种较新的近似值方法作了比较.实验研究表明,本文算法的各个策略都能给出接近最优解SRP 95%以上的高质量解,并且在大部分的算例中运行时间比标准算法和近似值方法有显著的降低.

在下一阶段的研究中,我们将考虑动态时间窗模式下的车辆共乘问题.动态时间窗模式下,车主和乘客的请求将被动态地加载,此时需考虑窗体的划分方法与全局价值的最大化.车辆共乘问题各种模型始终存在一定差异性,下一阶段研究将致力于针对动态车辆共乘问题提出一种可泛化的有效的模型和解决方法.

参考文献

[1]Dong Xueshi, Dong Wenyong, Cai Yongle.Hybrid algorithm for colored bottleneck traveling salesman problem[J].Journal of Computer Research and Development, 2018, 55(11): 2372-2385 (in Chinese)(董学士, 董文永, 蔡永乐.混合算法求解着色瓶颈旅行商问题[J].计算机研究与发展, 2018, 55(11): 2372-2385)

[2]Dong Xueshi, Dong Wenyong, Wang Yufeng.Hybrid algorithms for multi-objective balanced traveling salesman problem[J].Journal of Computer Research and Development, 2017, 54(8): 1751-1762 (in Chinese)(董学士, 董文永, 王豫峰.混合算法求解多目标平衡旅行商问题[J].计算机研究与发展, 2017, 54(8): 1751-1762)

[3]Agatza N, Erera A, Savelsbergh M, et al.Optimization for dynamic ride-sharing: A review[J].European Journal of Operational Research, 2012, 223(2): 295-303

[4]Cleophas C, Cottrill C, Ehmke J F, et al.Collaborative urban transportation: Recent advances in theory and practice[J].European Journal of Operational Research, 2018, 273(3): 801-816

[5]Baldacci R, Mingozzi M A.An exact method for the car pooling problem based on Lagrangean column generation[J].Operations Research, 2004, 52(3): 422-439

[6]Ece K, Eric H.Collaboration and shared plans in the open world: Studies of ridesharing[C] //Proc of the 21st Int Jont Conf on Artifical Intelligence(IJCAI).Menlo Park, CA: AAAI, 2009: 187-194

[7]Qi Guande, Pan Yao, Li Shijian, et al.Predicting passengers’ waiting time by mining taxi traces[J].Journal of Software, 2013, 24(Suppl 2): 14-23 (in Chinese)(齐观德, 潘遥, 李石坚, 等.基于出租车轨迹数据挖掘的乘客候车时间预测[J].软件学报, 2013, 24(增刊2): 14-23)

[8]Schilde M, Doerner K F, Hartl R F.Integrating stochastic time-dependent travel speed in solution methods for the dynamic dial-a-ride problem[J].European Journal of Operational Research, 2014, 238(1): 18-30

[9]Tan Jiamei, Wang Zheng.Simulation of influence of trust on the performance of dynamic ridesharing[J].Journal of Systems & Management, 2014, 23(6): 826-831 (in Chinese)(谭家美, 王正.信任水平对动态共乘匹配效果的仿真[J].系统管理学报, 2014, 23(6): 826-831)

[10]Stiglic M,Agatz N, Savelsbergh M, et al.The benefits of meeting points in ride-sharing systems[J].Transportation Research Part B: Methodological, 2015, 82: 36-53

[11]Ta Na, Li Guoliang, Zhao Tianyu, et al.An efficient ride-sharing framework for maximizing shared route[J].IEEE Transactions on Knowledge and Data Engineering, 2018, 30(2): 219-233

[12]Xiao Qiang, He Ruichun, Yu Jianning, et al.Method of carpooling probability and wait time based on Poisson distribution[J], China Journal of Highway and Transport, 2018, 31(5): 151-159 (in Chinese)(肖强, 何瑞春, 俞建宁, 等.基于泊松分布的出租车合乘概率及等待时间建模[J].中国公路学报, 2018, 31(5): 151-159)

[13]Agatz N, Erera A L, Savelsbergh M W P, et al.Dynamic ride-sharing: A simulation study in metro atlanta[J].Transportation Research Part B: Methodological, 2011, 45(9): 1450-1464

[14]Kleiner A, Nebel B, Ziparo V A.A mechanism for dynamic ride sharing based on parallel auctions[C] //Proc of the 22nd Int Jont Conf on Artifical Intelligence (IJCAI).Menlo Park, CA: AAAI, 2011: 266-272

[15]Shao Zengzhen, Wang Hongguo, Liu Hong, et al.Heuristic optimization algorithms of multi-carpooling problem based on two-stage clustering[J].Journal of Computer Research and Development, 2013, 50(11): 2325-2335 (in Chinese)(邵增珍, 王洪国, 刘弘, 等.多车辆合乘问题的两阶段聚类启发式优化算法[J].计算机研究与发展, 2013, 50(11): 2325-2335)

[16]Pelzer D, Xiao Jiajian, Zehe D, et al.A partition-based match making algorithm for dynamic ridesharing[J].IEEE Transactions on Intelligent Transportation Systems, 2015, 16(5): 1-12

[17]Yang Zhijia, Wang Zi, Wang Yang, et al.Two-stage estimation of distribution algorithm to solve multi-vehicle carpooling problem[J].Journal of Transportation Systems Engineering and Information Technology, 2016, 16(2): 164-169 (in Chinese)(杨志家, 王子, 汪扬, 等.车辆合乘问题的两阶段分布式估计算法[J].交通运输系统工程与信息, 2016, 16(2): 164-169)

[18]Alonso-Mora J, Samaranayake S, Wallar A, et al.On-demand high-capacity ride-sharing via dynamic trip-vehicle assignment[J].Proceedings of the National Academy of Sciences, 2017, 114(3): 462-467

[19]Guo Hui, Wang Lixia.Research on carpool path matching algorithm based on personalized needs[J].Computer Technology and Development, 2017, 27(1): 57-60 (in Chinese)(郭会, 王丽侠.基于个性化需求的拼车路径匹配算法研究[J].计算机技术与发展, 2017, 27(1): 57-60)

[20]Calvo R W, Luigi F D, Haastrup P, et al.A distributed geographic information system for the daily car pooling problem[J].Computers & Operations Research, 2004, 31(13): 2263-2278

[21]Ma Shuo, Zheng Yu, Wolfson O.Real-time city-scale taxi ridesharing[J].IEEE Transactions on Knowledge and Data Engineering, 2015, 27(7): 1782-1795

[22]Winter S, Nittel S.Ad-hoc shared-ride trip planning by mobile geosensor networks[J].International Journal of Geographical Information Science, 2006, 20(8): 899-916

[23]Amey A.Proposed methodology for estimating rideshare viability within an organization: Application to the MIT community[DB/OL].(2011-02-17) [2019-11-07].https://trid.trb.org/view/1092547

[24]Fu Yao, Xu Ge, Su Hui.Evolution of urban car sharing mode based on travel demand[J].Journal of Software, 2016, 27(Suppl 2): 309-319 (in Chinese)(付瑶, 徐恪, 苏辉.基于出行需求的城市车辆共享模式演化分析[J].软件学报, 2016, 27(增刊2): 309-319)

[25]Munkres J.Algorithms for the assignment and transportation problems[J].Journal of the Society for Industrial and Applied Mathematics, 1957, 5(1): 32-38

Multi-Strategy Solution Space Graph Search Algorithm of Real-Time Ride-Sharing Problem

Guo Yuhan, Zhang Yu, Shen Xueli, and Yu Junyu

(College of Software, Liaoning Technical University, Huludao, Liaoning 125100)

Abstract Ride-sharing can improve transportation efficiency, alleviate traffic congestion, reduce environmental pollution and save travel costs through decreasing the vehicle vacancy rate of all participants.Firstly, in this paper, a mathematical model is constructed for the real-time ride-sharing problem, where the utilization efficiency of the driver resources in the ride-sharing is evaluated by means of the shared route percentage and the detour distance constraint.Then, a solution space graph theory of discrete permutation problem is proposed and its principle is elaborated and analyzed.Based on this theory, a multi-strategy solution space graph search algorithm is constructed.The algorithm utilizes a parallel structure to generate the value matrix of driver-rider pairs, which greatly improves the efficiency of the algorithm compared with traditional approaches.Several different search operators, designed based on the characteristics of the discrete permutation problem, are manipulated by multiple control strategies proposed in this paper, which guide the search process to move to higher value directions of the solution space graph to obtain high quality matching results efficiently.The experimental results show that the quality of the algorithm can exceed 95% of the optimal solution, and the efficiency of the algorithm is significantly superior than the other algorithms compared in the experiment.

Key words ride-sharing; solution space graph; multi-strategy search algorithm; discrete permutation problem; combinational optimization algorithm

(guoyuhan@lntu.edu.cn)

中图法分类号 TP301.6

收稿日期2019-07-10;

修回日期:2019-11-13

基金项目国家自然科学基金项目(61404069);辽宁省自然科学基金项目(2019-ZD-0048);辽宁省教育厅基础研究项目(LJ2019JL012)

This work was supported by the National Natural Science Foundation of China (61404069), the Natural Science Foundation of Liaoning Province of China (2019-ZD-0048), and the Basic Research Project of Liaoning Provincial Education Department (LJ2019JL012).

Guo Yuhan, born in 1983.Received his PhD degree in the University of Artois, France, in 2013.Associate professor.Member of CCF.His main research interests include intelligent transportation, combinatorial optimization, machine learning and distributed computing.

Zhang Yu, born in 1996.Master candidate.His main research interests include intelligent transportation and machine learning.

Shen Xueli, born in 1969.Professor, master supervisor.Member of CCF.His main research interests include intelligent data processing, data mining and machine learning.

Yu Junyu, born in 1995.Master candidate.His main research interests include intelligent transportation and machine learning.