首页 > 文章中心 > 正文

CellID定位地铁出行路径

CellID定位地铁出行路径

对于AFC数据推算法,传统的地铁出行路径采用“最短路径法”[3],即最短路径上客流量按100%分配,其他路径则全为零。但实际中出行者的路径选择并非完全按最短路。陆奕婧[4]通过分析影响路径选择的主要因素,建立了简单的路径选择概率计算模型;孙延硕等[5]利用图论的方法,提出一种叫“单限制多权值的第K(≤3)短路径”算法,算法将换乘路径的里程数和换乘站数作为乘客选择某条路径的主要衡量标准,搜索满足限制条件的最短路径、次短路径和渐次短路径,然后以换乘路径选择概率的方式,计算各条路径的选择比例;徐瑞华等[6]通过研究路径的综合出行阻抗与最短路径阻抗的关系,提出以正态分布函数描述出行路径选择行为;殷锡金[7]基于AFC数据,提出了“鉴识车票乘车路径理论”,根据列车在各地铁站点实际到发时刻,将乘客进站时段、进站时间、换乘时间、出站时间与之进行比较,当两者在一个合理的时间段内时,即认为该路径是乘客所选路径;刘剑锋[8]采用Logit随机路径选择模型,建立了路径选择方法模型。但是,这些方法均是通过理论模型推算,与乘客实际的出行路径存在一定的误差,该误差因模型的不同具有一定的偏向性。至今仍没有一种公认的、权威的出行路径算法模型。

手机定位信息研究应用现状

随着无线通信网络的逐步完善,我国手机用户数量得到快速的增长,手机用户由2006年的4.6亿发展到2010年的近8.6亿[9]。同时,手机定位信息的应用,也得到各国学者的重视,并利用各类检测手段进行了大量的相关研究。Lovell[10],Bar-Gera[11]等利用仿真方法研究了不同手机定位方法下车速估计的精度,结果表明利用手机定位信息能很好地区分车流在不同状态下的速度。在国内,2008年中国移动委托国家智能交通系统工程技术研究中心(NationalCenterofITSEngineeringandTechnology,ITSC)组织实施了“基于手机位置采集实时交通信息科研项目”实验,这是国内首次大范围尝试利用手机位置进行实时交通信息分析与采集,所得行程时间准确率约70%。而刘淼等[12]、张博[13]从城市交通的角度研究了手机定位信息在居民出行调查中的运用,如居民出行OD、出行方式等数据的获取原理。本文利用手机被动定位(CellID定位法)产生的信令数据,通过分析地铁乘客在地铁系统内部的手机信令数据,研究乘客出行规律,实现乘客出行路径的精确识别。

地铁乘客出行路径辨识算法

无线通信位置信息产生原理处于待机状态的手机通过基站(BaseStation,BS)与无线通信网络保持联系,无线通信网络对手机所处的位置区(LocationArea,LA)信息进行记录,该信息称为位置区代码(LocationAreaCode,LAC),在用户拨打电话和接听电话时根据所记录的位置区信息可通过呼叫路由选择找到手机,建立通话连接,位置信息都以数据库的形式存储在来访用户位置寄存器中。在正常情况下,当移动台(MobileStation,MS)发生以下事件[14]时会向寄存器上传信息(包括上传的时间、事件编号、所用的基站编号即CellID),称为位置点信息。1)需要使用网络通信时,如主叫、被叫、发短信、收短信2)开、关机;3)周期性位置更新:长时间没有上报位置信息时;4)小区切换:在移动中打电话切换了所使用的基站时;5)正常位置更新:在待机状态下跨越了位置区时。若没有发生以上事件,MS会以一定的时间间隔自动上报信息置寄存器中。

算法基本思想在无线通信中,为保持良好的无线通信服务,进行位置区域划分时,通常把每条地铁线路赋予不同的LAC编号,例如地铁线路1的基站S11,S12,…,S1i,用同一个LAC表示,地铁线路2的基站S21,S22,…,S2i,用另外一个LAC表示。根据无线通信原理,除了正常的通信事件外,跨越不同的LAC时,也将发生位置信息的上传。地铁出行者路线可分两种类型,一是出行中未发生换乘,二是发生了线路间换乘。如图2所示,当地铁出行者经地面基站GS1范围进入地铁线路1的S11站点时,跨越不同的LAC,将向无线通信网络上报当前位置信息;当出行者再经换乘站TS12至站点S1i下车时,在出站口跨越至基站GS2的信号覆盖范围时,发生LAC切换,也向无线通信网络上报位置信息,出行者的下车站点便可确定。当出行者经换乘TS12至地铁线路2的站点S2i下车时,同理若中间未发生任何其他通信事件,在换乘TS12由线路1换乘至线路2时,跨越不同的LAC,向无线通信网络上报位置信息,最后经S2i出站,跨越LAC至基站GS3,再次发生上报位置信息事件。除跨越位置区发生位置信息更新外,当途中发生任何其他通信事件(主叫、被叫、发短信、收短信、开机、关机),也将发生位置信息的更新,这些信息可用于出行路径的修正。

算法流程基于手机定位信息的地铁出行路径辨识算法流程如图3。计算流程主要包括数据过滤预处理、基站与地铁站点匹配、路径有效性判别等步骤,三个关键步骤均要利用地铁基站数据库,该数据包含信息如表2所示。

数据过滤数据过滤包括两部分内容:一是无效数据过滤,初始手机信令数据可能包含一些错误的无效数据,进行分析之前应进行剔除处理;二是地铁出行用户数据过滤,结合地铁基站数据库,将出行用户中不包含地铁出行的过户提前过滤,减少后期计算工作量。

基站与地铁站点匹配基站与地铁站点匹配是出行路径辨识的核心算法,主要包括进地铁站点辨别、换乘站点辨别、出地铁站点辨别。定义出行者在某一时刻上传的位置信息为Ti(Ci,Li,ti,Ei),其中Ci是i时刻位置信息对应的CellID号,Li是i时刻位置信息对应的LAC号,ti是上传时间,Ei是i时刻位置信息对应的事件类型;地铁基站数据库以集合DB(C,L,Line,Station)表示,其中C,L意义同前,Line为地铁线路,Station为地铁线路的站点。算法步骤如下:1)将个体出行用户按信令提交时间先后排序。2)按信令先后顺序迭代判别,当首次出现信令Ti(Ci,Li,ti,Ei)中的Ti(Ci,Li)∈DB(C,L),且Ti(Ei)为正常位置更新事件时,令该基站对应DB中地铁站点为本次出行进入地铁站点的位置Enter(Line,Station)。3)继续信令数据迭代。若信令Ti+1(Ci+1,Li+1,ti+1,Ei+1)中的Ti+1(Ci+1,Li+1)∈DB(C,L),且Ti+1(Ei+1)为非正常位置更新事件或Ti+1(Ei+1)=Ti(Ei)时,把该信令对应地铁站点加入集合M(Linei,Stationij),用于最后对算法辨识路径结果修正;若Ti+1(Ci+1,Li+1)∈DB(C,L),且Ti+1(Ei+1)为正常位置更新事件,Ti+1(Ei+1)≠Ti(Ei)时,令该基站对应的地铁站点为本次出行的换乘站点之一TS(Line,Station)。4)按步骤3)继续迭代判断,若信令Ti+k(Ci+k,Li+k,ti+k,Ei+k)中的Ti+k(Ci+k,Li+k)DB(C,L),且Ti+k(Ei+k)为正常位置更新事件,Ti+k(Ei+k)≠Ti+k(Ei+k-1),令该基站对应的地铁站点为本次出行的出地铁站点Exit(Line,Station),结束本次出行判断。5)个体居民出行链中一天出行可能存在多次乘坐地铁,因而继续对信令数据迭代判断,重复2)~4),直至信令数据全部判断完毕。

地铁路径有效性判别经基站与地铁站点匹配后,可初步得到地铁出行进入地铁站点(起点)、换乘站点、离开地铁站点(迄点),但在实际数据条件下,由于无线通信网络数据采集不稳定等因素,可能存在信令数据丢失,导致无法匹配合适站点作为进入地铁、线路换乘、离开地铁的站点。因此需对匹配站点进行有效性检验,检验方法包括二种:一是出行进、出站点(起迄点)完整性检验;二是换乘站点合理性检验。1)地铁出行起迄点完整性检验。一次完整的地铁出行至少包括进站和出站点,因此,若经基站与地铁站点匹配得到的每次出行结果中无法完整地包含进站和出站站点,则认为此次出行不完整,应从有效出行中剔除;此外,还存在一天多次地铁出行的情形,需对相邻换乘点间的时间间隔进行判别,若超出一定阈值,则此次出行也应从有效出行中剔除,剔除数据作为计算样本,将加入集合Error中,用于对结果质量评价。2)地铁换乘站点合理性检验及路径修正。经第一步起迄点完整性检验后,出行路径已包括较为完整的出入地铁站点,此步骤主要针对换乘站点的合理性进行检验,同时,利用

节中基站与地铁站点匹配过程中得到的M(Linei,Stationij)进行路径修正。记第一次换乘站为TS1(Line,Station),进入站点为Enter(Line,Station),若Enter(Line)的地铁线路包含了站点TS1(Line),则认为本次换乘路径匹配成功。若TS1(Station)不包含在线路Enter(Line)中,则利用M(Linei,Stationij)进行修正,修正步骤如下:步骤1在轨道拓扑网络中寻找站点Enter(Line,Station)与TS1(Station)之间的第K短路径,集合M(Linei,Stationij)完全包含在该路径经过的站点时,认为该第K短路径为站点Enter(Line,Station)与TS1(Station)之间的实际出行路径,如图6所示,由Enter站点进,第一次换乘出行于TS4,寻找Enter与TS4间的第K短路径,假设为Enter—TS1—TS4,若M(Linei,Stationij)包括M1和M2,即M1、M2完全包含在该K短路Enter—TS1—TS4的拓扑结构中,则认为Enter-TS1-TS4为站点Enter与TS4间的实际出行路径;当K达到一定阈值时,仍然无法找到能够完全匹配的路径,认为此次匹配失败,剔除样本,加入集合Error中。步骤2若步骤1匹配成功或修正后匹配成功,进行换乘点TS1(Station)与换乘点TS2(Station)间的路径匹配,匹配方法与步骤1相同,直至所有换乘点与出站点匹配完成后,结束判断。

实例分析

为对算法的合理性进行检验,以北京市轨道交通网络为对象进行研究分析。地铁四号线的灵境胡同站与地铁5号线的刘家窑地铁站间的出行包括以下两条合理路径(可行路径大于2条),如图7所示,即可通过地铁线路1换乘,也可通过地铁线路2换乘,两条路径的出行时间费用相差不大,但高峰时刻1号线比2号线拥挤。本次算法验证数据来源于中国移动北京分公司,该公司在北京拥有3万多无线通信基站,在轨道交通网络中,基站布置于各个地铁站点处,每条地铁线路有不同LAC,周期性位置更新时间约2h。算法验证共采用有效样本160个。刘家窑至灵境胡同方向有效样本78个,经3.3.2节的基站与地铁站点匹配后,初步得地铁出行起、迄点,表3给出了起、迄点判别结果的两类典型示例,一是可直接得出行路径,二是经修正后可得出行路径。根据统计结果可知:由刘家窑至灵境胡同方向共78个有效样本,其中可直接判别路径的74个,需进行路径修正的4个;由灵境胡同至刘家窑方向共82个有效样本,可直接判别路径的77个,需进行路径修正的5个。路径修正后得出行路径统计如表4:经1号线换乘21个,经2号线换乘57个,比例约1∶2.7,在上午时段比例约1∶3.1,下午时段比例约1∶2.38,结果表明,上午选择2号线的比例要高于下午选2号线的比例。灵境胡同至刘家窑方向有效样本82个,经1号线换乘20个,经2号线换乘62个,比例约1∶3.1,在上午时段比例为1∶3.25,下午时段比例为1∶3.06。由以上分析可以看出,在刘家窑与灵境胡同间的出行路径,2号线的选择比例大约为1号线3倍,这主要是由于1号线流量大、负荷度高、服务水平低,出行者倾向于选择负荷度相对低的2号线;在同样选择2号线出行时,上午选择的比例要高于下午。

结语

手机定位信息在交通规划与管理中具有良好的应用前景。本文通过研究出行者在地铁出行中被动产生的手机定位信息,提出了出行路径辨识的计算模型,并基于真实的手机定位数据,对北京轨道路网5号线刘家窑站与4号线灵境胡同站之间的换乘路径进行分析。该方法展现了一种研究地铁出行路径的新思路,为地铁客流组织、出行诱导、票务清算等提供支持。但是,手机数据的运用也面临不少问题:在数据来源方面,由于数据源关系到公众个人隐私,因此,在实际应用中,必须合法解决手机数据来源问题;在使用过程中,因为数据过滤而造成的抽样率差异对结果的影响还需要在以后的研究中加以考虑解决。

作者:赖见辉陈艳艳钟园吴德仓袁奕芳单位:北京工业大学建筑工程学院北京市交通信息中心北京市轨道交通指挥中心

文档上传者