基于移动信令数据的城市热点识别方法论文

基于移动信令数据的城市热点识别方法

彭大芹1,2,罗裕枫1,2,江德潮1,2,刘艳林1,2

(1.新一代信息网络与终端重庆市协同创新中心,重庆 400065;2.重庆邮电大学 电子信息与网络工程研究院,重庆 400065)

摘 要 :城市热点的识别对于探索解决引导性的人群疏散、规避交通拥堵等问题提供新途径,并为基于位置服务(location based services,LBS)如商铺选址、旅游导航等提供重要的科学参考,具有重要的应用价值。随着个人手机终端的普及与发展,手机已经成为研究用户行为特征的一种理想的探测器。提出了将手机信令数据融合兴趣点(point of interest,POI)数据来挖掘城市的热点区域并进行功能类型标定,重点通过手机信令数据研究人流的出行行为和在蜂窝的驻留时长情况来识别活跃蜂窝,并进一步通过基于密度的聚类算法判别热点区域。选取了重庆市较场口一定范围区域作为研究区域,数据来源于重庆某移动运营商提供的用户手机信令数据,通过实验实例验证分析,证明了该方法可快速识别出城市热点区域,并具有较高的准确性。

关键词 :城市热点;信令数据;驻留点;活跃蜂窝;兴趣点(POI);功能类型

0 引 言

随着我国国民经济的快速发展,人们对生活质量的要求也越来越高,根据城市人口聚集特点进行城市热点区域的判定及功能类型标定,对于现代城市规划,使人们能更加便捷、舒适地生活,以及针对性地开展引导性的人群疏散、规避交通拥堵等具有重要意义[1-2]

近年来,通过分析用户的时空轨迹来研究用户的行为模式[3]、出行起止点(origin destination,OD)[4]、区域人口密度[5]、职住地分布[6]等已经取得了一定的成果,而时空轨迹分析的主要方法是基于全球定位系统(global positioning system,GPS)数据与手机信令数据。其中,用户驻留点的判别是用户行为分析的关键,亦是后续出行OD、职住地等研究的前提[7]。目前热点区域分析方法大部分是基于GPS的轨迹数据,从轨迹数据中提取经度、纬度、速度等关键字段判断用户在城市中的驻留位置,进而识别城市热点区域。文献[8]主要基于大量用户位置服务数据,对用户停留点用DBSCAN聚类算法挖掘热点区域,文献[9]则主要从出租车GPS原始数据进行停靠点的提取,然后对按时间段分块的停靠点并行运行基于密度的空间聚类来发现不同时段的热点区域。GPS定位数据相比手机信令数据定位精度高,但在实际的研究与应用中,GPS数据的获取都必须通过装有GPS的设备,存在成本高、设备投资大等问题,同时GPS数据也会由于遇到“城市峡谷”、遮挡物等引起信号丢失,从而造成数据缺失等诸多问题[10]

随着移动通信系统的不断优化和完善,为移动网络定位技术的实现提供了条件。手机信令定位技术目前存在的问题在于定位的精度很低,基本在几百米至几千米的范围内。但是手机信令有它得天独厚的优势:①城市基站实现全覆盖,能对手机用户实现时空位置的识别;②手机用户的普及率和使用率均达到了相当高的比例;③定位可以在现有网络资源下,产生的附加成本小。因此,利用手机信令数据,可以了解到任意时刻手机用户在城市区域内的分布情况,从而实现对区域内人群数量的统计,达到对区域内热点识别的效果。然而基于移动信令的定位技术,到目前为止主要用于完成区域内人群实时监测,包括区域内实时人流量大小、人流密度分布等。文献[11-14]证明了利用移动信令描述手机用户移动模式是可行的。文献[15]设计了改进的基于密度的DBSCAN算法,从大量用户手机位置数据挖掘人流密度较大的区域,并将该算法成功应用于华盛顿热点区域的分析。

综合上述研究,提出了基于移动信令数据的方法来判断城市热点,采用上述类似的方法判断用户的驻留点,但是在驻留点识别结果中考虑到处于用户居住地或者工作地等常驻地用户在热点区域活动的不确定性,引入了衰减因子来计算常住用户对热点区域的贡献度,增加了聚类结果的精准度,同时对判断出的热点区域标定了功能类型,对用户的出行、旅游等提供了方便,还可以对新发展城区的 POIs 数据库的扩充提供一定的参考价值。

1 基本概念

1.1 移动信令数据与POI数据

移动信令数据是由移动用户发生相应通信事件所产生的,以下对产生移动用户信令数据的通信事件进行简单介绍,如图1所示。

C =sin(Lat x )·sin(Lat y )+cos(Lat x

图1 通信事件简介图
Fig.1 Communication events introduction diagram

本文利用上述5类通信事件产生的移动信令数据作为城市热点识别的数据源,其包含的主要字段与说明如表1所示。在本文中用到了序号为3,4,6和9的字段,其中,CELLID字段中包含了经度(Lngt)和纬度(Lat)。一条信令数据由用户编号、经度、纬度、进出小区的时间构成,即小区Cell(ID,Lngt,Lat,t1,t2)。而一条信令轨迹Track由用户移动过程中所经历的小区(Cell1(ID,Lngt1,Lat1,t11,t12),Cell2(ID,Lngt2,Lat2,t21,t22),…,Celln(ID,Lngtn,Latn,tn1,tn2))组成。

兴趣点(point of interest, POI)数据,即包含名称、类别、经度和纬度等多个属性的数据,用以在电子地图上标示出某个地方的某个地标或景点。其作为描述城市的地标性建筑物数据,描述实体位置的能力是很强大的,在研究中可以有效地帮助我们提高识别出的城市热点的精度与速度。

表 1移动用户信令数据部分字段说明
Tab.1 Mobile user signaling data part field description

1.2 用户驻留点

关于手机轨迹中驻留点的描述不尽相同,但总的可以归结为在一个蜂窝内,用户的停留时间超过一定的时间阈值,即可以判定用户在该小区内驻留。

1.3 活跃蜂窝

活跃蜂窝表示某个蜂窝内的用户驻留数超过了一定的人数范围,该蜂窝即为活跃蜂窝。

德国联邦政府于2012年7月正式公布《调解法》(全名为《推进调解及其他裁判外纠纷解决程序法》),将调解作为裁判外纠纷解决的重要方式。对该法以及德国行政法院司法实践进行比较借鉴,对我国构建行政诉讼调解制度大有裨益。

1.4 热点区域

一个城市热点区域是指商业较发达区域、大量用户驻留或一个用户多次驻留的场所,例如重庆解放碑、观音桥等。所以,一个城市热点区域包含一个或多个活跃蜂窝。

2 思路分析

本文的设计思路主要是①原始信令数据的清洗和预处理;②根据用户的驻留时长识别驻留点;③计算常驻用户对热点区域的贡献度,判断活跃蜂窝;④对活跃蜂窝进行相似性度量并进行基于密度的聚类,挖掘出城市热点区域;⑤获取热点区域的POI数据,设置热点区域的功能类型。具体的流程图如图2所示。

1)施用钾肥明显促进了玉米苗期叶片数、株高、茎粗和SPAD值的增加,增幅分别为10.8%~23.2%、19.2%~40.0%、21.7%~40.1%和 8.5%~26.1%。 促进了玉米抽穗期叶片数和株高的增加,增幅分别为6.8%~10.9%和 6.6%~11.1%。 等施钾量条件下,100%OF处理的苗期株高、茎粗和SPAD值显著低于其他施钾处理。抽穗期茎粗和SPAD值均表现出有机无机钾配合施用高于100%OF处理和100%CF处理的趋势。

2.1 数据清洗与预处理

由于移动网络的复杂性和周边环境的影响,信令数据采集系统实际采集到的原始信令数据中经常夹杂较多的“噪音”数据。对数据进行清洗和预处理可以有效减少“噪音”数据对于驻留点识别的影响,提高识别准确度。信令数据处理过程如图3所示。

步骤3 对由相似度度量后的活跃蜂窝进行基于密度的聚类算法,将其划分到不同的组内,而组就是聚类结果的簇,即代表一个城市热点区域。

图2 流程图
Fig.2 Flow diagram

图3 数据预处理
Fig.3 Data preprocessing

2.2 用户驻留点识别

用户驻留点的识别没有采用目前应用广泛的基于GPS数据的方法,而是选取了基于移动信令数据的方法。从用户的移动信令轨迹数据中提取驻留点的主要方法是在移动信令数据中,根据用户进出单个蜂窝内的时间字段,计算该用户在此蜂窝内的驻留时长,判断驻留时长是否超过单个蜂窝内的时间阈值,如果是则判定该蜂窝即为用户的一个驻留点。

2.3 提取活跃蜂窝

二人置身绝壁,乍闻此声,只惊得魂飞魄散,扭头一望,但见一团硕大的阴影,正从云端飞速接近。它冲开云雾,两只黄色的眸,像雾中的探灯,凝射着金电般的厉芒!

其中,λ 与常驻用户是否在功能区域存在活跃行为相关,若常驻用户在区域内存在多点驻留点,则判定该常驻用户做出了贡献,统计常驻用户中做出了贡献的用户数n 1,则λ =1-n 1/n 。

2.4 挖掘热点区域

在介绍戊戌变法的时候,“戊戌变法”被译为“the Reform Movement of 1898”,并没有直译,因为在西方文化中没有“戊戌”这个说法。在中国,戊戌是传统甲子纪年中的一个年份名称,而康有为的“戊戌变法”那一年是戊戌年,所以叫戊戌变法,所以“戊戌变法”被译为“the Reform Movement of 1898”能让外国游客更好地理解它的意思。

步骤1 活跃蜂窝的位置表示。从上述内容知用户移动过程中的手机信令轨迹可表示为Cell n (Lngt n ,Lat n ,t n1 ,t n2 ),则活跃蜂窝的位置表示(Lngt n ,Lat n )。

热点区域的挖掘是对识别出的活跃蜂窝进行了相似性的度量后,采用了目前应用比较广泛的基于密度的聚类算法。挖掘的过程就是把所有的根据上述过程判定的活跃蜂窝利用欧几里得的相似性度量后,按照他们密度分布不同划分到不同的组内,每个组就代表一个热点区域。这里的密度是表示活跃蜂窝之间的距离,而组即为聚类的结果簇。具体的实现步骤如下。

步骤2 对识别出的所有活跃蜂窝进行相似性的识别,其中相似性是指对2个活跃蜂窝对象之间的相似程度的定量度量,若2个蜂窝对象之间越相似则其相似性也就会越高。相似性的计算方法有2种。一种方法是用一个K 维空间的点来表示对象,然后用2个点之间的距离来度量对象之间的相似性,距离越小就表示2个对象间的相似性越高。另外一种用来衡量对象间相似性的方法就是分别比较对象的基本特征与某些典型特征。目前相似性的计算技术不下几十种,本文结合数据源特征并综合考虑一些常用方法的优缺点,最终选取了最常用的欧几里得距离算法。根据三角推导,可以得到计算2点距离为

d (x +y )=R ·arccos(C )·π/180

(1)

信息是互联网的强项,互联网可以最大程度解决过去旅游信息不对称的现象。“互联网+”时代的到来伴随移动4G网络和WIFI的普及,游客出行依靠互联网和移动互联网的程度越来越大,许多实证研究都得出网络已成为游客获取旅游信息的首选媒介。

对于包含多个POI类别的热点区域,则利用信息增益法计算出该热点区域内影响较大的类别并标定为该城市热点区域的功能类别。具体步骤如下。

(2)

则采用欧几里得的相似度计算公式为

Sin (x +y )=1/(1+d (x +y ))

(3)

(1)—(3)式中:R =6 371 km是地球半径;x (Lngt x ,Lat x ),y (Lngt y ,Lat y )是K 维空间的2个点,x ,y 2点的经纬度经过正负处理后得x (MLngt x ,MLat x ),y (MLngt y ,MLat y ),d (x +y )是2点之间的欧几里得距离,sin(x ,y )表示2点间的欧几里得相似度。

北医三院推进这项工作的过程又具体分为几个阶段。第一阶段为2013年5-10月,项目组从40多个临床科室中选择了8个试点科室,涵盖内、外、妇、儿、麻醉、护理等主要科室,通过访谈、实地参与式观察、历史资料查阅等多种方式,了解了各岗位工作的职责与任务、任职资格(学历、工作经历、知识技能、能力素质等),完成了岗位说明书模板设计,主要包括基本信息、工作描述、岗位在组织中的位置与工作关系、工作职责及工作任务等。

三是调控水的时间分布。对沼泽地生态系统而言,自然的淹没及干旱循环是其自然状态下生态环境的重要组成部分,要以改善流入河口环境淡水的时间分布为目标,尽量按照水的自然流态调控进入生态系统,而不是人工的忽高忽低的脉冲状态。

根据某个时间段内蜂窝中驻留人数的不同,提出了活跃蜂窝的概念。但是在统计蜂窝内驻留人数N 时,考虑到驻留用户分为常驻用户和非常驻用户2类,其对某个蜂窝活跃性的判断更甚者对某个区域是否为热点的判定都是有不同的影响。因此,在本文中对蜂窝内驻留用户根据其历史轨迹进行了常驻用户的识别,并引入了衰减因子λ (0<λ <1),计算得到常驻用户数n 为该区域成为热点做出的贡献度。最后综合计算该蜂窝内的有效驻留人数P =N -λ ·n ,判断驻留人数是否超过了单个蜂窝内的人数范围,如果是,则判定此蜂窝为活跃蜂窝。

基于密度的聚类方法要求聚类空间中的一定区域内包含的对象数目不能低于某一阈值,相比于其他聚类算法的优点在于不需要输入聚类划分的个数、能够处理任意形状和大小的簇、具有明显的抗噪声优势等。

于是,我们四个人便去了附近的一家餐厅。但让我没想到的是,开始吃饭后没多久,两人又吵了起来。起因是小孩想吃虾,让他妈妈给剥一下,结果他妈一口回绝了,“这么大的孩子了,以后自己剥。”

2.5 功能类型的标定

对挖掘出的热点区域利用百度地图API获取POI数据,其中每条POI数据中包含POI的名称、类别、经度、纬度等多个属性值。根据热点区域内包含的POI类别个数的不同,分情况讨论热点区域功能类型的标定方法,具体过程如图4所示。

cos(Lat y )·cos(MLngt x -MLngt y )

步骤1 假设热点区域包含m (m ≥1)个POI类别C i ,i =1,2,…,m 则热点区域类别的期望信息为

I (C 1,C 2,…,C m )=-P 1lbP 1-

P 2lbP 2-…-P m lbP m

Spatial network structure of Huaihai Economic Zone based on traffic

(4)

(4)式中,P i =S i /S ;S i 表示第i 个类别在热点区域内出现的次数;S 表示所有类别在热点区域内出现的总次数。

步骤2 热点区域内第i (0<i ≤m )个类别的信息熵E (C i )为

E (C i )=P i ·I (C i )

(5)

步骤3 在热点区域内类别C i 的信息增益为

Gain (C i )=I (C 1,C 2,…,C m )-E (C i )

(6)

步骤4 根据前面步骤依次计算出热点区域内所有类别C i 的信息增益值,比较大小,将信息增益值最大的类别即标定为该热点区域的功能类型。

图4 热点区域功能类型的标定流程图
Fig.4 Hot spot area function type calibration flow diagram

3 实 验

3.1 移动信令数据与POI 数据

实验使用的移动信令数据是由重庆市某运营商提供的并经过加密处理,主要包括用户ID、事件发生时间、基站信息和道路编号等字段,数据以一条信令一行的方式进行存储。其中,用户编号是用户手机号匿名化以后的显示,jumpin表示用户进入目标覆盖区,jumpout则表示用户离开目标覆盖区。部分原始信令数据如图5所示。

图5 部分原始信令数据
Fig.5 Part of the original signaling data

POI数据则是利用百度地图API接口获取,可以得到POI的名称、类别、经纬度等属性,部分样例数据如图6所示。

3.2 数据清洗

移动信令数据的质量将直接影响到城市热点识别结果的准确性和有效性,因此,需要对原始的数据进行清洗。首先从原始的移动信令数据中过滤与本文无用信息,提取关键字段;然后删除由于在信息传输过程中发生丢失或错误或重复的无效数据;最后过滤掉产生乒乓切换现象的数据。以移动用户为单位,提取该用户的所有信令数据并按照时间先后顺序构建用户移动轨迹,从而达到减少后期存储、提高查询性能与数据处理能力的效果。

图6 POI样例数据
Fig.6 POI sample data

3.3 用户实例与结果分析

本文圈定了重庆市较场口附近区域作为研究目标区域,图7为基站的位置信息图,区域中包含了230个基站,并以区域基站2016年11月30日一天的原始数据作为研究对象,特别地,该天的常驻用户是通过与运营商在该区域的常驻用户库进行对比得到的。运用上述方法进行了城市热点的识别与功能类型的标定。

在课堂教学中渗透马克思主义的哲学理论是哲学课的题中应有之义。在理论知识的教学中,必须在”哲理”上下功夫,注重科学性,坚持以理服人,增强知识的可信度,培育学生的认同情感。

图7 较场口区域基站位置示意图
Fig.7 Location of base station in JiaoChangKou

首先对一天的原始数据进行数据清洗,然后对清洗后的数据进行驻留点识别,主要识别出用户在某个基站的停留时间,根据时间阈值来判断是否为驻留点,经过驻留点判别处理后的部分中间结果数据如图8所示,数据字段为用户ID(USER_ID),进入基站时间(TIME_IN),离开基站时间(TIME_OUT),基站经度(LNG),基站纬度(LAT),基站类型(STATION_TYPE),驻留时间(STAY_TIME)精确到分,是否为驻留点(IS_STAY)。然后确定基站的驻留人数,统计分析得到的部分结果数据如图9所示,数据的字段为基站ID号(ID),基站经度(LNG),基站纬度(LAT), 基站类型(STATION_TYPE),驻留人数(NUM)。最后利用百度地图API的可视化开源库Mapv展现活跃基站的热力图如图10所示。

图8 驻留点样例数据
Fig.8 Held point sample data

图9 基站驻留人数样例数据
Fig.9 Base station resident number sample data

图10 活跃基站热力图
Fig.10 Active base station thermal chart

由图10可以明显的看出,所圈定区域的用户停留点呈现出明显的区域集中性特征,从图10中可以看出,日月光广场、八一广场、解放碑中心、临江门、女人广场等区域人流最为密集,人流多数选择在以上几个区域中停留。

以基站驻留人数分析结果数据为基础,转换为[{LNG,LAT,NUM},{LNG,LAT,NUM,…}]的数据格式,对活跃基站进行距离的聚类,把相近的热点基站归类到一个区域,并利用百度地图的开源库mapV将数据可视化,其效果如图11所示。图11中数字为区域人数。

纳入标准:(1)查体、X线片、MRI、CT和ECT骨扫描检查符合脊柱转移性肿瘤;(2)出现顽固性背痛,尤其在夜间及身体活动时疼痛严重;(3)疼痛造成活动障碍,严重影响正常休息,导致睡眠状况不佳;(4)采取药物等其他保守治疗措施后没有明显好转;(5)对其进行Tomita评分,分值4~7分。排除标准:(1)成骨性转移;(2)肿瘤侵犯椎管产生神经压迫症状;(3)椎弓根破坏严重;(4)椎体塌陷超过75%;(5)穿刺部位感染;(6)不能耐受俯卧位;(7)凝血功能异常;(8)全身状况差不能耐受手术者。

图11 活跃基站聚合图
Fig.11 Active base station aggregation chart

将从百度地图API接口采集到的区域POI数据对应到相应的热点区域中,并对热点区域中的POI数据进行统计分析表如表2所示。

同一项政策,用不同的指标进行评价,其结果大不一样。指标的统一性不但在项目的最终评价中起标准尺度作用,而且也是评判政策的依据,标准不一,不同种政策就没有可比性。实行统一指标标准,就等于把不同的政策,置于相同的起跑线上,这样才能把诸多复杂因素化为单一因素,从而减轻评价难度。另外,制定的评价标准应尽量简要明了,避免因评价标准含糊不清、模棱两可而给评价工作带来操作上的困难。

表 2区域 POI数据统计表

Tab.2 Regional POI data statistics table

对热点区域与热点区域中的POI数据结合分析,利用信息增益法实现对热点区域的功能类型的标定。结果如表3所示。

3.4 结果验证

针对实验的结果,本文通过实地调查问卷和实地考察的方式进行结果的验证,每个区域随机选择了100人做考察,结果如表4所示。

表 3区域功能类型结果表

Tab.3 Area function type result table

表 4调查问卷结果表

Tab.4 Questionnaire results table

可以看出,实地调查的结果与实验的结果基本一致,但是当2个区距离较近的时候,由于是抽样随机调查,一个区域会受到另一个区域的人流的影响而产生偏差,如表4中的3 387(日月光广场区域)的实验标识结果与调查问卷结果有误差。总体来说,通过实地调查问卷和实地考察的方式说明了本文城市热点识别方法是可行的。

4 结束语

城市热点的识别对于合理地进行城市规划具有重要的参考意义。随着移动网络的全面覆盖,手机信令数据成为了智慧城市、城市规划等研究的一项重要的数据源。本文基于大量用户的信令数据挖掘城市热点区域,并提出了对常驻用户引入衰减因子的新方法,最后结合POI数据对热点区域标定功能类型。某个区域内的POI类别本就是区域标志性的建筑或景点,引入POI数据对热点区域进行功能类型的标定,其实也从侧面印证了文中方法挖掘的热点区域的准确性。另外,还可以通过热点区域的挖掘来扩充区域内的POI数据库。除此以外,还有一点值得引起我们的注意,那就是目前多番提倡的多源数据融合,关注数据之间的联系、隐藏价值以及彼此之间的相互验证等。

参考文献 :

[1] 路培聪.福州市居民出行特征分析与城市交通发展对策研究[J].福建师范大学学报:自然科学版,2002,18(2):99-103.

LU Peicong. Study on the Characteristics of Resident Trip in Fuzhou and Countermeasures for the Development of Urban Transportation[J]. Journal of Fujian Normal University: Natural Science Edition,2002,18(2):99-103.

[2] 曲大义,于仲臣.苏州市居民出行特征分析及交通发展对策研究[J].东南大学学报:自然科学版, 2001, 31(3): 118-123.

QU Dayi, YU Zhongchen. Study on the Trip Characteristics of Residents in Suzhou City and Countermeasures for Traffic Development[J], Journal of Southeast University: Natural Science, 2001, 31(3): 118-123.

[3] PHITHAKKITNUKOON S, HORANONT T, LORENZO G D, et al. Activity-Aware Map: Identifying Human Daily Activity Pattern Using Mobile Phone Data[C]//Human Behavior Understanding. Istanbul, Turkey: Springer Berlin Heidelberg, 2010:14-25.

[4] 陈欢.基于手机信令数据的人员出行特征跟踪调查[J].交通与运输:学术版,2017(A01):92-94.

CHEN Huan. Survey of Pedestrian Travel Characteristics Based on Mobile Phone Signaling Data[J]. Transportation and Transportation:Academic Version,2017(A01):92-94.

[5] 徐金垒,方志祥,萧世伦,等.城市海量手机用户停留时空分异分析——以深圳市为例[J].地球信息科学学报,2015,17(2):197-205.

XU Jinlei, FANG Zhixiang, XIAO Shilun, et al. The Spatio-temporal Heterogeneity Analysis of Massive Urban Mobile Phone Users’Stay Behavior:A Case Study of Shenzhen City[J]. Journal of Geo-Information Science, 2015,17(2):197-205.

[6] 张天然.基于手机信令数据的上海市域职住空间分析[J].城市交通,2016,14(1):15-23.

ZHANG Tianran. Job-Housing Spatial Distribution Analysis in Shanghai Metropolitan Area Based on Cellular Sig-naling Data[J].Urban Transport of China,2016,14(1):15-23.

[7] 苗壮.基于手机信令数据的数据清洗挖掘与居民职住空间分析[D].成都:西南交通大学,2017.

MIAO Zhuang. Data Cleaning and Mining Based on Mobile Phone Signaling Data and Residents' Living Space Analysis[D].Chengdu: Southwest Jiao Tong University.2017.

[8] 张文元,谈国新,朱相舟.停留点空间聚类在景区热点分析中的应用[J].计算机工程与应用,2018(4):263-270.

ZHANG Wenyuan, TAN Guoxin, ZHU Xiangzhou. Application of stay points spatial clustering in hot scenic spots analysis. Computer Engineering and Applications[J]. Computer Engineering and Applications,2018(4):263-270.

[9] 冯琦森.基于出租车轨迹的居民出行热点路径和区域挖掘[D].重庆:重庆大学,2017.

FENG Qisen. Traveling Hotspot Paths and Regional Excavations Based on Taxi Tracks[J]. Chongqing: Chongqing University ,2017.

[10] ZHANG X, YUAN Z. The GPS trajectory data research based on the intelligent traffic big data analysis platform[J]. Journal of Computational Methods in Sciences & Engineering, 2017, 17(3):1-8.

[11] 李青,严学纯,陈思中.基于移动信令数据分析的位置服务与基站定位技术的混合应用[J].电信科学,2017, 33(8):155-162.

LI Qing, YAN Xuechun, CHEN Sizhong. Hybrid application of location service based on mobile signaling data analysis and base station positioning technology[J]. Telecommunications Science, 2017, 33(8):155-162.

[12] WANG Z, HE S Y, LEUNG Y. Applying mobile phone data to travel behaviour research: A literature review[J]. Travel Behaviour & Society, 2017(1): 141-155.

[13] 唐小勇,周涛,陆百川.基于手机信令的大范围人流移动分析[J].重庆交通大学学报:自然科学版,2017, 36(1):82-87.

TANG Xiaoyong, ZHOU Tao, LU Baichuan. Analysis of Wide Range Population Flow Analysis Based on Mobile Phone Signaling[J]. Journal of Chongqing Jiaotong University: Natural Sciences, 2017, 36(1):82-87.

[14] BECKER R, CCERES R, HANSON K, et al. Human Mobility Characterization from Cellular Network Data[J]. Communications of the Acm, 2013, 56(1):74-82.

[15] KISILEVICH S, MANSMANN F, KEIM D. P-DBSCAN: a density based clustering algorithm for exploration and analysis of attractive areas using collections of geo-tagged photos[C]// Proceedings of the 1st International Conference and Exhibition on Computing for Geospatial Research & Application. New York: ACM, 2010:591-598.

Urban hotspots identification method based on mobile signaling data

PENG Daqin1,2, LUO Yufeng1,2, JIANG Dechao1,2, LIU Yanlin1,2

(1. Chongqing Collaborative Innovation Center for Information Communication Technology, Chongqing 400065, P. R. China;2. Electronic Information and Networking Research Institute, Chongqing University of Posts and Telecommunications, Chongqing 400065, P. R. China)

Abstract : The identification of urban hotspots provides a new approach to solve the problem of guiding people to evacuate, avoiding traffic congestion and other issues, and offers a scientific reference for location-based services (LBS) such as shop location, tourism navigation and so on, and has important application value. With the popularization and development of personal mobile terminals, mobile phones have become an ideal detector for studying user behavior characteristics. In this paper, mobile signaling data is integrated with point of interest (POI) data to mine hot spots in cities and perform function type calibration. The focus is on mobile signaling data to study the travel behavior of human traffic and the resident duration in the cell to identify the active cell and to further identify the hot spot area by the density-based clustering algorithm. This paper chooses a certain area of Chongqing Municipality as a research area, and the data comes from user mobile signaling data provided by a mobile operator in Chongqing. The experimental verification shows that this method can quickly identify hot spots in cities with higher accuracy.

Keywords :urban hotspots; signaling data; stay points; active cell; point of interest (POI); functional type

中图分类号 :TP391

文献标志码: A

文章编号 :1673-825X(2019)01-0095-08

收稿日期 :2017-11-05

修订日期: 2018-07-14

通讯作者: 彭大芹pengdq @cqupt .edu .cn

基金项目 :工信部新一代宽带无线移动通信网重大专项:LTE -V 无线传输技术标准化及样机研发验证(2016ZX 03002019-007)

Foundation Item s: The new generation of broadband wireless mobile communications network major projects of the Ministry of Industry and Information:The LTE-V wireless transmission technology standardization and prototype research and verification(2016ZX03002019-007)

DOI :10.3979/j.issn.1673-825X.2019.01.013

作者简介 :

彭大芹(1969-),男,四川雅安人,正高级工程师,硕士,主要研究方向为LTE、物联网以及车联网等方向的标准、终端协议和终端解决方案、移动大数据。E-mail:pengdq@cqupt.edu.cn。

罗裕枫(1992-),男,广西梧州人,硕士研究生,主要研究方向为移动大数据。E-mail:306314624@qq.com。

江得潮(1992-),男,浙江杭州人,硕士研究生,主要研究方向为移动大数据。E-mail:805652561@qq.com。

刘艳林(1990-),女,山西晋中人,硕士研究生,主要研究方向为移动大数据。E-mail:503777619@qq.com。

(编辑 :刘 勇)

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于移动信令数据的城市热点识别方法论文
下载Doc文档

猜你喜欢