Author Affiliations
The Centre for Urban Planning and Transport Studies, College of Urban and Environmental Sciences, Peking University, Beijing 100871, Chinashow less
Fig. 1. Spatial distribution of land-use related variables
Fig. 2. Spatial distribution of metro trip records in a week
Fig. 3. Schematic diagram of estimating trip purpose of the smart card transactions
Fig. 4. MDA values of different feature importance in the RF classifier
Fig. 5. The OOB accuracy of the RF classifier changes with the number of features
Fig. 6. Convergence of training of random forest classifiers and judgment of the optimal number of trees
Fig. 7. Temporal distribution of metro trip departures and arrivals for different travel purposes
Fig. 8. Spatial distribution of metro trip departures and arrivals for different travel purposes
数据类型 | 数据描述 | 数据年份 | 数据来源 |
---|
居民出行调查数据 | 居民一日出行链 | 2015年(对应2014年北京市居民出行情况) | 北京市交通委员会(http://jtw.beijing.gov.cn/) | SCD智能卡数据 | 共计约1434万条地铁出行数据 | 2018年(7月1日至7月7日) | 北京市交通委员会(http://jtw.beijing.gov.cn/) | 百度POI数据 | 用于反映城市服务设施的空间分布情况 | 2015年 | 百度地图开放平台(http://lbsyun.baidu.com/) | 地铁站点数据 | 北京市地铁站点空间分布情况 | 2014年、2018年 | 北京地铁(https://www.bjsubway.com/) | 住房交易价格数据 | 单位面积成交价格 | 2015年 | 北京链家网(https://bj.lianjia.com/) |
|
Table 1. Data sources and brief description
出行目的 | 样本数量/条 | 占比/% |
---|
回家 | 3270 | 58.76 | 其他 | 498 | 8.95 | 上班 | 1797 | 32.29 | 总计 | 5565 | 100.00 |
|
Table 2. Number and proportion of metro trips by purpose intraffic survey data
特征名称 | 特征描述 |
---|
出行目的 | 被识别变量(上班、回家、其他) | 出行特征 | 出发时刻、到达时刻、出行时长 | 土地利用特征 | 起止点周边高收入、低收入工作场所类型POI核密度值 | 起止点周边居民点类型兴趣点与住房价格核密度值 | 起止点周边公共服务与生活服务设施类型POI核密度值 | 起止点到市中心欧式距离 |
|
Table 3. Variables included in the random forest classifier
| 样本数量/条 | | 样本占比/% |
---|
分类结果为“回家” | 分类结果为“其他” | 分类结果为“上班” | 预测准确样本占比 |
---|
真实值为“回家” | 782 | 38 | 14 | | 93.76 | 真实值为“其他” | 8 | 45 | 23 | 59.21 | 真实值为“上班” | 0 | 42 | 439 | 91.27 |
|
Table 4. Random forest classifier confusion matrix results
| 样本数量/条 | | 样本占比/% |
---|
分类结果为“回家” | 分类结果为“其他” | 分类结果为“上班” | 仅包含出行特征分类准确样本占比 | 初始RF分类器准确样本占比 |
---|
真实值为“回家” | 765 | 38 | 15 | | 93.52 | 93.76 | 真实值为“其他” | 22 | 31 | 33 | 36.05 | 59.21 | 真实值为“上班” | 3 | 56 | 428 | 87.89 | 91.27 |
|
Table 5. Comparison of confusion matrix betweenrandom forest classifier with or without travel-related variables