循环神经网络最新模型(城市道路速度如何预测)
循环神经网络最新模型(城市道路速度如何预测)在复杂的城市路网中,城市交通状态受多种因素的共同影响。其中 天气状态、空气质量、节假日活动、上下班高峰时间等因素对城市交通状态影响显著,具有较高的相关性[15]。文献[16]研究了天气对于交通流参数的变化影响,发现在恶劣天气状态下城市道路平均车速下降了16%~40%。文献[17]分析了不同天气模式对芝加哥市交通速度的影响,表明降雨天气易导致保守驾驶行为 对道路的行驶速度有显著影响,且不同类型的道路受影响程度有所差异,城市空气质量与交通状态的变化也密切关联,城市大气污染物有40%~60%来自汽车尾气排放[18]。文献[19]的研究表明,交通模式的时空变化会导致空气污染物浓度时空变化,城市空气污染物含量的变化在一定程度上也反映了城市交通状态的变化。虽然采用深度学习方法预测交通流的形式多样,现有研究较多考虑单一变量的交通时序数据,结合多源特征数据融合的交通预测模型研究较少[1]。另外,实际的交通
融合多特征神经网络的城市道路速度预测研究
熊振华1,李恒凯1
(1. 江西理工大学土木与测绘工程学院,江西 赣州 341000)
摘要:交通速度预测是智能交通系统的重要组成部分,该文从交通路网时空分布特征入手,引入天气状态、空气质量和时间属性特征变量,建立了基于多源特征融合的双向长短期记忆网络框架(MF-BiLSTM)。以此模型为基础,对基于滴滴开源算法计算得到的成都市道路速度时序数据集进行建模分析,分别选取了RNN、ARIMA、CNN、多层LSTM和单层LSTM网络5个基准模型进行验证实验,结果表明 MF-BiLSTM在一个标准周内的各个时间段均优于基准模型,在不同道路等级下能表现出较高的稳定性,与上述基准模型相比预测精度分别提高了2.94%、1.02%、2.45%、1.10%和1.67%。同时 在不同天气状态和空气质量等级下,MF-BiLSTM均能表现出更加准确和平稳的预测性能。
0 引言
交通路网是交通运输的重要载体,推动着国民经济发展和城市化进程,同时随着居民收入水平的不断提高,机动车数量快速增长,造成交通拥堵问题日益严重,直接影响交通运行效率,对社会经济发展造成不利影响。建立智能交通系统(intelligent transportation system ITS)是缓解交通拥堵、缩短出行时间、提高道路通行效率的有效途径[1]。实时准确的交通流预测作为智能交通系统的重要组成部分,能动态掌握交通流发展变化趋势,是进行交通诱导、出行路线规划的前提和基础,对城市管理、交通调度、道路资源分配乃至经济发展都具有重要意义。
现有的交通预测模型主要分为两种类型:统计模型和机器学习算法。以自回归滑动平均模型(autoregressive integrated moving average model ARIMA)以及其变体算法为代表的经典统计模型早期被广泛应用于交通流预测[2-5]。然而 基于参数推断,统计模型通常具有较高的计算复杂度。同时也存在较大随机性和非线性因素,而传统的统计学方法在获取非线性关系和处理高维数据的能力有限,从而限制了预测模型的准确性和可靠性。
近年来 随着深度学习的兴起,基于深度学习的神经网络方法具有处理多维数据的能力、实现的灵活性、泛化能力和较强的预测能力等优点,被广泛用于优化交通流预测问题[8]。文献[9]提出一种基于深度神经网络(deep neural networks DNN)的交通流预测模型,分别利用卷积和递归神经网络挖掘交通流的周期性变化和时空变化特征。由于传统递归神经网络在处理较长时间序列交通流数据存在梯度爆炸和消失的问题,文献[10]首次引入LSTM模型并验证其用于交通流预测的有效性 并基于卷积神经网络(convolutional neural networks CNN)和长短期记忆网络(long short-term memory networks LSTM)网络构建了时空循环卷积网络预测交通流速度。文献[11]提出一种考虑网络拓扑结构的图卷积LSTM模型预测交通流量,针对不同类型数据集都能取得比传统方法更好的性能。由于传统LSTM网络记忆信息只能单向传播,因此有学者提出基于双向LSTM构建交通流预测模型,取得了比单向LSTM更好的预测效果[12-13]。文献[14]考虑了外部因素(天气和星期几),采用深度时空残差网络来预测城市人群流量分布,提高了模型预测精度。
在复杂的城市路网中,城市交通状态受多种因素的共同影响。其中 天气状态、空气质量、节假日活动、上下班高峰时间等因素对城市交通状态影响显著,具有较高的相关性[15]。文献[16]研究了天气对于交通流参数的变化影响,发现在恶劣天气状态下城市道路平均车速下降了16%~40%。文献[17]分析了不同天气模式对芝加哥市交通速度的影响,表明降雨天气易导致保守驾驶行为 对道路的行驶速度有显著影响,且不同类型的道路受影响程度有所差异,城市空气质量与交通状态的变化也密切关联,城市大气污染物有40%~60%来自汽车尾气排放[18]。文献[19]的研究表明,交通模式的时空变化会导致空气污染物浓度时空变化,城市空气污染物含量的变化在一定程度上也反映了城市交通状态的变化。虽然采用深度学习方法预测交通流的形式多样,现有研究较多考虑单一变量的交通时序数据,结合多源特征数据融合的交通预测模型研究较少[1]。另外,实际的交通路网时序数据集中,当前时段的交通速度不仅受前段时间影响,同时也影响后段时间的数据,单向的神经网络结构难以捕其前后关系。
为了弥补上述缺陷,综合考虑多个影响交通状态相关特征变量,建立基于多源特征融合的双向BiLSTM深度学习框架并加以改进,对城市道路速度时序数据集进行建模。在进行道路速度时序预测的同时,捕捉向前和向后时段各相关特征因子对预测模型的影响,有望更好地进行道路速度预测。
1 数据介绍与预处理1.1 研究区域
成都地处中国四川盆地西部、成都平原腹地,属亚热带季风性湿润气候,年平均降雨量945.6 mm,是国家重要的经济活动中心、商贸物流中心和综合交通枢纽。根据2018年度《中国主要城市道路网密度监测报告》,成都中心城区建成区路网密度为8.02 km/km2,在36个城市中排名第3位[20],密集的土地利用和快速的人口与经济增长导致了道路交通出行需求的快速增长。
1.2 气象数据
本研究的气象数据来自全球气象网站(www.wunderground.com)。从该网站批量获取2018年全年成都市气象站点记录的历史气象观测数据,包括每小时观测的气温、露点温度、湿度、气压、风速、风向及天气状态资料。其中 风向和天气状态属于离散特征,采用One-Hot编码表示,天气状态分为晴天、多云、小雨、中雨、大雨5种类型。
1.3空气污染数据
空气污染数据来源于国家生态环境部发布的全国城市空气质量实时发布平台,包含成都市8个空气监测站每小时汇总的二氧化硫、二氧化氮、一氧化碳、PM10、PM2.5、臭氧6项污染物浓度数据,以及由这 6项指标综合评价后得到空气质量指数(airquality index AQI)。为了更加准确地表现单个路段的实际空气污染物浓度,采用与该路段质心距离最短的空气监测站记录作为该路段实际空气质量数据。
1.4交通数据
本研究使用的道路行驶速度时序数据集来源于滴滴出行盖亚数据开放计划,该数据集包括2018年全年成都市辖区内1 697条道路完整的行驶速度记录。该数据集由滴滴开源算法,基于浮动车轨迹的城市交通指数计算服务得到,采样精度高,覆盖范围广[21],时间间隔重采样为1 h,并采用滑动平均法填补缺失记录,表1为其中一条道路数据样例。城市道路等级资料参考成都市公共数据开放平台,依据道路运行功能及设计标准[22],根据道路在城市道路系统中的地位、作用、交通功能以及对沿线建筑物的服务功能,将成都市道路划分为快速路、主干路、次支路3个等级。其中,次支路包含次干路和支路,其设计行车速度分别为60~100、40~60、20~40 km/h。
2 预测模型框架在本节中将详细介绍基于多特征融合的双向BiLSTM深度学习框架路网速度预测模型的构建过程,该模型在深度学习架构下融合多个影响交通状态的特征因素,并结合双向BiLSTM捕捉前后时间序列关系,以满足更精确的城市道路速度预测需求。
2.1 LSTM长短期记忆网络
早期传统的线性建模方法由于其计算复杂度低,通常不能捕捉实际交通场景下数据流之间复杂的非线性关系,因此,非线性方法因其较高的建模能力而被广泛应用。在非线性方法中,最早人工神经网络(artificialneural network ANN)用于交通流预测[23],但其网络结构简单,在对较长时序数据的处理和建模过程种存在局限性。为了缓解这一问题,引入了能够处理长期数据依赖的递归神经网络(recurrentneural network RNN)[24]。但是,随着预测时间步长增加,在误差反向传播过程中易出现梯度爆炸和消失的问题,难以捕捉长时间序列的数据特征,限制了RNN网络的预测效果。LSTM[25]在传统RNN网络上改进,其控制信息流存储和更新的门控机制,能有效克服梯度爆炸和消失问题[26],在处理长序列时间依赖任务中表现要优于RNN,可对存在长期和短期依赖的交通流时序数据进行更加精确的建模。图1展示了LSTM网络结构,其中 、、为控制信息输入、遗忘和输出的3个特殊的门控机制,是该网络关键部分。能有效对更长时序数据特征进行识别和记忆,从而允许有用的信息在LSTM网络中传递,可处理较复杂的时间序列问题。
2.2 BiLSTM双向长短期记忆网络
双向联通的BiLSTM网络是由两个上下反向叠加的单向LSTM连接组成,模型输入包含预测时间之前和之后的时间序列,因此能够同时处理正向和反向的时间序列数据。LSTM对时间序列的预测只与前向时间段的信息相关,而在实际的交通路网时序数据集中,对一时段的交通数据预测不仅受到前时段的影响,后时段的变化也同样能够影响当前时段的数据。BiLSTM同时捕获向前和向后时段的数据变化特征,并进行学习训练,可使预测结果更加准确。其网络结构如图2所示,输出层由前向和后向网络共同决定。
2.3多特征输入的BiLSTM道路速度预测模型
本文构建了基于多特征输入的双向长短期记忆网络(muti-feature bidirectional long short-term memory network MF-BiLSTM)网络的城市道路速度预测模型,模型结构见图3。
为了综合考虑相关特征变量对交通速度的影响,将影响城市交通状态的特征变量输入预测模型。其中 空气质量变量包括监测站逐小时记录的CO2、NO2、CO、PM10、PM2.5和O3这6项污染物浓度;气象要素特征包括气象站逐小时记录的实时气温、湿度、气压、风速、风向及天气状态语义;时间属性为该时间点的小时数(表示一天24 h内的第几个小时)、星期数(表示一周内的星期几,如编码“1”代表星期一);是否为工作日(编码“1”表示是工作日,编码“0”表示非工作日)。采用滑动求平均法填补序列中少量缺失的数据,并对数据进行预处理。由于输入模型的各类特征值变化范围存在差异,采用最小最大标准化(min-max standardization)公式将输入的特征值映射到[0 1]。将序列数据按照时间前后进行排列重构,构建特征矩阵,见式(10)。
2.4 评价指标
为了更好地评价模型预测效果,本文分别引入3种误差评价指标:平均绝对误差(mean absolute error MAE)、均方根误差(root mean square error RMSE)和平均绝对百分比误差(mean absolute percentage error MAPE)。这3种指标的计算过程见式(11)~式(13)。
3 结果分析3.1城市道路行驶速度的时空分布
城市道路网络错综复杂,道路行驶速度的变化与城市居民通勤活动紧密关联,表现出一定的时空分布规律,挖掘与分析其规律是进行有效预测的前提。图4(a)为成都市四环范围主道路在白天(6:00―22:00)平均行驶速度的空间分布情况。由图4可知,越靠近城市中心道路行驶速度越小,一环内为城市核心功能区,车流量密集,行驶速度在25 km/h之内;一环至二环行驶速度在整体25~30 km/h;二环至三环道路行驶速度在30~40 km/h;三环至四环处于城市郊区且道路较宽,车流稀疏,行驶速度普遍在40~60 km/h。低行驶速度的道路趋近于旅游景区和大型商业中心,成都市路网中行驶速度最低的两条道路位于宽窄巷子景区门口的下铜仁路和春熙路商业街附近的南纱帽路,速度分别为12.3 、13.1 km/h。
图4(b)展示了在一个标准周中,不同等级道路行驶速度在一天各小时的变化情况,可以看出工作日和周末的道路行驶速度呈现不同的模式。工作日期间一天内具有两个比较明显的低谷,一个在早高峰(7:00—9:00) 一个在晚高峰且持续时间较长(17:00—19:00)。在周末,道路行驶速度在上午没有明显的高峰,在17:00时以后的行驶速度变化情况与工作日变化趋势基本一致。这说明在周末市民在上午出行较少,交通较工作日相比更加通畅,行驶速度也更高;在周末傍晚市民出行需求增多,道路行驶速度在晚高峰时段呈现最低谷。同时随着道路等级的降低,行驶速度的变化范围相对稳定。
3.2模型结构与训练过程
为了满足城区范围不同等级道路行驶速度预测需求,按照成都市路网等级划分标准,在城市四环内选取快速路、主干路、次支路30条,共90条道路分别构建MF-BiLSTM模型进行实验。时间范围为2018年1月5日至12月21日,50个标准周,共350 d的道路交通数据。其中,道路平均行驶速度以1 h为时间间隔,总共756 000个时刻数据。训练集∶测试集=6∶4,预测目标为该路段未来一个时间段的道路平均速度。MF-BiLSTM模型结构需要根据数据情况进行参数寻优,实现MF-BiLSTM时应该考虑两个关键因素:①MF-BiLSTM模型深度;②单个BiLSTM模型超参数。
根据前人的研究,增加隐藏层可以逐步建立更高级别的时序数据表示,从而帮助解决更复杂的问题,产生更精确的结果[27]。在多层堆叠的BiLSTM体系结构中,具有多个隐藏的BiLSTM层,每个层包含多个LSTM单元,隐藏层的输出将作为新的输入至后续的隐藏层中。本文所提出的MF-BiLSTM网络结构中也采用这种可以提高神经网络预测性能的层叠机制,但是堆叠隐含层深度不宜太大,否则网络复杂度太高会影响模型收敛。图5显示了不同深度下训练数据和验证数据下模型的MSE变化,采用4层堆叠的深度学习模型性能表现最佳。
超参数的选择依赖于专家经验,没有一般的规则可以直接适用。基于一些前人研究的模型参数设置[28-29],最终确定模型输入时间步长为24,网络层数为4,Batch size设置为24,模型优化器选用Adam算法,使用Dropout方法随机失活20%神经元,激活函数为Tanh,损失函数为MSE,训练迭代次数设置为50次。最终的MF-BiLSTM预测模型详细层次结构如图6所示。
3.3模型预测结果对比
为了更好地解释模型预测性能,图7展示了在不同道路等级下,各个模型的预测结果在一个标准周内的分布情况。在每个子图中,上半图是各个模型道路速度预测值和真实值的对比,下半图展示了各个模型误差随时间的分布。结果表明,在不同交通条件下,不同模型的误差表现有所差异。
与其他基准模型相比,MF-BiLSTM在各道路等级上误差最低,预测值与真实值拟合程度最高且稳定性最好,而CNN与RNN模型在多数时间段误差更大,表现出较差的预测性能。与工作日相比,周末误差波动范围较小,一天中的早晚高峰时段模型误差较大。
MF-BiLSTM在不同道路等级下的性能表现有所差异,快速路由于其车速普遍较高,误差在__—3~6 km/h;主干路和次支路误差范围分别在—2~4 km/h和—2~2 km/h。其中 快速路在周一早高峰道路行驶速度最低且平均误差表现较大,CNN预测误差最高超过了9 km/h,这表明在周一上午的城市快速路上有大部分居民从郊区返回城市工作区,导致道路拥堵加重,路况也更加复杂,对模型预测能力产生影响。同时,各模型在周五晚高峰18:00时左右各模型误差一致表现最大,在结束了一周的工作,大部分居民选择周五下班后出行,导致道路通行压力增大,交通状态变化更明显。在城市快速路上,MF-BiLSTM预测误差波动相对较大,随着道路等级降低,误差波动接近平稳。
图8的误差箱线图展示了各个模型误差分布情况,结合了多源特征输入的MF-BiLSTM预测误差的极值、中位数和误差分布范围更小,与其他基线模型相比表现出更好的预测性能。RNN和CNN由于缺乏遗忘机制,在处理较长时间序列数据时存在一定的局限性;ARIMA结构相对简单,对数据质量要求高,实验发现不同道路的模型参数(p d q)差异较大,难以满足整个城市范围路网速度预测需求;LSTM整体预测效果较好,也证明基于多层堆叠LSTM模型的预测性能有一定的提升。
表2为各模型预测性能对比,MF-BiLSTM与RNN、ARIMA、CNN、多层LSTM、单层LSTM的MAPE相比,预测精度分别提高了2.94%、1.02%、2.45%、1.10%和1.67%,表现出最佳的预测性能。
3.3模型误差分布
由3.1节道路行驶速度时空分布可知,不同等级道路行驶速度呈现不同的模式。为了进一步比较MF-BiLSTM模型的误差分布规律,表3比较了不同道路等级下,预测模型在交通早高峰(7:00―9:00)、晚高峰(17:00―19:00)和非高峰时段的性能差异。通常情况下,在高峰时段模型误差整体要高于非高峰时段误差。一天中模型误差最大的时间集中在晚高峰,且早高峰的模型误差要低于晚高峰。这表明早高峰交通主要服务于人们的通勤需求,表现出更加规律的变化;而晚高峰期间人们出行除了通勤需求外,还涉及各种其他类型的出行目的,如饮食、购物、娱乐、社交等。晚高峰持续时间更长且交通状态变化更快,为预测模型精准捕捉其变化规律带来挑战。
城市交通状态变化对天气状态、空气质量变化非常敏感,通常情况下恶劣天气和较差的空气质量都会降低人们出行需求,从而影响交通流速的变化。为了分析气象因子和空气质量变化对MF-BiLSTM模型预测精度的影响,分别按照天气状态和空气质量等级对测试集进行划分。其中 天气状态分为晴天、多云、小雨、中雨、大雨,空气质量等级依据AQI指数分为优、良、轻度污染、中度污染和重度污染(实际样本数据无严重污染等级),并对预测结果分别计算MAPE。
图9(a)展示了不同天气状态下各个预测模型的误差变化。整体来看,降雨天气在一定程度上会增大模型预测误差,其影响程度也随降雨量的增加而增加,大雨天气对模型影响程度最大,在晴天和多云天气下模型预测误差相对较低。这说明在降雨天气下道路行车速度变化更加复杂,预测模型更难捕捉其变化规律。但在不同天气状态下,MF-BiLSTM模型预测精度均优于其他基准模型。
图9(b)可知,空气质量对模型预测精度存在一定程度影响,在空气污染较低时,模型误差表现相对稳定。当出现中度或重度以上污染时,模型预测误差明显上升。综上所述,天气状态和空气质量对城市道路运行状态产生显著影响,也改变着人们的出行模式,在不同环境特征下模型预测精度也有所差异。而MF-BiLSTM模型在不同天气状态和空气质量等级下,预测性能相对稳定且精度最高,可适用于不同环境特征下道路通行速度的预测。
4 结束语本文分析了成都市路网交通运行速度的时空分布规律,在空间上,越靠近城市中心道路行驶速度越小,低行驶速度的道路趋近于旅游景区和大型商业中心周边;在时间上,由于通勤需求不同,工作日和周末交通速度的变化模式存在差异,在周末早高峰不明显,晚高峰持续时间更长;在不同道路等级下,呈现出道路等级越高,行驶速度的变化越不稳定的规律。
本文在TensorFlow深度学习框架下,提出了基于多特征数据融合的双向MF-BiLSTM交通速度预测模型。选取了RNN、ARIMA、CNN、多层LSTM和单层LSTM网络5个基准模型进行验证,预测精度分别提高了2.94%、1.02%、2.45%、1.10%和1.67%,结合多源特征数据输入和双向网络结构在一定程度上提高了模型预测性能。
选取基准模型在各等级道路下分别进行验证实验,MF-BiLSTM的预测精度在一个标准周内的预测能力优于基准模型。与工作日相比,在周末模型表现出更好的预测精度,且在不同等级道路下均表现出更高的稳定性。进一步分析模型误差分布,MF-BiLSTM在交通高峰时段误通常高估真实值,在夜间或者非高峰时段往往低估真实值。MF-BiLSTM在高峰时段的MAE、RMSE和MAPE值高于非高峰时段,且当流量状态发生明显变化时,模型性能受到影响。
在不同天气状态和空气质量等级下验证模型性能,结果表明,恶劣的天气和严重的空气污染会影响模型预测效果,但MF-BiLSTM在各种环境状态下均能表现出更加准确和平稳的预测性能,可适用于不同场景下的交通速度预测。
(致谢:感谢来自滴滴出行“盖亚”数据开放计划,英文(Datasource: Didi Chuxing GAIA Initiative)的数据支持)
作者简介:熊振华(1996—),男,江西南昌人,硕士研究生,主要研究方向为地理大数据分析与人工智能。E-mail:xiongzh0112@qq.com
基金项目:中国教育部人文社科研究项目规划基金项目(18YJAZH040);中国教育部产学研协同育人项目(201901011002);中国江西省教育厅科学技术研究重点项目(GJJ180423)
通信作者:李恒凯副教授 E-mail: giskai@126.com