鐵路列車(chē)在其運(yùn)行的全過(guò)程中,不可避免地受到來(lái)自鐵路系統(tǒng)內(nèi)部與外部的一些擾動(dòng),這些擾動(dòng)可能源于設(shè)備故障、交通事故、極端天氣等,也可能源于非預(yù)期車(chē)流或考慮不周的調(diào)度指揮。擾動(dòng)對(duì)列車(chē)運(yùn)行造成的影響是一個(gè)不斷累積的過(guò)程,鋪畫(huà)合理的運(yùn)行圖是在一些區(qū)間、站點(diǎn)設(shè)有一定的冗余時(shí)間,以吸收和緩解擾動(dòng)對(duì)列車(chē)運(yùn)行造成的影響。而無(wú)法通過(guò)冗余時(shí)間吸收的擾動(dòng)將持續(xù)累加,最終導(dǎo)致列車(chē)無(wú)法按圖準(zhǔn)時(shí)行車(chē),因此,列車(chē)晚點(diǎn)現(xiàn)象產(chǎn)生。
列車(chē)在發(fā)生晚點(diǎn)后繼續(xù)行駛,部分晚點(diǎn)現(xiàn)象可以通過(guò)區(qū)間趕點(diǎn)、壓縮停站時(shí)間等方式得到改善甚至是消除;另一些沒(méi)能得到緩解的晚點(diǎn)可能會(huì)一直持續(xù),甚至因后續(xù)的擾動(dòng)影響而進(jìn)一步惡化;還有一些晚點(diǎn)是在列車(chē)之間的相互影響作用下于路網(wǎng)中傳播。
晚點(diǎn)演化就是在列車(chē)運(yùn)行過(guò)程中,晚點(diǎn)產(chǎn)生、傳播、持續(xù)、惡化、恢復(fù)的全過(guò)程。高速鐵路列車(chē)具有旅速高、開(kāi)行頻次多、開(kāi)行密度大的特點(diǎn),這意味著晚點(diǎn)一旦發(fā)生,就會(huì)產(chǎn)生復(fù)雜而劇烈的演化,故傳統(tǒng)的理論方法難以對(duì)其進(jìn)行有效的研究。
既有的高速鐵路列車(chē)晚點(diǎn)研究主要圍繞晚點(diǎn)分布、晚點(diǎn)仿真生成、晚點(diǎn)傳播鏈構(gòu)建、晚點(diǎn)恢復(fù)等方面展開(kāi)。
受北方降雨影響全國(guó)高鐵大部分晚點(diǎn)
在晚點(diǎn)分布方面,劉巖等分析了列車(chē)實(shí)際區(qū)間運(yùn)行時(shí)分、列車(chē)區(qū)間運(yùn)行時(shí)分、停站時(shí)分與列車(chē)晚點(diǎn)之間的關(guān)系。Briggs等基于英國(guó)鐵路列車(chē)運(yùn)行數(shù)據(jù)進(jìn)行了晚點(diǎn)分布的統(tǒng)計(jì),建立了全部晚點(diǎn)的q指數(shù)分布模型。劉健等以京滬高速鐵路實(shí)績(jī)數(shù)據(jù)為基礎(chǔ)進(jìn)行列車(chē)運(yùn)行仿真,得到了突發(fā)事件的發(fā)生概率。Yuan等構(gòu)建了列車(chē)晚點(diǎn)傳播模型,通過(guò)理論推導(dǎo)預(yù)測(cè)列車(chē)在車(chē)站的到達(dá)時(shí)間分布。Xu等基于列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),繪制了高速列車(chē)晚點(diǎn)的分布曲線,但其研究并未建立起致因—初始晚點(diǎn)時(shí)長(zhǎng)的相關(guān)模型。莊河等基于廣鐵集團(tuán)高速列車(chē)運(yùn)行實(shí)績(jī),研究不同致因情況下初始晚點(diǎn)時(shí)長(zhǎng)的分布模型。
有關(guān)晚點(diǎn)傳播過(guò)程、列車(chē)延誤模型、列車(chē)晚點(diǎn)恢復(fù)方面的研究尚且沒(méi)有一套完整的理論體系,孟令云等提出一種基于列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)挖掘的列車(chē)晚點(diǎn)傳播過(guò)程構(gòu)建方法。姜雯、李曉娟等將高速鐵路列車(chē)運(yùn)行過(guò)程作為離散事件系統(tǒng),并采用極大代數(shù)的方法建立列車(chē)延誤仿真模型。黃平等提出基于列車(chē)運(yùn)行實(shí)績(jī)的列車(chē)晚點(diǎn)恢復(fù)模型,分析高速列車(chē)初始晚點(diǎn)恢復(fù)的影響因素,建立了初始晚點(diǎn)恢復(fù)的隨機(jī)森林模型。
從已有研究分析來(lái)看,基于列車(chē)運(yùn)行實(shí)績(jī)進(jìn)行高速鐵路晚點(diǎn)演化相關(guān)問(wèn)題的研究尚不成熟,雖然這些研究均指出基于高速鐵路列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)對(duì)于運(yùn)輸組織優(yōu)化問(wèn)題具有重要的作用,但少有對(duì)晚點(diǎn)演化過(guò)程全面整體的認(rèn)知,關(guān)于高速鐵路晚點(diǎn)演化預(yù)測(cè)、規(guī)律的研究暫時(shí)處于起步階段。
近幾十年來(lái),隨著計(jì)算機(jī)性能飛躍般地提升,人類(lèi)收集、存儲(chǔ)、傳輸、處理數(shù)據(jù)的能力也取得了里程碑式的突破,對(duì)數(shù)據(jù)進(jìn)行深層挖掘、分析利用的機(jī)器學(xué)習(xí)算法也受到了前所未有的廣泛關(guān)注與應(yīng)用。機(jī)器學(xué)習(xí)算法通過(guò)對(duì)大數(shù)據(jù)進(jìn)行預(yù)處理、降維、特征提取與關(guān)聯(lián),可以揭示深藏于數(shù)據(jù)之中的機(jī)理與規(guī)律,從而完成對(duì)現(xiàn)實(shí)具體問(wèn)題的指導(dǎo)。
隨著鐵路信息化發(fā)展,列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)的收集工作日益完善。高速鐵路有著更加先進(jìn)、健全的信息管理系統(tǒng),列車(chē)運(yùn)行信息的收集也更加精細(xì)化與標(biāo)準(zhǔn)化。龐大的列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)成為了分析列車(chē)運(yùn)行狀況、線路基礎(chǔ)設(shè)施運(yùn)用狀況的寶貴資源,高鐵列車(chē)晚點(diǎn)演化的過(guò)程及其深層次的演化機(jī)理也蘊(yùn)藏其中。
為此,本文嘗試構(gòu)建基于機(jī)器學(xué)習(xí)的晚點(diǎn)演化預(yù)測(cè)模型,通過(guò)對(duì)高鐵列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)的特征提取與處理,結(jié)合表現(xiàn)效果好的支持向量機(jī)算法,達(dá)到對(duì)晚點(diǎn)演化進(jìn)行預(yù)測(cè)的目標(biāo)。
本文借助機(jī)器學(xué)習(xí)的理論與方法,對(duì)京滬高鐵列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)進(jìn)行了樣本提取、特征標(biāo)準(zhǔn)化、過(guò)采樣、晚點(diǎn)標(biāo)簽離散化等處理;結(jié)合晚點(diǎn)分類(lèi)構(gòu)建了混淆矩陣,并給出一些評(píng)價(jià)指標(biāo);建立了基于支持向量機(jī)的單車(chē)次列車(chē)晚點(diǎn)預(yù)測(cè)模型和區(qū)間全車(chē)次列車(chē)晚點(diǎn)預(yù)測(cè)模型并編程實(shí)現(xiàn)。通過(guò)構(gòu)造評(píng)價(jià)指標(biāo)評(píng)估了模型的有效性,結(jié)果表明,模型對(duì)高鐵列車(chē)的晚點(diǎn)范圍有理想的預(yù)測(cè)結(jié)果。
本文是機(jī)器學(xué)習(xí)理論遷移至高速鐵路列車(chē)晚點(diǎn)研究領(lǐng)域的一次嘗試,實(shí)例證明了機(jī)器學(xué)習(xí)方法具有一定的可行性。