摘要:從數據可看出,新交規發布及實施對于闖紅燈違法行為有很明顯的影響,我們可以通過建立相關數據模型來評估和預測影響的大小,從而對以后交通管理科學決策提供數據依據和技術支撐,具有顯著的現實意義。
文/裘晨璐 許卉瑩 邵志驊 唐禮虎
闖紅燈是比較嚴重的違法行為,不僅影響了正常的交通秩序,同時也將自己和別人的生命財產安全置于危險之中,帶來的后果是交通事故的增加,甚至是死亡人數的增加。據統計,因闖紅燈而發生的事故占事故總數的2.5%。公安部在012年10月8日發布了《機動車駕駛證申領和使用規定》(公安部第123號令,以下簡稱新交規),并于2013年1月1日起正式執行。其中進一步加大對嚴重危害交通安全的違法行為的懲處力度,新交規大大加強了包括機動車闖紅燈在內的違規行為的處罰力度,如闖紅燈交通違法記分將由3分提高到6分,提高了違法成本,從而提高廣大交通參與者對闖紅燈危害性的認識。新交規發布及實施以來,機動車闖紅燈數量下降明顯。以黑龍江省為例,2012年11月至2013年2月機動車闖紅燈數量分別為24434,19175,7004,6638起,同比分別下降21.8%,21.5%,63.5%,5.2%。從數據可看出,新交規發布及實施對于闖紅燈違法行為有很明顯的影響,我們可以通過建立相關數據模型來評估和預測影響的大小,從而對以后交通管理科學決策提供數據依據和技術支撐,具有顯著的現實意義。
一、闖紅燈違法數據分析及建模考慮
我們對黑龍江省2007年1月至2013年9月的闖紅燈違法行為數量進行了分析。如圖1所示,闖紅燈違法行為數量序列記為{Xt},下標t代表時間。新交規的發布時間(T1=2012年10月)和正式實施時間(T2=2013年1月)分別用藍色點線和紅色虛線標出。觀察可見:在T1前,闖紅燈數量呈明顯上升趨勢;自T1后,受政策干預的影響,闖紅燈違法數量呈大幅下降趨勢;在T2點,數據在較大幅度下降后開始恢復上升趨勢。
不同于回歸分析模型,時間序列模型尋找序列相關關系的統計規律,并尋求適當的數學模型來描述這種規律。類似于短時交通量預測,闖紅燈違法數據也可以通過時間序列模型來進行分析。時間序列經常會受到特殊事件的影響,這類外部事件稱為干預。由Box和Tiao提出的干預分析模型是對受政策干預(或其他突發事件)影響的時間序列建模的有效方法。干預模型的基本思想為:首先利用干預影響之前的數據,建立時間序列模型;然后利用此模型進行外推預測,作為假設不受干預影響情況下的預測值,將受干預影響的實際值減去該預測值,利用這些結果識別干預效應的形式;最后估計出一個總的干預分析時間序列模型,從而來評估政策干預對闖紅燈違法數據的具體影響。

圖1 黑龍江省闖紅燈違法行為數量序列
從圖1可以看出,可以選定T1=2012年10月為干預時刻來進行分析。首先對T1前數據建立時間序列模型,分析在沒有政策干預的情況下黑龍江省機動車闖紅燈違法數量的發展趨勢;然后再對政策干預后的數據建立干預分析模型,研究新交規的政策干預對黑龍江省機動車闖紅燈違法行為發展動態的影響。
二、時間序列模型建模過程描述
機動車闖紅燈違法行為數據存在明顯趨勢,屬于非平穩時間序列。對非平穩時間序列,一般先對其做平穩化處理,然后再對處理后序列建立ARMA模型,之后轉變該模型使之適應于平穩化處理前的序列,轉化后的模型稱為差分整合自回歸滑動平均(ARIMA)模型。時間序列的建??煞譃橐韵聨讉€步驟:數據預處理、模型識別、參數估計、模型檢驗和模型應用。具體到黑龍江省闖紅燈違法數量序列,建模流程如下:
1、數據預處理
數據預處理就是在建模之前先對原始數據做平穩化處理、白噪聲檢驗和離群值檢驗,使得處理后數據滿足ARMA模型的假設,為建模做好準備工作。
首先對序列做平穩化處理。對{Xt}進行一階差分運算后得到一個新序列{Yt},Yt=∇Xt=Xt-Xt-1,序列{Yt}代表每月的環比變化量。新序列{Yt}始終圍繞在一個常數值附近隨機波動,而且波動無明顯趨勢及無周期特征。我們認為新序列{Yt}是平穩的。
在建模之前,還需檢驗序列是否為白噪聲序列。采用Ljung–Box檢驗法對新序列{Yt}做隨機性檢驗,檢驗的結果為顯著性概率p=0.018<0.025。這說明,{Yt}為純隨機性序列的可能性小于5%,即月環比變化序列{Yt}是有規律可循的,可以對其建立ARMA模型。
在數據的采集過程中,不可避免會產生離群值。在建模前,還需對序列做離群值檢驗。應用t檢驗法的基本思想,考察單個樣本和樣本均值的偏離程度,若樣本值與樣本均值之間的距離大于2倍標準差,則認為該樣本為離群值。經檢測,每月的環比變化量序列{Yt}在2009年10月,2010年2月、11月、12月,2012年9月共5個時間點存在離群值。在后續建模中,我們將這些離群值信息納入到模型中。
2、模型識別
模型識別,就是對給定的時間序列選取適當的模型階數p,d,q。在前面預處理過程中,通過一階差分,將非平穩序列{Xt}轉換為平穩序列{Yt},差分階數d=1。對于平穩序列,識別p,q的主要根據是序列的自相關函數和偏自相關函數的特征。若序列的偏自相關函數在滯后p階以后截尾,而且它的自相關函數拖尾,則可判斷此序列是ARMA(p,0)序列。若序列的自相關函數在滯后q階以后截尾,而且它的偏自相關函數拖尾,則可判斷此序列是ARMA(0,q)序列。若序列的自相關函數、偏相關函數都呈現拖尾形態,則此序列是ARMA序列。我們根據序列{Yt}的樣本自相關函數和偏相關函數,初步選定模型的階數為p=1,q=1。
3、參數估計
在選定模型階數p,d,q之后,對已識別模型中的若干參數的估計計算,稱為參數估計。對于待選模型ARMA(1,1),模型參數的估計結果為:
(Yt-377248)=-0.020.54(Yt-1-377248)+?t-0.170.52?t-1)-4301Pt2009.10+5746Pt2010.2-746Pt2010.11+7456Pt2010.12+3458Pt2012.8
上式中,模型參數的下標為該參數的標準差,Pt代表單位沖擊函數,-4301Pt2009.10+5746Pt2010.2-
746Pt2010.11+7456Pt2010.12+3458Pt2012.8代表離群點修正。
在上述ARMA(1,1)模型中,一階自回歸參數?1的估計值僅為-0.02,遠小于標準差0.54。該系數估計不顯著,故而我們將模型修正為ARMA(0,1)。重新估計模型參數,轉換模型使之適應于原始序列,得到序列{Xt}的ARIMA(0,1,1)模型,其數學表達式如下:
X t = X t - 1 + 3 7 8 2 4 8 + ? t- 0 . 1 6 0 . 1 2 ? t - 1-4311Pt2009.10+
5734Pt2010.2-780Pt2010.11+7449Pt2010.12+3472Pt2012.9
4、模型診斷
令

代表模型對觀測值X
t的估計值,e
t=X
t-

為擬合殘差。模型的顯著性檢驗即檢驗殘差序列是否為白噪聲序列。一個好的擬合模型應該能夠提取觀察值序列中幾乎所有的樣本相關信息,即殘差序列應該為白噪聲序列。反之,如果殘差序列為非白噪聲序列,那就意味著殘差序列中還殘留著相關信息未被提取,這就說明擬合模型不夠有效。采用Ljung–Box檢驗法對殘差序列et做白噪聲檢驗,檢驗得顯著性概率值為p=0.9973。這說明,序列{e
t}為白噪聲序列得可能性大于99%,模型通過模型顯著性檢驗。
5、模型解釋與預測
根據模型來看,在政策干預之前:違法數據呈上升趨勢,每月增長約378起,略有波動;月增長130起以上的概率大于68%。我們利用ARIMA模型進行外推,預測2012年10月至2013年9月的闖紅燈違法數據,預測結果如圖2所示。其中,紅色虛線和和藍色點線分別畫出了預測值的95%和80%置信區間。置信區間展現的是真實值有一定概率落在預測值結果周圍的程度。模型預測2013年1月的闖紅燈數量落在22498至41311區間內的概率大于95%,落在27414至38395區間內的概率大于95%。

圖2 ARIMA模型預測
三、新交規對闖紅燈違法行為的干預影響分析
根據前述的ARIMA時間序列模型預測,黑龍江省2012年10月之前的闖紅燈違法數量將持續呈上升趨勢。但我們將模型的預測結果與真實數據進行了對比,該省闖紅燈違法數量自2012年11月以來呈現下降趨勢,并且持續位于預測值95%置信區間以外,即可能性小于5%的小概率的事件持續發生了。因此可以看出,新交規政策的干預對該省闖紅燈違法數量的趨勢產生了顯著的影響。這種影響可以通過建立干預分析模型來進行分析。具體到黑龍江省的闖紅燈違法行為數據來進行干預分析建模,其基本流程如下:
1、模型解釋與預測
干預分析模型可以表示為:
(1-Σpi=1?iBi)(∇dXt-μ)=(1+Σpi=1θiBi)?t+Zt
其中,Z
t代表干預效應項,它是干預變量的函數。假設T為干預時間。干預變量有兩種基本的形式:一種是持續性的干預變量,可以用階躍函數
4TRN(TK5DIB9_UOQRA$PU.jpg)
4TRN(TK5DIB9_UOQRA$PU.jpg)

;第二種是短暫性的干預變量,用單位脈沖函數

。干預效應按其影響的形式,歸納起來有四種類型,如圖3。

圖3 干預效應基本形式
a)

,表示干預的影響突然開始并長期持續。
b)

,表示干預的影響突然開始,但只在該時刻或者某段時間內有影響。
c)

,表示干預的影響逐漸開始,其全部影響要經歷較長時期方能充分體現。
d)

,表示干預的影響突然開始,但是該影響以幾何形式減弱以至最終消失。
在實際問題中,需要將以上基本形式結合起來,對干預效應建模。
2、建模過程描述
利用已建立的時間序列模型進行外推預測,得到干預效應的影響結果如圖4所示。
圖4干預效應影響圖
圖5干預模型擬合
觀察圖4,干預效應的影響模式與圖3中的模式(a)或者模式(c)較為類似。根據參數估計的結果不斷調整模型階數,我們最終將干預模型選定為:


模型的擬合結果如圖5所示。

圖5 干預模型擬合
3、模型診斷
我們采用Ljung–Box檢驗法對上述模型的殘差序列{et}做模型顯著性檢驗,檢驗的結果表明序列{et}為白噪聲序列的可能性大于99%,模型通過顯著性檢驗。
我們通過模型可決系數R
2來評價模型的擬合效果。該指標介于0和1之間,越接近于1,則模型擬合優度越好。令X
i代表觀測數據,上升趨勢


代表觀測數據均值,X.i代表擬合數據,那么
4、政策影響評估
根據時間序列干預分析模型可以預測得出:如果沒有政策的干預,黑龍江省機動車闖紅燈數量將持續呈平穩線性上升趨勢,每月增長約378起。從2012年10月后受新交規政策干預的影響,該指標不僅沒有持續之前增長的趨勢,反而大幅下降。通過模型計算得出:政策干預影響使得該指標值分別在2012年11、12月和2013年1月分別下降了7385、5706和12692起,政策干預影響非常顯著。
四、結論
通過建立干預分析模型,我們對黑龍江省的闖紅燈違法數據進行了分析,新交規發布的干預效用明顯。該模型的擬合優度較好,并且通過顯著性檢驗。這說明干預模型是定量分析政策對交通管理違法行為影響的有效手段之一,將廣泛應用于交通管理決策效果評估,為科學管理提供技術支撐。
?。ㄗ髡邌挝唬汗膊拷煌ü芾砜茖W研究所)