22 Aralık 2016 Perşembe

ZAMAN SERİLERİ BİLEŞENLERİ

1-TREND;

Bir zaman serisinin belli bir dönem boyunca yukarı ve aşağı hareketine trend adı verilmektedir.

2-MEVSİMSEL DALGALANMA;

Serinin her yıl içinde belirli dönemlerde bir artışa yada azalışa sahip olmasıdır. İki aynı veri ol

3-KONJENKTÜREL DALGALANMALAR;

2 İle 10 Yıllık aralıklarla sistematik bir biçimde değişen dalgalanmalara denir.

4-DÜZENSİZ HAREKETLER;

Serinin hareketi belirli bir yapıya uymuyor ise ve hiçbir şekilde modellenemiyor ise bu tür hareketlere düzensiz hareketler denir.Bu serilerin geleceği tahmin edilemez.

20 Aralık 2016 Salı

 ARİMA (OTOREGRESİF HAREKETLİ ORTALAMA)

ARİMA Modelleri Varsayımları;

ARİMA modellerinde bir zaman serisi geçmiş değerlerinin ve rassal şokların doğrusal bir
fonksiyonudur. Yani; k>0 olmak şartıyla Yt = f (Yt-k, et-k)+et’dir. ARIMA modellerinde,
modelin belirlenmesinden önce önsel olarak bir öngörü modeline sahip değiliz. ARIMA
zaman serisine uyan doğru modelin belirlenmesinde yardımcı olacaktır. Aşağıdaki akış
şemasında durum özetlenmiştir.












ARIMA Notasyonu:





ARIMA Modeli Kurma Adımları;

  • Modelin Belirlenmesi: Grafiklerin, ACF ve PACF istatistikleri değerlerinin, dönüşümlerin v.b. kullanılmasıyla durağanlığın elde edilmesi ve geçici olarak model bileşenlerinin ve örüntünün belirlenmesi aşaması.
  •  Tahmin:  En  küçük  kareler  veya  en  çok  benzerlik  yöntemlerinin  kullanılmasıyla katsayıların tahmin edilmesi aşaması.
  •    Teşhis: Grafiklerin, çeşitli istatistiklerin, kalıntıların ACF değerlerinin incelenerek  modelin  geçerliliğinin  araştırılması  aşaması.  Eğer  model  geçerliyse,  modele  karar verilir; aksi takdirde modelin belirlenmesi, tahmin ve teşhis tekrarlanır.
  •   Öngörü:  Modelin  öngörülerin  performansının  belirlenmesi  için  grafikler,  güven aralıkları ve ve bazı basit istatistikler kullanılır.




ARIMA Süreci;
1.          Otoregresif Süreç:  Birinci mertebeden otoregresif süreç ARIMA (1,0,0) yada kısaca AR(1) aşağıdaki şekilde tanımlanır.



Eğer Φ = 1 ise, ARIMA (0,1,0)’dir, yani durağan değildir. Eğer Φ > 1 ise,  Yt-k   ve et-k geçmiş değerleri Yt üzerinde gittikçe artan etkiye sahip olurlar. Bu durum, ele alınan serinin artan bir ortalamaya sahip durağan olmayan bir seri olduğunu gösterir. Bu durumda serinin durağan olan ilk farklarının kullanılması gerekir.

p. mertebeden Otoregresif Süreç: ARIMA (p, 0,0):
 Yt =θ + Φ1Yt-1+ Φ2Yt-2 +…+ ΦpYt-p + et

Veya sabit parametresiz model

Yt 1Yt-1 + Φ2Yt-2 +…+ ΦpYt-p + et

2.   Hareketli Ortalama Süreci:

Birinci mertebeden hareketli ortalama süreci ARIMA (0,0,1) aşağıdaki gibi tanımlanır:

Yt = a + et + θet-1          veya                 Yt = et + θet-1

Tersinirlik kısıtı: |θ| < 1. Eğer bu kısıt sağlanmazsa, model durağan değildir.

Hareketli Ortalama Süreci: ARIMA (0,0,q)
Yt = et + θ1et-1 + θ2et-2 + …+ θqet-q

ARIMA(0,0,q) modelinin en önemli özelliği et-1’den et-q’ya kadar olan değişkenlerin gözlemlenememesidir. Bu nedenle; elimizdeki örneklem verilerinden tahmin edilmeleri gerekmektedir. Uygulamada, q için genellikle 1 veya 2 gibi küçük değerler atanır.

1.          Bütünleşik Süreçler: ARIMA (0,1,0)

l   Rassal Yürüyüş Süreci: ARIMA (0,1,0):

Yt = Yt-1 +et             è Yt  Yt-1 = et            è DYt = et

Tüm gelecek değerlerin son dönem gerçek değerine eşit olması beklenir.

l   Deterministik Trend Süreci: ARIMA (0,1,0)

Yt = Yt-1 + T + et  è   DYt = T + et                        T trendi göstermektedir.


Yt+m = Yt+m-1 + mT +et è DYt+m = mT + et  m dönem öngörü ufku

4.         ARIMA(p,0,q) veya ARMA(p,q):

Yt = Φ1Yt-1 + Φ2Yt-2 +…+ ΦpYt-p + et + θ1et-1 + θ2et-2 + …+ θqet-q

5.         ARIMA(p,1,q):


DYt = Φ1DYt-1 + Φ2DYt-2 +…+ ΦpDYt-p +et 1et-1 + θ2et-2 + …+θqet-q

Tersinirlik: ARIMA(1,0,1) modelinin sonsuz MA gösterimi,

Yt = ΦYt-1 + et + θet-1

= Φ(ΦYt-2 + et-1 + θet-2) + et + θet-1

= Φ2Yt-2 + et + (θ+Φ)et-1 + Φθet-2

= Φ2(ΦYt-3 + et-2 + θet-3)+ et + (θ+Φ)et-1 + Φθet-2

= Φ3Yt-3 2et-2 2θet-3 + et + (θ+Φ)et-1 + Φθet-2

= Φ3Yt-3 + et + (θ+Φ)et-1 + Φ(θ+Φ)et-2 3θet-3

……………

Yt = et + (θ+Φ)et-1 + Φ(θ+Φ)et-2 + Φ2(θ+Φ)et-3 +…+ Φn(θ+Φ)et-n



ARIMA(1,0,1) modelinin sonsuz AR gösterimi:

Yt = ΦYt-1 + et + θet-1

è et = Yt - ΦYt-1 - θet-1

= Yt - ΦYt-1 θ(Yt-1 - ΦYt-2 - θet-2)

= Yt - ΦYt-1 θYt-1 + θΦYt-2 + θ2et-2


= Yt (Φ+θ)Yt-1 + θΦYt-2 + θ2(Yt-2 - ΦYt-3 - θet-3)

= Yt (Φ+θ)Yt-1 + θ(Φ+θ)Yt-2 - θ2ΦYt-3 – θ3et-3

……….

et = Yt (Φ+θ)Yt-1 + θ(Φ+θ)Yt-2 2(Φ+θ)Yt-3+ ...–(θ)t-k+1(Φ+θ)Yt-k+1+...



Modelin belirlenmesi: ARIMA Modelinin belirlenmesi araçları


1.    Otokorelasyon Fonksiyonu:




2. Kısmi Otokorelasyon Fonksiyonu (PACF):


Otokorelasyon fonksiyonu ile yakından ilişkili bir başka kavram kısmi otokorelasyon fonksiyonudur. PACF Yt ve Yt-k arasındaki korelasyonu, ara değerler Yt-1,…, Yt-k+1 için düzeltmeler yaptıktan sonra ölçer ve -1 ile +1 arasında değerler alır.
2.  Grafik  çizimi:  Otokorelasyonlar  ve  kısmi  otokorelasyonlar  genellikle  bir  tablo gösterilir veya korelogram adı verilen grafikle gösterilir.





Otoregresif Sür [ARIMA (1,0,0) reci] için Teorik ACF’ler:


Yt = ΦYt-1 + et

Eşitliğin her iki yanı Yt-1 ile çarpılır ve beklenen değer alınırsa:

E(YtYt-1) = E[ (ΦYt-1+et)Yt-1] = E[ ΦY2t-1+Yt-1et]]

Burada E(YtYt-1) = COV(YtYt-1)


è COV(YtYt-1) = ΦE(Y2t-1) + E(Yt-1et)

E(Y2t-1) terimi VAR(Yt-1) anlamına geldir ve Yt-1 ile et istatistiksel olarak bağımsızdır. Ayrıca, durağanlığa bağlı olarak, VAR(Yt-k) = VAR(Yt) olduğundan:
COV(YtYt-1) =ΦVAR(Yt-1) + 0 COV(YtYt-1) = ΦVAR(Yt)
Bu durumda    ACF(1) = COV(YtYt-1) / VAR(Yt)

= ΦVAR(Yt) / VAR(Yt)


= Φ

Sonra, benzer biçimde ACF(2) için her iki yan Yt-2 ile çarpılıp beklenen değer alınırsa,

E(YtYt-2) = E[Yt-2(ΦYt-1+et)]               Burada E(YtYt-2) = COV(YtYt-2) COV(YtYt-2) = E[Yt-2(Φ(ΦYt-2 + et-1) +et)]            Burada Yt-1 =ΦYt-2 + et-1 COV(YtYt-2) = E[Φ2(Y2t-2) + ΦE(Yt-2et-1) + E(Yt-2et)]
Buna göre;

COV(YtYt-2) = Φ2VAR(Yt-2) + 0 + 0 COV(YtYt-2) = Φ2VAR(Yt)
Bu durumda, ACF(2) = COV(YtYt-2) / VAR(Yt)

=Φ2VAR(Yt) / VAR(Yt)


2

Benzer biçimde k > 0 olmak üzere ACF(k) için genel bir formül yazılabilir:

ACF(k) = COV(YtYt-k) / VAR(Yt) =Φk


1<Φ<1 span=""> olduğundan, ARIMA(1,0,0) sürecinde ACF değerleri üstel olarak azalır.




Durağanlık kısıtı: -1< Φ1 < 1

Örnek: Eğer Φ1 = 0,8 ise;

ACF (1) = Φ1 = 0,8

Grafik Gösterimi
ACF (2) = F 2 = 0,64
1

ACF
ACF (3) = F3  = 0,512
1
ACF (4) = F 4  = 0,4096
1
1

ACF (5) = F5  = 0,32768
1
0.8

ACF (6) = F 6  = 0,262144
1
0.6


…………………..
0.4

0.2

ACF (k) = F k = (0.8)k
0



ACF(1)  ACF(2)  ACF(3)  ACF(4)  ACF(5)  ACF(6)

Eğer Φ1 = - 0,8 ise;

ACF (1) = Φ1 = -0,8
Grafik Gösterimi
ACF (2) = F 2 = 0,64
1
ACF (3) = F3  = -0,512
1
ACF (4) = F 4  = 0,4096
1
ACF (5) = F5  = -0,32768
1
ACF (6) = F 6  = 0,262144
1
.              .            .
.              .            .
.              .            .
ACF (k) = F k = (-0.8)k
1



ARIMA (0,0,1) reci için Teorik ACF’ler:

ARIMA (0,0,1) modelinde, Yt  ile Yt-k  istatistiksel olarak bağımsızdır. Keza, ak gürültülü


hata terimi et ile et-k da istatistiksel olarak bağımsızdır. Buna göre model:

Yt = et + θet-1

Şeklinde ifade edilir. Eşitliğin her iki yanı Yt-1 = (et-1 + θet-2) ile çarpılıp beklenen değerleri alınırsa;
E(YtYt-1) = E[(et +θet-1) (et-1 +θet-2)]           Burada E(YtYt-1) = COV(YtYt-1)

COV(YtYt-1) = E(etet-1 +θetet-2 + θe2t-1 2et-1et-2) COV(YtYt-1) = θE(e2t-1)
Buna göre, VAR(Yt):

VAR(Yt) = E(Y2t) = E[(et + θet-1)2]

= E(e2t + 2θetet-1 + θ2e2t-1)

= E(e2t) + θ2E(e2t-1)          (E(e2t) = E(e2t-1) olduğundan)

= (1+ θ2) E(e2t)


Olacaktır. Bu durumda;

ACF(1) = COV(YtYt-1) / VAR(Yt)


= θE(e2t-1) / (1+θ2)E(e2t)

= θ / (1+θ2)


≠0

Benzer biçimde ACF(k) değerleri bulunabilir.

ACF(2) için, eşitliğin her iki yanı Yt-2  =(et-2  + θet-3) ifadesi ile çarpılarak beklenen değeri alınır.
E(YtYt-2) = E[(et +θet-1) (et-2 +θet-3)]    burada E(YtYt-2) = COV(YtYt-2)


è COV(YtYt-2) = E(etet-2 +θetet-3 + θet-1et-2 2et-1et-3)

è COV(YtYt-2) = 0 + 0 + 0 + 0 = 0


Buna göre, ACF(2) = COV(YtYt-2) / VAR(Yt)

= 0 / VAR(Yt)


= 0

Genel gösterim: ACF(k) = 0       k > 1 için 

Teşhis:


Model oluşturulurken, eğer bir ARIMA(p,d,q) modeli seçilmişse (ACF ve PACF değerleri kullanılarak), modelin yeterliliği konusunda bazı denetimlerin yapılması gereklidir. Kalıntıların analizi, yeterli bir modelin kalıntıları yaklaşık olarak ak gürültü olmalıdır olgusuna dayanır. Bu nedenle, kalıntıların otokorelasyonlarının anlamlılığı denetlenmeli ve yaklaşık iki standart hata sınırları (yani ±2/   n ) ile karşılaştırılmalıdır.


l   Ljung-Box Q istatistiği (1978): Q istatistikleri bir zaman serisinin ak gürültü olup-olmadığının tarafsız bir denetim ölçüsüdür. Otokorelasyonlarda bir örüntünün var olup-olmadığını değerlendirir.
K

i
 
Q = T(T + 2)årˆ 2



i= 1…k            (k-p-q) serbestlik derecesi

i=1  T - i

Ho: ACF’ler ak gürültü süreci ACF’lerinden anlamlı biçimde farklı değildir.  (yani ACF’ler= 0).


H1: ACF’ler ak gürültü süreci ACF’lerinden anlamlı biçimde farklıdır.  (yani ACF’ler ¹ 0).

Karar Kuralı:

Eğer Q £ ctablo ise,  Ho reddedilemez, ACF örüntüsü ak gürültüdür.

Eğer Q > ctablo ise, Ho reddedilebilir, ACF örüntüsü ak gürültü değildir.

Eğer bir model bu aşamada reddedilirse, model tanımlama döngüsü tekrar edilmelidir. Not: Bu test k > p + q ise anlamlıdır.
Model Seçme Kriterleri:

Akaike Bilgi Ölçütü (Akaike's information criterion) (AIC):

AIC = logsˆ 2 + 2 p + q
T

Buradasˆ  et’nin tahmin edilen varyansıdır.

Schwarz Bilgi Ölçütü (Schwarz's Bayesian Information criterion) (SC, BIC, veya SBC):

SBC = logsˆ 2 + p + q log(T)
T

veya

AIC(k)=T log sˆ 2 + 2k SBC(k)=Tlog sˆ 2 + log(T)k
Formülleri ile hesaplanabilir.

Her iki ölçütte olabilirlik (likelihood) temellidir, log-olabilirlik değeri ile ölçülen “uygunluk” ve serbest parametre sayısı (p+q) ile ölçülen “tutumluluk” arasında farklı bir dengeleme gösterirler. Eğer sabit parametreli bir model söz konusu ise, parametrelerin sayısı p+q+1’e yükselir. Genellikle en küçük değerli AIC veya BIC değerleri tercih edilir. Her iki ölçüt uygunluk  ve  tutumluluk  arasında  dengelemeyi  farklı  gerçekleştirir,  ancak  BIC  ölçütü neredeyse kesin modeli seçecek özellik göstermesinde dolayı tercih edilir.

İyi bir öngörü modelinin Karakteristikleri:


1.          Geçmiş verilere iyi uyum gösterir.

l  Gerçek verilerle tahmin edilen verilerin grafikleri çizildiğinde uyum iyidir.

l  Düzeltilmiş R2 yüksektir.

l  RMSE diğer modellere göre küçüktür.

l  MAPE diğer modellere göre küçüktür.

2.          Model geleceği tahmin edebilir ve bu tahminler verilerden uzağa düşmez.

3.          Tutumluluk (parsimonious) ilkesine uygundur; yani çok fazla katsayısı yoktur, basit ama etkilidir.
4.          Tahmin edilen katsayılar ve θ katsayıları) istatistiksel olarak anlamlıdır, gereksiz ve fazladan katsayı yoktur.
5.          Model durağandır ve tersinirdir. (yani, Φ <1 span="" style="letter-spacing: -.15pt;"> > -1)


6.          Kalıntıların ACF ve PACF değerlerinde herhangi bir örüntü bulunmaz.

7.          Kalıntılar beyaz gürültüdür.