Προβλέποντας την Ανεργία στην Ελλάδα

Εισαγωγή

Υπόβαθρο

Η ανεργία αποτελεί ένα χρόνιο πρόβλημα της χώρας μας, καθώς ιστορικά τα τελευταία 25 χρόνια είναι σε υψηλότερα επίπεδα από τον ευρωπαϊκό μέσο όρο και τις χώρες του ΟΟΣΑ. Το φαινόμενο επιδεινώθηκε τα χρόνια της οικονομικής κρίσης όπου στις χειρότερες στιγμές της το ένα τέταρτο του εργατικού δυναμικού δεν μπορούσε να βρει εργασία. Ακόμα χειρότερη ήταν η κατάσταση για τους νέους της χώρας, αφού η νεανική ανεργία ανήλθε στο 46%, ποσοστό που αποτελεί τη χειρότερη επίδοση στην ΕΕ.

Πριν προχωρήσουμε στην ανάλυση, κρίνω σημαντικό να αποσαφηνίσουμε τι σημαίνει ακριβώς ο όρος «άνεργος». Ο ορισμός είναι πιο αυστηρός από ό,τι φαίνεται, καθώς δεν αρκεί απλώς κάποιος να μην εργάζεται. Για να χαρακτηριστεί κάποιος άνεργος πρέπει να πληροί τρία κριτήρια ταυτόχρονα: να μην εργάζεται, να είναι διαθέσιμος για εργασία και να την αναζητά ενεργά. Έτσι εξαιρούνται από τον υπολογισμό σπουδαστές, συνταξιούχοι και γενικότερα όσοι δεν συμμετέχουν στο εργατικό δυναμικό. Το ποσοστό ανεργίας προκύπτει ως εξής:

Ποσοστό ανεργίας = \frac{Αριθμός ανέργων}{Εργατικό Δυναμικό}

Βέβαια, ο υπολογισμός του αριθμού των ανέργων είναι αρκετά σύνθετη διαδικασία για διάφορους λόγους, όπως η ύπαρξη της υποαπασχόλησης ή εποχικής εργασίας. Υπάρχουν δύο κυρίαρχες μεθοδολογίες καταγραφής της ανεργίας. Η πρώτη βασίζεται στα διοικητικά δεδομένα, δηλαδή στον αριθμό των εγγεγραμμένων ανέργων στη ΔΥΠΑ (πρώην ΟΑΕΔ). Πρόκειται ουσιαστικά για καταμέτρηση όσων λαμβάνουν ή αιτούνται επίδομα ανεργίας. Το πρόβλημα είναι ότι οι προϋποθέσεις χορήγησης είναι αυστηρές:

Απόλυση και όχι παραίτηση από την τελευταία απασχόληση
125 ημέρες εργασίας τους τελευταίους 14 μήνες (δεν υπολογίζονται οι δύο τελευταίοι μήνες)
Μη επιδότηση για άνω των 400 ημερών ανά τετραετία ανεργίας

Με αυτά τα κριτήρια, η εγγεγραμμένη ανεργία υποεκτιμά σημαντικά την πραγματική, αφού εξαιρεί όσους παραιτήθηκαν, όσους δεν πληρούν το ελάχιστο ημερών εργασίας, και όσους εργάζονται σε αδήλωτο ή πρόσκαιρο καθεστώς. Η δεύτερη και πιο αξιόπιστη μεθοδολογία είναι η Έρευνα Εργατικού Δυναμικού (Labour Force Survey, LFS). Πρόκειται για δειγματοληπτική έρευνα που διενεργείται από τους εθνικούς στατιστικούς φορείς (στην Ελλάδα η ΕΛΣΤΑΤ) με βάση τον ορισμό ανεργίας της Διεθνούς Οργάνωσης Εργασίας (ILO): άνεργος θεωρείται όποιος δεν εργάζεται, αναζητά ενεργά εργασία και είναι διαθέσιμος να αναλάβει εντός δύο εβδομάδων. Αυτή η μεθοδολογία χρησιμοποιείται και από τη Eurostat και τον ΟΟΣΑ, καθιστώντας τα δεδομένα συγκρίσιμα μεταξύ των χωρών.

Συνοπτική Απάντηση

Σε αυτό το άρθρο έχω ως σκοπό την πρόβλεψη της πορείας της ανεργίας τους επόμενους μήνες. Έτσι λοιπόν πήρα κάποια ιστορικά δεδομένα για την ανεργία στην ΕΕ, τον ΟΟΣΑ και τη χώρα μας. Θα χρησιμοποιήσω ένα απλό μοντέλο (S)ARIMA, προκειμένου να κάνω μία εκτίμηση του μεγέθους της τους επόμενους μήνες. Τα δεδομένα που χρησιμοποιώ καλύπτουν την περίοδο από το 1998 μέχρι το 2022. Αν θέλετε μία γρήγορη απάντηση, στη συγκεκριμένη ανάλυση προβλέπω ότι η πτωτική τάση της ανεργίας αναμένεται να συνεχιστεί τους επόμενους μήνες. Τον Φεβρουάριο του 2023, αυτή θα κυμαίνεται μεταξύ του 10% - 13%.

Προαπαιτούμενα

Για την ανάλυση χρησιμοποιήθηκαν τυπικές βιβλιοθήκες για εισαγωγή και επεξεργασία δεδομένων (readr, dplyr), τα πακέτα kableExtra και gt για μορφοποίηση πινάκων, και το highcharter για διαδραστικά γραφήματα. Για ανάλυση χρονοσειρών χρησιμοποιήθηκαν: lubridate, tseries, forecast, tsibble, feasts, fable, strucchange και urca. Τα διαγράμματα ACF και pACF καθώς και τα γραφήματα πρόβλεψης κατασκευάστηκαν με το Highcharter.

Δομή δεδομένων

Το αρχείο περιέχει δεδομένα ανεργίας για διάφορες χώρες ή οντότητες χωρών όπως η Ευρωπαϊκή Ένωση και οι χώρες του ΟΟΣΑ (Οργανισμός Οικονομικής Συνεργασίας και Ανάπτυξης), γεγονός που μας επιτρέπει να συγκρίνουμε την ανεργία της Ελλάδας με αυτή των υπολοίπων αναπτυγμένων οικονομιών.

O ΟΟΣΑ (Οργανισμός Οικονομικής Συνεργασίας και Ανάπτυξης) είναι ένας διεθνής οργανισμός στον οποίο συμμετέχουν 38 χώρες. Αυτές είναι: η Αυστραλία, η Αυστρία, το Βέλγιο, η Γαλλία, η Γερμανία, η Δανία, η Ελβετία, η Ελλάδα, η Εσθονία, οι Ηνωμένες Πολιτείες Αμερικής, το Ηνωμένο Βασίλειο, η Ιαπωνία, η Ιρλανδία, η Ισλανδία, η Ισπανία, το Ισραήλ, η Ιταλία, ο Καναδάς, η Κολομβία, η Νότια Κορέα, η Κόστα Ρίκα, η Λετονία, η Λιθουανία, το Λουξεμβούργο, το Μεξικό, η Νέα Ζηλανδία, η Νορβηγία, η Ολλανδία, η Ουγγαρία, η Πολωνία, η Πορτογαλία, η Σλοβακία, η Σλοβενία, η Σουηδία, η Τουρκία, η Τσεχία, η Φινλανδία και η Χιλή. Αποτελείται από μία ομάδα χωρών που:

θεωρούνται αναπτυγμένες
με αντιπροσωπευτική δημοκρατία και
οικονομία ελεύθερης αγοράς

Προεπισκόπηση δεδομένων (πρώτες 5 σειρές):

LOCATION	TIME	Value
GRC	1998-04-01	10.9
GRC	1998-05-01	11.0
GRC	1998-06-01	10.9
GRC	1998-07-01	11.0
GRC	1998-08-01	11.2
GRC	1998-09-01	11.1

Τα δεδομένα μου αποτελούνται από 3 μεταβλητές (στήλες). Πιο συγκεκριμένα οι στήλες μου είναι οι εξής:

Μεταβλητή	Τύπος Μεταβλητής	Περιγραφή
`LOCATION`	Ποιοτική (κατηγορική)	Χώρα ή Οντότητα χωρών
`TIME`	Ποιοτική (διατάξιμη)	Μήνας-Έτος που αναφέρεται η μέτρηση
`Value`	Ποσοτική (συνεχής)	Ύψος ανεργίας (βάσει περιοχής και μήνα)

Συνεπώς, το δείγμα μου αποτελείται από 3 μεταβλητές, εκ των οποίων οι δύο είναι ποιοτικές και μία ποσοτική που είναι και η τιμή που θέλω να προβλέψω (ανεργία). Σε αυτό το σημείο ίσως να πρέπει να τονιστεί ότι η μεταβλητή LOCATION έχει τρεις τιμές, την Ελλάδα, τις χώρες του ΟΟΣΑ και τις χώρες των 27 ευρωπαϊκών χωρών. Τέλος, όσον αφορά την κατηγοριοποίηση της μεταβλητής του χρόνου, καθώς οι τιμές μου έχουν τη μορφή μήνα-έτος (μμ/ετος), δεν είναι ξεκάθαρο το είδος της. Θα μπορούσαμε να τη χωρίσουμε σε δύο επιπλέον μεταβλητές όπου η μία να είναι το έτος και να τη χαρακτηρίσουμε ως μία ποσοτική μεταβλητή και ο μήνας μία ποιοτική διατάξιμη μεταβλητή.

Προεπεξεργασία χρονοσειρών

Η μεταβλητή που δηλώνει το μήνα για τον οποίο αναφέρεται η αντίστοιχη ανεργία (TIME) αναγνωρίζεται αυτόματα ως ένα διάνυσμα χαρακτήρων. Ένα από τα πρώτα πράγματα που πρέπει να κάνουμε όταν χειριζόμαστε δεδομένα που δηλώνουν διάστημα χρόνου είναι να τα μετατρέψουμε στο αντίστοιχο είδος μεταβλητής, που στην R, αυτό το είδος καλείται Date. Ο παρακάτω πίνακας δηλώνει τις υπάρχουσες μεταβλητές, καθώς και το είδος το οποίο τους έχει αποδοθεί αυτόματα με βάση τις τιμές που περιέχουν. Η R έκανε καλή δουλειά και εντόπισε ότι η μεταβλητή Value αποτελεί ένα διάνυσμα αριθμών μιας και αντιπροσωπεύει το ύψος της ανεργίας. Η αντιστοίχιση των τριών οντοτήτων είναι και αυτή σωστή, επειδή αναφερόμαστε στα ονόματα αυτών και άρα θα είναι ένα διάνυσμα χαρακτήρων.

Variable Name	Variable Type
LOCATION	character
TIME	character
Value	numeric

Παραπάνω επισημάνθηκε ότι οι ημερομηνίες έχουν την μορφή “ΕΕΕΕ-ΜΜ” (Έτος-Μήνας) και από το λογισμικό αναγνωρίστηκαν αυτόματα ως χαρακτήρες. Με τη βοήθεια του πακέτου lubridate θα μετατρέψω τη μεταβλητή του χρόνου σε τύπο Date. Και αφού κάναμε τη μετατροπή, αν ελέγξουμε άλλη μία φορά θα δούμε ότι η αλλαγή ήταν επιτυχημένη, με τη μεταβλητή να έχει τύπο Date.

Variable Name	Variable Type
LOCATION	character
TIME	Date
Value	numeric

Ελλείπουσες τιμές

Ούφ! Έχουμε κάποια καλά νέα. Σε αυτό το σύνολο δεδομένων υπάρχουν συνολικά 0 ελλείπουσες τιμές. Σε περίπτωση που από το σύνολό μου έλειπαν παρατηρήσεις, θα έπρεπε να ερευνήσω σε πρώτη φάση ποια από τις μεταβλητές αυτές παρατηρήθηκαν. Σε δεύτερη φάση και αναλόγως του τύπου της μεταβλητής θα έπρεπε είτε να διώξω εντελώς εκείνες τις σειρές - παρατηρήσεις ή θα μπορούσα να προσπαθήσω με διάφορες μεθόδους να προβλέψω τις τιμές τους.

Περιγραφικά στοιχεία

Τα δεδομένα της ανεργίας για την Ελλάδα αναφέρονται στην περίοδο του Απριλίου του 1998 μέχρι και τον Αύγουστο του 2022. Όσον αφορά τα δεδομένα της ΕΕ, ξεκινάνε από τον Ιανουάριο του 2000 μέχρι και τον Αύγουστο του 2022. Τα τελευταία 20 χρόνια έχουν γίνει σοκαριστικά μεγάλες αλλαγές σχετικά με το ποσοστό ανεργίας στη χώρα μας με την πιο απότομη μεταβολή να σημειώνεται τις περιόδους της οικονομικής κρίσης (μετά το 2009). Ενδεικτικά μπορούμε να παρατηρήσουμε τη διαφορά στο ύψος της ανεργίας μεταξύ του Σεπτεμβρίου του 2010, που ήταν στο 10% και τρία χρόνια αργότερα, τον Σεπτέμβριο του 2013, έφτασε στο 28.1%. Για λόγους πληρότητας παρακάτω επισυνάπτονται πίνακες που δείχνουν τους 5 μήνες με τη μεγαλύτερη και τη μικρότερη ανεργία στην Ελλάδα και στην Ευρώπη τα τελευταία 20 χρόνια.

Πίνακας: 5 μήνες με υψηλότερη ανεργία — Ελλάδα (αριστερά) και ΕΕ-27 (δεξιά)

Από την άλλη μεριά έχει ενδιαφέρον να παρατηρήσουμε και τις περιόδους με τη χαμηλότερη παρατηρούμενη ανεργία. Στην Ελλάδα αυτή η περίοδος ήταν λίγο πριν την οικονομική κρίση, το 2008, ενώ η Ευρώπη των 27 διανύει μία από τις καλύτερες περιόδους όσον αφορά την ανεργία, με ιστορικό χαμηλό 20ετίας, στο 6%.

Πίνακας: 5 μήνες με χαμηλότερη ανεργία — Ελλάδα (αριστερά) και ΕΕ-27 (δεξιά)

Όλα αυτά μπορούν να συνοψιστούν και στο παρακάτω διάγραμμα, όπου ξεχωρίζουν οι τεράστιες μεταβολές στη χώρα μας. Μπορούμε να διακρίνουμε ότι η κρίση του 2008 επηρέασε την ανεργία στην ΕΕ και σε όλο τον αναπτυγμένο κόσμο, μιας και υπάρχει μία ανοδική πορεία την ίδια περίοδο. Πλέον η ΕΕ επανήλθε, αλλά η Ελλάδα δεν έχει καταφέρει να φτάσει τα προ κρίσης επίπεδα, αν και η τάση είναι πτωτική.

Γράφημα: Σύγκριση ποσοστού ανεργίας — Ελλάδα, ΟΟΣΑ, ΕΕ-27 (μέσος όρος ανά έτος 1998–2022)

Εξέταση τάσης και εποχικότητας

Στην ανάλυση χρονοσειρών είναι σημαντικό να ξεχωρίσουμε τις πηγές της διασποράς μιας χρονοσειράς και να διαπιστώσουμε από πού προέρχεται αυτή. Οι χρονοσειρές έχουν τρία βασικά στοιχεία, τη τάση ( $T$ ), την εποχικότητα ( $S$ ) και την τυχαιότητα ( $E$ ). Η τάση περιγράφει τη γενική κατεύθυνση που ακολουθεί η χρονοσειρά με το πέρασμα του χρόνου — ανοδική, καθοδική ή οριζόντια. Στη δική μας περίπτωση, για παράδειγμα, η απότομη άνοδος της ανεργίας μετά το 2009 αποτελεί χαρακτηριστικό παράδειγμα ισχυρής ανοδικής τάσης. Η εποχικότητα αναφέρεται σε μοτίβα που επαναλαμβάνονται με σταθερή περιοδικότητα — παραδείγματος χάριν, αν η ανεργία τείνει να αυξάνεται κάθε χειμώνα και να μειώνεται το καλοκαίρι, τότε μιλάμε για εποχική συνιστώσα. Τέλος, η τυχαιότητα (ή υπόλοιπο) είναι ό,τι απομένει αφού αφαιρεθούν η τάση και η εποχικότητα, δηλαδή οι απρόβλεπτες διακυμάνσεις που δεν μπορούν να αποδοθούν σε κάποιο συστηματικό μοτίβο, όπως για παράδειγμα η απότομη αύξηση της ανεργίας κατά τη διάρκεια της πανδημίας τον Μάρτιο του 2020.

y_{t} = S_{t} + T_{t} + E_{t}

Όπου:

$y_{t}$ δηλώνουν τα δεδομένα που έχουμε διαθέσιμα,
$S_{t}$ εποχική συνιστώσα,
$T_{t}$ τάση χρονοσειράς,
$E_{t}$ τυχαία συνιστώσα.

Παρόμοια, το πολλαπλασιαστικό μοντέλο:

y_{t} = S_{t} \cdot T_{t} \cdot E_{t}

όπου τα στοιχεία που συνθέτουν τη χρονοσειρά πολλαπλασιάζονται, αντί να προστίθενται.

Γράφημα: Αποσύνθεση STL ελληνικής ανεργίας — παρατήρηση, τάση, εποχικότητα, υπόλοιπο (4-panel stock chart)

Από το παραπάνω γράφημα είναι πολύ σημαντικό να διακρίνουμε τον παράγοντα της εποχικότητας, διότι θέλω να ξέρω αν έχω να μελετήσω ένα μοντέλο χωρίς αυτή με χρονοσειρές ARIMA ή ένα αυτοπαλίνδρομο μοντέλο AR ή ένα μοντέλο κινούμενου μέσου MA. Αν τυχόν διαπιστώσω εποχικότητα θα πρέπει να χρησιμοποιήσω μοντέλο που τη συμπεριλαμβάνει όπως εποχικό ARIMA (SARIMA) είτε εποχικό αυτοπαλίνδρομο μοντέλο (SAR) ή ένα εποχικό MA. Η εποχικότητα βλέπω ότι δεν έχει το ίδιο μοτίβο σε όλη τη διάρκεια της χρονοσειράς. Μέχρι το 2004 η εποχικότητα κρίνεται αμελητέα, στη συνέχεια μέχρι το 2014 υπάρχουν ενδείξεις ασθενούς εποχικότητας. Από το 2014 και έπειτα, η εποχικότητα είναι πιο έντονη από οποιαδήποτε άλλη περίοδο μετά το 1998. Αξίζει να σημειωθεί ότι οι περισσότερες κορυφώσεις, κατά προσέγγιση, παρατηρούνται τους μήνες Φεβρουάριο και Μάρτιο.

Έλαβα μία αμφιλεγόμενη εικόνα με ιστορικά μία αδύναμη εποχικότητα, η οποία υπάρχει σε μεγάλο βαθμό τα τελευταία χρόνια. Μία απλή μέθοδος για να πάρουμε μία σύντομη απάντηση είναι μέσω της εντολής nsdiffs του πακέτου {forecast}. Σε αυτή τη περίπτωση λάβαμε ως απόκριση μηδέν που με κάνει να υποθέτω πως μάλλον η όποια εποχικότητα ήταν γενικά αδύναμη.

Έλεγχος	Τιμή	Αποτέλεσμα
Canova-Hansen (CH)	—	Δεν απαιτείται εποχική διαφορά
OCSB	—	Δεν απαιτείται εποχική διαφορά
Εποχική Επιρροή (STL)	0.153	Ασθενής εποχικότητα

Έλεγχος για τομές (breaks)

Οι χρονοσειρές δεν είναι ένα μέτρο το οποίο μπορεί να ερμηνευτεί και συνεπώς να προβλεφθεί αξιόπιστα δίχως να λαμβάνουμε υπόψη μας διάφορους εξωγενείς παράγοντες. Στη δική μας περίπτωση μελετάμε και θέλουμε να προβλέψουμε την ανεργία στην χώρα μας τους επόμενους μήνες. Η αποστολή μας γίνεται ακόμα πιο δύσκολη αν αναλογιστούμε ότι δεν μπορούμε να το κάνουμε αυτό ικανοποιητικά, καθώς το μοντέλο δεν μπορεί να κατανοήσει τα μοτίβα των μεταβολών της σειράς και πώς αυτά προέκυψαν. Πολλές μεταβολές στη χρονοσειρά μπορεί να έχουν επέλθει από εξωτερικούς παράγοντες οι οποίοι να επηρεάζουν τον καθορισμό του μοντέλου μας. Έτσι είναι σημαντικό να καθορίσουμε αν υπάρχουν τέτοια διαρθρωτικά σημεία (structural breaks) — καθοριστικά γεγονότα που μπορεί να επηρέασαν την κίνηση της χρονοσειράς. Η περίπτωση της Ελλάδας είναι μία τέτοια σύνθετη περίπτωση. Αυτά τα χρονικά σημεία θα μπορούσαν να είναι διάφορες ημερομηνίες όπου συνέβησαν σημαντικά γεγονότα που μπορεί να επηρέασαν τη συμπεριφορά της χρονοσειράς. Στην δική μας περίπτωση αναλύουμε την ανεργία της Ελλάδας η οποία εκτοξεύτηκε μετά την οικονομική κρίση του 2009 και στα μέσα αυτής είχαμε ιστορικό υψηλό. Επιπλέον, οι σειρές περιλαμβάνουν και τη περίοδο της πανδημίας που επηρέασε τον δείκτη ανεργίας.

Γράφημα: RSS και BIC ανά αριθμό διαρθρωτικών τομών (spline γραμμές)

Υπάρχει αρκετά μεγάλη μείωση του Μπεϋζιανού κριτηρίου πληροφορίας (BIC) όταν μεταβαίνω από ένα μοντέλο με καμία διαρθρωτική τομή, σε ένα άλλο με δύο διαρθρωτικές τομές, με μικρότερη αυτή των τριών τομών. Αυτό είναι μία σημαντική ένδειξη ότι η ανεργία μου όντως επηρεάστηκε από ξαφνικούς παράγοντες. Φυσικά το υποψιαζόμασταν αυτό καθώς έχουμε τη περίοδο της κρίσης που συνετέλεσε σε υψηλά ποσοστά ανεργίας. Αφού καθορίσαμε τον αριθμό των τομών, είναι η στιγμή να καθορίσουμε ποια είναι τα κομμάτια που πρέπει να αναλυθούν, εν ολίγοις να διαπιστώσουμε ποια είναι αυτά τα εύρη ημερομηνιών που εντοπίστηκε σημαντική διαφοροποίηση στη συμπεριφορά της χρονοσειράς. Σύμφωνα με τα αποτελέσματα έχω:

Πίνακας: Δείκτες σημείων τομών ανά αριθμό τομών (Τομή Α, Τομή Β, … στήλες)

και οι ημερομηνίες των αντίστοιχων τομών:

Πίνακας: Ημερομηνίες σημείων τομών ανά αριθμό τομών

Με βάση τα αποτελέσματα των σφαλμάτων θα επιλέξω είτε 2 ή 3 διαρθρωτικές τομές, δεδομένου ότι έχω σημαντική μείωση του κριτηρίου BIC σε αυτό τον αριθμό. Στη τρίτη τομή υπάρχει μία μικρή μείωση ενώ στην τέταρτη αυξάνεται. Ας μελετήσουμε όμως τις προτεινόμενες τομές τους ξεχωριστά. Από τη μία το μοντέλο των 2 τομών προτείνει τομές τον Ιούνιο του 2011 και το Μάρτιο του 2018 και από την άλλη το μοντέλο των 3 τομών προτείνει τομές επίσης τον Ιούνιο του 2011, τον Ιούνιο του 2015 και τον Ιανουάριο του 2019. Προβληματίστηκα αρκετά στο κατά πόσο μπορώ να αποφασίσω μόνος μου ποια ήταν μία καθοριστική στιγμή της κρίσης, καθώς αυτό είναι ενδεχομένως και λίγο υποκειμενική άποψη, για αυτό προτιμώ να το υπολογίσει το μοντέλο μου. Επιπλέον όλη η περίοδος ήταν αρκετά ταραχώδης και γεμάτη αρνητικές εξελίξεις που στην πραγματικότητα δεν μπορείς να καθορίσεις μία ξεκάθαρη τομή.

Κοιτώντας τις ημερομηνίες ενδεχομένως αυτή με τις τρεις τομές να είναι αυτή που βγάζει νόημα σε όσους το δουν. Το 2011 που είχαμε ήδη προβλήματα και τα οποία ήδη φαίνονται στο δείκτη της ανεργίας, το 2015 που είχαμε μία περίοδο αβεβαιότητας και τον Ιανουάριο του 2019, όπου η χώρα ανέκαμψε, με λίγους μήνες νωρίτερα να ανακοινώνει την έξοδο από τα μνημόνια, τον Αύγουστο του 2018.

Έλεγχος στασιμότητας

Ορισμός στασιμότητας

Μία σημαντική έννοια στις χρονοσειρές είναι η στασιμότητα. Μία χρονοσειρά καλείται στάσιμη αν:

$E (X_{t}) : σταθερή$
$V a r (X_{t}) : σταθερή$
$C o v (X_{t}, X_{s}) : σταθερή$

Εξέταση στασιμότητας γραφικά

Από το παραπάνω γράφημα της ανεργίας είναι εμφανέστατο ότι η σειρά μας δεν κινείται γύρω από κάποια συγκεκριμένη τιμή, παραβιάζοντας την πρώτη προϋπόθεση για να θεωρηθεί μία χρονοσειρά στάσιμη. Αυτό μας υποδεικνύει την ανάγκη χρήσης διαφορών πρώτης τάξης για την ανεργία της Ελλάδας. Από τη πρώτη διαφορά ( $Δ y = y_{t} - y_{t - 1}$ ) παρατηρώ μεγάλη βελτίωση, εφόσον δεν έχουμε τις τεράστιες αποκλίσεις του προηγούμενου διαγράμματος. Οι τιμές ως επί το πλείστον δεν παρουσιάζουν κάποια τάση και κινούνται σε τιμές σχετικά κοντά στο μηδέν. Αυτό είναι ένα καλό στοιχείο, όμως έχω έναν ελαφρύ προβληματισμό καθώς υπάρχουν δύο σημεία στη χρονοσειρά με σχετικά μεγάλες αποκλίσεις από το μηδέν. Η πρώτη είναι μεταξύ των σημείων 120 και 170 καθώς η κύμανση γύρω από το μηδέν έχει ξεφύγει ελαφρώς, τα οποία αναφέρονται στη περίοδο μεταξύ 2008 και 2012 (κρίση & επιδείνωση οικονομικών δεικτών). Ένα άλλο ελαφρώς προβληματικό σημείο είναι το 266ο που αναφέρεται στο Μάρτιο - Απρίλιο του 2020 και στην θέσπιση περιορισμού μετακινήσεων για να περιοριστεί η μετάδοση του κορωνοϊού μιας και είχαν βρεθεί τα πρώτα κρούσματα στη χώρα μας.

Γράφημα: Διαφορές πρώτης τάξης ελληνικής ανεργίας — γραμμή κυμαινόμενη γύρω από το 0

Λαμβάνοντας υπόψιν τους παραπάνω προβληματισμούς μου, έλαβα και τις δεύτερες διαφορές ( $Δ^{2} y = Δ y - Δ_{y - 1}$ ) και τις οπτικοποίησα. Το διάγραμμα είναι σχεδόν το ίδιο, με τις τιμές να κυμαίνονται στο μηδέν ακόμα και στο προβληματικό σημείο κοντά στο 150ο σημείο. Στις δεύτερες παρατηρήσεις παρατηρώ μία πιο συνεπή κύμανση γύρω από το μηδέν, αλλά ταυτόχρονα υπάρχει ακόμα μεγαλύτερη απόκλιση στην έναρξη λήψης μέτρων κατά του κορωνοϊού στη χώρα μας (3.6% έναντι 2.6% των πρώτων διαφορών).

Γράφημα: Διαφορές δεύτερης τάξης ελληνικής ανεργίας

Εξέταση στασιμότητας με στατιστικούς ελέγχους

Ο γραφικός έλεγχος της στασιμότητας είναι ένας αρκετά εύκολος τρόπος για να διαπιστώσουμε την ύπαρξη τάσεων ή αν η σειρά μας έχει γενικότερα σταθερή συμπεριφορά. Αν εξαιρέσουμε κάποιες αρκετά ξεκάθαρες περιπτώσεις, θα υπάρχουν φορές που πολλοί μπορεί να διαφωνήσουν ως προς τη στασιμότητα της σειράς απλώς από την πορεία της. Αυτό είναι λογικό δεδομένου ότι ως μέτρο αξιολόγησης είναι κατά κάποιο τρόπο υποκειμενικό, αφού βασίζεται στην άποψη / ερμηνεία του καθενός που θα δώσει στην κίνηση της χρονοσειράς. Κάποιοι από τους πιο γνωστούς ελέγχους στασιμότητας, οι οποίοι είναι γνωστοί και ως έλεγχοι μοναδιαίας ρίζας, είναι οι εξής:

Ο έλεγχος DF (Dickey-Fuller)
Ο έλεγχος ADF (Augmented Dickey-Fuller)
Ο έλεγχος ADF-GLS
Ο έλεγχος PP (Phillips-Perron)
Ο έλεγχος KPSS (Kwiatkowski-Phillips-Schmidt-Shin) και
Ο έλεγχος ZA (Zivot-Andrews)

Εν συντομία, το πακέτο tseries με το οποίο έχω τη μεγαλύτερη εξοικείωση είναι αρκετά περιοριστικό — δεν μπορούσα να θέσω τα lags για τους ελέγχους ή να θέσω χαρακτηριστικά της χρονοσειράς. Από την άλλη μεριά έχουμε το πακέτο urca, το οποίο απαντάει σε αυτούς τους περιορισμούς επιτρέποντας στους χρήστες να θέτουν τον αριθμό των lags καθώς και στοιχεία της χρονοσειράς. Το μοναδικό μειονέκτημα του urca πακέτου είναι η μη παροχή ενός p-value στα αποτελέσματα των ελέγχων. Για τον έλεγχο της υπόθεσης υπολογίζεται η στατιστική τιμή και ελέγχεται με την αντίστοιχη κριτική τιμή.

Σύνοψη αποτελεσμάτων

Συνοψίζοντας τα αποτελέσματα των στατιστικών ελέγχων στασιμότητας συμπεραίνω ότι οι παρατηρήσεις της ανεργίας στην Ελλάδα δεν μπορούν να χαρακτηριστούν ως στάσιμες. Επιπλέον, όλοι οι κλασικοί έλεγχοι συμφωνούν στη ύπαρξη στασιμότητας στις διαφορές πρώτης και δεύτερης τάξης.

Έλεγχος	Αποτέλεσμα	Στασιμότητα…
ADF	I(1)	πρώτη διαφορά
PP	I(1)	πρώτη διαφορά
KPSS	I(1)	πρώτη διαφορά
ZA	I(1)	πρώτη διαφορά
LS	I(1)	πρώτη διαφορά

Έλεγχος DF

Ο έλεγχος Dickey-Fuller είναι ένας από τους πιο απλούς ελέγχους μοναδιαίας ρίζας για να διαπιστώσουμε τη στασιμότητα ή μη μίας χρονοσειράς. Αυτός ο έλεγχος βασίζεται στο αυτοπαλίνδρομο μοντέλο πρώτης τάξης, $AR (1)$ :

y_{t} = ϕ y_{t - 1} + e_{t}

Όπου $y_{t}$ είναι η τιμή της χρονοσειράς και το $e_{t}$ ο όρος του σφάλματος. Δηλαδή είναι μία χρονοσειρά που οι τιμές της επηρεάζονται — εξαρτώνται από τις προηγούμενες τιμές της.

y_{t} = ρ y_{t - 1} + e_{t}

y_{t} - y_{t - 1} = ρ y_{t - 1} - y_{t - 1} + e_{t}

Δ y_{t} = (ρ - 1) y_{t - 1} + e_{t}

Δ y_{t} = γ y_{t - 1} + e_{t}

Ο έλεγχος έχει συγκεκριμένες παραλλαγές οι οποίες βασίζονται στη συμπεριφορά της εκάστοτε χρονοσειράς:

Χωρίς σταθερό όρο και χωρίς τάση: $Δ y_{t} = γ y_{t - 1} + e_{t}$
Με σταθερό όρο: $Δ y_{t} = α + γ y_{t - 1} + e_{t}$
Με σταθερό όρο και τάση: $Δ y_{t} = α + β t + γ y_{t - 1} + e_{t}$

Ο συγκεκριμένος έλεγχος έχει κάποια προβλήματα στην εφαρμογή, καθώς κάνει μία σειρά από υποθέσεις: η σειρά μας βασίζεται σε ένα αυτοπαλίνδρομο μοντέλο $p = 1$ , τα σφάλματα είναι ομοσκεδαστικά και τα σφάλματα είναι ασυσχέτιστα.

Από τους ελέγχους Ljung-Box και Durbin-Watson, απορρίπτω την υπόθεση ότι τα σφάλματα είναι ασυσχέτιστα. Τέλος, από τον έλεγχο ARCH προκύπτει ότι τα σφάλματα δεν είναι ομοσκεδαστικά. Από αυτά είναι εμφανές ότι ο έλεγχος DF δεν είναι καλός και συνήθως δεν χρησιμοποιείται, καθώς οι υποθέσεις του είναι αρκετά περιοριστικές. Οι έλεγχοι όπως ο ADF και ο PP αντιμετωπίζουν με διάφορους τρόπους αυτή τη συμπεριφορά των σφαλμάτων.

Πίνακας: Έλεγχος υποθέσεων DF — Ljung-Box, Durbin-Watson, ARCH (στατιστική, βαθμοί ελευθερίας, p-value)

Έλεγχος ADF

Ένας από τους πιο χρησιμοποιούμενους ελέγχους μοναδιαίας ρίζας — στασιμότητας είναι ο επαυξημένος έλεγχος ADF (Augmented Dickey-Fuller) και αποτελεί γενίκευση του απλού ελέγχου Dickey-Fuller, μιας και εξαρτάται από ένα αυτοπαλίνδρομο μοντέλο μεγαλύτερης τάξης ( $ρ > 1$ ). Ένα αυτοπαλίνδρομο μοντέλο $ρ$ τάξης έχει την εξής μορφή:

y_{t} = ϕ_{1} y_{t - 1} + ϕ_{2} y_{t - 2} + \dots + ϕ_{p} y_{t - p} + ϵ_{t}

Ο έλεγχος ADF έχει την εξής μορφή υποθέσεων:

$H_{0} : γ = 0 (η σειρά δεν είναι στάσιμη)$ $H_{1} : γ \neq 0 (η σειρά είναι στάσιμη)$

Δηλαδή, αν τα αποτελέσματά μου απορρίψουν τη μηδενική υπόθεση τότε αυτό μας υποδεικνύει ότι η χρονοσειρά είναι στάσιμη. Χρησιμοποιώντας τον κανόνα Schwert για $T = 293$ παρατηρήσεις:

p_{m a x} = ⌊ 12 \cdot {(\frac{293}{100})}^{0.25} ⌋ = ⌊ 15.7 ⌋ = 15 υστερήσεις

Πίνακας: Αποτελέσματα ADF σε επίπεδα — 3 σειρές (none, drift, trend) με στατιστική, υστέρηση, κρίσιμες τιμές

Δεδομένου ότι τα αποτελέσματα δεν είναι στατιστικά σημαντικά μπορώ να συμπεράνω ότι η χρονοσειρά μου δεν είναι στάσιμη. Συνεπώς η χρήση των διαφορών των παρατηρήσεων έχει νόημα.

Πίνακας: Αποτελέσματα ADF στις πρώτες διαφορές — 3 σειρές

Αφού η στατιστική τιμή (−2.119) είναι μικρότερη της αντίστοιχης κρίσιμης τιμής (−1.95), τότε μπορούμε να απορρίψουμε την μηδενική υπόθεση μη στασιμότητας για τις διαφορές των αρχικών παρατηρήσεων, σε επίπεδο σημαντικότητας 5%.

Πίνακας: Πλήρη αποτελέσματα ADF — 6 σειρές (3 σε επίπεδα + 3 πρώτες διαφορές), μορφή σειράς, υπόδειγμα, στατιστική, υστέρηση, κρίσιμες τιμές

Έλεγχος PP

Άλλος ένας έλεγχος στασιμότητας είναι ο έλεγχος Phillips-Perron, ο οποίος βασίζεται στον απλό Dickey-Fuller. Η λογική είναι ίδια με τον ADF και η υπόθεση έχει την ίδια μορφή, αλλά διαφέρουν σημαντικά ως προς τον τρόπο που αντιμετωπίζει την αυτοσυσχέτιση των σφαλμάτων. O έλεγχος δεν προσθέτει lags για να περιορίσει την αυτοσυσχέτιση των σφαλμάτων (όπως ο ADF), αντιθέτως προσπαθεί να τροποποιήσει τη στατιστική τιμή εκτιμώντας τη μακροχρόνια διακύμανση $\hat{λ}$ .

Για τον παράγοντα εύρους $q$ της μακροχρόνιας διακύμανσης ισχύει για μικρά δείγματα:

q_{μικρό} = ⌊ 4 \cdot {(\frac{T}{100})}^{0.25} ⌋

και για μεγαλύτερα δείγματα:

q_{μεγάλο} = ⌊ 12 \cdot {(\frac{T}{100})}^{0.25} ⌋

$H_{0} : Η σειρά δεν είναι στάσιμη$ $H_{1} : Η σειρά είναι στάσιμη$

Πίνακας: Αποτελέσματα PP — 4 σειρές (επίπεδα: constant/trend + διαφορές: constant/trend), στατιστική, υστέρηση, κρίσιμες τιμές

Συνεπώς, έχουμε μη απόρριψη της μηδενικής ( $H_{0}$ ) υπόθεσης στα αρχικά δεδομένα και απόρριψη αυτής στις πρώτες διαφορές. Ο έλεγχος PP επιβεβαίωσε τα ευρήματα του ελέγχου ADF.

Έλεγχος KPSS

Ένας ακόμα έλεγχος μοναδιαίας ρίζας είναι ο έλεγχος KPSS. Αν και ο στόχος του ελέγχου είναι ο ίδιος, έχει αντίθετη λογική σε σχέση με τους προηγούμενους ελέγχους αφού η μηδενική του υπόθεση είναι η στασιμότητα, έναντι της μη στασιμότητας.

$H_{0} : Η σειρά είναι στάσιμη$ $H_{1} : Η σειρά δεν είναι στάσιμη$

Πίνακας: Αποτελέσματα KPSS — 3 σειρές (επίπεδα, πρώτες διαφορές, δεύτερες διαφορές): KPSS στατιστική, υστέρηση, κρίσιμες τιμές

Η μηδενική μου υπόθεση υπέθεσε στασιμότητα η οποία απορρίπτεται από τον έλεγχο KPSS σε επίπεδο σημαντικότητας 1%. Επιπλέον ο έλεγχος δεν είναι σε θέση να απορρίψει τη στασιμότητα στις διαφορές των παρατηρήσεων. Αυτά τα αποτελέσματα επιβεβαιώνουν και τους ελέγχους PP καθώς και τον έλεγχο ADF.

Έλεγχος ZA και LS

Τέλος, ένας άλλος έλεγχος για τη στασιμότητα είναι ο έλεγχος Zivot-Andrews (έλεγχος ZA). Η συγκεκριμένη στατιστική συνάρτηση διαφέρει από τις προηγούμενες ως προς το ότι συμπεριλαμβάνει υπόψιν της ορισμένα σημεία από τα οποία η χρονοσειρά αλλάζει συμπεριφορά. Οι πιο γνωστοί έλεγχοι για τη στασιμότητα σε χρονοσειρές με διαρθρωτικές τομές είναι οι:

Έλεγχος Zivot-Andrews (ZA), αν έχω μόνο μία διαρθρωτική τομή (structural break)
Έλεγχος Lee-Strazicich (LS), αν έχω δύο διαρθρωτικές τομές

Για λόγους πληρότητας θα συμπεριλάβω τον έλεγχο Zivot-Andrews ο οποίος όμως δεν είναι ο καλύτερος μιας και υποθέτει μόνο μία διαρθρωτική τομή. Παραπάνω βρέθηκαν δύο. Ευτυχώς, αντί να στηριχτούμε σε κάποιο στατιστικό πακέτο βρήκα στο GitHub διαθέσιμο ένα σχετικό αποθετήριο, όπου ο χρήστης hannes101 έχει γράψει μία σειρά από συναρτήσεις για τον συγκεκριμένο έλεγχο που θυμίζουν σε λογική αυτές του πακέτου urca.

Πίνακας: Έλεγχοι ZA και LS — 4 σειρές (ZA επίπεδα, ZA διαφορές, LS επίπεδα: −4.71, LS διαφορές: −7.72); κρίσιμη τιμή 5%: −5.65

Αναγνώριση μοντέλου

Παραπάνω κατέληξα ότι οι παρατηρήσεις της ανεργίας δεν είναι στάσιμες, ωστόσο οι πρώτες διαφορές τους αποτελούν στάσιμη χρονοσειρά. Αυτή τη στιγμή θα ήθελα να μελετήσω ποιο μοντέλο (S)ARIMA(p, d, q) ενδείκνυται στη περίπτωσή μου. Για αυτό το λόγο θα κατασκευάσω τα διαγράμματα αυτοσυσχέτισης και μερικής αυτοσυσχέτισης για να αναγνωρίσω τις ιδανικές τιμές $p$ , $q$ . Υπενθυμίζω ότι σε μοντέλο ARIMA, το $d$ συμβολίζει την τάξη της διαφοράς, όπου στην περίπτωσή μας είναι 1.

Αρχικές παρατηρήσεις

Για τυπικούς λόγους θα ξεκινήσουμε από τις δοσμένες παρατηρήσεις της ανεργίας. Τυπικά ήδη γνωρίζουμε ότι δεν είναι στάσιμες, αλλά υπάρχουν συγκεκριμένα μοτίβα που πρέπει να παρατηρήσουμε στα διαγράμματα αυτοσυσχέτισης προκειμένου να το επιβεβαιώσουμε. Το διάγραμμα αυτοσυσχέτισης πέφτει με έναν εξαιρετικά αργό ρυθμό που είναι ισχυρή ένδειξη μη στασιμότητας της σειράς.

Γράφημα: ACF αρχικής σειράς (ραβδόγραμμα, 20 υστερήσεις)

Γράφημα: pACF αρχικής σειράς (ραβδόγραμμα, 20 υστερήσεις)

Πρώτη διαφορά

Η μη στασιμότητα των δεδομένων μου που έχει χιλιοεπιβεβαιωθεί μας υποχρεώνει να λάβουμε τις πρώτες διαφορές και να λάβουμε τα αντίστοιχα διαγράμματα αυτοσυσχέτισης. Παρατηρώ μία αρκετά δυσνόητη κατάσταση από τα διαγράμματα καθώς υπάρχουν σημαντικές αυξομειώσεις και στα δύο διαγράμματα που κάνουν δύσκολη την απόφαση για το κατάλληλο μοντέλο ARIMA. Μετά τη 10η υστέρηση αυτή η τάση μειώνεται ή εξαλείφεται σημαντικά, επομένως το μοντέλο μου έχει μάλλον παραμέτρους $p$ και $q$ κάπου ανάμεσα στο 1 και στο 10.

Γράφημα: ACF πρώτων διαφορών (ραβδόγραμμα, 20 υστερήσεις)

Γράφημα: pACF πρώτων διαφορών (ραβδόγραμμα, 20 υστερήσεις)

Κατασκευή μοντέλων

Διαχωρισμός χρονοσειράς

Η πρόβλεψη της μελλοντικής ανεργίας απαιτεί από μεριάς μας τη κατασκευή ενός μοντέλου. Καθιερωμένοι μέθοδοι είναι τα μοντέλα ARIMA και τα μοντέλα εκθετικής εξομάλυνσης (ETS). Το να εκτελέσω απλώς ένα μοντέλο δεν λέει πολλά αν δεν αξιολογήσω τους παράγοντες του. Γενικότερα σε εργασίες που προσπαθούμε να φτιάξουμε προβλεπτικά υποδείγματα θέλουμε να αξιολογούμε την δύναμη του μοντέλου και για αυτό το λόγο συνήθως χωρίζουμε τα δεδομένα μας σε δύο μέρη — ένα για εκπαίδευση (train set) και ένα για αξιολόγηση (test set) — με τυπική αναλογία 70/30 ή 80/20.

Σύνολο δεδομένων (1998–2022, 293 παρατηρήσεις)
        ↙                         ↘
Εκπαίδευση (1998–2015)   Αξιολόγηση (2015–2022)

Όμως αν έχουμε προβλήματα χρονοσειρών τα πράγματα δεν είναι τόσο απλά. Τότε θα έρθουμε αντιμέτωποι με ένα μοντέλο το οποίο θα αγνοεί το 1/5 των παρατηρήσεων και μάλιστα των πιο πρόσφατων. Για αυτό το λόγο έχουν προταθεί άλλες μέθοδοι για τις χρονοσειρές.

Σύνολο χρονοσειράς (293 παρατηρήσεις)
  ├─ 1ο πλαίσιο: Εκπαίδευση 1998–2010 / Πρόβλεψη 2011
  ├─ 2ο πλαίσιο: Εκπαίδευση 1998–2011 / Πρόβλεψη 2012
  ├─ 3ο πλαίσιο: Εκπαίδευση 1998–2012 / Πρόβλεψη 2013
  ├─ …
  └─ Ν-πλαίσιο: Εκπαίδευση 1998–2021 / Πρόβλεψη 2022

Όλο αυτό ίσως να ακούγεται κάπως περίπλοκο. Έχω συμπεριλάβει μία διαδραστική εφαρμογή για να τη δοκιμάσετε και μόνοι σας, ώστε να γίνει κατανοητή η διαφορά και πώς επηρεάζουν οι διάφορες επιλογές.

Καθορισμός ARIMA μοντέλων

Για το απλό μοντέλο ARIMA χρειάζεται να καθορίσω τρεις παραμέτρους. Γνωρίζω ότι $d = 1$ , αφού πέτυχα στασιμότητα με τις πρώτες διαφορές. Για τον καθορισμό του $p$ υποψιάζομαι τιμές 1, 6 και 10, ενώ για το $q$ τιμές 1, 3, 6 και 10. Ο γραφικός καθορισμός των $p$ και $q$ είναι αρκετά υποκειμενικός και δίνει αβέβαια συμπεράσματα. Για αυτό το λόγο είναι καλό να αξιολογήσω ένα εύρος συνδυασμών παραμέτρων για τα μοντέλα ARIMA.

Πίνακας: Σύγκριση 15 ARIMA μοντέλων — Μοντέλο, BIC, AIC, AICc (ταξινομημένα κατά BIC)

Κάθε κριτήριο δίνει διαφορετικό μοντέλο ως βέλτιστο — το AIC και AICc προτείνουν ARIMA(3,1,2), ενώ το BIC προτείνει το ARIMA(1,1,1). Το ιδανικό μοντέλο είναι το ARIMA(1,1,1) καθώς πετυχαίνει την καλύτερη απόδοση στο BIC κριτήριο και καλή απόδοση στα AIC/AICc, με μικρή διαφορά από τα βέλτιστα. Επιπλέον, τα μοντέλα που προτείνει το AIC έχουν 5 παραμέτρους, έναντι 2 παραμέτρων που μπορεί να γενικεύει καλύτερα στη συμπεριφορά της χρονοσειράς.

Καθορισμός του μοντέλου ETS

Η μέθοδος εκθετικής εξομάλυνσης είναι εξίσου δημοφιλής μέθοδος για την πρόβλεψη χρονοσειρών. Το μεγάλο της πλεονέκτημα είναι ότι δεν απαιτεί τους ελέγχους που εκτελέσαμε για τα μοντέλα ARIMA.

E T S (Σφάλμα, Τάση, Εποχικότητα)

Πίνακας: Σύγκριση 9 ETS μοντέλων — Μοντέλο (A-N-N, A-A-N, …), BIC, AIC, AICc (ταξινομημένα κατά BIC)

Ο πίνακας δείχνει ότι το μοντέλο ETS(M,A,N), δηλαδή με πολλαπλασιαστικό σφάλμα, γραμμική τάση και χωρίς εποχικότητα, έχει την καλύτερη απόδοση στο BIC κριτήριο. Η απουσία εποχικής συνιστώσας (N) από τα καλύτερα μοντέλα επιβεβαιώνει τα ευρήματα της ενότητας εποχικότητας: η εποχικότητα στην ελληνική ανεργία είναι ασθενής και δεν βελτιώνει τα μοντέλα.

Μοντέλο Prophet

Μία εύκολη εναλλακτική για γρήγορη πρόβλεψη χρονοσειρών είναι ο αλγόριθμος Prophet. Δημιουργήθηκε από το Facebook το 2017 και είναι αρκετά δημοφιλής μέθοδος πρόβλεψης. Το ομώνυμο R πακέτο, με την εντολή prophet(), μας δίνει μία εκτίμηση σε μία μόνο γραμμή κώδικα.

Σε αντίθεση με τα μοντέλα ARIMA και ETS, το Prophet δεν απαιτεί ρητό έλεγχο στασιμότητας ή καθορισμό παραμέτρων, καθώς αποσυνθέτει αυτόματα τη χρονοσειρά σε τάση, εποχικότητα και αργίες. Αυτή η ευκολία χρήσης το κάνει δημοφιλές σε εφαρμογές της βιομηχανίας, αλλά δεν εγγυάται καλύτερη απόδοση. Στον πίνακα σύγκρισης που ακολουθεί θα δούμε πώς αποδίδει σε σχέση με τα κλασικά μοντέλα.

Σύγκριση μοντέλων

Μέχρι τώρα χρησιμοποίησα τα κριτήρια AIC και BIC για να επιλέξω τις καλύτερες παραμέτρους εντός κάθε τύπου μοντέλου. Αυτά τα κριτήρια δεν μπορούν, ωστόσο, να μου πουν αν ένα ARIMA είναι καλύτερο από ένα ETS ή Prophet, διότι κάθε τύπος μοντέλου τα υπολογίζει με διαφορετικό τρόπο. Για αυτό το λόγο χρειάζομαι μία κοινή βάση σύγκρισης. Η λογική είναι απλή: κάθε μοντέλο κάνει προβλέψεις για μήνες για τους οποίους γνωρίζω ήδη την πραγματική ανεργία, και μετρώ πόσο απέκλινε. Τα μέτρα που θα χρησιμοποιήσω είναι:

M A E = \frac{1}{n} \sum_{i = 1}^{n} | y_{i} - {\hat{y}}_{i} |

M S E = \frac{1}{n} \sum_{i = 1}^{n} {(y_{i} - {\hat{y}}_{i})}^{2}

Πίνακας: Σύγκριση μοντέλων για πρόβλεψη 2 μηνών — ~11 μοντέλα (Auto ARIMA, ARIMAX, ARIMA, ETS, Prophet, Naive, SNaive), RMSE και MAE, ταξινομημένα κατά RMSE

Πίνακας: Σύγκριση μοντέλων για πρόβλεψη 6 μηνών — ίδια μοντέλα, RMSE και MAE, ταξινομημένα κατά RMSE

Από τους παραπάνω πίνακες προκύπτει ότι για βραχυπρόθεσμες προβλέψεις ( $h \leq 6$ μήνες) το μοντέλο ARIMAX, που περιλαμβάνει δύο εξωγενείς μεταβλητές που αντιπροσωπεύουν τις διαρθρωτικές αλλαγές (breaks), αποδίδει καλύτερα. Ξεχωρίζει επίσης η σημαντική διαφορά στα σφάλματα μεταξύ των ARIMA μοντέλων και του Naive μοντέλου. Για να μελετήσουμε αν αυτές οι διαφορές είναι στατιστικά σημαντικές χρησιμοποιείται ο έλεγχος Diebold-Mariano:

Πίνακας: Έλεγχοι Diebold-Mariano — 6 ζεύγη μοντέλων: DM στατιστική, p-value, συμπέρασμα (σημαντικό / χωρίς διαφορά)

Σύμφωνα με τον έλεγχο, διαπίστωσα ότι τα επιλεγμένα ARIMA μοντέλα έχουν στατιστικά σημαντικές διαφορές από το Naive μοντέλο, αποδεικνύοντας την αξία τους για την πρόβλεψη μελλοντικής ανεργίας. Ένα περαιτέρω εύρημα είναι ότι τα επιλεγμένα ARIMA μοντέλα δεν έχουν στατιστικά σημαντικές διαφορές μεταξύ τους σε επίπεδο σημαντικότητας 5%.

Αλλά, Πού Είναι Οι Υποθέσεις;

Ε, πού είναι οι έλεγχοι υποθέσεων; Θέλουμε πίσω τα λεφτά μας.

Λοιπόν, έχω κάποια καλά και κάποια κακά νέα. Τα καλά νέα είναι ότι όχι μόνο το άρθρο δεν έχει τελειώσει, αλλά χρειάζεται επίσης να ελέγξω αν τα καλύτερα μοντέλα ικανοποιούν τις υποθέσεις που συζητήσαμε, δηλαδή ότι τα σφάλματα πρέπει να είναι:

ασυσχέτιστα ( $C o v (ϵ_{t}, ϵ_{t - 1}) = 0$ ),
ομοσκεδαστικά ( $V a r (ϵ_{t}) = σ^{2}$ ), και
να ακολουθούν την κανονική κατανομή.

Πίνακας: Έλεγχοι υποθέσεων μοντέλων — Ljung-Box, ARCH, Jarque-Bera για κάθε ένα από τα 4 μοντέλα, συν AIC και BIC

Τα αποτελέσματα δεν είναι ιδανικά για κανένα από τα μοντέλα. Ο έλεγχος Ljung-Box απορρίπτει τη μηδενική υπόθεση ασυσχέτιστων σφαλμάτων για όλα τα μοντέλα ( $p < 0.01$ ). Ο έλεγχος ARCH απορρίπτεται παντού, δηλώνοντας ετεροσκεδαστικότητα — αναμενόμενο σε μία χρονοσειρά που πέρασε από κρίση χρέους και πανδημία. Τέλος, ο έλεγχος Jarque-Bera απορρίπτει την κανονικότητα. Αυτά τα ευρήματα σημαίνουν ότι τα διαστήματα εμπιστοσύνης πρέπει να ερμηνεύονται με προσοχή. Ωστόσο, η παραβίαση αυτών των υποθέσεων δεν ακυρώνει αυτόματα τις σημειακές προβλέψεις. Τα μοντέλα ARIMA είναι γνωστό ότι παράγουν αξιόπιστες σημειακές εκτιμήσεις ακόμα και όταν οι διανεμητικές υποθέσεις δεν πληρούνται πλήρως, ιδίως σε βραχύ χρονικό ορίζοντα.

Πρόβλεψη Μελλοντικής Ανεργίας

Όλο αυτό ήταν κάπως κουραστικό, αλλά επιτέλους έφτασε η στιγμή να αποκτήσει νόημα όλο αυτό. Βρήκα το καλύτερο μοντέλο και, χρησιμοποιώντας το, θα προβλέψω το επίπεδο ανεργίας στην Ελλάδα για τους επόμενους 6 μήνες. Τα δεδομένα μου τελειώνουν τον Αύγουστο 2022 (ανεργία 12.2%), οπότε οποιαδήποτε εκτίμηση θα αφορά τους μήνες από τον Σεπτέμβριο 2022 έως και τον Αύγουστο 2023.

Γράφημα: Πρόβλεψη ανεργίας — ιστορική γραμμή (σκούρο) + 6μηνη πρόβλεψη (κόκκινο διακεκομμένο) με διαστήματα εμπιστοσύνης 80% και 95%

Και ο αντίστοιχος πίνακας με τις προβλέψεις:

Πίνακας: Προβλέψεις ανεργίας 6 μηνών — Μήνας, Σημειακή Πρόβλεψη, Δ.Ε. 80%, Δ.Ε. 95%

Με βάση το μοντέλο με την καλύτερη απόδοση, η πτωτική τάση της ελληνικής ανεργίας αναμένεται να συνεχιστεί τους επόμενους έξι μήνες. Η σημειακή εκτίμηση για τον Φεβρουάριο 2023 είναι 11.4%, με διάστημα εμπιστοσύνης 80% μεταξύ 10.1% και 12.8% (και διάστημα 95% μεταξύ 9.3% και 13.5%).

Αξίζει, ωστόσο, να επισημανθούν ορισμένοι περιορισμοί αυτής της ανάλυσης. Τα μοντέλα ARIMA βασίζονται στην υπόθεση ότι η μελλοντική δομή της χρονοσειράς θα μοιάζει με την ιστορική της. Ένα απρόοπτο γεγονός, όπως μία νέα γεωπολιτική κρίση ή ένα ενεργειακό σοκ, θα μπορούσε να ανατρέψει την πρόβλεψη. Επιπλέον, η ανεργία επηρεάζεται από μεταβλητές που δεν συμπεριλαμβάνονται στο μοντέλο, όπως η πορεία του ΑΕΠ, ο πληθωρισμός και η δημοσιονομική πολιτική.

Παρά αυτούς τους περιορισμούς, η κατεύθυνση της πρόβλεψης (συνέχεια της πτωτικής τάσης) είναι συνεπής σε όλα τα μοντέλα που εξετάστηκαν, γεγονός που ενισχύει την αξιοπιστία του συμπεράσματος. Η Ελλάδα φαίνεται να κινείται σταθερά προς χαμηλότερη ανεργία, αλλά παραμένει σε επίπεδα σημαντικά υψηλότερα από τον ευρωπαϊκό μέσο όρο (περίπου 6% τον ίδιο μήνα), υπενθύμιση ότι η πλήρης ανάκαμψη από την κρίση του 2010 δεν έχει ακόμα ολοκληρωθεί.

Φωτογραφία από τον χρήστη Rosy / Bad Homburg / Germany από το Pixabay.