Εισαγωγή
Σε αυτό το άρθρο θα ήθελα να αναλύσω τα δεδομένα των φοιτητών στο τμήμα μου, Στατιστική και Ασφαλιστική στο Πειραιά. Ο πρόσφατος οδηγός σπουδών περιλαμβάνει δεδομένα σχετικά με όσους επιβιώνουν (αποφοιτούν) από τη σχολή όπως το μέσο βαθμό αποφοίτησης και τα έτη που χρειάστηκαν για αυτή. Αρχικά, παρατηρούμε ότι τα δεδομένα για τα οποία ενδιαφερόμαστε είναι σε μία σχετικά οργανωμένη μορφή, σε πίνακες (το οποίο είναι καλό), βέβαια δεν τα έχουμε σε μορφή αρχείου, αλλά είναι μέρος ενός αρχείου pdf (το οποίο δεν είναι καλό). Ευτυχώς, ανάμεσα σε αυτό το χάος 20,000 και πλέον πακέτων υπάρχει και το πακέτο {tabulizer} που δίνει τη λύση σε τέτοιου είδους προβλήματα μιας και μπορεί να διαβάσει τους πίνακες εντός αρχείων pdf.
Το άρθρο είναι λίγο παλιό. Το πακέτο όταν είχα γράψει αυτό το άρθρο λεγόταν {tabulizer}. Λίγα χρόνια αργότερα, όταν επιχείρησα να κάνω μερικές αλλαγές παρατήρησα ένα σφάλμα στο συγκεκριμένο άρθρο. Το πακέτο πλέον έχει μετονομαστεί και μπορείτε να το βρείτε ως {tabulapdf}. Επομένως, προσέξτε το καθώς διάφορες πηγές στο διαδίκτυο ακόμα αναφέρονται σε αυτό με το παλιό όνομα.
Εισαγωγή βιβλιοθηκών
Όπως εξηγήσαμε και προηγουμένως, δεδομένου ότι θα πρέπει να εξάγω δεδομένα και ιδιαίτερα πίνακες από αρχείο pdf, το πακέτο tabulizer (νυν {tabulapdf}) είναι απαραίτητο. Δυστυχώς, καθώς προσπαθούσα να το εγκαταστήσω λάμβανα συνεχώς ένα μήνυμα σφάλματος παρόμοιο με αυτό. Το πρόβλημα φαίνεται να σχετιζόταν με το πακέτο {rJava} και προκειμένου να επιλύσω το πρόβλημα ακολούθησα τις επισημάνσεις αυτού του σχολίου. Έπειτα από την εγκατάσταση του {rJava}, κατάφερα να εγκαταστήσω το πακέτο.
Εξαγωγή δεδομένων
Ο οδηγός σπουδών ξεκινάει δίνοντας κάποιες πληροφορίες για το πανεπιστήμιο, συνεχίζει με βασικά στοιχεία της σχολής, το εκπαιδευτικό προσωπικό, τις προϋποθέσεις για τη λήψη πτυχίου και συνεχίζεται με αναλυτικότερα περιγραφή κάθε μαθήματος του τμήματος. Στο τέλος του οδηγού σπουδών του τμήματός μας έχει καθιερωθεί να δημοσιεύονται κάποια βασικά στατιστικά στοιχεία των φοιτητών. Θα ασχοληθούμε με τον πρόσφατα αναρτημένο οδηγό σπουδών του 2022, όπου περιέχει δεδομένα των εισαγωγών στο τμήμα, των αποφοίτων, της δομής των σπουδαστών και άλλα δεδομένα από το 2004. Όπως είναι εμφανές απλά μας ενδιαφέρουν οι τελευταίες σελίδες, από έναν πολυσέλιδο οδηγό σπουδών μιας και αποτελείται από 200 σελίδες. Θα ξεκινήσουμε κατεβάζοντας τον οδηγό από τον δοσμένο σύνδεσμο και στη συνέχεια θα επιλέξω με τη βοήθεια του πακέτου pdftools τις τελευταίες σελίδες, από την 186η μέχρι την 190η σελίδα, ώστε να εξαγάγω στη συνέχεια μόνο τους απαραίτητους πίνακες.
Αυτός ο περιορισμός είναι αρκετά σημαντικός έτσι ώστε να μειώσω το διάστημα αναζήτησης για τους πίνακες, συνεπώς έχω μια πιο γρήγορη εκτέλεση της εντολής (5 σελίδες αντί για 200). Στη συνέχεια αναλαμβάνει έργο το πακέτο tabulapdf από το οποίο θα χρειαστούμε την εντολή extract_tables που συλλέγει όλους τους πίνακες από ένα pdf και τους συγκεντρώνει σε μία λίστα. Στη δικιά μας περίπτωση εντοπίστηκαν πέντε πίνακες συνεπώς έλαβα ως αποτέλεσμα μία λίστα που περιείχε πέντε data.frames - πίνακες δεδομένων. Είναι εκπληκτικό ότι μέσα σε λίγα δευτερόλεπτα έλαβα όλη τη πληροφορία σε μία μορφή έτοιμη για ανάλυση. Αν προσπαθούσα να εισάγω τα δεδομένα με πιο παραδοσιακούς τρόπους, όπως αντιγραφή - επικόλληση θα είχα ξοδέψει πάνω από 1 ώρα!
Εισακτέοι φοιτητές
Ο πρώτος πίνακας που έχω λάβει είναι σχετικά με τους εισακτέους φοιτητές, δηλαδή με όσους επιτυγχάνουν να εγγραφούν στη σχολή. Για να εγγραφείς σε μία σχολή υπάρχουν τρεις βασικοί τρόποι. Ο πρώτος και ο πιο διαδεδομένος τρόπος είναι μέσω Πανελληνίων εξετάσεων, όπου διαγωνίζεσαι με όλους τους μαθητές της Γ Λυκείου για την εισαγωγή στη τριτοβάθμια εκπαίδευση. Ο δεύτερος τρόπος είναι αν είσαι ήδη πτυχιούχος, έχεις το δικαίωμα αντί να περάσεις το μαρτύριο των Πανελληνιών να δώσεις εξετάσεις στη σχολή που σε ενδιαφέρει. Συνήθως αυτές οι εξετάσεις διοργανώνονται από την ίδια τη σχολή και όχι από το κράτος όπως στις πανελλήνιες και στις περισσότερες σχολές προγραμματίζονται τον Δεκέμβριο. Μία τρίτη επιλογή είναι να πάρεις μεταγραφή. Αν έχεις περάσει σε ένα τμήμα για το οποίο υπάρχει ένα ομοειδές σε άλλη πόλη μπορείς να ζητήσεις μεταγραφή σε άλλο τμήμα, ωστόσο οι θέσεις είναι περιορισμένες και τα κριτήρια πάρα πολύ αυστηρά. Αν θέλετε να διαβάσετε τη λίστα με τις αντιστοιχίες των σχολών μπορείτε να πατήσετε εδώ. Για παράδειγμα, στο τμήμα μας (Στατιστική, Πειραιά) ερχόντουσαν να παρακολουθήσουν μαθήματα φοιτητές του Στατιστικού του Πανεπιστημίου Αιγαίου στη Σάμο, μιας και ήλπιζαν ότι θα πάρουν μεταγραφή στο δικό μας τμήμα που είναι κοντά στην Αθήνα. Συνολικά, το Υπουργείο Παιδείας έχει αντιστοιχίσει 4 τμήματα στο πεδίο της Στατιστικής, ως αντίστοιχα και από όσο ξέρω δεν υπάρχουν άλλα στην Ελλάδα (σε προπτυχιακό επίπεδο τουλάχιστον).
Διάγραμμα (organization chart): Τρόποι εισαγωγής στη τριτοβάθμια εκπαίδευση — Πανελλήνιες (ΕΠΑΛ, Λύκεια), Κατατακτήριες, Μεταγραφή (Κριτηρίων, Αμοιβαία)
Αφού κάναμε μία σύνοψη των τρόπων εισαγωγής στα τμήματα τριτοβάθμιας εκπαίδευσης ας δούμε τι ισχύει στο δικό μας τμήμα με βάση τα δημοσιευμένα στοιχεία.
Στη σχολή μας οι συνολικοί εισακτέοι από όλες τις κατηγορίες κυμαίνονταν στους 200 μέχρι 250 μέχρι το ακαδημαϊκό έτος 2012-2013. Τα επόμενα δύο έτη έσπασε το φράγμα των 250 εισακτέων. Στη συνέχεια η κατάσταση επανήλθε στα προαναφερόμενα όρια μέχρι το 2019, όπου είχαμε ιστορικό ρεκόρ εισαγωγών στο τμήμα με 292 εισακτέους. Μία σημαντική παρατήρηση που έκανα είναι πόσο όμοιο είναι το σχήμα της γραμμής μεταξύ και πόσο ταυτίζονται οι καμπύλες των συνολικών φοιτητών με αυτή των μεταγραφών, στην ουσία είναι ο απρόβλεπτος παράγοντας για την όποια ισχυρή διακύμανση των εισακτέων.
Διάγραμμα (stacked areaspline — απόλυτες τιμές): Συνολικές εγγραφές φοιτητών ανά ακαδημαϊκό έτος — Πανελλήνιες, Μεταγραφή, Κατατακτήριες, Άλλο
Αφού μελετήσαμε τις απόλυτες τιμές των επιτυχόντων, ωστόσο ο αριθμός των φοιτητών αυτή τη τελευταία 20ετία κυμαίνεται μεταξύ του 200 και του 300 που κάνει τη σύγκριση μεταξύ των ετών δύσκολη. Έτσι θα υπολογίσω και τη ποσοστιαία συμμετοχή κάθε κατηγορίας ανά έτος. Ένα πολύ ενδιαφέρον στοιχείο είναι ότι κάποια ακαδημαϊκά έτη ο αριθμός των φοιτητών που εισήλθαν στο τμήμα εκτός Πανελληνίων Εξετάσεων προσέγγιζε το ένα τρίτο των συνολικών εγγραφών. Αυτό φαίνεται να έχει συμβεί σε δύο ακαδημαϊκά έτη, το 2010-2011 και το 2013-2014.
Διάγραμμα (stacked areaspline — ποσοστά %): Ποσοστιαία κατανομή εγγραφών ανά κατηγορία εισαγωγής — Πανελλήνιες, Μεταγραφή, Κατατακτήριες, Άλλο
Πληθυσμός φοιτητών
Ένας δημογραφικός δείκτης που μπορεί να μας δώσει μία αδρή ένδειξη για τη κατάσταση στο τμήμα είναι σίγουρα ο αριθμός των σπουδαστών του. Αυτό είναι πολύ απλό αν αναλογιστούμε τις επιπτώσεις από έναν αρκετά μεγάλο αριθμό ατόμων προς φοίτηση με δεδομένους πόρους. Ο συντριπτικός όγκος φοιτητών είναι προπτυχιακοί με ποσοστό 95%. Το ποσοστό θα μπορούσαμε να πούμε είναι λογικό και αναμέναμε να υπερισχύουν οι προπτυχιακοί μιας και ο κύκλος σπουδών τους είναι μεγαλύτερος των μεταπτυχιακών. Επιπλέον, στο τμήμα προσφέρονται μόνο δύο (επί πληρωμή) μεταπτυχιακά προγράμματα που καθιστά δυσκολότερη την ομαλότερη ροή σε σπουδές υψηλότερων σπουδών ως προς την αναλογία των σπουδαστών.
Το στοιχείο που αξίζει ιδιαίτερης αναφοράς δεν είναι η αναλογία, αλλά ο απόλυτος αριθμός των σπουδαστών προπτυχιακού επιπέδου. Δυστυχώς, τα τελευταία χρόνια ο δείκτης εξακολουθεί να αυξάνεται ανεξέλεγκτα έχοντας ξεπεράσει του 3000 φοιτητές! Η μόνη χρονιά που μειώθηκε ο αριθμός τους είναι κατά την εξεταστική της πανδημίας COVID-19, η οποία διεξήχθη ηλεκτρονικά.
Διάγραμμα (stacked areaspline — απόλυτες τιμές): Συνολικός πληθυσμός φοιτητών του τμήματος — Προπτυχιακοί, Μεταπτυχιακοί, Διδακτορικοί
Βέβαια το γράφημα δεν είναι αρκετά σαφές για τους φοιτητές εκτός των προπτυχιακών μιας και το ποσοστό τους είναι συγκριτικά πολύ μικρότερο. Έτσι λοιπόν θα απομονώσω τους μεταπτυχιακούς και τους διδακτορικούς φοιτητές.
Διάγραμμα (stacked areaspline — απόλυτες τιμές): Αριθμός φοιτητών μεταπτυχιακών και διδακτορικών — Μεταπτυχιακό Εφαρμοσμένη Στατιστική, Μεταπτυχιακό Αναλογιστικά, Διδακτορικοί
Κατανομή βαθμών αποφοίτησης
Όλα τα παραπάνω στοιχεία ήταν κατά κάποιο τρόπο δημογραφικά και δεν είχαν και κάποια ιδιαίτερη αξία. Πάμε λοιπόν να εξετάσουμε το πρώτο ενδιαφέρον στοιχείο που είναι η κατανομή των βαθμών αποφοίτησης. Στα στοιχεία που δημοσιεύει το τμήμα οι βαθμοί έχουν χωριστεί σε τέσσερις κατηγορίες ανάλογα του βαθμού περάτωσης σπουδών:
- Από τη βάση (5) μέχρι 6
- Από 6 έως 7
- Από 7 μέχρι 8.5 και
- αυτοί που πήραν πάνω από 8.5
Από τα στοιχεία προκύπτει μία ιδιαίτερα ανισόρροπη κατανομή των βαθμών. Αρχικά παρατηρούμε ότι το ποσοστό των ατόμων που αποφοιτούν με «Άριστα» είναι ιδιαίτερα μικρό που μετά βίας είναι ορατό στο διάγραμμα. Το ποσοστό των αποφοίτων με άριστα κυμαίνεται μεταξύ του 4.8% των συνολικών αποφοίτων του αντίστοιχου ακαδημαϊκού έτους έως και 0%, μιας και υπήρχαν έτη χωρίς αριστεύσαντες πτυχιούχους. Άλλο ένα προβληματικό στοιχείο είναι η λήψη πτυχίου με τους χαμηλότερους δυνατούς βαθμούς (κατηγορία βαθμών από 5 μέχρι 6), μιας και ιστορικά είχαμε τέτοια αποφοίτηση ακόμα για άνω του ένα τρίτου των συνολικών αποφοίτων. Αναμφίβολα, όλα τα παραπάνω είναι κατά κάποιο τρόπο λίγο αναμενόμενα σε συνάρτηση με τη δυσκολία της σχολής και του αντικειμένου. Αυτό που ενδεχομένως δηλώνει προβλήματα της ίδιας της σχολής είναι όταν χωρίσουμε τους βαθμούς σε δύο μεγάλες κατηγορίες, η μία οι φοιτητές που αποφοίτησαν με βαθμό άνω του 7 και η άλλη ομάδα όσοι αποφοίτησαν με βαθμό κάτω από 7. Εκεί παρατηρούμε επί σειρά ετών ότι οι απόφοιτοι της δεύτερης ομάδας αποτελούν το 80% και υπήρχαν πρόσφατα έτη που αποτελούσαν το 90% αυτών. Ενδεικτικά αναφέρονται τα ακαδημαϊκά έτη 2009-2010, 2012-2013, 2016-2017 & 2017-2018, ως κάποια με τις χειρότερες επιδόσεις.
Διάγραμμα (stacked areaspline — ποσοστά %): Κατηγορίες βαθμών αποφοίτησης — Βαθμός 5–6, 6–7, 7–8.5, 8.5+
Κατανομή έτους αποφοίτησης
Ένας από τους πιο απογοητευτικούς δείκτες για τη σχολή μας είναι πόσα έτη χρειάζονται σε κάποιον για να αποφοιτήσει. Αυτός ο δείκτης είναι πλέον σημαντικός για πολλούς λόγους. Αρχικά η Ελλάδα έχει ψηφίσει πρόσφατα τη διαγραφή των φοιτητών και πλέον υπάρχει όριο στη φοίτηση, το οποίο υπολογίζεται ως εξής:
όπου
Διάγραμμα (stacked areaspline — ποσοστά %): Κατανομή διάρκειας σπουδών μέχρι αποφοίτηση — 4 έτη, 5–6 έτη, 7–8 έτη, 9+ έτη
Σχέση ετών και μέσου όρου
Οι κατανομές των βαθμών καθώς και των ετών περάτωσης είναι αρκετά κατατοπιστικές για να γίνει αντιληπτή η άσχημη κατάσταση στο τμήμα. Για το τέλος θα ήθελα να παρουσιάσω ένα διπλό διάγραμμα που παρουσιάζει τη μέση διάρκεια σπουδών και το μέσο βαθμό αποφοίτησης. Έτσι θα έχουμε και μία εικόνα του που κυμαίνεται ιστορικά ο μέσος απόφοιτος του τμήματος. Ιστορικά, παρατηρείται μια ιδιαίτερη σταθερότητα ως προς το βαθμό του πτυχίου ο οποίος έχει ιδιαίτερα μικρή απόκλιση από το 2009 μέχρι και το 2020, αφού κυμαίνεται μεταξύ 6.3 και 6.43 για μία ολόκληρη δεκαετία. Από την άλλη έχουμε για άλλη μία φορά τον πιο καταθλιπτικό δείκτη, αυτόν της μέσης διάρκειας σπουδών. Από το 2014 έχουμε συνεχή αύξηση του δείκτη και μέσα σε 4 ακαδημαϊκά έτη είχαμε αύξηση 1.6 έτη και διατήρηση του σε αυτά τα επίπεδα. Πλέον, η μέση διάρκεια όχι απλώς αποκλίνει του ν+2, αλλά συγκλίνει στο 2ν, δηλαδή οι φοιτητές του τμήματος χρειάζονταν τα διπλάσια χρόνια από τη προκαθορισμένη διάρκεια σπουδών (4 έτη) για να λάβουν το πτυχίο τους. Αξίζει να σημειωθεί ότι όλο τον χρονικό ορίζοντα που καταγράφεται ο δείκτης δεν έπεσε ποτέ κάτω του ορίου
Διάγραμμα (dual-axis line chart): Βαθμός αποφοίτησης (αριστερός άξονας) και μέση διάρκεια σπουδών σε έτη (δεξιός άξονας) ανά ακαδημαϊκό έτος
Στατιστικό vs Στατιστικό
Η χώρα μας έχει συνολικά τέσσερα τμήματα από τα οποία μπορεί κάποιος να βγει στατιστικός. Στις προηγούμενες ενότητες ανέλυσα τα στοιχεία των αποφοίτων στατιστικής για το τμήμα του Πειραιά μιας και είναι το μόνο για το οποίο βρήκα αναλυτικά στοιχεία. Από την άλλη μεριά θα ήθελα να επεκτείνω αυτή την ανάλυση και ως προς τη σύγκριση των ομοειδών τμημάτων. Το ιδανικό μέτρο αναφοράς θα ήταν ο μέσος χρόνος αποφοίτησης ανά έτος αποφοίτησης, ωστόσο τέτοια στοιχεία δεν είναι διαθέσιμα σε κάθε τμήμα. Για αυτό το λόγο θα χρησιμοποιήσουμε τα στοιχεία της ΕΛΣΤΑΤ και πιο συγκεκριμένα τα στοιχεία των κατανομών των ετών φοίτησης των εν ενεργεία προπτυχιακών φοιτητών. Έτσι θα καταλήξουμε σε δύο μεγέθη, τον αριθμό των φοιτητών που δεν έχουν υπερβεί τα ν+2 έτη και τους υπόλοιπους. Η σύγκριση των τμημάτων θα γίνει ως προς το ποσοστό των φοιτητών άνω των ν+2 ετών ως προς το σύνολο των προπτυχιακών ενός τμήματος.
Πίνακας (gt): Ποσοστό φοιτητών που υπερβαίνουν το ν+2 στα τμήματα Στατιστικής — κατάταξη, πανεπιστήμιο, τμήμα, % ν+2 (ΕΛΣΤΑΤ δεδομένα)
Στη προκειμένη περίπτωση παρατηρείται ότι το τμήμα του Πειραιά είναι μακράν το τμήμα με τους περισσότερους αιώνιους ως ποσοστό του προπτυχιακού πληθυσμού, με τρεις στους τέσσερις να είναι 7ο έτος και πάνω. Η επίδοση αυτή δεν είναι απλώς κακή σε πανελλήνιο επίπεδο (29η), αλλά αρκετά χειρότερη από τα άλλα ομοειδή τμήματα. Το τμήμα της Αθήνας έχει 15 ποσοστιαίες χαμηλότερο τέτοιο ποσοστό (61%), ακολουθούμενο από το τμήμα του Αιγαίου με ένα στους δύο να έχουν υπερβεί τα ν+2 έτη. Το τελευταίο τμήμα Στατιστικής είναι αυτό της Δυτικής Μακεδονίας και τα αποτελέσματά του χρειάζονται μερικές διευκρινίσεις. Το τμήμα έχει ιδρυθεί σχετικά πρόσφατα (2019), επομένως δεν έχει προλάβει να «παράγει» φοιτητές μεγαλύτερων ετών.
Στατιστική vs Υπόλοιπες Ειδικότητες
Οκ. Το καταλάβαμε, αν σπουδάσουμε στο ΠαΠει σκούρα (εώς και μουτζούρα) τα πράγματα. Αλλά αλήθεια πώς συγκρίνονται αυτά τα τμήματα με τις υπόλοιπες σχολές ή πεδία; Τελικά ποιο πεδίο συγκεντρώνει φοιτητές μεγαλύτερων ετών στη χώρα μας και τι θα μπορούσε να σημαίνει αυτό;
Πίνακας (gt): Κατανομή ποσοστού φοιτητών ν+2 ανά κατηγορία σχολής — Κατάταξη, Κατηγορία, Τμήματα, Min, Q1, Διάμεσος, Q3, Max
Βέβαια, θα ήθελα να προειδοποιήσω για τυχόν λανθασμένες ή βεβιασμένες ερμηνείες στον παραπάνω πίνακα. Το ότι ένα πεδίο έχει υψηλό αριθμό φοιτητών μεγαλύτερου έτους δεν είναι απόδειξη της δυσκολίας ενός τμήματος. Βεβαίως, μπορεί να αποτελέσει μία σημαντική ένδειξη. Το πρόβλημα με την συγκεκριμένη βεβιασμένη σύνδεση «ποσοστό αιώνιων - δυσκολία τμήματος» έγκειται στο γεγονός ότι οι σπουδές στην Ελλάδα έχουν έναν πιο ευέλικτο χαρακτήρα επιτρέποντας σε κάποιον να σταματήσει τις σπουδές του και να επανέλθει σε αυτές αργότερα. Οι λόγοι όμως που κάποιος μπορεί να καθυστερεί να λάβει πτυχίο μπορεί να είναι αρκετοί και πέραν της δυσκολίας της σχολής. Ίσως το ίδιο το αντικείμενο της σχολής να αποτελεί έναν σημαντικό λόγο για τη δημιουργία ιδιαίτερα υψηλού αριθμού αναβαλόμενης αποφοίτησης. Για παράδειγμα φοιτητές να διακρίνουν ότι το τμήμα τους να μην έχει ενδιαφέρον ή να μην έχει σημαντικές προοπτικές επαγγελματικής αποκατάστασης έχοντας χαμηλό κίνητρο μελέτης και συνεπακόλουθα αποφοίτησης. Προφανώς, υπάρχουν και άλλοι λόγοι για τους οποίους κάποιος να αναβάλει τις σπουδές του, όπως οικογενειακοί λόγοι, υγείας κ.α. Ωστόσο, δεν υπάρχει κάποιος ιδιαίτερος λόγος ότι αυτοί οι παράγοντες επηρεάζουν κάποια σχολή σε μεγαλύτερο βαθμό ή τουλάχιστον δεν έχω τέτοια στοιχεία για να το ελέγξουμε.