Πρώτο άρθρο!

Το πρώτο μου άρθρό στη προσωπική μου σελίδα χρησιμοποιώντας το Quarto.
Πρώτο άρθρο
Συντάκτης

stesiam

Δημοσιεύτηκε στις

27 Ιουλίου 2022

Γεια σας!

Επιτέλους, έφτιαξα την ιστοσελίδα μου χρησιμοποιώντας το Quarto. Αυτή τη στιγμή η σελίδα φιλοξενείται μέσω του GitHub Pages.

Η αφορμή

Όντας φοιτητής ενός τμήματος Στατιστικής ξεκίνησα να αποκτώ τα πρώτα μου ερεθίσματα μέσω της σχολής. Τα πρώτα χρόνια της σχολής ασχοληθήκαμε με αρκετή θεωρία όσον αφορά τη Στατιστική, τις Πιθανότητες, τις Ασφαλίσεις και τον Αναλογισμό. Έτσι είχα πάρει τις πρώτες σημαντικές βάσεις. Βέβαια μου έλειπε το πιο σημαντικό χαρακτηριστικό για έναν Στατιστικό, να μπορώ να δώσω υπόσταση στις γνώσεις και να μπορώ να εφαρμόζω τις αντίστοιχες στατιστικές τεχνικές. Η σχολή έδινε πολύ μικρή σημασία σε αυτά με μόνο δύο μαθήματα το ένα σε Excel και το άλλο σε SPSS. Το μάθημα του SPSS ήταν αρκετά καλό, αλλά δεν ήταν σε καμία περίπτωση αντίστοιχο των γνώσεων, ούτε ανταποκρινόταν στις σύγχρονες ανάγκες της αγοράς εργασίας. Εκτός από ατό το SPSS σαν λογισμικό έχει αρκετά αρνητικά στοιχεία που το καθιστούν αρκετά κακή επιλογή, μεταξύ των οποίων ότι δεν μπορείς να προσαρμόσεις το μοντέλο σου, δεν βλέπεις τον τρόπο με τον οποίο προκύπτουν τα αποτελέσματα και βεβαίως δεν είναι δωρεάν. Το 2018 με 2019, ξεκίνησα να ψάχνω για εναλλακτικές, καθώς απεχθανόμουν τελείως το συγκεκριμένο πρόγραμμα. Μεταξύ άλλων βρήκα ίδιας λογικής λογισμικά με το SPSS, αλλά δωρεάν όπως το PSPP, το JASP και το jamovi, όπου προσωπικά τα δύο τελευταία τα βρήκα αρκετά αξιόλογα, ωστόσο δεν μου αρκούσαν. Κάπου εκεί ανακάλυψα ότι υπάρχει μία γλώσσα προγραμματικού που είναι επικεντρωμένη στην ανάλυση δεδομένων.

Ξανά και ξανά

Η σχέση μου με την R ξεκινάει το 2019 με αρκετά σκαμπανεβάσματα. Μπορώ να πω ότι στην αρχή μου φάνηκε αρκετά περίεργη και ως επί το πλείστον τη χρησιμοποιούσε αρκετά διαδικαστικά. Με λίγα λόγια αντέγραφα κώδικα και απλώς προσπαθούσα να καταλάβω τι κάνω. Δηλαδή, για να εκθέσω τον εαυτό μου ακόμα περισσότερο, αν ήθελα να κάνω μία σύγκριση αν οι διαφορές είναι στατιστικές σημαντικές το έψαχνα στο Google. Λόγω της ιδιαιτερότητάς της σαν γλώσσα τη χρησιμοποιούσα πιο πολύ σαν εργαλείο ανάλυσης παρά σαν γλώσσα προγραμματισμού. Οι πρώτες χρήσεις που είχα κάνει στη R ήταν κάποιοι απλοί στατιστικοί έλεγχοι και ενθουσιάστηκα ότι μπορούσα πλέον να χρησιμοποιήσω ένα εργαλείο με θεωρητικά απεριόριστες δυνατότητες σε σχέση με τα “έτοιμα” προγράμματα. Βέβαια η όλη διαδρομή ήταν αρκετά ενδιαφέρουσα με αρκετά ξενύχτια, αλλά μετά από άπειρα μηνύματα σφάλματος, άρχιζα να παρατηρώ τη σταδιακή βελτίωση.

Πρώτα βήματα

Η ενασχόληση μου με την R είχε φτάσει το επίπεδο του χόμπι. Πλέον δεν το θεωρούσα κούραση, αλλά χαιρόμουν να ανοίγω τον υπολογιστή και να μαθαίνω κάτι νέο για αυτήν. Βέβαια όλα αυτά τα έκανα από καθαρά προσωπική περιέργεια μιας και η σχολή όχι απλώς δεν ασχολιόταν τη περίοδο με την R, αλλά δεν έκανε ούτε απλή αναφορά. Στη συνέχεια ανακάλυψα το Kaggle, μία ιστοσελίδα προσηλωμένη στην επιστήμη δεδομένων. Είχε αρκετά ενδιαφέρον και εκεί άρχισα να δημοσιεύω κάποια άρθρα- notebook, γραφήματα και να πειραματίζομαι με την R. Κοιτώντας τα μετά από πολλά χρόνια τα γραφήματά μου ήταν οικτρά, αλλά τότε τα έβλεπα και χαιρόμουν. Τουλάχιστον με το καιρό βελτιώθηκα και τώρα έχω το γνώθι σ’αυτόν ότι όντως τα κάνω χάλια, αλλά τώρα το ξέρω. Άμα με παρακαλέσετε όμως μπορεί και να ανεβάζω ένα δύο να δείτε πόσο αχάμπαρος ήμουν τότε.

R vs Python

Το Kaggle ήταν αρκετά καλό και έμαθα πάρα πολλά πράγματα και υπήρχαν άνρθωποι που δούλευαν σε κολοσσούς και αναρτούσαν προσβάσιμες λύσεις για πραγματικά προβλήματα. Μέχρι και σήμερα αναρτώνται δαιγωνισμοί και πολλοί ανάρτησαν τις λύσεις σε αυτούς. Το μοναδικό πρόβλημα είναι ότι έχει υπερισχύσει η Python και το 80% του υλικού είναι για κάποια άλλη γλώσσα. Αυτό είχε ως συνέπεια η βάση των R χρηστών να συρρικνωθεί και πλέον όλο και λιγότερα άρθρα για την R να δημοσεύονται ή να καλύπτονται από τα αντίστοιχα της Python.

Εκτός πλατφόρμας

Πριν από κάποια χρόνια αποφάσισα να φτιάξω τη σελίδα μου. Αρχικά, έπρεπε να αποφασίσω με ποιον τρόπο θα τη φτιάξω. Οι επιλογές είναι πολλές και πειραματίστηκα με διάφορους τρόπους και εργαλεία. Μία λύση θα ήταν μία συμβατική ιστοσελίδα με το Wordpress κάτι το οποίο θα ήταν αρκετά ακριβό μιας και θα έπρεπε να το φιλοξενήσω σε σέρβερ και να κάνω τα ανάλογα έξοδα (10$/μήνα) για κάποιο αξιοπρπές και ασφαλές πλάνο VPS. Κάτι τέτοιο δεν άξιζε και σαν σωστός μπατίρης που είμαι έψαξα για έναν πιο φθηνό τρόπο και από ότι φαίνεται υπάρχει. Κάπου εκεί είναι που ανακάλυψα τις στατικές ιστοσελίδες και την μη ανάγκη ενός blog να έχει σέρβερ. Τέτοια παραδείγματα είναι το Hugo με τη βοήθεια του πακέτου blogdown και το Distill), τα οποία ήταν αρκετά καλά, αλλά υπήρχαν σημαντικά προβλήματα. Από τη μία το Hugo βασίζεται σε μία γλώσσα που δεν γνωρίζω (Golang), άρα αν ήθελα να κάνω κάποια αλλαγή στην ισοτσελίδα ή να προσθέσω μία λειτουργία θα μου ήταν αδύνατο. Επιπλέον, η πρώην σελίδα μου, που ήταν φτιαγμένη με το Distill, δεν ήταν φιλική στις μικρές οθόνες (non-responsive), αφού έκρυβε το κουμπί του μενού. Το Quarto έλυσε αρκετά προβλήματα που είχαν αυτοί οι δύο τρόποι και πλέον πάρα πολλοί το χρησιμοποιούν για τις ιστοσελίδες τους. Ναι, το Quarto έχει κάποιες ακόμα ελλείψεις αν το συγκρίνουμε με άλλα καθιερωμένα υποδείγματα κατασκευής ιστοσελίδας (π.χ. Astro), αλλά αυτή τη στιγμή αποτελεί ότι καλύτερο για όποιον δουλεύει σε γλώσσες ανάλυσης (R, Python, Julia) και θέλει να αναρτήσει άρθρα με βάση αυτά. Το κύριο πλεονέκτημα κατά τη γνώμη μου είναι η εκτέλεση του αρχείου ανάλυσης και προσθήκη ως άρθρου. Αν χρησιμοποιούσα ένα άλλο static site builder όπως το Astro θα έπρεπε κάθε φορά να τρέχω ξεχωριστά τον κώδικα και να αναρτώ τα αποτελέσματα ή τα γραφήματά μου σε αυτό και να το ξανατρέξω, καθιστώντας το μη παραγωγικό.

Σχήμα 1: Πακέτα για να φτιάξεις ιστοσελίδα (πριν το Quarto)

Στόχοι ιστοσελίδας

Δεδομένου ότι είναι το πρώτο μου άρθρο στην ιστοσελίδα θα ήθελα να θέσω τους στόχους μου για αυτή. Έτσι λοιπόν, σκοπεύω να :

  • γράφω άρθρα ή να κάνω αναλύσεις μηχανικής μάθησης (χρησιμοποιώντας R και Python)
  • αναρτώ επεξηγηματικά άρθρα (e.g., “Πώς να φτιάξετε την δική σας ιστοσελίδα με το Quarto” etc.)
  • παρουσιάσω (κυρίως τις εφαρμογές μου με το Shiny, etc.)
  • αναρτώ υλικό και άρθρα στα ελληνικά, μιας και δεν υπάρχει μεγάλο κοινό στην Ελλάδα και θέλω αυτό να αλλάξει
  • λύνω θέματα εξετάσεων ή έστω να λύνω αντίστοιχα με την R
  • και πολλά άλλα … οπότε μείνετε συντονισμένοι!

Σημειώσεις

Εικόνα άρθρου: R. E. Beck from Pixabay

Παραπομπή άρθρου

Allaire, J. J., Teague, C., Scheidegger, C., Xie, Y., & Dervieux, C. (2022). Quarto. https://doi.org/10.5281/zenodo.5960048
Dervieux, C., Allaire, J., Iannone, R., Presmanes Hill, A., & Xie, Y. (2022). distill: ’R Markdown’ Format for Scientific and Technical Writing. Ανακτήθηκε από https://CRAN.R-project.org/package=distill
Xie, Y., Dervieux, C., & Hill, A. P. (2022). blogdown: Create Blogs and Websites with R Markdown. Ανακτήθηκε από https://github.com/rstudio/blogdown