Συγκεντρωμένο υλικό για την R στα ελληνικά

Μία λίστα (που θα ανανεώνεται συνεχώς) με υλικό που υπάρχει ελεύθερα διαθέσιμο στο διαδίκτυο σχετικά με την γλώσσα προγραματισμού R
R
Υλικο
Συντάκτης

stesiam

Δημοσιεύτηκε στις

23 Οκτωβρίου 2022

Τροποποιήθηκε στις

22 Ιουλίου 2024

Εισαγωγή

Καλησπέρα σας.

Πρώτο άρθρο στα ελληνικά και ελπίζω να μην τα γράφω τζάμπα και κάποιος, κάπου, κάποτε να βρει αυτή τη σελίδα αν ποτέ τη χρειαστεί 😁. Εγώ προσωπικά ασχολούμαι με την από το 2018 περίπου. Ένα από τα πράγματα που με εντυπωσίασαν είναι η κοινότητά της που είναι και αρκετά πρόθυμη νέους χρήστες. Αρκετοί νέοι χρήστες έχουν βρει βοήθεια σε προβλήματα με τη γλώσσα είτε στο Stackoverflow, στο Mastodon ή στο κανάλι /rstats του Reddit. Βέβαια, η συνεισφορά της κοινότητας δεν σταματάει εκεί καθώς πολλοί έχουν συμβάλλει γράφοντας ακόμα και βιβλία για την καθιστώντας μία απαιτητική γλώσσα προγραμματισμού πιο προσβάσιμη στο ευρύ κοινό. Πλειάδα αυτών των βιβλίων διατίθεται δωρεάν στο διαδίκτυο με πιο γνωστό από όλα το R for Data Science, το οποίο ήταν και το πρώτο βιβλίο που διάβασα για την R. Εκτός από τη κοινότητα και το απεριόριστο δωρεάν υλικό, έχουν δημιουργηθεί και ομάδες που προωθούν την R ή που έχουν ως κοινό χαρακτηριστικό την R σε ομάδες που υποεκπροσωπούνται στο πεδίο της επιστήμης δεδομένων (π.χ. κοινότητες R-ladies, etc.), γεγονός που την καθιστά αρκετά συμπεριλιπτική.

Λογότυπο γλώσσας προγραμματισμού R

Στα αγγλικά η συλλογή δωρεάν υλικού είναι χαώδης και πραγματικά για το κάθε πεδίο υπάρχει και ένα βιβλίο. Ενδεικτικά, από τη σελίδα bookdown, η οποία φιλοξενεί μία από τις βασικές και εκτεταμένες συλλογές δωρεάν βιβλίων για την R (πάνω από 1500 βιβλία), μπορώ να διακρίνω βιβλία τόσο για την R και για διάφορα πακέτα της (σχετικά με την ανάλυση, οπτικοποίηση και πρόβλεψη δεδομένων), όσο και για πιο εξειδικευμένα θέματα όπως Μετα-ανάλυση, Οικονομετρία, κ.α. Ωστόσο, τι γίνεται με τη πρόσβαση σε ελληνικό περιεχόμενο για την R; Πρόσφατα (το 2024) ο Hadley Wickham με δημοσίευσή του στο Mastodon έδωσε ίσως το καλύτερο νέο για τους Έλληνες χρήστες μιας και πλέον υπάρχει και ελληνική μετάφραση του γνωστού βιβλίου R for Data Science, Η R για την Επιστήμη Δεδομένων.

Το bookdown είναι ένα λογισμικό που δίνει τη δυνατότητα στους χρήστες της R να φτιάχνουν εύκολα έγγραφα ή και βιβλία. Η χρήση της συνεπώς γίνεται ως επί το πλείστον από χρήστες της R. Ωστόσο, στη συλλογή δεν αποκλείεται να δείτε και άσχετα βιβλία ή ακόμα και βιβλία για τη Python.

Βέβαια δεν είναι μόνο το βιβλίο RfDS, αφού και άλλοι μικροί ήρωες της καθημερινότητας έχουν προσφέρει υλικό για την R στα ελληνικά. Προκειμένου να συμπεριληφθεί κάτι στη σελίδα θα πρέπει να πληρεί τις εξής προϋποθέσεις :

  1. Να είναι δωρεάν
  2. Να είναι στα ελληνικά
  3. Να είναι κατανοητό για όλο το φάσμα των χρηστών της R

Βιβλία για την R

Συνολικά 6 βιβλία έχουν βρεθεί να είναι ελεύθερα διαθέσιμα ηλεκτρονικά. Τα τέσσερα από τα έξι αποτελούν βιβλία από το Κάλλιπο, όπου διαθέτει ηλεκτρονικά συγγράμματα για διάφορα επιστημονικά πεδία.

Τίτλος βιβλίου Συγγραφέας Σύνδεσμος
R για την Επιστήμη Δεδομένων
(2η έκδοση)
Hadley Wickham
Mine Çetinkaya-Rundel
Garrett Grolemund
P Togias (tr)
MT Pandi (tr)
Σύνδεσμος
Εισαγωγή στην R Πρόχειρες σημειώσεις Φωκιανός, Κ.
Χαραλάμπους, Χ.
Σύνδεσμος
(απευθείας κατέβασμα)
Εισαγωγή στον προγραμματισμό και στη στατιστική ανάλυση με R Ντζούφρας, Ι.
Καρλής, Δ.
Σύνδεσμος
Η επιστήμη των δεδομένων μέσα από τη γλώσσα R Βερύκιος, Β.
Καγκλής, Β.
Σταυρόπουλος, Η.
Σύνδεσμος
Εισαγωγή στην επιχειρησιακή έρευνα και στον γραμμικό προγραμματισμό Κουνέτας, Κ
Χατζησταμούλου, Ν.
Σύνδεσμος
Εισαγωγή στην εκπαιδευτική και ψυχολογική μέτρηση με τη χρήση της R Albano, A.
Markos, A. (tr)
Σύνδεσμος

Όπως είναι προφανές, οι επιλογές μας σε σχέση με το υλικό που υπάρχει στα αγγλικά (ελεύθερα διαθέσιμο) είναι αρκετά περιορισμένες. Ωστόσο, υπάρχουν κάποιες πολύ καλές επιλογές (ανάλογα το επίπεδο και τον σκοπό του χρήστη).

Η καλύτερη επιλογή (από το 2024) κατά τη γνώμη μου είναι το πλέον μεταφρασμένο βιβλίο R for Data Science, Η Επιστήμη Δεδομένων με την R. Αυτό το βιβλίο κατά τη γνώμη μου είναι το πιο πλήρες καθώς μας βάζει στη λογική ότι θα πρέπει η ανάλυση των δεδομένων δεν είναι απλά ένα διάγραμμα ή ένα μοντέλο. Αυτό είναι το αποτέλεσμα της ανάλυσης. Το βιβλίο με πολύ ωραίο τρόπο περιγράφει τη διαδικασία που προηγείται αυτού, όπως τη συλλογή, τη μεταφόρτωση των δεδομένων. Συνεχίζει με τον μετασχηματισμό αυτών προκειμένου να αποκτήσουν μορφή έτοιμη για ανάλυση. Τέλος, αξίζει να σημειωθεί ότι το βιβλίο δίνει έμφαση στο μετα-πακέτο (συλλογή από πακέτα) tidyverse, που είναι το πιο ευρέως χρησιμοποιούμενο στις μέρες μας και περιέχει αρκετά γνωστά πακέτα όπως το readr (μεταφόρτωση δεδομένων), dplyr (μετασχηματισμό δεδομένων), tidyr (τακτοποίηση δεδομένων), ggplot (οπτικοποίηση) κ.α. Αυτό είναι αρκετά σημαντικό καθώς ορισμένα από τα επόμενα βιβλία είναι αρκετά πιο παλιά και βασίζονται στη λεγόμενη base R (εντολές που περιλαμβάνονται στην R) για την όποια ανάλυση. Κατά τη γνώμη μου η χρήση του tidyverse είναι προτιμητέα αρχικά επειδή υπάρχει πολύ διαθέσιμο υλικό (ιστοσελίδες / documentation) έχει αρκετή υποστήριξη (τόσο από τη κοινότητα της R, όσο και από την Posit, πρώην RStudio) και είναι αρκετά πιο εύκολη στη χρήση. Αν δεν σας έχω πείσει ακόμα να σας ενημερώσω ότι πολλά από τα εντυπωσιακά διαγράμματα που βλέπετε κατά καιρούς στο Twitter (συνήθως στο hashtag #TidyTuesday) ή σε εφημερίδες / τηλεοπτικά δίκτυα (π.χ. BBC) χρησιμοποιούν το πακέτο ggplot2 της R για τα γραφήματά τους.

Εξώφυλλο πρωτότυπης έκδοσης RfDS

Εξώφυλλο πρωτότυπης έκδοσης RfDS

Η δεύτερη επιλογή μου (και η μέχρι πρότινος αγαπημένη μου που δεν υπήρχε η μετάφραση του RfDS) είναι το βιβλίο “Εισαγωγή στην R - Πρόχειρες σημειώσεις” . Είναι ένας συνδυασμός σημειώσεων και εφαρμογής των εντολών για κατηγορίες προβλημάτων. Αναφέρεται σε ένα μεγάλο εύρος θεμάτων (κυρίως στατιστικής), από τα πιο απλά (έλεγχοι t-test) μέχρι πιο σύνθετα θέματα (ανάλυση κατά συστάδες). Πολύ καλό για φοιτητές στατιστικής (μάλλον για αυτό μου αρέσει).

Η τρίτη επιλογή “Εισαγωγή στον προγραμματισμό και στη στατιστική ανάλυση με R” των Καρλή & Ντζούφρα κινείται σε παρόμοια νερά. Είναι ένα βιβλίο που με προβλημάτισε κάπως. Αυτό το βιβλίο είχε τα φόντα να γίνει το προσωπικό μου αγαπημένο, διότι δεν σου δείχνει απλά τις εντολές. Σου μαθαίνει να προγραμματίζεις με την R, αφού δίνει μεγαλύτερη σημασία σε ελέγχους ροής, συναρτήσεις και άλλα θέματα. Αυτό είναι πολύ σημαντικό, αν θες να φτιάξεις κάτι πιο περίπλοκο (π.χ. μία περίπλοκη ανάλυση, ένα πακέτο στην R, κτλ.). Αν και προγραμματισμός μαθαίνεται κυρίως κάνοντας και όχι διαβάζοντας πιστεύω ότι είναι μία καλή προσθήκη στη λίστα.

Εξώφυλλο Καρλή & Ντζούφρα (2015)

Εξώφυλλο Καρλή & Ντζούφρα (2015)

Η τρίτη μου επιλογή είναι το “Επιστήμη των δεδομένων μέσα από τη γλώσσα R”. Πιθανότατα αυτό το βιβλίο πλησιάζει περισσότερο στη λογική των notebooks και στο να ανεβάσεις δικά σου project. Σε βάζει σε μία λογική να αρχίσεις να κάνεις αναλύσεις. Καλό, αν κάποιος θέλει να φτιάξει τα δικά του project, προκειμένου κάποτε να βρει μία δουλειά (εγώ με αυτή την ελπίδα ζω ακόμα). Προσωπικά πιστεύω ότι είναι καλό για κάποιον που έχει ήδη κάποια εξοικείωση στην R.

Τα τελευταία 2 βιβλία της λίστας μου ασχολούνται με πιο εξειδικευμένα θέματα και γίνεται χρήση της R συνεπικουρικά. Κάτι τέτοιο δεν καθιστά τα βιβλία ως ακατάλληλα, απλώς η χρήση αυτών να ενδείκνυται σε πιο προχωρημένους χρήστες.

Βίντεομαθήματα για την R

Όνομα καναλιού Σύνδεσμος
Christos Malliarakis Σύνδεσμος

Πέρα όμως από τα βιβλία έψαξα να βρω και υλικό για την R στο Youtube. Το υλικό είναι επίσης αρκετά περιορισμένο. Προς το παρόν θα αφήσω μία επιλογή η οποία είναι και η πιο πλήρης. Στη σειρά βιντεομαθημάτων (playlist) του κ. Χρήστου Μαλλιαράκη γίνεται μία αναφορά σε βασικά στοιχεία της R ενώ σε επόμενα μαθήματα ασχολείται με κάποια απλά παραδείγματα μηχανικής μάθησης.

Επίλογος

Προφανώς η συμπερίληψη ελληνικών πηγών είναι ενθαρρυντική, τόσο για τη δημοφιλία της R στην Ελλάδα, όσο και για την δημιουργία ενεργής κοινότητας. Ωστόσο, σε καμία περίπτωση δεν μπορεί να αποτελέσουν αυτές οι πηγές εναλλακτική, αλλά μία χρήσιμη προσθήκη. Συνοπτικά, αν είστε ένας χρήστης που θέλει να μάθει την R σας προτείνω το βιβλίο R for Data Science καθώς είναι το μόνο βιβλίο που χρησιμοποιεί τα πιο πρόσφατα πακέτα της. Τα υπόλοιπα βιβλία χρησιμοποιούν ως επί το πλείστον εντολές που βασίζονται στη base R, το οποίο δεν είναι απαραίτητα κακό, αλλά η R έχει εξελιχθεί και πλέον υπάρχουν αποδοτικότεροι τρόποι/πακέτα για να κάνουμε μία αντίστοιχη ανάλυση.

Καλό διάβασμα. 📖

Αναφορά

BibTeX citation:
@online{2022,
  author = {, stesiam},
  title = {Συγκεντρωμένο υλικό για την R στα ελληνικά},
  date = {2022-10-23},
  url = {https://stesiam.com/posts/greek-material-for-r/},
  langid = {el}
}
Εναλλακτικά, μπορείτε να αναφερθείτε στο παραπάνω άρθρο ως εξής:
stesiam. 2022. “Συγκεντρωμένο υλικό για την R στα ελληνικά.” October 23, 2022. https://stesiam.com/posts/greek-material-for-r/.