Σύνοψη Κατανομών
Τι είναι οι κατανομές;
Μία βασική έννοια στη Στατιστική είναι αυτή των κατανομών. Με δεδομένο ότι δεν είναι μία λέξη που χρησιμοποιείται ευρέως στη καθημερινότητα ενδεχομένως με το που την ακούσει κάποιος να του προκαλέσει μία απορία ή μία σύγχηση για το ότι είναι κάποιος περίπλοκος όρος. Στη καθομιλουμένη ίσως να έχουμε χρησιμοποήσει τον όρο όταν αναφερόμαστε πώς κατανέμουμε, δηλαδή μοιράζουμε - μία ομάδα ανθρώπων. Παραδείγματος χάριν:
- τα παιδιά ενός σχολείου σε τάξεις
- τα ύψη των ανθρώπων στο γενικό πληθυσμό
Άρα με τον όρο κατανομές προσπαθούμε να περιγράψουμε τον τρόπο με τον όποίο μοιράζεται το δείγμα ή ο πληθυσμός που εξετάζω. Μία απλοϊκή ανάλυση είναι με βασικά μέτρα θέσης και διασποράς και κύρτωσης.
Διακριτές κατανομές
Οι διακριτές κατανομές είναι όσες κατανομές οι τυχαίες μεταβλητές μας (άγνωστες τιμές που εκτιμώ)
Bernoulli
Τα δεδομένα που ακολουθούν την κατανομή Bernoulli (X \sim Bernoulli(p)) έχει μόνο μία παράμετρο p η οποία παίρνει τιμές μηδέν ή ένα (p \in \{0,1\}). Έχει συνάρτηση πιθανότητας:
f(x) = \begin{cases} q , & \text{if } x=0 \\ p , & \text{if } x=1 \end{cases}
Η συνάρτηση κατανομής:
F(x) = \begin{cases} 0 , & \text{if x<0} \\ q , & \text{if } 0<=x<1 \\ 1 , & \text{if } x>=1 \end{cases} E(X) = p, V(X) = pq
M_x(t) = pe^t + q $ P_x(t) = pt + q$
Διωνυμική κατανομή
Η διωνυμική κατανομή είναι προέκταση της κατανομής Bernoulli. Η διαφορά με την προηγούμενη είναι ότι δεν μιλάμε για ένα πείραμα, αλλά για n πειράματα - δοκιμές. Όταν θέλουμε να πούμε ότι η τυχαία μεταβλητή μας ακολυθεί τη διωνυμική κατανομή χρησιμοποιόύμε το συμβολισμό Χ \sim B(n, p), όπου n και p είναι οι παράμετροί της. Το n συμβολίζει τον αριθμό των δοκιμών και όπως είναι προφανές παίρνει θετικές ακέραιες τιμές, δηλαδή n \in \mathbb{Z}^{+} = {1,2,...}. Όσον αφορά τη παράμετρο p δηλώνει τη πιθανότητα επέλευσης ενός ενδεχομένου, άρα οι τιμές τις κυμαίνονται μεταξύ του μηδέν και του 1, άρα p \in [0,1]. Η συνάρτηση πιθανότητας της είναι:
f(x) = \binom{n}{x} \cdot p^x \cdot q^{n-x}, x \in [0, 1, \ldots n] Ενώ ο υπολιγσμός της μέσης τιμής είναι το γινόμενο των παραμέτρων E(X) = pq, ενώ για τη διασπορά είναι το γινόμενο Var(X) = npq, όπου το q είναι η πιθανότητα αποτυχίας άρα q = 1-p. Επιπλέον η ροπογεννήτρια:
M_x(t) = (pe^t + q)^n
και πιθανογεννήτρια:
P_x(t) = (pt + q)^n
Poisson κατανομή
Όταν θέλουμε να πούμε ότι η τυχαία μεταβλητή μας ακολoυθεί τη κατανομή Poisson χρησιμοποιόύμε το συμβολισμό Χ \sim P(\lambda), όπου το \lambda είναι η μοναδική παράμετρός της. Το \lambda συμβολίζει τον αριθμό των δοκιμών και όπως είναι προφανές παίρνει θετικές τιμές, δηλαδή \lambda > 0. Η συνάρτηση πιθανότητας της είναι:
f(x) = e^{-\lambda} \cdot \frac{\lambda^x}{x!}
Η μέση τιμή και η διακύμαση έχουν την ίδια τιμή, δηλαδή E(X) = Var(X) = \lambda, ενώ η ροπογεννήτρια μιας Poisson κατανομής είναι:
f(x) = e^{\lambda(e^t -1)}
Συνεχείς κατανομές
Από την άλλη μεριά οι συνεχείς κατανομές είναι οι κατανομές που που μπορούν να έχουν ως τιμές δεκαδικές τιμές, σε ατν´θεση με τις διακριτές. Έτσι είναι αρκετά χρήσιμες σε μελέτη αριθμητικών μεγεθών που δεν περιγράφονται απαρείτητα από ακέραιους αριθμούς:
- Βαθμοί Κελσίου
- Ύψος
- Ποσοστό ανεργίας σε μία χώρα
Όλα αυτά είναι παραδείγματα που το δεκαδικό τους μέρος θεωρείται σημαντικό.