R e statistica

aprile 21, 2007

La scorsa settimana mi è capitato di dover consegnare un compito per casa di statistica con diversi grafici (istogrammi, diagrammi a barre, diagrammi a settori circolari…). Per fare tutto ciò ho usato OpenOffice.org Calc. Fin qui tutto facile, ma in una distribuzione statistica mi si chiedeva di disegnare il boxplot.

Da qui sorge il problema! In OpenOffice infatti (e anche nel suo rivale proprietario) non si possono fare questo tipo di rappresentazione. Sappiamo però che in OpenOffice possiamo importare delle immagini di diversi formati. Quindi non mi restava che avere una immagine del boxplot. Per farlo però volevo trovare una soluzione elegante. Scopro l’esistenza di R e lo provo. Inizio un po’ a giocarci ma dopo un po’ faccio sul serio e riesco ad avere una immagine perfetta del boxplot della distribuzione statistica che avevo. Ricordo che ho fatto tutto questo inserendo semplicemente su un vettore tutte le modalità e le frequenze. Quindi è R che si calcola il valore x minimo, il 1° quartile, la mediana, il 3° quartile e x massimo. Vediamo ora come fare un semplice boxplot in R.
Prima di tutto assumo le sembianze di root e do un bel apt-get install r-base una volta fatto ritorno da utente e digito sulla shell R.
Tutto ciò che appare è una shell molto potente in cui scrivere i comandi di R. Per fare un nuovo vettore basta digitare ad esempio:
vet <- c(2,3,2,5,4,5)
Per fare il boxplot di questo vettore basta soltanto
boxplot(vet)
Da come si può osservare R è uno strumento potente. La distribuzione statistica che avevo era:
x | f
0 | 2
1 | 3
2 | 8
3 | 6
4 | 1

Questa distribuzione ha anche le frequenze. Facciamo quindi un vettore chiamato “distro” in cui mettiamo questa distribuzione.
distro <- rep(c(0:4), c(2,3,8,6,1))
In questo modo i valori di x sono c(0:4), cioè l’intervallo da 0 a 4 (era uguale scrivere c(0,1,2,3,4) ma era più lungo :-)) mentre le frequenze sono c(2,3,8,6,1).
Scritta la distribuzione statistica possiamo vedere vari dati con:
summary(distro)
Ora facciamo e salviamo il boxplot in una immagine png:
png(filename="boxplotdistro.png")
boxplot(distro)

Una volta fatto usciamo da R:
quit()
Ora facciamo un bel ls e possiamo vedere il nostro boxplot, tutto grazie ad R! ;-)

Questo è un uso piuttosto semplice, R è molto potente, ad esempio potevamo scegliere il titolo del grafico, fare grafici diversi e molto ma molto altro ancora. Quindi per approfondire c’è
help(funzione).

Links utili:
http://www.r-project.org/ Pagina ufficiale del progetto R
http://cran.r-project.org/ Comprehensive R Archive Network
http://cran.r-project.org/doc/contrib/nozioniR.pdf Ottimo manuale in italiano su R

Annunci

6 Risposte to “R e statistica”

  1. Daniele Says:

    Che tipo di istituto frequenti? Un liceo scientifico o ITI?

  2. leonardo1990 Says:

    @Daniele
    Frequento un ITIS, specializzazione di Informatica (3° superiore). Abbiamo quindi in una settimana 3 ore di statistica di cui una di laboratorio.
    Ci fanno usare (purtroppo) Office commerciale e proprietario (della Micro$oft) però a casa io ho solo OS liberi e quindi uso OpenOffice.org. In quel caso però dovevo fare un boxplot, e leggendo un articolo su Linux&Co ho provato R e l’ho fatto con R. Mi è piaciuto particolarmente e credo che sarebbe da proporre anche nelle scuole, infatti è sicuramente più potente (in certe cose) di Excel || OpenOffice.org Calc ed altamente istruttivo.

  3. Daniele Says:

    immaginavo ITI perché per un breve periodo di tempo ho fatto (nel senso che insegnavo) un corso integrativo su Linux a Rimini e l’interesse c’è, magari da pochi docenti che lo conoscono già e coordinano, ma c’è.

    Se visiti il mio blog troverai un post sui “software statistici per la ricerca”. Le esperienze riportate nei commenti ti possono dare una misura della diffusione di R attualmente.

  4. leonardo1990 Says:

    @Daniele
    Grazie, avevo già visto ma ora mi rileggo tutti i commenti! :-)

  5. Silvano Says:

    Ciao Leonardo, volevo chiederti se sapevi come si fa ad importare i risultati di summary(1°Q, Mediana, 3°Q, etc) sul grafico del boxplot in modo tale da avere sia la parte grafica e una casella che contenga questi dati cosi da avere un quadro generale in un unico foglio. (grazie e scusami….non so se qui potevo fare domande o solo commenti!)

  6. TodosLogos Says:

    Ciao, volevo segnalarti questo sito che parla esclusivamente di statistica con R. Ogni post presenta un problema, con la relativa soluzione, ampiamente commentata.

    Ciao, e buoni studi :)


Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

w

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: