Construcció d'una taula de freqüències |
3. Taula de freqüències a R |
Per fer la taula de freqüències, farem servir el paquet "fdth". Si
no el tenim instal·lat, primer l'instal·lem, o bé usant el menú Tools
-> Install Packages, o bé entrant a la línia d'ordres:
> install.packages("fdth")
Un cop instal·lat, l'activem:
> library(fdth)
Ara ja podem fer la taula de freqüències amb:
> print(fdt(df$Edats,5))
on el segon argument (5) és el nombre d'intervals que volem. El
resultat és el següent:
Class limits f rf rf(%) cf cf(%)
[9.9,14) 4 0.08 8 4 8
[14,19) 15 0.30 30 19 38
[19,23) 19 0.38 38 38 76
[23,28) 9 0.18 18 47 94
[28,32) 3 0.06 6 50 100
La primera columna ens mostra els intervals de valors, mentre que la
segon ens dóna la freqüència absoluta. A la tercera columna trobem la
freqüència relativa, mentre que la quarta columna mostra la freqüència
relativa (en percentatges). Finalment, l'última columna mostre la
freqüència absoluta acumulada i la freqüència relativa acumulada (en
percentatges).
També podeu especificar el límit inferior del primer interval (amb
"start="), el límit superior de l'últim interaval (amb "end="), i
l'amplada de l'interval (amb "h="). Per exemple per obtenir 5
intervals d'amplada igual a 5, l'ordre és la següent:
> print(fdt(df$Edats,start=10,end=35,h=5))
Aquest és el resultat:
Class limits f rf rf(%) cf cf(%)
[10,15) 4 0.08 8 4 8
[15,20) 19 0.38 38 23 46
[20,25) 19 0.38 38 42 84
[25,30) 7 0.14 14 49 98
[30,35) 1 0.02 2 50 100
Una ordre semblant ens permet obtenir la taula de freqüències d'una
variable categòrica. Suposeu que tenim dades sobre els colors
preferits per a 30 persones. Podem trobar les dades al següent fitxer
Excel:
Colors preferits
Entreu les dades com es va explicar a la pàgina anterior.
Per obtenir una taula de freqüència de la variable categòrica d'aquest
conjunt de dades, entrem:
> print(fdt_cat(color$Color))
Això produeix la taula de freqüències següent:
Category f rf rf(%) cf cf(%)
Lila 9 0.30 30.00 9 30.00
Vermell 9 0.30 30.00 18 60.00
Groc 8 0.27 26.67 26 86.67
Negre 3 0.10 10.00 29 96.67
Blau 1 0.03 3.33 30 100.00
Com podeu veure, obtenim les freqüència absolutes i relatives, així
com els valors acumulats, per a la variable categòrica. L'R ordena les
categories d'acord amb la freqüència absoluta més gran fins a la més
petita. Si voleu un ordre alfabètic de les categories, podeu entrar
"sort=FALSE".
> print(fdt_cat(color$Color, sort=FALSE))
i obtenim:
Category f rf rf(%) cf cf(%)
Black 3 0.10 10.00 3 10.00
Blue 1 0.03 3.33 4 13.33
Purple 9 0.30 30.00 13 43.33
Red 9 0.30 30.00 22 73.33
Yellow 8 0.27 26.67 30 100.00
File translated from
TEX
by
TTH,
version 4.12.