<< Previ         Índex         Següent >>


Construcció d'una taula de freqüències

3. Taula de freqüències a R

Per fer la taula de freqüències, farem servir el paquet "fdth". Si no el tenim instal·lat, primer l'instal·lem, o bé usant el menú Tools -> Install Packages, o bé entrant a la línia d'ordres:
> install.packages("fdth")

Un cop instal·lat, l'activem:
> library(fdth)

Ara ja podem fer la taula de freqüències amb:
> print(fdt(df$Edats,5))

on el segon argument (5) és el nombre d'intervals que volem. El resultat és el següent:
 Class limits  f   rf rf(%) cf cf(%)
     [9.9,14)  4 0.08     8  4     8
      [14,19) 15 0.30    30 19    38
      [19,23) 19 0.38    38 38    76
      [23,28)  9 0.18    18 47    94
      [28,32)  3 0.06     6 50   100

La primera columna ens mostra els intervals de valors, mentre que la segon ens dóna la freqüència absoluta. A la tercera columna trobem la freqüència relativa, mentre que la quarta columna mostra la freqüència relativa (en percentatges). Finalment, l'última columna mostre la freqüència absoluta acumulada i la freqüència relativa acumulada (en percentatges).
També podeu especificar el límit inferior del primer interval (amb "start="), el límit superior de l'últim interaval (amb "end="), i l'amplada de l'interval (amb "h="). Per exemple per obtenir 5 intervals d'amplada igual a 5, l'ordre és la següent:
> print(fdt(df$Edats,start=10,end=35,h=5))

Aquest és el resultat:
 Class limits  f   rf rf(%) cf cf(%)
      [10,15)  4 0.08     8  4     8
      [15,20) 19 0.38    38 23    46
      [20,25) 19 0.38    38 42    84
      [25,30)  7 0.14    14 49    98
      [30,35)  1 0.02     2 50   100

Una ordre semblant ens permet obtenir la taula de freqüències d'una variable categòrica. Suposeu que tenim dades sobre els colors preferits per a 30 persones. Podem trobar les dades al següent fitxer Excel:
Colors preferits
Entreu les dades com es va explicar a la pàgina anterior.
Per obtenir una taula de freqüència de la variable categòrica d'aquest conjunt de dades, entrem:
> print(fdt_cat(color$Color))

Això produeix la taula de freqüències següent:
 Category f   rf rf(%) cf  cf(%)
     Lila 9 0.30 30.00  9  30.00
  Vermell 9 0.30 30.00 18  60.00
     Groc 8 0.27 26.67 26  86.67
    Negre 3 0.10 10.00 29  96.67
     Blau 1 0.03  3.33 30 100.00

Com podeu veure, obtenim les freqüència absolutes i relatives, així com els valors acumulats, per a la variable categòrica. L'R ordena les categories d'acord amb la freqüència absoluta més gran fins a la més petita. Si voleu un ordre alfabètic de les categories, podeu entrar "sort=FALSE".
> print(fdt_cat(color$Color, sort=FALSE))

i obtenim:
 Category f   rf rf(%) cf  cf(%)
    Black 3 0.10 10.00  3  10.00
     Blue 1 0.03  3.33  4  13.33
   Purple 9 0.30 30.00 13  43.33
      Red 9 0.30 30.00 22  73.33
   Yellow 8 0.27 26.67 30 100.00

<< Previ         Índex         Següent >>




File translated from TEX by TTH, version 4.12.