Estic intentant fer tot el que puc amb l'R en comptes del Stata, però Stata té externalitats positives en xarxa a la professió d'economista i és difícil deixar-lo si tenim coautors que usen l'Stata. En tot cas, una de les regressions més comuns que he d'exectutar es la regressió amb efectes fixos i errors estàndard clusteritzats. Suposem que Y es la vostra variable dependent, X és una variable explicativa i F és una variable categòrica que defineix els efectes fixos. També voleu clusteritzar els errors estàndard d'acord amb F. Si F té moltes categories, s'ha d'usar algun procediment de diferències amb les mitjanes per eliminar els efectes fixos, per no tenir un número excessiu de regressores, cosa que passaria si s'incloguessin explícitament. Aquest seria el codi en l'Stata:
xtset F
xtreg Y X, fe cluster(F) robust dfadj
L'opció "dfadj" és quelcom que vaig descovrir recentment que cal per obtenir els errors estàndard correctes (refereix a "degrees of freedom adjustment", o sigui ajustament dels graus de llibertat, i almenys per a mi, estava força oculta als manuals).
Per produir els mateixos resultats amb l'R, heu d'usar la funció felm del paquet lfe. Aquest és el codi:
model <- felm(Y ~ X | F | 0 | F)
summary(model)
A la funció felm els arguments se separen amb "|". El primer argument és l'equació a estimar, el següent és la variable categòrica que defineix els efectes fixos a eliminar mitjançant el procediment de restasr la mitjana. El tercer, en aquest cas "0", podria usar-se per introduir els instruments en una estimació per variables instrumentals, mentre que l'últim defineix la clusterització dels errors estàndars. Aquesta funció de l'R produeix exactament els mateixos resultats que el codi del Stata de dalt.