Lectura de datos

Se leen los datos saeraq.Rdata, que provienen del fichero raq.dat utilizado en (A. Field, Miles, and Field 2012).

load( "saeraq.RData" )

Análisis de Componentes Principales

indicesPreg <- grep( "^Q", colnames( df ) )
df[ , indicesPreg ] <- as.data.frame( lapply( df[ , indicesPreg ], as.numeric ) )

# library( FactoMineR )
pca <- PCA( df, quali.sup = c( 1:3, 5:6 ), quanti.sup = 4,
            scale.unit = TRUE, graph = FALSE )
# library( factoextra )
fviz_screeplot( pca, addlabels = TRUE ) + 
  ggtitle("") +
  scale_x_discrete( name = "Componentes principales" ) +
  scale_y_continuous( name = "Autovalor y varianza explicada" ) +
  theme_minimal()
PCA. Varianza explicada por cada componente principal

PCA. Varianza explicada por cada componente principal

fviz_pca_var( pca, axes = c( 1, 2 ), geom = "text", alpha.var = "contrib",
              labelsize = 2 ) +
  ggtitle("") +
  theme_minimal()
PCA. Gráfico de las variables con las eqtiquetas utilizadas para las proteínas

PCA. Gráfico de las variables con las eqtiquetas utilizadas para las proteínas

fviz_pca_biplot( pca, pointsize = 1.5, labelsize = 2.5, #alpha.var="contrib",
                 habillage = df$sexo, addEllipses = TRUE,
                 ellipse.level = 0.95, select.var = list( contrib = 25 ) ) +
  ggtitle("") +
  theme_minimal()
PCA Biplot. Gráfico de variables e individuos según las dos primeras componenetes principales. Elipses de confianza al 95\% y color según fracción

PCA Biplot. Gráfico de variables e individuos según las dos primeras componenetes principales. Elipses de confianza al 95% y color según fracción

Referencias y bibliografía

Field, Andy, Jeremy Miles, and Zoe Field. 2012. Discovering Statistics Using R. 1st edition. Sage Publications Ltd.


  1. Servicio de Apoyo Estadístico; alvarohv@um.es, elvira@um.es, antoniojose.peran@um.es, anabelen.marin4@um.es, amaurandi@um.es

  2. http://r-es.org/8jornadasR/

  3. doc:T4_analisisPCA.Rmd