Resumen

En un servicio central, como el Servicio de Apoyo a la Investigación de la Universidad de Murcia, hemos de analizar con frecuencia conjuntos de muy diversos ámbitos que requieren un análisis muy similar, es el caso de los cuestionarios o encuestas. Con este tipo de datos es usual encontrarse con preguntas o ítems tipo Likert, ordinales o variables medidas en intervalos, agrupados por temáticas o bloques. En nuestro servicio hemos llegado a pseudo-automatizar este tipo de análisis, partiendo de los paquetes Rmarkdown y knitr asistidos por otros paquetes como likert, pander, xtable, ztable, tables, DT y algunas funciones definidas ad hoc de forma que obtenemos unos resultados muy vistosos, que sientan la base para decidir futuros análisis a aplicar.

En este taller se analizará un conjunto de datos desde el principio, lectura de datos, explicando las estrategias seguidas y las diversas opciones que surgen en cada momento y cómo resolverlas, para llegar finalmente a un informe en formato pdf o html.

Modo de trabajo

En este taller partimos de un conjunto de datos que tomamos del libro Discovering Statistics Using R (A. Field, Miles, and Field 2012), al que le hemos añadido algunas variables más de nuestra cosecha.

Este conjunto de datos ampliado (saeraq.csv) consta de 23 cuestiones sobre miedo a la estadística , son ítems con una escala Likert 5, una variable dicotómica: sexo, varias variables categóricas: actS (4 niveles), origen (3 niveles), una ordinal ningles (10 niveles) y una variable medida en intervalo: ingresos.

El taller constituye un ejemplo de un posible análisis de una encuesta, para finalizar con un informe completo que incluye descriptivos gráficos, tablas de estadísticos descriptivos, comparaciones y un análisis final.

Materiales secuenciados

  1. Conjunto de datos inicial:
  2. Cocinillas previas: recode(), factor(), refactor(),…
  3. Fichero después de anotado: saeraq.RData
  4. Descriptivos iniciales
  5. Descriptivos con factores
  6. Algunos gráficos
  7. Un ejemplo de análisis: PCA
  8. Las típicas comparaciones


Materiales Auxiliares

  • Tablas con el paquete table (Murdoch 2016): Aquí
  • Trabajando con escalas Likert con el paquete likert (Bryer and Speerschneider 2015): Aquí
  • Correlación y validación, con los paquetes corrr (Jackson 2016) y corrplot (Wei and Simko 2016): Aquí

Referencias

Bryer, Jason, and Kimberly Speerschneider. 2015. Likert: Functions to Analyze and Visualize Likert Type Items. http://CRAN.R-project.org/package=likert.

Field, Andy, Jeremy Miles, and Zoe Field. 2012. Discovering Statistics Using R. 1st edition. Sage Publications Ltd.

Jackson, Simon. 2016. Corrr: Correlations in R. https://CRAN.R-project.org/package=corrr.

Murdoch, Duncan. 2016. Tables: Formula-Driven Table Generation. http://CRAN.R-project.org/package=tables.

Wei, Taiyun, and Viliam Simko. 2016. Corrplot: Visualization of a Correlation Matrix. http://CRAN.R-project.org/package=corrplot.










Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional.