Los vas a conseguir

Ya estamos listos para abordar el análisis de unos datos. Tenemos los recursos necesarios para …


Ya tienes los datos en sus ficheros, ya conoces los procedimientos para escribir las variables de estudio y guardar tu código. Vamos a ver cómo realizar las tareas más habituales: seleccionar los casos, transformar y preparar las variables para finalmente abordar un análisis de los datos. Se trata de un proceso relativamente rutinario:

  1. Cargar los datos en R.

  2. Realizar una descripción de las variables para identificar posibles problemas.

  3. Escribir el procedimiento para realizar los análisis deseados.

  4. Verificar los resultados de los análisis y confirmar que los datos no presentan errores

  5. Si hay errores en los datos o en el procedimiento, corregirlos y repetir el proceso hasta estar seguro de la calidad de los resultados.

Dado un conjunto de datos, preparamos un código que nos permita realizar una descripción de los datos, si hay errores puedes achacarlos al código o a los datos. Si no detectas ninguno, y puede haber algunos todavía, seguiremos con el código destinado al análisis, y de nuevo, verificamos que no haya errores en los resultados. En el diagrama siguiente puedes apreciar lo general del procedimiento, se repite dos veces un proceso de tratamiento y verificación tanto del código como de los datos.

El camino marcado en negro es el proceso libre de errores, los caminos en azul o rojo determinar correcciones en cada una de las etapas.

Manos a la obra

  • Descripción de las variables (acceso)
    Tal como hemos visto en el esquema general de trabajo, es imprescindible realizar una tarea de verificación de los datos y del código de carga y procesado de los mismos. En este documento vamos trabajar con distintas funciones que nos permitan el cálculo de estadísticos para una o más variables y el estudio de la distribución de las variables con la tabulación.

  • Analizando datos (acceso)
    Como objetivo de este documento planteamos la preparación y elaboración de algunos test y pruebas estadísticas, sin entrar en la interpretación de los resultados ya que este aspecto está fuera de los objetivos del curso. Aprovecheramos para introducir las fórmulas para describir modelos.

  • Transformaciones y selección de casos (acceso)
    Dado un conjunto de datos es necesario realizar tareas de transformación o creación de nuevas variables con diversos objetivos; algunos de ellos son la selección o filtrado de casos atendiendo a sus características. Veremos algunas funciones muy útiles y algunos trucos para simplificar el trabajo.

Resumen

Una vez finalizado este módulo ya tienes una idea muy clara de cómo realizar un buen trabajo con R, los elementos y los procedimientos. Ahora solo necesitas practicar y seguir adquiriendo recursos para potenciar tu trabajo. En el siguiente módulo vas a encontrar cómo personalizar el sistema para que tu trabajo sea óptimo y evitar las tareas rutinarias y sus errores.

Referencias

R Reference Card 2.0: aquí hay una gran cantidad de funciones organizadas por bloques, empieza a conocer algunas más allá de las que hemos visto hasta el momento, seguro que te resultan útiles.

Aunque este libro tiene ya un tiempo, puede servirte para hacer una lectura relajada, a modo de repaso, de diversos aspectos que ya hemos discutido.

En el archivo de Bookdown puedes encontrar libros de estadística básica en varios idiomas. Si no tienes problemas con el inglés, mira también Quick-R.