domingo, 6 de marzo de 2016

En lo que sigue, presento el proceso efectuado para realizar esta tarea asignada por el maestro Oskar Casquero, con el fin de evaluar las competencias adquiridas en el uso de la herramienta estadística RStudio y nuestra capacidad de análisis estadístico.

Planteamiento
Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps.

Conceptos
Primeramente, resulta interesante, antes de iniciar el desarrollo de esta asignación, conocer qué es Google Apps y qué es Moodle. El primero, es el conjunto de aplicaciones de Google que permite, que tanto estudiantes, como maestros, puedan desarrollar su trabajo de una manera más eficiente, usando herramientas como Google Sites, Google Forms, Google Calendar, entre muchas otras aplicaciones. El segundo, Moodle, es una potente aplicación diseñada para la creación y administración de Plataformas Virtuales de Aprendizaje (PVA), usada por la mayoría de instituciones educativas para la implementación de cursos en línea.

Objetivo
Analizar, para cada uno de los años, si existen diferencias estadísticamente significativas entre las calificaciones de ambos grupo.

Hipótesis de investigación
Los estudiantes que usan Google Apps tienden a obtener mejores calificaciones que los estudiantes que usan Moodle.

Procedimiento

Primero: Descargamos ambos archivos desde Dropbox: Notas-2grupos-v1.csv (archivo que contiene los datos del primer año) y Notas-2grupos-v2.csv (archivo que contiene los datos del segundo año).

 Figura 1a.

 Figura 1b.

Segundo: Abrimos RStudio e importamos el primer archivo, haciendo clic en "Import Dataset", eligiendo la opción: "From Text File", desde donde aparece la siguiente ventana (Figura 2.). Aquí pueden notar que en el archivo del primer año, el separador de los campos es el punto y coma (;), lo que permitirá que los datos aparezcan ordenados correctamente, según la estructura de datos presentada en la Figura 3.

 
Figura 2.


Figura 3.

Al importar el segundo archivo (Notas-2grupos-v2.csv), nos damos cuenta que el separador que usa (#), no aparece en la lista de separadores de la opción "Import Dataset" (Figura 4). Por tanto, procedemos a generar la estructura de datos para este archivo de forma manual, con el siguiente comando (Ver Figura 5).

Figura 4



Figura 5

Ya que tenemos la estructura de datos de ambos archivos (Figura 6), podemos observar que se crearon dos conjuntos de datos con igual número de registros (40) y de variables (3).


Figura 6


Tercero: Ahora procedemos a filtrar los datos de cada año, tomando la variable grupo como referencia. Esto significa que crearemos dos subconjuntos de datos, en base a la variable grupo, para cada año. Dos para el año 1 (GrupoMoodle1 y GrupoApps1) y dos para el año dos (GrupoMoodle2 y GrupoApps2). Esto lo hacemos con los siguientes comandos en la consola de RStudio (Figura 7). 

Figura 7


Cuarto: Calculamos las calificaciones medias de ambos grupos para cada año usando el comando tapply (Figura 8). A simple vista se podría decir que el grupo que usó Google Apps obtuvo mejores calificaciones en cada año. Pero para afirmar esto con certeza, debemos investigar si este valor tiene significancia estadística.

Figura 8


Quinto: Usando la fórmula de la t de Student, verificamos si existe una diferencia estadísticamente significativa en las calificaciones de ambos grupos para cada año (Figura 9 y Figura 10).

Año 1
Figura 9


Año 2
Figura 10


Análisis
Según podemos observar, en el primer año (Figura 9), el resultado del p-value es 0.007427 (0.7%), que es menor que 5%. Por tanto, esto nos indica que efectivamente hubo cambios estadísticamente significativos y por tanto el resultado no se debe al azar. Lo que nos lleva a afirmar que efectivamente, el grupo que usó Google Apps en el primer año obtuvo mejores calificaciones que el grupo que usó Moodle según las calificaciones medias obtenidas.

Por otro lado, en el  segundo año (Figura 10), el resultado del p-value es 0.08832 (8%),  mayor que 5%. Por tanto, esto nos indica que en este caso no existe una diferencia significativa entre estas medias y por tanto el resultado puede ser debido al azar. Por lo que en este segundo año, no podemos afirmar con certeza que el grupo que usó Google Apps obtuvo mejores calificaciones, aunque las medias presentadas digan lo contrario. 



Conclusiones

Aunque los estudiantes que usaron Google Apps, obtuvieron las mismas calificaciones en ambos años, observamos que en el primer año, debido a que hubo diferencias estadísticamente significativas en la variable notas, usando la t de Student  (p-value <  5%),  comprobamos nuestra hipótesis de investigación planteada más arriba.  Sin embargo, en el segundo año no pudimos comprobar nuestra hipótesis de investigación (p-value > 5%), ya que los resultados pudieron ser producto del azar o debido a la incidencia de otras variables que deben ser observadas.

Ahora bien, comparando el comportamiento de los grupos Moodle y Google Apps a través de ambos años, con las medias obtenidas, se puede obtener el siguiente gráfico (Figura 11).

Figura 11


Los resultados obtenidos en la gráfica, indican que del año 1 al año dos no hubo cambios para las calificaciones del grupo que trabajó con el entorno de Google Apps, mientras que el grupo que trabajó con Moodle, presentó un ligero aumento del año 1 al año 2.

Ahora bien, a partir de aquí podríamos decir que aunque los estudiantes que usaron Google Apps, obtuvieron las mejores calificaciones en ambos años, no hubo un aumento de las mismas en el segundo año. Sin embargo, aunque los que usaron Moodle obtuvieron las calificaciones más bajas, en el segundo año mostraron una mejoría en su desempeño, obteniendo mejores calificaciones.

Sería interesante calcular si estos cambios que observamos en el gráfico para el grupo que usó Moodle son estadísticamente significativos o simplemente se deben al azar o a la influencia de otras variables. Por tanto, usemos nuevamente la t de Student para comprobar esto, tomando en cuenta la media obtenida por el grupo Moodle en ambos años (Figura 12) .

Figura 12



De acuerdo al resultado de la t de Student (p-value > 5%), se demuestra que los cambios en las calificaciones de  los estudiantes que usaron  Moodle fueron muy escasos, ya que no hubo diferencias significativas en las medias calculadas. Por tanto, la variable grupo no puede ser el único indicador de los resultados presentados, se debe seguir investigando.

Y sigue aumentando mi curiosidad: ¿Qué otras variables podrían incidir en estos resultados?





2 comentarios:

Twitter

Copyright (c) Geovanna K. Lorenzo. Con tecnología de Blogger.

Mi Video con Powtoon

Artículos Populares