Introducción
La educación se ha visto re-moldeada con la aparición de las nuevas tecnologías de la información y la comunicación (TIC), así como por la rápida incorporación de internet a los procesos educativos. Los cambios se han presentado en los distintos niveles educativos afectando a todos los involucrados, estudiantes y docentes, incluso a las mismas instituciones. La implementación del uso de plataformas virtuales de aprendizaje se ha expandido y está presente en una parte considerable de las prácticas educativas (Lavigne, Backhoff-Escudero y Organista-Sandoval, 2008; Backhoff-Escudero, Lavigne, Organista-Sandoval y Aguirre-Muñoz, 2007; Concannon, Flynn y Campbell, 2005).
Dentro de las posibilidades de investigación se encuentran como nuevo objeto los registros de navegación logs1 que se generan automáticamente al utilizar este tipo de recursos tecnológicos. En el presente trabajo se busca entender de qué manera dicha tecnología es utilizada por estudiantes. Este tipo de investigación puede mejorar el uso de las herramientas pedagógicas, tomando en cuenta el diseño pedagógico como lo subrayan Rochefort y Richmond (2011). Hershkovitz y Nachmias (2008) mencionan que monitorear la motivación del estudiante por medio del análisis de los registros de navegación permite al instructor interferir cuando sea necesario, teniendo como objetivo incrementar la eficiencia del proceso de aprendizaje.
Antecedentes
En el uso diario de la plataforma se genera valiosa información acerca de las características y preferencias de navegación en línea por parte de los usuarios. La información registra en bitácoras de navegación el comportamiento de los usuarios del sitio web en donde está localizada la plataforma, eso independientemente de la voluntariedad que tengan estos usuarios para aportar dicha información (Martínez, Mateo y Albert, 2004). Sin embargo el análisis de estos datos se enfrenta a varios problemas, incluyendo los técnicos, como el tamaño de la muestra, la organización y posterior manejo de las bases de datos.
Este tipo de análisis se llama minería de datos, y cuando se aplica al campo de la educación, minería de datos educacional (educational data mining) (Baker y Yacef, 2009). Los sistemas de administración de cursos en línea como Moodle o Blackboard tienen sus propios programas para registrar los ingresos al sistema y las actividades realizadas en el espacio virtual por parte de cada usuario.
De acuerdo con Hardy, Bates, Antonioletti y Seed (2005), el análisis de registros de actividad ha sido eficaz para cuestionar ciertos aspectos del aprendizaje en línea, pero en algunos casos se pone de manifiesto que la implantación de ambientes virtuales de aprendizaje no da los resultados esperados (Buelens, Roosels, Wils y Van Rentergem, 2002).
Algunos autores (Feng y Heffernan, 2005, 2007) sugieren que el análisis de los registros puede ser útil en la construcción de sistemas de ayuda para el aprendizaje, o como señalan Bisson, Bronner, Gordon, Nicaud y Renaudie (2003), para identificar lagunas cognitivas en estudiantes o dificultades de adaptación a los ambientes en línea. Según Hoskins y Van Hooff (2005), poco se conoce acerca del impacto sobre el logro académico del estudiante en cursos disponibles vía internet. Dringus y Ellis (2005) buscaron cuál era la estructura de navegación de los estudiantes detrás de los textos agregados en foros para conocer su participación. Dönmez, Rosé, Stegmann, Weinberger y Fischer (2005) realizaron un análisis multidimensional del aprendizaje colaborativo a través el tratamiento lingüístico del contenido de foros, eso para desarrollar una tecnología de análisis automática. Este tipo de análisis permitió también revelar las operaciones de grupos de trabajo colaborativo (Perera, Kay, Koprinska, Yacef y Zaiane, 2009).
En la Universidad Autónoma de Baja California (UABC), los estudiantes han sido sujetos de investigación vía los registros de navegación de varios cursos en Moodle. Organista-Sandoval, Lavigne y McAnally-Salas (2008) analizaron la actividad en línea de estudiantes y su relación con el aprendizaje de estadística. Los estudiantes se clasificaron en cuatro conglomerados, de los cuales dos tuvieron gran actividad en línea y presentaron también una tendencia a mejores calificaciones. También se han realizado análisis en relación a los estilos de aprendizaje (Díaz, 2010), así como con el aprendizaje colaborativo (Vasconcelos, 2011).
La pedagogía contemporánea a la base del aprendizaje en línea requiere que se centre en el estudiante toda la concepción del material pedagógico. Además, el proceso de enseñanza-aprendizaje híbrido necesita nuevos enfoques de docencia, como el uso de un diseño instruccional basado en las características resultantes de la navegación de los estudiantes en espacios virtuales de aprendizaje, para lograr una didáctica más flexible. Pero faltan conocimientos sobre los comportamientos de los estudiantes en los ámbitos virtuales. Entonces, el presente proyecto, de carácter preliminar, explora en qué medida, a partir del uso de la plataforma Moodle, se pueden identificar estrategias de aprendizaje susceptibles de influir en el desempeño académico de los estudiantes.
Método
En la presente investigación, transversal y descriptiva-exploratoria, se utilizaron técnicas cuantitativas para analizar alrededor de 15.000 registros de navegación de la plataforma Moodle.2
Participantes
La investigación se hizo con el análisis de los registros de 33 estudiantes inscritos en el curso de 16 semanas «Métodos numéricos de la ingeniería en informática», de la Facultad de Ingeniería, Arquitectura y Diseño de la UABC. Conforme a la información existente solo se pudo deducir el género de los participantes: 3 mujeres y 30 hombres. El curso se impartió de manera mixta −en forma presencial y en forma virtual−, pero las clases presenciales se realizaron en un laboratorio de cómputo donde todos los estudiantes estaban conectados con el curso, bajo la supervisión del instructor, realizando tareas en línea.
Contexto del estudio
De las opciones posibles a utilizar dentro de Moodle, el instructor incluyó las siguientes actividades virtuales:
- Foros. No eran de carácter obligatorio pero repercutían en un 10 % en la calificación final; los foros tenían una función evaluativa, ofreciendo la oportunidad a los estudiantes de presentar evidencia de su desempeño, eso con el fin de retroalimentar y evaluar lo aprendido.
- Todas las lecturas sugeridas para el curso se encontraban dentro de la plataforma o en algún otro sitio virtual; las lecturas no eran todas de carácter obligatorio y no había penalización alguna al no realizarlas.
- Los cuestionarios y tareas, todas de carácter obligatorio y entregadas de manera virtual dentro de la plataforma, tenían fecha límite de entrega, existiendo una penalización si se entregaban tardíamente.
- La retroalimentación de cada tarea se entregó dentro de la plataforma; la calificación final la daba el instructor.
Recolección de datos
Para la recolección de los datos se extrajeron los registros de navegación de la plataforma Moodle ofrecidos a manera de informes, accediendo a los registros del servidor, seleccionando el curso, y dentro del curso todos los alumnos y todas las actividades realizadas. Los datos obtenidos se exportaron a Excel y se generó una base de datos. También se extrajeron las calificaciones finales de los alumnos, exclusivamente de las actividades realizadas dentro de la plataforma.
Variables
Los datos extraídos se transformaron posteriormente en las variables genéricas, las recuperadas directamente de Moodle y las derivadas; las nombradas derivadas se infirieron a partir de las primeras. Como la plataforma ofrece 7 tipos de recursos y 22 tipos de actividades, más módulos a medida, los recursos se almacenaron en una sola categoría, Recursos, y las actividades se reorganizaron en tres categorías −Tareas, Usuarios, Foros− más la Página principal.
Las variables utilizadas son las siguientes:
- Fecha de conexión. Se obtuvo al identificar la fecha en la que el alumno ingresó a la plataforma, mes y día.
- Hora de conexión. Se obtuvo al identificar la hora exacta (hora, minutos y segundos) en la que el alumno solicitó el acceso. Al nivel del análisis se dividieron en cinco periodos, a saber: 1 a 5:59:59 am, 6 a 10:59:59 pm, 11 am a 3:59:59 pm, 4 a 8:59:59 pm y 9 pm a 12:59:59 am.
- Acción realizada en la plataforma. Se obtuvo al identificar el módulo al que el alumno ingresó, página principal, foros, recursos, tareas, usuario.
- Dirección IP. Se obtuvo al identificar la dirección IP desde la cual el alumno ingresó a la plataforma; se dividieron en dos categorías: las identificadas pertenecientes a la UABC y las no pertenecientes a la UABC.
- Calificación final. Se obtuvo al identificar la calificación que el profesor otorgó a cada alumno por las actividades realizadas dentro de la plataforma.
- Número total de clics.3 Se obtuvo al contabilizar el número de veces que el alumno solicitó el acceso a alguna página y/o módulo dentro de ella.
- Número total de conexiones. Se obtuvo al identificar el número de veces que el alumno ingresó a Moodle.
- Duración promedio por clic. Se obtuvo dividiendo la suma del tiempo total de conexión por el número total de clics.
- Duración promedio por conexión. Se obtuvo dividiendo la suma del tiempo total de conexión por el número total de conexiones.
- Total de clics por estudiante en cada uno de los módulos o actividades. Se obtuvo al identificar el nombre del usuario dentro de los módulos de actividad y contabilizar el número de clics.
- Intervalo de conexión. Se obtuvo al identificar la hora en la que el alumno ingresó a la plataforma, así como su egreso de ella.
Herramientas de análisis
Para realizar el análisis se utilizó Excel y el paquete estadístico Statistical Package for Social Sciences (SPSS), tanto de manera descriptiva como inferencial. El análisis por conglomerados, de acuerdo con Pérez y Santín (2006), consistió en partir una o más veces el conjunto de estudiantes con base en características específicas; se utilizó el método aglomerativo-divisivo.
Con el programa Organization Risk Analyzer (ORA) de valoración dinámica meta-red4 se pudieron identificar trayectorias a partir de la base de datos conformada en Excel específicamente para su utilización en ORA. Como el uso de esta herramienta en relación con este tipo de investigación es innovador, se tomó una muestra y se analizaron y graficaron las trayectorias de 10 estudiantes, pero en este artículo se presenta un solo caso como ejemplo.
Procedimiento
Primeramente se extrajeron los registros de navegación por estudiante y se exportaron a Excel; se depuraron los datos removiendo la información que no fuera relevante. Se realizó el análisis estadístico con SPSS. Posterior a este análisis se elaboraron las trayectorias de navegación con ayuda del programa de aplicación ORA.
Cabe recordar que Moodle no identifica los accesos por sí mismos. Fue necesario identificarlos a partir de la fecha, la duración promedio de los clics, el URL y el tipo de página anterior y posterior a lo que parece una nueva conexión, y ordenarlos de manera cronológica. De la misma manera, fue necesario ajustar el formato de hora para que fuera posible visualizar los segundos.
Resultados
Características de navegación
Por medio de las características de navegación se muestran los descriptivos de las variables principales. El formato de tiempo se expresa según sea el caso en: días (dd), horas (hh), minutos (mm) y segundos (ss).
Se puede observar el total de las conexiones a lo largo del curso, que fue de 997, con una desviación estándar de 27,63, y la totalidad de clics de 15.779, con una media de 478,15 y una desviación estándar de 176,83, lo que subraya grandes diferencias entre los estudiantes. La media por clic es de 1 minuto y 34 segundos, el mínimo de 41 segundos y el máximo, de 2 minutos y 32 segundos.
Tabla 1. Descriptivos de las variables principales
Variables |
Total |
µ |
σ |
Mínimo |
Máximo |
---|---|---|---|---|---|
Conexiones |
997 |
30,21 |
27,63 |
12 |
151 |
Clics |
15.779 |
478,15 |
176,83 |
284 |
1.187 |
Duración de conexión |
16:20:35:23 |
12:15:37 |
4:34:42 |
3:48:42 |
21:11:55 |
Promedio clic (mm:ss) |
51:50 |
01:34 |
00:27 |
00:41 |
02:32 |
Los estudiantes invirtieron como grupo un total de 16 días, 20 horas, 35 minutos y 23 segundos, un promedio de 12 horas, 15 minutos y 37 segundos por estudiante. En la tabla 2 se muestran los módulos en los que se agruparon todas las actividades disponibles. Las tareas presentan una totalidad de clics de 7.314, mientras que los cuatro módulos restantes en conjunto presentan una totalidad de 8.458 clics. Se debe señalar que la Página principal denota la página de entrada al curso, y también el regreso a esta página de las trayectorias en bucle como la costumbre del Back-space.
Tabla 2. Descriptivos por módulos de actividad
Módulos |
Total de clics |
µ |
σ |
Mínimo |
Máximo |
---|---|---|---|---|---|
Tareas |
7.314 |
221,64 |
60,02 |
138 |
447 |
Recursos |
2.485 |
75,30 |
31,57 |
21 |
188 |
Foros |
2.516 |
76,24 |
37,82 |
20 |
210 |
Página principal |
2.870 |
86,97 |
56,61 |
37 |
285 |
Usuario |
587 |
17,79 |
23,11 |
1 |
136 |
En la tabla 3 se muestran los descriptivos de los horarios en los que los estudiantes accedieron al curso. Por un lado, los periodos nocturnales de 21-24 a 1-5 horas representan el 42,89 % del total de conexiones; las que ocurrieron en un horario de 16 a 20 horas, representando el 49,95 %, corresponden al laboratorio presencial.
Tabla 3. Descriptivos por horario de conexión
Horario |
Total de conexiones |
% |
µ |
σ |
Mínimo |
Máximo |
---|---|---|---|---|---|---|
1-5 h |
260 |
24,78 |
7,88 |
11,621 |
0 |
54 |
6-10 h |
44 |
4,19 |
1,33 |
1,88 |
0 |
8 |
11-15 h |
28 |
2,66 |
0,85 |
1,34 |
0 |
5 |
16-20 h |
524 |
49,95 |
15,88 |
8,46 |
9 |
47 |
21-24 h |
190 |
18,11 |
5,76 |
9,41 |
0 |
51 |
En la siguiente tabla se muestran los descriptivos agrupados por mes y los clics, así como el tiempo promedio de clic y de conexión. Se observan dos picos de actividad, en septiembre y en noviembre, pero la duración de un clic baja de manera constante.
Tabla 4. Descriptivos agrupados por mes
Mes |
Clics |
Duración hh:mm:ss |
Duración dd:hh:mm |
|||
---|---|---|---|---|---|---|
Total |
µ |
σ |
Promedio de clic |
Promedio de conexión |
Total de conexiones |
|
Agosto |
3.135 |
95 |
47,7 |
00:02:17 |
03:28:03 |
04:18:25 |
Septiembre |
4.665 |
141,3 |
63,0 |
00:01:39 |
04:11:30 |
05:18:19 |
Octubre |
3.538 |
107,2 |
66,6 |
00:01:21 |
02:27:17 |
03:09:00 |
Noviembre |
4.215 |
127,7 |
64,2 |
00:00:53 |
02:03:37 |
02:19:59 |
Se observa la distribución de la duración promedio por clic en cada mes. Se presenta un decremento constante en el tiempo promedio de clic, lo que significa una navegación muy rápida, como mejor aprovechamiento del tiempo; así mismo, la duración total de las conexiones por mes, en donde se puede notar un repunte en el segundo mes, pero también un decremento constante.
Análisis por conglomerados
Tomando en cuenta el tamaño de las desviaciones estándares de algunas variables, surgió la idea de que existen grupos dentro de los estudiantes. El tratamiento de los datos recabados se realizó por medio de análisis de conglomerados con el método de K-medias, perteneciente a los métodos no-jerárquicos (Pérez y Santín, 2006).
En la tabla 5 se observa el análisis ANOVA, en donde se encuentran los valores F para las principales variables, así como el nivel de significancia, que fue menor de ,05 para las cuatro variables.
Tabla 5. Resultado del análisis ANOVA
|
Conglomerado |
Error |
F |
Sig. |
||
---|---|---|---|---|---|---|
Variables principales |
Media cuadrática |
df |
Media cuadrática |
df |
||
Total clics |
169625,7 |
1 |
26806,4 |
31 |
6,328 |
,017 |
Total de conexiones |
3440,313 |
1 |
677,2 |
31 |
5,080 |
,031 |
Duración de conexión (en segundos) |
6,115E9 |
1 |
8,320E7 |
31 |
73,496 |
,000 |
Promedio clic (en segundos) |
12294,789 |
1 |
391,7 |
31 |
31,382 |
,000 |
En la tabla 6 se observan los descriptivos por grupo. Para el grupo 2, la diferencia en el total de clics es de menos 2.843 clics en comparación al grupo 1. El total de conexiones es, para el grupo 1, de 682 y para el segundo de 315 conexiones, el doble. La calificación final promedio correspondiente exclusivamente a la realización de las actividades dentro del curso virtual fue de 99,6 para el grupo 1 y de 98 para el grupo 2, es decir, casi las mismas calificaciones promedio.
Tabla 6. Características por grupo
Características descriptivas de los grupos |
Grupo 1 |
Grupo 2 |
---|---|---|
Total de casos |
17 |
16 |
Total de clics |
9.311 |
6.468 |
Duración promedio de clic (mm:ss) |
01:53 |
01:15 |
Total de conexiones |
682 |
315 |
Promedio de conexiones |
40 |
20 |
Duración promedio de conexión (mm:ss) |
32:49 |
27:04 |
Duración promedio de conexión por curso (hh:mm:ss) |
15:55:43 |
08:21:45 |
Calificación promedio |
99,6 |
98 |
En la tabla 7 es posible observar, derivado de la prueba F-Levene, que se asume la igualdad de varianzas, ya que se obtuvo un valor de ,000; por lo tanto, se toman en consideración los valores para t-student observada de 2,929, con un nivel de significancia de ,006.
Tabla 7. Contraste t-student para muestras independientes
Calificación final |
Prueba de Levene para igualdad de varianzas |
Prueba t para igualdad de medias |
|||||
---|---|---|---|---|---|---|---|
F |
Sig. |
t |
df |
Sig. bilateral |
Dif. de la media |
Dif. error estándar |
|
Igualdad de varianzas asumida |
16,176 |
,000 |
2,929 |
31 |
,006 |
1,51651 |
,51776 |
Igualdad de varianzas no asumida |
- |
- |
2,854 |
17,606 |
,011 |
1,51651 |
,53140 |
Estos resultados subrayan sin duda la existencia de dos grupos.
Trayectorias de navegación
Las trayectorias de navegación que dan cuenta del camino que el estudiante recorre al utilizar las distintas opciones de las que dispone dentro de la plataforma se pueden inferir al identificar los accesos dentro de cada conexión. A la fecha, no se encontraron programas informáticos para analizar las trayectorias de los estudiantes; fue necesario analizarlas a mano, por lo tanto se presentan solamente los resultados de dos estudiantes, uno de cada grupo.
En el concentrado de los accesos de los dos estudiantes, se nota de inmediato diferencias de navegación importantes. El estudiante 1 contó con 34 conexiones, participó mucho más en los foros y consultó los recursos pedagógicos ofertados más veces en comparación al estudiante 2, quien contó con 12 conexiones y concentró su atención en la realización de las tareas, tanto al inicio del curso como al fin. El primero obtuvo una calificación de 100, el segundo de 94,7.
En la siguiente figura se observan las trayectorias seguidas por los dos estudiantes a lo largo del curso. La mayor actividad la presentó el estudiante 1. De los 308 clics presentados por este estudiante a lo largo de su participación dentro del curso, 205 fueron realizados en el módulo de tareas, en comparación con 232 para estudiante 2, lo que significa que el estudiante 2 dedicó 66,5 % de su tiempo en línea para realizar las actividades de aprendizaje, y el primero 44,8 %.
Los estudiantes pertenecientes al grupo 1, caracterizados por presentar la mayor actividad (en accesos y tiempo) dentro de la plataforma, obtuvieron el promedio mayor, 99,6, a diferencia del grupo 2, conformado por los estudiantes que presentaron menor actividad y un promedio de 98,0. Entonces, cada uno con una estrategia de aprendizaje casi en oposición: calificación máxima no importa el tiempo en línea, grupo 1, menos tiempo en línea para una calificación óptima, recordando que la diferencia entre los 2 promedios, a pesar de ser pequeña, es estadísticamente significativa.
Discusión
Se ponen de manifiesto elementos clave de los procesos de enseñanza y aprendizaje, virtual o no (Coll, 2004). En los accesos dentro de los distintos módulos, como los de tareas y recursos, que incluían cuestionarios y lecturas. Se presentaron alrededor de 9.700 clics, de los 15.779 clics presentados en todo el curso. Por otro lado, se reconoce la importancia de los procesos de socialización (Ávila y Bosco, 2001) y de comunicación (Barajas, 2002); esto se hace presente por medio de los 2.500 accesos dentro del módulo de foros. Coincidiendo con Boneu (2007), los estudiantes tuvieron la opción de hacer uso de la plataforma a cualquier hora del día o de la noche y desde cualquier ubicación.
Al encontrar diversas formas de navegar dentro del entorno virtual de aprendizaje, queda evidenciado el carácter de potencialidad al que hace referencia Díaz (2010). Si bien la plataforma virtual brinda el mismo abanico de posibilidades para todos los usuarios, el resultado de su uso es inherente a cada uno de ellos, independientemente de la estructura de la plataforma o de la intención del diseño que el instructor implemente. Utilizando la información al momento que se genera para retroalimentar al instructor, los registros de navegación pueden repercutir de forma positiva en la práctica docente orientando a los instructores en su desempeño, ayudándolos a elegir la instrucción a emplear para obtener los mejores resultados académicos.
¿Siguen los estudiantes las rutas de aprendizaje establecidas por los profesores? Sí, a manera de sugerencia, ya que de los registros analizados se infiere que hacen uso de los recursos de manera más independiente. ¿Aplican los estudiantes algo similar al libre albedrío en el manejo de sus trayectorias en los ambientes virtuales de aprendizaje? Efectivamente, los estudiantes deciden de qué manera acceden a la plataforma y de qué manera se desplazan al interior de ella, esto es, dentro de los límites de diseño de ella.
Resultan de este análisis preliminar algunas observaciones que podrían convertirse en conocimientos con la multiplicación de este tipo de investigación. De acuerdo con Lavigne, Organista y McAnally (2008) y Lavigne, McAnally-Salas, Organista-Sandoval, Díaz-López y Vasconcelos-Ovando (2011), aparece como un estándar que la duración de un clic va disminuyendo con el tiempo y que tiene un promedio de más o menos 1 minuto. Esta observación genera preguntas: ¿qué pueden hacer los estudiantes en un minuto? ¿Cómo pueden los maestros diseñar actividades con esta condición?
Fue posible identificar a partir de algunas características de navegación dos grupos de estudiantes, cada uno con estrategias de aprendizaje muy diferentes al nivel de uso de las posibilidades de navegación ofertadas, pero con éxito casi similar. Se debe subrayar que estos dos grupos tienen patrones de trayectorias muy distintos, los cuales resultan de estrategias de aprendizaje elegidas por sus diferencias de consumo de tiempo en el espacio virtual, pero con una calificación también tan alta que la del otro grupo. Este componente, también presente en Lavigne et al. (2008), debería dar luz a otras investigaciones, ya que podrían definir líneas de flexibilidad en el diseño instruccional.
Al ser una temática emergente, las herramientas y técnicas de las que se dispone para el tratamiento de los datos no son por el momento las más convenientes. Podrían realizarse incluso estudios comparativos en donde las muestras provinieran de estudiantes que contaran con perfiles y habilidades tecnológicas diferentes. Además, análisis cualitativos podrían aclarar comportamientos hasta el momento no explorados y, por lo tanto, desconocidos.