INTRODUCCIÓN
La autorregulación del aprendizaje (ARA) es un constructo ampliamente investigado (Schunk y Zimmerman, 1998; Velayutham et al., 2011; Winne, 2001; Zimmerman, 2013). Actualmente se considera un factor predictor del éxito académico de los estudiantes (Dent y Koenka, 2015; Dignath y Büttner, 2018; Zimmerman, y Kitsantas, 2014). Resulta de gran valor conocer el nivel de autorregulación que tienen los estudiantes en su comportamiento educativo, dado que posibilita intervenir de manera preventiva en su transición a la Educación Superior. Se han identificado siete grandes teorías sobre autorregulación (operante, fenomenológica, procesamiento de la información, sociocognitiva, volitiva, vigotskiana y constructivista); estas teorías tienen elementos específicos y particulares, sin embargo, todas han contribuido a la construcción de un marco comprensivo para delimitar en qué consiste la autorregulación y cómo hacer para promoverla en los estudiantes (Panadero y Tapia, 2014). En relación con dichas teorías existen distintos modelos teóricos de ARA que demarcan diferencias y particularidades en cuanto a la definición del constructo (Boekaerts, 1995; Pintrich y De Groot, 1990; Winne, 1996; Zimmerman, 1989).
El modelo de autorregulación propuesto por Zimmerman (2000) basado en la teoría social cognitiva es uno de los más empleados en la investigación. El aprendizaje autorregulado de acuerdo con este modelo, se define como un proceso de aprendizaje autodirigido que integra pensamientos, emociones y acciones que están planificadas y adaptadas cíclicamente, donde el estudiante utiliza una variedad de estrategias personales y recursos a la luz de sus propias experiencias de aprendizaje previas para alcanzar los objetivos académicos establecidos (Chaves, et al., 2015; Efklides, 2011; Pintrich, 2004; Ramdass y Zimmerman, 2011). Existe consenso en concebir la ARA como un proceso auto-regulador que engloba elementos cognitivos, emocionales y comportamentales del estudiante que facilitan los logros académicos, visualizándose como una posible solución del fracaso académico (Schober et al., 2015).
La ARA está compuesta por tres fases: (1) disposición, que implica un proceso de activación o preparación al estudio, que considera el análisis de tareas, planificación, establecimiento de objetivos y metas de aprendizaje; (2) ejecución, considera la realización de la tarea mediante estrategias personales de control que llevarán al estudiante a cumplir su planificación estratégica; y por último (3) evaluación, que implica el juicio que el estudiante hace sobre su actividad de estudio en relación a las primeras dos fases, para en futuras actuaciones alcanzar los objetivos de aprendizaje esperados (Panadero, 2017). Desde esta perspectiva, un estudiante autorregulado es capaz de planificar estratégicamente su aprendizaje, por medio del ajuste de su conducta y estrategias que lo llevarán posteriormente al logro académico esperado (Ventura et al., 2017).
Diversas son las formas de medir el ARA, dentro de las principales se encuentran: las entrevistas (Zimmerman y Martinez-Pons, 1986); técnica de pensar en voz alta (Ward y Traweek, 1993); diarios de aprendizaje (Klug et al., 2011); cuestionarios de auto-reporte (Pintrich et al.,1991), siendo este último el método de evaluación más común en la investigación de ARA. El progresivo interés en este campo, ha llevado a un creciente número de investigadores a desarrollar instrumentos de autorreporte para evaluar ARA y medir los diferentes componentes que se incluyen en este complejo proceso (Jansen et al., 2017; Pintrich et al., 1991; Pintrich et al., 1993; Yan, 2016). Dentro de estos elementos se pueden mencionar los motivacionales, comportamentales, emocionales y cognitivos que se hallan implícitas en los estudiantes (Roll y Winne, 2015; Roth et al,. 2016; Zimmerman, 2008).
Las revisiones sistemáticas sobre instrumentos de evaluación de ARA, se han centrado en: (1) destacar características de los instrumentos usados en contexto de Educación Superior (Roth et al., 2016); (2) revisar el Cuestionario de Estrategias Motivacionales para el Aprendizaje (MSLQ), focalizado solamente en el desarrollo, adaptaciones y aplicaciones del instrumento a sus 25 años de creación; destacando la necesidad de ajustes tras los cambios sociales y estadísticos actuales (Curione y Huertas, 2016); y (3) revisar instrumentos de ARA que permitan diagnosticar e intervenir en población infanto-juvenil (Solé-Ferre et al., 2019). Dadas las características de las revisiones previas, se requiere una revisión vigente sobre los instrumentos que se utilizan para medir ARA en el contexto educativo, específicamente en estudiantes de secundaria, que considere el análisis de aspectos metodológicos para avanzar en investigaciones e intervenciones en esta área. Por tanto, el presente trabajo tiene por objetivo identificar y describir instrumentos para medir ARA utilizados en investigaciones empíricas cuantitativas en estudiantes de Educación Secundaria.
MÉTODO
Para la revisión y selección de artículos, se siguió la metodología de revisión sistemática basada en las declaraciones internacionales PRISMA (Moher et al., 2015), la cual se desarrolló en dos fases. La primera tuvo por objetivo identificar los estudios a incluir y la segunda elaborar una matriz con el propósito de extraer la información de los estudios para su posterior análisis. El proceso de selección de los artículos implicó 5 etapas (identificación, duplicado, elegibilidad, selección y sesgo) las que se pueden apreciar gráficamente en la Figura 1. La etapa de identificación consistió en la búsqueda de artículos en las bases de datos Scopus, Web of Science (WOS) y SciELO usando como palabras claves “instrumento”, “autorregulación del aprendizaje” y “educación secundaria” entre el periodo 2015 y 2019. Se realizaron dos iteraciones de búsqueda por base en idioma inglés y español, se aplicaron los filtros propios de cada base y además se incluyeron 3 estudios a partir del muestreo “bola de nieve”; estos últimos artículos, aunque no aparecieron en la búsqueda inicial, cumplían los criterios de inclusión, por tanto, fueron considerados. La búsqueda final se realizó el 1 de octubre de 2019. La etapa de duplicado consistió en eliminar aquellos estudios que tuvieran una copia literal del texto seleccionado. La etapa de elegibilidad consistió en una revisión por tres jueces independientes, a los cuales se les presentó un protocolo para evaluar el objetivo de la revisión y las palabras claves que debían identificar en el título y resumen.
Se eliminaron artículos que no contenían las palabras claves o no respondían al objetivo de esta revisión. También se eliminaron artículos cuando dos jueces consideraron no incluirlo; las discrepancias fueron resueltas a través de un tercer revisor quien decidió la inclusión del artículo o no. La etapa de selección implicó la descarga y lectura completa de las investigaciones y la aplicación de los criterios de exclusión previamente establecidos. Se incluyeron las investigaciones empíricas cuantitativas sobre ARA en estudiantes de Educación Secundaria. Los criterios de exclusión considerados fueron: 1) estudios no cuantitativos; 2) contexto distinto a Educación Secundaria; 3) tema central distinto a ARA; y 4) artículo no disponible. La etapa de evaluación de sesgo consistió en la revisión de todo el proceso por parte de dos revisores independientes, considerando los criterios de exclusión presentados. El proceso para el análisis de la información de los estudios incluidos implicó cada aspecto considerado que se describe en la Tabla 1 y el diseño de una matriz de artículos incluidos en esta investigación (Tabla 2).
RESULTADOS
Los resultados se exponen considerando 4 aspectos centrales analizados de las investigaciones seleccionadas: 1) países donde se desarrollaron las investigaciones; 2) nombre de los instrumentos utilizados para medir ARA; 3) escala de respuesta y cantidad de ítems; y 4) propiedades psicométricas.
Países donde se desarrollaron las investigaciones
Del total de 21 trabajos analizados, los estudios con más frecuencia se distribuyen en el continente de Europa (62%), comprenden los países de España (n=8; 38,09%), Turquía (n=3; 14,3%), Israel (n=1; 4,7%) y Alemania (n=1; 4,7%). El segundo continente con más investigaciones es el asiático (24%) representado por los países Malasia (n=1; 5%), Taiwán (n=2; 9%), Irán (n=1; 5%) y China (n=1; 5%). Latinoamérica está representada por dos países: Venezuela (n=1; 5%), y México (n=1; 5%). La menor frecuencia de estudios realizados fue en Norteamérica (5%), realizada en Estado Unidos.
Instrumentos utilizados para medir ARA
De las 21 investigaciones analizadas (n=12; 57,14%) utilizan el instrumento MSLQ (Pintrich et al., 1991, 1993); por consiguiente, el MSLQ ha sido adaptado y validado en estudiantes secundarios previo al uso. El otro instrumento que más se utiliza es el Questionnaire of Self-regulated Learning (Wu, 2005); (N=2; 9,1%). Los demás instrumentos fueron utilizados una sola vez. En total se encontraron 10 instrumentos que permiten evaluar las estrategias de ARA en estudiantes de Educación Secundaria (Tabla 3).
Escala de respuesta y cantidad de ítems
La escala de respuesta utilizada con más frecuencia es la de tipo Likert de siete puntos (n=13; 61,9%); sólo siete investigaciones utilizaron una escala tipo Likert de 5 opciones de respuesta (n=7; 38,09%) y solo una utilizó una escala de 4 puntos (ID: 14). El número de ítems reportado por factor es variable; esto se debe al uso de subescalas específicas para los objetivos propuestos por los autores en sus investigaciones. El rango va de 7 a 119 ítems.
Propiedades psicométricas
Las dimensiones declaradas por los investigadores son variadas, se identifican según el instrumento utilizado para medir la ARA. Se constata un rango de 1 a 9 dimensiones, existiendo predominio en el uso de investigaciones que reportaron usar dos y tres dimensiones (Tabla 4). Las dimensiones con más frecuencia de aparición son: autoeficacia, estrategias de motivación, repetición, ensayo, organización y autorregulación metacognitiva.
Respecto a la consistencia interna para cada dimensión, se observó que los investigadores lo reportan en la mayoría de los estudios (n=15; 71,4 %) y en todos estos casos es a través del Alfa de Cronbach, excepto en el estudio (ID: 10). Sólo (n=4; 19,04%) no declaran ni hacen alusión a los índices y las dos investigaciones restantes, a pesar de señalar las propiedades psicométricas de la escala general, no reportan los índices obtenidos por dimensión (ID: 1,7). La validación de los instrumentos -por parte de los autores- para la población de uso se observa en la mayoría de las investigaciones (n=15; 71,4%). Sólo 3 estudios (25%) no reporta validación en la población de uso. Respecto a la confiabilidad, se evidencia que 14 investigaciones analizaron la confiabilidad del instrumento en el estudio, en las siete investigaciones restantes se reportó la confiabilidad en estudios previos, es decir, el instrumento posee índices de fiabilidad obtenidos previamente en la población de uso, pero no verifican las propiedades psicométricas en el estudio que realizan, en este caso, en estudiantes de secundaria. El Alfa de Cronbach estuvo en el rango de .64 y .94 en las diferentes dimensiones, sin embargo, 13 dimensiones no reportan confiabilidad, lo cual es observado en cuatro estudios (ID: 5,12,19,21).
Un resultado adicional que podemos observar al analizar la Tabla 2, es el análisis de las dimensiones que agregan los otros instrumentos y que no son considerados en MSLQ ni en el Questionnaire of Self-regulated Learning. Específicamente los dos instrumentos identificados con mayor frecuencia de uso correspondientes a MSLQ y Questionnaire of Self-regulated Learning consideran por un parte las dimensiones: repetición, elaboración, organización, pensamiento crítico, autorregulación cognitiva; y las dimensiones: autoeficacia, valor de la tarea, ansiedad de aprendizaje, autoobservación, auto juicio, auto-reacción respectivamente.
En el caso de los 8 instrumentos restantes, es relevante en algunos, la aparición de otras dimensiones que han sido consideradas por los autores, en las cuales se observa que la conceptualización utilizada es igual que algunas de las dimensiones del MSLQ o del Questionnaire of Self-regulated Learning, lo cual se puede observar en 4 investigaciones: (1) Cerezo et al., (2015) refiere la dimensión competencia percibida, la cual es equivalente a la autoeficacia del estudiante en su proceso de aprendizaje; (2) Sáiz-Manzanares y Pérez, (2016), refiere las dimensiones inherentes a momentos del procesamiento de la información (adquisición, codificación, recuperación, etc), éstas son equivalentes a la dimensión de estrategias cognitivas y metacognitivas del MSLQ; (3) Suárez et al., (2018), refiere las estrategias de valor de logro y de costo, son estrategias de automotivación que los estudiantes pueden usar para estimular la motivación estableciendo intereses y valores o generando objetivos académicos, por lo tanto, las mismas son equivalentes a la dimensión “componentes de valor ” del factor motivación en el MSLQ; (4) Teng y Huang, (2019) utiliza 4 dimensiones: cognición, metacognición, comportamiento social y regulación motivacional, las dimensiones de: seguimiento y evaluación orientada a objetivos, planificación de ideas, manejo de retroalimentación, procesamiento de texto y memoria del curso refieren a estrategias cognitivas y metacognitivas, las cuales son paralelas a las dimensiones del Questionnaire of Self-regulated Learning; lo mismo sucede con las dimensiones: aumento de intereses, control emocional y autoconocimiento motivacional, están dirigidas a la regulación motivacional que el estudiante aporta en su aprendizaje, aprendizaje entre pares, las cuales se relacionan con la estrategias de gestión de recursos concebidas también en el MSLQ y Questionnaire of Self-regulated Learning.
Respecto de la coherencia de las dimensiones con el modelo teórico propuesto, también se encuentran algunas inconsistencias; por ejemplo, las diferencias en las dimensiones que se usan para medir el constructo de autorregulación, cuando los autores señalan que el instrumento se basa en una determinada teoría, tampoco este representa todas las variables del respectivo modelo teórico. Esto se observa en los dos instrumentos ya mencionados - MSLQ y Questionnaire of Self-regulated Learning-. En el caso del MSLQ, basado en el modelo de Pintrich (2000), este mide las dimensiones: componentes de expectativas, valor y afectivos, estrategias cognitivas y metacognitivas y estrategias de manejo de recursos; pero el modelo tiene 4 fases -(1) previsión, planificación y activación, (2) seguimiento/monitoreo, (3) control y (4) reacción y reflexión- y 4 dimensiones como la cognición, motivación, comportamiento y contexto; pero no se limita sólo a las variables abordadas en el MSLQ. Se proponen futuras investigaciones centradas en el desarrollo de instrumentos para medir ARA, considerando las diferentes variables implicadas en el modelo que se remite o basa.
DISCUSIÓN
El objetivo de este estudio fue identificar y describir investigaciones empíricas cuantitativas sobre instrumentos de aprendizaje autorregulado que se utilizan en estudiantes de Educación Secundaria; para ello se realizó una revisión sistemática de artículos cuantitativos, publicados recientemente en revistas indexadas en las bases de datos Scopus, WOS y SciELO. En cuanto al análisis de los países donde se han desarrollado las investigaciones, se encontró que el continente europeo concentra la mayoría de las investigaciones relacionados con la ARA en estudiantes secundarios, siendo España el país con más frecuencia de estudios, contribuyendo así al desarrollo y adaptaciones de instrumentos para medir la ARA. Escasos estudios se observan en Latinoamérica y Norteamérica. Este resultado es concordante con los hallazgos de Hernández y Camargo (2017), quienes identificaron que sólo un tercio de la región de Iberoamérica ha aportado al desarrollo de investigaciones en ARA en estudiantes universitarios; además, este referente confirma la necesidad de contar con revisiones de instrumentos de ARA en nivel de secundaria, para visualizar los instrumentos de medición óptimos para medir la ARA y desarrollar estrategias para su desarrollo en los estudiantes.
Respecto a los instrumentos hallados para medir ARA, se constata una variedad de instrumentos para dar cuenta de un constructo complejo; específicamente se encontraron 10 instrumentos que miden ARA en estudiantes secundarios. El instrumento más utilizado para medir ARA fue el MSLQ de Pintrich et al., (1991), que refleja una visión específica del constructo que se operacionaliza en dimensiones concretas (Panadero et al., 2015). Además, cumple con una estructura sólida y confiable, validada en múltiples contextos. Sin embargo, no hay acuerdo en relación a cómo se articulan las estrategias de aprendizaje con las apreciaciones, intereses, afectividad y cómo aplican en diferentes contextos académicos (Ventura et al., 2017). Por tanto, existen algunos aspectos en los que se podrían avanzar respecto a las escalas y dimensiones del instrumento para una mejor predicción en el rendimiento académico en diversos contextos académicos (Credé y Phillips, 2011; Inzunza et al., 2018).
En los 10 instrumentos de medición encontrados se constata que en su totalidad son de tipo autoinforme. Si bien esta metodología de evaluación aporta información relevante para estudiar la ARA y su relación con el rendimiento académico en el trascurso de la formación académica del estudiantado; su uso tiene limitaciones, debido a que los estudiantes no son frecuentemente precisos cuando informan sobre su propio uso de estrategias de aprendizaje (Rosário et al., 2019; Panadero, et al., 2015). Por tanto, si se opta por usar este tipo de instrumentos se requieren al menos cautelar adaptaciones específicas al contexto y participantes en el que se realiza el estudio para que permitan identificar niveles inadecuados de ARA y capturar los cambios en las estrategias de los estudiantes que son expuestos a intervenciones específicas (Sáez et., al 2018). La relevancia de contar con instrumentos válidos y confiables para medir ARA, se observa también en el entorno virtual de aprendizaje, puesto que estos contribuyen a promover la autorregulación, motivación y compromiso del estudiante ante las actividades académicas (Melo-Solarte y Díaz, 2018).
Se constató que en la mayoría de las investigaciones analizadas se utilizó la escala de respuesta tipo Likert de siete (61,9%) y cinco puntos (38,09%). La escala tipo Likert según la literatura científica, destaca como una de las técnicas de medida más seleccionadas por los investigadores tanto en la psicología aplicada como en otras disciplinas (Matas, 2018); debido a particularidades que favorecen una menor ambigüedad y mayor precisión de las respuestas al objetivo del investigador, además de ofrecer la posibilidad de recabar una gran cantidad de información en poco tiempo (Osinski y Bruno, 1998). También se consideran relativamente de bajo costo y sencilla de desarrollar tanto para el investigador como para los participantes en comprender y responder un cuestionario. Según estudios realizados que verifican la fiabilidad de los puntos de las escalas; mientras más puntos tiene la escala más confiable es el tipo de respuesta (Bisquerra y Pérez-Escoda, 2015; González-Alonso y Pazmiño-Santacruz, 2015); por tanto, puede concluirse que las investigaciones presentadas en esta revisión sistemática son concordantes con este criterio, dado que las escalas utilizadas fluctuaron ente 5 y 7 puntos. Respecto a la consistencia interna para cada dimensión de los instrumentos, se observó que los investigadores lo reportan en la mayoría de los estudios (n=15; 71,4 %). Sin embargo, un porcentaje no despreciable (19,04%) no declaran ni hacen alusión a los índices obtenidos por dimensión y otros dos estudios, sólo dan cuenta de la consistencia interna de la escala general, no reportando los índices obtenidos por dimensión (ID: 1,7).
En cuanto a la confiabilidad, se evidencia que 14 investigaciones analizaron la confiabilidad del instrumento en el mismo estudio, pero en otras siete investigaciones sólo se reportó la confiabilidad de estudios previos, es decir, no analizaron la consistencia interna de las dimensiones de las escalas del instrumento en el estudio que realizan, aunque dan cuenta de los índices de fiabilidad obtenidos previamente en la población de uso, en este caso, en estudiantes de secundaria. Las investigaciones que no aluden al análisis de la consistencia interna antes de la aplicación de las escalas ponen en riesgo la veracidad de los resultados en tanto la confiabilidad indica el grado en que el instrumento mide sin error (Morata-Ramírez et al 2015). Además, hay que considerar que todos los índices de fiabilidad reportados son a través del Alfa de Cronbach, lo cual actualmente ha tenido algunas aprensiones, principalmente porque el uso y reporte de la confiabilidad con este coeficiente, debe asegurar primeramente el cumplimiento de supuestos, que en muchos casos no se cumple, por las propias características de las escalas, cuestión que se discute ampliamente en el trabajo desarrollado por Trizano y Alvarado (2016). El número de ítems presentado por los autores en cada una de las dimensiones de los instrumentos utilizados se observa es variable en su cuantía, lo cual está relacionado con los objetivos de las investigaciones encontradas. En los estudios de análisis factorial, existe consenso en considerar que mientras más ítems se presenten, más sólida será la solución factorial, lo que apunta a un mínimo de tres o cuatro ítems por dimensión mientras se disponen un mínimo de 200 participantes (Lloret-Segura, et. al.,2014).
La validación de los instrumentos por parte de los autores para la población de uso se observa en la mayoría de las investigaciones (n=15; 71,4%). Sólo 3 estudios (25%) no reporta validación en la población de uso, aspecto determinante que ha sido considerado en las recomendaciones y directrices internacionales para el proceso de adaptación de escalas (Muñiz et al., 2013; Gudmundsson, 2009). En relación con la validez de contenido; se extrajo en su mayoría (66%) indicadores de buen dominio de contenido referido a lo que se deseó medir (peculiaridad de las estrategias de aprendizaje de la población relacionado con las escalas e ítems) y 28% no lo hicieron. Esto priva de obtener información valiosa respecto a la observación directa del instrumento en Estudiantes de Secundaria (Urrutia et al., 2014).
Las limitaciones de este estudio se relacionan con la identificación de investigaciones registradas en sólo tres bases de datos, lo que puede dificultar en los hallazgos de un número mayor de investigaciones empíricas cuantitativas relacionadas a los instrumentos utilizados para medir la ARA en estudiantes de secundaria. Además, sólo se identificaron cuestionarios como forma de medición, puesto que la investigación responde al criterio de identificar sólo estudios cuantitativos, por lo tanto, se dejaron fuera estudios de metodología mixtos o cualitativos. En consecuencia, se recomienda para futuros investigaciones analizar estudios con otros diseños de metodología, considerando que podrían mostrar formas importantes de cómo estudiar la ARA, a través de otras formas de medición.
La pertinencia del uso de instrumentos de medición válidos y confiables; así como el desarrollo de estrategias de autorregulación, como una herramienta importante para prevenir el fracaso académico y la deserción de los estudiantes en etapas posteriores de educación, favorecerá la formación de capital humano que participe en el desarrollo de sus países. Se requiere avanzar en nuevas formas de medición de ARA en estudios cuantitativos, es decir, nuevos métodos de medición de ARA para triangular los resultados de los instrumentos de tipo autorreporte que son declaraciones de los estudiantes sobre el uso de una determinada estrategia. Finalmente, es importante contar con instrumentos de medición confiables y válidos de ARA que permitirá evaluar adecuadamente el impacto de programas específicos diseñados e implementados con el objetivo de mejorar los niveles de ARA en estudiantes de secundaria.
CONCLUSIONES
De acuerdo a los resultados y discusión se pueden extraer las siguientes conclusiones principales: 1) en el continente Europeo se concentra la mayor cantidad de investigaciones sobre ARA en estudiantes de secundaria, y en América Latina se encuentra en un estado más preliminar de desarrollo; 2) el instrumento más utilizado para medir ARA es el MSLQ con adaptaciones para su uso en diferentes contextos; y 3) la confiabilidad y validez se reportan en la mayoría de los estudios, no obstante, se registra un número de estudio que, aunque es bajo, no calcularon la confiabilidad y validación del instrumento usado.