SciELO - Scientific Electronic Library Online

 
vol.127 número10Neoplasia colorrectal.: Tratamiento de la obstrucción con endoprótesis metálicas autoexpandiblesHiponatremia e hipokalemia graves, recientes, asociadas a hidroclorotiazida, enalaprila y citalopram.: Caso clínico índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Revista médica de Chile

versión impresa ISSN 0034-9887

Rev. méd. Chile v.127 n.10 Santiago oct. 1999

http://dx.doi.org/10.4067/S0034-98871999001000009 

Construcción y validación de un
instrumento de medición de
síntomas de enfermedad por reflujo
gastroesofágico. Informe preliminar

Construction and validation of
a gastroesophageal reflux symptom
scale

Carlos Manterola D, Sergio Muñoz N, Luis Grande P, Pablo
Riedemann G.

Background: Gastroesophageal reflux symptoms are frequent in the general population, but there is a lack of information about its prevalence and valid and reliable scales to determine it. Aim: To design a valid and reliable scale to determine gastroesophageal reflux disease. Subjects and methods: A Cross-sectional study with patients and controls was conducted. The diagnosis of gastroesophageal reflux was based of clinical plus radiological, endoscopic or pathologic criteria. A structured questionnaire was built, containing items covering different clinical manifestations of gastroesophageal reflux disease. All subjects were subjected to 24 h esophageal pH monitoring. Internal consistency of items, interobserver reliability, criterion and construct validity, sensitivity, specificity and predicted values were obtained. Results: One hundred thirteen subjects (74 female and 39 male with a mean age of 46 years old) were studied. Seventy three had gastroesophageal reflux and 40 were controls. Internal consistency of the score was 0.82. Inter observer reliability was greater than 0.80 and a significant association was observed between the score and 24 h esophageal pH monitoring (p <0.001). Instrument sensitivity was 97% and specificity 83%. Conclusions: The designed scale proved to be a valid and reliable instrument to measure gastroesophageal reflux symptoms, that can be used for future prevalence studies.
(Key Words: Esophageal Motility Disorders; Gastroscopy; Gastroesophageal reflux)

Recibido el 20 de abril, 1999. Aceptado en versión corregida el 16 de agosto, 1999.
Trabajo parcialmente financiado por INCLEN, Grant #1012-980003, Nº EX 98/105 de la
Dirección de Investigación de la Universidad de la Frontera y parcialmente por proyecto
DIDUFRO 99/20.
Servicio y Departamento de Cirugía, Hospital Clínico de la Frontera y Unidad
de Epidemiología Clínica, Facultad de Medicina, Universidad de la Frontera. Servicio y
Departamento de Cirugía, Hospital Clínico de Barcelona, Universidad de Barcelona, España.

La enfermedad por reflujo gastroesofágico (ERGE) es un problema de salud pública, de creciente importancia porque, a una mayor expectativa de vida debe seguir un aumento en la calidad de la misma. Aun cuando los síntomas de ERGE suelen pasar desapercibidos en gran parte de la población, por ser considerados normales, se ha comunicado que en población adulta, el 44% de las personas refieren síntomas al menos una vez al mes, y 7% a diario1,2. Estudios en individuos sintomáticos que consultan han permitido estimar que la esofagitis por reflujo tiene una prevalencia de 5 a 10%3; que la estenosis esofágica secundaria puede pesquisarse en 10%; y, la metaplasia de Barrett entre 4,5 y 20%.

La ERGE tiene un amplio espectro de formas de presentación: puede manifestarse por síntomas típicos, como pirosis, regurgitación y disfagia4-6, así como también por manifestaciones atípicas, como las respiratorias (tos nocturna, ronquera matinal, cuadros asmatiformes, laringitis y faringitis reiterativas1,7,8) y el dolor torácico no-coronario9,10. De acuerdo a la intensidad de los síntomas, los pacientes pueden consultar en forma precoz, o pueden no hacerlo nunca, asumiendo que sus molestias son parte de la vida normal3,11.

Para el estudio de estos pacientes, se dispone en la actualidad de diversos métodos diagnósticos, pero de todos ellos, el de mayor sensibilidad y especificidad, y por ende el que es considerado como el gold standard (prueba de oro) es la medición de pH esofágico ambulatorio de 24 h. Esta, cuantifica de una forma fisiológica la presencia de RGE, permite además correlacionar la sintomatología con los cambios del pH y refleja la capacidad de aclaramiento esofágico12.

Es escasa la literatura en relación a prevalencia de ERGE y menor aún aquella referente a instrumentos de medición de síntomas de esta enfermedad. Por ello, es que el objetivo de este trabajo es construir un instrumento de medición válido y confiable de síntomas de ERGE, para posteriormente, y en una segunda etapa, aplicarlo a la población general en un estudio de prevalencia de síntomas de ERGE.

MATERIAL Y MÉTODO

Sujetos. Se seleccionaron pacientes con ERGE, cuyo diagnóstico se planteó en base a la presencia de al menos 2 de los siguientes criterios: clínicos, radiológicos, endoscópicos y/o histopatológicos, que consultaron en forma consecutiva; y parientes de pacientes con ERGE, sin síntomas digestivos altos, en adelante llamados controles.

Los criterios de inclusión considerados fueron el ser residentes de la ciudad de Temuco, de edad igual o superior a 15 años, y que hubiesen firmado el consentimiento informado para participar en el estudio.

Los criterios de exclusión utilizados fueron el tener antecedente de embarazo actual, enfermedades esofágicas benignas y malignas, enfermedades capaces de causar RGE o alteraciones de la motilidad esofágica como parte de su curso natural, enfermedades gastroduodenales benignas y/o malignas, ingesta de cáusticos, cirugía sobre el tracto digestivo alto, y enfermedades mentales.

El tamaño de la muestra se determinó usando criterios de factibilidad13,14, con 10 sujetos por cada ítem del cuestionario. Dado que el instrumento se diseñó con 11 ítems, el tamaño muestral mínimo fue de 110 individuos. Se utilizó una relación 3:1 entre pacientes y controles: en primer lugar por ser la ERGE una entidad frecuente en la población, lo que facilita la obtención de casos; y en segundo lugar, porque la validación del instrumento implica la realización de una medición de pH esofágico de 24 h, prueba diagnóstica invasiva que produce algunas molestias, lo que hace difícil el reclutamiento de individuos sanos o asintomáticos.

Instrumento de medición. Se diseñó un cuestionario estructurado como base para el instrumento a validar. Este consta de 11 ítems, distribuidos en 3 secciones: datos del sujeto en estudio (variables biodemográficas), síntomas típicos de ERGE (pirosis, regurgitación y disfagia) y síntomas atípicos (dolor torácico, tos seca, asma y disfonía). Fue construido con 4 preguntas abiertas (sexo, edad, peso y estatura), 3 ítems dicotómicos (manifestación presente o ausente) y 4 ítems de alternativas, según frecuencia de aparición de los síntomas (Tabla 1). Adicionalmente se rotaron los ítems en versiones distintas del instrumento con el fin de minimizar el sesgo de tendencia en las respuestas.

Tabla 1. Codificación de los ítems,
según frecuencia de aparición

Items Frecuencia

Pirosis diaria
  al menos una vez por semana
  al menos una vez por mes
  no
Regurgitación diaria
  al menos una vez por semana
  al menos una vez por mes
  no
Disfagia si
  no
Dolor torácico diario
  al menos una vez por semana
  al menos una vez por mes
  no
Tos seca diaria
  al menos una vez por semana
  al menos una vez por mes
  no
Asma si
  no
Disfonía si
  no

La construcción de ítems tuvo como objetivo la consignación de las diversas manifestaciones clínicas de la ERGE comunicadas en la literatura. Estos, fueron construidos a partir de antecedentes teóricos y de la adaptación de ítems de otros instrumentos para medir síntomas de ERGE15-21. Para conformar la versión definitiva del cuestionario se contó con la opinión de expertos (6 médicos vinculados al tema, provenientes de diferentes Universidades de España, Italia, Inglaterra, Uruguay y Chile), los que conformaron un panel de discusión en relación a los ítems de interés.

Diseño y procedimiento. Se trata de un estudio de corte transversal para la construcción de un instrumento de medición válido y confiable de síntomas de ERGE. El estudio se realizó entre los meses de enero y diciembre de 1998 en el Hospital Clínico de la Frontera y la Facultad de Medicina de la Universidad de la Frontera, Temuco. Previo a la aplicación del cuestionario, se realizó un estudio piloto, aplicando el cuestionario a una población similar a la muestra, para objetivar potenciales falencias del instrumento y la comprensión de cada uno de los ítems13. Se regló el estudio a nivel hospitalario y se obtuvo la aprobación por parte del Comité de Etica del Hospital. La aplicación del cuestionario fue realizada por 2 encuestadores, una asistente de clínica con formación de técnico paramédico y 2 años de experiencia en el campo; y el otro, un médico residente de cirugía. La medición de pH esofágico, fue ejecutada por un médico especialista con experiencia en el tema, cuyos resultados han sido ampliamente comunicados12,22,23.

A los pacientes y controles, previa firma del consentimiento informado, se les administró el cuestionario en 2 oportunidades y se les realizó una medición de pH esofágico. El intervalo de tiempo en que se aplicaron las mediciones fue de 24 h.

Entre las variables del análisis computacional de la medición de pH esofágico, se escogieron aquellas que se consideran de mayor capacidad discriminatoria. Estas son: número total de episodios de reflujo, número total de episodios mayores de cinco minutos, episodio de reflujo más largo, tiempo total de pH inferior a 4, tiempo de pH inferior a 4 en supino, porcentaje total de tiempo de reflujo, porcentaje de tiempo de reflujo nocturno, índice de reflujo y puntuación final de De Meester.

Determinación de confiabilidad del instrumento. Confiabilidad, definida como el grado de acuerdo o concordancia entre mediciones realizadas en ocasiones diferentes, o por observadores diferentes, o por prueba paralela14,24 se determinó como sigue a continuación.

Se utilizó análisis factorial exploratorio con el fin de establecer la existencia de uno o más dominios en el instrumento. Luego de la identificación de dominios se procedió a evaluar la consistencia interna a través del alfa de Cronbach25,26. Se determinó el coeficiente de correlación entre el ítem y la escala, con el objeto de eliminar ítems que presentaran una baja correlación con la escala y/o que al ser excluidos permitieran incrementar la estadística alfa.

La confiabilidad interobservador (entre 2 observadores), se estudió mediante la aplicación del estadístico kappa para determinar así el grado de reproducibilidad del instrumento al ser aplicado por diferentes observadores. Se exigió un kappa >0,70.

Determinación de validez del instrumento. La validez, definida como el grado con que los resultados de una medición se corresponden con el estado de veracidad del fenómeno medido13,24, se estudió aplicando validez de contenido, de fachada, de criterio, de constructo, utilizando grupos extremos y validez concurrente.

La validez de contenido y de fachada se encuentran garantizadas por la rigurosa revisión de la literatura en relación a las manifestaciones clínicas de ERGE y los instrumentos de medición disponibles para su medición; como asimismo haber contemplado en el desarrollo del instrumento de medición, la incorporación de un panel de expertos.

La validez de criterio, que refleja el desempeño de la escala, en relación a otras variables seleccionadas, se estudió contra un gold standard, la medición de pH esofágico de 24 h. Se correlacionaron las subescalas generadas con la variable de mayor poder discriminatorio del análisis computacional de la medición de pH, el score final de De Meester, mediante un modelo de regresión lineal, ajustado por las variables biodemográficas.

La validez de constructo se evaluó utilizando grupos extremos, lo que permitió valorar la validez del cuestionario al aplicarlo a dos grupos, uno de pacientes con una medición de pH muy alterada, y otro de sujetos con una medición de pH normal. Para ello, se seleccionó el 25% de los valores más bajos y el 25% de los valores más altos del score final de la medición de pH, tomando como puntos de corte inferior y superior, 5,2 y 36,4 puntos respectivamente. Se aplicó un modelo de regresión logística para estudiar la asociación entre las subescalas y los grupos extremos previamente generados.

La validez concurrente del cuestionario se estudió evaluando la escala contra las demás variables de la medición de pH (Nº total episodios de reflujo, episodios mayores de 5 min, reflujo más largo, tiempo total de reflujo, tiempo de reflujo nocturno, porcentaje total de tiempo de reflujo, porcentaje de tiempo de reflujo nocturno e índice de reflujo) esto se realizó con un modelo de regresión logística.

Análisis estadístico. Para el estudio de las variables dicotómicas se construyeron tablas de contingencia y se aplicó el estadígrafo de chi cuadrado de Pearson, para la comparación de variables continuas la prueba de t, para el estudio de consistencia interna de los ítems el alfa de Cronbach, para el análisis de confiabilidad interobservador el estadístico kappa, y para los estudios de validez se utilizaron análisis factorial, regresión lineal y modelos de regresión logística múltiple. Finalmente, se construyó una curva ROC para la obtención de sensibilidad, especificidad y valores predictivos. Estos análisis fueron realizados mediante los softwares STATA 6,0 y SPSS.

RESULTADOS

Se estudiaron 113 sujetos, 73 de ellos pacientes con ERGE y los 40 restantes, individuos asintomáticos digestivos, que se consideraron controles. Del total de la muestra, 74 eran mujeres y 39 hombres con una edad promedio de 46,3 años; se les registró un peso promedio de 69 kg y una estatura promedio de 164 cm. Ninguna de estas variables fueron significativamente diferentes entre pacientes y controles, a excepción del peso (el que se observa con una tendencia mayor en el grupo de pacientes, pero sin alcanzar significancia estadística) y del sexo, pues se dispuso de un mayor número de sujetos de sexo femenino, con una relación mujer:hombre de 2:1 entre los pacientes y de 3:1 entre los controles (Tabla 2).

Tabla 2. Variables biodemográficas en pacientes y controles
(prueba de t y
c2)(n=113)

Variable
Controles
Pacientes P
  media IC 95% media IC 95%  
 
Edad (años) 44,1 (40,7-47,4) 47,5 (44,9-50,1) 0,105
peso (kg) 65,9 (62,8-69,1) 70,6 (66,9-74,3) 0,093
estatura (cm) 163,9   (161,0-166,1) 164,3   (162,0-166,5) 0,698
sexo, nº casos (%)         0,115
hombres 10 (26) 29 (74)  
mujeres 30 (41) 44 (59)  

Los síntomas más frecuentes son pirosis (62,9%) y regurgitación (68,1%). Por otro lado, se observó que asma y disfonía fueron reportados por una minoría en relación con los demás síntomas (Tabla 3). Al analizar el número de síntomas que reporta cada sujeto, se observó que 78% de los controles no manifestó síntoma alguno, en comparación con el 73% de los pacientes que informaron al menos 3 síntomas, independiente de su frecuencia de aparición (p <0,001 mediante c2).

Tabla 3. Distribución de los ítems, según frecuencia de aparición

  Frecuencia
Item Diaria Semanal Mensual No

Pirosis 29,2 20,4 13,3 37,1
Regurgitación 32,7 20,4 15,0 31,9
Dolor torácico   2,7 10,6 19,5 67,3
Tos seca 12,4 13,3   7,9 66,4
         
Sujetos con:   n %  
  disfagia 35 31,0  
  asma 12 10,6  
  disfonía 22 19,5  

Confiabilidad. Se observó una muy buena consistencia interna de los ítems en la construcción de la escala, obteniéndose un valor de a de Cronbach de 0,82, lo que permite asegurar que los ítems se encuentran intercorrelacionados y, por ende, miden el constructo construido.

Posteriormente, se realizó el estudio de confiabilidad interobservador entre los ítems en dos aplicaciones de la escala por dos observadores independientes. De este análisis se pudo apreciar que la confiabilidad de los distintos ítems del cuestionario es "casi perfecta"27, con valores kappa en general superiores a 0,75 (Tabla 4).

Tabla 4. Estudio de confiabilidad
interobservador (kappa)
(n=113)


Item Acuerdo(%) kappa

Pirosis 86,7 0,82
Regurgitación 90,3 0,87
Disfagia 95,6 0,91
Dolor torácico 96,5 0,94
Tos seca 85,8 0,74
Asma 95,6 0,77
Disfonía 95,6 0,86

Conociendo la consistencia interna y confiabilidad de los ítems, se creó una escala cuya puntuación va de 0 a 15 (según la existencia de síntomas y su frecuencia), con una media de 4,8 puntos para el total de la serie. La aplicación del análisis factorial con rotación varimax permitió constatar (según sus componentes), que se generan 2 subescalas por agrupación de ítems (Figura 1). La subescala 1, conformada por los ítems pirosis, regurgitación, disfagia y dolor torácico que quedó con una puntuación de 0 a 10, y una media de 3,8 puntos al ser aplicada a la totalidad de la serie; y la subescala 2, conformada por los ítems tos seca, asma y disfonía que se construyó con una puntuación de 0 a 5, y dio una media de 1,0 puntos al aplicarla a la totalidad de los sujetos (Tablas 5 y 6).

FIGURA 1.Componentes de la escala original. Análisis factorial con rotación de matriz.
Los cuadrados representan los diferentes síntomas evaluados (disfonía, tos, asma, disfagia, regurgitación, pirosis y dolor torácico).
disfo: disfonía; dt: dolor torácico; reg: regurgitación; disfa: disfagia; pir: pirosis

Tabla 5. Subescala 1

Items Frecuencia
Puntuación

Pirosis  
  diaria 3
  al menos una vez por semana 2
  al menos una vez por mes 1
  no 0
Regurgitación  
  diaria 3
  al menos una vez por semana 2
  al menos una vez por mes 1
  no 0
Disfagia  
  si 1
  no 0
Dolor torácico  
  diario 3
  al menos una vez por semana 2
  al menos una vez por mes 1
  no 0

Escore máximo = 10 puntos
Escore mínimo = 0 puntos

 

Tabla 6. Puntuación media de la escala y subescalas. Relación con los grupos en estudio
(prueba de t) (n=113)

Grupo Controles Pacientes P
  media IC 95% media IC 95%  

Escala original 1,7 (1,4-1,9) 7,5 (7,1-7,0) <0,001
Subescala 1 0,4 (0,1-0,6) 5,6 (5,1-6,1) <0,001
Subescala 2 0,1 (-0,1-0,2) 1,5 (1,2-1,9) <0,001

Validez. Se aplicó un modelo de regresión lineal entre la escala completa y el escore final de la medición de pH esofágico, obteniéndose una alta significación (p <0,001). Luego se ajustó por sexo, edad, peso y estatura, lo que permitió verificar que la asociación encontrada es independiente de estas características demográficas.

A continuación, se analizaron las subescalas 1 y 2, y se ajustaron por las mismas variables demográficas. Se pudo comprobar que estas variables no confunden ni modifican la relación, pero que es, en definitiva, la subescala 1 la que se asocia significativamente con el escore final de la medición de pH esofágico (p <0,001), no jugando ningún rol en el modelo la subescala 2 (p= 0,844).

Posteriormente, se analizó la validez de constructo en grupos extremos. En primer lugar se estudió la relación entre score final de medición de pH y los grupos en estudio, de lo que se extrajo la diferencia entre controles y pacientes para esta variable (4,8 puntos vs 35,2 puntos; p <0,001). Luego, se aplicó un modelo de regresión logística para estudiar la asociación entre las subescalas y los grupos extremos previamente generados. De este análisis se obtuvo una significación estadística solamente con la subescala 1 (p <0,001), quedando nuevamente la subescala 2, sin jugar algún rol en esta asociación (p = 0,710).

Inmediatamente después se estudió la validez concurrente del cuestionario contra las demás variables de medición de pH esofágico. Esto se realizó con las dos subescalas por separado, observándose una correlación entre la subescala 1 con todas las variables de medición de pH esofágico, la que es inexistente para la subescala 2 (Tabla 7).

Tabla 7. Validez concurrente. Correlación entre las subescalas
y las variables de medición de pH esofágico
(n=113)

Variable Subescala 1 Subescala 2

Nº total episodios de reflujo 0,7061 0,3668
Nº de episodios >5 min 0,5936 0,2974
Episodio más largo (min) 0,5111 0,2087
Tiempo total de reflujo (min) 0,5820 0,2882
Tiempo de reflujo nocturno (min) 0,5532 0,2618
Tiempo total de reflujo (%) 0,5804 0,2918
Tiempo de reflujo nocturno (%) 0,5566 0,2860
Indice de reflujo (reflujo/h) 0,6708 0,4162
Puntuación final (puntos) 0,6565 0,3258

Se construyó una curva ROC para conocer el punto de corte en relación con el score final de medición de pH esofágico, a objeto de determinar sensibilidad, especificidad y valores predictivos de la escala definitiva (Figura 2). En ésta, se puede apreciar que entre los puntos 3 y 5 de la subescala 1 se obtienen cifras de sensibilidad y especificidad adecuados. Finalmente, y para obtener información más precisa, se aplicó un modelo de regresión logística con la subescala 1 y los puntos de corte, hecho que permitió verificar que la mejor opción es utilizar como punto de corte, para diferenciar sanos de enfermos, los 3 puntos de la subescala 1 (Tabla 8), de tal modo, que se considerarán enfermos aquellos sujetos que al aplicarles la escala definitiva o modificada (subescala 1) den una puntuación ³3 puntos, y sanos a aquellos cuya puntuación sea £2 puntos.


FIGURA 2. Curva ROC. Subescala 1 y score final de la medición de pH esofágico.

 

Tabla 8. Discriminación de la subescala 1
(regresión logística)

Variable Punto de corte
  3 o más 4 o más

Sensibilidad (%) 96,6 93,1
Especificidad (%) 82,8 86,2
Valor predictivo positivo (%) 84,9 87,1
Valor predictivo negativo (%) 96,0 92,6
Clasificación correcta (%) 89,7 89,7
Area bajo la curva 0,96 0,90

DISCUSIÓN

La ERGE es una entidad compleja, ya que sus manifestaciones pueden ser múltiples y en ocasiones difíciles de interpretar. Para plantear el diagnóstico no basta la existencia de sintomatología, ya que se exige el cumplimiento de otros criterios. Por ello es que se pretende comenzar por el principio, conocer la prevalencia de síntomas de la enfermedad, para luego avanzar en el conocimiento de otros aspectos epidemiológicos de ésta.

Como se comentó en páginas anteriores, es evidente el exiguo conocimiento disponible en relación a diferentes aspectos epidemiológicos de la ERGE, la literatura existente es escasa, y la mayor parte de ella presenta carencias metodológicas evidentes. Una de las principales críticas es que todos los estudios de prevalencia realizados en este campo, han sido realizados con instrumentos que no fueron sometidos a estudios de validez ni confiabilidad15-21. Con ello, no sólo se ignora la capacidad de reproducir estas mediciones, sino que además no se puede saber si se midió lo que se quería medir. Es por esto, que parece de suma importancia diseñar un instrumento válido y confiable que permita la realización, en un futuro próximo, de un estudio de prevalencia de síntomas de ERGE.

Cuando se diseñó la escala, se intentó generar tantos ítems como síntomas y manifestaciones conocidas hubiese de ERGE. Sin embargo, a poco andar se reparó en que había varias manifestaciones difíciles de objetivar (crisis de apnea, neumonitis a repetición, broncoespasmos, otitis media recidivante, etc), por lo que el número de ítems fue disminuyendo a medida que se iban discutiendo, para quedar solamente los que parecían razonablemente medibles.

Pero aún así, existía la sospecha que alguno de los ítems (especialmente aquellos relacionados con manifestaciones atípicas) podía terminar excluido de la escala definitiva. La primera evidencia concordante con esta sospecha fue el estudio de consistencia interna; a pesar que se demostró una adecuada intercorrelación de los ítems entre sí, ya en esta fase se observó que el ítem disfonía se podía excluir sin causar alteración significativa en la escala. Luego, al estudiar la confiabilidad, este hecho se confirmó, puesto que otros dos ítems (tos seca y asma) obtuvieron valores kappa que sin ser inadecuados, estaban muy por debajo del resto. Sin embargo, se verificó una apropiada reproducibilidad de los ítems, punto que concita un particular interés, puesto que la escala obtenida puede ser sugerida en futuros estudios de prevalencia, y en distintos lugares.

Posteriormente, cuando se practicó el análisis factorial a la escala original (Figura 1), se observó que éste se correlacionaba fuertemente con la clínica, pues los ítems tos seca, asma y disfonía (manifestaciones clínicas de la esfera respiratoria y menos frecuentes en la ERGE) se encontraban separados de los ítems que en definitiva representan a los síntomas de la esfera digestiva, típicos y frecuentes de la ERGE, y que se encontraban relacionados también con el ítem dolor torácico, que sin representar un síntoma digestivo, se puede plantear el supuesto que su vecindad en este gráfico puede obedecer, desde el punto de vista clínico, al margen de confusión que puede existir entre los ítems dolor torácico y disfagia y/o pirosis, pues estos dos últimos, en ocasiones, pueden presentarse como incapacidad deglutoria dolorosa o ardor retroesternal doloroso. Es por lo anteriormente expuesto, que se decidió continuar trabajando con 2 subescalas (una de síntomas típicos más dolor torácico, y otra de manifestaciones atípicas respiratorias).

Por otro lado, la idea de utilizar el score final de De Meester como parámetro pHmétrico en el estudio de validez de criterio, obedeció a que éste constituye un índice matemático que incluye a las variables número total de episodios de reflujo, número de episodios de reflujo mayores de 5 min de duración, episodio de reflujo más largo, porcentaje de tiempo de reflujo total, en ortostatismo y nocturno. Este, por ende, es un buen representante de las demás variables en estudio, lo que se demostró posteriormente con una adecuada validez concurrente. Los grupos extremos generados, y la validez concurrente obtenida confirmaron que la subescala 2 podía ser excluida, pues no generaba un aporte significativo al resto de los ítems.

Trabajando con la subescala 1 en forma aislada (Tabla 8), y considerándola como la escala definitiva se generó la discusión del punto de corte más apropiado para definir la discriminación de la escala. Al observar la curva ROC (Figura 2), se puede constatar que tanto el punto de corte 3 como el 4 presentan parámetros de discriminación adecuados, y desde el punto de vista estadístico parece ser mejor el punto de corte 4, pues a pesar que disminuye un poco la sensibilidad (3,5%), incrementa la especificidad (6,6%), lo que permitiría clasificar correctamente un mayor porcentaje de sujetos sanos (Tabla 7). Sin embargo, al observar este hecho desde un punto de vista clínico, resulta impensable clasificar como no enfermo (para ERGE) a un sujeto con una puntuación de 3 que puede tener disfagia y pirosis o regurgitación al menos una vez por semana, pirosis o regurgitación diaria, pirosis al menos una vez por semana y regurgitación diaria, o viceversa; es decir sujetos que probablemente estarían enfermos, con una pHmetría alterada e incluso con esofagitis por reflujo. Este pensamiento, puso término a la discusión y definió que el punto de corte de la escala debía ser 3, pues esto se ajusta más a lo que la experiencia, la observación clínica y la teoría sugieren.

Por otro lado, si ahora lo miramos desde el punto de vista de estudios de prevalencia de síntomas, es importante que este instrumento tenga la mayor sensibilidad posible, pues lo que interesa es captar el mayor número de sujetos sintomáticos, que pueden ser considerados como enfermos. Es esencial considerar, que el punto de corte seleccionado depende del uso que se dará al instrumento y decisiones que se tomarán con su resultado.

Finalmente cabe señalar que en el presente estudio se diseña y valida un instrumento de medición de síntomas de ERGE único en su género, con 90% de clasificación correcta, una sensibilidad de 97% y especificidad de 83%. Este, permitirá realizar futuros estudios de prevalencia de síntomas de ERGE en diferentes lugares con un adecuado nivel de reproducibilidad.

Correspondencia a: Dr. Carlos Materola, Departamento de Cirugía, Universidad de la Frontera. Casilla 54-D, temuco, Chile. Fax: 56-45-325761. E-mail: cmantero@ufro.cl

REFERENCIAS

1. THE GALLUP ORGANIZATION. Gallup Survey on heartburn across America. Princeton, NJ: 1988, 24.        [ Links ]

2. NEBEL OT, FORNES MF, CASTELL DO. Symptomatic gastroesophageal reflux: Incidence and precipitating factors. Am J Dig Dis 1976; 21: 953-6.        [ Links ]

3. TRIMBLE KC, DOUGLAS S, PRYDE A. Clinical characteristics and natural history of symptomatic but not excess gastroesophageal reflux. Dig Dis Sci 1995; 40: 1098-104.        [ Links ]

4. GALMICHE JP, BRULEY DV. Symptoms and disease severity in gastroesophageal reflux disease. Scand J Gastroenterol 1994; 29 (Suppl) 201: 62-8.        [ Links ]

5. BRAGHETTO I, VELASCO M. Reflujo gastroesofágico patológico. Clínica y diagnóstico. En Braghetto I, Csendes A (Eds). Patología benigna del esófago. Santiago. Chile. Editorial Mediterráneo 1989; 63-8.        [ Links ]

6. PONCE J, HINOJOSA J, GARRIGUES V. Sintomatología y complicaciones. En Vilardell F. Ed. Patología de la secreción gástrica I. Barcelona, Ediciones Doyma, 1991; 31-9.        [ Links ]

7. SONTAG SJ, SCHNELL TG, MILLER TQ, KHANDEWALL S, O’CONELL S, CHEJFEC G ET AL. Prevalence of oesophagitis in asthmatics. Gut 1992; 33: 872-6.        [ Links ]

8. SPECHLER SJ, GORDON DW, COHEN J, WILLIFORD WO, KROLL W. The effects of antireflux therapy on pulmonary function in patients with severe gastroesophageal reflux disease. Am J Gastroenterol 1995; 90: 915-8.        [ Links ]

9. ROS E. Dolor torácico de origen esofágico. En Navarro S, Terés J, Pique JM, Bordas JM (Eds), Técnicas de exploración y diagnóstico en gastroenterología. Barcelona, Editorial Masson-Salvat, 1993; 217-24.        [ Links ]

10. MANTEROLA C. Evaluación del dolor esofágico. Gastroenterología Latinoamericana 1997; 8: 18-25.        [ Links ]

11. MC DOUGALL NI, JOHNSTON BT, KEE F, COLINS JSA, MCFARLAND RJ, LOVE AHG. Natural history of reflux oesophagitis: A 10 years follow up of its effect on patient symptomatology and quality of life. Gut 1996; 38: 481-6.        [ Links ]

12.MANTEROLA C, GARRIDO L, MUÑOZ N. Registro continuo de pH intraesofágico de 24 h en individuos sanos. Rev Méd Chile 1997; 125: 1313-8.        [ Links ]

13. STREINER DL, NORMAN GR. Validity. In Streiner DL (Ed). Health measurement scales. A practical guide to their development and use. New York: Oxford University Press, 1995; 144-62.

14. STREINER DL, NORMEN GR. Reliability. In Streiner DL (Ed). Health measurement scales. A practical guide to their development and use. New York: Oxford University Press 1995: 104-27.

15. CSENDES A, VALENZUELA J, BECKER P, ARRAZOTA JA, MEDINA E. Prevalencia de síntomas esofágicos y gastrointestinales en adultos chilenos. Rev Méd Chile 1989; 117: 146-9.        [ Links ]

16. MOLD JW, REED LE, DAVIS AB, ALLEN ML, DECKTOR DL, ROBINSON M. Prevalence of gastroesophageal reflux in elderly patients in a primary care setting. Am J Gastroenterol 1991; 86: 965-70.        [ Links ]

17. RUTH M, MANSSON Y, SANDBERG N. The prevalence of symptoms suggestive of esophageal disorders. Scand J Gastroenterol 1991; 26: 73-81.        [ Links ]

18. RAIHA IJ, IMPIVAARA O, SEPPALA M, SOURANDER LB. Prevalence and characteristics of symptomatic gastroesophageal reflux disease in the elderly. J Am Geriatr Soc 1992; 40: 1209-11.        [ Links ]

19. KAY L, JORGENSEN T, JENSEN KH. Epidemiology of abdominal symptoms in a random population: prevalence, incidence and natural history. Eur J Epidemiol 1994; 10: 559-66.        [ Links ]

20. BOHMER CJ, KLINKENBERG-KNOL EC, NIEZEN-DE BOER RC, MEUWISSEN SG. The prevalence of gastro-oesophageal reflux disease based on non-specific symptoms in institutionalised, intellectually disabled individuals. Eur J Gastroenterol Hepatol 1997; 9: 187-90.        [ Links ]

21. MANTEROLA C, PÉREZ O. Prevalencia de síntomas de reflujo gastroesofágico en una población de estudiantes universitarios. Rev Chil Cir 1998; 50: 513-7.        [ Links ]

22. MANTEROLA C, LÓPEZ A, YÁÑEZ P, BURGOS L, DE ARETXABALA X, FONSECA L ET AL. Análisis de pHmetría intraesofágica en 40 pacientes con reflujo gastroesofágico. Rev Chil Cir 1995; 47: 240-6.        [ Links ]

23. MANTEROLA C, FIERRO J. El laboratorio esofágico en el estudio de la patología esofágica benigna. Rev Méd Sur 1996; 18: 20-9.        [ Links ]

24. STREINER DL, NORMAN GR. Devising the items. In Streiner DL (Ed). Health measurement scales. A practical guide to their development and use. New York: Oxford University Press, 1995; 15-27.        [ Links ]

25. STREINER DL, NORMAN GR. Selecting the items. In Streiner DL (Ed). Health measurement scales. A practical guide to their development and use. New York: Oxford University Press, 1995; 54-68.        [ Links ]

26. DE VELLIS RF. Reliability. In De Vellis RF (Ed.) Scale development. Theory and aplications. New York, Newbury: SAGE Publications, 1991; 24-42.        [ Links ]

27. MUÑOZ SR, BANGDIWALA SI. Interpretation of Kappa and B Statistics Measures of Agreement. J App Stat 1997; 24: 105-11.        [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons