SciELO - Scientific Electronic Library Online

 
vol.130 número1Duración de la amenorrea de lactancia en la población urbana de TemucoEstados de hipercoagulabilidad heredados y trombosis venosa cerebral: Experiencia en 3 casos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Revista médica de Chile

versión impresa ISSN 0034-9887

Rev. méd. Chile v.130 n.1 Santiago ene. 2002

http://dx.doi.org/10.4067/S0034-98872002000100010 

Identificación de los determinantes
de la estadía en Unidades de
Cuidados Intensivos usando redes
neuronales artificiales

Prediction of the length of stay in
Intensive Care Units using artificial
neural networks

Max Chacón P1, Víctor Rocco M, Enrique Morgado A2,
Enzo Sáez H, Sergio Pliscoff M

Correspondencia a: Max Chacón P. Av. Ecuador 3659, Casilla 10233, Santiago, Chile. Tel: (562) 7763511 Fax: (562) 7765892. Email: mchacon@diinf.usach.cl

Background: The prediction of the length of stay at the moment of hospital admission is of outmost importance. Many studies have used lineal models to predict this variable, but there are inherent limitations to these models. The use of non lineal models has been scarce. Aim: To develop a non lineal model to predict length of stay in intensive care units. Material and methods: Retrospective analysis of 294 patients admitted to two intensive care units in Santiago, Chile. The severity of the disease motivating the admission was nominally quantified. This and other physiological variables were included in the model. The length of stay was modeled using Artificial Neural Networks. Results: The model yielded an error of 8.7% (3.6 ± 0.4 days, CI 95%) and a correlation coefficient of 0.9 (p <0.001) for the prediction of length of stay. Using net sensitivity analysis, the model determined that gastrointestinal diseases, infections and respiratory problems were the main causes of prolongation of intensive care unit stay. Conclusions: Intensive care units should have, in the future, computer systems that gather vital information to predict length of stay (Rev Méd Chile 2002; 130: 71-78).
(Key Words: Intensive care units; Models, theoretical, Neural networks (computer).

Recibido el 2 de marzo, 2001. Aceptado en versión corregida el 22 de octubre, 2001.
Financiado por Proyecto FONDECYT # 1990920 y proyecto DICYT # 9719 CHP, de la Universidad de Santiago de Chile.
Departamento de Ingeniería Informática, Universidad de Santiago de Chile.
Programa de Fisiopatología e Ingeniería Biomédica, Facultad de Ciencias Médicas
Universidad de Santiago de Chile, Programa de Patología, Instituto de Ciencias Biomédicas, Facultad de Medicina Universidad de Chile. Unidades de Cuidados Intensivos del Hospital Barros Luco Trudeau, Servicio de Salud Metropolitano Sur y Hospital de Carabineros de Chile, Dirección de Sanidad. Carabineros de Chile.
1 Ingeniero, Doctor en Ingeniería Biomédica.
2 Bioquímico.

La predicción de la duración de la estadía de los pacientes en la UCI a su ingreso, permite planificar adecuadamente la atención. Un modelo de estadía basado en múltiples variables de admisión origina información clínica relevante, como por ejemplo factores de riesgo o patologías determinantes, y es apropiado para ser tratado por medio de las redes neuronales artificiales (RNA).

La predicción de la duración de la estadía presenta problemas que se pueden agrupar en dos categorías: 1) determinación de la gravedad de la enfermedad de los pacientes que ingresan a la UCI, para lo cual se utilizan sistemas de índices de gravedad como el APACHE (Acute Physiology and Chronic Health Evaluation) y APS (Acute Physiology Score), TISS (Therapeutic Intervention Score System), PSI (Physiologic Stability Index), que intentan establecer la gravedad de los pacientes en un lapso que abarca desde el momento de la admisión hasta las 24 h siguientes1-8. Cada uno de estos índices caracteriza adecuadamente el estado fisiológico del paciente, aunque se han realizado críticas fundadas respecto de la inclusión de conocimiento clínico en el momento de la admisión, como se describe en algunas publicaciones9,10, y 2) una gran cantidad de trabajos intentan predecir estadía, usando métodos estadísticos lineales multivariados11,12. Estos estudios adolecen de una extrema simplificación del modelo, que exige variables no correlacionadas, limitando el número de variables y no permitiendo el tratamiento simultáneo de diferentes tipos de variables (nominales, continuas o binarias). Estos modelos tampoco consideran las complejas interacciones que existen entre las diferentes variables. Las dificultades descritas aumentan en el caso de una UCI, por la diversidad de la patología y por el compromiso de múltiples órganos y sistemas.

Recientemente se han publicado estudios que utilizaron modelos no lineales para predecir estadías, como las RNA, pero que están circunscritos a aplicaciones particulares9,13-15 y de este modo no satisfacen las exigencias necesarias para el modelado de los casos que requieren las prestaciones de una UCI.

Una red neuronal artificial es un modelo computacional compuesto de elementos matemáticos que se han diseñado para realizar aproximadamente el trabajo que efectúan las neuronas. Está constituida por una capa que recibe y organiza las entradas, una capa de "neuronas" intermedia y una capa de "neuronas" de salida, unidas por conexiones que representan las sinapsis neuronales. Los patrones particulares son representados por los valores de las conexiones. Las redes neurales pueden ser entrenadas por un método de cálculo de conexiones denominado "back-propagation", que es una extensión del método de los mínimos cuadrados utilizado en la regresión lineal.

En el presente estudio se utilizaron las variables más relevantes del índice APACHE II2 y se cuantificó la información clínica de admisión, usando las hipótesis diagnósticas para conformar un nuevo factor (Diagnósticos de Ingreso), que representó la situación de los pacientes al ingreso, lo que condujo a un proceso de enriquecimiento de los datos16 por la adición de información clínica de expertos, que permitió cuantificar los diagnósticos asociados a cada paciente. Estos procedimientos llevaron a una mejor cobertura de la información requerida para la predicción de la estadía.

Para optimizar el modelo se utilizó el paradigma de RNA multicapa y el algoritmo de aprendizaje "Back propagation"17-18, que permitió utilizar diferentes tipos de variables y representar adecuadamente las no-linealidades y sinergismos de las condiciones de ingreso de los pacientes.

MATERIAL Y MÉTODO

Recolección de datos: Los datos fueron obtenidos de pacientes de dos UCI para adultos de la ciudad de Santiago: 1) UCI del Hospital Barros Luco Trudeau (HBLT), que realiza en promedio 350 internaciones anuales, y que aportó 162 casos a este estudio; 2) UCI del Hospital de Carabineros, que realiza 150 internaciones anuales en promedio, y que aportó 132 casos. La muestra obtenida constó de 294 casos (243 sobrevivientes y 51 fallecidos), con un rango de estadía que varió entre 1 y 42 días.

Las variables estudiadas en cada paciente se agruparon en cuatro factores: Epidemiológico, Condición de gravedad, Indice fisiológico (APS) y Diagnósticos de ingreso. Cada uno de estos factores estuvo compuesto a su vez por variables individuales, alcanzando un total de 36 variables de entrada (Tabla 1). Los datos fueron recolectados retrospectivamente de los registros clínicos de cada unidad, por alumnos del quinto año de la Carrera de Medicina de la Facultad de Ciencias Médicas de la Universidad de Santiago de Chile y enfermeras de la UCI del HBLT. La mayoría de las variables pudo ser cuantificada directamente pues fueron binarias o continuas. La incorporación del factor Diagnóstico de ingreso originó un problema de cuantificación, ya que se debió incluir conocimiento médico para convertirlo en variables numéricas tratables por la red neuronal.


Cuantificación de los diagnósticos. El procedimiento adoptado para cuantificar los diagnósticos consistió de cuatro pasos:

1) Se dividieron los 1.200 diagnósticos (para cada paciente se consideró un diagnóstico principal y hasta 7 estados co-mórbidos de relevancia) en 17 grupos que representaron sistemas fisiológicos y grupos mórbidos (Tabla 2).


2) A continuación, los especialistas clasificaron cada diagnóstico en tres diferentes categorías: crónico, agudo e hiperagudo (excepto el caso de los diagnósticos de trauma, que fueron considerados todos agudos o hiperagudos).

3) En el tercer paso, se debió tener en cuenta que en cada sistema fisiológico o grupo mórbido podía existir más de una de estas categorías, o existir una combinación de éstas y se generó un sistema de clasificación que tenía asociado un orden creciente de gravedad, como se muestra en la Tabla 3.


4) Finalmente, se desarrolló un algoritmo que asignó un valor de gravedad a cada uno de los 17 grupos para cada paciente según la combinación de diagnóstico obtenida. Así, cada paciente quedó representado por 36 variables numéricas que conformaron los patrones de entrada ingresados a la red neuronal.

Modelado. Las RNA son representaciones lógicas altamente simplificadas de grandes grupos de neuronas simuladas en "software". Estos modelos no requieren información a priori, y obtienen la información exclusivamente desde un conjunto de datos. El fundamento de estos modelos se basa en el funcionamiento de las redes de neuronas del hipocampo17,19, donde la información se almacena en las sinapsis neuronales. De este modo, en una estructura de red previamente fijada, para desarrollar el modelo sólo se requiere un método de cálculo (denominado aprendizaje) que permite obtener los valores adecuados de las sinapsis que logren un error mínimo entre las salidas del modelo y los datos de salida resultantes del fenómeno real. Desde un punto de vista funcional, estos modelos son similares a una regresión estadística, la cual relaciona variables independientes (entradas) con una variable dependiente (salida), mediante una función lineal. La ventaja de una RNA del tipo hetero-asociativa (que relaciona variables de entrada y salida con una o más capas de neuronas intermedias, denominadas capas ocultas) sobre una regresión, es que permite encontrar cualquier tipo de relación entre las variables, proceso que es frecuente en la práctica clínica. El modelo utilizado en este trabajo estuvo formado por una red hetero-asociativa con una capa intermedia, como se muestra en la Figura 1. El método utilizado para obtener los valores de las sinapsis (representadas por las conexiones en la Figura 1) fue el "Back propagation"17 que permite a la red aprender efectivamente. Este algoritmo se basa en una aplicación iterativa del método de los mínimos cuadrados usado en el cálculo de regresión. El aprendizaje (cálculo iterativo) se basa en la presentación simultánea de los datos de entrada y los datos de salida a la red, para todo el conjunto de casos (ciclo de entrenamiento). El principal problema del aprendizaje es lograr disminuir el error de salida sin introducir sesgo, para lo cual se requiere evaluar el error en un conjunto diferente de casos (conjunto de prueba) que no fueron usados en la etapa de aprendizaje. Durante el aprendizaje se debe ajustar básicamente dos parámetros: la tasa de aprendizaje (h< 1, correspondiente al paso del método del gradiente)18 y el número de neuronas de la capa oculta. Un método adecuado para eliminar el sesgo del modelo y obtener el número adecuado de neuronas en la capa intermedia, es usar el método de la validación cruzada20-22 el cual consiste en separar el conjunto de datos en varios grupos, dejando uno para prueba y el resto para entrenamiento. Posteriormente se cambia el grupo de prueba y se continúa hasta probar todos los grupos. Después de lograr una red debidamente entrenada, es posible obtener la importancia o el impacto de las variables de entrada sobre la salida (en este caso la estadía). Para lograr este fin, se requiere realizar un análisis de sensibilidad de la red, el cual consiste en producir variaciones en las entradas y observar los cambios en las salidas. Así, la entrada que produzca los mayores cambios en la salida será aquella que cause un mayor impacto en la estadía.


Figura 1. Modelo de la Red Neuronal Artificial para estimar estadía, con cuatro factores de entrada (36 variables), una capa oculta y la estadía como salida.

RESULTADOS

En nuestro estudio, para el entrenamiento de redes que utilizaron 36 variables de entrada, los modelos desarrollados emplearon de 10 a 60 neuronas en la capa oculta. Los mejores resultados se obtuvieron con 45 neuronas en la capa oculta, con una tasa de aprendizaje de 0,5 en la capa oculta; 0,1 en la capa de salida, realizándose 2.714 ciclos de entrenamiento, con lo que se obtuvo un error de 11% (4,5 días).

La evaluación de los errores individuales demostró que los errores mayores se producen en las estadías largas (> 30 días), mientras que los casos en los cuales la estadía es menor que 30 días el error promedio es de 8,7% (3,56 días de promedio). La variación en este caso resultó ser de ± 0,4 días (IC 95%) y el coeficiente de correlación entre las estadías reales y los valores predichos por el modelo es r=0,90 (p <0,001). El análisis de sensibilidad permitió calcular el porcentaje de importancia que tuvo cada variable en predecir la estadía. Estos resultados se presentan en la Tabla 4, que indica el porcentaje que corresponde a cada factor en el que se agrupan las variables.


Con el fin de examinar más detalladamente la selección de variables se desarrolló un nuevo modelo, que incluyó las 12 variables mostradas en la Tabla 4. Cuando se utilizó una arquitectura de 29 neuronas en la capa oculta, con una tasa de aprendizaje de 0,5 y en 2.203 ciclos de entrenamiento, se logró un error de 8,8% (3,6 ± 0,4 días, IC 95%). El análisis de sensibilidad en este modelo reducido estableció un orden similar de las variables mostradas en la Tabla 4, sólo descendió en importancia la variable "Infección al ingreso", mientras se hizo más relevante la variable "Frecuencia respiratoria".

DISCUSIÓN

Para evaluar el poder de predicción del modelo se puede realizar una comparación simple entre los valores predichos por la red y la predicción realizada por el valor promedio de las estadías, para un diagnóstico particular. Las predicciones de estadía obtenidas utilizando redes neuronales son mejores que aquellas obtenidas por un sistema de predicción por promedio, como se muestra en la Tabla 5, al comparar los errores promedios para el grupo de diagnósticos seleccionados con el análisis de sensibilidad.


Una medida adecuada de comparación entre diferentes modelos es el uso del coeficiente de correlación. Una selección de trabajos recientes de predicción de estadía en UCI, mediante modelos lineales, permite destacar los trabajos de Clark et al11 y Chan et al12 que muestran coeficientes de correlación de r=0,76 (con 2.672 pacientes) y r=0,85 (con 1.064 pacientes), al usar variables del índice APACHE como entradas.

Entre los trabajos que usan RN para predecir estadía se puede destacar la comparación con modelos lineales que realiza Zernikow et al15, para 2.144 pacientes admitidos en unidades de neonatología, donde los modelos lineales logran correlaciones de r=0,85 y las RN de r=0,87. Se debe hacer notar que para los elevados valores de r y número de casos que se presentan en la literatura, todos los coeficientes de correlación mencionados son significativos con valores p <0,001.

Los errores obtenidos con conjuntos independientes de prueba fueron relativamente bajos para la predicción de 30 días (3,56 días), dado que pudo existir un error no previsible en los datos por razones netamente administrativas, ya que en numerosas ocasiones se puede retrasar la salida de los pacientes hasta por dos días. El origen más probable para el aumento de los errores cuando la estadía superó los 30 días, fue la falta de información en algunas variables de entrada y no la capacidad del modelo, dado que los resultados con el modelo reducido (12 variables) tuvieron errores similares a aquellos obtenidos con el modelo general (36 variables). Problemas similares han sido descritos por otros autores16.

Desde el punto de vista de la evolución clínica, los pacientes con permanencias mayores a 30 días, fueron influidos en forma importante por las eventuales complicaciones que se produjeron al interior de la UCI. Para caracterizar estos cambios, proponemos usar en el futuro índices que evalúen estados de evolución23, los cuales adquieren información durante la estada del paciente.

El análisis de sensibilidad apoyó la propuesta inicial de incluir las hipótesis diagnósticas, ya que el factor "Diagnósticos de ingreso" resultó responsable del 51,65% de la variación de la estadía. Este hallazgo solucionó uno de los principales problemas por el cual son criticados los índices de gravedad9-10, la exclusión del conocimiento clínico al ingreso del paciente.

El proceso de cuantificación diagnóstica es difícil y requiere del aporte fundamental de los especialistas, que garanticen su reproducibilidad en cualquier especialidad médica. El presente estudio demostró que los diagnósticos de ingreso priman en importancia predictiva sobre otras variables cuantitativas, como los parámetros fisiológicos.

Como un hecho relativamente sorprendente, las patologías de los sistemas digestivo, respiratorio y renal son responsables de una parte importante de la prolongación de la estadía, primando sobre las patologías neurológicas y cardíacas, que no aparecen en nuestro estudio como determinantes de la prolongación de la estadía.

La inclusión de patologías psiquiátricas resultó adecuada, ya que se incluyen en ellas los diagnósticos de alcoholismo, que en general presentan permanencia prolongada.

En base al presente estudio, las perspectivas de desarrollo a futuro de las UCI debieran incluir la utilización de sistemas computacionales que recojan información al ingreso y efectúen predicciones en línea al momento de la admisión. También debiera considerarse la incorporación de los costos de las prestaciones en la unidad y estudiar su relación con la estadía.

Agradecimientos

Los autores desean agradecer muy sinceramente al Prof. Dr. Bruno Günther S, por su lectura crítica del primer borrador del manuscrito y sus valiosas sugerencias; a las alumnas de la Facultad de Ciencias Médicas de la USACH, señoritas Marycarmen Ordenes y Solange Partarrieu V; a las enfermeras Marisol Murúa P y Mabel Pardo B, por la recolección de datos y a la alumna de Ingeniería Civil en Informática de la USACH señorita Nayibe Núñez, por los largos procesamientos de validación cruzada.

REFERENCIAS

1. Knaus W, Draper E, Wagner D, Zimmerman J, APACHE: Acute physiologically based classification system. Crit Care Med 1981; 9: 8: 591-7.        [ Links ]

2. Knaus W, Draper E, Wagner D, Zimmerman J, APACHE II: A severity of disease classification system. Crit Care Med 1985; 13: 591-7.        [ Links ]

3. Knaus W, Draper E, Wagner D, Zimmerman J. An evaluation of outcome from intensive care in major medical centres. Ann Intern Med 1987; 4: 2: 410-8.        [ Links ]

4. Lemeshow S, Teres D, Avronin J, Pastides H. A comparison of methods to predict mortality of intensive care unit patients. Crit Care Med 1987; 15: 8: 715-22.        [ Links ]

5. Cullen D, Civetta J, Briggs B, Ferrara L. Therapeutic intervention scoring system: A method for quantitative comparison of patient care. Crit Care Med 1974; 2: 2: 57-60.        [ Links ]

6. Keene R, Cullen D. Therapeutic intervention scoring system: Update. Crit Care Med 1983; 11: 1-3.        [ Links ]

7. Pollack M, Ruttiman U, Getson P. Accurate prediction of the outcome of paediatric intensive care: A new quantitative method. N Engl J Med 1987; 316: 3: 134-9.        [ Links ]

8. Pollack M, Katz R, Ruttimann U, Getson P. Improving the outcome and efficiency of intensive care: the impact of an intensivist. Crit Care Med 1988; 16: 1: 11-7.        [ Links ]

9. Creed F, Tomenson B, Anthony P, Tramner M. Predicting length of stay in psychiatry. Psychol Med 1997; 27: 4: 961-6.        [ Links ]

10. Huntley D, Cho D, Chistman J, Csernansky J. Predicting length of stay in an acute psychiatric. Psychiatr Serv 1998; 49: 8: 1049-53.        [ Links ]

11. Clark D, Kroenke K, Callahan C, Mcdonald C. Validity and utility of patient-reported health measures on hospital admission. J Clin Epidemiol 1999; 52: 1: 65-71.        [ Links ]

12. Chan J, Lam W, Chan S, Chan W, Nelson P, Young K. The ratio of actual length of stay (LOS) to predicted LOS based on the APACHE (R) III prediction equation is useful measurement of ICU resource efficiency. Chest 2000; 118: 4: 165.        [ Links ]

13. Frye K, Izenberg S, Williams M, Luterman A. Simulated biologic intelligence used to predict length of stay and survival of burns. J Burn Care Rehabil 1996; 17: 6: 540-6.        [ Links ]

14. Pofahl W, Walczal S, Rhone E, Izenberg S. Use of an artificial neural network to predict length of stay in acute pancreatitis. Am Surg 1998; 64: 9: 868-72.        [ Links ]

15. Zernikow B, Holtmannspüotter K, Michel E, Hornschuh F, Groote K, Hennecke K. Predicting length-of-stay in preterm neonates. Eur J Pediatr 1999; 158: 1: 59-62.        [ Links ]

16. Adriaans P, Zantinge D. Data mining, Addison Wesley Longman, Ltd, England, 1997.        [ Links ]

17. Rumelhart D, Hinton G, Mcclelland J. A General framework for parallell distributed processing", In: Parallell Distributed Processing, Vol 1: Foundations, Eds. Rumelhart D, McClelland J, and PDP Research Group, Cambridge: Mit Press. 1986.        [ Links ]

18. Haykin S. Neural Networks: A comprehensive foundation. New York: Macmillan College Pub. Com. Inc. 1994.        [ Links ]

19. Hecht-Nielsen R. Neurocomputing, New York: Addison Wesley Pub Co, 1990.        [ Links ]

20. Stone M. Cross-Validation choice and assessment of statistical predictions, J Royal Stat Soc 1974; Series B: 36: 111-33.        [ Links ]

21. Bishop C. Neural networks for pattern recognition. New York: Oxford University Press, 1997.        [ Links ]

22. Mitchell T. Machine learning. Boston: WCB, McGraw-Hill. 1997.        [ Links ]

23. Marshall J, Cook D, Christou N, Bernard G, Sprunf C, Sibbald W. Multiple organ dysfunction score: A reliable descriptor of a complex clinical outcome. Crit Care Med 1995; 23: 10: 1638-52.        [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons