Services on Demand
Journal
Article
Indicators
-
Cited by SciELO
-
Access statistics
Related links
-
Cited by Google
Similars in SciELO
-
Similars in Google
Share
Información tecnológica
On-line version ISSN 0718-0764
Inf. tecnol. vol.16 no.4 La Serena 2005
http://dx.doi.org/10.4067/S0718-07642005000400011
Información Tecnológica-Vol. 16 N°4-2005, págs.: 69-75 ARTICULOS VARIOS Análisis de Caudales Máximos Anuales usando la Distribución GVE para tres Poblaciones Flood Frequency Analysis via three Population GEV Distribution J. A. Raynal y L. G. García Resumen La función de distribución de probabilidad general de valores extremos para tres poblaciones (TPGVE), es presentada para su aplicación en el análisis de frecuencias de caudales máximos anuales. Se propone también un procedimiento para estimar sus parámetros, basado en el método de máxima verosimilitud. El modelo ha funcionado muy bien en la mayoría de las muestras de caudales máximos hasta ahora analizadas, dos de las cuales se incluyen como ejemplos de aplicación para ilustrar el procedimiento. El modelo propuesto ha resultado ser la mejor opción de ajuste a los datos de muestra provenientes de varias poblaciones, cuando ha sido comparado con dos distribuciones de probabilidad de una población y con otro modelo de tres poblaciones. Abstract This study examines the three population general extreme value (TPGEV) distribution for application in annual flood frequency analysis. We also propose a procedure for estimating its' parameters based on a maximum likelihood method. The model has functioned very well for most of the samples of maximum flows studied to date, two of which are included as illustrative examples in use of the procedure. The proposed model has proved to be the best option for the fitting of data arising from various populations when it has been compared with two probability distributions from one population and another model of three populations. Keywords: flood control, flood frequency analysis, three population, probability distribution function INTRODUCCIÓN La selección de la función de distribución de probabilidad y la elección del mejor método para estimar sus parámetros y límites de confianza para los valores de diseño, han sido siempre asuntos de gran preocupación en el ámbito de la Hidrología Superficial. Cuando hay la necesidad de considerar, por características meteorológicas existentes en la zona de estudio, dos o más poblaciones presentes en las muestras de datos, la preocupación citada crece. El modelado probabilístico de muestras de caudales máximos anuales con dos o más poblaciones presentes, arroja información que el análisis de una población no puede proveer porque está limitado a esa condición. La literatura técnica sobre análisis de caudales máximos anuales para una población es abundante (Rao y Hamed, 2000). No así la que se tiene para modelar muestras de caudales máximos anuales cuando éstas contienen dos o más poblaciones. El uso de funciones de distribución de probabilidad mezcladas, para ajustar muestras provenientes de dos o más poblaciones ha sido propuesto desde tiempo atrás, (Gumbel, 1958). Se ha propuesto un modelo general del tipo aditivo para distribuciones mezcladas, (Mood et al., 1974). En particular, en el caso de las funciones de distribución de valores extremos, se ha propuesto la distribución de valores extremos de dos componentes (TCEV), (Gumbel, 1958; Todorovic y Rousselle, 1971; Canfield, 1979; Rossi et al., 1984). La distribución doble Gumbel se propuso con un esquema de estimación de parámetros basado en el método de mínimos cuadrados, (González, 1970) Más recientemente, se han propuesto las distribuciones de valores extremos tipo I para dos poblaciones (DPG) (Raynal y Guevara, 1997), la general de valores extremos para dos poblaciones (DPGVE), (Raynal y Santillán, 1986; Gutiérrez y Raynal; 1988) y la de valores extremos tipo I para tres poblaciones (TPG) (Raynal y García, 2004). Un modelo de tres poblaciones ha sido usado para la distribución Rayleigh, (Gallaudet y de Moustier, 2003). El propósito del artículo es expandir el conocimiento sobre la distribución general valores extremos para tres poblaciones (TPGVE) en el caso de caudales máximos anuales, al proponer un procedimiento para estimar los parámetros, basado en el método de máxima verosimilitud, para así facilitar su aplicación en la práctica hidrológica. METODOLOGÍA Función de Distribución de Probabilidad General de Valores Extremos para Máximos La distribución de la función general de valores extremos (GVE) es, (Jenkinson, 1969; NERC, 1975): donde a, b, y x0 son los parámetros de escala, forma y ubicación. La función de densidad de probabilidad está dada por (NERC, 1975): Para la distribución de valores tipo II (Fréchet)): b < 0 g > 1.1396 x0 + a / b < x < ¥ (3) Para la distribución de valores extremos tipo III (Weibull): b > 0 g < 1.1396 -¥ < x < x0 + a / b (4) donde g es el coeficiente de asimetría. La Distribución General de Valores Extremos para Tres Poblaciones Basado en la forma general de la función de distribución de probabilidad para el caso de distribuciones mezcladas, (Mood et al., 1974), se ha propuesto el siguiente modelo general para tres poblaciones, (García, 1999; Raynal y García, 2004) : Donde F(.) es la función de distribución de probabilidad, qi es el vector de los parámetros de la función de distribución de probabilidad y p1 y p2 son las proporciones de la primera y segunda poblaciones en la mezcla, respectivamente. La proporción de la tercera población es (1-p1p2). A partir de este modelo general, la función de distribución general de valores extremos para tres poblaciones (TPGVE) puede ser construida como, (García, 1999): donde x0i, ai , bi , i = 1, 2, 3, son los parámetros de las funciones de distribución de cada población. p1 y p2 son las proporciones de la primera y segunda poblaciones en la mezcla, respectivamente. La proporción de la tercera población es (1-p1p2). La correspondiente función de densidad de probabilidad es: El Método de Máxima Verosimilitud El método de máxima verosimilitud ha sido definido y aplicado a varias funciones de distribución de probabilidad, con funciones de densidad de probabilidad definidas y directamente invertibles (NERC, 1975). Este método tiene propiedades muy importantes como las de invarianza, Mood et al., (1974), de falta de sesgo asintótico, suficiencia, consistencia y eficiencia (Haan, 1977), en la estimación de grandes muestras y su aplicabilidad en la estimación de parámetros con funciones de verosimilitud muy complejas. Estas características hacen que el método citado sea muy atractivo y superior, casi siempre, a los demás métodos de estimación hasta ahora disponibles. Además, el método de máxima verosimilitud es muy versátil, ya que puede ser aplicado, casi siempre, a funciones de verosimilitud matemáticamente complejas, que dificultan la generación de algoritmos computacionales, para la obtención de los parámetros de las funciones de distribución de probabalidad, cuando éstas son aplicadas a datos reales. La función de verosimilitud para N variables independientes e idénticamente distribuidas X1, X2,..., Xn puede obtenerse como la función de densidad de probabilidad conjunta, esto es, (Mood et al., 1974): donde q denota el conjunto de parámetros y f (.) es la función de densidad de probabilidad. La versión logarítmica de la Ecuación (8) es:
y será usada en lugar de la ecuación original, dado que su forma facilita su manejo en el procedimiento computacional descrito en la próxima sección. El conjunto de parámetros que maximizan a la Ecuación (9) serán los estimadores de máxima verosimilitud de los parámetros de la función de distribución de probabilidad en consideración. Estimadores de Máxima Verosimilitud de los Parámetros de la Distribución GVE de Tres Poblaciones Basado en los principios desarrollados en la sección anterior, la función logarítmica de verosimilitud para la distribución TPGEV para máximos es: RESULTADOS Y DISCUSIÓN Como ejemplos de aplicación, los datos de caudales máximos anuales de las estaciones hidrométricas Jaina, ubicada en la cuenca del río Sinaloa y Santa Cruz, ubicada en la cuenca del río San Lorenzo, ambas en la Región Hidrológica número 10 del estado de Sinaloa, en el Noroeste de México, fueron procesados y los estimadores de máxima verosimilitud, para los parámetros de la distribución TPGVE, fueron calculados para dichas muestras de datos. También se estimaron los parámetros de las distribuciones EVI y GVE para una población la TPG, para las muestras de datos citadas previamente; así como, sus errores estándar de ajuste. Adicionalmente, fueron obtenidos los valores de diseño para las estaciones hidrométricas citadas, para varios periodos de retorno. Estas estaciones hidrométricas están en una área geográfica de México que cada año es afectada por ciclones tropicales en el Verano y el Otoño, en el Invierno los frentes fríos procedentes del Polo Norte se hacen presentes en esta área, por lo que pueden suponerse que existen tres poblaciones, incluyendo a los fenómenos convectivos locales, y por lo tanto procede un análisis de frecuencias de caudales máximos anuales de tres poblaciones. En el periodo 1980-2002, más de diez ciclones, en la categoría de huracán, se impactaron las costas del estado de Sinaloa, México, (SMN, 2003). El periodo de registro histórico, área drenada, media, desviación estándar y el coeficiente de asimetría de los datos de muestra de las estaciones citadas, se indican en la tabla 1. Los parámetros de la distribución GVE para las dos estaciones seleccionadas se muestran en la tabla 2. En la tabla 3 se muestran los resultados para la distribución VEI. Los parámetros de la distribución TPGVE para las dos estaciones seleccionadas se muestran en la tabla 4. En la tabla 5 se muestran los resultados para la distribución TPG. Para comparar los resultados producidos por modelo propuesto con modelos ampliamente usados como las distribuciones de valores extremos tipo I (VEI), general de valores extremos (GVE), para una población, y valores extremos tipo I para tres poblaciones (TPG), se presentan en las tablas 6 y 7 los valores de diseño para diferentes periodos de retorno y los correspondientes errores estándar de ajuste, EE, dado por Kite (1988): donde xi son los valores históricos de la muestra de datos, yi son los valores producidos por la función de distribución correspondiente a los periodos de retorno de los valores históricos N es el tamaño de la muestra, y mj es el número de parámetros de la función de distribución. Con base en las muestras de datos de caudales máximos anuales analizadas, de las cuales sólo dos se incluyen en el artículo como ejemplos de aplicación, se han obtenido los resultados que a continuación se describen. Tabla 1: Periodo de registro, área drenada, media, desviación estándar y coeficiente de asimetría
Tabla 2: Parámetros de la distribución GVE, para una población, de los datos de caudales
Tabla 3: Parámetros de la distribución VEI, para una población, de los datos de caudales
Tabla 4: Parámetros de la distribución TPGVE, para tres poblaciones, de los datos de caudales
Tabla 5: Parámetros de la distribución TPG, para tres poblaciones, de los datos de caudales
El procedimiento fue implementado sin ninguna dificultad por medio de un paquete interactivo de cómputo bajo el ambiente de Visual Basic 5.0 (Visual Basic es una Marca Registrada de Microsoft Corporation). El paquete fue desarrollado por los autores, (García ,1999). El ajuste tiende a ser mucho mejor cuando se utiliza una función de distribución para tres poblaciones en lugar de una sola, en aquellos sitios de medición que están en una región meteorológicamente homogénea, donde ocurren más de un tipo de precipitación,. Esto puede observarse en los resultados consignados en las tablas 5 y 6, bajo el concepto designado como EE, el error estándar de ajuste. Para la estación hidrométrica Jaina, el modelo propuesto produce una reducción en el error estándar de ajuste del orden del 45 y 42% del valor obtenido por las distribuciones GVE de una sola población y TPG, respectivamente. Dicho valor es del orden del 66%, menor que el correspondiente al de la distribución VEI para una población. Para la estación hidrométrica Santa Cruz, el modelo propuesto produce una reducción en el error estándar de ajuste del orden del 21 y 11% del valor obtenido por las distribuciones GVE de una sola población y TPG, respectivamente. Dicho valor es del orden del 46%, menor que el correspondiente al de la distribución VEI para una población. Tabla 6. Comparación de los valores de diseño y los errores estándar de ajuste (ambos en m3/s)
Tabla 7. Comparación de los valores de diseño y los errores estándar de ajuste (ambos en m3/s)
CONCLUSIONES Ha sido presentado el procedimiento para calcular los estimadores de los parámetros de la distribución de general de valores extremos para tres poblaciones (TPGVE), utilizando el método de máxima verosimilitud. Cuando puede demostrarse que una muestra de caudales máximos anuales proviene de dos o más poblaciones, el usar metodologías como la propuesta produce resultados que mejoran los obtenidos por el procedimiento tradicional de considerar que la muestra proviene de una sola población. En igualdad de condiciones, el modelo TPGVE demostró ser muy superior a los modelos considerados de una población, GVE y VEI; así como también al de la distribución TPG, el cual considera 3 poblaciones. La distribución TPGVE se ha comportado muy bien en las muestras de caudales máximos anuales analizadas hasta ahora, sólo dos de éstas se han incluido en este artículo. Basados en los argumentos anteriores, los autores consideran que la distribución TPGVE es una buena opción para el modelado de caudales máximos anuales, en aquellos sitios donde puede considerarse la existencia de tres tipos diferentes de mecanismos productores de lluvia, los cuales inducen la presencia de tres poblaciones en las muestras de caudales máximos anuales. AGRADECIMIENTOS Los autores desean expresar su gratitud a la Universidad de las Américas, Puebla por el apoyo y las facilidades otorgadas para la realización de este artículo REFERENCIAS Canfield, R. V. The Distribution of the Extremes of a Mixture of Random Variable with Applications to Hydrology. In Input for Risk Analysis in Water Systems, E.A. McBean, K. W. Hipel and T. E. Unny, eds., pp 77-84, Water Resources Publications, Littleton, EUA (1979). [ Links ] García, L. G. Paquete Interactivo para Distribuciones de Valores Extremos Mixtas de Tres Poblaciones y sus Aplicaciones en Análisis de Gastos Máximos, Tesis de Licenciatura, Depto. de Ing. Civil, Universidad de las Américas, Puebla, México, (1999). [ Links ] Gallaudet, T. C. y C. P. de Moustier , High-frequency volume and boundary acoustic backscatter fluctuations in shallow water, Journal of the Acoustical Society of America 114 (2), 707-725. (2003). [ Links ] González, F. J. Contribución al Análisis de Frecuencias de Valores Extremos de Gastos Máximos en un Río, Reporte 277, Instituto de Ingeniería, Universidad Nacional Autónoma de México, México, D. F., México. (1970). [ Links ] Gumbel, E. J. Statistics of Extremes, Gutiérrez, C. y J. A. Raynal, Distribuciones Mezcladas en el Análisis de Frecuencias de Gastos Máximos, X Congreso Nacional de Hidráulica, págs. 220-228, Morelia, México (1988). [ Links ] Haan, C. T. Statistical Methods in Hydrology, 378 págs. The Jenkinson, A. F. Estimation of Maximum Floods, Chapter 5, Technical Note 98, págs. 183-227. WMO, Kite, G. W. Frequency y Risk Analyses in Hydrology, Water Resources Publications, 187págs. Mood, A. M., Graybill, F. y D.C. Boes, Introduction to the Theory of Statistics, Third ed., págs. 276-286. McGraw-Hill Inc., NERC, Natural Environment Research Council. Flood Studies Report, I, Hydrologic Studies, pág. 51. Whitefriars Press Ltd., Rao, A. R. y K. H. Hamed, Flood Frequency Analysis, CRC Press, 350 págs. Boca Ratón, EUA (2000). [ Links ] Raynal, J. A., y O. D. Santillán, Estimadores de Máxima Verosimilitud para los Parámetros de la Distribución GVE Mixta, IX Congreso Nacional de Hidráulica, págs. 79-90, Querétaro, México (1986). [ Links ] Raynal, J. A. y J. L. Guevara, Maximum Likelihood Estimators for the Two Populations Gumbel Distribution, Hydrological Science and Technology J., 13(1-4), págs. 47-56 (1997). [ Links ] Raynal J. A. FLODRO 2.0: A User-Friendly Personal Computer Package for Flood and Drought Frequency Analyses, Proceedings of RiverTech96, Raynal, J. A. y L. G. García, Análisis de Frecuencias de Gastos Máximos Anuales Usando la Distribución de Valores Extremos Tipo I para Tres Poblaciones, Información Tecnológica, 15(3), págs 97-104 (2004). [ Links ] Rossi, F., Florentino, M. y P. Versace, Two Component Extreme Value Distribution for Flood Frequency Analysis, Wat. Resour. Res., 20(7), págs. 847-856 (1984). [ Links ] Todorovic, P. y Rousselle, J., Some Problems of Flood Analysis, Wat. Resour. Res., 7(5) págs. 1144-1150 (1971). [ Links ]
|