SciELO - Scientific Electronic Library Online

 
vol.16 issue4Application of a Photometric Method to Detect Size Distribution of Micro ParticlesSSV3D: Simulator of Vectorial Shadows by Solar Radiation on 3D Computerized Objects author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Información tecnológica

On-line version ISSN 0718-0764

Inf. tecnol. vol.16 no.4 La Serena  2005

http://dx.doi.org/10.4067/S0718-07642005000400011 

 

Información Tecnológica-Vol. 16 N°4-2005, págs.: 69-75

ARTICULOS VARIOS

Análisis de Caudales Máximos Anuales usando la Distribución GVE para tres Poblaciones

Flood Frequency Analysis via three Population GEV Distribution

J. A. Raynal y L. G. García
Departamento de Ingeniería Civil, Universidad de las Américas, Puebla, 72820 Cholula, Pue.- México (e-mail: jraynal@mail.udlap.mx)


Resumen

La función de distribución de probabilidad general de valores extremos para tres poblaciones (TPGVE), es presentada para su aplicación en el análisis de frecuencias de caudales máximos anuales. Se propone también un procedimiento para estimar sus parámetros, basado en el método de máxima verosimilitud. El modelo ha funcionado muy bien en la mayoría de las muestras de caudales máximos hasta ahora analizadas, dos de las cuales se incluyen como ejemplos de aplicación para ilustrar el procedimiento. El modelo propuesto ha resultado ser la mejor opción de ajuste a los datos de muestra provenientes de varias poblaciones, cuando ha sido comparado con dos distribuciones de probabilidad de una población y con otro modelo de tres poblaciones.


Abstract

This study examines the three population general extreme value (TPGEV) distribution for application in annual flood frequency analysis. We also propose a procedure for estimating its' parameters based on a maximum likelihood method. The model has functioned very well for most of the samples of maximum flows studied to date, two of which are included as illustrative examples in use of the procedure.  The proposed model has proved to be the best option for the fitting of data arising from various populations when it has been compared with two probability  distributions  from one population and another model of three populations.  

Keywords: flood control, flood frequency analysis, three population, probability distribution function


INTRODUCCIÓN

La selección de la función de distribución de probabilidad y la elección del mejor método para estimar sus parámetros y  límites de confianza para los valores de diseño, han sido siempre asuntos de gran preocupación en el ámbito de la Hidrología Superficial. Cuando hay la necesidad de considerar, por características meteorológicas existentes en la zona de estudio, dos o más poblaciones presentes en las muestras de datos, la preocupación citada crece.

El modelado probabilístico de muestras de caudales máximos anuales con dos o más poblaciones presentes, arroja información que el análisis de una población no puede proveer porque está limitado a esa condición.

La literatura técnica sobre análisis de caudales máximos anuales para una población es abundante (Rao y Hamed, 2000). No así la que se tiene para modelar muestras de caudales máximos anuales cuando éstas contienen dos o más poblaciones.

El uso de funciones de distribución de probabilidad mezcladas, para ajustar muestras provenientes de dos o más poblaciones ha sido propuesto desde tiempo atrás, (Gumbel, 1958). Se ha propuesto un modelo general del tipo aditivo para distribuciones mezcladas, (Mood et al., 1974).

En particular, en el caso de las funciones de distribución de valores extremos, se ha propuesto la distribución de valores extremos de dos componentes (TCEV), (Gumbel, 1958; Todorovic y Rousselle, 1971; Canfield, 1979;  Rossi et al., 1984).  La distribución doble Gumbel se propuso con un esquema de estimación de parámetros basado en el método de mínimos cuadrados,  (González, 1970)

Más recientemente, se han propuesto las distribuciones de valores extremos tipo I para dos poblaciones (DPG) (Raynal y Guevara, 1997),  la general de valores extremos para dos poblaciones (DPGVE), (Raynal y Santillán, 1986; Gutiérrez y Raynal; 1988) y la de valores extremos tipo I para tres poblaciones (TPG) (Raynal y García, 2004). Un modelo de tres poblaciones ha sido usado para la distribución Rayleigh, (Gallaudet  y de Moustier, 2003).

El propósito del artículo es expandir el conocimiento sobre la distribución general valores extremos para tres poblaciones (TPGVE) en el caso de caudales máximos anuales, al proponer un procedimiento para estimar los parámetros, basado en el método de máxima verosimilitud, para así facilitar su  aplicación en la práctica hidrológica.

METODOLOGÍA

Función de Distribución de Probabilidad General de Valores Extremos para Máximos

La distribución de la función general de valores extremos (GVE) es, (Jenkinson, 1969; NERC, 1975):

              (1)

donde a, b, y x0  son los parámetros de  escala, forma y ubicación.

La función de densidad de probabilidad está dada por (NERC, 1975):

       

                                    (2)

Para la distribución de valores tipo II (Fréchet)):

b < 0

 g > 1.1396

x0 + a / b < x < ¥                                        (3)

Para la distribución de valores extremos tipo III (Weibull):

b > 0

g < 1.1396

-¥ < x < x0 + a / b                                      (4)

donde g  es el coeficiente de asimetría.

La Distribución General de Valores Extremos para Tres Poblaciones

Basado en la forma general de la función de distribución de probabilidad para el caso de distribuciones mezcladas, (Mood et al., 1974), se ha propuesto el siguiente modelo general para  tres poblaciones, (García, 1999; Raynal y García, 2004) :

                (5)

Donde F(.) es la función de distribución de probabilidad, qi es el vector de los parámetros de la función de distribución de probabilidad y  p1 y p2 son las proporciones de la primera y segunda poblaciones en la mezcla, respectivamente. La proporción de la tercera población es (1-p1–p2). A partir de este modelo general, la función de distribución general de valores extremos para tres poblaciones (TPGVE) puede ser construida como, (García, 1999):

 

                (6)

donde x0i, ai , bi , i = 1, 2, 3, son los parámetros de las funciones de distribución de cada población. p1 y p2 son las proporciones de la primera y segunda poblaciones en la mezcla, respectivamente. La proporción de la tercera población es (1-p1–p2).

La correspondiente función de densidad de probabilidad es:

                           
    
          (7)

El Método de Máxima Verosimilitud

El método de máxima verosimilitud ha sido definido y aplicado a varias funciones de distribución de probabilidad, con funciones de densidad de probabilidad definidas y directamente invertibles (NERC, 1975). Este método tiene propiedades muy importantes como las de invarianza, Mood et al., (1974),  de falta de sesgo asintótico, suficiencia, consistencia y eficiencia (Haan, 1977), en la estimación de grandes muestras y su aplicabilidad en la estimación de parámetros con funciones de verosimilitud muy complejas. Estas características hacen que el método citado sea muy atractivo y superior, casi siempre, a los demás métodos de estimación hasta ahora disponibles.

Además,  el método de máxima verosimilitud es muy versátil, ya que puede ser aplicado, casi siempre, a funciones de verosimilitud matemáticamente complejas, que dificultan la generación de algoritmos computacionales, para la obtención de los parámetros de las funciones de distribución de probabalidad, cuando éstas son aplicadas a datos reales.

La función de  verosimilitud para N variables independientes e idénticamente distribuidas X1, X2,..., Xn puede obtenerse como la función de densidad de probabilidad conjunta, esto es, (Mood et al., 1974):

                                     (8)

donde q denota el conjunto de parámetros y    f (.)  es la función de densidad de probabilidad. La versión logarítmica de la Ecuación (8) es:

                        (9)

               

y será usada en lugar de la ecuación original, dado que su forma facilita su manejo en el procedimiento computacional descrito en la próxima sección. El conjunto de parámetros que maximizan a la Ecuación (9) serán los estimadores de máxima verosimilitud de los parámetros de la función de distribución de probabilidad en consideración.

Estimadores de Máxima Verosimilitud de los Parámetros de la Distribución GVE de Tres Poblaciones

Basado en los principios desarrollados en la sección anterior, la función logarítmica de verosimilitud para la distribución TPGEV para  máximos es:

      

                  (10)

RESULTADOS Y DISCUSIÓN

Como ejemplos de aplicación, los datos de caudales máximos  anuales  de  las estaciones hidrométricas Jaina, ubicada en la cuenca del río Sinaloa  y Santa Cruz, ubicada en la cuenca del río San Lorenzo, ambas en la Región Hidrológica número 10 del estado de  Sinaloa, en el  Noroeste de México, fueron procesados y los estimadores de máxima verosimilitud, para los parámetros de la distribución TPGVE, fueron calculados para dichas muestras de datos. También se estimaron los parámetros de las distribuciones EVI y GVE para una población la TPG, para las muestras de datos citadas previamente; así como, sus errores estándar de ajuste. Adicionalmente, fueron obtenidos los valores de diseño para las estaciones hidrométricas citadas, para varios periodos de retorno.

Estas estaciones hidrométricas están en una área geográfica de México que cada año es afectada por ciclones tropicales en el Verano y el Otoño, en el Invierno los frentes fríos procedentes del Polo Norte se hacen presentes en esta área, por lo que pueden suponerse que existen tres poblaciones, incluyendo a los fenómenos convectivos locales, y por lo tanto procede un análisis de frecuencias de caudales máximos anuales de tres poblaciones. En el periodo 1980-2002, más de diez ciclones, en la categoría de huracán, se impactaron las costas del estado de Sinaloa, México, (SMN, 2003).

El periodo de registro histórico, área drenada, media, desviación estándar y el coeficiente de asimetría de los datos de muestra de las estaciones citadas, se indican en la tabla 1.

Los parámetros de la distribución GVE para las dos estaciones seleccionadas se muestran en la tabla 2. En la tabla 3 se muestran los resultados para la distribución VEI.

Los parámetros de la distribución TPGVE para las dos estaciones seleccionadas se muestran en la tabla 4. En la tabla 5 se muestran los resultados para la distribución TPG.

Para comparar los resultados producidos por modelo propuesto con modelos ampliamente usados como las distribuciones de valores extremos tipo I (VEI), general de valores extremos (GVE), para una población, y valores extremos tipo I para tres poblaciones (TPG), se presentan en las tablas 6 y 7 los  valores de diseño para diferentes periodos de retorno y los correspondientes errores estándar de ajuste, EE, dado por Kite  (1988):

                           (11)

donde xi son los valores históricos de la muestra de datos, yi son los valores producidos por la función de distribución correspondiente a los periodos de retorno de los valores históricos N es el tamaño de la muestra, y mj  es el número de parámetros de la función de distribución.

Con base en las muestras de datos de caudales máximos anuales analizadas, de las cuales sólo dos se incluyen en el artículo como ejemplos de aplicación, se han obtenido los resultados que a continuación se describen.

Tabla 1: Periodo de registro, área drenada, media, desviación estándar y coeficiente de asimetría
de los datos de caudales máximos anuales de las estaciones hidrométricas Jaina y Santa Cruz, Sin., Méx.

Periodo de Registro

Ärea Drenada
(km2)

Media
(m3/s)

Desv. Estánd.
(m3/s)

Coef.
Asim.

Jaina

1941-91

8179

1095.90

1163.66

3.39

Santa Cruz

1943-87

8919

1223.42

1203.98

3.07


Tabla 2: Parámetros de la distribución GVE, para una población, de los datos de caudales
máximos anuales de las estaciones hidrométricas Jaina y Santa Cruz, Sin., Méx.

GVE

Ubicación

Escala

Forma

Jaina

596.82

401.52

-0.4098

Santa Cruz

706.72

533.54

-0.2853


Tabla 3: Parámetros de la distribución VEI, para una población, de los datos de caudales
máximos anuales de las estaciones hidrométricas Jaina y Santa Cruz

VE I

Ubicación

Forma

Jaina

702.16

552.14

Santa Cruz

799.13

634.47


Tabla 4: Parámetros de la distribución TPGVE, para tres poblaciones, de los datos de caudales
máximos anuales de las estaciones hidrométricas Jaina y Santa Cruz

Ubicación

Escala

Forma

Probab.

Jaina

Primera Población

742.18

287.24

1.331

0.177

Segunda Población

604.18

389.79

 -0.341

0.6450

Tercera Población

1214.79

1018.95

- 0.458

0.1780

Santa Cruz

Primera Población

740.80

475.25

1.117

0.462

Segunda Población

660.47

527.27

-0.001

0.390

Tercera Población

2552.95

1351.55

- 0.015

0.148


Tabla 5: Parámetros de la distribución TPG, para tres poblaciones, de los datos de caudales
máximos anuales de las estaciones hidrométricas Jaina y Santa Cruz

Ubicación

Escala

Probab.

Jaina

Primera Población

224.53

120.79

0.097

Segunda Población

571.56

207.38

0.638

Tercera Población

1698.03

1021.79

0.265

Santa Cruz

Primera Población

351.30

254.99

0.3410

Segunda Población

898.68

121.96

0.4010

Tercera Población

1893.20

1139.43

0.2580


El procedimiento fue implementado sin ninguna dificultad por medio de un paquete interactivo de cómputo bajo el ambiente de Visual Basic 5.0 (Visual Basic es una Marca Registrada de Microsoft Corporation). El paquete fue desarrollado por los autores, (García ,1999).

El ajuste tiende a ser mucho mejor cuando se utiliza una función de distribución para tres poblaciones en lugar de una sola, en aquellos sitios de medición que están en una región meteorológicamente homogénea, donde ocurren más de un tipo de precipitación,. Esto puede observarse en los resultados consignados en las tablas 5 y 6, bajo el concepto designado como EE, el error estándar de ajuste.

Para la estación hidrométrica Jaina, el modelo propuesto produce una reducción en el error estándar de ajuste del orden del 45 y 42% del valor obtenido por las distribuciones GVE de una sola población y TPG, respectivamente. Dicho valor es del orden del 66%,  menor que el correspondiente al de la distribución VEI para una población.

Para la estación hidrométrica Santa Cruz, el modelo propuesto produce una reducción en el error estándar de ajuste del orden del 21 y 11% del valor obtenido por las distribuciones GVE de una sola población y TPG, respectivamente. Dicho valor es del orden del 46%,  menor que el correspondiente al de la distribución VEI para una población.

Tabla 6. Comparación de los valores de diseño y los errores estándar de ajuste (ambos en m3/s) 
entre varios modelos de una y tres poblaciones para la estación hidrométrica Jaina

Dist.

Q10

Q20

Q50

Q100

EE

TP
GVE

2358

3499

5661

7998

234

TPG

2462

3297

4299

5027

430

GVE

2081

2926

4465

6071

404

VEI

1945

2342

2857

3242

682


Tabla 7.  Comparación de los valores de diseño y los errores estándar de ajuste (ambos en m3/s) 
entre varios modelos de una y tres poblaciones para la estación hidrométrica Santa Cruz, Sin.

Dist.

Q10

Q20

Q50

Q100

EE

TP
GVE

2623

3793

5203

6221

347

TPG

2704

3642

4760

5574

391

GVE

2390

3201

4529

5784

441

VEI

2227

2684

3275

3718

643


CONCLUSIONES

Ha sido presentado el procedimiento para calcular los estimadores de los parámetros de la distribución de general de valores extremos  para tres poblaciones (TPGVE), utilizando el método de máxima verosimilitud.

Cuando puede demostrarse que una muestra de caudales máximos anuales proviene de dos o más poblaciones, el usar metodologías como la propuesta produce resultados que mejoran los obtenidos por el procedimiento tradicional de considerar que la muestra proviene de una sola población.

En igualdad de condiciones, el modelo TPGVE demostró ser muy superior a los modelos considerados de una población, GVE y VEI; así como también al de la distribución TPG, el cual considera 3 poblaciones.

La distribución TPGVE se ha comportado muy bien en las muestras de caudales máximos anuales analizadas  hasta ahora, sólo dos de éstas se han incluido en este artículo.

Basados en los argumentos anteriores, los autores consideran que la distribución TPGVE es una buena opción para el modelado de caudales máximos anuales, en aquellos sitios donde puede considerarse la existencia de tres tipos diferentes de mecanismos productores de lluvia, los cuales inducen la presencia de tres poblaciones en las muestras de caudales máximos anuales.

AGRADECIMIENTOS

Los autores  desean  expresar su gratitud a la Universidad de las Américas, Puebla por el apoyo y las facilidades otorgadas para la realización de este artículo

REFERENCIAS

Canfield, R. V. “The Distribution of the Extremes of a Mixture of Random Variable with Applications to Hydrology”. In Input for Risk Analysis in Water Systems, E.A. McBean, K. W. Hipel and T. E. Unny, eds., pp 77-84, Water Resources Publications, Littleton, EUA (1979).        [ Links ]

García, L. G. “Paquete Interactivo para Distribuciones de Valores Extremos Mixtas de Tres Poblaciones y sus Aplicaciones en Análisis de Gastos Máximos”, Tesis de Licenciatura, Depto. de Ing. Civil, Universidad de las Américas, Puebla, México, (1999).        [ Links ]

Gallaudet, T. C. y C. P. de Moustier , High-frequency volume and boundary acoustic backscatter fluctuations in shallow water, Journal of the Acoustical Society of America 114 (2), 707-725. (2003).        [ Links ]

González, F. J. “Contribución al Análisis de Frecuencias de Valores Extremos de Gastos Máximos en un Río”, Reporte  277, Instituto de Ingeniería, Universidad Nacional Autónoma de México, México, D. F., México. (1970).        [ Links ]

Gumbel, E. J. “Statistics of Extremes”, Columbia University  Press, 375 págs. New York, EUA.  (1958).        [ Links ]

Gutiérrez, C. y J. A. Raynal, “Distribuciones  Mezcladas  en   el Análisis de Frecuencias de  Gastos Máximos”,  X   Congreso   Nacional de Hidráulica, págs. 220-228, Morelia,  México (1988).        [ Links ]

Haan, C. T. “Statistical Methods in Hydrology”, 378 págs. The Iowa State University Press, Ames,  EUA, (1977).        [ Links ]

Jenkinson, A. F. “Estimation of Maximum Floods”,  Chapter  5,  Technical Note 98, págs. 183-227. WMO,  Geneva, Switzerland, (1969).        [ Links ]

Kite, G. W. “Frequency y Risk Analyses in Hydrology”,  Water  Resources   Publications, 187págs. Littleton, Colorado, (1988).        [ Links ]

Mood, A. M., Graybill, F. y D.C. Boes,  “Introduction to the Theory of Statistics”, Third ed., págs. 276-286. McGraw-Hill Inc., New York, N. Y.,  (1974).        [ Links ]

NERC, Natural  Environment  Research  Council. “Flood   Studies  Report, I, Hydrologic  Studies”,  pág. 51. Whitefriars  Press   Ltd.,  London (1975).          [ Links ]

Rao, A. R. y K. H. Hamed, “Flood Frequency Analysis”, CRC Press, 350 págs. Boca Ratón, EUA (2000).        [ Links ]

Raynal, J. A., y O. D. Santillán, “Estimadores de Máxima Verosimilitud para  los   Parámetros   de   la Distribución GVE  Mixta”, IX Congreso  Nacional  de  Hidráulica, págs. 79-90, Querétaro, México (1986).        [ Links ]

Raynal, J. A. y J. L. Guevara, Maximum Likelihood Estimators for the Two Populations Gumbel Distribution, Hydrological    Science and Technology J., 13(1-4), págs. 47-56 (1997).        [ Links ]

Raynal J. A. “FLODRO 2.0: A User-Friendly Personal Computer Package for Flood and Drought Frequency Analyses”, Proceedings of RiverTech’96, IWRA, págs. 900-902, Chicago, EUA,  (1996).        [ Links ]

Raynal, J. A. y L. G. García, Análisis de Frecuencias de Gastos Máximos Anuales Usando la Distribución de Valores Extremos Tipo I para Tres Poblaciones, Información Tecnológica, 15(3), págs 97-104 (2004).        [ Links ]

Rossi, F., Florentino, M. y P. Versace, Two Component Extreme Value Distribution for Flood Frequency Analysis, Wat. Resour. Res.,  20(7),  págs. 847-856 (1984).        [ Links ]

Todorovic, P. y Rousselle, J., Some Problems of Flood Analysis, Wat. Resour. Res., 7(5) págs. 1144-1150 (1971).        [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License