SciELO - Scientific Electronic Library Online

 
vol.15 número1Desarrollo de un Calorímetro para la Determinación de la Entalpía de Dilución en Disoluciones Acuosas de ElectrolitosEstudio Comparativo de Modelos Moleculares del Agua en la Predicción de Propiedades de Saturación índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Información tecnológica

versión On-line ISSN 0718-0764

Inf. tecnol. v.15 n.1 La Serena  2004

http://dx.doi.org/10.4067/S0718-07642004000100014 

 

Información Tecnológica - Vol. 15 N° 1 - 2004 : 87 - 94

ARTÍCULOS VARIOS

 

Cálculo de los límites de confianza de la Distribución de Probabilidad de valores extremos tipo i para dos poblaciones

Calculation of Confidence Limits for the Probability Distribution of Extreme Values of Type I for Two Populations

 

J.A. Raynal1 y M.E. Raynal2

(1) Univ. de las Américas-Puebla, Dpto. de Ingeniería Civil, Santa Catarina Mártir,
72820 Cholula, Pue.-México (e-mail: jraynal@mail.udlap.mx)
(2) Univ. de Illinois at Urbana-Champaign, Dpto. de Ingeniería Civil y Ambiental, 205 N. Mathews,
Urbana, IL 61801-E.U.A. (e-mail: raynalgu@uiuc.edu)


Resumen

Se presenta una metodología para la obtención de los límites de confianza para la distribución de probabilidad de valores extremos tipo I para dos poblaciones. La metodología está basada en la aplicación del método de máxima verosimilitud para calcular los parámetros y los límites de confianza de los valores de diseño. Estos son obtenidos por medio de la matriz de varianza-covarianza de los parámetros y con la suposición de que los valores de diseño poseen una distribución normal. Dada la complejidad de la función de verosimilitud, se hace uso de un código de optimización para maximizar esa función y así producir los valores de los parámetros de máxima verosimilitud. Los resultados obtenidos indican que es una metodología promisoria ya que en varios casos se ha encontrado una reducción en el ancho de los límites de confianza además de un mejor ajuste de la función de probabilidad propuesta a los datos de muestra.


Abstract

A methodology for the calculation of confidence limits for the probability distribution of extreme values of type I for two populations is presented. The methodology is based on the application of the maximum likelihood method for estimating the parameters of the distribution and the confidence limits of the design values. The confidence limits are obtained by the use of the variance-covariance matrix of the parameters assuming a normal distribution of the design values. Given the complexity of the likelihood function, an optimization code is used to maximize such function to produce the maximum likelihood estimators of the parameters of the distribution. The results obtained show that this is a promising methodology given that in several cases a reduction on the width of the confidence limits have been observed in addition to the improvement in the fitting of the proposed probability distribution to the data used.

Keywords: confidence limits, probability distribution, extreme values, maximum likelihood


 

INTRODUCCIÓN

La selección de la distribución de probabilidad y la elección del mejor método para estimar sus parámetros y límites de confianza para los valores de diseño, han sido siempre asuntos de gran preocupación entre los hidrólogos superficiales. Cuando hay la necesidad de considerar, por características meteorológicas existentes en la zona de estudio, dos o más poblaciones presentes en las muestras de datos la preocupación citada crece.

El modelado probabilístico de muestras de gastos máximos anuales con dos o más poblaciones presentes, arroja información que el análisis de una población no puede proveer porque está limitado a esa condición.

La literatura técnica sobre análisis de gastos máximos para una población es abundante (Rao y Hamed, 2000; Castillo 1988; entre otros). No así la que se tiene para modelar muestras de gastos máximos anuales cuando éstas contienen dos o más poblaciones.

El uso de funciones de distribución de probabilidad mezcladas, para ajustar muestras provenientes de dos o más poblaciones ha sido propuesto con anterioridad (Gumbel, 1958). La distribución doble Gumbel se propuso con un esquema de estimación de parámetros basado en el método de mínimos cuadrados (González-Villarreal, 1970).

Se ha propuesto un modelo general del tipo aditivo para distribuciones mezcladas (Mood et al., 1974).

En particular, en el caso de las funciones de distribución de valores extremos, se ha propuesto la distribución de valores extremos de dos componentes (TCEV), (Todorovic y Rousselle, 1971; Canfield 1979; Rossi et al., 1984).

Más recientemente, se han propuesto las distribuciones de valores extremos tipo I para dos poblaciones (Raynal-Villasenor y Gueva-ra-Miranda, 1997), y la general de valores extremos para dos poblaciones, (Raynal-Villa-señor y Santillán-Hernández, 1986; Gutiérrez-Ojeda y Raynal-Villaseñor; 1988).

Ninguno de estos esquemas ha provisto un procedimiento para estimar los límites de confianza de los eventos de diseño por medio del método de máxima verosimilitud.

El objetivo de este artículo fue proveer un procedimiento para estimar los límites de confianza, usando el método de máxima verosimilitud, de la distribución de valores extremos tipo I para dos poblaciones, con la finalidad de poder evaluarlos y buscar una reducción en el ancho de tales límites.

METODOLOGÍA

Función de distribución de probabilidad de
valores extremos tipo I para una población

La distribución de la función de Valores Extremos Tipo I (Gumbel) para una población y para máximos es (NERC, 1975):

(1)

donde a y x01 son los parámetros de escala y ubicación, respectivamente.

La función de densidad de probabilidad está dada por, (NERC, 1975):

(2)

donde: -¥ < x < ¥ y a > 0

Función de distribución de valores extremos
tipo I para dos poblaciones

Basada en la forma general de la función de distribución de probabilidad para dos poblaciones se ha propuesto el siguiente modelo general (Mood et al, 1974):

(3)

donde p es la proporción de la segunda población en la mezcla.

Con base en la ecuación anterior, la distribución Gumbel de dos poblaciones puede ser expresada como, (Raynal-Villasenor y Guevara-Miranda, 1997):

(4)

y su correspondiente función de densidad de probabilidad es:

(5)

El método de máxima verosimilitud

El método de máxima verosimilitud ha sido reconocido como uno de los mejores métodos para la estimación de los parámetros y de los límites de confianza de las distribuciones de probabilidad, basada esta afirmación en las propiedades de sus estimadores como son la ausencia de sesgo en forma asintótica y suficiencia, así como consistencia y eficiencia, como ha sido reportado en la literatura técnica (Mood et al., 1974; Haan, 1977; entre otros). Este método también posee la virtud de poder manejar funciones muy complejas en la fun-ción de verosimilitud y lo hace de manera muy flexible.

La función de verosimilitud para N variables independientes e idénticamente distribuidas X1, X2,..., Xn puede obtenerse como la función de densidad de probabilidad conjunta, esto es (Mood et al, 1974):

(6)

donde q denota el vector de parámetros y f(.) es la función de densidad de probabilidad.

Tomando logaritmos naturales a ambos lados de la fórmula anterior, se tiene la función logarítmica de verosimilitud:

(7)

Estimación de los parámetros

Basada en la Ecuación (7), la función logarítmica de verosimilitud para la distribución de Valores extremos tipo I de dos poblaciones para máximos es (Raynal-Villasenor y Guevara-Miranda, 1997):

LnL(c; c01, a1, c02,a2, p)

Ln {

1 - p
a1

·

(8)

Los parámetros la distribución de valores extremos tipo I de dos poblaciones para máximos, se obtienen al maximizar directamente la función anterior, por medio de un algoritmo de optimización no lineal conocido como el método de Rosenbrock para variables múltiples restringidas (Kuester y Mize, 1973).

Estimación de los límites de confianza

La matriz varianza-covarianza para la Distribución de Valores Extremos Tipo I para Dos Poblaciones, puede ser expresada como, (Raynal-Gutiérrez,2001):

(9)

y sus elementos son iguales a (Raynal-Gutiérrez, 2001):

(10)

Las expresiones contenidas en cada uno de los elementos de la matriz varianza-covarianza, ecuación (10), tienen las siguientes expresiones matemáticas (Raynal-Gutiérrez, 2001):

(11)

(12)

(13)

(14)

(15)

donde las expresiones mostradas son:

DEN = f(x)mix (16)

(17)

(18)

(19)

(20)

Los límites de confianza para la distribución de valores extremos tipo I para dos poblaciones, suponiendo que los valores de diseño tienen una distribución de probabilidad normal, pueden entonces calcularse como se describe a continuación (Raynal-Gutiérrez, 2001).

Una vez que han sido resueltas las derivadas parciales de los parámetros, Ecuaciones (11)-(15), y la matriz de varianza-covarianza, Ecuación (10), ha sido calculada con dichos resultados, los límites de confianza se estiman con la siguiente expresión:

(21)

aquí xl es el límite de confianza, xT es el valor de diseño asociado con un periodo de retorno T preestablecido, ma es el valor de confianza y ST es la desviación estándar de los valores de diseño xT .

La varianza de los valores de diseño es igual a:

(22)

El vector que representa a los valores de diseño (x) es igual a:

(23)

Y el vector x transpuesto tiene la siguiente forma:

(24)

Al multiplicar el vector x por la matriz varianza-covarianza, y por el vector x transpuesto, se obtiene que el valor de la varianza de los valores de diseño, ST, es igual a:

(25)

Si p ³ pt, donde pt es igual a:

(26)

Si p < pt, entonces St es igual a:

(27)

RESULTADOS Y DISCUSION

Se han seleccionado las estaciones hidrométricas Jaina (1941-1991) y Huites (1942-1992), Sinaloa-México, para mostrar el procedimiento de obtención de los límites de confianza de la Distribución de Valores Extremos Tipo I para Dos Poblaciones. Ambas estaciones están ubicadas en el Noroeste de México, en el estado de Sinaloa, ver el área sombreada mostrada en la Figura 1 que contiene el mapa de las regiones hidrológicas de la República Mexicana.

Fig. 1: Regiones hidrológicas de México (SRH, 1974)

La importancia económica del estado de Sinaloa es muy grande, ahí se localiza una de las regiones agrícolas más importantes de México, la cual cuenta con grandes presas de almacenamiento y distritos de riego. El Noroeste de México es un área que se ve afectada frecuentemente por la presencia de ciclones tropicales durante el Verano-Otoño y por frentes fríos durante la época invernal, fenómenos que sumados al proceso local convectivo provocan que estas muestras de gastos máximos anuales evidencien la presencia de más de una población en ellas. En la Figura 2 se muestran los ciclones que impactaron las costas de México en el periodo 1980-2002.

Fig. 2: Lugares de impactos de ciclones, en la categoría de huracán,
en Sinaloa,México durante el periodo 1980-2002 (SMN, 2003)

Los valores iniciales requeridos por el procedimiento propuesto fueron estimados usando el paquete de cómputo FLODRO, (Raynal-Villasenor, 1998). Los valores de diseño y sus límites de confianza, para las estaciones hidrométricas Jaina y Huites, usando la distribución de valores extremos tipo I para dos poblaciones, que se muestran en la Tablas 1 y 3, fueron obtenidos por medio del paquete interactivo para el cálculo de límites de confianza de la Distribución de Valores Extremos Tipo I para Dos Poblaciones (Raynal-Gutiérrez, 2001).

Los errores estándar de ajuste se indican con la denominación EE y son calculados de la forma siguiente (Kite, 1988):

(28)

donde xi son los valores históricos de la muestra de datos, yi son los valores producidos por la función de distribución correspondiente a los periodos de retorno de los valores históricos N es el tamaño de la muestra, y mj es el número de parámetros de la función de distribución.

En las Tablas 2 y 4 se muestran los límites de confianza, para dichas estaciones hidrométricas, calculados suponiendo que la muestra proviene de una sola población. Una representación gráfica de los resultados contenidos en las Tablas 1 y 3 es presentada en las Figuras 3 y 4.

Tabla 1: Límites de confianza para la estación Jaina,
Méx.,considerando dos poblaciones (EE = 276.15)

Tr
(años)

Límite Inferior
(m3/s)

Gasto de
Diseño (m3/s)

Límite Sup.
(m3/s)

Ancho de los
Límites (m3/s)

5

886

1007

1129

243

10

1345

1498

1651

306

20

1756

1938

2120

364

50

2261

2479

2698

437

100

2631

2876

3121

490

Tabla 2: Límites de confianza para la estación Jaina,
Méx., considerando una población (EE = 371.42 )

Tr
(años)

Límite Inferior
(m3/s)

Gasto de
Diseño (m3/s)

Límite Sup.
(m3/s)

Ancho de los
Límites (m3/s)

5

821

1002

1184

363

10

1044

1277

1509

465

20

1256

1541

1825

569

50

1528

1881

2235

707

100

1731

2137

2543

812

Tabla 3: Límites de confianza para la estación Huites,
Méx.,considerando dos poblaciones (EE = 309.36)

Tr
(años)

Límite Inferior
(m3/s)

Gasto de
Diseño (m3/s)

Límite Sup.
(m3/s)

Ancho de los
Límites (m3/s)

5

2589

3311

4034

1445

10

4556

5697

6834

2278

20

6069

7533

8996

2927

50

7809

9645

11480

3671

100

9056

11159

12262

3206

Tabla 4: Límites de confianza para la estación Huites,
Méx., considerando una población (EE = 1046.41)

Tr
(años)

Límite Inferior
(m3/s)

Gasto de
Diseño (m3/s)

Límite Sup.
(m3/s)

Ancho de los
Límites (m3/s)

5

2868

3468

4068

1200

10

3609

4377

5147

1538

20

4309

5250

6191

1882

50

5210

6380

7550

2340

100

5881

7226

8571

2690

Como es usual, el utilizar una metodología de dos poblaciones en lugar de una sola, en aquellos sitios de medición que están en una región meteorológicamente homogénea donde ocurren más de un tipo de precipitación, el ajuste tiende a ser mucho mejor, como puede observarse en los resultados consignados en las Tablas 1-4, bajo el concepto designado como EE, el error estándar de ajuste, y las Figuras 3 y 4.

Por lo general, la metodología propuesta produjo límites de confianza más estrechos para los eventos de diseño, como en el caso de la estación Jaina, Méx., que los producidos por el procedimiento usual de una sola población. Esto puede claramente observarse en los resultados consignados en las tablas 1 y 2 en la última columna.

Fig. 3: Curvas de frecuencias empírica y teórica y los límites de confianza
(dos poblaciones) para los datos de muestra para la estación Jaina, Sin.,
Méx. (1941-1991)


Fig. 4: Curvas de frecuencias empírica y teórica y los límites de confianza
(dos poblaciones) para los datos de muestra para la estación Huites, Sin.,
Méx. (1942-1992)

Cuando puede demostrarse que una muestra de gastos máximos anuales proviene de dos o más poblaciones, el usar metodologías como la propuesta produce resultados que mejoran los obtenidos por el procedimiento tradicional de considerar que la muestra proviene de una sola población.

La metodología propuesta tiene, sin embargo, la necesidad de contar con un equipo de cómputo personal, sin él es prácticamente imposible aplicarla dada la complejidad de los procesos numéricos a realizar. Esta aparente desventaja, tiende a desaparecer dado que los equipos de cómputo personal se generalizan cada vez más en la práctica ingenieril.

Los resultados obtenidos hasta ahora, hacen que la metodología propuesta sea muy promisoria para su aplicación en el análisis de gastos máximos anuales, en aquellas regiones donde se presuma la ocurrencia de más de un tipo de fenómeno productor de lluvia.

CONCLUSIONES

La metodología propuesta para la estimación de los límites de confianza para eventos de diseño para la distribución de valores extremos tipo I para dos poblaciones, ha producido muy buenos resultados con las muestras de datos analizadas hasta el momento, dos de las cuales se incluyen en el artículo como ejemplos de aplicación.

Se ha mejorado significativamente el ajuste de los datos de muestra por medio de la distribución de probabilidad propuesto, así como se ha observado una reducción en el ancho de los límites de confianza, incrementándose de esta forma la confiabilidad en la estimación de los valores de diseño.

AGRADECIMIENTOS

Los autores desean expresar su gratitud a la Universidad de las Américas, Puebla por el apoyo y las facilidades otorgadas para la realización de este artículo.

REFERENCIAS

Canfield, R.V., The Distribution of the Extremes of a Mixture of Random Variable with Applications to Hydrology, in Input for Risk Analysis in Water Systems, E.A. McBean, K.W. Hipel y T.E. Unny, eds., Water Resources Publications, pp. 77-84 (1979).        [ Links ]

Castillo, E., Extreme Value Theory in Engineering, Academic Press (1988).        [ Links ]

González-Villarreal, F.J., Contribución al Análisis de Frecuencias de Valores Extremos de Gastos Máximos en un Río, Reporte # 277, Instituto de Ingeniería, Universidad Nacional Autónoma de México, México, D.F., México (1970).        [ Links ]

Gutiérrez-Ojeda, C. y J.A. Raynal-Villaseñor, Distribuciones Mezcladas en el Análisis de Frecuencias de Gastos Máximos, X Congreso Nacional de Hidráulica, Morelia, Mich., Méx., págs. 220-228 (1988).        [ Links ]

Gumbel, E.J. Statistics of Extremes, Columbia University Press (1958).        [ Links ]

Haan, C.T., Statistical Methods in Hydrology, The Iowa State University Press, Ames, Iowa, USA. (1977).        [ Links ]

Kite, G.W. Frequency and Risk Analyses in Hydrology, Water Resources Publications, Littleton, Colorado, E.U.A. 187 pages. (1988)        [ Links ]

Kuester, J.L. y J.H Mize, "Optimization with FORTRAN", McGraw-Hill Book Co. (1973).        [ Links ]

Mood, A.M., F. Graybill y D.C. Boes, Introduction to the Theory of Statistics, McGraw-Hill Book Co., Third Ed., New York, N.Y., USA. (1974)        [ Links ]

NERC, Natural Environment Research Council, Flood Studies Report, Vol. 1 Hydrological Studies, Whitefriars LTD. London. (1975).        [ Links ]

Rao, A. R. y K.H. Hamed, Flood Frequency Analysis, CRC Press (2000)        [ Links ]

Raynal-Gutiérrez, M.E., Paquete Interactivo para la Estimación de los Límites de Confianza para la Distribución Gumbel de Dos Poblaciones, Tesis de Licenciatura, Departamento de Ingeniería Civil, Universidad de las Américas, Puebla, Méx. (2001).        [ Links ]

Raynal-Villaseñor, J.A., y O.D. Santillán-Hernández, Estimadores de Máxima Verosimilitud paralos Parámetros de la Distribución GVE Mixta,IX Congreso Nacional de Hidráulica, Querétaro, Qro., Méx., págs. 79-90 (1986).        [ Links ]

Raynal-Villasenor, J.A. y J.L. Guevara-Miranda, Maximum Likelihood Estimators for the Two Populations Gumbel Distribution, Hydrological Science and Technology Journal, 13(1-4), 47-56 (1997).        [ Links ]

Raynal-Villasenor, J.A., FLODRO 2.0: A User-Friendly Computer Package for Flood and Drought Frequency Analyses, in Development and Application of Computer Techniques to Environmental Studies, C. Brebbia et al (eds.), WIT press, Southampton, Inglaterra, 181-187. (1998).        [ Links ]

Rossi, F., M. Florentino y P. Versace, Two Component Extreme Value Distribution for Flood Frequency Analysis, Water Resources Research, 20(7), 847-856 (1984).        [ Links ]

SMN, Servicio Meteorológico Nacional, http://www.cna.gob.mx (2003).        [ Links ]

SRH, Secretaría de Recursos Hidráulicos, Boletín Hidrológico Núm 36, Tomo 1. (1975)        [ Links ]

Todorovic, P. y Rousselle, J., Some Problems of Flood Analysis, Water Resources Research, 7(5), 1144-1150 (1971).         [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons