Publication:
Análisis comparativo de tres modelos de densidad compuesta para el estudio de siniestros de cola pesada con R

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2016
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
En este trabajo se plantea el problema de la búsqueda de un modelo estocástico, en términos de una distribución de probabilidad, para explicar conjuntos de datos procedentes de siniestros de seguros no vida con colas pesadas. Se estudian tres modelos distintos con la misma idea general: aplicar una densidad hasta un cierto umbral a determinar y otra a partir del mismo. La densidad elegida para la primera parte del dominio de la variable aleatoria es la distribución lognormal, en vista de su forma asimétrica y con una moda estrictamente positiva, siendo ambas características muy frecuentes en los conjuntos de datos procedentes del sector asegurador no vida. Para la segunda densidad del modelo se han considerado dos alternativas: una distribución de Pareto ordinaria y una distribución de Pareto generalizada. Los modelos son requeridos de cumplir condiciones de continuidad y di- ferenciabilidad de distintos órdenes. Todos los modelos son introducidos y desarrollados desde una perspectiva teórica, algunas de sus propiedades son estudiadas de forma analítica y otras por medio de simulación y representación gráfica. Para verificar la utilidad de los modelos expuestos, éstos se aplican a los datos de siniestros derivados de incendios daneses en los años 1980 –un conjunto de datos muy utilizado en la literatura actuarial–. Los ajustes se realizan sobre una parte de los datos, y los resultados obtenidos se contrastan con la parte complementaria de la muestra global. Varias medidas para la comparación de modelos son introducidas –como la razón de verosimilitudes y el criterio de información de Akaike– y utilizadas para comparar los ajustes obtenidos con los diversos modelos estudiados en el presente trabajo.
Description
UCM subjects
Unesco subjects
Keywords
Citation
Akaike, H. (1974). A new look at the statistical model identification. Automatic Control, IEEE Transactions on, 19 (6), 716–723. Arlot, S. & Celisse, A. (2010). A survey of cross-validation procedures for model selection. Statistics surveys, 4, 40–79. Balkema, A. A. & De Haan, L. (1974). Residual life time at great age. The Annals of probability, 792–804. Cooray, K. (2009). The weibull–pareto composite family with applications to the analysis of unimodal failure rate data. Communications in Statistics—Theory and Methods, 38 (11), 1901–1915. Cooray, K. & Ananda, M. M. (2005). Modeling actuarial data with a composite lognormal-pareto model. Scandinavian Actuarial Journal, 2005 (5),321–334. Davison, A. C. (2003). Statistical models, volume 11. Cambridge University Press. Davison, A. C. (2013). SMPracticals: Practicals for use with Davison (2003). Statistical Models. R package version 1.4-2. Dutang, C., Goulet, V., & Pigeon, M. (2008). actuar: An r package for actuarial science. Journal of Statistical Software, 25 (7), 38. Embrechts, P., Klüppelberg, C., & Mikosch, T. (1997). Modelling Extremal Events, volume 33 of Applications of Mathematics (New York ed.). Springer-Verlag, Berlin. Frigessi, A., Haug, O., & Rue, H. (2002). A dynamic mixture model for unsupervised tail estimation without threshold selection. Extremes, 5 (3),219–235. Group, P. . R. A. & Securities, C. (2009). its: Irregular Time Series. R package version 1.1.8. Hill, B. M. (1975). A simple general approach to inference about the tail of a distribution. The annals of statistics, 3 (5), 1163–1174. Hoey, J. (2012). The Two-Way Likelihood Ratio (G) Test and Comparison to Two-Way Chi Squared Test. ArXiv e-prints. Hyndman, R. J. & Fan, Y. (1996). Sample quantiles in statistical packages. The American Statistician, 50 (4), 361–365. Joanes, D. & Gill, C. (1998). Comparing measures of sample skewness and kurtosis. Journal of the Royal Statistical Society: Series D (The Statistician), 47 (1), 183–189. Klugman, S. A., Panjer, H. H., & Willmot, G. E. (2012). Loss models: from data to decisions, volume 715. John Wiley and Sons. Luebeck, G. & Meza, R. (2013). Bhat: General likelihood exploration. R package version 0.9-10. McDonald, J. (2014). Handbook of Biological Statistics (3rd ed.). Baltimore, Maryland: Sparky House Publishing. McNeil, A. J. (1997). Estimating the tails of loss severity distributions using extreme value theory. ASTIN bulletin, 27 (01), 117–137. NIST/SEMATECH, Croarkin, C., Tobias, P., & Zey, C. (2001). Engineering statistics handbook. Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50 (302), 157–175. Pickands, J. (1975). Statistical inference using extreme orderstatistics. Annals of Statistics, 3, 119–131. R Core Team (2015). R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. Resnick, S. I. (2007). Heavy-tail phenomena: probabilistic and statistical modeling. Springer Science & Business Media. Scollnik, D. P. (2007). On composite lognormal-pareto models. Scandinavian Actuarial Journal, 2007 (1), 20–33. Scollnik, D. P. & Sun, C. (2012). Modeling with weibull-pareto models. North American Actuarial Journal, 16 (2), 260–272. Seal, H. L. (1980). Survival probabilities based on pareto claim distributions. Astin Bulletin, 11 (01), 61–71. Teodorescu, S. (2010). On the truncated composite lognormal-pareto model. Math Rep, 12, 71–84. Vernic, R. & Teodorescu, S. (2009). On composite pareto models. Wilks, S. S. (1938). The large-sample distribution of the likelihood ratio for testing composite hypotheses. The Annals of Mathematical Statistics, 9 (1), 60–62. Yates, F. (1934). Contingency tables involving small numbers and the X 2 test. Supplement to the Journal of the Royal Statistical Society, 1 (2), 217–235.