Universidad Complutense de Madrid
E-Prints Complutense

Bases de datos en R :análisis gráfico y estadístico de valores atípicos y ausentes

Impacto

Downloads

Downloads per month over past year



Cordero Sánchez, Jorge (2013) Bases de datos en R :análisis gráfico y estadístico de valores atípicos y ausentes. [Trabajo Fin de Máster]

[img]
Preview
PDF
4MB


Abstract

Este trabajo se centra en el tratamiento de valores atípicos y valores ausentes. Para ello se incluye una mejora a las caras de Chernoff, para poder localizar en un entorno
multivariante valores atípicos de manera unívoca. Dicha mejora se desarrolla en una base de datos propia de 531 ejemplares de cabras de Guadarrama con un total de 21 variables,con resultados satisfactorios. En la misma base de datos se verifica la correlación existente entre el perímetro torácico y el peso en caprinos, consiguiendo una ecuación con resultados considerablemente buenos. También se consiguen hallar más correlaciones en las medidas
morfológicas de los caprinos gracias a esta base de datos. Estas correlaciones son la anchura de la caña con el perímetro de la caña, la altura de la cruz con la altura de medio dorso y esta última con la altura de la grupa.
También se dispone de dos bases de datos de repostajes de carburante, una de diesel con 231 registros y otra de gasolina 95 con 109, sobre las que se descartan posibles correlaciones entre sus variables, así como se desarrolla un sistema experto el cual se testea haciendo uno de un comparador de estimadores, el cual ha sido también desarrollado en este trabajo y permite comparar métodos propios de estimación desarrollado por usuarios y compararlos entre sí.
[ABSTRACT]
This work is centred in the treatment of outliers and missing values. For this proposal here is developed an improvement of Chernoff face's, which consists of finding outliers accurately and univocally in a multivariate environment. This improvement is developed in our onhouse
developed database with 531 specimens of coats of Guadarrama, with 21 variables for each and satisfactory results. With this database is verified the correlation between the bust measurement and the weight in coats, getting an equation that responds well to tests.
Also other correlations with the morphological measures of the coats are discovered: the leg's width with the leg's perimeter, the cross's height and the back half height, and finally,the correlation between latter and rump height.
This work also shows the work on other two databases of refueling, the first with 109 records of 95 octano's petrol and the last one with 231 records of diesel. Any variable
correlations in those databases are discarded, and then an expert system is developed, which is tested with an estimators comparator. This developed comparator allows to compare user designed estimation methods.


Item Type:Trabajo Fin de Máster
Additional Information:

500 Convocatoria de septiembre
Máster en Investigación en Informática, Facultad de Informática, Departamento de Arquitectura de Computadora y Automática, curso 2012-2013

Directors:
DirectorsDirector email
López López, María Victoria
González Pérez, Beatriz
Uncontrolled Keywords:Caras de Cherno resaltando valores atípicos, Localizar outliers entorno multivariante, Correlación morfología cabras, Sistema experto repostajes, Comparador de estimadores, Localize outliers in Cherno's faces, Outliers in multivariate environment,Correlations in coat's morphology, Refueling's expert system, Estimators comparator.
Subjects:Sciences > Mathematics > Applied statistics
Sciences > Computer science > Databases
ID Code:23435
Deposited On:06 Nov 2013 09:52
Last Modified:07 Feb 2014 11:02

Origin of downloads

Repository Staff Only: item control page