Diplomarbeit, 2011
98 Seiten, Note: 7
Introducción a los datos composicionales
CAPITULO I: Definiciones sobre los datos composicionales
1.1 El Simplex
1.1.2 Definición formal de diagrama ternario.
1.1.3 Ejemplo
1.2 Operaciones en el simplex
1.2.1 Operador Clausura
1.2.2 Operador Perturbación
1.2.3 Operador Potenciación
1.2.4 Subcomposición
1.2.5 Ejemplo
1.3 Transformaciones
1.3.1 Transformación Log-Cociente aditiva
1.3.2 Transformación Log-Cociente centrada
1.4 Elementos básicos de estadística en el simplex
1.4.1 Media geométrica composicional (Centro)
1.4.2 Ejemplo
1.4.3 La variabilidad composicional
1.4.4 Matriz de variación
1.4.5 Ejemplo
CAPITULO II: Análisis de datos multidimensionales
2.1 Introducción a componentes principales
2.2 Definiciones para componentes principales
2.2.1 Vector aleatorio
2.2.2 Vector de promedios o medias muestrales
2.2.3 Vector de medias o de esperanzas
2.2.4 Matriz de varianzas-covarianzas
2.2.5 Matriz de correlaciones
2.2.6 Matriz de covarianzas
2.3 Componentes principales: Valores y Vectores propios de una matriz
2.3.1 Propiedades importantes
2.3.2 Cálculo de los valores y vectores propios
2.3.3 Cálculo de las componentes principales
2.3.4 Cálculo de la matriz de correlaciones para componentes principales
2.3.5 Criterio de selección de las componentes principales
2.4 Ejemplo númerico para el cálculo de componentes principales
2.5 Herramientas gráficas para el tratamiento de componentes principales
2.5.1 Biplot
2.5.2 Ejemplo Biplot
2.5.3 Loadings (Cargas)
2.5.4 Ejemplo Loadings
CAPITULO III: R como herramienta en el análisis de datos composicionales
3.1 El paquete "compositions" en R
3.1.1 El comando "acomp"
3.1.2 El comando "clo"
3.1.3 El comando "ellipses"
3.1.4 Ejemplo: ellipses
3.1.5 Ejemplo: vector en el simplex
3.1.1 El comando "clr"
3.1.2 El comando "alr"
3.1.3 El comando "princomp"
3.1.4 Ejemplo componentes principales: "Rocas Hawai"
3.1.5 Análisis de subcomposiciones "Rocas Hawai"
3.2 El paquete "klaR" en R
3.2.1 El comando "quadplot"
3.2.2 Una manera alternativa de graficar en 3 dimensiones
3.2.3 Ejemplo "plot3d" y "triplot"
CAPITULO IV: Aplicación a un problema real: “Análisis estadístico de 2 calderas (Topping), mediante la metodología de datos composicionales, utilizando el software R”
4.1 Objetivo General
4.2 Objetivos específicos
4.3 Instrumento de medida
4.3.1 Cromatografía
4.3.2 Ficha técnica del proceso cromatógrafo
4.3.3 Fase estacionaria
4.4 Población
4.5 Muestra
4.6 Metodología
4.7 Composiciones encontradas en cada Topping
4.8 Proceso de elaboración: gases y bencinas
4.8.1 Cracking catalítico
4.8.2 Hidrocracking
4.8.3 Coquización retardada (Coker)
4.9 Productos obtenidos del Topping
4.10 Análisis de los Topping
4.9.1 Análisis descriptivo de las composiciones para ambos Topping
4.9.2 Análisis de componentes principales para ambos Topping
4.9.3 Análisis de las matrices de variación y correlación para ambos Topping
4.9.4 Análisis de subcomposciones para ambos Topping
El objetivo principal de este trabajo es abordar el análisis de datos composicionales utilizando el software estadístico R, adaptando las metodologías tradicionales para superar las restricciones de suma constante propias de este tipo de variables.
1.2 Operaciones en el simplex
En el espacio real sumamos vectores, los multiplicamos por constantes, estudiamos su ortogonalidad, medimos distancias, todo esto es posible porque R^D es espacio vectorial euclideo. Pero, la geometría euclídea de R^D no es una geometría apropiada para fenómenos composicionales porque:
a) Los resultados pueden no estar en el simplex.
Por ejemplo: al sumar vectores composicionales, al multiplicarlos por una constante o calcular regiones de confianza.
b) Las diferencias euclídeas no siempre son medidas razonables^9.
Por ejemplo: entre el 5% y el 10% hay un incremento relativo del 100%, entre el 50% y el 55% hay un incremento relativo del 10%, pero la distancia euclídea es la misma.
Antes de indicar la problemática específica que comporta el análisis estadístico de los datos composicionales introducimos cuatro definiciones de gran importancia.
A partir de un vector con componentes positivas siempre podemos obtener un dato composicional de S^D. Basta con dividir cada una de sus componentes por la suma de todas ellas. Este hecho conduce a dar algunas definiciones, que se presentan en la página siguiente.
CAPITULO I: Definiciones sobre los datos composicionales: Introduce la naturaleza de los datos composicionales, las operaciones en el simplex y las transformaciones fundamentales propuestas por Aitchison.
CAPITULO II: Análisis de datos multidimensionales: Presenta los aspectos teóricos del análisis multivariado y el método de componentes principales aplicado a la reducción de variables.
CAPITULO III: R como herramienta en el análisis de datos composicionales: Muestra el funcionamiento del software R y los paquetes específicos necesarios para el tratamiento de datos composicionales y su representación gráfica.
CAPITULO IV: Aplicación a un problema real: “Análisis estadístico de 2 calderas (Topping), mediante la metodología de datos composicionales, utilizando el software R”: Aplica todas las metodologías desarrolladas anteriormente a un caso real de la industria del petróleo en Con-Con.
Datos composicionales, Simplex, R, Aitchison, Componentes Principales, Diagramas ternarios, Biplot, Transformación CLR, Transformación ALR, Variabilidad, Análisis multivariado, Calderas, Topping, Cromatografía, Estadística.
El trabajo se centra en resolver los problemas estadísticos que surgen al analizar datos cuyas variables suman una constante, utilizando la geometría de Aitchison y herramientas computacionales en R.
Estos datos aparecen comúnmente en disciplinas como la geología, la petrología, la química, la economía y la biología, donde las variables representan proporciones relativas de un total.
Debido a que las variables tienen una suma constante, los métodos estadísticos tradicionales (como la correlación directa) pierden su interpretabilidad, lo cual es corregido mediante transformaciones log-cociente.
Se utiliza la metodología de Aitchison para transformar los datos del simplex al espacio real, permitiendo aplicar análisis multivariados como los componentes principales y representaciones biplot.
Se realiza un análisis estadístico de los gases producidos por dos calderas industriales (Topping) de una refinería de petróleo, utilizando el software R para su descripción, reducción de dimensiones y comparación.
Se definen principalmente por ser vectores aleatorios de componentes positivas cuya suma es una constante definida, haciendo irrelevante su magnitud absoluta.
Se parte de la transformación CLR (Log-Cociente centrada) de los datos clausurados, utilizando la matriz de covarianzas para extraer los valores y vectores propios en el espacio transformado.
El comando "clo" (clausura) permite normalizar cualquier conjunto de datos positivos a una suma unitaria (o constante), convirtiéndolos formalmente en datos composicionales listos para el análisis.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

