



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
taller de datos estadísticos , Taller Estadistica inferencial, regresion lineal simple usando R
Tipo: Exámenes
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
13 de noviembre de 2020 Con la base de datos seleccionada para la realización del 50% del cuarto parcial y utilizando el software R realizar:
1. (valor 0,3) Escribir el enunciado del ejercicio que va a desarrollar donde especifique la variable dependiente “y” y la variable independiente “x”. Además, definir las unidades de medidas de cada una de las variables. El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y Gales en el período de 1970. Cada grupo está formado por trabajadores de la misma profesión (médicos, decoradores, trabajadores textiles, etc.), en cada uno de los veinticinco grupos muestreados se han observado dos variables: el índice de estandarizado de consumo de cigarrillos X (variable independiente) y el índice de muertes por cáncer de pulmón Y (variable dependiente). Se desea estudiar la relación entre estas dos variables. Consumo de cigarrillos (X) Muertes por cancer de pulmón (Y) 116 155 102 101 111 118 93 113 77 84 137 116 117 123 94 128 88 104 112 96 113 144 110 139 125 113 102 88 91 104 104 129 107 86 91 85 100 120 76 60 66 51 133 146 115 128 105 115 87 79
2. (valor 0,2) Escribir la fuente donde obtuvo los datos con los que va a trabajar (colocar dirección página web, nombre y foto si es de un libro) https://es.scribd.com/doc/155812446/2- 3 - 1 - Ejercicios-de-Datos-Bivariados-PROPUESTOS Scribd, ejercicio número 3. 3. (valor 0,4) Mostrar la salida de las estadísticas descriptivas (summary). Interpretar Se puede concluir que el valor máximo de el consumo de cigarrillos es de 137 y el valor máximo de muertes por cáncer de pulmón es 155. 4. (valor 0,6) Usando la función “par(mfrow=c(1,2))” mostrar los diagramas de cajas y bigotes al mismo tiempo de las dos variables de estudio (debe tener título, nombre eje y, color). Interpretar cada uno de los diagramas. Del diagrama de cajas y bigotes de el consumo de cigarrillos se puede concluir que la mediana está en 105 o un valor muy cercano. Del diagrama de cajas y bigotes de las muertes por cáncer de pulmón se puede concluir que la mediana está en un valor muy cercano a 120. 5. (valor 0,6) Usando la función “par(mfrow=c(1,2))” mostrar los histogramas al mismo tiempo de las dos variables de estudio (debe tener título, nombre eje y, color). Interpretar cada uno de los histogramas.
8. (valor 0,4) El diagrama de dispersión (debe llevar título, los puntos en el diagrama debe llevar un color diferente al negro). Interpretar La relación entre el consumo del cigarrillo y las muertes por cáncer de pulmón es lineal y directa. 9. (valor 0,2) Escriba el modelo de regresión lineal estimado Y = 1.088 – 2. 885
10. (valor 0,2) Interpretar 𝛽 ̂ 1 𝛽̂ 1 = 1. Al aumentar 1 unidad de índice estandarizado de consumo de cigarrillos, se espera que en promedio las muertes por cáncer de pulmón disminuyan en 2.885 unidades de índice estandarizado. 11. (valor 0,5) Utilizar el “summary(modelo)” para que señale e Interprete: a) 𝛽 ̂ 0 𝑦 𝛽 ̂ 1 𝛽̂ 1 = 1. Al aumentar 1 unidad de índice estandarizado de consumo de cigarrillos, se espera que en promedio las muertes por cáncer de pulmón disminuyan en 2.885. 𝛽̂ 0 = - 2. Cuando el consumo de cigarrillos es 0 unidades de índice estandarizado, se espera que en promedio las muertes por cáncer de pulmón sean - 2.885 unidades de índice estandarizado. b) Escribir la hipótesis para probar la significancia H0 = 𝛽̂1 = 0 H1 = 𝛽̂1 diferente a 0 “Se rechaza H0” c) Error estándar de 𝛽 ̂ 1 Error estándar = 0.22 09 d) Escribir el tp y el Fp. Además ¿Se rechaza Ho? Justificar y escribir conclusión tp = 4. Fp = 24. “Se rechaza H0” A un nivel de confianza del 90% se puede concluir que 𝛽̂ 1 es diferente de 0. e) Escribir el coeficiente de determinación. Interpretar R2 = 0. Debido a que el coeficiente de determinación es de 0.7 162398 se puede concluir que hay una relación lineal directa entre el consumo de cigarrillos y la muerte por el cáncer de pulmón. 12. (valor 0,4) Escribir el coeficiente de correlación. R^2 = 0.