









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Ejercicios de regresión lineal
Tipo: Ejercicios
1 / 15
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
1. El profesor Isaac Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes de su muerte,
escribió casi 500 libros durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue incluso
más productivo en términos del número de libros escritos en un periodo determinado. Los datos
siguientes dan el tiempo, en meses, necesario para escribir sus libros en incrementos de 100:
Numero de
libros (x)
Tiempo en
meses (y)
a) Suponga que el número de libros x y el tiempo en meses y están relacionados linealmente. Encuentra
la recta de mínimos cuadrados que relacione y con x.
2
2
2
2
2
2
2
2
2
b) Grafica el tiempo como función del número de libros escritos usando la gráfica de la recta de mínimos
cuadrados. ¿Esta ajustada esa recta? Justifica.
La recta no se encuentra totalmente ajustada, ya que los puntos graficados no coinciden con la recta
de mínimos cuadrados.
c) Construye una tabla ANOVA para la regresión lineal.
𝑡𝑜𝑡𝑎𝑙
2
2
2
Regresión 43146.9296 1 43146.
Error 1860.2704 3 620.
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
y = 0.6701x + 195.
0
100
200
300
400
500
600
0 100 200 300 400 500 600
c) Grafica los puntos y la recta ajustada. ¿Le parece razonable la suposición de una relación lineal?
Sí ya que los puntos graficados en “x” & “y” coinciden con la recta de mínimos cuadrados.
d) Usa la recta de regresión para predecir la máxima corriente generada cuando una solución que
contenga 100ppmm de níquel, se agregue al regulador.
ŷ = a + bx = 0. 0192 + ( 0. 00421 )( 100 )
𝑠𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑒 𝑞𝑢𝑒 ŷ = 0. 4402 𝑠𝑒𝑟í𝑎 𝑙𝑎 𝑚á𝑥𝑖𝑚𝑎 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒 𝑔𝑒𝑛𝑒𝑟𝑎𝑑𝑜𝑟𝑎
e) Construye la tabla ANOVA para la regresión lineal.
𝑡𝑜𝑡𝑎𝑙
𝑦𝑦
2
2
2
Regresión 0.3743 1 0.
Error 0.00049 7 0.
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
0
0 20 40 60 80 100 120 140 160 180
3. El índice de rendimiento académico (API) es una medida de rendimiento escolar que se basa en los
resultados del examen Stanford 9. Las calificaciones van de 200 a 1000, con 800 considerando como
objetivo de largo alcance para las escuelas. La tabla siguiente muestra el API para ocho escuelas
elementales en el condado de Riverside, California junto con el porcentaje de estudiantes de esa escuela
que son considerados Estudiantes del idioma inglés (ELL)
Escuela 1 2 3 4 5 6 7 8
API (x) 588 659 710 657 669 641 557 743
ELL (y) 58 22 14 30 11 26 39 6
a. ¿Cuál de las dos variables es la variable independiente y cuál es la dependiente? Explica su selección.
API depende de ELL porque el rendimiento académico depende de cada uno de los estudiantes y sus
calificaciones.
b. Suponiendo que x y y estén relacionadas linealmente, calcula la recta de regresión de mínimos
cuadrados.
2
2
2
2
2
2
2
2
2
2
2
2
b. Usa la tabla ANOVA para calcular F= MSR/MSE.
2
2
2
2
2
2
2
2
2
𝑡𝑜𝑡𝑎𝑙
𝑦𝑦
2
2
2
Regresión 14.4 1 14.4 MSR
Error 1.6 3 0. 53 MSE
𝑐𝑎𝑙
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
c. Compara el valor critico de dos colas para la prueba t con el valor crítico de F con α=0.05. ‘Cuál
es la relación entre los valores críticos?
𝐴𝑚𝑏𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜𝑠 (𝐹 𝑦 𝑡) 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑛 𝑚𝑎𝑦𝑜𝑟𝑒𝑠 𝑎 𝑙𝑜𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 𝑙𝑎𝑠 𝑡𝑎𝑏𝑙𝑎𝑠 "t de student" y "fisher"
5. Se diseñó un experimento para comparar varios tipos de diferentes monitores de la contaminación del
aire. Un monitor se inició y a continuación se expuso a diferentes concentraciones de ozono, que iban de
15 a 230 partes por millón (ppm) durante periodos de 8 a 72 hrs. los filtros del monitor se analizaron
enseguida y se midió la cantidad en microgramos de nitrato de sodio (NO 3 ) registrada por el monitor. Los
resultados para un tipo de monitor se dan en la siguiente tabla:
Ozono (ppm)
x
3
y 2.44 5.21 6.07 8.98 10.82 12.
a) Encuentra la recta de regresión de mínimos cuadrados que relacione la respuesta del monitor a la
concentración de ozono.
2
2
2
2
2
2
2
2
2
2
6. ¿Cómo está relacionado el costo de un viaje en avión con la duración del viaje? La tabla siguiente muestra
el promedio de la tarifa en primera clase, pagada por clientes de American Airlines en cada una de las 18
rutas aéreas de mayor movimiento en Estados Unidos.
Ruta Distancia (mi) Costo $
Dallas-Austin 178 125
Houston – Dallas 232 123
Chicago-Detroit 238 148
Chicago-San Luis 262 136
Chicago-Cleveland 301 129
Chicago-Atlanta 593 162
NY-Miami 1092 224
NY-San Juan 1608 264
NY-Chicago 714 287
Chicago-Denver 901 256
Dallas-Salt Lake 1005 365
NY-Dallas 1374 459
Chicago-Seattle 1736 424
LA-Chicago 1757 361
LA-Atlanta 1946 309
LA-Honolulu 2556 323
NY-San Francisco 2574 513
a) Si se desea estimar el costo de un vuelo, basado en la distancia recorrida, ¿Cuál es la variable de
respuesta y cuál la variable independiente de la predicción?
La variable independiente seria la distancia (x) y la de respuesta o dependiente en este caso sería el
costo (y) pues el precio del vuelo depende de la distancia que recorra el avión.
b) Suponga que hay una relación lineal entre costo y distancia. Calcular la recta de regresión de mínimos
cuadrados que describa el costo como una función lineal de la distancia.
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
c) Grafica los puntos y la recta de regresión. ¿Le parece que la recta ajusta los datos?
No, debido a que en su gran mayoría los datos proporcionados por la tabla de vuelos y costos de estos,
se encuentran muy alejados de la recta de regresión de mínimos cuadrados obtenida.
d) Usa las pruebas estadísticas y medidas apropiadas para explicar la utilidad del modelo de regresión
para predecir el costo.
Prueba la hipótesis de que β=0 al nivel de significancia del 5%.
𝑡𝑜𝑡𝑎𝑙
𝑦𝑦
2
2
2
2
𝑡𝑎𝑏𝑙𝑎𝑠
𝑡𝑜𝑡𝑎𝑙
2
2
2
y = 0.1703x + 101.
0
100
200
300
400
500
600
0 200 400 600 800 1000 1200 1400 1600 1800 2000
8. Consulta los datos del ejercicio 1, que relacionan x, el número de libros escritos por el profesor, con y, el
número de meses que le tomó escribir sus libros (en incrementos de 100).
a. ¿Los datos apoyan la hipótesis de que β=0? Usa la prueba t-student para llegar a tu conclusión.
Sí
n − 2
= 3 grados de libertad, con
𝑡𝑎𝑏𝑙𝑎𝑠
Se puede concluir que B NO es igual a 0, por lo tanto, B sería diferente de 0.
b. Usa la tabla ANOVA del ejercicio, y determina el coeficiente de determinación r
2
. ¿Qué reducción
de porcentaje en la variación total se alcanza usando el modelo de regresión lineal?
2
𝑡𝑜𝑡𝑎𝑙
c. Grafica los datos o consulta la gráfica del ejercicio (inciso b) ¿Los resultados de los incisos a y b
que indican que el modelo da un buen ajuste para los datos? ¿Hay algunas suposiciones que
pueden haber sido violadas al ajustar el modelo lineal?
Según los resultados proporcionados por los incisos a y b, existe suficiente evidencia para afirmar
que el modelo presenta un buen ajuste para los datos.
9. Los datos siguientes se obtuvieron en un experimento que relacionaba la variable dependiente y (textura
de fresas), con x (temperatura de almacenamiento codificada). Usa la siguiente información y responde
las preguntas:
a) ¿Los datos indican que la textura y la temperatura de almacenamiento están relacionadas
linealmente? Usa α=0.05 (ANOVA)
2
2
2
2
2
2
2
2
2
𝑡𝑜𝑡𝑎𝑙
𝑦𝑦
2
2
2
𝑐𝑎𝑙
𝑐𝑎𝑙
𝑡𝑎𝑏𝑙𝑎𝑠
Se puede concluir que no existe una regresión lineal significativa entre los valores de x y y
𝑐𝑎𝑙
𝑐𝑎𝑙