Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Teoría de muestras pequeñas, Apuntes de Estadística

Aquí puedes reconocer las diferentes teorías de muestras pequeñas

Tipo: Apuntes

2020/2021

Subido el 29/04/2021

kevinadiaz
kevinadiaz 🇨🇴

5

(1)

1 documento

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEORÍA DE
LAS MUESTRAS
PEQUEÑAS
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Teoría de muestras pequeñas y más Apuntes en PDF de Estadística solo en Docsity!

TEORÍA DE

LAS MUESTRAS

PEQUEÑAS

INTRODUCCIÓN

Si el tamaño de las muestras es grande, N > 30, lo que se conoce como muestras grandes, las distribuciones muestrales de muchos de los estadísticos son aproximadamente normales; esta aproximación mejora a medida que aumenta N. Si el tamaño de las muestras es N < 30, lo que se conoce como muestras pequeñas, esta aproximación no es buena y empeora a medida que N disminuye, de manera que es necesario hacer algunas modificaciones. Cuando las muestras son pequeñas, se le llama teoría de las muestras pequeñas. Sin embargo, un nombre más adecuado sería teoría del muestreo exacto, ya que los resultados obtenidos son válidos tanto para muestras grandes como para muestras pequeñas. Se estudian tres distribuciones importantes: la distribución t de Student, la distribución ji cuadrada y la distribución F.

DISTRIBUCIÓN t DE STUDENT

Sea el estadístico t que es análogo al estadístico z dado: Si se consideran muestras de tamaño N extraídas de una población normal (o aproximadamente normal) cuya media es μ y si para cada muestra se calcula t, usando la

media muestral ´ x y la desviación estándar muestral s, se obtiene la distribución muestral de t.

Esta distribución está dada por Donde Y 0 es una constante que depende de N, tal que el área total bajo la curva sea 1, y donde a la constante ν = (N − 1) se le conoce como el número de grados de libertad (ν es la letra riega nu). Se le llama distribución t de Student en honor a su descubridor, W. S. Gossett, quien en la primera mitad del siglo XX publicó sus trabajos bajo el seudónimo “Student”.

donde los valores ±tc, llamados valores críticos o coeficientes de confianza, dependen del nivel de confianza deseado y del tamaño de la muestra. Estos valores se leen en la tabla t Se supone que la muestra se toma de una población normal. Esta suposición se puede verificar empleando la prueba para normalidad de Kolmogorov-Smirnov. PRUEBAS DE HIPÓTESIS Y DE SIGNIFICANCIA

  1. Media. Para probar la hipótesis H 0 de que una población normal tiene una media μ, se usa la puntuación t (o estadístico t)
  2. Diferencias entre medias. Supóngase que de poblaciones normales cuyas desviaciones estándar son iguales (σ 1 = σ 2 ) se toman dos muestras aleatorias de tamaños N 1 y N 2.

Supóngase, además, que las medias de estas dos muestras son ´ x 1 y ´ x 2 y que sus desviaciones

estándar son s 1 y s 2 , respectivamente. Para probar la hipótesis H 0 de que las muestras provienen de una misma población (es decir que μ 1 = μ 2 y también σ 1 = σ 2 ) se usa la puntuación t dada por Esta distribución t tiene una distribución de Student con ν = N1 + N2 − 2 grados de libertad Ejemplos

se muestra en la gráfica la distribución t de Student para nueve (9) grados de libertad. Utilizar la tabla para hallar los valores de (a) para los que: a) el área a la derecha de a sea 0.05, a) Si el área sombreada a la derecha de a es 0.05, el área a la izquierda de a es (1 − 0.05) = 0.95, y a representa el percentil 95, t.95. En la tabla, se desciende por la columna cuyo encabezado es ν hasta llegar a la entrada 9, después se avanza a la derecha hasta la columna cuyo encabezado es t.95; el resultado, 1.83, es el valor de t que se busca. b) El total del área sombreada sea 0.05, Si el total del área sombreada es 0.05, entonces, por simetría, el área sombreada de la derecha es 0.025. Por lo tanto, el área a la izquierda de a es (1 − 0.025) = 0.975 y a representa el percentil 97.5, t.975. En el tabla se encuentra que 2.26 es el valor de t buscado. c) el total del área que no está sombreada sea 0. Si el total del área no sombreada es 0.99, entonces el total del área sombreada es (1 − 0.99) = 0.01 y el área sombreada a la derecha de a es 0.01/2 = 0.005. En la tabla se encuentra que t.995 = 3.25. d) el área sombreada de la izquierda sea 0. Si el área sombreada a la izquierda es 0.01, entonces por simetría el área sombreada a la derecha es 0.01. En la tabla, t.99 = 2.82. Por lo tanto, el valor crítico de t para el cual el área sombreada a la izquierda es 0.01 es igual a −2.82. e) el área a la izquierda de a sea 0.90. Si el área sombreada a la izquierda de a es 0.90, a corresponder al percentil 90, t.90, el cual en la tabla se encuentra que es igual a 1. e) empleando Excel Hallar los incisos Usando EXCEL con la expresión =TINV(0,1;9) se obtiene 1.833113.

Distribuciones ji cuadrada correspondientes a: a) v = 2 b) v = 4 c) v = 6 d) v = 10 grados de libertad.

INTERVALOS DE CONFIANZA PARA DESVIACIÓN ESTÁNDAR σ

Como se hizo con la distribución normal y con la distribución t, pueden definirse límites de confianza de 95%, 99%, u otros límites empleando la tabla de distribución χ2 que se presenta. De esta manera puede estimarse la desviación estándar poblacional σ en términos de la desviación estándar muestral dentro de determinados límites de confianza. si χ^2025 y χ (^2) .0975 son los valores de χ^2 (llamados valores críticos), tales que 2.5% del área se encuentra repartida en ambas colas de la distribución, entonces el intervalo de confianza de 95% es de donde se ve que puede estimarse que σ se encuentra en el intervalo

con 95% de confianza. De manera similar se pueden encontrar otros intervalos de confianza. Los valores χ^2025 y χ (^2) .0975 representan, respectivamente, los percentiles 2.5 y 97.5. se encuentran valores percentiles correspondientes a diversos grados de libertad ν. Si se tienen valores grandes de ν (ν ≥ 30), se puede usar el hecho de que se aproxima mucho a una distribución normal con media 0 y desviación estándar 1; por lo tanto, las tablas para la distribución normal pueden emplearse cuando ν ≥ 30. Si χ^2 p y z p son los percentiles p de la distribución ji cuadrada y de la distribución normal, respectivamente, se tiene GRADOS DE LIBERTAD Para calcular un estadístico, por ejemplo (t student ) y (ji cuadrado), es necesario emplear observaciones obtenidas de una muestra y también ciertos parámetros poblacionales. Si estos parámetros no se conocen, es necesario estimarlos a partir de la muestra El número de grados de libertad de un estadístico, que por lo general se denota ν(ípsilon)ípsilon)) , se define como la cantidad N de observaciones en la muestra (es decir, el tamaño de la muestra) menos la cantidad k de parámetros poblacionales que tengan que estimarse a partir de las observaciones muestrales. En símbolos, ν = N − k. En el caso del estadístico (t student), la cantidad de observaciones independientes en la

muestra es N, y a partir de ellas se calcula ´ x y s. Sin embargo, como se necesita estimar μ , k =

1 y por lo tanto ν = N − 1. En el caso del estadístico Ji cuadrada), la cantidad de observaciones independientes en la muestra es N, a partir de las cuales se calcula s. Sin embargo, como se tiene que estimar σ, k = 1 y por lo tanto ν = N − 1.

necesita la distribución muestral de la diferencia entre varianzas (S^21 - S^22 ). Sin embargo, resulta que esta distribución es bastante complicada. Debido a ello, se considera el estadístico S^21 / S^22 , ya que un cociente grande o pequeño indica una gran diferencia, en tanto que un cociente cercano a 1 indica una diferencia pequeña. En este caso se puede encontrar una distribución muestral a la que se le conoce como distribución F en honor a R. A. Fischer. Más precisamente, supóngase que se tienen dos muestras, 1 y 2, de tamaños N1 y N2, respectivamente, obtenidas de dos poblaciones normales (o casi normales) cuyas varianzas son

σ ²₁ y σ ²₂. Sea el estadístico

Entonces a la distribución muestral de F se le llama distribución F de Fisher, o simplemente distribución F , con ν 1 = N 1 1 y ν 2 = N 2 1 grados de libertad. Esta distribución está dada por donde C es una constante que depende de ν1 y ν2, de manera que el área total bajo la curva sea 1 La línea continua representa la distribución F con 4 y 2 grados de libertad, y la línea punteada representa la distribución F con 5 y 10 grados de libertad. En las tablas se dan los valores percentiles de F para los cuales las áreas en la cola derecha son 0.05 y 0.01, respectivamente, que se denotan F.95 y F.99. Estos valores que representan los niveles de significancia del 5% y del 1% se usan para determinar si la varianza S^21 es significativamente mayor que la varianza S^2 2. En la práctica, como muestra 1 se considera la muestra que tenga la mayor varianza. El software para estadística permite encontrar las áreas bajo la distribución t de Student, la distribución ji cuadrada y la distribución F. Este software

también permite trazar las distintas distribuciones. Esto se ilustrará en la sección de problemas resueltos de este capítulo. FRECUENCIAS OBSERVADAS Y FRECUENCIAS TEÓRICAS Como se ha visto, los resultados obtenidos de las muestras no siempre coinciden exactamente con los resultados teóricos esperados según las reglas de la probabilidad. Por ejemplo, aunque de acuerdo con las consideraciones teóricas en 100 lanzamientos de una moneda se esperarían 50 caras y 50 cruces, es raro que se obtengan exactamente estos resultados. Supóngase que en una muestra determinada se observa la ocurrencia de un conjunto de eventos E 1 , E 2 , E 3 ,... , Ek, con las frecuencias O 1 , O 2 , O 3 ,... , Ok, llamadas frecuencias observadas y que, según las reglas de la probabilidad, se esperaría que estos eventos ocurrieran con frecuencias e 1 , e 2 , e 3 ,... , ek, llamadas frecuencias esperadas o teóricas. Se desea saber si las frecuencias observadas difieren, de manera significativa, de las frecuencias esperadas. Una medida de la discrepancia entre las frecuencias observadas y las frecuencias esperadas la proporciona el estadístico χ2 (léase ji cuadrada) dado por Si χ^2 = 0, las frecuencias observadas y las frecuencias teóricas coinciden exactamente; en tanto que si χ^2 > 0, la coincidencia no es exacta. Cuanto mayor sea el valor de χ 2 , mayor la discrepancia entre frecuencias observadas y frecuencias esperadas