Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Tarea 6 Bioestadistica Agraria, Ejercicios de Bioestadística

Desarrollo aplicación de los conceptos Bioestadísticos en la tarea 6

Tipo: Ejercicios

2021/2022

Subido el 27/09/2022

Jose_Campo
Jose_Campo 🇨🇴

4.9

(19)

11 documentos

1 / 19

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tarea # 6
Aplicación de conceptos de análisis de varianza en un proyecto agropecuario.
BIOESTADISTICA.
Grupo
Presentado por:
Presentado a:
ASTRID TATIANA ROMERO.
Tutora BIOESTADISTICA.
Universidad Nacional Abierta y a Distancia – UNAD
Ingeniería Agroforestal ECAPMA
BIOESTADISTICA. 302277045_1141
Mayo de 2022
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Vista previa parcial del texto

¡Descarga Tarea 6 Bioestadistica Agraria y más Ejercicios en PDF de Bioestadística solo en Docsity!

Tarea # 6 Aplicación de conceptos de análisis de varianza en un proyecto agropecuario. BIOESTADISTICA. Grupo Presentado por: Presentado a: ASTRID TATIANA ROMERO. Tutora BIOESTADISTICA. Universidad Nacional Abierta y a Distancia – UNAD Ingeniería Agroforestal ECAPMA BIOESTADISTICA. 302277045_ Mayo de 2022

INTRODUCCION

La bioestadística es parte fundamental de la formación de cualquier tipo de investigador, en cualquiera de las ramas del conocimiento. Conocer y aplicar los conceptos vistos en este curso, nos da herramientas para la formulación de futuras investigaciones que permita resolver problemas coyunturales en los procesos productivos agroforestales en el futuro. Es importante aprender a identificar el problema, que se responderá mediante un proceso investigativo, como vimos a lo largo del curso, la estadística nos permite hacer predicciones de comportamientos poblacionales a través del análisis de la información, que sirven como herramienta en la toma de decisiones acertadas en campo, por esta razón, la probabilidad es uno de los pilares de varias ciencias humanas, como la biología, economía entre otras. La aplicación de tratamientos estadísticos ANOVA y las pruebas post-hoc nos permiten evaluar, corregir y afinar una investigación. Con el fin de desarrollar de la manera correcta los pasos para llegar a una conclusión verificable a través de la replica de los experimentos en las mismas condiciones. Por esta razón se desarrollarán de manera practica enunciados o problemas que nos permiten adsorber de manera más fácil estos conceptos, como la generación y posterior prueba de hipótesis estadística, mediante la utilización de los diferentes modelos estadísticos y pruebas de comprobación.

Desarrollo de la tarea 6.

1. Definan de manera individual * e integren grupalmente las siguientes definiciones básicas del curso (Se sugiere utilizar el material bibliográfico de apoyo listado al final de esta guía de actividades). *El avance en el desarrollo de estas respuestas deberá ser el resultado de la participación de cada uno de los integrantes del grupo y será la información que deben compartir en el foro de la actividad.

  • Vector de datos. Un vector de datos es una colección ordenada o secuencia de datos del mismo tipo, siendo

básicamente la representación de los valores de una variable en una muestra de n

elementos, que presentan algún tipo de tendencia lineal. (Peña D. 2002)

  • Matriz de datos. Esta es una herramienta que utilizamos en la gestión de la información obtenida del proceso experimental y no es más que la forma en que se ordenan los datos, básicamente en un esquema de columnas y filas, con el fin de someter dicha información a diferentes análisis estadísticos. En pocas palabras hablamos de la tabulación de la información. (Baranger D.
  • Variable cuantitativa continua. Las variables cuantitativas continuas son aquellas que pueden asumir o tomar valores infinitos o incontables es decir aquellas que toma valores en el marco de intervalo conocido, ósea valores decimales o fraccionarios, ejemplo la velocidad de un móvil, el peso de una persona y el volumen de agua de una piscina. (Johnson R., Kuby P. 2012).
  • Variable cuantitativa discreta. las discretas son aquellas variables que toman valores enteros, ósea no pueden tomar valores decimales o fraccionarios, por ejemplo, el número de personas que asisten a un concierto, Numero de árboles por hectárea, Numero de estudiantes de un colegio. (Johnson R., Kuby P. 2012).
  • Variable cualitativa nominal. Las variables cualitativas nominales son un tipo de variable cualitativa categórica. Son aquellas que no pueden ordenarse de manera jerárquica especifica, por lo tanto, matemática o aritméticamente son poco específicas o carecen de sentido, ejemplo los colores, nacionalidad y culto. (Johnson R., Kuby P. 2012).
  • Variable cualitativa categórica. Las variables cualitativas categóricas, también llamadas de atributos, son aquellas que expresan o describen características de un objeto o persona sin el uso de cifras o números, vinculadas a estos y se clasifican en nominal y ordinal, por ejemplo, Masculino, femenino y escolaridad. (Johnson R., Kuby P. 2012).
  • ¿Qué es una tabla de frecuencias?, ¿Cómo es la tabla de frecuencias de una variable continua, de una discreta y de una cualitativa?, ¿cuál tiene intervalos? “Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada característica en que se han dividido los datos”. (Mendoza H., Bautista G. 2002). Ósea que es la tabla donde se consignan las frecuencias de manera ordenada para cada uno de los datos, de acuerdo a la información que se obtiene en la etapa experimental. Las tablas de frecuencias de una variable continua y de una discreta son básicamente iguales, parten desde la construcción de los intervalos o agrupaciones que tienen una amplitud y que permiten analizar conjuntos de datos de manera mas fácil. Permitiendo tabular la frecuencia absoluta, frecuencias absolutas acumuladas, las frecuencias relativas y las frecuencias relativas acumuladas en cada intervalo. Mientras que en el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad. (Di Rienzo J. et al 2005)
  • Defina Histograma, en que variables se usa. Estos gráficos se caracterizan por estar compuestos de barras horizontales en forma vertical que se utiliza para representar información estadística de la distribución de frecuencias de conjunto de datos continuos permitiendo comparar valores no discretos. Como ventajas podemos citar, que permiten ver una gran cantidad de datos ofreciendo ver de manera clara y sencilla su distribución. Otra de las ventajas es que con ellos podemos observar las tendencias, y frecuencias relativas de un conjunto de datos. (Rodríguez A., Crespo R. 2006).
  • Defina Gráfico de barras, en que variables se usa. También llamado grafico de columnas y aunque bastante parecido al anterior ya que, también está compuesto por barras horizontales en forma vertical, se utilizan para comparar la frecuencia, el recuento total, la suma o la media de los datos en diferentes categorías mediante barras horizontales o verticales. Permitiendo comparar múltiples tipos de datos un ejemplo la cosechas en un tiempo vs la cantidad de lluvia en el mismo intervalo de tiempo. (Rodríguez A., Crespo R. 2006).
  • Defina Media muestral. Mostrar la fórmula de cálculo. Es una de las medidas de tendencia central utilizadas en bioestadística, también llamada promedio, puede decirse que es el valor medio en torno a un conjunto de datos, esta se calcula

al sumar el número de valores obtenidos para los n muestreados, entre el numero total de

individuos muestreados de la muestra. (Di Rienzo J. et al 2005). Su fórmula es: x =∑ i = 1

n x

i

n

  • Defina Varianza muestral. Registrar fórmulas de cálculo. La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media, En si es una forma de medir la dispersión y se caracteriza por representar

Un evento aleatorio es un fenómeno que en la realización experimental su observación puede o no ocurrir, aun repitiendo en las mismas condiciones el experimento, el resultado variará de una repetición dentro de un conjunto de posibles resultados. (Montes F. 2007)

  • En el caso de distribuciones de variables aleatorias, cuando una variable es continua y simétrica ¿Qué modelo se usa? Una variable es continua es aquella que puede tomar un valor fijo dentro de un intervalo determinado, entre dos valores observables va a existir un tercer valor, Para una variable continua y de distribución simétrica se usa el modelo Normal. (Balzarini, M. et al. 2011).
  • Para una variable de conteo no acotado ¿Qué modelo se utiliza? Para analizar variables de conteo se usa el modelo de regresión Poisson. (Balzarini, M. et al. 2011).
  • Para variables de proporciones ¿Cuál modelo se utiliza? Se usa en el modelo probabilístico Binomial. (Balzarini, M. et al. 2011)
  • ¿Cuáles variables tienen función de probabilidad y cuáles otras tienen función de densidad? La función de probabilidad la tienen las variables aleatorias discretas y la función de densidad la tienen las variables aleatorias continuas. (Balzarini, M. et al. 2011)
  • ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar funciones de distribución de variables aleatorias? El valor esperado (Esperanza matemática) y la varianza (Balzarini, M. et al. 2011)
  • ¿Qué es la esperanza matemática de una variable aleatoria?, ¿cómo se denota? Modelos probabilísticos La esperanza matemática o valor esperado, es el resultado de la suma de cada probabilidad multiplicada por su punto muestral, constituye el valor medio que se desea obtener y se denota

con la letra E. o la letra griega Mu ( μ ). (Balzarini, M. et al. 2011)

DISTRIBUCION NORMAL

  • ¿Qué tipo de histograma se selecciona para un modelo probabilístico de una variable aleatoria continua cuando se tienen datos de esa variable? Ilustre su respuesta con un ejemplo (Figura). Se usan los histogramas de frecuencias relativas. (Balzarini, M. et al. 2011). Grafica de ejemplo (Di Rienzo J. et al 2005).
  • ¿Que es la estandarización?, ¿cuál es su fórmula? Es un procedimiento mediante el cual nos permite transforma una distribución normal a una distribución normal estándar y su fórmula es:

Z =

Y − μ

σ

2 ó^ Z =^

Y − μ

Donde Y es el valor de la variable aleatoria, μ y σ^2 son la media y la varianza de la distribución

de Y. (Balzarini, M. et al. 2011).

DISTRIBUCIÓN BINOMIAL

  • ¿Qué tipo de conteos se trabajan con la distribución Binomial? Conteos acotados. (Balzarini, M. et al. 2011)
  • ¿A que es igual la esperanza y la varianza en esta distribución? En esta distribución la esperanza siempre será el valor medio, ya que, solo hay una probabilidad de 0,5. Mientras que la varianza es de un cuarto de esa probabilidad. (Balzarini, M. et al. 2011) DISTRIBUCION DE POISSON
  • ¿Que tipos de conteos se trabaja con la distribución de Poisson? En conteos no acotados, donde todos los eventos ocurren dentro un tiempo o espacio

determinado y los valores resultantes van de 0 a ∞ , o sin límite superior. (Balzarini, M. et al.

  • ¿Como se denota el único parámetro de esta distribución?

Se denota mediante la letra griega Lambda λ y la media es igual a la varianza ósea al

aumentar el promedio de conteos aumenta la varianza. (Balzarini, M. et al. 2011)

categóricas y variables de respuesta (cuantitativas) estudiadas_._ (Diaz M., Pineda W., Poveda K. 2015). Para cada uno de los experimentos se utilizó un modelo y tratamiento estadístico distinto. Para el primero se usó ANOVA de un solo factor y dos pruebas post-hoc, la prueba de Shapiro-Wilk y la prueba de Prueba de Kruskal-Wallis, en el segundo experimento se utilizó el análisis de multivariado de la varianza (MANOVA) y su prueba post-hoc la prueba de Mardia, el análisis no paramétrico denominado ANOVA por permutaciones (PerMANOVA) y su prueba post-hoc la

prueba t. En el tercer experimento se utilizó el Modelo de regresión Poisson, el Modelo de

ceros inflados y el análisis ANOVA robusto con las pruebas post-hoc prueba de Vuong y la prueba de Shapiro-Wilk. (Diaz M., Pineda W., Poveda K. 2015). Datos, Análisis y Conclusiones. Como podemos ver los datos resultantes de cada uno de los experimentos fueron tabulados en matrices de datos, registrados y posteriormente procesados en el programa estadístico R. con cada uno de los tratamientos estadísticos antes expuestos. Como conclusiones importantes pueden citarse que las variedades las variedades “Criolla Guaneña”, “Criolla Paisa” y “Parda Pastusa” son la preferidas por la polilla en la evaluación del primer experimento (Diaz M., Pineda W., Poveda K. 2015). Mientras que en el experimento de Tolerancia las variedades “Esmeralda”, “Punto Azul” y “Roja Nariño” mejores resultados frente a la presencia de huevos de la polilla (Diaz M., Pineda W., Poveda K. 2015), en cuanto al experimento de Resistencia y confirmando el estudio de Posada 2010, las variedades “Pastusa Suprema”, “Yungay”, “Criolla Paisa”, “Criolla Guaneña” y “Nevada” tras los análisis hechos sobre el número de tubérculos sanos “se aprecia un efecto de sobrecompensación expresado en un incremento en el número de tubérculos sanos en plantas donde se indujo la herbivoría en comparación con plantas control” (Diaz M., Pineda W., Poveda K. 2015). A través del modelo para conteos inflados con ceros y la regresión de Poisson, para el experimento de resistencia “se evidencia un efecto de las variedades “Esmeralda”, “Única” y “Diacol Capiro”, donde el número de individuos que se desarrollaron fue significativamente menor” (Diaz M., Pineda W., Poveda K. 2015), pero no es estadísticamente concluyente debido a que el análisis de las variables no arrojo diferencias significativas, y los asocia más con las características resilientes de cada variedad de papa. Por último, no se evidencia efectos en el desarrollo de larvas tras la inducción de la especie Spodoptera frugiperda (Diaz M., Pineda W., Poveda K. 2015).

3. Ejercicios - Diseño de muestreo y contraste de hipótesis a. Considerar la variable rendimiento de arroz, cuya distribución es normal con media μ y desviación estándar σ. Para estimar el rendimiento promedio del arroz bajo el efecto de un herbicida, se toma una muestra de tamaño 40 y se obtiene un promedio de 60 qq/ha. Se sabe por experiencias anteriores que la varianza poblacional σ^2 es 25 (qq/ha)^2. Datos del ejercicio.

Tamaño de la muestra de 40 ( n = 40 ¿

Promedio 60 qq/ha. ( X = 60 ¿

Varianza poblacional 25 qq/ha. ( σ^2 = 25 ¿

Para resolver este ejercicio utilizar el método de pivote (Pintarelli M. 2010)

  • Construyan los intervalos de confianza del 95% y 99% para μ. Entonces el intervalo de confianza esta dado por la formula [

X − z α

2 (

n )

, X + z α

2 (

n )]

Se reemplazan valores sobre la formula teniendo en cuenta que en la formula sigma ( σ ) no

está al cuadrado, por lo tanto, al reemplazarse deberá expresarse como la (^) √ σ^2 , además el

valor de α debe dividirse entre dos y buscar el valor de z en la tabla de probabilidad z con el

alfa correspondiente.

=0,025 ⟹ z 0,025=1,

Reemplazamos sobre la formula. [

( √^25 √^40 )

( √^25 √^40 )]

b. Se acepta que después de 3 años de almacenamiento el vigor de un arbusto de agrás, medido como peso seco alcanzado a los 20 días de la germinación, es de 45 mg promedio. Un nuevo método de almacenamiento se propone para aumentar el vigor. Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace germinar, obteniéndose los siguientes resultados de peso seco promedio a los 20 días: 49 43 56 57 59 65 52 51 50 55 60 65 53 57 67 56 53 37 45 42 Ayuda: si tuviera que calcular la potencia con la que se realizó la prueba, acepte la varianza muestral calculada como si se tratara de la varianza poblacional y tome a la media muestral como estimador de la verdadera media poblacional. Me apoyare en el video de Oviedo. G (2017) y en Balzarini, M. (2013). Datos del ejercicio.

Podemos ver que, en este ejercicio, el número muestras o n < 30 , por lo tanto, calcularemos el

valor para una distribución t calculada ( tc ).

Con los grados de libertad gl = n − 1 ⟹ gl = 20 − 1 ⟹ gl = 19 y el valor de significancia

α =0.01, hallaremos el valor de t tabulada ( tα ).

Usaremos la media muestral y la desviación estándar muestral ( s ), calculada a partir de las

muestras, ya que, se desconoce el valor de la varianza ( σ ).

n = 20

X =53,

s =7,

gl = 19

tα =2,

  • Plantear las hipótesis nula y alternativa asociadas al problema. Teniendo en cuenta que la media muestral es mayor a la media poblacional nuestra hipótesis estadística está dada así.

Hipótesis nula: H 0 :^ μ =^45 ósea que no habrá diferencia entre la media del nuevo estudio de

vigor y el anterior.

Hipótesis Alternativa: H 0 :^ μ >^45 ósea que si habrá diferencia entre la media del nuevo estudio

de vigor y el anterior.

  • Realizar una prueba de hipótesis con un nivel de significancia α =0.01.

Como en este ejercicio nuestro n < 30 y no conocemos a σ entonces nuestro estadístico de

prueba será

tc =

X − μ

s

n

⟹tc =

√^20

⟹ tc =

⟹ tc =4,

La hipótesis nula H 0 :^ μc = μd 1 = μd 2 = μd 3 = μd 4 , ósea que no habrá diferencia entre las medias

muestrales después de la aplicación del medicamento en el numero de parásitos por muestra.

La hipótesis nula H 0 :^ μc ≠^ ¿) ósea que alguna de las medias no es igual a la media de control

después de la aplicación del medicamento en el número de parásitos por muestra. Datos del ejercicio.

En la siguiente tabla se consignan los valores del número de muestras ( n ), la media muestral y

la desviación estándar para cada uno de los tratamientos. Control 25 mg 50 mg 100 mg 150 mg

n 12 12 12 12 12

X 56,9166667 92,5 47,0833333 22,4166667 21,

s 16,7193863 161,08524 15,4476143 7,78644899 8,

Ahora realizare el análisis con la utilización de ANOVA de un factor y posteriormente realizare una prueba post-hoc en este caso el test de Fisher.

Análisis de varianza de un factor ANOVA con un α =0,05(Excel).

RESUMEN

Grupos Cuenta Suma Promedio Varianza Control 12 683 56,9166667 279, 25mg 12 1110 92,5 25948, 50mg 12 565 47,0833333 238, 100mg 12 269 22,4166667 60, 125mg 12 261 21,75 76, ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilida d Valor crítico para F Entre grupos 40848, 3

Dentro de los grupos

Total 333488,93 59

De acuerdo con el análisis ANOVA podemos ver que el valor de probabilidad del análisis es

mayor al alfa que se utilizó, a =1,92> α =0,05, en consecuencia, el F calculado es menor al

valor de F crítico, Fc =1,919<^ Fα =2,539. Por lo tanto, aceptamos que nuestra hipótesis nula es

correcta hasta este punto. Sin embargo, ahora procedemos a realizar el test de Fisher para validar nuestra conclusión. (con software MiniTab). Al realizar el test de Fisher se comprueba que si hay diferencias de varianza por lo tanto la decisión correcta es rechazar a la hipótesis nula, ya que, hay evidencia estadística suficiente para decir que en al menos una de las dosificaciones hay respuesta positiva en la reducción de paracitos presentes en las abejas. En conclusión, podemos ver que no hay mucha variación entre el control y una dosis de 50 mg, sin embargo, pasa algo especial con la dosis de 25 mg, presenta un valor muy superior en la presencia de paracitos en relación a control y a la dosis de 50 mg. Esto puede sugerir que hay un error en las observaciones experimentales, ya que, es un dato que se aleja mucho de la media muestral. Ahora cuando se observan a los efectos de la dosis de 100 mg y 125 mg entre ellas no hay una diferencia estadísticamente significativa, pero nos permite concluir que el tratamiento si presenta valores de reducción de los paracitos para las dosis de 100 y 125 mg confirmando nuestra hipótesis alternativa. Apoyado en video de Cuellar L. (2019). CONCLUSIÓN Aprender a realizar una investigación no es algo fácil, se necesita realizar de manera rigurosa y profesional, todos los pasos correctos para la que nuestra conclusión o nuevo conocimiento sea científicamente aceptado. Pero gracias a la bioestadística, los futuros investigadores, tenemos un stock de herramientas que nos permiten, analizar nuestros datos en la validación de bien sea la producción de nuevos conocimientos o medir la efectividad, de cualquier pauta de manejo que apliquemos en campo. Los conocimientos aprendidos en este curso de invaluables para mí, ya que, era muy superficial el estudio que yo tenía de la estadística. La

Mendoza H., Bautista G. (2002). Probabilidad y Estadística. Universidad Nacional de Colombia. Recuperado de: http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Di Rienzo J., Casanoves F., Gonzalez L., Tablada E., Díaz M., Robledo C., Balzarini M. (2005) Estadística para las Ciencias Agropecuarias. 6a ed. Recuperado de: https://aulavirtual.agro.unlp.edu.ar/pluginfile.php/2968/mod_resource/content/0/ Estadistica_para_las_Ciencias_Agropecuarias_-_Di_Rienzo.pdf Rodríguez A., Crespo R. (2006). Web revistaseden.org. Estadística descriptiva. Representación de datos descriptivos. Recuperado de: https://www.revistaseden.org/files/6-CAP%206.pdf Pérez R. (2010). Nociones básicas de estadística. Pag 27 – 30 recuperado de: https://books.google.com.co/books? hl=es&lr=&id=0mHWT5Zs7pIC&oi=fnd&pg=PA7&dq=varianza+estad %C3%ADstica+definiciones&ots=0bu6Q7taxv&sig=eZUHwzkKKr_ybtTFejTkFninGSQ&redir_es c=y#v=onepage&q=varianza%20estad%C3%ADstica%20definiciones&f=false Matus J. (1995). Estadística descriptiva e inferencial I. Pag 44 – 46 Recuperado de: https://cs.unadmexico.mx/contenidos/DCSA/BLOQUE1/GT/01/QEBA/MA/U3/Fasciculo %202.%20Medidas%20de%20tendencia%20central.pdf Balzarini, M. (2011). Estadística y biometría: Ilustraciones del uso e infostat en problemas de agronomía. Recuperado de: https://drive.google.com/file/d/1b_gklh8Z0zLLgd2T3kL84Ivm98yLO8Ej/view?usp=sharing Portal ICA (2016). Web Corporativa ICA. Informe especial: Polilla Guatemalteca o Polilla de la Papa. Recuperado de: https://www.ica.gov.co/noticias/todas/2016/informe-especial-polilla- guatemalteca-o-polilla-de Montes F. (2007) Introducción a la Probabilidad. Recuperado de: https://www.uv.es/montes/probabilitat/manual.pdf Pintarelli M. (2010). Matemáticas 3. Intervalos de confianza. Pág. 154 a 159 recuperado de: https://www.mate.unlp.edu.ar/practicas/117_12_12092016211213.pdf Oviedo. G (2017). YouTube. Video. Estadística prueba de hipótesis - parte 4 muestras pequeñas. Recuperado de: https://www.youtube.com/watch?v=M2O- kWEfxYI&list=PL2GGpMHLRtp-wtsHPPB-nryKU2fORxfgY&index= Cuellar L. (2019) YouTube. Video. Prueba de Hipótesis con F (ANOVA) en Minitab. Recuperado de: https://www.youtube.com/watch?v=MTJcpXBVrvY