




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
biostatisztika magyarul 1 szemeszter, 2 szemeszter, jó, megbízható
Tipo: Apuntes
1 / 103
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
szucs.monika@med.u-szeged.hu Boda Krisztina Eller József Griechisch Erika Lantos Tamás Rárosi Ferenc
A jegyzet nem helyettesíti az előadások és gyakorlatok látogatását, valamint az előadások anyagát.
TARTALOMJEGYZÉK
R függvények.............................................. 92 Képletek és táblázatok........................................ 94 Vizsgaminta.............................................. 96
iii
BEVEZETÉS AZ R, RSTUDIO HASZNÁLATÁBA
Bevezetés az R, RStudio használatába
1.1. R
Az R egy olyan programozási nyelv, amely alkalmas statisztikai számítások el- végzésére és ábrák készítésére. Ez egy ingyenes szoftver (“GNU”). Az R telepítése: http://www.r-project.org/
1.2. RStudio
Az RStudio az R nyelvhez tartozó grafikus felület (integrated development envi- ronment, IDE), amely megkönnyíti a programozási nyelv használatát. Az RStudio telepítése:http://www.rstudio.com/
Az RStudio képernyőjének felosztása RStudio kezdőfelülete négy panelből, eszközsorból és menüsorból áll.
editor window
console window
history and environment window
files, plot, packages and help window
editor window : az parancsok beírása, futtatása és mentése itt történik. A # után megjegyzése- ket tudunk írni. A parancsok futtatása a Run gomb megnyomásával, vagy a CTRL+ENTER billentyűzetkombinációval történik. console/ command window: itt jelennek meg az eredmények (itt is futtathatók a parancsok).
environment window: a munkaterület, itt látjuk az aktív adatállományokat és változókat. history window: itt vannak a korábban lefuttatott utasítások.
files window: az aktuális munkakönyvtárban levő fájlok és mappákat itt találjuk. plot window: az általunk készített ábrák találhatók.
VÁLTOZÓK JELLEMZÉSE
Változók jellemzése
(A minta eloszlása)
2.1. Adatbázis (adat mátrix)
Az adatbázis az egyedek egy csoportjának adatait tartalmazza.
2.2. Változók típusai
A változó típusa meghatározza a változóval végezhető műveleteket. A változóknak két nagy csoportját különböztetjük meg (a lehetséges kimenetelek száma alapján):
2
4
6
8
10
12
3
10
7
Gyakoris´
agok A
15% B
50%
C 35%
VÁLTOZÓK JELLEMZÉSE
t a b l e ( vá l t o z ónév )
prop. t a b l e ( t a b l e ( vá l t o z ónév ) )
b a r p l o t ( t a b l e ( vá l t o z ónév ) )
p i e ( t a b l e ( vá l t o z ónév ) )
x =
∑^ n i =
xi n
∑^ n i =
( xi − x )^2 n − 1
sd =
var =
√√√√ n ∑ i =
( xi − x )^2 n − 1
VÁLTOZÓK JELLEMZÉSE
Extra R kódok
mean ( vá l t o z ónév )
median ( vá l t o z ónév )
min ( vá l t o z ónév )
max ( vá l t o z ónév )
d i f f ( range ( vá l t o z ónév ) )
IQR ( vá l t o z ónév )
q u a n t i l e ( vá l t o z ónév , c ( 0. 2 5 , 0. 7 5 ) )
temp= t a b l e ( as. v e c t o r ( vá l t o z ónév ) ) ; names ( temp ) [ temp == max ( temp ) ]
e r r o r. bar= f u n c t i o n ( x , y , upper , lower=upper , l e n g t h = 0. 1 ,... ) { i f ( l e n g t h ( x )! = l e n g t h ( y ) | l e n g t h ( y )! =l e n g t h ( lower ) | l e n g t h ( lower )! = l e n g t h ( upper ) ) s t op ( " v e c t o r s must be same l e n g t h " ) arrows ( x , y+upper , x , y−lower , angle =90 , code =3 , l e n g t h=length ,... ) } barx <− b a r p l o t ( mean ( vá l t o z ónév ) , ylim=c ( 0 , 2 0 0 ) , xlim=c ( 0 , 5 ) ) e r r o r. bar ( barx , mean ( vá l t o z ónév ) , 1.96 * sd ( vá l t o z ónév ) )
VÁLTOZÓK JELLEMZÉSE
2.3. Feladatmegoldások
A 0 0 B AB B AB AB 0 0 A A B B AB AB 0 0 B B
Megoldás A vércsoport, diszkrét változó. Gyakorisági és relatív gyakorisági táblázat:
0 A B AB TOTAL gyakoriság 6 3 6 5 20 relatív gyakoriság
0 A B AB
Gyakoriság
0
1
2
3
4
5
6
7
Megoldás (RStudio) A vércsoport egy diszkrét változó.
#####################################################################
A vá l t o z ó l é t r e h o z á sa
bloodgroup=c ( "A" , " 0 " , " 0 " , "B" , "AB" , "B" , "AB" , "AB" , " 0 " , " 0 " , "A" , "A" , " B" , " B" , "AB" , "AB" , " 0 " , " 0 " , "B" , "B" ) #####################################################################
g y a k o r i s á g i t á b l á z a t
t= t a b l e ( bloodgroup ) ; t bloodgroup 0 A AB B 6 3 5 6
r e l a t í v g y a k o r i s á g i t á b l á z a t
pt=prop. t a b l e ( t ) ; pt bloodgroup 0 A AB B
( a b s z o l ú t ) g y a k o r i s á g i oszlopdiagram
b a r p l o t ( t )
( a b s z o l ú t ) g y a k o r i s á g i kö rdiagram
p i e ( t )
VÁLTOZÓK JELLEMZÉSE
17 17 18 21 21 23 23 29 34 42 43 45 45 45 45 46
xi 34 42 43 45 45 45 45 46 ( xi − x )^2 3.52 97.52 118.27 165.77 165.77 165.77 165.77 192.
var = 215515_._ 75 = 143_._ 7167
részintervallumok gyakoriság [15; 20) 3 [20; 25) 4 [25; 30) 1 [30; 35) 1 [35; 40) 0 [40; 45) 2 [45; 50) 5
Életkor
Gyakoriság
15 20 25 30 35 40 45 50
0
1
2
3
4
5
6
VÁLTOZÓK JELLEMZÉSE
15
20
25
30
35
40
45
50
0
10
20
30
40
50
Megoldás (RStudio) Az életkor egy folytonos változó.
#####################################################################
Vá l t o z ó l é t r e h o z á sa
KOR=c ( 2 1 , 23 , 3 4 , 4 5 , 2 3 , 4 6 , 2 9 , 2 1 , 4 3 , 4 2 , 4 5 , 4 5 , 4 5 , 1 7 , 1 8 , 1 7 ) ##################################################################### summary (KOR) Min. 1 s t Qu. Median Mean 3rd Qu. Max. 17.00 21.00 31.50 32.12 45.00 46. var (KOR) [ 1 ] 143. sd (KOR) [ 1 ] 11. h i s t (KOR) boxplot (KOR)
Megoldás (RStudio) A kor változó folytonos.
−−−−−−−−−− ADATBÁZIS BEOLVASÁSA −−−−−−−−−−−−−−−−−−−−−
Munkakonyvtar b e a l l i t a s a
setwd ( " S : /R" )
a d a t b a z i s b e o l v a s a s a
data=read. csv ( " k i s k e r d. csv " ) a t t a c h ( data )
−−−−−−−−−− A VÁLTOZÓ JELLEMZÉSE −−−−−−−−−−−−−−−−−−−−−
summary ( kor ) Min. 1 s t Qu. Median Mean 3rd Qu. Max. 5.00 17.00 22.00 25.00 28.25 60. var ( kor )
sd ( kor )
VÁLTOZÓK JELLEMZÉSE
ID Nem Kor Iskolázottság Tömeg Magasság Szemszín Sport Zene 1 1 20 3 65 185 3 1 1 2 2 17 3 60 170 4 1 2 3 1 22 3 62 177 2 2 1 4 2 28 4 62 176 4 2 1 5 1 9 1 32 148 4 2 2 6 1 5 1 19 125 3 2 2 7 2 26 3 70 166 4 2 2 8 1 60 4 75 180 1 1 1 9 2 35 3 49 155 4 2 1 10 2 51 4 61 162 4 2 1 11 1 17 2 61 178 4 2 1 12 2 50 2 65 164 4 2 2 13 1 9 1 30 130 2 1 2 14 2 10 1 40 135 1 2 1 15 1 19 3 86 187 3 1 1 16 1 22 3 67 179 4 2 2 17 1 25 3 103 186 4 1 1 18 1 29 4 74 176 1 1 1 19 2 27 4 67 164 4 1 1 20 1 19 3 70 180 4 1 1
a) Nem b) Kor
c) Iskolázottság d) Tömeg
e) Magasság f) Szemszín
g) Sport h) Zene
35.1 36.1 35.2 36.2 36.5 36.5 37 36.2 36.8 36.7 36.
44 49 50 51 53 57 58 62 66 66 68 71 75 77 80 85
20 25 25 27 28 31 33 34 36 37 44 50 59 85 86 a) A hisztogram alapján mit tud mondani az átlag és a medián viszonyáról (melyik a kisebb)?
Operációk száma
Gyakoriságok
20 30 40 50 60 70 80 90
0
1
2
3
4
5
VÁLTOZÓK JELLEMZÉSE
b) Adja meg, az előző minta alapján, az elvégzett műtétek átlagát, szórását, minimumát, ma- ximumát, mediánját, kvartiliseit. Rajzoljon box-diagramot! c) Rajzolja fel az átlag-szórás diagramot!
5 7 10 14 18 19 25 29 31 33
a) Mit tud mondani az átlag és medián viszonyáról a hisztogram alapján?
Operációk száma
Gyakoriságok
5 10 15 20 25 30 35
0.^ 1.^
b) Adja meg az előző minta átlagát, szórását, mediánját, kvartiliseit, minimumát, maximu- mát! Rajzolja fel a box-digramot! c) Rajzolja fel az átlag-szórás diagramot!
ll
férfi no
20
40
60
80
férfi no
0
10
20
30
40
50
60
70
a) nem b) kor
c) végzettség d) tömeg
e) magasság f) szem
g) sport h) zene
VALÓSZÍNŰSÉG, FELTÉTELES VALÓSZÍNŰSÉG, DIAGNOSZTIKUS TESZTEK
Valószínűség, feltételes valószínűség,
diagnosztikus tesztek
3.1. Valószínűség
Véletlen kísérlet: A kimenetele nincs egyértelműen meghatározva az általunk meghatározott feltételekkel. (p.l..: feldobunk egy pénzérmét, feldobunk egy dobókockát, megmérjük egy oldat koncentrációját, megmérjük egy állat testtömegét) Elemi esemény: a kísérlet egy lehetséges kimenetele.
Összetett esemény: elemi eseményekre bontható esemény.
Kiegészítő esemény: egy A esemény kiegészítő eseménye az az esemény, amely akkor követke- zik be, amikor A nem következik be. Összeg/ Unió az A és B események összege (uniója) az az A + B (vagy A ∪ B ) esemény, amely akkor következik be, ha vagy A , vagy B bekövetkezik.
Szorzat/ Metszet az A és B események szorzata (metszete) az az A · B (vagy A ∩ B ) esemény, amely akkor következik be, ha A és B is bekövetkezik. Ha A · B = ∅, akkor azt mondjuk, hogy A és B egymást kizáró események.
A valószínűség heurisztikus elve:Ismételjünk meg egy kísérletet n -szer ugyanazon feltételek mellett, egymástól függetlenül, és figyeljük meg hányszor következik be az A esemény, legyen ez a szám k (0 ≤ k ≤ n ). Ha n nagy, a kn egy adott számot fog közelíteni. Ezt a számot az A esemény valószínűségének nevezzük és P ( A )-val jelöljük.
A valószínűség tulajdonságai:
Az A esemény valószínűségének számítása, ha minden elemi esemény egyformán valószínű
P ( A ) = (^) összes lehetséges kimenetel számakedvező^ kimenetelek száma
Fontos: Az előző képlet csak akkor használható, ha minden elemi esemény egyformán valószínű. Annak a valószínűsége, hogy holnap beugrik a szobánkba egy rózsaszín elefánt NEM^12.
VALÓSZÍNŰSÉG, FELTÉTELES VALÓSZÍNŰSÉG, DIAGNOSZTIKUS TESZTEK
3.2. Feltételes valószínűség
Feltételes valószínűség Az A eseménynek a B eseményre vonatkozó feltételes valószínűsége megadja az A esemény bekövetkezésének a valószínűségét, ha tudjuk hogy a B esemény már bekövetkezett vagy bekövetkezik. Jelölése: P ( A | B ) Formula: P ( A | B ) az A ∩ B esemény bekövetkezéseinek száma osztva a B esemény bekövetkezé- seinek számával: P ( A | B ) = | A^ |∩ B |^ B | , vagyis
P ( A | B ) = P^ ( PA (^ ∩ B )^ B )
A és B független, ha P ( A ∩ B ) = P ( A ) · P ( B )
3.3. Diagnosztikus tesztek
A diagnosztikus teszteket egy betegség jelenlétének vagy hiányának detektálására használjuk. Gold standard teszt a jelenleg legjobbnak tartott teszt. Gyakran invazív, vagy drága. Az új teszt például, egy szűrővizsgalat vagy egy kevésbé drága teszt. 2 × 2 táblázattal hasonlítjuk össze az új teszt és a gold standard teszt eredményeit.
GOLD STANDARD (^) TOTAL BETEG (pozitív) EGÉSZSÉGES (negatív)
(^) POZITÍV valós pozitívak (a) ál pozitívak (b) a+b NEGATÍVAK ál negatívak (c) valós negatívak (d) c+d TOTAL a+c b+d a+b+c+d
Validitás: a helyesen diagnosztizált egyedek aránya validitás = P (helyes diagnózis) = valódi pozitívak száma + valódi negatívak száma összes vizsgált egyed száma =^
a + d a + b + c + d Szenzitivitás/érzékenység: a valódi pozitív betegek számának aránya a teljes betegszámhoz vi- szonyítva, vagyis annak a valószínűsége, hogy a vizsgált egyed teszteredménye pozitív, feltéve, hogy beteg. sensitivity = P (az új teszt eredménye pozitívj | beteg) = valódi pozitívak száma összes beteg egyed száma =^
a a + c Specificitás: a valódi negatívak számának aránya a kontrollcsoport teljes létszámához viszo- nyítva, vagyis annak a valószínűsége, hogy a vizsgált egyed teszteredmény negatív, feltéve, hogy egészséges. specificitás = P (az új teszt eredménye negatív | egészséges)) = a valódi negatívak száma összes egészséges egyed száma =^
d b + d