Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

biostatistica biofisica 1 semestre, Apuntes de Física

biostatisztika magyarul 1 szemeszter, 2 szemeszter, jó, megbízható

Tipo: Apuntes

2017/2018

Subido el 29/01/2018

peter-janosy
peter-janosy 🇪🇸

1 documento

1 / 103

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Biostatisztikai számítások I.
Kiegészítőjegyzet
biostatisztikai problémák megoldásához és R használatához
(szerkesztés alatt)
Utoljára módosítva: 2017. november 30. 13:30
Mónika Szűcs
szucs.monika@med.u-szeged.hu
Boda Krisztina
Eller József
Griechisch Erika
Lantos Tamás
Rárosi Ferenc
A jegyzet nem helyettesíti az előadások és gyakorlatok látogatását,
valamint az előadások anyagát.
Szegedi Tudományegyetem
Orvosi Fizikai és Orvosi Informatikai Intézet
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga biostatistica biofisica 1 semestre y más Apuntes en PDF de Física solo en Docsity!

Biostatisztikai számítások I.

Kiegészítő jegyzet

biostatisztikai problémák megoldásához és R használatához

(szerkesztés alatt)

Utoljára módosítva: 2017. november 30. 13:

Mónika Szűcs

szucs.monika@med.u-szeged.hu Boda Krisztina Eller József Griechisch Erika Lantos Tamás Rárosi Ferenc

A jegyzet nem helyettesíti az előadások és gyakorlatok látogatását, valamint az előadások anyagát.

Szegedi Tudományegyetem

Orvosi Fizikai és Orvosi Informatikai Intézet

TARTALOMJEGYZÉK

TARTALOMJEGYZÉK

R függvények.............................................. 92 Képletek és táblázatok........................................ 94 Vizsgaminta.............................................. 96

iii

BEVEZETÉS AZ R, RSTUDIO HASZNÁLATÁBA

Bevezetés az R, RStudio használatába

1.1. R

Az R egy olyan programozási nyelv, amely alkalmas statisztikai számítások el- végzésére és ábrák készítésére. Ez egy ingyenes szoftver (“GNU”). Az R telepítése: http://www.r-project.org/

1.2. RStudio

Az RStudio az R nyelvhez tartozó grafikus felület (integrated development envi- ronment, IDE), amely megkönnyíti a programozási nyelv használatát. Az RStudio telepítése:http://www.rstudio.com/

Az RStudio képernyőjének felosztása RStudio kezdőfelülete négy panelből, eszközsorból és menüsorból áll.

editor window

console window

history and environment window

files, plot, packages and help window

editor window : az parancsok beírása, futtatása és mentése itt történik. A # után megjegyzése- ket tudunk írni. A parancsok futtatása a Run gomb megnyomásával, vagy a CTRL+ENTER billentyűzetkombinációval történik. console/ command window: itt jelennek meg az eredmények (itt is futtathatók a parancsok).

environment window: a munkaterület, itt látjuk az aktív adatállományokat és változókat. history window: itt vannak a korábban lefuttatott utasítások.

files window: az aktuális munkakönyvtárban levő fájlok és mappákat itt találjuk. plot window: az általunk készített ábrák találhatók.

VÁLTOZÓK JELLEMZÉSE

Változók jellemzése

(A minta eloszlása)

2.1. Adatbázis (adat mátrix)

Az adatbázis az egyedek egy csoportjának adatait tartalmazza.

  • Az adatbázisban egy megfigyelési egység (egy személy) adatai egy sorba kell, hogy kerüljenek.
  • Egy kérdéshez tartozó válaszokat egy oszlopba kell rögzíteni.
  • Különböző kérdésekhez tartozó válaszokat külön oszlopokba rögzítjük.

2.2. Változók típusai

A változó típusa meghatározza a változóval végezhető műveleteket. A változóknak két nagy csoportját különböztetjük meg (a lehetséges kimenetelek száma alapján):

  • diszkrét (kategorikus)
  • folytonos

2.2.1. Diszkrét változó eloszlása

  • Azt mondjuk, hogy X diszkrét változó ha a lehetséges értékeinek száma véges ( p.l.: nem, vér- csoport, korcsoport... )
  • Egy diszkrét változó eloszlása megadja, a lehetséges értékeket és azok gyakoriságát.
  • Diszkrét változó eloszlásának jellemzése
    • számokkal
      • (abszolút) gyakorisági táblázat ( A gyakoriság megadja, hogy a változó hányszor veszi fel az adott értéket. )
      • relatív gyakorisági táblázat ( Az adott kimenetel gyakorisága osztva a teljes esetszámmal. )
    • ábrákkal
  • relatív gyakorisági/ gyak. oszlopdiagram
  • relatív gyakorisági/ gyakorisági kördiagram (^0) A B C

2

4

6

8

10

12

3

10

7

Gyakoris´

agok A

15% B

50%

C 35%

VÁLTOZÓK JELLEMZÉSE

g y a k o r i s á g i t á b l á z a t

t a b l e ( vá l t o z ónév )

r e l a t í v g y a k o r i s á g i t á b l á z a t

prop. t a b l e ( t a b l e ( vá l t o z ónév ) )

oszlopdiagram

b a r p l o t ( t a b l e ( vá l t o z ónév ) )

kö rdiagram

p i e ( t a b l e ( vá l t o z ónév ) )

2.2.2. Folytonos változó eloszlása

  • Azt mondjuk, hogy X folytonos változó , ha végtelen sok értéket vehet fel egy adott interval- lumból. ( p.l.: koncentráció, hőmérséklet, vérnyomás, életkor... )
  • Egy folytonos változó eloszlása megadja hogy melyek a lehetséges értékek, és ezek milyen gyakran esnek bizonyos intervallumokba.
  • Folytonos változók eloszlásának jellemzése
    • Az eloszlás középének mérőszámai
      • átlag

x =

∑^ n i =

xi n

  • medián ( az a szám, amelynél az adatok fele kisebb, amely tehát a rendezett adatsort közepe )
  • módusz ( a leggyakrabban előforduló érték(ek) )
  • Az eloszlás szóródásának mérőszámai
    • terjedelem ( A legnagyobb (maximum) és a legkisebb (minimum) érték közötti különbség. )
    • interkvartilis terjedelem ( Az alsó és a felső kvartilisek különbsége IQR = Q 3 − Q 1_. Ez az_ intervallum tartalmazza az adatok középső 50%-át. ) · alsó kvartilis (Q 1 ) az az érték, amelynél az adatok 25%-a kisebb · felső kvartilis (Q 3 ) az az érték, amelynél az adatok 75%-a kisebb.
  • variancia var =

∑^ n i =

( xix )^2 n − 1

  • szórás (standard deviáció) ( Megadja a minta szóródását a mintaátlag körül. )

sd =

var =

√√√√ ni =

( xix )^2 n − 1

VÁLTOZÓK JELLEMZÉSE

Extra R kódok

á t l a g

mean ( vá l t o z ónév )

medián

median ( vá l t o z ónév )

minimum

min ( vá l t o z ónév )

maximum

max ( vá l t o z ónév )

t e r j e d e l e m

d i f f ( range ( vá l t o z ónév ) )

i n t e r k v a r t i l i s t e r j e d e l e m

IQR ( vá l t o z ónév )

a l s ó é s f e l s ő k v a r t i l i s e k

q u a n t i l e ( vá l t o z ónév , c ( 0. 2 5 , 0. 7 5 ) )

módusz

temp= t a b l e ( as. v e c t o r ( vá l t o z ónév ) ) ; names ( temp ) [ temp == max ( temp ) ]

á t l a g −s z ó r á s á bra

e r r o r. bar= f u n c t i o n ( x , y , upper , lower=upper , l e n g t h = 0. 1 ,... ) { i f ( l e n g t h ( x )! = l e n g t h ( y ) | l e n g t h ( y )! =l e n g t h ( lower ) | l e n g t h ( lower )! = l e n g t h ( upper ) ) s t op ( " v e c t o r s must be same l e n g t h " ) arrows ( x , y+upper , x , y−lower , angle =90 , code =3 , l e n g t h=length ,... ) } barx <− b a r p l o t ( mean ( vá l t o z ónév ) , ylim=c ( 0 , 2 0 0 ) , xlim=c ( 0 , 5 ) ) e r r o r. bar ( barx , mean ( vá l t o z ónév ) , 1.96 * sd ( vá l t o z ónév ) )

2.2.3. Az adatok transzformálása

  • Összeadás, kivonás Az adatokhoz ugyanazt a számot hozzáadva (kivonva) az eloszlás közepét jellemző mérőszá- mok a hozzáadott (kivont számmal) növekednek (csökkennek). Az adatokhoz ugyanazt a számot hozzáadva (kivonva) az eloszlás szóródását jellemző mérőszá- mok nem változnak.
  • Szorzás, osztás Az adatokat ugyanazzal a számmal szorozva (osztva) a közép mérőszámai az adott számmal szorzódnak (osztódnak). Az adatokat ugyanazzal a számmal szorozva (osztva) a szóródás mérőszámai az adott szám abszolút értékével szorzódnak (osztódnak).

VÁLTOZÓK JELLEMZÉSE

2.3. Feladatmegoldások

  1. Jellemezze a vércsoport változó eloszlását a következő minta alapján!

A 0 0 B AB B AB AB 0 0 A A B B AB AB 0 0 B B

Megoldás A vércsoport, diszkrét változó. Gyakorisági és relatív gyakorisági táblázat:

0 A B AB TOTAL gyakoriság 6 3 6 5 20 relatív gyakoriság

0 A B AB

Gyakoriság

0

1

2

3

4

5

6

7

Megoldás (RStudio) A vércsoport egy diszkrét változó.

#####################################################################

A vá l t o z ó l é t r e h o z á sa

bloodgroup=c ( "A" , " 0 " , " 0 " , "B" , "AB" , "B" , "AB" , "AB" , " 0 " , " 0 " , "A" , "A" , " B" , " B" , "AB" , "AB" , " 0 " , " 0 " , "B" , "B" ) #####################################################################

g y a k o r i s á g i t á b l á z a t

t= t a b l e ( bloodgroup ) ; t bloodgroup 0 A AB B 6 3 5 6

r e l a t í v g y a k o r i s á g i t á b l á z a t

pt=prop. t a b l e ( t ) ; pt bloodgroup 0 A AB B

  1. 3 0.15 0.25 0. 3

( a b s z o l ú t ) g y a k o r i s á g i oszlopdiagram

b a r p l o t ( t )

( a b s z o l ú t ) g y a k o r i s á g i kö rdiagram

p i e ( t )

VÁLTOZÓK JELLEMZÉSE

  • módusz: a leggyakoribb elem: 45
  • Az eloszlás szóródásának jellemzői:
  • terjedelem: = 46 − 17 = 29
  • interkvartilis terjedelem:

17 17 18 21 21 23 23 29 34 42 43 45 45 45 45 46

Q 3 = 45 + 45 2 = 45
Q 1 = 21 + 21 2 = 21
IQR = Q 3 − Q 1 = 45 − 21 = 24
  • variancia: xi 17 17 18 21 21 23 23 29 ( xix )^2 228.77 228.77 199.52 123.77 123.77 83.27 83.27 9.

xi 34 42 43 45 45 45 45 46 ( xix )^2 3.52 97.52 118.27 165.77 165.77 165.77 165.77 192.

var = 215515_._ 75 = 143_._ 7167

  • szórás: sd = √var = 11_._ 98819
  • Ábrák

részintervallumok gyakoriság [15; 20) 3 [20; 25) 4 [25; 30) 1 [30; 35) 1 [35; 40) 0 [40; 45) 2 [45; 50) 5

Életkor

Gyakoriság

15 20 25 30 35 40 45 50

0

1

2

3

4

5

6

VÁLTOZÓK JELLEMZÉSE

15

20

25

30

35

40

45

50

0

10

20

30

40

50

  • Az eloszlás alakja A hisztogram és a box- diagram alapján az elosz- lás szimmetrikus.

Megoldás (RStudio) Az életkor egy folytonos változó.

#####################################################################

Vá l t o z ó l é t r e h o z á sa

KOR=c ( 2 1 , 23 , 3 4 , 4 5 , 2 3 , 4 6 , 2 9 , 2 1 , 4 3 , 4 2 , 4 5 , 4 5 , 4 5 , 1 7 , 1 8 , 1 7 ) ##################################################################### summary (KOR) Min. 1 s t Qu. Median Mean 3rd Qu. Max. 17.00 21.00 31.50 32.12 45.00 46. var (KOR) [ 1 ] 143. sd (KOR) [ 1 ] 11. h i s t (KOR) boxplot (KOR)

  1. Nyissa meg a kiskerd.csv! adatbázist. Jellemezze az kor változó eloszlását!

Megoldás (RStudio) A kor változó folytonos.

−−−−−−−−−− ADATBÁZIS BEOLVASÁSA −−−−−−−−−−−−−−−−−−−−−

Munkakonyvtar b e a l l i t a s a

setwd ( " S : /R" )

a d a t b a z i s b e o l v a s a s a

data=read. csv ( " k i s k e r d. csv " ) a t t a c h ( data )

−−−−−−−−−− A VÁLTOZÓ JELLEMZÉSE −−−−−−−−−−−−−−−−−−−−−

summary ( kor ) Min. 1 s t Qu. Median Mean 3rd Qu. Max. 5.00 17.00 22.00 25.00 28.25 60. var ( kor )

sd ( kor )

VÁLTOZÓK JELLEMZÉSE

ID Nem Kor Iskolázottság Tömeg Magasság Szemszín Sport Zene 1 1 20 3 65 185 3 1 1 2 2 17 3 60 170 4 1 2 3 1 22 3 62 177 2 2 1 4 2 28 4 62 176 4 2 1 5 1 9 1 32 148 4 2 2 6 1 5 1 19 125 3 2 2 7 2 26 3 70 166 4 2 2 8 1 60 4 75 180 1 1 1 9 2 35 3 49 155 4 2 1 10 2 51 4 61 162 4 2 1 11 1 17 2 61 178 4 2 1 12 2 50 2 65 164 4 2 2 13 1 9 1 30 130 2 1 2 14 2 10 1 40 135 1 2 1 15 1 19 3 86 187 3 1 1 16 1 22 3 67 179 4 2 2 17 1 25 3 103 186 4 1 1 18 1 29 4 74 176 1 1 1 19 2 27 4 67 164 4 1 1 20 1 19 3 70 180 4 1 1

a) Nem b) Kor

c) Iskolázottság d) Tömeg

e) Magasság f) Szemszín

g) Sport h) Zene

  1. Jellemezze a hőmérséklet eloszlását a következő minta alapján!

35.1 36.1 35.2 36.2 36.5 36.5 37 36.2 36.8 36.7 36.

  1. Jellemezze a folytonos változó eloszlását a következő minta alapján!

44 49 50 51 53 57 58 62 66 66 68 71 75 77 80 85

  1. 15 férfi orvos által elvégzett adott típusú műtétek száma a következő:

20 25 25 27 28 31 33 34 36 37 44 50 59 85 86 a) A hisztogram alapján mit tud mondani az átlag és a medián viszonyáról (melyik a kisebb)?

Operációk száma

Gyakoriságok

20 30 40 50 60 70 80 90

0

1

2

3

4

5

VÁLTOZÓK JELLEMZÉSE

b) Adja meg, az előző minta alapján, az elvégzett műtétek átlagát, szórását, minimumát, ma- ximumát, mediánját, kvartiliseit. Rajzoljon box-diagramot! c) Rajzolja fel az átlag-szórás diagramot!

  1. 10 női orvos által elvégzett, adott típusú műtétek száma:

5 7 10 14 18 19 25 29 31 33

a) Mit tud mondani az átlag és medián viszonyáról a hisztogram alapján?

Operációk száma

Gyakoriságok

5 10 15 20 25 30 35

0.^ 1.^

b) Adja meg az előző minta átlagát, szórását, mediánját, kvartiliseit, minimumát, maximu- mát! Rajzolja fel a box-digramot! c) Rajzolja fel az átlag-szórás diagramot!

  1. A box-diagramokat, illetve az átlag-szórás diagramokat egymás mellé helyezve, összehasonlít- hatóvá válik a két eloszlás. Melyik diagram ad több információt?

ll

férfi no

20

40

60

80

férfi no

0

10

20

30

40

50

60

70

  1. Nyissa meg a kiskerd.csv adatbázist (a változók leírását a 90 oldalon találja)! Jellemezze a kö- vetkező változókat (Beolvasáshoz használja a read.csv parancsot.)

a) nem b) kor

c) végzettség d) tömeg

e) magasság f) szem

g) sport h) zene

VALÓSZÍNŰSÉG, FELTÉTELES VALÓSZÍNŰSÉG, DIAGNOSZTIKUS TESZTEK

Valószínűség, feltételes valószínűség,

diagnosztikus tesztek

3.1. Valószínűség

Véletlen kísérlet: A kimenetele nincs egyértelműen meghatározva az általunk meghatározott feltételekkel. (p.l..: feldobunk egy pénzérmét, feldobunk egy dobókockát, megmérjük egy oldat koncentrációját, megmérjük egy állat testtömegét) Elemi esemény: a kísérlet egy lehetséges kimenetele.

Összetett esemény: elemi eseményekre bontható esemény.

Kiegészítő esemény: egy A esemény kiegészítő eseménye az az esemény, amely akkor követke- zik be, amikor A nem következik be. Összeg/ Unió az A és B események összege (uniója) az az A + B (vagy AB ) esemény, amely akkor következik be, ha vagy A , vagy B bekövetkezik.

Szorzat/ Metszet az A és B események szorzata (metszete) az az A · B (vagy AB ) esemény, amely akkor következik be, ha A és B is bekövetkezik. Ha A · B = ∅, akkor azt mondjuk, hogy A és B egymást kizáró események.

A valószínűség heurisztikus elve:Ismételjünk meg egy kísérletet n -szer ugyanazon feltételek mellett, egymástól függetlenül, és figyeljük meg hányszor következik be az A esemény, legyen ez a szám k (0 ≤ kn ). Ha n nagy, a kn egy adott számot fog közelíteni. Ezt a számot az A esemény valószínűségének nevezzük és P ( A )-val jelöljük.

A valószínűség tulajdonságai:

  • Bármely esemény valószínűsége mindig egy 0 és 1 közötti szám (0 ≤ P ( A ) ≤ 1).
  • Az összes lehetséges esemény együttes valószínűsége 1.
  • Az A esemény komplementer eseményének valószínűsége: 1 − P ( A ).

Az A esemény valószínűségének számítása, ha minden elemi esemény egyformán valószínű

P ( A ) = (^) összes lehetséges kimenetel számakedvező^ kimenetelek száma

Fontos: Az előző képlet csak akkor használható, ha minden elemi esemény egyformán valószínű. Annak a valószínűsége, hogy holnap beugrik a szobánkba egy rózsaszín elefánt NEM^12.

VALÓSZÍNŰSÉG, FELTÉTELES VALÓSZÍNŰSÉG, DIAGNOSZTIKUS TESZTEK

3.2. Feltételes valószínűség

Feltételes valószínűség Az A eseménynek a B eseményre vonatkozó feltételes valószínűsége megadja az A esemény bekövetkezésének a valószínűségét, ha tudjuk hogy a B esemény már bekövetkezett vagy bekövetkezik. Jelölése: P ( A | B ) Formula: P ( A | B ) az AB esemény bekövetkezéseinek száma osztva a B esemény bekövetkezé- seinek számával: P ( A | B ) = | A^ |∩ B |^ B | , vagyis

P ( A | B ) = P^ ( PA (^ ∩ B )^ B )

A és B független, ha P ( AB ) = P ( A ) · P ( B )

3.3. Diagnosztikus tesztek

A diagnosztikus teszteket egy betegség jelenlétének vagy hiányának detektálására használjuk. Gold standard teszt a jelenleg legjobbnak tartott teszt. Gyakran invazív, vagy drága. Az új teszt például, egy szűrővizsgalat vagy egy kevésbé drága teszt. 2 × 2 táblázattal hasonlítjuk össze az új teszt és a gold standard teszt eredményeit.

GOLD STANDARD (^) TOTAL BETEG (pozitív) EGÉSZSÉGES (negatív)

ÚJTESZT

(^) POZITÍV valós pozitívak (a) ál pozitívak (b) a+b NEGATÍVAK ál negatívak (c) valós negatívak (d) c+d TOTAL a+c b+d a+b+c+d

Validitás: a helyesen diagnosztizált egyedek aránya validitás = P (helyes diagnózis) = valódi pozitívak száma + valódi negatívak száma összes vizsgált egyed száma =^

a + d a + b + c + d Szenzitivitás/érzékenység: a valódi pozitív betegek számának aránya a teljes betegszámhoz vi- szonyítva, vagyis annak a valószínűsége, hogy a vizsgált egyed teszteredménye pozitív, feltéve, hogy beteg. sensitivity = P (az új teszt eredménye pozitívj | beteg) = valódi pozitívak száma összes beteg egyed száma =^

a a + c Specificitás: a valódi negatívak számának aránya a kontrollcsoport teljes létszámához viszo- nyítva, vagyis annak a valószínűsége, hogy a vizsgált egyed teszteredmény negatív, feltéve, hogy egészséges. specificitás = P (az új teszt eredménye negatív | egészséges)) = a valódi negatívak száma összes egészséges egyed száma =^

d b + d