• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/66

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

66 Cards in this Set

  • Front
  • Back

Toegepaste Statistiek

Analyseren van data om een wetenschappelijke vraag te beantwoorden

Variabelen

zijn kenmerken van de onderzoekseenheden die gaan variëren.


Is ieder kenmerk van persoon, omgeving of (experimentele) situatie die van persoon tot persoon, van omgeving tot omgeving of van situatie tot situatie kan variëren.

Steekproef

Dat deel uit een groter geheel, de populatie, dat je selecteert voor het doen van onderzoek

Doelpopulatie

de volledige populatie waar we een uitspraak over willen doen met onze onderzoeksvraag

Observationeel onderzoek

Je gaat echt gaan observeren zonder een bepaald iets op te dragen


Wordt men alleen maar geobserveerd men verricht een aantal metingen aan de proefpersoon ( of patiënt) zonder dat dit de betreffende persoon beïnvloedt

Statistische testen of toets

is een beslissingsprocedure waarbij op grond van onderzoek in een steekproef gekozen moet worden tussen twee elkaar uitsluitende verklaringen van een bepaald verschijnsel

Data

slechts een ander woord voor gegeven waarnemingen of variabelen

Onafhankelijke Variabele

determinanten, verklarende variabelen, voorspellers of predictoren


de beïnvloedende variabele

uitkomst variabele

Afhankelijke variabele, dependent, outcome


de andere wordt beïnvloed, hangt er dus vanaf

Categorische Variabele

categoriale, kwalitatieve, in woorden beschreven

Dichotoom

is een kenmerk dat slechts twee mogelijke waarden kan aannemen


bv: man/vrouw

Numerieke kwantitatieve variabelen

waarnemingen dat een getal opleveren


Kansvariabele, random variabele, stochastische grootheid of stochast

Discreet

een variabele die slechts een beperkt aantal waarden kan aannemen en daartussen niets

Continu

hierbij kan wel elke waarde tussen 2 punten voorkomen

Prospectief

(hetgeen men onderzoekt) wordt gevolgd over de tijd

Transversaal of cross-sectioneel

informatie wordt verzameld op het moment van het onderzoek

Retrospectief

terugkijkend in het verleden

Case-control

een groep patiënten met een bepaalde ziekte of aandoening (de cases) vergeleken met een groep controle personen (de controls). De controle personen zijn vergelijkbaar met de patiënten maar hebben de betreffende ziekte of aandoening niet.


Retrospectief

Cohort

groep

Experimenteel onderzoek

word de patiënt/ proefpersoon wel beïnvloed. De beïnvloeding is hierbij zelfs het belangrijkste deel, want het doel van het onderzoek is het effect van de interventie te evalueren

Dummy coderingen

1 of 0 of ... weergave

Ordinaal

variabelen die een bepaalde volgorde hebben

nominaal

variabelen zonder ordening in categorieën

Geef de drie onderverdeling onder Categorische variabelen? Geef van elk een voorbeeld

Nominaal: bloedgroepen, landen,...


Ordinaal: opleidingsniveau


Dichotoom: Ja of neen

Geef de twee onderverdelingen onder Numerieke Variabelen? Geef van elk een voorbeeld

Continu: Lengte van personen, gewicht, bloeddruk


Discreet: aantallen: aantal dagen dat iemand afwezig is

Beschrijvende Statistiek

Overzichtelijk samenvatten van data zonder te kijken naar mogelijke verbanden of relaties tussen verschillende variabelen: grafische of numerieke weergave

Verklarende Statistiek

Interferentiële statistiek


- schatten van effecten/ relaties


- schatten van de betrouwbaarheid van deze effecten/ relaties


- hypothese testen


Het generaliseren van de verzamelde informatie naar een groter geheel


Inductieve statistiek

Geef de verschillende vormen van grafische weergaven die kunnen gebruikt worden om uitkomsten van beschrijvende statistiek weer te geven? Geef telkens ook hun engelse benaming en voor welke variabele ze het best worden gebruikt

- Staafdiagram (bar chart): categorische


- geclusterde/ gesegmenteerde staafdiagram (clusterd bar chart): min 2 categorische


- Taart diagram (pie chart): categorische


- Histogram: Continu


- Tak-en-blad diagram (stem-and-leaf plot): continu


- Puntenwolk (scatterplot): 2 continue

Geef de verschillende vormen van numerieke weergaven die kunnen gebruikt worden om uitkomsten van beschrijvende statistiek weer te geven? Geef telkens ook hun engelse benaming en voor welke variabele ze het best worden gebruikt

Frequentietabel: Categorische variabelen

Valid Percent

hier worden de missende waarden niet meegeteld in het totaal percentage

Geef de vier centrummaten?

modus


rekenkundig gemiddelde


mediaan


geometrisch gemiddelde

Centrummaten

centrale tendentie


is een getal dat een samenvatting geeft van de waarnemingen een samenvatting in de zin van de meest typerende of karakteristieke waarde

modus

is de meest voorkomende uitslag in een reeks waarnemingen

Rekenkundig gemiddelde

is de meest gebruikte centrale tendentie maat.


mean


is de som van een aantal getallen gedeeld door het aantal getallen.


Mediaan

is een centrale tendentiemaat of centrummaat


als de gegevens gerangschikt zijn van laag naar hoog dan is de mediaan gedefinieerd als de waarde van de middelste uitslag

Standaarddeviatie

Weergave van de spreiding van observaties. De grootte van de standaarddeviatie kan ongeveer gezien worden als het gemiddelde verschil tussen de observaties en het gemiddelde



σ = Sx = √( ∑ ( (xi - xgem)2 / nx) )



Sx = σ = de standaarddeviatie van getallenreeks x.
Xi = de waarde van getal i in de getallenreeks.
Xgem = het gemiddelde van de getallenreeks (som getallen / aantal)
Nx = het aantal getallen in de proef

Percentielpunten

is een score uit een frequentieverdeling, waarbeneden een gegeven gedeelte van de verdeling ligt. De bijhorende percentielrang geeft aan welk gedeelte van de totale groep scores haalde die lager zijn of gelijk aan de gegeven score.

Box- and Whisker plot

Box-plot: continue variabelen


combinatie van grafische en numerieke weergave


- grafisch: het is een figuur


- Numeriek: bepaalde samenvattingsmaten zijn in de figuur verwerkt

Wat zijn de kenmerken van een Normale verdeling?

de observaties zijn symmetrisch verdeeld rond het gemiddelde. Dus het gemiddelde = mediaan


klokvorm: 95% van de waarnemingen tussen gemiddeld ongeveer 2 standaarddeviaties. als je het gemiddelde neemt en hierbij 2 standaarddeviaties aftrekt of bijtelt zal je 95% van de waarnemingen krijgen.

Geef de twee niet-normale verdelingen?

scheef naar rechts: skewed to the right


- gemiddelde > mediaan


Scheef naar links: skewed to the left


- Gemiddelde < mediaan

Geometrisch gemiddelde

Rekenkundig gemiddelde genomen van de getransformeerde variabelen (natuurlijk logaritme van vorige)


Inverteren van het rekenkundig gemiddelde om het geometrisch gemiddelde te krijgen.

Geef 4 spreidingsmaten

Variatie: S²


Standaarddeviatie: sd


Range


Interkwartiel-range

Variatie

is in de statistiek een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken



Hoe wordt de normaliteit van continue variabelen bepaald?

observatie van het histogram


vergelijking van het gemiddelde en mediaan


vergelijking van het gemiddelde en de standaarddeviatie

Nulhypothese

H0


geen effect op de doelpopulatie


hopen op verwerping van de nulhypothese


wordt pas verworpen als er genoeg bewijs is

Alternatieve hypothese

Ha


geldt indien H0 onwaar is

op welke manieren wordt de onzekerheid gekwantificeerd?

Toetsing


Schatten

Toetsen

Kansberekening


op basis van wiskundige kansberekening gaan we bij toetsen telkens een p-waarde verkrijgen: dit is een overschrijdingskans: de kans om een bepaald onderzoeksresultaat te verkrijgen als de 0hypothese waar is.

Schatten van de onzekerheid

Puntschatting (= schatting in de steekproef)


populatieparameter


bij betrouwbaarheidsinterval gaan we kijken waar de werkelijke populatieparameter zich bevindt

P-waarde

is de kans dat in de verdeling gegeven door de nulhypothese de waarde van de toetsingsgrootheidwordt behaald of overschreden (links, rechts dan wel tweezijdig). De p-waarde is dus gebaseerd op de specifieke steekproefwaarde.


De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is. Hoe kleiner de p-waarde, hoe extremer de uitkomst. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een significante, resp. sterk significante uitkomst.

Het betrouwbaarheidsinterval

geeft aan hoe nauwkeurig een schatting is die we op grond van steekproefgegevens berekend hebben


Standard error of mean


s is the sample standard deviation (i.e., the sample-based estimate of the standard deviation of the population), and


n is the size (number of observations) of the sample.

Z-waarde

waarde van de standaardnormale kansverdeling of z- verdeling



Z= waarde van de standaardnormale variabele


x= waarde waarin we zijn geïnteresseerd


µ= gemiddelde waarde in de populatie


= standaarddeviatie in de populatie

5 stadia om een hypothese te testen?

1. definieer de nul- en alternatieve hypothesen


2. Verzamel data uit een steekproef


3. Bepaal de test statistiek uit specifiek voor de nul hypothese


4. vergelijk deze resultaten met een gekend kans verdeling


5. interpreteer de P waarden en de resultaten

Test statistiek

statistische grootheid


dit geeft een idee hoeveel evidentie we hebben tegen onze nul hypothese ( hoe groter de test statistiek, hoe minder compatibel H0 is met de steekproefdata)


aan elke test statistiek hangt een bepaalde P-waarde vast

Theoretische kansverdeling

probabiliteitsdistributie


steekproeftrekking meerdere keren herhalen


kansverdeling rond H0 waarin waarde van test statistiek kan worden opgezocht om zo de p waarde te bepalen


er zijn verschillende verdelingen naar de uitkomstvariabelen


Welke verschillende theoretische kansverdelingen zijn er? (uit het te lezen deel in boek)

binomiale verdeling


standaardnormale kansverdeling (z verdeling)


afgeleide students t-verdelingen

Welke zijn de twee indicatoren van onzekerheid?

N en spreiding

wat zijn de kenmerken van de standaardnormale kansverdeling?

Z- verdeling


normale verdeling met gemiddelde= 0 en sd=1


x as: [-, +]


y- as: kandsdichtheid (kans op exacte waarde=0)


totale oppervlakte onder de curve= 1 of 100%

Vanaf welke p-waarde kan je H0 verwerpen?

bij een p-waarde gelijk aan P<0,05


statistisch significant resultaat

Vanaf wanneer heeft men een statistisch significant resultaat?

bij een p-waarde P<0,05

Welke twee soorten van fouten kunnen optreden bij de besluitvorming en wat ligt hiervoor meestal aan de oorzaak?

Type I error: foutief aanvaarden van Ha


Type II error: foutief aanvaarden van H0


De steekproef populatie was te klein


Tweezijdig toetsen

hypothesen worden in twee richtingen geformuleerd


conservatievere benadering


P-waarden dubbel zo groot

toetsen vs schatten

toetsen: kwalitatieve benadering


- alles of niets


- impact van klinische relevantie


schatten: kwantitatieve benadering

centrale limietstelling

wanneer de steekproef voldoende groot is zal er een normale verdeling volgen, ongeacht de oorspronkelijke verdeling

t-verdeling

gelijkaardig aan standaard normale verdeling, maar bredere vorm, afhankelijk van het aantal vrijheidsgraden (steekproefgrootte)


naarmate de steekproefgrootte toeneemt neigt t-verdeling steeds meer naar de z verdeling