Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
66 Cards in this Set
- Front
- Back
Toegepaste Statistiek |
Analyseren van data om een wetenschappelijke vraag te beantwoorden |
|
Variabelen |
zijn kenmerken van de onderzoekseenheden die gaan variëren. Is ieder kenmerk van persoon, omgeving of (experimentele) situatie die van persoon tot persoon, van omgeving tot omgeving of van situatie tot situatie kan variëren. |
|
Steekproef |
Dat deel uit een groter geheel, de populatie, dat je selecteert voor het doen van onderzoek |
|
Doelpopulatie |
de volledige populatie waar we een uitspraak over willen doen met onze onderzoeksvraag |
|
Observationeel onderzoek |
Je gaat echt gaan observeren zonder een bepaald iets op te dragen Wordt men alleen maar geobserveerd men verricht een aantal metingen aan de proefpersoon ( of patiënt) zonder dat dit de betreffende persoon beïnvloedt |
|
Statistische testen of toets |
is een beslissingsprocedure waarbij op grond van onderzoek in een steekproef gekozen moet worden tussen twee elkaar uitsluitende verklaringen van een bepaald verschijnsel |
|
Data |
slechts een ander woord voor gegeven waarnemingen of variabelen |
|
Onafhankelijke Variabele |
determinanten, verklarende variabelen, voorspellers of predictoren de beïnvloedende variabele |
|
uitkomst variabele |
Afhankelijke variabele, dependent, outcome de andere wordt beïnvloed, hangt er dus vanaf |
|
Categorische Variabele |
categoriale, kwalitatieve, in woorden beschreven |
|
Dichotoom |
is een kenmerk dat slechts twee mogelijke waarden kan aannemen bv: man/vrouw |
|
Numerieke kwantitatieve variabelen |
waarnemingen dat een getal opleveren Kansvariabele, random variabele, stochastische grootheid of stochast |
|
Discreet |
een variabele die slechts een beperkt aantal waarden kan aannemen en daartussen niets |
|
Continu |
hierbij kan wel elke waarde tussen 2 punten voorkomen |
|
Prospectief |
(hetgeen men onderzoekt) wordt gevolgd over de tijd |
|
Transversaal of cross-sectioneel |
informatie wordt verzameld op het moment van het onderzoek |
|
Retrospectief |
terugkijkend in het verleden |
|
Case-control |
een groep patiënten met een bepaalde ziekte of aandoening (de cases) vergeleken met een groep controle personen (de controls). De controle personen zijn vergelijkbaar met de patiënten maar hebben de betreffende ziekte of aandoening niet. Retrospectief |
|
Cohort |
groep |
|
Experimenteel onderzoek |
word de patiënt/ proefpersoon wel beïnvloed. De beïnvloeding is hierbij zelfs het belangrijkste deel, want het doel van het onderzoek is het effect van de interventie te evalueren |
|
Dummy coderingen |
1 of 0 of ... weergave |
|
Ordinaal |
variabelen die een bepaalde volgorde hebben |
|
nominaal |
variabelen zonder ordening in categorieën |
|
Geef de drie onderverdeling onder Categorische variabelen? Geef van elk een voorbeeld |
Nominaal: bloedgroepen, landen,... Ordinaal: opleidingsniveau Dichotoom: Ja of neen |
|
Geef de twee onderverdelingen onder Numerieke Variabelen? Geef van elk een voorbeeld |
Continu: Lengte van personen, gewicht, bloeddruk Discreet: aantallen: aantal dagen dat iemand afwezig is |
|
Beschrijvende Statistiek |
Overzichtelijk samenvatten van data zonder te kijken naar mogelijke verbanden of relaties tussen verschillende variabelen: grafische of numerieke weergave |
|
Verklarende Statistiek |
Interferentiële statistiek - schatten van effecten/ relaties - schatten van de betrouwbaarheid van deze effecten/ relaties - hypothese testen Het generaliseren van de verzamelde informatie naar een groter geheel Inductieve statistiek |
|
Geef de verschillende vormen van grafische weergaven die kunnen gebruikt worden om uitkomsten van beschrijvende statistiek weer te geven? Geef telkens ook hun engelse benaming en voor welke variabele ze het best worden gebruikt |
- Staafdiagram (bar chart): categorische - geclusterde/ gesegmenteerde staafdiagram (clusterd bar chart): min 2 categorische - Taart diagram (pie chart): categorische - Histogram: Continu - Tak-en-blad diagram (stem-and-leaf plot): continu - Puntenwolk (scatterplot): 2 continue |
|
Geef de verschillende vormen van numerieke weergaven die kunnen gebruikt worden om uitkomsten van beschrijvende statistiek weer te geven? Geef telkens ook hun engelse benaming en voor welke variabele ze het best worden gebruikt |
Frequentietabel: Categorische variabelen |
|
Valid Percent |
hier worden de missende waarden niet meegeteld in het totaal percentage |
|
Geef de vier centrummaten? |
modus rekenkundig gemiddelde mediaan geometrisch gemiddelde |
|
Centrummaten |
centrale tendentie is een getal dat een samenvatting geeft van de waarnemingen een samenvatting in de zin van de meest typerende of karakteristieke waarde |
|
modus |
is de meest voorkomende uitslag in een reeks waarnemingen |
|
Rekenkundig gemiddelde |
is de meest gebruikte centrale tendentie maat. mean is de som van een aantal getallen gedeeld door het aantal getallen. |
|
Mediaan |
is een centrale tendentiemaat of centrummaat als de gegevens gerangschikt zijn van laag naar hoog dan is de mediaan gedefinieerd als de waarde van de middelste uitslag |
|
Standaarddeviatie |
Weergave van de spreiding van observaties. De grootte van de standaarddeviatie kan ongeveer gezien worden als het gemiddelde verschil tussen de observaties en het gemiddelde
σ = Sx = √( ∑ ( (xi - xgem)2 / nx) )
Sx = σ = de standaarddeviatie van getallenreeks x. |
|
Percentielpunten |
is een score uit een frequentieverdeling, waarbeneden een gegeven gedeelte van de verdeling ligt. De bijhorende percentielrang geeft aan welk gedeelte van de totale groep scores haalde die lager zijn of gelijk aan de gegeven score. |
|
Box- and Whisker plot |
Box-plot: continue variabelen combinatie van grafische en numerieke weergave - grafisch: het is een figuur - Numeriek: bepaalde samenvattingsmaten zijn in de figuur verwerkt |
|
Wat zijn de kenmerken van een Normale verdeling? |
de observaties zijn symmetrisch verdeeld rond het gemiddelde. Dus het gemiddelde = mediaan klokvorm: 95% van de waarnemingen tussen gemiddeld ongeveer 2 standaarddeviaties. als je het gemiddelde neemt en hierbij 2 standaarddeviaties aftrekt of bijtelt zal je 95% van de waarnemingen krijgen. |
|
Geef de twee niet-normale verdelingen? |
scheef naar rechts: skewed to the right - gemiddelde > mediaan Scheef naar links: skewed to the left - Gemiddelde < mediaan |
|
Geometrisch gemiddelde |
Rekenkundig gemiddelde genomen van de getransformeerde variabelen (natuurlijk logaritme van vorige) Inverteren van het rekenkundig gemiddelde om het geometrisch gemiddelde te krijgen. |
|
Geef 4 spreidingsmaten |
Variatie: S² Standaarddeviatie: sd Range Interkwartiel-range |
|
Variatie |
is in de statistiek een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken
|
|
Hoe wordt de normaliteit van continue variabelen bepaald? |
observatie van het histogram vergelijking van het gemiddelde en mediaan vergelijking van het gemiddelde en de standaarddeviatie |
|
Nulhypothese |
H0 geen effect op de doelpopulatie hopen op verwerping van de nulhypothese wordt pas verworpen als er genoeg bewijs is |
|
Alternatieve hypothese |
Ha geldt indien H0 onwaar is |
|
op welke manieren wordt de onzekerheid gekwantificeerd? |
Toetsing Schatten |
|
Toetsen |
Kansberekening op basis van wiskundige kansberekening gaan we bij toetsen telkens een p-waarde verkrijgen: dit is een overschrijdingskans: de kans om een bepaald onderzoeksresultaat te verkrijgen als de 0hypothese waar is. |
|
Schatten van de onzekerheid |
Puntschatting (= schatting in de steekproef) populatieparameter bij betrouwbaarheidsinterval gaan we kijken waar de werkelijke populatieparameter zich bevindt |
|
P-waarde |
is de kans dat in de verdeling gegeven door de nulhypothese de waarde van de toetsingsgrootheidwordt behaald of overschreden (links, rechts dan wel tweezijdig). De p-waarde is dus gebaseerd op de specifieke steekproefwaarde. De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is. Hoe kleiner de p-waarde, hoe extremer de uitkomst. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een significante, resp. sterk significante uitkomst. |
|
Het betrouwbaarheidsinterval |
geeft aan hoe nauwkeurig een schatting is die we op grond van steekproefgegevens berekend hebben
|
|
Standard error of mean |
s is the sample standard deviation (i.e., the sample-based estimate of the standard deviation of the population), and n is the size (number of observations) of the sample. |
|
Z-waarde |
waarde van de standaardnormale kansverdeling of z- verdeling Z= waarde van de standaardnormale variabele x= waarde waarin we zijn geïnteresseerd µ= gemiddelde waarde in de populatie = standaarddeviatie in de populatie |
|
5 stadia om een hypothese te testen? |
1. definieer de nul- en alternatieve hypothesen 2. Verzamel data uit een steekproef 3. Bepaal de test statistiek uit specifiek voor de nul hypothese 4. vergelijk deze resultaten met een gekend kans verdeling 5. interpreteer de P waarden en de resultaten |
|
Test statistiek |
statistische grootheid dit geeft een idee hoeveel evidentie we hebben tegen onze nul hypothese ( hoe groter de test statistiek, hoe minder compatibel H0 is met de steekproefdata) aan elke test statistiek hangt een bepaalde P-waarde vast |
|
Theoretische kansverdeling |
probabiliteitsdistributie steekproeftrekking meerdere keren herhalen kansverdeling rond H0 waarin waarde van test statistiek kan worden opgezocht om zo de p waarde te bepalen er zijn verschillende verdelingen naar de uitkomstvariabelen
|
|
Welke verschillende theoretische kansverdelingen zijn er? (uit het te lezen deel in boek) |
binomiale verdeling standaardnormale kansverdeling (z verdeling) afgeleide students t-verdelingen |
|
Welke zijn de twee indicatoren van onzekerheid? |
N en spreiding |
|
wat zijn de kenmerken van de standaardnormale kansverdeling? |
Z- verdeling normale verdeling met gemiddelde= 0 en sd=1 x as: [-, +] y- as: kandsdichtheid (kans op exacte waarde=0) totale oppervlakte onder de curve= 1 of 100% |
|
Vanaf welke p-waarde kan je H0 verwerpen? |
bij een p-waarde gelijk aan P<0,05 statistisch significant resultaat |
|
Vanaf wanneer heeft men een statistisch significant resultaat? |
bij een p-waarde P<0,05 |
|
Welke twee soorten van fouten kunnen optreden bij de besluitvorming en wat ligt hiervoor meestal aan de oorzaak? |
Type I error: foutief aanvaarden van Ha Type II error: foutief aanvaarden van H0 De steekproef populatie was te klein
|
|
Tweezijdig toetsen |
hypothesen worden in twee richtingen geformuleerd conservatievere benadering P-waarden dubbel zo groot |
|
toetsen vs schatten |
toetsen: kwalitatieve benadering - alles of niets - impact van klinische relevantie schatten: kwantitatieve benadering |
|
centrale limietstelling |
wanneer de steekproef voldoende groot is zal er een normale verdeling volgen, ongeacht de oorspronkelijke verdeling |
|
t-verdeling |
gelijkaardig aan standaard normale verdeling, maar bredere vorm, afhankelijk van het aantal vrijheidsgraden (steekproefgrootte) naarmate de steekproefgrootte toeneemt neigt t-verdeling steeds meer naar de z verdeling |