• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/90

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

90 Cards in this Set

  • Front
  • Back
Opgave 4.1

Een tentamen bestaat uit drie meerkeuzevragen met per vraag vier alternatieven.
Hoe groot is- wanneer ik alleen maar gok- de kans op:
a precies één vraag goed?
b precies twee vragen goed?
c alle vragen goed?
d alle vragen fout?
Antwoorden
Antwoorden
Opgave 4.1
Een tentamen bestaat uit drie meerkeuzevragen met per vraag vier alternatieven.
Hoe groot is- wanneer ik alleen maar gok- de kans op:

a precies één vraag goed?
Antwoord
Antwoord
Opgave 4.1
Een tentamen bestaat uit drie meerkeuzevragen met per vraag vier alternatieven.
Hoe groot is- wanneer ik alleen maar gok- de kans op:

b precies twee vragen goed?
Antwoord
Antwoord
Opgave 4.1
Een tentamen bestaat uit drie meerkeuzevragen met per vraag vier alternatieven.
Hoe groot is- wanneer ik alleen maar gok- de kans op:

c alle vragen goed?
Antwoord
Antwoord
Opgave 4.1
Een tentamen bestaat uit drie meerkeuzevragen met per vraag vier alternatieven.
Hoe groot is- wanneer ik alleen maar gok- de kans op:

d alle vragen fout?
Antwoord
Antwoord
4. Binomiale verdeling en normale verdeling


4.1 biomiale verdeling
De biomiale verdeling gebruiken we wanneer er per waarneming slechts .... mogelijk zijn
2 waarden mogelijk zijn. Bi is 2. Denk hierbij aan een munt.

Het is of kop, of munt. Ja of nee.
Stel, je hebt een tentamen met 5 vragen waarvan er per vraag 4 antwoord mogelijkheden zijn met maar 1 goed.

Hoe berekenen we de kans op precies 2 vragen goed?
Kans op één bepaalde gebeurtenis

Om de berekening inzichtelijk te houden, noemen we de vragen eerst A tot en met E en berekenen vervolgens de kans op precies één van de mogelijke gebeurtenissen waarin we twee vragen goed hebben, bijvoorbeeld vraag A en C goed en de rest fout.
Iets meer in termen van de in hoofdstuk 3 geïntroduceerde notatie voor kansen: hoe groot is P(A = g én B = f én C = g én D = f én E = f) ?

We hebben vragen A, B, C, D en E.
We hebben er 2 goed, bijvoorbeeld A en C.

We hebben alleen gegokt dus:
Dus P(A=g) · P(B=f) · P(C=g) · P(D=f) · P(E=f)
Er zijn vier alternatieven, dus is de kans om een willekeurige vraag goed te raden gelijk aan 1/4 en de kans op een fout 3/4. 

Omdat er alleen maar wordt gegokt, zijn de antwoorden op de. Tentamenvragen onafhankelijk van elkaar, en dus mogen we...
Er zijn vier alternatieven, dus is de kans om een willekeurige vraag goed te raden gelijk aan 1/4 en de kans op een fout 3/4.

Omdat er alleen maar wordt gegokt, zijn de antwoorden op de. Tentamenvragen onafhankelijk van elkaar, en dus mogen we de productregel voor onafhankelijke gebeurtenissen toepassen. De kans op deze ene gebeurtenis
wordt dan:

P(A = g) . P( B = f) . P(C = g) . P(D = f) . P(E = f)

Er zijn vier alternatieven, dus is de kans om een willekeurige vraag goed te raden gelijk aan 1/4 en de kans op een fout 3/4. De kans op de zojuist genoemde gebeurtenis wordt hierdoor:
Wanneer mag de binomiaalverdeling worden gebruikt?

De binomiaalformule is slechts van toepassing in die situaties waarin:
-Er per keer twee mogelijke uitkomsten zijn, bijvoorbeeld
1. goed/fout
2. succes/mislukking
3. jongen /meisje
4. gezakt/ geslaagd
5. kop/munt

-De gebeurtenissen onafhankelijk zijn van elkaar: dit wil zeggen dat de uitkomst va n de ene waarneming niet wordt beïnvloed door die van de andere (zoals bij een munt of dobbelsteen)

-De kans op een bepaalde uitkomst bij elk vanden waarnemingen gelijk blijft (zoals bij steekproeven met teruglegging) gelijk blijvende kansen.
Als aan deze drie voorwaarden is voldaan, mag de binomiaalformule worden gebruikt bij vragen naar kansen op het aantal malen goed (x) binnen een totaal van n.

Merk op dat we om de binomiale verdeling te kunnen gebruiken slechts de waarde van p en die van het totale aantal n hoeven te kennen . Als we p kennen, kennen we q immers ook, want die is 1 - p. Van het variabele aantal X weten we verder dat dit slechts waarden van 0 tot en met n kan aannemen.
Voor elke waarde van X geeft de formule vervolgens de kans dat deze waarde wordt aangenomen. Omdat n en p tezamen de binomiale verdeling geheel vastleggen, noemen we n en p wel de parameters van de binomiale verdeling.
Opgave 4.2

Veronderstel, de kans op een jongen is even groot als de kans op een meisje.
Wanneer er in een gezin zes kinderen worden geboren, hoe groot is dan de kans op precies vier meisjes en twee jongens?
Dus als er zes kinderen worden geboren in een gezin, dan is de kans dat er precies vier meisjes en twee jongens geboren worden, gelijk aan 0,23. Maar, veronderstel dat we het andersom hadden berekend. Als we X het aantal jongens hadden genoemd, had dat verschil uit gemaakt?
Nee! 
Want dan geldt:
Nee!
Want dan geldt:
Opgave 4 .3

Een tentamen bestaat uit tien tweekeuze-items. Om te slagen moet men er minstens zeven goed hebben. Hoe groot is de kans dat iemand slaagt die alleen maar gokt?
Antwoord

Om te slagen moet men óf 7 óf 8 óf 9 óf 10 items goed hebben, dus:

P(X ≤ 7) = P(X = 7 of X= 8 of X= 9 of X= 10) =
P(X = 7) + P(X = 8) + P(X = 9) of+ P( X= 10)

We berekenen eerst de kans op X= 7:

n 10 (aantal items)
X =...
Antwoord

Om te slagen moet men óf 7 óf 8 óf 9 óf 10 items goed hebben, dus:

P(X ≤ 7) = P(X = 7 of X= 8 of X= 9 of X= 10) =
P(X = 7) + P(X = 8) + P(X = 9) of+ P( X= 10)

We berekenen eerst de kans op X= 7:

n 10 (aantal items)
X = 7 (aantal items goed)
n- x = 3 (aantal items fout)
p 1/2 (kans op items goed)
q 1/2 (kans op items fout)
Evenzo berekenen we de kans dat:
P (X = 8) = 0,04
P (X = 9) = 0,01
P (X = 10) = 0,00 (= 0,000977)


We weten nu de kans op
7 goed
8 goed
9 goed
10 goed

Wat doen we?
We tellen ze op!

Gevraagd werd

P(X ≥ 7) = P(X = 7) + P(X = 8) + P(X = 9) + P(X = 10)


Dus de kans op groter of gelijk aan 7.

P (X = 7) = 0,12
P (X = 8) = 0,04
P (X = 9) = 0,01
P (X = 10) = 0,00 (= 0,000977)

Deze tellen we dus op:
= 0,12 = 0,04 = 0,01 + 0,00 = 0,17

Wanneer iemand minstens zeven van de tien tweekeuze-items goed moet hebben om te slagen en alleen maar gokt, dan is de kans op slagen gelijk aan 17%.

Met enig rekenwerk kan iedereen voor zichzelf de kans uitrekenen om via gokken te slagen wanneer een tentamen uit 40 driekeuze items bestaat en de slaaggrens ligt bij 29 of meer items goed (die kans is kleiner dan 0,00003) .
Opgave 4.4

De kans om te slagen voor het tentamen Inleiding Filosofie is 0, 70. Een groepje van vijf studenten werkt bij de voorbereiding nauw samen.

Hoe groot is de kans dat er van deze vijf studenten precies drie zullen slagen?
De binomiaalverdeling is hier niet van toepassing.
Door de nauwe samenwerking van de studenten zijn de gebeurtenissen niet onafhankelijk van elkaar. De kans om te slagen is geen 0,70, maar is door de samenwerking hoger geworden (hoopt men). Hoeveel hoger is niet bekend.
Formule binomiaalcoëfficiënt
Formule binomiaalcoëfficiënt
Voorbeeld Formule binomiaalcoëfficiënt
Voorbeeld Formule binomiaalcoëfficiënt
Formule binomiale verdeling
Formule binomiale verdeling
Voorbeeld Formule binomiale verdeling
Voorbeeld Formule binomiale verdeling
Wat als alles goed is?
Wat als alles goed is?
Wat als er geen kans is (0) ?
Wat als er geen kans is (0) ?
Dan is kans 0 =1
Dan is kans 0 =1
4.1 binomiale verdeling

De binomiale verdeling mogen we gebruiken als
wanneer er per waarneming slechts 2 waarden mogelijk zijn. Bi is 2. Denk hierbij aan een munt. Het is of kop, of munt. Ja of nee.

DE gebeurtenissen onafhankelijk zijn van elkaar. De ene uitkomst wordt niet beinvloed door die van de ander. Zoals bij een munt of dobbelsteen)

Als de kans op een bepaalde uitkomst bij elk van de n waarnemingen gelijk blijft (zoals bij steekproeven met teruglegging)
Stel, je hebt een tentamen met 5 vragen waarvan er per vraag 4 antwoord mogelijkheden zijn met maar 1 goed.

Hoe berekenen we de kans op precies 2 vragen goed?


Kans op één bepaalde gebeurtenis
Om de berekening inzichtelijk te houden, noemen we de vragen eerst A tot en met E en berekenen vervolgens de kans op precies één van de mogelijke gebeurtenissen waarin we twee vragen goed hebben, bijvoorbeeld vraag A en C goed en de rest fout. Iets meer in termen van de in hoofdstuk 3 geïntroduceerde notatie voor kansen: hoe groot is P(A = g én B = f én C = g én D = f én E = f) ?



Kans op één bepaalde gebeurtenis

Om de berekening inzichtelijk te houden, noemen we de vragen eerst A tot en met E en berekenen vervolgens de kans op precies één van de mogelijke gebeurtenissen waarin we twee vragen goed hebben, bijvoorbeeld vraag A en C goed en de rest fout. Iets meer in termen van de in hoofdstuk 3 geïntroduceerde notatie voor kansen: hoe groot is P(A = g én B = f én C = g én D = f én E = f) ?
We hebben vragen A, B, C, D en E.
We hebben er 2 goed, bijvoorbeeld A en C.

We hebben alleen gegokt dus:
Dus P(A=g) · P(B=f) · P(C=g) · P(D=f) · P(E=f)

Er zijn vier alternatieven, dus is de kans om een willekeurige vraag goed te raden gelijk aan 1/4 en de kans op een fout 3/4.

Omdat er alleen maar wordt gegokt, zijn de antwoorden op de. Tentamenvragen onafhankelijk van elkaar, en dus mogen we de productregel voor onafhankelijke gebeurtenissen toepassen. De kans op deze ene gebeurtenis
wordt dan:

P(A = g) . P( B = f) . P(C = g) . P(D = f) . P(E = f)
Er zijn vier alternatieven, dus is de kans om een willekeurige vraag goed te raden gelijk aan 1/4 en de kans op een fout 3/4. De kans op de zojuist genoemde gebeurtenis wordt hierdoor:
In welke volgorde twee vragen goed en drie fout, de kans blijft
Gelijk
De vraag is:
Hoeveel manieren zijn er om twee vragen goed en drie fout te hebben?
Het enige wat verschilt id de volgorde van mogelijke manieren van 2 goed en 3 fout. De kansen zijn gelijk

Wat willen we weten?
We willen het aantal verschillende manieren weten om op een totaal van n vragen er x goed te hebben..

Dus n-x vragen fout.

Daarbij is x een bepaalde variabele die elk het mogelijk aantal goed symboliseert.

De waarden van X lopen daarom van 0 tot en met n.
Voor de berekening van het aantal verschillende manieren om de waarde X te krijgen bestaat de volgende formule:
waarin:
n! (nn-faculteit)= n
waarin:
n! (nn-faculteit)= n
n en p vormen samen de binomiale verdeling. Ze heten ook wel
De parameters van de binomiale verdeling

N= hoeveelheid
P= Kans

Als we P kennen, kennen we Q ook. Want 1-P is Q
N= hoeveelheid
P= Kans

Als we P kennen, kennen we Q ook.

Want
1-P is Q
4.2 verwachte waarde en standaardafwijking van de binomiale verdeling.

Naast dat we geïnteresseerd zijn in kansen die we met de binomiale verdeling kennen willen we ook graag nog ander dingen weten...
De verwachtte waarde μ

En

De standaardafwijking σ

Uitgaande van een bepaalde η en een kans Ρ (zeg tien vragen met een kans van 1/3 op een goed antwoord) zegt die verwachte waarde μ hoeveel vragen mensen er gemiddeld goed zullen hebben als die kans voor iedereen tekens 1/3 is
Uitgaande van een bepaalde η en een kans Ρ (zeg tien vragen met een kans van 1/3 op een goed antwoord) zegt die verwachte waarde μ hoeveel vragen mensen er gemiddeld goed zullen hebben als die kans voor iedereen telkens 1/3 is

De standaardafwijking σ geeft vervolgens aan
hoe groot de verspreiding van de aantallen ‘goed’ is rond deze verwachtte waarde.

De verwachtte waarde μ krijgen we door elke waarde van de variabele te vermenigvuldigen met de kans op die waarde en dit voor alle mogelijke waarden op te tellen.
De verwachtte waarde μ krijgen we door
elke waarde van de variabele te vermenigvuldigen met de kans op die waarde en dit voor alle mogelijke waarden op te tellen.

μ = [P(X = 0) x 0] + [P(X = 1) x 1] + [P(X = 2) x 2] + [P(X = 3) x 3] + ……..[P(X = n) x n]
Wat is de verwachtte waarde, of beter, wat is verwachtte waarde van de gemiddelde score? Om dit te beantwoorden moet je eerst een kansverdeling opstellen.

Je berekend de kans op o vragen goed, op 1 vraag goed, op 2 vragen goed etc.

Noemen we X het aantal goed kunnen we het uitrekenen met de binomiaal formule waarbij n= 10 en p = 1/3. Bijvoorbeeld:
Dit zijn niet alle getallen, want die lopen van 0 t/m tien.

Samen zouden alle P(X) waardes 1 zijn en de kansen bij elkaar P(X) · p = 3,3333 

Dus:
alle P(X) waardes opgeteld zijn 1 
de kansen bij elkaar P(X) · p = 3,3333 (1/3)
Dit zijn niet alle getallen, want die lopen van 0 t/m tien.

Samen zouden alle P(X) waardes 1 zijn en de kansen bij elkaar P(X) · p = 3,3333

Dus:
alle P(X) waardes opgeteld zijn 1
de kansen bij elkaar P(X) · p = 3,3333 (1/3)
Uit de derde kolom van deze tabel blijkt dat de verwachte waarde afge­rond 3,33 is. G

elukkig hoeven we de verwachte waarde van een bino­ miale verdeling niet op deze om slachtige manier (en met de nodige afrondingsfouten) uit te rekenen. 

...
Uit de derde kolom van deze tabel blijkt dat de verwachte waarde afge­rond 3,33 is. G

elukkig hoeven we de verwachte waarde van een bino­ miale verdeling niet op deze om slachtige manier (en met de nodige afrondingsfouten) uit te rekenen.

Wiskundig kan worden aangetoond dat de verwachte waarde van een binomiaal verdeelde variabele geli k is aan:
µ = E (X) = n · p
In het voorbeeld is de verwachte waarde dus µ = 10 x (1/3) = 3,33. Dit stemt uiteraard overeen met onze verwachting dat we ongeveer een­ derde van de tien vragen goed zullen hebben.

Gooien we honderd maal met een munt, dus n = 100 en p = 1/2, dan verwachten we in de helft van de gevallen kruis, dus μ = 100 x (1/2) =
50.

In een steekproef van tachtig mensen uit een popu latie waarin 1/4 katholiek is, verwachten we gemiddeld µ = 80 x (1/4) = 20 katholieken aan te treffen.
Hoewel we zo van elke binomiale verdeling de verwachte waarde kun­nen berekenen, betekent dit niet dat we dit aantal ook elke keer exact zullen observeren.

Het werkelijk geobserveerde aantal zal
met een zeke­re spreiding rond deze verwachte waarde schommelen .
De standaardafwijking van een binomiale verdeling is gelijk aan:
met n weer als totaal aantal, 
p de kans op 'goed' en 
q = 1 -p de kans op 'fout'.
met n weer als totaal aantal,
p de kans op 'goed' en
q = 1 -p de kans op 'fout'.
Voor de kansverdeling uit tabel 4.1 met de verwachte waarde 3,33 is de standaardafwijking dan gelijk aan:
Zoals in paragraaf 3.3 al uiteen werd gezet gaat het bij kansverdelingen om theoretische begrippen.

Daarom gebruiken we weer de Griekse let­ter μ (spreek uit : mu) om .....aan te dui­den en gebruiken we

voor de ....... het symbool σ (spreek uit: sigma).
Daarom gebruiken we weer de Griekse let­ter μ (spreek uit : mu) om het gemiddelde op de lange duur aan te dui­den

en gebruiken we voor de standaardafwijking het symbool σ (spreek uit: sigma) .
We hoeven dus, als we de verwachte waarde en de standaardafwijking van een binomiaal verdeelde variabele willen weten, niet eerst de kans­ verdeling uit te rekenen zoals we in tabel 4.3 hebben gedaan, maar kun nen gebruikmaken van de volgende formules:
We zien dat de grafiek niet symmetrisch is voor n = 10. Maar als we n steeds groter nemen (bijvoorbeeld n = 600), terwijl p  het zelfde blijft, dan wordt het uiterlijk van de grafiek steeds meer symmetrisch met de verwachte waarde µ in het midden...
We zien dat de grafiek niet symmetrisch is voor n = 10. Maar als we n steeds groter nemen (bijvoorbeeld n = 600), terwijl p het zelfde blijft, dan wordt het uiterlijk van de grafiek steeds meer symmetrisch met de verwachte waarde µ in het midden.

Niet alleen wordt de grafiek meer symmetrisch naarmate n groter wordt, haar uiterlijk gaat ook steeds meer op een klokvorm lijken.

Ze gaat steeds meer lijken op
de zoge­naamde normale verdeling.
Wanneer n groot genoeg is, wordt het verschil tussen de grafiek van de binomiale verdeling en die van de normale verdeling - voor welke waarde van p dan ook - zó klein, dat de binomiale verdeling hoe mag worden opgevat?
als een normale verdeling mag worden opgevat .

Welke voordelen dat heeft, wordt na de normale verdeling in paragraaf 4.5 uit de doeken gedaan.
Als p = q = 1/2 voor een binomiale verdeling, dan is de grafiek welîswaar altijd symmetrisch rond µ. = n ·p, maar normaal verdeeld is ze nog niet.

Wél is het zo dat de grafiek bi j p = q = 1/2 sneller de normale verdeling benadert wanneer n groter wordt, dan bi j p ≠ q.

Omgekeerd, wanneer p of q heel klein is, dan ....
is een zeer grote n nodig voordat de grafiek de normale verdeling benadert .
Normale verdeling.

De normale verdeling heeft wis­kundige eigenschappen die onder meer van belang zijn om op basis van steekproefgegevens conclusies te kunnen trekken over
de popula­tie.
Als we dé normale verdeling zeggen, bedoelen we dat er een klasse van kansverdelingen is met dezelfde
formule als uitgangspunt, die alle­maal de karakteristieke klokvorm hebben als we de grafiek tekenen .
Wat is een normale verdeling?

Een normale verdeling is een theoretische kansverdeling voor een con­tinue variabele, waarbij de variabele dus niet meer gehele waarden aanneemt zoals bij de binomiale verdeling, maar waarbij
alle waarden bin­nen een gebied meetellen .
Omdat er oneindig veel van die waarden zijn , is de kans op exact één waarde (bijvoorbeeld 3, 141593) echter ge­lijk aan
nul.

Niettemin kunnen we kansen op waarden binnen bepaal­ de gebieden uitrekenen, bijvoorbeeld tussen 3 en 4, als we de formule van de kansverdeling kennen.
Uit de wiskunde is namelijk bekend dat de kans op een waarde binnen een bepaald gebied, bijvoorbeeld tussen 3 en 4, gegeven wordt door de oppervlakte onder de curve tussen 3 en 4.

De totale oppervlakte onder de curve van een normale verdeling moet dan ook altijd gelijk zijn aan ....
1,

anders is het geen kansverdeling (een kans moet immers altijd tussen 0 en 1 liggen, 0 en 1 meegere­kend). Kansrekening is wat dit betreft dan ook hetzelfde als het bepalen van oppervlakten onder curves.
Bij verschillende waarden van µ en σ horen verschillende curven, en van elke curve geeft f (x) telkens de hoogte aan . We kri jgen die hoogte
in elk punt x door de betreffende x-waa rde in de formule in te vullen en de hoogte vervolgens uit te rekenen.

Omdat er oneindig veel verschil­lende waarden zijn voor µ en σ , zijn er ook
oneindig veel normale ver ­delingen .

Desondanks vertonen deze grote overeenkomsten. We spre­ken daarom wel van een familie van kansverdelingen.
De hoogte van elke curve is maxi­maal wanneer
x = μ de top wor dt dus bereikt in het punt µ1.

Omdat we de plaats waar de top ligt (naar analogie van de frequentieverdeling) ook wel de modus van de verdeling noemen, is de modus van de nor­male verdeling gelijk aan de verwache waarde (het gemiddelde) μ.
Omdat we de plaats waar de top ligt (naar analogie van de frequentieverdeling) ook wel de modus van de verdeling noemen, is de modus van de nor­male verdeling gelijk aan de verwachte waarde
(het gemiddelde) μ.
Een normale verdeling is
Symetrisch
elke normale verdeling ligt symmetrisch rond de verwachte
waarde µ.

Voor x-waa rden die even ver van µ af liggen (dus links en rechts van μ) zijn de waarde n van de e-macht immers gelijk , en dus ook de hoogtes van de curve.

Normale verdelingen hebben daarom een symmetrische vorm met de top in het midden, terwjl de curves voorts ononderbroken naar links en naar rechts dalen.

Zij hebben daarbij een klokvorm, waarbij de uiteinden van de curve de X-as steeds meer naderen, zonder deze echt er ergens te raken.

Bij kleinere waarden van de standaardafwijking σ treffen we 'smallere' en 'hogere' curves aan, bij grotere waarden van σ 'bredere' en 'lagere'.

Een voorbeeld van twee zul­ke normale verdelingen is te zien in figuur 4.2 . De linkerverdeling heeft een kleine standaardafwijking en de rechter een grote . Voorts verschil ­len de verwachte waarden van beid e verdelingen, hetgeen tot uitdruk­king komt in de plaats van de toppen: µ1 < p2 .
Bij kleinere waarden van de standaardafwijking σ treffen we 'smallere' en 'hogere' curves aan, bi j grotere waarden van σ 'bredere' en 'lagere'. Een voorbeeld van twee zul­ke normale verdelingen is te zien in figuur 4.2 .
Bij kleinere waarden van de standaardafwijking σ treffen we 'smallere' en 'hogere' curves aan, bi j grotere waarden van σ 'bredere' en 'lagere'. Een voorbeeld van twee zul­ke normale verdelingen is te zien in figuur 4.2 .
De linkerverdeling heeft een kleine standaardafwijking en de rechter een grote . 

Voorts verschil­len de verwachte waarden van beid e verdelingen, hetgeen tot uitdruk­king komt in de plaats van de toppen: µ1 < p2 .
De linkerverdeling heeft een kleine standaardafwijking en de rechter een grote .

Voorts verschil­len de verwachte waarden van beid e verdelingen, hetgeen tot uitdruk­king komt in de plaats van de toppen: µ1 < p2 .
Een normale verdeling kan worden gezien als de kansverdeling van een
continue variabele, bijvoorbeeld X , die waarden kan aannemen tussen
∞ en + ∞ (min oneindig en plus oneindig). 

Zoals echter mooi aan de twee normale verdelingen uit figuur 4.2 is te zien, hopen de waarden van elke verdeling zich op in het...
continue variabele, bijvoorbeeld X , die waarden kan aannemen tussen
∞ en + ∞ (min oneindig en plus oneindig).

Zoals echter mooi aan de twee normale verdelingen uit figuur 4.2 is te zien, hopen de waarden van elke verdeling zich op in het midden van de verdeling rond de verwachte waarde μ. Extreme waarden, die zeer ver van p af liggen, komen bij een normale verdeling dan ook zelden voor.
De kans op een waarde binnen een bepaald gebied op de X -as wordt bi j een continue variabele gegeven door
de oppervlakte boven dat gebied.
Dat geldt dus ook bij een normale verdeling: de kans dat de waarde van X ligt tussen a en b is gelijk aan de oppervlakte behorend bij het gebied tussen a en b.

Elke normale verdeling is inderdaad een kansverdeling, want het kan worden bewezen dat de totale oppervlakte onder de nor ­male curve altijd precies gelijk is aan ....
1.
Er valt echter nog meer op te merken over oppervlakten onder de nor male verdeling. Welke waarde het gemiddelde μ en de standaardafwij king σ ook hebben, grof afgerond geldt steeds dat ongeveer:
1 68% van de oppervlakte ligt tussen µ - er en µ + er. Anders gezegd: de kans op een waarde tussen deze grenzen is ongeveer 0,68. Als men dus weet dat intelligentie normaal is verdeeld met µ. = 100 en er = 15, dan weet men ook dat ruwweg 68% van de mensen een intelligentie zal hebben tussen 85 en 115.

2 Afgerond ligt 95% van de oppervlakte ligt tussen µ - 2σ en μ + 2σ. De kans op een waarde tussen deze grenzen is daarom ongeveer 0,95. Grofweg za l dus 95% een intelligentie hebben tussen de 70 en 130.

3 Ongeveer 99,5% van de oppervlakte ligt tussen µ - 3σ en µ + 3σ. De kans op een waarde tussen deze grenzen is grofweg 0,995. Dus onge­ veer 99,5% heeft een intelligentie tussen de 55 en 145.

Hieruit kan ook worden afgeleid dat slechts 0,5% een IQ heeft lager da n 55 of hoger dan 145. De kans op een IQ groter dan 145 is dan 0,0025. Als het IQ inderdaad normaal is verdeeld, hebben dus ± 40.000 van de zestien miljoen Nederlanders een IQ groter dan 145 (overigens is het IQ niet helemaal normaal verdeeld, er zijn in feite iets meer zeer hoge én zeer lage IQ's dan de normale verdeling aangeeft).
Eigenschappen va n de normale verdeling
In het voorgaande zijn een aantal belangrijke eigenschappen van de normale verdeling genoemd.
We vatten deze nog eens kort samen:
1 het is een klokvormige kansverdeling;
2 de totale oppervlakte onder de curve is 1;
3 de verdeling is symmetrisch rond µ;
4 verwachte waarde (gemiddelde) , mediaan en modus zijn aan elkaar gelijk: µ = Me = Mo;
5 de kansverdeling wordt volledig bepaald door de parameters µ en σ;
6 kansen op waarden binnen bepaalde gebieden word en gegeven door de bijbehorende oppervlaktes onder de curve;
7 oppervlaktes tussen respectievelijk 10", 20" en 30" van de verwachte waarde µ zijn voor alle normale verdelingen aan elkaar gelijk.
4.4 Standaardnormale verdeling

We redeneren daartoe als volgt. Wanneer we van elke X-waarde een constante aftrekken, verandert er niets aan de vorm van de curve; slechts de positie op de scha al verand ert en dat is alles.

Veronderstel nu dat we van elke score X het gemiddelde μ zouden aftrekken. Altijd als we van elke score net gemiddelde aftrekken, is het nieuwe gemiddelde gelij k aa n nul. Als we deze nieuwe scores z' noemen, dan is z' = X- μ. en de verwachte µ2, waarde van is dus gelijk aan nul. Wat we in feite doen, wordt weergegeven in figuur 4.6.
We hebben de verdeling verplaatst op de schaal. De vorm is onveranderd gebleven; de σ is nog het zelfde. 

Wanneer we nu elke nieuwe score door σ delen , dan wordt de nieuw e stand aardafwijking σ keer zo klein als de oude, en dus gelijk aan ...
We hebben de verdeling verplaatst op de schaal. De vorm is onveranderd gebleven; de σ is nog het zelfde.

Wanneer we nu elke nieuwe score door σ delen , dan wordt de nieuw e stand aardafwijking σ keer zo klein als de oude, en dus gelijk aan 1. De variabele die we na deze transforma­tie overhouden is...
de z-score.
de z-score.
De z-score is nog steeds normaal verdeeld, maar nu met een verwacht e waarde μz = 0 en een standaardafwijking σz, = 1.

Een normale verdeling die men aldus heeft getransformeerd - du s door van elke score de ver­wachte waarde µ af te trekken en vervolgens te delen door de stan­daardafwi jking - heet
de standaardnormale verdeling en de mogelijke waarden van deze verdeling heten z -scores .

De standaardnormale verdeling heeft dus altijd een verwachte waarde (gemiddelde) van 0 en een standaard afwijking van 1 (dus μz = 0 en σz = 1) .
De standaardnormale verdeling heeft altijd een

verwachte waarde (gemiddelde) van 0 en
een standaard afwijking van 1

(dus μz = 0 en σz = 1) .
verwachte waarde (gemiddelde) van 0 en
een standaard afwijking van 1 (dus μz = 0 en σz = 1) .
Soorten Kansen

Er zijn 3 soorten overschrijdingskansen
Rechter overschrijdingskans
Linker overschrijdingskans
Tweezijdige overschrijdingskansen
Rechter overschrijdingskans
Linker overschrijdingskans
Tweezijdige overschrijdingskansen

Voorbeeld:
Rechter overschrijdingskans
Veronderstel dat we de kans willen weten op een waarde van z die gro­ter is of gelijk aan 1,04; dus P(z ≥ 1,04). Dit is een rechter overschrijdings ­kans en in plaats van P(z ≥ 1,04) schrijven we ook wel PR (1,04).

Linker overschrijdingskans
Veronderstel dat we de kans willen weten op een z-waarde die gelijk aan of kleiner is dan een bepaalde waarde, bijvoorbeeld P(z ≤ 0,37).
Deze kans noemen we linker overschrijdingskans, dus PL(0,37) = P(z ≤ 0,37 ). het gaat het nu om de oppervlakte links van een punt.

Tweezijdige overschrijdingskansen
Behalve linker en recht er overschrijdingskansen kunnen we ook twee­ zijdige overschridingskansen berekenen; dit wil zeggen de kans op z ≥ 1, 14 óf z ≤ -1, 14) .

Dus hier gaat het om de kans dat z op een be­paalde afstand van het gemiddelde ligt in welke richting dan ook. De tweezijdige overschrijdingskans noteren we als Pd (d is van 'distance'). Dus Pd( l, 14) wil zeggen : P(z ≤ - 1,14 óf z ≥ + 1,14) . In figuur 4.12 is deze kans in beeld gebracht.
Rechter overschrijdingskans
Veronderstel dat we de kans willen weten op een waarde van z die gro­ter is of gelijk aan 1,04; dus P(z ≥ 1,04). Dit is een rechter overschrijdings ­kans en in plaats van P(z ≥ 1,04) schrijven we ook wel PR (1,04).
Linker overschrijdingskans
Veronderstel dat we de kans willen weten op een z-waarde die gelijk aan of kleiner is dan een bepaalde waarde, bijvoorbeeld P(z ≤ 0,37).
Deze kans noemen we linker overschrijdingskans, dus PL(0,37) = P(z ≤ 0,37 ). het gaat het nu om de oppervlakte links van een punt.
Tweezijdige overschrijdingskansen
Behalve linker en recht er overschrijdingskansen kunnen we ook twee­ zijdige overschridingskansen berekenen; dit wil zeggen de kans op z ≥ 1, 14 óf z ≤ -1, 14) .

Dus hier gaat het om de kans dat z op een be­paalde afstand van het gemiddelde ligt in welke richting dan ook. De tweezijdige overschrijdingskans noteren we als Pd (d is van 'distance'). Dus Pd( l, 14) wil zeggen : P(z ≤ - 1,14 óf z ≥ + 1,14) . In figuur 4.12 is deze kans in beeld gebracht.
Bij   Pd(l , 14) gaat het om de twee gearceerde oppervlakten tezamen .

Pd (1,14)  = P(z ≤ - 1,14 óf z ≥+ 1,14)

= P(z ≤; - 1,14) + P(z ≥	+ 1,14) (toepassing somregel)
= PL (- 1, 14) + PR( 1 , 14)
Bij Pd(l , 14) gaat het om de twee gearceerde oppervlakten tezamen .

Pd (1,14) = P(z ≤ - 1,14 óf z ≥+ 1,14)

= P(z ≤; - 1,14) + P(z ≥ + 1,14) (toepassing somregel)
= PL (- 1, 14) + PR( 1 , 14)
Wat is nu de tweezijdige  overschrijdingskans van 2,01?
Wat is nu de tweezijdige overschrijdingskans van 2,01?
Dit is Pd(2,01) = 2 x PL(- 2,01) = 2 x Pr(2,01) = 2 x 0,0222 = 0,0444.

Er is dus 4% kans dat z verder dan 2,01 af ligt van de verwachte waarde 0, i n welke richting dan ook.
Dit is Pd(2,01) = 2 x PL(- 2,01) = 2 x Pr(2,01) = 2 x 0,0222 = 0,0444.

Er is dus 4% kans dat z verder dan 2,01 af ligt van de verwachte waarde 0, i n welke richting dan ook.
Als Z; een bepaalde waarde van z is, geldt in het algemeen dat :
Kans op z tussen twee waarden

Behalve linker, rechter en tweezijdige overschrijdingskansen, kunnen we ook berekenen hoe groot de kans is dat z tussen twee waarden in ligt, bijvoorbeeld  tussen - 1,96 en + 1,96.

Gevraagd wordt de grootte van ...
Kans op z tussen twee waarden

Behalve linker, rechter en tweezijdige overschrijdingskansen, kunnen we ook berekenen hoe groot de kans is dat z tussen twee waarden in ligt, bijvoorbeeld tussen - 1,96 en + 1,96.

Gevraagd wordt de grootte van het gearceerde oppervlak in figuur 4.13.

De kans op een z groter dan + 1,96 is gelijk aan 0,0250 en de kans op een z kleiner dan - 1,96 is eveneens gelijk aan 0,0250.

Dus is de kans op een z tussen de - 1,96 en + 1,96 gelijk aan:
P(- 1,96 ≤  z  ≤ +1,96) = 1 - 2 x 0,0250 = 1-0,050 = 0,95
P(- 1,96 ≤ z ≤ +1,96) = 1 - 2 x 0,0250 = 1-0,050 = 0,95
Opgave 4.5

Hoe groot is de kans op een waarde van z tussen 0,98 en 1,14?
Opgave 4.5

Hoe groot is de kans op een waarde van z tussen 0,98 en 1,14?
Oplossing

In de tabel voor de standaardnormale verdeling kunnen we vinden: 

P(z ≥ 0,98) = 0,1635 en P(z ≥ 1,14) = 0,1271
Nu is: P(0,98  ≥  z  ≥  1,14) = 0, 1635 - 0, 1271 = 0,0364
Oplossing

In de tabel voor de standaardnormale verdeling kunnen we vinden:

P(z ≥ 0,98) = 0,1635 en P(z ≥ 1,14) = 0,1271
Nu is: P(0,98 ≥ z ≥ 1,14) = 0, 1635 - 0, 1271 = 0,0364
Opgave 4.6

Hoe groot is de kans op een z tussen - 0,25 en + 0,30?
Opgave 4.6

Hoe groot is de kans op een z tussen - 0,25 en + 0,30?
Oplossing

P(z ≥: - 0,25) = 1 - P(z < - 0,25) = 1- P(z ≥ +0,25) = 1 - 0,4013 = 0,5987;
P(z ≥ + 0,30) = 0,3821;

en dus
P(- 0,25 ≤  z ≤  + 0,30) = 0,5987 - 0,3821 = 0,2166.
Oplossing

P(z ≥: - 0,25) = 1 - P(z < - 0,25) = 1- P(z ≥ +0,25) = 1 - 0,4013 = 0,5987;
P(z ≥ + 0,30) = 0,3821;

en dus
P(- 0,25 ≤ z ≤ + 0,30) = 0,5987 - 0,3821 = 0,2166.
Bij de standaardnormale verdeling kunnen we inmiddels alle kansen die we willen weten, opzoeken in de tabel. We blijken de tabel van de standaardnormale verdeling echter vooral nodig te hebben als we kan­sen willen berekenen waarin niet de standaardnormale, maar
een 'ge­wone ' normale verdeling is gegeven met een bepaalde µ en a.
Om dergelijke kansen te bepalen maken we gebruik van het feit dat
Om dergelijke kansen te bepalen maken we gebruik van het feit dat
de overschrijdingskans van een bepaalde waarde a bij een gewone norma­le verdeling gelijk is aan de overschrijdingskans van de z-score van die waarde  a bij  de standaardnormale verdeling.
de overschrijdingskans van een bepaalde waarde a bij een gewone norma­le verdeling gelijk is aan de overschrijdingskans van de z-score van die waarde a bij de standaardnormale verdeling.
Omdat we de z-score van elke X-waarde kunnen bepalen, kunnen we op deze wijze
Omdat we de z-score van elke X-waarde kunnen bepalen, kunnen we op deze wijze
voor elke waarde van X de kans berekenen dat deze waarde naar links of naar rechts wordt overschreden. Door de gevonden overschrijdingskansen van elkaar af te trekken, kunnen we vervolgens kansen op waarden tussen willekeurige grenzen bepalen.
voor elke waarde van X de kans berekenen dat deze waarde naar links of naar rechts wordt overschreden. Door de gevonden overschrijdingskansen van elkaar af te trekken, kunnen we vervolgens kansen op waarden tussen willekeurige grenzen bepalen.
Opgave 4.7

Gegeven is dat intelligentie (IQ) normaal is verdeeld met een gemiddelde 100 en een standaardafwijking van 15.

A.
Hoe groot is de ka ns dat een aselect getrokken persoon een IQ heeft dat gelij k is aan of hoger is dan 110?

B.
Hoe groot is de kans op een IQ van 85 of lager?

C.
Hoe groot is de kans op een IQ tussen 105 en 120?
A.
	
Gegeven is dat het IQ normaal is verdeeld. Het IQ van 110 moet daarom eerst wor den omgezet in een z-score, zodat we gebruik kunnen maken
van de standaardnormale verdeling: Dus:


In figuur 4.16 is deze kans weergegeven. Al met al treff...
A.

Gegeven is dat het IQ normaal is verdeeld. Het IQ van 110 moet daarom eerst wor den omgezet in een z-score, zodat we gebruik kunnen maken
van de standaardnormale verdeling: Dus:


In figuur 4.16 is deze kans weergegeven. Al met al treffen we in ongeveer 25% van de gevallen iemand met een IQ va n 110 of hoger.
B.
Hoe groot is de kans op een IQ van 85 of lager?
b	Ook hier moet de score eerst worden omgezet in een standaardnormale score, dus:

Dus de kans om iemand  te treff en  m et een IQ lager dan 85 is, afgerond, 0,16.
b Ook hier moet de score eerst worden omgezet in een standaardnormale score, dus:

Dus de kans om iemand te treff en m et een IQ lager dan 85 is, afgerond, 0,16.
C.
Hoe groot is de kans op een IQ tussen 105 en 120?
c	Ook hier maken we gebruik van z-scores:


De oppervlakte tussen  105 en  120 bij  de normale verdeling is even groot als die tussen z = 0,33 en z = 1,33 bij  de standaardnormale verdeling. 

Deze is gelijk  aan 0,2789, dus er is ongeveer 28...
c Ook hier maken we gebruik van z-scores:


De oppervlakte tussen 105 en 120 bij de normale verdeling is even groot als die tussen z = 0,33 en z = 1,33 bij de standaardnormale verdeling.

Deze is gelijk aan 0,2789, dus er is ongeveer 28% kans op iemand met een IQ tus­ sen 105 en 120.
Veronderstel dat een tentamen uit 50 driekeuze-items bestaat en ie­ mand geslaagd is met 37 of meer items goed.

We willen weten hoe groot de kans is om te slagen wanneer we alleen maar raden. Dit bete­kent dat we de kans moeten uitrekenen op 37 items goed, 38 items goed, tot en met 50 item s goed.

Als X het aantal items 'goed' is, kunnen we de gevraagde kansen berekenen met behul p van de binomiale ver­deling. Gevraagd wordt dan:

P(X = 37 óf X = 38 óf X = 39 óf ... óf X = 50) =
P(X = 37) + P(X = 38) + P(X = 39) + .. . + P(X = 50)

Voor X = 37 en X = 38 laten we deze kansen nog eens zien:
Het zal duidelijk  zijn  dat het berekenen  van zulke kansen via de bino­miale verdeling veel rekenwerk  vergt . 

Maar het kan eenvoudiger.
Het zal duidelijk zijn dat het berekenen van zulke kansen via de bino­miale verdeling veel rekenwerk vergt .

Maar het kan eenvoudiger.
Als n groot is dan nadert de binomiale verdeling de
normale verdeling
Naarmate n groter wordt , gaat de grafiek van een binomiale verdeling steeds meer lijken op een normale verdeling.

Als n groot genoeg is, mogen we net doen
of de binomiale verdeling een normale verdeling is; dit kan zonder veel risico als n · p > 5 én n · q > 5. 

Elke kans kunnen we met behulp van de tabel voor de standaard normale verdeling bere­kenen als we van een normale verdeling de verwa...
of de binomiale verdeling een normale verdeling is; dit kan zonder veel risico als n · p > 5 én n · q > 5.

Elke kans kunnen we met behulp van de tabel voor de standaard normale verdeling bere­kenen als we van een normale verdeling de verwachte waarde en de standaardafwijking kennen.

Dus ook P (X ≥ 37) kunnen we berekenen. We weten inmiddels immers dat de verwachte waarde va een binomi­aal verdeelde variabele gelijk is aan μ = n · p en dat de standaardafwij­king gelijk is aan:
In ons probleem is

n = 50 en p = 1/3.

In dat geval is

n · p = 16,67 en n · q = 33,33.

Beide zijn groter dan 5, dus we mogen de normale verdeling gebruiken als benadering van de bimomiale verdeling.

Als n = 50 en p = 1/3, dan is de verwachte waarde
µ = 50 · 1/3 = 16,67 en de standaardaf­wijking is:
Als n = 50 en p = 1/3, dan is de verwachte waarde 
µ = 50 · 1/3 = 16,67 en de standaardaf­wijking is:
Als n = 50 en p = 1/3, dan is de verwachte waarde
µ = 50 · 1/3 = 16,67 en de standaardaf­wijking is:
Continuïteitscorrectie

AIs we de binomiale verdeling benaderen met een normale verdeling, dan benad eren we een discrete verdeling met een continue verdeling. Want men heeft óf 37 óf 38 item s goed , maar daartussen liggen geen waarden .

Het is niet mogelijk 37,5 items goed te hebben. Bij een continue verdeling (bijvoorbeeld de normale verdeling) ligt tussen twee waarden altijd nog een andere waarde, hoe klei n et verschil ook is. Dit aaneen sluitingsprobleem ossen we op door te zeggen dat X = 37 in feite 36,5 ≤ X ≤ 37,5 betekent en X = 38
in feite 37,5 ≤ X ≤ 38,5. De kans P(X 2 ≥ 37) wordt onder de normale verdeling dan P(X 2 ≥ 36,5) . Dit noem en we de continuïteitscorrectie. De benadering van de binomiale verdeling door de normale verdeling wordt verbeterd wanneer de volgende continuïteitscorrectie wordt toegepast:

bij de berekening van de rechter overschrijdingskans PR(X) moeten we 0,5 aftrekken van X. bij de berekening van de linker overschrijdings­ kans PL(X) moeten we 0,5 optellen bi j X.

bij de berekening van de tweezijdigeoverschrijdingskans berekenen we 2 · PR(X) (m et PR(X) zoals hiervóór wanneer X > μ) of 2 · PL(X) (m et PL(X) zoals hiervóór wanneer X < µ)
'Onze' X is dus normaal verdeeld met µ = 16,67 en σ = 3,33. We kunnen de opgave nu herformuleren.
De vraag wordt thans:

Hoe groot is P(X 37) als X normaal is verdeeld met µ 16,67 en σ = 3,33?
Deze kans kunnen we  opzoeken in de tabel voor de standaardnormale verdeling. Echter de tabel stopt bij z = 4 met  P(z  4) = 0,00003; dus P(z   5,95) is nóg kleiner. 

Met andere woorden: wanneer een tentamen uit 50 driekeuze-items bestaat, is ...
Deze kans kunnen we opzoeken in de tabel voor de standaardnormale verdeling. Echter de tabel stopt bij z = 4 met P(z 4) = 0,00003; dus P(z 5,95) is nóg kleiner.

Met andere woorden: wanneer een tentamen uit 50 driekeuze-items bestaat, is het vrijwel uitgesloten om zevenen­ dertig of meer items goed te hebben door uitsluitend te gokken .
Opgave 4.8

Veronderstel dat een toets uit veertig meerkeuzevragen bestaat en men ge­slaagd is met negenentwintig of meer items goed. Alle items zijn even
moeilijk en de p-waarde van elk item (de kans om een item goed te hebben ) is 0, 75. Hoe groot is de kans om te slagen?
Antwoord

Omdat zowel n · p als n · q groter zijn dan 5, mogen we de binomiaal verdeelde variabele X  behandelen  als een normaal verdeelde variabele. 

Het  'gemiddelde',  ofwel het  verwachte aantal  goed , van  deze  normale verdeling is ...
Antwoord

Omdat zowel n · p als n · q groter zijn dan 5, mogen we de binomiaal verdeelde variabele X behandelen als een normaal verdeelde variabele.

Het 'gemiddelde', ofwel het verwachte aantal goed , van deze normale verdeling is μ = n · p = 40 x 0,75 = 30 en de standaardafwijking is:
Door over te stappen van de normale verdeling op de standaardnormale verdeling kunnen we de gevraagde kans na toepassing van de continuïteits­ correctie als volgt berekenen :
Wanneer mogen we zeggen dat een binomiaalverdeelde variabele nor­maal is verdeeld?
Een volstrekt eensluidend antwoord is daarop niet mogelijk, want dat hangt af van de nagestreefde nauwkeurigheid.
De gangbare vuistregel is dat de benadering van de binomiale verdeling door de normale verdeling goed is
De gangbare vuistregel is dat de benadering van de binomiale verdeling door de normale verdeling goed is

wanneer n · p > 5 én n · q > 5.
De gangbare vuistregel is dat de benadering van de binomiale verdeling door de normale verdeling goed is

wanneer n · p > 5 én n · q > 5.


Wanneer we de binomiale verdeling benaderen met behulp van de standaardnorma le verdeling, dan gebruiken we als benaderingsformu­le:
Wanneer we de binomiale verdeling benaderen met behulp van de standaardnorma le verdeling, dan gebruiken we als benaderingsformu­le:
Wanneer we de binomiale verdeling benaderen met behulp van de standaardnorma le verdeling, dan gebruiken we als benaderingsformu­le: