Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
40 Cards in this Set
- Front
- Back
Definition "messen"
|
= regelgeleitete Zuordnung von Zahlen zu Objekten oder Ereignissen (nach Stevens)
|
|
Definition "testen"
|
--> viele unterschiedliche und unterschiedlich weit gefasste Definitionen
|
|
Definition "psychologische Tests"
|
- im engeren Sinn: Verfahren, die nicht willentlich in eine best. Richtung verfälscht werden können
- im weiteren Sinn: auch Fragebögen und standardisierte Interviews und stand. Beobachtungen |
|
Arten von Tests (nach Rost)
|
- Leistungstests (HAWIE-R, HAWIK, HAWIVA)
- Persönlichkeitsfragebögen (NEO_PIR, NEO-FFI) - Objektive Persönlichkeitstests - Projektive Tests (Rorschach, TAT) - Situationsfragebögen - Symptomlisten (SCL-90-R) - Einstellungstests - Motivations- und Interessenfragebögen - Verhaltensfragebögen |
|
Antwortformate
|
- freie vs. gebundene Antwortformate
- beides hat Vor- und Nachteile - muss zur Fragestellung und Testart passen - Freie AF: hoher Aufwand für VL/VP (Zahlenreihen ergänzen, Lückentexte, Projektive Tests) |
|
Allgemeines zu Ratingskalen
|
- Kategorieanzahl festlegen --> je mehr, desto mehr Varianz (gut = nicht mehr als 7)
- zu viele --> Überdifferenzierung/Überforderung des Probanden - Mittelkategorie (neutral) oder Forced-Choice-Format (künstlich erzeugte Varianz) |
|
Aufgabentypen (gebundene Antwortformate)
|
- Richtig-Falsch-Aufgabe
- Mehrfach-Wahl-Aufgabe (Multiple Choice) - Umordnungsaufgabe - Zuordnungsaufgabe - Rangordnung bilden - Sortieraufgabe - Abgestufte Rating- oder Schätzskalen - Analoge Rating- oder Schätzskalen |
|
Richtig-Falsch-Aufgabe
|
- einfache Auswertung
- 50% Ratewahrscheinlichkeit - dichotom (auch ja/nein, stimme zu/stimme nicht zu) |
|
Multiple-Choice-Aufgaben
|
- Ratewahrscheinlichkeit ist abhängig von Anzahl und Schwere Antwortalternativen und dem Fragemodus (immer nur 1 Antwort richtig oder unterschiedlich viele)
|
|
Umordnungsaufgabe
|
- Bsp. Satzteile in die richtige Reihenfolge bringen
|
|
Zuordnungsaufgabe
|
- Bsp. verschiedenen chem. Verbindungen die richtigen (abgebildeten) Formelzeichen zuordnen
|
|
Rangordnung bilden
|
- Präferenz für bestimmte Objekte etc. erfassen
|
|
Sortieraufgaben
|
- Items zu bestimmten Kategorien zuordnen ("einsortieren")
|
|
Abgestufte Rating- oder Schätzskalen
|
- wichtig sind Anzahl der Antwortkategorien, Verhaltensanker/verbale Etikettierung, unipolar vs. bipolar
- Stimme zu, stimme eher zu, weder noch, stimme eher nicht zu, stimme nicht zu... |
|
Analoge Rating- oder Schätzskalen
|
- Antwort wird auf Kontinuum eingetragen (Kreuz auf Line machen, deren Enden Extreme/Gegensätze darstellen)
|
|
Hauptgütekriterien
|
- Objektivität
- Reliabilität - Validität |
|
Objektivitätsarten
|
- Durchführungsobjektivität
- Auswertungsobjektivität - Interpretationsobjektivität |
|
Definition "Objektivität"
|
= Ausmaß der Unabhängigkeit vom Versuchsleiter (VL)
Ist Test (Durchführung, Auswertung, Interpret.) so genau festgelegt, dass er unabhängig von Zeit, Ort, VL und Auswerter durchgeführt werden kann? |
|
Definition " Durchführungsobjektivität"
|
= VL hat keinen Einfluss auf die Testergebnisse der Versuchsperson (VP)
--> Erreichbar durch hohe Standardisierung |
|
Definition "Auswertungsobjektivität"
|
= Unabhängigkeit der Testergebnisse vom Auswerter
--> Jeder muss auf Grundlage der Antworten zum selben Ergebnis kommen |
|
Definition "Interpretationsobjektivität"
|
= Unabhängigkeit der Schlussfolgerungen
--> genau festgelegt, welche Bedeutung jedes Ergebnis hat (kein Einfluss durch Auswerter) |
|
Definition "Reliabilität"
|
= Ausmaß der Genauigkeit, mit der ein Test das misst, was er misst
(Messfehler? Replizierbar?) |
|
Bestimmung der Reliabilität
|
- Retest (Testwiederholung)
- Paralleltest (Vergleich der Ergebnisse mit denen aus ähnlichen Tests) - Split-half (Vergleich der Testhälften) - Interne Konsistenz (Itembeziehungen) |
|
Definition "Validität"
|
= Maß wie gut ein Test misst, was er messen soll (wichtigstes Kriterium)
(Sind Schlussfolgerungen verlässlich in Bezug auf das zu messende Konstrukt) -Bsp.: Depressivität) |
|
Validitätsarten
|
- Inhaltsvalidität
- Konstruktvalidität (konvergent/diskrimminant) - Kriteriumsvalidität (konkurrent/prädiktiv) |
|
Definition "Inhaltsvalidität"
|
= ist gegeben, wenn Items repräsentativ für die Grundgesamtheit aller möglichen Items sind
(meist von Experten beurteilt) |
|
Definition "Konstruktvalidität"
|
= ist gegeben, wenn sich Testergebnisse der VP auf Merkmalsausprägung des zugrunde liegenden Konstrukts zurückführen lassen
--> konvergent = hohe Korrelation mit Tests, die dasselbe Konstrukt messen --> diskrimminant = geringe Korrelation mit Tests, die ANDERES Konstrukt messen |
|
Definition "Kriteriumsvalidität"
|
= ist gegeben, wenn durch Testergebnisse die Ausprägung der VP auf dem zu messenden Konstrukt vorhersagen lässt
--> Konkurrent = aktuelle Ausprägung --> prädiktiv = zukünftige Ausprägung |
|
Nebengütekriterien
|
- Nützlichkeit
- Ökonomie - Zumutbarkeit - Unverfälschbarkeit - Testfairness - Skalierung - Normierung |
|
Definition "Nützlichkeit"
|
Test ist nützlich wenn,
- Testeinführung sinnvoll - keine/wenige Tests vorhanden, die dasselbe Konstrukt messen - besser geeignet als andere Tests - Messaufwand reduziert wird |
|
Definition "Ökonomie"
|
= sparsam (Material/Zeit) und kostengünstig
|
|
Definition "Zumutbarkeit"
|
= Verhältnis aus Belastung für VP und Bedeutung der Ergebnisse
|
|
Definition "Unverfälschbarkeit"
|
= Testwerte nicht durch Verhaltensweisen von VP/VL manipulierbar
|
|
Definition "Testfairness"
|
- keine Benachteiligung bestimmter Personengruppen
- besonders relevant für Test auf deren Grundlage Selektionsentscheidungen getroffen werden (Personalauswahl/Schuleignung) - KEIN psychometrischer Begriff! |
|
Definition "Skalierung"
|
= angemessenes Messniveau in Bezug auf Komplexität des Konstrukts
--> Bildung eines Testwertes durch gültige Rechenvorschrift - Frage nach ausreichender Quantifizierbarkeit der Daten |
|
Definition "Normierung"
|
= angemessene Eichstichprobe --> erlaucht zuverlässigen Vergleich von Individuum und Population
|
|
Definition "Eichstichprobe
|
- Repräsentativ für die zu interessierende Personengruppe
- aktuelle (Überprüfung alle 8 Jahre) - Zusammensetzung/Auswahl soll genau beschrieben werden - Daumenregel: mind. 300 Probanden |
|
Definition "Itemkennwerte"
|
- Geben Hinweis, wie gut Messinstrument ist
- Entscheidungshilfe fürs Beibehalten/nachträgliche Entfernen eines Items - Geben Hinweis, wie stark Zusammenhang zw. Item und Testergebnis - Zeigen, wie gut Item Varianz im zumessenden Konstrukt aufzeigt |
|
Itemkennwerte
|
Kennwerte einzelner Items
- Schwierigkeit - Varianz Beziehungen zwischen Items - Item-Interkorrelation - Trennschärfe |
|
Definition + Formel "Itemschwierigkeit"
|
Dichotome-Items:
= Lösungswahrscheinlichkeit p(x) = richtig gelöste Items/alle Items --> NR(x)/N Mehrstufige Items = Mittelwert der Stichprobe --> = ((Item 1*Anzahl Antworten für dieses Item)+ (Item 2 * ...) +...) / Gesamtanzahl der Antworten = |