Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
21 Cards in this Set
- Front
- Back
Unterschiede zwischen Absolute und Relative Häufigkeit |
Die Absolute Häufigkeit bezeichnet die Anzahl der Elemente der Menge Die Relative Häufigkeit gibt die Merkmalsausprägung an. |
|
Definiere das Arithnetische Mittel |
= Lagemaß & Durchschnitt/ Mittelmaß aller Beobachtungen Es sei die Urliste eines mindestensintervallskalierten Merkmals . Dann heißtdas arithmetische Mittel der Beobachtungen .In R: mean()
|
|
Definiere den Interquartilabstand |
Ein Streuungsmaß, das Aufschlüsse über die Verteilung der Daten zwischen dem 3. und 1. Quartil liefert.Der Interquartilsabstand ist wie der Median robust gegenüber Ausreißern. In R: IQR() |
|
Definiere die Lagemaße |
Eine Maßzahl, die das Zentrum einer Verteilung durch einen numerischen Wert beschreibt.Das zu wählende Lagemaß ist vom Skalenniveau des Merkmals abhängig. |
|
Was sind die 5 Streuungsmaße einer empirischen Verteilung. |
Varianz, Standardabweichung, Spannweite, Interquartilabstand, Variationkoeffizient |
|
Definiere die Varianz und Standardabweichung |
Die Varianz ist die quadrierte Abweichung vom arithmetischen Mittel, somit fallen große Abweichung stark ins gewicht Die Standardabweichung ist die Wurzel der Varianz |
|
Was ist die Empirische Verteilungsfunktion? |
Die Epirische Verteilungsfunktions stellt die kumulierten relativen Häufigkeiten aller Mermalsausprägung a in einer Grafik dar |
|
In R wurde folgender Output erzeugt: > M = c(29.5, 28.7, 31.8, 15.1 )> mean[M][1] 26.275 Berechne die Stichprobenvarianz. |
> var(M)[1] 57.22917 |
|
nj: die Anzahl der Mannschaften die aj Tore geschossen haben Berechne die empirische Verteilungsfunktion F(2) |
In R:ecdf(2) |
|
Definiere die Rangwertreihe |
Die Beobachtungswerte x1, . . . , xn eines ordinal- oder metrischskalierten Merk-mals heißt die aufsteigend geordnete Auflistung der Beobachtungswerte Ranwertreihe. Der Wert x(j) wird als j-ter Rangwert bezeichnet. Der Rang des Arithmetischen Mittels (xj) wird mit der Funktion bestimmt |
|
In R: Commands für Kunchen, Balken, Punkt-diagramm |
Kuchen: pie() Balken: Barplot() Punkte: dotchart() Die x und y Achsen beschriftet man jeweils mit xlab= oder ylab= |
|
Was is die Spannweite? |
Die Spannweite ist die Differenz zwischen Max xn und Min x1 |
|
Was is der Variationskoeffizient? |
Der Variationskoeffizient ist der Quotient zwischen der Standardabweicung und des Arithmetischen Mittels und ist somit selbsteine dimensionslose Größe. DEr eignet sich auch zum Vergleich der Streuung zweierDatensätze, die in unterschiedlichen Einheiten gemessen wurden. |
|
Was kann die lineare Transformation |
Die Anwendung einer linearen Transformation y = a + bx auf den me- trischskalierten Datensatz x1, . . . , xn liefert den linear transformierten Datensatz y1, . . . , yn mit yi =a+bxi Es gilt auch |
|
Definiere Standardtisierung |
Seien x1, . . . , xn Beobachtungswerte mit positiver empirischer Standardabwei-chung sxn > 0 und arithmetischem Mittel xn. Die lineare Transformation heißt Standardisierung. Die transformierten Daten z1, . . . , zn werden als standardisiert bezeichnet. Nach einer Standardisierung besitzen unterschiedliche Datensätze den gleichen empiri-schen Mittelwert 0 und die gleiche empirische Standardabweichung 1. |
|
Definiere Zentralisierung |
|
|
Definiere Klassenbildung |
Ziel ist es Daten x1, . . . , xn in Klassen K1, . . . , KM zusammenzufassen. Die resultierendenDaten werden dann als klassiert bezeichnet. Eine Einteilung des Wertebereiches [a, b]in Intervalle K1 = [v0,v1],K2 = (v1,v2],...,KM = (vM−1,vM]mit a=v0 |
|
Definition von der relativen Häufigkeiten einer Klassierung |
|
|
Definition von der absoluten Häufigkeiten einer Klassierung |
|
|
Was ist ein Histogramm? |
Es ist ein Histogramm, wenn auf der horizontalen Achse werdendie Klassengrenzen v0 bis vM abgetragen. Über jedem Intervall Kj wird ein Rechteck gezeichnet,dessen Breite gleich bj ist. Die Höhe hj berechnet sich gemäß der Formel |
|
Wie ist ein Boxplot aufgebaut? |
Ein Boxplot visualisiert die Fünf-Punkte-Zusammenfassung einer Urliste x1, . . . ,xn bestehend aus dem Minimum, dem Median der unteren Hälfte des Datensatzes x ̃0.5,u, dem Median, dem Median der oberen Hälfte des Datensatzes x ̃0.5,o und dem Maximum. Der untere undobere Median definieren dabei eine Box. Zusätzlich werden an den Rändern der Box whiskers (engl.Schnurrhaare) abgetragen zur Repräsentation der Randbereiche. Die Länge der whiskers wird ausdem 1.5-fachen der Boxlänge (ungefähr der Interquartilsabstand) berechnet, wobei das jeweilige Endeauf die unmittelbar davor liegende Beobachtung verkürzt wird. Werte die nicht mehr durch die whiskers erfasst werden, werden als Ausreißer mit einem Punkteingezeichnet In R: boxplot() |