• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/26

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

26 Cards in this Set

  • Front
  • Back

Definiere: Bestimmtheitsmaß

Ein bewertendes Maß für die Güte der angepassten Regressions-gerade.


Je höher Rxy^2, desto besser die Modellanpassung. D.h. die Rest-streuung (Fehler)  Se^2 ist fast oder gleich 0.

Ein bewertendes Maß für die Güte der angepassten Regressions-gerade.




Je höher Rxy^2, desto besser die Modellanpassung. D.h. die Rest-streuung (Fehler) Se^2 ist fast oder gleich 0.

Bestimme die Korrelationsrechnung und die dazugehörige Kennzahl nach dem Skalenniveau.

Definiere Residuum

Fehlerterm einer linearen Regression. Differenz aus Messwert bzw. Beobachtungswert  yi und angepasstem Regressionswert Dach yi.


Mögliche Gründe sind Messfehler und statistische Schwankungen, wie z.B Ausreißer auf die das Modell nicht angepass...

Fehlerterm einer linearen Regression. Differenz aus Messwert bzw. Beobachtungswert yi und angepasstem Regressionswert Dach yi.




Mögliche Gründe sind Messfehler und statistische Schwankungen, wie z.B Ausreißer auf die das Modell nicht angepasst ist.

Definiere Zusammenhangsmaße

Beschreiben Zusammenhänge zwischen (mindestens) zwei Variablen.


Beispiel: Alter und Miete


In der statistischen Analyse legt die Größe mit dem geringsten Messniveau die Methode fest.

Streudiagramme und Dichteschätzung

Grafische Hilfsmittel, die die Anordnung der Beobachtungspunkte quantitativer, d.h. metrisch skalierter Merkmale veranschaulichen.

Definition: Kontingenztafel

Eine tabellarische Darstellung der gemeinsamen Verteilungen von zwei- oder mehr qualitativen Merkmalen. Es wird stets das Nominalskalenniveau der Merkmale verwendet.

Eine tabellarische Darstellung der gemeinsamen Verteilungen von zwei- oder mehr qualitativen Merkmalen. Es wird stets das Nominalskalenniveau der Merkmale verwendet.

Bestimmung des Korrelationskoeffizienten  für die beiden Merkmale "Niederschlag" und "Umsatz".

Bestimmung des Korrelationskoeffizienten für die beiden Merkmale "Niederschlag" und "Umsatz".

Der Wert liegt sehr nahe bei der -1. Die beiden Merkmale scheinen stark negativ zusammenzuhängen. Je höher der "Niederschlag", desto geringer der "Umsatz".

Der Wert liegt sehr nahe bei der -1. Die beiden Merkmale scheinen stark negativ zusammenzuhängen. Je höher der "Niederschlag", desto geringer der "Umsatz".

Definition: Methode der kleinsten Quadrate

Methode zur Berechnung der angepassten Regressionsgerade


Die Gerade für die die Summe der quadratischen Differenzen zwischen Beobachungswerten  yi und prognostizierten werten y˜i minimal ist. 


Dach a und Dach b bezeichnen wir als Kleinste-Qu...

Methode zur Berechnung der angepassten Regressionsgerade




Die Gerade für die die Summe der quadratischen Differenzen zwischen Beobachungswerten yi und prognostizierten werten y˜i minimal ist.




Dach a und Dach b bezeichnen wir als Kleinste-Quadrate Schätzer.

Was ist die Empirische Unabhängigkeit?

Besteht zwischen den 2 nominalskalierten Merkmalen X und Y kein Zusammenhang, so sind sie empirisch Unabhängig.Dann gilt:

Besteht zwischen den 2 nominalskalierten Merkmalen X und Y kein Zusammenhang, so sind sie empirisch Unabhängig.Dann gilt:

Definition: Kleinste-Quadrate Schätzer

Die Werte von ba und a, für die die quadrierte Summe  Q(a,b) aus Beobachtungswert yi und Funktionswert y˜i ihr Minimum annimmt.

Die Werte von ba und a, für die die quadrierte Summe Q(a,b) aus Beobachtungswert yi und Funktionswert y˜i ihr Minimum annimmt.

Defnition: Korrelationskoeffizient von Bravis-Pearson

Ein Maß für die Stärke des Zusammenhangs zwischen zwei quantitativen Merkmalen. Er ist definiert als  r(X,Y) = r

Ein Maß für die Stärke des Zusammenhangs zwischen zwei quantitativen Merkmalen. Er ist definiert als r(X,Y) = r

Definiere Kovarianz

Zusammenhangsmaß zur Messung des linearen Zusammenhangs zweier Variablen mit gemeinsamer Wahrscheinlichkeitsverteilung. Beispiel: Gewicht und Größe einer Person


s˜xy=

Zusammenhangsmaß zur Messung des linearen Zusammenhangs zweier Variablen mit gemeinsamer Wahrscheinlichkeitsverteilung. Beispiel: Gewicht und Größe einer Person




sxy=

Assoziation und Korrelation

Assoziation: Steht für einen beliebigen Zusammenhang.




Korrelation: Linearer Zusammenhang & lineare Beziehung.




Bei ordinal skalierten Merkmalen sprechen wir auch vom Rangkorrelationskoeffizienten, da diese lineare Beziehung nur auf den Rängen basiert.

Definition: Korrelationsanalyse

Sie untersucht den Grad des linearen Zusammenhangs zweier mindestens intervallskalierten Merkmale.




Der Korrelationskoeffizient oder auch Bravais-Pearson-Korrelatioinskoeffizient ist das zu verwendende Maß.

X^2 für den Spezialfall der Vier-Felder-Tafel

Was ist die Randhäufigkeit

Randsummen der abs./ relativen Häufkeiten einer Kontingenztafel (am Rand ablesbar).

Randsummen der abs./ relativen Häufkeiten einer Kontingenztafel (am Rand ablesbar).




In R :add margins()

Definition: Lineare Regression

Ein Modell zur Beschreibung des linearen Zusammenhangs zwischen  X und Y . Es gilt:

Ein Modell zur Beschreibung des linearen Zusammenhangs zwischen X und Y . Es gilt:

Definition: Pearson Chi-Quadrat

Maßzahl für den in einer Quadratischer Abstand zwischen der und Häufigkeit in Relation zur Häufigkeit

Maßzahl für den in einer Quadratischer Abstand zwischen der und Häufigkeit in Relation zur Häufigkeit

Bedingte Häufigkeit

Definiere den Kontigenzkoeffizient

X^2 kann grundsätzlich sehr große Werte annehmen und ist nicht auf das Intervall [0,1] beschränkt. Um die Abhängigkeit des Koeffizienten vom Stichprobenumfang auszuschalten, wird auf Basis des χ2 der Kontingenzkoeffizient C (auch CC od...

X^2 kann grundsätzlich sehr große Werte annehmen und ist nicht auf das Intervall [0,1] beschränkt. Um die Abhängigkeit des Koeffizienten vom Stichprobenumfang auszuschalten, wird auf Basis des χ2 der Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson ermittelt

Dfiniere den Korrigierten Kontigenzkoeffizient

Definiere: Rangkorrelationskoeffizient nach Spearman

Mit der Spearman-Korrelation misst man ebenso wie mit der Pearson-Korrelation den Zusammenhang zwischen zwei Variablen. Er nimmt ebenso Werte von -1 (perfekte negative Korrelation) bis +1 (perfekte positive Korrelation) an, und ist nahe bei 0, ...

Mit der Spearman-Korrelation misst man ebenso wie mit der Pearson-Korrelation den Zusammenhang zwischen zwei Variablen. Er nimmt ebenso Werte von -1 (perfekte negative Korrelation) (falls f wachsend und g fallend bzw umgekehrt) bis +1 (perfekte positive Korrelation) (f und g fallen oder wachsen zsm.) an, und ist nahe bei 0, falls gar keine Korrelation vorliegt.

Was ist eine QQ-Grafik? (In R: qqplot())

Die QQ-Grapfik ist ein exploratives, grafisches Werkzeug, in dem die Quantile zweier statistischer Variablen gegeneinander abgetragen werden, um ihre Verteilungen zu vergleichen

Wie minimiert man den Kleinste.Quadrate Schätzer?

Definiere normierte Residuen

Was ist das Ziel bei einer Residuenanalyse?

Das Ziel der Residuenanalyse ist die Überprüfung der verwendeten Modellannahmen, d.h.des angenommenen linearen Zusammenhangs. Der Residuenplot ist dabei ein Streudia-gramm in dem die angepassten Regressionswerte y 1, . . . , y n gegen die (normierten) Residuen abgetragen werden. Eine Verwendung der normierten Residuen d1,...,dn hat denVorzug, dass der Wertebereich stets auf das Intervall [−1, 1] beschränkt ist.