• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/22

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

22 Cards in this Set

  • Front
  • Back

Variables qualitatives ?


Définition et exemple

Ce sont des champs descriptifs non numériques. Il y a deux sous-types : variable nominale et variable ordinale.


Exemple d’une variable nominale: oui/non, homme-femme


Exemple d’une variable ordinale: bas/moyen/haut

Variables quantitatives?


Définition et exemples.

Ce sont des champs descriptifs numériques. Également appelés variables métriques. Il y a deux sous-types: valeurs discrètes ou continues. Cette première compte les valeurs entières, cette dernière les valeurs réelles.



Exemple valeurs discrètes: nb de lettres, age, date


Exemple valeurs continues: fréquence relative, mesures expérimentales

Données ?

- collection d’objets étudiés (p.ex des mots, des locuteurs…)


- individus


- représentées pas des lignes dans un tableau

Population

Ensemble d’individus

Échantillon

En général, les données représentent uniquement une partie de ce qui est envisageable = un échantillon

Variable ?

- L’ensemble des caractéristiques d’un individu


- représentée par des colonnes dans un tableau


Pourquoi les stats ?

- observer les comportements globaux des données


- décrire les données


- généraliser


- faire des inférences (stats inférentielles) : variables liées ??


- explorer


- Faire des prédictions

Pourquoi stats descriptives univariées ?

- résumer caractéristiques pour chaque variable


- identifier grandes tendances


- repérer phénomènes intéressants

Quelles sont les 3 dimensions de la description d’une variable ?

1. Étendue: liste des valeurs, min et max


2. Tendance centrale: variable unique qui exprime le mieux la variable, moyenne/médiane/mode


3. Distribution: la répartition des valeurs, tableau d’effectifs, mesures descriptives simple (écart-type, variance)

Mode ?

La variable la plus fréquente. Calcul: il faut connaître pour chaque valeur du tableau le nb d’individus concernés, puis identifier la valeur avec la plus élevée.

Comment peut-on observer la répartition des données ?

Solution 1: en regardant la table des effectifs (mais cela n’est pas tjrs facile !)


Solution 2: en générant une représentation graphique (plrs types existent)

Comment calculer l’étendue des variables quantitatives ?

Observer les valeurs min et max (trier les valeurs et regarder la première et la dernière)

Comment observer la tendance centrale des variables quantitatives ?

Calcul de la moyenne :somme des valeurs divisée par le nb d’individus


Calcul de la médiane: valeur pour laquelle la moitié de la population a une valeur supérieure at l’autre moitié une valeur inférieure

Comment interpréter la médiane et la moyenne ?

Il est intéressant de comparer les deux, si elles diffèrent beaucoup cela veut dire que la répartition des valeurs n’est pas symétrique.

Pourquoi faire un test khi-deux ?

Pour tester l’existence d’une association entre 2 variables nominales en mesurant la distance entre elles.

Coefficient de corrélation de Pearson ? Quel intérêt ?

La corrélation de Pearson évalue le degré de dépendance linéaire entre des variables quantitatives.

Quelles questions ne sont pas répondues avec les mesures d’étendue et de tendance centrale ?

- les individus, sont-ils tous proches de la valeur centrale ou y a -t-il une grand écart ?


- est-ce que la répartition est symétrique ?


- est-ce que la répartition est homogène ? (Ou y a-t-il des trous ou des paquets ?)

Quartile?

Une tranche de la population. Le premier quartile est la valeur pour laquelle un quart de la population a une valeur inférieure. La médiane = 2eme quartile.

La variance ?

La somme des carrés des écarts divisée par le total d’individus

Covariance ?

Moyenne des produits des écarts à la moyenne.



Permet d’étudier la liaison linéaire entre deux variables quantitatives.

Écart absolu moyen

Il faut connaître les écarts. On enlève les signes devant chaque valeur. Ensuite on fait la moyenne de ces valeurs.

Écart réduit

Se calcule par individu. On divise son écart à la moyenne par son écart-type. Si le chiffre est supérieur à 2, il est atypique.