Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
22 Cards in this Set
- Front
- Back
Variables qualitatives ? Définition et exemple |
Ce sont des champs descriptifs non numériques. Il y a deux sous-types : variable nominale et variable ordinale. Exemple d’une variable nominale: oui/non, homme-femme Exemple d’une variable ordinale: bas/moyen/haut |
|
Variables quantitatives? Définition et exemples. |
Ce sont des champs descriptifs numériques. Également appelés variables métriques. Il y a deux sous-types: valeurs discrètes ou continues. Cette première compte les valeurs entières, cette dernière les valeurs réelles.
Exemple valeurs discrètes: nb de lettres, age, date Exemple valeurs continues: fréquence relative, mesures expérimentales |
|
Données ? |
- collection d’objets étudiés (p.ex des mots, des locuteurs…) - individus - représentées pas des lignes dans un tableau |
|
Population |
Ensemble d’individus |
|
Échantillon |
En général, les données représentent uniquement une partie de ce qui est envisageable = un échantillon |
|
Variable ? |
- L’ensemble des caractéristiques d’un individu - représentée par des colonnes dans un tableau
|
|
Pourquoi les stats ? |
- observer les comportements globaux des données - décrire les données - généraliser - faire des inférences (stats inférentielles) : variables liées ?? - explorer - Faire des prédictions |
|
Pourquoi stats descriptives univariées ? |
- résumer caractéristiques pour chaque variable - identifier grandes tendances - repérer phénomènes intéressants |
|
Quelles sont les 3 dimensions de la description d’une variable ? |
1. Étendue: liste des valeurs, min et max 2. Tendance centrale: variable unique qui exprime le mieux la variable, moyenne/médiane/mode 3. Distribution: la répartition des valeurs, tableau d’effectifs, mesures descriptives simple (écart-type, variance) |
|
Mode ? |
La variable la plus fréquente. Calcul: il faut connaître pour chaque valeur du tableau le nb d’individus concernés, puis identifier la valeur avec la plus élevée. |
|
Comment peut-on observer la répartition des données ? |
Solution 1: en regardant la table des effectifs (mais cela n’est pas tjrs facile !) Solution 2: en générant une représentation graphique (plrs types existent) |
|
Comment calculer l’étendue des variables quantitatives ? |
Observer les valeurs min et max (trier les valeurs et regarder la première et la dernière) |
|
Comment observer la tendance centrale des variables quantitatives ? |
Calcul de la moyenne :somme des valeurs divisée par le nb d’individus Calcul de la médiane: valeur pour laquelle la moitié de la population a une valeur supérieure at l’autre moitié une valeur inférieure |
|
Comment interpréter la médiane et la moyenne ? |
Il est intéressant de comparer les deux, si elles diffèrent beaucoup cela veut dire que la répartition des valeurs n’est pas symétrique. |
|
Pourquoi faire un test khi-deux ? |
Pour tester l’existence d’une association entre 2 variables nominales en mesurant la distance entre elles. |
|
Coefficient de corrélation de Pearson ? Quel intérêt ? |
La corrélation de Pearson évalue le degré de dépendance linéaire entre des variables quantitatives. |
|
Quelles questions ne sont pas répondues avec les mesures d’étendue et de tendance centrale ? |
- les individus, sont-ils tous proches de la valeur centrale ou y a -t-il une grand écart ? - est-ce que la répartition est symétrique ? - est-ce que la répartition est homogène ? (Ou y a-t-il des trous ou des paquets ?) |
|
Quartile? |
Une tranche de la population. Le premier quartile est la valeur pour laquelle un quart de la population a une valeur inférieure. La médiane = 2eme quartile. |
|
La variance ? |
La somme des carrés des écarts divisée par le total d’individus |
|
Covariance ? |
Moyenne des produits des écarts à la moyenne.
Permet d’étudier la liaison linéaire entre deux variables quantitatives. |
|
Écart absolu moyen |
Il faut connaître les écarts. On enlève les signes devant chaque valeur. Ensuite on fait la moyenne de ces valeurs. |
|
Écart réduit |
Se calcule par individu. On divise son écart à la moyenne par son écart-type. Si le chiffre est supérieur à 2, il est atypique. |