adada
variable discrete / discontinue : Ce sont des variables dont les modalités sont nettement séparées. On peut compter le nombre d’individus associés à chacune des catégorie par exemple, on peut dire une phrase comme "il y a 123 hommes et 118 femmes"). Le plus souvent ces variables possèdent un nombre très limité de modalités mais pas nécessairement. Le nombre de grains de sables sur une plage est une donnée discontinue par essence : on pourrait les compter mais il n’y a rien entre 2 entier consécutifs Variable continue La taille d’un individu est une quantité mesurable avec une précision presque infinie à l’échelle de nos sens humains. Autrement dit, on pourrait zoomer : mesurer des mètres, puis des centimètres, puis des millimètres, ..., des micromètres, etc. Une telle caractéristique sera alors dite continue et possède potentiellement une infinité de modalités. On peut découper une variable continue (comme la taille) en intervalles séparés et mutuellement exclusifs. Chacun de ces intervalles se comporte alors comme une catégorie Les échelles de Stevens : Échelles nominales : La variable est qualitative. Ses modalités sont des catégories, et il n’existe aucune relation d’ordre entre les différentes modalités de la variable. Échelles ordinales : La variable est qualitative ET il existe une relation d’ordre entre les modalités, ie, qu’il est possible de les classer de la plus petite à la plus grande (ou l’inverse). Échelles numériques : Les modalités sont des nombres mesurant des caractéristiques telles que cela fait sens de considérer l’égalité des intervalles (2 −1 =3−2) et éventuellement l’égalité des rapports (ce qui suppose l’existence d’un zéro absolu) variance SOM(XI-MOYENNEXI)/N Variance echantillons pareil mais /N-1 ecart type racine carré variance Ecart inter Quartile : Q3-Q1 diagramme : Diagramme a bar : Le diagramme à barre s'emploie avec des variables discrètes Le trait essentiel : la hauteur des barres est directement proportionnelle à l'e ectif (ou à la fréquence) de chaque modalité : plus l'e ectif est important, plus la barre associée à cette modalité est haute La surface de la barre ne doit généralement pas varier On peut donc utiliser une variante, le diagramme en bâtons où la barre est réduite juste à un trait Diagramme a secteur (camemberts) Illustrer les importances relatives des modalités d'une variable discrète On les rencontre abondamment dans la presse grand public et très peu dans la littérature scientique ils sont déconseillé Diagramme a moustache (bloxplot) : Ce type de représentations est adapté aux variables ordinales. Elle se compose, au minimum, d'une boîte rectangulaire et de deux traits. Lorsque la disposition du graphique est horizontale, les deux traits peuvent faire penser à des moustaches, d'où le nom. La boîte centrale est limitée par Q1 et Q3 avec le trait vertical positionnant la médiane. Les moustaches délimitent des observations non extrêmes. Des points externes peuvent signaler la présence de données extrêmes Diagramme histogramme : L'histogramme a une apparence très proche de celle du diagramme à barres Les positions sur l'axe horizontal représentent les valeurs possibles de la variable. On ne représente généralement pas les modalités elles-mêmes pour une variable continue il y en a une infinité mais des intervalles. Par exemple, les âges de 10 à 20 ans, puis de 20 à 30 ans Centration : Consiste à retrancher du score brut de chaque individu la moyenne observée sur l'ensemble des individus Réduction : Consiste à diviser le score centré de chaque individu par l'écart-type observé sur l'ensemble des individus Zi : (XI-MoyenneX)/sx (moyenne = 0 plus ou moins que 0= different de la moyenne) Standardisation : zi*a+b cov(X,Y) Somme(Xi-MoyenneX)(Yi-MoyenneY)/n-1 coefficient de correlation r = cov(X,Y)/sx*sy +1 ca monte -1 ca descend 0 y'a pas de correlation Aij = (Li*Ci)/n chi^2 = (Oij-Aij)^2)/Aij V : = racine2:(Chi^2/n*min(l-1,c-1))