STATISTIQUE :
Document 1
1. Quelques
repères historiques : 2.
Les premières
approches: 3.
LES STATISTIQUES – LA STATISTIQUE 4.
Statistique
descriptive . 5.
Problèmes liés
à la saisie des informations : 6.
Les statistiques et les probabilités
|
1- repères historiques : L'empereur chinois
Yao organisait le recensement des productions agricoles en 2238 av J.C.
(c'étaient les tables statistiques agricoles) L'institution du
cadastre et du cens chez les égyptiens , date de 1700 av J.C. Ils relevaient
régulièrement les hauteurs des crues du Nil pour établir l'impôt. C'est grâce à un
recensement qu'on sait que Jésus Christ est né dans une étable. 2 - Les premières approches: Les premières études
statistiques descriptives sont dues à des anglais que préoccupait la
rentabilisation des assurances maritimes. Au XVIIIe siècle , l'idée que les
statistiques en matière démographique pouvaient servir de base à des
prévisions , s'est répandue en Angleterre . Il faut rappeler que c'est
l'époque où les problèmes concernant la population de l' Angleterre sont examinés avec des approches
économiques ( Malthus 1766-1834 ) . Mais on peut aussi citer les tables de
mortalité de Wargentin en Suède , sensiblement à la même époque ou de
Deparcieux en France (1703-1768) Pour prévoir
l'évolution démographique de la population anglaise , les fréquences (terme que nous allons
examiner plus loin ) observées sur des populations assez nombreuses étaient
assimilées à des probabilités , approximation légitime lorsqu'on dispose d'un
grand nombre d'observations. Adolphe Quetelet (Belge , 1796-1874) fut le premier à concevoir que la statistique pouvait être
fondée sur le calcul des probabilités (il a rencontré Fourrier et Poisson)
son œuvre est très vaste et elle
concerne aussi bien l' anthropométrie que l'économie et les sciences
sociales. Il faut attendre les premiers statisticiens anglais (vers
1900) pour voir apparaître réellement
une méthode statistique , une théorie bien formalisée de l'inférence , c'est à dire , du raisonnement
permettant , à partir des données observables de tirer des conclusions sur
les lois de probabilité des phénomènes. En résumé : La
statistique représente une méthode de recherche . Son champ d’application est
très vaste : les méthodes statistiques sont appliquées à la physique , à
la biologie , à la psychologie , à l’économie , à l’industrie …. Science ancienne ( nous
l’avons dit plus haut ) , la statistique
est utilisée ,, en sciences sociales
et sciences de
l’éducation , en médecine ; en psychologie ; en physique , en
fiscalité , etc….;et aussi en gestion des entreprises . 3 -
LES STATISTIQUES – LA
STATISTIQUE
Pourquoi "des
stats" ? Le couple
"Recensement - dénombrement" reste trop descriptif : il n'est pas réaliste
de penser compter tous les éléments d'une catégorie dont on sait qu'elle
relève des grands nombres ( le nombre d'arbres dans une forêt; le nombre
d'habitants d'un pays;…) On est obligé de
recourir à des techniques qui nous éviteront des tâches trop étendues , pour
un avantage relatif. Vocabulaire: Pour un recensement , on prend
en compte les réponses de la population toutes entière. Pour un sondage : une seule
partie seulement de la population est interrogée. Cette partie
est appelée : échantillon Dans la vie de tous les jours il est fondamental
pour qu’une entreprise (ou commerce) , ou société soit viable qu’elle puisse prévoir les tendances
saisonnières dans leur domaine d’activité ; pour cela elle doit faire
appelle aux statisticiens qui sera chargé d’étudier une population donnée
.A partir de l’analyse et l’interprétation des résultats d’enquête sur un
échantillonnage de cette population elle pourra établir de façon rationnelle
des programmes d’achat ou de fabrication. Le
terme « statistique » à un sens différent selon qu’il est employé
au pluriel ou au singulier . LES
STATISTIQUES : 1°) les statistiques
concerne l’ ensemble des documents
regroupant les données , comme par exemple les statistiques de vente ou les
statistiques d’accidents du
travail . Les statistiques sont le
recensement , l ' organisation et la représentation de données.(numériques) Les stratégies
économiques et industriels sont des
grandes utilisatrices de "statistiques" ;habitudes alimentaires , composition de la population , évolution
comparée des prix et des revenus ……. LA STATISTIQUE : 2°) La
statistique regroupe l’ensemble des
méthodes permettant d’obtenir et de traiter ces statistiques . Le mot
"statistique" désigne d'une part un ensemble de données
d'observation et d'autre part l'activité qui concerne leur recueil , leur
traitement et leur interprétation. La statistique est une
branche des mathématiques appliquées. L'essentiel des mathématiques qu'elle
utilise se retrouve dans la théorie des probabilités , qui n'est qu'un aspect
particulier de la théorie de la mesure .Les probabilités sont donc bien
distinctes de la statistique dont
elles constituent le modèle. Aussi , la statistique devra -t - elle ramener les phénomènes
réels à ce modèle probabiliste , chaque fois que cela sera possible . Bien entendu la statistique fait beaucoup de choses ,
mais elle ne fait pas tout. Par définition : La statistique est la
science qui a pour objet l’étude , l’analyse et l’interprétation des
observations relatives à des phénomènes collectifs. Il y a de nombreuses autres définitions concernant « la statistique ». Toutes
acceptables , certaines permettent
de comprendre , son
objet . Ainsi nous
en citons trois autres : -
la statistique est une étude
numérique des faits et de leurs rapports. -
La statistique est une science
qui a pour objet de recueillir un ensemble de données numériques relatives à tel ou tel phénomène
aléatoire et d’exploiter cette information pour établir toutes relations de
causalité par analyse et l’interprétation ; -
La statistique est une science
dont l’objet est de récolter une
information quantitative concernant des individus , des groupes , des séries de faits ,
etc ;…. Et de déduire , grâce à l’analyse de ces données , des significations précises ou des prévisions pour l’avenir . Elle commence là où la donnée d'un
tableau de nombres exprime des grandeurs liées au phénomène étudié : exemples le nombre
de naissances annuelles dans les dix dernières années , la répartition de ces
naissances en sexes , la catégorie socio - professionnelle des parents , etc
.. 5 - Problèmes liés à la saisie des
informations : L ' enquête
statistique et son traitement par l 'informatique font partie de notre vie.
Elle permet de répondre au désir de mieux connaître notre pays et le monde qui nous entoure , elle nous
aide à rechercher des solutions à de graves problèmes (natalité , mortalité , chômage ,etc. ) . Evidemment , si gérer , c’est prévoir , cela implique qu’avant de faire des prévisions , il est nécessaire
de « savoir » ; La statistique
permet d’avoir une meilleur
connaissance des faits et de faciliter la prise de décision . La plupart des entreprises ,
dans l ‘ensemble des services on utilise des statistiques .exemple :
gestion de stocks , entrées et sorties de marchandises , approvisionnement ;
….. |
SUITE : ► |
La théorie (ou le
calcul) des probabilités est une branche des mathématiques qui permet de modéliser
les phénomènes où le hasard intervient (initialement développée à propos des
jeux de hasard, puis progressivement étendue à l’ensemble des sciences
expérimentales, dont la physique et la biologie.)
Cette théorie
permet de construire des modèles de ces phénomènes et permet le calcul :
c’est à partir d’un modèle probabiliste d’un jeu de hasard comme le jeu de dés
que l’on peut prédire les fréquences d’apparition d’événements comme le nombre
de fois que l’on obtient une valeur paire en jetant un dé un grand nombre de
fois. Les éléments de calcul des probabilités indispensables à la compréhension
des statistiques seront traités dans la première partie du cours.
Sous jacente à la
notion de statistiques se trouve la notion de Population dont on souhaite connaître
les propriétés (plus précisément les régularités), permettant en particulier de
savoir si deux populations sont identiques ou non. Ce cas est celui du cadre
des essais thérapeutiques, où l’on considère 2 populations (patients traités
avec le médicament A ou avec le médicament B) dont on souhaite savoir si elles
diffèrent ou non (c’est le cas le plus simple des essais cliniques). Pour ce
faire il est nécessaire de modéliser les populations, en utilisant des modèles
probabilistes. Un modèle de ce type est par exemple de considérer que la taille
des individus suit une distribution gaussienne. A partir de ce modèle on peut
calculer les propriétés d’échantillons ; c’est ce qu’on appelle une
déduction qui va du modèle vers l’expérience. A l’inverse, considérant un
échantillon d’une population on peut essayer de reconstruire le modèle de la
population.
Cette démarche est
calquée sur la démarche scientifique habituelle. Le scientifique est capable,
en utilisant les mathématiques, de prédire le comportement d’un modèle donné
(c’est par exemple une « loi » de la physique) : c’est la
démarche déductive. A l’inverse, observant des faits expérimentaux il va tenter
de dégager des propriétés générales du phénomène observé qu’il va en général
représenter sous forme d’un modèle (toutes les lois de la physique et de la
chimie sont des modèles mathématiques les plus généraux possibles des faits
expérimentaux) : c’est la construction inductive de la théorie. Cette
démarche générale va plus loin car le modèle permet de prédire des expériences
non réalisées. Si les prédictions ainsi réalisées sont contradictoires avec les
résultats expérimentaux alors on pourra avec certitude réfuter le modèle (on
dit aussi qu’on l’a falsifié) ; dans le cas contraire on garde le modèle
mais on n’est pas certain qu’il soit « vrai ». Autrement dit, à
l’issue d’un tel test on ne peut avoir de certitude que si on a trouvé des
éléments permettant de réfuter le modèle. Nous verrons dans la suite que cette
approche se transpose exactement dans la démarche statistique, en particulier
dans le domaine des tests.