STATISTIQUE : Document 1 

1.       Quelques repères historiques :

2.     Les premières approches:

3.     LES  STATISTIQUES – LA STATISTIQUE

4.     Statistique descriptive .

5.     Problèmes liés à la saisie des informations :

6.    Les statistiques et les probabilités

 

 

1- repères historiques :

 

L'empereur chinois Yao organisait le recensement des productions agricoles en 2238 av J.C. (c'étaient les tables statistiques agricoles)

L'institution du cadastre et du cens chez les égyptiens , date de 1700 av J.C. Ils relevaient régulièrement les hauteurs des crues du Nil pour établir l'impôt.

 

C'est grâce à un recensement qu'on sait que Jésus Christ est né dans une étable.

 

2 -  Les premières approches:

 

 

Les premières études statistiques descriptives sont dues à des anglais que préoccupait la rentabilisation des assurances maritimes. Au XVIIIe siècle , l'idée que les statistiques en matière démographique pouvaient servir de base à des prévisions , s'est répandue en Angleterre . Il faut rappeler que c'est l'époque où les problèmes concernant la population de l' Angleterre  sont examinés avec des approches économiques ( Malthus 1766-1834 ) . Mais on peut aussi citer les tables de mortalité de Wargentin en Suède , sensiblement à la même époque ou de Deparcieux en France (1703-1768)  

Pour prévoir l'évolution démographique de la population anglaise  , les fréquences (terme que nous allons examiner plus loin ) observées sur des populations assez nombreuses étaient assimilées à des probabilités , approximation légitime lorsqu'on dispose d'un grand nombre d'observations.

 

Adolphe Quetelet  (Belge , 1796-1874) fut le premier  à concevoir que la statistique pouvait être fondée sur le calcul des probabilités (il a rencontré Fourrier et Poisson) son œuvre est très vaste  et elle concerne aussi bien l' anthropométrie que l'économie et les sciences sociales.

Il faut attendre  les premiers statisticiens anglais (vers 1900) pour voir apparaître réellement  une méthode statistique , une théorie bien formalisée de l'inférence , c'est à dire , du raisonnement permettant , à partir des données observables de tirer des conclusions sur les lois de probabilité des phénomènes.

 

En résumé : La statistique représente une méthode de recherche . Son champ d’application est très vaste : les méthodes statistiques sont appliquées à la physique , à la biologie , à la psychologie , à l’économie , à l’industrie ….

                 Science ancienne ( nous l’avons dit plus haut ) , la statistique  est utilisée ,, en sciences sociales  et  sciences de l’éducation , en médecine ; en psychologie ; en physique , en fiscalité , etc….;et aussi en gestion des entreprises .

3 -  LES  STATISTIQUES – LA STATISTIQUE

Pourquoi "des stats" ?

Le couple "Recensement - dénombrement" reste trop descriptif : il n'est pas réaliste de penser compter tous les éléments d'une catégorie dont on sait qu'elle relève des grands nombres ( le nombre d'arbres dans une forêt; le nombre d'habitants d'un pays;…)

On est obligé de recourir à des techniques qui nous éviteront des tâches trop étendues , pour un avantage relatif.

Vocabulaire:

Sondage et recensement :

Pour  un recensement , on prend en compte les réponses de la population toutes entière.

Pour un sondage : une seule  partie seulement de la population est interrogée. Cette partie est  appelée : échantillon

 

Dans la vie de tous les jours il est fondamental pour qu’une entreprise (ou commerce) , ou société soit viable  qu’elle puisse prévoir les tendances saisonnières dans leur domaine d’activité ; pour cela elle doit faire appelle aux statisticiens qui sera chargé d’étudier une population donnée .A partir de l’analyse et l’interprétation des résultats d’enquête sur un échantillonnage de cette population elle pourra établir de façon rationnelle des programmes d’achat ou de fabrication.

 

  Le terme « statistique » à un sens différent selon qu’il est employé au pluriel  ou au singulier .

 

LES STATISTIQUES :

1°) les statistiques concerne  l’ ensemble des documents regroupant les données , comme par exemple les statistiques de vente ou les statistiques d’accidents du  travail  .

 

        Les statistiques sont le recensement  , l '  organisation  et la représentation de données.(numériques)

Les stratégies économiques et industriels  sont des grandes utilisatrices de "statistiques"  ;habitudes alimentaires  , composition de la population , évolution comparée des prix et des revenus  …….

 

LA STATISTIQUE :

 

2°) La statistique  regroupe l’ensemble des méthodes permettant d’obtenir et de traiter ces statistiques .

 

Le mot "statistique" désigne d'une part un ensemble de données d'observation et d'autre part l'activité qui concerne leur recueil , leur traitement et leur interprétation.

 

La statistique est une branche des mathématiques appliquées. L'essentiel des mathématiques qu'elle utilise se retrouve dans la théorie des probabilités , qui n'est qu'un aspect particulier de la théorie de la mesure .Les probabilités sont donc bien distinctes de la  statistique dont elles constituent le modèle. Aussi , la statistique  devra -t - elle ramener les phénomènes réels à ce modèle probabiliste , chaque fois que cela sera possible .

 

Bien entendu  la statistique fait beaucoup de choses , mais elle ne fait pas tout.

Par définition :

La statistique est la science qui a pour objet l’étude , l’analyse et l’interprétation des observations relatives à des phénomènes collectifs.

 

Il y a de nombreuses  autres définitions   concernant « la statistique ».

 

Toutes  acceptables , certaines permettent  de comprendre  , son objet .

Ainsi  nous en citons trois autres  :

-        la statistique est une étude numérique des faits et de leurs rapports.

-        La statistique est une science qui a pour objet de recueillir un ensemble de données  numériques relatives à tel ou tel phénomène aléatoire et d’exploiter cette information pour établir toutes relations  de  causalité  par analyse et l’interprétation ;

-        La statistique est une science dont l’objet est de  récolter une information quantitative  concernant  des individus  , des groupes , des séries de faits , etc ;…. Et de déduire , grâce à l’analyse  de ces données , des significations  précises ou des prévisions pour l’avenir .

 

 

4 - Statistique descriptive .

        Elle commence là où la donnée d'un tableau de nombres exprime des grandeurs liées au phénomène étudié : exemples  le nombre de naissances annuelles dans les dix dernières années , la répartition de ces naissances en sexes , la catégorie socio - professionnelle des parents , etc ..

 

 

5 -  Problèmes liés à la saisie des informations :

 

 

L ' enquête statistique et son traitement par l 'informatique font partie de notre vie. Elle permet de répondre au désir de mieux connaître notre pays  et le monde qui nous entoure , elle nous aide à rechercher des solutions à de graves problèmes  (natalité , mortalité , chômage ,etc. ) .

 

 

   Evidemment , si gérer  , c’est prévoir  , cela implique  qu’avant de faire des prévisions , il est nécessaire de « savoir » ; La statistique  permet d’avoir  une  meilleur  connaissance  des faits  et de faciliter la prise de  décision .

 

 La plupart des entreprises  ,  dans  l ‘ensemble    des services  on utilise des statistiques .exemple : gestion de stocks , entrées  et  sorties de marchandises , approvisionnement ; …..

 

SUITE :  

 

Cliquer ici :   La saisie de données

 

6- Les statistiques et les probabilités

La théorie (ou le calcul) des probabilités est une branche des mathématiques qui permet de modéliser les phénomènes où le hasard intervient (initialement développée à propos des jeux de hasard, puis progressivement étendue à l’ensemble des sciences expérimentales, dont la physique et la biologie.)

Cette théorie permet de construire des modèles de ces phénomènes et permet le calcul : c’est à partir d’un modèle probabiliste d’un jeu de hasard comme le jeu de dés que l’on peut prédire les fréquences d’apparition d’événements comme le nombre de fois que l’on obtient une valeur paire en jetant un dé un grand nombre de fois. Les éléments de calcul des probabilités indispensables à la compréhension des statistiques seront traités dans la première partie du cours.

Sous jacente à la notion de statistiques se trouve la notion de Population dont on souhaite connaître les propriétés (plus précisément les régularités), permettant en particulier de savoir si deux populations sont identiques ou non. Ce cas est celui du cadre des essais thérapeutiques, où l’on considère 2 populations (patients traités avec le médicament A ou avec le médicament B) dont on souhaite savoir si elles diffèrent ou non (c’est le cas le plus simple des essais cliniques). Pour ce faire il est nécessaire de modéliser les populations, en utilisant des modèles probabilistes. Un modèle de ce type est par exemple de considérer que la taille des individus suit une distribution gaussienne. A partir de ce modèle on peut calculer les propriétés d’échantillons ; c’est ce qu’on appelle une déduction qui va du modèle vers l’expérience. A l’inverse, considérant un échantillon d’une population on peut essayer de reconstruire le modèle de la population.

Cette démarche est calquée sur la démarche scientifique habituelle. Le scientifique est capable, en utilisant les mathématiques, de prédire le comportement d’un modèle donné (c’est par exemple une « loi » de la physique) : c’est la démarche déductive. A l’inverse, observant des faits expérimentaux il va tenter de dégager des propriétés générales du phénomène observé qu’il va en général représenter sous forme d’un modèle (toutes les lois de la physique et de la chimie sont des modèles mathématiques les plus généraux possibles des faits expérimentaux) : c’est la construction inductive de la théorie. Cette démarche générale va plus loin car le modèle permet de prédire des expériences non réalisées. Si les prédictions ainsi réalisées sont contradictoires avec les résultats expérimentaux alors on pourra avec certitude réfuter le modèle (on dit aussi qu’on l’a falsifié) ; dans le cas contraire on garde le modèle mais on n’est pas certain qu’il soit « vrai ». Autrement dit, à l’issue d’un tel test on ne peut avoir de certitude que si on a trouvé des éléments permettant de réfuter le modèle. Nous verrons dans la suite que cette approche se transpose exactement dans la démarche statistique, en particulier dans le domaine des tests.