DU HASARD ET DES PROBABILITÉS
|
HASARD, subst. masc.
Étymol. ... Empr. à l'ar. pop.az-zahr « le dé à jouer » (az est la forme assimilée de l'art. al devant z) par l'intermédiaire de l'esp. azar « coup défavorable au jeu de dés; sorte de jeu de dés » (1283 d'apr. COR. et FEW t. 19, p. 205b), avec un h- dû au fait qu'au Moy. Âge, les mots à initiale vocalique, et particulièrement les mots étrangers, étaient souvent écrits avec un h- (FEW). À l'étymon ar. az-zahr, on peut objecter que le sens de « dé à jouer », non attesté en ar. class., est « relativement moderne » (Lammens; V. aussi DEVIC, KLEIN Étymol. et LOK. n°2186), aussi COR. propose-t-il de partir du sens de l'ar. class. zahr « fleur », parce qu'une fleur aurait été représentée sur l'une des faces du dé. On a aussi proposé un autre étymon : l'ar. yasara « jouer aux dés » (KLEIN Étymol.) ou yasar « groupe de joueurs de dés », dér. de ce même verbe attesté en ar. class. (LOK. n°2186).
Benzecri J.P. (1976) - Histoire et préhistoire de l'analyse des données.
Les Cahiers de l'analyse des données, 1, page 11 [].
Centre National de Ressources Textuelles et Lexicales, 13/11/2018
|
Trois des 26 LECOUTRE morts pour la France pendant la première guerre mondiale
sont nés le même jour, en l'occurence un 25 décembre. Il s'agit d'Arthur (1890), de Maurice Albert (1895) et de Noël* Charles (1875) Cette coïncidence est-elle réellement étonnante?
*Encore une coïncidence!
|
Oubliant pour le moment la guerre et ses victimes, imaginons simplement que n individus se réunissent.
Quelle est la probabilité que: - trois d'entre eux (au moins) aient le même jour anniversaire; - deux d'entre eux (au moins) aient le même jour anniversaire; Etc. Pour répondre à cette question il faut faire un certain nombre de suppositions ou hypothèses (en anglais assumptions). Supposons donc que ces n individus constituent un échantillon issu d'une population de très grande taille, théoriquement de taille infinie. Supposons encore que toutes les individus de la population ont la même probabilité d'être dans l'échantillon, et que dans la population les proportions d'individus ayant le même jour anniversaire sont identiques pour tous les jours de l'année (dans la réalité, ce n'est qu'une approximation*). Pour simplifier, ignorons le 29 février des années bissextiles et admettons donc que les années ne comportent que 365 jours. C'est ce qu'on appelle le modèle probabiliste à partir du quel on va pouvoir calculer les probabilités qui vont notamment permettre des prédictions relatives à un échantillon. Ici les caractéristiques de la population pour l'évènement qui nous intéresse (le jour de l'anniversaire) sont supposées parfaitement connues. *D'autant plus à notre époque. En effet notamment pour les jours fériers, il y a peu d'accouchements par césarienne, lesquels sont programmés "à des heures ouvrables" (les césariennes représentent plus de 20% des accouchements en France) et également moins d'accouchements "déclenchés." Ainsi à notre époque le 25 décembre est en moyenne le jour de l'année où il y a le moins de naissances en France. |
Quelle est votre intuition? |
Un problème d'anniversaires
|
Dans un échantillon de 26 individus
quelle est la probabilité que trois individus au moins aient le même jour anniversaire? |
environ 0.001 (0.1%)
|
Répondez le plus spontanément possible (sans calcul)
|
La réponse est: environ 0.02 (2%) |
Un autre problème d'anniversaires
|
Dans un échantillon de 26 individus
quelle est la probabilité que deux individus au moins aient le même jour anniversaire? |
environ 0.10 (10%)
|
Répondez le plus spontanément possible (sans calcul)
|
La réponse est: environ 0.60 (60%) |
Un biais cognitif
|
La question précédente correspond à ce qui est connu comme le "paradoxe des anniversaires".
Il s'agit d'un paradoxe au sens où le résultat mathématique contredit l'intuition qu'ont la plupart des gens. Plutôt que de considérer un point de vue normatif (mathématique), je préfère me placer du point de vue de l'humain. C'est ainsi que procède la psychologie cognitive en étudiant les biais cognitifs qui affectent les jugements probabilistes. Ainsi, dans le cas présent, celui* qui répond tend à rapprocher deux événements: - un individu pris au hasard a le même jour anniversaire que lui; - deux individus pris au hasard ont le même jour anniversaire. Ce faisant, il se réfère à sa propre expérience, et cela le conduit à sous-estimer fortement la probabilité du deuxième événement, qui est clairement beaucoup plus fréquent. *Ou celle. Mais je ne suis pas là pour faire du genre. Celui est pour moi neutre comme individu, Quiconque n'est pas d'accord peut toujours aller à la celle. |
Un calcul simple
|
|||||||||||||||||||||||||||
Revenons à notre échantillon de n individus tel que nous l'avons caractérisé précédemment.
Imaginons que je sois l'un des individus de cet échantillon, et que je sois né un 29 juillet. Quelle est la probabilité P1 qu'un au moins des n1 autres individus soit également né un 29 juillet?
Il est relativement facile de calculer la probabilité de l'événement complémentaire: Aucun
de ces n-1 individus n'est né un 29 juillet, autrement dit ils sont tous nés l'un des 364 autres jours.
Pris séparément chacun d'eux a donc pour cela une probabilité 364/365 (environ 0.997 ou 99.7%). - Le premier individu (l'ordre n'a pas d'importance), c'est moi. Je suis né le 29 juillet, c'est une certitude! Enfin, c'est ce que je crois... - Le deuxième individu doit avoir son anniversaire un jour différent du 29 juillet. Ceci est réalisé avec une probabilité de 364/365. - Le troisème individu également. Ceci est réalisé avec une probabilité de 364/365. - Etc. - Le n-ième encore. Ceci est réalisé avec une probabilité de 364/365. Nous avons affaire à des événements indépendants. Donc, pour obtenir leur probabilité conjointe, les probabilités se multiplient et la probabilité qu'aucun des n-1 individus ne soient nés le 29 juillet est (364/365)n-1
Par conséquent la probabilité P1 cherchée est
P1 = 1 - (364/365)n-1
Comme on pouvait s'y attendre, la probabilité P1
est faible pour un petit échantillon - elle est par exemple 6.6% pour un échantillon de 26 individus -
et elle croît lentement avec n.
Il faut au moins 354 individus pour qu'elle soit supérieure à 1/2 (50%) et au moins 1093 individus pour qu'elle soit supérieure à 95% |
Un autre calcul simple
|
||||||||||||||||||||||||||||||
Considérons toujours notre échantillon de n individus tel que nous l'avons caractérisé précédemment.
Quelle est la probabilité P2 que deux au moins de ces n individus aient des jours anniversaires identiques
Il est relativement facile de calculer la probabilité de l'événement complémentaire:
Les n individus ont tous des des jours anniversaires différents.
- Le premier individu se présente: Son anniversaire tombe un jour j1. j1 étant un jour quelconque, c'est une certitude! - Le deuxième individu doit avoir son anniversaire un jour j2 différent de j1. Ceci est réalisé avec une probabilité de 364/365. - Le troisème individu doit avoir son anniversaire un jour j3 différent de j1 et j2 Ceci est réalisé avec une probabilité de 363/365. - Etc. - Le n-ième individu doit avoir son anniversaire un jour jn différent de celui des n-1 premiers. Ceci est réalisé avec une probabilité de (365-(n-1))/365.!!! Nous avons affaire à des événements indépendants. Donc, pour obtenir leur probabilité conjointe, les probabilités se multiplient et la probabilité que les n individus aient tous des des jours anniversaires différents est
(364/365)×(363/365)×(362/365)× ... × ((366-n)/365)
Par conséquent la probabilité P2 cherchée est
P2 = 1 - (364×363×362× ... ×(366-n)) / 365n-1
(pour n inférieur ou égal à 366)
La probabilité P2, qui est égale
à P1 pour deux individus
croît très rapidement avec n.
Il suffit de 18 individus pour qu'elle soit supérieure à 1/3 et de 23 pour qu'elle soit supérieure à 1/2. Avec seulement 47 individus elle est déjà supérieure à 95%. Bien entendu, et comme l'indique la formule, à partir de 366 individus on est certain que deux individus au moins auront le même jour anniversaire. |
Plus généralement
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
Les résultats précédents s'appliquent bien entendu de manière générale à toute autre caractéristique
ayant M modalités, par exemple le jour de la semaine ou le signe zodigliacal*,
pourvu que pour chaque modalité les proportions d'individus soient approximativement égales dans la population.
Il suffit de remplacer 365 par M et nous obtenons: P1 = 1 - ((M-1)/M)n-1 P2 = 1 - ((M-1)×(M-2)×(M-3)× ... ×(M+1-n)) / 365n-1
(pour n inférieur ou égal à M+1)
*Ah! Pierre Dac et Francis Blanche dans le Sar Rabindrnanah Duval.
Je vous laisse le soin de méditer ces résultats...
|
Des probabilités fréquentistes
|
Les probabilités précédentes sont des probabilités fréquentistes dans le sens suivant:
Si on répète indéfiniment l'observation d'échantillons de n individus
la probabilité d'un événement peut ici être définie comme la fréquence avec laquelle
on observe cet évenement sur l'ensemble de ces échantillons*.
Pour calculer cette fréquence nous pouvons utiliser une urne contenant des boules comme dans le tirage des "jeux de hasard" du type loto. Dans notre situation, nous avons supposé que la population était théoriquemnt de taille infinie. Mais il suffit de mettre dans l'urne 365 boules correspondant aux jours de l'année et de replacer chaque fois la boule dans l'urne après son tirage pour simuler cette population. Pour obtenir la probabilité d'un événement nous tirerons un très grand nombre d'échantillons, disons E, et pour chacun d'eux nous noterons si l'événement s'est ou non réalisé. Si au total nous avons observé k fois l'évenement, la probabilité de l'événement sera estimée par la proportion k/E
Cette estimation sera d'autant plus précise que E sera grand.
Evidemment faire ceci "à la main" serait fastidieux et très long, mais nous pouvons utiliser un programme informatique qui réalisera ceci pour nous. Dans ce cas simple, le premier informaticien venu (et sinon le deuxième) devrait être capable d'écrire ce programme. Nous pouvons ainsi simuler de manière quasi immédiate le tirage de millions d'échantillons! *De manière plus rigoureuse comme la limite de cette fréquence quand le nombre d'échantillons tend vers l'infini. |
Même avec un petit nombre d'échantillons E nous pouvons déjà avoir une idée de la probabilité de
l'événement. C'est ainsi qu'un journaliste de l'AFP Lionel Bonaventure a pu constater en 2014 que, sur les 32 équipes qui ont partipé à la coupe du monde de football cette année là, 16 avaient au moins deux joueurs ayant leur anniversaire le même jour. L'effectif de chaque équipe étant de 23 joueurs, la proportion observée 16/32 = 0.50 correspond effectivement à la probabilité théorique que nous avons calculée précédemment (0.5073)! Cinq équipes - Argentine, France*, Corée du Sud, Iran et Suisse - avaient même deux paires de joueurs ayant le même jour anniversaire. Déjà au début des années 1970 j'avais pu faire une constation analogue, en considérant les dates de naissance des coureurs cyclistes professionnels (devinez pourquoi). Le magazine L'Express, qui a repris cette information, ne s'est pas privé d'invoquer "une incroyable coïncidence" fort heureusement expliquée par "le paradoxe des anniversaires", Contribuant à populariser celui-ci. *Mamadou Sakho et Eliaquim Mangala nés le 13 février, Rio Mavuba et Rémy Cabella nés le 8 mars. |
Le résultat précédent peut paraître trop beau, et pourtant il est vrai.
Mais c'est précisément pour cela qu'il a été diffusé.
Nous constatons là un autre type de biais, le biais de publication.
On ne diffuse que les résultats qui paraîssent étonnant et/ou qui sont de nature à provoquer
des réactions. Nous aurons l'occasion d'y revenir à propos d'un sujet plus grave que le footbal.
|
C'est en probabilisant
qu'on devient probabiliste |
Les calculs de probabilité que nous avons effectués ne sont que des approximations.
La raison en est que nous avons utilisé un modèle simplifié, supposant que les naissances se
répartissent uniformément sur l'année et ignorant les années bissextiles.
Mais cela ne remet pas en cause la pertinence des résultats puisque nous obtiendrions des résultats du même ordre avec un modèle plus proche de la réalité. Les facilités de calcul offertes par les ordinateurs permettent d'explorer des modèles complexes, prenant par exemple en compte les proportions de naissances observées pour chaque jour de l'année dans la population et les années bissextiles. Elles permettent aussi d'estimer les probabilités d'événements plus complexes, comme par exemple la probabilité de trouver dans un échantillon trois individus ayant le même jour anniversaire, et en fait de n'importe quel événement, même dans des cas où il serait très difficile de trouver une formule mathématique. Bien enrtendu la programmation en sera d'autant plus complexe. L'automatisation des calculs n'exclut pas la réflexion. |
Revenons à nos malheureux LECOUTRE morts pour la France
|
Comme nous venons de le voir, si deux seulement avaient eu le même jour anniversaire,
cela n'aurait rien eu d'étonnant.
Ils sont trois: Quelle est la probabilité de trouver au moins trois individus
ayant le même jour anniversaire dans un échantillon de 26 individus?
Celle-ci probabilité peut être estimée suivant le principe exposé précédemment.
On trouve ici un peu moins de 2% (0.0185).
Il s'agit donc d'un événement relativement rare, mais pas exceptionnel.
On pourrait argumenter que le fait qu'il soient nés un 25 décembre est quand même étonnant. Mais, d'une part, il y a beaucoup d'autres jours remarquables dans l'année: le 1er janvier, le 8 mai, le 11 novembre, le jour de mon anniversaire, du votre, de celui de votre femme ou de votre mari (je vous salue), le jour de l'élection d'Emmanuel Macron, etc. Et, d'autre part, il y a incontestablement ici un biais de publication (voir plus haut). Je n'aurais sans doute même pas remarqué cette coïncidence si je n'avais pas, en recopiant la liste des LECOUTRE morts pour la France, trouvé un Noël né le 25 décembre. Ceci m'a encore amené à constater qu'il y avait un autre Noël LECOUTRE, né le 25 décembre 1900, et donc trop jeune pour avoir combattu pendant la première guerre mondiale*. Pour ceux qui n'aiment pas le hasard
Et si par leur origine (voir les custos dans l'étymologie)
les LECOUTRES étaient prédisposés à naître le 25 décembre... *Fort heureusement, sinon mon cousin et joueur de flûte Alain LECOUTRE (voir LES LECOUTRES MUSICIENS), dont il est le grand-père, ne serait peur-être pas là. |
UN PEU PLUS
DE HASARD ET DE PROBABILITÉS |
Un problème de chaussettes
|
On tire au hasard (à l'aveugle) une paire de chaussettes dans un tiroir
qui contient deux chaussettes rouges et deux chaussettes vertes. On considère les résultats suivants
Résultat 1:
on obtient une paire de chaussettes appareillées (deux rouges ou deux vertes)
Résultat 2: on obtient une paire de chaussettes dépareillées (une rouge et une verte) |
Pensez-vous qu'il y a
1) plus de chances d'obtenir le résultat 1
|
Répondez le plus spontanément possible (sans calcul)
|
La réponse correcte est:
2) plus de chances d'obtenir le Résultat 2
Si on numérote les chaussettes dans le tiroir:
1 2
3 4
donc quatre chances sur six d'obtenir une paire de chaussettes dépareillées. |
Le biais d'équiprobabilité
|
Cela illustre un biais typique qui affecte nos jugements probabilistes,
le biais d'équiprobabilité.
Lorsque la situation est présentée comme une situation "de hasard", il existe chez une majorité
d'individus un modèle cognitif implicite selon lequel des événements à caractère aléatoire sont "par nature"
équiprobables. Ce modèle est extrêmement résistant et vient en quelque sorte "parasiter" le modèle mathématique, de type combinatoire (voir le justifcatif de la solution ci-dessus). |
IL Y A HASARD ET HASARD
|
Encore des chaussettes
Prenez-en de la graine |
Considérez les deux événements suivants
"Le fait de constituer une paire de chaussettes 'assorties' à partir d'un tirage
à l'aveugle de deux chaussettes d'un tiroir qui contient deux paires de chaussettes différentes"
|
Est-ce que, selon vous le hasard intervient dans chacun de ces deux événements?
Le hasard intervient pour les chaussettes et pour la graine
|
Répondez le plus spontanément possible
|
Il n'y a pas de "bonne réponse" ! |
Trois groupes de sujets ont été interrogés: des collégiens, des psychologues et des
mathématiciens.
|
QU'ENTEND-ON PAR "HASARD"?
|
|
"Nous naissons par hasard dans un monde qui s'en fiche."
nous dit d'une manière provocatrice Raphaël Enthoven* en 2013.
Ce disant, il ne fait que s'inspirer de Michel de Montaigne, qu'ancien élève
du Lycée Montaigne à Paris il ne doit pas ignorer:
"Ce n'est pas merveille, dict un ancien, que le hazard*** puisse tant sur nous, puisque nous vivons par hazard."
Montaigne (1588), Livre second, chapitre 1
Comme le remarque Villey (1908, page 50), Montaigne lui même reprend Sénèque:
"Necesse est multum in vita nostra casus possit quia vivimus casu,"
Sénèque Epitres à Lucilius, épitre LXXI, in Nisard (1869), page 659
ce qui dans Nisard (1869, page 659) est traduit****:
En vérité, il faut que le hasard ait bien du pouvoir sur notre conduite,
L'édition épurée***** des Essais de Montaigne, publiée par la Société de Saint Victor (1847, page 192)
la phrase précédente est complétée par la note:
"Pensée absolument païenne."
La bible défend effectivement une toute autre conception:
"Quand je n'étais qu'une masse informe, tes yeux me voyaient;
Second (1910), psaume 139.16, page 1022
Montaigne M. (1588) - Essais. Edition de 1833. Paris: Lebigre et Didot.
*Connu pour avoir été le compagnon de Carla Bruni**. |