LES LECOUTRES ET LE HASARD
  F L O T
DU HASARD ET DES PROBABILITÉS

HASARD, subst. masc.

Étymol. ... Empr. à l'ar. pop.az-zahr « le dé à jouer » (az est la forme assimilée de l'art. al devant z) par l'intermédiaire de l'esp. azar « coup défavorable au jeu de dés; sorte de jeu de dés » (1283 d'apr. COR. et FEW t. 19, p. 205b), avec un h- dû au fait qu'au Moy. Âge, les mots à initiale vocalique, et particulièrement les mots étrangers, étaient souvent écrits avec un h- (FEW). À l'étymon ar. az-zahr, on peut objecter que le sens de « dé à jouer », non attesté en ar. class., est « relativement moderne » (Lammens; V. aussi DEVIC, KLEIN Étymol. et LOK. n°2186), aussi COR. propose-t-il de partir du sens de l'ar. class. zahr « fleur », parce qu'une fleur aurait été représentée sur l'une des faces du dé. On a aussi proposé un autre étymon : l'ar. yasara « jouer aux dés » (KLEIN Étymol.) ou yasar « groupe de joueurs de dés », dér. de ce même verbe attesté en ar. class. (LOK. n°2186).

Benzecri J.P. (1976) - Histoire et préhistoire de l'analyse des données. Les Cahiers de l'analyse des données, 1, page 11 [].
Knudson Ch. A. (1937) - 'Hasard' et les autres jeux de dés dans le Jeu de saint Nicolas. Romania, 63, pages 248-253.
Tiktin H. (1911) - Zur Geschichte von hasard. Archiv für das Studium der neueren Sprachen und Literaturen Bd, 127, pages 162-174.

Centre National de Ressources Textuelles et Lexicales, 13/11/2018


Trois des 26 LECOUTRE morts pour la France pendant la première guerre mondiale
sont nés le même jour, en l'occurence un 25 décembre.
Il s'agit d'Arthur (1890), de Maurice Albert (1895) et de Noël* Charles (1875)

Cette coïncidence est-elle réellement étonnante?

*Encore une coïncidence!
Oubliant pour le moment la guerre et ses victimes, imaginons simplement que n individus se réunissent.

Quelle est la probabilité que:
- trois d'entre eux (au moins) aient le même jour anniversaire;
- deux d'entre eux (au moins) aient le même jour anniversaire;
  Etc.

Pour répondre à cette question il faut faire un certain nombre de suppositions ou hypothèses (en anglais assumptions).

Supposons donc que ces n individus constituent un échantillon issu d'une population de très grande taille, théoriquement de taille infinie. Supposons encore que toutes les individus de la population ont la même probabilité d'être dans l'échantillon, et que dans la population les proportions d'individus ayant le même jour anniversaire sont identiques pour tous les jours de l'année (dans la réalité, ce n'est qu'une approximation*). Pour simplifier, ignorons le 29 février des années bissextiles et admettons donc que les années ne comportent que 365 jours.

C'est ce qu'on appelle le modèle probabiliste à partir du quel on va pouvoir calculer les probabilités qui vont notamment permettre des prédictions relatives à un échantillon. Ici les caractéristiques de la population pour l'évènement qui nous intéresse (le jour de l'anniversaire) sont supposées parfaitement connues.

*D'autant plus à notre époque. En effet notamment pour les jours fériers, il y a peu d'accouchements par césarienne, lesquels sont programmés "à des heures ouvrables" (les césariennes représentent plus de 20% des accouchements en France) et également moins d'accouchements "déclenchés." Ainsi à notre époque le 25 décembre est en moyenne le jour de l'année où il y a le moins de naissances en France.


Quelle est votre intuition?


Un problème d'anniversaires
Dans un échantillon de 26 individus
quelle est la probabilité que trois individus au moins aient le même jour anniversaire?

  environ 0.001 (0.1%)
  environ 0.01 (1%)
  environ 0.02 (2%)
  environ 0.05 (5%)
  environ 0.10 (10%)

Répondez le plus spontanément possible (sans calcul)



Un autre problème d'anniversaires
Dans un échantillon de 26 individus
quelle est la probabilité que deux individus au moins aient le même jour anniversaire?

  environ 0.10 (10%)
  environ 0.20 (20%)
  environ 0.40 (40%)
  environ 0.60 (60%)
  environ 0.80 (80%)

Répondez le plus spontanément possible (sans calcul)



Un calcul simple
Revenons à notre échantillon de n individus tel que nous l'avons caractérisé précédemment.
Imaginons que je sois l'un des individus de cet échantillon, et que je sois né un 29 juillet.
Quelle est la probabilité P1 qu'un au moins des n1 autres individus soit également né un 29 juillet?

Il est relativement facile de calculer la probabilité de l'événement complémentaire: Aucun de ces n-1 individus n'est né un 29 juillet, autrement dit ils sont tous nés l'un des 364 autres jours.
Pris séparément chacun d'eux a donc pour cela une probabilité 364/365 (environ 0.997 ou 99.7%).

- Le premier individu (l'ordre n'a pas d'importance), c'est moi. Je suis né le 29 juillet, c'est une certitude!
     Enfin, c'est ce que je crois...
- Le deuxième individu doit avoir son anniversaire un jour différent du 29 juillet.
     Ceci est réalisé avec une probabilité de 364/365.
- Le troisème individu également.
     Ceci est réalisé avec une probabilité de 364/365.
- Etc.
- Le n-ième encore.
     Ceci est réalisé avec une probabilité de 364/365.

Nous avons affaire à des événements indépendants. Donc, pour obtenir leur probabilité conjointe, les probabilités se multiplient et la probabilité qu'aucun des n-1 individus ne soient nés le 29 juillet est

(364/365)n-1

Par conséquent la probabilité P1 cherchée est

P1 = 1 - (364/365)n-1

Quelques valeurs
n
2
10
26
50
100
254
365
1093
P1
0.0027
0.0244
0.0663
0.1258
0.2378
0.5005
0.6316
0.9500

Comme on pouvait s'y attendre, la probabilité P1 est faible pour un petit échantillon - elle est par exemple 6.6% pour un échantillon de 26 individus - et elle croît lentement avec n.
Il faut au moins 354 individus pour qu'elle soit supérieure à 1/2 (50%) et au moins 1093 individus pour qu'elle soit supérieure à 95%


Un autre calcul simple
Considérons toujours notre échantillon de n individus tel que nous l'avons caractérisé précédemment.
Quelle est la probabilité P2 que deux au moins de ces n individus
aient des jours anniversaires identiques

Il est relativement facile de calculer la probabilité de l'événement complémentaire: Les n individus ont tous des des jours anniversaires différents.
- Le premier individu se présente: Son anniversaire tombe un jour j1.
     j1 étant un jour quelconque, c'est une certitude!
- Le deuxième individu doit avoir son anniversaire un jour j2 différent de j1.
     Ceci est réalisé avec une probabilité de 364/365.
- Le troisème individu doit avoir son anniversaire un jour j3 différent de j1 et j2
     Ceci est réalisé avec une probabilité de 363/365.
- Etc.
- Le n-ième individu doit avoir son anniversaire un jour jn différent de celui des n-1 premiers.
     Ceci est réalisé avec une probabilité de (365-(n-1))/365.!!!

Nous avons affaire à des événements indépendants. Donc, pour obtenir leur probabilité conjointe, les probabilités se multiplient et la probabilité que les n individus aient tous des des jours anniversaires différents est

(364/365)×(363/365)×(362/365)× ... × ((366-n)/365)

= (364×363×362× ... × (366-n)) / 365n-1

Par conséquent la probabilité P2 cherchée est

P2 = 1 - (364×363×362× ... ×(366-n)) / 365n-1

(pour n inférieur ou égal à 366)      
Quelques valeurs
n
2
10
18
23
26
47
50
100
366
P1
0.0027
0.1169
0.3469
0.5073
0.5982
0.95477
0.9704
0.9999997
1

La probabilité P2, qui est égale à P1 pour deux individus croît très rapidement avec n.
Il suffit de 18 individus pour qu'elle soit supérieure à 1/3 et de 23 pour qu'elle soit supérieure à 1/2. Avec seulement 47 individus elle est déjà supérieure à 95%.

Bien entendu, et comme l'indique la formule, à partir de 366 individus on est certain que deux individus au moins auront le même jour anniversaire.


Plus généralement
Les résultats précédents s'appliquent bien entendu de manière générale à toute autre caractéristique ayant M modalités, par exemple le jour de la semaine ou le signe zodigliacal*, pourvu que pour chaque modalité les proportions d'individus soient approximativement égales dans la population.

Il suffit de remplacer 365 par M et nous obtenons:

P1 = 1 - ((M-1)/M)n-1

P2 = 1 - ((M-1)×(M-2)×(M-3)× ... ×(M+1-n)) / 365n-1

(pour n inférieur ou égal à M+1)      

*Ah! Pierre Dac et Francis Blanche dans le Sar Rabindrnanah Duval.

Appliquons cela aux 12 signes zodigliacaux
n
2
3
4
5
6
7
8
9
10
11
12
36
P1
0.083
0.160
0.230
0.294
0.353
0.407
0.456
0.501
0.543
0.581
0.616
0.952
P2
0.083
0.236
0.427
0.618
0.777
0.889
0.954
0.985
0.996
0.999
0.9999
1

Je vous laisse le soin de méditer ces résultats...


Des probabilités fréquentistes
Les probabilités précédentes sont des probabilités fréquentistes dans le sens suivant: Si on répète indéfiniment l'observation d'échantillons de n individus la probabilité d'un événement peut ici être définie comme la fréquence avec laquelle on observe cet évenement sur l'ensemble de ces échantillons*.

Pour calculer cette fréquence nous pouvons utiliser une urne contenant des boules comme dans le tirage des "jeux de hasard" du type loto.
Dans notre situation, nous avons supposé que la population était théoriquemnt de taille infinie. Mais il suffit de mettre dans l'urne 365 boules correspondant aux jours de l'année et de replacer chaque fois la boule dans l'urne après son tirage pour simuler cette population.

Pour obtenir la probabilité d'un événement nous tirerons un très grand nombre d'échantillons, disons E, et pour chacun d'eux nous noterons si l'événement s'est ou non réalisé. Si au total nous avons observé k fois l'évenement, la probabilité de l'événement sera estimée par la proportion

k/E

Cette estimation sera d'autant plus précise que E sera grand.

Evidemment faire ceci "à la main" serait fastidieux et très long, mais nous pouvons utiliser un programme informatique qui réalisera ceci pour nous. Dans ce cas simple, le premier informaticien venu (et sinon le deuxième) devrait être capable d'écrire ce programme. Nous pouvons ainsi simuler de manière quasi immédiate le tirage de millions d'échantillons!

*De manière plus rigoureuse comme la limite de cette fréquence quand le nombre d'échantillons tend vers l'infini.

Même avec un petit nombre d'échantillons E nous pouvons déjà avoir une idée de la probabilité de l'événement.

C'est ainsi qu'un journaliste de l'AFP Lionel Bonaventure a pu constater en 2014 que, sur les 32 équipes qui ont partipé à la coupe du monde de football cette année là, 16 avaient au moins deux joueurs ayant leur anniversaire le même jour. L'effectif de chaque équipe étant de 23 joueurs, la proportion observée 16/32 = 0.50 correspond effectivement à la probabilité théorique que nous avons calculée précédemment (0.5073)!

Cinq équipes - Argentine, France*, Corée du Sud, Iran et Suisse - avaient même deux paires de joueurs ayant le même jour anniversaire.

Déjà au début des années 1970 j'avais pu faire une constation analogue, en considérant les dates de naissance des coureurs cyclistes professionnels (devinez pourquoi).

Le magazine L'Express, qui a repris cette information, ne s'est pas privé d'invoquer "une incroyable coïncidence" fort heureusement expliquée par "le paradoxe des anniversaires", Contribuant à populariser celui-ci.

*Mamadou Sakho et Eliaquim Mangala nés le 13 février, Rio Mavuba et Rémy Cabella nés le 8 mars.

Le résultat précédent peut paraître trop beau, et pourtant il est vrai. Mais c'est précisément pour cela qu'il a été diffusé. Nous constatons là un autre type de biais, le biais de publication. On ne diffuse que les résultats qui paraîssent étonnant et/ou qui sont de nature à provoquer des réactions. Nous aurons l'occasion d'y revenir à propos d'un sujet plus grave que le footbal.


C'est en probabilisant
qu'on devient probabiliste
Les calculs de probabilité que nous avons effectués ne sont que des approximations. La raison en est que nous avons utilisé un modèle simplifié, supposant que les naissances se répartissent uniformément sur l'année et ignorant les années bissextiles.
Mais cela ne remet pas en cause la pertinence des résultats puisque nous obtiendrions des résultats du même ordre avec un modèle plus proche de la réalité.

Les facilités de calcul offertes par les ordinateurs permettent d'explorer des modèles complexes, prenant par exemple en compte les proportions de naissances observées pour chaque jour de l'année dans la population et les années bissextiles. Elles permettent aussi d'estimer les probabilités d'événements plus complexes, comme par exemple la probabilité de trouver dans un échantillon trois individus ayant le même jour anniversaire, et en fait de n'importe quel événement, même dans des cas où il serait très difficile de trouver une formule mathématique.

Bien enrtendu la programmation en sera d'autant plus complexe. L'automatisation des calculs n'exclut pas la réflexion.


Revenons à nos malheureux LECOUTRE morts pour la France
Comme nous venons de le voir, si deux seulement avaient eu le même jour anniversaire, cela n'aurait rien eu d'étonnant. Ils sont trois: Quelle est la probabilité de trouver au moins trois individus ayant le même jour anniversaire dans un échantillon de 26 individus? Celle-ci probabilité peut être estimée suivant le principe exposé précédemment. On trouve ici un peu moins de 2% (0.0185). Il s'agit donc d'un événement relativement rare, mais pas exceptionnel.

On pourrait argumenter que le fait qu'il soient nés un 25 décembre est quand même étonnant. Mais, d'une part, il y a beaucoup d'autres jours remarquables dans l'année: le 1er janvier, le 8 mai, le 11 novembre, le jour de mon anniversaire, du votre, de celui de votre femme ou de votre mari (je vous salue), le jour de l'élection d'Emmanuel Macron, etc.
Et, d'autre part, il y a incontestablement ici un biais de publication (voir plus haut). Je n'aurais sans doute même pas remarqué cette coïncidence si je n'avais pas, en recopiant la liste des LECOUTRE morts pour la France, trouvé un Noël né le 25 décembre.

Ceci m'a encore amené à constater qu'il y avait un autre Noël LECOUTRE, né le 25 décembre 1900, et donc trop jeune pour avoir combattu pendant la première guerre mondiale*.

Pour ceux qui n'aiment pas le hasard

Et si par leur origine (voir les custos dans l'étymologie)
les LECOUTRES étaient prédisposés à naître le 25 décembre...

*Fort heureusement, sinon mon cousin et joueur de flûte Alain LECOUTRE (voir LES LECOUTRES MUSICIENS), dont il est le grand-père, ne serait peur-être pas là.



UN PEU PLUS
DE HASARD ET DE PROBABILITÉS


Un problème de chaussettes
On tire au hasard (à l'aveugle) une paire de chaussettes dans un tiroir
qui contient deux chaussettes rouges et deux chaussettes vertes.

On considère les résultats suivants

  Résultat 1: on obtient une paire de chaussettes appareillées (deux rouges ou deux vertes)

  Résultat 2: on obtient une paire de chaussettes dépareillées (une rouge et une verte)
Pensez-vous qu'il y a

1)  plus de chances d'obtenir le résultat 1
2)  plus de chances d'obtenir le résultat 2
3)  autant de chances d'obtenir les deux résultats

Répondez le plus spontanément possible (sans calcul)



      


       


Afficher/Télécharger au format pdf


EST-ON LECOUTRE PAR HASARD?
NAÎT-ON LECOUTRE PAR HASARD?

   


RETOUR À L'ACCUEIL