Dans ces conditions, on peut montrer facilement comment, du fait du passage d’un cadre
expérimental a priori à un cadre observationnel a posteriori, les proportions 3/4-1/4 sont
modifiées en proportions 3/7-4/7.
Il y a quatre type de couples à risque avec deux enfants selon qu’aucun, un seul ou les deux
enfants sont atteints,
leurs fréquences relatives étant le produit des probabilités d’avoir leur
premier et/ou leur deuxième enfant sain et/ou atteint.
Tableau 2.9
Couple à risque de type 1
Couple à risque de type 2
Couple à risque de type 3
Couple à risque de type 4
Premier
enfant
Sain
Sain
Atteint
Atteint
deuxième enfant
Sain
Atteint
Sain
Atteint
Fréquence relative de tous les types de couples à risque
3/4 x
3/4 = 9/16
3/4 x
1/4 = 3/16
1/4 x
3/4 = 3/16
1/4 x
1/4 = 1/16
Fréquence à priori des enfants atteints sur la totalité
des couples
f = (9/16 x 0) + (3/16 x
1/2) + (3/16 x 1/2) + (1/16 x 2/2) = 8/32
f = 1/4
Fréquence relative des types de couples à risque
recensés
3/7
3/7
1/7
Fréquence a posteriori des enfants atteints sur les
couples recensés
f = (3/7 x 1/2) + (3/7 x
1/2) + (1/7 x 2/2)
f = 4/7
5. Pour des familles de trois enfants, on aura quatre types de couples en précisant
que les types de couples avec un enfant ou deux enfants atteints sont des cas triples qui
peuvent être obtenus de trois façons mutuellement exclusives, l’enfant atteint (ou non atteint)
étant le premier ou le deuxième ou le troisième, ce qui amène à multiplier par trois la
probabilité.
Tableau 2.10
Couple à risque de type 1 : trois enfants sains
Couple à risque de type 2 : trois enfants sains
Couple à risque de type 3 : trois enfants sains
Couple à risque de type 4 : trois enfants sains
Fréquence relative de tous les types de couples à risque
3/4 x
3/4 x 3/4 = 27/64
[3/4 x
3/4 x 1/4] x 3 = 27/64
[3/4 x
1/4 x 1/4] x 3 = 9/64
1/4 x
1/4 x 1/4 = 1/64
Fréquence a priori des enfants atteints sur la totalité
des couples
f = (27/64 x 0) + (27/64 x
1/3) + (9/64 x 2/3) + (1/64 x 3/3) = 48/192
f = 1/4
Fréquence relative des types de couples à risque
recensés
27/37
9/37
1/37
Fréquence a posteriori des enfants atteints sur les
couples recensés
f = (27/37 x 1/3) + (9/38
x 2/3) + (1/37 x 3/3)
f = 48/111
La proportion d’enfants atteints n’est pas la même que dans les familles recensées de deux
enfants, parce que la fréquence du type de couple à risque non recensé (pas d’enfant atteint)
dépend du nombre d’enfants et est égale à (1 – p)s, où p est la probabilité d’avoir un enfant
atteint, c’est-à-dire 1/4 et s est le nombre d’enfants de la famille.
6. Si on dispose d’un échantillon de familles de tailles variables, il faut définir la valeur
attendue de la fréquence des enfants atteints pour chaque taille de famille, puis en faire le
produit avec le poids relatif de chaque taille de famille dans l’échantillon, afin d’estimer la
fréquence attendue dans l’échantillon et de la confronter par un test statistique à la fréquence
observée.
On désigne par p, le « paramètre de ségrégation », soit la probabilité a priori d’avoir un
enfant atteint chez les couples à risque (p = 1/4 quand il s’agit d’un phénotype récessif
produit par un couple d’hétérozygote pour un gène donnant une ségrégation 2/2 de leurs
allèles à la méiose).
On désigne maintenant par p(c/s) la fréquence des enfants atteints, corrigée (c) du biais de
détection, chez des couples à risque ayant s enfants.
Cette fréquence est égale à p, corrigée
par le terme [1 – (1 – p)s], comme cela ressort des calculs faits précédemment.
De sorte que : p(c/s) = p/[1 – (1 – p)s].
Si on prend p = 1/4, la valeur de la probabilité d’avoir un enfant atteint chez un couple à
risque pour une maladie récessive, on obtient bien, avec cette formule, la fréquence des
enfants atteints dans des familles de s enfants, soit :
• Pour s = 2 p(c/2) = (1/4)/[1 – (3/4)2] = 4/7.
• Pour s = 3 p(c/3) = (1/4)/[1 – (3/4)3] = 48/111.
Dans un échantillon où les familles ayant s enfants représentent un effectifs de ns, sur un total
de N familles, on aura la fréquence corrigée totale :
p(c) = Σs (ns /N)-p(c/s)
La valeur de p(c) dépend de celle de p.
S’il y ségrégation 2/2 (trait ou maladie monogénique), alors p = 1/4 et p(c) doit avoir une
valeur bien particulière qu’il faut confronter à la valeur effectivement observée, par un test
statistique adéquat.
Mais c’est encore un peu simple, car on a supposé ici que les couples à risque avec deux ou
plusieurs enfants atteints avaient autant de chances d’être recensés que ceux à risque avec un
seul enfant atteint, ce qui est évidemment contestable.
S’il existe un « biais de recensement »
venant du fait que les différentes familles détectables n’ont pas la même probabilité d’être
recensées, il faut en tenir compte.
Remarque.
Parce qu’elle n’est pas et ne peut être expérimentale, la génétique
humaine est toujours plus complexe.
Elle doit notamment contourner les obstacles
dus à l’impossibilité d’obtenir des souches pures et d’organiser des croisements, par
des modélisations probabilistes et statistiques parfois très complexes, prenant en
compte tous les biais de détection et de recensement possibles.
Elle doit aussi prendre
en compte l’hétérogénéité génétique et les incertitudes venant du fait qu’un même
phénotype peut correspondre à plusieurs génotypes possibles dans une population
naturelle, alors que ce n’est pas le cas, sauf exceptions éventuellement détectables,
dans un protocole de croisements expérimentaux partant de souches pures.
En conséquence, la génétique humaine n’est absolument pas le bon domaine pour apprendre
les rudiments de la génétique. Son enseignement, dans le secondaire et même dans le supérieur,
est confronté soit à des difficultés pédagogiques insurmontables soit à l’énoncé de propositions et d’exercices erronés qui traduisent, de la part de leurs auteurs, une simplification
abusive et falsificatrice.
La spécificité et les difficultés de la génétique humaine illustrée à travers les biais de détection
et de recensement permet de renvoyer légitimement cet enseignement spécialisé et
quasiment professionnel en maîtrise, voire en troisième cycle.