
Melinda Mills, Professeure de Démographie et de Santé de la Population et directrice du Centre Leverhulme pour la Science Démographique, à l’Université d’Oxford a récemment publié sur son profil LinkedIn un plaidoyer en faveur d’une meilleure prise en compte des réalités familiales pour l’avancée de la recherche.
Avec sa permission, Familles Durables en publie une traduction en français.
*
Michael J. Fox a dit un jour : « La famille n’est pas une chose importante. C’est tout. » Dans notre nouvel article publié dans Nature, nous sommes d’accord avec cette idée et soutenons que recueillir des données familiales – comme celles sur les frères et sœurs ou les parents et leurs enfants – est la clé pour répondre à des questions cruciales telles que la persistance des inégalités intergénérationnelles ou des maladies au sein des familles.
Voici un résumé rapide de nos principaux arguments concernant la puissance des données familiales.
- Comprendre les inégalités socioéconomiques intergénérationnelles. Les données familiales et multigénérationnelles permettent de décomposer les facteurs sous-jacents aux inégalités persistantes, à la mobilité sociale intergénérationnelle, aux effets d’âge et de cohorte, aux périodes de développement critiques, et à la manière dont la composition et la dynamique des réseaux de parenté influencent la santé et les résultats socioéconomiques.
- Décomposer les relations causales entre les facteurs de risque et les résultats en matière de santé. Les analyses basées sur la population (i.e., individus non apparentés) incluent des relations entre facteurs pouvant être influencées par des éléments cachés (que nous appelons des « confondeurs non observés »). Les analyses au sein de la famille – lorsqu’on compare des frères et sœurs ayant grandi dans le même foyer – permettent de séparer ce qui ne varie pas au sein de la famille (comme le statut socioéconomique ou le quartier) de ce qui varie entre les familles.
- Fournir un essai contrôlé randomisé (ECR) naturel. En raison de la ségrégation mendélienne (méiose), les différences génétiques sont attribuées de manière aléatoire au sein des familles, semblable à un ECR. Cet ECR de la vie réelle est une expérience naturelle qui permet d’attribuer une inférence causale aux effets génétiques directs d’un trait.
- Élimine la causalité inverse. Le Saint Graal des scientifiques est de comprendre la causalité. Le facteur A (génétique) cause-t-il le facteur B (maladie) ? Contrairement aux facteurs non génétiques (éducation, statut socioéconomique), la génétique est fixée à la conception et ne peut être confondue par des événements ultérieurs, éliminant ainsi les problèmes de causalité inverse.
- Fournir des estimations « deux en un ». Les études d’association pangénomiques (en anglais genome-wide association study, GWAS) basées sur la population (i.e., individus non apparentés) estiment uniquement les associations génétiques, tandis que les échantillons familiaux permettent d’estimer à la fois les associations génétiques (entre familles) et les effets génétiques directs (informations au sein de la famille).
- Permettre de comprendre comment les estimations génétiques sont affectées par des facteurs non mesurés. Les GWAS sont une technique de premier plan pour déterminer les associations entre la génétique et un trait particulier. Un problème est celui des confondeurs, lorsque des variables non mesurées affectent la relation entre la génétique et le trait étudié. Un problème majeur avec les GWAS, que nous avons explicités par ailleurs, est la stratification de la population, le choix de partenaire non aléatoire et les effets génétiques parentaux indirects. L’analyse basée sur la famille peut aider à résoudre ces problèmes.
- Premièrement, la stratification de la population. Les composantes principales (un outil statistique utilisé pour identifier les grands motifs au sein d’une population) peuvent contrôler cette stratification. Cependant, comme nous l’avons montré, pour les associations GWAS de traits complexes tels que la réussite scolaire, la taille ou l’âge à la première naissance, une grande partie de l’effet génétique opère via les voies familiales et environnementales (non, économistes, démographes, sociologues, votre recherche n’a pas été vaine). Les prédictions entre frères et sœurs au sein d’une même famille sont beaucoup plus faibles, ce qui démontre le pouvoir des familles.
- Deuxièmement, le choix de partenaire non aléatoire (AM). Les effets génétiques directs des GWAS peuvent être influencés par le fait que les individus choisissent souvent un partenaire de manière très non aléatoire. Cela gonfle les estimations individuelles des GWAS en raison des corrélations positives entre les traits pour lesquels les individus s’associent, comme l’éducation ou le statut socioéconomique. En d’autres termes, la soi-disant « corrélation génétique » entre la taille et l’éducation peut refléter le choix de partenaire sur ces traits plutôt que des effets génétiques directs partagés.
- Troisièmement, les effets génétiques indirects, ou l’« éducation », lorsque les traits de vos parents que vous n’avez pas directement hérités génétiquement vous influencent via l’environnement familial. Vous n’avez peut-être pas hérité des composants génétiques liés à la conscience ou à l’ouverture d’esprit, mais vous en êtes imprégné tout au long de votre enfance. L’article de Augie Kong et de ses collègues dans Science démontre cela empiriquement.
Tout cela semble bien, mais où se trouvent ces données familiales, et comment pourrait-on les collecter ?
La bonne nouvelle est que des données familiales existent déjà. Les pionniers sont des personnes comme Kári Stefánsson de deCODE genetics et d’autres initiatives comme Lifelines_NL , l’étude prospective de Mexico City Prospective Study, MOBA. Consultez notre article dans Nature pour plus d’informations !
Pour de nouvelles initiatives, des échantillons familiaux peuvent être collectés ou en complétant de grandes biobanques et enquêtes existantes en : (1) collectant des échantillons suffisamment grands pour inclure des proches, (2) liant des données existantes à des dossiers administratifs ou de santé de proches, (3) utilisant des échantillons familiaux comme unité d’échantillonnage tels que les frères et sœurs ou les trios (parents et enfants), (4) recrutant des familles entières, ou (5) recrutant des individus index puis en tirant un échantillon représentatif au sein de leur famille (enfants, parents, frères et sœurs).