Avis de soutenance - doctorat - Marion LEBLANC
Informations pratiques
Ecole doctorale 472
105 Bd de l'Hôpital, 75013 Paris
Faculté de médecine
Ajouter à mon calendrier
Faculté de médecine
- iCal
- Yahoo!
- Outlook.com
- Office365
Choose a calendar service :
Soutenue par
Marion LEBLANC
Épissage normal et pathologique des gènes impliqués dans les maladies des neurones moteurs en tant source de variabilité clinique et d'options thérapeutiques
S'il a d'abord été pensé que la complexité de l'être humain était due à un plus grand nombre de gènes codants par rapport aux autres espèces, nous savons aujourd'hui que c'est surtout une régulation plus complexe de l'expression des gènes qui en est à l'origine. Parmi les processus régulant l'expression des gènes se trouve l'épissage alternatif. En effet, il a été démontré que la règle "un gène - un ARNm - une protéine" est plus une exception qu'une règle et que plus de 95 % des gènes ont plus d'un transcrit d'ARNm chez l'homme, pouvant mener à la production de protéines issues du même gène mais aux fonctions et propriétés différentes.
Cependant, l'étude de ces transcrits alternatifs est compliquée par la ressemblance entre les transcrits. De plus, elle a longtemps été limitée par les technologies de séquençage disponibles, en courts fragments, qui ne permettaient pas d'avoir une vision globale de la molécule d'ARN. Le récent avènement des technologies de séquençage en longs fragments a permis de surmonter cette limitation en permettant un séquençage de la molécule d'ARN dans son entièreté. Ce séquençage reste cependant indirect, dans la plupart des cas, car c'est la molécule d'ADNc, issue de la rétrotranscription de l'ARN, qui est séquencée.
Dans le cadre de ce projet, j'ai étudié l'épissage alternatif des gènes impliqués dans les maladies des neurones moteurs et analysé l'expression cellule-spécifique des transcrits alternatifs de ces gènes. Pour cela, j'ai mis en place un protocole de séquençage indirect de l'ARN en longs fragments avec la technologie d'Oxford Nanopore Technologies. Le cDNA a été obtenu à partir de l'isolation et de la rétrotranscription d'ARN de fibroblastes (n=2), de cellules mononucléées du sang périphérique (n=3) et de neurones moteurs dérivés de cellules souches pluripotentes induites (n=3) humains provenant d'individus contrôles. La librairie de séquençage a ensuite été enrichie en fragments de grande taille afin de contrer le biais de taille du séquençage.
Un pipeline d'analyse des données a été développé, en collaboration avec la plateforme Data Core Analysis de l'Institut du Cerveau, afin de faire l'appel de base, le nettoyage et la sélection des lectures puis leur alignement sur le génome humain. J'ai ensuite mis en place un pipeline d'analyse des lectures déterminant les transcrits alternatifs d'un gène ainsi que ses caractéristiques. Les données seront à terme utilisées pour l'étude de l'expression des gènes impliqués dans les maladies des neurones moteurs, mais j'ai focalisé l'analyse initiale sur un gène en particulier, SPG11, afin de pouvoir mettre en place le protocole ainsi que les pipelines d'analyse.
SPG11 est un gène impliqué dans plusieurs maladies des neurones moteurs puisque des mutations de ce gène ont été montrées causales dans des cas de paraplégies spastiques héréditaires, de maladie de Charcot-Marie Tooth et de sclérose latérale amyotrophique. Le transcrit canonique de SPG11 a une taille de 7,8 kb, ce qui en fait un bon candidat pour le développement de ce type de protocole. Grâce à cette étude, j'ai mis en évidence l'existence de transcrits de SPG11 non-décrits dans les bases de données, avec des différences d'expression cellule-spécifique pour certains. Ces transcrits sont prédits codants, ils pourraient donc avoir des fonctions spécifiques dans ces cellules et nous aider à mieux comprendre le rôle général de SPG11.
De plus, des fibroblastes prélevés sur des patients mutés dans SPG11 ont également été séquencés. Le but de cette seconde étude, à un stade préliminaire, est de savoir si la variabilité clinique observée chez les patients SPG11 peut être en partie expliquée par un impact des mutations sur l'expression des transcrits alternatifs.
Sur le long terme, nous espérons qu'une meilleure compréhension de l'expression du gène aidera à déchiffrer le mécanisme pathologique et à trouver des traitements pour ces pathologies.
Normal and pathological splicing of genes involved in motor neuron diseases as the source of clinical variability and therapeutic options
Although it was initially thought that human organismal complexity was due to a greater number of coding genes than in other species, we now know that it is mainly due to a more complex regulation of gene expression. Among the processes regulating gene expression is alternative splicing. Indeed, it has been shown that the "one gene - one mRNA - one protein" rule is more of an exception than a rule, and that over 95% of genes have more than one mRNA transcript in humans, leading to the production of proteins derived from the same gene but with different functions and properties.
However, the study of these alternative transcripts is complicated by the similarity between the transcripts. Moreover, it has long been limited by the short-read sequencing technologies available, which did not provide a global view of the RNA molecule. The recent advent of long-read sequencing technologies has overcome this limitation, enabling sequencing of the entire RNA molecule. In most cases, however, this sequencing remains indirect, as it is the cDNA molecule, resulting from RNA reverse transcription, that is sequenced.
As part of this project, I studied the alternative splicing of genes involved in motor neuron diseases and analyzed the cell type-specific expression of alternative transcripts of these genes. To do so, I set up an indirect long-read RNA sequencing protocol using Oxford Nanopore Technologies. The cDNA was obtained from the isolation and reverse transcription of RNA from human fibroblasts (n=2), peripheral blood mononuclear cells (n=3), and motor neurons derived from induced pluripotent stem cells (n=3) from control individuals. The sequencing library was then enriched with large fragments to counter the sequencing size bias.
A data analysis pipeline was developed, in collaboration with the Brain Institute's Data Core Analysis platform, to perform the basecalling, cleaning, and selection of reads and their alignment to the human genome. I then set up a read analysis pipeline to determine alternative transcripts and their characteristics. The data will eventually be used to study the expression of genes involved in motor neuron diseases, but I initially focused the analysis on one gene in particular, SPG11, to set up the protocol and analysis pipelines.
SPG11 is implicated in several motor neuron diseases as mutations in this gene have been shown to be causal in hereditary spastic paraplegia, Charcot-Marie Tooth disease, and amyotrophic lateral sclerosis. The canonical transcript of SPG11 is 7.8 kb in size, making it an excellent candidate for the development of this type of protocol. In this study, I have highlighted the existence of SPG11 transcripts not described in databases, some with cell type-specific differences in expression. These transcripts are predicted to be coding, so they could have specific functions and help us better understand the general role of SPG11.
In addition, fibroblasts from SPG11-mutated patients were also sequenced. The aim of this second study, at a preliminary stage, is to find out whether the clinical variability observed in SPG11 patients can be partly explained by the impact of mutations on the expression of alternative transcripts.
In the long term, we hope that a better understanding of SPG11's expression will help to decipher the pathological mechanism and enable the discovery of treatments for these pathologies.
Directeur de thèse :
Giovanni STEVANIN
Unité de recherche :
Institut du cerveau et de la moelle épinière
Membres du jury :
- Directeur de thèse : Giovanni STEVANIN
- Rapporteur : Anne-Sophie LIA , Maître de conférences des universités praticien hospitalier (Université de Limoges)
- Rapporteur : Bertrand COSSON , Professeur des universités (Université Paris Cité)
- Examinateur : Morgane THOMAS-CHOLLIER , Maître de conférences (École Normale Supérieure - université Paris Sciences et Lettres (ENS-PSL))
- Examinateur : Eric ALLEMAND , Chargé de recherche (INSERM)
- Président : Betty GARDIE , Directeur d'études (Ecole Pratique des Hautes Etudes (EPHE))
- Co-encadrant de thèse : Thomas CARLILE , Associate Scientific Director (Biogen)
- Examinateur : Eric LEGUERN , Professeur des universités praticien hospitalier (Sorbonne Université/APHP)
Diplôme :
Doctorat Systèmes intégrés, environnement et biodiversité
Spécialité de soutenance :
Biologie cellulaire et moléculaire et sciences de la santé