Avis de soutenance - doctorat - Samuel DIOP
Informations pratiques
Ecole doctorale 472
14 cours des Humanités, batiment nord, 93322 Aubervilliers
Ajouter à mon calendrier
- iCal
- Yahoo!
- Outlook.com
- Office365
Choose a calendar service :
Soutenue par
Samuel DIOP
CARACTERISATION AUTOMATISEE DES SPASMES INFANTILES
Les spasmes infantiles représentent un syndrome épileptique sévère touchant les nourrissons, caractérisé par de brèves contractions musculaires durant de 0,5 à 2 secondes. Ces épisodes subtils sont fréquemment mal diagnostiqués comme des comportements infantiles courants, entraînant des retards critiques de traitement pouvant causer d'importantes conséquences développementales. Bien que la surveillance vidéo-EEG reste la référence diagnostique, elle présente des limitations substantielles, notamment des exigences d'hospitalisation, une mauvaise tolérance des électrodes par les nourrissons et une accessibilité restreinte due à l'équipement spécialisé coûteux.
Cette thèse introduit trois approches computationnelles complémentaires pour la détection automatisée des spasmes infantiles utilisant exclusivement des données vidéo, visant à améliorer le diagnostic précoce sans recourir à l'EEG. Premièrement, nous développons un cadre de reconnaissance d'action utilisant l'architecture X3D-M préentraînée sur Kinetics-400, adaptée par transfert d'apprentissage pour identifier les caractéristiques spatio-temporelles des spasmes infantiles. Ce système atteint une AUC-ROC de 0,813±0,058 avec une classification XGBoost sur des fenêtres temporelles de 3 secondes. Deuxièmement, nous implémentons un système de détection basé sur le flux optique utilisant l'algorithme DualTVL1, qui quantifie le mouvement entre les images consécutives tout en préservant les frontières de mouvement. Cette approche démontre une performance supérieure avec un classificateur de modèle de mélange gaussien (AUC ROC : 0,964, sensibilité : 0,989, spécificité : 0,941). Troisièmement, reconnaissant les proportions anatomiques distinctes des enfants par rapport aux adultes, nous développons un modèle de détection spécialisé basé sur YOLO, entraîné sur notre Ensemble de Données de Détection d'Enfants. Ce modèle surpasse significativement les cadres de détection standard en environnement médical (96,6% vs 59,5% de précision).
Notre recherche inclut la création de trois ensembles de données spécialisés : l'ensemble de données Raymond Poincaré avec 136 minutes d'examens vidéo-EEG annotés de 7 patients ; l'ensemble de données Kremlin-Bicêtre avec 1 274 spasmes infantiles annotés sur 61 patients ; et l'Ensemble de Données de Détection d'Enfants contenant 1 930 images réelles d'enfants dans divers scénarios.
Les performances élevées atteintes par toutes les approches suggèrent une utilité clinique potentielle pour réduire les délais de diagnostic, particulièrement dans les contextes aux ressources spécialisées limitées. Les orientations futures incluent l'intégration multimodale avec des données EEG, le développement élargi d'ensembles de données et l'extension à d'autres troubles du mouvement pédiatriques. Cette recherche représente une avancée significative vers un diagnostic plus accessible, précis et rapide des spasmes infantiles, améliorant potentiellement les résultats pour les enfants affectés grâce à une intervention thérapeutique plus précoce.
AUTOMATED CHARACTERIZATION OF INFANTILE SPASMS
Infantile spasms represent a severe epileptic syndrome affecting infants, characterized by brief muscular contractions lasting 0.5-2 seconds. These subtle episodes are frequently misdiagnosed as common infant behaviors, leading to critical treatment delays that can cause significant developmental consequences. While video-EEG monitoring remains the diagnostic gold standard, it presents substantial limitations including hospitalization requirements, poor electrode tolerance by infants, and restricted accessibility due to expensive specialized equipment.
This thesis introduces three complementary computational approaches for automated infantile spasm detection using exclusively video data, aiming to improve early diagnosis without relying on EEG. First, we develop an action recognition framework utilizing the X3D-M architecture pre-trained on Kinetics-400, adapted through transfer learning to identify the characteristic spatio-temporal patterns of infantile spasms. This system achieves an AUC-ROC of 0.813±0.058 with XGBoost classification on 3-second temporal windows. Second, we implement an optical flow-based detection system using the DualTVL1 algorithm, which quantifies motion between consecutive frames while preserving movement boundaries. This approach demonstrates superior performance with a Gaussian Mixture Model classifier (ROC AUC: 0.964, sensitivity: 0.989, specificity: 0.941). Third, recognizing the distinct anatomical proportions of children compared to adults, we develop a specialized YOLO-based detection model trained on our Child Detection Dataset. This model significantly outperforms standard detection frameworks in medical environments (96.6% vs. 59.5% precision).
Our research includes the creation of three specialized datasets: the Raymond Poincaré dataset with 136 minutes of annotated video-EEG exams from 7 patients; the Kremlin-Bicêtre dataset with 1,274 annotated infantile spasms across 61 patients; and the Child Detection Dataset containing 1,930 real-world images of children in diverse scenarios.
The high performance achieved across all approaches suggests potential clinical utility for reducing diagnostic delays, particularly in settings with limited specialized resources. Future directions include multimodal integration with EEG data, expanded dataset development, and extension to other pediatric movement disorders. This research represents a significant step toward more accessible, accurate, and timely diagnosis of infantile spasms, potentially improving outcomes for affected children through earlier therapeutic intervention.
Directeur de thèse :
François JOUEN
Unité de recherche :
Cognitions humaine et artificielle
Membres du jury :
- CoDirecteur de thèse : François JOUEN
- CoDirecteur de thèse : Jean BERGOUNIOUX , Professeur des universités praticien hospitalier (UVSQ)
- Rapporteur : Mohamed CHETOUANI , Professeur (Université Sorbonne Institut des Systèmes Intelligents et de Robotique UMR 7222)
- Examinateur : Bruno CANQUE
- Examinateur : Daniel STOCKHOLM
- Rapporteur : Pascal BOILEAU , Professeur des universités praticien hospitalier (Université Versailles St-Quentin-en-Yvelines Unité Inserm UMRS1185 Physiologie et Physiopathologie Endocriniennes - Université Paris-Saclay)
- Co-encadrant de thèse : Imen TRABELSI , Docteur (EPHE)
- Examinateur : Eric AZABOU , Professeur des universités praticien hospitalier (UVSQ)
Diplôme :
Doctorat Systèmes intégrés, environnement et biodiversité
Spécialité de soutenance :
Informatique, mathématique et applications