© Benjamin Vittrant, 2021 L'utilisation des outils bioinformatiques pour caract

© Benjamin Vittrant, 2021 L'utilisation des outils bioinformatiques pour caractériser le paysage immunologique du cancer de la prostate Thèse Benjamin Vittrant Doctorat en médecine moléculaire Philosophiæ doctor (Ph. D.) Québec, Canada L'utilisation des outils bioinformatiques pour caractériser le paysage immunologique du cancer de la prostate Thèse Benjamin Vittrant Sous la direction de Yves Fradet Arnaud Droit Résumé Dans le cadre de mon doctorat j’ai développé des approches appliquées d’analyse de données pour effectuer une analyse multi omique du cancer de la prostate (CaP). Mon projet s’est défini en deux parties distinctes correspondant aux deux articles intégrés dans le corps de mon document. Une première partie du travail a consisté à récupérer des données omiques de différents types (RNA-Seq, Methylation, CNA, SNA, miRNA, données cliniques) associées au CaP et à les préparer avec un pipeline bioinformatique adapté. Ensuite j’ai eu pour objectif de chercher à mettre en avant de nouveaux points de contrôles de l’immunité associés à la récidive biochimique (BCR) dans le CaP au travers de ces données. Pour remplir cet objectif j’ai utilisé une approche particulière basée sur des algorithmes d’analyse en composante principale (PCA) et de régression des moindres carrés (PLS). Cela a permis de faire ressortir une famille spécifique de points de contrôle de l’immunité, la famille des LILR, qui peut potentiellement être une famille cible en immunothérapie. Dans un second temps, j’ai utilisé ces mêmes données pour développer un protocole d’analyse d’apprentissage machine (ML). Le but de ce travail était de montrer qu’il était possible de prédire si des patients allaient récidiver ou pas à partir de données RNA-Seq. J’ai montré que même avec des petits jeux de données on pouvait atteindre des scores de prédiction très bon et que les algorithmes actuels de ML prenaient bien en compte la variabilité technique de la diversité des sources de données dans le CaP. Il est donc possible d’utiliser les biobanques actuelles possédées par les structures de recherches à travers le monde pour créer des jeux de données plus importants. ii Abstract As part of my PhD, I developed applied data analysis approaches to perform a multi-omic analysis of prostate cancer (CaP). My project was split into two distinct parts corresponding to the two articles integrated into the body of my document. A first part of the work consisted in recovering omics data of different types (RNA-Seq, Methylation, CNA, SNA, miRNA, clinical data) associated with CaP and preparing them with an adapted bioinformatics pipeline. Then, my goal was to seek to highlight new immunity checkpoints associated with biochemical recurrence (BCR) in CaP through these data. To fulfill this objective, I used a special approach based on Principal Component Analysis (PCA) and Partial Least Squares Regression (PLS) algorithms. This has brought out a specific family of immunity checkpoints, the LILR family, which can potentially be a target family in immunotherapy. Second, I used the same data to develop a machine learning (ML) analysis protocol. The aim of this work was to show that it was possible to predict whether or not patients would relapse from RNA-Seq data. I have shown that even with small datasets, one can achieve very good prediction scores and that current ML algorithms take into account the technical variability of the diverse data sources in the CaP. It is therefore possible to use current biobanks owned by research structures around the world to create larger datasets. iii Table des matières Résumé ii Abstract iii Table des matières iv Liste des figures vii Abréviations viii Remerciements x Avant-propos xi Article 1 xi Article 2 xi Introduction 1 1.1 Le cancer de la prostate 1 1.1.a Généralités et statistiques 1 1.1.b Diagnostic et évolution du CaP 4 1.1.c Traitement du CaP localisé 5 1.1.d Les cancers métastatiques 9 1.1.d Classification des tumeurs: TNM et Gleason 9 1.1.e Autres outils diagnostiques et pronostiques 12 1.1.f Caractéristiques moléculaires du CaP 16 1.1.g Analyse omiques du CaP: TCGA 20 1.1.h Analyse omique du CaP: CPC-GENE 21 1.2 Immunologie 22 1.2.a Rappels généraux 22 1.2.b Anticorps 24 1.2.c Complexe majeur d'histo-compatibilité 25 1.2.d Inflammasome et micro-environnement tumoral. 29 1.2.e Microenvironnement immunitaire tumoral 31 1.2.f Immunothérapie 34 1.3 Points de contrôle immunologique 36 1.3.a Les points de contrôle immunologique majeurs : CTLA4 et PD1/PD-L1 36 CTLA4 37 PD1/PD-L1 38 1.3.a Les points de contrôle immunologique mineurs 39 iv 1.3.c Les points de contrôle immunologique nouveaux : La famille des LILR 40 LILRB 43 LILRA 45 Relation avec le CaP 46 1.3.d Autres approches 47 1.4 L'immunothérapie du CaP 47 1.4.a Infiltration immunitaire 47 1.4.b Traitements 49 1.5 Bioinformatique 50 1.5.a Analyses des omiques 50 1.5.b Projet internationaux 54 1.5.c Analyse de données en grande dimension 56 La préparation des données 56 Sélection de variables 57 Comprendre ses données : Spécificités des données médicales 57 Algorithmes d’analyse 59 Langages 60 Librairies 61 1.5.d Régression des moindres carrés partiels 61 1.5.e Gain d’information et forêt aléatoires (apprentissage machine) 63 1.5.f Analyse multi-omiques appliquées au CaP 66 1.6 Problématique, hypothèses et objectifs du projet 68 1.6.a Problématique 68 1.6.b Hypothèses 68 1.6.c Objectifs 69 Chapitre 1 : Article 1 70 2.1 Résumé 70 2.2 Titre et auteurs 71 2.3 Abstract 72 2.4 Introduction 73 2.5 Results 74 2.6 Discussion 85 2.7 Material and methods 87 2.8 Bibliographie 105 Chapitre 2 : Article 2 111 3.1 Résumé 111 3.2 Titres et auteurs 111 3.3 Abstract 112 iv 3.4 Introduction 113 3.5 Materials and methods 115 3.6 Results 122 3.7 Discussion 130 3.8 Bibliographie 134 Chapitre 3 : Discussion 144 Chapitre 4 : Perspective 152 Conclusion 155 Matériel supplémentaire 156 Matériel supplémentaire 1. Outils bioinformatiques : Liste des outils d’analyses de bioinformatique au moment de mon travail de préparation des données. 156 Matériel supplémentaire 2. Réduction de dimension - 1 : Méthodes de réduction de dimension pour un jeu de données seul. 157 Matériel supplémentaire 3. Réduction de dimension - 2 : Méthodes de réduction de dimension pour des jeux de données en pair. 158 Matériel supplémentaire 3. Réduction de dimension - 3 : Méthodes de réduction de dimension pour des jeux de données multiples. 159 Bibliographie 160 iv Liste des figures - Figure 1 : Incidence et mortalité - Figure 2 : Système uro-génital mâle - Figure 3 : Incidence et mortalité - Figure 4 : évolution du CaP - Figure 5 : Score de Gleason - Figure 6 : Tables de Partin - Figure 7 : Nomogramme de Kattan - Figure 8 : Score de Capra - Figure 9 : Sous-type moléculaire du CaP primaire TCGA - Figure 10 : Différentes phases de la tumorigenèse - Figure 11 : Action des Ig - Figure 12 : Activation des Tc - Figure 13 : Production des TCR - Figure 14 : Inflammation et tumorigenèse - Figure 15 : Principaux TIME - Figure 16 : TIME et développement tumoral - Figure 17 : Mise en place du TIME par les tumeurs - Figure 18 : Modèles de CTLA4 - Figure 19 : Modèles de PD-1/PD-L1 - Figure 20 : Organisation chromosomique de la famille LILR - Figure 21 : Structure globale des LILR - Figure 22 : Modèle simplifié de LILRB1 vii Abréviations Les abréviations sont classées par ordre alphabétique de l’acronyme utilisé: ADT : Androgen deprivation therapy AKT : Protéine kinase B AR : Androgen receptor ATM : Ataxia telangiectasia serine/threonine kinase mutation AUC : Area under the curve BET : Bromodomain and extraterminal CaP : Cancer de la prostate Cor : Corrélation Cov : Covariance CRPC : Castration resistant prostate cancer CTLs : Cytotoxic T lymphocytes DCs : Dendritic cells DDR : DNA damage Repair EZH2 : Enhancer of zeste homolog 2 FGF : Fibroblast growth factor HLA : Human leukocyte antigens HSCs : Hematopoetic stem cells IE : Immunoediting mCRPC : Metastatic castration resistant prostate cancer MFS : Metastasis-free survival MSI-H : Micro-sattelite instability high mHSPC : Metastatic hormone sensitive prostate cancer MLL : Mixed lineage leukemia NLR : Neutrophil-to-lymphocyte ratio nmCRPC : Non metastatic castration resistant prostate cancer viii PARP : Poly ADP ribose polymerase PRC2 : Polycomb repressive complex 2 PSA : Prostate specific antigen PSMA : Prostate-Specific Membrane Antigen PTEN : Phosphatase and tensin homolog SD : Déviation standard SI : Système immunitaire TAA : Tumor-associated antigens TAM : Tumor-associated macrophages Tc : T-cell TCR : T-cell receptor Tex : T-cell exhausted Teff : T-cell effector TLRs : Toll-like receptors TMA : Transcription mediated assay TIME : Tumor immune micro-environnement TIC : Tumor-immunity cycle UICC : Union for International Cancer Control’s Var : Variance Wnt : Wingless-related integration ix Remerciements N’ayant jamais les bons mots pour ce genre de choses j’irai droit au but ! Tout d’abord j’aimerais remercier Arnaud et Yves de m’avoir fait confiance dans le cadre de ce projet de doctorat. Je n’ai jamais été un étudiant modèle et être arrivé aussi loin dans mes études n’a pu être possible que grâce à des professeurs prêts à prendre des risques. Je rajoute donc la grande Marie-Laure Martin-Magniette à cette liste et qui a aussi accepté de faire de uploads/Management/ l-x27-utilisation-des-outils-bioinformatiques-pour-caracteriser-le-paysage-immunologique-du-cancer-de-la-prostate.pdf

  • 36
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Aoû 11, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 11.8463MB