RELAZIONE ATTIVITA’ SCIENTIFICA ALL’ESTERO
Dott.ssa Stefania Niada
(Università di Milano)
Relazione finale del periodo di studio trascorso all’estero con borsa SIF della Dr.ssa Stefania Niada.
Istituto di provenienza: “Laboratorio di Ricerca di Farmacologia delle Cellule Staminali e Medicina Rigenerativa”, Dipartimento di Scienze Biomediche Chirurgiche e Odontoiatriche, Università di Milano.
Istituto ospitante: Laboratorio diretto dalla Prof.ssa Latif, presso il Centre for Rare Diseases and Personalized Medicine, University of Birmingham, UK.
Titolo del progetto di ricerca: Utilizzo di approccio Whole exome sequencing per la ricerca di geni associati a tumori rari dell’osso.
Il genoma umano comprende ~3 x 10^9 di paia di basi di cui circa l’1% (~3 x 10^7) costituisce sequenze codificanti (exome, esoma). E’ stato stimato che circa l’85% delle mutazioni che causano patologie siano situate nelle regioni codificanti e funzionali del genoma. Per questo motivo, il sequenziamento dell’intera porzione codificante possiede il potenziale per svelare le varianti predisponenti o causanti diversi tipi tumori, patologie comuni o malattie genetiche rare [1]. In passato, l’uso del sequenziamento Sanger e della reazione a cascata della polimerasi di Mullis hanno permesso di raggiungere importanti traguardi tra cui il completamento dell’Human Genome Project, fornendo validi riferimenti per investigare alterazioni genetiche associate ad uno specifico fenotipo. Recentemente, invece, sono state sviluppate nuove strategie che hanno rimpiazzato le metodiche tradizionali per il sequenziamento del genoma (whole genome sequencing, WGS) o dell’esoma (whole exome sequencing, WES) riducendone significativamente tempi e costi. Queste tecnologie rivoluzionarie vengono chiamate next-generation sequencing (NGS) paragonandole al metodo di Sanger che viene ora considerato una tecnologia di prima generazione. Le attuali piattaforme NGS includono quelle prodottte da 450 Life Sciences, Illumina, Applied BioSystem, Helicos Biosciences, Danaher Motion, Oxford Nanopore Technologies e Pacific Biosciences. L’utilizzo di WES permette di ottenere una enorme quantità di dati e di identificare una moltitudine di alterazioni genetiche. Tuttavia, il numero di mutazioni somatiche in un tumore rappresenta meno dello 0.1% delle varianti del suo genoma [2, 3]. Per limitare errate identificazioni risulta quindi di grande aiuto l’analisi contemporanea dell’esoma del tumore e di un tessuto sano dello stesso paziente per poter distinguere tra le mutazioni somatiche e quelle germinali. Per analizzare la grande mole di dati relativi a sequenziamento di campioni tumore-controllo ottenibili grazie alle metodiche di NGS e determinare mutazioni somatiche sono stati sviluppati recentemente vari algoritmi tra cui SomaticSniper, JointSNVMix and Strelka e VarScan2. Quest’ultimo consente di identificare mutazioni somatiche, perdite di eterozigosi e alterazioni nel numero di copie di geni in campioni appaiati tumore-controllo. Varscan2 analizza contemporaneamente le sequenze di un campione di tumore e del suo controllo corrispondente (tessuto sano dello stesso paziente), applicando un metodo euristico e un test statistico per selezionare le varianti e classificarle in base al loro stato somatico [4]. Una volta identificate le mutazioni somatiche è però importante identificare quali tra queste siano passeggere o quali siano effettivamente associate allo sviluppo e/o alla progressione del tumore. Stabilire quali siano queste ultime e distinguerle dalle mutazioni passeggere rappresenta la sfida principale di questo tipo di ricerca.
Il progetto in cui sono stata coinvolta nella prima parte del mio soggiorno presso il laboratorio della Prof.ssa Latif (Professor in Human Molecular Genetics, Centre for Rare Diseases and Personalized Medicine, School of Clinical and Experimental Medicine, College of Medical and Dental Sciences, University of Birmingham) consisteva nello studio tramite WES di un particolare tumore raro dell’osso. Ho iniziato ad apprendere le conoscenze e gli strumenti necessari per affrontare questo tipo di studio dalla preparazione dei campioni per l’analisi WES all’analisi dei dati derivanti. Brevemente abbiamo estratto il DNA da 8 campioni di tumore e altrettanti di tessuto controllo di ciascun paziente e abbiamo inviato i campioni presso la Oxford gene Technology (OGT) dove l’esoma è stato selezionato tramite Agilent SureSelect Human All Exon V5 Kit e sequenziato tramite Illumina paired end sequencing (protocol v1.2) e dove è stata effettuata l’analisi tramite Varscan2 per evidenziare CNV e SNP e inserzioni e delezioni somatiche. I dati che abbiamo così ottenuto hanno rappresentato un punto di inizio per identificare possibili variazioni somatiche tumore-associate. Il primo criterio che abbiamo utilizzato per filtrare i risultati ottenuti consiste nel selezionare solo le varianti che possono avere una seria conseguenza (perdita o guadagno di stop, alterazione di sito di splicing, frameshift, variazioni missenso, inserzioni o delezioni complesse) sull’espressione del gene e sulla proteina da esso codificata. Il secondo criterio utilizzato consiste nell’escludere variazioni missenso il cui effetto sulla proteina risulti non danneggiante (conservativa) secondo 3 strumenti di predizione utilizzati (Polyphen, SIft e Condel). Il terzo criterio riguarda l’esclusione di mutazioni che possano risultare somatiche nel tumore di un paziente ma che siano germinali in altri individui. L’analisi Varscan2 effettuata, infatti, paragona ciascun tumore con il proprio controllo ma non tiene in considerazione i dati derivanti da altri campioni. Per ovviare a questa possibile fonte di errore, abbiamo valutato i dati grezzi relativi alle letture di ciascun campione allineate al genoma di riferimento (GRCh37) e abbiamo eliminato tutte le mutazioni presenti in almeno un campione controllo. Per lo stesso scopo abbiamo anche escluso le varianti se riportate avere una frequenza nella popolazione ≥1% in database quali ExAC Browser, Exome Sequencing Project e 1000 genome. Inoltre altre varianti sono state scartate in quanto in geni definiti fishy, ovvero noti essere frequentemente mutati in vari tipi di tumore ma la cui funzione biologica o le cui caratteristiche genomiche li rendono poco probabilmente correlati alla iniziazione e progressione del tumore[5]. Dopo questa operazione di scrematura abbiamo selezionato geni per validarne le varianti tramite sequenziamento Sanger. I candidati sono stati selezionati in quanto rispondenti a uno o più dei seguenti requisiti: geni che presentino varianti in almeno due campioni di tumore, geni definiti Driver genes e cioè le cui mutazioni o espressioni aberranti conferiscono un vantaggio di crescita selettivo ([6], IntOGen Database) e geni appartenenti a pathway (Ingenuity pathways analysis, DAVID Bioinformatic Resources) la cui errata regolazione potrebbe essere alla base dello sviluppo o mantenimento tumorale (pathways appartenenti a fondamentali processi cellulari quali sopravvivenza e destino della cellula e mantenimento del genoma). Queste operazioni ci hanno portato a identificare circa 50 geni candidati le cui varianti stiamo attualmente validando mediante sequenziamento Sanger.
Nella seconda parte del mio soggiorno ho lavorato a un progetto volto a identificare alterazioni geniche in un altro tipo di tumore raro dell’osso. Analogamente a quanto riportato per il progetto precedente abbiamo isolato il DNA di 16 campioni accoppiati tumore-controllo (8 tumori e 8 biopsie muscolari dei relativi pazienti) e lo abbiamo inviato presso la compagnia OGT per il sequenziamento dell’intero esoma e la prima fase di analisi bioinformatica (Varscan2). In seguito i dati sono stati ulteriormente analizzati mediante MuTect, un metodo sviluppato dal Broad Institute per l’identificazione di mutazioni puntiformi somatiche, al fine di aumentare la sensibilità dell’analisi. Le varianti identificate sono state da me filtrate per selezionare mutazioni che potessero causare una seria conseguenza sulla proteina codificata come spiegato nel dettaglio nella prima parte del progetto. Inoltre al fine di ridurre la percentuale di falsi positivi identificati mediante il sequenziamento ho iniziato ad analizzare le varianti identificate controllandone l’assenza in tutti i tessuti controllo (analisi dei file BAM) e la frequenza allelica minima nella popolazione attraverso le specifiche banche dati già utilizzate nel corso del primo progetto.
Adesso che il mio soggiorno a Birmingham è terminato continuerò a seguire questi progetti in collaborazione con la Prof.ssa Latif (University of Birmingham) presso il laboratorio diretto dalla Prof Brini (Laboratorio di Applicazioni Biotecnologiche, IRCCS Istituto Ortopedico Galeazzi; Laboratory of Mesenchymal Stem Cells Pharmacology and Regenerative Medicine, Dipartimento di Scienze Biomediche, Chirurgiche e Odontoiatriche, Università degli Studi di Milano) che collabora con la prima già da alcuni anni. In particolare per quanto riguarda il progetto iniziato durante la seconda parte del mio soggiorno mi ripropongo di individuare mutazioni in geni di interesse tra cui geni ricorrentemente mutati o appartenenti a pathway o cluster (Ingenuity pathways analysis, DAVID Bioinformatic Resources, IntOGen) che potrebbero essere alterati in più di un campione di questo particolare tipo di tumore, e di validare le suddette alterazioni attraverso il sequenziamento di Sanger. Ad oggi, tutti i campioni utilizzati sono stati forniti dalla National Research Ethics Committee Approved Tissue Bank (The Royal Orthopaedic Hospital NHS Foundation Trust; Robert Aitken Institute of Clinical Research; University of Birmingham) ma grazie alla collaborazione con l’IRCCS Istituto Ortopedico Galeazzi ci proponiamo in futuro di raccogliere un maggior numero di campioni al fine di valutare la frequenza di mutazione di geni candidati in un campione più ampio.
1. Rabbani B, Tekin M, Mahdieh N. The promise of whole-exome sequencing in medical genetics. J Hum Genet. 2014;59:5-15.
2. Ley TJ, Mardis ER, Ding L, Fulton B, McLellan MD, Chen K, et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature. 2008;456:66-72.
3. Mardis ER, Ding L, Dooling DJ, Larson DE, McLellan MD, Chen K, et al. Recurring mutations found by sequencing an acute myeloid leukemia genome. N Engl J Med. 2009;361:1058-66.
4. Koboldt DC, Zhang Q, Larson DE, Shen D, McLellan MD, Lin L, et al. VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res. 2012;22:568-76.
5. Lawrence MS, Stojanov P, Polak P, Kryukov GV, Cibulskis K, Sivachenko A, et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes. Nature. 2013;499:214-8.
6. Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA, Jr., Kinzler KW. Cancer genome landscapes. Science. 2013;339:1546-58.