RELAZIONE ATTIVITA’ SCIENTIFICA
Dott.ssa NIADA STEFANIA
(Università di Milano)
Relazione del periodo di studio trascorso all’estero con borsa SIF: relazione di metà periodo della Dr.ssa Stefania Niada.
Istituto di provenienza: “Laboratorio di Ricerca di Farmacologia delle Cellule Staminali e Medicina Rigenerativa”, Dipartimento di Scienze Biomediche Chirurgiche e Odontoiatriche, Università di Milano. Istituto ospitante: Laboratorio, diretto dalla Prof.ssa Latif, presso il Centre for Rare Diseases and Personalized Medicine, University of Birmingham, UK.
Utilizzo di approccio Whole exome sequencing per la ricerca di geni associati a tumori rari dell’osso
Il genoma umano comprende ~3 x 109 di paia di basi di cui circa l’1% (~3 x 107) costituisce sequenze codificanti (exome, esoma). E’ stato stimato che circa l’85% delle mutazioni che causano patologie siano situate nelle regioni codificanti e funzionali del genoma. Per questo motivo, il sequenziamento dell’intera porzione codificante possiede il potenziale per svelare le varianti predisponenti o causanti diversi tipi tumori, patologie comuni o malattie genetiche rare [1]. In passato, l’uso del sequenziamento Sanger e della reazione a cascata della polimerasi di Mullis hanno permesso di raggiungere importanti traguardi tra cui il completamento dell’Human Genome Project, fornendo validi riferimenti per investigare alterazioni genetiche associate ad uno specifico fenotipo. Recentemente, invece, sono state sviluppate nuove strategie che hanno rimpiazzato le metodiche tradizionali per il sequenziamento del genoma (whole genome sequencing, WGS) o dell’esoma (whole exome sequencing, WES) riducendone significativamente tempi e costi. Queste tecnologie rivoluzionarie vengono chiamate next-generation sequencing (NGS) paragonandole al metodo di Sanger che viene ora considerato una tecnologia di prima generazione. Le attuali piattaforme NGS includono quelle prodottte da 450 Life Sciences, Illumina, Applied BioSystem, Helicos Biosciences, Danaher Motion, Oxford Nanopore Technologies e Pacific Biosciences. L’utilizzo di WES permette di ottenere una enorme quantità di dati e di identificare una moltitudine di alterazioni genetiche. Tuttavia, il numero di mutazioni somatiche in un tumore rappresenta meno dello 0.1% delle varianti del suo genoma [2, 3]. Per limitare errate identificazioni risulta quindi di grande aiuto l’analisi contemporanea dell’esoma del tumore e di un tessuto sano dello stesso paziente per poter distinguere tra le mutazioni somatiche e quelle germinali. Per analizzare la grande mole di dati relativi a sequenziamento di campioni tumore-controllo ottenibili grazie alle metodiche di NGS e determinare mutazioni somatiche sono stati sviluppati recentemente vari algoritmi tra cui SomaticSniper, JointSNVMix and Strelka e VarScan2. Quest’ultimo consente di identificare mutazioni somatiche, perdite di eterozigosi e alterazioni nel numero di copie di geni in campioni appaiati tumore-controllo. Varscan2 analizza contemporaneamente le sequenze di un campione di tumore e del suo controllo corrispondente (tessuto sano dello stesso paziente), applicando un metodo euristico e un test statistico per selezionare le varianti e classificarle in base al loro stato somatico [4]. Una volta identificate le mutazioni somatiche è però importante identificare quali tra queste siano passeggere o quali siano effettivamente associate allo sviluppo e/o alla progressione del tumore. Stabilire quali siano queste ultime e distinguerle dalle mutazioni passeggere rappresenta la sfida principale di questo tipo di ricerca.
Il progetto in cui sono stata coinvolta nella prima parte del mio soggiorno presso il laboratorio della Prof.ssa Latif (Professor in Human Molecular Genetics, Centre for Rare Diseases and Personalized Medicine, School of Clinical and Experimental Medicine, College of Medical and Dental Sciences, University of Birmingham) consiste nello studio tramite WES di un particolare tumore raro dell’osso. In questi mesi ho iniziato ad apprendere le conoscenze e gli strumenti necessari per affrontare questo tipo di studio dalla preparazione dei campioni per l’analisi WES all’analisi dei dati derivanti. Brevemente abbiamo estratto il DNA da 8 campioni di tumore e altrettanti di tessuto controllo di ciascun paziente e abbiamo inviato i campioni presso la Oxford gene Technology dove l’esoma è stato selezionato tramite Agilent SureSelect Human All Exon V5 Kit e sequenziato tramite Illumina paired end sequencing (protocol v1.2) e dove è stata effettuata l’analisi tramite Varscan2 per evidenziare CNV e SNP e inserzioni e delezioni somatiche. I dati che abbiamo così ottenuto hanno rappresentato un punto di inizio per identificare possibili variazioni somatiche tumore-associate. Il primo criterio che abbiamo utilizzato per filtrare i risultati ottenuti consiste nel selezionare solo le varianti che possono avere una seria conseguenza (perdita o guadagno di stop, alterazione di sito di splicing, frameshift, variazioni missenso, inserzioni o delezioni complesse) sull’espressione del gene e sulla proteina da esso codificata. Il secondo criterio utilizzato consiste nell’escludere variazioni missenso il cui effetto sulla proteina risulti non danneggiante (conservativa) secondo 3 strumenti di predizione utilizzati (Polyphen, SIft e Condel). Il terzo criterio riguarda l’esclusione di mutazioni che possano risultare somatiche nel tumore di un paziente ma che siano germinali in altri individui. L’analisi Varscan2 effettuata, infatti, paragona ciascun tumore con il proprio controllo ma non tiene in considerazione i dati derivanti da altri campioni. Per ovviare a questa possibile fonte di errore, abbiamo valutato i dati grezzi relativi alle letture di ciascun campione allineate al genoma di riferimento (GRCh37) e abbiamo eliminato tutte le mutazioni presenti in almeno un campione controllo. Per lo stesso scopo abbiamo anche escluso le varianti se riportate avere una frequenza nella popolazione ≥1% in database quali ExAC Browser, Exome Sequencing Project e 1000 genome. Inoltre altre varianti sono state scartate in quanto in geni definiti fishy, ovvero noti essere frequentemente mutati in vari tipi di tumore ma la cui funzione biologica o le cui caratteristiche genomiche li rendono poco probabilmente correlati alla iniziazione e progressione del tumore[5]. Dopo questa operazione di scrematura abbiamo selezionato geni per validarne le varianti tramite sequenziamento Sanger. I candidati sono stati selezionati in quanto rispondenti a uno o più dei seguenti requisiti: geni che presentino varianti in almeno due campioni di tumore, geni definiti Driver genes e cioè le cui mutazioni o espressioni aberranti conferiscono un vantaggio di crescita selettivo ([6], IntOGen Database) e geni appartenenti a pathway (Ingenuity pathways analysis, DAVID Bioinformatic Resources) la cui errata regolazione potrebbe essere alla base dello sviluppo o mantenimento tumorale (pathways appartenenti a fondamentali processi cellulari quali sopravvivenza e destino della cellula e mantenimento del genoma). Queste operazioni ci hanno portato a identificare circa 50 geni candidati le cui varianti stiamo attualmente validando mediante sequenziamento Sanger. Nell’ambito di questo progetto ci proponiamo anche di studiare le varianti identificate attraverso un programma statistico (MutSigCV) che permetta di eliminare gli artefatti ed evidenziare nei nostri campioni i geni effettivamente associati allo sviluppo e alla progressione del tumore. Nella seconda parte del mio soggiorno inizierò anche ad analizzare i dati relativi ai campioni di altri tipi di tumori rari dell’osso.
Al temine del mio soggiorno a Birmingham continuerò a seguire questi progetti in collaborazione con la Prof.ssa Latif (University of Birmingham) presso il laboratorio diretto dalla Prof Brini (Laboratorio di Applicazioni Biotecnologiche, IRCCS Istituto Ortopedico Galeazzi; Laboratory of Mesenchymal Stem Cells Pharmacology and Regenerative Medicine, Dipartimento di Scienze Biomediche, Chirurgiche e Odontoiatriche, Università degli Studi di Milano) che collabora con la prima già da alcuni anni. Ad oggi, tutti i campioni utilizzati sono stati forniti dalla National Research Ethics Committee Approved Tissue Bank (The Royal Orthopaedic Hospital NHS Foundation Trust; Robert Aitken Institute of Clinical Research; University of Birmingham) ma grazie alla collaborazione con l’IRCCS Istituto Ortopedico Galeazzi ci proponiamo in futuro di raccogliere un maggior numero di campioni al fine di valutare la frequenza di mutazione di geni candidati in un campione più ampio.
- Rabbani B, Tekin M, Mahdieh N. The promise of whole-exome sequencing in medical genetics. J Hum Genet. 2014;59:5-15.
- Ley TJ, Mardis ER, Ding L, Fulton B, McLellan MD, Chen K, et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature. 2008;456:66-72.
- Mardis ER, Ding L, Dooling DJ, Larson DE, McLellan MD, Chen K, et al. Recurring mutations found by sequencing an acute myeloid leukemia genome. N Engl J Med. 2009;361:1058-66.
- Koboldt DC, Zhang Q, Larson DE, Shen D, McLellan MD, Lin L, et al. VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res. 2012;22:568-76.
- Lawrence MS, Stojanov P, Polak P, Kryukov GV, Cibulskis K, Sivachenko A, et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes. Nature. 2013;499:214-8.
- Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA, Jr., Kinzler KW. Cancer genome landscapes. Science. 2013;339:1546-58.