COSMIC: somatická genetika rakoviny ve vysokém rozlišení

Abstrakt

COSMIC, Catalogue of Somatic Mutations in Cancer (http://cancer.sanger.ac.uk) je zdroj s vysokým rozlišením pro zkoumání cílů a trendů v genetice lidské rakoviny. Informace v databázi COSMIC, která je v současnosti nejrozsáhlejší databází mutací v nádorových onemocněních, jsou kurátorsky zpracovávány odbornými vědci, a to především na základě pečlivého zkoumání velkého množství vědeckých publikací. Ve verzi v78 (září 2016) jsou popsány více než 4 miliony kódujících mutací, které kombinují výsledky celogenomového sekvenování z 28 366 nádorů s kompletní ruční kurátorskou kontrolou 23 489 jednotlivých publikací zaměřených na 186 klíčových genů a 286 klíčových fúzních párů napříč všemi druhy rakoviny. Molekulární profilování velkého počtu nádorů také umožnilo anotovat více než 13 milionů nekódujících mutací, 18 029 genových fúzí, 187 429 genomových přestaveb, 1 271 436 abnormálních úseků počtu kopií, 9 175 462 abnormálních expresních variant a 7 879 142 diferenciálně metylovaných CpG dinukleotidů. COSMIC nyní podrobně popisuje genetiku lékové rezistence, nové somatické genové mutace, které umožňují nádoru vyhnout se terapeutickým protinádorovým lékům. Systém COSMIC v78, který se zpočátku zaměřoval na vysoce charakterizované léky a geny, obsahuje široké profily mutací rezistence u 20 léků a podrobně popisuje opakovaný výskyt 301 jedinečných alel rezistence u 1934 lékově rezistentních nádorů. Všechny informace z databáze COSMIC jsou volně dostupné na webových stránkách COSMIC.

ÚVOD

Velká část lidských nádorových onemocnění je způsobena získáním somatických mutací v průběhu života jedince a rozsáhlé sekvenování kohort pacientů nyní popsalo miliony takových mutací v lidském genomu. Catalogue of Somatic Mutations in Cancer (COSMIC) je databázový systém, který shromažďuje tyto údaje o somatických mutacích z různých veřejných zdrojů do jednoho standardizovaného úložiště a umožňuje jejich snadné zkoumání různými grafickými, tabulkovými a stahovatelnými způsoby. Aby poskytl co největší podporu při výzkumu rakoviny, zahrnuje COSMIC všechny formy lidského nádorového onemocnění, od nejčastějších nádorů plic, prsu a tlustého střeva až po extrémně vzácné formy rakoviny krve, které lékař zaznamená jen jednou nebo dvakrát za kariéru.

Začal v roce 2004 s kurátorstvím v pouhých čtyřech lidských genech (1) a COSMIC se rozrostl do rozsáhlého celogenomového systému pro zkoumání vzorců somatických mutací ve všech druzích rakoviny; nyní jsou rutinně generovány značné genetické údaje napříč lidskými nádory a ty jsou zachycovány odbornými, standardizovanými kurátorskými postupy. Nedávné studie navíc charakterizovaly konkrétní mutace v evoluci genetické rezistence na klinickou léčbu. Přestože je zajištěno, že COSMIC zahrnuje celý rozsah genetiky lidských nádorů, jsou tyto rezistentní mutace zdůrazněny v novém oddíle, aby se zdůraznil jejich dopad v klinické onkologii.

Obsah databáze

Jak bylo popsáno dříve (2,3), kurátorství dat o somatických mutacích do COSMIC probíhá dvěma paralelními cestami. Odborná manuální kurátorská práce s literaturou se zabývá nejdůležitějšími nádorovými geny s důrazem na úplnou a vyčerpávající kurátorskou práci s existující literaturou před vydáním a následnou pravidelnou aktualizací. Tyto klíčové nádorové geny jsou vybírány z Cancer Gene Census (4), což je seznam více než 600 genů s podstatnými důkazy popisujícími jejich silnou roli v onkologii. Výsledkem vysoké kontroly kvality je odmítnutí více než 30 % prací z důvodu nekonzistence nebo nedostatečné podrobnosti. Souběžně s tím odborná kurátorská práce na celogenomových analýzách nádorů vyžaduje ruční přiřazení klasifikace nádorů a klinických údajů, ale velké soubory dat genetických variant jsou anotovány a nahrávány prostřednictvím poloautomatického systému využívajícího Ensembl jako zdroj transkriptomových dat. Celkový obsah ve verzi 78 (září 2016) je popsán v tabulce 1.

Celkový obsah ve verzi 78 databáze COSMIC (září 2016)

Tabulka 1.

Celkový obsah ve verzi 78 databáze COSMIC (září 2016)

.

1 235 846 Vzorky nádorů
4 067 689 Pozorované kódující mutace
18 029 Pozorované Fúze genů
1 271 436 Varianty počtu kopií
9 175 462 Exprese genu Varianty
7 879 142 Diferencovaně metylované CpGs
13 347 517 Ne-kódující varianty
187 429 Strukturální mutace
23 096 Papíry: Ruční kurátorství
393 Genomické publikace
277 TCGA/ICGC/studie buněčných linií
28 366 Celé genomy
1 235 846 Nádorové vzorky
4 067 689 Pozorováno. Kódující mutace
18 029 Pozorované genové fúze
1 271 436 Varianty čísla kopie
9 175 462 Varianty genové exprese
7 879 142 Diferencovaně metylované CpGs
13 347 517 Non-kódující varianty
187 429 Strukturální mutace
23 096 Papíry: Ruční kurátorství
393 Genomické publikace
277 TCGA/ICGC/Cell Line Studies
28 366 Celkové genomy
Tabulka 1.

Celkový obsah ve verzi 78 databáze COSMIC (září 2016)

.

1 235 846 Vzorky nádorů
4 067 689 Pozorované kódující mutace
18 029 Pozorované Fúze genů
1 271 436 Varianty počtu kopií
9 175 462 Exprese genu Varianty
7 879 142 Diferencovaně metylované CpGs
13 347 517 Ne-kódující varianty
187 429 Strukturální mutace
23 096 Papíry: Ruční kurátorství
393 Genomické publikace
277 TCGA/ICGC/studie buněčných linií
28 366 Celé genomy
1 235 846 Nádorové vzorky
4 067 689 Pozorováno. Kódující mutace
18 029 Pozorované genové fúze
1 271 436 Varianty čísla kopie
9 175 462 Varianty genové exprese
7 879 142 Diferencovaně metylované CpGs
13 347 517 Non-kódující varianty
187 429 Strukturální mutace
23 096 Papíry: Ruční kurátorství
393 Genomické publikace
277 TCGA/ICGC/Cell Line Studies
28 366 Celé genomy

Sbírají se údaje o automatických mutacích u všech nádorových onemocnění, v současné době 1335 popisů nemocí ve více než 5000 podrobných klasifikacích. Manuální kurátorství literatury se zaměřuje na bodové mutace (jednonukleotidové mutace, malé inzerce a delece) a genové fúze. Celogenomové profilování nádorů však může být mnohem širší. Zatímco genomová literatura obvykle klade důraz na bodové mutace, větší datové portály zaměřené na konsorcia, včetně The Cancer Genome Atlas (5) (TCGA; http://cancergenome.nih.gov) a International Cancer genome Consortium (6) (ICGC; https://dcc.icgc.org), zahrnují mnohem širší anotace, včetně bodových mutací, aberací počtu kopií, variant genové exprese, variant mety metylace DNA a strukturálních genomových přestaveb, které jsou všechny kurátorovány do COSMIC a kombinovány s dalšími kurátory. Zdůrazňujeme účinnost přístupu založeného na kurátorství literatury: více než 60 % obsahu celého genomu COSMIC je kurátorováno z vědecké literatury, zatímco méně než třetina pochází ze zdrojů konsorcia.

Po kurátorství do COSMIC jsou všechna data standardizována a kombinována v jediné databázi. Každé mutaci je přiřazena souřadnice v lidském referenčním genomu. Od roku 2015 je výchozím referenčním genomem GRCh38, ale je udržován archivní systém na GRCh37. Každé mutaci je přiřazena buď kódující, nebo nekódující anotace. Nekódující popisy jsou jednoduchými výroky o změně sekvence DNA na určených místech genomu. Kódující mutace jsou navíc anotovány podle svého dopadu na gen, který ovlivňují, a popisují změnu sekvence kódujících nukleotidů a změnu sekvence peptidů. Ručně kurátorované mutace, týkající se klíčových genů Cancer Census, jsou anotovány k transkriptům, které mají největší podporu v literatuře (aby co nejlépe podpořily komunitu zkoumající tyto geny). Všechny ostatní genové změny jsou však anotovány prostřednictvím databáze Ensembl (7) k nejdelšímu transkriptu CCDS (Consensus Coding Domain Sequences; 8). Fúze genů jsou popsány z hlediska obsahu exonů z každého partnerského genu. K popisu fúzí jsou opět vybrány transkripty, které se v literatuře používají nejčastěji, čímž je zajištěna nejlepší podpora této komunity. Varianty genové exprese jsou dodatečné číselné hodnoty (Z-skóre) spojené s pojmenovanými geny v COSMIC, které odkazují na rozdíly v expresi v každém vzorku od populační normy (vypočtené na kohortu onemocnění). Změny počtu kopií jsou anotovány tak, aby popisovaly hodnotu ploidie pro každý gen v každém testovaném vzorku nádoru, a jsou popsány jako zisk nebo ztráta ve srovnání s průměrnou hodnotou ploidie v každém nádoru. Hyper/hypo-metylované CpG dinukleotidy jsou popsány ve vzorku, pokud se hodnota beta pro každou sondu podstatně liší od normy pro populaci jednoho onemocnění. A konečně, strukturní body zlomu jsou opatřeny základními anotacemi k referenčním souřadnicím genomu a interpretovány do popisnějších anotací důsledků, pokud jsou podpořeny dalšími publikovanými informacemi.

Klasifikace nádorů je standardizována a popsána v několika nomenklaturách, aby bylo zajištěno vysoké rozlišení, ale také aby byly usnadněny integrativní analýzy. Každý vzorek nádoru je v systému COSMIC primárně klasifikován podle vlastního slovníku vyvinutého týmem předních patologů; k dispozici a popsán je zde: http://cancer.sanger.ac.uk/cosmic/classification. Tato klasifikace je nyní převedena do tezauru National Cancer Institute („NCIt“; 9; https://ncit.nci.nih.gov/ncitbrowser), který byl vybrán jako veřejná ontologie s nejvyšším rozlišením napříč nádorovými onemocněními. Současně jsou klasifikace NCIt přeloženy také do klasifikace Experimental Factor Ontology („EFO“; 10), což podporuje mnoho způsobů integrace dat COSMIC do širších analýz napříč genetikou nádorových onemocnění.

Zvýšená genomická kuratela vedla k většímu rozsahu variant anotovaných napříč genomem, přičemž každý lidský gen nyní vykazuje rozšíření somatických mutací po celé své délce. S cílem snížit složitost těchto údajů a podpořit studie identifikující příčiny onemocnění jsou všechny bodové mutace v systému COSMIC označeny statusem jednonukleotidového polymorfismu (SNP) a hodnotou patogenity. Status SNP definuje, zda byla každá varianta dříve popsána ve studii 1000 genomů (11) nebo v panelu normálních vzorků používaných jako kontroly v experimentech genomického profilování ICGC. Skóre patogenity je určeno algoritmem FATHMM-MKL (12), přičemž skóre je interpretováno tak, že určuje každou variantu jako „patogenní“ nebo „neutrální“.

V roce 2016 bylo zavedeno nové téma pro kurátorství, které zahrnuje genetiku lékové rezistence. Jak bylo popsáno, napříč nádorovými onemocněními byly pozorovány miliony mutací, přičemž tisíce alel se podílejí na vzniku onemocnění. Z nich je navíc popsán malý počet, který způsobuje klinickou rezistenci na farmaceutickou léčbu. Tyto podrobnosti jsou po zveřejnění zachyceny také v kurátorských procesech COSMIC, přičemž nejnovější vydání (v78; září 2016) popisuje rozsah mutací způsobujících rezistenci na 20 protinádorových léčebných postupů.

DOSTUP K DATŮM

COSMIC lze nejsnáze prozkoumat pomocí jeho veřejných webových stránek (http://cancer.sanger.ac.uk). Ta byla vytvořena na míru tak, aby bylo možné snadno prozkoumat mnoho anotací v systému COSMIC uživatelsky přívětivým grafickým způsobem a zároveň poskytovala rozsáhlé soubory dat v tabulkách, které jsou základem každé prezentace. Kromě této webové stránky, která je popsána níže, byly hledány možnosti, jak zpřístupnit COSMIC dalším zdrojům, které by jim umožnily doplnit další veřejné genomické zdroje o široké souvislosti s rakovinou. Například COSMIC přímo podporuje výzkum dětské rakoviny pomocí úplných datových souborů v St. Jude ProteinPaint (13) (https://pecan.stjude.org/#/proteinpaint), poskytuje celogenomový kontext somatických variací rakoviny v Ensembl (7) (http://www.ensembl.org) a upozorňuje na onkologické cíle v rámci Cancer Gene Census v OpenTargets (https://www.opentargets.org). K dispozici je také maják COSMIC (http://cancer.sanger.ac.uk/cosmic/beacon), který odpovídá standardům GA4GH (http://ga4gh.org/#/beacon) a umožňuje dotazování COSMIC v rámci rozsáhlých federativních analýz. Úplný obsah databáze v různých užitečných formátech, včetně dump souborů Oracle, lze získat ke stažení (http://cancer.sanger.ac.uk/cosmic/download), což vyžaduje registraci (https://cancer.sanger.ac.uk/cosmic/register).

Přehled webových stránek

Webové stránky COSMIC jsou dostupné online na adrese http://cancer.sanger.ac.uk. Titulní stránka (obrázek 1) nabízí několik způsobů, jak databázi prozkoumat („Zdroje“, „Nástroje“), a řadu stránek popisujících obsah databáze, způsob, jakým byla data vytvořena, a podrobnosti o přístupu k ní („Odborné kurátorství“, „Data“). Na pravé straně je v diagramu Circos shrnuta rekurence mutací ve všech nádorových genomech v databázi COSMIC (verze 78, září 2016, obsahuje 28 366 genomů a exomů). Se zvětšenou verzí pro bližší zkoumání (http://cancer.sanger.ac.uk/cosmic/landscape) rekurentních vrcholů je tento obrázek klikatelný a reaguje podrobným genomickým pohledem napříč zvolenou oblastí. Primárně se však COSMIC ovládá prostřednictvím centrálního pole „Search“ (hledání), které přijme libovolný název genu nebo synonymum, syntaxi mutace, název vzorku/buněčné linie nebo autora článku a odpoví seznamem možností odpovídajících zadanému hledanému výrazu spolu s několika podrobnostmi pro usnadnění výběru. Po kliknutí na výběr se zobrazí souhrnná stránka s přehledem vybraného genu, vzorku, mutace nebo publikace s dalšími odkazy pro specifikaci dotazu v celém systému COSMIC; tímto způsobem lze podrobně zkoumat trendy somatických mutací ve více genech a typech onemocnění.

Obrázek 1.

Přední stránka COSMIC poskytuje snadné způsoby vyhledávání a navigace v databázi; k dispozici jsou různé nástroje pro různé pohledy na podobná data a několik popisných stránek podrobně popisuje postupy kurátorů dat a aktuální obsah.

Obrázek 1.

Přední stránka databáze COSMIC poskytuje snadné způsoby vyhledávání a navigace v databázi; k dispozici jsou různé nástroje pro různé pohledy na podobná data a na několika popisných stránkách jsou podrobně popsány postupy kurátorů dat a současný obsah.

Trendy mutací v databázi COSMIC lze nejsnáze prozkoumat, když začnete u konkrétního genu nebo nádorového onemocnění. Vyhledávání genů se řídí především názvy genů organizace Human Genome Organisation (HUGO) (http://www.genenames.org/), ale prohledává také všechna synonyma genů (stejně jako další termíny, včetně vzorku/mutace/autora) a vrací všechny záznamy, které obsahují zadané znaky. Například vyhledávání „PTEN“ vrátí jeden gen, protože tento název genu je jedinečný. Vyhledání „RAS“ však vrátí 70 záznamů, protože tento termín se vyskytuje ve více názvech genů a synonymech; výběr člena rodiny RAS (např. KRAS) vrátí specifičtější výsledek.

Po výběru genu zahájí COSMIC analýzu genu zobrazením rozložení mutací po celé délce genu ve formátu histogramu. V tomto grafu osa x představuje lineární peptidovou sekvenci (od methioninu po stop) s možností znázornit nukleotidy místo aminokyselin (v poli Filtry na pravé straně). Grafický histogram shrnuje obsah mutací v několika různých mechanismech, zahrnuje několik os Y, vertikálně zarovnaných, přičemž výška píku představuje počet vzorků, ve kterých byla každá mutace pozorována (stupnice na levé straně ukazuje počty vzorků mutovaných v každé pozici). Minihistogramy shora dolů ukazují vrcholy rekurence mutací napříč genovou sekvencí pro: jednonukleotidové substituce, vícenukleotidové substituce, malé inzerce, malé delece, zisk/ztrátu počtu kopií, overexpresi/underexpresi genu a hyper/hypo metylované CpG dinukleotidy. Obrázek 2 například ukazuje mutační profil genu ABL1, který je hlavním původcem rakoviny krve. Je zřejmé, že většina nádorových mutací se shlukuje uvnitř a v okolí tyrozinkinázové domény tohoto peptidu, což je charakteristické pro řídící mutace v této široké rodině genů. Při použití levých stupnic pro posouzení dopadu jednotlivých typů mutací je ABL1 primárně hnací silou rozvoje rakoviny prostřednictvím bodových mutací v kinázové doméně a nadměrné exprese. Ostatní typy mutací se vyskytují pouze v malém počtu. Graf je zvětšitelný, pro podrobnější zobrazení stačí kliknout a přetáhnout kurzor myši přes oblast zájmu.

Obrázek 2.

Histogram hlavní analýzy genů shrnuje veškerý obsah mutací v jednom genu, v tomto případě genu ABL1. Od shora dolů histogramy představují opakování mutací, na každé pozici nukleotidu/aminokyseliny, rozdělené do samostatných segmentů pro jednonukleotidové substituce, vícenukleotidové substituce, inzerce, delece, zisk/ztrátu počtu kopií, nadměrnou/podměrnou expresi genu a hyper/hypo-metylaci CpG. Opakování mutací napříč tyrozinkinázovou doménou (zvýrazněno fialovou barvou) naznačuje, že tato oblast je v případě mutace klíčovou oblastí, která je příčinou rakoviny.

Obrázek 2.

Histogram hlavní analýzy genů shrnuje veškerý obsah mutací v jednom genu, v tomto případě genu ABL1. Od shora dolů histogramy představují opakování mutací, na každé pozici nukleotidu/aminokyseliny, rozdělené do samostatných segmentů pro jednonukleotidové substituce, vícenukleotidové substituce, inzerce, delece, zisk/ztrátu počtu kopií, nadměrnou/podměrnou expresi genu a hyper/hypo-metylaci CpG. Opakování mutací v tyrozinkinázové doméně (zvýrazněno fialovou barvou) naznačuje, že tato oblast je v případě mutace klíčovou oblastí, která je příčinou vzniku rakoviny.

Pole Filtry na pravé straně umožňuje tento histogram (spolu se všemi informacemi v ostatních záložkách na této stránce) třídit a zkoumat mnoha způsoby, s možnostmi výběru mutací z konkrétní tkáně nebo onemocnění, nebo konkrétní oblasti genu, zadat pouze potvrzené somatické mutace, nebo pouze buněčné linie či vzorky pacientů, stejně jako řadu dalších více mechanistických charakteristik mutací.

Stránka zobrazuje různé pohledy na obsah mutací genu v samostatných „záložkách“ uspořádaných v horní části stránky, které nabízejí několik způsobů, jak pečlivě prozkoumat velké množství dostupných informací. Zvláště užitečné pro zkoumání vlivu vybraných genů napříč stovkami kurátorovaných typů rakoviny je záložka „Tkáň“, která zobrazuje rozdělení mutací napříč tkáněmi a nemocemi uspořádané do matice. Na ose x jsou zobrazeny čtyři typy mutací a na ose y primární typy tkání. Mezi nimi jsou malé červené histogramy s jedním sloupcem, které ukazují dopad každého typu mutace na každou tkáň, přičemž větší sloupce znamenají vyšší dopad, což umožňuje velmi rychle vyhodnotit, které tkáně jsou nejvíce postiženy vybraným genem („n“ je také zobrazeno pro vyhodnocení významnosti červeného sloupce; pokud je číslo malé, významnost je nízká). U genu ABL1 je nejdelší sloupec „Haematopoietic & Lymphoid“, což zdůrazňuje jeho vliv na rakovinu krve. Kliknutím na výraz „Haematopoietic & Lymphoid“ se zobrazí rozdělení klasifikací nádorových onemocnění v rámci této tkáně, z něhož vyplývá, že mutace ABL1 jsou primárně příčinou 28 % hodnocených chronických myeloidních leukémií a 32 % akutních lymfoblastických leukémií (v COSMIC v78).

Prohlížeč nádorových onemocnění

Nádorová onemocnění lze nejsnáze procházet pomocí Prohlížeče nádorových onemocnění (http://cancer.sanger.ac.uk/cosmic/browse/tissue), kde lze provést výběr ze seznamu a vyhnout se tak nutnosti zadávat často složité patologické termíny. Zásadní je výběr primární tkáně, poté je nabídnut výběr napříč souvisejícími subtkáněmi, histologickými a subhistologickými termíny. Na všechny z nich lze kliknout a všechny volby lze přeskočit pomocí horní volby „zahrnout vše“. Jakmile je proveden výběr, kliknutím na tlačítko „Go“ se vypočtou profily mutací ve všech genech pro vybrané onemocnění. Pokud například vyberete jednoduše rakovinu „plic“ a stisknete tlačítko Go, okamžitě se zobrazí 20 nejčastěji mutovaných genů u rakoviny plic (seřazených podle četnosti mutací), přičemž se zvýrazní především dobře charakterizované geny, jako jsou TP53, EGFR a KRAS). Podobně jako na stránkách analýzy genů nabízejí další záložky různé pohledy na mutační zátěž vybraného onemocnění.

Prohlížeč genomu

Somatické mutace u rakoviny jsou nyní anotovány v celém lidském genomu. Vzhledem k více než 4 milionům kódujících bodových mutací a více než 13 milionům nekódujících bodových mutací je metoda hodnocení genomického kontextu napříč těmito informacemi nezbytná. Toho dosahuje nástroj COSMIC Genome Browser (http://cancer.sanger.ac.uk/cosmic/browse/genome), který zobrazuje všechna data o mutacích COSMIC zarovnaná s řadou genomických anotací pomocí instance platformy Jbrowse (14), která umožňuje snadné a rychlé prozkoumání obrovských dat. Titulní stránka tohoto systému nabízí funkci vyhledávání popsanou výše, ale vrací genomický (nikoli genový) pohled na provedený výběr. Počáteční zobrazení zobrazují strukturu genu, bodové mutace a body zlomu struktury genomu pro vybranou oblast. Přibližování a oddalování umožňuje zkoumat detaily a trendy v celé genomické oblasti, přičemž podrobnosti o mutacích se transformují do histogramů, když jsou data na obrazovce příliš přeplněná. Na levé straně obrazovky se nabízí řada dalších stop rozdělených na anotace genomové struktury/funkce z databáze Ensembl (7) a vícenásobné anotace somatických mutací z databáze COSMIC. Ty umožňují zkoumat všechny údaje o somatických mutacích a variacích v zarovnání se strukturami kódujících genů, nekódujících RNA (včetně mikroRNA) a regulačních oblastí. Kromě toho je zpřístupněn obsah databáze dbSNP (15) (https://www.ncbi.nlm.nih.gov/snp/), který umožňuje zkoumat vztahy mezi somatickými mutacemi v databázi COSMIC a širšími lidskými variacemi zahrnutými v databázi dbSNP.

Genetika lékové rezistence

S rozvojem precizní medicíny se objevuje stále více literatury, která popisuje genetické reakce na cílenou léčbu. Somatické mutace získané během evoluce nádoru jsou při aplikaci monoterapie u pacientů s rakovinou často pod selekčním tlakem, což vede ke vzniku nových klonů obsahujících rezistentní alely a způsobuje selhání terapie. COSMIC nyní tyto informace shromažďuje (přehled je uveden na adrese http://cancer.sanger.ac.uk/cosmic/drug_resistance) a popisuje řadu somatických mutací způsobujících rezistenci k vybraným terapeutikům. Ve verzi v78 databáze COSMIC (září 2016) je podrobně popsáno 20 léčiv, přičemž je popsáno 301 jedinečných sekvenčních variant, které způsobily rezistenci k léčivům u 1934 vzorků nádorů. Tyto informace jsou na webových stránkách COSMIC prezentovány v grafické podobě pomocí koláčových grafů a histogramů popisujících opakovaný výskyt genů a mutací ve vývoji rezistence k léčbě. Například nádory způsobené mutacemi ABL1 byly léčeny čtyřmi pojmenovanými léčebnými přípravky (Imatinib, Dasatinib, Bosutinib a Nilotinib) a dalšími nepojmenovanými inhibitory kináz. Krajina rezistence k těmto lékům je uvedena na adrese http://cancer.sanger.ac.uk/cosmic/gene/analysis?ln=ABL1#dt, s možnostmi zobrazení rozsahu dotčených genů nebo mnohem většího rozsahu sekvenčních variant (obrázek 3).

Obrázek 3.

Bylo popsáno několik pojmenovaných terapií léčících nádory řízené ABL1 a mnoho studií uvádí nové mutace způsobující rezistenci k těmto terapiím. Tento histogram zobrazuje dlouhý seznam mutací spojených s rezistencí na pojmenované terapie, přičemž sloupec histogramu ukazuje jejich opakovaný výskyt.

Obrázek 3.

Bylo popsáno několik pojmenovaných terapií léčících nádory řízené ABL1 a mnoho studií uvádí nové mutace způsobující rezistenci na tyto terapie. Tento histogram zobrazuje dlouhý seznam mutací spojených s rezistencí na pojmenovaná terapeutika, přičemž sloupec histogramu ukazuje jejich opakovaný výskyt.

Buněčné linie COSMIC

Souběžně s kurátory COSMIC uvedenými na hlavní webové stránce COSMIC zpřístupňuje ‚COSMIC Cell Lines’ (http://cancer.sanger.ac.uk/cell_lines) molekulární profilování 1015 nádorových buněčných linií běžně používaných v laboratorním výzkumu, zejména při hodnocení aktivity a účinnosti léčiv. Jedná se o samostatnou, ale paralelní databázi s přehledem aktualizací napříč informacemi zveřejněnými v (16), včetně úplného exomového sekvenování každé buněčné linie, analýzy počtu kopií a analýzy genové exprese. Další informace jsou přidávány podle toho, jak jsou dokončovány další experimenty. Data jsou umístěna na analytické webové stránce s identickou funkčností jako kurátorský systém COSMIC (popsaný výše), s dalšími odkazy na soubory nezpracovaných dat a hodnocení citlivosti na léčiva (umístěné na adrese http://www.cancerrxgene.org/).

Ke stažení

Kromě bezplatné a otevřené prezentace systému COSMIC na jeho veřejných webových stránkách je systém COSMIC k dispozici ke stažení také v několika formátech (https://cancer.sanger.ac.uk/cosmic/download). Několik souborů ve formátech TSV (formát oddělený tabulátory) nebo VCF (formát volání variant) poskytuje kompletní soubory dat napříč jednotlivými verzemi COSMIC a celá databáze je poskytována jako úplný exportní soubor Oracle. Stažení kompletních datových souborů COSMIC vyžaduje registraci, ale následný přístup je plný a bezplatný pro všechny akademické a neziskové instituce (https://cancer.sanger.ac.uk/cosmic/register).

BUDOUCÍ PRÁCE

COSMIC je budován především prostřednictvím kurátorství publikované literatury odbornými vědci. To je stále hlavní náplní a s rozšiřováním tohoto týmu mohl COSMIC obsáhnout větší šíři anotací, což nedávno vyústilo v nové zaměření na genetiku lékové rezistence. Všechny aspekty genetické kurátorské práce s nádorovými onemocněními budou pokračovat s důrazem na shromažďování podrobností pro hloubkové popisné anotace napříč klíčovými nádorovými geny a široké molekulární profily napříč nádorovými genomy. Databáze COSMIC se během několika posledních vydání značně rozrostla a předpokládá se, že tento růst bude pokračovat (obrázek 4).

Obrázek 4.

COSMIC se v posledních letech rychle rozrůstá, protože je kurátorováno větší množství genů a jsou zahrnuty další mechanismy mutací. Graf ukazuje jednoduché znázornění velikosti databáze podporující webové stránky COSMIC od roku 2010 do roku 2016 (gzipovaný soubor Oracle dmp, v Mb).

Obrázek 4.

COSMIC se v posledních letech rychle rozrostl, protože jsou kurátorovány větší počty genů a jsou zahrnuty další mechanismy mutací. Graf ukazuje jednoduché znázornění velikosti databáze podporující webové stránky COSMIC od roku 2010 do roku 2016 (gzipovaný soubor Oracle dmp, v Mb).

Informace v databázi COSMIC jsou zpřístupněny několika různými způsoby, které se budou dále rozšiřovat. Tím, že webové stránky COSMIC zahrnují analytickou navigaci rozsáhlých údajů o mnoha onemocněních a mechanismech, jsou stále složitější a změna designu některých jejich prezentací usnadní jejich prohlížení. Prioritou je rovněž podpora externí integrace systému COSMIC. Programové rozhraní API z velké části překoná současnou potřebu stahování velkých datových souborů a bude velmi užitečné při podpoře studií, které potřebují spojit velké soubory dat. Tímto způsobem bude COSMIC i nadále podporovat širokou škálu výzkumů rakoviny, od těch, které zkoumají genetiku primárních nádorů, přes diagnostiku a identifikaci farmaceutických cílů, až po ty, které se snaží pochopit reakce na klinickou intervenci.

PODĚKOVÁNÍ

Většina této práce byla podpořena fondem Wellcome Trust v rámci grantu č. 077012/Z/05/Z. Další finanční prostředky podporující další kurátorství a rozvoj webových stránek byly poskytnuty prostřednictvím licence databáze COSMIC komerčním organizacím. Autoři chtějí dodatečně poděkovat za podporu prostřednictvím spolupráce se společnostmi Bayer Pharmaceuticals, AstraZeneca, Cancer Research Technology a Astex Pharmaceuticals.

FONDY

Wellcome Trust ; licencování databáze COSMIC . Financování za poplatek za otevřený přístup: Wellcome Trust .

Prohlášení o střetu zájmů. Žádný nebyl deklarován.

Bamford
S.

,

Dawson
E.

,

Forbes
S.

,

Clements
J.

,

Pettett
R.

,

Dogan
A.

,

Flanagan
A.

,

Teague
J.

,

Futreal
P.A.

,

Stratton
M.R.

a další.

Databáze a webové stránky COSMIC (Catalogue of Somatic Mutations in Cancer)

.

Br. J. Cancer

.

2004

;

91

:

355

358

.

Forbes
S.A.

,

Beare
D.

,

Gunasekaran
P.

,

Leung
K.

,

Bindal
N.

,

Boutselakis
H.

,

Ding
M.

,

Bamford
S.

,

Cole
C.

,

Ward
S.

a další .

COSMIC: zkoumání světových znalostí o somatických mutacích u lidských nádorových onemocnění

.

Nucleic Acids Res.
2015

;

43

:

D805

D811

.

Forbes
S.A.

,

Beare
D.

,

Bindal
N.

,

Bamford
S.

,

Ward
S.

,

Cole
C.G.

,

Jia
M.

,

Kok
C.

,

Boutselakis
H.

,

De
T.

a další .

COSMIC: High-Resolution Cancer Genetics Using the Catalogue of Somatic Mutations in Cancer

.

Curr. Proto se v tomto čísle objevují další informace. Hum. Genet.
2016

;

91

:

10.11.1

10.11.37

.

Futreal
P.A.

,

Coin
L.

,

Marshall
M.

,

Down
T.

,

Hubbard
T.

,

Wooster
R.

,

Rahman
N.

,

Stratton
M.R.

.

Seznam lidských nádorových genů

.

Nat. Rev. Cancer

.

2004

;

4

:

177

183

.

Collins
F.S.

,

Barker
A.D.

.

Mapování genomu rakoviny. Určení genů, které se podílejí na vzniku rakoviny, pomůže vytyčit nový směr ve složité krajině lidských zhoubných nádorů

.

Sci. Am.
2007

;

296

:

50

57

.

Hudson
T.J.

,

Anderson
W.

,

Artez
A.

,

Barker
A.D.

,

Bell
C.

,

Bernabé
R.R.

,

Bhan
M.K.

,

Calvo
F.

,

Eerola
I.

,

Gerhard
D.S.

a další.

Mezinárodní síť projektů nádorových genomů

.

Nature

.

2010

;

464

:

993

998

.

Yates
A.

,

Akanni
W.

,

Amode
M.R.

,

Barrell
D.

,

Billis
K.

,

Carvalho-Silva
D.

,

Cummins
C.

,

Clapham
P.

,

Fitzgerald
S.

,

Gil
L.

a další.

Ensembl, 2016

.

Nucleic Acids Res.
2016

;

44

:

D710

D716

.

Pruitt
K.D.

,

Harrow
J.

,

Harte
R.A.

,

Wallin
C.

,

Diekhans
M.

,

Maglott
D.R.

,

Searle
S.

,

Farrell
C.M.

,

Loveland
J.E.

,

Ruef
B.J.

,

Hart
E.

a další .

Projekt konsensuální kódovací sekvence (CCDS): Identifikace společného souboru genů kódujících proteiny pro lidský a myší genom

.

Genome Res.
2009

;

19

:

1316

1323

.

Sioutos
N.

,

de Coronado
S.

,

Haber
M.W.

,

Hartel
F.W.

,

Shaiu
W.L.

,

Wright
L.W.

.

NCI Thesaurus: sémantický model integrující klinické a molekulární informace týkající se rakoviny

.

J. Biomed. Inform.
2007

;

40

:

30

43

.

Malone
J.

,

Holloway
E.

,

Adamusiak
T.

,

Kapushesky
M.

,

Zheng
J.

,

Kolesnikov
N.

,

Zhukova
A.

,

Brazma
A.

,

Parkinson
H

.

Modelování výběrových proměnných pomocí ontologie experimentálních faktorů

.

Bioinformatika

.

2010

;

26

:

1112

1118

.

Konzorcium projektu 1000 genomů

.

Globální reference pro genetickou variabilitu člověka

.

Nature

.

2015

;

526

:

68

74

.

Shihab
H.A.

,

Rogers
M.F.

,

Gough
J.

,

Mort
M.

,

Cooper
D.N.

,

Day
I.N.

,

Gaunt
T.R.

,

Campbell
C.

.

Integrativní přístup k předpovídání funkčních účinků nekódujících a kódujících sekvenčních variací

.

Bioinformatika

.

2015

;

31

:

1536

1543

.

Zhou
X.

,

Edmonson
M.N.

,

Wilkinson
M.R.

,

Patel
A.

,

Wu
G.

,

Liu
Y.

,

Li
Y.

,

Zhang
Z.

,

Rusch
M.C.

,

Parker
M.

a další .

Zkoumání genomických změn u dětských nádorových onemocnění pomocí programu ProteinPaint

.

Nat. Genet.
2016

;

48

:

4

6

.

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

a další.

JBrowse: dynamická webová platforma pro vizualizaci a analýzu genomu

.

Genome Biol.
2016

;

17

:

66

90

.

Sherry
S.T.

,

Ward
M.H.

,

Kholodov
M.

,

Baker
J.

,

Phan
L.

,

Smigielski
E.M.

,

Sirotkin
K.

.

dbSNP: databáze genetických variací NCBI

.

Nucleic Acids Res.
2001

;

29

:

308

311

.

Iorio
F.

,

Knijnenburg
T.A.

,

Vis
D.J.

,

Bignell
G.R.

,

Menden
M.P.

,

Schubert
M.

,

Aben
N.

,

Gonçalves
E.

,

Barthorpe
S.

,

Lightfoot
H.

a další.

Krajina farmakogenomických interakcí u rakoviny

.

Cell

.

2016

;

166

:

740

754

.

© Autor(é) 2016. Published by Oxford University Press on behalf of Nucleic Acids Research.
Jedná se o článek s otevřeným přístupem šířený za podmínek licence Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/), která umožňuje neomezené opakované použití, šíření a reprodukci na jakémkoli médiu za předpokladu, že je původní dílo řádně citováno.

.

Leave a Reply

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.