COSMIC: szomatikus rákgenetika nagy felbontásban

Abstract

A COSMIC, a Catalogue of Somatic Mutations in Cancer (http://cancer.sanger.ac.uk) egy nagy felbontású forrás az emberi rák genetikai célpontjainak és trendjeinek feltárására. A COSMIC jelenleg a rákban előforduló mutációk legszélesebb adatbázisát szakértő tudósok kuratálják, elsősorban nagyszámú tudományos publikáció átvizsgálásával. Több mint 4 millió kódoló mutációt ír le a v78 (2016. szeptember), amely 28 366 daganat genom-szintű szekvenálási eredményeit kombinálja 23 489 egyedi publikáció teljes kézi kurációjával, amelyek 186 kulcsfontosságú génre és 286 kulcsfontosságú fúziós párra összpontosítanak az összes rákbetegségben. A nagyszámú daganat molekuláris profilozása lehetővé tette továbbá több mint 13 millió nem kódoló mutáció, 18 029 génfúzió, 187 429 genomi átrendeződés, 1 271 436 abnormális kópiaszámú szegmens, 9 175 462 abnormális expressziós variáns és 7 879 142 differenciálisan metilált CpG-dinukleotid annotálását. A COSMIC most a gyógyszerrezisztencia genetikáját, az új szomatikus génmutációkat részletezi, amelyek lehetővé teszik, hogy a daganat elkerülje a terápiás rákgyógyszereket. A COSMIC v78 kezdetben a jól jellemzett gyógyszerekre és génekre összpontosítva 20 gyógyszerre kiterjedő, széles körű rezisztencia-mutációs profilokat tartalmaz, részletezve 301 egyedi rezisztenciaallél visszatérését 1934 gyógyszerrezisztens tumorban. A COSMIC-adatbázis minden információja szabadon hozzáférhető a COSMIC weboldalán.

BEVEZETÉS

A humán rákos megbetegedések nagy részét az egyén élete során bekövetkező szomatikus mutációk okozzák, és a betegcsoportok nagyszabású szekvenálása mára több millió ilyen mutációt írt le az emberi genomban. A Catalogue of Somatic Mutations in Cancer (COSMIC) egy olyan adatbázisrendszer, amely ezeket a különböző nyilvános forrásokból származó szomatikus mutációs adatokat egyetlen szabványosított adattárba gyűjti, és könnyen feltárhatóvá teszi különböző grafikus, táblázatos és letölthető módon. Annak érdekében, hogy a lehető legnagyobb támogatást nyújtsa a rákkutatásban, a COSMIC az emberi rák minden formáját felöleli, a leggyakoribb tüdő-, emlő- és vastagbélrákoktól kezdve a vérrák rendkívül ritka formáiig, amelyeket egy klinikus csak egyszer vagy kétszer figyel meg pályafutása során.

A 2004-ben mindössze négy emberi génre vonatkozó kurációval indult (1) COSMIC mára egy nagy, az egész genomra kiterjedő rendszerré nőtte ki magát, amely a szomatikus mutációk mintázatainak feltárására szolgál minden rákbetegségben; ma már rutinszerűen jelentős genetikai adatok keletkeznek az emberi daganatokról, és ezeket szakértői, szabványosított kurációs eljárásokkal rögzítik. Emellett a közelmúltban végzett tanulmányok a klinikai terápiákkal szembeni genetikai rezisztencia kialakulásában szerepet játszó egyes mutációkat jellemezték. Miközben biztosítjuk, hogy a COSMIC a humán rákgenetika teljes lefedettségét lefedje, ezeket a rezisztenciamutációkat egy új szakaszban hangsúlyozzuk, hogy kiemeljük hatásukat a klinikai onkológiában.

ADATBÁZIS TARTALMA

Amint azt korábban leírtuk (2,3), a szomatikus mutációs adatok kurálása a COSMIC-ben két párhuzamos úton történik. A szakértői kézi irodalmi kuráció a legfontosabb rákos génekkel foglalkozik, hangsúlyt fektetve a meglévő irodalom teljes és kimerítő kurációjára a közzététel előtt, amelyet rendszeres frissítések követnek. Ezeket a kulcsfontosságú rákgéneket a Cancer Gene Censusból (4) választják ki, amely több mint 600 olyan gént tartalmaz, amelyeknek az onkológiában betöltött jelentős szerepét jelentős bizonyítékok támasztják alá. A magas szintű minőségellenőrzés eredményeként a cikkek több mint 30%-át visszautasítják következetlenség vagy elégtelen részletesség miatt. Ezzel párhuzamosan a genomszintű tumorelemzések szakértői kurátora a tumorok osztályozásának és a klinikai adatoknak a manuális hozzárendelését igényli, de a genetikai variánsadatok nagy fájljait egy félautomatizált rendszeren keresztül annotálják és töltik fel, amely az Ensembl-t használja a transzkriptom adatok forrásaként. A v78 kiadás (2016. szeptember) teljes tartalmát az 1. táblázat tartalmazza.

Total contents in version 78 of the COSMIC database (September 2016)

Table 1.

A COSMIC adatbázis 78. verziójának teljes tartalma (2016. szeptember)

.

1 235 846 Tumorminták
4 067 689 Megfigyelt kódoló mutációk
18 029 Megfigyelt… Génfúziók
1 271 436 Kópiaszám variánsok
9 175 462 Génexpresszió Variánsok
7 879 142 Differenciálisan metilált CpG-k
13 347 517 Nem-kódoló változatok
187 429 Szerkezeti mutációk
23 096 Papírok: Kézi kurálás
393 Genomikai publikációk
277 TCGA/ICGC/Cellvonal vizsgálatok
28 366 Teljes genomok
1 235 846 Tumorminták
4 067 689 Megfigyeltek Kódoló mutációk
18 029 Megfigyelt génfúziók
1 271 436 Kópiaszám variánsok
9 175 462 Genexpressziós variánsok
7 879 142 Differenciálisan metilált CpG-k
13 347 517 Nem-kódoló változatok
187 429 Szerkezeti mutációk
23 096 Papírok: Kézi kurálás
393 Genomikai publikációk
277 TCGA/ICGC/Cell. Line Studies
28 366 Whole Genomes
1. táblázat.

A COSMIC adatbázis 78. verziójának teljes tartalma (2016. szeptember)

.

1 235 846 Tumorminták
4 067 689 Megfigyelt kódoló mutációk
18 029 Megfigyelt… Génfúziók
1 271 436 Kópiaszám-variánsok
9 175 462 Génexpresszió Variánsok
7 879 142 Differenciálisan metilált CpG-k
13 347 517 Nem-kódoló változatok
187 429 Szerkezeti mutációk
23 096 Papírok: Kézi kurálás
393 Genomikai publikációk
277 TCGA/ICGC/Cellvonal vizsgálatok
28 366 Teljes genomok
1 235 846 Tumorminták
4 067 689 Megfigyeltek Kódoló mutációk
18 029 Megfigyelt génfúziók
1 271 436 Kópiaszám-variánsok
9 175 462 Genexpressziós variánsok
7 879 142 Differenciálisan metilált CpG-k
13 347 517 Nem-kódoló változatok
187 429 Szerkezeti mutációk
23 096 Papírok: Kézi kurálás
393 Genomikai publikációk
277 TCGA/ICGC/sejtvonal vizsgálatok
28 366 Whole Genomes

Szomatikus mutációs adatokat gyűjtenek az összes daganatos betegségről, jelenleg 1335 betegségleírás több mint 5000 részletes osztályozásban. A kézi irodalmi kuráció a pontmutációkra (egynukleotid mutációk, kis inszerciók és deléciók) és génfúziókra összpontosít. A genom-szintű tumorprofilok azonban sokkal szélesebb körűek lehetnek. Míg a genomikai irodalom általában a pontmutációkra helyezi a hangsúlyt, a nagyobb konzorcium-fókuszú adatportálok, köztük a The Cancer Genome Atlas (5) (TCGA; http://cancergenome.nih.gov) és az International Cancer genome Consortium (6) (ICGC; https://dcc.icgc.org) sokkal szélesebb körű annotációkat tartalmaznak, beleértve a pontmutációkat, kópiaszám-aberrációkat, génexpressziós variánsokat, DNS-metilációs variánsokat és strukturális genomiális átrendeződéseket, amelyeket mind a COSMIC-be kuratálnak és más kurációkkal kombinálnak. Hangsúlyozva az irodalmi kurációs megközelítés hatékonyságát, a COSMIC genomszintű tartalmának több mint 60%-át a tudományos irodalomból kuratálják, míg kevesebb mint egyharmada konzorciumi forrásokból származik.

A COSMIC-ba kuratálva az összes adatot szabványosítják és egyetlen adatbázisban egyesítik. Minden mutációhoz hozzárendelnek egy koordinátát a humán referencia genomon. 2015 óta az alapértelmezett referencia a GRCh38, de a GRCh37-en archivált rendszert tartanak fenn. Minden mutációhoz vagy kódoló vagy nem kódoló annotációt rendelnek. A nem-kódoló leírások egyszerű kijelentések a DNS-szekvencia változásáról meghatározott genomi helyeken. A kódoló mutációkat ezen felül az általuk érintett génre gyakorolt hatásuk szerint is annotálják, leírva a kódoló nukleotidszekvencia-változást és a peptidszekvencia-változást. A kézzel kurrált mutációkat a Cancer Census kulcsfontosságú génjein a szakirodalomban leginkább támogatott átiratokhoz jegyzetelik (hogy a legjobban támogassák az ezeket a géneket vizsgáló közösséget). Minden más génváltozást azonban az Ensembl-adatbázison (7) keresztül a leghosszabb CCDS-transzkripthez (Consensus Coding Domain Sequences; 8) jegyzetelnek. A génfúziókat az egyes partnergének exon-tartalma alapján írjuk le. A fúziók leírásához ismét azokat a transzkripteket választottuk ki, amelyeket a szakirodalomban a legtöbbet használnak, így biztosítva a legjobb támogatást ennek a közösségnek. A génexpressziós variánsok további numerikus értékek (Z-pontszámok), amelyek a COSMIC-ban megnevezett génekhez kapcsolódnak, és az egyes mintákban a populációs normától való expressziós különbségekre utalnak (betegségenként kiszámított kohorsz). A másolatszám-változások az egyes gének ploidiaértékének leírására szolgálnak minden egyes vizsgált tumormintában, és az egyes tumorok átlagos ploidiaértékéhez képest nyereségként vagy veszteségként vannak leírva. A hiper/hypo-metilált CpG-dinukleotidokat akkor írjuk le egy mintában, ha az egyes szondák béta-értéke jelentősen eltér a betegségenkénti populációs normától. Végül a strukturális töréspontok a referencia genom-koordinátákhoz tartozó alapvető annotációkat kapnak, és leíróbb következmény-annotációkká értelmezhetők, ha ezt további publikált információkkal támasztják alá.

A daganatok osztályozása szabványosított és többféle nómenklatúrában van leírva a nagy felbontás biztosítása, de az integratív elemzések megkönnyítése érdekében is. A COSMIC-ban minden egyes tumormintát elsősorban egy vezető patológusokból álló csoport által kifejlesztett egyedi szókincs alapján osztályoznak; ez itt elérhető és ismertethető: http://cancer.sanger.ac.uk/cosmic/classification. Ezt az osztályozást most lefordítják a National Cancer Institute tezauruszába (“NCIt”; 9; https://ncit.nci.nih.gov/ncitbrowser), amelyet a rákbetegségeket átfogó, legnagyobb felbontású nyilvános ontológiának választottak. Ezzel párhuzamosan az NCIt osztályozását lefordítják az Experimental Factor Ontology (“EFO”; 10) osztályozására is, ami többféle módon támogatja a COSMIC-adatok integrálását a rákgenetikai szélesebb körű elemzésekbe.

A fokozott genomikai kuráció a genomban annotált variánsok szélesebb körét eredményezte, és ma már minden emberi gén szomatikus mutációkat mutat a teljes hosszában. Ezen adatok összetettségének csökkentése és a betegséget kiváltó tényezők azonosítását célzó vizsgálatok támogatása érdekében a COSMIC-ban minden pontmutációt egynukleotid-polimorfizmus (SNP) státusszal és patogenitási értékkel jelölnek. Az SNP-státusz meghatározza, hogy az egyes variánsokat korábban leírták-e az 1000 genom tanulmányban (11), vagy az ICGC genomikai profilalkotási kísérletek során kontrollként használt normál mintákban. A patogenitási pontszámokat a FATHMM-MKL algoritmus (12) határozza meg, a pontszámokat úgy értelmezve, hogy az egyes variánsokat “patogénként” vagy “semlegesként” határozzák meg.

2016-ban új kurátori témát vezettek be, amely a gyógyszerrezisztencia genetikáját foglalja magában. Mint leírtuk, a rákos megbetegedésekben több millió mutációt figyeltek meg, és több ezer allélt vontak be a betegség okozásába. Ezek közül egy kis részük ráadásul a gyógyszeres terápiákkal szembeni klinikai rezisztencia okozójaként van leírva. Ezeket a részleteket, amikor közzéteszik, a COSMIC kurációs folyamatai is rögzítik, a legutóbbi kiadás (v78; 2016. szeptember) a 20 rákellenes kezeléssel szembeni rezisztenciát okozó mutációk körét írja le.

ADATELÉRÉS

A COSMIC legkönnyebben a nyilvános weboldalán (http://cancer.sanger.ac.uk) fedezhető fel. Ezt úgy alakították ki, hogy a COSMIC számos annotációja felhasználóbarát grafikus módon könnyen felfedezhető legyen, miközben nagy táblázatos adatkészleteket is biztosít, amelyek minden egyes bemutatót alátámasztanak. Az alább ismertetett honlapon túlmenően lehetőség nyílt arra, hogy a COSMIC-ot más források számára is elérhetővé tegyék, és így további nyilvános genomikai forrásokhoz széleskörű rákos kontextust adjanak. A COSMIC például közvetlenül támogatja a gyermekrákkutatást a St. Jude ProteinPaint (13) (https://pecan.stjude.org/#/proteinpaint) teljes adatkészleteivel, az Ensembl-ben (7) (http://www.ensembl.org) a rákos szomatikus variáció genomszintű kontextusát biztosítja, és az OpenTargets-ben (https://www.opentargets.org) kiemeli az onkológiai célpontokat a Cancer Gene Censusban. A GA4GH szabványoknak (http://ga4gh.org/#/beacon) megfelelő COSMIC beacon (http://cancer.sanger.ac.uk/cosmic/beacon) is rendelkezésre áll, amely lehetővé teszi a COSMIC lekérdezését nagy szövetségi elemzéseken belül. Az adatbázis teljes tartalma számos hasznos formátumban, beleértve az Oracle dump fájlokat is, letölthető (http://cancer.sanger.ac.uk/cosmic/download), amihez regisztráció szükséges (https://cancer.sanger.ac.uk/cosmic/register).

Honlap áttekintés

A COSMIC honlapja online elérhető a http://cancer.sanger.ac.uk címen. A kezdőlapon (1. ábra) többféle módon lehet felfedezni az adatbázist (“Resources”, “Tools”), valamint egy sor olyan oldalt találunk, amelyek leírják az adatbázis tartalmát, az adatok keletkezésének módját és a hozzáférés részleteit (“Expert Curation”, “Data”). A jobb oldalon egy Circos-diagram foglalja össze a mutációk ismétlődését a COSMIC összes tumorgenomjában (78. verzió, 2016. szeptember, 28 366 genomot és exomot tartalmaz). A rekurrens csúcsok közelebbi feltárására szolgáló zoomolt verzióval (http://cancer.sanger.ac.uk/cosmic/landscape) ez a kép kattintható, és a kiválasztott régió részletes genomikus perspektívájával válaszol. A COSMIC azonban elsősorban a központi “Keresés” mezőn keresztül navigálható, amely bármilyen génnevet vagy szinonimát, mutációs szintaxist, minta/sejtsor nevét vagy a cikk szerzőjét elfogadja, és a beírt keresési kifejezésnek megfelelő lehetőségek listájával válaszol, a kiválasztást segítő néhány részlet mellett. A kiválasztást követően egy összefoglaló oldal jelenik meg, amely áttekintést ad a kiválasztott génről, mintáról, mutációról vagy publikációról, további linkekkel a COSMIC-on belüli lekérdezés specializálására; ily módon a szomatikus mutációs trendek több génre és betegségtípusra vonatkozóan részletesen feltárhatók.

1. ábra.

A COSMIC kezdőlapja egyszerű keresési és navigációs lehetőségeket biztosít az adatbázisban; különböző eszközök állnak rendelkezésre a hasonló adatok különböző perspektíváihoz, és több leíró oldal részletezi az adatok kurálási eljárásait és aktuális tartalmát.

1. ábra.

A COSMIC kezdőlapja egyszerű keresési és navigációs lehetőségeket biztosít az adatbázisban; különböző eszközök állnak rendelkezésre a hasonló adatok különböző nézőpontjaihoz, és több leíró oldal részletezi az adatok kurátori eljárásait és aktuális tartalmát.

A COSMIC-en belüli mutációs trendeket akkor lehet a legkönnyebben felfedezni, ha egy adott génnel vagy rákos betegséggel kezdjük. Elsősorban a Human Genome Organisation (HUGO) génnevei (http://www.genenames.org/) alapján a génkeresés az összes gén szinonimájára (valamint más kifejezésekre, beleértve a minta/mutáció/szerzőt) is rákeres, és visszaad minden olyan bejegyzést, amely tartalmazza a megadott karaktereket. Például a “PTEN” keresés egy gént fog visszaadni, mivel ez a génnév egyedi. A “RAS” keresés azonban 70 bejegyzést ad vissza, mivel ez a kifejezés több génnévben és szinonimában is előfordul; a RAS család valamelyik tagját (pl. KRAS) választva specifikusabb eredményt kapunk.

A gén kiválasztása után a COSMIC a génelemzést a mutációknak a gén hosszában való eloszlásának hisztogram formátumú megjelenítésével kezdi meg. Ezen a grafikonon az x-tengely a lineáris peptidszekvenciát ábrázolja (metionintól a Stopig), az aminosavak helyett nukleotidok ábrázolására van lehetőség (a jobb oldali Szűrők dobozban). A hisztogram grafikon a mutációtartalmat foglalja össze több különböző mechanizmuson keresztül, több Y tengelyt felölelve, függőlegesen egymáshoz igazítva, a csúcsmagasság pedig azon minták számát jelzi, amelyekben az egyes mutációkat megfigyelték (a bal oldali skálasáv az egyes pozíciókban mutálódott minták számát mutatja). A mini-hisztogramok fentről lefelé haladva mutatják a mutációs ismétlődési csúcsokat a génszekvenciában a következő esetekben: egy nukleotid szubsztitúciók, több nukleotid szubsztitúciók, kis inszerciók, kis deléciók, kópiaszám nyereség/veszteség, gén overexpresszió/underexpresszió és hiper/hypo metilált CpG-dinukleotidok. A 2. ábra például az ABL1 gén mutációs profilját mutatja, amely a vérrák egyik fő kiváltó oka. Világos, hogy a legtöbb rákos mutáció e peptid tirozinkináz doménjén belül és körül csoportosul, ami e széles géncsaládban a driver mutációkra jellemző. A bal oldali skálasávokat használva az egyes mutációtípusok hatásának megítélésére, az ABL1 elsősorban a kinázdomain pontmutációk és a túlterjedés révén hajtja a rák kialakulását. Más mutációtípusok csak kis számban figyelhetők meg. A grafikon nagyítható, a részletesebb megjelenítéshez az egérkurzor egyszerű kattintására és áthúzására van szükség az érdekes régióban.

2. ábra.

A fő génelemzési hisztogram egyetlen gén, jelen esetben az ABL1 gén összes mutációs tartalmát foglalja össze. A hisztogramok felülről lefelé haladva mutatják a mutációk ismétlődését minden egyes nukleotid/aminosav pozícióban, külön szegmensekre bontva az egynukleotid szubsztitúciók, többnukleotid szubsztitúciók, inszerciók, deléciók, kópiaszám nyereség/veszteség, gén túl/alul-expresszió és CpG hiper/hypo-metiláció tekintetében. A tirozin-kináz doménen (lilával kiemelve) történő mutáció-visszatérés azt jelzi, hogy mutáció esetén ez az a kulcsfontosságú régió, amely a rák kialakulásához vezet.

2. ábra.

A fő génelemzési hisztogram egyetlen gén, ebben az esetben az ABL1 gén teljes mutációs tartalmát összefoglalja. A hisztogramok felülről lefelé haladva mutatják a mutációk ismétlődését minden egyes nukleotid/aminosav pozícióban, külön szegmensekre bontva az egynukleotid szubsztitúciók, többnukleotid szubsztitúciók, inszerciók, deléciók, kópiaszám nyereség/veszteség, gén túl/alul-expresszió és CpG hiper/hypo-metiláció tekintetében. A mutációk ismétlődése a tirozin-kináz doménben (lila színnel kiemelve) azt jelzi, hogy mutáció esetén ez az a kulcsfontosságú régió, amely a rák kialakulásához vezet.

A jobb oldali szűrőmező lehetővé teszi, hogy ezt a hisztogramot (az oldal más lapjain található összes információval együtt) többféleképpen szitáljuk és vizsgáljuk, lehetőség van egy adott szövetből vagy betegségből, vagy egy adott génrégióból származó mutációk kiválasztására, csak a megerősített szomatikus mutációk, vagy csak sejtvonalak vagy betegminták, valamint számos más, mechanisztikusabb mutációs jellemző meghatározására.

A weboldal az oldal tetején elhelyezett külön “fülek” segítségével különböző nézőpontokból mutatja be egy gén mutációs tartalmát, többféle módon kínálva lehetőséget a rendelkezésre álló nagy mennyiségű információ alapos vizsgálatára. A “Tissue” különösen hasznos a kiválasztott gének hatásának feltárásához a több száz kurrens ráktípuson keresztül, a “Tissue” a mutációk szövetek és betegségek szerinti bontását mutatja mátrixba rendezve. Az x-tengelyen négy mutációtípus, az y-tengelyen pedig elsődleges szövettípusok láthatók. Ezek között kis piros egysávos hisztogramok mutatják az egyes mutációtípusok hatását az egyes szövetekre, a nagyobb sávok nagyobb hatást jeleznek, lehetővé téve annak nagyon gyors értékelését, hogy a kiválasztott gén mely szöveteket érinti leginkább (“n” is látható a piros sáv szignifikanciájának értékeléséhez; ha a szám kicsi, a szignifikancia alacsony). Az ABL1 esetében a leghosszabb sáv a “Haematopoietic & Lymphoid”, ami kiemeli a gén hatását a vérrákban. A ‘Haematopoietic & Lymphoid’ kifejezésre kattintva megjelenik az e szövet alatti daganatos betegségosztályozások bontása, ami azt mutatja, hogy az ABL1 mutációk elsősorban az értékelt krónikus myeloid leukémiák 28%-át és az akut lymphoblastos leukémiák 32%-át irányítják (a COSMIC v78-ban).

Rákböngésző

A rákbetegségek között a legkönnyebben a Rákböngésző (http://cancer.sanger.ac.uk/cosmic/browse/tissue) segítségével lehet navigálni, ahol egy listából lehet választani, elkerülve a gyakran összetett patológiai kifejezések beírását. Az elsődleges szövet kiválasztása alapvető fontosságú, majd a kapcsolódó alszöveti, szövettani és szubhisztológiai kifejezések közül lehet választani. Ezek mindegyike kattintható, és az összes választási lehetőség kihagyható a felső “include all” opcióval. A kiválasztás után a “Go” gombra kattintva a kiválasztott betegség összes génjének mutációs profilja kiszámítható. Ha például egyszerűen a “Tüdőrák” rákot választjuk, és megnyomjuk a Go gombot, azonnal megjelenik a tüdőrák 20 leggyakrabban mutálódott génje (mutációs gyakoriság szerint rendezve), elsősorban olyan jól jellemzett géneket emelve ki, mint a TP53, EGFR és KRAS). A Génelemzés oldalakhoz hasonlóan további fülek kínálnak különböző nézőpontokat a kiválasztott betegség mutációs terheiről.

Genom böngésző

A rákban előforduló szomatikus mutációkat már a teljes emberi genomban annotálták. A több mint 4 millió kódoló pontmutáció és a több mint 13 millió nem kódoló pontmutáció miatt elengedhetetlen egy olyan módszer, amellyel értékelni lehet a genomi kontextust ezen információk egészén. A COSMIC Genome Browser (http://cancer.sanger.ac.uk/cosmic/browse/genome) ezt valósítja meg, az összes COSMIC mutációs adatot a genomikai annotációkkal összehangolva mutatja be, a Jbrowse platform (14) egy olyan példányát használva, amely a hatalmas adatokat könnyen és gyorsan feltárhatóvá teszi. A rendszer kezdőlapja a fent leírt keresési funkciókat kínálja, de az elvégzett kiválasztásra genomi (és nem genomikai) nézetet ad vissza. A kezdeti nézetek a génszerkezetet, a pontmutációkat és a genomszerkezet töréspontjait mutatják a kiválasztott régióra vonatkozóan. A nagyítás és kicsinyítés lehetővé teszi a részletek és tendenciák feltárását egy genomiális régióban, a mutációs részletek pedig hisztogramokká alakulnak át, ha az adatok túl zsúfolttá válnak a képernyőn. A képernyő bal oldalán számos további sávot kínálunk, amelyek az Ensembl adatbázisból (7) származó genomi struktúra/funkció annotációkra és a COSMIC adatbázisból származó szomatikus mutáció többszörös annotációira oszlanak. Ezek lehetővé teszik az összes szomatikus mutációs és variációs adat vizsgálatát a kódoló gének, a nem kódoló RNS-ek (beleértve a mikroRNS-eket is) és a szabályozó régiók szerkezetével való összehangolásban. Emellett a dbSNP (15) (https://www.ncbi.nlm.nih.gov/snp/) tartalma is elérhetővé válik, hogy lehetővé tegye a COSMIC-ben szereplő szomatikus mutációk és a dbSNP által lefedett szélesebb körű emberi variáció közötti kapcsolatok feltárását.

A gyógyszerrezisztencia genetikája

A precíziós orvoslás előrehaladtával egyre több olyan irodalom jelenik meg, amely a célzott terápiákra adott genetikai válaszokat írja le. A daganat evolúciója során szerzett szomatikus mutációk gyakran szelekciós nyomás alá kerülnek, amikor monoterápiákat alkalmaznak a rákos betegeknél, ami rezisztens allélokat tartalmazó új klónok kialakulásához vezet, és terápiás kudarcot okoz. A COSMIC most ezt az információt (áttekintve a http://cancer.sanger.ac.uk/cosmic/drug_resistance címen) összegyűjti, és leírja a kiválasztott terápiákkal szembeni rezisztenciát okozó szomatikus mutációk körét. A COSMIC v78-ban (2016. szeptember) 20 gyógyszer van részletezve, leírva 301 egyedi szekvencia-variánst, amelyek 1934 tumormintában gyógyszerrezisztenciát okoztak. Ezeket az információkat a COSMIC weboldalon grafikus formában, kördiagramokkal és hisztogramokkal mutatják be, amelyek a gének és mutációk ismétlődését írják le a terápiás rezisztencia kialakulásában. Például az ABL1 mutációk által vezérelt tumorokat négy megnevezett terápiával (Imatinib, Dasatinib, Bosutinib és Nilotinib), valamint más, meg nem nevezett kinázgátlókkal kezelték. Az ezekkel a gyógyszerekkel szembeni rezisztencia tájképe a http://cancer.sanger.ac.uk/cosmic/gene/analysis?ln=ABL1#dt oldalon látható, ahol lehetőség van az érintett gének körének vagy a szekvencia-variánsok sokkal nagyobb körének megtekintésére (3. ábra).

3. ábra.

Egyre több nevesített terápiát írtak le az ABL1 által vezérelt rákok kezelésére, és számos tanulmány számolt be új mutációkról, amelyek ezekkel a terápiákkal szembeni rezisztenciát okoznak. Ez a hisztogram a nevesített terápiákkal szembeni rezisztenciával összefüggésbe hozható mutációk hosszú listáját mutatja, a hisztogram sávja pedig az ismétlődésüket mutatja.

3. ábra

Sok nevesített terápiát írtak le az ABL1-vezérelt rákok kezelésére, és számos tanulmány számolt be az ezekkel a terápiákkal szembeni rezisztenciát okozó új mutációkról. Ez a hisztogram a nevesített terápiákkal szembeni rezisztenciával összefüggésbe hozható mutációk hosszú listáját mutatja, és egy hisztogram sáv mutatja a mutációk ismétlődését.

COSMIC sejtvonalak

A COSMIC fő weboldalán látható COSMIC kurációkkal párhuzamosan a “COSMIC Cell Lines” (http://cancer.sanger.ac.uk/cell_lines) elérhetővé teszi 1015, a laboratóriumi kutatásokban, különösen a gyógyszeraktivitás és -hatékonyság értékelésében gyakran használt rákos sejtvonal molekuláris profilját. Ez egy különálló, de párhuzamos adatbázis, amely áttekintést nyújt a (16)-ban közzétett információk frissítéseiről, beleértve az egyes sejtvonalak teljes exom-szekvenálását, a kópiaszám-elemzést és a génexpressziós elemzést. A további kísérletek befejeztével további információkkal egészül ki. Az adatokat egy analitikus weboldalon tárolják, amelynek funkcionalitása megegyezik a kurátori COSMIC rendszerével (a fent leírtak szerint), további linkekkel a nyers adatfájlokhoz és a gyógyszerérzékenységi értékelésekhez (a http://www.cancerrxgene.org/ címen található).

Letöltések

A COSMIC nyilvános weboldalán történő ingyenes és nyílt bemutatásán túlmenően a COSMIC több formátumban is letölthető (https://cancer.sanger.ac.uk/cosmic/download). Több TSV (Tab-szeparált formátum) vagy VCF (Variant call format) formátumú fájl biztosítja a teljes adatkészletet minden egyes COSMIC kiadásban, és a teljes adatbázis teljes Oracle exportfájlként is rendelkezésre áll. A teljes COSMIC-adatkészletek letöltése regisztrációhoz kötött, de a későbbi hozzáférés teljes körű és ingyenes minden tudományos és nonprofit intézmény számára (https://cancer.sanger.ac.uk/cosmic/register).

JÖVŐS MUNKA

A COSMIC elsősorban a publikált szakirodalom szakértő tudósok általi kurálásával épül fel. Ez továbbra is a fő hangsúlyt képezi, és ahogy ez a csapat bővül, a COSMIC képes volt az annotációk nagyobb szélességét felölelni, ami nemrégiben a gyógyszerrezisztencia genetikájára való új összpontosítást eredményezte. A rákgenetikai kuráció minden aspektusa folytatódik, hangsúlyt fektetve a kulcsfontosságú rákgének mély leíró annotációjához szükséges részletek összegyűjtésére, valamint a rák genomjainak széles körű molekuláris profiljaira. A COSMIC adatbázis az elmúlt néhány kiadás során jelentősen megnőtt, és ez a növekedés várhatóan folytatódni fog (4. ábra).

4. ábra.

A COSMIC az elmúlt években gyorsan nőtt, mivel egyre több gént kuratáltak, és további mutációs mechanizmusokat foglaltak magukba. Az ábra a COSMIC honlapot támogató adatbázis méretének egyszerű ábrázolását mutatja 2010 és 2016 között (gzipped Oracle dmp fájl, Mb-ban).

4. ábra

A COSMIC az elmúlt években gyorsan nőtt, mivel egyre több gént kuratíroztak, és további mutációs mechanizmusokat foglaltak magukba. Az ábra a COSMIC honlapot támogató adatbázis méretének egyszerű ábrázolását mutatja 2010 és 2016 között (gzipped Oracle dmp fájl, Mb-ban).

A COSMIC adatbázisban található információkat többféle módon teszik elérhetővé, és ezeket bővíteni fogják. Azáltal, hogy a COSMIC weboldal több betegségre és mechanizmusra kiterjedő nagy mennyiségű adat analitikus navigációját foglalja magában, egyre összetettebbé válik, és néhány bemutatójának újratervezése megkönnyíti a felfedezést. A COSMIC külső integrációjának támogatása szintén prioritást élvez. Egy programozható API nagymértékben ki fogja küszöbölni a nagy adatállományok letöltésének jelenlegi szükségességét, és nagyon hasznos lesz a nagy adathalmazok egyesítését igénylő tanulmányok támogatásában. Ilyen módon a COSMIC továbbra is támogatni fogja a rákkutatási vizsgálatok széles körét, a primer tumor genetikáját vizsgálóktól kezdve a diagnosztikai és gyógyszeripari célpontok azonosításán át a klinikai beavatkozásokra adott válaszok megértését célzó kutatásokig.

HÁTTALÁLLÁS

A munka nagy részét a Wellcome Trust támogatta a 077012/Z/05/Z pályázati referenciaszám alatt. A COSMIC-adatbázis kereskedelmi szervezeteknek történő licencelésével további forrásokat biztosítottak a további kurátori munkához és a weboldal fejlesztéséhez. A szerzők ezenkívül szeretnék elismerni a Bayer Pharmaceuticals, az AstraZeneca, a Cancer Research Technology és az Astex Pharmaceuticals cégekkel való együttműködési kapcsolatokon keresztül nyújtott támogatást.

FUNDING

Wellcome Trust ; a COSMIC adatbázis engedélyezése . A nyílt hozzáférés díjának finanszírozása: Wellcome Trust .

Erdekütközésre vonatkozó nyilatkozat.

Bamford
S.

,

Dawson
E.

,

Forbes
S.

,

Clements
J.

,

Pettett
R.

,

Dogan
A.

,

Flanagan
A.

,

Teague
J.

,

Futreal
P.A.

,

Stratton
M.R.

és mások .

A COSMIC (Catalogue of Somatic Mutations in Cancer) adatbázis és honlap

.

Br. J. Cancer

.

2004

;

91

:

355

358

.

Forbes
S.A.

,

Beare
D.

,

Gunasekaran
P.

,

Leung
K.

,

Bindal
N.

,

Boutselakis
H.

,

Ding
M.

,

Bamford
S.

,

Cole
C.

,

Ward
S.

et al.

COSMIC: az emberi rákban előforduló szomatikus mutációkkal kapcsolatos világszintű ismeretek feltárása

.

Nucleic Acids Res.
2015

;

43

:

D805

D811

.

Forbes
S.A.

,

Beare
D.

,

Bindal
N.

,

Bamford
S.

,

Ward
S.

,

Cole
C.G.

,

Jia
M.

,

Kok
C.

,

Boutselakis
H.

,

De
T.

és mások .

COSMIC: High-Resolution Cancer Genetics Using the Catalogue of Somatic Mutations in Cancer

.

Curr. Protoc. Hum. Genet.
2016

;

91

:

10.11.1

10.11.37

.

Futreal
P.A.

,

Coin
L.

,

Marshall
M.

,

Down
T.

,

Hubbard
T.

,

Wooster
R.

,

Rahman
N.

,

Stratton
M.R.

.

A humán rákgének összeírása

.

Nat. Rev. Cancer

.

2004

;

4

:

177

183

.

Collins
F.S.

,

Barker
A.D.

.

A rák genomjának feltérképezése. A rákban szerepet játszó gének pontos meghatározása segít új irányt kijelölni az emberi rosszindulatú daganatok összetett táján

.

Sci. Am.
2007

;

296

:

50

57

.

Hudson
T.J.

,

Anderson
W.

,

Artez
A.

,

Barker
A.D.

,

Bell
C.

,

Bernabé
R.R.

,

Bhan
M.K.

,

Calvo
F.

,

Eerola
I.

,

Gerhard
D.S.

és mások .

Rákgenomprojektek nemzetközi hálózata

.

Nature

.

2010

;

464

:

993

998

.

Yates
A.

,

Akanni
W.

,

Amode
M.R.

,

Barrell
D.

,

Billis
K.

,

Carvalho-Silva
D.

,

Cummins
C.

,

Clapham
P.

,

Fitzgerald
S.

,

Gil
L.

et al.

Ensembl, 2016

.

Nucleic Acids Res.
2016

;

44

:

D710

D716

.

Pruitt
K.D.

,

Harrow
J.

,

Harte
R.A.

,

Wallin
C.

,

Diekhans
M.

,

Maglott
D.R.

,

Searle
S.

,

Farrell
C.M.

,

Loveland
J.E.

,

Ruef
B.J.

,

Hart
E.

és mások .

A konszenzusos kódoló szekvencia (CCDS) projekt: Egy közös fehérjekódoló génkészlet azonosítása az emberi és egér genomban

.

Genome Res.
2009

;

19

:

1316

1323

.

Sioutos
N.

,

de Coronado
S.

,

Haber
M.W.

,

Hartel
F.W.

,

Shaiu
W.L.

,

Wright
L.W.

.

NCI Thesaurus: egy szemantikus modell, amely integrálja a rákhoz kapcsolódó klinikai és molekuláris információkat

.

J. Biomed. Inform.
2007

;

40

:

30

43

.

Malone
J.

,

Holloway
E.

,

Adamusiak
T.

,

Kapushesky
M.

,

Zheng
J.

,

Kolesnikov
N.

,

Zhukova
A.

,

Brazma
A.

,

Parkinson
H

.

Mintaváltozók modellezése kísérleti tényező ontológiával

.

Bioinformatika

.

2010

;

26

:

1112

1118

.

The 1000 genomes project consortium

.

A humán genetikai variáció globális referenciája

.

Nature

.

2015

;

526

:

68

74

.

Shihab
H.A.

,

Rogers
M.F.

,

Gough
J.

,

Mort
M.

,

Cooper
D.N.

,

Day
I.N.

,

Gaunt
T.R.

,

Campbell
C.

.

Egy integratív megközelítés a nem kódoló és kódoló szekvencia variáció funkcionális hatásainak előrejelzésére

.

Bioinformatika

.

2015

;

31

:

1536

1543

.

Zhou
X.

,

Edmonson
M.N.

,

Wilkinson
M.R.

,

Patel
A.

,

Wu
G.

,

Liu
Y.

,

Li
Y.

,

Zhang
Z.

,

Rusch
M.C.

,

Parker
M.

és mások .

Genomikai változások feltárása gyermekrákban ProteinPaint

segítségével.

Nat. Genet.
2016

;

48

:

4

6

.

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

et al.

JBrowse: dinamikus webes platform a genom vizualizációjához és elemzéséhez

.

Genome Biol.
2016

;

17

:

66

90

.

Sherry
S.T.

,

Ward
M.H.

,

Kholodov
M.

,

Baker
J.

,

Phan
L.

,

Smigielski
E.M.

,

Sirotkin
K.

.

dbSNP: az NCBI genetikai variációs adatbázisa

.

Nucleic Acids Res.
2001

;

29

:

308

311

.

Iorio
F.

,

Knijnenburg
T.A.

,

Vis
D.J.

,

Bignell
G.R.

,

Menden
M.P.

,

Schubert
M.

,

Aben
N.

,

Gonçalves
E.

,

Barthorpe
S.

,

Lightfoot
H.

és mások .

A Landscape of Pharmacogenomic Interactions in Cancer

.

Cell

.

2016

;

166

:

740

754

.

© A szerző(k) 2016. Published by Oxford University Press on behalf of Nucleic Acids Research.
Ez egy nyílt hozzáférésű cikk, amelyet a Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/) feltételei szerint terjesztünk, amely engedélyezi a korlátlan újrafelhasználást, terjesztést és sokszorosítást bármilyen médiumban, feltéve, hogy az eredeti művet megfelelően idézik.

Leave a Reply

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.