Abstract
A COSMIC, a Catalogue of Somatic Mutations in Cancer (http://cancer.sanger.ac.uk) egy nagy felbontású forrás az emberi rák genetikai célpontjainak és trendjeinek feltárására. A COSMIC jelenleg a rákban előforduló mutációk legszélesebb adatbázisát szakértő tudósok kuratálják, elsősorban nagyszámú tudományos publikáció átvizsgálásával. Több mint 4 millió kódoló mutációt ír le a v78 (2016. szeptember), amely 28 366 daganat genom-szintű szekvenálási eredményeit kombinálja 23 489 egyedi publikáció teljes kézi kurációjával, amelyek 186 kulcsfontosságú génre és 286 kulcsfontosságú fúziós párra összpontosítanak az összes rákbetegségben. A nagyszámú daganat molekuláris profilozása lehetővé tette továbbá több mint 13 millió nem kódoló mutáció, 18 029 génfúzió, 187 429 genomi átrendeződés, 1 271 436 abnormális kópiaszámú szegmens, 9 175 462 abnormális expressziós variáns és 7 879 142 differenciálisan metilált CpG-dinukleotid annotálását. A COSMIC most a gyógyszerrezisztencia genetikáját, az új szomatikus génmutációkat részletezi, amelyek lehetővé teszik, hogy a daganat elkerülje a terápiás rákgyógyszereket. A COSMIC v78 kezdetben a jól jellemzett gyógyszerekre és génekre összpontosítva 20 gyógyszerre kiterjedő, széles körű rezisztencia-mutációs profilokat tartalmaz, részletezve 301 egyedi rezisztenciaallél visszatérését 1934 gyógyszerrezisztens tumorban. A COSMIC-adatbázis minden információja szabadon hozzáférhető a COSMIC weboldalán.
BEVEZETÉS
A humán rákos megbetegedések nagy részét az egyén élete során bekövetkező szomatikus mutációk okozzák, és a betegcsoportok nagyszabású szekvenálása mára több millió ilyen mutációt írt le az emberi genomban. A Catalogue of Somatic Mutations in Cancer (COSMIC) egy olyan adatbázisrendszer, amely ezeket a különböző nyilvános forrásokból származó szomatikus mutációs adatokat egyetlen szabványosított adattárba gyűjti, és könnyen feltárhatóvá teszi különböző grafikus, táblázatos és letölthető módon. Annak érdekében, hogy a lehető legnagyobb támogatást nyújtsa a rákkutatásban, a COSMIC az emberi rák minden formáját felöleli, a leggyakoribb tüdő-, emlő- és vastagbélrákoktól kezdve a vérrák rendkívül ritka formáiig, amelyeket egy klinikus csak egyszer vagy kétszer figyel meg pályafutása során.
A 2004-ben mindössze négy emberi génre vonatkozó kurációval indult (1) COSMIC mára egy nagy, az egész genomra kiterjedő rendszerré nőtte ki magát, amely a szomatikus mutációk mintázatainak feltárására szolgál minden rákbetegségben; ma már rutinszerűen jelentős genetikai adatok keletkeznek az emberi daganatokról, és ezeket szakértői, szabványosított kurációs eljárásokkal rögzítik. Emellett a közelmúltban végzett tanulmányok a klinikai terápiákkal szembeni genetikai rezisztencia kialakulásában szerepet játszó egyes mutációkat jellemezték. Miközben biztosítjuk, hogy a COSMIC a humán rákgenetika teljes lefedettségét lefedje, ezeket a rezisztenciamutációkat egy új szakaszban hangsúlyozzuk, hogy kiemeljük hatásukat a klinikai onkológiában.
ADATBÁZIS TARTALMA
Amint azt korábban leírtuk (2,3), a szomatikus mutációs adatok kurálása a COSMIC-ben két párhuzamos úton történik. A szakértői kézi irodalmi kuráció a legfontosabb rákos génekkel foglalkozik, hangsúlyt fektetve a meglévő irodalom teljes és kimerítő kurációjára a közzététel előtt, amelyet rendszeres frissítések követnek. Ezeket a kulcsfontosságú rákgéneket a Cancer Gene Censusból (4) választják ki, amely több mint 600 olyan gént tartalmaz, amelyeknek az onkológiában betöltött jelentős szerepét jelentős bizonyítékok támasztják alá. A magas szintű minőségellenőrzés eredményeként a cikkek több mint 30%-át visszautasítják következetlenség vagy elégtelen részletesség miatt. Ezzel párhuzamosan a genomszintű tumorelemzések szakértői kurátora a tumorok osztályozásának és a klinikai adatoknak a manuális hozzárendelését igényli, de a genetikai variánsadatok nagy fájljait egy félautomatizált rendszeren keresztül annotálják és töltik fel, amely az Ensembl-t használja a transzkriptom adatok forrásaként. A v78 kiadás (2016. szeptember) teljes tartalmát az 1. táblázat tartalmazza.
Total contents in version 78 of the COSMIC database (September 2016)
1 235 846 | Tumorminták |
4 067 689 | Megfigyelt kódoló mutációk |
18 029 | Megfigyelt… Génfúziók |
1 271 436 | Kópiaszám variánsok |
9 175 462 | Génexpresszió Variánsok |
7 879 142 | Differenciálisan metilált CpG-k |
13 347 517 | Nem-kódoló változatok |
187 429 | Szerkezeti mutációk |
23 096 | Papírok: Kézi kurálás |
393 | Genomikai publikációk |
277 | TCGA/ICGC/Cellvonal vizsgálatok |
28 366 | Teljes genomok |
1 235 846 | Tumorminták |
4 067 689 | Megfigyeltek Kódoló mutációk |
18 029 | Megfigyelt génfúziók |
1 271 436 | Kópiaszám variánsok |
9 175 462 | Genexpressziós variánsok |
7 879 142 | Differenciálisan metilált CpG-k |
13 347 517 | Nem-kódoló változatok |
187 429 | Szerkezeti mutációk |
23 096 | Papírok: Kézi kurálás |
393 | Genomikai publikációk |
277 | TCGA/ICGC/Cell. Line Studies |
28 366 | Whole Genomes |
1 235 846 | Tumorminták |
4 067 689 | Megfigyelt kódoló mutációk |
18 029 | Megfigyelt… Génfúziók |
1 271 436 | Kópiaszám-variánsok |
9 175 462 | Génexpresszió Variánsok |
7 879 142 | Differenciálisan metilált CpG-k |
13 347 517 | Nem-kódoló változatok |
187 429 | Szerkezeti mutációk |
23 096 | Papírok: Kézi kurálás |
393 | Genomikai publikációk |
277 | TCGA/ICGC/Cellvonal vizsgálatok |
28 366 | Teljes genomok |
1 235 846 | Tumorminták |
4 067 689 | Megfigyeltek Kódoló mutációk |
18 029 | Megfigyelt génfúziók |
1 271 436 | Kópiaszám-variánsok |
9 175 462 | Genexpressziós variánsok |
7 879 142 | Differenciálisan metilált CpG-k |
13 347 517 | Nem-kódoló változatok |
187 429 | Szerkezeti mutációk |
23 096 | Papírok: Kézi kurálás |
393 | Genomikai publikációk |
277 | TCGA/ICGC/sejtvonal vizsgálatok |
28 366 | Whole Genomes |
Szomatikus mutációs adatokat gyűjtenek az összes daganatos betegségről, jelenleg 1335 betegségleírás több mint 5000 részletes osztályozásban. A kézi irodalmi kuráció a pontmutációkra (egynukleotid mutációk, kis inszerciók és deléciók) és génfúziókra összpontosít. A genom-szintű tumorprofilok azonban sokkal szélesebb körűek lehetnek. Míg a genomikai irodalom általában a pontmutációkra helyezi a hangsúlyt, a nagyobb konzorcium-fókuszú adatportálok, köztük a The Cancer Genome Atlas (5) (TCGA; http://cancergenome.nih.gov) és az International Cancer genome Consortium (6) (ICGC; https://dcc.icgc.org) sokkal szélesebb körű annotációkat tartalmaznak, beleértve a pontmutációkat, kópiaszám-aberrációkat, génexpressziós variánsokat, DNS-metilációs variánsokat és strukturális genomiális átrendeződéseket, amelyeket mind a COSMIC-be kuratálnak és más kurációkkal kombinálnak. Hangsúlyozva az irodalmi kurációs megközelítés hatékonyságát, a COSMIC genomszintű tartalmának több mint 60%-át a tudományos irodalomból kuratálják, míg kevesebb mint egyharmada konzorciumi forrásokból származik.
A COSMIC-ba kuratálva az összes adatot szabványosítják és egyetlen adatbázisban egyesítik. Minden mutációhoz hozzárendelnek egy koordinátát a humán referencia genomon. 2015 óta az alapértelmezett referencia a GRCh38, de a GRCh37-en archivált rendszert tartanak fenn. Minden mutációhoz vagy kódoló vagy nem kódoló annotációt rendelnek. A nem-kódoló leírások egyszerű kijelentések a DNS-szekvencia változásáról meghatározott genomi helyeken. A kódoló mutációkat ezen felül az általuk érintett génre gyakorolt hatásuk szerint is annotálják, leírva a kódoló nukleotidszekvencia-változást és a peptidszekvencia-változást. A kézzel kurrált mutációkat a Cancer Census kulcsfontosságú génjein a szakirodalomban leginkább támogatott átiratokhoz jegyzetelik (hogy a legjobban támogassák az ezeket a géneket vizsgáló közösséget). Minden más génváltozást azonban az Ensembl-adatbázison (7) keresztül a leghosszabb CCDS-transzkripthez (Consensus Coding Domain Sequences; 8) jegyzetelnek. A génfúziókat az egyes partnergének exon-tartalma alapján írjuk le. A fúziók leírásához ismét azokat a transzkripteket választottuk ki, amelyeket a szakirodalomban a legtöbbet használnak, így biztosítva a legjobb támogatást ennek a közösségnek. A génexpressziós variánsok további numerikus értékek (Z-pontszámok), amelyek a COSMIC-ban megnevezett génekhez kapcsolódnak, és az egyes mintákban a populációs normától való expressziós különbségekre utalnak (betegségenként kiszámított kohorsz). A másolatszám-változások az egyes gének ploidiaértékének leírására szolgálnak minden egyes vizsgált tumormintában, és az egyes tumorok átlagos ploidiaértékéhez képest nyereségként vagy veszteségként vannak leírva. A hiper/hypo-metilált CpG-dinukleotidokat akkor írjuk le egy mintában, ha az egyes szondák béta-értéke jelentősen eltér a betegségenkénti populációs normától. Végül a strukturális töréspontok a referencia genom-koordinátákhoz tartozó alapvető annotációkat kapnak, és leíróbb következmény-annotációkká értelmezhetők, ha ezt további publikált információkkal támasztják alá.
A daganatok osztályozása szabványosított és többféle nómenklatúrában van leírva a nagy felbontás biztosítása, de az integratív elemzések megkönnyítése érdekében is. A COSMIC-ban minden egyes tumormintát elsősorban egy vezető patológusokból álló csoport által kifejlesztett egyedi szókincs alapján osztályoznak; ez itt elérhető és ismertethető: http://cancer.sanger.ac.uk/cosmic/classification. Ezt az osztályozást most lefordítják a National Cancer Institute tezauruszába (“NCIt”; 9; https://ncit.nci.nih.gov/ncitbrowser), amelyet a rákbetegségeket átfogó, legnagyobb felbontású nyilvános ontológiának választottak. Ezzel párhuzamosan az NCIt osztályozását lefordítják az Experimental Factor Ontology (“EFO”; 10) osztályozására is, ami többféle módon támogatja a COSMIC-adatok integrálását a rákgenetikai szélesebb körű elemzésekbe.
A fokozott genomikai kuráció a genomban annotált variánsok szélesebb körét eredményezte, és ma már minden emberi gén szomatikus mutációkat mutat a teljes hosszában. Ezen adatok összetettségének csökkentése és a betegséget kiváltó tényezők azonosítását célzó vizsgálatok támogatása érdekében a COSMIC-ban minden pontmutációt egynukleotid-polimorfizmus (SNP) státusszal és patogenitási értékkel jelölnek. Az SNP-státusz meghatározza, hogy az egyes variánsokat korábban leírták-e az 1000 genom tanulmányban (11), vagy az ICGC genomikai profilalkotási kísérletek során kontrollként használt normál mintákban. A patogenitási pontszámokat a FATHMM-MKL algoritmus (12) határozza meg, a pontszámokat úgy értelmezve, hogy az egyes variánsokat “patogénként” vagy “semlegesként” határozzák meg.
2016-ban új kurátori témát vezettek be, amely a gyógyszerrezisztencia genetikáját foglalja magában. Mint leírtuk, a rákos megbetegedésekben több millió mutációt figyeltek meg, és több ezer allélt vontak be a betegség okozásába. Ezek közül egy kis részük ráadásul a gyógyszeres terápiákkal szembeni klinikai rezisztencia okozójaként van leírva. Ezeket a részleteket, amikor közzéteszik, a COSMIC kurációs folyamatai is rögzítik, a legutóbbi kiadás (v78; 2016. szeptember) a 20 rákellenes kezeléssel szembeni rezisztenciát okozó mutációk körét írja le.
ADATELÉRÉS
A COSMIC legkönnyebben a nyilvános weboldalán (http://cancer.sanger.ac.uk) fedezhető fel. Ezt úgy alakították ki, hogy a COSMIC számos annotációja felhasználóbarát grafikus módon könnyen felfedezhető legyen, miközben nagy táblázatos adatkészleteket is biztosít, amelyek minden egyes bemutatót alátámasztanak. Az alább ismertetett honlapon túlmenően lehetőség nyílt arra, hogy a COSMIC-ot más források számára is elérhetővé tegyék, és így további nyilvános genomikai forrásokhoz széleskörű rákos kontextust adjanak. A COSMIC például közvetlenül támogatja a gyermekrákkutatást a St. Jude ProteinPaint (13) (https://pecan.stjude.org/#/proteinpaint) teljes adatkészleteivel, az Ensembl-ben (7) (http://www.ensembl.org) a rákos szomatikus variáció genomszintű kontextusát biztosítja, és az OpenTargets-ben (https://www.opentargets.org) kiemeli az onkológiai célpontokat a Cancer Gene Censusban. A GA4GH szabványoknak (http://ga4gh.org/#/beacon) megfelelő COSMIC beacon (http://cancer.sanger.ac.uk/cosmic/beacon) is rendelkezésre áll, amely lehetővé teszi a COSMIC lekérdezését nagy szövetségi elemzéseken belül. Az adatbázis teljes tartalma számos hasznos formátumban, beleértve az Oracle dump fájlokat is, letölthető (http://cancer.sanger.ac.uk/cosmic/download), amihez regisztráció szükséges (https://cancer.sanger.ac.uk/cosmic/register).
Honlap áttekintés
A COSMIC honlapja online elérhető a http://cancer.sanger.ac.uk címen. A kezdőlapon (1. ábra) többféle módon lehet felfedezni az adatbázist (“Resources”, “Tools”), valamint egy sor olyan oldalt találunk, amelyek leírják az adatbázis tartalmát, az adatok keletkezésének módját és a hozzáférés részleteit (“Expert Curation”, “Data”). A jobb oldalon egy Circos-diagram foglalja össze a mutációk ismétlődését a COSMIC összes tumorgenomjában (78. verzió, 2016. szeptember, 28 366 genomot és exomot tartalmaz). A rekurrens csúcsok közelebbi feltárására szolgáló zoomolt verzióval (http://cancer.sanger.ac.uk/cosmic/landscape) ez a kép kattintható, és a kiválasztott régió részletes genomikus perspektívájával válaszol. A COSMIC azonban elsősorban a központi “Keresés” mezőn keresztül navigálható, amely bármilyen génnevet vagy szinonimát, mutációs szintaxist, minta/sejtsor nevét vagy a cikk szerzőjét elfogadja, és a beírt keresési kifejezésnek megfelelő lehetőségek listájával válaszol, a kiválasztást segítő néhány részlet mellett. A kiválasztást követően egy összefoglaló oldal jelenik meg, amely áttekintést ad a kiválasztott génről, mintáról, mutációról vagy publikációról, további linkekkel a COSMIC-on belüli lekérdezés specializálására; ily módon a szomatikus mutációs trendek több génre és betegségtípusra vonatkozóan részletesen feltárhatók.
A COSMIC kezdőlapja egyszerű keresési és navigációs lehetőségeket biztosít az adatbázisban; különböző eszközök állnak rendelkezésre a hasonló adatok különböző perspektíváihoz, és több leíró oldal részletezi az adatok kurálási eljárásait és aktuális tartalmát.
A COSMIC kezdőlapja egyszerű keresési és navigációs lehetőségeket biztosít az adatbázisban; különböző eszközök állnak rendelkezésre a hasonló adatok különböző nézőpontjaihoz, és több leíró oldal részletezi az adatok kurátori eljárásait és aktuális tartalmát.
A COSMIC-en belüli mutációs trendeket akkor lehet a legkönnyebben felfedezni, ha egy adott génnel vagy rákos betegséggel kezdjük. Elsősorban a Human Genome Organisation (HUGO) génnevei (http://www.genenames.org/) alapján a génkeresés az összes gén szinonimájára (valamint más kifejezésekre, beleértve a minta/mutáció/szerzőt) is rákeres, és visszaad minden olyan bejegyzést, amely tartalmazza a megadott karaktereket. Például a “PTEN” keresés egy gént fog visszaadni, mivel ez a génnév egyedi. A “RAS” keresés azonban 70 bejegyzést ad vissza, mivel ez a kifejezés több génnévben és szinonimában is előfordul; a RAS család valamelyik tagját (pl. KRAS) választva specifikusabb eredményt kapunk.
A gén kiválasztása után a COSMIC a génelemzést a mutációknak a gén hosszában való eloszlásának hisztogram formátumú megjelenítésével kezdi meg. Ezen a grafikonon az x-tengely a lineáris peptidszekvenciát ábrázolja (metionintól a Stopig), az aminosavak helyett nukleotidok ábrázolására van lehetőség (a jobb oldali Szűrők dobozban). A hisztogram grafikon a mutációtartalmat foglalja össze több különböző mechanizmuson keresztül, több Y tengelyt felölelve, függőlegesen egymáshoz igazítva, a csúcsmagasság pedig azon minták számát jelzi, amelyekben az egyes mutációkat megfigyelték (a bal oldali skálasáv az egyes pozíciókban mutálódott minták számát mutatja). A mini-hisztogramok fentről lefelé haladva mutatják a mutációs ismétlődési csúcsokat a génszekvenciában a következő esetekben: egy nukleotid szubsztitúciók, több nukleotid szubsztitúciók, kis inszerciók, kis deléciók, kópiaszám nyereség/veszteség, gén overexpresszió/underexpresszió és hiper/hypo metilált CpG-dinukleotidok. A 2. ábra például az ABL1 gén mutációs profilját mutatja, amely a vérrák egyik fő kiváltó oka. Világos, hogy a legtöbb rákos mutáció e peptid tirozinkináz doménjén belül és körül csoportosul, ami e széles géncsaládban a driver mutációkra jellemző. A bal oldali skálasávokat használva az egyes mutációtípusok hatásának megítélésére, az ABL1 elsősorban a kinázdomain pontmutációk és a túlterjedés révén hajtja a rák kialakulását. Más mutációtípusok csak kis számban figyelhetők meg. A grafikon nagyítható, a részletesebb megjelenítéshez az egérkurzor egyszerű kattintására és áthúzására van szükség az érdekes régióban.
A fő génelemzési hisztogram egyetlen gén, jelen esetben az ABL1 gén összes mutációs tartalmát foglalja össze. A hisztogramok felülről lefelé haladva mutatják a mutációk ismétlődését minden egyes nukleotid/aminosav pozícióban, külön szegmensekre bontva az egynukleotid szubsztitúciók, többnukleotid szubsztitúciók, inszerciók, deléciók, kópiaszám nyereség/veszteség, gén túl/alul-expresszió és CpG hiper/hypo-metiláció tekintetében. A tirozin-kináz doménen (lilával kiemelve) történő mutáció-visszatérés azt jelzi, hogy mutáció esetén ez az a kulcsfontosságú régió, amely a rák kialakulásához vezet.
A fő génelemzési hisztogram egyetlen gén, ebben az esetben az ABL1 gén teljes mutációs tartalmát összefoglalja. A hisztogramok felülről lefelé haladva mutatják a mutációk ismétlődését minden egyes nukleotid/aminosav pozícióban, külön szegmensekre bontva az egynukleotid szubsztitúciók, többnukleotid szubsztitúciók, inszerciók, deléciók, kópiaszám nyereség/veszteség, gén túl/alul-expresszió és CpG hiper/hypo-metiláció tekintetében. A mutációk ismétlődése a tirozin-kináz doménben (lila színnel kiemelve) azt jelzi, hogy mutáció esetén ez az a kulcsfontosságú régió, amely a rák kialakulásához vezet.
A jobb oldali szűrőmező lehetővé teszi, hogy ezt a hisztogramot (az oldal más lapjain található összes információval együtt) többféleképpen szitáljuk és vizsgáljuk, lehetőség van egy adott szövetből vagy betegségből, vagy egy adott génrégióból származó mutációk kiválasztására, csak a megerősített szomatikus mutációk, vagy csak sejtvonalak vagy betegminták, valamint számos más, mechanisztikusabb mutációs jellemző meghatározására.
A weboldal az oldal tetején elhelyezett külön “fülek” segítségével különböző nézőpontokból mutatja be egy gén mutációs tartalmát, többféle módon kínálva lehetőséget a rendelkezésre álló nagy mennyiségű információ alapos vizsgálatára. A “Tissue” különösen hasznos a kiválasztott gének hatásának feltárásához a több száz kurrens ráktípuson keresztül, a “Tissue” a mutációk szövetek és betegségek szerinti bontását mutatja mátrixba rendezve. Az x-tengelyen négy mutációtípus, az y-tengelyen pedig elsődleges szövettípusok láthatók. Ezek között kis piros egysávos hisztogramok mutatják az egyes mutációtípusok hatását az egyes szövetekre, a nagyobb sávok nagyobb hatást jeleznek, lehetővé téve annak nagyon gyors értékelését, hogy a kiválasztott gén mely szöveteket érinti leginkább (“n” is látható a piros sáv szignifikanciájának értékeléséhez; ha a szám kicsi, a szignifikancia alacsony). Az ABL1 esetében a leghosszabb sáv a “Haematopoietic & Lymphoid”, ami kiemeli a gén hatását a vérrákban. A ‘Haematopoietic & Lymphoid’ kifejezésre kattintva megjelenik az e szövet alatti daganatos betegségosztályozások bontása, ami azt mutatja, hogy az ABL1 mutációk elsősorban az értékelt krónikus myeloid leukémiák 28%-át és az akut lymphoblastos leukémiák 32%-át irányítják (a COSMIC v78-ban).
Rákböngésző
A rákbetegségek között a legkönnyebben a Rákböngésző (http://cancer.sanger.ac.uk/cosmic/browse/tissue) segítségével lehet navigálni, ahol egy listából lehet választani, elkerülve a gyakran összetett patológiai kifejezések beírását. Az elsődleges szövet kiválasztása alapvető fontosságú, majd a kapcsolódó alszöveti, szövettani és szubhisztológiai kifejezések közül lehet választani. Ezek mindegyike kattintható, és az összes választási lehetőség kihagyható a felső “include all” opcióval. A kiválasztás után a “Go” gombra kattintva a kiválasztott betegség összes génjének mutációs profilja kiszámítható. Ha például egyszerűen a “Tüdőrák” rákot választjuk, és megnyomjuk a Go gombot, azonnal megjelenik a tüdőrák 20 leggyakrabban mutálódott génje (mutációs gyakoriság szerint rendezve), elsősorban olyan jól jellemzett géneket emelve ki, mint a TP53, EGFR és KRAS). A Génelemzés oldalakhoz hasonlóan további fülek kínálnak különböző nézőpontokat a kiválasztott betegség mutációs terheiről.
Genom böngésző
A rákban előforduló szomatikus mutációkat már a teljes emberi genomban annotálták. A több mint 4 millió kódoló pontmutáció és a több mint 13 millió nem kódoló pontmutáció miatt elengedhetetlen egy olyan módszer, amellyel értékelni lehet a genomi kontextust ezen információk egészén. A COSMIC Genome Browser (http://cancer.sanger.ac.uk/cosmic/browse/genome) ezt valósítja meg, az összes COSMIC mutációs adatot a genomikai annotációkkal összehangolva mutatja be, a Jbrowse platform (14) egy olyan példányát használva, amely a hatalmas adatokat könnyen és gyorsan feltárhatóvá teszi. A rendszer kezdőlapja a fent leírt keresési funkciókat kínálja, de az elvégzett kiválasztásra genomi (és nem genomikai) nézetet ad vissza. A kezdeti nézetek a génszerkezetet, a pontmutációkat és a genomszerkezet töréspontjait mutatják a kiválasztott régióra vonatkozóan. A nagyítás és kicsinyítés lehetővé teszi a részletek és tendenciák feltárását egy genomiális régióban, a mutációs részletek pedig hisztogramokká alakulnak át, ha az adatok túl zsúfolttá válnak a képernyőn. A képernyő bal oldalán számos további sávot kínálunk, amelyek az Ensembl adatbázisból (7) származó genomi struktúra/funkció annotációkra és a COSMIC adatbázisból származó szomatikus mutáció többszörös annotációira oszlanak. Ezek lehetővé teszik az összes szomatikus mutációs és variációs adat vizsgálatát a kódoló gének, a nem kódoló RNS-ek (beleértve a mikroRNS-eket is) és a szabályozó régiók szerkezetével való összehangolásban. Emellett a dbSNP (15) (https://www.ncbi.nlm.nih.gov/snp/) tartalma is elérhetővé válik, hogy lehetővé tegye a COSMIC-ben szereplő szomatikus mutációk és a dbSNP által lefedett szélesebb körű emberi variáció közötti kapcsolatok feltárását.
A gyógyszerrezisztencia genetikája
A precíziós orvoslás előrehaladtával egyre több olyan irodalom jelenik meg, amely a célzott terápiákra adott genetikai válaszokat írja le. A daganat evolúciója során szerzett szomatikus mutációk gyakran szelekciós nyomás alá kerülnek, amikor monoterápiákat alkalmaznak a rákos betegeknél, ami rezisztens allélokat tartalmazó új klónok kialakulásához vezet, és terápiás kudarcot okoz. A COSMIC most ezt az információt (áttekintve a http://cancer.sanger.ac.uk/cosmic/drug_resistance címen) összegyűjti, és leírja a kiválasztott terápiákkal szembeni rezisztenciát okozó szomatikus mutációk körét. A COSMIC v78-ban (2016. szeptember) 20 gyógyszer van részletezve, leírva 301 egyedi szekvencia-variánst, amelyek 1934 tumormintában gyógyszerrezisztenciát okoztak. Ezeket az információkat a COSMIC weboldalon grafikus formában, kördiagramokkal és hisztogramokkal mutatják be, amelyek a gének és mutációk ismétlődését írják le a terápiás rezisztencia kialakulásában. Például az ABL1 mutációk által vezérelt tumorokat négy megnevezett terápiával (Imatinib, Dasatinib, Bosutinib és Nilotinib), valamint más, meg nem nevezett kinázgátlókkal kezelték. Az ezekkel a gyógyszerekkel szembeni rezisztencia tájképe a http://cancer.sanger.ac.uk/cosmic/gene/analysis?ln=ABL1#dt oldalon látható, ahol lehetőség van az érintett gének körének vagy a szekvencia-variánsok sokkal nagyobb körének megtekintésére (3. ábra).
Egyre több nevesített terápiát írtak le az ABL1 által vezérelt rákok kezelésére, és számos tanulmány számolt be új mutációkról, amelyek ezekkel a terápiákkal szembeni rezisztenciát okoznak. Ez a hisztogram a nevesített terápiákkal szembeni rezisztenciával összefüggésbe hozható mutációk hosszú listáját mutatja, a hisztogram sávja pedig az ismétlődésüket mutatja.
Sok nevesített terápiát írtak le az ABL1-vezérelt rákok kezelésére, és számos tanulmány számolt be az ezekkel a terápiákkal szembeni rezisztenciát okozó új mutációkról. Ez a hisztogram a nevesített terápiákkal szembeni rezisztenciával összefüggésbe hozható mutációk hosszú listáját mutatja, és egy hisztogram sáv mutatja a mutációk ismétlődését.
COSMIC sejtvonalak
A COSMIC fő weboldalán látható COSMIC kurációkkal párhuzamosan a “COSMIC Cell Lines” (http://cancer.sanger.ac.uk/cell_lines) elérhetővé teszi 1015, a laboratóriumi kutatásokban, különösen a gyógyszeraktivitás és -hatékonyság értékelésében gyakran használt rákos sejtvonal molekuláris profilját. Ez egy különálló, de párhuzamos adatbázis, amely áttekintést nyújt a (16)-ban közzétett információk frissítéseiről, beleértve az egyes sejtvonalak teljes exom-szekvenálását, a kópiaszám-elemzést és a génexpressziós elemzést. A további kísérletek befejeztével további információkkal egészül ki. Az adatokat egy analitikus weboldalon tárolják, amelynek funkcionalitása megegyezik a kurátori COSMIC rendszerével (a fent leírtak szerint), további linkekkel a nyers adatfájlokhoz és a gyógyszerérzékenységi értékelésekhez (a http://www.cancerrxgene.org/ címen található).
Letöltések
A COSMIC nyilvános weboldalán történő ingyenes és nyílt bemutatásán túlmenően a COSMIC több formátumban is letölthető (https://cancer.sanger.ac.uk/cosmic/download). Több TSV (Tab-szeparált formátum) vagy VCF (Variant call format) formátumú fájl biztosítja a teljes adatkészletet minden egyes COSMIC kiadásban, és a teljes adatbázis teljes Oracle exportfájlként is rendelkezésre áll. A teljes COSMIC-adatkészletek letöltése regisztrációhoz kötött, de a későbbi hozzáférés teljes körű és ingyenes minden tudományos és nonprofit intézmény számára (https://cancer.sanger.ac.uk/cosmic/register).
JÖVŐS MUNKA
A COSMIC elsősorban a publikált szakirodalom szakértő tudósok általi kurálásával épül fel. Ez továbbra is a fő hangsúlyt képezi, és ahogy ez a csapat bővül, a COSMIC képes volt az annotációk nagyobb szélességét felölelni, ami nemrégiben a gyógyszerrezisztencia genetikájára való új összpontosítást eredményezte. A rákgenetikai kuráció minden aspektusa folytatódik, hangsúlyt fektetve a kulcsfontosságú rákgének mély leíró annotációjához szükséges részletek összegyűjtésére, valamint a rák genomjainak széles körű molekuláris profiljaira. A COSMIC adatbázis az elmúlt néhány kiadás során jelentősen megnőtt, és ez a növekedés várhatóan folytatódni fog (4. ábra).
A COSMIC az elmúlt években gyorsan nőtt, mivel egyre több gént kuratáltak, és további mutációs mechanizmusokat foglaltak magukba. Az ábra a COSMIC honlapot támogató adatbázis méretének egyszerű ábrázolását mutatja 2010 és 2016 között (gzipped Oracle dmp fájl, Mb-ban).
A COSMIC az elmúlt években gyorsan nőtt, mivel egyre több gént kuratíroztak, és további mutációs mechanizmusokat foglaltak magukba. Az ábra a COSMIC honlapot támogató adatbázis méretének egyszerű ábrázolását mutatja 2010 és 2016 között (gzipped Oracle dmp fájl, Mb-ban).
A COSMIC adatbázisban található információkat többféle módon teszik elérhetővé, és ezeket bővíteni fogják. Azáltal, hogy a COSMIC weboldal több betegségre és mechanizmusra kiterjedő nagy mennyiségű adat analitikus navigációját foglalja magában, egyre összetettebbé válik, és néhány bemutatójának újratervezése megkönnyíti a felfedezést. A COSMIC külső integrációjának támogatása szintén prioritást élvez. Egy programozható API nagymértékben ki fogja küszöbölni a nagy adatállományok letöltésének jelenlegi szükségességét, és nagyon hasznos lesz a nagy adathalmazok egyesítését igénylő tanulmányok támogatásában. Ilyen módon a COSMIC továbbra is támogatni fogja a rákkutatási vizsgálatok széles körét, a primer tumor genetikáját vizsgálóktól kezdve a diagnosztikai és gyógyszeripari célpontok azonosításán át a klinikai beavatkozásokra adott válaszok megértését célzó kutatásokig.
HÁTTALÁLLÁS
A munka nagy részét a Wellcome Trust támogatta a 077012/Z/05/Z pályázati referenciaszám alatt. A COSMIC-adatbázis kereskedelmi szervezeteknek történő licencelésével további forrásokat biztosítottak a további kurátori munkához és a weboldal fejlesztéséhez. A szerzők ezenkívül szeretnék elismerni a Bayer Pharmaceuticals, az AstraZeneca, a Cancer Research Technology és az Astex Pharmaceuticals cégekkel való együttműködési kapcsolatokon keresztül nyújtott támogatást.
FUNDING
Wellcome Trust ; a COSMIC adatbázis engedélyezése . A nyílt hozzáférés díjának finanszírozása: Wellcome Trust .
Erdekütközésre vonatkozó nyilatkozat.
,
,
,
,
,
,
,
,
,
és mások .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
és mások .
.
;
:
–
.
,
,
,
,
,
,
,
.
.
.
;
:
–
.
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
és mások .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
,
és mások .
.
;
:
–
.
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
.
.
.
;
:
–
.
.
.
.
;
:
–
.
,
,
,
,
,
,
,
.
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
és mások .
segítségével.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al.
.
;
:
–
.
,
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
és mások .
.
.
;
:
–
.