數(shù)據(jù)庫背景信息
由于越來越多的測序研究不斷擴(kuò)充癌癥基因的相關(guān)數(shù)據(jù),研究者急需一個能時時更新的癌癥基因綜合信息數(shù)據(jù)庫。因此,研究者在2010年開始建立The Network of Cancer Genes (NCG)數(shù)據(jù)庫,旨在從大量癌癥測序數(shù)據(jù)中收集匯總癌癥基因并給予詳細(xì)注釋。
NCG基于專家對癌癥測序篩查研究的分析總結(jié),提取出原始文獻(xiàn)中癌癥基因,并且收集分析該基因各方面的特征性質(zhì)信息(簡單來說,這是一個基于測序研究手動整理的癌癥候選基因百科全書)。目前最新版NCG,共包括了2372個癌癥基因?;?75篇已發(fā)表文章,這些基因的體細(xì)胞改變具有已知或預(yù)測具有癌癥驅(qū)動作用。NCG同時注釋了癌癥基因的特性,例如多倍性,進(jìn)化起源,RNA和蛋白表達(dá),miRNA和蛋白互做,以及蛋白功能和其它一些基本特性。NCG目前已更新到第六版,與舊版相比,新版囊括的內(nèi)容增加了1.5倍,可在以下地址訪問http://ncg.kcl.ac.uk/。
圖:2372個癌癥候選基因來源(2個癌癥數(shù)據(jù)庫+273篇癌癥測序文章)。
數(shù)據(jù)庫使用體驗(yàn)
基本信息模塊(各種NCBI序列編號與鏈接“一網(wǎng)打盡”)
癌癥基因信息模塊
1 Cancer information:提示BRCA1為腫瘤驅(qū)動基因的文獻(xiàn)列表(包括技術(shù)平臺,分析平臺,癌種等信息)
2 Duplicability(倍性):體現(xiàn)BRCA1基因編碼蛋白序列在基因組的比對情況
3 Orthology BRCA1基因的直系同源情況
4Network Properties:BRCA1蛋白互做情況
5Gene Expression in Normal Tissues:包括2個基因表達(dá)數(shù)據(jù)(GTEx和Protein Atlas)和1個蛋白表達(dá)數(shù)據(jù)(Protein Atlas)



6 Gene Expression in Cancer Cell Lines:列舉了三個數(shù)據(jù)庫中腫瘤細(xì)胞系中該基因表達(dá)情況(Cancer Cell Lines Encyclopedia (CCLE);Cosmic Cancer Cell Lines Project (CLP);Genentech dataset (GNE))
7 Essentiality:BRCA1基因?qū)τ诩?xì)胞系存活的必須性(來源于OGEE和PICKLES 數(shù)據(jù)庫)
8 Protein Function:蛋白參與的通路信息(來源于KEGG,Reactome,BioCarta三個數(shù)據(jù)庫)
9 miRNA-gene interactions:互做miRNA信息
結(jié)語:如果準(zhǔn)備開展一個腫瘤基因的功能研究,先來NCG數(shù)據(jù)逛一逛,一定可以少走很多彎路哦~