昊閱讀】Nature Genetics 9月精選文章一覽
發(fā)稿時間:2018-09-25來源:天昊生物
(一)
Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations
常見疾病的全基因組多基因評分可識別相當于單基因突變風險的個體
公共衛(wèi)生需求中的一個關鍵問題是識別特定疾病的高風險個體,以加強篩查或預防治療。因為大多數(shù)常見疾病都有遺傳因素,一個重要的方法是根據(jù)遺傳的DNA變異對個體進行分層。常見臨床應用主要集中在尋找患病風險增加了幾倍的罕見單基因突變攜帶者。盡管大多數(shù)疾病風險是多基因控制的,但還沒有可以使用的多基因預測方法來識別與單基因突變相當?shù)娘L險個體。本研究開發(fā)并驗證了五種常見疾病的全基因組多基因評分方法。該方法分別確定了8.0、6.1、3.5、3.2和1.5 %的患冠心病、房顫、2型糖尿病、炎癥性腸病和乳腺癌的風險增加三倍以上人口。對于冠狀動脈疾病,這種相對風險比罕見單基因突變的攜帶頻率高20倍。研究人員建議,現(xiàn)在是該考慮將多基因風險預測納入到臨床護理并討論相關問題的時候了。
(二)
Biobank-driven genomic discovery yields new insight into atrial fibrillation biology
生物庫驅動的基因組發(fā)現(xiàn)為房顫生物學提供新的見解
為了確定心房顫動(最常見的心律失常)的遺傳變異,本研究對超過100萬人進行了全基因組關聯(lián)研究,包括60620例心房顫動患者和970216名對照。研究者在111個位點上鑒定了142個獨立的風險變異,并確定了151個可能參與心房顫動的功能候選基因優(yōu)先級。許多已鑒定的風險變異落在據(jù)報道會導致人類嚴重心臟缺陷的基因附近(GATA4, MYH6, NKX2-5, PITX2, TBX5) ,或者落在對橫紋肌功能和完整性起重要作用的基因附近(例如CFL2, MYH7, PKP2, RBM20, SGCG, SSPN)。通路和功能富集分析還表明,許多推定的心房顫動基因通過心臟結構重塑起作用,可能以“心房心肌病”的形式,在胎兒心臟發(fā)育期間作為對成人心臟壓力的一種反應。
(三)
EBS is a bivalent histone reader that regulates floral phase transition in Arabidopsis
EBS是一種調節(jié)擬南芥花發(fā)育的二價組蛋白閱讀器
細胞感知多種信號并將其轉化為不同染色質和轉錄狀態(tài)的能力對生物過程至關重要。在植物中,及時過渡到開花狀態(tài)對于成功繁殖至關重要。EARLY BOLTING IN SHORT DAY (EBS)是一種負轉錄調節(jié)子,可防止擬南芥過早開花。本研究發(fā)現(xiàn)EBS含有BAH-PHD閱讀器模塊,分別結合H3K27me3和H3K4me3。實驗中觀察到一部分EBS相關基因與H3K27me3和H3K4me3和PRC2的共富集。值得注意的是,EBS采用自動抑制模式來調節(jié)其在H3K27me3和H3K4me3之間的結合偏好轉換。這種結合平衡至關重要,因為EBS-H3K27me3或EBS- H3K4me3相互作用的中斷會導致早期的花轉換。本研究結果鑒定了一種能夠識別兩種拮抗組蛋白標記的二價染色質閱讀器,并提出了活性染色質狀態(tài)和抑制染色質狀態(tài)之間相互作用的獨特機制。
(四)
Polycomb-mediated gene silencing by the BAH–EMF1 complex in plants
Polycomb通過BAH–EMF1復合物介導的植物基因沉默
Polycomb蛋白在多細胞生物中執(zhí)行著全基因組轉錄抑制功能。進化保守的Polycomb抑制蛋白復合物2 (PRC2)催化組蛋白H3K27me3,它在動物中是由Polycomb抑制蛋白復合物1 (PRC1)讀取和影響的,但是這一標記在植物中的解釋仍然不清楚。本研究報道了在雙子葉擬南芥中,兩個同源BAH結構域包含的蛋白質與花發(fā)育蛋白形成了植物特異性復合物BAH–EMF1c,讀取并影響H3K27me3標記,并介導了全基因組轉錄抑制。此外,在單子葉水稻中,擬南芥BAH結構域蛋白的同源物也結合甲基化的H3K27,并與EMF1的水稻同源物形成復合物,這表明BAH–EMF1c在開花植物中是保守的。因此,本研究結果發(fā)現(xiàn)植物特異性BAH–EMF1c在高等植物中實現(xiàn)了類似PRC1的功能,這表明植物和動物中PRC1活性的趨同進化。
(五)
Copy number signatures and mutational processes in ovarian carcinoma
卵巢癌的拷貝數(shù)特征和突變過程
由拷貝數(shù)變化導致的基因組復雜性阻礙了卵巢癌的有效分子分層。這里,為了解釋這種復雜性,研究者從117例嚴重卵巢癌(HGSOC)病例的低深度全基因組測序中獲得拷貝數(shù)相關特征,并在527例病例中進行了驗證。結果表明,HGSOC基因組通過多種突變導致已知基因組模式的畸變??截悢?shù)變化特征暴露值可以用于在診斷時預測總生存率和耐藥復發(fā)的可能性。相關特征暴露值的測量為選擇針對多個突變過程的組合治療提供了一個合理的指導框架。
(六)
Genomic correlates of response to immune checkpoint blockade in microsatellite-stable solid tumors
微衛(wèi)星穩(wěn)定實體腫瘤免疫檢查點封鎖反應的基因組相關性分析
腫瘤突變負荷與多種實體腫瘤對免疫檢查點阻斷的反應相關,盡管在微衛(wèi)星穩(wěn)定腫瘤中,這種關聯(lián)具有不確定的臨床用途。這里,研究者統(tǒng)一分析了249例腫瘤的全外顯子測序(WES),包括臨床注釋為進行免疫治療患者的正常組織及相匹配多種癌癥類型組織。分析結果鑒定出超出突變負荷的基因組相關性,包括個體驅動基因中的體細胞事件、某些全局突變特征和特定的HLA限制性新抗原等。然而,這些特征往往是相互關聯(lián)的,這突顯了識別產生免疫反應性腫瘤環(huán)境的基因驅動事件的復雜性。這項研究為以綜合和多方面的方式分析大規(guī)模臨床群體,以增強發(fā)現(xiàn)免疫檢查站封鎖反應的有臨床意義的預測特征能力,開辟了一條前進的道路。
(七)
The maize W22 genome provides a foundation for functional genomics and transposon biology
玉米W22基因組為功能基因組學和轉座子生物學提供了基礎
自20世紀中葉以來,玉米W22自交系一直是玉米遺傳的平臺。為了簡化玉米基因組分析,研究者已經使用高通量測序技術對W22參考基因組進行測序和重新組裝。結果表明,從轉座子組成和拷貝數(shù)變異到單核苷酸多態(tài)性,與B73參考基因組相比,在多個尺度上存在顯著的結構異質性。這種參考基因組的產生使得數(shù)以千計的突變子(Mu)和解離子(Ds)轉座子插入能夠被準確放置,用于反向和正向遺傳學研究。使用RNA-seq、差異核酸酶敏感性圖譜和亞硫酸氫鹽測序分別測定了開放閱讀框、開放染色質位點和DNA甲基化圖譜,實現(xiàn)了對基因組的注釋??傊?,這里開發(fā)的資源整合了W22作為功能基因組學的參考基因組,為玉米泛基因組奠定了基礎。
(八)
Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes
Mo17和其他玉米基因組之間廣泛的種內基因順序和基因結構變異
玉米是一種重要的糧食作物,它具有高度的基因組多樣性和雜種優(yōu)勢。之前已經公布了雌性系B73的基因組序列。在這里,研究者報道了相應男性代表品系Mo17的從頭基因組組裝結果。在2183 Mb組裝基因組中,超過96.4 %的基因可以被10個假染色體中的362個scaffolds覆蓋,其中有38620個帶注釋的蛋白質編碼基因。比較分析揭示了大的基因順序和基因結構變異:大約10%的注釋基因是相互不同步的,超過20%的預測基因具有大的效應突變或大的結構變異,這可能會導致兩個自交系之間的蛋白質差異。本研究結果提供了一個重要玉米種質的高質量參考基因組序列,所鑒定的種內基因順序和基因結構變異應該會對雜種優(yōu)勢和基因組進化產生影響。
(九)
Estimation of complex effect-size distributions using summary-level statistics from genome-wide association studies across 32 complex traits
使用來自32個復雜性狀全基因組關聯(lián)研究的匯總水平統(tǒng)計來估計復雜效應大小分布
研究者開發(fā)了一種基于似然的方法來分析匯總水平統(tǒng)計數(shù)據(jù)和外部連鎖不平衡信息,以估計常見變異的效應大小分布,其特征在于潛在易感SNPs的比例和它們效應的靈活正態(tài)混合模型。對32項全基因組關聯(lián)研究結果的分析表明,盡管所有性狀都是高度多基因的,但多基因的程度和性質有很大差異。精神疾病和與精神健康和能力相關的性狀似乎是最多基因的,涉及一系列小的影響,包括主要慢性疾病在內的大多數(shù)性狀都涉及具有明顯影響的SNPs群。通過預測發(fā)現(xiàn),鑒定解釋全基因組關聯(lián)研究中發(fā)現(xiàn)的大多數(shù)遺傳力的SNPs所需的樣本量將從幾十萬到幾百萬不等,這取決于性狀潛在的效應大小分布。因此,本研究結果預測了多基因風險評分對各種疾病的風險預測能力。
(十)
Modified penetrance of coding variants by cis-regulatory variation contributes to disease risk
通過順式調節(jié)變異改變編碼變異體的外顯率有助于疾病風險
編碼變體代表基因型和表型之間的許多最強關聯(lián),然而,它們在效果上表現(xiàn)出個體間的差異,稱為“可變外顯率”。在這里,研究者聚焦順式調控變異如何改變編碼變異的外顯率。使用GTEx數(shù)據(jù)庫中的功能基因組和基因數(shù)據(jù),研究者觀察到,在普通人群中,純化選擇已經耗盡了預測會增加致病編碼變異外顯率的單倍型組合。相反,在癌癥和孤獨癥患者中,研究者觀察到疾病相關基因中致病變異體的外顯率增加的單倍型構型的豐富,提供了編碼變異體的調控單倍型構型影響疾病風險的證據(jù)。最后,研究通過使用CRISPR/Cas9編輯孟德爾SNP來實驗驗證這個模型,在不同的表達單倍型上使用轉錄組作為表型讀數(shù)。本研究的結果表明,聯(lián)合調控和編碼變異效應是人類性狀遺傳結構的重要組成部分,并有助于改變致病變異的外顯率。
(十一)
Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies
在大規(guī)模GWAS中有效控制case-control不平衡和樣本相關性的方法
目前利用大型生物庫在研究成千上萬種表型的全基因組關聯(lián)研究(GWAS)時,大多數(shù)病例數(shù)據(jù)比對照少得多。廣泛使用的兩種方法為線性混合模型和最近提出的邏輯混合模型,他們都表現(xiàn)不佳;當用于分析不平衡的病例對照表型時,它們會產生較大的I型錯誤率。在這里,研究者提出了一種可擴展的、精確的廣義混合模型關聯(lián)檢驗,該檢驗使用saddlepoint近似來校準分數(shù)測試統(tǒng)計的分布。這種命名為SAIGE (可擴展和精確廣義混合模型)方法,即使在case-control比率非常不平衡的情況下,也能提供精確的P值。SAIGE使用最先進的優(yōu)化策略來降低計算成本,因此它適用于大型生物庫的成千上萬種表型的GWAS分析。通過對408961份來自歐洲血統(tǒng)的英國白人參與者的英國生物庫數(shù)據(jù)的分析,研究者發(fā)現(xiàn)SAIGE可以有效地分析大樣本數(shù)據(jù),控制不平衡的case-control比率和樣本相關性。