圖片來源:doi:10.3389/fpls.2015.00189
摘要:多倍體無參植物RNA-seq經(jīng)典文章解讀
油茶,又名茶子樹、茶油樹,因其種子可榨油,被列入世界四大木本油料樹種之一。油茶主要生長在我國南方高山及丘陵地帶,作為一種常綠闊葉喬木,油茶具有一定的冷適應(yīng)性。最近發(fā)表的一篇《BMC Genomics》文章,就利用了RNA-seq技術(shù),探討了這種冷適應(yīng)性可能的分子機制。
英文題目:Leaf transcriptome analysis of a subtropicalevergreen broadleaf plant, wild oil-teacamellia (Camellia oleifera), revealingcandidate genes for cold acclimation
中文題目:對亞熱帶常綠闊葉植物野生油茶(Camellia oleifera)的葉片轉(zhuǎn)錄組分析揭示冷適應(yīng)性相關(guān)候選基因
期刊名:BMC Genomics發(fā)表時間: 2017年影響因子:3.867
研究背景:冷耐受性是在地理分布范圍上影響植物種類和作物產(chǎn)量的關(guān)鍵因素之一。冷適應(yīng)可以在未冰凍的低溫階段起到增強植物的冷耐受性的作用。作為一種常綠闊葉植物,油茶表現(xiàn)出相對較強的耐受寒冷低溫的能力。
研究目的:通過對不同緯度和海拔油茶轉(zhuǎn)錄組變化的分析,發(fā)現(xiàn)冷適應(yīng)相關(guān)基因。
材料方法:
研究地點及采樣方法情況
采樣地點及時間:對廬山(2013年11月29日)和井岡山(2013年12月6日)共8處不同海拔位置的野生油茶葉片進行取樣,并記錄相應(yīng)的經(jīng)緯度、海拔及大氣溫度。
表1、野生油茶采樣地點及分組情況
采樣方法:選取開花期野生油茶植株進行取樣,將3到5片完整葉片摘下用鋁箔包好后,迅速放入液氮中,后轉(zhuǎn)移至-80度冰箱保存。
RNA提取及轉(zhuǎn)錄組測序
油茶葉片用液氮研磨成粉,后取約100 mg粉末提取RNA???span>RNA采用EASYspin Plus Plant RNA Kit (Aidlab,Beijing, China)提取。同一植株的兩片葉片等量混合,最終根據(jù)取樣時大氣溫度,8個樣品分為5組T2,T5,T10,T14和T18用于測序(表1)。RNA-seq采用IlluminaHiSeq 2000雙端測序(PE 2 x 100 bp)進行。
序列組裝和Unigene注釋
利用Trinity軟件對測序獲得的clean reads進行組裝,組裝最長的基因轉(zhuǎn)錄本當作unigene,將所有組裝的unigene當作參考序列用于后續(xù)油茶葉片轉(zhuǎn)錄組分析。Unigene功能注釋利用的數(shù)據(jù)庫包括:Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等。
SSRs、SNPs和InDels檢測
用MISA 1.0進行unigenes的SSRs檢測,用Primer3進行SSRs引物的設(shè)計。用bowtie 2 (mismatch 0)對Clean reads進行參考unigene序列的比對,對比對的序列進行SAMtools和Picard的分類和重復去除。SNP和InDel利用GATK2進行識別,將QUAL<30.0和QD<5.0的進行去除。
遺傳結(jié)構(gòu)分析
為了說明不同緯度和海拔野生油茶樣本的遺傳結(jié)構(gòu),本研究篩選不超過2個等位基因位置和reads數(shù)不小于6個的SNP數(shù)據(jù)進行了系統(tǒng)進化分析。對不用樣本進行SNP基因分型,利用MrBayes 3.2.5和FigTree軟件構(gòu)建系統(tǒng)進化樹。
基因表達分析
利用RSEM計算每個樣本中unigene的reads數(shù)并轉(zhuǎn)換成FPKM,它的值作為不同樣本unigene的基因表達水平。為了檢驗測序深度是否足夠進行基因表達分析,不同比例比對上的reads被隨機抽取進行評估,繪制的曲線說明了最終表達值10%以內(nèi)的基因片段和比對上的read比例關(guān)系。如果曲線趨于平緩,則表明測序深度足夠用來進行基因表達分析。
為了研究大氣溫度對基因表達模式的影響,用DESeq對不同溫度分組間的差異基因表達水平進行FPKM密度分布比較分析,用分層聚類分析和韋恩圖進行展示。根據(jù)unigene的功能注釋,將預測有功能的差異表達基因(DEGs)用于冷適應(yīng)性的候選基因的發(fā)掘。此外,通過比較DEGs與所有檢測到基因表達的GO注釋情況,弄清了涉及到冷適應(yīng)的相關(guān)功能分組基因。
qRT-PCR分析
用qRT-PCR來檢驗轉(zhuǎn)錄組測序獲得的DEGs的準確性。
研究結(jié)果:
測序及組裝情況
本實驗共獲得57.3 Gb高質(zhì)量測序數(shù)據(jù)(表2),平均每個樣本測序數(shù)據(jù)在6.08到8.85 Gb范圍。測序數(shù)據(jù)組裝了286121個轉(zhuǎn)錄本,長度從201到20507個堿基不等。最終獲得的unigene的總長度為91.6 Mb。
表2、不同野生油茶樣本測序數(shù)據(jù)統(tǒng)計表
Unigene功能注釋
本研究對83352個unigene進行了成功注釋(表3)。其中GO分析結(jié)果表明,生物過程相關(guān)基因最多,其次是細胞組分類。
表3、不同數(shù)據(jù)庫對unigene的注釋情況
圖1、KEGG通路富集分析
KEGG通路分類結(jié)果表明,注釋結(jié)果涉及了不同代謝通路,其中碳水化合物代謝最多(圖1)。
SSRs、SNPs和InDels檢測
本研究共檢測出25751個SSRs,SSR motif分布情況如圖2所示,大約46.8%的SSRs是單核苷酸重復,主要是(A/T)n重復。第二多的是二核苷酸重復(37.2%),主要以(AG/GA/CT/TC)n為主,總共設(shè)計13962個SSRs的引物。針對分子標記開發(fā)目的,將一些復雜的SSRs,如(TA)6(TAC)6,(CT)8tatct(TC)6等和一些小于2個核苷酸重復的SSR去除,成功設(shè)計了7005個SSR引物。
本研究獲得661280個SNPs,其中約54.%為非編碼的SNPs。在編碼區(qū)的SNPs里面,非同義與同義SNPs的比值為0.604。有103442個SNP位置在2個等位基因并且不小于6個比對上的reads中出現(xiàn),這些為油茶的SNP分子標記開發(fā)提供有用信息。研究人員同時發(fā)現(xiàn)了47056個InDels,其中6534個可以用于后期分子標記開發(fā)。
圖2、SSR motifs分布圖
遺傳結(jié)構(gòu)分析
研究人員隨機選取9000個SNP用于系統(tǒng)進化分析。系統(tǒng)進化樹構(gòu)建結(jié)果如圖3所示,除了JG01和LS02外,從廬山和井岡山取樣的油茶是分開的,并且從高海拔取樣在遺傳上比兩山之間差別更大。
圖3、不同地點取樣油茶的系統(tǒng)進化分析
基因表達差異分析
根據(jù)FPKM密度分布圖可以看出,當FPKM>3時,所有樣本的曲線趨于飽和狀態(tài),這說明測序深度能夠用于進行基因表達分析。不同溫度分組的基因表達密度分布圖如圖4所示,基因表達模式可以根據(jù)相似性分為兩組:T18、T14、T10代表的相對高溫度組(10-18度)和T5、T2代表的相對低溫度組(2-5度)。
圖4、FPKM密度分布圖
差異表達基因的聚類熱圖表明,T18和T14聚在一起具有相對較高的表達模式相似性(圖5)。同樣的,基因表達模式隨著大氣溫度的降低而變化,尤其是在T5和T2中上調(diào)表達的基因。
圖5、差異表達基因聚類分析圖
韋恩圖對不同溫度的差異表達基因數(shù)目差別進行了統(tǒng)計(圖6)。
圖6、差異表達基因韋爾圖
經(jīng)過進一步不同分組間的分析,鑒定了多組別間冷適應(yīng)相關(guān)的候選基因。通過對這些差異表達基因分析,發(fā)現(xiàn)了多個SNPs,進一步分析非同義與同義SNP比值,推測部分差異表達基因可能處于正選擇中。
對差異表達基因的GO分析表明,生物過程相關(guān)基因比較多。其中T2中的C重復結(jié)合因子(CBF)顯著性表達上調(diào),可能與冷適應(yīng)相關(guān)(圖7)。
圖7、差異表達基因的GO分析
圖8、差異表達基因在RNA-seq和qRT-PCR中的比對圖
qRT-PCR驗證分析
本研究對T5和T2中的糖轉(zhuǎn)運基因差異表達進行了qRT-PCR驗證分析,結(jié)果能夠與RNA-seq結(jié)果很好的吻合,表明RNA-seq得到的差異表達基因結(jié)果是可信的。
總結(jié):
l 實驗共獲得57.3 Gb高質(zhì)量測序數(shù)據(jù),組裝了286121個轉(zhuǎn)錄本,獲得的unigene的總長度為91.6 Mb。
l unigene GO分析結(jié)果表明,生物過程相關(guān)基因最多。KEGG通路分類結(jié)果主要涉及碳水化合物代謝等。
l 檢測出25751個SSRs,以單核苷酸重復和二核苷酸重復為主。針對分子標記開發(fā)了7005個SSR引物。獲得661280個SNPs,其中6534個可以用于后期分子標記開發(fā)。
l 相對較高溫度組和相對較低溫度組具有各自的基因表達模式。
關(guān)于天昊:
天昊生物具有對多倍體植物各種通量分子標記,如SSR和SNP精準分型的技術(shù)檢測平臺,2016年公司客戶共發(fā)表SCI文章127篇,總影響因子達到404分。我們致力于為遺傳學領(lǐng)域的研究者提供高質(zhì)量的科研策略咨詢、實驗技術(shù)服務(wù)和遺傳數(shù)據(jù)分析服務(wù),期待成為大家科研工作中的“昊”助手與“昊”伙伴。