低温胁迫下不同甘蔗品种的转录组比较分析
唐仕云 杨丽涛 李杨瑞
摘 要:以桂糖08-1180和主栽品种ROC22为研究材料,进行低温胁迫和常温处理,采用转录组测序技术,比较不同甘蔗品种抗寒性分子机制的差异。结果表明:测序共产生57.41 G 的clean bases,进行de novo接后,共获得183 515个unigenes,将所有unigenes在NR、NT、KOG/COG、Swiss-Prot、PFAM、KEGG、GO进行比对,有110 021个unigenes获得注释。对2个品种的差异表达基因分析表明,低温胁迫下,桂糖08-1180有16145个基因的表达发生了显著变化,ROC22有20317个基因的表达发生了显著变化,且均表现为上调表达基因多于下调表达基因。ROC22与桂糖08-1180共有13113个差异表达基因相同,ROC22特有7204个差异表达基因,桂糖08-1180特有3032个差异表达基因。对桂糖08-1180和ROC22的共有差异表达基因进行功能富集分析,在对寒害逆境反应、膜系统、光合作用方面具有许多相同的功能小类,说明对低温胁迫的应急响应、低温胁迫对膜系统的伤害及光合作用的下降是2个品种的共性。对桂糖08-1180和ROC22的特有差异表达基因进行功能富集分析表明,桂糖08-1180在DNA整合、RNA聚合酶、ADP结合及代谢酶中富集较多,而ROC22在有机化合物的合成、运输和转运蛋白活性相关的条目富集得较多。
关键词: 甘蔗;低温胁迫;转录组
Comparative Analysis on Transcriptomes of Different Sugarcane Cultivars under Low Temperature Stress
TANG Shiyun1 YANG Litao2* LI Yangrui1,2
(1. Sugarcane Research Institute, Guangxi Academy of Agricultural Sciences / Sugarcane Research Center, Chinese Academy of Agricultural Sciences / Key Laboratory of Sugarcane Biotechnology and Genetic Improvement (Guangxi), Ministry of Agriculture / Guangxi Key Laboratory of Sugarcane Genetic Improvement, Nanning 530007, China; 2. State Key Laboratory for Conservation and Utilization of Subtropical Agro-Bioresources / Agricultural College, Guangxi University, Nanning 530005, China;)
Abstract: In order to comparative analysis of different cultivars molecular mechanism in cold resistance, GT08-1180 and ROC22 were used to RNA-seq under cold stress treatment and normal temperature treatment. The results showed that a total of 57.41 G clean reads were produced., and
183515 unigenes were obtained after de novo assembly. All unigenes were annotated in NR, NT,
Key words: Sugarcane; cold stress; transcriptome
KOG/COG, Swiss-Prot, PFAM, KEGG and GO, and 110021 unigenes were functionally annotated in at least one database. The differentially expressed genes(DEGs) analysis showed that there were 16145 and 20317 DEGs found in the cold stress treatment and control in GT08-1180 and ROC22 respectively. In addition, there were more up-regulated DEGs than down-regulated DEGs in both GT08-1180 and ROC22. 13113 DEGs were found common in both GT08-1180 and ROC22, 7204 DEGs only in ROC22, and 3032 DEGs only in GT08-1180. The result of GO enrichment analysis of DEGs in both GT08-1180 and ROC22 showed that they had common sub-groups of differentially expressed genes related to cold stress response, membrane and photosynthesis, which indicated that both GT08-1180 and ROC22 performed the same in stress responses, membrane damage and photosynthesis decrease under cold stress. GT08-1180 showed more enrichment in DEGs related to DNA integration、RNA polymerase、ADP binding and metabolic enzymes. ROC22 showed more enrichment in DEGs related to synthesis and transfer of organic substances, and transporter protease.
甘蔗是我国重要的糖料作物和新型能源作物,甘蔗对低温胁迫较为敏感,低温寒害常给甘蔗生产带来了巨大的经济损失[1]。选育高产优质抗寒性强的品种,可提高甘蔗抵御寒害的能力,降低蔗糖产业生产中的经济损失。目前甘蔗杂交育种是获得优良品种的主要途径[2],但甘蔗常规育种技术所需时间长,盲目性大。随着现代生物技术的飞速发展,从分子水平改良甘蔗新品种成为了可能[3]。但由于甘蔗是高度复杂的多倍体,遗传背景十分复杂,目前甘蔗全基因组信息匮乏,现代生物技术辅助甘蔗常规育种的能力和幅度受限,甘蔗现代分子育种急需加强。转录组是一个生物体中所有基因表达后产物的综合[4],包括转录本的数量、特定发育阶段的表达动态、转录后的修饰以及非编码RNA的调控表达情况等。转录组测序技术,是最近发展起来的利用深度测序技术进行转录组分析的技术[5,6],该技术能够在单核苷酸水平对任意物种的整体转录活动进行检测[7],它可不依赖于参考基因组,为非模式生物转录组研究提供了新的手段[8],可以从整体水平上了解和研究非模式生物的基因功能和结构,有助于挖掘植物优良性状的相关功能基因。本研究采用新一代高通量Illumina转录组测序技术,对2个不同基因型甘蔗在低温胁迫和常温处理下的转录组进行分析,研究不同甘蔗品种低温胁迫下基因表达的差异,揭示不同品种抗寒性分子机制,为甘蔗抗寒性分子育种提供依据和参考。
1 材料与方法
1.1 实验材料
以桂糖08-1180和ROC22号为材料,每个品种种植4桶,每桶种植4个蔗芽,淋足水分,待苗长出后,每桶留甘蔗4株。
1.2 试验处理
当甘蔗长至10片叶龄时,进行试验处理,试验设4个处理:桂糖08-1180常温(G1180_CW)、桂糖08-1180低温(G1180_DW)、ROC22常温(ROC22_CW)、ROC22低温(ROC22_DW),每处理设2个生物学重复。常温处理为甘蔗在自然条件下的温度处理,低温处理为甘蔗在人工气候箱中进行4oC低温处理,常温和低温的处理时间均为36 h。处理完毕后,立即剪取+1叶叶片,进行液氮速冻处理。
1.3 RNA提取及样品检测
采用RNAprep pure 多糖多酚植物总RNA提取试剂盒(天根),按说明书操作方法进行提取。用琼脂糖凝胶电泳分析RNA降解程度以及是否有污染;用Nanodrop仪检测RNA纯度(OD260/280比值);用Qubit Fluorometer仪对RNA浓度进行精确定量;用Agilent 2100生物分析仪检测RNA的完整性。
1.4 文库构建及库检
样品检测合格后,用带有Oligo(dT)的磁珠富集真核生物mRNA。随后加入fragmentation buffer 将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成一链cDNA,然后加入缓冲液、dNTPs和DNA polymerase Ⅰ和RNase H合成二链cDNA,再用AMPure XP beads 纯化双链cDNA,纯化的双链cDNA先进行末端修复、加A尾并连接测序接头,再用AMPure XP beads 进行片段大小选择。最后进行PCR扩增,并用AMPure XP beads进行纯化PCR产物,得到最终的文库。文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1.5 ng/µl,随后使用Agilent 2100生物分析仪对文库的insert size进行检测,insert size符合预期后,使用qPCR方法对文库的有效浓度进行准确定量(文库有效浓度>2 nM),以保证文库质量。
1.5 上机测序
库检合格后,把不同文库按照有效浓度及目标下机数据量的需求池化(pooling)后,由北京诺禾致源生物公司进行Illumina HiSeq测序。
1.6 转录组数据的获取
高通量测序得到的原始图像数据文件经CASAVA碱基识别(Base calling)分析转化为原始测序序列(Sequenced reads),也称之为Raw reads。对原始读子(Raw reads)去除带接头(adapter)的reads;去除N(N表示无法确定碱基信息)的比例大于0.1%的reads;去除低质量reads(质量值Qphred≤20的碱基数占整个reads的50%以上的reads)。
1.7 转录本拼接
由于目前甘蔗的全基因组测序信息尚未见公布,本研究获得clean reads后,采用Trinity软件进行de novo从头拼接。由Trinity拼接得到的转录本序列,取每条基因中最长的转录本作为Unigene,对转录本及Unigene的长度分别进行统计,并以此进行后续的分析。
1.8 基因功能注释
使用Blast对Unigene进行Nr、Nt、Pfam、KOG/COG、Swiss-prot、KEGG、GO注释。 对没有比对上的序列,采用estscan(3.0.3)软件预测其ORF。
1.9 基因表达水平分析
将Trinity拼接得到的转录组作为参考序列(ref),采用RSEM软件(Li and Dewey, 2011),将每个样品的clean reads往参考序列(ref)上做映射(mapping),并对其进行FPKM转换,分析基因的表达水平。
本研究为有生物学重复的样品,因而采用DESeq (Anders and Huber, 2010)进行基因差异表达分析,筛选阈值为padj<0.05。
1.10 差异表达基因的GO富集分析和KEGG富集分析
采用GOseq (Young et al., 2010) 方法进行GO富集分析。使用KOBAS(2.0)进行Pathway富集分析。
2 结果与分析
2.1 测序数据及质量情况
从表2-1可以看出,本试验8个样品共获得394 907 890条raw reads,过滤后共获得382 684 356条clean reads,测序产生的clean reads的碱基数合计为57.41G。并且碱基错误率在0.02%的较低水平,Q20值均大于96.00%,Q30值大于91.00%。GC含量在53.28%至55.16%之间。
表2-1 8个样本的数据产出情况表
Table2-1 The output data of 8 samples
样品 Sample |
原始读子 Raw reads |
干净读子 Clean reads |
读子碱基 Clean bases |
错误率 Error(%) |
Q20 (%) |
Q30 (%) |
GC含量 GC content(%) |
常温ROC22重复1 ROC22_CW1 |
56026258 |
54176772 |
8.13G |
0.02 |
96.93 |
92.38 |
54.65 |
常温ROC22重复2 ROC22_CW2 |
48993300 |
47485066 |
7.12G |
0.02 |
97.16 |
92.86 |
54.19 |
低温ROC22重复1 ROC22_DW1 |
50108078 |
48508462 |
7.28G |
0.02 |
97.06 |
92.69 |
53.69 |
低温ROC22重复2 ROC22_DW2 |
51814232 |
50130140 |
7.52G |
0.02 |
97.02 |
92.6 |
54.00 |
常温桂糖08-1180重复1 G1180_CW1 |
53026656 |
51350798 |
7.70G |
0.02 |
97.03 |
92.57 |
55.16 |
常温桂糖08-1180重复2 G1180_CW2 |
45750672 |
44449086 |
6.67G |
0.02 |
96.93 |
92.17 |
54.49 |
低温桂糖08-1180重复1 G1180_DW1 |
45051390 |
43656714 |
6.55G |
0.02 |
96.92 |
92.18 |
53.39 |
低温桂糖08-1180重复2 G1180_DW2 |
44137304 |
42927318 |
6.44G |
0.02 |
96.77 |
91.83 |
53.28 |
合计Total |
394907890 |
382684356 |
57.41G |
- |
- |
- |
- |
2.2 拼接的转录本数量
从表2-2可以看出,对8个样品进行拼接后,获得360 404条转录本,它们的平均长度为608bp, N50长度为1903bp。8个样本共获得183 515个Unigenes,平均长度为741bp,N50长度为1284bp。
表2-2 转录本数量及长度
Table 2-2 The total number and length of transcripts and unigenes
|
最小 长度 Min. length |
平均 长度 Mean length |
中位数 Median length |
最大 长度 Max. length |
N50 |
N90 |
总数 Total number |
总核苷酸数 Total nucleotides |
转录本 Transcripts |
201 |
1073 |
608 |
16245 |
1903 |
424 |
360404 |
386703425 |
基因 Unigenes |
201 |
741 |
382 |
16245 |
1284 |
279 |
183515 |
135974507 |
2.3 基因功能注释
从表2-3可以看出,将拼接得到的unigenes在NR、NT、KO、Swiss-Prot、PFAM、GO、KOG共7个数据库进行比对,有110 021个unigenes至少在7个数据库中的1个数据库能被显著匹配,注释成功的unigenes占总unigenes的59.95%。10 825个unigenes在7个数据库中均能匹配,占总unigenes的5.89%。
表2-3 基因注释成功率统计表
Table 2-3 The rate of annotated unigenes
注释类别 Description |
基因数 Number of Unigenes |
百分比 Percentage (%) |
Annotated in NR |
75068 |
40.9 |
Annotated in NT |
81034 |
44.15 |
Annotated in KO |
23539 |
12.82 |
Annotated in Swiss-Prot |
50045 |
27.27 |
Annotated in PFAM |
51279 |
27.94 |
Annotated in GO |
56929 |
31.02 |
Annotated in KOG |
24395 |
13.29 |
Annotated in all Databases |
10825 |
5.89 |
Annotated in at least one Database |
110021 |
59.95 |
Total Unigenes |
183515 |
100 |
2.4 基因差异表达分析
从图2-1可以看出,桂糖08-1180和ROC22在低温胁迫下基因的表达均发生了显著变化,但变化的基因数量不同。桂糖08-1180有16145个基因的表达发生了显著变化,其中有8965个为上调表达基因,7180个为下调表达基因。ROC22有20317个基因的表达发生了显著变化,其中有10898个为上调表达基因,9419个为下调表达基因。
图2-1 基因差异表达分析火山图
Fig. 2-1 Volcano p