低温胁迫下不同甘蔗品种的转录组比较分析

低温胁迫下不同甘蔗品种的转录组比较分析

唐仕云   杨丽涛   李杨瑞

要:以桂糖08-1180和主栽品种ROC22为研究材料,进行低温胁迫和常温处理,采用转录组测序技术,比较不同甘蔗品种抗寒性分子机制的差异。结果表明:测序共产生57.41 G 的clean bases,进行de novo接后,共获得183 515个unigenes,将所有unigenes在NR、NT、KOG/COG、Swiss-Prot、PFAM、KEGG、GO进行比对,有110 021个unigenes获得注释。2个品种的差异表达基因分析表明,低温胁迫下,桂糖08-1180有16145个基因的表达发生了显著变化,ROC2220317个基因的表达发生了显著变化,且均表现为上调表达基因多于下调表达基因。ROC22与桂糖08-1180共有13113个差异表达基因相同,ROC22特有7204个差异表达基因,桂糖08-1180特有3032个差异表达基因。对桂糖08-1180和ROC22的共有差异表达基因进行功能富集分析,在对寒害逆境反应、膜系统、光合作用方面具有许多相同的功能小类,说明对低温胁迫的应急响应、低温胁迫对膜系统的伤害及光合作用的下降是2个品种的共性。对桂糖08-1180和ROC22的特有差异表达基因进行功能富集分析表明,桂糖08-1180在DNA整合、RNA聚合酶、ADP结合及代谢酶中富集较多,而ROC22在有机化合物的合成、运输和转运蛋白活性相关的条目富集得较多。

关键词:  甘蔗;低温胁迫;转录组

Comparative Analysis on Transcriptomes of Different Sugarcane Cultivars under Low Temperature Stress

TANG Shiyun1  YANG Litao2*  LI Yangrui12

(1. Sugarcane Research Institute, Guangxi Academy of Agricultural Sciences / Sugarcane Research Center, Chinese Academy of Agricultural Sciences / Key Laboratory of Sugarcane Biotechnology and Genetic Improvement (Guangxi), Ministry of Agriculture / Guangxi Key Laboratory of Sugarcane Genetic Improvement, Nanning 530007, China; 2. State Key Laboratory for Conservation and Utilization of Subtropical Agro-Bioresources / Agricultural College, Guangxi University, Nanning 530005, China;)

Abstract: In order to comparative analysis of different cultivars molecular mechanism in cold resistance, GT08-1180 and ROC22 were used to RNA-seq under cold stress treatment and normal temperature treatment. The results showed that a total of 57.41 G clean reads were produced., and

183515 unigenes were obtained after de novo assembly. All unigenes were annotated in NR, NT,

Key words: Sugarcane; cold stress; transcriptome
KOG/COG, Swiss-Prot, PFAM, KEGG and GO, and 110021 unigenes were functionally annotated in at least one database. The differentially expressed genes(DEGs) analysis showed that there were 16145 and 20317 DEGs found in the cold stress treatment and control in GT08-1180 and ROC22 respectively. In addition, there were more up-regulated DEGs than down-regulated DEGs in both GT08-1180 and ROC22. 13113 DEGs were found common in both GT08-1180 and ROC22, 7204 DEGs only in ROC22, and 3032 DEGs only in GT08-1180. The result of GO enrichment analysis of DEGs in both GT08-1180 and ROC22 showed that they had common sub-groups of differentially expressed genes related to cold stress response, membrane and photosynthesis, which indicated that both GT08-1180 and ROC22 performed the same in stress responses, membrane damage and photosynthesis decrease under cold stress. GT08-1180 showed more enrichment in DEGs related to DNA integrationRNA polymeraseADP binding and metabolic enzymes. ROC22 showed more enrichment in DEGs related to synthesis and transfer of organic substances, and transporter protease.

甘蔗是我国重要的糖料作物和新型能源作物甘蔗对低温胁迫较为敏感,低温寒害常给甘蔗生产带来了巨大的经济损失[1]。选育高产优质抗寒性强的品种,可提高甘蔗抵御寒害的能力,降低蔗糖产业生产中的经济损失。目前甘蔗杂交育种是获得优良品种的主要途径[2],但甘蔗常规育种技术所需时间长,盲目性大。随着现代生物技术的飞速发展,从分子水平改良甘蔗新品种成为了可能[3]。但由于甘蔗高度复杂的多倍体,遗传背景十分复杂目前甘蔗全基因组信息匮乏现代生物技术辅助甘蔗常规育种的能力和幅度受限,甘蔗现代分子育种急需加强。转录组是一个生物体中所有基因表达后产物的综合[4]包括转录本的数量、特定发育阶段的表达动态、转录后的修饰以及非编码RNA的调控表达情况等转录组测序技术,是最近发展起来的利用深度测序技术进行转录组分析的技术[5,6],该技术能够在单核苷酸水平对任意物种的整体转录活动进行检测[7],它可不依赖于参考基因组,为非模式生物转录组研究提供了新的手段[8],可以从整体水平上了解和研究非模式生物的基因功能和结构,有助于挖掘植物优良性状的相关功能基因。本研究用新一代高通量Illumina转录组测序技术,对2个不同基因型甘蔗在低温胁迫和常温处理下的转录组进行分析,研究不同甘蔗品种低温胁迫下基因表达的差异,揭示不同品种抗寒性分子机制,为甘蔗抗寒性分子育种提供依据和参考。

1 材料与方法

1.1 实验材料

桂糖08-1180ROC22号为材料,每个品种种植4桶,每桶种植4个蔗芽,淋足水分,待苗长出后,每桶留甘蔗4株。

1.2 试验处理

当甘蔗长至10叶龄时,进行试验处理试验设4个处理:桂糖08-1180常温(G1180_CW)、桂糖08-1180低温(G1180_DW)ROC22常温(ROC22_CW)、ROC22低温(ROC22_DW每处理设2个生物学重复。常温处理为甘蔗自然条件下的温度处理,低温处理甘蔗人工气候箱中进行4oC低温处理,常和低温的处理时间均为36 h处理完毕后,立即剪取+1叶叶片,进行液氮速冻处理。

1.3 RNA提取及样品检测

采用RNAprep pure 多糖多酚植物总RNA提取试剂盒(天根),按说明书操作方法进行提取琼脂糖凝胶电泳分析RNA降解程度以及是否有污染;用Nanodrop仪检测RNA纯度(OD260/280比值);用Qubit Fluorometer仪对RNA浓度进行精确定量;用Agilent 2100生物分析仪检测RNA的完整性。

1.4 文库构建及库检

样品检测合格后,用带有OligodT)的磁珠富集真核生物mRNA。随后加入fragmentation buffer mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成一链cDNA,然后加入缓冲液、dNTPsDNA polymerase ⅠRNase H合成二链cDNA,再用AMPure XP beads 纯化双链cDNA,纯化的双链cDNA先进行末端修复、加A尾并连接测序接头,再用AMPure XP beads 进行片段大小选择。最后进行PCR扩增,并用AMPure XP beads进行纯化PCR产物,得到最终的文库。文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1.5 ng/µl,随后使用Agilent 2100生物分析仪对文库的insert size进行检测,insert size符合预期后,使用qPCR方法对文库的有效浓度进行准确定量(文库有效浓度>2 nM),以保证文库质量

1.5 上机测序

库检合格后,把不同文库按照有效浓度及目标下机数据量的需求池化(pooling)后,由北京诺禾致源生物公司进行Illumina HiSeq测序。

1.6 转录组数据的获取

     高通量测序得到的原始图像数据文件经CASAVA碱基识别(Base calling)分析转化为原始测序序列(Sequenced reads),也称之为Raw reads原始读子(Raw reads)去除带接头(adapter)的reads;去除N(N表示无法确定碱基信息)的比例大于0.1%reads;去除低质量reads(质量值Qphred≤20的碱基数占整个reads50%以上的reads

1.7 转录本拼接

由于目前甘蔗的全基因组测序信息尚未见公布,本研究获得clean reads后,采用Trinity软件进行de novo从头拼接。由Trinity拼接得到的转录本序列取每条基因中最长的转录本作为Unigene,对转录本及Unigene的长度分别进行统计,并以此进行后续的分析。

1.8 基因功能注释

使用BlastUnigene进行Nr、Nt、Pfam、KOG/COG、Swiss-prot、KEGG、GO注释。 对没有比对上的序列,采用estscan(3.0.3)软件预测其ORF

1.9 基因表达水平分析

Trinity拼接得到的转录组作为参考序列(ref)采用RSEM软件(Li and Dewey, 2011)将每个样品的clean reads往参考序列(ref)上做映射(mapping并对其进行FPKM转换,分析基因的表达水平。

本研究有生物学重复的样品,因而采用DESeq (Anders and Huber, 2010)进行基因差异表达分析,筛选阈值为padj<0.05。

1.10 差异表达基因GO富集分析KEGG富集分析

采用GOseq (Young et al., 2010) 方法进行GO富集分析。使用KOBAS(2.0)进行Pathway富集分析

2 结果与分析

2.1 测序数据质量情况

从表2-1可以看出,本试验8个样品共获得394 907 890raw reads,过滤后共获得382 684 356clean reads,测序产生的clean reads的碱基数合计为57.41G。并且碱基错误率在0.02%的较低水平,Q20值均大于96.00%Q30值大于91.00%GC含量在53.28%55.16%之间。

2-1   8个样本的数据产出情况表

Table2-1  The output data of 8 samples

样品

Sample

原始读子

Raw reads

干净读子

Clean reads

读子碱基

Clean bases

错误率

Error(%)

Q20

(%)

Q30

(%)

GC含量

GC content(%)

常温ROC22重复1 ROC22_CW1

56026258

54176772

8.13G

0.02

96.93

92.38

54.65

常温ROC22重复2

ROC22_CW2

48993300

47485066

7.12G

0.02

97.16

92.86

54.19

低温ROC22重复1 ROC22_DW1

50108078

48508462

7.28G

0.02

97.06

92.69

53.69

低温ROC22重复2

ROC22_DW2

51814232

50130140

7.52G

0.02

97.02

92.6

54.00

常温桂糖08-1180重复1

G1180_CW1

53026656

51350798

7.70G

0.02

97.03

92.57

55.16

常温桂糖08-1180重复2

G1180_CW2

45750672

44449086

6.67G

0.02

96.93

92.17

54.49

低温桂糖08-1180重复1

G1180_DW1

45051390

43656714

6.55G

0.02

96.92

92.18

53.39

低温桂糖08-1180重复2

G1180_DW2

44137304

42927318

6.44G

0.02

96.77

91.83

53.28

合计Total

394907890

382684356

57.41G

-

-

-

-

2.2 拼接的转录本数量

从表2-2可以看出,对8个样品进行拼接后,获得360 404条转录本,它们的平均长度为608bp N50长度为1903bp8个样本共获得183 515Unigenes,平均长度为741bpN50长度为1284bp

 

 

 

 

 

 

 

 

 

2-2 转录本数量及长度

Table 2-2 The total number and length of transcripts and unigenes

 

最小

长度

Min. length

平均

长度

Mean

length

中位数

Median length

最大

长度

Max. length

N50

N90

总数

Total number

总核苷酸数

Total nucleotides

转录本

Transcripts

201

1073

608

16245

1903

424

360404

386703425

基因

Unigenes

201

741

382

16245

1284

279

183515

135974507

2.3 基因功能注释

从表2-3可以看出,将拼接得到的unigenesNRNTKOSwiss-ProtPFAMGOKOG7个数据库进行比对,有110 021unigenes至少在7个数据库中的1个数据库能被显著匹配,注释成功的unigenes占总unigenes59.95%10 825unigenes7个数据库中均能匹配,占总unigenes5.89%

2-3   基因注释成功率统计表

Table 2-3 The rate of annotated unigenes

注释类别

Description

基因数

Number of Unigenes

百分比

Percentage (%)

Annotated in NR

75068

40.9

Annotated in NT

81034

44.15

Annotated in KO

23539

12.82

Annotated in Swiss-Prot

50045

27.27

Annotated in PFAM

51279

27.94

Annotated in GO

56929

31.02

Annotated in KOG

24395

13.29

Annotated in all Databases

10825

5.89

Annotated in at least one Database

110021

59.95

Total Unigenes

183515

100

2.4 基因差异表达分析

从图2-1可以看出,桂糖08-1180ROC22在低温胁迫基因的表达均发生了显著变化,变化的基因数量不同。桂糖08-118016145个基因的表达发生了显著变化,其中有8965上调表达基因,7180下调表达基因。ROC2220317个基因的表达发生了显著变化,其中有10898上调表达基因,9419下调表达基因。

2-1   基因差异表达分析火山图

Fig. 2-1  Volcano p

微信二维码
扫码添加微信咨询
QQ客服:1663286777
电话:137-1883-9017
收到信息将及时回复