杨树木质素合成关键酶基因的鉴定与分析(2)

杨树(Populustremula)是世界范围内种植最广的速生树木,是重要的建筑用材和造纸原料,同时还可作为生物质能源的原料。随着基因组测序的完成,杨树已作


杨树(Populustremula)是世界范围内种植最广的速生树木,是重要的建筑用材和造纸原料,同时还可作为生物质能源的原料。随着基因组测序的完成,杨树已作为木本模式植物广泛应用于木质素合成的研究[4]。然而,对于杨树中木质素合成的调控机制,目前还了解的不多[9]。鉴于杨树在建筑用材和造纸等工业应用的广泛性与我国林木资源的紧缺性,利用生物信息学从基因组水平上尽快发掘和分析杨树重要基因及基因家族已成为一种普遍的方法[10]。尽快模式植物的PAL、C4H与4CL等10种木质素合成关键酶的基因研究已有不少报道,但是杨树的相关基因研究却很少。本文详细分析了PAL、C4H、4CL、CCR、F5H、C3H、COMT、CCoAOMT、CAD、CCR和HCT基因的相位、基因结构、保守基序、功能结构域、基因表达以及系统发育关系,为进一步研究杨树这些基因的功能和进化奠定基础。

2材料与方法

2.1物种选择与数据下载

为研究木质素合成关键酶基因的序列、表达与进化规律,我们必须选择木质素含量较高的模式物种进行相关研究。作为常见的木本模式物种的代表,杨树备受研究人员们的青睐。本研究以杨树为模式物种,从全基因组水平挖掘杨树木质素合成关键酶基因,具体步骤:首先,直接查找拟南芥和水稻模式植物中的木质素合成关键酶基因,直接从TAIR和RAP-DB数据库中下载相应的序列;然后,以拟南芥和水稻木质素合成关键酶的蛋白序列为检索序列,在Ensembl数据库中检索杨树相应的同源蛋白,并下载所有检索到的杨树同源基因的核酸、编码以及蛋白序列,以备下游分析所用。

2.2杨树木质素合成关键酶的聚类分析

由于下载到的杨树木质素合成关键酶归属于不同的蛋白家族,其序列相似程度也有极大差别,严格而言这些关键酶并不具有共同的祖先蛋白,为了阐明这些蛋白分类情况,笔者以拟南芥和杨树木质素合成关键酶序列为基础,在默认参数设置下,利用ClustalX[11]对所有的序列进行了对齐分析,产生一个比对结果文件,接下来将这个比对结果文件直接导入到DNAMAN软件[12]中,利用DNAMAN工具中的聚类分析方法,对这些蛋白进行聚类分析,参数采用默认条件下的设置状态。

2.3杨树木质素合成关键酶的基因结构分析

为分析杨树木质素合成关键酶基因的结构特征,我们对这些基因基因组DNA和编码CDS序列进行比较,可确定外显子和内含子的个数是多少,同时可以计算出每个内含子的相位状态。为直观表示杨树木质素合成关键酶基因的结构,GSDS在线工具[13]被用来制作这些基因的外显子和内含子的组成模式图。

2.4杨树木质素合成关键酶基因的染色体定位

为理解杨树木质素合成关键酶基因进化特征,考察这些基因在染色体上的位置与分布是必要的。基因在染色体上对应的是DNA序列,因此,本研究基于同源搜索策略,利用BLAST工具[14],在默认条件下,以杨树木质素合成关键酶基因的DNA序列为检索序列,在整个杨树基因组上进行搜索,鉴定出最佳匹配区段,这些区段即为该基因的染色体对应定位区,从而达到基因染色体定位目的。

2.5杨树木质素合成关键酶基因的表达分析

笔者探索了杨树木质素合成关键酶基因的表达规律,具体步骤如下:直接从NCBI的GEO数据库中下载杨树芯片数据,将这些数据进行正态化处理,然后利用SPSS软件转化为Z-Score分数,利用R软件对Z-score进行聚类,并绘制相应的热度图。