马铃薯热激转录因子的全基因组鉴定与分析(2)

马铃薯(Solanum tuberosum),它属于茄科一年生草本植物,其块茎能够食用,它的排位在小麦、稻谷和玉米之后,是全球第四重要的粮食作物[11]。由于马铃薯可


   马铃薯(Solanum tuberosum),它属于茄科一年生草本植物,其块茎能够食用,它的排位在小麦、稻谷和玉米之后,是全球第四重要的粮食作物[11]。由于马铃薯可以被加工成馒头、面条、米粉等食物,中国已经启动将马铃薯作为主要粮食的发展战略计划[12]。马铃薯性喜冷凉,是低温作物。但随着环境的恶化,马铃薯的生产面临着新的挑战,因此,当前研究的重要内容是抗逆品种的选育。高温会对马铃薯的生长和发育造成严重影响,应对高温胁迫的有效途径是找出马铃薯的耐热基因,并且了解植物耐热机制,从而培育耐热品种。本文利用生物信息学方法鉴定了马铃薯热激转录因子数目,分析了基因结构,染色体定位以及基因共线与系统进化关系和基因表达情况等,这有助于更好的分析HSF基因的复杂性及其功能,为培育马铃薯耐热新品种提供理论依据。

1 数据与方法

1.1 基因鉴定与序列下载

为了鉴定出马铃薯基因组中HSF家族基因全部成员,本研究利用两种途径对马铃薯HSF家族基因进行搜索。一方面,直接从TAIR数据库中下载拟南芥HSF基因,利用AtHSF基因为检索序列,通过BLAST同源搜索在马铃薯基因组中检索马铃薯相应的同源基因,这些基因被认为是马铃薯HSF候选基因;另一方面,直接从Pfam数据库[13]中下载具有功能结构域PF00447的种子序列,利用这些种子序列建立HMM文件,然后利用HMMER工具[14]在马铃薯基因组中搜索相应的功能结构域,最终也得到马铃薯HSF候选蛋白。最后,利用Pfam工具对这些蛋白进行详细分析,凡是具有HSF典型功能结构域(PF00447)的蛋白均被认为是马铃薯HSF蛋白。以这些马铃薯基因ID号码,直接在Phytozome数据库[15]中下载这些基因的核酸、基因组和蛋白序列。

1.2 基因结构分析

为绘制马铃薯HSF基因的外显子和内含子组织结构,笔者将马铃薯HSF基因编码序列和相应DNA基因组序列进行两两比较,可以鉴定出外显子和内含子剪接位点,进而绘制出基因结构,这些分析均由GSDS 2.0[16]在线工具完成。

1.3 染色体定位分析

染色体定位信息可以为基因进化提供一定线索,同时也为基因起源阐明提供帮助。为将马铃薯HSF基因定位染色体上,我们以马铃薯HSF基因的DNA基因组序列为探针,通过BLASTN工具搜索位于染色体上同源匹配区段,如果能够达到98%序列相似性的匹配度以上,则认为该基因就定为这个位置。染色体定位图由GGT工具[17]完成,图片进行了细微手工调整。

1.4 基因的共线性分析

为阐明马铃薯HSF基因之间的共线性关系,笔者以马铃薯HSF基因的ID或序列为探针,分别利用PGDD[18]和Genomicus数据库[19]中的共线性信息分析这些马铃薯HSF基因之间,是否具有共线性。为显示共线性结果,笔者将以共线性为特点的片段重复,以相互紧挨的串联重复都通过标记方式展现在染色体定位图中。

1.5 序列比对与系统进化关系分析

为了阐明马铃薯HSF基因亲缘关系,笔者将拟南芥、水稻和马铃薯的HSF蛋白作为比对的对象,利用高性能比对工具ProbCons对这些蛋白进行比对分析。比对结果直接被提交到Phylogeny.fr网站[20]的PhyML工具,该工具可以构建极大似然进化树。极大似然树的可视化过程由TreeDyn工具完成,同时手工调整极大似然树的拓扑结构,进而形成一个合理的进化树。

1.6 基因的表达情况分析

   为了探明重复基因对之间的表达分歧情况,笔者以马铃薯雄蕊、成熟果实、块茎(2个样本)、成熟块茎和不成熟果实等32个组织或器官为研究对象,分别考察2个重复基因在这些组织或器官中表达情况。本研究选择的重复基因对之间,均具有较高的共线性,同时利用已知RNA-seq数据,最后计算出FPKM值,这个值可以间接表征马铃薯HSF基因的表达情况。