尽管很多物种的Trihelix蛋白家族成员已经被详细解析,但迄今为止,仍然未见高粱Trihelix基因家族的相关报道。高粱是世界第五大禾谷类作物,具有抗旱、
尽管很多物种的Trihelix蛋白家族成员已经被详细解析,但迄今为止,仍然未见高粱Trihelix基因家族的相关报道。高粱是世界第五大禾谷类作物,具有抗旱、耐盐碱、耐涝、适应性强等优点,在我国是重要的抗旱植物。高粱作为重要的经济作物,可用作饲料、酿酒、做醋、生产酱油及熬糖等[4-7]。因此研究高粱Trihelix转录因子的功能,不仅可以扩宽对该家族基因功能的认识,而且对深入理解植物逆境胁迫具有重要意义。本研究以高粱Trihelix家族基因为研究对象,利用生物信息学手段,在全基因水平上鉴定Trihelix基因家族的成员数目,并详细剖析这些基因的结构、蛋白保守基序、保守氨基酸位点和系统进化关系。这些研究为深入剖析高粱Trihelix家族基因的功能提供了有益线索。
1. 材料与方法
1.1 物种选择与序列下载
为鉴定在高粱基因组中的Trihelix家族基因成员,先从TAIR数据库中直接查询拟南芥Trihelix基因家族成员,然后直接下载这些基因的序列。接下来,以拟南芥Trihelix基因为检索序列,利用BLAST同源搜索方法在高粱基因组中鉴定所有Trihelix候选基因,然后利用NCBI数据库中的CDD工具[13]对这些Trihelix蛋白进行分析。此外,还要用Pfam[14]和SMART[15]在线工具进一步对这些蛋白进行分析,以Trihelix蛋白的特征功能结构域为标准,最终确定高粱Trihelix家族的基因数目。最后,直接从Ensembl Plants数据库[16]中下载这些高粱的序列。
1.2 高粱Trihelix家族基因的染色体定位分析
基于高粱Trihelix家族基因序列,直接利用高粱Trihelix家族基因的序列为探针,采用BLAST工具将Trihelix基因序列与基因组进行比对,鉴定出Trihelix家族基因最佳匹配位置。根据最佳匹配位置,进一步手工比对以确保两者之间的一致性,最后确定高粱Trihelix家族基因的染色体定位区段。为了显示高粱Trihelix家族基因在染色体上的位置,利用GGT软件[17]将这些基因绘制在染色体上。
1.3 高粱Trihelix家族基因的微共线性分析
为了阐明高粱Trihelix家族基因的微共线性关系,我们对高粱Trihelix家族基因进行两两组合,对每一个组合对应基因的染色体位置进行确定,然后分别向上游和下游各下载100Kb长度的碱基,将这200Kb的区段内的基因进行两两分析。如果两个基因对应的200Kb区段内,至少存在2对同源基因时,两个重复基因对应的两个染色体区段具有较好的微共线性。结果可以利用PGDD[18]和Genomicus[19]工具进行验证。
1.4 高粱Trihelix家族基因的结构分析
分别下载高粱Trihelix家族基因的编码序列和基因组序列,接下来对两者进行序列比较,根据比较结果可以推测出高粱Trihelix家族基因的外显子与内含子剪接模式,同时能够鉴定出内含子相位。绘制基因结构由GSDS2.0[20]在线服务器完成,同时对基因结构进行手工调整。
1.5 高粱Trihelix家族蛋白的亚细胞定位分析
高粱Trihelix家族蛋白亚细胞定位与功能密切相关,为阐明蛋白功能,必先确定这些蛋白的亚细胞定位情况。笔者利用pSort工具[21]预测了高粱Trihelix家族蛋白的亚细胞定位情况。
1.6 高粱Trihelix家族基因的表达情况分析
为阐明Trihelix基因表达规律,选择高粱的种子、花粉囊、叶片、胚、胚乳、Pistal和inflorescene器官组织,在NCBI网站的GEO数据库[22]下载这些基因的表达数据,利用R软件编写脚本提取高粱每一个Trihelix家族基因的FPKM值,将这些基因的FPKM值转化为Z-Score值,同时利用R程序绘制热度图。
2. 结果与分析
2.1 高粱Trihelix家族基因的鉴定
结果表明高粱Trihelix家族基因共有15个,分别命名为SbTH1、SbTH2、SbTH3、SbTH4、SbTH5、SbTH6、SbTH7、SbTH8、SbTH9、SbTH10、SbTH11、SbTH12、SbTH13、SbTH14和SbTH15。如表1为高粱Trihelix基因家族成员的基本信息。对每个基因进行Blast后,找出其EST数目。可以看出,每个基因的EST数目不等,且差异较大。SbTH1的EST数目为19条,例如CN152534.1;SbTH2的EST数目为25条,例如FL837511.1;SbTH3的EST为77条,例如BI211215.1;SbTH4的EST数目为30条,例如CF429665.1;SbTH5的EST数目为20条,例如BJ584919.1;SbTH6的EST数目为77条,例如CF072785.1;SbTH7的EST数目为8条,例如BE918780.1;SbTH8的EST数目为11条,例如CF481373.1;SbTH9的EST数目为39条,例如CA203600.1;SbTH10的EST数目为24条,例如FL801788.1;SbTH11的EST数目为7条,例如CF486268.1;SbTH12的EST数目为50条,例如CD425774.1;SbTH13的EST数目为只有1条,即DK748904.1;SbTH14的EST数目为39条,例如BI141108.1;SbTH15的EST数目为5条,例如CX610375.1。从表1可以发现,SbTH3、SbTH6和SbTH12的EST数目较多,而SbTH 15很少,仅有5条,且SbTH13只有1条。