2.2 番茄GDSL基因的检索与下载 植物GDSL蛋白均具有典型GDSL结构域(PF00657),为了在番茄基因组中鉴定出所有GDSL家族基因。笔者首先从Pfam数据库中下载到了具
2.2 番茄GDSL基因的检索与下载
植物GDSL蛋白均具有典型GDSL结构域(PF00657),为了在番茄基因组中鉴定出所有GDSL家族基因。笔者首先从Pfam数据库中下载到了具有GDSL结构域的种子蛋白序列,利用HMMER工具建立相应HMM模型,然后在番茄基因组中搜索具有GDSL保守结构域的蛋白作为番茄GDSL家族的候选蛋白。此外,还利用关键词搜索和同源搜索方法相结合,鉴定出更多的番茄GDSL候选蛋白。将这些GDSL候选蛋白提交InterProScan和SMART工具上进行分析,含有典型GDSL结构域(PF00657)被认定为番茄GDSL蛋白,这些序列下载于SGN数据库(http://solgenomics.wur.nl/)。
2.3 序列比对与系统进化分析
为弄清楚番茄GDSL家族基因的系统进化关系,我们对番茄GDSL蛋白进行序列比对,同时也加入一些拟南芥GDSL基因,这个比对过程由在线服务器Clustal Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/help/faq.html)完成,比对结果被进一步提交给Phylogeny.fr平台上的BioNJ工具,系统进化树被构建。其进化树图由DrawGram工具绘制,同时进行细微手工调整,美化进化树示意图。
2.4 番茄GDSL基因的结构分析
通过比较编码区与基因组区序列,可以轻松鉴定出基因外显子和内含子的剪接位置和模式,将这些信息整理成BED文件。这些BED结果文件可以直接提交到GSDS 2.0在线工具上,运行参数设置为默认,该工具自动绘制番茄GDSL基因结构图,同时还给出内含子相位信息。
2.5 番茄GDSL蛋白的序列特征分析
为阐明番茄GDSL蛋白序列特征,我们利用MEME工具对这些蛋白的保守模体进行鉴定与分析,参数设置为:保守模体大于12aa,小于200aa;最大保守模体数目为10个;其他参数为默认。此外,利用Pfam工具对这些蛋白典型结构域GDSL进行详细分析,并对保守模体和功能结构域重叠问题进行了比较分析。
2.6 染色体定位和微共线性分析
为鉴定番茄GDSL基因在染色体上物理位置,笔者收集了番茄GDSL基因的基因组序列,以这些基因组序列为检索序列,基于同源搜素方法从染色体上筛查出最佳匹配序列,如果两者序列相似程度达到了99%以上,可以充分说明这个GDSL基因便是位于这个位置。接下来,利用番茄GDSL基因ID号码逐个提交到PGDD数据库中的Locus Search工具,检索这些GDSL基因是否具有共线性重复基因。
3 结果与分析
3.1 番茄GDSL基因家族成员的鉴定
本次研究所采用的番茄植物的GDSL脂肪酶家族基因序列数据整理如表一所示:表中呈现了番茄GDSL脂肪酶基因家族的成员数目,共有105个基因序列,为了清晰的反应结果列出这些基因的基因名称和基因登录号。在以往对不同的植物的GDSL的基因测序中发现,不同的植物所含有的GDSL基因家族的成员数量是不同的。如在白菜、高粱、杨树、水稻、葡萄、拟南芥、小立碗藓中分别含有141、130、126、114、96、108、57个GDSL基因家族成员。而有些植物中含有的GDSL基因数目只有50-100个,如玉米、江南卷柏、衣藻和三角褐指藻等物种的基因组中。
表1 番茄GDSL家族基因的名称与登录号
基因名称 基因登录号 基因名称 基因登录号 基因名称 基因登录号
SlGDSL1 Solyc00g042850.1 SlGDSL36 Solyc03g006240.2 SlGDSL71 Solyc07g049430.2
SlGDSL2 Solyc00g058900.1 SlGDSL37 Solyc03g006250.2 SlGDSL72 Solyc07g049440.2
SlGDSL3 Solyc00g098560.2 SlGDSL38 Solyc03g111550.2 SlGDSL73 Solyc07g064720.2
SlGDSL4 Solyc01g005610.2 SlGDSL39 Solyc03g115960.2 SlGDSL74 Solyc07g064730.1
SlGDSL5 Solyc01g059840.1 SlGDSL40 Solyc03g121170.2 SlGDSL75 Solyc08g008620.2
SlGDSL6 Solyc01g079160.2 SlGDSL41 Solyc03g121180.2 SlGDSL76 Solyc08g082490.1
SlGDSL7 Solyc01g095450.2 SlGDSL42 Solyc04g007440.1 SlGDSL77 Solyc08g082500.1