高粱SbCOBRA基因的鉴定表达与进化(2)

1 材料与方法 1.1 序列检索与下载 在TAIR 网站(https://www.arabidopsis.org/index.jsp)上直接搜索COBRA基因获得COBRA基因家族的所有基因ID,然后在NCBI里搜索所有COBRA基


1  材料与方法

1.1  序列检索与下载

在TAIR 网站(https://www.arabidopsis.org/index.jsp)上直接搜索COBRA基因获得COBRA基因家族的所有基因ID,然后在NCBI里搜索所有COBRA基因所编码的蛋白序列。为检索高粱所有COBRA家族基因成员,利用BLAST搜索工具在高粱基因组中挖掘COBRA家族基因,最终得到与拟南芥COBRA基因同源物,这些同源物被认定高粱COBRA候选基因。为进一步确证这些基因是否为COBRA家族基因,利用Pfam工具[15]分析这些植物的COBRA蛋白的功能结构域,含有COBRA典型功能结构域的蛋白被视为COBRA家族成员。COBRA结构域(PF04833)长度有所变异,但绝大多数高粱COBRA候选蛋白均具有这个典型的结构域。

1.2  序列比对与系统进化分析

序列过长过短或分歧度过高,均后续的多序列比对分析不利,因此,将所有下载序列进行筛选,尽可能删除较短和分歧度过高的序列。为了揭示COBRA家族基因的起源与进化特征,本研究选择了模式植物小立碗藓、江南卷柏、拟南芥、水稻和高粱等13个物种的COBRA基因作为研究对象,然后,这些基因的多序列分析由Clustal Omega在线工具(https://www.ebi.ac.uk/Tools/msa/clustalo/)在默认条件下完成。进而将这些比对结果导入到MEGA软件[16]中,利用这个软件中的邻接方法构建系统进化树。

1.3  高粱COBRA基因的序列特征分析

为阐明高粱COBRA基因的结构特征和蛋白的保守基序以及这些保守基序组成模式,本研究分别利用GSDS[17]和MEME[18]在线工具(http://meme.nbcr.net/meme/)检测这些COBRA基因的结构特征与保守基序数目以及排列顺序。GSDS运行时,提交编码和基因组序列文件,同时参数设置为默认。MEME运行时,参数设置如下:每个COBRA蛋白序列中某个保守模体出现1或多次;基序长度最长为160aa,长度最短为9aa;保守模体最大数目为10;其它参数均按照默认条件运行。

1.4  染色体定位与微共线性分析

利用高粱COBRA基因的编码序列搜索高粱基因组,通过BLASTN鉴定出最佳匹配位置,这个位置就是该COBRA基因对应基因座位,也是染色体分布的位置。为阐明不同基因之间的微共线性,本研究利用PGDD[19]数据库中位点搜索工具,鉴定出片段重复基因;利用不同基因在染色体上的位置距离,鉴定出串联重复基因;同时,可推知高粱COBRA基因的扩增模式类型。