人类TESMIN基因(CPP同源基因)最初通过在睾丸中的特异性表达而被鉴定出来,随后它也在卵巢发育的特定阶段被检测到特异性表达。同时还确定了导致花和胚
人类TESMIN基因(CPP同源基因)最初通过在睾丸中的特异性表达而被鉴定出来,随后它也在卵巢发育的特定阶段被检测到特异性表达。同时还确定了导致花和胚珠发育缺陷的拟南芥TSO1基因的突变等位基因。‘TSO’在中文中是“丑陋”的意思, TSO1基因突变会导致花的外形变化。TSO1基因是模式植物拟南芥中第一个通过图位克隆方式被鉴定出的 CPP-like基因, TSO1基因影响细胞的方向性增长以及临近细胞的协调生长,并能调节花发育过程中的有丝分裂和胞质分裂, TSO1突变体会引起花器官发育发生缺陷[11-13]。在大豆中也分离出一个属于该家族的基因 CPP1 ,该基因能够与大豆的豆血红蛋白基因 Gmlbc3的启动子区段特异结合并调控其表达[14]。然而表达局限在受感染根瘤的核心部位。CPP1蛋白质和TSO1一样包含两个高度保守的 CXC结构域。且结构域之间序列存在保守性。Hauser 等[12]认为这表明CPP-like基因家族是通过CXC结构域与目标基因的DNA相结合并调控其表达。
通过前人对水稻与模式植物拟南芥的研究,比较分析发现, 由于水稻基因组中的 CPP-like 基因的内含子序列长度显著大于拟南芥中的基因。拟南芥与水稻的CPP-like基因家族的编码序列之间虽然不存在显著差异,但是两者基因的序列全长却有着极显著差异。通过搜索对应的cDNA序列和相匹配的EST序列,发现在拟南芥中所有的 CPP-like基因都表达了,而在水稻基因组中OsCPP6很可能也是表达的。而OsCPP4基因很可能是一个假基因。通过多序列联配表明:除OsCPP4之外,其余的拟南芥和水稻的 CPP-like 基因中均含两个CXC结构域,且高度保守。其基本结构是 C-X-C-X4-C-X3-YC-X-C-X6-C-X3-C-X-C-X2-C[15-17]。
基因家族的物种特异性扩张是指基因家族成员在特定物种中的数目得到了增加,片段复制、串联重复和逆转录转座等基因复制方式在基因家族的物种特异性扩张方面起到了重要作用。为新基因的产生提供了材料,并促使新功能的产生。有研究表明在模式植物拟南芥基因组中有 80%的基因是物种特异性扩张的结果。而植物的 CPP-like 基因家族成员比动物具有更多。通过系统发生树,发现在单子叶与双子叶植物分离之后, CPP-like基因家族在水稻和拟南芥基因组中进行了物种特异性扩张。单子叶模式植物水稻的基因组至少经历了两次全基因组加倍过程,而双子叶模式植物拟南芥的基因组则至少经历了三次全基因组加倍过程[18,19]。
CPP-like转录因子基因家族对植物的生长发育起到了重要作用,因此对该基因家族进行分子进化研究是十分必要的。荷花是中国十大名花之一,也是重要的水生观赏植物。对荷花的基因组测序计划的完成,为对荷花CPP-like基因进化分析提供了基础。本研究将通过生物信息学方法在荷花基因组范围内鉴定CPP-like基因家族,并进一步分析其进化规律。
1 材料与方法
1.1 序列搜索
从NCBI数据库中找到大豆的CPP1和拟南芥的TSO1基因编码的蛋白质序列,将这两段已知作为检索序列,通过BLASTP检索荷花NCBI基因组数据库,再从检索出的结果中筛选出 E≤10 10的蛋白质序列,作为候选。然后通过Pfam工具[20]在候选蛋白序列中找出有CXC结构域的,作为CPP-like基因编码的蛋白质序列。最后将新检索出的荷花CPP-like蛋白质序列再次对NCBI数据库进行检索,直到不再检索出新的序列。然后对得到的荷花CPP-like基因进行结构的分析,并用Plantcare对启动子序列进行功能性分析。
1.2 多序列联配
利用CLUSTAL W 软件[21],选择默认参数对荷花基因组中 CPP-like 蛋白质序列进行多序列联配。再对荷花CPP-like基因做序列比对。
1.3 系统发生树的构建