目前发现共有64个密码子编码20种氨基酸,每个氨基酸至少对应一种密码子,20种氨基酸都存在多个简并密码子以及多个终止密码子[11-12]。同义密码子是指
目前发现共有64个密码子编码20种氨基酸,每个氨基酸至少对应一种密码子,20种氨基酸都存在多个简并密码子以及多个终止密码子[11-12]。同义密码子是指编码同一种氨基酸的密码子,在不同的物种和不同的基因中不是随机出现,存在一定的偏好性并广泛存在于生物体中。密码子偏好性被确定为基因表达中的一个重要因素,不仅可以探究很多生物学现象,还反映出基因与生物进化机制。评价密码子偏性的指标有很多,主要有密码子使用相对概率(RSCU)、密码子不同位置的GC含量、密码子有效使用个数(ENC)等。物种或基因的不同决定密码子的偏好性,通过对密码子偏性差异程度的比较和分析,鉴定出最优密码子并对其结构进行适当的改造[13]。
重组蛋白的表达受密码子利用的影响,蛋白质编码度高的基因利用偏爱密码子并避免利用率低的密码子完成基因组成,这种基因的重新设计合成叫做密码子优化。密码子优化的优化点可以从基因的合成(平衡GC含量,二级结构)、载体的构建(酶切位点)、基因转录(平衡GC含量,终止信号)和翻译(密码子偏好性,GC含量,mRNA二级结构,mRNA自由能)等过程中提取,目的就是方便优化过程的高效达成[14-16]。
2材料与方法
2.1植酸酶PhyA基因的检索与序列下载
通过文献查询到黑曲霉植酸酶PhyA基因的登录号,从NCBI数据库中检索PhyA基因,直接从这个数据库中下载PhyA基因的蛋白序列和核苷酸序列,以FASTA格式保存在文本文件中。接下来,利用黑曲霉植酸酶PhyA蛋白序列作为种子序列,基于BLAST同源搜索在PLAZA数据库[17]中检索出该基因相应的同源序列,然后直接下载这些植物的PhyA基因的核酸和蛋白序列,分别放入FASTA文本文件中,以备进行下一步密码子用法分析。
2.2植物植酸酶PhyA基因的密码子用法分析
为阐明植物植酸酶PhyA基因的密码子偏好性规律,以便设置出符合植物表达体系的黑曲霉植酸酶高效表达的PhyA基因,基于生物信息学手段,本研究利用CodonW工具[18],对二岁短柄草、番木瓜、草莓、大豆、百脉根、苜蓿、水稻、小立碗藓、杨树、蓖麻、高粱、江南卷柏、可可树、葡萄以及衣藻等19个物种的PhyA基因进行密码子统计分析,分别计算密码子相对使用度、有效密码子以及碱基组成情况。
2.3黑曲霉植酸酶PhyA与植物植酸酶的聚类分析
黑曲霉植酸酶是一种常用的代表性植酸酶,但在植物中有没有其对应的直系同源基因存在。从植物中筛选出与黑曲霉植酸酶PhyA最接近的植物植酸酶,并利用黑曲霉密码子用法特征,优化植物植酸酶基因,最终有望人工创造出高效植物源植酸酶,这种植酸酶可以在黑曲霉系统中高效表达。为筛查出植物植酸酶,笔者将与黑曲霉植酸酶PhyA序列相似性较高植物序列进行多序列比对,并构建聚类树,最终鉴定出与黑曲霉植酸酶PhyA位于同一聚类枝的植物植酸酶。比对由Clustalomega在线工具[19]完成,聚类树由DNAMAN工具[20]产生。
2.4黑曲霉植酸酶最佳匹配植物PhyA基因的密码子优化
参考植物植酸酶蛋白密码子使用的偏好性特点,利用在线工具optimizer[21]对黑曲霉植酸酶PhyA基因进行密码子优化。优化原则为选择使用频率较高的简并密码子。优化后,将PhyA基因翻译为氨基酸序列,然后利用Clustalomega工具比对优化前后的氨基酸序列,确认优化前后氨基酸序列是否一致。优化过程中,我们还要尽量减少重复序列过多,同时组合利用CodonW和EMBOSS工具[22]对优化前后的序列进行有效密码子和密码子适应指数等参数评估。
3结果与分析
3.1模式植物植酸酶PhyA基因的鉴定
为鉴定模式植物植酸酶PhyA基因,首先利用NCBI数据库的CDD在线工具对黑曲霉植酸酶蛋白功能结构域进行鉴定,结果显示:黑曲霉植酸酶PhyA蛋白包括HP_HAP_like功能结构域,隶属于HP超家族(图1)。