本文最后更新于90 天前,其中的信息可能已经过时,如有错误请发送邮件到wuyk@163.com
顺式作用元件是位于基因启动子上的,可能影响基因表达的序列。因此,我们需要对基因的启动子进行分析
提取基因CDS以及CDS前2000bp序列
打开TBtools的Gtf/Gff3 Sequences Extract功能,输入基因组的gff3文件和基因组文件,并且设置输出文件
然后提取目标基因的启动子序列,打开 TBtools 的 Fasta Extract or Filter,设置好序列文件、输出文件、基因 ID,点击 start 开始
打开TBtools的Sequence Manipulate (Rev&comp)功能,输入刚刚得到的序列,将其全部转成大写
打开plantcare,输入刚刚大写后的文件,进行启动子预测
解压得到的plantcare分析文件,把结果放在excel中
接下来我们需要对plantcare结果进行优化,不然TBtools会报错
首先,以第二列进行排序筛选,把没有motif的所有行都删除,其次,搜索TATA-box,CAAT-box,unmaned,分别把含有这三种motif的项删除;其次,以最后一列进行排序筛选,把没有注释的所有行也删除;这样,我们就完成了对plantcare结果的初筛,然后,只留下基因ID、起始位置、终止位置和motif功能这四列,其他的列都删除;最后,起始位置-20bp,终止位置+20bp,生成新的起始位置和终止位置。得到的新的基因ID、起始位置、终止位置和motif功能这四列,即可用于绘图。