本文最后更新于97 天前,其中的信息可能已经过时,如有错误请发送邮件到wuyk@163.com
将linux下使用hmmsearch得到的out文件,用excel打开,得到其蛋白序列:
用TBTOOLS,根据序列ID,提取这些序列:
如此,我们便能初步得到目的基因家族的序列
接下来进行结构域分析
打开NCBI——CDD——batch—CD—search
输入刚刚提取得到的蛋白序列,点击Browse result,全选序列:
再点击show selected queries,查看蛋白结构域
将不含有目的基因家族结构域的蛋白删除,最后得到的蛋白序列即为该基因家族的序列。
https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
这个可以用NCBI绘图并美化