本文最后更新于96 天前,其中的信息可能已经过时,如有错误请发送邮件到wuyk@163.com
blast
下载ncbi的linux安装包:Index of /blast/executables/blast+/LATEST
通过filezilla将其导入linux环境。
解压及安装:Linux下BLAST的安装与使用 · 大专栏
使用:需要先建库
makeblastdb -in 基因组数据库.pep.fa -dbtype prot -parse_seqids
再进行blastp:
blastp -query 目标序列.txt -out 输出文件.pep.fa -db 数据库.pep.fa -outfmt 6 -evalue 1e-100 -num_threads 4
hmmer
hmmer从官网下载最新版:HMMER
通过filezilla上传到linux系统中。
用mv命令将其放置在固定位置,我一般是~/app
gz文件用gunzip解压,tar文件用tar -xf 命令解压
cd hmmer-3.3.2
./configure
make
make check
完成安装
接下来需要修改调用命令,使得在任何地方都能调用hmmer软件。
笔者使用的是集群服务器,没有root权限,因此修改.bash_profile文件
vim .bash_profile
加上刚刚安装的软件路径即可:
PATH=$PATH:HOME/app/hmmer
hmmer的使用
hmmbuild A.hmm genefamily_seed.txt #以某个基因家族的种子文件作为索引,获得hmm文件
hmmsearch --domtblout A.out A.hmm genome_pep.fa #在某个物种中,上一步获取得到的hmm文件为索引,搜寻基因家族成员,以A.out的结果输出
种子文件在pfam中下载
得到的stockholm文件即为种子文件。
最近Pfam合并到interpro中了,那么怎么找我们想要的结构域的种子文件呢?
打开Interpro
点击search–by text,然后输入结构域的pfam号(PF开头的结构域号):
点击curation,就可以下载.hmm文件啦
conda安装更方便也更容易管理,Windows的hmmer很久不更新了我记得,但也可以用conda