eggNOG 5.0数据库介绍(eggnog怎么读音)

网友投稿 2242 2022-08-30


eggNOG 5.0数据库介绍(eggnog怎么读音)

目录

​​1. eggNOG简介​​​​2. eggNOG-Mapper注释原理​​​​3. eggNOG 5.0数据资源​​​​4. eggNOG-Mapper使用​​​​5. NOG、KOG、COG、KEGG、GO区别?​​

1. eggNOG简介

eggNOG数据库全称是:直系同源蛋白分组比对(evolutionary genealogy of genes: Non-supervised Orthologous Groups)数据库,由EMBL创建维护,是对NCBI的COG数据库进行拓展,提供不同分类水平蛋白的直系同源分组(Orthologous Groups,OG),包括真核、原核及病毒的数据信息。它扩展了COG数据库的分类方法,采用无监督聚类算法在全基因组范围内推导基因功能,更适用于谱系特征基因的分析。

2. eggNOG-Mapper注释原理

常规功能注释方法基于序列相似性寻找直系同源基因,常用​​blast+blast2go​​​或​​InterProscan​​​来注释,这种方法可能找到旁系同源基因,而eggNOG能区分旁系和直系同源基因,因此开发出​​eggNOG-mapper​​​来进行功能注释。​​eggNOG v5.0​​​对应的工具是​​eggNOG-mapper v2​​​。 注释的过程可分为图下四个过程:

3. eggNOG 5.0数据资源

其中e5.proteomes.faa为所有的蛋白组序列,e5.viruses.faa为所有的病毒蛋白序列,e5.taxid_info.tsv为Taxid对应的物种名称以及完整的谱系信息,e5.og_annotations.tsv为所有的NOG信息,其第一列为Taxid,第二列为NOG groups,第三列为COG归属,第四列为Function。

4. eggNOG-Mapper使用

在eggnog-mapper使用之前应该准备好:python、hmmer、diamond、fasta、注释数据库。

# 下载软件git clone 下载数据库cd eggnog-mapper ./download_eggnog_data.py euk #euk真核,bact原核,arch古菌,viruses病毒#注释python emapper.py -i test.fa --output ./ -d euk #默认以HMMER搜索python emapper.py -m diamond -i test.fa --output ./ -d euk #指定搜索数据库类型,可大类、小类python emapper.py -i test.fa --output ./ -d maNOG #哺乳动物NOGpython emapper.py -i test.fa --output ./ -d maNOG --usemem --cpu 10 #内存和线程

至于eggNOG注释的结果,包括了一些匹配和得分信息,以及GO,KEGG,BiGG,COG,KOG,NOG等功能注释结果。但不建议用它的GO和KEGG结果,因为这两个数据库是生信领域更新最快的,信息最全,eggNOG注释的结果可能会跟不上。可以采纳下它的COG、KOG、NOG的注释信息,因为COG/KOG几乎没有更新了,还停留在2003-2014年:​​NOG、KOG、COG、KEGG、GO区别?

KEGG(Encyclopedia of Genes and Genomes)和GO(Gene Ontology)耳熟能详就不解释了,至少是目前权威公认的两大数据库。

主要是NOG和KOG、COG有点懵。

相同点:三者都是同源分类数据库,即都是OG(Orthologous Groups)。

不同点:

COG:Clusters ofOrthologousGroups of proteins,即同源蛋白簇,是NCBI的一个数据库。根据生物完整基因组的编码蛋白系统进化关系分类构建而成,每一簇COG由直系同源序列构成,从而可以推测该序列的功能,按功能共可以分为二十六类。KOG:EuKaryoticOrthologousGroups(为什么不叫EOG?问号脸)。广义上COG分为真核和原核生物两类,原核的一般称为COG数据库,真核的一般称为KOG数据库。NOG:Non-supervisedOrthologousGroups,注意是非监督,因COG未及时更新,​​EMBL EggNOG​​对COG进行了完善,极大拓展了基因组信息,主要是基于HMM分析提供更细致的OG分析。

做了eggNOG,还有必要做COG/KOG吗?做不做都可以,主要看心情,看哪个更能解释你的生物学问题。一般来说,差别不会太大,COG虽然过时,但权威性还在呀。

Ref:​​​应该是最好的eggnog-mapper功能注释教程​​​​时隔四年,NOG数据库更新啦!​​​​宏基因组功能注释(以COG为例)​​​​https://biostars.org/p/286615/​​


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:学习Java中的List集合
下一篇:Python文件扩展名有几种?分别代表什么?(python程序文件的扩展名是哪两种)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~