biotools 综合性生物信息工具资源网站

biotools 综合性生物信息工具资源网站

5 min read

生物信息涉及到的工具方法过于庞杂,很多时候接触到一个新的内容总是不知该去哪里找相关的工具,还有很多时候找到的工具太多又不知道该用哪个。之前写过两篇文章 66 种测序数据分析方法和流程如何快速找到自己需要的 R 包。分别从测序数据类型和 bioconductor 包两个角度介绍如何快速找到自己需要的工具。

今天是这个系列的最后一篇文章,介绍一个综合性生物信息工具资源网站 biotools。以后只要用好这三个工具,就不会害怕生物信息不知道用什么和怎么选工具的问题。

其实说到这类整合网站,很多人都知道 omictools, 不过它很早之前就已更名为 omicX 并转向商用,每天点上六七次网页之后就会提示付费且价格不菲。现在,有一个同样好用还免费的网站来替代它——biotools。

Genome Biology 近日上线的一篇题为 The bio.tools registry of software tools and data resources for the life sciences 的文章,介绍的就是这个网站。

网站特点

biotools 背后团队来源于欧洲的一个政府间组织 the European Infrastructure for Biological Information(ELXIR), 这个组织主要的工作就是希望能够协调整合以及维护所有组织成员国内的生物信息学数据和各种资源,而这个网站主要是有丹麦提供资金和领导。因为是非盈利组织,所以无需付费使用。

从网站的介绍来看,主要有如下几个主要特点:

简单使用

biotools 的使用非常简单。网站首页提供了一些比较受欢迎的词条目录,方便直接访问。以 Nucleic acids 为例,目录如下 。包括和「核酸」相关的序列比对、甲基化分析、变异检测以及转录因子结合预测等。

每一个词条都可以点击,点击后就会进入对应的搜索界面。如下图所示。

首先,可以在右上角选择展示方式,个人比较推荐「详细」模式,看到关于搜索结果更详细的描述信息。

在这个搜索页面中可以按照不同标准(默认是评分)进行排序,包括更新日期、添加日期,发表时间和引用次数等。无论是想要用新的还是想用被使用多的,都可以满足。此外,还可以在搜索栏中继续进行二次搜索,支持联想,会自动提示可能想要搜索的词条。

如果你找到感兴趣的工具,点击工具名字即可进入详情页。这里以 BWA 举例,如下所示。

第一部分是工具的属性标签,包括这个工具的开发成熟度,协议、工具类型、开发语言和操作系统等。右边是工具的受欢迎程度,例如引用次数信息。

第二部分是工具相关的分析流程,其中每一步骤显示的都是语义标签,可以点击进行二次搜索。例如 BWA 的输入数据是 fasta 或者 fastq 文件,可以进行索引比对,输出内容是 sam 文件。如果点击 fastq,就会看到所有输入数据支持 fastq 的工具。


第三部分内容则是工具对应的开发者联系方式,文档地址和工具下载地址;第四部分是工具相关文献的链接和文献引用情况。

工具有了然后呢

如文章开头所说,如果我们能从测序数据类型和 bioconductor 包和综合性工具这三个层面进行查找,总可以找到一些(或许)适合自己的工具,但是找的到可不意味着用的对和用的好。就像听过很多道理,依然过不好这一生,我们听过很多工具,可能依然解决不了手上的问题。而且对于做生物信息的人来说,搜到一大把的工具不见得是好事。

文末,祝你上得了厅堂,下得了厨房,找得了工具,发的了文章。


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

扫码即刻沟通

前一篇

如何使用语雀快速发表自己的博客

后一篇

听说你也有 emojifont 的字体使用困惑