很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 通讯 播客 工具 简历 关于

biotools 综合性生物信息工具资源网站

生物信息涉及到的工具方法过于庞杂,很多时候接触到一个新的内容总是不知该去哪里找相关的工具,还有很多时候找到的工具太多又不知道该用哪个。之前写过两篇文章 66 种测序数据分析方法和流程如何快速找到自己需要的 R 包。分别从测序数据类型和 bioconductor 包两个角度介绍如何快速找到自己需要的工具。

今天是这个系列的最后一篇文章,介绍一个综合性生物信息工具资源网站 biotools。以后只要用好这三个工具,就不会害怕生物信息不知道用什么和怎么选工具的问题。

其实说到这类整合网站,很多人都知道 omictools, 不过它很早之前就已更名为 omicX 并转向商用,每天点上六七次网页之后就会提示付费且价格不菲。现在,有一个同样好用还免费的网站来替代它——biotools。

Genome Biology 近日上线的一篇题为 The bio.tools registry of software tools and data resources for the life sciences 的文章,介绍的就是这个网站。

网站特点

biotools 背后团队来源于欧洲的一个政府间组织 the European Infrastructure for Biological Information(ELXIR), 这个组织主要的工作就是希望能够协调整合以及维护所有组织成员国内的生物信息学数据和各种资源,而这个网站主要是有丹麦提供资金和领导。因为是非盈利组织,所以无需付费使用。

从网站的介绍来看,主要有如下几个主要特点:

  • 所有的数据公开:可以用这写数据集进行符合开源协议的二次开发
  • 所有网站的源代码开源:可以去 GitHub 上提交 issue 并了解最新动态
  • 所有人都可参与:注册后可以按照规定格式自行提交尚未收录的工具
  • 工具唯一标识:所有资源分配有唯一 ID,方便和其他工具整合以及交叉使用
  • 资源描述有严格标准:涉及到的主题操作数据以及格式等描述都有明确的标准
  • 有 Web API:可以使用官方提供的 API 进行各方便的访问和查询

简单使用

biotools 的使用非常简单。网站首页提供了一些比较受欢迎的词条目录,方便直接访问。以 Nucleic acids 为例,目录如下 。包括和「核酸」相关的序列比对、甲基化分析、变异检测以及转录因子结合预测等。

每一个词条都可以点击,点击后就会进入对应的搜索界面。如下图所示。

首先,可以在右上角选择展示方式,个人比较推荐「详细」模式,看到关于搜索结果更详细的描述信息。

在这个搜索页面中可以按照不同标准(默认是评分)进行排序,包括更新日期、添加日期,发表时间和引用次数等。无论是想要用新的还是想用被使用多的,都可以满足。此外,还可以在搜索栏中继续进行二次搜索,支持联想,会自动提示可能想要搜索的词条。

如果你找到感兴趣的工具,点击工具名字即可进入详情页。这里以 BWA 举例,如下所示。

第一部分是工具的属性标签,包括这个工具的开发成熟度,协议、工具类型、开发语言和操作系统等。右边是工具的受欢迎程度,例如引用次数信息。

第二部分是工具相关的分析流程,其中每一步骤显示的都是语义标签,可以点击进行二次搜索。例如 BWA 的输入数据是 fasta 或者 fastq 文件,可以进行索引比对,输出内容是 sam 文件。如果点击 fastq,就会看到所有输入数据支持 fastq 的工具。


第三部分内容则是工具对应的开发者联系方式,文档地址和工具下载地址;第四部分是工具相关文献的链接和文献引用情况。

工具有了然后呢

如文章开头所说,如果我们能从测序数据类型和 bioconductor 包和综合性工具这三个层面进行查找,总可以找到一些(或许)适合自己的工具,但是找的到可不意味着用的对和用的好。就像听过很多道理,依然过不好这一生,我们听过很多工具,可能依然解决不了手上的问题。而且对于做生物信息的人来说,搜到一大把的工具不见得是好事。

文末,祝你上得了厅堂,下得了厨房,找得了工具,发的了文章。


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

如果你对这篇文章感兴趣,欢迎通过邮箱或者微信订阅我的 「熊言熊语」会员通讯,我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想点此链接即可进行免费订阅。


· 分享链接 https://kaopubear.top/blog/2019-08-15-biotools-web/