刊首语
本周把自己一年多没更新的个人公众号(思考问题的熊)更新了一次,结果很快就有了五十多条留言。
很多人都在反馈自己过去三四年发生和经历的事情,很神奇的感受,看似没有交集但是却也没有断了联系。
本周把自己一年多没更新的个人公众号(思考问题的熊)更新了一次,结果很快就有了五十多条留言。
很多人都在反馈自己过去三四年发生和经历的事情,很神奇的感受,看似没有交集但是却也没有断了联系。
是的,你可能会好奇什么是学习素材共享小组,以及 1.0 版本去哪里了。
Van den Berge, Koen, Katharina M. Hembach, Charlotte Soneson, Simone Tiberi, Lieven Clement, Michael I. Love, Rob Patro, and Mark D. Robinson. 2019. “RNA Sequencing Data: Hitchhiker’s Guide to Expression Analysis.” Annual Review of Biomedical Data Science 2 (1): 139–73. https://doi.org/10.1146/annurev-biodatasci-072018-021255.
DESeq 最新版本(v1.25.9)针对大样本分析的速度和之前相比有了质的飞越,果子老师的 1215 个 TCGA 样本差异分析时间从 1200 分钟缩短到单线程 20 分钟,使用多线程的情况下最快 6 分钟搞定。
生物信息涉及到的工具方法过于庞杂,很多时候接触到一个新的内容总是不知该去哪里找相关的工具,还有很多时候找到的工具太多又不知道该用哪个。之前写过两篇文章 66 种测序数据分析方法和流程 和 如何快速找到自己需要的 R 包。分别从测序数据类型和 bioconductor 包两个角度介绍如何快速找到自己需要的工具。
第一届生物信息人才发展论坛落幕已经半月有余,算上前前后后的准备周期,在大家眼中一个「小而美」的论坛其实陆陆续续持续了一个多月的时间。
有两件事情,第一是前几天看到一个朋友分享了自己 学习生物信息工具的经验,借着这个机会刚好反思了一下自己过去几年是如何做的;第二是最近有人问了我一个问题:“使用 tophat 比对完的转录组数据 bam 文件想用 RNA-SeQC 来质控,但是这个软件好像没人维护了”(竟然还在用 tophat)。那这次就聊聊如何学习一个新的工具。
如果让你说出日常在进行生物数据分析时,做的最多的事情是什么,我想不管你是什么方向,「不停地转换格式」应该能排进日常前三。如果再问用的最多的工具是什么,想必一定也是和「不停地转换格式」相关的工具。
写在前面:看了标题进来的老铁,这里不可能在一篇文章里写好 66 个 pipeline 给你,实际上我就是给你推荐一个网站。
第一篇 Hi-C 文章: Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome; DOI: 10.1126/science.1181369