很高兴和你相遇
这里正在记录我的所思所学
邮箱 [email protected]
首页 归档 想法 通讯 播客 工具 简历 关于

船新版本 DESeq2 处理大量样本速度显著提升

太长不看版本

DESeq 最新版本(v1.25.9)针对大样本分析的速度和之前相比有了质的飞越,果子老师的 1215 个 TCGA 样本差异分析时间从 1200 分钟缩短到单线程 20 分钟,使用多线程的情况下最快 6 分钟搞定。

biotools 综合性生物信息工具资源网站

生物信息涉及到的工具方法过于庞杂,很多时候接触到一个新的内容总是不知该去哪里找相关的工具,还有很多时候找到的工具太多又不知道该用哪个。之前写过两篇文章 66 种测序数据分析方法和流程如何快速找到自己需要的 R 包。分别从测序数据类型和 bioconductor 包两个角度介绍如何快速找到自己需要的工具。

首届生物信息人才发展论坛背后的故事

第一届生物信息人才发展论坛落幕已经半月有余,算上前前后后的准备周期,在大家眼中一个「小而美」的论坛其实陆陆续续持续了一个多月的时间。

学习新工具的思路

有两件事情,第一是前几天看到一个朋友分享了自己 学习生物信息工具的经验,借着这个机会刚好反思了一下自己过去几年是如何做的;第二是最近有人问了我一个问题:“使用 tophat 比对完的转录组数据 bam 文件想用 RNA-SeQC 来质控,但是这个软件好像没人维护了”(竟然还在用 tophat)。那这次就聊聊如何学习一个新的工具。

用 bedtools 和 bedops 对 bed 文件进行各种运算

bedtools 的傲人光环

如果让你说出日常在进行生物数据分析时,做的最多的事情是什么,我想不管你是什么方向,「不停地转换格式」应该能排进日常前三。如果再问用的最多的工具是什么,想必一定也是和「不停地转换格式」相关的工具。

66 种测序数据分析方法和流程

写在前面:看了标题进来的老铁,这里不可能在一篇文章里写好 66 个 pipeline 给你,实际上我就是给你推荐一个网站。

3D 基因组与生物信息

重要的 Hi-C 相关文献

第一篇 Hi-C 文章: Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome; DOI: 10.1126/science.1181369

贯穿你我一生的基因之谜

无处不在的基因

选一个心情不错的时间,打开手中叫做「唾液采集器」的小管子吐进一些唾液,再把它寄给一家公司。几天后你就会收到一份复杂而详细的报告,这份报告里将记录你和上百项健康风险、几十项遗传性疾病是否有关,甚至还会帮你寻根溯源,告诉你有多少少数民族或东南亚的祖先。

链特异性测序那点事

2021 年 12 月更新,距离写这篇文章已经过去 5 年了,但是今天发现这篇文章还会有人看。感慨一下。以及如果你只是想通过比对后的 bam 文件判断一下链特异性建库与否,这个文章太长了,直接去用RSeQC这个软件的 infer_experiment.py命令跑一下就好。祝好~

本文最早写于 2017 年,时间略显久远,各位选择性吸收

转录调控与生物信息

cis-regulatory motifs

转录调控