转录组表达分析知识图谱

文章信息

Van den Berge, Koen, Katharina M. Hembach, Charlotte Soneson, Simone Tiberi, Lieven Clement, Michael I. Love, Rob Patro, and Mark D. Robinson. 2019. “RNA Sequencing Data: Hitchhiker’s Guide to Expression Analysis.” Annual Review of Biomedical Data Science 2 (1): 139–73. https://doi.org/10.1146/annurev-biodatasci-072018-021255.

Annual Review 系列杂志的综述应该说是综述界的老大哥。最近在 Annual Review of Biomedical Data Science 发表了「另」一篇 RNA-Seq 相关的重磅综述。之所以说是另一篇,因为同期在 Nature Reviews Genetics 发表过一篇看名字就非常霸气的综述:RNA sequencing: the teenage years 。

船新版本 DESeq2 处理大量样本速度显著提升

太长不看版本

DESeq 最新版本(v1.25.9)针对大样本分析的速度和之前相比有了质的飞越,果子老师的 1215 个 TCGA 样本差异分析时间从 1200 分钟缩短到单线程 20 分钟,使用多线程的情况下最快 6 分钟搞定。

biotools 综合性生物信息工具资源网站

生物信息涉及到的工具方法过于庞杂,很多时候接触到一个新的内容总是不知该去哪里找相关的工具,还有很多时候找到的工具太多又不知道该用哪个。之前写过两篇文章 66 种测序数据分析方法和流程如何快速找到自己需要的 R 包。分别从测序数据类型和 bioconductor 包两个角度介绍如何快速找到自己需要的工具。

今天是这个系列的最后一篇文章,介绍一个综合性生物信息工具资源网站 biotools。以后只要用好这三个工具,就不会害怕生物信息不知道用什么和怎么选工具的问题。

每周文献-190622-ATAC-seq和转录本从头组装新方法

HMMRATAC: a Hidden Markov ModeleR for ATAC-seq

DOI(url): https://doi.org/10.1093/nar/gkz533

杂志:Nucleic Acids Research

发表日期:14 June 2019

关键点

本文利用 ATAC-seq 技术原理中的转座酶插入特性,设计了一种专门针对 ATAC-seq 的隐马尔科夫模型,这种半监督机器学习方法可以用来鉴定染色质开放区域。

每周文献-190606-多篇结构变异和转录组分析方法文章

Alignment and mapping methodology influence transcript abundance estimation

DOI(url): https://doi.org/10.1101/657874

发表日期:June 03, 2019

关键点

不对比对方法对转录本定量的影响有哪些(读完感觉是给 Salmon 最近一次升级写的软文)

参考意义

使用 RNA-seq 数据进行转录本定量的准确性取决于许多因素,比如比对的方法和所采用的定量模型。虽然有不少文章已经讲过定量模型的重要性,但比较各种比对方法对定量准确度的影响并没有那么受关注。作者在这篇文章中研究了比对方法对定量准确性以及对差异基因表达分析的影响。

随时随地跟踪最新热点文献

本文的图表及主要内容均来自 Meta-Research: Tracking the popularity and outcomes of all bioRxiv preprintsRxivist.org: Sorting biology preprints using social media and readership metrics 两篇文献,一篇发表在elife一篇发表在plos biology,如果有兴趣不妨直接阅读原文。

另外,说一句题外话,关于「bioRxiv」如何发音这个事可能每个人都有不一样的读法,在上面的文献中给出了正确的发音方式,「bioRxiv」的发音等同于「Bio Archive」。

一句话读完全文版

只要有网络随时随地用电脑或者手机打开 Rxivist 这个网站就都给你安排明白了。

如何快速找到自己需要的 R 包

Bioconductor 的存在让只用 R 语言完成 (90% 的) 生物信息分析成为了一种可能,也在很大程度上推动了 R 在生物信息领域的应用和发展。目前 Bioconductor 配合 R 3.6 使用升级到了 3.9 版本。一共有 R 包 1741 个。学习生物信息和 R 语言,它是非常好的资源。

平常偶尔会有人问到我这样的问题:我目前正在做某某分析,你知道有什么 R 包可以用么?如果是不熟的人而且他做的分析我也不熟悉,一般我的回答直接就是不知道;如果是好朋友那我就得顺手帮他快速的找到想要的 Bioconductor R 包。看完今天的文章,这个操作对你来说以后也没有什么难度。

几步操作,快准狠,找到自己要想的 Bioconductor 工具。

解决 Stringtie 基因重复定量的意外收获

Bioinformatics was like a box of chocolates. You never konw what you’re gonna get ——阿飞正传

铺垫

由于自己之前一直不喜欢用 cufflinks,所以后面的 stringtie 也是能不用就不用,偶尔用下也都是浅尝辄止。因为 stringtie 可以直接拿到基因的 TPM 值,比 RSEM 需要单独构建一次索引的操作省力些,所以最近自己注释了些基因就用它对十几个样本跑了一波基因定量的常规操作。心想做个表达矩阵进行下游分析,结果偶买噶,每个定量结果的行数(基因数)竟然都不一样。同一个注释文件定量出了不同的结果,检查一下原始基因数,发现有的定量结果行数要比实际基因数多 7 个,有的要多 5 个,还不尽相同。

每周文献-190419-植物单细胞BAM重比对以及假基因研究

A Single-Cell RNA Sequencing Profiles the Developmental Landscape of Arabidopsis Root

DOI(url): https://doi.org/10.1016/j.molp.2019.04.004

发表日期:April 17, 2019

关键点

国内首篇植物相关单细胞文章,两个一作还都很熟。

参考意义

植物单细胞的阶段要开启了,今天提到的这篇文章是国内首篇,也是世界范围内的第四篇植物单细胞文章。除此之外,还有几篇已经在 bioRxiv 上上线了,不过还没有正式发表。这些文章都不约而同选择了植物中研究最广的模式之物拟南芥,而且全部研究的是根尖。后面在发展就要看看其它组织和物种的情况了。

如果一个东西在植物里已经出现要快速增长的趋势,那么它在人和动物里应该也就已经相对比较成熟了。此时,即便暂时还用不到,但是相关的技术和方法就需要留意和学习起来。

每周文献-190411-lncRNA功能exRNA分析以及DNA甲基化

Antisense lncRNA Transcription Mediates DNA Demethylation to Drive Stochastic Protocadherin α Promoter Choice

DOI(url): https://doi.org/10.1016/j.cell.2019.03.008

发表日期:4 April 2019

关键点

反义 lncRNA 转录可以影响 DNA 甲基化,进而改变染色体结构促进增强子与启动子结合,调控基因表达。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×