每周文献-190606-多篇结构变异和转录组分析方法文章

Alignment and mapping methodology influence transcript abundance estimation

DOI(url): https://doi.org/10.1101/657874

发表日期:June 03, 2019

关键点

不对比对方法对转录本定量的影响有哪些(读完感觉是给 Salmon 最近一次升级写的软文)

参考意义

使用 RNA-seq 数据进行转录本定量的准确性取决于许多因素,比如比对的方法和所采用的定量模型。虽然有不少文章已经讲过定量模型的重要性,但比较各种比对方法对定量准确度的影响并没有那么受关注。作者在这篇文章中研究了比对方法对定量准确性以及对差异基因表达分析的影响。

随时随地跟踪最新热点文献

本文的图表及主要内容均来自 Meta-Research: Tracking the popularity and outcomes of all bioRxiv preprintsRxivist.org: Sorting biology preprints using social media and readership metrics 两篇文献,一篇发表在elife一篇发表在plos biology,如果有兴趣不妨直接阅读原文。

另外,说一句题外话,关于「bioRxiv」如何发音这个事可能每个人都有不一样的读法,在上面的文献中给出了正确的发音方式,「bioRxiv」的发音等同于「Bio Archive」。

一句话读完全文版

只要有网络随时随地用电脑或者手机打开 Rxivist 这个网站就都给你安排明白了。

如何快速找到自己需要的 R 包

Bioconductor 的存在让只用 R 语言完成 (90% 的) 生物信息分析成为了一种可能,也在很大程度上推动了 R 在生物信息领域的应用和发展。目前 Bioconductor 配合 R 3.6 使用升级到了 3.9 版本。一共有 R 包 1741 个。学习生物信息和 R 语言,它是非常好的资源。

平常偶尔会有人问到我这样的问题:我目前正在做某某分析,你知道有什么 R 包可以用么?如果是不熟的人而且他做的分析我也不熟悉,一般我的回答直接就是不知道;如果是好朋友那我就得顺手帮他快速的找到想要的 Bioconductor R 包。看完今天的文章,这个操作对你来说以后也没有什么难度。

几步操作,快准狠,找到自己要想的 Bioconductor 工具。

解决 Stringtie 基因重复定量的意外收获

Bioinformatics was like a box of chocolates. You never konw what you’re gonna get ——阿飞正传

铺垫

由于自己之前一直不喜欢用 cufflinks,所以后面的 stringtie 也是能不用就不用,偶尔用下也都是浅尝辄止。因为 stringtie 可以直接拿到基因的 TPM 值,比 RSEM 需要单独构建一次索引的操作省力些,所以最近自己注释了些基因就用它对十几个样本跑了一波基因定量的常规操作。心想做个表达矩阵进行下游分析,结果偶买噶,每个定量结果的行数(基因数)竟然都不一样。同一个注释文件定量出了不同的结果,检查一下原始基因数,发现有的定量结果行数要比实际基因数多 7 个,有的要多 5 个,还不尽相同。

每周文献-190419-植物单细胞BAM重比对以及假基因研究

A Single-Cell RNA Sequencing Profiles the Developmental Landscape of Arabidopsis Root

DOI(url): https://doi.org/10.1016/j.molp.2019.04.004

发表日期:April 17, 2019

关键点

国内首篇植物相关单细胞文章,两个一作还都很熟。

参考意义

植物单细胞的阶段要开启了,今天提到的这篇文章是国内首篇,也是世界范围内的第四篇植物单细胞文章。除此之外,还有几篇已经在 bioRxiv 上上线了,不过还没有正式发表。这些文章都不约而同选择了植物中研究最广的模式之物拟南芥,而且全部研究的是根尖。后面在发展就要看看其它组织和物种的情况了。

如果一个东西在植物里已经出现要快速增长的趋势,那么它在人和动物里应该也就已经相对比较成熟了。此时,即便暂时还用不到,但是相关的技术和方法就需要留意和学习起来。

每周文献-190411-lncRNA功能exRNA分析以及DNA甲基化

Antisense lncRNA Transcription Mediates DNA Demethylation to Drive Stochastic Protocadherin α Promoter Choice

DOI(url): https://doi.org/10.1016/j.cell.2019.03.008

发表日期:4 April 2019

关键点

反义 lncRNA 转录可以影响 DNA 甲基化,进而改变染色体结构促进增强子与启动子结合,调控基因表达。

每周文献-190330-DTU分析及转录组denovo拼接解析等

文献题目 Relative Abundance of Transcripts (RATs): Identifying differential isoform abundance from RNA-seq

DOI(url): https://doi.org/10.12688/f1000research.17916.1

发表日期:24 Feb 2019

关键点

差异表达中比较少见的一种方式

参考意义

在 F1000Research 发表的这篇文章介绍了一个利用 alignment-free RNA-seq quantifications 结果进行差异分析的工具,主要是用来对转录本进行差异定量分析。在日常的分析中我们进行差异分析最常见的是对差异基因进行定量分析,这里没有考虑到每个基因内部转录本的情况。

每周文献-190322-DNA甲基化分析工具及silencers鉴定

文献题目:RnBeads 2.0: comprehensive analysis of DNA methylation data

DOI(url):https://doi.org/10.1186/s13059-019-1664-9

发表日期:14 March 2019

关键点

DNA 甲基化全功能分析 R 包 RnBeads 2.0 更新。

参考意义

DNA 甲基化是一种被广泛研究的表观遗传标记,其在发育和疾病中具有重要作用。最近甲基化分析工具 RnBeads 在 bioconductor 上更新了其 2.0 版本。它可以分析目前诸多种类的甲基化数据,并且可以完成目前甲基化分析相关所有主流内容。
本次升级主要是在输入数据、分析方法、交互界面以及计算效率上进行了提升。软件官方地址为 https://rnbeads.org/index.html 可以进行进一步了解。

学习新工具的思路

有两件事情,第一是前几天看到一个朋友分享了自己 学习生物信息工具的经验,借着这个机会刚好反思了一下自己过去几年是如何做的;第二是最近有人问了我一个问题:“使用 tophat 比对完的转录组数据 bam 文件想用 RNA-SeQC 来质控,但是这个软件好像没人维护了”(竟然还在用 tophat)。那这次就聊聊如何学习一个新的工具。

学会提炼需求

学习新工具有两种途径,一种是按需搜索一种是被动获取。被动获取还好,就是一般最新的杂志发表了什么平台推荐了什么就看什么。如果是按需搜索需要首先明白自己的需求是什么。

举一个最简单的例子,如果你使用一个转录组拼接工具提示内存不够了不能正确运行。这个时候你的需求是什么,很自然会想到去找一款需要消耗内存更少的软件。然后找了另外两个软件,一测试一个效果非常不好另一个压根自己不会安装。卒。

用 bedtools 和 bedops 对 bed 文件进行各种运算

bedtools 的傲人光环

如果让你说出日常在进行生物数据分析时,做的最多的事情是什么,我想不管你是什么方向,「不停地转换格式」应该能排进日常前三。如果再问用的最多的工具是什么,想必一定也是和「不停地转换格式」相关的工具。在这些工具里有几个叫 XXtools 的非常出名,其中 samtools 和 bcftools 我们这次暂且不提,它们都是出自大神 LiHeng 之手。另一个能脱口而出的恐怕就是 bedtools 了,这个工具最初发表在 Bioinformatics 的文章,谷歌学术显示自 2010 年以来已经有了 6600 多次引用。当年这篇文章的第一作者 Quinlan ,如今已经是 UNIVERSITY OF UTAH 很厉害的 PI,它的课题组先后开发了一些列优秀的生物信息工具。当然,他们的故事今天也暂且不提(那位朋友问了,你今天到底要说啥,且看下文)。

6600 多次引用(其实现在很多文章用了它已经不引用了)让 bedtools 在 bed 相关格式文本处理领域一家独大。我经常半开玩笑地说 50% 高通量数据后期分析概括一下都是各种位置之间的纠缠,因为但凡分析有参考基因组的数据就会把所有信息都铆定到参考基因组这个坐标系中(如果没有基因组那就拼一个),这也是为什么 bedtools 从一推出就如此受欢迎。在生物信息这个领域,一个软件是不是会被大量使用,最重要的是它是否真的有用然后再加上一点点出现的时机和运气。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×