很高兴和你相遇
这里正在记录我的所思所学
首页 标签 归档 播客 关于

靠谱熊的每周分享 第1期

刊首语

在「素材学习分享小组」进行的第二个年头,为了让它能再向前走一小步,我们决定以电子杂志的形式发布「素材学习分享周刊」。

每期都会有一位小组成员作为轮值编辑为大家奉献一期内容,同时也作为小组成员的阶段性考核。**我们会提前一周提醒轮值编辑,如果断更则基本会取消下一阶段小组成员资格。**每位轮值编辑对自己当期的内容持有版权,可以决定除小组分享外是否公开分享,亦可发布在自己的博客或者公众号等个人平台。

当然,如果不是轮值编辑仍然可以记录自己的分享内容,只需要在题目最后增加你的个人 ID 即可。除了清退机制,我们也在思考如何引入奖励机制或成就值。分享的内容越多,在小组的成就值也就越高。

周刊的分享和发布形式都受到了阮一峰「科技爱好者周刊」的启发,在此表示感谢和敬意。

在以后的每期内容中,轮值编辑都会向大家推荐自己的心头好,其中包括但不限于和专业相关的科研文献、近期读到的书籍文章、值得学习的资料素材、自己喜欢的电影音乐和好用的应用工具等等。

希望这些内容可以记录彼此的成长,留住易逝的时光。

思考问题的熊
2020 年 2 月 28 日

专业文献

Regulation of Rice Tillering by RNA-directed DNA Methylation at Miniature Inverted-repeat Transposable Elements

Molecular Plant 2020 February 19

Tillering is a major determinant of rice plant architecture and grain yield. Here we report that depletion of rice OsNRPD1a and OsNRPD1b, two orthologues of the largest subunit of RNA polymerase IV, leads to a high-tillering phenotype, in addition to dwarfism and smaller panicles. OsNRPD1a and OsNRPD1b are required for the production of **24-nt siRNAs **that direct DNA methylation at transposable elements (TEs) including Miniature Inverted-repeat TEs (MITEs). Interestingly, many genes are regulated either positively or negatively by TE methylation. Among them, OsMIR156d and OsMIR156j, which promote rice tillering, are repressed by CHH methylation at two MITEs in the promoters. By contrast, D14, which suppresses rice tillering, is activated by CHH methylation at a MITE in its downstream. Our findings reveal control of rice tillering by RdDM at MITEs and provide potential targets for agronomic trait enhancement by epigenome editing.

水稻分蘖是水稻结构和产量的主要决定因素。这篇文章揭示了 RNA 介导的 DNA 甲基化(RdDM)在 MITE 这个类型的转座子上可以分别正向和负向调节 D14 和 OsMIR156 家族成员,从而促进水稻分蘖的调节。

Robustness and applicability of transcription factor and pathway analysis tools on single-cell RNA-seq data

Genome Biology 2020 February 12, 21 (1): 36

BACKGROUND: Many functional analysis tools have been developed to extract functional and mechanistic insight from bulk transcriptome data. With the advent of single-cell RNA sequencing (scRNA-seq), it is in principle possible to do such an analysis for single cells. However, scRNA-seq data has characteristics such as drop-out events and low library sizes. It is thus not clear if functional TF and pathway analysis tools established for bulk sequencing can be applied to scRNA-seq in a meaningful way.
RESULTS: To address this question, we perform benchmark studies on simulated and real scRNA-seq data. We include the bulk-RNA tools PROGENy, GO enrichment, and DoRothEA that estimate pathway and transcription factor (TF) activities, respectively, and compare them against the tools SCENIC/AUCell and metaVIPER, designed for scRNA-seq. For the in silico study, we simulate single cells from TF/pathway perturbation bulk RNA-seq experiments. We complement the simulated data with real scRNA-seq data upon CRISPR-mediated knock-out. Our benchmarks on simulated and real data reveal comparable performance to the original bulk data. Additionally, we show that the TF and pathway activities preserve cell type-specific variability by analyzing a mixture sample sequenced with 13 scRNA-seq protocols. We also provide the benchmark data for further use by the community.**

转录因子和通路分析工具对于单细胞数据是不是数据,以及有哪些影响,应该怎么用,这篇文章给出了一些介绍。这篇文章也提到了一些我们这方面可以借鉴的工具。

MUM&Co: Accurate detection of all SV types through whole genome alignment

Bioinformatics 2020 February 25

SUMMARY: MUM&Co is a single bash script to detect Structural Variations (SVs) utilizing Whole Genome Alignment (WGA). Using MUMmer's nucmer alignment, MUM&Co can detect insertions, deletions, tandem duplications, inversions and translocations greater than 50bp. Its versatility depends upon the WGA and therefore benefits from contiguous de-novo assemblies generated by 3rd generation sequencing technologies. Benchmarked against 5 WGA SV-calling tools, MUM&Co outperforms all tools on simulated SVs in yeast, plant and human genomes and performs similarly in two real human datasets. Additionally, MUM&Co is particularly unique in its ability to find inversions in both simulated and real datasets. Lastly, MUM&Co's primary output is an intuitive tabulated file containing a list of SVs with only necessary genomic details.
AVAILABILITY: https://github.com/SAMtoBAM/MUMandCo

借助  MUMmer 写的一个一千多行的 shell 脚本,用来分析各种 SV,测试了不同物种的分析效果,发到了 bioinformatics。

Small RNAs in the Transgenerational Inheritance of Epigenetic Information

Published:January 14, 2020

  • DOI:https://doi.org/10.1016/j.tig.2019.12.001

In recent years it has become evident that RNA interference-related mechanisms can mediate the deposition and transgenerational inheritance of specific chromatin modifications in a truly epigenetic fashion. Rapid progress has been made in identifying the RNAi effector proteins and how they work together to confer long-lasting epigenetic responses, and initial studies hint at potential physiological relevance of such regulation. In this review, we highlight mechanistic studies in model organisms that advance our understanding of how small RNAs trigger long-lasting epigenetic changes in gene expression and we discuss observations that lend support for the idea that small RNAs might participate in mechanisms that trigger epigenetic gene expression changes in response to environmental cues and the effects these could have on population adaptation.

这篇综述介绍了 smRNA 和表观的关系,推荐大家了解一下。

数据库

*Genome Research *最近发表了一篇 Resource 文章,FANTOM 利用他们已有的数据对人的 lncRNA 数据进行了一次新的综合定量分析。
长链非编码 RNA (lncRNAs) 已经成为生物和细胞过程的关键调控子,在细胞和组织中表征 lncRNA 的表达是理解它们作用的关键。研究者们推出的 FC-R2 是一个转录组相关的综合表达图谱,包括了超过 109,000 个编码和非编码基因。
该图谱极大地扩展了已有的基因注释。我们通过从已发表的大型研究中复制关键发现,并通过在正常和患病的人类样本中产生新的结果,证明了 FC-R2 图谱的实用性。
该图谱有如下几个特点:

  • 确定不同类型编码和非编码基因的组织特异性转录谱
  • 在 13 种癌症类型中进行差异表达分析, 识别潜在参与肿瘤发病和进展的新的非编码基因
  • 确认癌症中几种增强子 lncRNAs 表达的预后价值

相关资料

好书好文

如何学会所有编程语言

应该从哪些方面学习一门编程语言
英文原文:This is How You Can Learn All Programming Languages, Yes - “all”
中文译文:如何学会所有的编程语言?

一个普通 985 研究生的求职全纪录

我也不是很差劲吧,985 研究生,成绩前 5%,发过论文,拿过国奖,怎么找工作就比不上别人?
https://mp.weixin.qq.com/s/ITOV7cHB-KkEYceWYAw_RA

梁文道、周轶君:为什么“假新闻”总是跑得更快?

弹指之间就能获得大量讯息的今天,自然也伴随着漫天飞的截图、谣言、推测、和评论。这时,真相真的离我们更近了吗?我们该如何获得真相?新闻、媒体、平台与我们的关系又有了哪些改变?
https://mp.weixin.qq.com/s/h-rkTyJ12Kn4olVYhegUSQ

学习素材

如何使用 R 制作 PPT

前天收到了教育中心负责老师的微信,她说我之前作为助教带的一些学生这两年也陆续在当助教,这一届的助教有人推荐了我当时上第一节课的时候使用的 PPT,问我能不能贡献出来给他们参考一下。这就想起了当时用 R 做 PPT 的经历。这几天又看到了一个不错的介绍

地址  https://arm.rbind.io/slides/xaringan.html

影音推荐

北京时间 2 月 25 日凌晨,科比-布莱恩特追思会“生命的礼赞”在斯台普斯中心举行。科比遗孀瓦妮莎首次公开亮相,发表了感人至深的演讲,纪念科比以及两人的女儿吉安娜。迈克尔-乔丹全程流泪演讲,沙奎尔-奥尼尔等也都演讲致敬、怀念科比。
这次推荐两个视频,一个是乔丹此次的演讲,一个是 Jimmy Kimmel 特别节目追忆科比,科比曾经 15 次录制过这个节目。

乔丹回忆科比

Jimmy Kimmel 特别节目追忆科比

工具

文章配图插画制作 itg digital

关于文章配图,推荐过几个比较不错的插画网站,这次推荐的工具支持对不同的元素进行自定义的组合。可以根据自己的需求更改元素、样式和颜色。jpg 格式内容的下载免费。

地址  https://app.itg.digital/

给我印象很深的是他的加载动画,是一只小狗向前走,然后越走自己的身体越长,如果你的网速不理想就可以看到一只加长小狗~

讨论

本周我遇到了两个比较有趣的问题,一并记录下来和大家分享。

富集分析用哪些基因

第一个问题是

转录组分析中,常常把上调表达基因和下调表达基因分别进行 GO 分析和 Pathway 富集分析,为什么不是放在一起进行 GO 和 Pathway 分析呢?上调下调的不同基因可能是同一种功能或者同一个通路的,整体分析不是能更全面的找出真正差异的功能或者通路了吗

我的回答:

这个问题很有意思,首先要不要把差异基因上调和下调分别进行 GO 和 Pathway 分析本身是没有定论的,上调下调不同基因当然可能是同一种功能或者同一个通路的。如果 KEGG 的一个通路里本身有抑制性的基因也有促进性的基因,那么使用所有表达差异基因去分析就是合理的。

但是 2013 年曾经有一篇文章专门研究了这个问题,他们使用了 5 种肿瘤的芯片和转录组数据集进行了分析,研究的结果是具有相关功能的基因在表达水平上往往是正相关的,这也就导致特定通路上某一类基因的比例是失衡的,不恰当的具体例子可以理解为一个通路上 100 个基因,可能有 80 个都是在一种处理中上调表达,而只有 20 个是下调表达的。

Hong G, Zhang W, Li H, Shen X, Guo Z. Separate enrichment analysis of pathways for up- and downregulated genes. J R Soc Interface. 2013;11(92):20130950. Published 2013 Dec 18. doi:10.1098/rsif.2013.0950

这种不平衡导致如果使用全部差异基因进行富集分析的统计学检验时会显著降低统计检验效力,在他们检测的 5 种肿瘤数据中,对上调和下调的基因进行单独分析可以确定与表型差异真正相关的更多通路。

这里就出现了一个富集分析的缺点,所谓上调基因和下调基因是不同处理下的相对表达量而言的,但是仅凭 KEGG 里的「富集」就把上调理解为对通路的激活,把下调理解为对通路的抑制是不合适的。

此外,富集分析通常用的都是 Fisher 精确检验或超几何检验来验证相关基因在背景中的比例是不是足够多,这里怎么定义上下调的倍数本身也存在很多争议,也就是为什么要引入某种程度上更有意义的 GSEA 分析。

当然,之前也有过一些其它的分析思路,但是都是发了文章没有人用。

Warden C D, Kanaya N, Chen S, et al. BD-Func: a streamlined algorithm for predicting activation and inhibition of pathways[J]. PeerJ, 2013, 1: e159.

Malathi S.I Dona, Luke A Prendergast, Suresh Mathivanan, Shivakumar Keerthikumar, Agus Salim, Powerful differential expression analysis incorporating network topology for next-generation sequencing data, Bioinformatics, Volume 33, Issue 10, 15 May 2017, Pages 1505–1513, https://doi.org/10.1093/bioinformatics/btw833

RNA 和蛋白质的关系

有没可能 mrna 没有高表达,但是蛋白高表达。即使发生了也没法解释吧?

我的回答

mRNA 和对应蛋白质的关系比较复杂,比如转录后修饰和 miRNA 起作用等等,这个推荐一篇研究二者关系的文献,16 年发表在 cell 上

Liu Y, Beyer A, Aebersold R. On the Dependency of Cellular Protein Levels on mRNA Abundance. Cell. 2016;165(3):535–550. doi:10.1016/j.cell.2016.03.014

订阅

该周刊每周六发布,暂时作为「素材分享学习小组」内部资料,我们会挑选部分内容进行公开分享。
完成前期测试运行后将择期通过博客和公众号等形式同步更新,届时将发布具体的订阅形式。

交流

如果你想要加入「素材分享学习小组」可以参考申请说明,如果想和我们交流,欢迎在评论区留言,我们下周见!


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

扫码即刻沟通

· 分享链接 https://kaopubear.top/blog/2020-02-28-weeklyshare1/