很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 通讯 播客 工具 简历 关于

每周文献-181208-DNA 甲基化和几个工具

文献信息

标题: A DNA methylation reader complex that enhances gene transcription

DOI(url): 10.1126/science.aar7854

发表日期: 07 Dec 2018

关键词: DNA methylation; reader complex; SUVH1 and SUVH3; activate

文献概述

emmm , 挺长时间没有植物甲基化的文章发表在 science 上了,文章的通讯作者是美国科学院院士。

DNA 甲基化(DNA methylation)是最早发现的表观修饰遗传标记。DNA 甲基化在调控基因表达、维持染色质结构、基因印记以及胚胎发育等生物学过程中发挥着重大的作用。在真核生物中,DNA 甲基化通常标记转座元件。在植物中,RNA 介导的 DNA 甲基化(RNA-directed DNA methylation, RdDM)是一种重要的甲基化途径,植物中有三种甲基化形式 CG、CHG、CHH。CG 由 DNA 甲基化转移酶 MET1 维持,在植物中 DNMT1 的同源蛋白;植物特异的 CMT3 结合 H3k9me2 促进 CHG 甲基化;CHH 由 DRM2 及 CMT2 维持。转座子的插入可以对邻近的基因在转录水平产生影响,启动子的甲基化通常来说会抑制这些基因的表达,但也存在 DNA 甲基化促进基因表达的例外情况。

文章鉴定了拟南芥中的蛋白质复合物 SUVH1 和 SUVH3,其通过 DNA 甲基化被募集到染色质中,SUVH 蛋白与甲基化 DNA 结合并募集 DNAJ 蛋白以增强近端基因表达。SUVH1 和 SUVH3 在体外结合甲基化 DNA,与体内常染色质甲基化有关,并与含有两个含 DNAJ 结构域的同源物 DNAJ1 和 DNAJ2 形成复合物。 DNAJ1 的异位募集增强了植物,酵母和哺乳动物的基因转录。 因此,SUVH 蛋白结合甲基化 DNA 并募集 DNAJ 蛋白以增强近端基因表达,从而抵消转座子插入基因附近的抑制作用。通过平衡抑制和激活转录效应,DNA 甲基化可以起到微调基因表达的作用。

笔记

在拟南芥中分离出与 DNA 甲基化结合的蛋白质

首先挑选了 10 个和不同种类甲基化位点结合紧密的蛋白。其中 SUVH1 SUVH3 以及 DNAJ 蛋白的研究较少。

SUVH1 由 RdDM 相关的 mCHH 募集

ChIP-seq 数据显示,SUVH1 和 SUVH3 在基因组上的定位基本相同。且这两个蛋白的位置与通过 RdDM 途径相关的 CHH 甲基化共定位。从下图中的 drm1/2 突变体可以观察到。同时 SUVH1 也富集在 NRPE1 (RNA polymerase V 的最大亚基) 的 peak 区域,且在短 TE 和长 TE 的边缘处显示出更强的富集,这些位置也是 RdDM 定位的标志。使用随机森林回归 (random forest regression) 发现 mCHH 是体内 SUVH1 结合的最强预测因子。同时在 RdDM 相关的突变体中 SUVH1 的富集基本消失。

SUVH1,SUVH3,DNAJ1 和 DNAJ2 相互作用、共定位且是临近基因表达必需的

通过 IP 实验和 ChiP-seq 发现这四个蛋白可以相互作用和共定位,而且突变体中,离他们越近的基因表达受影响越明显。表明 DNAJ1 和 DNAJ2 与 SUVH1 和 SUVH3 相互作用,被募集到 RdDM 的位点,并促进近端基因的表达。然后使用 DNAJ1 的过表达突变体发现上调的基因和 DNAJ1 的结合位点有显著的富集。

方法

文章正文比较短,图也很紧凑,但是附件有很多的数据和结果,一共有 55 页。从方法部分来看,能做的高通量分析基本都做了。比如质谱,ChIP-seq, ATAC-seq,Whole Genome Bisulfite Sequencing (WGBS) 和 RNAseq。

不出意外的是,RNA-seq 的 mapping 还是用的 TopHat2,差异表达用的还是 DEseq 第一版,WGBS 用的是 BSMAP。因为不同重复中甲基化差距不同,在下游分析中作者将重复合并在一起进行后续分析。画热图用的包是 ComplexHeatmap。ATAC-seq mapping 用的是 bowtie , ChIP-seq 用 bowtie2, call peak 使用 MACS 而不是第二版。可视化的几个图用了 NGS.plot DeepTools 这两个包。

对 SUVH1 的结合位点进行预测使用了随机森林回归算法。相关方法来自于 https://www.nature.com/articles/ncomms11025 这篇文章。

相关文献

https://www.nature.com/articles/s41556-018-0089-0
https://www.nature.com/articles/nature12931
https://www.ncbi.nlm.nih.gov/pubmed/27903897?dopt=Abstract
https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1005998
https://www.nature.com/articles/nsmb.2354

其它几篇方法文章

植物 miRNA 分析流程

文献题目:miRDeep-P2: accurate and fast analysis of the microRNA transcriptome in plants

DOI(url): https://doi.org/10.1093/bioinformatics/bty972

发表日期: 2018 Dec 6

关键点

Two major challenges to identify microRNAs (miRNAs) in plants

  • how to minimize the false-positive inheritable to computational predictions;
  • how to minimize the computational time required for analyzing the miRNA transcriptome in plants with complex and large genomes.

miRDP2: Based on ultra-deep sampling of small RNA libraries by next generation sequencing, miRDP2 is able to identify miRNA genes in plant species, even for those without detailed annotation, with extremely high speed and reliable performance.

http://sourceforge.net/projects/mirdp2/.

参考意义

流程有待测试,作者来自北京农科院。我对这个地方的印象就是虽然在北京,但是感觉已经快到我老家了。

BAM 文件过滤信息统计及注释工具

文献题目: Alfred: Interactive multi-sample BAM alignment statistics, feature counting and feature annotation for long- and short-read sequencing

DOI(url): 10.1093/bioinformatics/bty1007

发表日期: 2018 Dec 6

关键点

主要功能:Alfred uses subcommands for quality control (qc), feature counting (count_dna, count_rna, count_jct), feature annotation (annotate, tracks), alignment (pwalign, consensus) and haplotype-resolved analysis (split, ase).

网址:https://gear.embl.de/docs/alfred/

参考意义

看起来功能挺多,与 samtools 相比更注重一些下游的分析。

CNV 预测工具

文献题目: CODEX2: full-spectrum copy number variation detection by high-throughput DNA sequencing.

DOI(url): 10.1186/s13059-018-1578-y

发表日期: 2018 Nov 26

关键点

CODEX2, as a statistical framework for full-spectrum CNV profiling that is sensitive for variants with both common and rare population frequencies and that is applicable to study designs with and without negative control samples.

We demonstrate and evaluate CODEX2 on whole-exome and targeted sequencing data, where biases are the most prominent.

CODEX2 outperforms existing methods and, in particular, significantly improves sensitivity for common CNVs.

https://github.com/yuchaojiang/CODEX2


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

如果你对这篇文章感兴趣,欢迎通过邮箱或者微信订阅我的 「熊言熊语」会员通讯,我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想点此链接即可进行免费订阅。


· 分享链接 https://kaopubear.top/blog/2018-12-08-weeklypaper/