每周文献-181208-DNA甲基化和几个工具

每周文献-181208-DNA甲基化和几个工具

文献信息

标题: A DNA methylation reader complex that enhances gene transcription

DOI(url): 10.1126/science.aar7854

发表日期: 07 Dec 2018

关键词: DNA methylation; reader complex; SUVH1 and SUVH3; activate

文献概述

emmm , 挺长时间没有植物甲基化的文章发表在 science 上了,文章的通讯作者是美国科学院院士。

DNA 甲基化(DNA methylation)是最早发现的表观修饰遗传标记。DNA 甲基化在调控基因表达、维持染色质结构、基因印记以及胚胎发育等生物学过程中发挥着重大的作用。在真核生物中,DNA 甲基化通常标记转座元件。在植物中,RNA 介导的 DNA 甲基化(RNA-directed DNA methylation, RdDM)是一种重要的甲基化途径,植物中有三种甲基化形式CG、CHG、CHH。CG 由DNA甲基化转移酶 MET1 维持,在植物中 DNMT1 的同源蛋白;植物特异的 CMT3 结合 H3k9me2 促进 CHG 甲基化;CHH 由DRM2 及 CMT2 维持。转座子的插入可以对邻近的基因在转录水平产生影响,启动子的甲基化通常来说会抑制这些基因的表达,但也存在DNA甲基化促进基因表达的例外情况。

文章鉴定了拟南芥中的蛋白质复合物 SUVH1 和 SUVH3,其通过 DNA 甲基化被募集到染色质中,SUVH蛋白与甲基化DNA结合并募集 DNAJ 蛋白以增强近端基因表达。SUVH1 和 SUVH3 在体外结合甲基化 DNA,与体内常染色质甲基化有关,并与含有两个含DNAJ结构域的同源物DNAJ1和DNAJ2形成复合物。 DNAJ1 的异位募集增强了植物,酵母和哺乳动物的基因转录。 因此,SUVH 蛋白结合甲基化 DNA 并募集 DNAJ 蛋白以增强近端基因表达,从而抵消转座子插入基因附近的抑制作用。通过平衡抑制和激活转录效应,DNA甲基化可以起到微调基因表达的作用。

笔记

在拟南芥中分离出与 DNA 甲基化结合的蛋白质

首先挑选了10个和不同种类甲基化位点结合紧密的蛋白。其中 SUVH1 SUVH3 以及 DNAJ 蛋白的研究较少。

SUVH1由RdDM相关的mCHH募集

ChIP-seq 数据显示,SUVH1 和 SUVH3 在基因组上的定位基本相同。且这两个蛋白的位置与通过RdDM途径相关的 CHH 甲基化共定位。从下图中的drm1/2 突变体可以观察到。同时SUVH1 也富集在NRPE1 (RNA polymerase V 的最大亚基) 的peak 区域,且在短TE和长TE的边缘处显示出更强的富集,这些位置也是RdDM 定位的标志。使用随机森林回归 (random forest regression) 发现mCHH是体内 SUVH1 结合的最强预测因子。同时在RdDM 相关的突变体中 SUVH1 的富集基本消失。

SUVH1,SUVH3,DNAJ1和DNAJ2相互作用、共定位且是临近基因表达必需的

通过IP 实验和ChiP-seq 发现这四个蛋白可以相互作用和共定位,而且突变体中,离他们越近的基因表达受影响越明显。表明 DNAJ1 和 DNAJ2 与 SUVH1 和 SUVH3 相互作用,被募集到RdDM的位点,并促进近端基因的表达。然后使用DNAJ1 的过表达突变体发现上调的基因和DNAJ1的结合位点有显著的富集。

方法

文章正文比较短,图也很紧凑,但是附件有很多的数据和结果,一共有55页。从方法部分来看,能做的高通量分析基本都做了。比如质谱,ChIP-seq, ATAC-seq,Whole Genome Bisulfite Sequencing (WGBS) 和 RNAseq。

不出意外的是,RNA-seq 的mapping 还是用的TopHat2,差异表达用的还是DEseq 第一版, WGBS 用的是 BSMAP。因为不同重复中甲基化差距不同,在下游分析中作者将重复合并在一起进行后续分析。画热图用的包是 ComplexHeatmap。ATAC-seq mapping 用的是bowtie , ChIP-seq 用 bowtie2, call peak 使用 MACS 而不是第二版。可视化的几个图用了 NGS.plot DeepTools 这两个包。

对 SUVH1 的结合位点进行预测使用了随机森林回归算法。相关方法来自于 https://www.nature.com/articles/ncomms11025 这篇文章。

相关文献

https://www.nature.com/articles/s41556-018-0089-0
https://www.nature.com/articles/nature12931
https://www.ncbi.nlm.nih.gov/pubmed/27903897?dopt=Abstract
https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1005998
https://www.nature.com/articles/nsmb.2354

其它几篇方法文章

植物 miRNA 分析流程

文献题目:miRDeep-P2: accurate and fast analysis of the microRNA transcriptome in plants

DOI(url): https://doi.org/10.1093/bioinformatics/bty972

发表日期: 2018 Dec 6

关键点

Two major challenges to identify microRNAs (miRNAs) in plants

  • how to minimize the false-positive inheritable to computational predictions;
  • how to minimize the computational time required for analyzing the miRNA transcriptome in plants with complex and large genomes.

miRDP2: Based on ultra-deep sampling of small RNA libraries by next generation sequencing, miRDP2 is able to identify miRNA genes in plant species, even for those without detailed annotation, with extremely high speed and reliable performance.

http://sourceforge.net/projects/mirdp2/.

参考意义

流程有待测试,作者来自北京农科院。我对这个地方的印象就是虽然在北京,但是感觉已经快到我老家了。

BAM 文件过滤信息统计及注释工具

文献题目: Alfred: Interactive multi-sample BAM alignment statistics, feature counting and feature annotation for long- and short-read sequencing

DOI(url): 10.1093/bioinformatics/bty1007

发表日期: 2018 Dec 6

关键点

主要功能:Alfred uses subcommands for quality control (qc), feature counting (count_dna, count_rna, count_jct), feature annotation (annotate, tracks), alignment (pwalign, consensus) and haplotype-resolved analysis (split, ase).

网址:https://gear.embl.de/docs/alfred/

参考意义

看起来功能挺多,与samtools 相比更注重一些下游的分析。

CNV 预测工具

文献题目: CODEX2: full-spectrum copy number variation detection by high-throughput DNA sequencing.

DOI(url): 10.1186/s13059-018-1578-y

发表日期: 2018 Nov 26

关键点

CODEX2, as a statistical framework for full-spectrum CNV profiling that is sensitive for variants with both common and rare population frequencies and that is applicable to study designs with and without negative control samples.

We demonstrate and evaluate CODEX2 on whole-exome and targeted sequencing data, where biases are the most prominent.

CODEX2 outperforms existing methods and, in particular, significantly improves sensitivity for common CNVs.

https://github.com/yuchaojiang/CODEX2


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

# 文献
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×