每周文献-181208-DNA甲基化和几个工具

文献信息

标题: A DNA methylation reader complex that enhances gene transcription

DOI(url): 10.1126/science.aar7854

发表日期: 07 Dec 2018

关键词: DNA methylation; reader complex; SUVH1 and SUVH3; activate

文献概述

emmm , 挺长时间没有植物甲基化的文章发表在 science 上了,文章的通讯作者是美国科学院院士。

DNA 甲基化(DNA methylation)是最早发现的表观修饰遗传标记。DNA 甲基化在调控基因表达、维持染色质结构、基因印记以及胚胎发育等生物学过程中发挥着重大的作用。在真核生物中,DNA 甲基化通常标记转座元件。在植物中,RNA 介导的 DNA 甲基化(RNA-directed DNA methylation, RdDM)是一种重要的甲基化途径,植物中有三种甲基化形式CG、CHG、CHH。CG 由DNA甲基化转移酶 MET1 维持,在植物中 DNMT1 的同源蛋白;植物特异的 CMT3 结合 H3k9me2 促进 CHG 甲基化;CHH 由DRM2 及 CMT2 维持。转座子的插入可以对邻近的基因在转录水平产生影响,启动子的甲基化通常来说会抑制这些基因的表达,但也存在DNA甲基化促进基因表达的例外情况。

每周文献-181130-lncRNA

文献信息

标题:Global identification of Arabidopsis lncRNAs reveals the regulation of MAF4 by a natural antisense RNA

DOI(url): 10.1038/s41467-018-07500-7

发表日期:29 November 2018

关键词:lncRNA, H3K4me3, natural antisense transcripts, concordantly expressed

文献概述

  • 鉴定了 6510 个 lncRNA ,其中包括 4050 个 NAT-lncRNA 以及 2460 个 lincRNA
  • 在不同组织或逆境处理条件下,很多 NAT-lncRNA 与邻近蛋白编码基因的表达呈现正相关趋势。
  • 通过人工 miRNA 沉默部分 NAT-lncRNA 表达可导致邻近蛋白编码基因表达下降,表明 NAT-lncRNA 可正向调控邻近基因的表达。
  • 拟南芥成花抑制基因 MADS AFFECTING FLOWERING4(MAF4) 基因位点有一个 NAT-lncRNA,MAS。
  • MAS 受冷处理诱导并在转录水平激活 MAF4 表达,抑制拟南芥过早开花。MAS 对 MAF4 的激活依赖于一类参与组蛋白 H3K4me3 修饰的 COMPASS-like 复合体。
  • MAS 与复合体中的一个核心蛋白组分 WDR5a 结合并辅助该复合体招募到MAF4 基因位点,促进 H3K4me3 修饰,从而促进 MAF4 表达。

优秀到不能被忽视 读书笔记

基本信息

  • 原作名: So Good They Can’t Ignore You
  • 作者: 卡尔·纽波特
  • 页数: 226
  • 整理:思考问题的熊

你的灯亮着么 读书笔记

基本信息

  • 原作名:Are Your Lights On? How to Figure Out what the Problem Really is
  • 作者:唐纳德·高斯;杰拉尔德·温伯格
  • 主要内容:如何能更好的解决问题,通过20个故事讲6个道理

VS Code 系列 1:提升 R 和 Python 使用体验

已经攒了一系列 VS Code 写作计划和素材,之前也发过几篇基础知识的思维导图(见文末)。不过一直不知道该从哪里开始第一篇文章,如果推荐给身边的人,他们可能最关心的是用 VS Code 日常写简单的 R 和 Python 代码体验如何。那就从这里开始吧。

本文以 PC 作为安装配置示例,Mac 基本类似且部分内容体验可能更优。

为什么是 VS Code

既然是系列文章的开篇,姑且对主题按下不表先介绍一下 VS Code。

VS Code 的全称是 Visual Studio Code,官方给他的定义是官方定义是一个免费的、开源的跨平台编辑器。相对于各种 IDE 而言,编辑器则相对更轻量,更侧重于文件或者文件夹而非宏大的项目。

66种测序数据分析方法和流程

写在前面:看了标题进来的老铁,这里不可能在一篇文章里写好66个pipeline 给你,实际上我就是给你推荐一个网站。

闲着乱看的时候发现在bioinformatics 上发表了一篇文章SequencEnG: an Interactive Knowledge Base of Sequencing Techniques,再一看Abstract,写道

Next-generation sequencing (NGS) techniques are revolutionizing biomedical research by providing powerful methods for generating genomic and epigenomic profiles. The rapid progress is posing an acute challenge to students and researchers to stay acquainted with the numerous available methods. We have developed an interactive online educational resource called SequencEnG (acronym for Sequencing Techniques Engine for Genomics) to provide a tree-structured knowledge base of 66 different sequencing techniques and step-by-step NGS data analysis pipelines comparing popular tools

艾玛,原来现在已经有至少66种不同测序技术了? 掰着手指想了想,知道的做过的撑死也超不过一双手啊。这66种测序技术都是啥,于是点开了这篇文章的网站想探探路。嗯,果然很多没听说过:)

VS Code 学习记 1-4

使用 VS Code作为自己的主力编辑器已经有一年的时间,但是总感觉没有很系统的了解过日常的这个工具,也就不知道自己的使用是否高效。最近再跟极客时间上的一个VS Code付费连载,那就顺便把它好好安排一下,记录一些学习笔记。学习记录将主要分为两种形式,偏文字的部分会整理为思维导图,偏代码的部分会整理为文章。

SRA 数据下载自救指南

还在羡慕海峡那边的朋友下载SRA 快到飞起?还在难过用wget 下载数据经常下载不完整?用了官方的下载工具还是慢的不行?这里有一个SRA 下载自救尝试指南供你参考。

需要用到两个工具

  • SRA Toolkit
  • IBM aspera 高速文件传输工具

因为这是一篇极简自救指南,所以一切都不解释,直接给出链接,不明白的自行学习(爱学不学)。

SRA Toolkit 网址:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc

aspera 网址:https://support.asperasoft.com/hc/en-us

aspera 官方对于下载NCBI数据的说明

https://support.asperasoft.com/hc/en-us/articles/216125898-Downloading-data-from-NCBI-via-the-command-line

转录组时间序列数据小结

针对转录组数据,平时分析中最常见两组之间的比较,比如不同处理或者不同突变体。面对这样的数据用用 DESeq2 或者 edgeR 基本就差不多。如果样本量或者不同条件很多的话可以还做WGCNA的分析。但是生物体的生长发育和时间这个维度有着非常密切的关系。如果碰上了一组和时间有关系的数据可以怎么处理呢?

时序分析

所谓时序分析 (time series analysis) 在 data science 中是非常重要的一个方向。对大多数商业行为而言如果能够通过已有不同时间数据来进行预测就有可能大大提高自己的胜率。通常时间序列数据会包括趋势部分和不规则部分, 我们需要做的就是剔除不规则部分然后找到趋势所在,再进行预测。在预测过程中通常可以采用移动平均法、局部加权回归法、指数平滑法和自回归整合移动平均等方法。

生物学时序分析

生物学的时间相关数据本身预测属性和商业数据相比要弱很多。一种是单一条件的纯时间序列,主要看不同基因的表达模式,根据相似的表达谱将基因归为多个类有助于找到功能相似的基因。另一种情况是含有对照和处理的时间序列,需要再考察不同条件的差异基因。

生物信息学简史

前几天看到Briefings in bioinformatics 发了一篇文章介绍生物信息学发展历史。个人有两个感慨,一是这样的文章也可以发表(不禁想给自己的博客投稿),二是感慨生物信息学发展之快。对整篇文章进行了粗糙的翻译整理,供大家了解。

起源:1950-1970

20世纪50年代早期,DNA的历史地位还没有被建立,那个时候人们普遍认为蛋白质才是遗传信息的载体。直到1952年的噬菌体感染实验,人们才第一次证明DNA是真正的遗传物质。因为这个历史原因,生物信息学在DNA中的应用要落后于蛋白质研究将近20年时间。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×