写着写着 R 与统计基础莫名其妙地又写开 R 基础了,一起写吧。
文献信息
标题: A DNA methylation reader complex that enhances gene transcription
文献信息
标题:Global identification of Arabidopsis lncRNAs reveals the regulation of MAF4 by a natural antisense RNA
基本信息
- 原作名:So Good They Can't Ignore You
- 作者:卡尔·纽波特
- 页数:226
- 整理:思考问题的熊
基本信息
- 原作名:Are Your Lights On? How to Figure Out what the Problem Really is
- 作者:唐纳德·高斯;杰拉尔德·温伯格
- 主要内容:如何能更好的解决问题,通过 20 个故事讲 6 个道理
已经攒了一系列 VS Code 写作计划和素材,之前也发过几篇基础知识的思维导图(见文末)。不过一直不知道该从哪里开始第一篇文章,如果推荐给身边的人,他们可能最关心的是用 VS Code 日常写简单的 R 和 Python 代码体验如何。那就从这里开始吧。
写在前面:看了标题进来的老铁,这里不可能在一篇文章里写好 66 个 pipeline 给你,实际上我就是给你推荐一个网站。
使用 VSCode 作为自己的主力编辑器已经有一年的时间,但是总感觉没有很系统的了解过日常的这个工具,也就不知道自己的使用是否高效。最近再跟极客时间上的一个 VS Code 付费连载,那就顺便把它好好安排一下,记录一些学习笔记。学习记录将主要分为两种形式,偏文字的部分会整理为思维导图,偏代码的部分会整理为文章。
还在羡慕海峡那边的朋友下载 SRA 快到飞起?还在难过用 wget 下载数据经常下载不完整?用了官方的下载工具还是慢的不行?这里有一个 SRA 下载自救尝试指南供你参考。
针对转录组数据,平时分析中最常见两组之间的比较,比如不同处理或者不同突变体。面对这样的数据用用 DESeq2 或者 edgeR 基本就差不多。如果样本量或者不同条件很多的话可以还做 WGCNA 的分析。但是生物体的生长发育和时间这个维度有着非常密切的关系。如果碰上了一组和时间有关系的数据可以怎么处理呢?
时序分析
所谓时序分析 (time series analysis) 在 data science 中是非常重要的一个方向。对大多数商业行为而言如果能够通过已有不同时间数据来进行预测就有可能大大提高自己的胜率。通常时间序列数据会包括趋势部分和不规则部分, 我们需要做的就是剔除不规则部分然后找到趋势所在,再进行预测。在预测过程中通常可以采用移动平均法、局部加权回归法、指数平滑法和自回归整合移动平均等方法。
生物学时序分析
生物学的时间相关数据本身预测属性和商业数据相比要弱很多。一种是单一条件的纯时间序列,主要看不同基因的表达模式,根据相似的表达谱将基因归为多个类有助于找到功能相似的基因。另一种情况是含有对照和处理的时间序列,需要再考察不同条件的差异基因。