很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 工具 通讯 播客 简历 主页

转录组时间序列数据小结

针对转录组数据,平时分析中最常见两组之间的比较,比如不同处理或者不同突变体。面对这样的数据用用 DESeq2 或者 edgeR 基本就差不多。如果样本量或者不同条件很多的话可以还做 WGCNA 的分析。但是生物体的生长发育和时间这个维度有着非常密切的关系。如果碰上了一组和时间有关系的数据可以怎么处理呢?

时序分析

所谓时序分析 (time series analysis) 在 data science 中是非常重要的一个方向。对大多数商业行为而言如果能够通过已有不同时间数据来进行预测就有可能大大提高自己的胜率。通常时间序列数据会包括趋势部分和不规则部分, 我们需要做的就是剔除不规则部分然后找到趋势所在,再进行预测。在预测过程中通常可以采用移动平均法、局部加权回归法、指数平滑法和自回归整合移动平均等方法。

生物学时序分析

生物学的时间相关数据本身预测属性和商业数据相比要弱很多。一种是单一条件的纯时间序列,主要看不同基因的表达模式,根据相似的表达谱将基因归为多个类有助于找到功能相似的基因。另一种情况是含有对照和处理的时间序列,需要再考察不同条件的差异基因。

生物信息学简史

前几天看到 Briefings in bioinformatics 发了一篇 文章 介绍生物信息学发展历史。个人有两个感慨,一是这样的文章也可以发表(不禁想给自己的博客投稿),二是感慨生物信息学发展之快。对整篇文章进行了粗糙的翻译整理,供大家了解。

3D 基因组与生物信息

重要的 Hi-C 相关文献

第一篇 Hi-C 文章: Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome; DOI: 10.1126/science.1181369

一位印象大使的印象笔记使用心得

无纸化的尝试与优势

在大学,每到考试周我的书包里就会多出不少笔记本,但因为自己从小写字潦草经常会出现第二天认不出前一天记了什么的尴尬场景,在准备考研的阶段我还不幸有过笔记丢失的悲惨经历。写字太乱加上笔记本买买丢丢,是我最初产生把纸质笔记转变为电子笔记的原因。另外,纸笔形式更适合短期高强度的记录,高中大学之后类似于考试周之类的场景愈发减少。

R 安装升级后的若干规定动作

两个地址

R cran 镜像地址  https://cran.r-project.org/mirrors.html

bioconductor  mirror 地址  https://www.bioconductor.org/about/mirrors/

《小岛经济学》告诉我们的

他说的对还是不对

每一门学科都存在很多分支,研究同一个问题会有不同的解决方法,比如在生命科学领域要证明某个理论可以使用生物化学,分子生物的方法也可以使用生物信息学的方法,虽然研究的思路不同但目的相同。

awk 入门与进阶 part2—模式动作输出与输入

模式

BEGIN END

当 awk 从输入读取数据之前,首先执行 BEGIN 的语句;当所有输入数据读取完毕,最后执行 END 的语句。BEGIN 与 END 提供控制初始化与结尾的方式。FS 指定输入行分隔符;OFS 指定输出行分隔符。

awk 入门与进阶 part1—快速入门

awk 的结构

由一个单独的模式–动作语句 (pattern-action statement) 组成。

R 的安装配置与升级

这几天 R 语言升级到了 3.5 的版本,终于在小数点后面一位有了变化。关于新版本可以这这篇博客中查看  R 3.5.0 is released! (major release with many new features) 。

vim 操作应知应会 10 点

  • vim 包括 normal 和 insert 两种模式
    • normal 模式下所有按键都是功能键
    • 在 insert 模式下可以正常的输入内容