第一届生物信息人才发展论坛落幕已经半月有余,算上前前后后的准备周期,在大家眼中一个「小而美」的论坛其实陆陆续续持续了一个多月的时间。
这个月,我成为了一名 Mac 用户。macOS 诞生于 1984 年,经历了 35 年的发展之后,其在全球操作系统市场中的份额已经不到 10%。
做学生和做研究的一个重要工作是把自己在做的东西告诉别人,通常是通过各种报告完成的,上到各种高大上的会议,下到组里几个人的小组会。我本身没有什么高大上会议的经历,但是几年下来各种各样的小组会也讲了不少。导师和同门都时常会给出一些建议和意见,逐渐就有了一套个人的「学术报告准备清单」。各种报告都会反复对照这份清单来准备。其中关于幻灯片的制作心得之前已经写过一篇文章,算是「技」。这篇文章主要写这份报告准备清单中「术」的部分,希望对你有所帮助。
HMMRATAC: a Hidden Markov ModeleR for ATAC-seq
DOI(url): https://doi.org/10.1093/nar/gkz533
杂志:Nucleic Acids Research
引子
之前写 awk 教程的时候,曾经提到过一些对文本中行列进行某些计算统计的需求,例如使用数组分类求和。一些基本需求 awk 都可以实现,但是写起来稍显复杂。在 R 中使用 dplyr 或者基础函数 aggregate()
可以方便的进行分组操作,如果能在 linux 中使用更加简洁的单行命令针对数值和字符进行一些基本运算就省去了在 R 终端操作的时间。这篇文章介绍一个 linux 中能满足这类需求的工具 GNU datamash。
喜欢科比的球迷应该熟悉这个词,mamba(曼巴)是科比的绰号,同时曼巴也是眼镜蛇的一种,黑曼巴是世界上移动速度最快的蛇。不过这篇文章里的 mamba 和科比没关系和蛇也没啥关系,说的是一个极速版 conda 。
Alignment and mapping methodology influence transcript abundance estimation
DOI(url): https://doi.org/10.1101/657874
发表日期:June 03, 2019
本文的图表及主要内容均来自 Meta-Research: Tracking the popularity and outcomes of all bioRxiv preprints 和 Rxivist.org: Sorting biology preprints using social media and readership metrics 两篇文献,一篇发表在 elife 一篇发表在 plos biology,如果有兴趣不妨直接阅读原文。
今天分析数据的时候刚好碰到一个小问题,因为本身文件较大一开始想不出比较好的解决方法,睡个午觉醒来突然有了灵感,自认为目前解决的还算巧妙。