很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 通讯 播客 工具 简历 关于

靠谱熊的每周分享 第3期

刊首语

本周想分享一个「汉隆剃刀」经验法则:能解释为愚蠢的,就不要解释为恶意。

Hanlon's Razor: 'Never attribute to malice that which can be adequately explained by stupidity.'

这句话究竟是谁说的,汉隆究竟是谁,似乎也不太可靠了,想看比较可信度源头可以参见 Wikipedia。

之所以我们感觉这个世界充满了恶意,很大一部分原因是因为我们理解错了这个世界。潜意识里,我们每个人都会以自我为中心思考问题,最常见的一个句式就是「他问什么这么对我」,但现实是每个人都是一个平行的个体。


@Matthew Cook

汉隆剃刀说的「愚蠢」,代表各种无知的、偶然的、非故意的的原因,这些情况发生的可能性远远大于恶意。彼此熟悉的人,突然对你产生恶意的可能性很小,不熟的人也没什么理由对你产生恶意。

这里的愚蠢不仅仅是指「笨」,可能是忘了、错了、误会了、累了或者有事耽误了。并不是这些人恨你,不喜欢你,还是前面说的,这个世界并非以你为中心,很多人也不会专门针对你。


@Matthew Cook

回到开头,评论一个人或者一件事不是坏就是蠢。事后看,往往都不是坏,而仅仅是蠢。

不提别人,可以想一下自己,平时我们有多大的概率会精心设计一件事情,会思考很多其他人之后再做一个决策。通常都是被惯性和情绪驱动,不会想太多。问题在于我们一般意识不到自己的愚蠢,不经意就有了一些让人误解的行为。从另一个角度讲,如果你感觉自己承受了阴谋和恶意,一定要直接交流、小心求证防止误判。

学会和这个世界在某种程度上和解。

专业文献

HisTrader: A Tool to Identify Nucleosome Free Regions from ChIP-Seq of Histone Post-Translational Modifications

Yifei Yan, Ansley Gnanapragasam, Swneke Donovan Bailey
Motivation: Chromatin immuno-precipitation sequencing (ChIP-Seq) of histone post-translational modifications coupled with de novo motif elucidation and enrichment analyses can identify transcription factors responsible for orchestrating transitions between cell- and disease-states. However, the identified regulatory elements can span several kilobases (kb) in length, which complicates motif-based analyses. Restricting the length of the target DNA sequence(s) can reduce false positives. Therefore, we present HisTrader, a computational tool to identify the regions accessible to transcription factors, nucleosome free regions (NFRs), within histone modification peaks to reduce the DNA sequence length required for motif analyses.
Results: HisTrader accurately identifies NFRs from H3K27Ac ChIP-seq profiles of the lung cancer cell line A549, which are validated by the presence of DNaseI hypersensitivity. In addition, HisTrader reveals that multiple NFRs are common within individual regulatory elements; an easily overlooked feature that should be considered to improve sensitivity of motif analyses using histone modification ChIP-seq data.

Availability and implementation: The HisTrader script is open-source and available on GitHub (https://github.com/SvenBaileyLab/Histrader) under a GNU general public license (GPLv3). HisTrader is written in PERL and can be run on any platform with PERL installed.
DOI: https://doi.org/10.1101/2020.03.12.989228

数据库

REWORK

一个大牛做的效率工具导航,700+ 实用工具,涵盖个人、协作、产品、设计、开发、运营。很有意思。

好书好文

「到处说」是到很多地方去说

上周「人物」的一篇报道被刷屏了,这个事情甚至慢慢的变成了一个有点「泛娱乐」的时间。因为人们一边发平台一边删,逐渐性质就变成了大家抖机灵。我在朋友圈里看到了大量的类似文章,有竖排版的,有变成乐谱的,甚至还有变成 DNA 序列的。
但是不禁一个疑问也随之产生:到处说的地方难道只有微信了么?变出一百个奇奇怪怪的版本都发在微信里,为什么不换个阵地呢?还是我们如今的信息只剩下了微信?
正如一篇博客提到的

以上可以理解,但下面的不好理解,也容易被忽视:为什么网民的接力「到处说」,仅仅局限在微信中?
一个公号倒下了,另一个公号站起来,以此类推。但为什么我们的互联网阵地现在只有微信一个了,这是从什么时候开始的?
现在,微信已经完全等于互联网了吗?差不多是的,就像网民的身份证一样,微信把人们的吃喝玩乐基本上都筐进去了。
人们爱谈微信红利,都希望从中借力,增长自己的产品。而且大势所趋,不是每个人都会自己建网站,也不是每个人都会折腾自己的网络设置来开心上网,也没必要。
如果一个东西没必要,我们确实不应该做。但如果有必要,而且还很重要,我们只是忘了技术实现以及它的名字,那就应该再将它提上日程。
最重要的是,我们要认清,我们不只有一个阵地,也确实需要更多的阵地,集中抱团是最危险的行为,因为这样,对方一个大炮,我们就被轻易消灭了。

snakemake 如何处理大量的文件

流程控制工具 snakemake 如何处理大量的文件,这篇文章提到了一些技巧

如何清理你的 apple 设备,看看官方怎么说

苹果官网更新了设备清理说明,其中提到了是不是可以使用消毒剂。其中说到,其实是可以用酒精来擦屏幕的,比如把酒精喷到无绒布上然后猜猜设备。

关于显示器怎么清理,一般情况下其实就是无绒布+水即可。

首先,断开显示屏与电源、电脑以及所有外部设备的连接。然后使用显示屏随附的布或其他柔软的干布擦拭屏幕上的灰尘。
如果需要另外清洁显示面板或外壳,请使用微湿的无绒软布。避免开口处受潮。不要使用窗户清洁剂、家用清洁剂、喷雾剂、溶剂、氨水、研磨剂或含有过氧化氢的清洁剂来清洁显示屏。
不要使用含有丙酮的清洁剂清洁显示屏的屏幕。请使用屏幕或显示屏专用的清洁剂。切勿将清洁剂直接喷到屏幕上。清洁剂可能会流入显示屏内部,导致损坏。

美股暴跌,什么是「熔断机制」

北京时间 3 月 9 日 21:34 分,标普 500 指数日内跌 7%,触发第一层熔断机制,这是美股史上第二次熔断,交易暂停 15 分钟。此外,巴西基准股指下跌 10%,触发熔断。加拿大股指开跌 7%,为 2008 年以来最大跌幅。欧洲股指同样录得自 2008 年经济危机以来的最大跌幅。

以下内容来自中文维基百科
熔断机制(Circuit breaker / Trading curb)指的是在股票市场的交易时间中,当价格波动的幅度达到某一个限定的目标(熔断点)时,对其暂停交易一段时间的机制。此机制如同保险丝在电流过大时候熔断比较相似,故而得名。熔断机制推出的目的是为了防范系统性风险,给市场更多的冷静时间,避免恐慌情绪蔓延导致市场波动,从而防止大规模股价下跌现象的发生。然而熔断机制也因切断了资金的流通性,同样会造成市场情绪加大,并令市场风险在熔断期结束后继续扩大。
在美国交易时段,熔断机制可以分为三级: 一级市场熔断,市场下跌达到 7%;二级市场熔断,市场下跌达到 13%;三级市场熔断,市场下跌达到 20%。
如果触发一级或者二级市场熔断,且时间是在:美东时间 9:30-15:25(含) 之间,全市场所有股票暂停交易 15 分钟。美东时间 15:25 之后,不暂停交易。另外,如果该交易日为半天交易,则时间分界点为 12:25。全天任意交易时段,如果触发三级市场熔断,全市场停止交易,直至下个交易日开盘。

发布前美股又经历了第二次熔断。

国外新闻媒体应该看些什么

想了解外面的世界就需要看看国外新闻媒体,那么国外媒体应该怎么分类哪些该看哪些不该看呢?这里推荐一篇文章。简单来说就是看下图中绿色框和黄色框里的。

学习素材

Introduction to Data Science

一本介绍数据分析很好的教材,推荐!

Bioinformatics Algorithms An Active Learning Approach

Bioinformatics Algorithms  这本书目前已经出到了第三版,其中第二版应该是可以从网络上找到的,第三版目前作者已经在逐步开放,现在前三章都可以阅读。
比较厉害的是这本书配套有一个网站,其中有对应的视频和 FAQ 可以一起学习参考。作者在 coursera 上也有对应的课程。

影音推荐

Super Band

本周的视频分享来自韩国一档综艺节目「super band」超级乐队的一次现场表演,一把六弦贝斯+三把吉他,演奏曲目是 Coldplay 的  Adventure Of A Lifetime。
听了很多遍,  只能说 awesome。

工具

Tools and tricks for a data scientist

生物信息 IP 网红  Ming (Tommy) Tang  最近分享了学习生物信息(数据科学)应该掌握的一些工具和技能。主要涉及到的知识点如下,不知道哪些是你在用的。大部分我也在使用,在此简单罗列和介绍。

  • Oh-my-zsh!: zsh  配置
  • Mosh: mobile shell  远程终端后台执行,可以代替 ssh 使用
  • csvkit:和 csvtk 类似,文本处理工具
  • body:一个小脚本,处理出 header 以外的所有行
  • csvtk  爪哥写的命令行工具
  • GNU parallel:Linux  并行命令
  • Brename:爪哥写的文件重命名工具
  • Notion App:笔记类 All-in-on 工具
  • Hackmd:一个台湾开发者开发的在线协作 markdown 工具,之前我们分享过
  • Blogdown:使用 Rmarkdown 搭建个人博客
  • Workflowr:项目结果网页化展示
  • Docker + rstudio:容器
  • Snakemake:流程控制工具
  • crontab:备份命令

讨论

BWA-MEM2 Review: Should You Upgrade?

是否需要升级成 BWAMEM2 呢?前一段时间,序列比对工具 BWA  的升级版本 BWAmem2  更新了一个版本,其中一个内容是完善了的大基因组数据的处理(我之前在分析的时候反馈了一个 issue,这次得到了修正)。不过在主页上还是不建议用于生产环境,目前还处于测试版本。
Readme 中给出了在一些情况下和 BWA-mem  的比较说明。双端无论是使用单线程还是多线程,基本上提速在 1.5-2 倍速。

这里也有一篇测评文章  BWA-MEM2 Review: Should You Upgrade?  大家可以参考。
我使用最新的预编译版本最近进行了一点测试,


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

如果你对这篇文章感兴趣,欢迎通过邮箱或者微信订阅我的 「熊言熊语」会员通讯,我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想点此链接即可进行免费订阅。


· 分享链接 https://kaopubear.top/blog/2020-03-15-weeklyshare3/