很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 工具 通讯 播客 简历 主页

『终极算法』摘抄笔记-是否存在终极算法

##  同样的算法做不同的事情

朴素贝叶斯算法是一个可以用短方程来表达的学习算法。只要提供患者病历的数据库,包括病人症状、检查结果,或者他们是否有什么特殊情况,朴素贝叶斯算法就可在一秒之内做出诊断,而且往往比那些花几年在医学院学习的医生还要强。该算法还可应用于学习垃圾邮件过滤器,乍一看这和医疗诊断毫无关系。

贯穿你我一生的基因之谜

无处不在的基因

选一个心情不错的时间,打开手中叫做「唾液采集器」的小管子吐进一些唾液,再把它寄给一家公司。几天后你就会收到一份复杂而详细的报告,这份报告里将记录你和上百项健康风险、几十项遗传性疾病是否有关,甚至还会帮你寻根溯源,告诉你有多少少数民族或东南亚的祖先。

窥概率

概率论代表一种看待世界的方式,关注的焦点是可能性。**对随机事件发生的可能性进行规范的数学描述是概率论的公理化过程。**概率的公理化结构体现出的是对概率本质的认识。

先验后验和贝叶斯

随机并不随机

设想一个转盘游戏有红黑两种,且颜色各占一半。现在请你写下自己的预测结果。如果你配合可以此刻直接写到评论区,再来看文章后续内容。

关于 P 值的几点问题

关于假设检验中的 P 值相关的文章和批评实在太多了。最近看大一本书中有提到了 P 值的部分,简单做个整理。

统计世界的那些八卦 1

《女士品茶》读书笔记

最近整理前一段时间看过的书,想了想先从《女士品茶》开始,正如这本书的自序所言,全书没有关于概率统计的抽象概念,但是却介绍了一些概率统计在各个领域的应用。这几篇系列文章将依托于《女士品茶》这本书,对概率统计世界的那些八卦做一些梳理。

四步实现内网穿透

想要做数据分析,一个配置说的过去的服务器必不可少,在自己的笔记本跑数据总有一些说不出的痛。如果能把实验室配备的高性能服务器搬回宿舍,就可以在宿舍里愉快地工作了。

variant分析阶段小结3-对变异进行注释

variant annotation

通过上面几步内容,我们找到了一些可信度相对高的突变位置,接下来一个很重要的内容就是对这些突变位点进行注释和功能预测。注释目前常用的工具有两种,一个是 snpEFF,另一个是 annovar。注释的思路也可以分为两类,一类是按照基因注释,另一类是按照位置注释。

链特异性测序那点事

2021 年 12 月更新,距离写这篇文章已经过去 5 年了,但是今天发现这篇文章还会有人看。感慨一下。以及如果你只是想通过比对后的 bam 文件判断一下链特异性建库与否,这个文章太长了,直接去用RSeQC这个软件的 infer_experiment.py命令跑一下就好。祝好~

本文最早写于 2017 年,时间略显久远,各位选择性吸收

shell 脚本应知应会

基本介绍

shell 脚本通常是一个以 shebang 起始的文本文件