## 同样的算法做不同的事情
朴素贝叶斯算法是一个可以用短方程来表达的学习算法。只要提供患者病历的数据库,包括病人症状、检查结果,或者他们是否有什么特殊情况,朴素贝叶斯算法就可在一秒之内做出诊断,而且往往比那些花几年在医学院学习的医生还要强。该算法还可应用于学习垃圾邮件过滤器,乍一看这和医疗诊断毫无关系。
## 同样的算法做不同的事情
朴素贝叶斯算法是一个可以用短方程来表达的学习算法。只要提供患者病历的数据库,包括病人症状、检查结果,或者他们是否有什么特殊情况,朴素贝叶斯算法就可在一秒之内做出诊断,而且往往比那些花几年在医学院学习的医生还要强。该算法还可应用于学习垃圾邮件过滤器,乍一看这和医疗诊断毫无关系。
选一个心情不错的时间,打开手中叫做「唾液采集器」的小管子吐进一些唾液,再把它寄给一家公司。几天后你就会收到一份复杂而详细的报告,这份报告里将记录你和上百项健康风险、几十项遗传性疾病是否有关,甚至还会帮你寻根溯源,告诉你有多少少数民族或东南亚的祖先。
概率论代表一种看待世界的方式,关注的焦点是可能性。**对随机事件发生的可能性进行规范的数学描述是概率论的公理化过程。**概率的公理化结构体现出的是对概率本质的认识。
设想一个转盘游戏有红黑两种,且颜色各占一半。现在请你写下自己的预测结果。如果你配合可以此刻直接写到评论区,再来看文章后续内容。
关于假设检验中的 P 值相关的文章和批评实在太多了。最近看大一本书中有提到了 P 值的部分,简单做个整理。
《女士品茶》读书笔记
最近整理前一段时间看过的书,想了想先从《女士品茶》开始,正如这本书的自序所言,全书没有关于概率统计的抽象概念,但是却介绍了一些概率统计在各个领域的应用。这几篇系列文章将依托于《女士品茶》这本书,对概率统计世界的那些八卦做一些梳理。
想要做数据分析,一个配置说的过去的服务器必不可少,在自己的笔记本跑数据总有一些说不出的痛。如果能把实验室配备的高性能服务器搬回宿舍,就可以在宿舍里愉快地工作了。
通过上面几步内容,我们找到了一些可信度相对高的突变位置,接下来一个很重要的内容就是对这些突变位点进行注释和功能预测。注释目前常用的工具有两种,一个是 snpEFF,另一个是 annovar。注释的思路也可以分为两类,一类是按照基因注释,另一类是按照位置注释。
shell 脚本通常是一个以 shebang 起始的文本文件