很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 工具 通讯 播客 简历 主页

统计学基础与 R-3

写在前面

入门生物信息,所有人都绕不开统计基础知识和相关实现方式。本章我们将简要介绍统计学相关基础知识以及如何使用 R 语言进行简单地计算和分析。

第三节 估计

在通常的试验中我们获得的信息总是来自样本,想要知道总体的参数,只能通过已有样本参数进行估计。

样本均值是总体均值的点估计,通常样本均值用x\overline x表示,总体均值用μ\mu表示。

在估计总体方差σ2\sigma^2时,计算公式为$$\sigma^2=\frac{\Sigma(x-\overline x)^2}{n-1}$$

用样本方差估计总体方差会使得估计结果偏低,样本越小两个方差的差别可能就越大。在这里,估计总体方差的公式中除的是n1n-1,能够更接近总体方差。另外,总体方差点估计公式通常记做s2s^2, 写作:$$s^2=\frac{\Sigma(x-\overline x)^2}{n-1}$$

用样本均值估计总体均值时也会产生误差,均值的标准误差是σ/n\sigma/\sqrt{n},估计量是s/ns/\sqrt{n}。标准误差表示了样本均值的分散情况,从公式中我们可以看出,n 越大,用样本均值估计总体均值越准确。当样本足够大(大于 30),即便总体不符合正态分布,但从中取出的样本均值分布仍然近似于正态分布(中心极限定理)。XN(μ,σ2/n)\overline X \sim N(\mu, \sigma^2/n)

除了对总体进行点估计以外,我们往往还会对总体进行区间估计,即对通过点估计得到的结果加减一定范围的误差。


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

如果你对这篇文章感兴趣,欢迎通过邮箱或者微信订阅我的 「熊言熊语」会员通讯,我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想点此链接即可进行免费订阅。


· 分享链接 https://kaopubear.top/blog/2017-09-27-RandStatistics3/