很高兴和你相遇
这里正在记录我的所思所学
首页 标签 归档 播客 主页 简历

R 的 20 年

最近有一篇文章从三个纬度介绍了 R 这 20 年的发展。

  • R 在这些年里发展速度有多快
  • 2000 年以来发布了多少个 R 包
  • 包的下载量如何增长

我提取一些结果和大家分享。

测试 R 的运行速度

作者使用了一段测试代码:

col_len <- function(n) {
  len <- 0
  while (n > 1) {
    len <- len + 1
    if ((n %% 2) == 0)
      n <- n / 2
    else {
      n <- (n * 3 + 1) / 2
      len <- len + 1
    }
  }
  len
}

res <- lapply(
  1:10,
  function(i) {
    gc()
    system.time(
      max(sapply(seq(from = 1, to = 999999), col_len))
    )
  }
)

运行时间如下图所示

  • 2000 年 2 月: 第一个 R 版本超过 17 分钟,1.0.0
  • 2002 年 1 月: 1.4.1 版本带来了巨大的性能提升约为 4.5 分钟
  • 2004 年 10 月: 在版本 2.0.0 只有 168 秒,不到 3 分钟。
  • 2014 年 4 月 -- 10 年后,3.1 版将时间缩短到大约 145 秒
  • 2017 年 4 月-最后,3.4 版本已经看到了另一个显著的性能提升,从这个版本上执行这个计算所需的时间不到 30 秒。

R 包数量的增长速度

  • 在 2000-2004,新发布的包数量不到 100 个
  • 在 2010 中,CRAN 已经看到了 400 多个
  • 2014 年,超过 1000 个包首次发布
  • 在 2017 中,超过 2000 个新包被添加到 CRAN
  • 在 2018 和 2019 中,总 CRAN 释放量超过 10000

R 包的下载量

上面的数字仅代表了许多 CRAN 镜像中的一个,因此包下载的真实数量要高得多,图表的信息价值主要在增长:

  • 2013 年 1 月有大约 110 万个
  • 2015 年 1 月 770 万
  • 2017 年 1 月 2690 万
  • 2020 年 1 月超过 1.28 亿次下载

原文地址:https://jozef.io/r921-happy-birthday-r/


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

扫码即刻沟通

· 分享链接 https://kaopubear.top/blog/2020-02-29-r20years/