很高兴和你相遇
这里正在记录我的所思所学
邮箱 [email protected]
首页 归档 想法 通讯 播客 简历 关于

从 MacBook Pro M1 安装编译 R 踩坑想到的

关键时刻要稳住,以及软件之间的不兼容和人与人之间很类似。

之前写过两篇 macOS 升级系统后安装升级 R 的博客,现在回看虽然解决了当时的问题但还是蛮混乱的。最近工作主力机切换到了 MBP M1 版本(感谢东家),再整理一点踩坑实录和引申出来的想法。

新 Mac 必备

新 Mac 上手,装好 Xcode command-line tools 和 homebrew 其实就已经解决了大部分后续软件安装问题,如果还需要在笔记本跑跑数据就装 miniconda。写这篇文章的时候 homebrew 在 M1 上基本不会碰到什么问题,可以放心安装。

想起来研二开始日常管理实验室服务器的时候,必学技能还是如何在几个不同的 Linux 版本环境中安装编译好大家需要的各种软件,如今 conda 和 docker 的成熟让软件安装早就不再是什么问题,管理员的最大作用似乎就是做好数据备份的同时提醒大家做好数据备份

arm64 架构 R 的坑好多

我是一个忍受不了手机软件有更新而不升级的人,甚至经常通过 TestFlight 去找各种应用的测试版本(这种人被成为 TF boys)。拿到 M1 Mac 自然也是先找最新适配版本的软件。

以数据分析写代码常用的 VSCode 和 R 为例,目前很多软件已经有了专门针对 macOS arm64 的版本。你可以通过 R 官方的 mac 页面 找到下载链接。如图所示 4.1 版本 arm64 的安装包新鲜出炉。

下载安装一切顺利,往下翻翻就能看到针对 arm64 版本的说明。简单说为了防止不同架构的 R 打架,最新版本的 R 相关内容都保存在 /opt/R/arm64目录,包括进行 R 包编译必备的 GUN Fortran ,嗯你没有看错截图显示他们页面的这个单词拼错了。除了 gfortran 以外, XQuartz 则需要版本 2.8.0_rc1。gfortran 也有了 arm64 版本,可以通过 这个链接 下载安装。

正常情况下装好这几个就可以装 R 包了,但在安装几十个常用 R 的过程中发现了好几处 bug,其中最根源的问题是在 arm64 版本下(几乎)所有 R 包都需要通过编译才能使用。只要涉及到编译,各种不兼容和依赖问题就都来了。

edgeR 编译报错

这个 bug 最早是同事提出的,因为忙着搬砖所以我没有回答到点子上就甩了之前的文章链接。报错信息是library not found for -lgfortran,其实就是gfortran的位置找不到。这个问题如果仔细读了上面提到的官方页面应该有所准备。

It is assumed that /usr/local is unsafe as it may contain Intel binaries which don't mix, therefore R will not try to use /usr/local unless a manual flags override is issued. However, it also means that it is safe to use our arm binaries without affecting your legacy Intel ecosystem.

解决方案是需要正确安装最新版本的 gfortran,然后手动修改~/.R/Makevars编译用到的 FLIBS 信息

FLIBS = -L/usr/local/gfortran/lib/gcc/aarch64-apple-darwin20.2.0/11.0.0 -L/usr/local/gfortran/lib -lgfortran -lm

另外,网上其它软件也有提到把export PATH=/opt/R/arm64/bin:$PATH 写入系统配置文件,我并没有测试。

rgl 安装包错

rgl 是一个在 Mac 中有很多 R 包依赖的常用包,在安装报错的时候开发者良心地直接给出了讨论链接。macos catalina - Package rgl in R not loading in Mac OS - Stack Overflow

Warning messages:
1: 	Loading rgl's DLL failed. 
	This build of rgl depends on XQuartz, which failed to load.
 See the discussion in https://stackoverflow.com/a/66127391/2554330 
2: Trying without OpenGL... 

概括一下就是 rgl 和目前支持 M1 芯片的 Xquartz 版本不兼容,如果不想像链接中反复修改依赖软件的话,可以直接从 github 下载进行编译。

remotes::install_github("dmurdoch/rgl")

maftools 编译报错

安装 maftools 需要提前安装 Rhtslib,而 Rhtslib 在编译时有如下问题。

# 'lzma.h' file not found

因为 Rhtslib 也是一个频繁被依赖的软件,所以我猜测这个问题应该有人已经在 issue 里问了,一搜 确实如此。结果翻着翻着看到这样一条回答。

Intel 架构的 R 真香

通过上面的截图可以看到最中肯的建议就是:别乱用什么 arm64 架构的 R……

这是因为虽然 R 和 Rsutido 最新版本都已经支持 m1 芯片,但是 bioconductor 还没有支持,这样一来就无法直接安装编译好的 R 包版本。

不过,这个事情其实一开始苹果已经通过 Rosetta 2 解决了。为了在过渡阶段让 M1 同时兼容两种架构的软件,当使用 Intel 架构的软件时,macOS 可以直接通过 Rosetta2 去做转换。之前苹果官方介绍在大多数情况下需要使用 Rosetta 的 App 性能不会出现差异。

因此目前只需要使用 Intel 版本的 R,就可以避免编译以及随之而来的各种问题。所以,在果断重新安装这个版本的 R 之后,我只能说一句真香。

从 macOS M1 安装编译 R 想到的

在一开始读到 R 官网说明时,我就看到了下面这句话。

That said, our current Intel releases work just fine on the new Macs as well using Rosetta 2.

但追求走在更新前线的人怎么能如此委曲求全,结果就是浪费了不少因为编译 debug 的时间。所以生产环境求稳还是真理,只要没出错就不要乱改动,修改一下奥卡姆剃刀法则就是「如无必要,请勿升级」。

以及,使用 arm64 架构的 R 配合 Bioconductor 出现各种各样问题,原因在于它们没有保持住一致的节奏。软件如此,人和人之间也差不多。三五个人一起,要想成些事,彼此就不能出现太明显的「不兼容」。

一方面,如果有人走的太快但还要依赖他人的时候,这种自我升级本身没有太大价值,多数还是需要主动调低自己的版本。

另一方面,如果多数人都升级了,为了运行速度和后续更新,版本太低的人也不会被一直兼容。就像手机系统升级一样,手机公司总得逐渐放弃一些久远的型号,至于支持几代就要看不同公司的策略。

除了关键时刻果断决策,更重要的还是大家一起进步一起升级。想起来那句话:你就是你身边最常接触五个人的平均值。


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

熊言熊语会员通讯「4321X」是一个免费的订阅服务。
每期会为你推荐 4 篇生物信息或者医学相关文献,分享 3 个我过去一周的思考,介绍 2 个我喜欢的工具,同时提出 1 个问题供我们交流,而 X 则代表不固定的 one more thing。可以点击这里进行订阅。


· 分享链接 https://kaopubear.top/blog/2021-07-06-macos-arm64-R-tips/