很高兴和你相遇
这里正在记录我的所思所学
订阅免费邮件通讯接收最新内容
首页 归档 想法 通讯 播客 工具 简历 关于

使用R语言分析上海地铁好位置周边的二手房价格

昨天看到有朋友分享了一篇关于北京地铁和二手房市场价格相关内容分析的文章。

打开一看作者是刘思喆大神,如今他是 51Talk 的首席数据科学家。那我的第一步操作当然是订阅好大神的博客,第二步就是用文章里提供的 R 语言脚本稍加修改,顺手看看上海是个什么情况。

关于具体分析内容不再赘述,主要提炼下知识点和注意事项。

关于地铁站评级的分析在思喆更早(2013 年)的博客中有所提及,他引入了三个 Closeness、Betweenness和 PageRank 指标分别表示一个地铁站和其它地铁站之间的距离关系、被经过次数和该节点的重要性。

使用高德地图上海地铁图网页版调取 json 文件的时候,可以在网页点击 F12 打开调试模式,切换到 network 面板后刷新一下后就可以看到 json 文件的地址 https://map.amap.com/service/subway?_1613660591830&srhdata=3100_drw_shanghai.json

使用贝壳网的二手房数据查询上海价格时,API 中对应的 CityID 是 310000。在实际分析过程中,原文按照步行十分钟到达地铁站设置的经纬度范围,我把这个范围稍微扩大了一点,不然有些地铁站附近会因为没有房源而报错。至于哪一站不行 10 分钟没有地铁呢?答案是虹桥二号航站楼。

整体分析下来,上海的所有地铁站被我聚成了 7 类,按照 Closeness、Betweenness和 PageRank 三个指标筛选后,分出来的第 3 类和第 6 类是比较不错的地段,尤其是第 3 类中的 14 个地铁站可以说是指定指标下的最优选择。直接看地铁站名很多也是肉眼可见的厉害。

结合二手房价格平均值,可以得到下面的二手房数量和价格关系图。不过这个平均价格和从各种 app 上看到的多少有些出入,似乎比实际情况整体要偏低一些,可能和选择的经纬度范围有关,关注的还还需仔细了解。

这个图比较说明问题,比如像长清路,东明路,成山路和耀华路都是 7 号线和 13 号线相对集中的一片区域,这里离浦东和浦江很远的几个工业园区和徐汇长宁几个区域也相对位置居中,到哪个地方上班无论是地铁还是自驾都不会耗时过长。

如果想了解更多关于城市地铁其它的分析指标,可以参考下面几篇文献进行深入了解。

  • Oldham S, Fulcher B, Parkes L, et al. Consistency and differences between centrality measures across distinct classes of networks[J]. PloS one, 2019, 14(7): e0220061.
  • Derrible S. Network centrality of metro systems[J]. PloS one, 2012, 7(7): e40575.
  • To W M. Centrality of an urban rail system[J]. Urban Rail Transit, 2015, 1(4): 249-256.

本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

如果你对这篇文章感兴趣,欢迎通过邮箱或者微信订阅我的 「熊言熊语」会员通讯,我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想点此链接即可进行免费订阅。


· 分享链接 https://kaopubear.top/blog/2021-02-19-shanghai-subway/