很高兴和你相遇
这里正在记录我的所思所学
邮箱 [email protected]
首页 标签 归档 播客 主页 简历

使用R语言分析上海地铁好位置周边的二手房价格

昨天看到有朋友分享了一篇关于北京地铁和二手房市场价格相关内容分析的文章。

打开一看作者是刘思喆大神,如今他是51Talk的首席数据科学家。那我的第一步操作当然是订阅好大神的博客,第二步就是用文章里提供的R语言脚本稍加修改,顺手看看上海是个什么情况。

关于具体分析内容不再赘述,主要提炼下知识点和注意事项。

关于地铁站评级的分析在思喆更早(2013年)的博客中有所提及,他引入了三个 Closeness、Betweenness和PageRank指标分别表示一个地铁站和其它地铁站之间的距离关系、被经过次数和该节点的重要性。

使用高德地图上海地铁图网页版调取json文件的时候,可以在网页点击F12打开调试模式,切换到network面板后刷新一下后就可以看到json文件的地址 https://map.amap.com/service/subway?_1613660591830&srhdata=3100_drw_shanghai.json

使用贝壳网的二手房数据查询上海价格时,API中对应的 CityID 是 310000。在实际分析过程中,原文按照步行十分钟到达地铁站设置的经纬度范围,我把这个范围稍微扩大了一点,不然有些地铁站附近会因为没有房源而报错。至于哪一站不行10分钟没有地铁呢?答案是虹桥二号航站楼。

整体分析下来,上海的所有地铁站被我聚成了7类,按照Closeness、Betweenness和PageRank三个指标筛选后,分出来的第3类和第6类是比较不错的地段,尤其是第3类中的14个地铁站可以说是指定指标下的最优选择。直接看地铁站名很多也是肉眼可见的厉害。

结合二手房价格平均值,可以得到下面的二手房数量和价格关系图。不过这个平均价格和从各种app上看到的多少有些出入,似乎比实际情况整体要偏低一些,可能和选择的经纬度范围有关,关注的还还需仔细了解。

这个图比较说明问题,比如像长清路,东明路,成山路和耀华路都是7号线和13号线相对集中的一片区域,这里离浦东和浦江很远的几个工业园区和徐汇长宁几个区域也相对位置居中,到哪个地方上班无论是地铁还是自驾都不会耗时过长。

如果想了解更多关于城市地铁其它的分析指标,可以参考下面几篇文献进行深入了解。

  • Oldham S, Fulcher B, Parkes L, et al. Consistency and differences between centrality measures across distinct classes of networks[J]. PloS one, 2019, 14(7): e0220061.
  • Derrible S. Network centrality of metro systems[J]. PloS one, 2012, 7(7): e40575.
  • To W M. Centrality of an urban rail system[J]. Urban Rail Transit, 2015, 1(4): 249-256.

本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

熊言熊语会员通讯「4321X」是一个免费的订阅服务。
每期会为你推荐 4 篇生物信息或者医学相关文献,分享 3 个我过去一周的思考,介绍 2 个我喜欢的工具,同时提出 1 个问题供我们交流,而 X 则代表不固定的 one more thing。可以点击这里进行订阅。


· 分享链接 https://kaopubear.top/blog/2021-02-19-shanghai-subway/