快捷搜索:  汽车  科技

为什么深圳租房这么贵?深圳租房有多贵

为什么深圳租房这么贵?深圳租房有多贵目前格式为 “¥1490 (每月)”,要把其修改为纯数字格式0 15.5 1 24.0 2 15.0 3 6.3 4 7.8 Name: house_area dtype: float642). house_price 字段df_sz_ziroom = df_sz_ziroom.drop('Unnamed: 0' axis=1) # 删掉无用的列df_sz_ziroom.head(5) # 预览前五条数据2.数据清洗除了 house_room 字段外,剩下的字段都需要清洗,为了便于分析还需要新增字段,工作量有点大,挺好,又可以练手。1).house_area 字段有 "15.2" 和 "约9.5" 两种格式,需要转换成纯数字格式

这是一篇来自小密圈同学的投稿发现小密圈的高手真多,卧虎藏龙呀.租房是一个刚需,相信很多人特别是刚毕业不久的小伙伴都会碰到这个问题,那么在一线大城市比如深圳的租房情况如何呢,闪亮同学对深圳自如网站上的房源情况进行探索分析,非常有意思.

探索的问题

  • 房租的分布情况
  • 哪种户型的房源最多
  • 哪条地铁线附近的房租比较贵
  • 哪个区的房租更贵
  • 房源的面积分布情况
数据说明
  • 数据来源深圳自如网站(仅包含可出租状态的合租房源)
  • 采用集搜客工具爬取
  • house_area: 表示房间的面积
  • house_toom: 表示出租房屋的户型
  • house_price: 表示每月的房租
  • house_name: 表示房源所处的小区
  • house_located: 表示房源所处的小区
  • subway_info: 表示房源附近是否有地铁站
1.数据预览

1).看一下整个数据集的情况

为什么深圳租房这么贵?深圳租房有多贵(1)

为什么深圳租房这么贵?深圳租房有多贵(2)

2).删掉一些无用的列

df_sz_ziroom = df_sz_ziroom.drop('Unnamed: 0' axis=1) # 删掉无用的列df_sz_ziroom.head(5) # 预览前五条数据

为什么深圳租房这么贵?深圳租房有多贵(3)

2.数据清洗

除了 house_room 字段外,剩下的字段都需要清洗,为了便于分析还需要新增字段,工作量有点大,挺好,又可以练手。

1).house_area 字段

有 "15.2" 和 "约9.5" 两种格式,需要转换成纯数字格式

为什么深圳租房这么贵?深圳租房有多贵(4)

0 15.5 1 24.0 2 15.0 3 6.3 4 7.8 Name: house_area dtype: float64

2). house_price 字段

目前格式为 “¥1490 (每月)”,要把其修改为纯数字格式

为什么深圳租房这么贵?深圳租房有多贵(5)

0 1660 1 2230 2 1830 3 1860 4 1930 Name: house_price dtype: int64

3).house_name 字段

目前的格式类似为 “桦润馨居4居室-南卧”,需要把小区名字提取出来,如 “桦润馨居”

为什么深圳租房这么贵?深圳租房有多贵(6)

0 龙园山庄 1 塘朗城广场东区 2 龙园山庄 3 塘朗城广场东区 4 桃源村一期 Name: house_name dtype: object

4). house_located 字段

目前格式为 “[龙华区龙华中心] 4号线(龙华线)龙华” 包含所在的区和地铁两项信息,现需要把这两项信息提取并设置为两个字段

4.1).提取地铁信息

0 3号线 1 5号线 2 3号线 3 5号线 4 7号线 Name: subway_info dtype: object

4.2).提取所在的区的信息

0 罗湖区 1 南山区 2 罗湖区 3 南山区 4 南山区 Name: house_located dtype: object

经过上面的步骤,看一下清洗完的数据集

为什么深圳租房这么贵?深圳租房有多贵(7)

3.数据可视乎分析:单维度

1). 房租分布情况

  • 最低的房租为 1130 元每月,最贵的房租为 4360 元每月,土豪专属。
  • 平均房租为 2068 元每月,75% 的房租超过 1760 元每月。

df_sz_ziroom['house_price'].describe()

count 899.000000 mean 2068.787542 std 465.815828 min 1130.000000 25% 1760.000000 50% 1930.000000 75% 2290.000000 max 4360.000000 Name: house_price dtype: float64

最高房租和最低房租的是什么房子

df_sz_ziroom[df_sz_ziroom['house_price'] == 1130]

df_sz_ziroom[df_sz_ziroom['house_price'] == 4360]

  • 房租最低的房子位于龙岗区,龙岗区比较偏僻,且该套房源为6室1厅,房租最低也正常。
  • 房租最贵的房子位于南山区在二号线旁边,2号线经过的基本都是深圳最繁华的地带,房租这么高也正常。

为什么深圳租房这么贵?深圳租房有多贵(8)

大部分的房价集中在 1625 到 2250 元每月,其中 1750 到 2000 元每月的房源最多。超过 3500 元每月的房源很少。因为本次分析的都是合租房源,看来深圳自如的房租还是比较贵。

2).面积分布情况

df_sz_ziroom['house_area'].describe()

count 899.000000 mean 11.462803 std 3.322627 min 5.360000 25% 9.200000 50% 11.100000 75% 13.300000 max 30.900000 Name: house_area dtype: float64

为什么深圳租房这么贵?深圳租房有多贵(9)

绝大多数房间的面积集中在 6.3 到 12.7 平米之间,其中 10 到 12.7之间的房源最多。超过 20平米的房源很少,租房形式真严峻。

3).区域房源分布情况

为什么深圳租房这么贵?深圳租房有多贵(10)

罗湖区的房源最多,其次是南山区,最少的是福田区。在福田上班的话不妨去罗湖租房,房源比较多.

4).地铁房源分布

为什么深圳租房这么贵?深圳租房有多贵(11)

3号线附近的房源最多,由于3号线终点和起点分别在罗湖和龙岗,在罗湖上班的话,沿着3号线租房最好,不仅房源多,而且龙岗的房租普遍比较便宜,上班地铁直达。
5号线附近房源数量排在第二位,由于5号线横跨罗湖区、南山区、宝安区,中途换成站非常多,不论在罗湖还是南山还是宝安区,沿着5号线附近租房也是不错的选择。

4.数据可视化分析:双维度分析

1).考虑面积和房租

为什么深圳租房这么贵?深圳租房有多贵(12)

  • 图1为房子的面积和总价的关系图
  • 图2为对面积和总计分别取平方根和对数的关系图
    从图2中发现面积和房租并没有呈现出明显的线性关系,并不是房间面积越大,房租越贵。

2).区域和房租

为什么深圳租房这么贵?深圳租房有多贵(13)

南山区的房租贵,75%的房租高于2000元每月,其箱体也最长。南山区积聚了大量互联网企业,薪资水平在深圳相对来说也非常高。
福田区的房租紧随南山区之后,龙岗区和罗湖区的房租最低。
如果在南山区工作,去宝安租房是个不错的选择,地铁方便,房租也比南山便宜。
在福田区工作,去罗湖和龙华租房是个不错的选择,地铁方便,房租也比福田便宜很多。

5.数据可视乎分析:多维度分析

1).我们考虑面积,房租,区域,地铁沿线三者的关系

为什么深圳租房这么贵?深圳租房有多贵(14)

  • 2号线沿线的房子最贵,主要分布在南山区和福田区,绝大多数房租均超过2000元每月
  • 5号线和3号线沿线的房子主要分布在罗湖区和龙岗区,且绝大多数房价低于2000元每月。5号线沿线少量的大面积房源分布子在龙华区
  • 7号线和9号线沿线的房子主要分布在南山区和罗湖区,房源数量比较少,且价格大多数超过2000元每月
  • 4号线沿线的房子绝大部分分布在龙华区,绝大部分价格比较高分布在福田区
  • 1号线和11号线沿线的房子主要分布南山区和宝安区,分布在宝安区的房租相对来说比较低

结论:


  1. 深圳自如绝大多数房租超过1700元,且面积都不大,不过结合深圳的实际租房情况和自如的服务,这个价位还是可以考虑。
  2. 南山区的房租最贵,房源数量也是第二多的,南山区也聚集了大量互联网企业,对于经常加班的互联网从业者来说在公司附近租房是个不错的选择。
  3. 龙岗区和罗湖区的房租最低,且罗湖区房源数量最多,在罗湖上班想租的近一点可以选择罗湖,考虑便宜一点的可以去龙岗区租房。

猜您喜欢: