链家“楼盘字典”的大数据:如何数完全国6000万套房子?
你知道北京朝阳区有多少套房子吗?其中带飘窗的房子又有多少套?
链家集团不动产数据中心(Real Estate Data Center)打算在今年年底前就告诉你这些答案。在过去八、九年的时间里,链家集团在全国30个城市里数完了6000万套房子,并且录入了链家自己开发的“楼盘字典”。
链家为了掌握到已经进入的30个城市所有房源的基础数据,链家花了数年时间编制“楼盘字典”,为了保证100%真房源,数完6000万套房子,链家雇佣了400个人专门在各个小区数房子,然后汇总录入到“楼盘字典”的数据库。
大量的投入让链家的楼盘字典成果斐然。链家内部提供的一个数据显示,目前楼盘字典管理了全国30个城市6000余万套存量住宅,其中北京690万套(除未进入的远郊县,比如延庆),北京市朝阳区房源最多,拥有存量住宅170万套。链家还掌握到北京两居室户型房源占比最高,达到了39.21%。
这些基础数据极为宝贵,链家网楼盘字典中心总经理白智广把链家的“楼盘字典”比喻成类似人口普查的“房屋普查”,他说这是链家作为一家房产中介公司夯实客户的基础性工作。
链家现在北京的报盘率达到了85%-90%左右,也就意味着,如果北京某个区域二手房市场上如果有100套房源挂牌出售,链家就会在楼盘字典里掌握其中85-90套左右的房源。
在中国,出于种种原因,楼盘的资料往往是缺失的,用户缺少途径找到真实透明的楼盘信息。这也给了很多不怀好意的中介可乘之机。虚假房源、上下游通吃等等问题一直层出不穷。而另一方面,国内官方机构的信息查询也不完全透明,好的中介更多需要依靠自己的专业经验、甚至运气来服务客户。通过“楼盘字典”的持续性建设,链家才有了真房源承诺的底气,为用户带来更透明的购房体验。
当然,链家“楼盘字典”同样也是投入不菲,链家内部人士告诉记者,集团董事长左晖将“楼盘字典”称作一个“不计成本投入”的开发项目。过去“楼盘字典”开发的八、九年时间,到目前的累计投入预计达到了4.5亿元左右,而且仍然难以判断何时会产生价值与收回投入。
白智广说,链家集团和左晖对开发“楼盘字典”暂时没有投入产出的绩效考核。“公司要敢于投入,这需要管理层非常果敢的决策。”白智广说,“五年前我来到团队里做的事情,至今仍然在做,并且我还没有看到它的价值。但是管理层和我自己都认为,再过三五年,现在的工作和项目都会发挥不可替代的价值。”
链家的“楼盘字典”是摸底和普查城市里存量房源的基础性工作,几乎没有投机取巧和“抄近道”的可能性。
“你知道北京现在有多少凶宅吗?就是那些出现过人员突然死亡、离奇死亡的住宅。我们掌握到的数据是3000套左右。”白智广告诉人民网记者,“这些凶宅的数据是在做楼盘字典的过程里掌握到的,因为隐私的问题,链家不会对外披露,但是这些房源在通过链家的时候,经纪人可以提醒业主,这样就能够降低或者规避掉买家的风险。”
对于链家来说,在公司已经进入的30个城市里掌握超过6000万房源数据并且录入“楼盘字典”极为重要。这些基础数据在战略应用上,当市场热点开始切换的时候,链家可以准确地掌握到市场动向。
另一位房产中介人士指出,在链家计划切入的家装、搬家、租赁市场中,这些基础数据对公司掌握市场空白和需求点有着极为稀缺的研究价值,链家从中发现的,可能就是围绕房屋衍生出来的其他生意。
与此同时,链家开发的“楼盘字典”,对链家经纪人而言将是巨大的效率提升。“链家的经纪人距离房源数据最近,当他们掌握这些房源信息和数据的时候,汇总到楼盘字典的链家平台上,也就意味着不再需要每一个门店的经纪人去数房子、画户型图,毕竟区域内的楼盘和房源数量是有限的,平台提升了经纪人的工作效率。”白智广说。
链家“楼盘字典”希望能够让客户在网上找房子更加精确。在链家二手房交易链条里,有一个“漏斗管理”,其核心是能够确保链家房源“漏斗”的顶端数据尽可能地真实,也就是确保真房源。
“漏斗管理就是当客户通过链家找房子的时候,我们会监测到客户对哪些区域、哪些户型的房子感兴趣,最后实现成交的房子是哪些,整个过程就像是漏斗,这样筛选出最后成交的房源。”白智广说,“所以只有漏斗顶端的房源信息真实,才能促成和保证最后成交的概率与机会。”
白智广把链家“楼盘字典”也描述成一个不动产数据平台,其针对客户的目的是把话语权交给客户,让他们在买房子的时候尽可能多和真实地掌握到房源。
所以,链家集团“楼盘字典”团队一个较难的工作是如何“描述”一套房子。“一开始做楼盘字典之前,链家描述一套房子的维度可能只有几十个,但是楼盘字典开发以后,链家已经形成用300多个维度来描述一套房子。”白智广说。
在今年三季度,链家向客户开放网上寻找房源的通道就会添加这些房源描述的标签,比如区域、户型、报价、朝向等等,甚至有无带飘窗,其中一间卧室朝向、面积都会供客户添加选择,再加上链家“楼盘字典”高报盘率的房源数据,客户可以通过链家精准地找到自己想要买的房子。
今年,链家不动产数据中心开发“楼盘字典”另一项重要工作是在数房子的基础上“量房子”,比如链家会进入到小区楼栋里测量这些房子卧室、阳台、卫生间等区域空间面积,进一步把这些数据经过二次加工录入到楼盘字典,形成标准化的户型图。
“全国6000万套房子,预计会要画55万-60万张户型图,其中北京户型超过12万个,链家预计会完成全国4000多万套房子的测量和绘图。”白智广向记者介绍说,“链家今年为了量房子,在全国投入的人力数量会达到1000人,其中北京预计达到200人,再加上画图人员100-150人左右。”
白智广领导的60人团队,开发了目前总容量全国6000万套房源的“楼盘字典”,这个团队里员工专业背景各异,有的是数房子出身,因为描述房源涉及到标准问题,要求懂业务,也有数据分析和运营推广背景的员工,最多的还是来自百度、新浪微博的技术产品人才,比如程序员、架构师、产品经理等。
“我们更愿意自我描述成一个不动产数据标准化的团队。”白智广说,“当然我们的技术力量很厉害,足以支撑开发楼盘字典,为了吸引到优秀的互联网技术人才,我们甚至把办公地点从东二环的朝阳门搬到了互联技术从业者扎堆的西二旗。”