首发|杀死假房源!这家公司1年将房源错误率从90%降到3%,天使融资1000万!

2016-05-24
主要措施就是将非标准的数据整成了结构化数据。

找过房子的人都知道,房产信息平台上的房源,简直是“钓鱼信息”,无论你怎样精挑细选看重一个房子,打电话过去,中介肯定会告诉你,这个房子已经没有了,我们这而还有类似的,然后巴拉巴拉开始安利他的房源了。

而且,还都是重复房源,一家房源会登在几乎所有房产信息平台上,极其浪费用户的搜索时间。为此,苏伟杰和张文战在2015年3月成立了“诸葛找房”,意在通过搜索引擎技术算法,为用户提供最真实的房源信息。

诸葛找房可以自动对全网房源进行真假判断和清洗过滤,并聚合每一套房子的不同中介公司及业主信息,实现让用户客观了解房屋信息并自行选择交易对象。

日前,诸葛找房宣布完成1000万元天使投资,由浅石创投领投、劲邦资本跟投。浅石创投合伙人郑毅表示,之所以会投资诸葛找房,在于“房屋买卖这样的重度决策过程仍然存在着高度的信息不对称,看好诸葛找房运用各种技术手段和服务体系帮助优化用户的买卖决策和交易流程。”

诸葛找房的三大技术特点

据创业邦(微信搜索关注ichuangyebang)了解,诸葛找房有三方面的技术能力,来帮用户清理“假乱错”的房源信息,让用户看到简单真实的房源。

一是结构化技术处理能力。创业以来,诸葛找房用1年的时间来做基础数据库,也就是把网上各种错综复杂杂乱无章的数据,从非标准化做到标准化,多像一个强迫症会做的事。

在北京,诸葛找房目前覆盖互联网上95%的整租、二手房房源信息,其中整租不到10万套,二手房23万套。将房源的错误率从90%降到3%~5%,错误率饱含三层涵义:假房源、已出租出售房源、图片与真实情况不符房源。

而之所以能够做到3%~5%的错误率,原因在于数据处理的过程中,用ETC系统,做电话识别、空号处理,并对经纪公司数据、住建委数据、其他平台数据进行匹配;以及,诸葛找房旧版App中有反馈入口,通过用户人工众包来进行数据清洗。

二是多因子聚合分析。即把同一套房源的各种信息,划分成不同的因子,比如有平米、居室、厅、装修程度、价格、图片等,对这些因子进行匹配。其中,经过数据质量评估后,不同网站的不同参数有不同的权重,比如链家的数据在行业里质量较高,在某些权重上就更相信链家。

同时,在系统进行数据筛选的同时,会认为进行干预,最终优化为真实信息。

三是人工智能。这是在前两者的基础上发展起来的,数据是人工智能的基础,人工智能是服务行业的基础,房产行业低频高客单价的特征,导致用户非常需要直观的一个人或工具来帮助做消费决策,诸葛找房的人工智能就是做这个直观的工具。

诸葛找房的人工智能机器人叫“诸葛小AI”,诸葛找房将大数据处理能力集成在小AI身上,从而使小AI拥有个性化推荐系统、房产舆情系统、房产中介识别系统、找房预期妥协算法、房产行业语义解析&场景分析系统,并可搜索到全网房产知识。

其中,语义分析和场景解析的含义为:

语义分析指,语音搜索,听明白用户想找什么样的房子,还包括判断用户的需求,通过判断用户的操作、行为,为用户做个性化的推荐。

场景解析则指根据对场景的分析,探寻用户的真实需求,比如,用户搜“太阳宫小区”和“太阳宫小区的房子”背后可能是不一样的意图。

商业模式:与线下经纪公司合作

苏伟杰告诉创业邦(微信搜索关注ichuangyebang),诸葛找房的商业模式是和线下房产经纪公司进行合作。用户通过诸葛找房最终搜索到中意的房子时,可通过诸葛找房介入到线下经纪公司、中介公司、金融机构。

这也是一般来说,搜索引擎都会采取的变现方式——某种意义上说,是为优质搜索结果导流。

为了保证搜索结果的客观真实,诸葛找房称,排名结果显示的先后,并没有竞价逻辑,而是很有可能某经纪公司排名最前是因为中介费最低。用户可以选择嫁接服务到任何一家经纪公司,诸葛找房并不会干扰用户的选择。

现在正是做房产行业数据化的契机

之所以会选择在房产行业进行创业,一方面在于自身原因,自己从回国以来,就一直浸淫在房产行业,做过C2C房产交易,才转到房产搜索领域进行创业。

另一方面,则在于对房产大行业的理解。事实上,如果在2014年之前,做房产搜索引擎的话,会很快死掉。房产行业的信息变革直到2015年才开始出现:比如,房多多等开始有自己的网站、58赶集等平台开始有更多数据、整体房产网站的信息越来越离散。

而在信息离散的大环境下,就需要有一个搜索引擎来做信息引导。

而对于为什么没有选择房产的其他领域进行创业,苏伟杰表示,线下竞争已白热化,如果介入买卖,一是因为市场不稳定,二是因为中介在这个重度消费决策中有着不可替代的作用,所以也不做去中介化的事,三是因为线下太重,不适合创业公司。

但是看到互联网房产信息平台的槽点,58赶集、安居客等作为流量平台,效率太低,所以决定做流量平台,做基础的真实数据库。

据创业邦(微信搜索关注ichuangyebang)了解,截止2015年底,诸葛找房可提供的二手房和整租数据,覆盖北京、上海、广州、深圳、南京五大城市,实现每天10亿次+数据处理,每10分钟更新重组全网数据; 同时支持快速地水平扩展,1天即可开放一个新城市,边际成本因此变得极低。

来源:创业邦|http://www.cyzone.cn