IT龙门阵第 211 期

人工智能在细分领域的商业化探索

诸葛找房苏伟杰:人工智能可以帮助用户更有效率的找房子

现场互动

观众 : 我们数据堂云技术组的负责人,首先感谢戴总和苏总这里,确实是AI的产品发展,带动了大数据的行业,首先我来自大数据的公司我这里想问几个问题,第一个先问戴总,首先呢,我知道因为我本身是做语音识别这么一个算是行业的学者吧,我知道咱们做这个小莫呢是语音识别的东西,这个涉及到语音识别层,还有NIP层,最终达到语义的理解,首先是很高级的一个层面,涉及到很大知识库,特别关心APP背后的知识库,是怎么构建,让知识库不断的扩大,不断完善支撑APP,适应行业人群的各种需求。
戴帅湘 : 我先说一个比较容易理解的,就是说数据堂有数据结构化和非结构化,百度这样的数据,如果是结构化的数据,我们把它当做数字,结构化的数据,我们来说,就是数学里面的数字,这些结构数据库里面的关系,相当于我们做了一定的预算,这个学术界也是认可的,没有一个做的很好,我们对人物做的很好,不见得只是人物数据库,我们做不同的混合的推理和认证,没有差异,有可能专注到,人物地点是吧,各种知识这个要抓取的,这个数据委托大数据,就是大数据库,我有了才有可能认可,有全部的,这个是技术方面,还有一部分,就是我刚才讲的,主题讲的,不是结构化数据,或者说你结构化不了,你没法结构化,这个时候就需要少量样本的学习,这个时候也做了大量的,完成学习任务,完成任务写个三四个,就写不下去了,你不知道谁的问法多,这种情况下必须走小数据的学习,你没有别的方法来做,你也标不了太多。
观众 : 刚才过来听,找房的时候,问一下这块十分钟刷新一个数据,这个必要是什么,不像那么高频的数据变化,为什么十分钟刷新一下数据,您说人工智能的运用,第二个问题是,您这些数据都从不同的数据源抓来的,那些数据源,这些数据有冲突怎么处理这些数据,是否涉及到人工智能的应用。
苏伟杰 : 先回答您的第一个问题,就是为什么每十分钟刷新一下数据,房屋的变更效率,对用户价格很高,我们推出二十四小时降价的房源,基本上已经看到全北京市二十四小时降价的,这套房子降就意味着这套房子很快就会出手,我们会提出二十四小时涨价的房源,而是你还来得及和他谈,所以房源数据的有效性,对用户的价值很高的,房源会不会那么多,那么及时,这边有两个方面,一个是通过我们数据源去看,一个是多家委托,这房子挂在不同的网站,在单一的网站变化不会那么多,但是在多个网站数据变化就会相对多一些,我们确保我这套房子是最有效的,对所有的房源进行监控,但是我们也不能每十分钟把对方网站扫描一遍,现在的房地产平台,整个技术的背景还没有那么好,我们访问多了,对方网站也受不了,我们在某些网站不会达到十分钟,相对延迟时间长一些,房源有效性保障数据质量很重要的前提。这个我们还是要去做的,另外一个您说的,在多个网站进来的时候我们处理,实际上我们所有数据进来之后,我们都会看看大数据是否之前存在过,是否在其他网站存在过,这是第二个层面,这个数据是不是脏数据库里面存在的,这是第三个层面,对于数据处理这个逻辑还很多,我们数据的多因子聚合是一个最热的数据处理方式是不断回流的。
观众 : 我第一个问题想问一下戴总,咱们这款产品,您感觉跟百度的度蜜还有苹果的SIRI,您的优势是什么。
戴帅湘 : 我刚才在PPT里面也提到了优势,没有强调,我们是非常非常明显地连续的对话,上下文观念的理解,最后帮助你作出决策,三个层面都是,可以现场用度蜜,可以用SIRI,随意问他,你找他能干的事情,有什么东西,你要加油,你可能要去医院,如果他很好做,这些公司绝对不会放弃他,度米也是一样,都做不到,这个时候很有门槛的,这个地方你们可能不相信,这是事实,没有任何一家。

嘉宾观点

新浪微博

参与评论

点击获取
 

(共有 条评论)网友评论