1. 数据收集
京东商城信息采集 数据收集的来源:
京东拥有我认为几乎是互联网上最完整、最精准、最高、最长完整链条的数据。
第一方面,京东商城一年有大几千亿的销售额,十几万的商家,10亿以上的商品每天沉淀在平台上,有大量的数据可以为整体的后续营销和人工智能建设服务。
第二方面,我不知道大家有没有用过京东白条?实际上像京东白条,包括理财产品,对用户来讲是有非常高价值的数据。
第三方面,是物流。今年4月份,京东宣布整个物流子集团成立,意味着京东物流从一个供给自身商城业务,扩展到社会化物流。我们现在也开始给大量的品牌方服务,可能这个商家在天猫开店,但它是用京东的仓库,用京东的整个物流体系。各个地区行业的数据获取可以更高,当然数据是永远没有止境的。
京东产品总监朱文伟:利用AI加速构建营销新模式
第四方面,东哥(刘强东在开年大会上)也提了无界零售。我们现有八家京X计划,包括腾讯,今日头条,都是行业里最大的媒体和流量端。通过整个的数据清洗,让我们的数据更完整。
数据收集的原则
互联网真正地采集了大量的数据,这是人工智能的第一战场。在数据整个收集过程里有几个点,是我想强调的:
第一个,数据并非越多越好
如果有些数据是无效的,也不用刻意地生产很多画像。
第二个,没有应用场景的画像没有任何价值
举个例子,比如你喜欢吃核桃,你又打王者荣耀,你觉得王者荣耀知道你喜欢吃核桃这件事情有任何价值吗?他可能给你出个核桃的装备吗?听上去好像没有什么商业意义。
第三个,大部分画像都是一种概率
大部分数据,包括用户画像,你可以认为它是一种概率。比如京东商品信息采集,在我们家大部分电商的消费都是我来完成的,也会帮我老婆买一些女性用品,由于我其他行为也不多,可能我就会被定义为一个女性用户。但实际上我在其他方面的行为并不是一个女性用户,所以它会存在偏差。
京东商品采集器 第四个,不要过度关心用户避免用户焦虑
这个在互联网早期比较多,总让用户填一些个人信息问卷;其实很少有人会认真地去填,所以尽量不要去打搅用户。
<文章地址:https://www.tianxianmao.com/article/online/jdcpzjzwwlyAIjsgjyxxms.html