今天在西溪园区举行的生意参谋媒体沟通会上,阿里巴巴集团副总裁车品觉对阿里大数据策略作了系统解读阿里巴巴产品采集助手。他首先谈到“整合”对于数据的意义,“零散的数据没有办法产生价值,所以第一步,我们需要强大的系统对各类数据进行有效的采集和整合,然后才能享用大数据带来的价值。”
据介绍,阿里巴巴数据技术及产品团队已经建立起一套多来源、线上线下全渠道、多屏的数据采集体系,能够实现阿里集团、阿里系乃至全域大数据资产的采集通路。以商家数据体系为例,现有数据包含商家售前、售中、售后三大环节的八项业务过程阿里巴巴信息采集器。千余个数据指标覆盖商家开店装修、选品、营销运营、成交、仓储、物流、评价、售后服务等多项经营行为,贯穿商家业务全链路。全域数据采集,是整合零散数据、使之产生价值的基础,也是阿里数据团队的基本“武功”之一。
建立数据公共层1688数据采集器,让服务效能和质量双重提升
多来源数据采集完成后,在数据产生价值前还有更深一层的要求,即如何打造口径标准统一阿里巴巴采集软件,计算全面精确的数据。对此,阿里巴巴建立了一套全集团的数据公共层,以OneData体系对多来源数据进行处理,进而以此为出口,对外提供标准化的(standard)、服务化的(service)、安全的(safe)、共享的(shared)数据。同时,通过OneID等计算标准和算法能力的升级1688商品关键词采集工具,对原本独立的个体数据进行有效归一,看似不同的个体数据得到高效集成和最大程度丰富,离散数据计算和存储带来的信息冗余问题也随之得到解决。
在实时和离线数据公共层之上,阿里巴巴还建立了实时和离线数据应用层,该层支持各类来源的个性化数据的计算、存储和调用,与数据公共层配合服务业务。基于此,阿里巴巴大数据系统不仅能为客户提供标准、统一、全面、精确的数据,同时还能满足多样化的数据服务需求,进而带来数据价值的最大化发挥。基于两个数据公共层及数据分发技术的应用阿里巴巴产品采集助手,数据的处理时效得到大大提升,单就实时来说,实时计算和实时推送的服务响应能力均可达到秒级。
目前,基于OneData体系下的阿里巴巴数据公共层已经支撑了淘宝、天猫、聚划算、无线、搜索、阿里妈妈、航旅等20余个团队超过30个产品和应用,日均调用约20亿次,双11当天更是超过75亿次。
文章地址:https://www.tianxianmao.com/article/online/qysjcjrlsdsjyyy.html