人工智能时代前沿技术社区

首页 > 大数据 > 热点

货拉拉大数据总监刘幸:大数据&智能化体系的建立 | 2018FMI人工智能与大数据高峰论坛(深圳站)

10月28日FMI-2018人工智能与大数据高峰论坛深圳场圆满落幕,货拉拉大数据总监刘幸以大数据&智能化体系的建立为主题进行了精彩的分享。

作者: | 2018-11-07 09:32:52

3刘幸.png

10月28日FMI-2018人工智能与大数据高峰论坛深圳场圆满落幕,货拉拉大数据总监刘幸以大数据&智能化体系的建立为主题进行了精彩的分享。

以下是刘幸演讲内容,飞马网根据现场速记进行了不改变原意的编辑(有删减):

刘幸:大家好!我今天分享内容的标题是《从零建立大数据&智能化体系》。主要分为三个部分。

第一部分:大数据行业综述

首先从不同行业大数据的发展来探讨一下当下的现状。 

金字塔顶端是互联行业因为互联网行业资源充足,其次互联网行业有成熟的工程师文化,数据团队是作为核心竞争力,最后外包模式雄厚的资金也使得互联网居于大数据行业的顶端

第二梯队的是金融行业,金融行业特色采用“外包+正式编制”,重分析和业务。数据可以金融公司带来可观经济效益,所以很重视数据驱动营收的模式明显    第三梯队是交通运输、医疗健康、公共管理、能源、科教等等。这些偏向公益型或者政府主导的,带有大量数据积累的行业。

第四梯队、第五梯队,是制造、建筑、房地产、餐饮、农业、住宿等等。这一批信息化,本身的数据没有太多积累,且资金相对薄弱

大数据、智能化不分家,两者都面临着数据价值落地难的业界痛点。

数据团队不直接产出价值,而是通过业务团队间接产出价值,很难衡量中间的价值量。

产生价值要数据科学团队和业务团队紧密配合。这个配合涉及两个很大的问题:一个满意度问题,一个是部门墙问题。

怎么解决这个问题呢?

1、构建数据体系,用好数据。

2、通过业务将数据找到价值出口,这里面最关键的是团队合作。

数据价值落地闭环

从数据源开始,然后收集埋点、信息转化、数据处理最后得到结果可以是统计分析学结果,可以是数据挖掘、机器学习等等出来的结果)。 

如何用数据?

我们要运营数据,通过做迭代、做循环,有结果要分析、要洞察、要引导决策、持续优化,最后形成数据的反馈闭环。其中引导可以人也可以机器引导,人引导是分析师做的事情,机器引导是人工智能做的事情。    

数据团队体系的组织架构

1、矩阵型模式典型):业务黏度最高

2、中心型在影响力、决策相应度、可复用性和团队结合效率更好。

成熟数据体系的特征:

1、数据有价值。

2、数据成体系

第二部分:企业级大数据体系建设实践

如果要从0开始建设大数据和智能化的体系,应该怎么办?

第一步做数据转换。二是做数据的处理和整合信息经过分析变成情报可以理解为组织得比较好,经过统计和挖掘相关出来的数据,这其实就是情报),情报通过学习变成知识,知识放在应用里面变成智慧,这就是我们讲的智慧城市、智慧交通。智慧的系统做出来安到设备上就是实践,实践之后产生很多数据然后进行反馈最后就形成一个闭环,这是数据自己的闭环。

发展愿景

创业团队或者内部创业团队有发展愿景一是建立数据体系,二是数据化运营,三是数据驱动业务,四是智慧物流企业,五是驱动产业链升级。

方法论

发展方法论叫专业、伙伴、未来

1、专业就是深化内功,带动技术方向,树立业界大数据专业地位,彰显大数据团队的专业知识优势资源。

2、伙伴数据也好、智能化也好,要通过业务找出口和价值需要成为业务的伙伴,业务和数据是相互合作的关系。只有做成伙伴之后才能更好的驱动业务价值产出

3、未来让业务更加智能,让公司更加适应大数据时代或者大数据时代。

建设原则

指导思想是平台化、服务化和应用化

1、平台化:平台使得大数据和人工智能不再是一个工具,不再是一种技术,而是集中资源优势,对数据资产进行深度整合、开发和利用。  

2、服务化:让大数据像当今的专业咨询策划机构一样,不仅接受咨询HIA提供解决方案。

3、应用化:深化大数据服务,使其有形化、标准化、品牌化。

大数据建设初期战略

1、建团队。搭建一个架构团队,先建的是大数据平台、数据分析平台、大数据应用平台,大数据应用平台是大数据产品,后面就是数据仓库,再就是算法,然后就是一个虚拟的架构组。

2、搭平台搭基础平台、集成开发平台、数据服务门户,还有企业级数据仓库和人工智能平台。

3、做应用有大数据的解决方案,大数据产品和智能化产品。

数据从业者的技能栈:

1、数据技能数学、统计学、机器学习、数据仓库等等理论。

2、研发技能Java、SQL、架构能力等。

3、技能:业务知识、抽象思维能力、归纳总结能力、沟通社交能力等。

相比数据技能和研发技能软技能很少受关注但它们同等重要

业务知识,抽象思维能力,归纳总结能力和发散思维,沟通及社交能力,特别是沟通能力和社交能力很重要,因为大部分数据都是通过业务产生价值,所以软件特别重要。数据技能加研发技能,我叫数据工程。研发技能+软技能,就是数据产品,产品经理、数据应用工程师等等这些。数据技能+软技能就是数据分析、数据挖掘。真正的数据科学就是这三个技能之间,既要懂数据技能,又要懂研发技能,还要懂软技能。

第三部分:大数据在不同行业的案例

用户画像

所有的行业都需要用户画像。没有做过数据的人一般对画像停留在感官层面,而数据从业者则是要深入到每个人的内心这样才能做到数据有价值。用户画像是把用户心里怎么想的用数据表达出来这个技术其实就是打标签,也即标签化。

用户画像的数据构建(以金融行业为例)   

1、客户的基础数据金融行业是一个要求数据特别准确的行业,包括身份证、银行卡、收入、职业等等都涵盖在内,其客户基础数据非常全

 2、用户交易数据金融行业最核心的业务数据。

3、客户行为数据:包括交易终端、手机证券易淘金、金钥匙等客户行为浏览数据

4、外部数据如果想要一份完善的用户画像,最好是和外部数据关联结合起来。业界一边是通过数据买卖或者是数据交易

用户画像应用场景

用户画像可以做基础统计、场景化运营、数据挖掘和运营服务评估。

1、基础统计个体分析和群体分析。

2、场景化运营精准化营销客户的生命周期管理

3、运营评估服务运营效果的评估

4、数据挖掘相关的功能。

用户画像可以理解为不是直接产生用户价值的业务系统,而是给很多产生价值的东西提供数据源,提供数据画像的数据源,它是一个基础工作。

智能客服

智能客服是一个典型的应用,它一般分为三个小的模块,一是机器人客服二是机器人助手三是智能问答服务。

客户价值管理体系

这是大数据和人工智能典型的应用。在金融行业特别好,因为金融行业客服单价特别高。这一块做的最多的是流失预警,原因是竞争对手比较多,单价比较高。

智能语音质检

这是智能客服做的副产品。智能客服是提前打一道关,语音质检是到语音客服手上,从语音对话上发现问题,打客户的电话说电话会被录音,录音就是质检。之前抽样质检,10%抽样率,有智能化之后就变成了全量检。

智能投顾

现在金融行业比较火的智能机器人、股票机器人

把人工智能技术用到传统投资顾问里面去的东西,有人说这个行业变味,变成推销产品,用技术包装一层然后推销基金和各种各样的理财产品。但是脱下高科技的外衣本质是一回事。这里强调一下,这里和卖理财产品有区别。智能投顾根据你的风险偏好和投资行为和风险承受能力,有的喜欢炒长线,有的喜欢搏短线,有的操作频率高,有的操作频率低,千人千面,每个人算一次,然后推荐喜欢的和感兴趣的投资组合,进行自动组合,这是唯一的区别。本质还是一堆产品里面挑你喜欢的。

手机APP崩溃分析 

个性化推荐。


我的分享到这里。谢谢大家!