人工智能时代前沿技术社区

首页 > 人工智能 > 热点

AdMaster技术副总裁卢亿雷:数字营销在人工智能领域的实践

提到数字营销,相信很多人都非常熟悉,但以往我们接触到的数字营销大多说的都是在大数据领域的应用。在AI时代,数字营销同样引人注目。今天,我们要说的是AdMaster技术副总裁卢亿雷在飞马网的FMI人工智能峰会上,为我们介绍的数字营销在人工智能领域的实践!

作者:谭盼雨 | 2017-09-14 11:11:40 | 来源:飞马网

提到数字营销,相信很多人都非常熟悉,但以往我们接触到的数字营销大多说的都是在大数据领域的应用。在AI时代,数字营销同样引人注目。今天,我们要说的是AdMaster技术副总裁卢亿雷在飞马网的FMI人工智能峰会上,为我们介绍的数字营销在人工智能领域的实践!

1.png

卢亿雷,AdMaster技术副总裁,大数据资深专家,CCF大数据专委委员。 对分布式存储和分布式计算、超大集群、大数据分析等有深刻理解及实践经验。有超过10年云计算、云存储、大数据经验。

卢亿雷表示,现在人工智能很火,但是对于“智能”这个概念,大家容易有理解上的偏差。卢亿雷告诉我们,按照我们现在目前的发展来说人工智能分成两大块:第一块是符号智能,传统的人工智能。第二个叫计算智能。这块其实也是我们目前实践最多的,是我们目前发展最快的点。

而人工智能的基本技术,它主要分为5大块:

* 第一个,很大的知识库,其实很多时候,你要做人工智能应用, 如果没有数据库的话,也是很难实现的。

* 第二个搜索技术,目前不管是国外的谷歌,还是中国的百度,  它提的更多,它天然而然把搜索引擎应用到人工智能里面来。

* 第三个推理技术,个人驳议,就是推理的。

* 第四个是知识获取技术,这块也是未来比较重要的方向,你如果没有什么方法来获取知识的话,那人工智能的发展还是有限的。

* 第五个应用场景。

目前大家重点看好的人工智能方向有两个:第一个,是自然语言的理解,这块是未来的方向,现在目前看到很多这样的,机器人也好,它都是对语言的理解。第二个,计算机视觉,卢亿雷告诉我们,计算机视觉是他非常看重的一个点,目前很多机器人的图象识别技术做的还是比较弱的,如果能把这块突破的话,将会很有前景的。

卢亿雷表示,如果没有数据的话,其他的发展是比较缓慢的,如机器智能,数据智能,计算智能,最后是类脑智能,这块是未来的发展方向。

接下来,卢亿雷给我们介绍了6个算法模型,以及在数字营销行业里面的应用。

* 第一个是SVM,这边主要判断比较通用的分析,判断你的性别跟年龄,你的广告投放是不是安全的,比如说是不是投放在一些色情的网站。

*第二块是自然语言处理,我们会对于这些情感判断,判断这句话对于阅读者和写作者来说,他是中性的还是正面的还是负面的,我们会做一个深度分析,第二做主题的分类,比如说这个是汽车,什么样的叫汽车?我们会做一个分类。

*第三块聚类分析,我们把已有的人群做人群的聚类分析。

*第四块回归分析,CTR,还有把历史的数据做综合投放效果,哪些平台,哪些媒体效果最好,我们会做深度分析的。

*第五块,GBDT,这块主要是用在,判断这个设备ID是不是属于同一个人,再一个应用于CTR预估。

*第六个时间序列分析,很多人做的很不错,在实验室里面效果非常不错,但是一到实际环境里面效果不好,他很容易忘记时间序列,我们已经把这个人判断出来他的性别、年龄,包括个人兴趣判断的很准确,但是投放的时候效果是相反的,其实他是没有考虑到时间因素。

另外,关于深度学习这一块,卢亿雷基于Hidden nodes这一点告诉我们,不是你的Hidden nodes越多越好的。这个时候你需要做一些取舍的。因为你如果做的层越多的话,最后你发现你的结果可能体现的度也是有限的。所以我们可以通过其他的方面来调整这个参数。

而TensorFlow基于Spark,其实你修改了代码,不超过10行。但是它其实还是有很多坑的,一个你发现你跑过以后他的性能上不去了,第一个点,新的版本叫RDMA,这时候我们知道机器学习里面,你如果基于网络的话,其实你的性能,它会急剧下降的,你怎么把它打通呢?我们直接通过RDMA的方式可以快速提升你的计算性能。基于这样,我们原来做的一些机器学习,相当于比较快速的可以上手。

另外卢亿雷给我们介绍了几个常见的案例,第一个是跨设备识别到人,来告诉我们怎么把设备ID信息分别出来是同一个人?

答案是可以通过算法包括行为分析来识别的。

而且识别的方式分为三个层次:

▲ 第一个就是识别阶段,识别一个家庭,我们通过具体行为识别个人。对于同一台电脑,不同时间段,我可能可以识别你是不同的人,比如你上网,或者白天你小孩玩电脑,晚上以后,可能是爸爸妈妈在上网,因为每个人访问的习惯是不一样的,所以同一个设备,在不同场景下能够识别出来。

▲ 第二个通过IP结合行为属性。其实IP它也分场景的,我们知道有高校IP,公司IP,基站IP,甚至还有家庭IP,分好多类别的,你把类别做区分以后,那这个智能识别会很好的。

▲ 第三个,我们需要结合人的行为。通过分家庭组,再到个人,其实到家庭的话,您回到家以后都有路由器,你的路由器一定是通过手机,或者是PC,或者是电脑连接在一起,甚至跟你的电视盒子连到一块的。

另一个场景,深度学习,图像识别,广告行业为什么还要做图象识别呢?其实很简单,我们在图象识别的时候,因为我们公司是做一个第三方效果监测的公司,我们要判断这广告是不是有作弊的行为。证据是我把图截下来以后,这样我可以把证据拿出去告诉广告商说你这个是有问题。对图象识别有很高的要求的。

对于图象识别来说,你不是简单把图象识别出来就可以了,你需要把它周围的包括相关的知识库连在一起,你才能把这个很好的识别出来。

一旦识别出来这个层次以后,对于我们AI实现来说,要求蛮高的,第一个图象识别做的很好,第二,知识库得好,第三个,时政的东西,都要有。这时候你需要自动化的把图片识别出来,图象识别出来以后,你还要识别出来他的logo,包括他里面的内容是什么样的,当时表现出来的状态是什么样的,一个是图像的识别,包括序列的匹配。第三你需要很强大的知识库才能做这个事情。

第三个场景是什么地方呢?我们有很多的行为数据,怎么把海量的行为数据通过我们的机器学习把作弊的行为抓出来?

卢亿雷表示,这个地方你是可以通过不断调整你的模型,包括你的行为的参数特征,你要做的很强大,你才能把这个做出来的。比如你现在刷广告流量的话,你可以自己换你的ID,包括你的UI的长短,你都可以做各种调整的。

做第三方监测效果评估公司,暴光与点击,包括时间、地域,包括受众重合度,这样的维度,我们通过手动的方式实现这个实行,手动报告以后给广告主。这样你做的时候其实这个成本是蛮高的。这个有没有什么方法?卢亿雷表示,会自动帮你选择哪些媒体,哪些广告位,哪些时间段,哪些地域,哪些人群,我全部给他智能化打成一个包,自动投放出以后,投完以后,会自动的做重新的选择。

其实基于这些场景,自然人可以把这个效果做的真正的效率智能化,卢亿雷告诉了我们一个词叫做营销自动化,现在也叫营销智能化,也是这个原因。卢亿雷表示,我们在数字营销在人工智能的发展趋势,不只是把广告投出去了就OK,我们希望把这个广告投出去以后,任何人都不反感。

一、搜索的革命。比如我找一个地方吃饭,这个饭店很好吃。其实我们这里会做基于搜索意图算法,其实你没输入的时候,我很可能预测到你大概做什么事情,这是无限搜索的过程。

二、搜索引擎智能化。现在的AI,包括广告投放,人全是个性化了,你怎样把每个人做细分,把每一个点做人群的精准投放,个性化的内容推荐。卢亿雷认为,最终达到“私人定制”才是搜索引擎智能化做到最好的效果。

三、TPU。TPU,其实是专门基于线性的来做计算的。目前的服务器,或者台式机,达到几个T或者十几个G的计算能力已经是不错的,而TPU是180个T,这样这个计算能力,在大数据时代是非常重要的。

最后,卢亿雷还是用一句话结束了自己的分享:以后的数字营销,真正的智能化,是会让大家对广告没那么讨厌,让用户感到这个广告确实是自己想要看到的东西。

以下是卢亿雷现场与听众的Q&A环节:

Q:现在基于移动化设备的精准营销,涉及到用户不想被挖到的数据,请问在做研究的时候有没有考虑到下一步跟法律边界的交互,该怎样进行隐私保护?    卢亿雷:确实大家都很关注数据隐私,是在今年6月1号发布的双高,高检法、法院、检察院,对个人的隐私,如果我没记错的话,是规定超过50条的隐私,就涉及到刑法,还蛮严重的。我们也是深刻研究了广告的内容,它有两个点:

第一个点,PI数据,个人的这些,像电话网,包括你的姓名,这些是PI数据,这些PI数据,是你绝对不能做的,这是一个非常非常重要的问题。

第二个对于这些PI数据如果是加了密的,是不可逆的,其实你可以做数据交换,我们在做个人IP识别的时候也是一样的,像设备ID,我们的ADFA,本身就是一个不可逆的东西。其他的IP,我们是不碰的,像身份证号码,是不会碰的,不会有这个问题。其实我们这边做的事情是把这些ID信息放在一块以后,他不是概率问题,它是一个画像,它不是一个耽搁IP,因为我们是一个弱IP体系,不是一个强IP体系,自然可以做到20%,30%,做的好的话,可以做到80%,90%,这也是基于算法来做的。第二个利用场景的时候,我把这个IP的个人信息,只是用户在触达你的时候,你给他推,这块我们确实我们不会触碰红线的。

Q:您刚才提到的是针对于人的兴趣来推送广告的,但是我们知道,广告效果评估的时候,一般是内容跟区域进行推送,看这个地区的消费情况,才推断出他的广告的效果,对于这部分您是怎么做的?

卢亿雷:像广告它在想要做广告投放的时候,是怎样做的?第一个点,会定投某个城市,某个时间段,甚至他可能定投到的,他都会定下来的,但是定完以后,其实关注的还是人群。

第二个,我们在做的时候,如果你试先知道这个人,他是这个行业的,你事先知道的话,预测完以后,你再投放广告,效果会事半功倍。

【责任编辑:谭盼雨】