人工智能时代前沿技术社区

首页 > 人工智能 > 热点

专访美国华为研究院Chief Architect & CTO 胡鲁辉: 价值化是当前大数据和人工智能的关键

2017年8月5日,由飞马网主办的“FMI2017国际人工智能&大数据高峰论坛”将在北京国家会议中心盛大开幕,现在距离大会开幕还有一周多的时间,飞马网记者提前采访了将会在大会上做重要演讲的专家胡鲁辉,让我们来听听他对于大数据及人工智能的看法。

作者:谭盼雨 | 2017-08-03 13:29:00 | 来源:飞马网原创

2017年8月5日,由飞马网主办的“FMI2017国际人工智能&大数据高峰论坛”将在北京国家会议中心盛大开幕,现在距离大会开幕还有一周多的时间,飞马网记者提前采访了将会在大会上做重要演讲的专家胡鲁辉,让我们来听听他对于大数据及人工智能的看法。

胡鲁辉.jpg

胡鲁辉 美国华为研究院Chief Architect & CTO

飞马网:胡老师您好,请您简单做下自我介绍,包括您一直关注哪些技术?

胡鲁辉:我在美国华为研究院之前的过去十来年,一直在亚马逊和微软的总部工作。从一开始在亚马逊做电商云到大数据云计算,后来到微软的大数据云服务和智能服务,到现在华为的大数据智能云服务。我比较喜欢技术挖深,所以在带领团队推出多个服务产品同时,常常会深入研究一些有意义的关键技术点,当然我目前所关注的技术领域还是云计算、大数据和人工智能。

飞马网:您之前在亚马逊和微软都工作过,国内外企业在对大数据挖掘与数据应用这方面有哪些不同呢?

胡鲁辉:对于大数据挖掘与数据应用,之间的差别还是有一些的。主要可以体现以下几点:

一、国外企业(主要是美国)走的相对早,从技术方面,应该领先不少,但是由于大数据有不少开源的工具,这从中帮助了不少后来的企业快速推进。当然利用开源的很难打造竞争力,而且有不少开源工具离真正商用还是有很大的距离,这是有些商家所不知的。所以亚马逊微软谷歌有不少是自研的,这样一来从技术方面他们至今还是有绝对优势的。 比例亚马逊的Kinesis和Aurora,微软的Data Lake和Cosmos DB,和谷歌的Spanner等等。

二、同样由于走的比较早,国外企业应用的领域也相对比较广泛和深入,无论是用户数据分析、机器数据处理(主要来自云计算和企业内部数据中心)、医疗数据洞察和基因数据计算等等。但是国内巨大的用户量和市场,在许多方面已经具有巨大的数据,尽管数据复杂性也很大,但是潜力非常之大。特别当智能物联网(IIOT)的到来,这里的机会会更加巨大。

三、大数据挖掘与数据应用少不了人工智能,尽管华人在这领域的从业人员在全球比例非常高,但是许多核心的算法工具和平台还是来自国外,比如谷歌TensorFlow,微软CNTK,Spark ML,R等等和它们形成的生态。当然人工智能的算法开源和民主化(AI Democracy)推动了快速应用和生态的形成。

飞马网:现阶段,大数据应用领域有哪些特点和困境?您又是如何看待的?

胡鲁辉:当前大数据可以说已经从概念走向了应用,大家也开始接受这个新东西并且已经受益不少,但是真正达到大家所期望的大数据价值还是有不少挑战,主要是大数据工具有很多但是使用门槛太高,数据安全和数据治理问题,大数据应用领域的复杂性等等。所以如何实现大数据的价值是我们需要思考的问题,而不只是概念理解或工具技术开发。

飞马网:请为我们解释一下“智能大数据应用”这个概念。

胡鲁辉:这个概念比较广,可以简单理解为利用人工智能挖掘大数据,使数据更加智能化和价值化。我觉得价值化是当前大数据和人工智能的真正关键,是它们颠覆现有技术、能够形成巨大产业的关键。

飞马网:您认为大数据与人工智能之间是什么关系?

胡鲁辉:我们常常把大数据和人工智能有个区分,但是其实应用上有许多关联,可以相互为另一方的工具,比例说通过人工智能处理大数据或者大数据提高了人工智能效果。更重要的是大数据下的巨大计算能力和丰富的数据使人工智能的发展和应用成为可能,同时人工智能可以使数据产生更大的价值。

飞马网:对于大数据分析与大数据应用的前景,请谈谈您的看法。

胡鲁辉:虽然我在前面提到了大数据如何价值化的挑战,但是我对其前景还是比较乐观的,应该是充满着激情。我觉得许多挑战只是在于技术本身和我们的观念,但这些只是个时间问题,随着数据爆发式增长和智能物联网(IIOT)的来临,必将形成巨大产业。

飞马网:有人说,数据量是做人工智能的重要前提,您认为数据量在人工智能研究的过程中占据怎样的地位?多少数据量才算是可以做人工智能的标准?数据量小的企业该如何应对?

胡鲁辉:这是有针对性的。人工智能领域比较广泛,对许多机器学习方法来说,数据量的要求其实不是很高的,但是对于深度学习等方法,巨大的数据和巨大的计算能力是非常关键的。最近几年深度学习等发展非常振奋,是个革命性的突破,这种统计类的方法,需要丰富的数据,但不只是量,应该说数据越丰富越好。

对于数据量小的企业可能是个挑战,技术上transfer learning和incremental learning等方法会非常有帮助。另外我觉得智能民主化(AI Democracy)不应该只极限于算法平台,模型(model)共享和相互优化是个思路,这才是更大的平台。

飞马网:您认为人工智能最有可能从哪些行业或领域有所突破呢?为什么?

胡鲁辉:人工智能本身不是新东西,但是这几年深度学习(主要是CNN和RNN)发展取得了前未所有的突破,同时增强学习和NLP也取得了不错成就,主要应用的领域有内容推荐,认知辅助(包括图像识别和语音识别等),控制系统,机器翻译,欺诈检测等等。所以可以广泛应用到许多行业,比例工业制造、医疗事业、电商、公安、金融、物联网、办公助理、企业客服等等。

2017年8月5日,胡鲁辉将会在由飞马网主办的“FMI2017国际人工智能&大数据高峰论坛”上围绕着“智能大数据应用”做重要演讲,详细讲解在AI时代,利用人工智能技术挖掘大数据,使数据更加智能化和价值化。20+位专家,1000+技术同仁,大会虚位以待,赶紧报名参加吧!

【责任编辑:谭盼雨】