首页 > 人工智能 > 热点

Facebook的高分辨率卫星图像深度信息提取实践

深度学习不仅仅是用在类似于卫星图像这样高精尖的行业,在很多航拍、无人机应用等方面也已经非常成熟。包括现在的共享单车,可以做到更分辨率!未来,深度学习、图像识别等技术还会被应用在生活的方方面面,给我们的生活带来更多惊喜与便利。

作者:谭盼雨 | 2017-08-24 13:27:09 | 来源:飞马网

在阅读这篇文章前,我们先来看一个场景:

有一天,饥肠辘辘的你在某APP上点了份想想就流口水的麻辣小龙虾,系统显示约半个小时后你就能迟到小龙虾了!然后过了一会,肚子的响声提醒你看一下外卖是不是快到了,你打开APP,看着送餐员的轨迹距离你还有1000米、800米、500米......你放心地喝了口水,再一看,距离你还有550米、600米、750米......你慌了,不得不拨通送餐员的电话,告诉他:你走错路了!

以上的场景,相信很多人都经历过。你是不是也希望,如果可以精确可控自己的地图该多好啊!那就来看看下面的内容吧,是来自研究地图的幕后的大咖----王胤带来的分享:关于高分辨率卫星图像深度信息提取。

1.png

王胤

王胤,前Facebook部门负责人、现饿了么技术VP。

首先,王胤给我们介绍到,Facebook跟微信很相像,微信里面可以看到各种各样的地图,可以分享位置,Facebook也是一样的,Facebook有商家的位置,可以导航,所以Facebook在这方面的使用量应该是在全球仅次于谷歌的规模。

为了把这个地图做的更好,当初Facebook做了很详细的地图分布的应用,考虑到各个国家地图的分布,把开源地图也好,商业地图也好和其他的地图拿到一起做了一个分析,发现在发达国家,包括北美和欧洲,这个地图质量,开源地图已经跟商业地图质量非常接近,粉红色表示覆盖率真的很高,有问题的地方是在东南亚、非洲、中美比较落后的一些国家。

但是分析的结果发现蛮令人鼓舞的,在大部分的国家和地区,开源地图已经超过商业地图,在大概30个国家左右开源地图明显比较落。

那怎么把开源地图质量提高呢?

王胤告诉我们,当时考虑的一个重点是关于深度学习这一块的引入和包括对图象处理的增强。另一个方面,数据的来源全球范围内有很高清的30亿级别的微信地图的覆盖,这是世界上唯一一个提供这么高分辨率的地图公司,和Facebook是合作关系。而开源地图覆盖率,为贫困国家或者发展中国家提供更好的地图,改善这些国家的经济状况。

据王胤老师介绍,地图真正有问题的地方是在发展中国家。发展中国家间情况也有很大的区别,不同国家的道路情况不一样,用同样的预测方法是行不通的。

由于数据的不吻合问题,所以当初很快用了当地的数据结合了开源地图,将当地的开源地图的数据和卫星图像结合,重新做一训练,再出结果,马上可以看到很大的改进。

经过了一些改进和更好的训练数据和更好的模型和各种各样的优化,后来做了一个泰国的城市的训练结果,可以看到非常好的效果。另外,在埃及的一个小村庄做的一个道路的检测结果也是非常不错的,整个图像里面一条水泥马路或者国家马路都没有,全部都是土路。那么问题来了:计算机自动学习到底什么样的是一条路,能够正确的把这些道路跟农田里的道路区分开来?

王胤告诉我们,它是从旁边是否有建筑来做一个判断,这个在传统的方式要花大量的时间去分析,而机器学习把图像和数据传进去,自动把这个事情可以做好。

商业应用落地实践

说到商业的应用,王胤表示,其实跟学术应用不太一样,商业应用需要很好的落地的方案,不光是说在图片上看上去结果不错就可以了。而Facebook当初也是为了这个产品落地化花了很多时间做很多后续处理,比如原始预测只是一个位置,变成一个矢量图要花很多的时间和工作。

具体的工作步骤如下:

一、从原始的预测出来的位置图里面提取出一些比较可信度高的道路的片断,

二、有了骨架以后,我们可以把道路连通,可以生成一个更加连续的,更紧贴近实际的道路。

三、有了道路网以后,将现有的地图,跟原始的地图进行一个匹配,通过匹配以后,保证这个道路没有重复,同时跟现有的道路联系起来。

四、去掉多余的不连通的边际,形成一个连通的道路网。

除了技术方面,说到真正的生产的话,王胤告诉我们,需要做很多预测,很多的改进和更新优化的工作。比如说其中的一个工作,不光是要体现道路的预测的结果,还要把这些居民区的位置,给标注出来,这样的话,大家在看这个道路的时候,更能够清楚这个道路是居民区的道路还是主干道。

通过这种方式,不光能够识别道路,也能够识别建筑,就能够把这个地图信息更加丰富起来,其实原始的卫星地图,我们是不能跟用户直接分享的。因为这是版权问题,但是可以通过这种方式把一些需要的信息,需要地图编辑的信息分享出去。

为了更加提高准确性,也是需要做一些工作来确定地图一定是满足要求的。比如把有问题的道路标记出来,提醒人工处理等。

另外,王胤表示,我们是不可能做出跟一个国家等比的训练数据的,耗费的人力时间太长了,但是可以通过全局预测检验的方法发现问题,然后把训练数据不断的完善。

而关于道路的名字,无论做的再精准,我们肯定还是有不知道名字的。Facebook有这么大的平台,通过众包的方法,让用户准确的提供一个道路的名字。

其他应用

现在,各种各样的工具分辨率越来越高,被应用在各行各业,以下是王胤为我们举的一些例子,以便大家加深理解:

* 比如国外比较成熟的商业应用,通过不停的照一个商业区的地图,分析这个商厂停车数量,通过停车数量变化的轨迹分析交易量,交易量分析之后,分析股价的走势,已经有好几个商业公司在做这个事情。

* 再比如飞机,飞机场飞机的数量也是一样的分析。

* 包括油井,分析全世界油罐储量,通过阴影分析油罐储量的比例,预测原油的走势。

* 包括政府也有很多的应用,这是国内的应用,会希望能够把农田做地块划分,很多偏远地区,农田没有很好的划分,并不知道这块田到底住什么,政府给一些补贴或者出的方案也得不到落实,政府希望得到这样的信息,城市里面违章建筑的检测。

王胤表示,现在,深度学习不仅仅是用在类似于卫星图像这样高精尖的行业,在很多航拍、无人机应用等方面也已经非常成熟。包括现在的共享单车,可以做到更分辨率!未来,深度学习、图像识别等技术还会被应用在生活的方方面面,给我们的生活带来更多惊喜与便利。

以下是王胤与粉丝的Q&A环节:

Q:算法做的效果并不是太理想,你们加入了当地的数据,效果得到了很明显的提升,这个有没有一些开放的计算的方法的资料?

A:其实没有特别多的经验,就是一个训练数据跟测试数据匹配的问题,之前的论文里面提出的训练数据都是美国的数据,美国的道路跟泰国是不一样的,用美国数据训练出来的话,机器也不知道泰国的道路是什么样子。

Q:您提到的例子中数据应该是城市比较规范的道路,如果乡村关于道路的数据,可能相对来说,开放的数据不是特别多,你们做的时候,是否有一些数据是完全用的OSM的数据?

A:OSM有数据,我们自己绘制了一部分数据,这个数据没办法开放,这个工作比较复杂,主要是要有耐心。因为这是工业的应用,你要发论文的话,大家觉得这是已经解决的问题,对于细节方面不是很关心。

Q:我想通过程序来实现比如车辆它行使的热门路线的轨迹,这种的话,他算法上需要怎么实现,或者说它需要的研发的时间有多久?

A:这个相对比较容易,他没有深度学习图象处理的问题,更多是把轨迹绘制出来,这个我之前做过很多的工作,我们可以线下讨论一下。

【责任编辑:谭盼雨】