人工智能时代前沿技术社区

首页 > 人工智能 > 热点

揭秘机器视觉中的深度学习

飞马网于11月8日晚邀请到清华大学深圳研究生院在站博士后曲晓峰老师为大家分享机器视觉中的深度学习相关知识。以下是本次先生分享的实录:

作者: | 2018-11-09 16:33:03

飞马网于11月8日晚邀请到清华大学深圳研究生院在站博士后曲晓峰老师为大家分享机器视觉中的深度学习相关知识。

以下是本次线上直播分享的实录:

今天分享的主题是揭秘机器视觉中的深度学习。

一、机器视觉简介

机器视觉简单说就是基于图像的工业自动化检测。

 

机器视觉的硬件组成主要包括五部分:

1、光源:简单理解就是灯,常见的是LED,机器中常见的也有日光灯等高亮的灯,色温等都有很大的影响。

2、镜头:比较具有代表性。常见就是普通的镜头组,代表呈现的光学系统。

3、相机:传感器。

4、采集卡:针对传统相机,现在很多存在返卡。

5、运算平台:通常来说,机器视觉的运算平台就是一个PC,只不过用的是工业控制机。工控机是一个很结实、扛燥的PC。除此之外,也有一些是小型的嵌入式设备;或运算平台和相机结合在一起,也就是智能相机。 

常见的应用例子:

计数、包装印刷、纺织品、电子产品等的表面检测、运动定位、尺寸测量、OCR 

机器视觉行业近几年的发展

2000年以后才兴起的;

2008年,金融危机波折,使得整个行业受很大影响;

近年人工智能复兴,又进入了上升期。 

项目开发流程:

需求、系统、算法、软件、投产生产 

与计算机视觉、图像处理的区别:

机器视觉的理解很多,这里从狭义的基于图像的工业自动化检测。光机电系统化、项目定制化。光机电系统化、项目定制化

计算机视觉更为广义,对场景的理解。

图像处理:底层技术,不管是计算机视觉还是机器视觉都用到很多图像处理的技巧。

二、深度学习在机器视觉行业的应用

深度学习

一般是指多层的卷积神经网络(图像)或者循环神经网络(语言或语音)在我的这次分享中,机器视觉专指深度的卷积神经网络或者是以这个为基础的其他一些算法。

模式:卷积层+基础层,或者重复很多次,形成全连接,然后输出

核心:多层次的卷积和非线性的激活

主要优化方法:梯度负反馈

有效性的反馈:基于目标数据的优化和充足的计算能力

涉及难点:根据需求定义一个合适的损失函数 

机器视觉行业

从产品上划分(如图)

机器视觉行业企业

从历史沿革上划分

传统机器视觉公司:大恒、凌云、微视(之前的很多从业走出繁衍)

大型制造集团北京的机器视觉子公司:海康、大华

人工智能浪潮下的创业企业

国际上:美国、加拿大、日本、德国 

机器视觉软件生态(如图)

 

ViDi

随着深度学习的兴起而诞生

主要分三个组件

绿色:针对分类问题

蓝色:针对定位问题和识别问题,检测或计数的目标在哪等

红色:缺陷检测

具体实现;

绿色模块(如图)

蓝色模块(如图)

红色模块(如图)

 

例子:TensorFlowFaster R-CNN(如图)

作用:无代码或者少代码的实现物体检测,可以迅速上手,且潜力巨大;在与训练模型上做不需要几周几个月,一天即得;简单切换训练数据,迅速验证概念可行性 

三、展望 

深度学习的发展趋势与局限:

1、深度学习在图像处理方面是一种特征提取方法,是一种优化方法

2、在算法开发的各个流程,都还可以显著提升效果

3、受运算性能局限,网络不能无限加深,近期学术上研究的热点是提高效率,缩小体积同时还能保证一定的性能。现在几乎各大厂商都在推出带有AI引擎的芯片来终端市场,就是想把深度学习赋能到生活中去

4、深度学习的应用领域还在不断拓展

5、非监督,少样本甚至单样本效果还不理想

6、深度学习虽然很强大,但也只是算法,物理上拿不到的信息,深度学习也变不出魔法 

机器视觉行业发展

1、以深度学习为基础,一些应用上会出现规模化市场

2、对运算能力的需求还会继续增加

3、新一代的智能相机必备AI引擎

4、中高端定制化市场暂时还难以被深度学习攻破,但会受益于深度学习带来的提高

 

以上就是本次线上直播的主要内容,相信你对该领域的知识已经有了一定的认识。想了解更多更详细内容的小伙伴们,可以关注服务号:FMI飞马网,点击菜单栏飞马直播,即可进行学习。

微信图片_20180530151141.jpg