一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

- 编辑:admin - 点击数:981

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

计算机视觉为什么重要?

人的大脑皮层,有差不多70%都是在处理视觉信息。是人类获取信息最主要的渠道,没有之一。

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

而在计算机视觉出现之前,图像对于计算机来说是黑盒的状态。

一张图片对于机器只是一个文件。机器并不知道图片里的内容到底是什么,只知道这张图片是什么尺寸,多少MB,什么格式的。

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

如果计算机、人工智能想要在现实世界发挥重要作用,就必须看懂图片!这就是计算机视觉要解决的问题。

什么是计算机视觉–CV?

计算机视觉是人工智能的一个重要分支,它要解决的问题就是:看懂图像里的内容。

比如:

图片里的宠物是猫还是狗?

图片里的人是老张还是老王?

这张照片里,桌子上放了哪些物品?

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

计算机视觉的原理是什么?

目前主流的基于深度学习的机器视觉方法,其原理跟人类大脑工作的原理比较相似。

人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

机器的方法也是类似:构造多层的神经网络,较低层的识别初级的图像特征,若干底层特征组成更上一层特征,最终通过多个层级的组合,最终在顶层做出分类。

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

计算机视觉的2大挑战

对于人类来说看懂图片是一件很简单的事情,但是对于机器来说这是一个非常难的事情,说2个典型的难点:

特征难以提取

同一只猫在不同的角度,不同的光线,不同的动作下。像素差异是非常大的。就算是同一张照片,旋转90度后,其像素差异也非常大!

所以图片里的内容相似甚至相同,但是在像素层面,其变化会非常大。这对于特征提取是一大挑战。

需要计算的数据量巨大

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

CNN解决了上面的两大难题

CNN属于深度学习的范畴,它很好的解决了上面所说的2大难点:

CNN可以有效的提取图像里的特征

CNN可以将海量的数据(不影响特征提取的前提下)进行有效的降维,大大减少了对算力的要求

CNN的具体原理这里不做具体说明,感兴趣的可以看看《一文看懂卷积神经网络-CNN(基本原理+独特价值+实际应用)》

计算机视觉的8大任务

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

图像分类

图像分类是计算机视觉中重要的基础问题。后面提到的其他任务也是以它为基础的。

举几个典型的例子:人脸识别、图片鉴黄、相册根据人物自动分类等。

一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

这里需要说明一下,条形码和二维码的扫描不算是计算机视觉。

这种对图像的识别,还是基于固定规则的,并不需要处理复杂的图像,完全用不到AI技术。