一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)
- 编辑:admin - 点击数:981一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

人的大脑皮层,有差不多70%都是在处理视觉信息。是人类获取信息最主要的渠道,没有之一。

而在计算机视觉出现之前,图像对于计算机来说是黑盒的状态。
一张图片对于机器只是一个文件。机器并不知道图片里的内容到底是什么,只知道这张图片是什么尺寸,多少MB,什么格式的。

如果计算机、人工智能想要在现实世界发挥重要作用,就必须看懂图片!这就是计算机视觉要解决的问题。
什么是计算机视觉–CV?计算机视觉是人工智能的一个重要分支,它要解决的问题就是:看懂图像里的内容。
比如:
图片里的宠物是猫还是狗?
图片里的人是老张还是老王?
这张照片里,桌子上放了哪些物品?

目前主流的基于深度学习的机器视觉方法,其原理跟人类大脑工作的原理比较相似。
人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。

机器的方法也是类似:构造多层的神经网络,较低层的识别初级的图像特征,若干底层特征组成更上一层特征,最终通过多个层级的组合,最终在顶层做出分类。

对于人类来说看懂图片是一件很简单的事情,但是对于机器来说这是一个非常难的事情,说2个典型的难点:
特征难以提取
同一只猫在不同的角度,不同的光线,不同的动作下。像素差异是非常大的。就算是同一张照片,旋转90度后,其像素差异也非常大!
所以图片里的内容相似甚至相同,但是在像素层面,其变化会非常大。这对于特征提取是一大挑战。
需要计算的数据量巨大

CNN解决了上面的两大难题
CNN属于深度学习的范畴,它很好的解决了上面所说的2大难点:
CNN可以有效的提取图像里的特征
CNN可以将海量的数据(不影响特征提取的前提下)进行有效的降维,大大减少了对算力的要求
CNN的具体原理这里不做具体说明,感兴趣的可以看看《一文看懂卷积神经网络-CNN(基本原理+独特价值+实际应用)》
计算机视觉的8大任务
图像分类
图像分类是计算机视觉中重要的基础问题。后面提到的其他任务也是以它为基础的。
举几个典型的例子:人脸识别、图片鉴黄、相册根据人物自动分类等。

这里需要说明一下,条形码和二维码的扫描不算是计算机视觉。
这种对图像的识别,还是基于固定规则的,并不需要处理复杂的图像,完全用不到AI技术。