一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

- 编辑：admin - 2025-08-17 09:30 点击数：981

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

计算机视觉为什么重要？

人的大脑皮层，有差不多70%都是在处理视觉信息。是人类获取信息最主要的渠道，没有之一。

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

而在计算机视觉出现之前，图像对于计算机来说是黑盒的状态。

一张图片对于机器只是一个文件。机器并不知道图片里的内容到底是什么，只知道这张图片是什么尺寸，多少MB，什么格式的。

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

如果计算机、人工智能想要在现实世界发挥重要作用，就必须看懂图片！这就是计算机视觉要解决的问题。

什么是计算机视觉–CV？

计算机视觉是人工智能的一个重要分支，它要解决的问题就是：看懂图像里的内容。

比如：

图片里的宠物是猫还是狗？

图片里的人是老张还是老王？

这张照片里，桌子上放了哪些物品？

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

计算机视觉的原理是什么？

目前主流的基于深度学习的机器视觉方法，其原理跟人类大脑工作的原理比较相似。

人类的视觉原理如下：从原始信号摄入开始（瞳孔摄入像素Pixels），接着做初步处理（大脑皮层某些细胞发现边缘和方向），然后抽象（大脑判定，眼前的物体的形状，是圆形的），然后进一步抽象（大脑进一步判定该物体是只气球）。

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

机器的方法也是类似：构造多层的神经网络，较低层的识别初级的图像特征，若干底层特征组成更上一层特征，最终通过多个层级的组合，最终在顶层做出分类。

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

计算机视觉的2大挑战

对于人类来说看懂图片是一件很简单的事情，但是对于机器来说这是一个非常难的事情，说2个典型的难点：

特征难以提取

同一只猫在不同的角度，不同的光线，不同的动作下。像素差异是非常大的。就算是同一张照片，旋转90度后，其像素差异也非常大！

所以图片里的内容相似甚至相同，但是在像素层面，其变化会非常大。这对于特征提取是一大挑战。

需要计算的数据量巨大

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

CNN解决了上面的两大难题

CNN属于深度学习的范畴，它很好的解决了上面所说的2大难点：

CNN可以有效的提取图像里的特征

CNN可以将海量的数据（不影响特征提取的前提下）进行有效的降维，大大减少了对算力的要求

CNN的具体原理这里不做具体说明，感兴趣的可以看看《一文看懂卷积神经网络-CNN（基本原理+独特价值+实际应用）》

计算机视觉的8大任务

一文看懂计算机视觉-CV（基本原理+2大挑战+8大任务+4个应用）

图像分类

图像分类是计算机视觉中重要的基础问题。后面提到的其他任务也是以它为基础的。

举几个典型的例子：人脸识别、图片鉴黄、相册根据人物自动分类等。

这里需要说明一下，条形码和二维码的扫描不算是计算机视觉。

这种对图像的识别，还是基于固定规则的，并不需要处理复杂的图像，完全用不到AI技术。