人工智能AI基础知识科普系列（六）：计算机视觉——给机器装上“火眼金睛”

如果你真的想学习人工智能，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

Gupao123

1746人浏览 · 2025-05-30 15:04:25

Gupao123 · 2025-05-30 15:04:25 发布

嘿，上次咱们聊了“自然语言处理”，讲了机器怎么学会听懂人话、跟咱们唠嗑。这回，咱们换个角度，说说“计算机视觉”（Computer Vision，简称CV）——这可是让机器长出一双“眼睛”的技术！你平时刷脸解锁手机、用美颜相机拍大头照，或者听说自动驾驶车能自己认路，这些全是计算机视觉的功劳。那么，这玩意儿到底啥意思？机器咋就“看懂”世界了呢？来，咱们一块儿唠唠，保准你听完觉得有趣又明白！

一、计算机视觉：机器的“视力”从哪来？

计算机视觉，顾名思义，就是让机器能“看”东西。你我看世界，眼睛一扫就知道：这是猫，那是车，天上有云。但对机器来说，图片就是一堆乱七八糟的数字——每个像素点有颜色值（红绿蓝啥的），完全没啥意义。计算机视觉的任务，就是把这些数字变成“知识”，让机器也能像咱们一样，指着一张图说：“嘿，这有只猫在打盹儿！”

简单点说，CV就是给机器装上“火眼金睛”，让它能：

认东西：图片里有啥？人、狗还是树？
懂场景：这些东西干啥呢？人在跑，狗在睡？
会反应：看到啥就干啥，比如自动驾驶看到红灯就刹车。

是不是挺酷？接下来，咱们看看这“眼睛”是咋炼成的。

二、从瞎摸到开眼：计算机视觉的成长路

计算机视觉可不是一夜之间蹦出来的，它也有自己的“童年故事”：

起步那会儿（1960年代）
60年代，科学家开始琢磨：能不能让机器认图？那时候电脑弱得像个老爷车，他们试着教机器认简单形状，比如圆圈和方块。结果呢？费老大劲儿也就认个大概，稍微复杂点就抓瞎了。方法也很“原始”——人手工写规则，比如“直线多就是方形”。这招对付复杂照片？门儿都没有！
有点眉目了（1990年代）
到了90年代，电脑快了点，科学家也聪明了。他们不再全靠手写规则，而是让机器自己找“特征”，比如图片里的边缘、角落啥的。像SIFT这种算法，能从人脸上找到关键点，银行开始用它认支票上的数字。这时候，CV总算能干点实事儿了。
开了挂的时代（2010年代到现在）
真正让CV起飞的，是咱们上期讲的“深度学习”。2012年，一个叫AlexNet的家伙（其实是个神经网络）在比赛里把图像识别的水平拉高了一大截。从那以后，CV就跟打了鸡血似的，能干的事儿越来越多——从认猫狗到看懂视频，全不在话下。现在的自动驾驶、刷脸支付，都是它的“得意之作”。