知识点归纳 | PAAT人工智能编程考试：图像识别基础知识

人工智能三阶段

·第一阶段（基础）- 计算智能 表现：能存会算。机器开始像人类一样会计算、传递信息。示例：神经网络、遗传算法价值：能够帮助人类存储和快速处理海量数据，是认知和感知的基础。
·第二阶段（目前）- 感知智能表现：感知外界。机器开始看懂和听懂，做出判断、采取一些行动。示例：可以认出罪犯的摄像头、可以听懂语音的音响价值：能够帮助人类高效的完成“看”和“听”相关工作。
·第三阶段 - 认知智能表现：自主行动。机器能够像人一样思考，主动采取行动。示例：完全独立驾驶的无人驾驶汽车、自主行动的机器人价值：可以全面辅助或替代人类工作。

在了解计算机视觉前，需要先了解目前人工智能所处的阶段，是“感知智能”。现在计算机已经学会了“感知”，不过距离计算机“能理解、会思考”的“认知智能”阶段，还差得很远。让计算机学会“感知”，最重要的一步就是”看“了。

02计算机视觉
·概述计算机视觉，是一门研究如何让计算机达到人类那样“看”的学科，也就是我们常说的图像识别。计算机视觉的主要目标是教会“计算机”去获取图片信息中的知识。例如，人脸识别就是让计算机去自动获取与识别人脸图像中的特征，这个“特征”的范畴可以是“两张图片中的人脸是否来自于同一个人”，也可以是“图片中的人脸是男人还是女人”。更准确点说，它是利用摄像机和电脑代替人眼，使计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。目前应用于无人驾驶、无人安防、VR/AR、车辆车牌折别、医学图像分析等领域。

·基础概念

数字图像 又称数码图像或数位图像，是二维图像用有限数字数值像素的表示。由数组或矩阵表示，其光照位置和强度都是离散的。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
像素是数字图像的基本元素。像素是在模拟图像数字化时对连续空间进行离散化得到的。每个像素具有整数行（高）和列（宽）位置坐标，同时每个像素都具有整数灰度值或颜色值。像素是指由图像的小方格组成的，这些小方块都有一个明确的位置和被分配的色彩数值，小方格颜色和位置就决定该图像所呈现出来的样子。

每个图像的像素，通常对应于二维空间中一个特定的'位置'，并且有一个或者多个与那个点相关的采样值组成数值。根据这些采样数目及特性的不同数字图像可以划分为：

二值图像
1、二值: 图像中每个像素的亮度值仅可以取自0到1的图像。2、灰度，也称为灰阶图像: 图像中每个像素可以由0(黑)到255(白)的亮度值表示。0-255之间表示不同的灰度级。

彩色图像每幅彩色图像是由三幅不同颜色的灰度图像组合而成，一个为红色，一个为绿色，另一个为蓝色。

三维图像 (3D Image)

由一组堆栈的二维图像组成，每一幅图像表示该物体的一个横截面。

图像识别的流程

1、信息的获取信息的获取是指通过摄像头，将光信息转化为电信息。获取研究对象的基本信息，并通过某种方法将其转变为机器能够认识的信息。

2、预处理

预处理主要是指图像处理中的彩色图片转成灰度图片，并且进行去噪、平滑、变形等的操作，从而加强图像的重要特征，减少干扰因素，降低识别成本。

3、特征提取和选择

特征提取和选择在图像识别过程中是非常关键的技术之一，通常会使用边缘检测，剔除不相关的信息，保留了图像重要的结构。图中所示就是使用了Canny边缘检测后的结果。

接下来，我们使用霍夫变换来提取图像中的直线（段），图中红框中标出的即为提取结果。

4、分类器设计

图像在经过特征选择之后，接下来需要经过分类器，获取我们需要的信息，舍弃不需要的特征信息。分类器设计是指通过训练而得到一种识别规则，通过此识别规则可以得到一种特征分类，使图像识别能够得到高识别率。针对车道线检测，可以设计一个基于多层神经网络的线段分类器进行筛选。
5、分类决策分类决策是指在特征空间中对被识别对象进行分类，我们通过从筛选后的边缘集合中生成车道线，判定图中标注的为主车道线。

Canny边缘检测算法被公认为最优的边缘检测算法，因为它满足以下最优边缘检测算法准则：低错误率、高定位性、最小响应。
·边缘检测算法的实现步骤步骤一：对图像进行高斯模糊：应用高斯滤波来平滑图像

步骤二：计算图像梯度

步骤三：非极大值抑制技术

步骤四：双阈值边缘连接处理

步骤五：二值化图像输出结果

关于威盛创造栗

▼▼▼

威盛创造栗是威盛集团旗下的人工智能教育领导品牌，致力于提供青少年人工智能教育解决方案，将智能硬件、智能软件平台、课程体系、师资培训、赛事活动、等级考试、AI实验室项目融为一体。教学对象实现全学段覆盖，教学场景涉及课堂教学、社团活动及实验教学等全方位、多场景，打造定制化人工智能教育全方位解决方案。

编程考级

知识点归纳 | PAAT人工智能编程考试：图像识别基础知识