编程考级

计算机视觉,是一门研究如何让计算机达到人类那样“看”的学科,也就是我们常说的图像识别。
首页 资讯中心 编程考级 知识点归纳 | PAAT人工智能编程考试:图像识别基础知识

知识点归纳 | PAAT人工智能编程考试:图像识别基础知识

人工智能三阶段图片


·第一阶段(基础)- 计算智能 表现:能存会算。机器开始像人类一样会计算、传递信息。示例:神经网络、遗传算法价值:能够帮助人类存储和快速处理海量数据,是认知和感知的基础。
·第二阶段(目前)- 感知智能表现:感知外界。机器开始看懂和听懂,做出判断、采取一些行动。示例:可以认出罪犯的摄像头、可以听懂语音的音响价值:能够帮助人类高效的完成“看”和“听”相关工作。
·第三阶段 - 认知智能表现:自主行动。机器能够像人一样思考,主动采取行动。示例:完全独立驾驶的无人驾驶汽车、自主行动的机器人价值:可以全面辅助或替代人类工作。


34952_oqyn_6671.jpg

在了解计算机视觉前,需要先了解目前人工智能所处的阶段,是“感知智能”。现在计算机已经学会了“感知”,不过距离计算机“能理解、会思考”的“认知智能”阶段,还差得很远。让计算机学会“感知”,最重要的一步就是”看“了。



02图片计算机视觉图片
·概述计算机视觉,是一门研究如何让计算机达到人类那样“看”的学科,也就是我们常说的图像识别。计算机视觉的主要目标是教会“计算机”去获取图片信息中的知识。例如,人脸识别就是让计算机去自动获取与识别人脸图像中的特征,这个“特征”的范畴可以是“两张图片中的人脸是否来自于同一个人”,也可以是“图片中的人脸是男人还是女人”。更准确点说,它是利用摄像机和电脑代替人眼,使计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。目前应用于无人驾驶、无人安防、VR/AR、车辆车牌折别、医学图像分析等领域。


34988_wj5l_4289.png

·基础概念

 数字图像 又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。由数组或矩阵表示,其光照位置和强度都是离散的。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
 像素 是数字图像的基本元素。像素是在模拟图像数字化时对连续空间进行离散化得到的。每个像素具有整数行(高)和列(宽)位置坐标,同时每个像素都具有整数灰度值或颜色值。像素是指由图像的小方格组成的,这些小方块都有一个明确的位置和被分配的色彩数值,小方格颜色和位置就决定该图像所呈现出来的样子。

34988_iq3b_5185.png

每个图像的像素,通常对应于二维空间中一个特定的'位置',并且有一个或者多个与那个点相关的采样值组成数值。根据这些采样数目及特性的不同数字图像可以划分为:


二值图像
1、二值: 图像中每个像素的亮度值仅可以取自0到1的图像。2、灰度,也称为灰阶图像: 图像中每个像素可以由0(黑)到255(白)的亮度值表示。0-255之间表示不同的灰度级。

图片


彩色图像每幅彩色图像是由三幅不同颜色的灰度图像组合而成,一个为红色,一个为绿色,另一个为蓝色。

图片


三维图像 (3D Image)

由一组堆栈的二维图像组成,每一幅图像表示该物体的一个横截面。

34989_topl_9110.png

图像识别的流程图片


1、信息的获取信息的获取是指通过摄像头,将光信息转化为电信息。获取研究对象的基本信息,并通过某种方法将其转变为机器能够认识的信息。


34989_6e8h_8420.png

2、预处理

预处理主要是指图像处理中的彩色图片转成灰度图片,并且进行去噪、平滑、变形等的操作,从而加强图像的重要特征,减少干扰因素,降低识别成本。


34990_elvh_8135.png

3、特征提取和选择

特征提取和选择在图像识别过程中是非常关键的技术之一,通常会使用边缘检测,剔除不相关的信息,保留了图像重要的结构。图中所示就是使用了Canny边缘检测后的结果。

34990_fgaw_8911.png

接下来,我们使用霍夫变换来提取图像中的直线(段),图中红框中标出的即为提取结果。

34991_zfeo_3766.png

4、分类器设计

图像在经过特征选择之后,接下来需要经过分类器,获取我们需要的信息,舍弃不需要的特征信息。分类器设计是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别能够得到高识别率。针对车道线检测,可以设计一个基于多层神经网络的线段分类器进行筛选。
5、分类决策分类决策是指在特征空间中对被识别对象进行分类,我们通过从筛选后的边缘集合中生成车道线,判定图中标注的为主车道线。


34992_xsxa_9408.png

图片


Canny边缘检测算法被公认为最优的边缘检测算法,因为它满足以下最优边缘检测算法准则:低错误率、高定位性、最小响应。
·边缘检测算法的实现步骤步骤一:对图像进行高斯模糊:应用高斯滤波来平滑图像


34992_jscy_5307.png

步骤二:计算图像梯度

34993_wztd_8398.png

步骤三:非极大值抑制技术

34993_bdui_6070.png

步骤四:双阈值边缘连接处理


34993_wztd_8398.png

步骤五:二值化图像输出结果

35216_ob4e_8247.png

 关于威盛创造栗   





威盛创造栗是威盛集团旗下的人工智能教育领导品牌,致力于提供青少年人工智能教育解决方案,将智能硬件、智能软件平台、课程体系、师资培训、赛事活动、等级考试、AI实验室项目融为一体。教学对象实现全学段覆盖,教学场景涉及课堂教学、社团活动及实验教学等全方位、多场景,打造定制化人工智能教育全方位解决方案。