机器视觉系统的组成
机器视觉系统是指用计算机来完结人的视觉功用,也就是用计算机来完结对客观的三维国际的辨认。按现在的了解,人类视觉体系的感受部分是视网膜,它是一个三维采样体系。三维物体的可见部分投影到网膜上,人们依照投影到视网膜上的二维的像来对该物体进行三维了解。所谓三维了解是指对被调查方针的形状、尺度、脱离调查点的间隔、质地和运动特征(方向和速度)等的了解。
机器视觉系统的输入设备可以是摄像机、转鼓等,它们都把三维的印象作为输入源,即输入计算机的就是三维管观国际的二维投影。假如把三维客观国际到二维投印象看作是一种正改换的话,则机器视觉系统所要做的是从这种二维投影图画到三维客观国际的逆改换,也就是依据这种二维投影图画去重建三维的客观国际。
机器视觉系统首要由三部分组成:图画的获取、图画的处理和剖析、输出或显现。
将近80%的工业视觉体系首要用在检测方面,包含用于进步出产功率、操控出产进程中的产品质量、收集产品数据等。产品的分类和挑选也集成于检测功用中。下面经过一个用于出产线上的单摄像机视觉体系,说明体系的组成及功用。
视觉体系检测出产线上的产品,决议产品是否契合质量要求,并依据成果,发作相应的信号输入上位机。图画获取设备包含光源、摄像机等;图画处理设备包含相应的软件和硬件体系;输出设备是与制作进程相连的有关体系,包含进程操控器和报警设备等。数据传输到计算机,进行剖析和产品操控,若发现不合格品,则报警器告警,并将其扫除出出产线。机器视觉的成果是CAQ体系的质量信息来历,也可以和CIMS其它体系集成。
图画的获取
图画的获取实践上是将被测物体的可视化图画和内涵特征改换成能被计算机处理的一系列数据,它首要由三部分组成:
* 照明
* 图画聚集构成
* 图画断定和构成摄像机输出信号
1、照明
照明和影响机器视觉系统输入的重要因素,由于它直接影响输入数据的质量和至少30%的运用作用。由于没有通用的机器视觉照明设备,所以针对每个特定的运用实例,要挑选相应的照明设备,以到达最佳作用。
过去,许多工业用的机器视觉系统用可见光作为光源,这首要是由于可见光简单取得,价格低,而且便于操作。常用的几种可见光源是白帜灯、日光灯、水银灯和钠光灯。可是,这些光源的一个最大缺陷是光能不能保持安稳。以日光灯为例,在运用的榜首个100小时内,光能将下降15%,跟着运用时刻的添加,光能将不断下降。因而,怎么使光能在必定的程度上保持安稳,是实用化进程中急需求处理的问题。
另一个方面,环境光将改动这些光源照耀到物体上的总光能,使输出的图画数据存在噪声,一般选用加防护屏的办法,减少环境光的影响。
由于存在上述问题,在如今的工业运用中,关于某些要求高的检测使命,常选用X射线、超声波等不可见光作为光源。可是不可见光不利于检测体系的操作,且价格较高,所以,现在在实践运用中,仍多用可见光作为光源。
照明体系按其照耀办法可分为:背向照明、前向照明、结构光和频亮光照明等。其中,背向照明是被测物放在光源和摄像机之间,它的优点是能取得高对比度的图画。前向照明是光源和摄像机坐落被测物的同侧,这种办法便于设备。结构光照明是将光栅或线光源等投射到被测物上,依据它们发作的畸变,解调出被测物的三维信息。频亮光照明是将高频率的光脉冲照耀到物体上,照像机摄影要求与光源同步。
2、图画聚集构成
被测物的图画经过一个透镜聚集在灵敏元件上,好像照像机摄影相同。所不同的是照像机运用胶卷,而机器视觉系统运用传感器来捕捉图画,传感器将可视图画转化为电信号,便于计算机处理。
选取机器视觉系统中的摄像机应依据实践运用的要求,其中摄像机的透镜参数是一项重要方针。透镜参数分为四个部分:扩大倍率、焦距、景深和透镜设备。
3、图画断定和构成摄像机输出信号
机器视觉系统实践上是一个光电改换设备,行将传感器所接纳到的透镜成像,转化为计算机能处理的电信号、摄像机可以是电子管的,也可是固体状况传感单元。
电子管摄像机开展较早,20世纪30年代就已运用于商业电视,它选用包含光感元件的真空管进行图画传感,将所接纳到的图画改换成模仿电压信号输出。具有RS-170输出制式的摄像机可直接与商用电视显现器相连。
固体状况摄像机是在20世纪60年代后期,美国贝尔电话实验室发明晰电荷耦合设备(CCD),而开展起来的。它上散布于各个像元的光敏二极管的线性阵列或矩形阵列构成,经过按必定次序输出每个二极管的电压脉冲,完结将图画光信号改换成电信号的意图。输出的电压脉冲序列可以直接以RS-170制式输入规范电视显现器,或许输入计算机的内存,进行数值化处理。CCD是现在最常用的机器视觉传感器。
图画处理技能
机器视觉系统中,视觉信息的处理技能首要依赖于图画处理办法,它包含图画增强、数据编码和传输、滑润、边际锐化、切割、特征抽取、图画辨认与了解等内容。经过这些处理后,输出图画的质量得到适当程度的改进,既改进了图画的视觉作用,又便于计算机对图画进行剖析、处理和辨认。
1、图画的增强
图画的增强用于调整图画的对比度,杰出图画中的重要细节,改进视觉质量。一般选用灰度直方图修正技能进行图画增强。
图画的灰度直方图是表明一幅图画灰度散布状况的计算特性图表,与对比度紧密相连。
一般,在计算机中表明的一幅二维数字图画可表明为一个矩阵,其矩阵中的元素是坐落相应坐标方位的图画灰度值,是离散化的整数,一般取0,1,……,255。这首要是由于计算机中的一个字节所表明的数值规模是0~255。别的,人眼也只能分辩32个左右的灰度级。所以,用一个字节表明灰度即可。
可是,直方图仅能计算某级灰度像素呈现的概率,反映不出该像素在图画中的二维坐标。因而,不同的图画有可能具有相同的直方图。经过灰度直方图的形状,能判别该图画的清晰度和是非对比度。
假如取得一幅图画的直方图作用不抱负,可以经过直方图均衡化处理技能作适当修正,即把一幅已知灰度概率散布图画中的像素灰度作某种映射改换,使它变成一幅具有均匀灰度概率散布的新图画,完结使图象清晰的意图。
2、图画的滑润
图画的滑润处理技能即图画的去噪声处理,首要是为了去除实践成像进程中,因成像设备和环境所构成的图画失真,提取有用信息。众所周知,实践取得的图画在构成、传输、接纳和处理的进程中,不可避免地存在着外部搅扰和内部搅扰,如光电改换进程灵敏元件灵敏度的不均匀性、数字化进程的量化噪声、传输进程中的差错以及人为因素等,均会使图画蜕变。因而,去除噪声,康复原始图画是图画处理中的一个重要内容。
3、图画的数据编码和传输
数字图画的数据量是适当庞大的,一幅512*512个像素的数字图画的数据量为256 K字节,若假定每秒传输25帧图画,则传输的信道速率为52.4M比特/秒。高信道速率意味着高出资,也意味着普及难度的添加。因而,传输进程中,对图画数据进行紧缩显得十分重要。数据的紧缩首要经过图画数据的编码和改换紧缩完结。
图画数据编码一般选用猜测编码,行将图画数据的空间改变规则和序列改变规则用一个猜测公式表明,假如知道了某一像素的前面各相邻像素值之后,可以用公式猜测该像素值。选用猜测编码,一般只需传输图画数据的起始值和猜测差错,因而可将8比特/像素紧缩到2比特/像素。
改换紧缩办法是将整幅图画分红一个个小的(一秀取8*8或16*16)数据块,再将这些数据块分类、改换、量化,然后构成自适应的改换紧缩体系。该办法可将一幅图画的数据紧缩到为数不多的几十个特传输,在接纳端再改换回去即可。
4、边际锐化
图画边际锐化处理首要是加强图画中的概括边际和细节,构成完好的物体鸿沟,到达将物体从图画中分离出来或将表明同一物体外表的区域检测出来的意图。它是前期视觉理论和算法中的基本问题,也是中期和后期视觉胜败的重要因素之一。
5、图画的切割
图画切割是将图画分红若干部分,每一部分对应于某一物体外表,在进行切割时,每一部分的灰度或纹理契合某一种均匀测度度量。某实质是将像素进行分类。分类的依据是像素的灰度值、色彩、频谱特性、空间特性或纹理特性等。图画切割是图画处理技能的基本办法之一,运用于比方染色体分类、景象了解体系、机器视觉等方面。
图画切割首要有两种办法:一是鉴于度量空间的灰度阈值切割法。它是依据图画灰度直方图来决议图画空间域像素聚类。但它只运用了图画灰度特征,并没有运用图画中的其它有用信息,使得切割成果对噪声十分灵敏;二是空间域区域增加切割办法。它是对在某种意义上(如灰度级、安排、梯度等)具有类似性质的像素连通集构成切割区域,该办法有很好的切割作用,但缺陷是运算复杂,处理速度慢。其它的办法如边际追踪法,首要着眼于保持边际性质,盯梢边际并构成闭合概括,将方针切割出来;锥体图画数据结构法和符号松懈迭代法同样是运用像素空间散布联系,将边邻的像素作合理的归并。而根据常识的切割办法则是运用景象的先验信息和计算特性,首要对图画进行初始切割,抽取区域特征,然后运用范畴常识推导区域的解说,最终依据解说对区域进行兼并。
6、图画的辨认
图画的辨认进程实践上可以看作是一个符号进程,即便用辨认算法来区分景象中已切割好的各个物体,给这些物体赋予特定的符号,它是机器视觉系统有必要完结的一个使命。
依照图画辨认从易到难,可分为三类问题。榜首类辨认问题中,图画中的像素表达了某一物体的某种特定信息。如遥感图画中的某一像素代表地上某一方位地物的必定光谱波段的反射特性,经过它即可判别出该地物的种类。第二类问题中,待辨认物是有形的全体,二维图画信息已经满足辨认该物体,如文字辨认、某些具有安稳可视外表的三维体辨认等。但这类问题不像榜首类问题简单表明成特征矢量,在辨认进程中,应先将待辨认物体正确地从图画的布景中切割出来,再设法将建立起来的图画中物体的特点图与假定模型库的特点图之间匹配。第三类问题是由输入的二维图、要素图、2•5维图等,得出被测物体的三维表明。这儿存着怎么将隐含的三维信息提取出来的问题,当是今研讨的热点。
现在用于图画辨认的办法首要分为决策理论和结构办法。决策理论办法的根底是决策函数,运用它对形式向量进行分类辨认,是以守时描绘(如计算纹理)为根底的;结构办法的核心是将物体分化成了形式或形式基元,而不同的物体结构有不同的基元串(或称字符串),经过对不知道物体运用给定的形式基元求出编码鸿沟,得到字符串,再依据字符串判别它的属类。这是一种依赖于符号描绘被测物体之间联系的办法。
那么,机器视觉系统规划的难点都有哪些?
本文首要总结了一下五点,
榜首:打光的安稳性
工业视觉运用一般分红四大类:定位、丈量、检测和辨认,其中丈量对光照的安稳性要求最高,由于光照只需发作10-20%的改变,丈量成果将可能差错出1-2个像素,这不是软件的问题,这是光照改变,导致了图画上边际方位发作了改变,即便再厉害的软件也处理不了问题,有必要从体系规划的视点,扫除环境光的搅扰,一起要确保主动照明光源的发光安稳性。当然经过硬件相机分辩率的提高也是进步精度,抗环境搅扰的一种办法了。比方之前的相机对应物空间尺度是1个像素10um,而经过提高分辩率后变成 1个像素5um,精度近似可以以为提高1倍,对环境的搅扰天然增强了。
第二:工件方位的纷歧致性
一般做丈量的项目,无论是离线检测,仍是在线检测,只需是全自动化的检测设备,首要做的榜首步工作都是要能找到待测方针物。每次待测方针物呈现在摄影视场中时,要能精确知道待测方针物在哪里,即便你运用一些机械夹具等,也不能特别高精度确保待测方针物每次都呈现在同一方位的,这就需求用到定位功用,假如定位不精确,可能丈量工具呈现的方位就不精确,丈量成果有时会有较大差错
第三:标定
一般在高精度丈量时需求做以下几个标定,一光学畸变标定(假如您不是用的软件镜头,一般都有必要标定),二投影畸变的标定,也就是由于您设备方位差错代表的图画畸变校对,三物像空间的标定,也就是具体算出每个像素对应物空间的尺度。
不过现在的标定算法都是根据平面的标定,假如待丈量的物理不是平面的,标定就会需求作一些特种算法来处理,一般的标定算法是处理不了的。
此外有些标定,由于不方面运用标定板,也有必要规划特别的标定办法,因而标定不必定能经过软件中已有的标定算法悉数处理。
第四:物体的运动速度
假如被丈量的物体不是静止的,而是在运动状况,那么必定要考虑运动含糊对图画精度(含糊像素=物体运动速度*相机曝光时刻),这也不是软件可以处理的。
第五:软件的丈量精度
在机器视觉系统运用中软件的精度只能依照1/2—1/4个像素考虑,最好依照1/2,而不能向定位运用相同到达1/10-1/30个像素精度,由于丈量运用中软件可以从图画上提取的特征点十分少。