>
首页 » 业界动态 » 一种基于服务机器人的视觉系统设计

一种基于服务机器人的视觉系统设计

作者:刘京诚,廖智勇,朱木健,刘 俊  时间:2007-04-08 19:09  来源:

摘 要:通过采用图像传感器OV7635采集图像帧存储器AL422B进行数据缓存CPLD控制时序DSP进行图像处理构建了一个图像采集的硬件系统在图像软件处理中采用阈值向量判断法和改进的种子填充法来完成彩色图像的识别和分割在分割中计算图像的几何矩利用全局图像的几何矩特征量构建图像雅可比矩阵并用推导的图像雅可比矩阵完成一个图像反馈与目标运动自适应补偿的视觉跟踪系统系统采用了TFT液晶来直观显示视觉识别和跟踪的效果

关键词:视觉系统;阈值向量;种子填充;图像矩;雅可比矩阵  

随着计算机科学和自动控制技术的发展越来越多的不同种类的智能机器人出现在工厂、生活当中机器人视觉系统作为智能机器人系统中一个重要的子系统也越来越受到人们的重视它涉及了图像处理、模式识别和视觉跟踪等领域不同种类的机器人由于工作的重点不一样它的视觉系统在软件或硬件上都有着细微的差别本文研究基于服务机器人的单目视觉系统它处理的是二维图像是基于对无遮挡物体颜色和形状的识别以及3D目标物体的平动跟踪

视觉系统是一个非常复杂的系统它既要做到图像的准确采集还要做到对外界变化反应的实时性同时还需要对外界运动的目标实时跟踪因此视觉系统对硬件和软件系统都提出了较高的要求目前比较流行的足球机器人技术它的视觉系统属于比较典型的快速识别和反应类型一般情况下它是通过彩色标志定标的方法来达到对队员和目标的识别以及通过扩展卡尔曼滤波器的预测功能来实现对目标的跟踪功能在硬件上采用一个现成的摄像机来实现一个机器人的图像采集系统

本系统在设计上采用CMOS图像传感器代替CCD类型传感器进行采集图像DSP处理芯片TMS320VC5509A进行图像处理以及作为CPU控制在设计过程中为了直观显现机器人视觉系统识别和跟踪的效果专门采用了一个TFT格式的液晶来直观显示软件上采用了一部分足球机器人的视觉技术来达到对目标的快速识别通过全局的特征矩构建的雅可比矩阵达到对目标的自适应跟踪

1 硬件部分设计

1为系统硬件电路的功能模块框图

1.1 图像采集

视觉镜头把外部的图像信息成像在图像传感器的面阵单元上目前流行的图像传感器有面阵CCD(Charged Coupled Device,电荷耦合器件)型和面阵CMOS两种相比较CCD型的图像传感器CMOS图像传感器的有源像素单元为每一个像素提供了放大器只需一个单供电低逻辑电平电压功耗只相当于CCD的十分之一CMOS图像传感器内部集成了A/D转换部分直接输出数字信号基于这些因素本系统采用了Omnivision公司推出的CMOS彩色图像传感器OV7635。

OV7635的分辨力为640X480,能输出3种格式的8位数据:YCbCr4:2:2模式、RGB4:2:2模式和RGB原始数据模式输出VGA格式最大可达到30fps(fps:每秒帧数)。能工作在逐行扫描下和隔行扫描下OV7635有主模式和从模式两种工作模式在主模式下同步信号和时钟不由外围设备控制在从模式下OV7635的场同步信号VSYNC,行同步信号HREF以及系统的晶振频率XCLK均由外部设备控制本系统采用的是主模式OV7635通过I2C总线配置片内寄存器使其输出原始数据系统上电复位后DSP芯片的I2C总线信号对CMOS寄存器初始化然后OV7635就按要求输出图像信号包括行同步信号HREF,场同步信号VSYNC,像素时钟信号PCLK,数字图像信号

1.2 液晶显示

为了很直观的看到视觉系统对人的识别和跟踪效果采用了一片INNOLUX公司的PT035TN01液晶显示屏为了不增加对DSP的负担同时也为了实时看到对外界目标物体的跟踪效果液晶显示的数据不经由DSP,直接通过传感器OV7635输出的图像数据信号和CPLD控制时序来进行显示PT035TN013.5英寸TFT格式的液晶分辨力为320×3(RGB)×240,液晶IF1IF2两输入控制脚对输入的数据格式进行选择:串行RGB格式、CCIR601格式、CCIR656格式液晶的扫描模式有4本视觉系统采用的输入数据格式是CCIR601格式扫描模式为由上到下和左到右的扫描模式

CCIR601格式下图像传感器输出的像素时钟PCLK通过CPLD二分频作为液晶的工作时钟图像传感器输出的行同步信号HREF经过CPLD的处理后作为液晶的行同步信号HIS,这样CPLD控制下图像传感器OV7635输出的数据信号送入液晶中进行显示

1.3 时序控制

OV7635输出的场同步信号VSYNC,行同步信号HREF以及像素时钟信号PCLK接至CPLD芯片产生控制信号把OV7635输出的数据信号存入FIFO帧存储器AL422B以及产生液晶的时钟和行同步信号控制液晶的显示CPLD采用了ALTERA公司的EPM7064芯片CPLD中完成了对FIFO的写控制、通知DSP读信号、液晶的时钟信号的产生等功能

CPLD接收场同步信号VSYNC,此信号的下降沿表示图像传感器输出一帧的开始此时CPLD产生WRST负脉冲复位FIFO的写指针场同步信号VSYNC下降沿后判断行同步信号HREF的上升沿到来接着利用像素时钟信号PCLK作为写时钟WCK将图像数据直接存储到FIFO当存到一定的数后就及时发信号给DSP,以便DSP读取数据本系统采用的是一个中断INT0来通知DSP。此时DSP可以读数据也可以不读视处理的速度来定读数据时可利用RD和片选产生RCK信号DSP读取的速度不能太快以读取速度小于写速度为原则

在对液晶的逻辑时序控制上由于图像输出的信号是640×480的像素而液晶的显示为320×240的格式所以利用CPLD把图像传感器输入的像素时钟信号PCLK进行二分频产生液晶的时钟信号控制液晶的显示同时对行同步信号进行隔行有效从而达到液晶对图像的显示CPLD中的程序编写用的采用了硬件描述语言VHDL,QUARTUSⅡ软件平台上进行编写的由于在选用芯片时采用的是EPM7064S系列的44PLCC封装的只能工作在5V电压情况下其输出的高电平信号是5V,必须通过处理才能接入系统中工作在3。3V状态下的芯片器件

1.4 帧存储器选择

帧存储器有需要外部提供地址线的RAM和不需要外部提供地址线的FIFO,为了简化CPLD的设计采用了FIFO的帧存储器FIFO又可以分为基于动态存储的DRAM和基于静态的SRAM。基于静态SRAM的优点是不需要刷新电路但容量小需要多片才能存储一帧数据;基于DRAM的优点是容量大只需一片就能存储一帧数据缺点是必须有刷新电路本设计中采用的是Averlogic公司的大容量FIFO动态存储芯片AL422B。其刷新电路比较简单仅需WCKRCK提供大于1M的不间断脉冲即可AL422B的存储容量为3MB,由于系统一帧的信息通常包含640×480个彩色像素每个像素占用2个字节可存储1帧图像的完整信息其工作频率可达50MHz。

1.5 视频处理DSP

在选用DSP在兼顾处理速度存储容量现有条件下的加工工艺水平以及性价比方面选用了TI公司的144脚封装的TMS320VC5509A,此芯片的最高工作频率可达到200MHz,具有很高的处理速度

DSP收到来自CPLD的读通知信号后开始读取AL422B中的视频数据为了方便处理数据DSP外围扩展了一个的SDRAM。芯片采用的是HYNIX公司的HY57V161610E,此芯片的存储容量为1M×16bits。

DSP上电复位后通过采样GPIO0GPIO3的状态根据采样的状态来进行什么样方式的程序装载本系统的采用外接的flash存储芯片的SPI口对DSP进行程序装载接着通过DSPI2C口对图像传感器进行寄存器初始化图像传感器开始输出信号整个系统开始进入工作

DSP作为高速的处理器主要用于图像的处理由于本视觉系统要完成识别和跟踪功能数据的处理量是很大的在完成图像处理的同时DSP也作为控制器使用完成对控制器的控制从而构成视觉跟踪系统

2 软件部分设计

由于本系统采用的是颜色和形状相结合的办法对无遮挡目标物体的识别为了达到机器人实时快速的目的在软件方法上主要采用了目前常用的足球机器人的颜色识别方法目前比较常见是基于阈值向量的颜色判断法下面简述颜色识别原理

2.1 色彩空间选择

对于采用基于彩色图像分割的方法识别目标时首先要选择合适的颜色空间常用的颜色空间有RGBYUVHSVCMY颜色空间的选择直接影响到图像分割和目标识别的效果

RGB:是最常用的颜色空间其中亮度等于RGB3个分量之和RGB颜色空间是不均匀的颜色空间两个颜色之间的知觉差异与空间中两点间的欧氏距离不成线性比例而且RGB值之间的相关性很高对同一颜色属性在不同条件(光源种类、强度和物体反射特性)RGB值很分散对于识别某种特定颜色很难确定其阈值和其在颜色空间中的分布范围因此通常会选择能从中分离出亮度分量的颜色空间其中最常见的是YUVHSV颜色空间

HSV:接近人眼感知色彩的方式H为色调(Hue),S为色饱和度(Saturation),V为亮度(Value)。色调H能准确地反映颜色种类对外界光照条件变化敏感度低但是HS均为RGB的非线性变换存在奇异点在奇异点附近即使RGB的值有很小变化也引起变换值有很大的跳动

YUV:RGB颜色空间线性变化为的亮度-色彩空间是为了解决彩色电视机与黑白电视机的兼容问题而提出的Y表示亮度(Luminance),UV用来表示色差(Chrominance)。YUV表示法的重要性是它的亮度信号(Y)和色度信号(UV)是相互独立的所谓色差是指基色信号中的3个分量信号(RGB)与亮度信号之差

因此针对以上原因本系统在采用的是YUV色彩空间

YUV格式与RGB存在如下关系:

2.2 阈值确定和色彩判断

在确定阈值时首先通过采集样本进行训练从而得到预定的几种颜色在YUV空间的分量的上下阈值如图2所示

当一个待判定的像素在色彩空间中的位置落在这个长方体中时就认为该像素属于要找的颜色从而完成对图像颜色的识别Y空间中Y值表示亮度因它的变化很大所以只考虑了UV的值在进行颜色判断时首先分别建立UV的阈值向量

由于在系统中图像传感器的数字信号是81Byte,255Byte,系统最多能判定8种颜色在颜色识别后进行图像分割在图像分割中采用了种子填充算法其整个种子的填充是和像素点的颜色同时进行的一开始不是对所有的像素进行处理而是分块进行的本系统采用的块是32×24像素这样计算量大大减小当中心点是所要识别的颜色时就以这个点为种子向四周扩散并判定周围像素点的颜色直到填满整个块在这过程中同时对目标进行形状识别本系统采用了基于全局的特征向量的识别算法来进行识别同时也为构建雅可比矩阵得到需要的矩特征量3为图像识别分割流程图

2.3 视觉跟踪软件原理

当目标物体被识别以后视觉系统将调整镜头使目标位于视野的中心一旦物体运动视觉系统将进行对目标物体的跟踪

在机器人视觉跟踪系统上采用无定标的视觉跟踪系统无定标的视觉跟踪不需要事先对摄像镜头进行定标而是应用自适应控制方面的原理在线的实时调整图像雅可比矩阵通过二维的图像特征信息反馈这种方式对摄像机模型误差和机器人模型误差、图像误差、图像噪声不敏感基于图像跟踪的视觉跟踪控制系统如图4。

控制量c为机器人头部的控制系统首先把目标放在机器人视野的前方采集到期望的图像从期望图像中抽取期望的特征集作为视野跟踪控制系统的期望输入从而完成任务需要的视野特征集定义在实时控制系统中由机器人的图像传感器获取实时采样图像从中获取实时特征集这样构成一个视野反馈引导机器人完成跟踪任务区别于图像的简单几何特征本系统选用的视觉特征集为全局的图像描述—图像矩

根据矩特征变化量与相对位姿变化量之间的关系矩阵即图像雅可比矩阵然后利用推导的图像雅可比矩阵设计了视觉跟踪控制器完成系统对3D目标物体的平动跟踪

3 实验结果

5DSPclkout脚输出波形表明DSP的内部时钟电路工作正常6的图像传感器输出数据波形证明了图像传感器工作正常7DSP采集到的图像数据可以确定整个图像采集硬件电路工作正常

4 结 论

针对服务机器人的视觉系统本文通过构建它的硬件系统和软件系统完成了整个系统的设计在硬件系统上采用了CMOS图像传感器CPLD时序控制异步动态FIFO的数据缓存以及高速DSP处理器构成了一个典型的图像采集系统并调试输出了图像信号在软件设计上采用了足球机器人的彩色识别和彩色分割识别技术去完成视觉系统快速准确的识别采用基于动态的工作方式以及采用基于图像的雅可比矩阵的控制原理去实现自适应补偿跟踪控制系统

相关推荐

美国迈思肯荣获“2011包装行业荣格技术创新奖”

美国迈思肯公司成功参展ProPak China 2011

Microscan  视觉系统  Vision  HAWK  2011-07-25

美国科学家开发模拟人类大脑视觉系统计算机

视觉系统  计算机  GPU  2010-06-08

一种机器人视觉系统模块的设计

基于图像传感器的CPLD视觉系统设计

图像传感器  CPLD  视觉系统  2009-03-02

极富灵活性和追踪性的视觉检测方案——汽车配件供应商的理想选择

在线研讨会
焦点