CN102509283A - 一种基于dsp的面向视神经假体的目标感知与编码方法 - Google Patents
一种基于dsp的面向视神经假体的目标感知与编码方法 Download PDFInfo
- Publication number
- CN102509283A CN102509283A CN2011102934252A CN201110293425A CN102509283A CN 102509283 A CN102509283 A CN 102509283A CN 2011102934252 A CN2011102934252 A CN 2011102934252A CN 201110293425 A CN201110293425 A CN 201110293425A CN 102509283 A CN102509283 A CN 102509283A
- Authority
- CN
- China
- Prior art keywords
- image
- dsp
- target
- optic nerve
- sigma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于DSP的面向视神经假体的目标感知与编码方法,首先进行图像采集,其次图像预处理,然后感兴趣目标提取,最后进行光幻视编码。本发明基于DSP的面向视神经假体的目标感知与编码方法,解决了视神经前端的图像处理及编码部分不易进行的问题,在基于DSP硬件平台的设计过程中取得了初步成果,验证了方案的可行性,也为后端神经刺激器刺激方式的确定提供决策性的方案。
Description
技术领域
本发明属于图像处理与编码技术领域,涉及一种面向视神经假体的目标识别方法,具体涉及一种基于DSP的面向视神经假体的目标感知与编码方法。
背景技术
视觉是人们认识世界的主要途径之一,通常从外界获取信息90%由视觉完成的。对于视网膜等器官受到损伤或者发生病变的患者,目前临床上还没有有效的治疗方案。随着电子、生物技术的发展,人们试图寻求通过人工视觉假体对盲人进行一定的视觉修复。在我国,人工视觉假体技术起步较晚,再加上问题的复杂性以及相关领域的技术进步,虽然取得了一些基础性研究成果,但目前的研究工作对于实际应用还有一定的差距。
当前,普遍认为假体的设计加工和植入手术的方案已不再是视觉假体未来发展的最大障碍。随着研究的深入,人们逐渐认识到最大的障碍在于如何建立假体与大脑之间的有效信息传递。为克服这一障碍,不但要论证以不同神经接口为基础的视觉假体的有效性,还必须弄清复杂的视觉神经编码机制。只有这样才能为视觉假体的最终成功开发与应用奠定坚实的基础。国内的研究人员通过动物视觉电生理实验了验证以视神经为神经接口的假体设计的可行性。目前关于视觉假体的研究主要集中在理论方面的研究,并没有涉及复杂的视觉假体的目标识别与编码系统的设计。
发明内容
本发明的目的是提供一种基于DSP的面向视神经假体的目标感知与编码方法,解决了视神经前端的图像处理及编码部分不易进行的问题。
本发明所采用的技术方案是,一种基于DSP的面向视神经假体的目标感知与编码方法,具体按照以下步骤实施:
步骤1:图像采集,采用CMOS摄像头采集视觉图像,通过视频解码器将CMOS摄像头采集的图像信号转换为数字信号,将得到的数字信号传递给DSP芯片;
步骤2:对步骤1得到的图像数字信号预处理;
步骤3:感兴趣目标提取,根据感兴趣的目标,对步骤2得到的预处理后的图像采用经典的图像分类方法进行提取;
步骤4:对步骤3得到的感兴趣目标图像进行光幻视编码,得到感兴趣区域的编码图。
本发明的特点还在于,
其中步骤2中的预处理,具体按照以下步骤实施:a.采用中值滤波保护图像的边缘信息;b.进行膨胀处理,并进行平滑运算,消除噪点;c.将彩色图像转化为灰度图像。
其中步骤3中的感兴趣目标提取,具体按照以下步骤实施:a.采用马尔科夫随机场模型对图像进行分割;b.对图像分割处理后的图像进行边缘检测;c.采用Hough变换的算法检测场景中的直线。
其中采用马尔科夫随机场模型对图像进行分割,具体按照以下步骤实施:
X是一个马尔科夫随机场,当且仅当在某个位置上的局部条件概率仅仅随所考虑的位置的邻域状态而变化,
P(XS=xS|xS)=P(XS=xS|xt,t∈δs),
其中,xs表示位置s处的状态值,δs为位置s的邻域集合,这样,一个点的灰度值只取决于该点邻域像素的灰度值;
根据Hamersley-Clifford定理中Gibbs分布与MRF的等价关系,用Gibbs分布来求解MRF中的概率分布,邻域系统J的Gibbs分布是定义在Q上的概率测度P,具有如下表达形式:
P(X=x)=exp[-U(x)]/Z,
其中,exp(.)为指数函数,X为随机场,x为X的具体实现,Z为归一化常数,U(x)为能量函数;
把预处理后的图像,先用K-均值算法完成一次初始分割,得到分割结果后计算特征参数μ和σ2:
其中,xs表示位置s处的状态值,ys为其观察值,Nm表示对应状态为m的位置的数目;
图像向量Y为一个行向量的集合,每一行对应一个像素位置的特征向量,设均值向量为μi,协方差矩阵为∑i,在s出的特征向量为ys,则能量函数表示为:
计算出特征场能量和标记场能量,根据最小能量的原则,得到分割结果。
其中步骤4中的光幻视编码,具体按照以下步骤实施:先建立匹配模式的数据库,并设置模式匹配时覆盖度为80%,模式与目标的匹配度高于80%时便接受,低于该标准时便舍去。
本发明的有益效果是,在基于DSP硬件平台的设计过程中取得了初步成果,验证了方案的可行性,也为后端神经刺激器刺激方式的确定提供决策性的方案。
附图说明
图1是本发明方法的流程图;
图2是微电极刺激实验条件下视网膜皮层呈现的真实光幻视模式图;
图3是本发明方法中DSP硬件平台设计的结构图;
图4是本发明实施例中字母E的光幻视编码图,其中,图a为字母E图像,图b为字母E的光幻视编码。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于DSP的面向视神经假体的目标感知与编码方法,按照人类视觉系统处理外界自然场景的思路,将视觉假体视觉信息处理与编码系统分为CMOS摄像头图像采集、基于DSP平台的实时图像处理以及LCD显示三个功能模块。其中,基于DSP的实时图像处理主要包括两个重要处理过程:感兴趣目标轮廓的提取和基于目标轮廓简化信息的视神经生理学模式(光幻视)编码。
如图1所示,具体按照以下步骤实施:
步骤1:CMOS摄像头的数据采集
由于当前视网膜人工假体还无法实现高密度神经刺激,刺激通道有限,因此对图像传感器的像素要求不高。另外考虑到视觉功能修复系统是可植入式的,要求其构成部件必须尺寸小、重量轻、功耗低。为此,本发明选用低分辨率的CMOS摄像头用于视觉假体的图像采集。数据采集完成后,传送给视频解码器,视频解码器将CMOS摄像头采集的模拟信号转换为要求的图像数据,以供DSP读取。这种方法为图像采集的通用方法。选用TI公司的超低功耗TVP5150视频解码器。
步骤2:图像的预处理
基于CMOS传感器获取的图像都是彩色格式的数据,具有R、G、B三个颜色通道。虽然联合利用各个通道的视觉数据对最终的目标轮廓提取性能会起到一定的作用,但会大大增加数据处理的运算量和存储空间。本发明采用的图像处理算法只需要灰度图像就可以很好地提取出感兴趣目标的轮廓。因此,需要对摄像头获取的彩色图像首先进行灰度图像转化预处理,转化成灰度级数据。预处理时,系统采集来的图像受到外界因素的影响,要采用中值滤波来保护图像的边缘信息,消除孤立的噪声点之后,再转化为灰阶图像,为下面的目标提取提供方便。
步骤3:感兴趣目标的提取
根据实际应用的需要,在确定了感兴趣目标所在的区域后,就可以通过经典的图像分类方法对这些感兴趣目标进行提取,有针对性的选取感兴趣的特定目标。对预处理后的图像运用马尔科夫随机场模型对图像进行分割,把分割的结果进一步进行处理,由于对于场景来说本发明更关心的是场景类别的整体而不是细节,所以对图像进行微小的膨胀处理,之后再进行一次平滑运算,这样在一定程度上保证了图像整体连续性,消除类别内的一些噪点。另一方面,由于单纯的模型分割效果仍需完善,本发明对预处理后的图像进行了边缘检测,并运用Hough变换的算法来检测场景中的直线。
步骤4:基于目标轮廓的神经生理学光幻视编码
图2所示为微电极刺激实验条件下视网膜皮层呈现的真实光幻视模式,这些光幻视模式分别对应着不同的微电极刺激方式。本发明利用这些基本的光幻视模式去表达感兴趣目标的轮廓。这样,每一种特定的目标轮廓就由不同的光幻视模式组成,也就对应着某一特定的微电极刺激模式组合。因此,对该试验对象来说,通过该特定的微电极刺激组合,通过特定的微电极刺激组合,通过实验对象的视神经将该目标的编码信息传到大脑中,从而可以感知到目标的信息。
在完成了从视频图像中提取感兴趣行人走道目标,目标的分割和轮廓提取及其概要化之后,就需要采用光幻视模式进行组合编码,本发明采用模式匹配的方法来完成这个环节的任务。可以说这一步骤是提取的感兴趣目标在光幻视模式编码框架下的一种重构,可以近似地看作是一种图像处理的逆过程。
在匹配的过程中,采用类似于图2的光幻视模式建立匹配模式的数据库,并设置模式匹配时覆盖度为80%,模式与目标的匹配度高于80%时便接受,低于该标准时便舍去。依据上述方法,可以对提取的目标实现良好的编码。
步骤5:基于DSP开发平台的系统实现。
为了便于与在室外操作和携带,为了让算法更高效的实现,也为了更直观的看到结果,本发明搭建了DSP开发平台。
对于图像数字信号处理芯片,选用TI公司推出的DSP 6000系列TMS320DM642专用视频信号处理芯片作为人工视觉图像处理系统的主芯片。
用视频解码器TVP 5150将CMOS摄像头采集的信号,转换为图像数据传送给DSP DM642,DSP将采集的图像数据缓存在SDRAM中,进行图像处理和编码。系统集成的示意图,如图3所示。
实施例
以英语字母E为例做出了编码的实验,下面叙述实验过程:
步骤1:用CMOS摄像头采集字母E的图像,采集到模拟信号采用视频解码器TVP5150,转化为可供DSP读取的数字信号。
步骤2:对图像进行预处理,实验时直接采用黑色的英文字母E,免除了图像灰色处理过程。在采集E图像时,难免受到外界因素的影响,故采用中值滤波来保护E的边缘信息,消除孤立的噪声点,为下面的目标提取提供方便。
步骤3:提取出感兴趣目标,由于研究的问题具有特定性,采用自顶向下(基于先验知识)和自底向上(基于图像信息)融合的选择性视觉注意方法来完成。
在确定了感兴趣目标所在的区域(即字母E)后,就需要通过图像分割的方法对这些感兴趣目标进行提取,采用基于马尔科夫随机场模型对图像进行处理,图像是由对应于像素点的有限集合S组成的,在S中有不同的邻域结构,当子集c∈S中的每对不同位置总是相邻时,称c是一个势,c表示势团的集合。用势团的势能可以表示相邻位置上灰度之间的局部相互作用。设有一个势团c,对应的势能为配,其值由该势团像素分量的灰度值决定。因此,图像的总能量可以定义为所有势团的势能之和,而某个位置的局部能量定义为该位置所属的所有势团的势能之和。
X是一个马尔科夫随机场,当且仅当在某个位置上的局部条件概率仅仅随所考虑的位置的邻域状态而变化。
P(XS=xS|x)=P(XS=xS|xt,t∈δs) (1)
其中,xs表示位置s处的状态值,δs为位置s的邻域集合。这样,一个点的灰度值只取决于该点邻域像素的灰度值。
根据Hamersley-Clifford定理中Gibbs分布与MRF的等价关系,从而用Gibbs分布来求解MRF中的概率分布。邻域系统的Gibbs分布可表示为概率测度P,具有如下表达形式:
P(X=x)=exp[-U(x)]/Z (2)
其中,exp(.)为指数函数,X为随机场,x为X的具体实现,Z是归一化常数,U(x)为能量函数。这就是马尔科夫模型的基本理论。
把预处理后的图像,先用K-均值算法完成一次初始分割,得到分割结果后计算特征参数均值μ和方差σ2。
其中,xs表示位置s处的状态值,ys为其观察值,Nm表示对应状态为m的位置的数目。
如果把图像向量Y为一个行向量的集合,每一行对应一个像素位置的特征向量,设均值向量为μi,协方差矩阵为∑i,在s处的特征向量为ys,则能量函数可以表示为
这样便可以计算出特征场能量和标记场能量,根据最小能量的原则,得到分割结果。设定一个终止条件,如果不满足终止条件就返回继续计算能量函数。最终把分割的结果进行一个后处理,由于对于场景来说更关心的是场景类别的整体而不是细节,所以对图像进行微小的膨胀处理,之后进行一次平滑运算,这样在一定程度上保证了图像整体连续性,消除类别内的一些噪点。
另一方面,由于单纯的模型分割效果仍需完善,对预处理后的图像进行了边缘检测,并运用Hough变换的算法来检测场景中的直线。
然后在图像分割和内部区域填充的基础上字母E的外部轮廓。
步骤4:对字母E进行光幻视编码,采用匹配的方法进行编码。在匹配的过程中,先建立匹配模式的数据库,并设置模式匹配时覆盖度为80%,模式与目标的匹配度高于80%时便接受,低于该标准时便舍去。依据上述方法,实现了对字母E良好的编码。
步骤5:通过DSP平台,得到了图4所示的编码结果。a为字母E的原始图像,b为字母E经过目标感知和编码好后的结果。b中的字母E用圆斑和长条模式将其表达出来,降低了E的复杂程度,简化了结果。以此类比,对于视神经假体,采用较少的神经刺激电极,便可以看到事物的大体轮廓,为后端神经刺激器刺激方式的确定提供决策性的方案。
Claims (5)
1.一种基于DSP的面向视神经假体的目标感知与编码方法,其特征在于,具体按照以下步骤实施:
步骤1:图像采集,采用CMOS摄像头采集视觉图像,通过视频解码器将CMOS摄像头采集的图像信号转换为数字信号,将得到的数字信号传递给DSP芯片;
步骤2:对步骤1得到的图像数字信号预处理;
步骤3:感兴趣目标提取,根据感兴趣的目标,对步骤2得到的预处理后的图像采用经典的图像分类方法进行提取;
步骤4:对步骤3得到的感兴趣目标图像进行光幻视编码,得到感兴趣区域的编码图。
2.根据权利要求1所述的基于DSP的面向视神经假体的目标感知与编码方法,其特征在于,所述的步骤2中的预处理,具体按照以下步骤实施:a.采用中值滤波保护图像的边缘信息;b.进行膨胀处理,并进行平滑运算,消除噪点;c.将彩色图像转化为灰度图像。
3.根据权利要求1所述的基于DSP的面向视神经假体的目标感知与编码方法,其特征在于,所述的步骤3中的感兴趣目标提取,具体按照以下步骤实施:a.采用马尔科夫随机场模型对图像进行分割;b.对图像分割处理后的图像进行边缘检测;c.采用Hough变换的算法检测场景中的直线。
4.根据权利要求3所述的基于DSP的面向视神经假体的目标感知与编码方法,其特征在于,所述的采用马尔科夫随机场模型对图像进行分割,具体按照以下步骤实施:
X是一个马尔科夫随机场,当且仅当在某个位置上的局部条件概率仅仅随所考虑的位置的邻域状态而变化,
P(XS=xS|xS)=P(XS=xS|xt,t∈δs),
其中,xs表示位置s处的状态值,δs为位置s的邻域集合,这样,一个点的灰度值只取决于该点邻域像素的灰度值;
根据Hamersley-Clifford定理中Gibbs分布与MRF的等价关系,用Gibbs分布来求解MRF中的概率分布,邻域系统J的Gibbs分布是定义在Q上的概率测度P,具有如下表达形式:
P(X=x)=exp[-U(x)]/Z,
其中,exp(.)为指数函数,X为随机场,x为X的具体实现,Z为归一化常数,U(x)为能量函数;
把预处理后的图像,先用K-均值算法完成一次初始分割,得到分割结果后计算特征参数μ和σ2:
其中,xs表示位置s处的状态值,ys为其观察值,Nm表示对应状态为m的位置的数目;
图像向量Y为一个行向量的集合,每一行对应一个像素位置的特征向量,设均值向量为μi,协方差矩阵为∑i,在s出的特征向量为ys,则能量函数表示为:
计算出特征场能量和标记场能量,根据最小能量的原则,得到分割结果。
5.根据权利要求1所述的基于DSP的面向视神经假体的目标感知与编码方法,其特征在于,所述的步骤4中的光幻视编码,具体按照以下步骤实施:先建立匹配模式的数据库,并设置模式匹配时覆盖度为80%,模式与目标的匹配度高于80%时便接受,低于该标准时便舍去。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102934252A CN102509283A (zh) | 2011-09-30 | 2011-09-30 | 一种基于dsp的面向视神经假体的目标感知与编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102934252A CN102509283A (zh) | 2011-09-30 | 2011-09-30 | 一种基于dsp的面向视神经假体的目标感知与编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102509283A true CN102509283A (zh) | 2012-06-20 |
Family
ID=46221361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102934252A Pending CN102509283A (zh) | 2011-09-30 | 2011-09-30 | 一种基于dsp的面向视神经假体的目标感知与编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102509283A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102921103A (zh) * | 2012-10-19 | 2013-02-13 | 西安理工大学 | 植入式视觉假体神经刺激器 |
CN104598897A (zh) * | 2015-02-12 | 2015-05-06 | 杭州摩图科技有限公司 | 视觉传感器、图像处理方法和装置、视觉交互设备 |
WO2018102988A1 (zh) * | 2016-12-06 | 2018-06-14 | 深圳先进技术研究院 | 基于人造视网膜的图像识别方法及装置 |
CN110200748A (zh) * | 2019-06-03 | 2019-09-06 | 上海海洋大学 | 一种假体视觉下功能评估仿真装置及其操作方法 |
CN111273050A (zh) * | 2020-02-12 | 2020-06-12 | 清华大学 | 信号采集处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1489115A (zh) * | 2003-08-14 | 2004-04-14 | 中国人民解放军第一军医大学 | 基于广义模糊随机场的图像优化分割方法 |
CN101114336A (zh) * | 2007-08-16 | 2008-01-30 | 上海交通大学 | 基于小波变换的人工视觉图像处理方法 |
-
2011
- 2011-09-30 CN CN2011102934252A patent/CN102509283A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1489115A (zh) * | 2003-08-14 | 2004-04-14 | 中国人民解放军第一军医大学 | 基于广义模糊随机场的图像优化分割方法 |
CN101114336A (zh) * | 2007-08-16 | 2008-01-30 | 上海交通大学 | 基于小波变换的人工视觉图像处理方法 |
Non-Patent Citations (4)
Title |
---|
刘桂雄,申柏华,冯云庆,胡存银,易静蓉: "基于改进的Hough变换图像分割方法", 《光学 精密工程》 * |
周昱,张杰,沈安文: "基于改进3D马尔可夫模型的动态车辆检测", 《华中科技大学学报(自然科学版)》 * |
李旭超,朱善安: "图像分割中的马尔可夫随机场方法综述", 《中国图象图形学报》 * |
王艳艳: "基于DSP的人工视觉图像采集系统", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102921103A (zh) * | 2012-10-19 | 2013-02-13 | 西安理工大学 | 植入式视觉假体神经刺激器 |
CN102921103B (zh) * | 2012-10-19 | 2015-04-22 | 西安理工大学 | 植入式视觉假体神经刺激器 |
CN104598897A (zh) * | 2015-02-12 | 2015-05-06 | 杭州摩图科技有限公司 | 视觉传感器、图像处理方法和装置、视觉交互设备 |
CN104598897B (zh) * | 2015-02-12 | 2018-06-12 | 杭州摩图科技有限公司 | 视觉传感器、图像处理方法和装置、视觉交互设备 |
US10382661B2 (en) | 2015-02-12 | 2019-08-13 | Morpx Inc. | Vision sensor, system, and method for image processing, and vision based interactive device |
WO2018102988A1 (zh) * | 2016-12-06 | 2018-06-14 | 深圳先进技术研究院 | 基于人造视网膜的图像识别方法及装置 |
US10984234B2 (en) | 2016-12-06 | 2021-04-20 | Shenzhen Cas-Envision Medical Technology Co., Ltd | Method and apparatus for image recognition based on retina prosthesis |
CN110200748A (zh) * | 2019-06-03 | 2019-09-06 | 上海海洋大学 | 一种假体视觉下功能评估仿真装置及其操作方法 |
CN111273050A (zh) * | 2020-02-12 | 2020-06-12 | 清华大学 | 信号采集处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102542281B (zh) | 非接触式生物特征识别方法和系统 | |
CN105574518B (zh) | 人脸活体检测的方法和装置 | |
CN102509283A (zh) | 一种基于dsp的面向视神经假体的目标感知与编码方法 | |
CN101261677B (zh) | 人脸的特征提取方法 | |
CN105426821A (zh) | 一种基于八邻域和二次匹配的手掌静脉特征提取和匹配方法 | |
CN106963489B (zh) | 一种个体化股骨骨折复位模型构建方法 | |
CN103761519A (zh) | 一种基于自适应校准的非接触式视线追踪方法 | |
CN108985172A (zh) | 一种基于结构光的视线追踪方法、装置、设备及存储介质 | |
CN103985099B (zh) | 一种弥散张量磁共振图像张量域非局部均值去噪方法 | |
CN105342769A (zh) | 智能电动轮椅 | |
CN102331838B (zh) | 基于深度等高线的图像的振动触觉表达方法 | |
CN103679203A (zh) | 机器人的人脸检测与情感识别系统及方法 | |
CN104318221A (zh) | 一种基于elm的人脸表情识别方法 | |
CN102542242B (zh) | 非接触式采集图像的生物特征区域定位方法和装置 | |
CN106485721A (zh) | 从光学相干断层图像获取视网膜结构的方法及其系统 | |
CN109009887A (zh) | 一种基于脑机接口的人机交互式导航系统及方法 | |
CN105354856A (zh) | 一种基于mser与orb相结合的人体匹配与定位方法及系统 | |
CN106709431A (zh) | 虹膜识别方法及装置 | |
CN112037252A (zh) | 基于鹰眼视觉的目标跟踪方法及系统 | |
CN101286236B (zh) | 基于多特征图像和均值漂移的红外目标跟踪方法 | |
CN103824483A (zh) | 一种基于虚拟现实的交警手势训练系统 | |
CN108288299A (zh) | 一种表情数据驱动三维形象表情的方法及系统 | |
CN114202795A (zh) | 一种老年人瞳孔快速定位方法 | |
CN111950371B (zh) | 疲劳驾驶预警方法及其装置、电子设备、存储介质 | |
CN109920049B (zh) | 边缘信息辅助精细三维人脸重建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120620 |