CN108347685A

CN108347685A - 一种视觉识别转化为骨传导的精密算法

Info

Publication number: CN108347685A
Application number: CN201810110389.3A
Authority: CN
Inventors: 周琳; 陈林瑞
Original assignee: Sichuan Dongding Lizhi Information Technology Co Ltd
Current assignee: Sichuan Dongding Lizhi Information Technology Co Ltd
Priority date: 2018-02-05
Filing date: 2018-02-05
Publication date: 2018-07-31

Abstract

本发明的主要目的在于提供一种克服现有技术中视觉识别缺陷的视觉识别转化为骨传导的精密算法，其首先通过对图像进行变形校定，在依据视频图像的实际质量情况明暗程度对图像进行提前处理，从而可以很好地实现对视觉识别图像物体的识别和区分，进而通过骨传导的方式传达给大脑，从而对盲人达到良好的视觉识别效果。

Description

一种视觉识别转化为骨传导的精密算法

技术领域

本发明属于视觉识别领域，具体涉及一种视觉识别转化为骨传导的精密算法。

背景技术

人类感受客观世界70％以上的信息是通过眼睛得来的，因为视觉信息是当前信息研究的核心之一。视觉识别技术是从图像中检测出特定物体或目标的技术，而随着嵌入式技术的发展，目前机器视觉的实际研究与应用日益得到重视，并不断地在许多领域取得成果，例如机器人以及各种嵌入式系统等。视觉识别是通过各种视觉系统来模拟人的视觉功能，从各种事物的图像中提取信息，进行处理并加以理解，最终用于视觉检测、测量和控制柜。一个典型的视觉识别系统包括光源、光学系统、图像捕捉系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。

目前视觉识别的图像处理主要包括图像匹配、判别模型检测等，而图像匹配通常采用分区匹配和基于特征的匹配，分区匹配，其计算复杂度较高，且检测鲁棒性差，物体的微小变动即会对结果产生很大影响。而当物体发生尺寸变化、光照变化等变化时，该方法很难有较好的效果。而基于特征的匹配可在很大程度上避免这些问题，其受噪音干扰较小，根据不同的相似性度量准则进行判断，然而，其通常要将特征检测环节作为基础，受限制比较大。同时，受图像变形影响，其检测结果也会存在较大误差。而目前的图像处理过程也较为成熟，通常采用图像采集、图像灰度化、图像平滑、图像滤波、图形锐化、阈值分割等等。为了克服上述缺陷，目前需要一种对视觉识别图像处理中进行预处理的算法，以降低上述视觉识别存在的问题。

此外，尽管现有技术存在多种视觉识别方法，但仅识别而言对于盲人的影响尤其显著，他们还是无法感受到识别的效果。

发明内容

鉴于以上分析，本发明的主要目的在于提供一种克服上述缺陷的视觉识别缺陷的视觉识别转化为骨传导的精密算法，其首先通过对图像进行变形校定，在依据视频图像的实际质量情况明暗程度对图像进行提前处理，从而可以很好地实现对视觉识别图像物体的识别和区分，进而通过骨传导的方式传达给大脑，从而对盲人达到良好的视觉识别效果。

本发明的目的是通过以下技术方案实现的。

一种视觉识别转化为骨传导的精密算法，其包括如下步骤：

(1)采集视觉信息并进行识别；

(2)将识别结果对应于不同的语音类型，通过骨传导形式传送到耳蜗。

进一步地，所述步骤(1)包括视觉成像校定和像素处理两大步骤。

进一步地，所述视觉成像校定为对视频成像变形校定，在视频像中，由于视频设备镜头的原因，核心区域变形不明显，然而周围边界区域图像会有明显变形，需要建立从中心到边界方向平面变形校定公式：

x_c＝x(1+k₁r+k₂r⁴)

y_c＝y(1+k₁r+k₂r⁴)

其中，(x,y)表示像的原始位置，(x_c,y_c)是校定后的位置，r表示距成像中心的变形距离，k₁和k₂为所述从中心到边界方向上的变形系数，可以在校定中获取。

然而，由于镜头不完全与成像平面平行，因此，在同样会有该不平行方向上的变形，接着建立该方向上的变形校定公式：

x_c＝x+[2w₁y+w₂(r²+2x²)]

y_c＝y+[w₁(r²+2y²)+2w₂x]

其中w₁和w₂为该方向上的变形系数。

进一步地，对变形进行校定后，再接着对图像进行处理，将像素点颜色信息由彩色转换到灰度级，如果图像明暗程度正常时，再对像素点(x,y)进行如下处理：

设图像灰度为1～M，第i级别像素n_i个，总的像素则第i级别灰度出现的比率为p_i＝n_i/N。

设灰度限值为k。则像素按灰度级别被分为两种：

C₀＝{1,2,…,k}，C₁＝{k+1,…,M}

图像的灰度级别均值为：

C₀的灰度级别均值为：

像素个数为：

C₁的灰度级均值为μ-μ(k)，像素个数为N-N₀，背景和视觉识别物体两部分图像所占比例分别为：

对C₀和C₁作处理：

图像总平均值可化为：

μ＝w₀μ₀+w₁μ₁

种类之间的方差σ²(k)＝w₀(μ-μ₀)²+w₁(μ-μ₁)²＝w₀w₁(μ₀-μ₁)²转化为：

σ²(k)＝[μ·w(k)-μ(k)]²/{w(k)·[1-w(k)]}

k从1～M变化，使上述方差最大的k^*即为最佳限值。

上述种类之间的方差值越大，则表明构成图像的识别物体和背景图像差异越大，也就是说寻找上述最佳限值可以得到最优灰度限值，实现图像的最优区分，

而当图像过于昏暗时，则对每个像素的各通道值做线性转换后再像素做如上的处理步骤，其中线性转换的系数是目前光照条件特征值的函数。

进一步地，所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。

进一步地，所述步骤(2)包括：

(21)将识别出的图像映射到音乐空间，建立映射关系，所述音乐空间包括多种音乐元素；

(22)将映射关系对应的音乐元素转换成不同频率的振动信号；

(23)将振动信号通过骨传导的方式传递到耳蜗。

具体实施方式

在实施方式中，将详细介绍本发明的一种视觉识别转化为骨传导的精密算法，其包括如下步骤：

(1)采集视觉信息并进行识别；

优选地，所述步骤(1)包括视觉成像校定和像素处理两大步骤。其中所述视觉成像校定为对视频成像变形校定，在视频像中，由于视频设备镜头的原因，核心区域变形不明显，然而周围边界区域图像会有明显变形，需要建立从中心到边界方向平面变形校定公式：

x_c＝x(1+k₁r+k₂r⁴)

y_c＝y(1+k₁r+k₂r⁴)

x_c＝x+[2w₁y+w₂(r²+2x²)]

y_c＝y+[w₁(r²+2y²)+2w₂x]

其中w₁和w₂为该方向上的变形系数。

设灰度限值为k。则像素按灰度级别被分为两种：

C₀＝{1,2,…,k}，C₁＝{k+1,…,M}

图像的灰度级别均值为：

C₀的灰度级别均值为：

像素个数为：

对C₀和C₁作处理：

图像总平均值可化为：

μ＝w₀μ₀+w₁μ₁

σ²(k)＝[μ·w(k)-μ(k)]²/{w(k)·[1-w(k)]}

k从1～M变化，使上述方差最大的k^*即为最佳限值。

所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。

所述步骤(2)包括：

(21)将识别出的图像映射到音乐空间，建立映射关系，所述音乐空间包括多种音乐元素；所述图像在建立映射时是以图像的亮度、饱和度、色度、颜色变化速度为参数建立的，所述音乐空间包括旋律、和旋、音长、节奏信息。

(22)将映射关系对应的音乐元素转换成不同频率的振动信号；这种转换没有一定之规，例如本申请是申请人根据不同场景经过大量试验总结得到的经验转换方式。

(23)将振动信号通过骨传导的方式传递到耳蜗。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视觉识别转化为骨传导的精密算法，其包括如下步骤：

(1)采集视觉信息并进行识别；

2.根据权利要求1所述的视觉识别转化为骨传导的精密算法，其特征在于，所述步骤(1)包括视觉成像校定和像素处理两大步骤。

3.如权利要求2所述的视觉识别转化为骨传导的精密算法，其中所述视觉成像校定为对视频成像变形校定，在视频像中，由于视频设备镜头的原因，核心区域变形不明显，然而周围边界区域图像会有明显变形，需要建立从中心到边界方向平面变形校定公式：

x_c＝x(1+k₁r+k₂r⁴)

y_c＝y(1+k₁r+k₂r⁴)

其中，(x,y)表示像的原始位置，(x_c,y_c)是校定后的位置，r表示距成像中心的变形距离，k₁和k₂为所述从中心到边界方向上的变形系数，可以在校定中获取；

由于镜头不完全与成像平面平行，因此，在同样会有该不平行方向上的变形，接着建立该方向上的变形校定公式：

x_c＝x+[2w₁y+w₂(r²+2x²)]

y_c＝y+[w₁(r²+2y²)+2w₂x]

其中w₁和w₂为该方向上的变形系数。

4.如权利要求2所述的视觉识别转化为骨传导的精密算法，对变形进行校定后，再接着对图像进行处理，将像素点颜色信息由彩色转换到灰度级，如果图像明暗程度正常时，再对像素点(x,y)进行如下处理：

设灰度限值为k。则像素按灰度级别被分为两种：

C₀＝{1,2,…,k}，C₁＝{k+1,…,M}

图像的灰度级别均值为：

C₀的灰度级别均值为：

像素个数为：

w₁＝1-w(k)

对C₀和C₁作处理：

图像总平均值可化为：

μ＝w₀μ₀+w₁μ₁

σ²(k)＝[μ·w(k)-μ(k)]²/{w(k)·[1-w(k)]}

k从1～M变化，使上述方差最大的k^*即为最佳限值，上述种类之间的方差值越大，则表明构成图像的识别物体和背景图像差异越大，也就是说寻找上述最佳限值可以得到最优灰度限值，实现图像的最优区分；

而当图像过于昏暗时，则对每个像素的各通道值做线性转换后再像素做如上的像素处理步骤，其中所述线性转换的系数是目前光照条件特征值的函数。

5.如权利要求2所述的视觉识别转化为骨传导的精密算法，所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。

6.如权利要求2所述的视觉识别转化为骨传导的精密算法，其特征在于，所述步骤(2)包括：

(22)将映射关系对应的音乐元素转换成不同频率的振动信号；

(23)将振动信号通过骨传导的方式传递到耳蜗。