CN108347685A - 一种视觉识别转化为骨传导的精密算法 - Google Patents

一种视觉识别转化为骨传导的精密算法 Download PDF

Info

Publication number
CN108347685A
CN108347685A CN201810110389.3A CN201810110389A CN108347685A CN 108347685 A CN108347685 A CN 108347685A CN 201810110389 A CN201810110389 A CN 201810110389A CN 108347685 A CN108347685 A CN 108347685A
Authority
CN
China
Prior art keywords
image
osteoacusis
deformation
converted
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810110389.3A
Other languages
English (en)
Inventor
周琳
陈林瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Dongding Lizhi Information Technology Co Ltd
Original Assignee
Sichuan Dongding Lizhi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Dongding Lizhi Information Technology Co Ltd filed Critical Sichuan Dongding Lizhi Information Technology Co Ltd
Priority to CN201810110389.3A priority Critical patent/CN108347685A/zh
Publication of CN108347685A publication Critical patent/CN108347685A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/60Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
    • H04R25/604Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers
    • H04R25/606Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers acting directly on the eardrum, the ossicles or the skull, e.g. mastoid, tooth, maxillary or mandibular bone, or mechanically stimulating the cochlea, e.g. at the oval window
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Neurosurgery (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明的主要目的在于提供一种克服现有技术中视觉识别缺陷的视觉识别转化为骨传导的精密算法,其首先通过对图像进行变形校定,在依据视频图像的实际质量情况明暗程度对图像进行提前处理,从而可以很好地实现对视觉识别图像物体的识别和区分,进而通过骨传导的方式传达给大脑,从而对盲人达到良好的视觉识别效果。

Description

一种视觉识别转化为骨传导的精密算法
技术领域
本发明属于视觉识别领域,具体涉及一种视觉识别转化为骨传导的精密算法。
背景技术
人类感受客观世界70%以上的信息是通过眼睛得来的,因为视觉信息是当前信息研究的核心之一。视觉识别技术是从图像中检测出特定物体或目标的技术,而随着嵌入式技术的发展,目前机器视觉的实际研究与应用日益得到重视,并不断地在许多领域取得成果,例如机器人以及各种嵌入式系统等。视觉识别是通过各种视觉系统来模拟人的视觉功能,从各种事物的图像中提取信息,进行处理并加以理解,最终用于视觉检测、测量和控制柜。一个典型的视觉识别系统包括光源、光学系统、图像捕捉系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。
目前视觉识别的图像处理主要包括图像匹配、判别模型检测等,而图像匹配通常采用分区匹配和基于特征的匹配,分区匹配,其计算复杂度较高,且检测鲁棒性差,物体的微小变动即会对结果产生很大影响。而当物体发生尺寸变化、光照变化等变化时,该方法很难有较好的效果。而基于特征的匹配可在很大程度上避免这些问题,其受噪音干扰较小,根据不同的相似性度量准则进行判断,然而,其通常要将特征检测环节作为基础,受限制比较大。同时,受图像变形影响,其检测结果也会存在较大误差。而目前的图像处理过程也较为成熟,通常采用图像采集、图像灰度化、图像平滑、图像滤波、图形锐化、阈值分割等等。为了克服上述缺陷,目前需要一种对视觉识别图像处理中进行预处理的算法,以降低上述视觉识别存在的问题。
此外,尽管现有技术存在多种视觉识别方法,但仅识别而言对于盲人的影响尤其显著,他们还是无法感受到识别的效果。
发明内容
鉴于以上分析,本发明的主要目的在于提供一种克服上述缺陷的视觉识别缺陷的视觉识别转化为骨传导的精密算法,其首先通过对图像进行变形校定,在依据视频图像的实际质量情况明暗程度对图像进行提前处理,从而可以很好地实现对视觉识别图像物体的识别和区分,进而通过骨传导的方式传达给大脑,从而对盲人达到良好的视觉识别效果。
本发明的目的是通过以下技术方案实现的。
一种视觉识别转化为骨传导的精密算法,其包括如下步骤:
(1)采集视觉信息并进行识别;
(2)将识别结果对应于不同的语音类型,通过骨传导形式传送到耳蜗。
进一步地,所述步骤(1)包括视觉成像校定和像素处理两大步骤。
进一步地,所述视觉成像校定为对视频成像变形校定,在视频像中,由于视频设备镜头的原因,核心区域变形不明显,然而周围边界区域图像会有明显变形,需要建立从中心到边界方向平面变形校定公式:
xc=x(1+k1r+k2r4)
yc=y(1+k1r+k2r4)
其中,(x,y)表示像的原始位置,(xc,yc)是校定后的位置,r表示距成像中心的变形距离,k1和k2为所述从中心到边界方向上的变形系数,可以在校定中获取。
然而,由于镜头不完全与成像平面平行,因此,在同样会有该不平行方向上的变形,接着建立该方向上的变形校定公式:
xc=x+[2w1y+w2(r2+2x2)]
yc=y+[w1(r2+2y2)+2w2x]
其中w1和w2为该方向上的变形系数。
进一步地,对变形进行校定后,再接着对图像进行处理,将像素点颜色信息由彩色转换到灰度级,如果图像明暗程度正常时,再对像素点(x,y)进行如下处理:
设图像灰度为1~M,第i级别像素ni个,总的像素则第i级别灰度出现的比率为pi=ni/N。
设灰度限值为k。则像素按灰度级别被分为两种:
C0={1,2,…,k},C1={k+1,…,M}
图像的灰度级别均值为:
C0的灰度级别均值为:
像素个数为:
C1的灰度级均值为μ-μ(k),像素个数为N-N0,背景和视觉识别物体两部分图像所占比例分别为:
对C0和C1作处理:
图像总平均值可化为:
μ=w0μ0+w1μ1
种类之间的方差σ2(k)=w0(μ-μ0)2+w1(μ-μ1)2=w0w101)2转化为:
σ2(k)=[μ·w(k)-μ(k)]2/{w(k)·[1-w(k)]}
k从1~M变化,使上述方差最大的k*即为最佳限值。
上述种类之间的方差值越大,则表明构成图像的识别物体和背景图像差异越大,也就是说寻找上述最佳限值可以得到最优灰度限值,实现图像的最优区分,
而当图像过于昏暗时,则对每个像素的各通道值做线性转换后再像素做如上的处理步骤,其中线性转换的系数是目前光照条件特征值的函数。
进一步地,所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。
进一步地,所述步骤(2)包括:
(21)将识别出的图像映射到音乐空间,建立映射关系,所述音乐空间包括多种音乐元素;
(22)将映射关系对应的音乐元素转换成不同频率的振动信号;
(23)将振动信号通过骨传导的方式传递到耳蜗。
具体实施方式
在实施方式中,将详细介绍本发明的一种视觉识别转化为骨传导的精密算法,其包括如下步骤:
(1)采集视觉信息并进行识别;
(2)将识别结果对应于不同的语音类型,通过骨传导形式传送到耳蜗。
优选地,所述步骤(1)包括视觉成像校定和像素处理两大步骤。其中所述视觉成像校定为对视频成像变形校定,在视频像中,由于视频设备镜头的原因,核心区域变形不明显,然而周围边界区域图像会有明显变形,需要建立从中心到边界方向平面变形校定公式:
xc=x(1+k1r+k2r4)
yc=y(1+k1r+k2r4)
其中,(x,y)表示像的原始位置,(xc,yc)是校定后的位置,r表示距成像中心的变形距离,k1和k2为所述从中心到边界方向上的变形系数,可以在校定中获取。
然而,由于镜头不完全与成像平面平行,因此,在同样会有该不平行方向上的变形,接着建立该方向上的变形校定公式:
xc=x+[2w1y+w2(r2+2x2)]
yc=y+[w1(r2+2y2)+2w2x]
其中w1和w2为该方向上的变形系数。
进一步地,对变形进行校定后,再接着对图像进行处理,将像素点颜色信息由彩色转换到灰度级,如果图像明暗程度正常时,再对像素点(x,y)进行如下处理:
设图像灰度为1~M,第i级别像素ni个,总的像素则第i级别灰度出现的比率为pi=ni/N。
设灰度限值为k。则像素按灰度级别被分为两种:
C0={1,2,…,k},C1={k+1,…,M}
图像的灰度级别均值为:
C0的灰度级别均值为:
像素个数为:
C1的灰度级均值为μ-μ(k),像素个数为N-N0,背景和视觉识别物体两部分图像所占比例分别为:
对C0和C1作处理:
图像总平均值可化为:
μ=w0μ0+w1μ1
种类之间的方差σ2(k)=w0(μ-μ0)2+w1(μ-μ1)2=w0w101)2转化为:
σ2(k)=[μ·w(k)-μ(k)]2/{w(k)·[1-w(k)]}
k从1~M变化,使上述方差最大的k*即为最佳限值。
上述种类之间的方差值越大,则表明构成图像的识别物体和背景图像差异越大,也就是说寻找上述最佳限值可以得到最优灰度限值,实现图像的最优区分,
而当图像过于昏暗时,则对每个像素的各通道值做线性转换后再像素做如上的处理步骤,其中线性转换的系数是目前光照条件特征值的函数。
所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。
所述步骤(2)包括:
(21)将识别出的图像映射到音乐空间,建立映射关系,所述音乐空间包括多种音乐元素;所述图像在建立映射时是以图像的亮度、饱和度、色度、颜色变化速度为参数建立的,所述音乐空间包括旋律、和旋、音长、节奏信息。
(22)将映射关系对应的音乐元素转换成不同频率的振动信号;这种转换没有一定之规,例如本申请是申请人根据不同场景经过大量试验总结得到的经验转换方式。
(23)将振动信号通过骨传导的方式传递到耳蜗。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种视觉识别转化为骨传导的精密算法,其包括如下步骤:
(1)采集视觉信息并进行识别;
(2)将识别结果对应于不同的语音类型,通过骨传导形式传送到耳蜗。
2.根据权利要求1所述的视觉识别转化为骨传导的精密算法,其特征在于,所述步骤(1)包括视觉成像校定和像素处理两大步骤。
3.如权利要求2所述的视觉识别转化为骨传导的精密算法,其中所述视觉成像校定为对视频成像变形校定,在视频像中,由于视频设备镜头的原因,核心区域变形不明显,然而周围边界区域图像会有明显变形,需要建立从中心到边界方向平面变形校定公式:
xc=x(1+k1r+k2r4)
yc=y(1+k1r+k2r4)
其中,(x,y)表示像的原始位置,(xc,yc)是校定后的位置,r表示距成像中心的变形距离,k1和k2为所述从中心到边界方向上的变形系数,可以在校定中获取;
由于镜头不完全与成像平面平行,因此,在同样会有该不平行方向上的变形,接着建立该方向上的变形校定公式:
xc=x+[2w1y+w2(r2+2x2)]
yc=y+[w1(r2+2y2)+2w2x]
其中w1和w2为该方向上的变形系数。
4.如权利要求2所述的视觉识别转化为骨传导的精密算法,对变形进行校定后,再接着对图像进行处理,将像素点颜色信息由彩色转换到灰度级,如果图像明暗程度正常时,再对像素点(x,y)进行如下处理:
设图像灰度为1~M,第i级别像素ni个,总的像素则第i级别灰度出现的比率为pi=ni/N。
设灰度限值为k。则像素按灰度级别被分为两种:
C0={1,2,…,k},C1={k+1,…,M}
图像的灰度级别均值为:
C0的灰度级别均值为:
像素个数为:
C1的灰度级均值为μ-μ(k),像素个数为N-N0,背景和视觉识别物体两部分图像所占比例分别为:
w1=1-w(k)
对C0和C1作处理:
图像总平均值可化为:
μ=w0μ0+w1μ1
种类之间的方差σ2(k)=w0(μ-μ0)2+w1(μ-μ1)2=w0w101)2转化为:
σ2(k)=[μ·w(k)-μ(k)]2/{w(k)·[1-w(k)]}
k从1~M变化,使上述方差最大的k*即为最佳限值,上述种类之间的方差值越大,则表明构成图像的识别物体和背景图像差异越大,也就是说寻找上述最佳限值可以得到最优灰度限值,实现图像的最优区分;
而当图像过于昏暗时,则对每个像素的各通道值做线性转换后再像素做如上的像素处理步骤,其中所述线性转换的系数是目前光照条件特征值的函数。
5.如权利要求2所述的视觉识别转化为骨传导的精密算法,所述图像处理过程还包括图像轮廓提取、图像滤波、图像锐化步骤。
6.如权利要求2所述的视觉识别转化为骨传导的精密算法,其特征在于,所述步骤(2)包括:
(21)将识别出的图像映射到音乐空间,建立映射关系,所述音乐空间包括多种音乐元素;
(22)将映射关系对应的音乐元素转换成不同频率的振动信号;
(23)将振动信号通过骨传导的方式传递到耳蜗。
CN201810110389.3A 2018-02-05 2018-02-05 一种视觉识别转化为骨传导的精密算法 Pending CN108347685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810110389.3A CN108347685A (zh) 2018-02-05 2018-02-05 一种视觉识别转化为骨传导的精密算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810110389.3A CN108347685A (zh) 2018-02-05 2018-02-05 一种视觉识别转化为骨传导的精密算法

Publications (1)

Publication Number Publication Date
CN108347685A true CN108347685A (zh) 2018-07-31

Family

ID=62958555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810110389.3A Pending CN108347685A (zh) 2018-02-05 2018-02-05 一种视觉识别转化为骨传导的精密算法

Country Status (1)

Country Link
CN (1) CN108347685A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162503A (zh) * 2007-11-23 2008-04-16 重庆大学 利用改进Hausdorff距离提取识别人耳特征的方法
CN101950351A (zh) * 2008-12-02 2011-01-19 英特尔公司 使用图像识别算法识别目标图像的方法
CN102663685A (zh) * 2012-03-19 2012-09-12 宁波大学 一种基于非线性的几何校正方法
JP2015119352A (ja) * 2013-12-18 2015-06-25 佑太 国安 記憶再生装置
CN106203390A (zh) * 2016-07-22 2016-12-07 杭州视氪科技有限公司 一种智能盲人辅助系统
CN107424481A (zh) * 2017-07-20 2017-12-01 广州古拉思信息科技有限公司 一种可图像识别的骨传导盲人眼镜

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162503A (zh) * 2007-11-23 2008-04-16 重庆大学 利用改进Hausdorff距离提取识别人耳特征的方法
CN101950351A (zh) * 2008-12-02 2011-01-19 英特尔公司 使用图像识别算法识别目标图像的方法
CN102663685A (zh) * 2012-03-19 2012-09-12 宁波大学 一种基于非线性的几何校正方法
JP2015119352A (ja) * 2013-12-18 2015-06-25 佑太 国安 記憶再生装置
CN106203390A (zh) * 2016-07-22 2016-12-07 杭州视氪科技有限公司 一种智能盲人辅助系统
CN107424481A (zh) * 2017-07-20 2017-12-01 广州古拉思信息科技有限公司 一种可图像识别的骨传导盲人眼镜

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
凌澄: "《PC总线工业控制系统精粹》", 31 May 1998, 清华大学出版社 *
张大治: "《刑事数字图像处理原理与实务》", 31 January 2015, 四川大学出版社 *

Similar Documents

Publication Publication Date Title
CN108229362B (zh) 一种基于门禁系统的双目人脸识别活体检测方法
US6661907B2 (en) Face detection in digital images
CN111368683B (zh) 基于模约束CenterFace的人脸图像特征提取方法及人脸识别方法
CN112819772B (zh) 一种高精度快速图形检测识别方法
CN108268859A (zh) 一种基于深度学习的人脸表情识别方法
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN111191573A (zh) 一种基于眨眼规律识别的驾驶员疲劳检测方法
JP2006146626A (ja) パターン認識方法および装置
WenJuan et al. A real-time lip localization and tacking for lip reading
CN104484652A (zh) 一种指纹识别方法
CN111079688A (zh) 一种人脸识别中的基于红外图像的活体检测的方法
CN111767877A (zh) 一种基于红外特征的活体检测方法
CN108446642A (zh) 一种快速人脸识别系统
CN107122732B (zh) 一种监控场景下高鲁棒性的快速车牌定位方法
CN116843581B (zh) 一种多场景图的图像增强方法、系统、设备和存储介质
CN108446639A (zh) 低功耗增强现实设备
CN108009480A (zh) 一种基于特征识别的图像人体行为检测方法
JP3962517B2 (ja) 顔面検出方法及びその装置、コンピュータ可読媒体
CN108288041B (zh) 一种行人目标错检去除的预处理方法
CN108347685A (zh) 一种视觉识别转化为骨传导的精密算法
CN107220612B (zh) 以关键点局部邻域的高频分析为核心的模糊人脸判别方法
Saranya et al. An approach towards ear feature extraction for human identification
JP4510562B2 (ja) 円中心位置検出方法および装置並びにプログラム
CN114782268A (zh) 一种改进surf算法的低照度图像增强方法
CN109948530B (zh) 基于交叉学习的行人再识别性能提升方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180731