CN113948109B - 一种基于声音识别生理现象的系统 - Google Patents
一种基于声音识别生理现象的系统 Download PDFInfo
- Publication number
- CN113948109B CN113948109B CN202111196272.XA CN202111196272A CN113948109B CN 113948109 B CN113948109 B CN 113948109B CN 202111196272 A CN202111196272 A CN 202111196272A CN 113948109 B CN113948109 B CN 113948109B
- Authority
- CN
- China
- Prior art keywords
- sound
- voice
- signal
- frequency
- physiological phenomenon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 claims abstract description 103
- 230000005236 sound signal Effects 0.000 claims abstract description 98
- 238000012545 processing Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 10
- 230000001105 regulatory effect Effects 0.000 claims abstract description 9
- 230000036541 health Effects 0.000 claims description 33
- 238000005259 measurement Methods 0.000 claims description 22
- 238000012544 monitoring process Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 230000001276 controlling effect Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 210000003928 nasal cavity Anatomy 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 210000001503 joint Anatomy 0.000 claims description 3
- 210000001260 vocal cord Anatomy 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 9
- 206010011224 Cough Diseases 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Telephone Function (AREA)
Abstract
本发明提供了一种基于声音识别生理现象的系统。包括:声音判断模块:用于获取集音装置收集的声音信号,并提取所述声音信号生理特征信息,对所述声音信号进行识别处理,获取识别结果,根据所述识别结果对所述声音信号进行生理特征信息判断,获取准确生理现象声音信号;声音响应模块:用于根据所述准确生理现象声音信号确定发话者身份,并设定对应的声音响应方式;声音显示模块:用于根据所述声音响应方式进行音量调控处理,并将调控后的标准声音进行输出,本发明不仅可以通过生理现象进行声音识别,还可以通过识别所述生理现象声音对发声者的身体健康状况进行监测。
Description
技术领域
本发明涉及声音识别技术领域,特别涉及一种基于声音识别生理现象的系统。
背景技术
目前,声音识别的迅速发展以及高效可靠的应用软件的开发,使声音识别系统在很多方面得到了应用、这种系统可以用声音指令拟应用特定短句实现“不用手”的数据采集、其最大特点就是不用手和眼睛,这对那些采集数据同时还要完成手脚并用的工作场合尤为适用。由于每个人的声音千差万别,因此声音可以用作安全认证的依据之一,因此本发明不仅可以通过生理现象进行声音识别,还可以通过识别所述生理现象声音对发声者的身体健康状况进行监测。
发明内容
本发明提供一种基于声音识别生理现象的系统,通过采集并识别佩戴者叹气、咳嗽的声音至传感器对生理现象做出判断,并传输给机器给予相应的反应。
一种基于声音识别生理现象的系统,其特征在于,包括:
声音判断模块:用于获取集音装置收集的声音信号,并提取所述声音信号的生理特征信息,对所述声音信号进行识别处理,获取识别结果,根据所述识别结果对所述声音信号进行生理特征信息判断,获取准确生理现象声音信号;
声音响应模块:用于根据所述准确生理现象声音信号确定发话者身份,并设定对应的声音响应方式;
声音显示模块:用于根据所述声音响应方式进行音量调控处理,并将调控后的标准声音进行输出。
作为本技术方案的一种实施例,在于所述声音识别模块,包括:
声音信号获取单元:用于对接集音装置,并实时接收集音装置传输的声音信号,并将所述声音信号进行初级标识;
声音信号处理单元:用于接收所述标识声音信号,对所述标识声音信号进行降噪处理,并将发话者声音信号与噪音信号进行分离处理,获取无噪声音信号;
声音识别处理单元:用于根据所述无噪声音信号,对所述发话者声音信号进行识别,确定发话者身份信息。
作为本技术方案的一种实施例,在于声音响应模块,包括:
发话者确定单元:用于根据识别后的声音信号确定发话者发身份信息和声音信息;
相应内容设定单元:用于根据接收到的所述声音特征信息,在声音频率范围子单元将所述声音特征信息进行声音频率划分,获取不同声音频率分段范围;
响应方式设定单元:用于根据所述不同声音频率分段范围,对声音响应方式进行一级响应方式、二级响应方式、三级响应方式和四级响应方式的设定;
响应输出控制单元:用于根据声音响应方式,控制声音信号响应时间,将阈值时间内的声音信号进行输出。
作为本技术方案的一种实施例,在于所述声音频率范围子单元和响应方式设定单元,进行频率划分和响应方式设定需要如下步骤:
所述声音频率范围子单元根据发话者发声生理部声音的频率进行频率划分;
通过所述频率划分,将声音频率划分为三个等级:高频率信号、中频率信号和低频率信号;
根据所述声音频率等级,确定声音响应方式;
当发话者声音为高频率信号时,系统响应方式为低语速声音响应;
当发话者声音为中频率信号时,系统响应方式为正常语速声音响应;
当发话者声音为低频率信号时,系统响应方式为快语速声音响应。
作为本技术方案的一种实施例,在于声音显示模块,包括:
声音反应单元:用于对接收到的声音响应方式信号进行响应标准化预设处理,并确定处理后的标准声音信号;
声音调控单元:用于对所述标准声音信号进行调控处理,生成额定音量的标准声音信号;
声音输出单元:基于所述额定音量标准声音信号,进行标准音量声音输出。
作为本技术方案的一种实施例,在于生理现象判断单元进行生理现象判断需要如下步骤:
所述生理现象判断单元采集生理现象声音信号,对所述生理现象声音信号进行存储标识;
根据进行标识的生理现象声音信号,对所述生理现象声音信号进行特征识别;
根据识别的生理现象特征,对所述声音进行生理现象发声部位判断,得到判断结果;
基于判断结果,当所述生理现象为气声时,判断发声部位为鼻腔部位;
当所述生理现象为字声时,判断发声部位是通过声带振动产生声音的喉腔部位。
作为本技术方案的一种实施例,在于声音测量模块用声音进行距离测量需要如下步骤:
所述声音测量模块用于根据发话者发出的生理现象声音进行声音测量;
通过收集所述生理现象声音,对收集到的所述声音进行计算分析,判断声源与测量模块的距离范围;
根据所述距离范围,进行距离误差计算,基于所述距离误差进行计算范围调整;
基于对距离误差进行调整,对发话者与测量模块的距离进行计算,获取发话者与测量模块之间的实际距离数据。
作为本技术方案的一种实施例,在于所述声音测量模块进行测量步骤如下所示:
步骤一:声音测量模块采集生理现象声音,并对所述声音进行压缩处理,获取压缩声音信号;
步骤二:根据所述压缩声音信号,进行声音传送距离计算,获取发话者和测量模块之间的距离范围数据值;
步骤三:根据所述数据值,进行距离误差计算,对所述距离范围进行调控设置;
步骤四:根据调控设置,进行距离差值计算,获取发话者与测量模块之间的实际距离数据。
作为本技术方案的一种实施例,在于生理现象监测模块进行监测生理现象是否正常,需要如下步骤:
所述生理现象监测模块用于通过监测生理现象声音的发声频率,判断发声者的健康状态;
通过所述生理现象监测模块采集生理现象声音,并将所述生理现象声音转化为声音频率信号;
根据所述声音频率信号的频率特征,进行声音信号分频段存储,生成固定频段声音信号;
将收集到的生理现象声音与所述固定频段声音信号进行对比,判断所述生理现象声音是否在人体健康声音频率范围;
当所述生理现象声音在人体健康声音频率范围内时,判定发声者身体健康,将所述生理现象声音进行收录存储;
当所述生理现象声音不在人体健康声音频率范围内时,判定发声者身体健康异常,将进行系统报警提示。
作为本技术方案的一种实施例,在于所述生理现象监测模块具体实施步骤如下所示:
步骤一:采集生理现象声音,进行声音压缩转化获取声音频率信号,并将所述声音频率信号在信息库中进行存储;
步骤二:根据声音频率波段将信息库中的所述声音频率信号进行频率等级划分;
步骤三:根据所述频率等级划分,生成固定频段的声音信号;
步骤四:将采集的生理现象声音与所述固定频段声音信号进行声音频率波长对比;
步骤五:根据波长对比结果,当所述生理现象声音波长在固定频段声音波长范围内时,判断发声者身体健康处于正常状态;
步骤六:当所述生理现象声音波长不在固定频段声音波长范围内时,判断发声者身体健康处于异常状态。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于声音识别生理现象的系统流程图;
图2为本发明实施例中一种基于声音识别生理现象的系统流程图;
图3为本发明实施例中一种基于声音识别生理现象的系统流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了声音判断模块:用于获取集音装置收集的声音信号,并提取所述声音信号的生理特征信息,对所述声音信号进行识别处理,获取识别结果,根据所述识别结果对所述声音信号进行生理特征信息判断,获取准确生理现象声音信号;
声音响应模块:用于根据所述准确生理现象声音信号确定发话者身份,并设定对应的声音响应方式;
声音显示模块:用于根据所述声音响应方式进行音量调控处理,并将调控后的标准声音进行输出;
上述技术方案的工作原理为:在声音判断模块通过集音装置获取声音信号然后对声音信号进行生理特征判断,并对声音信号开始进行识别,在声音响应模块中是用于根据声音信号来确定发话者身份,并且设定发话者声音响应方式,在声音显示模块中,是用于对采集声音进行音量调控处理,并将调控后的标准声音进行输出显示;
上述技术方案的有益效果为:通过声音判断模块、声音响应模块和声音显示模块的共同作用,完成对生理现象声音的识别,既可以根据生理现象特征确定发话者身份,又可以对声音进行降噪、音量设置,确保输出标准的声音。
在一个实施例中,所述声音识别模块,包括:
声音信号获取单元:用于对接集音装置,并实时接收集音装置传输的声音信号,并将所述声音信号进行初级标识;
声音信号处理单元:用于接收所述标识声音信号,对所述标识声音信号进行降噪处理,并将发话者声音信号与噪音信号进行分离处理,获取无噪声音信号;
声音识别处理单元:用于根据所述无噪声音信号,对所述发话者声音信号进行识别,确定发话者身份信息;
上述技术方案的工作原理为:在声音识别模块中,首先通过声音信号获取单元通过集音装置获取声音信号,对所述声音进行初级标识,并将所述标识声音信号传递至声音信号处理单元,对所述标识声音信号进行降噪处理,并将发话者声音信号与噪音信号进行分离处理,然后对发话者声音信号进行识别;
上述技术方案的有益效果为:通过声音识别模块可以不仅可以对采集到的声音进行处理还可以对声音进行识别,便于对声音信号进行采集。
在一个实施例中,声音响应模块,包括:
发话者确定单元:用于根据识别后的声音信号确定发话者发身份信息和声音信息;
相应内容设定单元:用于根据接收到的所述声音特征信息,在声音频率范围子单元将所述声音特征信息进行声音频率划分,获取不同声音频率分段范围;
响应方式设定单元:用于根据所述不同声音频率分段范围,对声音响应方式进行一级响应方式、二级响应方式、三级响应方式和四级响应方式的设定;
响应输出控制单元:用于根据声音响应方式,控制声音信号响应时间,将阈值时间内的声音信号进行输出;
上述技术方案的工作原理为:在声音响应模块中,通过发话者确定单元确定发话者发声生理部的声音特征信息,然后根据接收到的所述声音特征信息,设定声音频率范围子单元,在声音频率子单元将所述声音特征信息进行声音频率划分,然后通过响应方式设定单元根据所述声音频率范围子单元的声音频率划分设定,对声音响应方式进行一级响应方式、二级响应方式、三级响应方式和四级响应方式的设定,根据声音响应方式,控制声音信号响应时间,将阈值时间内的声音信号进行输出;
上述技术方案的有益效果为:通过对声音信号频率进行划分,可以更加准确的识别声音信号。
在一个实施例中,所述声音频率范围子单元和响应方式设定单元,进行频率划分和响应方式设定需要如下步骤:
所述声音频率范围子单元根据发话者发声生理部声音的频率进行频率划分;
通过所述频率划分,将声音频率划分为三个等级:高频率信号、中频率信号和低频率信号;
根据所述声音频率等级,确定声音响应方式;
当发话者声音为高频率信号时,系统响应方式为低语速声音响应;
当发话者声音为中频率信号时,系统响应方式为正常语速声音响应;
当发话者声音为低频率信号时,系统响应方式为快语速声音响应;
当发话者声音为低频率信号时,系统响应方式为快语速声音响应;
上述技术方案的工作原理为:在声音频率划分子单元中,首先对识别的声音进行频率划分,按照频率波长的不同,将识别到的声音信号划分为高频率信号、中频率信号以及低频率信号这三种信号等级,然后根据信号频率等级确定声音响应方式,设定系统进行声音响应方式分别为:低语速声音响应、正常语速响应以及快语速声音响应;
上述技术方案的有益效果为:在声音频率划分子单元中,通过对声音信号的频率进行划分后,又及进一步根据划分的声音频率设定相应的声音响应方式,所述响应方式可以对收集的生理现象声音的语速进行调整,使得可以得到正常语速的声音。
在一个实施例中,声音显示模块,包括:
声音反应单元:用于对接收到的声音响应方式信号进行响应标准化预设处理,并确定处理后的标准声音信号;
声音调控单元:用于对所述标准声音信号进行调控处理,生成额定音量的标准声音信号;
声音输出单元:基于所述额定音量标准声音信号,进行标准音量声音输出;
上述技术方案的工作原理为:在声音显示模块中,先对接收到的声音信号进行预设处理,对声音信号进行噪音滤除,
m1(m)=m0(m)(1-e-0.5)
其中,
m1(m)线性变化后的噪音信号;
m0(m)表示初始噪音信号;
e表示噪音指数了。
滤除噪音后的声音信号为:
其中,
Wk(m)表示滤除参数;
m表示噪音信号;
k表示噪音取值。
然后计算因噪音产生的误差信号:
μ(m)=f(m)+m1(m)-y(m)
其中,
f(m)表示噪音延时;
m1(m)表示线性变化后的噪音;
y(m)表示滤除噪音后的声音信号。
通过消除声音误差并且滤除声音中的噪音,就可以得到标准清晰的声音。
然后再对标准声音信号进行音量设置,使得在使用环境中能够保准该音量可以清晰传递给每一个人调控设置好音量后,然后将该声音进行输出;
上述技术方案的有益效果为:通过声音显示模块不仅可以滤除声音中存在的噪音,还可以对声音的音量女进行调整设置,使得输出声音不仅清晰而且音量大小合适。
在一个实施例中,生理现象判断单元进行生理现象判断需要如下步骤:
所述生理现象判断单元采集生理现象声音信号,对所述生理现象声音信号进行存储标识;
根据进行标识的生理现象声音信号,对所述生理现象声音信号进行特征识别;
根据识别的生理现象特征,对所述声音进行生理现象发声部位判断,得到判断结果;
基于判断结果,当所述生理现象为气声时,判断发声部位为鼻腔部位;
当所述生理现象为字声时,判断发声部位是通过声带振动产生声音的喉腔部位;
上述技术方案的工作原理为:通过生理现象判断单元对采集的声音信号进行标识,根据标识对采集的生理现象声音进行特征识别,将识别出来的生理特征发声现象进行发声部位判断,根据判断可将发声部位分为鼻腔发声或喉腔发声;
上述技术效果为:在生理现象判断模块可以通过对生理现象声音的发声特点进行判断,以此判断得出具体发声部位,通过对发声部位的了解为之后的声音识别提供依据。
在一个实施例中,声音测量模块用声音进行距离测量需要如下步骤:
所述声音测量模块用于根据发话者发出的生理现象声音进行声音测量;
通过收集所述生理现象声音,对收集到的所述声音进行计算分析,判断声源与测量模块的距离范围;
根据所述距离范围,进行距离误差计算,基于所述距离误差进行计算范围调整;
基于对距离误差进行调整,对发话者与测量模块的距离进行计算,获取发话者与测量模块之间的实际距离数据;
上述技术方案的工作原理为:声音测量模块根据收集到的生理现象声音,进行计算分析,判断声源与测量模块的距离范围;根据所述距离范围,进行距离误差计算,由于声音在传播过程中会随距离的增加而产生声音衰减,从而在通过声音进行距离测量时会产生误差,
声音衰减公式为:
ΔL=10log10(1/4πr2)
其中,
ΔL为距离增加产生的衰减值,单位dB;
r声源至受声点的距离;
log10表示以10为底的对数;
r1处至r2处的衰减值:
ΔL=20log10(r1/r2)
当r2=2r1时,ΔL=-6dB,即点声源声传播距离增加1倍,衰减值是6dB。
基于所述距离衰减值产生的距离误差进行计算范围调整,并对发话者与测量模块的距离进行计算,获取发话者与测量模块之间的实际距离数据;
上述技术方案的有益效果为:在距离测量模块,通过对声源与系统之间的距离的测量,得到最适合的声音识别位置,能够更好的收录声音。
在一个实施例中,所述声音测量模块的具体实施方式如下所示:
步骤一:声音测量模块采集生理现象声音,并对所述声音进行压缩处理,获取压缩声音信号;
步骤二:根据所述压缩声音信号,进行声音传送距离计算,获取发话者和测量模块之间的距离范围数据值;
步骤三:根据所述数据值,进行距离误差计算,对所述距离范围进行调控设置;
步骤四:根据调控设置,进行距离差值计算,获取发话者与测量模块之间的实际距离数据;
上述技术方案的工作原理为:依据声音在空气中传播的原理,一直声音在空气中的传播速度还有声音传播到测量模块所用的时间,通过计算的出声音传送的距离,然后继续计算距离误差,通过调整消除因外力产生的距离误差,然后根据距离误差值进行差值计算,得出准确具体的实际距离;
上述技术方案的有益效果为:通过计算声源与系统之间的距离范围,以及进一步计算二者之间通过计算产生的距离误差,进行更进一步的调整获取消除距离误差而得到二者之间的实际距离,使得声源和系统的距离更加准确,还可以使得声音的采集更加全面。
在一个实施例中,生理现象监测模块进行监测生理现象是否正常,需要如下步骤:
所述生理现象监测模块用于通过监测生理现象声音的发声频率,判断发声者的健康状态;
通过所述生理现象监测模块采集生理现象声音,并将所述生理现象声音转化为声音频率信号;
根据所述声音频率信号的频率特征,进行声音信号分频段存储,生成固定频段声音信号;
将收集到的生理现象声音与所述固定频段声音信号进行对比,判断所述生理现象声音是否在人体健康声音频率范围;
当所述生理现象声音在人体健康声音频率范围内时,判定发声者身体健康,将所述生理现象声音进行收录存储;
当所述生理现象声音不在人体健康声音频率范围内时,判定发声者身体健康异常,将进行系统报警提示;
上述技术方案的工作原理为:通过所述生理现象监测模块采集生理现象声音,并将所述生理现象声音转化为声音频率信号;根据所述声音频率信号的频率特征,进行声音信号分频段存储,生成固定频段声音信号;将收集到的生理现象声音与所述固定频段声音信号进行对比,判断所述生理现象声音是否在人体健康声音频率范围;当所述生理现象声音在人体健康声音频率范围内时,判定发声者身体健康,将所述生理现象声音进行收录存储;当所述生理现象声音不在人体健康声音频率范围内时,判定发声者身体健康异常,将进行系统报警提示;
上述技术方案的有益效果为:通过声音监测模块可以观察佩戴者的身体健康状况,便于通过观测声音频率是否在正常身体健康频率范围内,判断人的身体是否健康。
在一个实施例中,所述生理现象监测模块具体实施步骤如下所示:
步骤一:采集生理现象声音,进行声音压缩转化获取声音频率信号,并将所述声音频率信号在信息库中进行存储;
步骤二:根据声音频率波段将信息库中的所述声音频率信号进行频率等级划分;
步骤三:根据所述频率等级划分,生成固定频段的声音信号;
步骤四:将采集的生理现象声音与所述固定频段声音信号进行声音频率波长对比;
步骤五:根据波长对比结果,当所述生理现象声音波长在固定频段声音波长范围内时,判断发声者身体健康处于正常状态;
步骤六:当所述生理现象声音波长不在固定频段声音波长范围内时,判断发声者身体健康处于异常状态;
上述技术方案的工作原理为:生理现象判断单元中,利用人体通过佩戴者叹气、咳嗽等生理现象发出的声音进行识别存储,然后在通过系统对此生理现象声音进行标识,通过将采集到的生理现象声音与储存标识的声音进行对比,根据对比波长的不同,判断采集到的生理现象声音频率是否在正常频率范围内,以此观察发声者的身体健康状态是否正常;
上述技术方案的有益效果为:在生理现象判断单元中,通过对佩戴者叹气、咳嗽等生理现象的声音的识别,可以根据这些发声特征以不同发声特征的特有频率进行对比识别,观察收集到的生理现象声音有没有出现异常,在出现异常时能够及时报警警示,便于使用人员及时发现自身身体健康问题。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种基于声音识别生理现象的系统,其特征在于,包括:
声音判断模块:用于获取集音装置收集的声音信号,并提取所述声音信号的生理特征信息,对所述声音信号进行识别处理,获取识别结果,根据所述识别结果对所述声音信号进行生理特征信息判断,获取准确生理现象声音信号;
声音响应模块:用于根据所述准确生理现象声音信号确定发话者身份,并设定对应的声音响应方式;
声音显示模块:用于根据所述声音响应方式进行音量调控处理,并将调控后的标准声音进行输出;
声音显示模块,包括:
声音反应单元:用于对接收到的声音响应方式信号进行响应标准化预设处理,并确定处理后的标准声音信号;
声音调控单元:用于对所述标准声音信号进行调控处理,生成额定音量的标准声音信号;
声音输出单元:基于所述额定音量标准声音信号,进行标准音量声音输出;
其中,在声音显示模块中,先对接收到的声音信号进行预设处理,对声音信号进行噪音滤除,包括:
m1(m)=m0(m)(1-e(-0.5)
其中,
m1(m)线性变化后的噪音信号;
m0(m)表示初始噪音信号;
e表示噪音指数;
滤除噪音后的声音信号为:
其中,
Wk(m)表示滤除参数;
m表示噪音信号;
k表示噪音取值;
然后计算因噪音产生的误差信号:
μ(m)=f(m)+m1(m)-y(m)
其中,
f(m)表示噪音延时;
m1(m)表示线性变化后的噪音;
y(m)表示滤除噪音后的声音信号;
还包括:声音测量模块用声音进行距离测量需要如下步骤:
所述声音测量模块用于根据发话者发出的生理现象声音进行声音测量;
通过收集所述生理现象声音,对收集到的所述声音进行计算分析,判断声源与测量模块的距离范围;
根据所述距离范围,进行距离误差计算,基于所述距离误差进行计算范围调整;
基于对距离误差进行调整,对发话者与测量模块的距离进行计算,获取发话者与测量模块之间的实际距离数据;
其中,声音衰减公式为:
ΔL=10 log10(1/4πr2)
其中,ΔL为距离增加产生的衰减值,单位dB;
r声源至受声点的距离;
log10表示以10为底的对数;
基于所述距离衰减值产生的距离误差进行计算范围调整。
2.如权利要求1所述的一种基于声音识别生理现象的系统,其特征在于,所述声音识别模块,包括:
声音信号获取单元:用于对接集音装置,并实时接收集音装置传输的声音信号,并将所述声音信号进行初级标识;
声音信号处理单元:用于接收所述标识声音信号,对所述标识声音信号进行降噪处理,并将发话者声音信号与噪音信号进行分离处理,获取无噪声音信号;
声音识别处理单元:用于根据所述无噪声音信号,对所述发话者声音信号进行识别,确定发话者身份信息。
3.如权利要求1所述的一种基于声音识别生理现象的系统,其特征在于,声音响应模块,包括:
发话者确定单元:用于根据识别后的声音信号确定发话者发身份信息和声音信息;
相应内容设定单元:用于根据接收到的所述声音特征信息,在声音频率范围子单元将所述声音特征信息进行声音频率划分,获取不同声音频率分段范围;
响应方式设定单元:用于根据所述不同声音频率分段范围,对声音响应方式进行一级响应方式、二级响应方式、三级响应方式和四级响应方式的设定;
响应输出控制单元:用于根据声音响应方式,控制声音信号响应时间,将阈值时间内的声音信号进行输出。
4.如权利要求3所述的一种基于声音识别生理现象的系统,其特征在于,所述声音频率范围子单元和响应方式设定单元,进行频率划分和响应方式设定需要如下步骤:
所述声音频率范围子单元根据发话者发声生理部声音的频率进行频率划分;
通过所述频率划分,将声音频率划分为三个等级:高频率信号、中频率信号和低频率信号;
根据所述声音频率等级,确定声音响应方式;
当发话者声音为高频率信号时,系统响应方式为低语速声音响应;
当发话者声音为中频率信号时,系统响应方式为正常语速声音响应;
当发话者声音为低频率信号时,系统响应方式为快语速声音响应。
5.如权利要求1所述的一种基于声音识别生理现象的系统,其特征在于,生理现象判断单元进行生理现象判断需要如下步骤:
所述生理现象判断单元采集生理现象声音信号,对所述生理现象声音信号进行存储标识;
根据进行标识的生理现象声音信号,对所述生理现象声音信号进行特征识别;
根据识别的生理现象特征,对所述声音进行生理现象发声部位判断,得到判断结果;
基于判断结果,当所述生理现象为气声时,判断发声部位为鼻腔部位;
当所述生理现象为字声时,判断发声部位是通过声带振动产生声音的喉腔部位。
6.如权利要求1所述的一种基于声音识别生理现象的系统,其特征在于,所述声音测量模块进行测量步骤如下所示:
步骤一:声音测量模块采集生理现象声音,并对所述声音进行压缩处理,获取压缩声音信号;
步骤二:根据所述压缩声音信号,进行声音传送距离计算,获取发话者和测量模块之间的距离范围数据值;
步骤三:根据所述数据值,进行距离误差计算,对所述距离范围进行调控设置;
步骤四:根据调控设置,进行距离差值计算,获取发话者与测量模块之间的实际距离数据。
7.如权利要求1所述的一种基于声音识别生理现象的系统,其特征在于,生理现象监测模块进行监测生理现象是否正常,需要如下步骤:
所述生理现象监测模块用于通过监测生理现象声音的发声频率,判断发声者的健康状态;
通过所述生理现象监测模块采集生理现象声音,并将所述生理现象声音转化为声音频率信号;
根据所述声音频率信号的频率特征,进行声音信号分频段存储,生成固定频段声音信号;
将收集到的生理现象声音与所述固定频段声音信号进行对比,判断所述生理现象声音是否在人体健康声音频率范围;
当所述生理现象声音在人体健康声音频率范围内时,判定发声者身体健康,将所述生理现象声音进行收录存储;
当所述生理现象声音不在人体健康声音频率范围内时,判定发声者身体健康异常,将进行系统报警提示。
8.如权利要求7所述的一种基于声音识别生理现象的系统,其特征在于,所述生理现象监测模块具体实施步骤如下所示:
步骤一:采集生理现象声音,进行声音压缩转化获取声音频率信号,并将所述声音频率信号在信息库中进行存储;
步骤二:根据声音频率波段将信息库中的所述声音频率信号进行频率等级划分;
步骤三:根据所述频率等级划分,生成固定频段的声音信号;
步骤四:将采集的生理现象声音与所述固定频段声音信号进行声音频率波长对比;
步骤五:根据波长对比结果,当所述生理现象声音波长在固定频段声音波长范围内时,判断发声者身体健康处于正常状态;
步骤六:当所述生理现象声音波长不在固定频段声音波长范围内时,判断发声者身体健康处于异常状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111196272.XA CN113948109B (zh) | 2021-10-14 | 2021-10-14 | 一种基于声音识别生理现象的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111196272.XA CN113948109B (zh) | 2021-10-14 | 2021-10-14 | 一种基于声音识别生理现象的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113948109A CN113948109A (zh) | 2022-01-18 |
CN113948109B true CN113948109B (zh) | 2023-03-28 |
Family
ID=79330349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111196272.XA Active CN113948109B (zh) | 2021-10-14 | 2021-10-14 | 一种基于声音识别生理现象的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113948109B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11749298B2 (en) * | 2018-05-08 | 2023-09-05 | Cirrus Logic Inc. | Health-related information generation and storage |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105193390B (zh) * | 2015-10-15 | 2017-11-14 | 成都云卫康医疗科技有限公司 | 用于监测睡眠呼吸暂停综合症的健康分析模块 |
CN107622797B (zh) * | 2017-09-26 | 2020-07-28 | 李涵之 | 一种基于声音的身体状况确定系统及方法 |
CN107635147A (zh) * | 2017-09-30 | 2018-01-26 | 上海交通大学 | 基于多模态人机交互的健康信息管理电视 |
CN109360584A (zh) * | 2018-10-26 | 2019-02-19 | 平安科技(深圳)有限公司 | 基于深度学习的咳嗽监测方法及装置 |
CN112767948A (zh) * | 2021-01-21 | 2021-05-07 | 厦门科路德科技有限公司 | 一种声音气体复合检测方法 |
CN113077794A (zh) * | 2021-04-06 | 2021-07-06 | 南京新知艺测科技有限公司 | 一种人声识别系统 |
CN113091257B (zh) * | 2021-04-06 | 2023-05-16 | 青岛海尔空调器有限总公司 | 空调的控制方法、装置、设备和存储介质 |
-
2021
- 2021-10-14 CN CN202111196272.XA patent/CN113948109B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113948109A (zh) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11683632B2 (en) | Automatic speech recognition triggering system | |
RU2595636C2 (ru) | Система и способ для генерации аудиосигнала | |
CN108806720B (zh) | 话筒、数据处理器、监测系统及监测方法 | |
US10074384B2 (en) | State estimating apparatus, state estimating method, and state estimating computer program | |
CN103169505B (zh) | 一种多普勒超声拾音分析处理装置 | |
US20140309549A1 (en) | Methods for testing hearing | |
US20060069559A1 (en) | Information transmission device | |
US8155966B2 (en) | Apparatus and method for producing an audible speech signal from a non-audible speech signal | |
US11842725B2 (en) | Detection of speech | |
CN113948109B (zh) | 一种基于声音识别生理现象的系统 | |
TWI749663B (zh) | 發聲監控之方法及系統 | |
US11290802B1 (en) | Voice detection using hearable devices | |
US11501758B2 (en) | Environment aware voice-assistant devices, and related systems and methods | |
JP5347505B2 (ja) | 音声推定システム、音声推定方法、及び音声推定プログラム | |
McLoughlin | Super-audible voice activity detection | |
KR101783959B1 (ko) | 청력을 검사하는 휴대용 음원재생장치 및 이를 수행하는 방법 | |
CN113259826B (zh) | 在电子终端中实现助听的方法和装置 | |
WO2008075305A1 (en) | Method and apparatus to address source of lombard speech | |
CN112037759B (zh) | 抗噪感知敏感度曲线建立及语音合成方法 | |
US5897614A (en) | Method and apparatus for sibilant classification in a speech recognition system | |
CN117095691B (zh) | 语音数据集的构建方法、电子设备及存储介质 | |
Hirahara et al. | Acoustic characteristics of non-audible murmur | |
US20220068294A1 (en) | Method for rating the speech quality of a speech signal by way of a hearing device | |
Cordourier Maruri et al. | V-speech: Noise-robust speech capturing glasses using vibration sensors | |
JP7296214B2 (ja) | 音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |