CN108550394A - 一种基于声纹识别的诊病方法及装置 - Google Patents
一种基于声纹识别的诊病方法及装置 Download PDFInfo
- Publication number
- CN108550394A CN108550394A CN201810200592.XA CN201810200592A CN108550394A CN 108550394 A CN108550394 A CN 108550394A CN 201810200592 A CN201810200592 A CN 201810200592A CN 108550394 A CN108550394 A CN 108550394A
- Authority
- CN
- China
- Prior art keywords
- disease
- trained
- follow
- speech model
- diagnosing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 170
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 14
- 201000007100 Pharyngitis Diseases 0.000 claims description 12
- 206010022000 influenza Diseases 0.000 claims description 12
- 206010039083 rhinitis Diseases 0.000 claims description 12
- 206010037660 Pyrexia Diseases 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000003745 diagnosis Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000012360 testing method Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例公开了一种基于声纹识别的诊病方法及装置,实现了利用声纹识别技术实现个人身体情况的自检。本发明提供了一种基于声纹识别的诊病方法,包括:S1、获取录音端采集的待诊断音频;S2、依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;S3、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
Description
技术领域
本发明涉及声纹识别技术领域,尤其涉及一种基于声纹识别的诊病方法及装置。
背景技术
随着人工智能的发展,声纹识别技术已经非常成熟,人的声音中有成千上万个人们自身甚至都无法说清楚的特征,这些特征可以帮助我们做很多事情。
因此,如何利用声纹识别技术实现个人身体情况的自检是本领域技术人员亟需解决的技术问题。
发明内容
本发明提供了一种基于声纹识别的诊病方法及装置,实现了利用声纹识别技术实现个人身体情况的自检。
本发明提供了一种基于声纹识别的诊病方法,包括:
S1、获取录音端采集的待诊断音频;
S2、依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
S3、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
可选地,步骤S1之前还包括:
S0、获取预置数量的一个疾病的音频,通过一个疾病的音频对疾病语音模型进行训练,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
可选地,步骤S0具体包括:
获取预置数量的一个疾病的音频;
依次提取一个疾病的音频中的第一语音特征参数;
根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
可选地,步骤S2具体包括:
提取待诊断音频中的第二语音特征参数;
依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值。
可选地,步骤S1之后,步骤S2之前还包括:
对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理。
本发明提供了一种基于声纹识别的诊病装置,包括:
获取单元,用于获取录音端采集的待诊断音频;
匹配单元,用于依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
判断单元,用于判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
可选地,本发明提供的一种基于声纹识别的诊病装置还包括:
训练单元,用于获取预置数量的一个疾病的音频,通过一个疾病的音频对疾病语音模型进行训练,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
可选地,训练单元具体包括:
获取子单元,用于获取预置数量的一个疾病的音频;
第一提取子单元,用于依次提取一个疾病的音频中的第一语音特征参数;
训练子单元,用于根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
可选地,匹配单元具体包括:
第二提取子单元,用于提取待诊断音频中的第二语音特征参数;
匹配子单元,用于依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值。
可选地,本发明提供的一种基于声纹识别的诊病装置还包括:
预处理单元,用于对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理。
从以上技术方案可以看出,本发明具有以下优点:
本发明提供了一种基于声纹识别的诊病方法,包括:S1、获取录音端采集的待诊断音频;S2、依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;S3、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
本发明通过将待诊断音频与经过训练的疾病语音模型进行匹配,并计算匹配值,当匹配值高于预置匹配阈值时可以判断待诊断音频中的声音对应得出的疾病结论,实现了利用声纹识别技术实现个人身体情况的自检。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于声纹识别的诊病方法的一个实施例的流程示意图;
图2为本发明实施例提供的一种基于声纹识别的诊病方法的另一个实施例的流程示意图;
图3为本发明实施例提供的一种基于声纹识别的诊病装置的一个实施例的结构示意图;
图4为本发明实施例提供的一种基于声纹识别的诊病装置的另一个实施例的结构示意图。
具体实施方式
本发明实施例提供了一种基于声纹识别的诊病方法及装置,实现了利用声纹识别技术实现个人身体情况的自检。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明提供了一种基于声纹识别的诊病方法的一个实施例,包括:
101、获取录音端采集的待诊断音频;
102、依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
103、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
本发明实施例通过将待诊断音频与经过训练的疾病语音模型进行匹配,并计算匹配值,当匹配值高于预置匹配阈值时可以判断待诊断音频中的声音对应得出的疾病结论,实现了利用声纹识别技术实现个人身体情况的自检。
以上是本发明提供的一种基于声纹识别的诊病方法的一个实施例进行说明,以下将说明本发明提供的一种基于声纹识别的诊病方法的另一个实施例进行说明。
请参阅图2,本发明提供了一种基于声纹识别的诊病方法的另一个实施例,包括:
201、获取预置数量的一个疾病的音频;
需要说明的是,需要获取预置数量的一个疾病的音频,来进行后续的模型训练,一般而言,最少需要获取20段同一个疾病的音频,在此不做限定。
202、依次提取一个疾病的音频中的第一语音特征参数;
需要说明的是,在获取了预置数量的一个疾病的音频后,依次提取一个疾病的音频中的第一语音特征参数,第一语音特征参数一般为梅尔倒谱系数。
203、根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧;
需要说的是,根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧,每一种疾病都训练出对应的一个疾病语音模型。
204、获取录音端采集的待诊断音频;
需要说明的是,获取到录音端采集的待诊断音频,即用户需要进行个人身体状态自检时,通过录音端录制待诊断音频。
205、对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理;
需要说明的是,在获取了录音端采集的待诊断音频后,对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理等一系列预处理工作。
206、提取待诊断音频中的第二语音特征参数;
需要说明的是,对待诊断音频进行预处理工作后,需要提取待诊断音频中的第二语音特征参数,其中,第二语音特征参数和第一语音特征参数相同,一般为梅尔倒谱系数。
207、依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值;
需要说明的是,依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值。
208、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端;
需要说明的是,判断计算得到的匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端,若否,则说明并未出现该疾病对应的语音特征参数。
本发明通过将待诊断音频与经过训练的疾病语音模型进行匹配,并计算匹配值,当匹配值高于预置匹配阈值时可以判断待诊断音频中的声音对应得出的疾病结论,实现了利用声纹识别技术实现个人身体情况的自检,进一步地,通过预处理对待诊断音频进行处理,能够更加准确地提取第二语音特征参数,提高比对的准确度。
以上是本发明提供的一种基于声纹识别的诊病方法的另一个实施例进行说明,以下将说明本发明提供的一种基于声纹识别的诊病装置的一个实施例进行说明。
请参阅图3,本发明提供了一种基于声纹识别的诊病装置的一个实施例,包括:
获取单元301,用于获取录音端采集的待诊断音频;
匹配单元302,用于依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
判断单元303,用于判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
本发明通过匹配单元302将待诊断音频与经过训练的疾病语音模型进行匹配,并计算匹配值,当匹配值高于预置匹配阈值时判断单元303可以判断待诊断音频中的声音对应得出的疾病结论,实现了利用声纹识别技术实现个人身体情况的自检。
以上是本发明提供的一种基于声纹识别的诊病装置的一个实施例进行说明,以下将说明本发明提供的一种基于声纹识别的诊病装置的另一个实施例进行说明。
请参阅图4,本发明提供了一种基于声纹识别的诊病装置的另一个实施例,包括:
训练单元401,用于获取预置数量的一个疾病的音频,通过一个疾病的音频对疾病语音模型进行训练,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧;
训练单元401具体包括:
获取子单元4011,用于获取预置数量的一个疾病的音频;
第一提取子单元4012,用于依次提取一个疾病的音频中的第一语音特征参数;
训练子单元4013,用于根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧;
获取单元402,用于获取录音端采集的待诊断音频;
预处理单元403,用于对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理;
匹配单元404,用于依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
匹配单元404具体包括:
第二提取子单元4041,用于提取待诊断音频中的第二语音特征参数;
匹配子单元4042,用于依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值;
判断单元405,用于判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于声纹识别的诊病方法,其特征在于,包括:
S1、获取录音端采集的待诊断音频;
S2、依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
S3、判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
2.根据权利要求1所述的基于声纹识别的诊病方法,其特征在于,步骤S1之前还包括:
S0、获取预置数量的一个疾病的音频,通过一个疾病的音频对疾病语音模型进行训练,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
3.根据权利要求2所述的基于声纹识别的诊病方法,其特征在于,步骤S0具体包括:
获取预置数量的一个疾病的音频;
依次提取一个疾病的音频中的第一语音特征参数;
根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
4.根据权利要求3所述的基于声纹识别的诊病方法,其特征在于,步骤S2具体包括:
提取待诊断音频中的第二语音特征参数;
依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值。
5.根据权利要求1所述的基于声纹识别的诊病方法,其特征在于,步骤S1之后,步骤S2之前还包括:
对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理。
6.一种基于声纹识别的诊病装置,其特征在于,包括:
获取单元,用于获取录音端采集的待诊断音频;
匹配单元,用于依次将待诊断音频与经过训练的疾病语音模型进行匹配,计算待诊断音频与经过训练的疾病语音模型的匹配值;
判断单元,用于判断匹配值是否大于预置匹配阈值,若是,则根据疾病语音模型对应的疾病发送警告信息至预置接收端。
7.根据权利要求6所述的基于声纹识别的诊病装置,其特征在于,还包括:
训练单元,用于获取预置数量的一个疾病的音频,通过一个疾病的音频对疾病语音模型进行训练,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
8.根据权利要求7所述的基于声纹识别的诊病装置,其特征在于,训练单元具体包括:
获取子单元,用于获取预置数量的一个疾病的音频;
第一提取子单元,用于依次提取一个疾病的音频中的第一语音特征参数;
训练子单元,用于根据一个疾病的音频中的第一语音特征参数训练疾病语音模型,得到经过训练的疾病语音模型,其中,疾病包括:感冒、咽炎、鼻炎、胸闷或发烧。
9.根据权利要求8所述的基于声纹识别的诊病装置,其特征在于,匹配单元具体包括:
第二提取子单元,用于提取待诊断音频中的第二语音特征参数;
匹配子单元,用于依次将待诊断音频中的第二语音特征参数与经过训练的疾病语音模型进行匹配,计算待诊断音频中的第二语音特征参数与经过训练的疾病语音模型的匹配值。
10.根据权利要求6所述的基于声纹识别的诊病装置,其特征在于,还包括:
预处理单元,用于对待诊断音频进行采样处理和/或预加重处理和/或预滤波处理和/或加窗处理和/或端点检测处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810200592.XA CN108550394A (zh) | 2018-03-12 | 2018-03-12 | 一种基于声纹识别的诊病方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810200592.XA CN108550394A (zh) | 2018-03-12 | 2018-03-12 | 一种基于声纹识别的诊病方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108550394A true CN108550394A (zh) | 2018-09-18 |
Family
ID=63516081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810200592.XA Pending CN108550394A (zh) | 2018-03-12 | 2018-03-12 | 一种基于声纹识别的诊病方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108550394A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110473616A (zh) * | 2019-08-16 | 2019-11-19 | 北京声智科技有限公司 | 一种语音信号处理方法、装置及系统 |
CN112494032A (zh) * | 2021-02-03 | 2021-03-16 | 中南大学湘雅二医院 | 一种基于声学特征的呼吸道疾病监测预警系统 |
CN113870903A (zh) * | 2021-09-28 | 2021-12-31 | 平安科技(深圳)有限公司 | 病理语音的识别方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN104732972A (zh) * | 2015-03-12 | 2015-06-24 | 广东外语外贸大学 | 一种基于分组统计的hmm声纹识别签到方法及系统 |
CN106251880A (zh) * | 2015-06-03 | 2016-12-21 | 创心医电股份有限公司 | 识别生理声音的方法以及系统 |
CN106448654A (zh) * | 2016-09-30 | 2017-02-22 | 安徽省云逸智能科技有限公司 | 一种机器人语音识别系统及其工作方法 |
CN106847262A (zh) * | 2016-12-28 | 2017-06-13 | 华中农业大学 | 一种猪呼吸道疾病自动识别报警方法 |
-
2018
- 2018-03-12 CN CN201810200592.XA patent/CN108550394A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN104732972A (zh) * | 2015-03-12 | 2015-06-24 | 广东外语外贸大学 | 一种基于分组统计的hmm声纹识别签到方法及系统 |
CN106251880A (zh) * | 2015-06-03 | 2016-12-21 | 创心医电股份有限公司 | 识别生理声音的方法以及系统 |
CN106448654A (zh) * | 2016-09-30 | 2017-02-22 | 安徽省云逸智能科技有限公司 | 一种机器人语音识别系统及其工作方法 |
CN106847262A (zh) * | 2016-12-28 | 2017-06-13 | 华中农业大学 | 一种猪呼吸道疾病自动识别报警方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110473616A (zh) * | 2019-08-16 | 2019-11-19 | 北京声智科技有限公司 | 一种语音信号处理方法、装置及系统 |
CN110473616B (zh) * | 2019-08-16 | 2022-08-23 | 北京声智科技有限公司 | 一种语音信号处理方法、装置及系统 |
CN112494032A (zh) * | 2021-02-03 | 2021-03-16 | 中南大学湘雅二医院 | 一种基于声学特征的呼吸道疾病监测预警系统 |
CN113870903A (zh) * | 2021-09-28 | 2021-12-31 | 平安科技(深圳)有限公司 | 病理语音的识别方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106847292B (zh) | 声纹识别方法及装置 | |
CN107492382B (zh) | 基于神经网络的声纹信息提取方法及装置 | |
CN109044396B (zh) | 一种基于双向长短时记忆神经网络的智能心音识别方法 | |
CN108766418A (zh) | 语音端点识别方法、装置及设备 | |
CN108281146A (zh) | 一种短语音说话人识别方法和装置 | |
CN109754812A (zh) | 一种基于卷积神经网络的防录音攻击检测的声纹认证方法 | |
CN111081279A (zh) | 语音情绪波动分析方法及装置 | |
CN108550394A (zh) | 一种基于声纹识别的诊病方法及装置 | |
CN108492830B (zh) | 声纹识别方法、装置、计算机设备和存储介质 | |
CN108320781B (zh) | 一种基于语音的医疗报告生成方法及装置 | |
CN113129927B (zh) | 语音情绪识别方法、装置、设备及存储介质 | |
US20210118464A1 (en) | Method and apparatus for emotion recognition from speech | |
CN107945793A (zh) | 一种语音激活检测方法及装置 | |
Tripathi et al. | Improved speaker independent dysarthria intelligibility classification using deepspeech posteriors | |
DE112018007847B4 (de) | Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm | |
Alghifari et al. | On the use of voice activity detection in speech emotion recognition | |
WO2021127990A1 (zh) | 一种基于语音降噪的声纹识别方法和相关装置 | |
CN111968643A (zh) | 智能识别方法、机器人及计算机可读存储介质 | |
Hamidi et al. | Emotion recognition from Persian speech with neural network | |
Diener et al. | A comparison of EMG-to-Speech Conversion for Isolated and Continuous Speech | |
CN108962281B (zh) | 一种语言表达的评价和辅助方法及装置 | |
CN116884648A (zh) | 基于中医问诊的语音交互优化方法、装置、设备及介质 | |
CN111341304A (zh) | 一种基于gan的说话人语音特征训练方法、装置和设备 | |
WO2021217979A1 (zh) | 声纹识别方法、装置、设备及存储介质 | |
CN115206347A (zh) | 肠鸣音的识别方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180918 |
|
RJ01 | Rejection of invention patent application after publication |