CN113643690A - 针对患者不规则声音的高精密医疗设备的语言识别方法 - Google Patents
针对患者不规则声音的高精密医疗设备的语言识别方法 Download PDFInfo
- Publication number
- CN113643690A CN113643690A CN202111207068.3A CN202111207068A CN113643690A CN 113643690 A CN113643690 A CN 113643690A CN 202111207068 A CN202111207068 A CN 202111207068A CN 113643690 A CN113643690 A CN 113643690A
- Authority
- CN
- China
- Prior art keywords
- language
- module
- model
- patient
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000001788 irregular Effects 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000000605 extraction Methods 0.000 claims abstract description 38
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims abstract description 9
- 230000007704 transition Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 5
- 241001672694 Citrus reticulata Species 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及语音识别技术领域,具体涉及针对患者不规则声音的高精密医疗设备的语言识别方法,包括将医疗患者发出原始语言由接收模块接收,并将语言信号发送到信号处理模块,由信号处理模块对其进行处理,再由特征提取模块、模型库、模型匹配模块进行进一步识别处理,最后将信号传递给执行转化模块,由其转化为执行指令,实现与医疗设备语音交互;本发明提供了一种针对不同患者不规则声音,如模糊语言、地方方言等,对其进行语音识别,并建立个性化语言模型库,形成一种高效的,不断训练学习的语音识别法,相较于现有的医疗设备语音交互,分类识别处理识别的效率管更高,用户的人机交互体验感更好。
Description
技术领域
本发明涉及语音识别技术领域,具体涉及针对患者不规则声音的高精密医疗设备的语言识别方法。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
现有的语音识别技术正在蓬勃发展,但在医疗这一领域,医疗患者在与医疗设备进行语音交互这一模块仍然存在空缺;当有些患者在与医疗设备语音交互时,往往因为部分患者的口齿不清或患者说地方语言导致医疗设备的语音识别系统无法识别。
发明内容
解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了针对患者不规则声音的高精密医疗设备的语言识别方法,解决了有些患者在与医疗设备语音交互时,因患者的口齿不清或患者说地方语言导致医疗设备的语音识别系统无法识别的问题。
技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
针对患者不规则声音的高精密医疗设备的语言识别方法,包括以下步骤:
S1:医疗患者发出声音,为原始语言;
S2:接收模块接收到语言信号并将语言信号发送到信号处理模块,由信号处理模块对其进行处理;
S3:特征提取模块对信号处理模块处理的信号进行特征提取;
S4:将提取的特征模型上传到模型库,判断提取的特征模型在模型库中是否存在,若存在,则转到S5,若不存在,则转到S6;
S5:通过模型匹配模块对特征提取模块所提取的模型与模型库中的个性化模型进行匹配;
S6:将特征提取模块提取的语言信号生成预设模型导入模型库,并由模型库生成个性化语言识别模型,并将生成的个性化语音识别模型提供到模型匹配模块中;
S7:由模型匹配模块与模型库中的语言识别模型进行匹配,若匹配成功,则转到S8,若匹配失败,则转到S9;
S8:由执行转化模块将匹配成功的信号转化为执行指令,实现与医疗设备语音交互;
S9:由语音播报模块发出语音提醒患者重复原始语言。
更进一步地,所述信号处理模块在进行信号处理时,进行分类处理。
更进一步地,所述信号处理模块分类处理包括模糊语言处理、地方语言处理、普通话处理。
患者发出的原始语言经过识别进行分类,例如,若患者口齿不清,则通过信号处理模块中的模糊语言处理模块进行处理;相应的,若患者的原始语言为地方语言,则通过信号处理模块中的地方语言处理模块进行处理。分类识别处理的方法相较于直接接收识别,识别效率更高。
更进一步地,所述特征提取模块将通过分帧提取的方法进行语音信号提取处理。
更进一步地,所述分帧提取将信号处理模块处理的信号分成若干小段语音,再将所述若干小段语音分成若干状态,合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别,由此获得语音特征模型。
更进一步地,所述模型库将会由特征提取模块提供的预设语音模型进行训练,由此生成个性化识别模型A、个性化识别模型B、个性化识别模型C……个性化识别模型N。
将特征提取组件提供的语音模型存储到模型库内,形成个性化语音识别模型,到患者下一次发出原始语言时,信号处理模块、特征提取模块和模型匹配模块可以更快的处理语言模型,可以直接与模型库中的个性化语音识别模型匹配,以获得更好的语音交互体验。
更进一步地,所述特征提取模块基于马尔科夫模型:一个系统由N个状态S= {s1,s2,...sn},随着时间的推移,该系统从一个状态转换成另一个状态。Q= {q1,q2,...qn}为一个状态序列,qi∈S,在t时刻的状态为qt,对该系统的描述要给出当前时刻t所处的状态st,和之前的状态s1,s2,...st,则t时刻位于状态qt的概率为:P(qt=st|q1=s1,q2=s2,...qt-1=st-1)。
特殊状态下,当前时刻的状态只决定于前一时刻的状态叫一阶马尔可夫模型,即P(qt=si|q1=s1,q2=s2,...qt-1=sj) =P(qt=si|qt-1=sj)。
状态之间的转化表示为aij,aij=P(qt=sj|qt-1=si),其表示由状态i转移到状态j的概率。
对于有N个状态的一阶马尔科夫模型,每个状态可以转移到另一个状态(包括自己),则共有N2次状态转移,可以用状态转移矩阵表示。
更进一步地,模块包括接收模块、信号处理模块、降噪模块、特征提取模块、模型库、模型匹配模块、执行转化模块和语音播报模块。
每个模块处理执行不同步骤:
接收模块接收患者的原始语言,将语言信号发送到信号处理模块,由信号处理模块对其进行处理;
特征提取模块对信号处理模块处理的信号进行特征提取;
模型匹配模块对特征提取模块所提取的模型与模型库中的个性化模型进行匹配;
模型库生成个性化语言识别模型,并将生成的个性化语音识别模型提供到模型匹配模块中;
模型匹配模块将与模型库中的语言识别模型进行匹配;
执行转化模块将匹配成功的信号转化为执行指令,实现与医疗设备语音交互;
语音播报模块发出语音提醒患者重复原始语言。
降噪模块对接收模块接收的患者原始语言之外的噪音进行降除。
更进一步地,所述语音播报模块发出提醒患者重复原始语言,所述提醒患者重复原始语言由患者所接收,并由患者发出原始语言。
有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
本发明提供了一种针对不同患者不规则声音,如模糊语言、地方方言等,对其进行语音识别,并建立个性化语言模型库,形成一种高效的,不断训练学习的语音识别法,相较于现有的医疗设备语音交互,分类识别处理识别的效率管更高,用户的人机交互体验感更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的执行流程示意图;
图2为本发明的各模块连接示意图;
图3为本发明的特征提取模块执行步骤示意图;
图中的标号分别代表:1、接收模块;2、信号处理模块;3、降噪模块;4、特征提取模块;5、模型库;6、模型匹配模块;7、执行转化模块;8、语音播报模块;9、提醒患者重复原始语言;10、原始语言;21、模糊语言处理;22、地方语言处理;23、普通话处理;41、分帧提取;42、若干小段语音;43、若干状态;44、识别。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例1
本实施例公开如图1所示的针对患者不规则声音的高精密医疗设备的语言识别方法,包括以下步骤:
S1:医疗患者发出声音,为原始语言10。
S2:接收模块1接收到语言信号并将语言信号发送到信号处理模块2,由信号处理模块2对其进行处理。
S3:特征提取模块4对信号处理模块2处理的信号进行特征提取。
S4:将提取的特征模型上传到模型库5,判断提取的特征模型在模型库5中是否存在,若存在,则转到S5,若不存在,则转到S6。
S5:通过模型匹配模块6对特征提取模块4所提取的模型与模型库5中的个性化模型进行匹配。
S6:将特征提取模块4提取的语言信号生成预设模型导入模型库5,并由模型库5生成个性化语言识别模型,并将生成的个性化语音识别模型提供到模型匹配模块6中。
S7:由模型匹配模块S7与模型库S6中的语言识别模型进行匹配,若匹配成功,则转到S8,若匹配失败,则转到S9。
S8:由执行转化模块7将匹配成功的信号转化为执行指令,实现与医疗设备语音交互。
S9:由语音播报模块8发出语音提醒患者重复原始语言9。
其中,特征提取模块基于马尔科夫模型:
一个系统由N个状态S= {s1,s2,...sn},随着时间的推移,该系统从一个状态转换成另一个状态。Q= {q1,q2,...qn}为一个状态序列,qi∈S,在t时刻的状态为qt,对该系统的描述要给出当前时刻t所处的状态st,和之前的状态s1,s2,...st,则t时刻位于状态qt的概率为:P(qt=st|q1=s1,q2=s2,...qt-1=st-1)。
特殊状态下,当前时刻的状态只决定于前一时刻的状态叫一阶马尔可夫模型,即P(qt=si|q1=s1,q2=s2,...qt-1=sj) =P(qt=si|qt-1=sj)。
状态之间的转化表示为aij,aij=P(qt=sj|qt-1=si),其表示由状态i转移到状态j的概率。
对于有N个状态的一阶马尔科夫模型,每个状态可以转移到另一个状态(包括自己),则共有N2次状态转移,可以用状态转移矩阵表示。
如上述方法,提供了一种针对不同患者不规则声音,如模糊语言、地方方言等,对其进行语音识别,并建立个性化语言模型库,形成一种高效的,不断训练学习的语音识别法,相较于现有的医疗设备语音交互,分类识别处理识别的效率管更高,用户的人机交互体验感更好。
实施例2
本实施例公开了一种信号处理模块在进行信号处理时,进行分类处理的方法:
信号处理模块分类处理包括模糊语言处理、地方语言处理、普通话处理。
患者发出的原始语言经过识别进行分类,例如,若患者口齿不清,则通过信号处理模块中的模糊语言处理模块进行处理;相应的,若患者的原始语言为地方语言,则通过信号处理模块中的地方语言处理模块进行处理。分类识别处理的方法相较于直接接收识别,识别效率更高。
实施例3
本实施例公开了如图3所示一种特征提取模块将通过分帧提取进行语音信号提取处理的方法:
分帧提取将信号处理模块处理的信号分成若干小段语音,再将所述若干小段语音分成若干状态,合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别,由此获得语音特征模型。
实施例4
本实施例公开如图2所示的各个模块的连接方式和每个模块处理执行的不同步骤:
接收模块接收患者的原始语言,将语言信号发送到信号处理模块,由信号处理模块对其进行处理;
特征提取模块对信号处理模块处理的信号进行特征提取;
模型匹配模块对特征提取模块所提取的模型与模型库中的个性化模型进行匹配;
模型库生成个性化语言识别模型,并将生成的个性化语音识别模型提供到模型匹配模块中;
模型匹配模块将与模型库中的语言识别模型进行匹配;
执行转化模块将匹配成功的信号转化为执行指令,实现与医疗设备语音交互;
语音播报模块发出语音提醒患者重复原始语言。
降噪模块对接收模块接收的患者原始语言之外的噪音进行降除。
综上所述,本发明提供了一种针对不同患者不规则声音,如模糊语言、地方方言等,对其进行语音识别,并建立个性化语言模型库,形成一种高效的,不断训练学习的语音识别法,相较于现有的医疗设备语音交互,分类识别处理识别的效率管更高,用户的人机交互体验感更好。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于:所述方法包括以下步骤:
S1:医疗患者发出声音,为原始语言(10);
S2:接收模块(1)接收到语言信号并将语言信号发送到信号处理模块(2),由信号处理模块(2)对其进行处理;
S3:特征提取模块(4)对信号处理模块(2)处理的信号进行特征提取;
S4:将提取的特征模型上传到模型库(5),判断提取的特征模型在模型库(5)中是否存在,若存在,则转到S5,若不存在,则转到S6;
S5:通过模型匹配模块(6)对特征提取模块(4)所提取的模型与模型库(5)中的个性化模型进行匹配;
S6:将特征提取模块(4)提取的语言信号生成预设模型导入模型库(5),并由模型库(5)生成个性化语言识别模型,并将生成的个性化语音识别模型提供到模型匹配模块(6)中;
S7:由模型匹配模块(S7)与模型库(S6)中的语言识别模型进行匹配,若匹配成功,则转到S8,若匹配失败,则转到S9;
S8:由执行转化模块(7)将匹配成功的信号转化为执行指令,实现与医疗设备语音交互;
S9:由语音播报模块(8)发出语音提醒患者重复原始语言(9)。
2.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述信号处理模块(2)在进行信号处理时,进行分类处理。
3.根据权利要求2所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述信号处理模块(2)分类处理包括模糊语言处理(21)、地方语言处理(22)、普通话处理(23)。
4.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述特征提取模块(4)将通过分帧提取(41)的方法进行语音信号提取处理。
5.根据权利要求4所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述分帧提取(41)将信号处理模块(2)处理的信号分成若干小段语音(42),再将所述若干小段语音(42)分成若干状态(43),合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别,由此获得语音特征模型。
6.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述模型库(5)将会由特征提取模块(4)提供的预设语音模型进行训练,由此生成个性化识别模型A、个性化识别模型B、个性化识别模型C…个性化识别模型N。
7.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述特征提取模块(4)基于马尔科夫模型:
一个系统由N个状态S= {s1,s2,...sn},随着时间的推移,该系统从一个状态转换成另一个状态,Q= {q1,q2,...qn}为一个状态序列,qi∈S,在t时刻的状态为qt,对该系统的描述要给出当前时刻t所处的状态st,和之前的状态s1,s2,...st,则t时刻位于状态qt的概率为:P(qt=st|q1=s1,q2=s2,...qt-1=st-1),
当前时刻的状态只决定于前一时刻的状态叫一阶马尔可夫模型,即P(qt=si|q1=s1,q2=s2,...qt-1=sj) =P(qt=si|qt-1=sj),
状态之间的转化表示为aij,aij=P(qt=sj|qt-1=si),其表示由状态i转移到状态j的概率,
对于有N个状态的一阶马尔科夫模型,每个状态能够转移到另一个状态,则共有N2次状态转移,能够用状态转移矩阵表示。
8.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,模块包括接收模块(1)、信号处理模块(2)、降噪模块(3)、特征提取模块(4)、模型库(5)、模型匹配模块(6)、执行转化模块(7)和语音播报模块(8)。
9.根据权利要求8所述的针对患者不规则声音的高精密医疗设备的语言识别方法,其特征在于,所述语音播报模块(8)发出提醒患者重复原始语言(9),所述提醒患者重复原始语言(9)由患者所接收,并由患者发出原始语言(10)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111207068.3A CN113643690A (zh) | 2021-10-18 | 2021-10-18 | 针对患者不规则声音的高精密医疗设备的语言识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111207068.3A CN113643690A (zh) | 2021-10-18 | 2021-10-18 | 针对患者不规则声音的高精密医疗设备的语言识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113643690A true CN113643690A (zh) | 2021-11-12 |
Family
ID=78427308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111207068.3A Pending CN113643690A (zh) | 2021-10-18 | 2021-10-18 | 针对患者不规则声音的高精密医疗设备的语言识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113643690A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1022725A1 (en) * | 1999-01-20 | 2000-07-26 | Sony International (Europe) GmbH | Selection of acoustic models using speaker verification |
CN106601230A (zh) * | 2016-12-19 | 2017-04-26 | 苏州金峰物联网技术有限公司 | 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统 |
CN106875943A (zh) * | 2017-01-22 | 2017-06-20 | 上海云信留客信息科技有限公司 | 一种用于大数据分析的语音识别系统 |
CN109119071A (zh) * | 2018-09-26 | 2019-01-01 | 珠海格力电器股份有限公司 | 一种语音识别模型的训练方法及装置 |
CN109410946A (zh) * | 2019-01-11 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种识别语音信号的方法、装置、设备及存储介质 |
-
2021
- 2021-10-18 CN CN202111207068.3A patent/CN113643690A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1022725A1 (en) * | 1999-01-20 | 2000-07-26 | Sony International (Europe) GmbH | Selection of acoustic models using speaker verification |
CN106601230A (zh) * | 2016-12-19 | 2017-04-26 | 苏州金峰物联网技术有限公司 | 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统 |
CN106875943A (zh) * | 2017-01-22 | 2017-06-20 | 上海云信留客信息科技有限公司 | 一种用于大数据分析的语音识别系统 |
CN109119071A (zh) * | 2018-09-26 | 2019-01-01 | 珠海格力电器股份有限公司 | 一种语音识别模型的训练方法及装置 |
CN109410946A (zh) * | 2019-01-11 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种识别语音信号的方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110223705B (zh) | 语音转换方法、装置、设备及可读存储介质 | |
CN109326302B (zh) | 一种基于声纹比对和生成对抗网络的语音增强方法 | |
CN109817213B (zh) | 用于自适应语种进行语音识别的方法、装置及设备 | |
CN110827801B (zh) | 一种基于人工智能的自动语音识别方法及系统 | |
WO2022048405A1 (zh) | 基于文本的虚拟对象动画生成方法及装置、存储介质、终端 | |
CN111341325A (zh) | 声纹识别方法、装置、存储介质、电子装置 | |
CN111477216A (zh) | 一种用于对话机器人的音意理解模型的训练方法及系统 | |
CN107039036B (zh) | 一种基于自动编码深度置信网络的高质量说话人识别方法 | |
CN113327609A (zh) | 用于语音识别的方法和装置 | |
US11763801B2 (en) | Method and system for outputting target audio, readable storage medium, and electronic device | |
CN112420050B (zh) | 一种语音识别方法、装置和电子设备 | |
CN109493846B (zh) | 一种英语口音识别系统 | |
CN112735431A (zh) | 模型训练方法和装置及人工智能对话的识别方法和装置 | |
CN115762489A (zh) | 语音识别模型的数据处理系统及方法、语音识别方法 | |
CN112466287B (zh) | 一种语音分割方法、装置以及计算机可读存储介质 | |
CN113643690A (zh) | 针对患者不规则声音的高精密医疗设备的语言识别方法 | |
CN111009236A (zh) | 一种基于dblstm+ctc声学模型的语音识别方法 | |
WO2023183680A1 (en) | Alignment prediction to inject text into automatic speech recognition training | |
CN115547345A (zh) | 声纹识别模型训练及相关识别方法、电子设备和存储介质 | |
WO2021253779A1 (zh) | 一种语音识别方法以及系统 | |
CN114792518A (zh) | 一种基于调度域技术的语音识别系统及其方法、存储介质 | |
CN113744727A (zh) | 模型训练方法、系统、终端设备及存储介质 | |
CN113160828A (zh) | 智能辅助机器人交互方法、系统、电子设备及存储介质 | |
CN112863485A (zh) | 口音语音识别方法、装置、设备及存储介质 | |
CN110085212A (zh) | 一种用于cnc程序控制器的语音识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211112 |
|
RJ01 | Rejection of invention patent application after publication |