CN113643690A

CN113643690A - 针对患者不规则声音的高精密医疗设备的语言识别方法

Info

Publication number: CN113643690A
Application number: CN202111207068.3A
Authority: CN
Inventors: 毛丹凤
Original assignee: Shenzhen Yunchuang Precision Medical Technology Co ltd
Current assignee: Shenzhen Yunchuang Precision Medical Technology Co ltd
Priority date: 2021-10-18
Filing date: 2021-10-18
Publication date: 2021-11-12

Abstract

本发明涉及语音识别技术领域，具体涉及针对患者不规则声音的高精密医疗设备的语言识别方法，包括将医疗患者发出原始语言由接收模块接收，并将语言信号发送到信号处理模块，由信号处理模块对其进行处理，再由特征提取模块、模型库、模型匹配模块进行进一步识别处理，最后将信号传递给执行转化模块，由其转化为执行指令，实现与医疗设备语音交互；本发明提供了一种针对不同患者不规则声音，如模糊语言、地方方言等，对其进行语音识别，并建立个性化语言模型库，形成一种高效的，不断训练学习的语音识别法，相较于现有的医疗设备语音交互，分类识别处理识别的效率管更高，用户的人机交互体验感更好。

Description

针对患者不规则声音的高精密医疗设备的语言识别方法

技术领域

本发明涉及语音识别技术领域，具体涉及针对患者不规则声音的高精密医疗设备的语言识别方法。

背景技术

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

现有的语音识别技术正在蓬勃发展，但在医疗这一领域，医疗患者在与医疗设备进行语音交互这一模块仍然存在空缺；当有些患者在与医疗设备语音交互时，往往因为部分患者的口齿不清或患者说地方语言导致医疗设备的语音识别系统无法识别。

发明内容

解决的技术问题

针对现有技术所存在的上述缺点，本发明提供了针对患者不规则声音的高精密医疗设备的语言识别方法，解决了有些患者在与医疗设备语音交互时，因患者的口齿不清或患者说地方语言导致医疗设备的语音识别系统无法识别的问题。

技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

针对患者不规则声音的高精密医疗设备的语言识别方法，包括以下步骤：

S1：医疗患者发出声音，为原始语言；

S2：接收模块接收到语言信号并将语言信号发送到信号处理模块，由信号处理模块对其进行处理；

S3：特征提取模块对信号处理模块处理的信号进行特征提取；

S4：将提取的特征模型上传到模型库，判断提取的特征模型在模型库中是否存在，若存在，则转到S5，若不存在，则转到S6；

S5：通过模型匹配模块对特征提取模块所提取的模型与模型库中的个性化模型进行匹配；

S6：将特征提取模块提取的语言信号生成预设模型导入模型库，并由模型库生成个性化语言识别模型，并将生成的个性化语音识别模型提供到模型匹配模块中；

S7：由模型匹配模块与模型库中的语言识别模型进行匹配，若匹配成功，则转到S8，若匹配失败，则转到S9；

S8：由执行转化模块将匹配成功的信号转化为执行指令，实现与医疗设备语音交互；

S9：由语音播报模块发出语音提醒患者重复原始语言。

更进一步地，所述信号处理模块在进行信号处理时，进行分类处理。

更进一步地，所述信号处理模块分类处理包括模糊语言处理、地方语言处理、普通话处理。

患者发出的原始语言经过识别进行分类，例如，若患者口齿不清，则通过信号处理模块中的模糊语言处理模块进行处理；相应的，若患者的原始语言为地方语言，则通过信号处理模块中的地方语言处理模块进行处理。分类识别处理的方法相较于直接接收识别，识别效率更高。

更进一步地，所述特征提取模块将通过分帧提取的方法进行语音信号提取处理。

更进一步地，所述分帧提取将信号处理模块处理的信号分成若干小段语音，再将所述若干小段语音分成若干状态，合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别，由此获得语音特征模型。

更进一步地，所述模型库将会由特征提取模块提供的预设语音模型进行训练，由此生成个性化识别模型A、个性化识别模型B、个性化识别模型C……个性化识别模型N。

将特征提取组件提供的语音模型存储到模型库内，形成个性化语音识别模型，到患者下一次发出原始语言时，信号处理模块、特征提取模块和模型匹配模块可以更快的处理语言模型，可以直接与模型库中的个性化语音识别模型匹配，以获得更好的语音交互体验。

更进一步地，所述特征提取模块基于马尔科夫模型：一个系统由N个状态S= {s₁，s₂，...s_n}，随着时间的推移，该系统从一个状态转换成另一个状态。Q= {q₁，q₂，...q_n}为一个状态序列，q_i∈S，在t时刻的状态为q_t，对该系统的描述要给出当前时刻t所处的状态s_t，和之前的状态s₁，s₂，...s_t，则t时刻位于状态q_t的概率为：P(q_t=s_t|q₁=s₁，q₂=s₂，...q_t-1=s_t-1)。

特殊状态下，当前时刻的状态只决定于前一时刻的状态叫一阶马尔可夫模型，即P(q_t=s_i|q₁=s₁，q₂=s₂，...q_t-1=s_j) =P(q_t=s_i|q_t-1=s_j)。

状态之间的转化表示为a_ij，a_ij=P(q_t=s_j|q_t-1=s_i)，其表示由状态i转移到状态j的概率。

对于有N个状态的一阶马尔科夫模型，每个状态可以转移到另一个状态（包括自己），则共有N2次状态转移，可以用状态转移矩阵表示。

更进一步地，模块包括接收模块、信号处理模块、降噪模块、特征提取模块、模型库、模型匹配模块、执行转化模块和语音播报模块。

每个模块处理执行不同步骤：

接收模块接收患者的原始语言，将语言信号发送到信号处理模块，由信号处理模块对其进行处理；

特征提取模块对信号处理模块处理的信号进行特征提取；

模型匹配模块对特征提取模块所提取的模型与模型库中的个性化模型进行匹配；

模型库生成个性化语言识别模型，并将生成的个性化语音识别模型提供到模型匹配模块中；

模型匹配模块将与模型库中的语言识别模型进行匹配；

执行转化模块将匹配成功的信号转化为执行指令，实现与医疗设备语音交互；

语音播报模块发出语音提醒患者重复原始语言。

降噪模块对接收模块接收的患者原始语言之外的噪音进行降除。

更进一步地，所述语音播报模块发出提醒患者重复原始语言，所述提醒患者重复原始语言由患者所接收，并由患者发出原始语言。

有益效果

采用本发明提供的技术方案，与已知的公有技术相比，具有如下有益效果：

本发明提供了一种针对不同患者不规则声音，如模糊语言、地方方言等，对其进行语音识别，并建立个性化语言模型库，形成一种高效的，不断训练学习的语音识别法，相较于现有的医疗设备语音交互，分类识别处理识别的效率管更高，用户的人机交互体验感更好。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的执行流程示意图；

图2为本发明的各模块连接示意图；

图3为本发明的特征提取模块执行步骤示意图；

图中的标号分别代表：1、接收模块；2、信号处理模块；3、降噪模块；4、特征提取模块；5、模型库；6、模型匹配模块；7、执行转化模块；8、语音播报模块；9、提醒患者重复原始语言；10、原始语言；21、模糊语言处理；22、地方语言处理；23、普通话处理；41、分帧提取；42、若干小段语音；43、若干状态；44、识别。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合实施例对本发明作进一步的描述。

实施例1

本实施例公开如图1所示的针对患者不规则声音的高精密医疗设备的语言识别方法，包括以下步骤：

S1：医疗患者发出声音，为原始语言10。

S2：接收模块1接收到语言信号并将语言信号发送到信号处理模块2，由信号处理模块2对其进行处理。

S3：特征提取模块4对信号处理模块2处理的信号进行特征提取。

S4：将提取的特征模型上传到模型库5，判断提取的特征模型在模型库5中是否存在，若存在，则转到S5，若不存在，则转到S6。

S5：通过模型匹配模块6对特征提取模块4所提取的模型与模型库5中的个性化模型进行匹配。

S6：将特征提取模块4提取的语言信号生成预设模型导入模型库5，并由模型库5生成个性化语言识别模型，并将生成的个性化语音识别模型提供到模型匹配模块6中。

S7：由模型匹配模块S7与模型库S6中的语言识别模型进行匹配，若匹配成功，则转到S8，若匹配失败，则转到S9。

S8：由执行转化模块7将匹配成功的信号转化为执行指令，实现与医疗设备语音交互。

S9：由语音播报模块8发出语音提醒患者重复原始语言9。

其中，特征提取模块基于马尔科夫模型：

一个系统由N个状态S= {s₁，s₂，...s_n}，随着时间的推移，该系统从一个状态转换成另一个状态。Q= {q₁，q₂，...q_n}为一个状态序列，q_i∈S，在t时刻的状态为q_t，对该系统的描述要给出当前时刻t所处的状态s_t，和之前的状态s₁，s₂，...s_t，则t时刻位于状态q_t的概率为：P(q_t=s_t|q₁=s₁，q₂=s₂，...q_t-1=s_t-1)。

如上述方法，提供了一种针对不同患者不规则声音，如模糊语言、地方方言等，对其进行语音识别，并建立个性化语言模型库，形成一种高效的，不断训练学习的语音识别法，相较于现有的医疗设备语音交互，分类识别处理识别的效率管更高，用户的人机交互体验感更好。

实施例2

本实施例公开了一种信号处理模块在进行信号处理时，进行分类处理的方法：

信号处理模块分类处理包括模糊语言处理、地方语言处理、普通话处理。

实施例3

本实施例公开了如图3所示一种特征提取模块将通过分帧提取进行语音信号提取处理的方法：

分帧提取将信号处理模块处理的信号分成若干小段语音，再将所述若干小段语音分成若干状态，合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别，由此获得语音特征模型。

实施例4

本实施例公开如图2所示的各个模块的连接方式和每个模块处理执行的不同步骤：

特征提取模块对信号处理模块处理的信号进行特征提取；

模型匹配模块将与模型库中的语言识别模型进行匹配；

语音播报模块发出语音提醒患者重复原始语言。

综上所述，本发明提供了一种针对不同患者不规则声音，如模糊语言、地方方言等，对其进行语音识别，并建立个性化语言模型库，形成一种高效的，不断训练学习的语音识别法，相较于现有的医疗设备语音交互，分类识别处理识别的效率管更高，用户的人机交互体验感更好。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于：所述方法包括以下步骤：

S1：医疗患者发出声音，为原始语言（10）；

S2：接收模块（1）接收到语言信号并将语言信号发送到信号处理模块（2），由信号处理模块（2）对其进行处理；

S3：特征提取模块（4）对信号处理模块（2）处理的信号进行特征提取；

S4：将提取的特征模型上传到模型库（5），判断提取的特征模型在模型库（5）中是否存在，若存在，则转到S5，若不存在，则转到S6；

S5：通过模型匹配模块（6）对特征提取模块（4）所提取的模型与模型库（5）中的个性化模型进行匹配；

S6：将特征提取模块（4）提取的语言信号生成预设模型导入模型库（5），并由模型库（5）生成个性化语言识别模型，并将生成的个性化语音识别模型提供到模型匹配模块（6）中；

S7：由模型匹配模块（S7）与模型库（S6）中的语言识别模型进行匹配，若匹配成功，则转到S8，若匹配失败，则转到S9；

S8：由执行转化模块（7）将匹配成功的信号转化为执行指令，实现与医疗设备语音交互；

S9：由语音播报模块（8）发出语音提醒患者重复原始语言（9）。

2.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述信号处理模块（2）在进行信号处理时，进行分类处理。

3.根据权利要求2所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述信号处理模块（2）分类处理包括模糊语言处理（21）、地方语言处理（22）、普通话处理（23）。

4.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述特征提取模块（4）将通过分帧提取（41）的方法进行语音信号提取处理。

5.根据权利要求4所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述分帧提取（41）将信号处理模块（2）处理的信号分成若干小段语音（42），再将所述若干小段语音（42）分成若干状态（43），合并每一小段语音和每一个若干个状态中的其中一个状态分别进行识别，由此获得语音特征模型。

6.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述模型库（5）将会由特征提取模块（4）提供的预设语音模型进行训练，由此生成个性化识别模型A、个性化识别模型B、个性化识别模型C…个性化识别模型N。

7.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述特征提取模块（4）基于马尔科夫模型：

一个系统由N个状态S= {s₁，s₂，...s_n}，随着时间的推移，该系统从一个状态转换成另一个状态，Q= {q₁，q₂，...q_n}为一个状态序列，q_i∈S，在t时刻的状态为q_t，对该系统的描述要给出当前时刻t所处的状态s_t，和之前的状态s₁，s₂，...s_t，则t时刻位于状态q_t的概率为：P(q_t=s_t|q₁=s₁，q₂=s₂，...q_t-1=s_t-1)，

当前时刻的状态只决定于前一时刻的状态叫一阶马尔可夫模型，即P(q_t=s_i|q₁=s₁，q₂=s₂，...q_t-1=s_j) =P(q_t=s_i|q_t-1=s_j)，

状态之间的转化表示为a_ij，a_ij=P(q_t=s_j|q_t-1=s_i)，其表示由状态i转移到状态j的概率，

对于有N个状态的一阶马尔科夫模型，每个状态能够转移到另一个状态，则共有N2次状态转移，能够用状态转移矩阵表示。

8.根据权利要求1所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，模块包括接收模块（1）、信号处理模块（2）、降噪模块（3）、特征提取模块（4）、模型库（5）、模型匹配模块（6）、执行转化模块（7）和语音播报模块（8）。

9.根据权利要求8所述的针对患者不规则声音的高精密医疗设备的语言识别方法，其特征在于，所述语音播报模块（8）发出提醒患者重复原始语言（9），所述提醒患者重复原始语言（9）由患者所接收，并由患者发出原始语言（10）。