CN109102804A

CN109102804A - 一种语音病历终端输入的方法及其系统

Info

Publication number: CN109102804A
Application number: CN201810942485.4A
Authority: CN
Inventors: 杨海峰; 张钧; 张鑫; 代江波
Original assignee: Flying Rescue Medical Technology (ganzhou) Co Ltd
Current assignee: Flying Rescue Medical Technology (ganzhou) Co Ltd
Priority date: 2018-08-17
Filing date: 2018-08-17
Publication date: 2018-12-28

Abstract

本发明涉及一种语音病历终端输入的方法及其系统，属于语音识别技术领域，解决了现有语音录入技术对云端过度依赖、识别率差的问题。本发明公开的方法将对目标语音数据的终端识别和云端识别进行了结合，优先本地匹配，即终端识别，云端识别作为补充方式，以节约通信流量，并不断更新本地语音库，降低对云端识别的依赖性，适合特定目标用户使用。本发明能够使得本地语音引擎和本地语音库的容量和处理开销始终维持在最优状态，避免出现冗余数据和资源占用的情况，非常适合在急救环境下长期使用。

Description

一种语音病历终端输入的方法及其系统

技术领域

本发明涉及医疗技术领域，尤其涉及一种语音病历终端输入的方法及其系统。

背景技术

随着电子病历在医疗行业中的逐渐普及，需要录入的文字信息越来越多，而语音录入技术的应用为紧急医疗条件下电子病历的实时记录提供了便利。

现有语音录入方法有两种。一种采用终端采集录音样本、发送到云端识别和匹配、回传终端显示的方案，这种方案不仅需要耗费大量通信流量，而且过度依赖云端，在断网情况下无法应用。另一种采用将定制的语音包传送到终端进行识别，部分解决了云端高度依赖和流量消耗问题，如目前市面上比较流行的翻译软件和导航软件，但其缺点是一旦遇到离线包无法匹配仍然需要云端匹配，并消耗大量通信流量。

紧急医疗，例如急救，处于非常特殊的医疗环境，其病历录入的格式相对固定，语言总量相对较少，而且终端用户群体比较固定。由于其情况紧急，往往缺乏时间进行手工录入，因此语音录入病人病历非常必要，要求语音录入准确、识别率高，并支持离线识别。

发明内容

鉴于上述的分析，本发明实施例旨在提供一种语音病历终端输入的方法，用以解决现有语音录入技术对云端过度依赖、识别率差的问题。

一方面，本发明实施例提供了一种语音病历终端输入的方法，包括如下步骤：

在语音病历终端，输入目标语音数据；

所述语音病历终端，将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别；若未匹配成功，将未识别出的目标语音数据发送到云端服务器；

所述云端服务器，将所述语音病历终端未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别；若未匹配成功，发送识别失败指令至所述语音病历终端；

所述语音病历终端接收到所述识别失败指令后，对上述云端服务器未识别出的目标语音数据进行人工识别；

所述语音病历终端将所述目标语音数据对应的最终识别结果以文字形式进行显示。

上述技术方案的有益效果如下：上述技术方案至多进行三重匹配，首先进行了本地语音库匹配，如果不匹配，再进行云端语音库匹配，如果还不匹配，则进行人工匹配，即优先本地匹配，云端、人工匹配作为补充方式，可以极大地节约通信流量，降低对云端和网络的依赖性。并且，可以不断同步更新本地语音库和云端语音库，将对云端的依赖性降到最低，更加适合目标用户使用。本地语音库中初始可设置为空，后面只录入使用该语音病历终端的目标用户相匹配的特征语音数据和对应的文字数据。随着目标用户使用得越来越频繁，本方法对目标语音数据的识别率会越来越高，使得语音病历终端处理开销处于最优状态，避免冗余和资源浪费，非常适合急救环境使用。

进一步，所述语音病历终端将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别的步骤包括：

将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别；

如果所述目标语音数据匹配到对应的特征语音数据，将所述特征语音数据对应的文字数据在预设录入位置进行显示；

如果所述目标语音数据未匹配到对应的特征语音数据，将未识别出的目标语音数据按预设规则划分成至少一个子目标数据，并将所述子目标数据发送到云端服务器。

采用上述进一步方案的有益效果如下：未识别出的目标语音数据通常可能是多个短语的结合，为了提高后续识别效率，可以按预设规则，例如中间已经识别出的目标语音数据，划分成多个子目标数据，进行进一步的处理，使得后续处理的数据长度降低，提高处理效率，降低资源消耗。

进一步，所述云端服务器将语音病历终端未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别的步骤包括：

云端服务器接收语音病历终端传来的未识别出的子目标数据；

云端服务器将每个所述子目标数据与云端语音库中的特征语音数据分别进行匹配识别；

如果所述子目标数据匹配到对应的特征语音数据，则将所述特征语音数据对应的文字数据发送至所述语音病历终端在预设位置进行显示，经用户确认正确后，将所述特征语音数据和对应的文字数据作为新的特征语音数据和对应的文字数据，录入本地语音库；

否则，所述云端服务器发出指令控制语音病历终端对未识别出的子目标数据进行人工录入，并将所述子目标数据和人工录入的文字数据作为新的特征语音数据和对应的文字数据，录入本地语音库。

采用上述进一步方案的有益效果如下：如上所述，通过子目标数据进行匹配对资源消耗更少。并且，云端服务器的处理能力强大，将识别出的子目标数据和识别结果同步更新到本地语音库，下一次识别时就可以直接应用，不需要依赖网络和云端，本地语音库的识别率越来越高。云端服务器还控制语音病历终端对未识别出的子目标数据进行人工录入。

进一步，所述语音病历终端接收到所述识别失败指令后对上述云端服务器未识别出的目标语音数据进行人工识别的步骤包括：

语音病历终端接收所述识别失败指令后，显示所述子目标数据，并发出人工录入指令；

用户接收到所述人工录入指令后，在语音病历终端对显示的所述子目标数据进行人工识别，将识别结果以文字数据形式录入预设位置，并将所述子目标数据和录入的文字数据作为新的特征语音数据和对应的文字数据，录入本地语音库和云端服务器。

采用上述进一步方案的有益效果如下：相比现有技术的第二种语音录入方法，上述进一步方案对本地语音库和云端服务器对出现的无法识别的目标语音数据可以进行手动匹配并不断更新，即功能越来越完善，识别率越来越高，具有突出的技术优势。

进一步，所述将最终识别结果以文字形式进行显示的步骤包括：

将语音病历终端和云端服务器对子目标数据的识别结果按照将目标语音数据划分成子目标数据的先后顺序进行排列，获得最终识别结果；

将最终识别结果以文字形式进行显示。

采用上述进一步方案的有益效果如下：最终得到的识别结果可以和目标语音信号保持一致，由于数据处理速度非常快，基本上可以实现同步更新。

基于上述方法的另一个实施例中，提供了一种语音病历终端和云端服务器；

所述语音病历终端，用于采集目标语音数据，将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别，若匹配成功，则将识别结果以文字形式进行显示，若未匹配成功，将未识别出的目标语音数据发送到云端服务器，接受云端服务器发送的识别结果，并对与本地语音库和云端语音库中特征语音数据都不匹配的目标语音数据进行人工识别，将最终识别结果以文字形式进行显示。

所述云端服务器，用于接收语音病历终端未识别出的目标语音数据，将所述未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别，将识别结果发送至语音病历终端进行显示。

采用上述技术方案的有益效果如下：上述技术方案至多进行三重匹配，首先进行了本地语音库匹配，如果不匹配，再进行云端语音库匹配，如果还不匹配，则进行人工录入(识别)，即优先本地匹配，云端匹配、人工录入作为补充方式，可以极大地节约通信流量，降低对云端和网络的依赖性。并且，可以不断同步更新本地语音库和云端数据库，将对云端的依赖性降到最低，更加适合目标用户使用。随着目标用户使用得越来越频繁，上述技术方案对目标语音数据的识别率会越来越高，使得语音病历终端处理开销处于最优状态，避免冗余和资源浪费，非常适合急救环境使用。

进一步，所述语音病历终端包括录音模块、本地语音引擎、第一网络通信模块、本地语音库、显示模块；

所述录音模块，用于采集目标语音数据，并将其发送至本地语音引擎；

所述本地语音引擎，用于读取目标语音数据，将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别，将识别出的目标语音数据发送至显示模块进行显示，将未识别的目标语音数据按预设规则划分成至少一个子目标数据，并将每个子目标数据发送到云端服务器；

所述第一网络通信模块，用于语音病历终端输入系统和云端服务器的双向数据通信；

所述显示模块，用于将目标语音数据以文字形式进行显示。

采用上述进一步方案的有益效果如下：未识别出的目标语音数据可能是多个短语的结合，按照预设规则，例如中间已经识别出的目标语言数据，划分成多个子目标数据，能更容易识别出相应的文字，识别效果更好。

进一步，云端服务器包括设置于云平台上的云端识别引擎、云端语音库、第二网络通信模块；

所述云端识别引擎，用于读取语音病历终端未识别出的子目标数据，将所述子目标数据与云端语音库中的特征语音数据进行匹配识别，将识别出的子目标数据对应的文字数据发送至语音病历终端的显示模块进行显示，并发出指令控制语音病历终端对未识别出的子目标数据进行人工录入；

所述第二网络通信模块，用于语音病历终端输入系统和云端服务器的双向数据通信。

采用上述进一步方案的有益效果如下：如上所述，通过子目标数据进行匹配，对资源消耗更少。并且，云端服务器的处理能力强大，将识别出的子目标数据用于更新本地语音库，下一次识别时无须依赖云端和网络，在不联网环境下可以直接应用，本地语音库的识别率越来越高。云端服务器还控制语音病历终端对其未识别出的子目标数据进行人工录入，提高了处理正确率。

进一步，所述录音模块包括依次连接的麦克风、控制器、存储器；

所述本地语音引擎，包括本地语音识别设备；

所述本地语音库，包括特征语音数据-文字数据对。

采用上述进一步方案的有益效果如下：通过本地语音引擎的应用，可以减少对云端识别的依赖，从而降低通信费用。

进一步，所述云端识别引擎，包括云端语音识别设备；

所述云端语音库，包括特征语音数据-文字数据对。

采用上述进一步方案的有益效果如下：通过云端引擎的应用，提高初始状态下语音识别效率，协助本地语音库快速并针对性地扩充本地常用语音特征，适合使用该语音病历终端的用户使用。

本发明中，上述各技术方案之间还可以相互组合，以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述，并且，部分优点可从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书、权利要求书以及附图中所特别指出的内容中来实现和获得。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。

图1为本发明实施例1语音病历终端输入方法的步骤示意图；

图2为本发明实施例2语音病历终端将目标语音数据与本地语音库中的特征语音数据进行匹配识别的步骤示意图；

图3为本发明实施例2云端服务器将语音病历终端未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别的步骤示意图；

图4为本发明实施例2语音病历终端接收到识别失败指令后对云端服务器未识别出的目标语音数据进行人工识别的步骤示意图；

图5为将本发明实施例2将最终识别结果以文字形式进行显示的步骤示意图；

图6为本发明实施例2语音病历终端输入方法流程示意图；

图7为本发明实施例3语音病历终端输入系统组成示意图。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理，并非用于限定本发明的范围。

实施例1

本发明的一个具体实施例，公开了一种语音病历终端输入的方法，如图1所示，包括如下步骤：

S1.在语音病历终端，输入目标语音数据。

S2.语音病历终端，将目标语音数据与本地语音库中的特征语音数据进行匹配识别，将未识别出的目标语音数据发送到云端服务器。

S3.云端服务器，将所述语音病历终端未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别。如果匹配成功，将识别结果发送至所述语音病历终端进行显示，过程结束。如果未匹配成功，发送识别失败指令至所述语音病历终端，执行步骤S4。

S4.语音病历终端接收到所述识别失败指令后，对上述云端服务器未识别出的目标语音数据进行人工识别，并将最终识别结果以文字形式进行显示。

实施时，由于用户可能使用非普通话，匹配结果可能会出现错误，因此上述步骤S2-S4中，用户需对显示的匹配成功的识别结果进行人工确认正确性，如果正确，则作为最终识别结果，如果不正确，需进行人工修改，并将该目标语音数据与修改结果作为新的特征语音数据和对应的文字数据，同时录入本地语音库和云端语音库，本领域技术人员能够理解，下面不再赘述。

与现有技术相比，本实施例提供的语音病历终端输入的方法至多进行三重匹配，首先进行本地语音库匹配，如果不匹配，再进行云端语音库匹配，如果还不匹配，则进行人工匹配，即优先本地匹配，云端、人工匹配作为补充方式，可以极大地节约通信流量，降低对云端服务器和网络的依赖性。并且，可以不断同步更新本地语音库和云端数据库，将对云端服务器的依赖性降到最低。本地语音库中的特征语音数据和对应的文字数据能够在断网情况下使用，并且可以只包含使用该语音病历终端的目标用户经常使用的特征语音数据和对应的文字数据，更加适合目标用户使用。随着目标用户使用得越来越频繁，本实施例对目标语音数据的识别率会越来越高，使得语音病历终端处理开销处于最优状态，避免冗余和资源浪费，非常适合急救环境使用。

实施例2

在实施例1的基础上进行优化，步骤S2可以进一步细化为如下步骤，如图2所示。

S21.将目标语音数据与本地语音库中的特征语音数据进行匹配识别。具体地，按照目标语音先后顺序对目标语音数据与本地语音库中的特征语音数据进行匹配识别。

S22.如果所述目标语音数据匹配到对应的特征语音数据，将所述特征语音数据对应的文字数据在预设录入位置进行显示。具体地，将能识别的目标语音数据按其对应的特征语音数据划分成N₁个子目标数据，在显示屏预设位置进行显示，之后由人工进行确认正确性；如果所述目标语音数据未匹配到对应的特征语音数据，将未识别出的目标语音数据按预设规则划分成至少一个子目标数据，并将所述子目标数据发送到云端服务器。所述预设规则包括，通过中间已经识别出的目标语音数据，将未识别出的目标语音数据划分成N个子目标数据，所述子目标数据可以是短句、短语或词，通过短句、短语或词进行后续匹配识别。

步骤S3可以进一步细化为如下步骤，如图3所示。

S31.云端服务器接收语音病历终端传来的未识别出的子目标数据。

S32.云端服务器将每个上述所述子目标数据与云端语音库中的特征语音数据分别进行匹配识别。

S33.如果所述子目标数据匹配到对应的特征语音数据，则将云端语音库中所述特征语音数据对应的文字数据发送至所述语音病历终端在显示器预设录入位置进行显示，由用户人工确认正确后，将所述特征语音数据和对应的文字数据录入本地语音库；否则，发出未识别指令控制语音病历终端进行人工识别。

步骤S33中，如果用户经过人工判断，所述云端服务器识别的初始文字数据与子目标数据不匹配，则人工手动将所述初始文字数据更正，将更正后的文字数据进行显示，将所述子目标数据、初始文字数据和更正后的文字数据关联，然后将所述子目标数据和更正后的文字数据作为新的特征语音数据和对应的文字数据，录入本地语音库和云端服务器中的云端语音库。

步骤S4中语音病历终端对上述云端服务器未识别出的目标语音数据进行人工识别可以进一步细化为如下步骤，如图4所示。

S41.语音病历终端接收所述识别失败指令后，显示所述子目标数据，并发出人工录入指令。

S42.用户接收到所述人工录入指令后，在语音病历终端对显示的所述子目标数据进行人工识别，将识别结果以文字数据形式录入预设位置，并将所述子目标数据和录入的文字数据作为新的特征语音数据和对应的文字数据，录入本地语音库和云端服务器。

为了更直观地说明本实施例方法的过程，提供了该方法的流程图，如图5和图6所示。

与实施例1相比，本实施例为了提高对目标语音数据的识别率，将目标语音数据按预设规则划分成多个子目标数据，再进行识别。通过短句或短语进行匹配的识别率更高。

实施例3

本发明的另一个具体实施例,公开了上述方法对应的一种语音病历终端输入系统,包括语音病历终端和云端服务器，如图7所示。

语音病历终端，用于采集目标语音数据，将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别，若匹配成功，则将识别结果以文字形式进行显示，若未匹配成功，将未识别出的目标语音数据发送到云端服务器，并接受云端服务器发送的识别结果，对所述语音病历终端、云端服务器都未识别出的目标语音数据进行人工识别录入，并将最终识别结果进行显示。

云端服务器，用于接收语音病历终端未识别出的目标语音数据，将所述未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别，将识别结果发送至语音病历终端进行显示。

优选地，语音病历终端包括录音模块、本地语音引擎、第一网络通信模块、本地语音库、显示模块。本地语音引擎包括输入接口、第一数据接口、第二数据接口、第三数据接口。其中，输入接口与所述录音模块的输出接口连接，第一数据接口与本地语音库双向数据连接，第二数据接口与所述第一网络通信模块双向数据连接，第三数据接口与显示模块连接；并且，本地语音库的输入接口与网络通信模块输出接口连接。

优选地，云端服务器包括设置于云平台上的云端识别引擎、云端语音库、第二网络通信模块。云端识别引擎包与云端语音库双向数据连接，与第二网络通信模块双向数据连接；并且，第二网络通信模块与第一网络通信模块通过光纤网络或者无线网络进行双向数据通信。

优选地，语音病历终端中，录音模块包括依次连接的麦克风、控制器、存储器。录音模块的功能是采集目标语音数据，并将其发送至本地语音引擎。具体地，通过麦克风录入目标语音数据，通过控制器将所述目标语音数据进行处理生成录音文件，通过存储器，存储所述录音文件。

优选地，本地语音引擎，包括本地语音识别设备。本地语音识别设备可采用现有的尚科语音、捷通华声、科大讯飞等公司的本地语音识别设备，例如科大讯飞的离线识别模块XFMT101。本地语音引擎的功能是读取目标语音数据，将目标语音数据与本地语音库中的特征语音数据进行匹配识别，将未识别出的目标语音数据按预设规则划分成至少一个子目标数据，将识别出的目标语音数据发送至显示模块进行显示，并将未识别出的目标语音数据发送到云端服务器。

优选地，第一网络通信模块用于语音病历终端和云端服务器的双向数据通信，应支持有线或无线宽带、Wi-Fi、蓝牙等通信技术中至少一种，可采用现有网络通信模块，例如高通或华为麒麟4G通讯模块、博通或IntelWi-Fi通讯模块等。

优选地，本地语音库采用现有自动创建模式，无须人工介入。初始状态可设置为空，用于存储使用语音病历终端的目标用户自身的特征语音数据与文字数据的对应关系。随着目标用户使用次数增多，在手动录入和云端识别的帮助下，本地语音库的内容会不断扩充。实际使用时，本地语音库可以设置成软件，也可以设置成语音识别算法的芯片，本领域技术人员能够理解，此处不再赘述。本地语音库，包括语音数据-文字数据对。

优选地，显示模块可采用现有显示器，用于将目标语音数据以文字形式进行显示。

云端服务器包括设置于云平台上的云端识别引擎、云端语音库、第二网络通信模块。云端识别引擎的功能是读取语音病历终端未识别出的子目标数据，将所述子目标数据与云端语音库中的特征语音数据进行匹配识别，将识别出的子目标数据对应的文字数据发送至语音病历终端的显示模块直接显示，并发出指令控制语音病历终端对其未识别出的子目标数据进行人工识别。人工识别是确保语音识别结果正确率的一个必要手段，可以随时介入和修改，显示的每个子目标对应的文字数据不必逐条确认，只要正确，操作者可以一直向下识别。第二网络通信模块的功能是实现语音病历终端输入系统和云端服务器的双向数据通信。

优选地，云端识别引擎，包括云端语音识别设备。所述云端语音识别设备可采用现有的尚科语音、捷通华声、科大讯飞等公司的云端语音识别设备，例如科大讯飞的云医声。云端识别引擎具有海量处理和存储能力，且具有完善的语音特征库，对资源消耗不敏感，处理响应速度极快，而本地语音引擎由于资源极其有限，对资源占用非常敏感，初始状态下语音库可为空，后续添加的语音特征仅为该终端用户的语音特征。

优选地，云端语音库，采用自动创建，无须人工介入。随着不同用户使用，云端语音库的内容也会不断扩充。云端语音库，包括语音数据-文字数据对。

优选地，第二网络通信模块用于语音病历终端和云端服务器的双向数据通信，应支持有线或无线宽带、Wi-Fi、蓝牙等通信技术中至少一种，可采用现有网络通信模块，如科大讯飞的识别模块。

本领域技术人员可以理解，实现上述实施例方法的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读存储介质中。其中，所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种语音病历终端输入的方法,其特征在于,包括如下步骤:

在语音病历终端，输入目标语音数据；

2.根据权利要求1所述的语音病历终端输入的方法,其特征在于,所述语音病历终端将所述目标语音数据与本地语音库中的特征语音数据进行匹配识别的步骤包括：

3.根据权利要求2所述的语音病历终端输入的方法,其特征在于，所述云端服务器将语音病历终端未识别出的目标语音数据与云端语音库中的特征语音数据进行匹配识别的步骤包括：

4.根据权利要求3所述的语音病历终端输入的方法,其特征在于,所述语音病历终端接收到所述识别失败指令后对上述云端服务器未识别出的目标语音数据进行人工识别的步骤包括：

5.根据权利要求2-4任一所述的语音病历终端输入的方法,其特征在于,所述将最终识别结果以文字形式进行显示的步骤包括：

将最终识别结果以文字形式进行显示。

6.一种语音病历终端输入系统，其特征在于，包括语音病历终端和云端服务器；

7.根据权利要求6所述的语音病历终端输入系统，其特征在于，所述语音病历终端包括录音模块、本地语音引擎、第一网络通信模块、本地语音库、显示模块；

所述显示模块，用于将目标语音数据以文字形式进行显示。

8.根据权利要求7所述的语音病历终端输入系统，其特征在于，云端服务器包括设置于云平台上的云端识别引擎、云端语音库、第二网络通信模块；

9.根据权利要求8所述的语音病历终端输入系统，其特征在于，所述录音模块包括依次连接的麦克风、控制器、存储器；

所述本地语音引擎，包括本地语音识别设备；

所述本地语音库，包括特征语音数据-文字数据对。

10.根据权利要求8或9所述的语音病历终端输入系统，其特征在于，所述云端识别引擎，包括云端语音识别设备；

所述云端语音库，包括特征语音数据-文字数据对。