CN116959453A - 一种语音录入电子病历信息系统及操作方法 - Google Patents
一种语音录入电子病历信息系统及操作方法 Download PDFInfo
- Publication number
- CN116959453A CN116959453A CN202311022721.8A CN202311022721A CN116959453A CN 116959453 A CN116959453 A CN 116959453A CN 202311022721 A CN202311022721 A CN 202311022721A CN 116959453 A CN116959453 A CN 116959453A
- Authority
- CN
- China
- Prior art keywords
- voice
- text data
- error correction
- terminal
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012937 correction Methods 0.000 claims abstract description 63
- 230000002618 waking effect Effects 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 23
- 239000012634 fragment Substances 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 abstract description 3
- 238000012549 training Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了电子病历技术领域的一种语音录入电子病历信息系统及操作方法,接收所述终端的声纹特征,与声纹数据库进行对比,以确定终端是否进行后续的语音识别;接收所述终端发送的电子病例语音,将电子病例语音转换成录入文本数据,将录入文本数据进行存储的同时将录入文本数据上传至显示器进行纠错;接收所述终端发送的纠错语音,将纠错语音转换成纠错文本数据,将纠错文本数据与录入文本数据对比后替换该录入文本数据。能够有效识别医生电子病例语音,并将医生的电子病例语音进行录入,具有唤醒、过滤识别和纠错功能,有效保证语音录入电子病例的准确性。
Description
技术领域
本发明涉及电子病历的技术领域,尤其是涉及一种语音录入电子病历信息系统及操作方法。
背景技术
随着医疗电子信息化的普及,电子病历已经成为各大医院记录医疗信息的必备方式,现有的电子病历生成方案要求医生启动电脑中已安装的电子病历程序,之后在电子病历程序提供的电子病历模板中手动输入病历内容,并存储为病人的电子病历,这给医生带来沉重负担,同时影响看病的效果。
如公开(公告)号:CN104485105B公开了一种电子病历生成方法和电子病历系统,其中,电子病历生成方法包括:终端在接收到指示创建电子病历的指令时采集录入的语音;终端提取本次录入的语音的声音特征,生成声音特征文件;终端将声音特征文件发送给服务器;服务器接收来自终端的声音特征文件并进行语音识别,得到语音识别结果;服务器将语音识别结果存储为电子病历文件;其中,服务器对所述声音特征文件进行语音识别包括:使用声学模型、N-gram语音模型和神经网络语言模型依次对声音特征文件进行处理,得到语音识别结果。
但是存在由于语言的复杂多样和周围噪声影响,语音识别的结果往往与用户实际想输入的内容有较大的偏差,会出现部分字错误的情况,容易造成严重的医疗事故。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本发明的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
因此,本发明目的是提供一种语音录入电子病历信息系统及操作方法,能够有效识别医生电子病例语音,并将医生的电子病例语音进行录入,具有唤醒、过滤识别和纠错功能,有效保证语音录入电子病例的准确性。
为解决上述技术问题,本发明提供一种语音录入电子病历信息系统及操作方法,采用如下的技术方案:包括终端和服务器,
所述终端用于接收唤醒语音,对所述唤醒语音进行声纹识别,将得到的声纹特征发送给所述服务器进行比对;
所述终端用于接收医生录入的电子病例语音,并将采集到的电子病例语音发送给所述服务器存储;
所述终端用于接收纠错语音指令,并将采集到的纠错语音发送给所述服务器存储;
所述服务器用于接收所述终端的声纹特征,与声纹数据库进行对比,以确定终端是否进行后续的语音识别;
所述服务器用于接收所述终端发送的电子病例语音,将电子病例语音转换成录入文本数据,将录入文本数据进行存储的同时将录入文本数据上传至显示器进行纠错;
所述服务器用于接收所述终端发送的纠错语音,将纠错语音转换成纠错文本数据,将纠错文本数据与录入文本数据对比后替换该录入文本数据。
可选的,所述声纹数据库,由以下方法得到:终端第一次启动后,提示医生进行账户注册,连接至服务器进行注册,并获取设备唯一识别信息,医生通过服务器进行具有终端操作权限的账号注册,所述账号注册包括将账号与声纹进行绑定;当不存在所需要绑定的声纹时,通过终端进行声纹注册。
可选的,所述声纹注册方法为:医生口述预设的标准文本,终端根据所接受到的声音信号提取医生的声纹特征;所述声纹特征和具有终端操作权限的账号注册同时在服务器保存。
可选的,所述终端用于接收医生录入的电子病例语音基于声纹特征进行采集,即基于电子病例语音通过声纹特征过滤非声纹特征信息。
可选的,所述服务器具体通过如下方式将电子病例语音转换成录入文本数据:
使用声学模型对所述电子病例语音进行处理,得到第一处理文件,其中,所述声学模型基于医学类词典、历史医学病例文件以及医学类的英文名词构建;
使用N-gram语音模型对所述第一处理文件进行处理,得到第二处理文件;
使用神经网络语音模型对所述第二处理文件进行处理,得到电子病例转换后的录入文本数据。
可选的,所述纠错语音指令的启动可以采用语音控制或者手动控制。
可选的,所述服务器包括存储临时录入文本数据库,当该录入文本数据进行纠错后,从存储临时录入文本数据库删除。
可选的,所述服务器具体通过如下方式将纠错文本数据与录入文本数据对比后替换该录入文本数据:
使用搜索模块将纠错文本数据与存储临时录入文本数据库内的录入文本数据进行比对,并搜索近似语段;
使用抽取模块抽取所述近似语段中不同词汇的属性片段信息;
使用获取模块获取所述不同词汇的属性片段信息对应的上下文关键词;
使用计算模块根据所述上下文关键词的权重,计算每个所述待抽取的属性片段信息的分值,并将所述分值最高的所述待抽取的属性片段信息对应的关键词替换所抽取的似语段中不同词汇,形成纠错文本数据。
可选的,一种语音录入电子病历信息系统的操作方法,具体包括以下步骤:
步骤S1:连接终端与服务器,并接通电源;
步骤S2:进行医生的账号注册和声纹注册;
步骤S3:使用唤醒语音唤醒终端;
步骤S4:打开显示器电子病例录入界面,录入的电子病例语音;
步骤S5:当医生通过显示器观看录入文本数据构成的电子病例需要纠错时,发出纠错语音指令,输入纠错语音;
步骤S6:终端接收纠错语音,通过服务器将录入文本数据替换为纠错文本数据。
综上所述,本发明包括以下至少一种有益效果:
1、通过声纹特征识别用户的唤醒词和电子病例语音的声纹,来判断是否是医生在进行语音操作,可以明显降低设备的误唤醒率,尤其是在有多个设备、多个用户同时存在的场景下,唤醒的准确率能明显提高。
2、通过纠错语音转换成纠错文本数据,将纠错文本数据与录入文本数据对比后替换该录入文本数据,不但能够保证医嘱的正确性,而且有效避免手动修改的低效率性,无需手动参与,全程进行语音录入和纠错。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明语音录入电子病历信息系统原理框图;
图2为本发明语音录入电子病历信息系统整体结构示意图;
图3为本发明语音录入电子病历信息系统的操作方法流程图。
具体实施方式
以下结合附图1-3对本发明作进一步详细说明。
实施例一
参照图1-图2,本发明公开一种语音录入电子病历信息系统及操作方法,包括终端和服务器,
终端用于接收唤醒语音,对所述唤醒语音进行声纹识别,从利用数学方法可以建模的角度出发,声纹自动识别模型目前可以使用的特征包括(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道);等等。
将得到的声纹特征发送给所述服务器进行比对;服务器接收所述终端的声纹特征,与声纹数据库进行对比,以确定终端是否进行后续的语音识别;
所述声纹数据库,由以下方法得到:终端第一次启动后,提示医生进行账户注册,连接至服务器进行注册,并获取设备唯一识别信息,医生通过服务器进行具有终端操作权限的账号注册,所述账号注册包括将账号与声纹进行绑定;当不存在所需要绑定的声纹时,通过终端进行声纹注册。所述声纹注册方法为:医生口述预设的标准文本,终端根据所接受到的声音信号提取医生的声纹特征;所述声纹特征和具有终端操作权限的账号注册同时在服务器保存。声纹注册如通过多次呼喊终端名称或者说“进行电子病例录入”语句,通过多次对不同语句的声音信号提取医生的声纹特征,将其录入在声纹数据库内,当需要终端启动或者运作时,可以通过对比该声纹特征确定是否为所要执行的命令。
所述终端用于接收医生录入的电子病例语音基于声纹特征进行采集,并将采集到的电子病例语音发送给所述服务器存储;即基于电子病例语音通过声纹特征过滤非声纹特征信息,避免非本人的误操作,具体将采集的电子病例语音的声纹特征与声纹数据库进行比对,存在该声纹特征则认定可以录入。服务器具体通过如下方式将电子病例语音转换成录入文本数据:使用声学模型对所述电子病例语音进行处理,得到第一处理文件,其中,所述声学模型基于医学类词典、历史医学病例文件以及医学类的英文名词构建;使用N-gram语音模型对所述第一处理文件进行处理,得到第二处理文件;使用神经网络语音模型对所述第二处理文件进行处理,得到电子病例转换后的录入文本数据。
下面具体对上述声学模型的构建过程进行说明:为使得本发明实施例中的电子病历系统在医学场景下具有更好的语音识别效果,在上述声学模型训练过程中,采用了针对医疗应用环境下的发音词典,以及相应语境环境的训练音频。在上述声学模型的发音词典方面,为处理医学情景下的复杂语言环境,引入专业的医学类词典及部分医学类的英文名词。在发音词典的建立过程中,采用统计学方法,从大量医学病历文本(例如医院3年以上的所有病人的病历文本)中找出出现较频率高的词作为发音词典中的词汇,发音标记采用处理中文广泛使用的音素标记法。可选的,声学模型建模基于传统的隐马尔可夫模型(HMM,HiddenMarkovModel)-混合高斯模型(GMM,Gaussianmixturemodel)三音素模型,并在其基础上进行异方差线性判别分析及最小化音素错误(MPE,MinimumPhoneErro)过程得到。下面具体对上述N-gram语音模型和神经网络语言模型进行说明:为使语言模型得到更好的效果,本发明实施例中的电子病历系统中的语音模型采用N-gram语言模型和神经网络语言模型结合的方法。神经网络语言模型将词映射到高维度的向量空间,基于多层级神经网络对接下来的词进行解码,由于神经网络语言模型的结构特点,对于出现频率低的词无法给出似然值,所以在语音识别过程中通过N-gram语言模型进行预解码。
终端还用于接收纠错语音指令,并将采集到的纠错语音发送给所述服务器存储;将录入文本数据进行存储的同时将录入文本数据上传至显示器进行纠错。所述纠错语音指令的启动可以采用语音控制或者手动控制,即语音唤醒终端后,通过语音下达进行纠错指令,或者在终端上安装“纠错”功能的按钮,所述服务器包括存储临时录入文本数据库,当该录入文本数据进行纠错后,从存储临时录入文本数据库删除,减小占用内存,剔除无用信息。为了解决现有针对语音录入错误的信息需要手动修改,服务器接收所述终端发送的纠错语音,将纠错语音自动转换成纠错文本数据,将纠错文本数据与录入文本数据对比后替换该录入文本数据。
服务器具体通过如下方式将纠错文本数据与录入文本数据对比后替换该录入文本数据:
使用搜索模块将纠错文本数据与存储临时录入文本数据库内的录入文本数据进行比对,并搜索近似语段;根据纠错文本数据寻找在电子病例中存在相近似的语段,即为需要纠错的语段;然后使用抽取模块抽取所述近似语段中不同词汇的属性片段信息;将该纠错的语段抽取出来后使用获取模块获取所述不同词汇的属性片段信息对应的上下文关键词;
使用计算模块根据所述上下文关键词的权重,计算每个所述待抽取的属性片段信息的分值,权重的计算公式为:其中c(x,y)表示训练数据中有效特征y与属性片段信息x同时出现的次数,c(x)表示训练数据中属性片段信息x出现的次数;待抽取的属性片段信息的分值计算公式为:/>c(i)表示上下文关键词i对于属性片段信息的权重,k表示上下文关键词的集合。
并将所述分值最高的所述待抽取的属性片段信息对应的关键词替换所抽取的似语段中不同词汇,形成纠错文本数据。
实施例二
参照图3,基于与上述实施例一相同的构思,还包括一种语音录入电子病历信息系统的操作方法,具体包括以下步骤:
步骤S1:连接终端与服务器,并接通电源;
步骤S2:进行医生的账号注册和声纹注册;
步骤S3:使用唤醒语音唤醒终端;
步骤S4:打开显示器电子病例录入界面,录入的电子病例语音;
步骤S5:当医生通过显示器观看录入文本数据构成的电子病例需要纠错时,发出纠错语音指令,输入纠错语音;
步骤S6:终端接收纠错语音,通过服务器将录入文本数据替换为纠错文本数据。
以上均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
Claims (9)
1.一种语音录入电子病历信息系统,其特征在于:包括终端和服务器,
所述终端用于接收唤醒语音,对所述唤醒语音进行声纹识别,将得到的声纹特征发送给所述服务器进行比对;
所述终端用于接收医生录入的电子病例语音,并将采集到的电子病例语音发送给所述服务器存储;
所述终端用于接收纠错语音指令,并将采集到的纠错语音发送给所述服务器存储;
所述服务器用于接收所述终端的声纹特征,与声纹数据库进行对比,以确定终端是否进行后续的语音识别;
所述服务器用于接收所述终端发送的电子病例语音,将电子病例语音转换成录入文本数据,将录入文本数据进行存储的同时将录入文本数据上传至显示器进行纠错;
所述服务器用于接收所述终端发送的纠错语音,将纠错语音转换成纠错文本数据,将纠错文本数据与录入文本数据对比后替换该录入文本数据。
2.根据权利要求1所述的一种语音录入电子病历信息系统,其特征在于:所述声纹数据库,由以下方法得到:终端第一次启动后,提示医生进行账户注册,连接至服务器进行注册,并获取设备唯一识别信息,医生通过服务器进行具有终端操作权限的账号注册,所述账号注册包括将账号与声纹进行绑定;当不存在所需要绑定的声纹时,通过终端进行声纹注册。
3.根据权利要求2所述的一种语音录入电子病历信息系统,其特征在于:所述声纹注册方法为:医生口述预设的标准文本,终端根据所接受到的声音信号提取医生的声纹特征;所述声纹特征和具有终端操作权限的账号注册同时在服务器保存。
4.根据权利要求1所述的一种语音录入电子病历信息系统,其特征在于:所述终端用于接收医生录入的电子病例语音基于声纹特征进行采集,即基于电子病例语音通过声纹特征过滤非声纹特征信息。
5.根据权利要求1所述的一种语音录入电子病历信息系统,其特征在于:所述服务器具体通过如下方式将电子病例语音转换成录入文本数据:
使用声学模型对所述电子病例语音进行处理,得到第一处理文件,其中,所述声学模型基于医学类词典、历史医学病例文件以及医学类的英文名词构建;
使用N-gram语音模型对所述第一处理文件进行处理,得到第二处理文件;
使用神经网络语音模型对所述第二处理文件进行处理,得到电子病例转换后的录入文本数据。
6.根据权利要求5所述的一种语音录入电子病历信息系统,其特征在于:所述纠错语音指令的启动可以采用语音控制或者手动控制。
7.根据权利要求6所述的一种语音录入电子病历信息系统,其特征在于:所述服务器包括存储临时录入文本数据库,当该录入文本数据进行纠错后,从存储临时录入文本数据库删除。
8.根据权利要求7所述的一种语音录入电子病历信息系统,其特征在于:所述服务器具体通过如下方式将纠错文本数据与录入文本数据对比后替换该录入文本数据:
使用搜索模块将纠错文本数据与存储临时录入文本数据库内的录入文本数据进行比对,并搜索近似语段;
使用抽取模块抽取所述近似语段中不同词汇的属性片段信息;
使用获取模块获取所述不同词汇的属性片段信息对应的上下文关键词;使用计算模块根据所述上下文关键词的权重,计算每个所述待抽取的属性片段信息的分值,并将所述分值最高的所述待抽取的属性片段信息对应的关键词替换所抽取的似语段中不同词汇,形成纠错文本数据。
9.根据权利要求1-8任一所述的一种语音录入电子病历信息系统的操作方法,其特征在于:具体包括以下步骤:
步骤S1:连接终端与服务器,并接通电源;
步骤S2:进行医生的账号注册和声纹注册;
步骤S3:使用唤醒语音唤醒终端;
步骤S4:打开显示器电子病例录入界面,录入的电子病例语音;
步骤S5:当医生通过显示器观看录入文本数据构成的电子病例需要纠错时,发出纠错语音指令,输入纠错语音;
步骤S6:终端接收纠错语音,通过服务器将录入文本数据替换为纠错文本数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022721.8A CN116959453A (zh) | 2023-08-15 | 2023-08-15 | 一种语音录入电子病历信息系统及操作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022721.8A CN116959453A (zh) | 2023-08-15 | 2023-08-15 | 一种语音录入电子病历信息系统及操作方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116959453A true CN116959453A (zh) | 2023-10-27 |
Family
ID=88456656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311022721.8A Pending CN116959453A (zh) | 2023-08-15 | 2023-08-15 | 一种语音录入电子病历信息系统及操作方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959453A (zh) |
-
2023
- 2023-08-15 CN CN202311022721.8A patent/CN116959453A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9552809B2 (en) | Document transcription system training | |
US7668718B2 (en) | Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile | |
US7584103B2 (en) | Automated extraction of semantic content and generation of a structured document from speech | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
JP4393494B2 (ja) | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム | |
US7092870B1 (en) | System and method for managing a textual archive using semantic units | |
US20020173956A1 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
EP1617409B1 (en) | Multimodal method to provide input to a computing device | |
US20100299135A1 (en) | Automated Extraction of Semantic Content and Generation of a Structured Document from Speech | |
EP1089193A2 (en) | Translating apparatus and method, and recording medium used therewith | |
US20020082831A1 (en) | Method for adding phonetic descriptions to a speech recognition lexicon | |
JP2017058674A (ja) | 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器 | |
WO2001031511A1 (en) | Data capture and verification system | |
US6975985B2 (en) | Method and system for the automatic amendment of speech recognition vocabularies | |
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
JP2002287787A (ja) | 明確化言語モデル | |
US8583417B2 (en) | Translation device and computer program product | |
CN112466279B (zh) | 一种英语口语发音自动纠正方法和装置 | |
Ronzhin et al. | Survey of russian speech recognition systems | |
RU2386178C2 (ru) | Способ предварительной обработки текста | |
CN116959453A (zh) | 一种语音录入电子病历信息系统及操作方法 | |
JP5028599B2 (ja) | 音声処理装置、およびプログラム | |
Kumar et al. | Formalizing expert knowledge for developing accurate speech recognizers. | |
WO2001031634A1 (en) | Proofreading system and method | |
CN117935783A (zh) | 一种随访语音识别自校验方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |