CN106548778B - 一种字符转换规则的生成方法及装置 - Google Patents

一种字符转换规则的生成方法及装置 Download PDF

Info

Publication number
CN106548778B
CN106548778B CN201610895083.4A CN201610895083A CN106548778B CN 106548778 B CN106548778 B CN 106548778B CN 201610895083 A CN201610895083 A CN 201610895083A CN 106548778 B CN106548778 B CN 106548778B
Authority
CN
China
Prior art keywords
string
character
comentropy
transformation rule
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610895083.4A
Other languages
English (en)
Other versions
CN106548778A (zh
Inventor
王翘楚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201610895083.4A priority Critical patent/CN106548778B/zh
Publication of CN106548778A publication Critical patent/CN106548778A/zh
Application granted granted Critical
Publication of CN106548778B publication Critical patent/CN106548778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种字符转换规则的生成方法及装置,用于解决语音识别系统无法将语音播报的病历数据准确识别为病历专用字符的问题。所述方法包括:将原始文本转换为语音数据后通过语音识别转换为转换文本;将转换文本与原始文本进行逐字比对,识别出差异字符串;在转换文本中差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;从原始文本中获取与转换字符串在转换文本中的位置对应位置处的原始字符串;建立原始字符串与转换字符串的对应关系得到一条字符转换规则。该方法能够根据现有病历资料,生成特殊字符串的转换规则供语音识别系统使用。

Description

一种字符转换规则的生成方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种字符转换规则的生成方法及装置。
背景技术
根据美国医学会的统计,医生职业生涯大约15%-20%的时间用在了病历书写及与之相关的文案工作上。接受训练的医生(如住院医)花在上面的时间更是高达30%。虽然病历书写是行医工作中必不可少的部分,但巨大的工作量让很多医生苦不堪言,由于医疗成本的高昂,提高医生的工作效率一直是医院和医疗机构不断探索的问题。随着这些年电子病历系统的盛行,很多医院都在推行无纸化电子病历。电子病历不仅节省了纸张,还大大方便了患者和医生查看病历。但是也有一个小小的不足:医生要花费很多时间录入病历。
近年来,随着语音识别技术的发展,语音识别被提出应用到医疗领域。医生以口述的方式直接将患者病史、身体检查、评估和治疗计划等用语音播报,语音识别系统就可在很短的时间内生成文字版本的电子病历,大大节约了医生手写病历或者通过计算机录入电子病历的时间,提高了工作效率。病历中往往有大量的符号、字母等组合的特殊字符串,但是,现有的语音识别系统还未有专门针对病历中的这些字符串的转写规则。例如:医生口述“此药每天一片”,若采用传统的手写病历法,记录的内容可能为“此药1p/D”,但是若采用语音识别技术录入病历,则可能录入的内容为“此药每天一片”,无法按照医疗系统中的病历记录习惯进行语音识别记录,即:无法将语音播报的病历数据准确识别为病历专用字符。
发明内容
本发明提供一种字符转换规则的生成方法及装置,用于解决现有的语音识别系统无法将语音播报的病历数据准确识别为病历专用字符的问题。本发明提供的字符转换规则的生成方案能够根据现有病历资料,生成特殊字符串的转换规则供语音识别系统使用。
本发明提供一种字符转换规则的生成方法,包括:
将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本;
将转换文本与原始文本进行逐字比对,识别出差异字符串;所述差异字符串为转换文本中与原始文本不同之处的字符;
对于转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;
从所述原始文本中获取与所述转换字符串在所述转换文本中的位置对应位置处的原始字符串;
建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则。
本发明实施例的一些有益效果可以包括:
本发明提供的字符转换规则的生成方法,通过语音将原始文本转换为语音数据后,通过语音识别将原始文本对应的语音数据识别为转换文本,随后对于转换文本和原始文本不同之处的差异字符串,根据左、右信息熵的大小,提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串,获取该转换字符串在原始文本中对应的原始字符串,从而可以建立获取的原始字符串和转换字符串之间的对应关系作为字符串换规则。采用本方法得到的字符转换规则,在进行语音识别时,若用户播报的语音为字符转换规则中的转换字符串时,可将该语音准确识别为所述字符转换规则中该转换字符串对应的原始字符串。该方法能够用于诸多领域在语音识别时的特殊字符串的转换规则建立,显著提高语音识别的准确性,尤其适用于病历的语音识别,能够将语音播报的病历数据准确识别为病历专用字符。
在一个实施例中,所述在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串,包括:
将所述差异字符串作为目标字符串;
计算所述目标字符串的左、右信息熵;
判断所述目标字符串的长度是否小于预设字符串长度值且目标字符串的左、右信息熵是否小于预设信息熵阈值;
当所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有左/右信息熵小于预设信息熵阈值时,将转换文本中所述目标字符串及其左/右侧一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左/右侧一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤;
当所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵均小于预设信息熵阈值时,比较所述目标字符串的左信息熵和右信息熵的大小;
当所述目标字符串的左/右信息熵小于右/左信息熵时,将转换文本中所述目标字符串及其左/右侧一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左/右侧一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤;
当所述目标字符串的左、右信息熵相等时,将转换文本中所述目标字符串及其左、右侧各一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左、右侧各一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤;
当所述目标字符串的长度不小于预设字符串长度值或所述目标字符串的左、右信息熵均不小于预设信息熵阈值时,将已存储的最大信息熵对应的字符串确定为转换字符串。
该实施例中,通过计算目标字符串的左、右信息熵来表征目标字符串与左 /右侧字符相连组成的字符串出现的概率,在目标字符串长度小于预设字符串长度值时,将目标字符串往信息熵低的一侧扩展一个字符,直至目标字符串的左、右信息熵均不小于预设信息熵阈值时截止,并将上述过程中得到的最大信息熵对应的字符串确定为转换字符串,从而能够得到包括差异字符串且出现概率最大的字符串作为转换字符串,能够根据该转换字符串生成较为准确的字符转换规则。
在一个实施例中,在所述建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则之后,还包括:
将当前得到的字符转换规则记录在字符转换备选规则表中;
向用户提供字符转换备选规则表,并接收用户输入的选定指令;
将所述选定指令在所述字符转换备选规则表中选定的字符转换规则记录到字符转换规则库中。
该实施例中,用户可以自由选择是否使用得到的字符转换规则,增加人为把控过程,使得字符转换规则库中的字符转换规则更为精简有效。
在一个实施例中,所述将转换文本与原始文本进行逐字比对,识别出差异字符串之前,还包括:
将转换文本中与所述字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。
该实施例中,识别出差异字符串后,可以使用已有的字符转换规则对转换文本进行转写,进一步减少使用本发明提供的方法生成字符转换规则的重复工作量。
在一个实施例中,所述字符转换规则的生成方法,还包括:
接收用户直接输入的字符转换规则;
将接收的字符转换规则记录到所述字符转换规则库中。
该实施例中,接收用户直接设置的字符转换规则,方法更为人性化。
在一个实施例中,所述将原始文本转换为语音数据,包括:将原始文本通过语音播放转化为语音数据;
所述将所述语音数据通过语音识别转换为转换文本,包括:将所述语音数据通过语音输入法转换为转换文本。
该实施例中,使用语音播放功能将原始文本转化为语音数据,使用语音输入法将语音数据转换为转换文本,简单易行。
本发明提供的一种字符转换规则的生成装置,包括:
转换模块,用于将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本;
比对模块,用于将所述转换模块得到的转换文本与原始文本进行逐字比对,识别出差异字符串;所述差异字符串为转换文本中与原始文本不同之处的字符;
转换字符串获取模块,用于对所述比对模块识别出的转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;
原始字符串获取模块,用于从所述原始文本中获取与所述转换字符串获取模块获取的转换字符串在所述转换文本中的位置对应位置处的原始字符串;
规则生成模块,用于建立所述原始字符串获取模块获取的原始字符串与所述转换字符串获取模块获取的转换字符串的对应关系,得到一条字符转换规则。
在一个实施例中,所述转换字符串获取模块包括:
目标字符串确定子模块,用于对所述比对模块识别出的转换文本中的每个差异字符串,首先将差异字符串作为目标字符串,还用于在每次收到字符串获取存储子模块发来的字符串时,将收到的字符串重新确定为目标字符串;
信息熵计算子模块,用于计算所述目标字符串确定子模块确定的目标字符串的左、右信息熵;
判断子模块,用于判断所述目标字符串确定子模块确定的目标字符串的长度是否小于预设字符串长度值且所述信息熵计算子模块计算出的所述目标字符串的左、右信息熵是否小于预设信息熵阈值;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有左信息熵小于预设信息熵阈值时,向字符串获取存储子模块发送包括目标字符串的左信息熵的第一指令;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有右信息熵小于预设信息熵阈值时,向字符串获取存储子模块发送包括目标字符串的右信息熵的第二指令;当判断出所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵均小于预设信息熵阈值时,向大小比较子模块发送大小比较指令;当判断出所述目标字符串的长度不小于预设字符串长度值或所述目标字符串的左、右信息熵均不小于预设信息熵阈值时,向转换字符串确定子模块发送转换指令;
大小比较子模块,用于根据所述大小比较指令,比较所述信息熵计算子模块计算出的目标字符串的左信息熵和右信息熵的大小;当所述目标字符串的左信息熵小于右信息熵时,向字符串获取存储子模块发送所述第一指令;当所述目标字符串的右信息熵小于左信息熵时,向字符串获取存储子模块发送所述第二指令;当所述目标字符串的左、右信息熵相等时,向字符串获取存储子模块发送第三指令;
字符串获取存储子模块,用于根据收到的第一指令,获取转换文本中所述目标字符串及其左侧一个字符,并将当前获取的字符串与所述目标字符串的左信息熵对应存储;还用于根据收到的第二指令,获取转换文本中所述目标字符串及其右侧一个字符,并将当前获取的字符串与所述目标字符串的右信息熵对应存储;还用于根据收到的第三指令,获取转换文本中所述目标字符串及其左、右侧各一个字符,并将当前获取的字符串与所述目标字符串的左/右信息熵对应存储;所述字符串获取存储子模块还用于在每次存储后将本次获取的字符串发送给所述目标字符串确定子模块;
转换字符串确定子模块,用于根据转换指令,将所述字符串获取存储子模块已存储的最大信息熵对应的字符串确定为转换字符串。
在一个实施例中,所述字符转换规则的生成装置还包括:
记录模块,用于将所述规则生成模块当前得到的字符转换规则记录在字符转换备选规则表中;
选定模块,用于向用户提供所述记录模块记录的字符转换备选规则表,并接收用户输入的选定指令;
更新模块,用于将所述选定模块接收的选定指令在所述字符转换备选规则表中选定的字符转换规则记录到自身存储的字符转换规则库中。
在一个实施例中,所述转换模块还用于将得到的转换文本中与所述更新模块存储的字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。
在一个实施例中,所述字符转换规则的生成装置还包括:接收模块,用于接收用户直接输入的字符转换规则;所述更新模块还用于将所述接收模块接收的字符转换规则记录到所述字符转换规则库中。
在一个实施例中,所述转换模块包括:
语音播放子模块,用于将原始文本通过语音播放转化为语音数据;
语音识别子模块,用于将所述语音播放子模块得到的语音数据通过语音输入法转换为转换文本。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明字符转换规则的生成方法的流程图;
图2为本发明实施例一中一种字符转换规则的生成方法的流程图;
图3为本发明实施例二中一种字符转换规则的生成方法的流程图;
图4为本发明实施例提供的一种字符转换规则的生成装置的结构框图;
图5为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图;
图6为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图;
图7为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图;
图8为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明字符转换规则的生成方法的流程图。如图1所示,该方法包括以下步骤S101-S105:
S101:将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本。
其中,原始文本可以为需要建立字符转换规则的文本数据,例如现有的病历文本。优选地,可以通过语音播放将原始文本转化为语音数据,随后将所述语音数据通过语音输入法转换为转换文本。
S102:将转换文本与原始文本进行逐字比对,识别出差异字符串;所述差异字符串为转换文本中与原始文本不同之处的字符。
其中,将转换文本的每个字符(包括文字、数字、字母、符号等)与原始文本的每个字符从文本开头一一对齐,得到多个差异字符串。例如:原始文本为“病人心率为80bpm”,转换文本为“病人心率为80次每分钟”,则差异字符串为“次每分钟”。
S103:对于转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串。
例如,若原始文本为“A1A2A3A4A5A6A7A8A9A10”,其中A1-A10代表不同的字符,转换文本为“A1A2A3A4A5B1A7A8A9A10”,预设字符串长度值为4,首先确定出的差异字符串为“B1”,若转换文本中的字符串“A5B1”的左信息熵小于预设信息熵阈值且右信息熵大于预设信息熵阈值,字符串“A4A5B1”的左、右信息熵均大于预设信息熵阈值,则可将“A5B1”确定为转换字符串。
S104:从所述原始文本中获取与所述转换字符串在所述转换文本中的位置对应位置处的原始字符串。
例如,若原始文本为“A1A2A3A4A5A6A7A8A9A10”,其中A1-A10代表不同的字符,转换文本为“A1A2A3A4A5B1A7A8A9A10”,根据前面的步骤确定出转换字符串为“A4A5B1”,则此步骤中从原始文本中获取到的原始字符串为“A4A5A6”。
S105:建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则。
本实施例的字符转换规则的生成方法,通过语音将原始文本转换为语音数据后,通过语音识别将原始文本对应的语音数据识别为转换文本,随后对于转换文本和原始文本不同之处的差异字符串,根据左、右信息熵的大小,提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串,获取该转换字符串在原始文本中对应的原始字符串,从而可以建立获取的原始字符串和转换字符串之间的对应关系作为字符串转 换规则。采用本方法得到的字符转换规则,在进行语音识别时,若用户播报的语音为字符转换规则中的转换字符串时,可将该语音准确识别为所述字符转换规则中该转换字符串对应的原始字符串。该方法能够用于诸多领域在语音识别时的特殊字符串的转换规则建立,显著提高语音识别的准确性,尤其适用于病历的语音识别,能够将语音播报的病历数据准确识别为病历专用字符。
下面通过具体实施例来说明本发明实施例提供的字符转换规则的生成方法。
实施例一
图2为本发明实施例一中一种字符转换规则的生成方法的流程图。如图2 所示,包括以下步骤S201-S214:
S201:将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本。
S202:将转换文本与原始文本进行逐字比对,识别出差异字符串。
S203:将转换文本中的第N个差异字符作为目标字符串。其中,N的初始值为1。
S204:计算所述目标字符串的左、右信息熵。
S205:判断目标字符串的长度是否小于预设字符串长度值,若是,则执行步骤S206;否则,执行步骤S210。
S206:判断目标字符串的左、右信息熵是否小于预设信息熵阈值;若目标字符串的左、右信息熵均小于预设信息熵阈值,执行步骤S207;若目标字符串的左、右信息熵中只有左/右信息熵小于预设信息熵阈值,执行步骤S208;若目标字符串的左、右信息熵均不小于预设信息熵阈值,执行步骤S210。
S207:比较目标字符串的左信息熵和右信息熵的大小;当目标字符串的左 /右信息熵小于右/左信息熵时,执行步骤S208;当所述目标字符串的左、右信息熵相等时,执行步骤S209。
S208:将转换文本中目标字符串及其左/右侧一个字符与目标字符串的左/ 右信息熵对应存储,并将转换文本中目标字符串及其左/右侧一个字符重新确定为目标字符串,随后返回执行步骤S204。
其中,若步骤S206中判断出目标字符串的左、右信息熵中只有左信息熵小于预设信息熵阈值,则此步骤中将转换文本中所述目标字符串及其左侧一个字符与所述目标字符串的左信息熵对应存储,并将转换文本中所述目标字符串及其左侧一个字符重新确定为目标字符串;类似地,若步骤S206中判断出目标字符串的左、右信息熵中只有右信息熵小于预设信息熵阈值,则此步骤中将转换文本中所述目标字符串及其右侧一个字符与所述目标字符串的右信息熵对应存储,并将转换文本中所述目标字符串及其右侧一个字符重新确定为目标字符串。当步骤S207中比较出目标字符串的左信息熵小于右信息熵时,此步骤中将转换文本中所述目标字符串及其左侧一个字符与所述目标字符串的左信息熵对应存储,并将转换文本中所述目标字符串及其左侧一个字符重新确定为目标字符串;若步骤S207中比较出目标字符串的右信息熵小于左信息熵,则此步骤中将转换文本中所述目标字符串及其右侧一个字符与所述目标字符串的右信息熵对应存储,并将转换文本中所述目标字符串及其右侧一个字符重新确定为目标字符串。
S209:将转换文本中目标字符串及其左、右侧各一个字符与目标字符串的左/右信息熵对应存储,并将转换文本中目标字符串及其左、右侧各一个字符重新确定为目标字符串,随后返回执行步骤S204。
例如,若原始文本为“A1A2A3A4A5A6A7A8A9A10”,其中A1-A10代表不同的字符,转换文本为“A1A2A3A4A5B1A7A8A9A10”,当步骤S208中判断出目标字符串“B1”的左、右信息熵相等,则此步骤中将字符串“A5B1A7”与“B1”的左/右信息熵对应存储,并将字符串“A5B1A7”重新确定为目标字符串后返回执行步骤S204。
S210:将已存储的最大信息熵对应的字符串确定为转换字符串。
例如,对于差异字符串“B1”,若已存储的对应关系有:字符串“A5B1”及对应信息熵值H1,字符串“A5B1A7”及对应信息熵值H2,字符串“A5B1A7A8”及对应信息熵值H3,且H1<H3<H2,则对于当前的差异字符串“B1”,将“A5B1 A7”确定为转换字符串。
S211:从原始文本中获取与转换字符串在转换文本中的位置对应位置处的原始字符串。
S212:建立原始字符串与转换字符串的对应关系,得到一条字符转换规则。
S213:判断N是否等于M,若是则结束流程,否则执行步骤S214。
其中,M为在转换文本中识别出的差异字符串的数量。
S214:令N=N+1,并返回执行步骤S203。
本实施例能够通过计算语音转换后的转换文本中的差异字符串的信息熵来判断差异字符串左右字符出现的概率,从而根据预先设置的字符串长度值和信息熵阈值,确定出转换字符串,最终得到字符转换规则,提高语音识别的准确性。
实施例二
图3为本发明实施例二中一种字符转换规则的生成方法的流程图。如图3 所示,包括以下步骤S301-S308:
S301:将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本。
S302:将转换文本与原始文本进行逐字比对,识别出差异字符串。
S303:对于转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串。
本实施例中,步骤S303也可以采用实施例一中步骤S203-S210的方法实施,此处不再赘述。
S304:从所述原始文本中获取与所述转换字符串在所述转换文本中的位置对应位置处的原始字符串。
S305:建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则。
S306:将当前得到的字符转换规则记录在字符转换备选规则表中。
S307:向用户提供字符转换备选规则表,并接收用户输入的选定指令。
S308:将所述选定指令在所述字符转换备选规则表中选定的字符转换规则记录到字符转换规则库中。
此实施例中,根据上述方法得到的字符转换规则不一定是用户所需的,因此可以预先建立字符转换备选规则表,每次得到的字符转换规则先暂存在字符转换备选规则表中。随后可通过向用户提供字符转换备选规则表,使用户认为确定生成的哪些字符转换规则需要添加至字符转换规则库中。使得字符转换规则库中的字符转换规则更为精简有用,该字符转换规则库可直接使用于语音识别系统中。
在另一个实施例中,步骤S301和S302之间,还包括步骤:将转换文本中与所述字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。可以将第一次语音转换后没按照已生成的字符转换规则转换的字符串进行转换,进一步减少重复工作量。
在一个实施例中,上述字符转换规则的生成方法还可由用户直接输入字符转换规则,并将用户直接输入的字符转换规则记录到所述字符转换规则库中。
对应于本发明实施例提供的字符转换规则的生成方法,本发明实施例还提供一种字符转换规则的生成装置,如图4所示,包括:转换模块11、比对模块 12、转换字符串获取模块13、原始字符串获取模块14、规则生成模块15;其中:转换模块11,用于将原始文本转换为语音数据,并将语音数据通过语音识别转换为转换文本;比对模块12,用于将转换模块11得到的转换文本与原始文本进行逐字比对,识别出差异字符串;转换字符串获取模块13,用于对比对模块12识别出的转换文本中的每个差异字符串,在转换模块11得到的转换文本中差异字符串所处位置处提取包含差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;原始字符串获取模块14,用于从原始文本中获取与转换字符串获取模块 13获取的转换字符串在转换文本中的位置对应位置处的原始字符串;规则生成模块15,用于建立原始字符串获取模块14获取的原始字符串与转换字符串获取模块13获取的转换字符串的对应关系,得到一条字符转换规则。其中,差异字符串为转换文本中与原始文本不同之处的字符。
图4所示装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图,如图5所示,本实施例的装置在图4所示装置的基础上,进一步的,转换字符串获取模块13包括:
目标字符串确定子模块131,用于对比对模块12识别出的转换文本中的每个差异字符串,首先将差异字符串作为目标字符串,还用于在每次收到字符串获取存储子模块135发来的字符串时,将收到的字符串重新确定为目标字符串;
信息熵计算子模块132,用于计算目标字符串确定子模块131确定的目标字符串的左、右信息熵;
判断子模块133,用于判断目标字符串确定子模块131确定的目标字符串的长度是否小于预设字符串长度值且信息熵计算子模块计132算出的目标字符串的左、右信息熵是否小于预设信息熵阈值;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有左信息熵小于预设信息熵阈值时,向字符串获取存储子模块135发送包括目标字符串的左信息熵的第一指令;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有右信息熵小于预设信息熵阈值时,向字符串获取存储子模块135发送包括目标字符串的右信息熵的第二指令;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵均小于预设信息熵阈值时,向大小比较子模块134发送大小比较指令;当判断出目标字符串的长度不小于预设字符串长度值或目标字符串的左、右信息熵均不小于预设信息熵阈值时,向转换字符串确定子模块136发送转换指令;
大小比较子模块134,用于根据大小比较指令,比较信息熵计算子模块计算出的目标字符串的左信息熵和右信息熵的大小;当目标字符串的左信息熵小于右信息熵时,向字符串获取存储子模块135发送第一指令;当目标字符串的右信息熵小于左信息熵时,向字符串获取存储子模块135发送第二指令;当目标字符串的左、右信息熵相等时,向字符串获取存储子模块135发送第三指令;
字符串获取存储子模块135,用于根据收到的第一指令,获取转换文本中目标字符串及其左侧一个字符,并将当前获取的字符串与目标字符串的左信息熵对应存储;还用于根据收到的第二指令,获取转换文本中目标字符串及其右侧一个字符,并将当前获取的字符串与目标字符串的右信息熵对应存储;还用于根据收到的第三指令,获取转换文本中目标字符串及其左、右侧各一个字符,并将当前获取的字符串与目标字符串的左/右信息熵对应存储;字符串获取存储子模块135还用于在每次存储后将本次获取的字符串发送给目标字符串确定子模块131;
转换字符串确定子模块136,用于根据转换指令,将字符串获取存储子模块135已存储的最大信息熵对应的字符串确定为转换字符串。
图5所示装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图,如图6所示,本实施例的装置在图4所示装置的基础上,进一步的,还包括:
记录模块16,用于将规则生成模块15当前得到的字符转换规则记录在字符转换备选规则表中;
选定模块17,用于向用户提供记录模块16记录的字符转换备选规则表,并接收用户根据字符转换备选规则表输入的选定指令;
更新模块18,用于将选定模块17接收的选定指令在所述字符转换备选规则表中选定的字符转换规则记录到自身存储的字符转换规则库中。
图6所示装置,可以用于执行图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
优选地,在另一实施例中,转换模块11还用于将得到的转换文本中与更新模块18存储的字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。
图7为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图,如图7所示,本实施例的装置在图6所示装置的基础上,进一步的,还包括:接收模块19,用于接收用户直接输入的字符转换规则;更新模块18还用于将接收模块19接收的字符转换规则记录到所述字符转换规则库中。
图8为本发明实施例提供的另一种字符转换规则的生成装置的结构示意图,如图8所示,本实施例的装置在图4所示装置的基础上,进一步的,转换模块11包括:
语音播放子模块111,用于将原始文本通过语音播放转化为语音数据;
语音识别子模块112,用于将所述语音播放子模块111得到的语音数据通过语音输入法转换为转换文本。
本发明提供的字符转换规则的生成装置能够用于诸多领域在语音识别时的特殊字符串的转换规则建立,以提高语音识别的准确性,尤其适用于病历的语音识别专用字符规则库的建立。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种字符转换规则的生成方法,其特征在于,包括:
将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本;
将转换文本与原始文本进行逐字比对,识别出差异字符串;所述差异字符串为转换文本中与原始文本不同之处的字符;
对于转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;
从所述原始文本中获取与所述转换字符串在所述转换文本中的位置对应位置处的原始字符串;
建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则;
其中,所述在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串,包括:
将所述差异字符串作为目标字符串;
计算所述目标字符串的左、右信息熵;
判断所述目标字符串的长度是否小于预设字符串长度值且目标字符串的左、右信息熵是否小于预设信息熵阈值;
当所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有左/右信息熵小于预设信息熵阈值时,将转换文本中所述目标字符串及其左/右侧一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左/右侧一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤;
当所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵均小于预设信息熵阈值时,比较所述目标字符串的左信息熵和右信息熵的大小;
当所述目标字符串的左/右信息熵小于右/左信息熵时,将转换文本中所述目标字符串及其左/右侧一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左/右侧一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤;
当所述目标字符串的左、右信息熵相等时,将转换文本中所述目标字符串及其左、右侧各一个字符与所述目标字符串的左/右信息熵对应存储,并将转换文本中所述目标字符串及其左、右侧各一个字符重新确定为目标字符串,随后返回执行计算所述目标字符串的左、右信息熵的步骤。
2.如权利要求1所述的一种字符转换规则的生成方法,其特征在于,在所述建立所述原始字符串与转换字符串的对应关系,得到一条字符转换规则之后,还包括:
将当前得到的字符转换规则记录在字符转换备选规则表中;
向用户提供字符转换备选规则表,并接收用户输入的选定指令;
将所述选定指令在所述字符转换备选规则表中选定的字符转换规则记录到字符转换规则库中。
3.如权利要求2所述的一种字符转换规则的生成方法,其特征在于,所述将转换文本与原始文本进行逐字比对,识别出差异字符串之前,还包括:
将转换文本中与所述字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。
4.如权利要求2所述的一种字符转换规则的生成方法,其特征在于,还包括:
接收用户直接输入的字符转换规则;
将接收的字符转换规则记录到所述字符转换规则库中。
5.如权利要求1所述的一种字符转换规则的生成方法,其特征在于,所述将原始文本转换为语音数据,包括:将原始文本通过语音播放转化为语音数据;
所述将所述语音数据通过语音识别转换为转换文本,包括:将所述语音数据通过语音输入法转换为转换文本。
6.一种字符转换规则的生成装置,其特征在于,包括:
转换模块,用于将原始文本转换为语音数据,并将所述语音数据通过语音识别转换为转换文本;
比对模块,用于将所述转换模块得到的转换文本与原始文本进行逐字比对,识别出差异字符串;所述差异字符串为转换文本中与原始文本不同之处的字符;
转换字符串获取模块,用于对所述比对模块识别出的转换文本中的每个差异字符串,在转换文本中所述差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;
原始字符串获取模块,用于从所述原始文本中获取与所述转换字符串获取模块获取的转换字符串在所述转换文本中的位置对应位置处的原始字符串;
规则生成模块,用于建立所述原始字符串获取模块获取的原始字符串与所述转换字符串获取模块获取的转换字符串的对应关系,得到一条字符转换规则;
其中,所述转换字符串获取模块包括:
目标字符串确定子模块,用于对所述比对模块识别出的转换文本中的每个差异字符串,首先将差异字符串作为目标字符串,还用于在每次收到字符串获取存储子模块发来的字符串时,将收到的字符串重新确定为目标字符串;
信息熵计算子模块,用于计算所述目标字符串确定子模块确定的目标字符串的左、右信息熵;
判断子模块,用于判断所述目标字符串确定子模块确定的目标字符串的长度是否小于预设字符串长度值且所述信息熵计算子模块计算出的所述目标字符串的左、右信息熵是否小于预设信息熵阈值;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有左信息熵小于预设信息熵阈值时,向字符串获取存储子模块发送包括目标字符串的左信息熵的第一指令;当判断出目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵中只有右信息熵小于预设信息熵阈值时,向字符串获取存储子模块发送包括目标字符串的右信息熵的第二指令;当判断出所述目标字符串的长度小于预设字符串长度值且目标字符串的左、右信息熵均小于预设信息熵阈值时,向大小比较子模块发送大小比较指令;
大小比较子模块,用于根据所述大小比较指令,比较所述信息熵计算子模块计算出的目标字符串的左信息熵和右信息熵的大小;当所述目标字符串的左信息熵小于右信息熵时,向字符串获取存储子模块发送所述第一指令;当所述目标字符串的右信息熵小于左信息熵时,向字符串获取存储子模块发送所述第二指令;当所述目标字符串的左、右信息熵相等时,向字符串获取存储子模块发送第三指令;
字符串获取存储子模块,用于根据收到的第一指令,获取转换文本中所述目标字符串及其左侧一个字符,并将当前获取的字符串与所述目标字符串的左信息熵对应存储;还用于根据收到的第二指令,获取转换文本中所述目标字符串及其右侧一个字符,并将当前获取的字符串与所述目标字符串的右信息熵对应存储;还用于根据收到的第三指令,获取转换文本中所述目标字符串及其左、右侧各一个字符,并将当前获取的字符串与所述目标字符串的左/右信息熵对应存储;所述字符串获取存储子模块还用于在每次存储后将本次获取的字符串发送给所述目标字符串确定子模块。
7.如权利要求6所述的一种字符转换规则的生成装置,其特征在于,还包括:
记录模块,用于将所述规则生成模块当前得到的字符转换规则记录在字符转换备选规则表中;
选定模块,用于向用户提供所述记录模块记录的字符转换备选规则表,并接收用户输入的选定指令;
更新模块,用于将所述选定模块接收的选定指令在所述字符转换备选规则表中选定的字符转换规则记录到自身存储的字符转换规则库中。
8.如权利要求7所述的一种字符转换规则的生成装置,其特征在于,所述转换模块还用于将得到的转换文本中与所述更新模块存储的字符转换规则库中记录的字符转换规则中的原始字符串相同的各字符串按照所述字符转换规则库中记录的相应字符转换规则进行转写。
9.如权利要求7所述的一种字符转换规则的生成装置,其特征在于,还包括:接收模块,用于接收用户直接输入的字符转换规则;所述更新模块还用于将所述接收模块接收的字符转换规则记录到所述字符转换规则库中。
10.如权利要求6所述的一种字符转换规则的生成装置,其特征在于,所述转换模块包括:
语音播放子模块,用于将原始文本通过语音播放转化为语音数据;
语音识别子模块,用于将所述语音播放子模块得到的语音数据通过语音输入法转换为转换文本。
CN201610895083.4A 2016-10-13 2016-10-13 一种字符转换规则的生成方法及装置 Active CN106548778B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610895083.4A CN106548778B (zh) 2016-10-13 2016-10-13 一种字符转换规则的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610895083.4A CN106548778B (zh) 2016-10-13 2016-10-13 一种字符转换规则的生成方法及装置

Publications (2)

Publication Number Publication Date
CN106548778A CN106548778A (zh) 2017-03-29
CN106548778B true CN106548778B (zh) 2019-10-11

Family

ID=58368923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610895083.4A Active CN106548778B (zh) 2016-10-13 2016-10-13 一种字符转换规则的生成方法及装置

Country Status (1)

Country Link
CN (1) CN106548778B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107331391A (zh) * 2017-06-06 2017-11-07 北京云知声信息技术有限公司 一种数字种类的确定方法及装置
CN109146427A (zh) * 2018-08-31 2019-01-04 万翼科技有限公司 定标的邮件沟通方法、装置及计算机可读存储介质
CN111862955B (zh) * 2020-06-23 2024-04-23 北京嘀嘀无限科技发展有限公司 一种语音识别方法与终端、计算机可读存储介质
CN112185390B (zh) * 2020-09-27 2023-10-03 中国商用飞机有限责任公司北京民用飞机技术研究中心 机上信息辅助方法及装置
CN113407665A (zh) * 2021-05-25 2021-09-17 北京有竹居网络技术有限公司 文本比对方法、装置、介质及电子设备
CN116644083B (zh) * 2023-07-24 2023-11-03 苏州浪潮智能科技有限公司 数据更新方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4974191A (en) * 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
CN101031913A (zh) * 2004-09-30 2007-09-05 皇家飞利浦电子股份有限公司 自动文本校正
CN104243666A (zh) * 2013-06-13 2014-12-24 腾讯科技(深圳)有限公司 语言处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4974191A (en) * 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
CN101031913A (zh) * 2004-09-30 2007-09-05 皇家飞利浦电子股份有限公司 自动文本校正
CN104243666A (zh) * 2013-06-13 2014-12-24 腾讯科技(深圳)有限公司 语言处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《统计与规则相融合的领域术语抽取算法》;樊梦佳等;《计算机应用研究》;20160830;第33卷(第8期);第2283-2284页第2.1节、图2 *

Also Published As

Publication number Publication date
CN106548778A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN106548778B (zh) 一种字符转换规则的生成方法及装置
CN107220235B (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN107978311A (zh) 一种语音数据处理方法、装置以及语音交互设备
WO2021208601A1 (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN110196908A (zh) 数据分类方法、装置、计算机装置及存储介质
CN108288468A (zh) 语音识别方法及装置
CN108959257A (zh) 一种自然语言解析方法、装置、服务器及存储介质
CN108549662A (zh) 多轮会话中语义解析结果的补充消解方法及装置
CN106328145B (zh) 语音修正方法及装置
CN104064180A (zh) 演唱评分方法及装置
CN108877782A (zh) 语音识别方法和装置
CN107544726A (zh) 基于人工智能的语音识别结果纠错方法、装置及存储介质
CN108664465A (zh) 一种自动生成文本方法以及相关装置
CN113342968B (zh) 文本摘要提取方法及装置
CN112052321A (zh) 人机对话方法、装置、计算机设备及存储介质
CN112232052B (zh) 文本拼接方法、装置、计算机设备及存储介质
CN110223365A (zh) 一种笔记生成方法、系统、装置及计算机可读存储介质
KR20210129605A (ko) 텍스트 핵심정보 추출방법, 장치, 전자기기 및 기록매체
CN106980620A (zh) 一种对中文字串进行匹配的方法及装置
CN113393544B (zh) 一种图像处理方法、装置、设备及介质
CN109766881A (zh) 一种竖向文本图像的字符识别方法和装置
CN110610698A (zh) 一种语音标注方法及装置
CN108009160A (zh) 含有命名实体的语料翻译方法、装置、电子设备及存储介质
CN114841274A (zh) 语言模型的训练方法、装置、电子设备和存储介质
CN104346616B (zh) 字符识别装置和字符识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address