CN109582775B - 信息录入方法、装置、计算机设备及存储介质 - Google Patents

信息录入方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109582775B
CN109582775B CN201811472779.1A CN201811472779A CN109582775B CN 109582775 B CN109582775 B CN 109582775B CN 201811472779 A CN201811472779 A CN 201811472779A CN 109582775 B CN109582775 B CN 109582775B
Authority
CN
China
Prior art keywords
information
text
pinyin
preset
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811472779.1A
Other languages
English (en)
Other versions
CN109582775A (zh
Inventor
贾克尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811472779.1A priority Critical patent/CN109582775B/zh
Publication of CN109582775A publication Critical patent/CN109582775A/zh
Application granted granted Critical
Publication of CN109582775B publication Critical patent/CN109582775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了信息录入方法、装置、计算机设备及存储介质。方法包括:若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。本发明基于语音处理技术,能够及时检查所录入语音信息中的错误并提示用户,确保所录入的语音信息与文本信息相匹配,从而大幅提高了语音信息录入的效率。

Description

信息录入方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息录入方法、装置、计算机设备及存储介质。
背景技术
在对视频进行翻译并添加翻译后的语音信息时,需根据字幕中的文字信息录入相应的语音信息,因而在在录入语音信息的过程中,需确保所录入的语音信息与文本信息一一对应,现有的语音信息录入方法使用操作复杂,且无法对所录入的语音信息进行校验,从而造成录入的语音信息存在未被及时发现的错误,极大地影响了语音信息录入的效率。因而现有的语音录入方法存在语音信息录入效率较低的问题。
发明内容
本发明实施例提供了一种信息录入方法、装置、计算机设备及存储介质,旨在解决现有技术中语音信息录入方法存在录入效率较低的问题。
第一方面,本发明实施例提供了一种信息录入方法,其包括:
若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;
根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;
若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;
通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;
对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
第二方面,本发明实施例提供了一种信息录入装置,其包括:
文本信息切分单元,用于若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;
录入提示信息发送单元,用于根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;
第一拼音信息获取单元,用于若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;
第二拼音信息获取单元,用于通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;
提示信息发送单元,用于对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的信息录入方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的信息录入方法。
本发明实施例提供了一种信息录入方法、装置、计算机设备及存储介质。通过对文本信息进行切分得到文本语句,对用户所录入的语音信息进行转换并与文本语句转换得到的拼音信息是否匹配进行判断,能够及时检查所录入语音信息中的错误并提示用户,以确保所录入的语音信息与文本信息中对应的文本语句相匹配,从而大幅提高了语音信息录入的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的信息录入方法的流程示意图;
图2为本发明实施例提供的信息录入方法的子流程示意图;
图3为本发明实施例提供的信息录入方法的另一子流程示意图;
图4为本发明实施例提供的信息录入方法的另一子流程示意图;
图5为本发明实施例提供的信息录入方法的另一子流程示意图;
图6为本发明实施例提供的信息录入装置的示意性框图;
图7为本发明实施例提供的信息录入装置的子单元示意性框图;
图8为本发明实施例提供的信息录入装置的另一子单元示意性框图;
图9为本发明实施例提供的信息录入装置的另一子单元示意性框图;
图10为本发明实施例提供的信息录入装置的另一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的信息录入方法的流程示意图。该信息录入方法应用于具有信息录入功能的终端设备中,例如台式电脑、笔记本电脑、平板电脑或手机等。
如图1所示,该方法包括步骤S110~S150。
S110、若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句。
若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句。文本信息即是用户所输入的需录入语音信息的一段文字,文本信息中包含至少一个文本语句,预设处理规则即是用于对文本信息进行切分处理的规则信息,文本语句即是从文本信息中切分得到的一个完整语句。
具体的,预设处理规则中包含一个或多个预设标点符号,通过将文本信息中的标点符号与预设标点符号进行匹配即可根据匹配结果将文本信息进行切分处理,以得到文本语句。
在一实施例中,如图2所示,步骤S110包括子步骤S111、S112、S113和S114。
S111、获取文本信息中所包含的一标点符号。
获取文本信息中所包含的一个标点符号,并对该标点符号进行判断。
S112、对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同。
对所获取的标点符号与预设处理规则中的预设标点符号进行匹配,以判断文本信息中的标点符号与预设标点符号是否相同。具体的,预设标点符号可以为一个或多个,将文本信息中的标点符号依次与预设标点符号进行匹配,若该标点符号与某一个预设标点符号相同,则匹配结果为该标点符号与预设标点符号相同;若该标点符号与所有预设标点符号均不相同,则匹配结果为该标点符号与预设标点符号不相同。
例如,预设处理规则中的预设标点符号为“,”、“;”、“。”以及“?”;则某一标点符号与四个预设标点符号中某一个预设标点符号相同,即可得到标点符号与预设标点符号相同的匹配结果。
S113、若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理。
若匹配结果为文本信息中的标点符号与预设标点符号相同,则需在此标点符号所处的位置对文本信息进行切分处理,具体的,可根据该标点符号在文本信息中所处的位置对文本信息进行切分处理。
例如,某一文本信息为“我是谁?我来自那里?”,根据预设处理规则需在第一个“?”及第二个“?”所处的位置对文本信息进行切分处理。
S114、若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
若匹配结果为文本信息中的标点符号与预设标点符号不相同,则无需在该标点符号所处的位置对文本信息进行切分处理,继续获取下一标点符号并进行并返回至S112以对该标点符号进行判断。
S120、根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息。
根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息,具体的,获取当前第一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息,可在用户终端的显示设备中对录入提示信息进行显示,用户通过用户终端的显示设备察看到录入提示信息,并完成在第一个待处理的文本语句中录入相应语音信息之后,则继续获取下一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息。
S130、若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息。
若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息。为对用户所录入的语音信息是否与相应文本语句相匹配进行判断,需通过将用户所录入的语音信息转换为第一拼音信息,语音转换模型即是用于将语音信息转换为第一拼音信息的模型,语音转换模型中具体包括声学模型和语音特征词典。
在一实施例中,如图3所示,步骤S130包括子步骤S131和S132。
S131、根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。
根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。具体的,用户所录入的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将音频信息与声学模型中所有的音素进行匹配,即可对音频信息中单个字符的音素进行切分,通过切分最终得到该音频信息中所包含的多个音素。
S132、根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,获取该语音信息中所有字符相对应的字符拼音即可实现将语音信息中所包含的所有音素转换为第一拼音信息。
S140、通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息。
通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息。预设文本转换模型即是用于将文本语句转换为第二拼音信息的模型,每一个汉字或数字的汉语读法均能够通拼音进行表示,文本转换模型中包含所有字符的拼音信息,通过将文本语句中所包含的汉字或数字与文本转换模型中的字符进行匹配,即可将文本语句转换为第二拼音信息。
在一实施例中,如图4所示,步骤S140包括子步骤S141和S142。
S141、通过预设文本转换模型获取文本语句中每一字符的拼音信息。
通过预设文本转换模型获取文本语句中每一字符的拼音信息。具体的,通过将文本语句中每一个汉字或数字与文本转换模型中的字符进行匹配,即可获取相应汉字或数字在文本转换模型中的拼音信息,也即是获取得到文本语句中每一字符的拼音信息。
例如,获取得到“里”的拼音信息为“lǐ”,“和”的拼音信息为“hé/hú/huó/huò”。
S142、对所得到的拼音信息进行组合以得到第二拼音信息。
根据每一字符在文本语句中的位置对所得到的字符拼音进行组合以得到第二拼音信。具体的,若某一个字符为多音字,则需将该字符的多种读音添加至该字符在文本语句中所处的位置。
S150、对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。将语音信息转换得到的第一拼音信息,与该语音信息相对应的文本语句转换得到的第二拼音信息是否相匹配进行判断,即可得到相应的判断结果。其中,若第一拼音信息与第二拼音信息相匹配,则表明语音信息与相应文本语句相匹配,该文本信息相对应的语音信息成功录入;若第一拼音信息与第二拼音信息不相匹配,则表明语音信息与相应文本语句不相匹配,该文本信息相对应的语音信息未成功录入。
在一实施例中,如图5所示,步骤S150包括子步骤S151、S152和S153。
S151、判断所述第一拼音信息与第二拼音信息是否相匹配。
判断所述第一拼音信息与第二拼音信息是否相匹配。具体的判断过程为,对第二拼音信息中每一字符的拼音信息是否包含第一拼音信息中相应字符的字符拼音进行判断,由于第二拼音信息中字符的拼音信息可能包含一种或多种读音,因此若第二拼音信息中所有字符的拼音信息均包含第一拼音信息中相应字符的字符拼音,即判断第一拼音信息与第二拼音信息相匹配;若第二拼音信息中存在某一字符的拼音信息不包含第一拼音信息中相应字符的字符拼音,则第一拼音信息对应的语音信息中存在录入错误的部分,即判断第一拼音信息与第二拼音信息不相匹配。
S152、若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息。
若判断结果为第一拼音信息与第二拼音信息相匹配,则向用户发出与该第一拼音信息相对应的语音信息录入完成的提示信息,也即是该第二拼音信息相对应的文本语句完成语音信息录入,继续获取文本下一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息。
S153、若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
若判断结果为第一拼音信息与第二拼音信息不相匹配,则向用户发出语音信息录入错误的提示信息。可在用户终端的显示设备中对语音信息录入错误的提示信息进行显示,用户接收到提示信息后,可对该语音信息进行再次录入。更具体的,还可在提示信息中添加第一拼音信息对应的语音信息中存在录入错误的部分,以更好地对用户出现错误的部分进行提示,提高语音信息的录入效率。
通过对文本信息进行切分得到文本语句,对用户所录入的语音信息进行转换并与文本语句转换得到的拼音信息是否匹配进行判断,能够及时检查所录入语音信息中的错误并提示用户,以确保所录入的语音信息与文本信息中对应的文本语句相匹配,从而大幅提高了语音信息录入的效率。
本发明实施例还提供一种信息录入装置,该信息录入装置用于执行前述信息录入方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的信息录入装置的示意性框图。该信息录入装置可以配置于台式电脑、笔记本电脑、平板电脑或手机等终端设备中。
如图6所示,信息录入装置100包括文本信息切分单元110、录入提示信息发送单元120、第一拼音信息获取单元130、第二拼音信息获取单元140和提示信息发送单元150。
文本信息切分单元110,用于若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句。
若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句。文本信息即是用户所输入的需录入语音信息的一段文字,文本信息中包含至少一个文本语句,预设处理规则即是用于对文本信息进行切分处理的规则信息,文本语句即是从文本信息中切分得到的一个完整语句。
具体的,预设处理规则中包含一个或多个预设标点符号,通过将文本信息中的标点符号与预设标点符号进行匹配即可根据匹配结果将文本信息进行切分处理,以得到文本语句。
其他发明实施例中,如图7所示,所述文本信息切分单元110包括子单元:第一符号获取单元111、符号匹配单元112、切分处理单元113和第二符号获取单元114。
第一符号获取单元111,用于获取文本信息中所包含的一标点符号。
获取文本信息中所包含的一个标点符号,并对该标点符号进行判断。
符号匹配单元112,用于对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同。
对所获取的标点符号与预设处理规则中的预设标点符号进行匹配,以判断文本信息中的标点符号与预设标点符号是否相同。具体的,预设标点符号可以为一个或多个,将文本信息中的标点符号依次与预设标点符号进行匹配,若该标点符号与某一个预设标点符号相同,则匹配结果为该标点符号与预设标点符号相同;若该标点符号与所有预设标点符号均不相同,则匹配结果为该标点符号与预设标点符号不相同。
切分处理单元113,用于若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理。
若匹配结果为文本信息中的标点符号与预设标点符号相同,则需在此标点符号所处的位置对文本信息进行切分处理,具体的,可根据该标点符号在文本信息中所处的位置对文本信息进行切分处理。
第二符号获取单元114,用于若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
若匹配结果为文本信息中的标点符号与预设标点符号不相同,则无需在该标点符号所处的位置对文本信息进行切分处理,继续获取下一标点符号并进行并返回至符号匹配单元112以对该标点符号进行判断。
录入提示信息发送单元120,用于根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息。
根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息,具体的,获取当前第一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息,可在用户终端的显示设备中对录入提示信息进行显示,用户通过用户终端的显示设备察看到录入提示信息,并完成在第一个待处理的文本语句中录入相应语音信息之后,则继续获取下一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息。
第一拼音信息获取单元130,用于若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息。
若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息。为对用户所录入的语音信息是否与相应文本语句相匹配进行判断,需通过将用户所录入的语音信息转换为第一拼音信息,语音转换模型即是用于将语音信息转换为第一拼音信息的模型,语音转换模型中具体包括声学模型和语音特征词典。
其他发明实施例中,如图8所示,所述第一拼音信息获取单元130包括子单元:音素获取单元131和音素匹配单元132。
音素获取单元131,用于根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。
根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。具体的,用户所录入的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将音频信息与声学模型中所有的音素进行匹配,即可对音频信息中单个字符的音素进行切分,通过切分最终得到该音频信息中所包含的多个音素。
音素匹配单元132,用于根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,获取该语音信息中所有字符相对应的字符拼音即可实现将语音信息中所包含的所有音素转换为第一拼音信息。
第二拼音信息获取单元140,用于通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息。
通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息。预设文本转换模型即是用于将文本语句转换为第二拼音信息的模型,每一个汉字或数字的汉语读法均能够通拼音进行表示,文本转换模型中包含所有字符的拼音信息,通过将文本语句中所包含的汉字或数字与文本转换模型中的字符进行匹配,即可将文本语句转换为第二拼音信息。
其他发明实施例中,如图9所示,所述第二拼音信息获取单元140包括子单元:文本语句转换单元141和拼音信息组合单元142。
文本语句转换单元141,用于通过预设文本转换模型获取文本语句中每一字符的拼音信息。
通过预设文本转换模型获取文本语句中每一字符的拼音信息。具体的,通过将文本语句中每一个汉字或数字与文本转换模型中的字符进行匹配,即可获取相应汉字或数字在文本转换模型中的拼音信息,也即是获取得到文本语句中每一字符的拼音信息。
拼音信息组合单元142,用于对所得到的拼音信息进行组合以得到第二拼音信息。
根据每一字符在文本语句中的位置对所得到的字符拼音进行组合以得到第二拼音信。具体的,若某一个字符为多音字,则需将该字符的多种读音添加至该字符在文本语句中所处的位置。
提示信息发送单元150,用于对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。将语音信息转换得到的第一拼音信息,与该语音信息相对应的文本语句转换得到的第二拼音信息是否相匹配进行判断,即可得到相应的判断结果。其中,若第一拼音信息与第二拼音信息相匹配,则表明语音信息与相应文本语句相匹配,该文本信息相对应的语音信息成功录入;若第一拼音信息与第二拼音信息不相匹配,则表明语音信息与相应文本语句不相匹配,该文本信息相对应的语音信息未成功录入。
其他发明实施例中,如图10所示,所述提示信息发送单元150包括子单元:判断单元151、第一提示信息发送单元152和第二提示信息发送单元153。
判断单元151,用于判断所述第一拼音信息与第二拼音信息是否相匹配。
判断所述第一拼音信息与第二拼音信息是否相匹配。具体的判断过程为,对第二拼音信息中每一字符的拼音信息是否包含第一拼音信息中相应字符的字符拼音进行判断,由于第二拼音信息中字符的拼音信息可能包含一种或多种读音,因此若第二拼音信息中所有字符的拼音信息均包含第一拼音信息中相应字符的字符拼音,即判断第一拼音信息与第二拼音信息相匹配;若第二拼音信息中存在某一字符的拼音信息不包含第一拼音信息中相应字符的字符拼音,则第一拼音信息对应的语音信息中存在录入错误的部分,即判断第一拼音信息与第二拼音信息不相匹配。
第一提示信息发送单元152,用于若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息。
若判断结果为第一拼音信息与第二拼音信息相匹配,则向用户发出与该第一拼音信息相对应的语音信息录入完成的提示信息,也即是该第二拼音信息相对应的文本语句完成语音信息录入,继续获取文本下一个待处理的文本语句并向用户发送在该文本语句中录入语音信息的录入提示信息。
第二提示信息发送单元153,用于若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
若判断结果为第一拼音信息与第二拼音信息不相匹配,则向用户发出语音信息录入错误的提示信息。可在用户终端的显示设备中对语音信息录入错误的提示信息进行显示,用户接收到提示信息后,可对该语音信息进行再次录入。更具体的,还可在提示信息中添加第一拼音信息对应的语音信息中存在录入错误的部分,以更好地对用户出现错误的部分进行提示,提高语音信息的录入效率。
通过对文本信息进行切分得到文本语句,对用户所录入的语音信息进行转换并与文本语句转换得到的拼音信息是否匹配进行判断,能够及时检查所录入语音信息中的错误并提示用户,以确保所录入的语音信息与文本信息中对应的文本语句相匹配,从而大幅提高了语音信息录入的效率。
上述信息录入装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行信息录入方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行信息录入方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
在一实施例中,处理器502在执行若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句的步骤时,执行如下操作:获取文本信息中所包含的一标点符号;对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同;若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理;若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
在一实施例中,处理器502在执行若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息的步骤时,执行如下操作:根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
在一实施例中,处理器502在执行通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息的步骤时,执行如下操作:通过预设文本转换模型获取文本语句中每一字符的拼音信息;对所得到的拼音信息进行组合以得到第二拼音信息。
在一实施例中,处理器502在执行对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息的步骤时,执行如下操作:判断所述第一拼音信息与第二拼音信息是否相匹配;若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息;若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息。
在一实施例中,所述若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句的步骤,包括:获取文本信息中所包含的一标点符号;对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同;若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理;若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
在一实施例中,所述若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息的步骤,包括:根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
在一实施例中,所述通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息的步骤,包括:通过预设文本转换模型获取文本语句中每一字符的拼音信息;对所得到的拼音信息进行组合以得到第二拼音信息。
在一实施例中,所述对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息的步骤,包括:判断所述第一拼音信息与第二拼音信息是否相匹配;若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息;若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种信息录入方法,其特征在于,包括:
若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;
根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;
若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;
通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;
对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息;
通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息还包括:通过预设文本转换模型获取文本语句中每一字符的拼音信息;对所得到的拼音信息进行组合以得到第二拼音信息;
其中,若所述第二拼音信息中的某一个字符为多音字,则将该字符的多种读音添加至该字符在文本语句中所处的位置;
所述对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息,包括:
判断所述第一拼音信息与第二拼音信息是否相匹配,包括:对所述第二拼音信息中每一字符的拼音信息是否包含所述第一拼音信息中相应字符的字符拼音进行判断;
若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息;
若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
2.根据权利要求1所述的信息录入方法,其特征在于,所述根据预设处理规则将文本信息进行切分处理以得到文本语句,包括:
获取文本信息中所包含的一标点符号;
对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同;
若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理;
若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
3.根据权利要求1所述的信息录入方法,其特征在于,所述通过预设语音转换模型将语音信息转换为第一拼音信息,包括:
根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;
根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
4.一种信息录入装置,其特征在于,包括:
文本信息切分单元,用于若接收到用户所输入的文本信息,根据预设处理规则将文本信息进行切分处理以得到文本语句;
录入提示信息发送单元,用于根据所述文本语句向用户发送录入提示信息以提醒用户在相应文本语句中录入语音信息;
第一拼音信息获取单元,用于若接收到用户所录入的语音信息,通过预设语音转换模型将语音信息转换为第一拼音信息;
第二拼音信息获取单元,用于通过预设文本转换模型将与所述语音信息相对应的文本语句转换为第二拼音信息;
提示信息发送单元,用于对第一拼音信息与第二拼音信息是否相匹配进行判断以根据判断结果向用户发出提示信息;
所述第二拼音信息获取单元包括子单元:文本语句转换单元和拼音信息组合单元;
文本语句转换单元:用于通过预设文本转换模型获取文本语句中每一字符的拼音信息;拼音信息组合单元,用于对所得到的拼音信息进行组合以得到第二拼音信息;
其中,若所述第二拼音信息中的某一个字符为多音字,则将该字符的多种读音添加至该字符在文本语句中所处的位置;
所述提示信息发送单元包括:判断单元,用于判断所述第一拼音信息与第二拼音信息是否相匹配,包括:对所述第二拼音信息中每一字符的拼音信息是否包含所述第一拼音信息中相应字符的字符拼音进行判断;第一提示信息发送单元,用于若判断结果为第一拼音信息与第二拼音信息相匹配,向用户发出语音信息录入完成的提示信息;第二提示信息发送单元,用于若判断结果为第一拼音信息与第二拼音信息不相匹配,向用户发出语音信息录入错误的提示信息。
5.根据权利要求4所述的信息录入装置,其特征在于,所述文本信息切分单元,包括:
第一符号获取单元,用于获取文本信息中所包含的一标点符号;
符号匹配单元,用于对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同;
切分处理单元,用于若匹配结果为文本信息中的标点符号与预设标点符号相同,根据该标点符号所处的位置对文本信息进行切分处理;
第二符号获取单元,用于若匹配结果为文本信息中的标点符号与预设标点符号不相同,获取所述文本信息中的下一标点符号并返回执行所述对所获取的标点符号与预设处理规则中的预设标点符号进行匹配以判断文本信息中的标点符号与预设标点符号是否相同的步骤。
6.根据权利要求4所述的信息录入装置,其特征在于,所述第一拼音信息获取单元,包括:
音素获取单元,用于根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;
音素匹配单元,用于根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的信息录入方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至3任一项所述的信息录入方法。
CN201811472779.1A 2018-12-04 2018-12-04 信息录入方法、装置、计算机设备及存储介质 Active CN109582775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811472779.1A CN109582775B (zh) 2018-12-04 2018-12-04 信息录入方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811472779.1A CN109582775B (zh) 2018-12-04 2018-12-04 信息录入方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109582775A CN109582775A (zh) 2019-04-05
CN109582775B true CN109582775B (zh) 2024-03-26

Family

ID=65927011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811472779.1A Active CN109582775B (zh) 2018-12-04 2018-12-04 信息录入方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109582775B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767217B (zh) * 2019-10-30 2022-04-12 爱驰汽车有限公司 音频分割方法、系统、电子设备和存储介质
CN110782869A (zh) * 2019-10-30 2020-02-11 标贝(北京)科技有限公司 语音合成方法、装置、系统和存储介质
CN113506550B (zh) * 2021-07-29 2022-07-05 北京花兰德科技咨询服务有限公司 一种人工智能阅读显示器及显示方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365925A (zh) * 2012-04-09 2013-10-23 高德软件有限公司 获取多音字拼音、基于拼音检索的方法及其相应装置
CN103578464A (zh) * 2013-10-18 2014-02-12 威盛电子股份有限公司 语言模型的建立方法、语音辨识方法及电子装置
CN103903615A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN106570180A (zh) * 2016-11-10 2017-04-19 北京百度网讯科技有限公司 基于人工智能的语音搜索方法及装置
CN107204184A (zh) * 2017-05-10 2017-09-26 平安科技(深圳)有限公司 语音识别方法及系统
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置
CN109036420A (zh) * 2018-07-23 2018-12-18 努比亚技术有限公司 一种语音识别控制方法、终端及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5198046B2 (ja) * 2007-12-07 2013-05-15 株式会社東芝 音声処理装置及びそのプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365925A (zh) * 2012-04-09 2013-10-23 高德软件有限公司 获取多音字拼音、基于拼音检索的方法及其相应装置
CN103578464A (zh) * 2013-10-18 2014-02-12 威盛电子股份有限公司 语言模型的建立方法、语音辨识方法及电子装置
CN103903615A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置
CN106570180A (zh) * 2016-11-10 2017-04-19 北京百度网讯科技有限公司 基于人工智能的语音搜索方法及装置
CN107204184A (zh) * 2017-05-10 2017-09-26 平安科技(深圳)有限公司 语音识别方法及系统
CN109036420A (zh) * 2018-07-23 2018-12-18 努比亚技术有限公司 一种语音识别控制方法、终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN109582775A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN107195295B (zh) 基于中英文混合词典的语音识别方法及装置
CN107301860B (zh) 基于中英文混合词典的语音识别方法及装置
CN107729313B (zh) 基于深度神经网络的多音字读音的判别方法和装置
US8831929B2 (en) Multi-mode input method editor
CN103714048B (zh) 用于校正文本的方法和系统
CN111523306A (zh) 文本的纠错方法、装置和系统
CN102156551B (zh) 一种字词输入的纠错方法及系统
WO2015176518A1 (zh) 一种回复信息推荐方法及装置
CN109582775B (zh) 信息录入方法、装置、计算机设备及存储介质
CN110335608B (zh) 声纹验证方法、装置、设备及存储介质
CN111209740A (zh) 文本模型训练方法、文本纠错方法、电子设备及存储介质
CN109461459A (zh) 语音评分方法、装置、计算机设备及存储介质
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
JP2001092484A (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
CN105786204A (zh) 信息处理方法和电子设备
JP2004053652A (ja) 発音判定システム、システム管理用サーバ及びプログラム
CN113436614A (zh) 语音识别方法、装置、设备、系统及存储介质
CN112527967A (zh) 文本匹配方法、装置、终端和存储介质
CN110929514B (zh) 文本校对方法、装置、计算机可读存储介质及电子设备
CN112559725A (zh) 文本匹配方法、装置、终端和存储介质
US20150161105A1 (en) Techniques for automatically selecting a natural language for configuring an input method editor at a computing device
CN109670040B (zh) 写作辅助方法、装置及存储介质、计算机设备
CN108897872B (zh) 对话处理方法、装置、计算机设备和存储介质
CN110895938B (zh) 语音校正系统及语音校正方法
CN115298736A (zh) 用于数据输入的语音识别和训练

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant