CN105808197B - 一种信息处理方法和电子设备 - Google Patents

一种信息处理方法和电子设备 Download PDF

Info

Publication number
CN105808197B
CN105808197B CN201410838464.XA CN201410838464A CN105808197B CN 105808197 B CN105808197 B CN 105808197B CN 201410838464 A CN201410838464 A CN 201410838464A CN 105808197 B CN105808197 B CN 105808197B
Authority
CN
China
Prior art keywords
information
modification
modification information
recognition result
matching condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410838464.XA
Other languages
English (en)
Other versions
CN105808197A (zh
Inventor
戴海生
过晓冰
王龙庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201410838464.XA priority Critical patent/CN105808197B/zh
Publication of CN105808197A publication Critical patent/CN105808197A/zh
Application granted granted Critical
Publication of CN105808197B publication Critical patent/CN105808197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供的一种信息处理方法,应用于具有语音识别模块的电子设备,该方法包括:接收输入语音信息;在依据预设的语音识别模型对该输入语音信息进行识别得到识别结果后,当该识别结果中的第一信息为需要修改的内容时,该第一信息为该识别结果中的至少一个字符,采用通过操作体输入的方式对该识别结果中的第一信息进行修改,该用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。

Description

一种信息处理方法和电子设备
技术领域
本发明属于电子设备领域,尤其涉及一种信息处理方法和电子设备。
背景技术
随着电子技术的发展,各种的电子设备中添加了语音输入功能。由于语音输入快速高效,广泛应用于各种电子设备中。
现有的语音识别方法中,一旦发生语音识别错误,需要对识别结果进行修改,一般是将该识别结果忽略或者删除,重新输入新的语音信息并进行识别,直至识别得到的结果与用户目输入的内容一致,完成语音输入过程。
但是,该修正语音识别错误的过程繁琐,导致语音输入的整体速度较慢,导致信息输入速度较低。
发明内容
有鉴于此,本发明的目的在于提供一种信息处理方法,能够解决对当语音识别出现错误时,只能重新输入新的语音,导致语音输入的整体速度较慢的问题。
一种信息处理方法,应用于具有语音识别模块的电子设备,所述方法包括:
接收输入语音信息;
依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符。
上述的方法,优选的,所述依据所述修改信息对所述识别结果中的第一信息进行修改之后,还包括:
当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
上述的方法,优选的,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
获取与所述修改信息对应的标准语音信息;
将所述标准语音信息与所述第一信息进行比对;
当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
上述的方法,优选的,所述依据所述修改信息对所述识别结果中的第一信息进行修改之后,判断所述第一信息与所述修改信息是否满足预设匹配条件之前还包括:
判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则判断所述第一信息与所述修改信息是否满足预设匹配条件。
上述的方法,优选的,所述修改信息中任一文字对应的单字标准语音信息为至少两个时,则将所述标准语音信息与所述第一信息进行比对包括:
分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;
依据所述至少两个匹配值,得到最高匹配值;
将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。
上述的方法,优选的,当所述修改信息为拼音时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:
接收所述修改信息;
获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;
将所述识别结果中的第一信息替换为所述目标信息。
上述的方法,优选的,当所述修改信息为文字时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:
接收所述修改信息;
将所述识别结果中的第一信息替换为所述修改信息。
上述的方法,优选的,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
依据预设的分类规则,判断所述修改信息所属类型;
当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;
当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
上述的方法,优选的,所述依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
获取与所述拼音对应的至少一个标准语音信息;
将所述与所述拼音对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;
当比对结果表明存在一匹配值大于第三预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
否则,所述第一信息与所述修改信息不满足预设匹配条件。
上述的方法,优选的,所述依据第二类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括
获取与所述文字对应的至少一个标准语音信息;
将所述与所述文字对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;
当比对结果表明存在一匹配值大于第四预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
否则,所述第一信息与所述修改信息不满足预设匹配条件。
一种电子设备,包括:
接收模块,用于接收输入语音信息;
识别模块,用于依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
修改模块,用于接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符。
上述的电子设备,优选的,还包括:
第一判断模块,用于判断所述第一信息与所述修改信息是否满足预设匹配条件;
训练模块,用于当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
上述的电子设备,优选的,所述第一判断模块包括:
第一获取单元,用于获取与所述修改信息对应的标准语音信息;
比对单元,用于将所述标准语音信息与所述第一信息进行比对;当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
上述的电子设备,优选的,还包括:
第二判断模块,用于判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则触发第一判断模块。
上述的电子设备,优选的,所述比对单元包括:
组合子单元,用于分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
比对子单元,用于依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;依据所述至少两个匹配值,得到最高匹配值;将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。
上述的电子设备,优选的,当所述修改信息为拼音时,所述修改模块包括:
第一接收单元,用于接收所述修改信息;
第二获取单元,用于获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
选择单元,用于接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;将所述识别结果中的第一信息替换为所述目标信息。
上述的电子设备,优选的,当所述修改信息为文字时,所述修改模块包括:
第二接收单元,用于接收所述修改信息;
替换单元,用于将所述识别结果中的第一信息替换为所述修改信息。
上述的电子设备,优选的,第一判断模块包括:
分类单元,用于依据预设的分类规则,判断所述修改信息所属类型;
第一判断单元,用于当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;
第二判断单元,用于当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
本申请提供的一种信息处理方法,应用于具有语音识别模块的电子设备,该方法包括:接收输入语音信息;在依据预设的语音识别模型对该输入语音信息进行识别得到识别结果后,当该识别结果中的第一信息为需要修改的内容时,该第一信息为该识别结果中的至少一个字符,采用通过操作体输入的方式对该识别结果中的第一信息进行修改,该用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种信息处理方法实施例1的流程图;
图2是本申请提供的一种信息处理方法实施例2的流程图;
图3是本申请提供的一种信息处理方法实施例3的流程图;
图4是本申请提供的一种信息处理方法实施例4的流程图;
图5是本申请提供的一种信息处理方法实施例5的流程图;
图6是本申请提供的一种信息处理方法实施例6的流程图;
图7是本申请提供的一种信息处理方法实施例6的具体场景示意图;
图8是本申请提供的一种信息处理方法实施例7的流程图;
图9是本申请提供的一种信息处理方法实施例8的流程图;
图10是本申请提供的一种电子设备实施例1的结构示意图;
图11是本申请提供的一种电子设备实施例2的结构示意图;
图12是本申请提供的一种电子设备实施例3的结构示意图;
图13是本申请提供的一种电子设备实施例4的结构示意图;
图14是本申请提供的一种电子设备实施例5的结构示意图;
图15是本申请提供的一种电子设备实施例6的结构示意图;
图16是本申请提供的一种电子设备实施例7的结构示意图;
图17是本申请提供的一种电子设备实施例8的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本申请提供的一种信息处理方法实施例1的流程图,该方法应用于电子设备中,该电子设备具体可以为台式机、笔记本、平板电脑、手机、智能电视、智能手表、穿戴式设备等电子设备,该电子设备设置有语音识别功能。
其中,该方法通过以下步骤实现:
步骤S101:接收输入语音信息;
其中,当用户想要通过语音方式输入待输入内容时,用户发出该待输入内容对应的语音。
其中,该输入语音信息可以包括:数字对应语音、文字对应语音等。
步骤S102:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
其中,该电子设备中预设语音识别模型,该语音识别模型对接收到的输入语音信息进行识别,得到识别结果。
其中,语音识别模型根据该输入语音信息中的发音,识别得到至少一个字符组成的识别结果。
具体的,该字符可以包括文字字符和/或数字字符等,本实施例中队识别结果中包含的内容不做限制。
步骤S103:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符。
其中,语音识别模型根据该输入语音信息进行识别过程中,由于用户发音错误,或者该语音识别模型的精度较低等问题,导致该语音识别模型对该输入语音信息识别的结果出现错误。
因此,通过操作体输入修改信息,该操作体与电子设备的笔输入方式对应。
具体实施中,还有一种情况,语音识别模型对用户发出的语音识别得到的识别结果为正确的识别结果,但是用户想要对该识别结果中的部分内容进行修改,即进行语义的修改,此时,也可通过该操作体输入修改信息,并采用该修改信息对该识别结果中的第一信息进行修改。
具体的,当该电子设备为触控屏幕时,则该笔输入方式为通过该触控屏幕中的触控区域输入字符,该输入字符的方式可以为手写输入、拼音输入或者五笔输入等方式;当该电子设备中包含实体按键时,则该笔输入方式为通过该实体按键输入字符,该输入字符的方式可以采用拼音输入或五笔输入等方式。
需要说明的是,在对识别结果中的第一信息进行修改时,可以首先执行删除操作,将该第一信息删除,然后输入该修改信息;或者,还可选定该第一信息,直接输入修改信息替换该第一信息,修改方式本实施例中不做限制。
需要说明的是,电子设备的语音识别模型对用户的输入语音信息进行初步自动识别之后,得到的识别结果并不完全正确时,用户可通过操作体对该识别结果中出现错误的部分进行修改,保证最终得到的结果满足用户输入的目标内容。
作为一个具体实现方式,用户发出一段语音后,电子设备接收到该语音后,对该语音进行识别,识别结果为“今天天机不错”,但是,用户发出的语音对应的文字应该是“今天天气不错”,因此,对该识别结果中的“天机”词语进行修改,修改为“天气”
作为另一个具体实现方式,用户发出一段语音后,电子设备接收到该语音后,对该语音进行识别,识别结果为“今天太阳不错”,该识别结果与用户发出的语音匹配,但是用户还可根据自己的需要对识别结果中的“太阳”词语进行修改,修改为“天气”。
还有一种具体实现方式,用户发出一段语音后,电子设备接收到该语音后,对该语音进行识别,识别结果为“今天天机不错”,而用户发出的语音对应的文字应该是“今天天气不错”,但是用户还可根据自己的需要对识别结果中的“太阳”词语进行修改,则,可接收用户通过操作体输入的词组“太阳”,并将识别结果中的“天机”修改为“太阳”。
综上,本实施例提供的一种信息处理方法中,包括:接收输入语音信息;在依据预设的语音识别模型对该输入语音信息进行识别得到识别结果后,当该识别结果中的第一信息为需要修改的内容时,该第一信息为该识别结果中的至少一个字符,通过操作体输入的方式对该识别结果中的第一信息进行修改,采用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。
如图2所示,为本申请提供的一种信息处理方法实施例2的流程图,该方法通过以下步骤实现:
步骤S201:接收输入语音信息;
步骤S202:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
步骤S203:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
其中,步骤S201-203与实施例1中的步骤S101-103一致,本实施例不再赘述。
步骤S204:当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
需要说明的是,由于该语音识别模型的精度较低的问题或者用户发音的问题,可能会导致语音识别模型对输入语音信息进行识别,得到的识别结果中有错误部分,该错误部分具体是指该第一信息,则需要通过该操作体输入该修改信息对该第一信息进行修改。
所以,依据该修改后的识别结果以及该输入语音信息对该语音识别模型进行训练,提高语音识别模型与发音用户的发音习惯的适应程度,提高了修改后的识别结果与该输入语音信息的匹配度,以使得用户再次发出该输入语音信息时,能够快速准确识别得到与该修改后识别结果对应的识别结果,无需再次修改。
其中,由于该修改信息的修改方式包括:发音的修改以及语义的修改。
具体的,该发音的修改是针对语音识别模型的精度较低或者用户发音不准确导致的识别错误问题;该语义的修改是指用户根据自己的判断或者需求,对识别结果中的部分内容进行修改,该修改前后的两个词语之间发音并无关联。
需要说明的是,由于语义的修改中,修改前后的两个词语之间发音并无关联,则该根据该语义的修改的情况中修改后的识别结果和输入语音信息之间并匹配,所以,采用该修改后的识别结果和输入语音信息对语音识别模型进行训练会导致语音识别模型的精度更低。而该发音的修改中,修改后的词语是对识别结果中的识别错误词语(即第一信息)进行的修改,该修改后的识别结果与该输入语音信息更匹配,据此对语音识别模型进行训练则能够提高该语音识别模型的精度。
所以,当第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和该输入语音信息训练语音识别模型,提高了该语音识别模型对该输入语音信息识别的准确度。
综上,本实施例提供的一种信息处理方法中,还包括:当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型,提高了修改后的识别结果与该输入语音信息的匹配度,以使得用户再次发出该输入语音信息时,能够快速准确识别得到与该修改后识别结果对应的识别结果,无需再次修改。
如图3所示,为本申请提供的一种信息处理方法实施例3的流程图,该方法通过以下步骤实现:
步骤S301:接收输入语音信息;
步骤S302:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
步骤S303:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
其中,步骤S301-303与实施例2中的步骤S201-203一致,本实施例不再赘述。
步骤S304:获取与所述修改信息对应的标准语音信息;
其中,对该第一信息和修改信息是否匹配的判断,基于语音信息进行判断。
具体实施中,电子设备中可以预设标准语音库,其中存储有大量单字、词语的语音信息。
具体的,从预设的标准语音库中获取该修改信息对应的标准语音信息。
需要说明的是,该修改信息为单字或者词语时,可直接从该标准语音库中查找对应的标准语音信息,并基于该标准语音信息进行后续步骤;当该修改信息为单字或者词语的组合时,可以从该标准语音信息库中查找到相应的标准语音信息后,依据该修改信息中的先后顺序,将各个标准语音信息组合,并基于该组合后的语音信息进行后续步骤;当该修改信息为单字或者词语的组合时,可以从该标准语音信息库中查找到相应的标准语音信息后,依据该修改信息中的先后顺序,依次基于各个标准语音信息进行后续步骤。
步骤S305:将所述标准语音信息与所述第一信息进行比对;
其中,将该步骤S304中得到的标准语音信息与该第一信息进行比对匹配,其本质上是将该标准语音信息与该第一信息对应的语音信息进行比对。
具体实施中,先基于该预设的标准语音库中,获取该第一信息对应的标准语音信息,然后,将该第一信息对应的标准语音信息与该修改信息对应的标准语音信息进行比对,得到二者的匹配值。
其中,第一预设阈值表示该第一信息与该修改信息的标准语音信息对应的为发音相近字符的最低匹配值。
具体的,当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,该第一信息与该修改信息为发音相近字符,则所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,该第一信息与该修改信息为发音不相近字符,则所述第一信息与所述修改信息不满足预设匹配条件。
需要说明的是,当判断该第一信息与该修改信息为发音相近字符,则该通过操作体对识别结果进行修改是由于对输入语音信息进行识别得到的识别结果不完全正确导致的,而不是用户进行的语义修改。
步骤S306:当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
其中,步骤S306与实施例2中的步骤S204一致,本实施例不再赘述。
综上,本实施例提供的一种信息处理方法中,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:获取与所述修改信息对应的标准语音信息;将所述标准语音信息与所述第一信息进行比对;当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。采用该方法,将该修改信息对应的标准语音信息与该第一信息进行比对,并基于比对结果确定该第一信息与该修改信息满足预设匹配条件时,则该第一信息与该修改信息为发音相近字符,则该通过操作体对识别结果进行修改是由于对输入语音信息进行识别得到的识别结果不完全正确导致的,而不是用户进行的语义修改,采用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。
如图4所示,为本申请提供的一种信息处理方法实施例4的流程图,该方法通过以下步骤实现:
步骤S401:接收输入语音信息;
步骤S402:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
步骤S403:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
其中,步骤S401-403与实施例2中的步骤S201-203一致,本实施例不再赘述。
步骤S404:判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
需要说明的是,语音识别模型对输入语音信息进行识别过程中,依据匹配的程度,从高到低依次匹配得到多个匹配结果,该具有最高匹配值的匹配结果作为识别结果。
其中,该匹配值表示了该识别结果与该语音识别模型之间的匹配程度。
其中,该第二预设阈值用于区分该识别结果与该语音识别模型匹配程度的值。
具体的,当该识别结果与该语音识别模型的匹配值大于该第二预设阈值时,则该识别结果与该语音识别模型匹配值较高,即该识别结果与该输入语音信息的匹配度较高。
其中,当该识别结果和输入语音信息匹配度较高时,采用该识别结果对语音识别模型进行训练,能够提高该语音识别模型的准确度;而当该识别结果和输入语音信息匹配度较低时,采用该识别结果对语音识别模型进行训练,会导致该语音识别模型的准确度降低。
因此,当该识别结果与该语音识别模型匹配值较高时,该识别结果与该输入语音信息匹配度较高,依据该识别结果进行后续的修改,并基于修改后的识别结果和输入语音信息训练该语音识别模型。
步骤S405:当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则判断所述第一信息与所述修改信息是否满足预设匹配条件;
步骤S406:当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
其中,步骤S405-406与实施例2中的步骤S204一致,本实施例不再赘述。
综上,本实施例提供的一种信息处理方法中,所述依据所述修改信息对所述识别结果中的第一信息进行修改之后,判断所述第一信息与所述修改信息是否满足预设匹配条件之前还包括:判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则判断所述第一信息与所述修改信息是否满足预设匹配条件。依据该识别结果进行后续的修改,并基于修改后的识别结果和输入语音信息训练该语音识别模型,采用该识别结果对语音识别模型进行训练,能够提高该语音识别模型的准确度。
其中,所述修改信息中任一文字对应的单字标准语音信息为至少两个,即,该修改信息中存在多音字情况。
如图5所示,为本申请提供的一种信息处理方法实施例5的流程图,该方法通过以下步骤实现:
步骤S501:接收输入语音信息;
步骤S502:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
步骤S503:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
其中,步骤S501-503与实施例3中的步骤S301-303一致,本实施例不再赘述。
步骤S504:获取与所述修改信息对应的标准语音信息;
其中,从电子设备中预设的标准语音库中,检索得到与该修改信息对应的标准语音信息。
需要说明的是,该获取的与该标准语音信息是以单字为基准获取的,当该修改信息中任意一个文字对应的单字标准信息为至少两个,即该单字为多音字时,则对应获取该至少两个单字标准信息。
步骤S505:分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
具体实施中,当修改的为单字时,则从标准语音库中获取该单字的多个单字标准语音信息;当修改的为词语时,则从标准语音库中获取该多音字的多个单字标准语音信息以及该词语中剩余单字的单字标准语音信息,将该多音字和该该词语中剩余单字的单字标准语音信息组合,得到标准语音信息。
例如,当识别得到“笑对文稿”的识别结果,需要对该“笑”进行修改,修改为“校”。单字“校”有两个读音“jiao”(四声)和“xiao”(四声),则当该修改信息为“校”时,从标准语音库中获取“校”的单字标准语音“jiao”和“xiao”。
例如,当识别得到“笑对文稿”的识别结果,当对该“笑对”修改为“校对”时,由于单字“校”有两个读音“jiao”(四声)和“xiao”(四声),则当该修改信息为“校对”时,从标准语音库中分别获取“校”和“对”的单字标准语音“jiao”、“xiao”和“dui”。将这两个单字的标准语音组合,得到词语的标准语音信息“jiaodui”和“xiaodui”。
步骤S506:依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;
其中,将该步骤S504中得到的标准语音信息与该第一信息进行比对匹配,其本质上是将该标准语音信息与该第一信息对应的语音信息进行比对。
具体的,将该包含有多音字中一个读音的标准语音信息与该第一信息比对,生成与该多音字读音个数相同的匹配值。
例如,单字“校”有两个读音“jiao”(四声)和“xiao”(四声),则针对该“校”所对应的2个标准语音信息,与该第一信息进行比对匹配,得到两个匹配值。
步骤S507:依据所述至少两个匹配值,得到最高匹配值,将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值;
其中,由于用户发出的语音信息出现错误,导致语音识别模型的识别结果出现错误,则需要语音识别模型针对用户的发音规则进行自适应调整,所以,即使用户发音错误,当得到正确的修改信息后,基于该修改信息对语音识别模型进行自适应训练,以提高语音识别模型对用户的发音习惯的匹配度。
因此,在得到多个标准语音信息后,从中确定正确的标准语音信息,并基于该正确的标准语音信息进行后续的训练步骤,而该正确的标准语音信息与该第一信息的匹配值最高。
如上述例子中,其中一个标准语音信息“jiaodui”匹配值较大,而另一个标准语音信息“xiaodui”匹配值较小,则取该匹配值较大的“jiaodui”为该标准语音信息与所述第一信息的匹配值。
具体的,当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
步骤S508:当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
其中,步骤S508与实施例3中的步骤S306一致,本实施例不再赘述。
综上,本实施例提供的一种信息处理方法中,所述修改信息中任一文字对应的单字标准语音信息为至少两个时,则将所述标准语音信息与所述第一信息进行比对包括:分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;依据所述至少两个匹配值,得到最高匹配值;将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。采用该方法,当修改信息中的文字出现多音字的情况时,基于多音字的各个读音实现与第一信息的比对,并基于最高的匹配值确定正确的读音,以及修改后的识别结果和所述输入语音信息训练所述语音识别模型,提高了修改后的识别结果与该输入语音信息的匹配度,以使得用户再次发出该输入语音信息时,能够快速准确识别得到与该修改后识别结果对应的识别结果,无需再次修改。
其中,该修改信息可以采用拼音方式进行输入。
如图6所示,为本申请提供的一种信息处理方法实施例6的流程图,该方法通过以下步骤实现:
步骤S601:接收输入语音信息;
步骤S602:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
其中,步骤S601-602与实施例1中的步骤S101-102一致,本实施例不再赘述。
步骤S603:接收修改信息;
其中,该修改信息为通过拼音方式进行输入。
需要说明的是,该拼音可以采用全拼或者智能拼音,本实施例中不对拼音形式进行限制。
例如,该修改信息为“勋位”时,由于用户忘记该词语具体怎么写,则用户直接输入拼音“xunwei”。
需要说明的是,该输入拼音的结果为该拼音在该识别结果显示位置处展示。
步骤S604:获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
其中,由于该修改信息为拼音,而该拼音可能对应多个候选项,每个候选项中都对应至少一个文字。
如图7所示的具体场景示意图中,识别结果“授予司令寻味”在显示区域701中进行展示,其中,“寻味”错误,当用户输入拼音“xunwei”时,产生的候选项可以为“逊位”、“勋位”和“寻味”等多个,其中该拼音“xunwei”在字符区域702显示,该候选项在与该字符区域702相对于的候选项区域703进行展示。
步骤S605:接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;
其中,该电子设备中的预设词库,能够根据该输入的拼音自动检索与该拼音对应的字符,并将检索到的字符作为候选项显示,以供用户选择。
其中,当该修改信息的拼音对应的多个候选项在电子设备中显示后,用户可根据实际情况从中选择一个候选项作为目标信息,电子设备接收依据该选择确认动作生成的确认信息。
具体的,基于该确认信息,可确定目标信息。
步骤S606:将所述识别结果中的第一信息替换为所述目标信息。
其中,由于该识别结果中的第一信息为识别得到的错误信息,则将该正确的目标信息替换该第一信息,最终得到正确的识别结果。
例如,将该识别结果“授予司令寻味”中的“寻味”替换为“勋位”,最终得到正确的识别结果“授予司令勋位”。
综上,本实施例提供的一种信息处理方法中,当所述修改信息为拼音时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:接收所述修改信息;获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;将所述识别结果中的第一信息替换为所述目标信息。采用该方法,通过拼音方式输入修改信息,并基于该输入的拼音生成的候选项中选择目标信息,并将该目标信息替换识别结果中的第一信息,当用户不能写出该修改信息时,通过拼音方式从中选择自动生成的候选项,提示用户字符的写法,提高了输入修改信息的速度。
其中,该修改信息可以采用文字方式进行输入。
如图8所示,为本申请提供的一种信息处理方法实施例7的流程图,该方法通过以下步骤实现:
步骤S801:接收输入语音信息;
步骤S802:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
其中,步骤S801-802与实施例1中的步骤S101-102一致,本实施例不再赘述。
步骤S803:接收修改信息;
其中,该修改信息为文字,即,用户直接输入文字的修改信息。
具体的,当该电子设备为触控屏幕时,则该文字信息的输入方式为通过该触控屏幕中的触控区域输入字符,该输入字符的方式可以为手写输入、拼音输入或者五笔输入等方式;当该电子设备中包含实体按键时,则该文字信息的输入方式为通过该实体按键输入字符,该输入字符的方式可以采用拼音输入或五笔输入等方式。
需要说明的是,该输入文字的结果为该文字在该识别结果显示位置处展示,当该文字以拼音方式输入时,该拼音只是在输入法对应的输入区域显示,在该识别结果显示区域中不显示。
步骤S804:将所述识别结果中的第一信息替换为所述修改信息。
其中,由于该识别结果中的第一信息为识别得到的错误信息,则将该正确的修改信息替换该第一信息,最终得到正确的识别结果。
综上,本实施例提供的一种信息处理方法中,当所述修改信息为文字时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:接收所述修改信息;将所述识别结果中的第一信息替换为所述修改信息。采用该方法,通过文字方式输入修改信息,并将该文字形式的修改信息直接替换识别结果中的第一信息,提高了输入修改信息的速度。
如图9所示,为本申请提供的一种信息处理方法实施例8的流程图,该方法通过以下步骤实现:
步骤S901:接收输入语音信息;
步骤S902:依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
步骤S903:接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
其中,步骤S901-903与实施例2中的步骤S201-203一致,本实施例不再赘述。
步骤S904:依据预设的分类规则,判断所述修改信息所属类型;
其中,当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
具体的,所述依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:获取与所述拼音对应的至少一个标准语音信息;将所述与所述拼音对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;当比对结果表明存在一匹配值大于第三预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;否则,所述第一信息与所述修改信息不满足预设匹配条件。
其中,当该拼音对应的字符为多音字时,则对包含该字符对应的多个发音的标准语音信息分别于该第一信息进行比对,生成多个匹配值,其中匹配值大于该第三预设阈值时,则该修改信息为对该识别信息中识别错误的部分进行的修改。
需要说明的是,后续步骤中基于该匹配值最大的标准语音信息对该语音识别模型进行训练。
具体的,所述依据第二类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:获取与所述文字对应的至少一个标准语音信息;将所述与所述文字对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;当比对结果表明存在一匹配值大于第四预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;否则,所述第一信息与所述修改信息不满足预设匹配条件。
其中,当该文字中的某个字符为多音字时,则对包含该字符对应的多个发音的标准语音信息分别于该第一信息进行比对,生成多个匹配值,其中匹配值大于该第四预设阈值时,则该修改信息为对该识别信息中识别错误的部分进行的修改。
需要说明的是,后续步骤中基于该匹配值最大的标准语音信息对该语音识别模型进行训练。
需要说明的是,数字也属于该文字所属的第二类型。
具体实施中,数字中如“一”平时具有两种发音形式“yi”和“yao”(同幺),则识别123的发音时,可能识别得到的为“幺二三”,则对该“幺”修改为“一”,或者,修改整体为阿拉伯计数法“123”。
步骤S905:当基于所属类型判断所述修改信息与所述第一信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
其中,步骤S905与实施例2中的步骤S204一致,本实施例不再赘述。
综上,本实施例提供的一种信息处理方法中,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:依据预设的分类规则,判断所述修改信息所属类型;当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。采用该方法,基于修改信息所属的不同类型,进行不同的满足预设匹配条件的判断,能够结合多个情况对输入信息进行判断,灵活度高。
与上述本申请提供的一种信息处理方法实施例相对应的,本申请中还提供了一种应用该信息处理方法的电子设备的实施例。
如图10所示,为本申请提供的一种电子设备实施例1的结构示意图,该电子设备具体可以为台式机、笔记本、平板电脑、手机、智能电视、智能手表、穿戴式设备等电子设备,该电子设备设置有语音识别功能。
其中,该电子设备由以下结构组成:接收模块1001、识别模块1002和修改模块1003;
其中,接收模块1001,用于接收输入语音信息;
其中,识别模块1002,用于依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
其中,修改模块1003,用于接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符。
综上,本实施例提供的一种电子设备中,接收输入语音信息;在依据预设的语音识别模型对该输入语音信息进行识别得到识别结果后,当该识别结果中的第一信息为需要修改的内容时,该第一信息为该识别结果中的至少一个字符,通过操作体输入的方式对该识别结果中的第一信息进行修改,采用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。
如图11所示,为本申请提供的一种电子设备实施例2的结构示意图,该电子设备由以下结构组成:接收模块1101、识别模块1102、修改模块1103、第一判断模块1104和训练模块1105;
其中,接收模块1101、识别模块1102、修改模块1103的结构功能与实施例1中的相应结构一致,本实施例不做赘述。
其中,第一判断模块1104,用于判断所述第一信息与所述修改信息是否满足预设匹配条件;
其中,训练模块1105,用于当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型。
综上,本实施例提供的一种电子设备中,当第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型,提高了修改后的识别结果与该输入语音信息的匹配度,以使得用户再次发出该输入语音信息时,能够快速准确识别得到与该修改后识别结果对应的识别结果,无需再次修改。
如图12所示,为本申请提供的一种电子设备实施例3的结构示意图,该电子设备由以下结构组成:接收模块1201、识别模块1202、修改模块1203、第一判断模块1204和训练模块1205;
其中,第一判断模块1204包括:第一获取单元1206和比对单元1207。
其中,接收模块1201、识别模块1202、修改模块1203和训练模块1205的结构功能与实施例2中的相应结构一致,本实施例不做赘述。
其中,第一获取单元1206,用于获取与所述修改信息对应的标准语音信息;
其中,比对单元1207,用于将所述标准语音信息与所述第一信息进行比对;当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
综上,本实施例提供的一种电子设备中,将该修改信息对应的标准语音信息与该第一信息进行比对,并基于比对结果确定该第一信息与该修改信息满足预设匹配条件时,则该第一信息与该修改信息为发音相近字符,则该通过操作体对识别结果进行修改是由于对输入语音信息进行识别得到的识别结果不完全正确导致的,而不是用户进行的语义修改,采用操作体输入的方式对识别结果中的第一信息进行修改,只需对目的修改的部分进行修改,而无需用户再次输入语音信息即可得到目的结果,操作过程简单,提高了信息输入的整体速度。
如图13所示,为本申请提供的一种电子设备实施例4的结构示意图,该电子设备由以下结构组成:接收模块1301、识别模块1302、修改模块1303、第二判断模块1304、第一判断模块1305和训练模块1306;
其中,接收模块1301、识别模块1302、修改模块1303、第一判断模块1305和训练模块1306的结构功能与实施例2中的相应结构一致,本实施例不做赘述。
其中,第二判断模块1304,用于判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则触发第一判断模块。
综上,本实施例提供的一种电子设备中,还包括:第二判断模块,应用判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则触发第一判断模块判断所述第一信息与所述修改信息是否满足预设匹配条件。依据该识别结果进行后续的修改,并基于修改后的识别结果和输入语音信息训练该语音识别模型,采用该识别结果对语音识别模型进行训练,能够提高该语音识别模型的准确度。
如图14所示,为本申请提供的一种电子设备实施例5中比对单元的结构示意图,该电子设备由以下结构组成:接收模块、识别模块、修改模块、第一判断模块和训练模块;
其中,第一判断模块包括:第一获取单元和比对单元;该比对单元包括:组合子单元1401和比对子单元1402。
其中,接收模块、识别模块、修改模块、第一获取单元和训练模块的结构功能与实施例3中的相应结构一致,本实施例不做赘述。
其中,组合子单元1401,用于分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
其中,比对子单元1402,用于依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;依据所述至少两个匹配值,得到最高匹配值;将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。
综上,本实施例提供的一种电子设备中,当修改信息中的文字出现多音字的情况时,基于多音字的各个读音实现与第一信息的比对,并基于最高的匹配值确定正确的读音,以及修改后的识别结果和所述输入语音信息训练所述语音识别模型,提高了修改后的识别结果与该输入语音信息的匹配度,以使得用户再次发出该输入语音信息时,能够快速准确识别得到与该修改后识别结果对应的识别结果,无需再次修改。
其中,该修改信息可以采用拼音方式进行输入。
如图15所示,为本申请提供的一种电子设备实施例6的结构示意图,该电子设备由以下结构组成:接收模块1501、识别模块1502和修改模块1503;
其中,修改模块1503包括:第一接收单元1504、第二获取单元1505和选择单元1506。
其中,接收模块1501、识别模块1502的结构功能与实施例1中的相应结构一致,本实施例不做赘述。
其中,第一接收单元1504,用于接收所述修改信息;
其中,第二获取单元1505,用于获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
其中,选择单元1506,用于接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;将所述识别结果中的第一信息替换为所述目标信息。
综上,本实施例提供的一种电子设备中,通过拼音方式输入修改信息,并基于该输入的拼音生成的候选项中选择目标信息,并将该目标信息替换识别结果中的第一信息,当用户不能写出该修改信息时,通过拼音方式从中选择自动生成的候选项,提示用户字符的写法,提高了输入修改信息的速度。
其中,该修改信息可以采用文字方式进行输入。
如图16所示,为本申请提供的一种电子设备实施例7的结构示意图,该电子设备由以下结构组成:接收模块1601、识别模块1602和修改模块1603;
其中,修改模块1603包括:第二接收单元1604和替换单元1605。
其中,接收模块1601、识别模块1602的结构功能与实施例1中的相应结构一致,本实施例不做赘述。
其中,第二接收单元1604,用于接收所述修改信息;
其中,替换单元1605,用于将所述识别结果中的第一信息替换为所述修改信息。
综上,本实施例提供的一种电子设备中,通过文字方式输入修改信息,并将该文字形式的修改信息直接替换识别结果中的第一信息,提高了输入修改信息的速度。
如图17所示,为本申请提供的一种电子设备实施例8的结构示意图,该电子设备由以下结构组成:接收模块1701、识别模块1702、修改模块1703、第一判断模块1704和训练模块1705;
其中,第一判断模块1704包括:分类单元1706、第一判断单元1707和第二判断单元1708。
其中,接收模块1701、识别模块1702、修改模块1703和训练模块1705的结构功能与实施例2中的相应结构一致,本实施例不做赘述。
其中,分类单元1706,用于依据预设的分类规则,判断所述修改信息所属类型;
其中,第一判断单元1707,用于当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;
其中,第二判断单元1708,用于当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
具体的,所述依据第一类型的匹配条件,第一判断单元1707具体用于:获取与所述拼音对应的至少一个标准语音信息;将所述与所述拼音对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;当比对结果表明存在一匹配值大于第三预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;否则,所述第一信息与所述修改信息不满足预设匹配条件。
具体的,所述依据第二类型的匹配条件,第二判断单元1708具体用于:获取与所述文字对应的至少一个标准语音信息;将所述与所述文字对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;当比对结果表明存在一匹配值大于第四预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;否则,所述第一信息与所述修改信息不满足预设匹配条件。
综上,本实施例提供的一种电子设备中,基于修改信息所属的不同类型,进行不同的满足预设匹配条件的判断,能够结合多个情况对输入信息进行判断,灵活度高。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种信息处理方法和电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种信息处理方法,其特征在于,应用于具有语音识别模块的电子设备,所述方法包括:
接收输入语音信息;
依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型;
其中,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
依据预设的分类规则,判断所述修改信息所属类型;
当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;
当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
2.根据权利要求1所述的方法,其特征在于,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
获取与所述修改信息对应的标准语音信息;
将所述标准语音信息与所述第一信息进行比对;
当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
3.根据权利要求1所述的方法,其特征在于,所述依据所述修改信息对所述识别结果中的第一信息进行修改之后,判断所述第一信息与所述修改信息是否满足预设匹配条件之前还包括:
判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则判断所述第一信息与所述修改信息是否满足预设匹配条件。
4.根据权利要求2所述的方法,其特征在于,所述修改信息中任一文字对应的单字标准语音信息为至少两个时,则将所述标准语音信息与所述第一信息进行比对包括:
分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;
依据所述至少两个匹配值,得到最高匹配值;
将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。
5.根据权利要求1所述的方法,其特征在于,当所述修改信息为拼音时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:
接收所述修改信息;
获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;
将所述识别结果中的第一信息替换为所述目标信息。
6.根据权利要求1所述的方法,其特征在于,当所述修改信息为文字时,所述接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改包括:
接收所述修改信息;
将所述识别结果中的第一信息替换为所述修改信息。
7.根据权利要求1所述的方法,其特征在于,所述依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括:
获取与所述拼音对应的至少一个标准语音信息;
将所述与所述拼音对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;
当比对结果表明存在一匹配值大于第三预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
否则,所述第一信息与所述修改信息不满足预设匹配条件。
8.根据权利要求1所述的方法,其特征在于,所述依据第二类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件包括
获取与所述文字对应的至少一个标准语音信息;
将所述与所述文字对应的至少一个标准语音信息分别与所述第一信息进行比对,得到至少一个匹配值;
当比对结果表明存在一匹配值大于第四预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;
否则,所述第一信息与所述修改信息不满足预设匹配条件。
9.一种电子设备,其特征在于,包括:
接收模块,用于接收输入语音信息;
识别模块,用于依据预设的语音识别模型识别所述输入语音信息,得到识别结果,所述识别结果包括至少一个字符;
修改模块,用于接收通过操作体输入的修改信息,并依据所述修改信息对所述识别结果中的第一信息进行修改,所述修改信息包括至少一个字符;
第一判断模块,用于判断所述第一信息与所述修改信息是否满足预设匹配条件;
训练模块,用于当所述第一信息与所述修改信息满足预设匹配条件时,依据修改后的识别结果和所述输入语音信息训练所述语音识别模型;
其中,第一判断模块包括:
分类单元,用于依据预设的分类规则,判断所述修改信息所属类型;
第一判断单元,用于当所述修改信息为至少两个字母组成的拼音时,所述修改信息所属类型为第一类型,依据第一类型的匹配条件,判断所述第一信息与所述修改信息是否满足预设匹配条件;
第二判断单元,用于当所述修改信息为文字时,所述修改信息所属类型为第二类型,依据第二类型的匹配条件,判断所述输入语音信息与所述修改信息是否满足预设匹配条件。
10.根据权利要求9所述的电子设备,其特征在于,所述第一判断模块包括:
第一获取单元,用于获取与所述修改信息对应的标准语音信息;
比对单元,用于将所述标准语音信息与所述第一信息进行比对;当比对结果表明所述标准语音信息与所述第一信息的匹配值大于第一预设阈值时,所述第一信息与所述修改信息满足预设匹配条件;当比对结果表明所述标准语音信息与所述第一信息的匹配值不大于第一预设阈值时,所述第一信息与所述修改信息不满足预设匹配条件。
11.根据权利要求9所述的电子设备,其特征在于,还包括:
第二判断模块,用于判断所述识别结果与所述语音识别模型的匹配值是否大于第二预设阈值;
当判断结果表明所述识别结果与所述语音识别模型的匹配值大于第二阈值时,则触发第一判断模块。
12.根据权利要求10所述的电子设备,其特征在于,所述比对单元包括:
组合子单元,用于分别将至少两个单字标准语音信息依次与所述标准语音信息中剩余的单字对应的单字标准语音信息组合,得到至少两个标准语音信息;
比对子单元,用于依次将所述至少两个标准语音信息与所述第一信息比对,得到至少两个匹配值;依据所述至少两个匹配值,得到最高匹配值;将所述最高匹配值记为所述标准语音信息与第一信息进行比对得到的匹配值。
13.根据权利要求9所述的电子设备,其特征在于,当所述修改信息为拼音时,所述修改模块包括:
第一接收单元,用于接收所述修改信息;
第二获取单元,用于获取与所述修改信息匹配的至少一个候选项,所述各个候选项包括至少一个文字;
选择单元,用于接收确认信息,并依据所述确认信息在所述至少一个候选项中选择一个候选项作为目标信息;将所述识别结果中的第一信息替换为所述目标信息。
14.根据权利要求9所述的电子设备,其特征在于,当所述修改信息为文字时,所述修改模块包括:
第二接收单元,用于接收所述修改信息;
替换单元,用于将所述识别结果中的第一信息替换为所述修改信息。
CN201410838464.XA 2014-12-30 2014-12-30 一种信息处理方法和电子设备 Active CN105808197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410838464.XA CN105808197B (zh) 2014-12-30 2014-12-30 一种信息处理方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410838464.XA CN105808197B (zh) 2014-12-30 2014-12-30 一种信息处理方法和电子设备

Publications (2)

Publication Number Publication Date
CN105808197A CN105808197A (zh) 2016-07-27
CN105808197B true CN105808197B (zh) 2019-07-26

Family

ID=56979927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410838464.XA Active CN105808197B (zh) 2014-12-30 2014-12-30 一种信息处理方法和电子设备

Country Status (1)

Country Link
CN (1) CN105808197B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993653A (zh) * 2017-11-30 2018-05-04 南京云游智能科技有限公司 语音识别设备的错误发音自动纠正更新方法和更新系统
CN108364653B (zh) * 2018-02-12 2021-08-13 王磊 语音数据处理方法及处理装置
CN109215638B (zh) * 2018-10-19 2021-07-13 珠海格力电器股份有限公司 一种语音学习方法、装置、语音设备及存储介质
CN110827815B (zh) * 2019-11-07 2022-07-15 深圳传音控股股份有限公司 一种语音识别方法、终端、系统以及计算机存储介质
CN112328738A (zh) * 2020-10-10 2021-02-05 中国农业银行股份有限公司河北省分行 语音检索方法、终端设备及可读存储介质
CN112259092B (zh) * 2020-10-15 2023-09-01 深圳市同行者科技有限公司 一种语音播报方法、装置及语音交互设备
CN113032426A (zh) * 2021-04-08 2021-06-25 平安科技(深圳)有限公司 识别结果的智能校对方法、装置、设备及存储介质
CN117831573B (zh) * 2024-03-06 2024-05-14 青岛理工大学 基于多模态的语言障碍人群言语录音分析方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207376A (ja) * 1999-01-08 2000-07-28 Nippon Telegr & Teleph Corp <Ntt> システム性能向上方法、装置、およびシステム性能向上プログラムを記録した記録媒体
CN1282072A (zh) * 1999-07-27 2001-01-31 国际商业机器公司 对语音识别结果中的错误进行校正的方法和语音识别系统
US6219407B1 (en) * 1998-01-16 2001-04-17 International Business Machines Corporation Apparatus and method for improved digit recognition and caller identification in telephone mail messaging
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219407B1 (en) * 1998-01-16 2001-04-17 International Business Machines Corporation Apparatus and method for improved digit recognition and caller identification in telephone mail messaging
JP2000207376A (ja) * 1999-01-08 2000-07-28 Nippon Telegr & Teleph Corp <Ntt> システム性能向上方法、装置、およびシステム性能向上プログラムを記録した記録媒体
CN1282072A (zh) * 1999-07-27 2001-01-31 国际商业机器公司 对语音识别结果中的错误进行校正的方法和语音识别系统
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统

Also Published As

Publication number Publication date
CN105808197A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN105808197B (zh) 一种信息处理方法和电子设备
CN106202059B (zh) 机器翻译方法以及机器翻译装置
CN105009064B (zh) 使用语言和空间模型的触摸键盘
CN105378606B (zh) 用于手势键入的备选假设错误修正
CN105431809B (zh) 用于国际语言的虚拟键盘输入
CN109120511B (zh) 基于特征的自动校正方法、计算设备和系统
US9886432B2 (en) Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
AU2014212844B2 (en) Character and word level language models for out-of-vocabulary text input
CN107622054B (zh) 文本数据的纠错方法及装置
US10114809B2 (en) Method and apparatus for phonetically annotating text
CN103366741B (zh) 语音输入纠错方法及系统
US20160275941A1 (en) Systems and methods for structured stem and suffix language models
US20110202876A1 (en) User-centric soft keyboard predictive technologies
CN101876853B (zh) 拼音输入方法及装置
US20150169537A1 (en) Using statistical language models to improve text input
KR20090019198A (ko) 음성 인식을 이용한 텍스트 입력 자동 완성 방법 및 장치
US10902197B1 (en) Vocabulary determination and vocabulary-based content recommendations
KR101633556B1 (ko) 문법 오류 수정 장치 및 이를 이용한 문법 오류 수정 방법
CN104461056B (zh) 一种信息处理方法和电子设备
EP3244408A1 (en) Method and electronic unit for adjusting playback speed of media files
US20170040019A1 (en) Interaction apparatus and method
CN105786204A (zh) 信息处理方法和电子设备
KR101562222B1 (ko) 발음의 정확도 평가 장치 및 그 방법
Skidmore Incremental disfluency detection for spoken learner english
KR102327790B1 (ko) 정보 처리 방법, 장치 및 저장 매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant