CN113763949B - 语音识别修正方法、电子设备及计算机可读存储介质 - Google Patents

语音识别修正方法、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113763949B
CN113763949B CN202110829171.5A CN202110829171A CN113763949B CN 113763949 B CN113763949 B CN 113763949B CN 202110829171 A CN202110829171 A CN 202110829171A CN 113763949 B CN113763949 B CN 113763949B
Authority
CN
China
Prior art keywords
information
word
text information
text
model library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110829171.5A
Other languages
English (en)
Other versions
CN113763949A (zh
Inventor
田松林
李华军
邹凡
刘兆平
周海
罗育林
赵铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Original Assignee
China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Digital Platform Technology Guangdong Co ltd filed Critical China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Priority to CN202110829171.5A priority Critical patent/CN113763949B/zh
Publication of CN113763949A publication Critical patent/CN113763949A/zh
Application granted granted Critical
Publication of CN113763949B publication Critical patent/CN113763949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种语音识别修正方法、电子设备及计算机可读存储介质,所述方法包括获取语音信息;将所述语音信息转换为文本信息;输入所述文本信息至预设的电力词语转换模型库中进行匹配;若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令。本申请技术方案能够提高语音识别准确率,以有效实现对电力系统的执行操作。

Description

语音识别修正方法、电子设备及计算机可读存储介质
技术领域
本申请涉及电力系统应用技术领域,特别涉及一种语音识别修正方法、电子设备及计算机可读存储介质。
背景技术
目前对电力系统进行命令执行、表单填写等操作,通常通过输入设备(例如键盘)来实现。采用语音识别的人机交互技术来对电力系统进行命令执行、表单填写等,常规做法是集成百度语音或科大讯飞语音等各大软件开发工具包,通过软件开发工具包提供的唤醒、命令词、语音转文字等技术直接对电力系统输入语音,以实现命令执行及表单填写的操作。但采用这种方式对语言进行识别,容易因环境噪音干扰、普通话标准程度、语速断句等影响,导致语音识别准确率较低,从而导致无法对电力系统执行操作。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提供了一种语音识别修正方法、电子设备及计算机可读存储介质,能够提高语音识别准确率,以有效实现对电力系统的执行操作。
根据本申请第一方面实施例提供的一种语音识别修正方法,包括:获取语音信息;将所述语音信息转换为文本信息;输入所述文本信息至预设的电力词语转换模型库中进行匹配;若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令。
根据本申请的上述实施例,至少具有如下有益效果:本申请实施例,通过获取语音信息,之后将语音信息转换为文本信息,再通过将文本信息输入至预设的电力词语转换模型库中进行匹配;所采用的电力词语转换模型库能够对语音识别的初始结果即文本信息进行修正,电力词语转换模型库包括了电力生产领域中专业操作词语(即电力词语)以及对应的执行命令,通过将语音识别出来的非电力生产领域中专业操作词语转换成电力词语,以便于电力系统准确执行相应操作,即若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令。本申请实施例能够提高语音在电力系统应用中的识别准确率,以有效实现对电力系统的执行操作。
根据本申请第一方面方法的一些实施例,所述将所述语音信息转换为文本信息之后,包括:
对所述文本信息进行分解,生成多种不同类型的词语信息;
对应的,所述输入所述文本信息至预设的电力词语转换模型库中进行匹配,包括:
对所述词语信息进行拼接,并将拼接后的词语信息输入至所述预设的电力词语转换模型库中进行匹配;
对应的,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述拼接后的词语信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述拼接后的词语信息执行相应命令。
根据本申请第一方面方法的一些实施例,所述对所述文本信息进行分解,生成多种不同类型的词语信息,包括:
对所述文本信息进行语义分析,以识别所述文本信息中包含的词性;
根据所述词性对所述文本信息进行分解,生成多种不同类型的词语信息。
根据本申请第一方面方法的一些实施例,所述对所述词语信息进行拼接,包括:
将所述多种不同类型的词语信息输入至所述预设的电力词语转换模型库中进行匹配;
若至少两个所述词语信息分别与所述电力词语转换模型库中对应的文本数据匹配准确,则对至少两个所述词语信息进行拼接。
根据本申请第一方面方法的一些实施例,所述对所述词语信息进行拼接,包括:
根据所述语音信息中的词语输入顺序,对所述词语信息进行拼接。
根据本申请第一方面方法的一些实施例,所述将所述语音信息转换为文本信息之后,包括:
提取所述文本信息中的关键词信息;
对应的,所述输入所述文本信息至预设的电力词语转换模型库中进行匹配,包括:
将所述关键词信息输入至所述预设的电力词语转换模型库中进行匹配;
对应的,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述关键词信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述关键词信息执行相应命令。
根据本申请第一方面方法的一些实施例,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息发送命令提示指令;
根据所述命令提示指令,获取命令执行指令;
根据所述命令执行指令,执行相应命令。
根据本申请第一方面方法的一些实施例,所述将所述语音信息转换为文本信息,包括:
将所述语音信息转换为拼音文本信息。
根据本申请第二方面提供的一种电子设备,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述指令时实现如第一方面实施例所述的语音识别修正方法。
由于本申请第二方面实施例提供的电子设备应用第一方面实施例的语音识别修正方法,因此具有第一方面实施例任一所述的语音识别修正方法的全部有益效果。
根据本申请第三方面提供的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如第一方面实施例所述的语音识别修正方法。
由于本申请第三方面提供的计算机可读存储介质执行如第一方面实施例所述的语音识别修正方法,因此具有第一方面实施例任一所述的语音识别修正方法的全部有益效果。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请第一方面实施例的语音识别修正方法的流程示意图;
图2是本申请一实施例的对文本信息进行分解的流程示意图;
图3是本申请一实施例的对文本信息进行语义分析的流程示意图;
图4是本申请一实施例的对词语信息进行拼接的流程示意图;
图5是本申请一实施例的提取关键词信息的流程示意图;
图6是本申请一实施例的获取命令执行提示的流程示意图;
图7是本申请另一实施例的语音识别修正方法的流程示意图;
图8是本申请一实施例的执行换行命令的示意图;
图9是图8中执行换行命令的示意图;
图10是本申请另一实施例的语音识别修正方法的示意图;
图11是本申请一实施例的表单填写的示意图;
图12是本申请第二方面实施例所提供的电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
相关技术中,通常是通过集成百度语音或科大讯飞语音等各大软件开发工具包,通过软件开发工具包提供的唤醒、命令词、语音转文字等技术来对电力系统输入语音,以实现命令执行及表单填写的操作。但采用这种方式对语言进行识别,容易因环境噪音干扰、普通话标准程度、语速断句等影响,导致语音识别准确率较低,从而导致无法对电力系统执行准确操作。
基于此,本申请提供了一种语音识别修正方法、电子设备及计算机可读存储介质,能够提高语音识别准确率,以有效对电力系统执行相关操作。
下面结合附图,对本申请实施例作进一步阐述。
参照图1,根据本申请第一方面实施例提供的一种语音识别修正方法,包括:
步骤S100,获取语音信息;
步骤S200,将语音信息转换为文本信息;
步骤S300,输入文本信息至预设的电力词语转换模型库中进行匹配;
步骤S400,若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令。
可以理解的是,本申请实施例通过预设一个电力词语转换模型库,所采用的电力词语转换模型库包括了电力生产领域中专业操作词语(即电力词语)以及与专业操作词语(即电力词语)对应的执行命令。本申请实施例通过获取语音信息,之后将语音信息转换为文本信息,所采用的电力词语转换模型库能够对语音识别的初始结果即文本信息进行修正,且能够将语音识别出来的非电力生产领域中专业操作词语转换成电力词语,以便于电力系统能够准确执行相应操作。具体地通过将文本信息输入至预设的电力词语转换模型库中进行匹配;若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令。
参照图2,可以理解的是,将语音信息转换为文本信息之后,包括:
步骤S210,对文本信息进行分解,生成多种不同类型的词语信息;
对应的,输入文本信息至预设的电力词语转换模型库中进行匹配,包括:
步骤S310,对词语信息进行拼接,并将拼接后的词语信息输入至预设的电力词语转换模型库中进行匹配;
对应的,若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令,包括:
步骤S410,若拼接后的词语信息与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息执行相应命令。
可以理解的是,通过对获取到的文本信息(例如用户输入的冗长语音信息)进行转换,以生成与语音信息对应的文本信息。为了提高语音识别的准确率,故需要对一些非电力词语进行筛选剔除,或将输入的非电力生产领域中专业操作词语转换成电力词语,以便于电力词语转换模型库能够对文本信息进行准确匹配,故本申请实施例在对文本信息进行分解生成多种不同类型的词语信息后,需要对获取到的多种不同类型的词语信息重新进行拼接,再将拼接后的词语信息输入至预设的电力词语转换模型库中进行匹配。可以理解的是,由于分解文本信息后,可以生成多种不同类型的词语信息,故可以根据词语信息的多种不同类型进行多种组合的拼接,例如根据语义习惯或者电力系统中常规的电力词语用法或者电力系统中高频使用的电力词语,来对多种不同类型的词语信息进行拼接,直至拼接后的词语信息能够与电力词语转换模型库中的文本数据匹配为止。即,若拼接后的词语信息与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息执行相应命令。
参照图3,可以理解的是,对文本信息进行分解,生成多种不同类型的词语信息,包括:
步骤S211,对文本信息进行语义分析,以识别文本信息中包含的词性;
步骤S212,根据词性对文本信息进行分解,生成多种不同类型的词语信息。
可以理解的是,由于语音信息除了可以是简短的操作词语外,还可能是长语音、长词句等,故本申请实施例在将语音信息转换为文本信息之后,需要对文本信息进行分解,以生成多种不同类型的词语信息。具体地,通过对文本信息进行语义分析,以识别文本信息中包含的词性,再根据词性对文本信息进行分解,生成多种不同类型的词语信息。
可以理解的是,词性可以包括名词、动词、形容词、介词等等。例如,输入“我想查看历史记录”的语音信息,将该句语音信息转换为对应的文本信息,并对该文本信息进行语义分析,以识别该文本信息中包含的词性,根据词性对文本信息进行分解,而生成多种不同类型的词语信息,即可得到:“我”属于代词、“想”属于意向动词、“查看”属于动词、“历史”属于名词、“记录”属于动词或名词,等等。
之后,再对分解得到的多种不同类型的词语信息进行拼接,例如,可以拼接得到“查看历史”,或“查看记录”,或“查看历史记录”等,由于“我”、“想”为非电力生产领域中专业操作词语,且在电力系统中并无相应匹配,故为了提高语音识别的效率,可以筛除“我”,“想”这类类型的词语信息,而无需对“我”,“想”这类类型的词语信息进行拼接,而是对动词和名词这类类型的词语信息进行组合拼接。在本申请实施例中,将拼接后的词语信息,例如将“查看历史记录”输入至预设的电力词语转换模型库中进行匹配,若该拼接后的词语信息(即“查看历史记录”)与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息(即“查看历史记录”)执行相应命令(即执行“查看历史记录”的命令)。
在一些实施例中,还可以执行其他拼接后的词语信息所相对应的命令,而不局限于本实施例,在此不再赘述。
参照图4,可以理解的是,对词语信息进行拼接,包括:
步骤S311,将多种不同类型的词语信息输入至预设的电力词语转换模型库中进行匹配;
步骤S312,若至少两个词语信息分别与电力词语转换模型库中对应的文本数据匹配准确,则对至少两个词语信息进行拼接。
可以理解的是,在本申请实施例中,由于电力词语转换模型库中所存储的文本数据较多,故为了提高对语音识别的准确率,通常会对每个对应的执行命令所属种类的应用进行分类,其中,每个应用均包括有至少两个不同等级的数据层;每个数据层均包括文本数据,文本数据包括电力词语、操作类型以及应用类型等,其中,电力词语、操作类型以及应用类型之间为一一对应的关系。可以理解的是,电力词语转换模型库中通常包括一个或多个不同种类的应用,例如业务应用、财务应用、行政应用、生产应用等等。而应用包括有至少两个不同等级的数据层,例如一级数据层、二级数据层等,所涉及的一级、二级……可逐级增加,其范围可设置逐级减少,例如一级数据层包括二级数据层,二级数据层包括三级数据层等,且在各数据层中,每一数据层分别包括文本数据,文本数据中的多个操作类型分别对应的所要执行命令,即该文本数据包括的电力词语、操作类型以及应用类型,可分别与词语信息,或拼接后的词语信息,或文本信息一一对应进行匹配,以便系统根据语音信息自动执行相应命令,有效实现智能化,操作简便。
具体地,将多种不同类型的词语信息输入至预设的电力词语转换模型库中进行匹配;在电力词语转换模型库中匹配查找是否存在着与每一种类型的词语信息所相对应的文本数据,若至少两个词语信息分别与电力词语转换模型库中对应的文本数据匹配准确,则对至少两个词语信息进行拼接,之后再将拼接后的词语信息输入至预设的电力词语转换模型库中进行再次匹配,若拼接后的词语信息与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息执行相应命令。这样设置的目的是,提高语音识别准确率,有效减少误操作。
可以理解的是,对词语信息进行拼接,包括:根据语音信息中的词语输入顺序,对词语信息进行拼接。
通常用户在输入语音信息时,会直接输入带有执行命令的语音信息,且按照语义习惯,通常会直接输入与执行命令相对应的语音信息,故通过直接根据语音信息中的词语输入顺序,对词语信息进行拼接,便于节省词语信息匹配的时间,提高语音识别效率。可以理解的是,对词语信息进行拼接的前提是,用户所输入的语音信息中,经过文本信息的转换、文本信息的语义分析、以及文本信息的分解后,生成的多种不同类型的词语信息,均能够被所预设的电力词语转换模型库匹配得到。此时再根据语音信息中的词语输入顺序,对词语信息进行拼接,并将拼接后的词语信息输入至预设的电力词语转换模型库中进行匹配,若拼接后的词语信息与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息执行相应命令。
参照图5,可以理解的是,将语音信息转换为文本信息之后,包括:
步骤S510,提取文本信息中的关键词信息;
对应的,输入文本信息至预设的电力词语转换模型库中进行匹配,包括:
步骤S610,将关键词信息输入至预设的电力词语转换模型库中进行匹配;
对应的,若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令,包括:
步骤S710,若关键词信息与电力词语转换模型库中对应的文本数据匹配准确,则根据关键词信息执行相应命令。
可以理解的是,由于执行命令所对应的文本数据中的电力词语,通常为动词类型,或者名词类型,或者动词+名词结合等类型,故通过提取文本信息中的关键词信息,该关键词信息可以为文本信息中所包含的动词类型的关键词,或动词+名词结合的关键词等,之后将关键词信息输入至预设的电力词语转换模型库中进行匹配,若关键词信息与电力词语转换模型库中对应的文本数据匹配准确,则根据关键词信息执行相应命令。
参照图6,可以理解的是,若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息执行相应命令,包括:
步骤S420,若文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据文本信息发送命令提示指令;
步骤S430,根据命令提示指令,获取命令执行指令;
步骤S440,根据命令执行指令,执行相应命令。
在一些实施例中,为了检测电力词语转换模型库中的文本数据与文本信息是否匹配准确,可以通过将文本信息与电力词语转换模型库中所对应的文本数据匹配成功后,根据文本信息发送命令提示指令,用户接收到该命令提示指令后,判断文本数据与文本信息是否匹配准确,若正确,则选择执行该命令;若错误,则选择不执行该命令。即通过获取命令执行指令,再根据命令执行指令,执行相应命令。
可以理解的是,将语音信息转换为文本信息,包括:将语音信息转换为拼音文本信息。
通过将语音信息转换为拼音文本信息,再通过将拼音文本信息输入至预设的电力词语转换模型库中进行匹配,若拼音文本信息与电力词语转换模型库中对应的文本数据匹配准确,则根据该拼音文本信息执行相应命令。例如输入“查看”语音信息,将该“查看”语音信息转换为拼音文本信息(即“chakan”),在预设的电力词语转换模型库中对“chakan”进行匹配筛选,若“chakan”与其对应的文本数据“查看”匹配正确,则执行“查看”命令。
下面结合附图以一个具体的实施例详细描述根据本申请实施例的语音识别修正方法。值得理解的是,下述描述仅是示例性说明,而不是对申请的具体限制。
本申请实施例的语音识别修正方法,通过预设一个电力词语转换模型库,将文本信息输入至预设的电力词语转换模型库中,以修正语音识别的初始结果(即文本信息),这样的目的是,能够将语音识别出来的非电力生产领域中专业操作词语转换得到电力词语,从而便于电力系统根据电力词语准确执行相应操作,能够提高在电力领域应用中的语音识别准确率。
参照图7,具体地,获取语音信息,将语音信息转换为文本信息,输入文本信息至预设的电力词语转换模型库中,将文本信息与其对应的文本数据进行匹配修正,并结合简易电力词语语义理解,以便使系统得到准确的执行命令。本申请实施例可用于系统唤醒、命令执行、表单填写等。
可以理解的是,本申请实施例的电力词语转换模型库包括:多个文本数据以及多个不同种类的应用。应用一般包括有多个同等级但不同类型的数据层,可定义为一级数据层,而在一级数据层内也可增加多个不同等级的数据层,例如二级数据层、三级数据层等,各级数据层之间为包含关系。例如,设置生产应用为一级数据层,其包括维修检修这个二级数据层,维修检修再包括表单填写模块这个三级数据层。此外,每个数据层均包括文本数据,文本数据包括电力词语、操作类型以及应用类型等,其中,电力词语、操作类型以及应用类型之间为一一对应的关系。
例如,用户输入“换行”语音信息,通过将“换行”语音信息转换为“huanhang”拼音文本信息,再将“huanhang”拼音文本信息输入至预设的电力词语转换模型库中进行匹配,以便于在电力词语转换模型库中查找应用类型、电力词语、操作类型等,通过将“huanhang”拼音文本信息与电力词语转换模型库中对应的文本数据匹配准确后,再根据“huanhang”拼音文本信息执行换行命令。
参照图8,具体表示一级数据层的数据,表格的应用类型中的数字0、1、2……指代不同种类的应用类型,例如业务应用、财务应用、行政应用、生产应用等等,在一些实施例中,生产应用可用数字1表示,业务应用可用数字2表示等等;在确定为生产应用后,其下的二级数据层、三级数据层等内的应用类型,均以数字1表示;操作类型则包括名词、命令等。参照图9,具体表示三级数据层的数据。可以理解的是,当需要在生产应用中执行换行命令时,需先进入到生产应用中,再获取文本信息。例如需要在“生产应用-维护检修-表单填写模块”中执行换行命令,其中的生产应用则表示的是在一级数据层中,生产应用采用数字1表示;维护检修则表示在二级数据层中;表单填写模块则表示在三级数据层中。通过将“huanhang”拼音文本信息输入至预设的电力词语转换模型库中进行匹配,即先将“huanhang”拼音文本信息在一级数据层中进行匹配查找,得到对应的电力词语、操作类型以及应用类型,匹配准确后,再进入至二级数据层中进行二次匹配查找,得到与“换行”执行命令对应的电力词语、操作类型以及应用类型……以此操作,根据最终匹配得到的结果在表单填写模块中执行“换行”命令。
参照图8,可以理解的是,本申请实施例的语音识别修正方法,所预设的电力词语转换模型库能够对输入的拼音文本信息进行模糊匹配。由于各用户之间可能存在口音差异,使得根据用户输入的语音信息转换得到的拼音文本信息,与正确的拼音文本信息之间会存在误差,通过设置模糊匹配,使得在对比转换得到的拼音文本信息与正确的拼音文本信息时,将转换得到的拼音文本信息先进行各个词之间的分解,再将每个词的各字母信息分别与正确的拼音文本信息内每个词的各字母信息进行一一匹配,若匹配成功的正确率在预设阈值内,则表示匹配成功,进而便可根据转换得到的拼音文本信息得到正确的执行命令。
又例如,当输入长语句的语音信息时,通过获取语音信息,再将语音信息转换为文本信息,对文本信息进行语义分析,以识别文本信息中包含的词性,再根据词性对文本信息进行分解,生成多种不同类型的词语信息,将多种不同类型的词语信息输入至预设的电力词语转换模型库中进行匹配,若至少两个词语信息分别与电力词语转换模型库中对应的文本数据匹配准确,则对至少两个词语信息进行拼接,并将拼接后的词语信息输入至预设的电力词语转换模型库中进行匹配,若拼接后的词语信息与电力词语转换模型库中对应的文本数据匹配准确,则根据拼接后的词语信息执行相应命令。且对至少两个词语信息进行拼接时,还可以根据语音信息中的词语输入顺序,对词语信息进行拼接。
参照图10,如输入"查看历史记录"的语音信息,将"查看历史记录"的语音信息转换为文本信息,之后对该文本信息进行语义分析、分解,得到“查看”、“历史记录”这两个类型的词语信息。根据语音信息中的词语输入顺序,可以先将“查看”的词语信息输入至电力词语转换模型库中,若“查看”的词语信息与对应的文本数据匹配准确,则保留“查看”的词语信息,再将“历史记录”的词语信息输入至电力词语转换模型库中,若“历史记录”的词语信息与对应的文本数据匹配准确,则保留““历史记录”的词语信息。此时,对“查看”、“历史记录”这两个类型的词语信息进行组合拼接,得到"查看历史记录"的词语信息,重新输入至电力词语转换模型库中进行匹配,使得系统根据语音信息准确执行查看历史记录的命令,能够有效提高语音识别准确率。
参照图11,为一个具体的表单填写实施例。通过开启在特定应用下的表单,通过本申请实施例的语音识别修正方法,逐步进行表单填写。可以理解的是,“保存”、“查看台账”、“下一行”、“填值”等均为电力词语转换模型库中所存储的电力词语。通过输入语音信息,进而得到与语音信息所对应的执行命令,并及时根据该执行命令执行相应操作。
可以理解的是,本申请实施例能够识别出电力生产领域中专业操作词语,且能够将非电力生产领域中专业操作词语转换成电力词语,以便于电力系统能够准确根据该电力词语进行相应操作。
本申请实施例的语音识别修正方法,通过不断设定添加更多的文本数据,可应用在所有需要语音识别的电力系统场景中,以提高在电力系统中的语音识别的准确率或表单填写准确性。
根据本申请第二方面实施例提供的一种电子设备,该电子设备6000可以是任意类型的智能终端,如手机、平板电脑、个人计算机等。
进一步地,电子设备6000包括:一个或多个存储器6002;一个或多个处理器6001;一个或多个程序,程序被存储在存储器6002中,处理器6001执行一个或多个程序实现上述语音识别修正方法。图12中以一个处理器6001为例。
处理器6001和存储器6002可以通过总线或其他方式连接,图12以通过总线连接为例。
存储器6002作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及信号,如本发明实施例中的电子设备6000对应的程序指令/信号。处理器6001通过运行存储在存储器6002中的非暂态软件程序、指令以及信号,从而执行各种功能应用以及数据处理,即实现上述方法实施例的语音识别修正方法。
存储器6002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储上述语音识别修正方法的相关数据等。此外,存储器6002可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器6002可选包括相对于处理器6001远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备6000。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个信号存储在存储器6002中,当被一个或者多个处理器6001执行时,执行上述任意方法实施例中的语音识别修正方法。例如,执行以上描述的图1中的方法步骤S100至S400、图2中的方法步骤S100至S410、图3中的方法步骤S100至S410、图4中的方法步骤S311至S312、图5中的方法步骤S100至S710、图6中的方法步骤S100至S440。
根据本申请第三方面实施例提供的一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器6001执行,例如,被图12中的一个处理器6001执行,可使得上述一个或多个处理器6001执行上述方法实施例中的语音识别修正方法。例如,执行以上描述的图1中的方法步骤S100至S400、图2中的方法步骤S100至S410、图3中的方法步骤S100至S410、图4中的方法步骤S311至S312、图5中的方法步骤S100至S710、图6中的方法步骤S100至S440。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读信号、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读信号、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体地”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,均应包含在本申请的保护范围内。

Claims (8)

1.一种语音识别修正方法,其特征在于,包括:
获取语音信息;
将所述语音信息转换为文本信息;
输入所述文本信息至预设的电力词语转换模型库中进行匹配;
若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令;
所述将所述语音信息转换为文本信息之后,包括:
对所述文本信息进行分解,生成多种不同类型的词语信息;
对应的,所述输入所述文本信息至预设的电力词语转换模型库中进行匹配,包括:
对所述词语信息进行拼接,并将拼接后的词语信息输入至所述预设的电力词语转换模型库中进行匹配;
对应的,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述拼接后的词语信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述拼接后的词语信息执行相应命令;
所述对所述词语信息进行拼接,包括:
将所述多种不同类型的词语信息输入至所述预设的电力词语转换模型库中进行匹配;
若至少两个所述词语信息分别与所述电力词语转换模型库中对应的文本数据匹配准确,则对至少两个所述词语信息进行拼接。
2.根据权利要求1所述的语音识别修正方法,其特征在于,所述对所述文本信息进行分解,生成多种不同类型的词语信息,包括:
对所述文本信息进行语义分析,以识别所述文本信息中包含的词性;
根据所述词性对所述文本信息进行分解,生成多种不同类型的词语信息。
3.根据权利要求1所述的语音识别修正方法,其特征在于,所述对所述词语信息进行拼接,包括:
根据所述语音信息中的词语输入顺序,对所述词语信息进行拼接。
4.根据权利要求1至3任一项所述的语音识别修正方法,其特征在于,所述将所述语音信息转换为文本信息之后,包括:
提取所述文本信息中的关键词信息;
对应的,所述输入所述文本信息至预设的电力词语转换模型库中进行匹配,包括:
将所述关键词信息输入至所述预设的电力词语转换模型库中进行匹配;
对应的,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述关键词信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述关键词信息执行相应命令。
5.根据权利要求1至3任一项所述的语音识别修正方法,其特征在于,所述若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息执行相应命令,包括:
若所述文本信息与所述电力词语转换模型库中对应的文本数据匹配准确,则根据所述文本信息发送命令提示指令;
根据所述命令提示指令,获取命令执行指令;
根据所述命令执行指令,执行相应命令。
6.根据权利要求1至3任一项所述的语音识别修正方法,其特征在于,所述将所述语音信息转换为文本信息,包括:
将所述语音信息转换为拼音文本信息。
7.一种电子设备,其特征在于,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述指令时实现如权利要求1至6中任一项所述的语音识别修正方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至6中任一项所述的语音识别修正方法。
CN202110829171.5A 2021-07-22 2021-07-22 语音识别修正方法、电子设备及计算机可读存储介质 Active CN113763949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110829171.5A CN113763949B (zh) 2021-07-22 2021-07-22 语音识别修正方法、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110829171.5A CN113763949B (zh) 2021-07-22 2021-07-22 语音识别修正方法、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113763949A CN113763949A (zh) 2021-12-07
CN113763949B true CN113763949B (zh) 2024-05-14

Family

ID=78787821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110829171.5A Active CN113763949B (zh) 2021-07-22 2021-07-22 语音识别修正方法、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113763949B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408490A (zh) * 2022-11-01 2022-11-29 广东省信息工程有限公司 一种基于知识库的官文校对方法、系统、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018231106A1 (en) * 2017-06-13 2018-12-20 Telefonaktiebolaget Lm Ericsson (Publ) First node, second node, third node, and methods performed thereby, for handling audio information
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN112270922A (zh) * 2020-10-20 2021-01-26 云南电网有限责任公司迪庆供电局 一种调度日志自动化填写方法及装置
CN112668311A (zh) * 2019-09-29 2021-04-16 北京国双科技有限公司 文本错误的检测方法及装置
CN112669851A (zh) * 2021-03-17 2021-04-16 北京远鉴信息技术有限公司 一种语音识别方法、装置、电子设备及可读存储介质
CN112885352A (zh) * 2021-01-26 2021-06-01 广东电网有限责任公司 一种语料库的构建方法、装置、计算机设备及存储介质
CN113140219A (zh) * 2021-05-08 2021-07-20 广东电网有限责任公司 调控指令生成方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018231106A1 (en) * 2017-06-13 2018-12-20 Telefonaktiebolaget Lm Ericsson (Publ) First node, second node, third node, and methods performed thereby, for handling audio information
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN112668311A (zh) * 2019-09-29 2021-04-16 北京国双科技有限公司 文本错误的检测方法及装置
CN112270922A (zh) * 2020-10-20 2021-01-26 云南电网有限责任公司迪庆供电局 一种调度日志自动化填写方法及装置
CN112885352A (zh) * 2021-01-26 2021-06-01 广东电网有限责任公司 一种语料库的构建方法、装置、计算机设备及存储介质
CN112669851A (zh) * 2021-03-17 2021-04-16 北京远鉴信息技术有限公司 一种语音识别方法、装置、电子设备及可读存储介质
CN113140219A (zh) * 2021-05-08 2021-07-20 广东电网有限责任公司 调控指令生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113763949A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
US20220058343A1 (en) Written-modality prosody subsystem in a natural language understanding (nlu) framework
US11520992B2 (en) Hybrid learning system for natural language understanding
US7912700B2 (en) Context based word prediction
US20210056266A1 (en) Sentence generation method, sentence generation apparatus, and smart device
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
CN104573099A (zh) 题目的搜索方法及装置
KR20080085165A (ko) 입력 데이터 확장 시스템 및 방법, 및 와일드카드 삽입 및입력 데이터 확장 시스템
CN112395391B (zh) 概念图谱构建方法、装置、计算机设备及存储介质
US20220414463A1 (en) Automated troubleshooter
CN109299471A (zh) 一种文本匹配的方法、装置及终端
CN116956835B (zh) 一种基于预训练语言模型的文书生成方法
CN101689198A (zh) 使用规格化串的语音搜索
CN113763949B (zh) 语音识别修正方法、电子设备及计算机可读存储介质
CN111553138A (zh) 用于规范内容结构文档的辅助写作方法及装置
CN115904482B (zh) 接口文档生成方法、装置、设备及存储介质
CN116797195A (zh) 工单处理方法、装置、计算机设备和计算机可读存储介质
CN110162615A (zh) 一种智能问答方法、装置、电子设备和存储介质
CN115309994A (zh) 地点检索方法、电子设备以及存储介质
CN110309258A (zh) 一种输入检查方法、服务器和计算机可读存储介质
CN115509485A (zh) 一种业务表单的填写方法、装置、电子设备和存储介质
CN111930884A (zh) 一种确定回复语句的方法、设备和人机对话系统
CN112380850A (zh) 错别字识别方法、装置、介质及电子设备
CN113744737B (zh) 语音识别模型的训练、人机交互方法、设备和存储介质
CN115630634B (zh) 文本纠错方法、装置、电子设备以及存储介质
US11934794B1 (en) Systems and methods for algorithmically orchestrating conversational dialogue transitions within an automated conversational system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 510000 501, 502, 601 and 602, building D, wisdom Plaza, Qiaoxiang Road, Gaofa community, Shahe street, Nanshan District, Shenzhen, Guangdong

Applicant after: China Southern Power Grid Digital Platform Technology (Guangdong) Co.,Ltd.

Address before: 510000 501, 502, 601 and 602, building D, wisdom Plaza, Qiaoxiang Road, Gaofa community, Shahe street, Nanshan District, Shenzhen, Guangdong

Applicant before: China Southern Power Grid Shenzhen Digital Power Grid Research Institute Co.,Ltd.

Country or region before: China

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant