CN109753659B - 语义处理方法、装置、电子设备和存储介质 - Google Patents
语义处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN109753659B CN109753659B CN201811652978.0A CN201811652978A CN109753659B CN 109753659 B CN109753659 B CN 109753659B CN 201811652978 A CN201811652978 A CN 201811652978A CN 109753659 B CN109753659 B CN 109753659B
- Authority
- CN
- China
- Prior art keywords
- wildcard
- sentence
- text information
- text
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Abstract
本申请提供一种语义处理方法、装置、电子设备和存储介质,其中,该方法包括:获取语音信息;对语音信息进行语音识别,得到文本信息;确定文本信息是否符合预设的文本通配规则中的通配语句,其中,文本通配规则中包括至少一个通配语句,每一个通配语句中包括至少一个关键词和至少一个通配字符;若文本信息符合文本通配规则中的一个或多个通配语句,则根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。可以快速、正确的分析出用户的语义,正确的理解用户意图;即使在较为嘈杂的环境,采集到较为杂乱的语音的时候,也可以快速、正确的分析出用户的语义,提高了用户体验。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语义处理方法、装置、电子设备和存储介质。
背景技术
随着人工智能的发展,智能语音设备应用到了各个领域中。现有技术中,智能语音设备采集用户与其对话的用户语音,该用户语音经过语音识别、自然语言理解后得到用户语义分析结果,智能语音设备可以根据该用户语义分析结果为用户提供服务。
然而现有技术中,智能语音设备采集到的用户与其对话的用户语音中,可能会掺杂环境中的其它语音,或者会掺杂用户与其他用户对话的语音;从而在进行语音识别的时候,会将一些无意义的、不是用户与智能语音设备对话的内容识别进来,进而导致不能正确分析出用户语义,导致不能正确理解用户意图。
发明内容
本申请提供一种语义处理方法、装置、电子设备和存储介质,用以解决不能正确理解用户意图的问题。
本申请的第一方面是提供一种语义处理方法,包括:
获取语音信息;
对所述语音信息进行语音识别,得到文本信息;
确定所述文本信息是否符合预设的文本通配规则中的通配语句,其中,所述文本通配规则中包括至少一个通配语句,每一个所述通配语句中包括至少一个关键词和至少一个通配字符;
若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
进一步地,若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果,包括:
若所述文本信息符合所述文本通配规则中的一个通配语句,则根据所述一个通配语句所包括的各关键词,确定语义分析结果;
若所述文本信息符合所述文本通配规则中的多个通配语句,确定所述多个通配语句中优先级最高的通配语句;根据所述优先级最高的通配语句所包括的各关键,确定语义分析结果。
进一步地,所述文本信息与所述文本信息符合的通配语句之间符合以下要求中的至少一种:
所述文本信息包括所述文本信息符合的通配语句所包括的各关键字;
所述文本信息所包括的所述各关键字的次序与所述文本信息符合的通配语句所包括的各关键字的次序相同;
所述文本信息所包括的所述各关键字中,相邻关键字之间的间隔字符的长度,属于所述文本信息符合的通配语句所包括的对应相邻关键字之间的通配字符表征的长度范围,其中,所述相邻关键字与所述对应相邻关键字相同。
进一步地,根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果,包括:
根据所述文本信息符合的通配语句中的一个通配语句,获取所述文本信息中的目标词;
根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词和所述目标词,确定语义分析结果。
进一步地,根据所述文本信息符合的通配语句中的一个通配语句,获取所述文本信息中的目标词,包括:
确定所述文本信息符合的通配语句中的一个通配语句的意图信息;
获取所述文本信息中与所述意图信息对应的目标词。
进一步地,所述通配字符在通配语句中的位置符合以下规则中至少一种:
每一个所述通配语句中的相邻关键字之间具有所述通配字符;
每一个所述通配语句的开头具有所述通配字符;
每一个所述通配语句的结尾具有所述通配字符。
进一步地,在根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果之后,还包括:
接收修正指令;
根据所述修正指令对所述语义分析结果进行修正,得到修正后的语义分析结果。
进一步地,所述方法,还包括:
若所述文本信息不符合所述文本通配规则中的所有通配语句,则采用自然语言理解技术对所述文本信息进行语义理解,得到语义分析结果。
本申请的第二方面是提供一种语义处理装置,包括:
获取单元,用于获取语音信息;
识别单元,用于对所述语音信息进行语音识别,得到文本信息;
第一确定单元,用于确定所述文本信息是否符合预设的文本通配规则中的通配语句,其中,所述文本通配规则中包括至少一个通配语句,每一个所述通配语句中包括至少一个关键词和至少一个通配字符;
第二确定单元,用于若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
进一步地,所述第二确定单元,具体用于:
若所述文本信息符合所述文本通配规则中的一个通配语句,则根据所述一个通配语句所包括的各关键词,确定语义分析结果;
若所述文本信息符合所述文本通配规则中的多个通配语句,确定所述多个通配语句中优先级最高的通配语句;根据所述优先级最高的通配语句所包括的各关键,确定语义分析结果。
进一步地,所述文本信息与所述文本信息符合的通配语句之间符合以下要求中的至少一种:
所述文本信息包括所述文本信息符合的通配语句所包括的各关键字;
所述文本信息所包括的所述各关键字的次序与所述文本信息符合的通配语句所包括的各关键字的次序相同;
所述文本信息所包括的所述各关键字中,相邻关键字之间的间隔字符的长度,属于所述文本信息符合的通配语句所包括的对应相邻关键字之间的通配字符表征的长度范围,其中,所述相邻关键字与所述对应相邻关键字相同。
进一步地,所述第二确定单元,包括:
获取模块,用于根据所述文本信息符合的通配语句中的一个通配语句,获取所述文本信息中的目标词;
确定模块,用于根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词和所述目标词,确定语义分析结果。
进一步地,所述获取模块,具体用于:
确定所述文本信息符合的通配语句中的一个通配语句的意图信息;
获取所述文本信息中与所述意图信息对应的目标词。
进一步地,所述通配字符在通配语句中的位置符合以下规则中至少一种:
每一个所述通配语句中的相邻关键字之间具有所述通配字符;
每一个所述通配语句的开头具有所述通配字符;
每一个所述通配语句的结尾具有所述通配字符。
进一步地,所述装置,还包括:
接收单元,用于在所述第二确定单元根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果之后,接收修正指令;
修正单元,用于根据所述修正指令对所述语义分析结果进行修正,得到修正后的语义分析结果。
进一步地,所述装置,还包括:
第三确定单元,用于若所述文本信息不符合所述文本通配规则中的所有通配语句,则采用自然语言理解技术对所述文本信息进行语义理解,得到语义分析结果。
本申请第三方面提供一种电子设备,包括:发送器、接收器、存储器和处理器;
所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令实现第一方面任一实现方式提供的语义处理方法。
本申请第四方面提供一种存储介质,其特征在于,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现第一方面任一实现方式提供的语义处理方法。
本申请的技术效果是:通过提供了一种文本通配规则,文本通配规则中包括至少一个通配语句;在确定语音信息对应的文本信息符合文本通配规则中的通配语句的时,可以直接根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定出语义分析结果;从而可以快速、正确的分析出用户的语义,正确的理解用户意图;即使在较为嘈杂的环境,采集到较为杂乱的语音的时候,也可以快速、正确的分析出用户的语义,提高了用户体验。
附图说明
图1为本申请实施例提供的一种语义处理方法的流程示意图;
图2为本申请实施例提供的另一种语义处理方法的流程示意图;
图3为本申请实施例提供的一种语义处理装置的结构示意图;
图4为本申请实施例提供的另一种语义处理装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
现有技术中,智能语音设备采集用户与其对话的用户语音,该用户语音经过语音识别、自然语言理解后得到用户语义分析结果,智能语音设备可以根据该用户语义分析结果为用户提供服务。
然而现有技术中,智能语音设备采集到的用户与其对话的用户语音中,可能会掺杂环境中的其它语音,或者会掺杂用户与其他用户对话的语音;从而在进行语音识别的时候,会将一些无意义的、不是用户与智能语音设备对话的内容识别进来,进而导致不能正确分析出用户语义,导致不能正确理解用户意图。
举例来说,智能语音设备为机器人,机器人与用户A交互的时候,用户A一边和机器人说话,用户A一边和用户B说话;机器人可以采集到用户A与机器人交互的语音,机器人也可以采集到用户A与用户B交流的语音,这两个语音掺杂在一起,使得机器人无法识别和理解出用户A的正确的语义。例如,用户A与机器人交互的语音,用户A与用户B交流的语音,两者掺杂在一起,机器人采集得到语音“我们这个机器人可以替企业做引领工作你看哈带我去咖啡厅”,基于该语音很难正确理解用户的意图。
本申请提供的语义处理方法、装置、电子设备和存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种语义处理方法的流程示意图。如图1所示,该方法包括:
步骤101、获取语音信息。
在本实施例中,具体的,本实施例的执行主体可以为电子设备,该电子设备具体可以为能够采集用户语音信息的智能语音设备,可以包括但不限于为机器人、智能音箱等,也可以为与智能语音设备通信的外部设备,此时,外部设备可以从智能语音设备获取用户语音信息,具体的,外部设备可以包括但不限于为智能语音设备的服务器等。
步骤102、对语音信息进行语音识别,得到文本信息。
在本实施例中,具体的,在采集到语音信息之后,可以采用自然语言识别技术对采集的语音信息进行识别,得到对应的文本信息。
例如,获取到语音信息“我们这个机器人可以替企业做引领工作你看哈带我去咖啡厅”,进而利用现有技术中的自然语言识别技术,对该语音信息进行识别,得到对应的文本信息。
步骤103、确定文本信息是否符合预设的文本通配规则中的通配语句,其中,文本通配规则中包括至少一个通配语句,每一个通配语句中包括至少一个关键词和至少一个通配字符。
可选的,通配字符在通配语句中的位置符合以下规则中至少一种:每一个通配语句中的相邻关键字之间具有通配字符;每一个通配语句的开头具有通配字符;每一个通配语句的结尾具有通配字符。
可选的,文本信息与文本信息符合的通配语句之间符合以下要求中的至少一种:文本信息包括文本信息符合的通配语句所包括的各关键字;文本信息所包括的各关键字的次序与文本信息符合的通配语句所包括的各关键字的次序相同;文本信息所包括的各关键字中,相邻关键字之间的间隔字符的长度,属于文本信息符合的通配语句所包括的对应相邻关键字之间的通配字符表征的长度范围,其中,相邻关键字与对应相邻关键字相同。
在本实施例中,具体的,已经预先配置了文本通配规则,文本通配规则中包括N个通配语句,N为大于等于1的正整数;每一个通配语句由至少一个关键词和至少一个通配字符构成。
每一个通配语句可以符合以下规则中的至少一种:
第一种规则,通配语句中的相邻关键字之间的具有一个或多个通配字符;
第二种规则,通配语句中开头具有一个或多个通配字符;
第三种规则,通配语句中结尾具有一个或多个通配字符。
举例来说,通配语句为“<0-20>能不能<0-20>”,其中,“能不能”为关键字,通配语句的开头可以具有通配字符,通配语句的结尾可以具有通配字符。
又举例来说,通配语句为“我<0-5>想<0-5>去<0-20>”,其中,“我”、“想”、“去”为关键字;通配语句的结尾可以具有通配字符,关键字“我”与“想”之间可以具有通配字符,关键字“想”与“去”之间可以具有通配字符。
再举例来说,通配语句为“<0-20>带我<0-5>去<0-5>”,其中,“带”、“我”、“去”为关键字;通配语句的开头可以具有通配字符,通配语句的结尾可以具有通配字符,关键字“我”与“去”之间可以具有通配字符。
可以将文本信息与文本通配规则中的各个通配语句进行对比分析,确定文本信息是否符合文本通配规则中的通配语句。
实际实施时,在判断文本信息是否符合某一个通配语句的时候,可以判断文本信息与该通配语句之间是否符合以下预设条件:
第一种预设条件为,文本信息包括了该通配语句中的各个关键字;
第二种预设条件为,文本信息所包括的各关键字的次序与该通配语句所包括的各关键字的次序是相同的;
第三种预设条件为,文本信息中的相邻关键字之间的间隔字符的长度,是属于该通配语句中的对应相邻关键字之间的通配字符表征的长度范围的,其中,相邻关键字与对应相邻关键字是相同。
举例来说,若文本信息包括某一个通配语句中的各个关键字,并且,文本信息所包括的各关键字的次序与该通配语句所包括的各关键字的次序是相同的,同时,文本信息中的相邻关键字之间的间隔字符的长度,是属于该通配语句中的对应相邻关键字之间的通配字符表征的长度范围的,则文本信息是符合该通配语句的。例如,文本信息为“我们这个机器人可以替企业做引领工作你看哈带我去咖啡厅”,通配语句为“<0-22>带我<0-5>去<0-5>”,可以确定通配语句的关键字为“带”、“我”、“去”,文本信息中包括这几个关键字;并且,关键字“带”、“我”、“去”在文本信息中次序与在通配语句中的次序是相同的;同时,文本信息的开头的字符的长度为20,20是在通配语句的开头的通配字符表征的长度范围<0-22>之内的;文本信息中的关键字“带”和“我”之间的间隔字符的长度为0,通配语句中的关键字“带”和“我”之间不具有通配字符;文本信息中的关键字“我”和“去”之间的间隔字符的长度为0,通配语句中的关键字“我”和“去”之间的通配字符表征的长度范围为<0-5>,0是在该长度范围之内的;文本信息的结尾的字符的长度为3,3是在通配语句的结尾的通配字符表征的长度范围<0-5>之内的;然后,可以确定文本信息是符合该通配语句的。
步骤104、若文本信息符合文本通配规则中的一个或多个通配语句,则根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
在本实施例中,具体的,根据步骤103的具体过程,若确定文本信息符合文本通配规则中的一个或多个通配语句,则可以确定文本信息符合文本通配规则;然后,就可以选择出文本信息符合的通配语句中的一个通配语句,根据该通配语句所包括的各关键词,确定语义分析结果。
本实施例,通过提供了一种文本通配规则,文本通配规则中包括至少一个通配语句;在确定语音信息对应的文本信息符合文本通配规则中的通配语句的时,可以直接根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定出语义分析结果;从而可以快速、正确的分析出用户的语义,正确的理解用户意图;即使在较为嘈杂的环境,采集到较为杂乱的语音的时候,也可以快速、正确的分析出用户的语义,提高了用户体验。
图2为本申请实施例提供的另一种语义处理方法的流程示意图。如图2所示,该方法包括:
步骤201、获取语音信息。
本步骤可以参见图1的步骤101,不再赘述。
步骤202、对语音信息进行语音识别,得到文本信息。
本步骤可以参见图1的步骤102,不再赘述。
步骤203、确定文本信息是否符合预设的文本通配规则中的通配语句,其中,文本通配规则中包括至少一个通配语句,每一个通配语句中包括至少一个关键词和至少一个通配字符。
本步骤可以参见图1的步骤103,不再赘述。
步骤204、若文本信息符合文本通配规则中的一个或多个通配语句,则根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
可选的,步骤204具体包括以下步骤:
若文本信息符合文本通配规则中的一个通配语句,则根据一个通配语句所包括的各关键词,确定语义分析结果。
若文本信息符合文本通配规则中的多个通配语句,确定多个通配语句中优先级最高的通配语句;根据优先级最高的通配语句所包括的各关键,确定语义分析结果。
在本实施例中,具体的,参照图1所示的实施例,在确定出文本信息符合文本通配规则中的一个或多个通配语句的时候,确定文本信息符合文本通配规则。
此时,若文本信息只符合一个通配语句,就可以直接根据该通配语句所包括的各关键词,确定出语义分析结果。
若文本信息符合多个通配语句,则由于为文本通配规则中每一个通配语句设置了优先级,那么可以选择出文本信息符合的多个通配语句中优先级最高的通配语句;然后,根据该优先级最高的通配语句所包括的各关键词,确定出语义分析结果。
举例来说,文本信息符合通配语句A、通配语句B、通配语句C,其中,通配语句B的优先级最高;则根据通配语句B所包括的各关键词,确定出语义分析结果。
可选的,步骤204在确定语义分析结果的时候,若根据文本信息符合的通配语句中的一个通配语句所包括的各关键词能够组成完整语义,则可以直接根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,组成语义分析结果。
可选的,步骤204在确定语义分析结果的时候,若根据文本信息符合的通配语句中的一个通配语句所包括的各关键词不能够组成完整语义,需要从文本信息中再提取目标词才能够和各关键词组成完整语义,可以执行以下步骤:
第一步骤:根据文本信息符合的通配语句中的一个通配语句,获取文本信息中的目标词。
举例来说,文本信息为“好饿啊你带那个今天早上我吃饭了没去咖啡厅”;参照图1的方法,可以确定文本信息符合通配语句“<0-20>带我<0-5>去<0-5>[destination]{destination}<0-5>”;根据该通配语句,可以直接确定对应的目标词为地点词,具体为“咖啡厅”。
第二步骤:根据文本信息符合的通配语句中的一个通配语句所包括的各关键词和目标词,确定语义分析结果。
在获取到了文本信息的各关键词和目标词之后,根据各关键词和目标词,确定出语义分析结果。例如,可以直接根据各关键词、目标词、以及各关键词和目标词之间次序,构成语义分析结果。
可选的,获取文本信息中的目标词,也可以参照以下方式。
根据文本信息符合的一个通配语句中的关键词,确定出通配语句的意图信息;或者,预先建立通配语句与意图信息之间的对应关系,可以直接确定出与该通配语句对应的意图信息。其中,意图信息可以包括引领信息等等,即意图信息指示出了通配语句的语句类别。然后,可以根据意图信息确定目标词,从文本信息中提取具体的目标词。
举例来说,文本信息为“好饿啊你带那个今天早上我吃饭了没去咖啡厅”;参照图1的方法,可以确定文本信息符合通配语句“<0-20>带我<0-5>去<0-5>”;由于预先建立了通配语句和意图信息的对应关系,对应关系例如为通配语句“<0-20>带我<0-5>去<0-5>”的意图信息为引领,从而可以确定出通配语句“<0-20>带我<0-5>去<0-5>”的意图信息为引领,对应的目标词为地点词;然后,获取到文本信息中的地点词为“咖啡厅”。
若文本信息中包含了多个目标词,可以根据预先设定的目标词与优先级的对应关系,选择优先级最高的目标词作为最终用于确定语义分析结果的目标词。
举例来说,若上述例子中获取到文本信息中的地点词不仅仅包括“咖啡厅”,还包括“展厅”、“会议室”,共三个地点词,而根据预先设定的地点词和优先级的对应关系,优先级最高的地点词为“会议室”,则将“会议室”作为最终用于确定语义分析结果的地点词。
步骤205、若文本信息不符合文本通配规则中的所有通配语句,则采用自然语言理解技术对文本信息进行语义理解,得到语义分析结果。
在本实施例中,具体的,若确定文本信息不符合文本通配规则中的所有通配语句,那么确定文本信息不符合文本通配规则,此时无法采用文本通配规则中的通配语句去确定语义分析结果。此时,可以采用现有的自然语言理解技术对文本信息进行语义理解,进而得到语义分析结果。
步骤206、接收修正指令。
在本实施例中,具体的,用户可以对语义分析结果进行修正。用户可以通过语音、手势、触控等方式,发送修正指令。
步骤207、根据修正指令对语义分析结果进行修正,得到修正后的语义分析结果。
在本实施例中,具体的,在步骤206之后,可以对语义分析结果进行修正;然后,存储修正后的语义分析结果。
举例来说,得到语义分析结果“带我去咖啡厅”;用户对语义分析结果进行修正,得到修正后的语义分析结果“带我们一起去咖啡厅”。
本实施例,通过提供一种文本通配规则,文本通配规则中包括至少一个通配语句;在确定语音信息对应的文本信息符合文本通配规则中的通配语句的时,可以直接根据文本信息符合的通配语句中的一个通配语句所包括的各关键词;并且,可以识别出文本信息中的目标词,然后,根据文本信息的各关键词和目标词,确定出语义分析结果。从而可以快速、正确的分析出用户的语义,正确的理解用户意图,正确的识别出用户的意图目标,进而便于为用户提供服务;即使在较为嘈杂的环境,采集到较为杂乱的语音的时候,也可以快速、正确的分析出用户的语义,提高了用户体验。
图3为本申请实施例提供的一种语义处理装置的结构示意图,如图3所示,本实施例提供的语义处理装置,包括:
获取单元31,用于获取语音信息。
识别单元32,用于对语音信息进行语音识别,得到文本信息。
第一确定单元33,用于确定文本信息是否符合预设的文本通配规则中的通配语句,其中,文本通配规则中包括至少一个通配语句,每一个通配语句中包括至少一个关键词和至少一个通配字符。
第二确定单元34,用于若文本信息符合文本通配规则中的一个或多个通配语句,则根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
本实施例提供的语义处理装置,同于实现前述任一实施例提供的语义处理方法中的技术方案,其实现原理类似,不再赘述。
图4为本申请实施例提供的另一种语义处理装置的结构示意图,在图3所示实施例的基础上,如图4所示,本实施例提供的语义处理装置中,第二确定单元34,具体用于:
若文本信息符合文本通配规则中的一个通配语句,则根据一个通配语句所包括的各关键词,确定语义分析结果;若文本信息符合文本通配规则中的多个通配语句,确定多个通配语句中优先级最高的通配语句;根据优先级最高的通配语句所包括的各关键,确定语义分析结果。
文本信息与文本信息符合的通配语句之间符合以下要求中的至少一种:文本信息包括文本信息符合的通配语句所包括的各关键字;文本信息所包括的各关键字的次序与文本信息符合的通配语句所包括的各关键字的次序相同;文本信息所包括的各关键字中,相邻关键字之间的间隔字符的长度,属于文本信息符合的通配语句所包括的对应相邻关键字之间的通配字符表征的长度范围,其中,相邻关键字与对应相邻关键字相同。
第二确定单元34,包括:
获取模块341,用于根据文本信息符合的通配语句中的一个通配语句,获取文本信息中的目标词。
确定模块342,用于根据文本信息符合的通配语句中的一个通配语句所包括的各关键词和目标词,确定语义分析结果。
获取模块341,具体用于:确定文本信息符合的通配语句中的一个通配语句的意图信息;获取文本信息中与意图信息对应的目标词。
通配字符在通配语句中的位置符合以下规则中至少一种:每一个通配语句中的相邻关键字之间具有通配字符;每一个通配语句的开头具有通配字符;每一个通配语句的结尾具有通配字符。
本申请实施例提供的装置,还包括:
接收单元41,用于在第二确定单元34根据文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果之后,接收修正指令;
修正单元42,用于根据修正指令对语义分析结果进行修正,得到修正后的语义分析结果。
本申请实施例提供的装置,还包括:
第三确定单元43,用于若文本信息不符合文本通配规则中的所有通配语句,则采用自然语言理解技术对文本信息进行语义理解,得到语义分析结果。
本实施例提供的语义处理装置,同于实现前述任一实施例提供的语义处理方法中的技术方案,其实现原理类似,不再赘述。
图5为本申请实施例提供的一种电子设备的结构示意图,如图5所示,该电子设备,包括:发送器71、接收器72、存储器73和处理器74;
存储器73用于存储计算机指令;处理器74用于运行存储器73存储的计算机指令实现前述实施例提供任一实现方式的语义处理方法的技术方案。
该电子设备具体可以为能够采集用户语音信息的智能语音设备,可以包括但不限于为机器人、智能音箱等,也可以为与智能语音设备通信的外部设备,可以包括但不限于为服务器等。
本申请还提供一种存储介质,其特征在于,包括:可读存储介质和计算机指令,计算机指令存储在可读存储介质中;计算机指令用于实现前述例提供的任一实现方式的语义处理方法的技术方案。
在上述电子设备的具体实现中,应理解,处理器74可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(英文:read-only memory,缩写:ROM)、RAM、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetictape)、软盘(英文:floppy disk)、光盘(英文:optical disc)及其任意组合。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种语义处理方法,其特征在于,包括:
获取语音信息;
对所述语音信息进行语音识别,得到文本信息;
确定所述文本信息是否符合预设的文本通配规则中的通配语句,其中,所述文本通配规则中包括至少一个通配语句,每一个所述通配语句中包括至少一个关键词和至少一个通配字符,所述通配字符用于表征对应位置非关键词的字符长度范围;
若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
2.根据权利要求1所述的方法,其特征在于,若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果,包括:
若所述文本信息符合所述文本通配规则中的一个通配语句,则根据所述一个通配语句所包括的各关键词,确定语义分析结果;
若所述文本信息符合所述文本通配规则中的多个通配语句,确定所述多个通配语句中优先级最高的通配语句;根据所述优先级最高的通配语句所包括的各关键词,确定语义分析结果。
3.根据权利要求1所述的方法,其特征在于,所述文本信息与所述文本信息符合的通配语句之间符合以下要求中的至少一种:
所述文本信息包括所述文本信息符合的通配语句所包括的各关键字;
所述文本信息所包括的所述各关键字的次序与所述文本信息符合的通配语句所包括的各关键字的次序相同;
所述文本信息所包括的所述各关键字中,相邻关键字之间的间隔字符的长度,属于所述文本信息符合的通配语句所包括的对应相邻关键字之间的通配字符表征的长度范围,其中,所述相邻关键字与所述对应相邻关键字相同。
4.根据权利要求1所述的方法,其特征在于,根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果,包括:
根据所述文本信息符合的通配语句中的一个通配语句,获取所述文本信息中的目标词;
根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词和所述目标词,确定语义分析结果。
5.根据权利要求4所述的方法,其特征在于,根据所述文本信息符合的通配语句中的一个通配语句,获取所述文本信息中的目标词,包括:
确定所述文本信息符合的通配语句中的一个通配语句的意图信息;
获取所述文本信息中与所述意图信息对应的目标词。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述通配字符在通配语句中的位置符合以下规则中至少一种:
每一个所述通配语句中的相邻关键字之间具有所述通配字符;
每一个所述通配语句的开头具有所述通配字符;
每一个所述通配语句的结尾具有所述通配字符。
7.根据权利要求1-5任一项所述的方法,其特征在于,在根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果之后,还包括:
接收修正指令;
根据所述修正指令对所述语义分析结果进行修正,得到修正后的语义分析结果。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述方法,还包括:
若所述文本信息不符合所述文本通配规则中的所有通配语句,则采用自然语言理解技术对所述文本信息进行语义理解,得到语义分析结果。
9.一种语义处理装置,其特征在于,包括:
获取单元,用于获取语音信息;
识别单元,用于对所述语音信息进行语音识别,得到文本信息;
第一确定单元,用于确定所述文本信息是否符合预设的文本通配规则中的通配语句,其中,所述文本通配规则中包括至少一个通配语句,每一个所述通配语句中包括至少一个关键词和至少一个通配字符,所述通配字符用于表征对应位置非关键词的字符长度范围;
第二确定单元,用于若所述文本信息符合所述文本通配规则中的一个或多个通配语句,则根据所述文本信息符合的通配语句中的一个通配语句所包括的各关键词,确定语义分析结果。
10.根据权利要求9所述的装置,其特征在于,所述第二确定单元,具体用于:
若所述文本信息符合所述文本通配规则中的一个通配语句,则根据所述一个通配语句所包括的各关键词,确定语义分析结果;
若所述文本信息符合所述文本通配规则中的多个通配语句,确定所述多个通配语句中优先级最高的通配语句;根据所述优先级最高的通配语句所包括的各关键词,确定语义分析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811652978.0A CN109753659B (zh) | 2018-12-28 | 2018-12-28 | 语义处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811652978.0A CN109753659B (zh) | 2018-12-28 | 2018-12-28 | 语义处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109753659A CN109753659A (zh) | 2019-05-14 |
CN109753659B true CN109753659B (zh) | 2023-08-04 |
Family
ID=66404984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811652978.0A Active CN109753659B (zh) | 2018-12-28 | 2018-12-28 | 语义处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109753659B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827807B (zh) * | 2019-11-29 | 2022-03-25 | 恒信东方文化股份有限公司 | 一种语音识别的方法及其系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004294542A (ja) * | 2003-03-25 | 2004-10-21 | Mitsubishi Electric Corp | 音声認識装置及びそのプログラム |
CN101154379A (zh) * | 2006-09-27 | 2008-04-02 | 夏普株式会社 | 定位语音中的关键词的方法和设备以及语音识别系统 |
CN103246641A (zh) * | 2013-05-16 | 2013-08-14 | 李营 | 一种文本语义信息分析系统和方法 |
JP2013225200A (ja) * | 2012-04-20 | 2013-10-31 | Ntt Comware Corp | 意味的対応付け装置及びその処理方法とプログラム |
CN107316643A (zh) * | 2017-07-04 | 2017-11-03 | 科大讯飞股份有限公司 | 语音交互方法及装置 |
CN108962282A (zh) * | 2018-06-19 | 2018-12-07 | 京北方信息技术股份有限公司 | 语音检测分析方法、装置、计算机设备及存储介质 |
-
2018
- 2018-12-28 CN CN201811652978.0A patent/CN109753659B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004294542A (ja) * | 2003-03-25 | 2004-10-21 | Mitsubishi Electric Corp | 音声認識装置及びそのプログラム |
CN101154379A (zh) * | 2006-09-27 | 2008-04-02 | 夏普株式会社 | 定位语音中的关键词的方法和设备以及语音识别系统 |
JP2013225200A (ja) * | 2012-04-20 | 2013-10-31 | Ntt Comware Corp | 意味的対応付け装置及びその処理方法とプログラム |
CN103246641A (zh) * | 2013-05-16 | 2013-08-14 | 李营 | 一种文本语义信息分析系统和方法 |
CN107316643A (zh) * | 2017-07-04 | 2017-11-03 | 科大讯飞股份有限公司 | 语音交互方法及装置 |
CN108962282A (zh) * | 2018-06-19 | 2018-12-07 | 京北方信息技术股份有限公司 | 语音检测分析方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109753659A (zh) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113327609B (zh) | 用于语音识别的方法和装置 | |
EP3477635B1 (en) | System and method for natural language processing | |
US20160372110A1 (en) | Adapting voice input processing based on voice input characteristics | |
WO2016023317A1 (zh) | 一种语音信息的处理方法及终端 | |
WO2018153316A1 (zh) | 获取文本提取模型的方法及装置 | |
EP3915104A1 (en) | Word lattice augmentation for automatic speech recognition | |
CN108039175B (zh) | 语音识别方法、装置及服务器 | |
JP6625772B2 (ja) | 検索方法及びそれを用いた電子機器 | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
CN111881297A (zh) | 语音识别文本的校正方法及装置 | |
CN111046060A (zh) | 一种基于Elasticsearch的数据检索方法、装置、设备、介质 | |
CN111768789A (zh) | 电子设备及其语音发出者身份确定方法、装置和介质 | |
KR20190074508A (ko) | 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법 | |
CN109753659B (zh) | 语义处理方法、装置、电子设备和存储介质 | |
CN113053390B (zh) | 基于语音识别的文本处理方法、装置、电子设备及介质 | |
CN110473543A (zh) | 一种语音识别方法、装置 | |
KR102536944B1 (ko) | 음성 신호 처리 방법 및 장치 | |
US10600405B2 (en) | Speech signal processing method and speech signal processing apparatus | |
CN109872718A (zh) | 语音数据的答案获取方法及装置、存储介质、计算机设备 | |
US20190279623A1 (en) | Method for speech recognition dictation and correction by spelling input, system and storage medium | |
CN109960806A (zh) | 一种自然语言处理方法 | |
CN111339790A (zh) | 文本翻译方法、装置、设备及计算机可读存储介质 | |
CN111785259A (zh) | 信息处理方法、装置及电子设备 | |
JP2019109424A (ja) | 計算機、言語解析方法、及びプログラム | |
US11308936B2 (en) | Speech signal processing method and speech signal processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |