CN110704592B - 语句分析处理方法、装置、计算机设备和存储介质 - Google Patents

语句分析处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110704592B
CN110704592B CN201910926276.5A CN201910926276A CN110704592B CN 110704592 B CN110704592 B CN 110704592B CN 201910926276 A CN201910926276 A CN 201910926276A CN 110704592 B CN110704592 B CN 110704592B
Authority
CN
China
Prior art keywords
grained
fine
word
coarse
slot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910926276.5A
Other languages
English (en)
Other versions
CN110704592A (zh
Inventor
孙辉丰
杨煜
孙叔琦
孙珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910926276.5A priority Critical patent/CN110704592B/zh
Publication of CN110704592A publication Critical patent/CN110704592A/zh
Application granted granted Critical
Publication of CN110704592B publication Critical patent/CN110704592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Abstract

本发明公开了一种语句分析处理方法、装置、计算机设备和存储介质。其中,该方法可包括:获取用户的查询语句;根据查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,细粒度词槽为粗粒度词槽的内部结构槽位;根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。该方法通过用户的查询语句,可确定查询语句对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。

Description

语句分析处理方法、装置、计算机设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种语句分析处理方法、装置、计算机设备和存储介质。
背景技术
在人机对话系统中,词槽对于语句的理解以及接下来的应答至关重要。例如查询语句为“北京明天天气怎么样”,可知用户意图是在查询天气情况,其中,查询地点、时间的天气情况就需要给出对应的词槽,即给出地点槽位“北京”,时间槽位“明天”,这样可以针对性地查询天气情况。
相关技术中,对话系统在对查询语句进行分析处理时,通常给出查询语句对应的一个长片段词槽或多个小片段词槽,其中,给出一个长片段词槽时,可直接去查询,但是查询接口无法直接接收大片段地点的查询;给出多个小片段词槽时,无法获知两个地点槽位的关系,无法判断具体选择哪个词槽去查询,且对话系统中通常会配置对话模板来识查询语句的意图,当槽位无法命中模板时,这样就增加了配置模板的复杂程度。因此,如何能够得到查询语句的最佳词槽以使用户灵活使用,已经成为亟待解决的问题。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种语句分析处理方法,该方法无需增加更多的配置模板,用户使用起来更加灵活,增加了用户体验。
本发明的第二个目的在于提出一种语句分析处理装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达到上述目的,本发明第一方面实施例提出的一种语句分析处理方法,包括:获取用户的查询语句;根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,所述细粒度词槽为所述粗粒度词槽的内部结构槽位;根据所述粗粒度词槽和细粒度词槽,生成所述查询语句对应的目标词槽。
根据本发明实施例的语句分析处理方法,可获取用户的查询语句,之后根据查询语句确定出对应的粗粒度词槽和细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位,然后根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。该方法通过用户的查询语句,可确定查询语句对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。
为达到上述目的,本发明第二方面实施例提出的一种语句分析处理装置,包括:查询语句获取模块,用于获取用户的查询语句;词槽确定模块,用于根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,所述细粒度词槽为所述粗粒度词槽的内部结构槽位;目标词槽生成模块,用于根据所述粗粒度词槽和细粒度词槽,生成所述查询语句对应的目标词槽。
根据本发明实施例的语句分析处理装置,可获取用户的查询语句,之后根据查询语句确定出对应的粗粒度词槽和细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位,然后根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。由此,通过用户的查询语句,可确定查询语句对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。
为达到上述目的,本发明第三方面实施例提出的计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本发明第一方面实施例所述的语句分析处理方法。
为达到上述目的,本发明第四方面实施例提出的计算机可读存储介质,所述计算机程序被处理器执行时实现本发明第一方面实施例所述的语句分析处理方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的语句分析处理方法的流程图。
图2是根据本发明一个具体实施例的语句分析处理方法的流程图。
图3是根据本发明一个具体实施例的语句分析处理方法的流程图。
图4是根据本发明一个实施例的语句分析处理装置的结构示意图。
图5是根据本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
相关技术中,例如,查询语句为“北京市海淀区明天天气怎么样”,此时可以将“北京市海淀区”合并识别为一个地点槽位,也可以分别将“北京市”和“海淀区”识别为两个地点槽位。其中,如果识别为一个地点槽位的可直接去查询,但是查询接口无法直接接收大片段地点的查询;如果识别为两个地点槽位,无法获知两个地点槽位的关系,且无法判断具体选择哪个地点去查询;而且在对话系统中,通常会配置对话模板来识query的意图,如利用模板“{地点}{时间}天气怎么样”来识别“北京市海淀区明天”查询天气的意图,其中,“北京市”和“海淀区”两个地点槽位就无法命中此模板,这样就增加了配置模板的复杂程度。
本发明提出了一种语句分析处理方法、装置、计算机设备和计算机可读存储介质,本发明解决了相关技术中对话系统均单独给出大片段词槽时,查询接口无法直接接收大片段地点的查询;多个词槽平行,无法获知词槽间的关联关系,无法判断选择哪个词槽进行操作;且槽位无法命中模板时,增加了配置模板的复杂程度等技术问题。具体地,下面参考附图描述本发明实施例的语句分析处理方法、装置、计算机设备和计算机可读存储介质。
图1是根据本发明一个实施例的语句分析处理方法的流程图。需要说明的是,本发明实施例的语句分析处理方法可应用于本发明实施例的语句分析处理装置,该装置可被配置于计算机设备上。
如图1所示,该语句分析处理方法可以包括:
S110,获取用户的查询语句。
需要说明的是,本发明实施例的语句分析处理方法适用于人机对话系统中。
举例而言,在人机对话系统中,人机对话系统可向用户提供文本输入框,用户可通过该输入框输入查询语句文本,例如,该查询语句文本为“查询北京市海淀区明天的天气”,这样,人机对话系统可获取用户输入的“查询北京市海淀区明天的天气”的查询语句。
其中,可以理解,该人机对话系统的服务端可部署在计算机设备上,该人机对话系统的客户端可安装于移动终端,例如,该移动终端可接收到该用户输入的查询语句之后,可将该查询语句上传至人机对话系统的服务端,从而使得人机对话系统的服务端获得用户的查询语句,以便后续对该查询语句进行分析以得到对应的目的词槽。其中,该移动终端可包括但不仅限于手机、平板电脑等硬件设备。
S120,根据查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,细粒度词槽为粗粒度词槽的内部结构槽位。
在本发明的实施例中,可获取第一序列化标注模型,其中,第一序列化标注模型为使用已标注的第一训练语料预先训练,其中,第一训练语料中的已标注标签为粗粒度标签,然后通过第一序列化标注模型对查询语句进行命名实体识别标注,以便第一序列化标注模型针对查询语句文本中具有特定意义的实体进行识别标注,得到查询语句对应的粗粒度词槽。同时,还可根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽。
举例而言,可通过第一序列化标注模型对查询语句“查询北京市海淀区明天的天气”进行命名实体识别,得到对应的粗粒度词槽,即地点槽位为“北京市海淀区”、时间槽位为“明天”,并根据预设策略对该查询语句进行分析处理,得到对应的细粒度词槽。
在本发明的实施例中,可通过以下两种方式来实现所述根据预设策略对查询语句进行分析处理,得到对应的细粒度词槽的步骤:
作为一种示例,当预设策略为采用第二序列化标注模型标注识别方式时,可获取第二序列化标注模型,第二序列化标注模型为使用已标注的第二训练语料预先训练,其中,第二训练语料中的已标注标签为细粒度标签,然后根据第二序列化标注模型对查询语句进行标注,得到对应的细粒度词槽。
也就是说,可获取第二序列化标注模型,然后通过第二序列化标注模型对查询语句进行分词实体识别,以便第二序列化标注模型针对查询语句文本中具有特定意义的实体进行分词识别,得到查询语句对应的细粒度词槽。
举例而言,可通过第二序列化标注模型对查询语句“查询北京市海淀区明天的天气”进行分词实体识别,得到对应的细粒度词槽,即城市槽位为“北京市”、区县槽位为“海淀区”、时间槽位为“明天”。
可以理解,在本发明的实施例中,还可根据具体实际应用情况,通过第二序列化标注模型对时间槽位为“明天”进行进一步细粒度识别标注,得到对应的细粒度词槽,如“明天上午”、“明天下午”。
作为另一种示例,当预设策略为采用领域词典匹配方式时,可确定查询语句所对应的领域类型,之后根据领域类型获取对应的领域词典,然后根据领域词典对查询语句进行字典匹配,得到对应的细粒度词槽。
举例而言,可确定查询语句“查询北京市海淀区明天的天气”所对应的领域类型为天气,之后根据天气领域获取对应的领域字典,其中,领域字典包括但不仅限于城市、区县、日期、气温等信息,然后根据领域词典对查询语句进行字典匹配,可得到对应的细粒度词槽,即城市槽位为“北京市”、区县槽位为“海淀区”、时间槽位为“明天”。
需要说明的是,在本发明的实施例中,第一序列化标注模型和第二序列化标注模型均为采用已标注的训练语料预先训练得到的序列标注模型,其中,第一序列化标注模型可以用于对输入的查询语句进行粗粒度的实体标签标注,以得到相应的粗粒度词槽;第二序列化标注模型可以用于对输入的查询语句进行细粒度的实体标签标注,以得到相应的细粒度词槽。
S130,根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。
也就是说,在本发明的实施例中,可将粗粒度词槽和细粒度词槽进行合并操作,合并后得到的词槽确定为查询语句对应的目标词槽。
根据本发明实施例的语句分析处理方法,可获取用户的查询语句,之后根据查询语句确定出对应的粗粒度词槽和细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位,然后根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。该方法通过用户的查询语句,可确定查询语句对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。
图2是根据本发明一个具体实施例的语句分析处理方法的流程图。如图2和如图3所示,该语句分析处理方法可以包括:
S210,获取用户的查询语句。
举例而言,在人机对话系统中,人机对话系统可向用户提供文本输入框,用户可通过该输入框输入查询语句文本,例如,该查询语句文本为“查询北京市海淀区明天的天气”,这样,人机对话系统可获取用户输入的“查询北京市海淀区明天的天气”的查询语句。
其中,可以理解,该人机对话系统的服务端可部署在计算机设备上,该人机对话系统的客户端可安装于移动终端,例如,该移动终端可接收到该用户输入的查询语句之后,可将该查询语句上传至人机对话系统的服务端,从而使得人机对话系统的服务端获得用户的查询语句,以便后续对该查询语句进行分析以得到对应的目的词槽。其中,该移动终端可包括但不仅限于手机、平板电脑等硬件设备。
S220,获取第一序列化标注模型,根据第一序列化标注模型对查询语句进行标注,得到对应的粗粒度词槽。
在本发明的实施例中,可获取第一序列化标注模型,然后通过第一序列化标注模型对查询语句进行命名实体识别标注,以便第一序列化标注模型针对查询语句文本中具有特定意义的实体进行识别标注,得到查询语句对应的粗粒度词槽。
举例而言,可通过第一序列化标注模型对查询语句“查询北京市海淀区明天的天气”进行命名实体识别,得到对应的粗粒度词槽,即地点槽位为“北京市海淀区”、时间槽位为“明天”。
S230,获取第二序列化标注模型,根据第二序列化标注模型对查询语句进行标注,得到对应的细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位。
在本发明的实施例中,可获取第二序列化标注模型,然后通过第二序列化标注模型对查询语句进行分词实体识别,以便第二序列化标注模型针对查询语句文本中具有特定意义的实体进行分词识别,得到查询语句对应的细粒度词槽。
举例而言,可通过第二序列化标注模型对查询语句“查询北京市海淀区明天的天气”进行分词实体识别,得到对应的细粒度词槽,即城市槽位为“北京市”、区县槽位为“海淀区”、时间槽位为“明天”。
S240,将粗粒度词槽和细粒度词槽进行合并操作。
在本发明的实施例中,当粗粒度词槽和细粒度词槽中存在字词一致的词槽时,将粗粒度词槽和细粒度词槽中的字词一致的词槽进行去重,当细粒度词槽中的字词被粗粒度词槽中的字词完全覆盖时,将细粒度词槽作为粗粒度词槽的子槽位。
例如,假设查询语句为“查询北京市海淀区明天的天气”,得到粗粒度词槽:地点槽位“北京市海淀区”、时间槽位为“明天”;得到细粒度词槽:城市槽位为“北京市”、区县槽位为“海淀区”、时间槽位为“明天”,将粗粒度词槽和细粒度词槽进行合并时,细粒度词槽中的时间槽位与粗粒度词槽中的时间槽位的字词一致,此时可对其进行去重;细粒度词槽中的城市槽位、区县槽位的字符完全被粗粒度词槽中的地点槽位字词覆盖,此时可将细粒度词槽作为粗粒度词槽的子槽位,即将粗粒度词槽中的地点槽位作为父词槽,细粒度词槽中的城市槽位、区县槽位作为该地点槽位的子槽位,最终可得到该查询语句的目标词槽可如图3所示。
S250,合并后得到的词槽确定为查询语句对应的目标词槽。
根据本发明实施例的语句分析处理方法,可获取用户的查询语句,获取第一序列化标注模型,根据第一序列化标注模型对查询语句进行标注,得到对应的粗粒度词槽,获取第二序列化标注模型,根据第二序列化标注模型对查询语句进行标注,得到对应的细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位,之后将粗粒度词槽和细粒度词槽进行合并操作,合并后得到的词槽确定为查询语句对应的目标词槽。该方法通过第一序列化标注模型和第二序列化标注模型对用户的查询语句进行标注,得到对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。
与上述几种实施例提供的语句分析处理方法相对应,本发明的一种实施例还提供一种语句分析处理装置,由于本发明实施例提供的语句分析处理装置与上述几种实施例提供的语句分析处理方法相对应,因此在语句分析处理方法的实施方式也适用于本实施例提供的语句分析处理装置,在本实施例中不再详细描述。图4是根据本发明一个实施例的语句分析处理装置的结构示意图。
如图4所示,该语句分析处理装置400包括:查询语句获取模块410、词槽确定模块420和目标词槽生成模块430。其中:
查询语句获取模块410用于获取用户的查询语句;
词槽确定模块420用于根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,所述细粒度词槽为所述粗粒度词槽的内部结构槽位。
在本发明的实施例中,所述词槽确定模块420包括:标注模型获取单元,用于获取第一序列化标注模型;所述第一序列化标注模型为使用已标注的第一训练语料预先训练,其中,所述第一训练语料中的已标注标签为粗粒度标签;第一确定单元,用于根据所述第一序列化标注模型对所述查询语句进行标注,得到对应的粗粒度词槽;第二确定单元,用于根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽。其中,所述预设策略为采用第二序列化标注模型标注识别方式,所述第二确定单元具体用于:获取第二序列化标注模型;所述第二序列化标注模型为使用已标注的第二训练语料预先训练,其中,所述第二训练语料中的已标注标签为细粒度标签;根据所述第二序列化标注模型对所述查询语句进行标注,得到对应的细粒度词槽。所述预设策略为采用领域词典匹配方式,所述第二确定单元具体用于:确定所述查询语句所对应的领域类型;根据所述领域类型获取对应的领域词典;根据所述领域词典对所述查询语句进行字典匹配,得到对应的细粒度词槽。
目标词槽生成模块430用于根据所述粗粒度词槽和细粒度词槽,生成所述查询语句对应的目标词槽。作为一种示例,所述目标词槽生成模块具体用于:将所述粗粒度词槽和所述细粒度词槽进行合并操作,合并后得到的词槽确定为所述查询语句对应的目标词槽。
在本发明的实施例中,所述目标词槽生成模块430具体用于:当所述粗粒度词槽和所述细粒度词槽中存在字词一致的词槽时,将所述粗粒度词槽和所述细粒度词槽中的所述字词一致的词槽进行去重;当所述细粒度词槽中的字词被所述粗粒度词槽中的字词完全覆盖时,将所述细粒度词槽作为所述粗粒度词槽的子槽位。
根据本发明实施例的语句分析处理装置,可获取用户的查询语句,之后根据查询语句确定出对应的粗粒度词槽和细粒度词槽,其中,细粒度词槽为粗粒度词槽的内部结构槽位,然后根据粗粒度词槽和细粒度词槽,生成查询语句对应的目标词槽。由此,通过用户的查询语句,可确定查询语句对应的粗粒度词槽,同时可得到作为粗粒度词槽的内部结构槽位的细粒度词槽,体现了粗粒度词槽与细粒度词槽的关联关系,无需增加更多的配置模板,并根据细粒度词槽和粗粒度词槽生成查询语句的最佳词槽,使得用户使用起来更加灵活,增加了用户体验。
为了实现上述实施例,本发明还提出了一种计算机设备。
图5是根据本发明一个实施例的计算机设备的结构示意图。如图5所示,该计算机设备500可以包括:存储器510、处理器520及存储在存储器510上并可在处理器520上运行的计算机程序530,处理器520执行程序时,实现本发明上述任一项所述的语句分析处理方法。
为了实现上述实施例,本发明还提出了一种计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一项所述的语句分析处理装置方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种语句分析处理方法,其特征在于,包括:
获取用户的查询语句;
根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,所述细粒度词槽为所述粗粒度词槽的内部结构槽位;
根据所述粗粒度词槽和细粒度词槽,生成所述查询语句对应的目标词槽,包括:
将所述粗粒度词槽和所述细粒度词槽进行合并操作,合并后得到的词槽确定为所述查询语句对应的目标词槽;
其中,将所述粗粒度词槽和所述细粒度词槽进行合并操作,包括:
当所述粗粒度词槽和所述细粒度词槽中存在字词一致的词槽时,将所述粗粒度词槽和所述细粒度词槽中的所述字词一致的词槽进行去重;
当所述细粒度词槽中的字词被所述粗粒度词槽中的字词完全覆盖时,将所述细粒度词槽作为所述粗粒度词槽的子槽位。
2.根据权利要求1所述的方法,其特征在于,根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽,包括:
获取第一序列化标注模型;所述第一序列化标注模型为使用已标注的第一训练语料预先训练,其中,所述第一训练语料中的已标注标签为粗粒度标签;
根据所述第一序列化标注模型对所述查询语句进行标注,得到对应的粗粒度词槽;
根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽。
3.根据权利要求2所述的方法,其特征在于,所述预设策略为采用第二序列化标注模型标注识别方式;其中,所述根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽,包括:
获取第二序列化标注模型;所述第二序列化标注模型为使用已标注的第二训练语料预先训练,其中,所述第二训练语料中的已标注标签为细粒度标签;
根据所述第二序列化标注模型对所述查询语句进行标注,得到对应的细粒度词槽。
4.根据权利要求2所述的方法,其特征在于,所述预设策略为采用领域词典匹配方式;其中,所述根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽,包括:
确定所述查询语句所对应的领域类型;
根据所述领域类型获取对应的领域词典;
根据所述领域词典对所述查询语句进行字典匹配,得到对应的细粒度词槽。
5.一种语句分析处理装置,其特征在于,包括:
查询语句获取模块,用于获取用户的查询语句;
词槽确定模块,用于根据所述查询语句确定出对应的粗粒度词槽和细粒度词槽;其中,所述细粒度词槽为所述粗粒度词槽的内部结构槽位;
目标词槽生成模块,用于根据所述粗粒度词槽和细粒度词槽,生成所述查询语句对应的目标词槽,包括:将所述粗粒度词槽和所述细粒度词槽进行合并操作,合并后得到的词槽确定为所述查询语句对应的目标词槽;
其中,所述目标词槽生成模块具体用于:
当所述粗粒度词槽和所述细粒度词槽中存在字词一致的词槽时,将所述粗粒度词槽和所述细粒度词槽中的所述字词一致的词槽进行去重;
当所述细粒度词槽中的字词被所述粗粒度词槽中的字词完全覆盖时,将所述细粒度词槽作为所述粗粒度词槽的子槽位。
6.根据权利要求5所述的装置,其特征在于,所述词槽确定模块包括:
标注模型获取单元,用于获取第一序列化标注模型;所述第一序列化标注模型为使用已标注的第一训练语料预先训练,其中,所述第一训练语料中的已标注标签为粗粒度标签;
第一确定单元,用于根据所述第一序列化标注模型对所述查询语句进行标注,得到对应的粗粒度词槽;
第二确定单元,用于根据预设策略对所述查询语句进行分析处理,得到对应的细粒度词槽。
7.根据权利要求6所述的装置,其特征在于,所述预设策略为采用第二序列化标注模型标注识别方式;其中,所述第二确定单元具体用于:
获取第二序列化标注模型;所述第二序列化标注模型为使用已标注的第二训练语料预先训练,其中,所述第二训练语料中的已标注标签为细粒度标签;
根据所述第二序列化标注模型对所述查询语句进行标注,得到对应的细粒度词槽。
8.根据权利要求6所述的装置,其特征在于,所述预设策略为采用领域词典匹配方式;其中,所述第二确定单元具体用于:
确定所述查询语句所对应的领域类型;
根据所述领域类型获取对应的领域词典;
根据所述领域词典对所述查询语句进行字典匹配,得到对应的细粒度词槽。
9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至4中任一所述的语句分析处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一所述的语句分析处理方法。
CN201910926276.5A 2019-09-27 2019-09-27 语句分析处理方法、装置、计算机设备和存储介质 Active CN110704592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910926276.5A CN110704592B (zh) 2019-09-27 2019-09-27 语句分析处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910926276.5A CN110704592B (zh) 2019-09-27 2019-09-27 语句分析处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110704592A CN110704592A (zh) 2020-01-17
CN110704592B true CN110704592B (zh) 2021-06-04

Family

ID=69198274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910926276.5A Active CN110704592B (zh) 2019-09-27 2019-09-27 语句分析处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110704592B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681647B (zh) * 2020-06-10 2023-09-05 北京百度网讯科技有限公司 用于识别词槽的方法、装置、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012030838A1 (en) * 2010-08-30 2012-03-08 Honda Motor Co., Ltd. Belief tracking and action selection in spoken dialog systems
CN109933654A (zh) * 2019-01-30 2019-06-25 神思电子技术股份有限公司 一种基于状态树的对话管理方法
CN110008319A (zh) * 2019-02-27 2019-07-12 百度在线网络技术(北京)有限公司 基于对话模板的模型训练方法和装置
CN110019725A (zh) * 2017-12-22 2019-07-16 科沃斯商用机器人有限公司 人机交互方法、系统及其电子设备
CN110232108A (zh) * 2019-05-13 2019-09-13 华为技术有限公司 人机对话方法以及对话系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012030838A1 (en) * 2010-08-30 2012-03-08 Honda Motor Co., Ltd. Belief tracking and action selection in spoken dialog systems
CN110019725A (zh) * 2017-12-22 2019-07-16 科沃斯商用机器人有限公司 人机交互方法、系统及其电子设备
CN109933654A (zh) * 2019-01-30 2019-06-25 神思电子技术股份有限公司 一种基于状态树的对话管理方法
CN110008319A (zh) * 2019-02-27 2019-07-12 百度在线网络技术(北京)有限公司 基于对话模板的模型训练方法和装置
CN110232108A (zh) * 2019-05-13 2019-09-13 华为技术有限公司 人机对话方法以及对话系统

Also Published As

Publication number Publication date
CN110704592A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN107193865B (zh) 人机交互中自然语言意图理解方法及装置
CN107291822B (zh) 基于深度学习的问题分类模型训练方法、分类方法及装置
CN108009303B (zh) 基于语音识别的搜索方法、装置、电子设备和存储介质
CN107591155B (zh) 语音识别方法及装置、终端及计算机可读存储介质
CN109002510B (zh) 一种对话处理方法、装置、设备和介质
CN110929729B (zh) 图像标注方法、图像标注装置及计算机存储介质
US20190164540A1 (en) Voice recognition system and voice recognition method for analyzing command having multiple intents
CN105279227B (zh) 同音词的语音搜索处理方法及装置
CN110673748B (zh) 输入法中候选长句的提供方法及装置
US20130262093A1 (en) Information extraction in a natural language understanding system
CN108039175B (zh) 语音识别方法、装置及服务器
CN107273883B (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN109616101B (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
WO2022252946A1 (zh) 语音控制方法、语音控制装置、服务器和存储介质
CN112633423B (zh) 文本识别模型的训练方法、文本识别方法、装置及设备
CN106843523B (zh) 基于人工智能的文字输入方法和装置
CN109637529A (zh) 基于语音的功能定位方法、装置、计算机设备及存储介质
CN110704592B (zh) 语句分析处理方法、装置、计算机设备和存储介质
CN110428052B (zh) 深度神经网络模型的构建方法、装置、介质及电子设备
CN110188327B (zh) 文本去口语化方法及装置
CN117216271A (zh) 一种文章文本处理方法、装置以及设备
CN108829896B (zh) 回复信息反馈方法和装置
CN115240659B (zh) 分类模型训练方法、装置、计算机设备及存储介质
CN111143424A (zh) 特征场景数据挖掘方法、装置和终端
AU2021251463B2 (en) Generating performance predictions with uncertainty intervals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant