CN113095089A - 一种语义分析方法及装置 - Google Patents
一种语义分析方法及装置 Download PDFInfo
- Publication number
- CN113095089A CN113095089A CN202110499308.5A CN202110499308A CN113095089A CN 113095089 A CN113095089 A CN 113095089A CN 202110499308 A CN202110499308 A CN 202110499308A CN 113095089 A CN113095089 A CN 113095089A
- Authority
- CN
- China
- Prior art keywords
- information
- semantic
- request information
- key information
- semantic key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000004044 response Effects 0.000 claims description 17
- 238000012549 training Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语义分析方法,该方法包括:获取待分析的请求信息;对请求信息进行分析,得到请求信息的场景类型以及语义关键信息;若语义关键信息与所述场景类型对应的槽位组完全匹配,则根据请求信息的语义关键信息确定请求信息的语义信息。可见,本申请可通过对请求信息进行分析,获取到请求信息中更深层次、更全面的语义关键信息,以及将语义关键信息与所述场景类型对应的槽位组进行匹配,以进一步筛选出能够用于准确识别用户意图的语义关键信息,这样便可根据所述请求信息的语义关键信息确定所述请求信息的语义信息,即确定出用户真实意图,从而可实现有效地分析出用户的请求信息的真正语义,提高识别用户意图的准确性,进而提高用户体验。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语义分析方法及装置。
背景技术
随着人工智能的发展,被誉为“人工智能皇冠上的明珠”的自然语言技术也不断获得突破。在自然语言处理领域中,对话解析有着丰富的使用场景,如个人助理(语音助手)、智能客服、问答系统甚至搜索引擎等。目前,智能机器人和智能对话系统的对话应用一般体现在完成系统设置、简单的问答聊天等,并且目前的对话解析(即语义分析)技术主要基于深度学习算法进行处理,但由于现有深度学习模型关注点较为专一,即一模型一用,兼顾性不足,且现有的多轮对话系统对文本内容关键信息的发掘停留在较浅的层次,导致无法有效地分析出用户对话的真正语义,即无法准确识别用户意图,进而无法准确有效地进行用户意图回复,降低了用户体验。故此,目前亟需一种新的语义分析方案。
发明内容
本发明提供一种语义分析方法及装置,以实现有效地分析出用户的请求信息的真正语义,提高识别用户意图的准确性,进而提高用户体验。
第一方面,本发明提供了一种语义分析方法,所述方法包括:
获取待分析的请求信息;
对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;
若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息,包括:
对所述请求信息进行正则表达式解析,得到所述请求信息的语义关键信息;
若所述语义关键信息包括领域信息和意图信息,根据所述领域信息和所述意图信息,确定所述请求信息的场景类型。
可选的,所述场景类型对应的槽位组包括若干个槽位;所述请求信息的语义关键信息还包括实体信息;所述若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息,包括:
若所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述方法还包括:
若对所述请求信息不能进行正则表达式解析、所述请求信息的语义关键信息不包括领域信息和意图信息或者所述场景类型对应的槽位组存在未匹配的槽位;则将所述请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的语义关键信息;
若所述语义关键信息识别模型输出的语义关键信息与所述请求信息的场景类型对应的槽位组完全匹配,则根据所述语义关键信息识别模型输出的语义关键信息确定所述请求信息的语义信息。
可选的,所述方法还包括:
若所述语义关键信息识别模型输出的语义关键信息与所述场景类型对应的槽位组未完全匹配,则确定所述场景类型对应的槽位组中未匹配的槽位;
根据所述槽位组中未匹配的槽位,生成追加询问指令;
根据所述追加询问指令对应的用户反馈请求,确定所述用户反馈请求的语义关键信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组未完全匹配,则继续执行所述确定所述场景类型对应的槽位组中未匹配的槽位,直至根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述根据所述槽位组中未匹配的槽位,生成追加询问指令,包括:
根据所述槽位组中未匹配的槽位对应的槽位类型,生成追加询问指令。
可选的,所述方法还包括:
根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息。
第二方面,本发明提供了一种语义分析装置,所述装置包括:
获取单元,用于获取待分析的请求信息;
分析单元,用于对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;
确定单元,用于若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述分析单元,具体用于:
对所述请求信息进行正则表达式解析,得到所述请求信息的语义关键信息;
若所述语义关键信息包括领域信息和意图信息,根据所述领域信息和所述意图信息,确定所述请求信息的场景类型。
可选的,所述场景类型对应的槽位组包括若干个槽位;所述请求信息的语义关键信息还包括实体信息;所述确定单元,具体用于:
若所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述确定单元,还具体用于:
若对所述请求信息不能进行正则表达式解析、所述请求信息的语义关键信息不包括领域信息和意图信息或者所述场景类型对应的槽位组存在未匹配的槽位;则将所述请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的语义关键信息;
若所述语义关键信息识别模型输出的语义关键信息与所述请求信息的场景类型对应的槽位组完全匹配,则根据所述语义关键信息识别模型输出的语义关键信息确定所述请求信息的语义信息。
可选的,所述确定单元,还具体用于:
若所述语义关键信息识别模型输出的语义关键信息与所述场景类型对应的槽位组未完全匹配,则确定所述场景类型对应的槽位组中未匹配的槽位;
根据所述槽位组中未匹配的槽位,生成追加询问指令;
根据所述追加询问指令对应的用户反馈请求,确定所述用户反馈请求的语义关键信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组未完全匹配,则继续执行所述确定所述场景类型对应的槽位组中未匹配的槽位,直至根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述可选的,所述确定单元,还具体用于:
根据所述槽位组中未匹配的槽位对应的槽位类型,生成追加询问指令。
可选的,所述装置还包括回应单元,用于:
根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息。
第三方面,本发明提供了一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面中任一所述的方法。
第四方面,本发明提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
由上述技术方案可以看出,本申请提供了一种语义分析方法,该方法先获取待分析的请求信息;然后,可以对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;接着,若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。可见,本申请可以通过对请求信息进行分析,获取到请求信息中更深层次、更全面的语义关键信息,以及,可以将语义关键信息与所述场景类型对应的槽位组进行匹配,以进一步筛选出能够用于准确识别用户意图的语义关键信息,这样,便可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息,即确定出用户真实意图,从而可以实现有效地分析出用户的请求信息的真正语义,提高了识别用户意图的准确性,进而提高了用户体验。
上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种语义分析方法的流程示意图;
图2为本发明一实施例提供的一种语义分析装置的结构示意图;
图3为本发明一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中由于现有深度学习模型关注点较为专一,即一模型一用,兼顾性不足,且现有的多轮对话系统对文本内容关键信息的发掘停留在较浅的层次,导致无法有效地分析出用户对话的真正语义,即无法准确识别用户意图,进而无法准确有效地进行用户意图回复,降低了用户体验的问题。本发明提供了一种语义分析方法,该方法先获取待分析的请求信息;然后,可以对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;接着,若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。可见,本申请可以通过对请求信息进行分析,获取到请求信息中更深层次、更全面的语义关键信息,以及,可以将语义关键信息与所述场景类型对应的槽位组进行匹配,以进一步筛选出能够用于准确识别用户意图的语义关键信息,这样,便可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息,即确定出用户真实意图,从而可以实现有效地分析出用户的请求信息的真正语义,提高了识别用户意图的准确性,进而提高了用户体验。
下面结合附图,详细说明本发明的各种非限制性实施方式。
参见图1,示出了本发明实施例中的一种语义分析方法。在本实施例中,所述方法例如可以包括以下步骤:
S101:获取待分析的请求信息。
具体地,所述请求信息为用户所发出的需要进行处理的请求,可以理解为用于分析用户意图的请求信息,例如,待分析的请求信息可以为“我明天想从武汉坐高铁到上海去”,“我想搭高铁去上海”。所述请求信息可以是用户输入的,也可以是外部设备发送的,还可以是通过从后台服务端(例如,云端)获取的。所述请求信息可以语音形式的请求信息,也可以为文本形成的请求信息等,并且当所述请求信息为语音形式的请求信息,可以对所述请求信息进行语音识别,以将所述语音形式的请求信息转换为文本形式的请求信息。
S102:对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息。
在本实施例中,请求信息的场景类型可以理解为请求信息对应的对话的发生情形,比如,待分析的请求信息“我明天想从武汉坐高铁到上海去”、“我想搭高铁去上海”所对应的场景类型均为“高铁查询”。语义关键信息可以理解为请求信息中能够反映用户意图的字词;在一种实现方式中,语义关键信息可以包括领域信息、意图信息和实体信息;领域信息可以理解为用于反映请求信息所对应的对话内容的话题范畴,例如,出行、视频观看、app、天气、高铁、汽车等;意图信息可以理解为用于反映请求信息所需要执行的操作,例如,下载、删除、查询等;实体信息可以理解为用于确定请求信息对应的用户意图的关键信息,即实体信息可以理解为确定请求信息对应的用户意图的依据。例如,请求信息为“我想搭高铁去上海”中,请求信息中的领域信息可以为“高铁”或“出行”,意图信息可以为“查询”,实体信息可以包括目的地“上海”。
在本实施例的一种实现方式中,对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息的方式可以为:先对所述请求信息进行正则表达式解析,得到所述请求信息的语义关键信息;若所述语义关键信息包括领域信息和意图信息,根据所述领域信息和所述意图信息,确定所述请求信息的场景类型。
在本实现方式中,可以先根据正则表达式解析的规则对请求信息进行解析,提取所述请求信息的语义关键信息,比如,将“从”和“到”之间的词语分别设置为出发地和目的地等。在获取到请求信息的语义关键信息之后,可以先判断语义关键信息中是否包括领域信息和意图信息,若是,则可以根据所述领域信息和所述意图信息,确定所述请求信息的场景类型,比如,领域信息为“高铁”,意图信息为“查询”,则可以确定所述请求信息的场景类型为“查询高铁”。
需要说明的是,每一场景类型都预先设置了与其对应的槽位组,其中,每一场景类型对应的槽位组可以包括若干个槽位,即一个或多个槽位。需要说明的是,槽位可以理解为用于存放在该场景类型下确定用户意图所需的实体信息的属性,例如,在询问天气的场景类型下,槽位组可以包括两个槽位“时间”和“地点”,又例如,场景类型为“查询高铁”时,槽位组可以包括四个槽位“出发地”、“目的地”、“时间”和“座位等级”。需要说明的是,在该场景类型下,需要获取到该场景类型对应的槽位组中所有槽位对应的实体信息,才可以根据该槽位组中所有槽位对应的实体信息,确定请求信息对应的用户意图。
S103:若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
其中,语义信息可以理解为所述请求信息对应的语句意图。在本实施例中,若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
具体地,若所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,可以理解为所述语义关键信息中的实体信息可以将所述场景类型对应的槽位组中的所有槽位均填充,则可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
举例来说,假设在询问天气的场景类型下,槽位组包括两个槽位“时间”和“地点”,且语义关键信息中的实体信息包括“明天下午两点”和“北京”,由于实体信息“明天下午两点”与槽位“时间”的属性对应,实体信息“北京”与槽位“地点”的属性对应,则所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,则可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息为“需要查询北京明天下午两点的天气”。
由上述技术方案可以看出,本申请提供了一种语义分析方法,该方法先获取待分析的请求信息;然后,可以对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;接着,若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。可见,本申请可以通过对请求信息进行分析,获取到请求信息中更深层次、更全面的语义关键信息,以及,可以将语义关键信息与所述场景类型对应的槽位组进行匹配,以进一步筛选出能够用于准确识别用户意图的语义关键信息,这样,便可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息,即确定出用户真实意图,从而可以实现有效地分析出用户的请求信息的真正语义,提高了识别用户意图的准确性,进而提高了用户体验。
在本实施例的一种实现方式中,若对所述请求信息不能进行正则表达式解析、所述请求信息的语义关键信息不包括领域信息和意图信息或者所述场景类型对应的槽位组存在未匹配的槽位,说明请求信息需要进行进一步更加精确的解析。在本实现方式中,可以将所述请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的语义关键信息。需要说明的是,在本实施例中,可以将请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的包括意图信息、领域信息和实体信息的语义关键信息,其中,语义关键信息识别模型可以是基于预设的第一训练样本集训练得到的,其中,第一训练样本集包括若干组训练样本,每组训练样本包括一样本请求信息以及该样本请求信息对应的意图信息、领域信息和实体信息。
在另一种实现方式中,语义关键信息识别模型可以包括意图识别模型、领域识别模型和实体识别模型,通过将请求信息输入意图识别模型得到该请求信息对应的意图信息,通过将请求信息输入领域识别模型得到该请求信息对应的领域信息,通过将请求信息输入实体识别模型得到该请求信息对应的实体信息。其中,意图识别模型可以是基于预设的第二训练样本集训练得到的,其中,第二训练样本集包括若干组训练样本,每组训练样本包括一样本请求信息以及该样本请求信息对应的意图信息;领域识别模型可以是基于预设的第三训练样本集训练得到的,其中,第三训练样本集包括若干组训练样本,每组训练样本包括一样本请求信息以及该样本请求信息对应的领域信息;实体识别模型可以是基于预设的第四训练样本集训练得到的,其中,第四训练样本集包括若干组训练样本,每组训练样本包括一样本请求信息以及该样本请求信息对应的实体信息。
若所述语义关键信息识别模型输出的语义关键信息与所述请求信息的场景类型对应的槽位组完全匹配,则根据所述语义关键信息识别模型输出的语义关键信息确定所述请求信息的语义信息。需要说明的是,在本实施例中,获取到所述语义关键信息识别模型输出的语义关键信息之后,可以根据语义关键信息中的意图信息和领域信息重新确定场景类型,若无法重新确定场景类型,则可以将该请求信息对应的缓存数据中历史场景类型(即曾经确定的场景类型)作为该语义关键信息对应的历史场景类型。
在本实施例的一种实现方式中,若请求信息中的确缺失场景类型对应的槽位组中一槽位对应的实体信息,则所述语义关键信息识别模型输出的语义关键信息与所述场景类型对应的槽位组未完全匹配。在该情况下,可以先确定所述场景类型对应的槽位组中未匹配的槽位(即确定槽位组中哪个槽位并未被填充),例如,场景类型“查询高铁”对应的槽位组包括槽位“出发地”、“目的地”、“时间”和“座位级别”,实体信息包括出发地“上海”、目的地“北京”和时间“明天”,由于槽位“座位级别”未被实体信息填充,则可以将槽位“座位级别”确定为槽位组中未匹配的槽位。然后,可以根据所述槽位组中未匹配的槽位,生成追加询问指令,具体地,可以根据所述槽位组中未匹配的槽位对应的槽位类型,生成追加询问指令,举例来说,假设槽位“座位级别”为槽位组中未匹配的槽位,由于槽位“座位级别”的槽位类型为座次信息,则可以根据槽位“座位级别”的槽位类型确定追加询问指令“您需要的座次是?”。接着,可以根据所述追加询问指令对应的用户反馈请求,确定所述用户反馈请求的语义关键信息,具体地,在本实施例中,可以根据用户针对追加询问指令所反馈的用户反馈请求(比如可以是语音反馈,也可以是文字反馈),确定所述用户反馈请求中与槽位组中未匹配的槽位对应的实体信息,比如从用户反馈请求中提取与槽位组中未匹配的槽位对应的实体信息;举例来说,假设追加询问指令“您需要的座次是?”,且用户反馈请求为“G408”,则可以确定未匹配的槽位“座位级别”对应的实体信息为“G408”。
在本实施例中,若通过正则表达式解析所得到的请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组完全匹配,则可以根据所述请求信息的语义关键信息确定所述请求信息的语义信息。若通过正则表达式解析所得到的请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组未完全匹配,则继续执行所述确定所述场景类型对应的槽位组中未匹配的槽位,直至根据所述请求信息的语义关键信息确定所述请求信息的语义信息,即直至所述场景类型对应的槽位组中的槽位均被填满。
在本实施例的一种实现方式中,在确定所述请求信息的语义信息之后,所述方法还可以包括:根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息。
在本实施例中,确定请求信息的语义信息之后,可以根据该语义信息生成所述语义信息的应答信息,以及输出该应答信息。例如,可以利用预先设置的对话语库以及查询数据库,确定所述语义信息的应答信息,其中,该对话语库预先设置了多组语义信息与其对应的应答信息的关系,查询数据库包括若干相关的知识信息,比如各个城市路线信息、天气预报信息等;例如,还可以利用已训练的应答信息生成模型,生成所述语义信息的应答信息,其中,该应答信息生成模型是基于若干组训练样本训练得到的,且每组训练样本包括一问题文本或陈述文本,以及该问题文本或陈述文本对应的应答文本。例如请求信息的语义信息为“需要查询北京明天下午两点的天气”,则可以生成该语义信息的应答信息为“北京明天下午两点的天气为晴天”
在本实施例中,确定请求信息的语义信息之后,也可以执行所述语义信息对应的业务。具体地,确定请求信息的语义信息之后,可以根据该语义信息确定需要执行的业务,接着,可以根据该需要执行的业务确定该业务对应的操作信息(比如需要调用的应用程序、网页或数据系统等),紧接着,根据该业务对应的操作信息执行所述语义信息对应的业务,从而得到执行业务的结果,并输出该执行业务的结果。举例来说,假设请求信息的语义信息为“需要购买明天G408北京到上海的二等座车票”,则可以将语义信息中的订票业务对应的操作信息“明天”、“G408”、“北京到上海”和“二等座”传入到订票系统进行订票,并将订票结果输出到用户终端上或者输出该订票结果。
可见,本实施例中,在确定所述请求信息的语义信息之后,可以根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息,从而可以在有效识别出用户对话意图后,能够狗跟该对话意图进行灵活回复以及执行相关业务,进而提高用户体验。
如图2所示,为本发明所述语义分析装置的一个具体实施例。本实施例所述装置,即用于执行上述实施例所述方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。本实施例中所述装置包括:
获取单元201,用于获取待分析的请求信息;
分析单元202,用于对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;
确定单元203,用于若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述分析单元202,具体用于:
对所述请求信息进行正则表达式解析,得到所述请求信息的语义关键信息;
若所述语义关键信息包括领域信息和意图信息,根据所述领域信息和所述意图信息,确定所述请求信息的场景类型。
可选的,所述场景类型对应的槽位组包括若干个槽位;所述请求信息的语义关键信息还包括实体信息;所述确定单元203,具体用于:
若所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述确定单元,还具体用于:
若对所述请求信息不能进行正则表达式解析、所述请求信息的语义关键信息不包括领域信息和意图信息或者所述场景类型对应的槽位组存在未匹配的槽位;则将所述请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的语义关键信息;
若所述语义关键信息识别模型输出的语义关键信息与所述请求信息的场景类型对应的槽位组完全匹配,则根据所述语义关键信息识别模型输出的语义关键信息确定所述请求信息的语义信息。
可选的,所述确定单元,还具体用于:
若所述语义关键信息识别模型输出的语义关键信息与所述场景类型对应的槽位组未完全匹配,则确定所述场景类型对应的槽位组中未匹配的槽位;
根据所述槽位组中未匹配的槽位,生成追加询问指令;
根据所述追加询问指令对应的用户反馈请求,确定所述用户反馈请求的语义关键信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组未完全匹配,则继续执行所述确定所述场景类型对应的槽位组中未匹配的槽位,直至根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
可选的,所述可选的,所述确定单元,还具体用于:
根据所述槽位组中未匹配的槽位对应的槽位类型,生成追加询问指令。
可选的,所述装置还包括回应单元,用于:
根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息。
图3是本发明实施例提供的一种电子设备的结构示意图。在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-AccessMemory,RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(IndustryStandardArchitecture,工业标准体系结构)总线、PCI(PeripheralComponentInterconnect,外设部件互连标准)总线或EISA(ExtendedIndustryStandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放执行指令。具体地,执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器,并向处理器提供执行指令和数据。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成语义分析装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的语义分析方法。
上述如本发明图1所示实施例提供的语义分析装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提出了一种可读介质,该可读存储介质存储有执行指令,存储的执行指令被电子设备的处理器执行时,能够使该电子设备执行本发明任一实施例中提供的语义分析方法,并具体用于执行上述语义分析所述的方法。
前述各个实施例中所述的电子设备可以为计算机。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种语义分析方法,其特征在于,所述方法包括:
获取待分析的请求信息;
对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;
若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息,包括:
对所述请求信息进行正则表达式解析,得到所述请求信息的语义关键信息;
若所述语义关键信息包括领域信息和意图信息,根据所述领域信息和所述意图信息,确定所述请求信息的场景类型。
3.根据权利要求2所述的方法,其特征在于,所述场景类型对应的槽位组包括若干个槽位;所述请求信息的语义关键信息还包括实体信息;所述若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息,包括:
若所述语义关键信息中的实体信息与所述场景类型对应的槽位组中的所有槽位相匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若对所述请求信息不能进行正则表达式解析、所述请求信息的语义关键信息不包括领域信息和意图信息或者所述场景类型对应的槽位组存在未匹配的槽位;则将所述请求信息输入已训练的语义关键信息识别模型,得到所述语义关键信息识别模型输出的语义关键信息;
若所述语义关键信息识别模型输出的语义关键信息与所述请求信息的场景类型对应的槽位组完全匹配,则根据所述语义关键信息识别模型输出的语义关键信息确定所述请求信息的语义信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述语义关键信息识别模型输出的语义关键信息与所述场景类型对应的槽位组未完全匹配,则确定所述场景类型对应的槽位组中未匹配的槽位;
根据所述槽位组中未匹配的槽位,生成追加询问指令;
根据所述追加询问指令对应的用户反馈请求,确定所述用户反馈请求的语义关键信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息;
若所述请求信息的语义关键信息、所述语义关键信息识别模型输出的语义关键信息和所述用户反馈请求的语义关键信息,与所述场景类型对应的槽位组未完全匹配,则继续执行所述确定所述场景类型对应的槽位组中未匹配的槽位,直至根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述槽位组中未匹配的槽位,生成追加询问指令,包括:
根据所述槽位组中未匹配的槽位对应的槽位类型,生成追加询问指令。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述方法还包括:
根据所述请求信息的语义信息,执行所述语义信息对应的业务和/或生成所述语义信息的应答信息。
8.一种语义分析装置,其特征在于,所述装置包括:
获取单元,用于获取待分析的请求信息;
分析单元,用于对所述请求信息进行分析,得到所述请求信息的场景类型以及语义关键信息;
确定单元,用于若所述语义关键信息与所述场景类型对应的槽位组完全匹配,则根据所述请求信息的语义关键信息确定所述请求信息的语义信息。
9.一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如权利要求1至7中任一所述的方法。
10.一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如权利要求1至7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110499308.5A CN113095089A (zh) | 2021-05-08 | 2021-05-08 | 一种语义分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110499308.5A CN113095089A (zh) | 2021-05-08 | 2021-05-08 | 一种语义分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113095089A true CN113095089A (zh) | 2021-07-09 |
Family
ID=76664160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110499308.5A Pending CN113095089A (zh) | 2021-05-08 | 2021-05-08 | 一种语义分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095089A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101545A (zh) * | 2018-06-29 | 2018-12-28 | 北京百度网讯科技有限公司 | 基于人机交互的自然语言处理方法、装置、设备和介质 |
CN111368548A (zh) * | 2018-12-07 | 2020-07-03 | 北京京东尚科信息技术有限公司 | 语义识别方法及装置、电子设备和计算机可读存储介质 |
CN111508482A (zh) * | 2019-01-11 | 2020-08-07 | 阿里巴巴集团控股有限公司 | 语义理解及语音交互方法、装置、设备及存储介质 |
CN111813903A (zh) * | 2020-05-25 | 2020-10-23 | 车智互联(北京)科技有限公司 | 一种问句匹配方法和计算设备 |
CN111985249A (zh) * | 2020-09-03 | 2020-11-24 | 贝壳技术有限公司 | 语义分析方法、装置、计算机可读存储介质及电子设备 |
CN112559689A (zh) * | 2020-12-21 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种基于车载问答的数据处理方法和装置 |
-
2021
- 2021-05-08 CN CN202110499308.5A patent/CN113095089A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101545A (zh) * | 2018-06-29 | 2018-12-28 | 北京百度网讯科技有限公司 | 基于人机交互的自然语言处理方法、装置、设备和介质 |
CN111368548A (zh) * | 2018-12-07 | 2020-07-03 | 北京京东尚科信息技术有限公司 | 语义识别方法及装置、电子设备和计算机可读存储介质 |
CN111508482A (zh) * | 2019-01-11 | 2020-08-07 | 阿里巴巴集团控股有限公司 | 语义理解及语音交互方法、装置、设备及存储介质 |
CN111813903A (zh) * | 2020-05-25 | 2020-10-23 | 车智互联(北京)科技有限公司 | 一种问句匹配方法和计算设备 |
CN111985249A (zh) * | 2020-09-03 | 2020-11-24 | 贝壳技术有限公司 | 语义分析方法、装置、计算机可读存储介质及电子设备 |
CN112559689A (zh) * | 2020-12-21 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种基于车载问答的数据处理方法和装置 |
Non-Patent Citations (1)
Title |
---|
赵鸣 等: "《基于深度学习的自然语言处理》", 31 May 2020, 北京:机械工业出版社, pages: 32 - 36 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109002510B (zh) | 一种对话处理方法、装置、设备和介质 | |
US9582757B1 (en) | Scalable curation system | |
CN110162780B (zh) | 用户意图的识别方法和装置 | |
JP2019159309A (ja) | 音声対話の満足度の確定方法及び装置 | |
CN110929094B (zh) | 一种视频标题处理方法和装置 | |
CN108399150B (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
JP2020030408A (ja) | オーディオにおける重要語句を認識するための方法、装置、機器及び媒体 | |
CN110244941B (zh) | 任务开发方法、装置、电子设备及计算机可读存储介质 | |
CN109753658B (zh) | 交互方法和装置 | |
CN111737990A (zh) | 一种词槽填充方法、装置、设备及存储介质 | |
CN110534115A (zh) | 多方言混合语音的识别方法、装置、系统和存储介质 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN117149140B (zh) | 一种用于编码的架构信息生成方法、装置及相关设备 | |
CN113961768A (zh) | 敏感词检测方法、装置、计算机设备和存储介质 | |
EP3843090B1 (en) | Method and apparatus for outputting analysis abnormality information in spoken language understanding | |
CN110928995B (zh) | 一种交互信息处理方法、装置、设备及存储介质 | |
CN111143404B (zh) | 一种业务处理方法及装置 | |
CN111783425A (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN113095089A (zh) | 一种语义分析方法及装置 | |
CN111400340A (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN112069267A (zh) | 一种数据处理方法和装置 | |
CN115620726A (zh) | 语音文本生成方法、语音文本生成模型的训练方法、装置 | |
CN115062629A (zh) | 会话信息的识别方法及装置、存储介质、计算机设备 | |
CN114169331A (zh) | 地址解析方法、装置、计算机设备和存储介质 | |
CN110134775B (zh) | 问答数据生成方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |