CN113255354B - 搜索意图识别方法、装置、服务器及存储介质 - Google Patents
搜索意图识别方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN113255354B CN113255354B CN202110619306.5A CN202110619306A CN113255354B CN 113255354 B CN113255354 B CN 113255354B CN 202110619306 A CN202110619306 A CN 202110619306A CN 113255354 B CN113255354 B CN 113255354B
- Authority
- CN
- China
- Prior art keywords
- search
- text
- model
- vector
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种搜索意图识别方法、装置、服务器及存储介质,所述方法包括:响应于搜索请求,获得待识别搜索文本;识别出所述待识别搜索文本中的至少一个实体词;根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图。采用本公开可以提高搜素意图的识别效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种搜索意图识别方法、装置、服务器及存储介质。
背景技术
搜索意图理解是指基于用户偏好、时空特性、上下文、交互、以及文本、手势、图像和视频等在内的多模态信息等内容,在语义级上准确理解用户的意图,并以支持高效查询推演的统一模型进行表示。通过将搜索输入内容转换为机器可识别的表示语言,深度学习用户思维,统一搜索查询视图,从而将用户搜索转换为机器可识别的语言模型,便于机器理解搜索意图。
相关技术在进行搜索意图识别时,往往是通过模型识别出搜索文本中的各个实体词对应的实体特征来识别出搜索意图。然而,这使得相关技术中的模型需要利用具体到实体词层面的信息,模型数据处理量大,不便于模型进行多领域、多层级的扩展;同时,为了使模型的识别精度不受实体词库的更新的影响,相关技术还需要基于实体词库的热更新不断对模型进行重新训练,这也使得模型无法高效地完成搜索意图识别任务。
因此,相关技术中存在搜索意图识别效率不高的问题。
发明内容
本公开提供一种搜索意图识别方法、装置、服务器及存储介质,以至少解决相关技术中搜索意图识别效率不高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种搜索意图识别方法,包括:
响应于搜索请求,获得待识别搜索文本;
识别出所述待识别搜索文本中的至少一个实体词;
根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;
将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图。
在一种可能实现方式中,所述将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图,包括:
将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;
将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图。
在一种可能实现方式中,若所述实体领域标识具有多个,所述将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本,包括:
对多个所述实体领域标识进行排序,得到排序后领域标识;
将所述排序后领域标识添加至所述待识别搜索文本,得到所述拼接后文本。
在一种可能实现方式中,所述目标意图识别模型包括文本向量化模型、向量融合模型和分类模型,所述将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图,包括:
将所述拼接后文本输入至所述文本向量化模型,获得所述拼接后文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示;
将所述字符向量表示和所述领域向量表示输入至所述向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示;
将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图。
在一种可能实现方式中,所述向量融合模型包括自注意力机制层和向量融合层,所述将所述字符向量表示和所述领域向量表示输入至所述向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示,包括:
分别获取所述字符、所述实体领域标识在所述拼接后文本中的位置信息;
通过所述注意力机制层,基于所述位置信息,分别确定所述字符向量表示的注意力权重,以及,所述领域向量表示的注意力权重;
根据所述字符向量表示的注意力权重,对所述字符向量表示进行加权,以及,根据所述领域向量表示的注意力权重,对所述领域向量表示进行加权;
通过所述向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到所述融合后向量表示。
在一种可能实现方式中,所述将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图,包括:
将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到搜索意图分类结果;所述搜索意图分类结果包括至少一个候选搜索意图,且每个所述候选搜索意图具有对应的置信度;
将置信度最高的所述候选搜索意图,作为所述目标搜索意图。
在一种可能实现方式中,所述方法还包括:
获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果;
获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本;
采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型;其中,所述待训练意图识别模型包括待训练的所述文本向量化模型、待训练的所述向量融合模型和待训练的所述分类模型。
在一种可能实现方式中,所述采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型,包括:
将所述拼接后样本文本输入至待训练的所述文本向量化模型,获得所述拼接后样本文本中各个字符的字符特征向量,以及,获取所述样本搜索文本的实体领域标识对应的领域特征向量;
将所述字符特征向量和所述领域特征向量输入至待训练的所述向量融合模型,通过所述待训练的所述向量融合模型对所述字符特征向量和所述领域特征向量进行融合处理,得到融合后特征向量;
将所述融合后特征向量输入至待训练的所述分类模型,通过所述待训练的所述分类模型对所述融合后特征向量进行分类处理,得到搜索意图输出结果;
基于所述搜索意图输出结果与所述搜索意图标注结果间的差异,对所述待训练意图识别模型的模型参数进行调整,直至调整后的所述待训练意图识别模型满足预设的训练条件,得到所述目标意图识别模型。
根据本公开实施例的第二方面,提供一种搜索意图识别装置,包括:
响应单元,被配置为执行响应于搜索请求,获得待识别搜索文本;
提取单元,被配置为执行识别出所述待识别搜索文本中的至少一个实体词;
确定单元,被配置为执行根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;
识别单元,被配置为执行将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图。
在一种可能实现方式中,所述识别单元,具体被配置为执行将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图。
在一种可能实现方式中,若所述实体领域标识具有多个,所述识别单元,具体被配置为执行对多个所述实体领域标识进行排序,得到排序后领域标识;将所述排序后领域标识添加至所述待识别搜索文本,得到所述拼接后文本。
在一种可能实现方式中,所述目标意图识别模型包括文本向量化模型、向量融合模型和分类模型,所述识别单元,具体被配置为执行将所述拼接后文本输入至所述文本向量化模型,获得所述拼接后文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示;将所述字符向量表示和所述领域向量表示输入至所述向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示;将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图。
在一种可能实现方式中,所述向量融合模型包括自注意力机制层和向量融合层,所述识别单元,具体被配置为执行分别获取所述字符、所述实体领域标识在所述拼接后文本中的位置信息;通过所述注意力机制层,基于所述位置信息,分别确定所述字符向量表示的注意力权重,以及,所述领域向量表示的注意力权重;根据所述字符向量表示的注意力权重,对所述字符向量表示进行加权,以及,根据所述领域向量表示的注意力权重,对所述领域向量表示进行加权;通过所述向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到所述融合后向量表示。
在一种可能实现方式中,所述识别单元,具体被配置为执行将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到搜索意图分类结果;所述搜索意图分类结果包括至少一个候选搜索意图,且每个所述候选搜索意图具有对应的置信度;将置信度最高的所述候选搜索意图,作为所述目标搜索意图。
在一种可能实现方式中,所述装置还包括:样本获取单元,被配置为执行获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果;拼接单元,被配置为执行获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本;训练单元,被配置为执行采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型;其中,所述待训练意图识别模型包括待训练的所述文本向量化模型、待训练的所述向量融合模型和待训练的所述分类模型。
在一种可能实现方式中,所述训练单元,具体被配置为执行将所述拼接后样本文本输入至待训练的所述文本向量化模型,获得所述拼接后样本文本中各个字符的字符特征向量,以及,获取所述样本搜索文本的实体领域标识对应的领域特征向量;将所述字符特征向量和所述领域特征向量输入至待训练的所述向量融合模型,通过所述待训练的所述向量融合模型对所述字符特征向量和所述领域特征向量进行融合处理,得到融合后特征向量;将所述融合后特征向量输入至待训练的所述分类模型,通过所述待训练的所述分类模型对所述融合后特征向量进行分类处理,得到搜索意图输出结果;基于所述搜索意图输出结果与所述搜索意图标注结果间的差异,对所述待训练意图识别模型的模型参数进行调整,直至调整后的所述待训练意图识别模型满足预设的训练条件,得到所述目标意图识别模型。
根据本公开实施例的第三方面,提供一种服务器,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任一种可能实现方式所述的搜索意图识别方法。
根据本公开实施例的第四方面,提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面的任一种可能实现方式所述的搜索意图识别方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序,使得设备执行第一方面的任一项实施例中所述的搜索意图识别方法。
本公开的实施例提供的技术方案至少带来以下有益效果:通过响应于搜索请求,获得待识别搜索文本;识别出所述待识别搜索文本中的至少一个实体词;根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图,如此,能够实现在各个实体词所处领域层面进行建模,只保留实体词对应的领域信息,并使用该领域信息对搜索意图识别进行辅助,无需具体到实体词层面的信息,从而极大减少模型参数,以便于模型进行多领域、多层级的扩展;同时,由于屏蔽了实体层面信息,领域实体词库的更新不会影响模型的判断,可支持实体词库的热更新并不需要重新训练模型,从而有效地提高了搜索意图识别效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种搜索意图识别方法的应用环境图。
图2是根据一示例性实施例示出的一种搜索意图识别方法的流程图。
图3是根据一示例性实施例示出的一种标记替换示意图。
图4是根据一示例性实施例示出的一种领域预训练的流程示意图。
图5是根据一示例性实施例示出的一种搜索意图识别方法的应用场景图。
图6是根据一示例性实施例示出的另一种搜索意图识别方法的流程图。
图7是根据一示例性实施例示出的一种搜索意图识别装置的框图。
图8是根据一示例性实施例示出的一种服务器的内部结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。
本公开所提供的一种搜索意图识别方法,可以应用于如图1所示的应用环境中。其中,终端110发送搜索请求至服务器120;服务器120响应于搜索请求,获得待识别搜索文本;服务器120识别出待识别搜索文本中的至少一个实体词;服务器120根据至少一个实体词,确定实体领域标识;其中,实体领域标识为实体词表征的实体所属领域对应的标识;服务器120将待识别搜索文本和实体领域标识输入至目标意图识别模型,得到搜索请求对应的目标搜索意图。实际应用中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
图2是根据一示例性实施例示出的一种搜索意图识别方法的流程图,如图2所示,该搜索意图识别方法用于图1的服务器120中,包括以下步骤。
在步骤S210中,响应于搜索请求,获得待识别搜索文本。
其中,搜索请求可以是针对视频、文本、网页、图片等内容的搜索请求等。
具体实现中,当用户账户需要搜索视频、文本、网页、图片等内容时,用户账户可以通过终端向服务器发送携带有待识别搜索文本的搜索请求。服务器在接收到搜索请求后,服务器则响应于该搜索请求,并获取该搜索请求携带的待识别搜索文本。实际应用中,待识别搜索文本也可以命名为待识别搜索词。
在步骤S220中,识别出待识别搜索文本中的至少一个实体词。
举例来说,已知待识别搜索文本为“天下第一宠爱全集”,则该待识别搜索文本中的实体词为“天下第一”“天下第一宠”等。
具体实现中,服务器在识别出待识别搜索文本中的至少一个实体词的过程中,服务器可以将待识别搜索文本输入至预训练的实体识别模型,得到针对该待识别搜索文本的实体识别结果。其中,该实体识别结果包括待识别搜索文本中的至少一个实体词。
在步骤S230中,根据至少一个实体词,确定实体领域标识。
其中,实体领域标识为实体词表征的实体所属领域对应的标识。
具体实现中,服务器在识别出待识别搜索文本中的实体词后,服务器则查询该实体词所属领域对应的信息即至少一个实体词对应的实体领域标识。具体来说,服务器可以基于该实体词在已有的实体领域标识库进行检索匹配,将其命中的实体领域标识确定为实体词对应的实体领域标识。举例来说,已知待识别搜索文本为[天下第一宠爱全集];其中,实体词为“天下第一”,则实体领域标识可以记为“{影视}天下第一”。
在步骤S240中,将待识别搜索文本和实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图。
其中,目标意图识别模型可以是指预训练的意图识别模型。
具体实现中,服务器在确定至少一个实体词对应的实体领域标识后,服务器则可以将待识别搜索文本和实体领域标识输入至目标意图识别模型;通过该目标意图识别模型提取出待识别搜索文本的语义信息和实体领域标识的实体领域信息;然后,再对语义信息和实体领域信息之间的融合信息进行分类处理,进而得到针对搜索请求的目标搜索意图。
上述搜索意图识别方法中,通过响应于搜索请求,获得待识别搜索文本;识别出待识别搜索文本中的至少一个实体词;根据至少一个实体词,确定实体词表征的实体所属领域对应的实体领域标识;然后,再将待识别搜索文本和实体领域标识输入至目标意图识别模型,得到搜索请求对应的目标搜索意图,如此,能够实现在各个实体词所处领域层面进行建模,只保留实体词对应的领域信息,并使用该领域信息对搜索意图识别进行辅助,无需具体到实体词层面的信息,从而极大减少模型参数,以便于模型进行多领域、多层级的扩展;同时,由于屏蔽了实体层面信息,领域实体词库的更新不会影响模型的判断,可支持实体词库的热更新并不需要重新训练模型,从而有效地提高了搜索意图识别效率。
在一示例性实施例中,将待识别搜索文本和实体领域标识输入至目标意图识别模型,得到搜索请求对应的目标搜索意图,包括:将实体领域标识拼接至待识别搜索文本,得到拼接后文本;将拼接后文本输入至目标意图识别模型,得到目标搜索意图。
具体实现中,服务器在将待识别搜索文本和实体领域标识输入至目标意图识别模型的过程中,服务器可以将实体领域标识拼接至待识别搜索文本,得到拼接后文本;然后,服务器再将拼接后文本输入至目标意图识别模型,进而通过该目标意图识别模型对拼接后文本进行处理,提取出待识别搜索文本的语义信息和实体领域标识的实体领域信息;然后,再对语义信息和实体领域信息之间的融合信息进行分类处理,进而得到针对搜索请求的目标搜索意图。
举例来说,已知待识别搜索文本为[天下第一宠爱全集],服务器则可以将实体词“天下第一”对应的实体领域标识“{影视}天下第一”添加至待识别搜索文本的末尾,构成完整的输入序列即拼接后文本[天下第一宠爱全集{影视}天下第一]。然后,服务器将拼接后文本[天下第一宠爱全集{影视}天下第一]输入至目标意图识别模型,进而通过该目标意图识别模型对拼接后文本进行处理,提取出待识别搜索文本的语义信息和实体领域标识的实体领域信息;然后,再对语义信息和实体领域信息之间的融合信息进行分类处理,进而得到针对搜索请求的目标搜索意图。
本实施例的技术方案,通过将实体领域标识拼接至待识别搜索文本,得到拼接后文本,实现在后续一次性地对拼接后文本进行意图识别,便于目标意图识别模型可以方便地在拼接后文本中提取出待识别搜索文本的语义信息和实体领域标识的实体领域信息,并基于该语义信息和实体领域信息,输出针对搜索请求的目标搜索意图。
在一示例性实施例中,若实体领域标识具有多个,将实体领域标识拼接至待识别搜索文本,得到拼接后文本,包括:对多个实体领域标识进行排序,得到排序后领域标识;将排序后领域标识添加至待识别搜索文本,得到拼接后文本。
具体实现中,若实体领域标识具有多个,服务器在将实体实体领域标识添加至待识别搜索文本中的目标位置,得到拼接后文本的过程中,具体包括:服务器可以对各个实体实体领域标识进行排序,得到排序后实体领域标识。具体来说,服务器可以根据各个实体领域的首字符位置顺序,对各个实体实体领域标识进行排序,得到排序后实体领域标识;将排序后实体领域标识添加至待识别搜索文本的末尾位置,得到拼接后文本。
例如,待识别搜索文本[天下第一宠爱全集]命中了影视领域中的{天下第一}以及动漫领域的{天下第一宠爱},将该实体实体领域标识“{影视}天下第一”和“{动漫}天下第一宠爱”,服务器将实体领域标识“{动漫}天下第一宠爱”排于实体领域标识“{影视}天下第一”的后面,并添加在待识别搜索文本[天下第一宠爱全集]的末尾,构成完整的输入序列即拼接后文本[天下第一宠爱全集{影视}天下第一{动漫}天下第一宠爱]。
本实施例的技术方案,在实体领域标识具有多个时,通过对多个实体领域标识进行排序,得到排序后实体领域标识;将排序后实体领域标识添加至待识别搜索文本的末尾位置,实现有序地将实体领域标识添加至待识别搜索文本中,同时保障了待识别搜索文本的语义信息不丢失,进而便于目标意图识别模型有效地提取出待识别搜索文本的语义信息。
在一示例性实施例中,目标意图识别模型包括文本向量化模型、向量融合模型和分类模型,将拼接后文本输入至目标意图识别模型,得到目标搜索意图,包括:将拼接后文本输入至文本向量化模型,获得拼接后文本中各个字符的字符向量表示,以及,获取实体领域标识对应的领域向量表示;将字符向量表示和领域向量表示输入至向量融合模型,通过向量融合模型对字符向量表示和领域向量表示进行融合处理,得到融合后向量表示;将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到目标搜索意图。
其中,字符向量表示可以是指各个字符对应的向量表示。实际应用中,字符向量表示用于表征待识别搜索文本的语义信息。
其中,领域向量表示可以是指实体词所属领域的向量表示。实际应用中,领域向量表示用于表征实体词对应的实体领域信息。
具体实现中,服务器在将拼接后文本输入至目标意图识别模型,得到目标搜索意图的过程中,服务器可以将拼接后文本输入至文本向量化模型,获得拼接后文本中各个字符的字符向量表示。
其中,服务器可以对拼接后文本进行分词处理,得到拼接后文本中的各个字符。服务器将分词处理后得到的各个字符输入至文本向量化模型,得到各个字符对应的特征向量,作为各个字符的向量表示。
其中,文本向量化模型可以是指BERT模型。实际应用中,服务器还可以对文本向量化模型进行领域预训练。具体来说,服务器可以获取包含有样本搜索文本的样本搜索文本。其中,该样本搜索文本所属的搜索场景与待识别搜索文本所属的搜索场景相同。服务器则采用训练样本数据对待训练的文本向量化模型进行训练,直至训练后的文本向量化模型满足预设的训练条件,得到预训练的文本向量化模型。
例如,服务器可以从待识别搜索文本所属的搜索场景相同的搜索日志中筛选出高频率、高质量的搜索query,通过正则化等方式去除无关的字符;根据BERT模型通用预训练的语料构建规则,用Mask标记随机替换query中的部分字;由于原始的Mask策略是按照文本长度的一定比例进行Mask替换,在本场景中会出现Mask掉query中较多的字,导致语义丢失严重的情况;因此根据query长度的分布特点,设计了可自适应调整的Mask策略,以保证Mask的比例处于合理范围。此外,Mask操作时优先选择长度较大的词组,目的是将query中最有效的信息掩盖,以提高模型学习语言知识的能力。
为了便于本领域技术人员的理解,如图3所示,图3提供了一种标记替换示意图。
服务器将预处理得到的Mask数据,分批次送入经过通用预训练的BERT模型,进行领域预训练。模型的预训练任务是预测输入文本中Mask标记所代替的原始文本,优化函数为预测结果与真实标签的交叉熵。
为了便于本领域技术人员的理解,如图4所示,图4提供了一种领域预训练的流程示意图。
同时,对于实体领域标识,服务器可以在预先构建的一个实体领域数量大小的领域向量表示(embedding)表中,查询到与该与实体领域标识对应的特征向量,作为实体领域标识对应的领域向量表示。
然后,服务器可以将字符向量表示和领域向量表示输入至向量融合模型,通过向量融合模型对字符向量表示和领域向量表示进行融合处理,得到融合后向量表示。
最后,服务器可以将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到目标搜索意图。
本实施例的技术方案,通过获取待识别搜索文本中各个字符的字符向量表示和实体词所属领域对应的领域向量表示,从而实现提取出待识别搜索文本的语义信息和实体领域标识,并将将字符向量表示和领域向量表示进行融合处理,得到融合后向量表示;对融合后向量表示进行分类处理,得到目标搜索意图;如此,可以实现综合考虑到待识别搜索文本中携带的语义信息和对应的实体领域标识,准确地识别出针对搜索请求的目标搜索意图。
在一示例性实施例中,向量融合模型包括自注意力机制层和向量融合层,将字符向量表示和领域向量表示输入至向量融合模型,通过向量融合模型对字符向量表示和领域向量表示进行融合处理,得到融合后向量表示,包括:分别获取字符、实体领域标识在拼接后文本中的位置信息;通过注意力机制层,基于位置信息,分别确定字符向量表示的注意力权重,以及,领域向量表示的注意力权重;根据字符向量表示的注意力权重,对字符向量表示进行加权,以及,根据领域向量表示的注意力权重,对领域向量表示进行加权;通过向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到融合后向量表示。
具体实现中,服务器在将将字符向量表示和领域向量表示输入至向量融合模型,通过向量融合模型对字符向量表示和领域向量表示进行融合处理,得到融合后向量表示的过程中,服务器可以分别获取字符、实体领域标识在拼接后文本中的位置信息;然后,服务器通过注意力机制层,基于位置信息,分别确定字符向量表示的注意力权重,以及,领域向量表示的注意力权重;服务器根据字符向量表示的注意力权重,对字符向量表示进行加权,以及,根据领域向量表示的注意力权重,对领域向量表示进行加权;服务器通过向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,进而得到融合后向量表示。
例如,服务器可以为拼接后文本中每个字符增加起始位置(headposition)和结束位置(tailposition)。例如:字符“天”的起始位置为1,结束位置为1;实体领域标识“{影视}天下第一”的起始位置为1,结束位置为4。当考虑第j个字符相对于第i个字符时,根据如上headpoi和tailpoi,计算下列4种相对距离:
(1)起始与起始相对距离D(hh) ij=head[i]-head[j];
(2)起始与结束相对距离D(ht) ij=head[i]-tail[j];
(3)结束与起始相对距离D(th) ij=tail[i]-head[j];
(4)结束与结束相对距离D(tt) ij=tail[i]-tail[j]。
将得到的4个整数通过正弦/余弦函数转换为浮点数并拼接成长度为4的向量,经过可学习的相对位置编码参数矩阵WR转换,得到第j个字符相对于第i个字符的相对位置编码Rij,用于后续的注意力权重计算。
然后,对于拼接后文本中每个字符的表示向量Ei,通过三个注意力矩阵WQ/WK/WV,得到每个字符的Queryi/Keyi/Valuei向量表示,其中,Query和Key向量表示查询/被查询关系,用于注意力权重计算,Value向量用于表示该字符的实际值。在计算输出向量Hi时,用Queryi跟序列中每个字符的Keyj向量进行注意力权重计算,计算公式如下:
Aij=QueryiKeyj+QueryiRijWk,R+uKeyj+vRijWk,R。最终该位置的输出向量Hi为计算得到的注意力权重与Value的加权和,得到融合后向量表示。
本实施例的技术方案,通过分别获取字符、实体领域标识在拼接后文本中的位置信息;基于位置信息,分别确定字符向量表示的注意力权重,以及,领域向量表示的注意力权重;根据字符向量表示的注意力权重,对字符向量表示进行加权,以及,根据领域向量表示的注意力权重,对领域向量表示进行加权;融合加权后的字符向量表示和加权后的领域向量表示,得到融合后向量表示;如此,通过采用自注意力机制,实现对字符向量表示和领域向量表示进行更为合理和符合语义场景的融合处理,使得得到的融合后向量表示具有更高的准确度。
在一示例性实施例中,将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到目标搜索意图,包括:将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到搜索意图分类结果;搜索意图分类结果包括至少一个候选搜索意图,且每个候选搜索意图具有对应的置信度;将置信度最高的候选搜索意图,作为目标搜索意图。
具体实现中,服务器在将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到目标搜索意图的过程中,服务器可以将融合后向量表示输入至分类模型,通过分类模型对融合后向量表示进行分类处理,得到搜索意图分类结果。其中,该搜索意图识别结果包括至少一个候选搜索意图,且每个候选搜索意图具有对应的置信度即服务器会输出各个候选搜索意图的概率分布。服务器在得到搜索意图识别结果后,则在各个候选搜索意图中将置信度最高的候选搜索意图,作为目标搜索意图。
本实施例的技术方案,通过将融合后向量表示输入至预训练的搜索意图分类模型,得到每个候选搜索意图具有对应的置信度;将置信度最高的候选搜索意图,作为目标搜索意图;实现准确地识别出针对搜索请求的目标搜索意图。
在一示例性实施例中,方法还包括:获取训练样本集;训练样本集包括样本搜索文本与对应的搜索意图标注结果;获取样本搜索文本的实体领域标识,并将实体领域标识拼接至样本搜索文本,得到拼接后样本文本;采用拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型。
其中,待训练意图识别模型包括待训练的文本向量化模型、待训练的向量融合模型和待训练的分类模型。
具体实现中,服务器还可以获取包括样本搜索文本与该样本搜索文本对应的搜索意图标注结果的训练样本集;然后,服务器获取样本搜索文本的实体领域标识,并将实体领域标识拼接至样本搜索文本,得到拼接后样本文本。需要说明的是,服务器获取样本搜索文本的实体领域标识,并将实体领域标识拼接至样本搜索文本,得到拼接后样本文本所采用的方法与上文中获取待识别搜索文本的实体领域标识,并将实体领域标识拼接至待识别搜索文本,得到拼接后文本所采用的方法原理相同,在此不再赘述。服务器采用该拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型。
本实施例的技术方案,通过获取包括样本搜索文本与该样本搜索文本对应的搜索意图标注结果的训练样本集,并获取样本搜索文本的实体领域标识,并将实体领域标识拼接至样本搜索文本,得到拼接后样本文本,并采用拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型,使得目标意图识别模型可以有效地从待识别搜索文本中提取出拼接后文本的语义信息,并基于该语义信息和待识别搜索文本对应的实体领域信息,识别出针对搜索请求的目标搜索意图。
在一示例性实施例中,采用拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型,包括:将拼接后样本文本输入至待训练的文本向量化模型,获得拼接后样本文本中各个字符的字符特征向量,以及,获取样本搜索文本的实体领域标识对应的领域特征向量;将字符特征向量和领域特征向量输入至待训练的向量融合模型,通过待训练的向量融合模型对字符特征向量和领域特征向量进行融合处理,得到融合后特征向量;将融合后特征向量输入至待训练的分类模型,通过待训练的分类模型对融合后特征向量进行分类处理,得到搜索意图输出结果;基于搜索意图输出结果与搜索意图标注结果间的差异,对待训练意图识别模型的模型参数进行调整,直至调整后的待训练意图识别模型满足预设的训练条件,得到目标意图识别模型。
具体实现中,在采用拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型的过程中,服务器将拼接后样本文本输入至待训练的文本向量化模型,获得拼接后样本文本中各个字符的字符特征向量,以及,获取样本搜索文本的实体领域标识对应的领域特征向量;将字符特征向量和领域特征向量输入至待训练的向量融合模型,通过待训练的向量融合模型对字符特征向量和领域特征向量进行融合处理,得到融合后特征向量;将融合后特征向量输入至待训练的分类模型,通过待训练的分类模型对融合后特征向量进行分类处理,得到搜索意图输出结果;然后,服务器基于搜索意图输出结果与搜索意图标注结果间的差异,对待训练意图识别模型的模型参数进行调整,直至调整后的待训练意图识别模型满足预设的训练条件,得到目标意图识别模型。具体来说,服务器可以将搜索意图输出结果与搜索意图标注结果输入至预设的损失函数,得到用于表征搜索意图输出结果与搜索意图标注结果间的差异的损失函数值;然后,服务器在基于该损失函数值,采用反向传播的方法,计算出待训练的文本向量化模型、待训练的向量融合模型和待训练的分类模型中各个模型节点的参数(如,权重、偏置等)的梯度;再然后,服务器基于各个模型节点的参数的梯度,采用梯度下降的方法,对待训练的文本向量化模型、待训练的向量融合模型和待训练的分类模型中各个模型节点的参数进行调整,得到调整后的待训练意图识别模型;直至调整后的待训练意图识别模型满足预设的训练条件,得到目标意图识别模型。实际应用中,服务器可以判断调整后的待训练意图识别模型的模型训练次数是否大于预设阈值、调整后的待训练意图识别模型的模型损失值是否小于预设阈值,进而来判断该调整后的待训练意图识别模型是否符合预设的训练条件。
本实施例的技术方案,通过将拼接后样本文本输入至待训练的文本向量化模型,获得拼接后样本文本中各个字符的字符特征向量,以及,获取样本搜索文本的实体领域标识对应的领域特征向量;将字符特征向量和领域特征向量输入至待训练的向量融合模型,通过待训练的向量融合模型对字符特征向量和领域特征向量进行融合处理,得到融合后特征向量;将融合后特征向量输入至待训练的分类模型,通过待训练的分类模型对融合后特征向量进行分类处理,得到搜索意图输出结果;基于搜索意图输出结果与搜索意图标注结果间的差异,对待训练意图识别模型的模型参数进行调整,直至调整后的待训练意图识别模型满足预设的训练条件,得到目标意图识别模型;从而实现了快速且高效地对待训练意图识别模型进行有监督训练,使得得到的目标意图识别模型可以有效地从待识别搜索文本中提取出拼接后文本的语义信息,并基于该语义信息和待识别搜索文本对应的实体领域信息,识别出针对搜索请求的目标搜索意图。
为了便于本领域技术人员的理解,图5提供了一种搜索意图识别方法的应用场景图;其中,服务器响应于搜索请求,获得待识别搜索文本[天下第一宠爱全集];识别出所述待识别搜索文本中的至少一个实体词;确定所述至少一个实体词对应的实体领域标识;提取所述待识别搜索文本的语义信息,并根据所述语义信息和所述实体领域标识,识别出针对所述搜索请求的目标搜索意图。如此,能够实现在各个实体词所处领域层面进行建模,只保留实体词对应的领域信息,并使用该领域信息对搜索意图识别进行辅助,无需具体到实体词层面的信息,从而极大减少模型参数,以便于模型进行多领域、多层级的扩展;同时,由于屏蔽了实体层面信息,领域实体词库的更新不会影响模型的判断,可支持实体词库的热更新并不需要重新训练模型。
图6是根据一示例性实施例示出的另一种搜索意图识别方法的流程图,如图6所示,该方法用于图1中的服务器120中,包括以下步骤:在步骤S602中,获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果。在步骤S604中,获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本。在步骤S606中,采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到目标意图识别模型;其中,所述待训练意图识别模型包括待训练的文本向量化模型、待训练的向量融合模型和待训练的分类模型。在步骤S608中,响应于搜索请求,获得待识别搜索文本。在步骤S610中,识别出所述待识别搜索文本中的至少一个实体词。在步骤S612中,根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;所述实体领域标识具有多个。在步骤S614中,对多个所述实体领域标识进行排序,得到排序后领域标识。在步骤S616中,将所述排序后领域标识添加至所述待识别搜索文本,得到拼接后文本。在步骤S618中,将所述拼接后文本输入至所述文本向量化模型,获得所述拼接后文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示。在步骤S620中,将所述字符向量表示和所述领域向量表示输入至所述向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示。在步骤S622中,将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述搜索请求对应的目标搜索意图。需要说明的是,上述步骤的具体限定可以参见上文对一种搜索意图识别方法的具体限定,在此不再赘述。
应该理解的是,虽然图2和图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
图7是根据一示例性实施例示出的一种搜索意图识别装置框图。参照图7,该装置包括:
响应单元710,被配置为执行响应于搜索请求,获得待识别搜索文本;
提取单元720,被配置为执行识别出所述待识别搜索文本中的至少一个实体词;
确定单元730,被配置为执行根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;
识别单元740,被配置为执行将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图。
在一示例性实施例中,所述识别单元740,具体被配置为执行将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图。
在一示例性实施例中,若所述实体领域标识具有多个,所述识别单元740,具体被配置为执行对多个所述实体领域标识进行排序,得到排序后领域标识;将所述排序后领域标识添加至所述待识别搜索文本,得到所述拼接后文本。
在一示例性实施例中,所述目标意图识别模型包括文本向量化模型、向量融合模型和分类模型,所述识别单元740,具体被配置为执行将所述拼接后文本输入至所述文本向量化模型,获得所述拼接后文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示;将所述字符向量表示和所述领域向量表示输入至所述向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示;将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图。
在一示例性实施例中,所述向量融合模型包括自注意力机制层和向量融合层,所述识别单元740,具体被配置为执行分别获取所述字符、所述实体领域标识在所述拼接后文本中的位置信息;通过所述注意力机制层,基于所述位置信息,分别确定所述字符向量表示的注意力权重,以及,所述领域向量表示的注意力权重;根据所述字符向量表示的注意力权重,对所述字符向量表示进行加权,以及,根据所述领域向量表示的注意力权重,对所述领域向量表示进行加权;通过所述向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到所述融合后向量表示。
在一示例性实施例中,所述识别单元740,具体被配置为执行将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到搜索意图分类结果;所述搜索意图分类结果包括至少一个候选搜索意图,且每个所述候选搜索意图具有对应的置信度;将置信度最高的所述候选搜索意图,作为所述目标搜索意图。
在一示例性实施例中,所述装置还包括:样本获取单元,被配置为执行获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果;拼接单元,被配置为执行获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本;训练单元,被配置为执行采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型;其中,所述待训练意图识别模型包括待训练的所述文本向量化模型、待训练的所述向量融合模型和待训练的所述分类模型。
在一示例性实施例中,所述训练单元,具体被配置为执行将所述拼接后样本文本输入至待训练的所述文本向量化模型,获得所述拼接后样本文本中各个字符的字符特征向量,以及,获取所述样本搜索文本的实体领域标识对应的领域特征向量;将所述字符特征向量和所述领域特征向量输入至待训练的所述向量融合模型,通过所述待训练的所述向量融合模型对所述字符特征向量和所述领域特征向量进行融合处理,得到融合后特征向量;将所述融合后特征向量输入至待训练的所述分类模型,通过所述待训练的所述分类模型对所述融合后特征向量进行分类处理,得到搜索意图输出结果;基于所述搜索意图输出结果与所述搜索意图标注结果间的差异,对所述待训练意图识别模型的模型参数进行调整,直至调整后的所述待训练意图识别模型满足预设的训练条件,得到所述目标意图识别模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于执行搜索意图识别方法的设备800的框图。例如,设备800可以为一服务器。参照图8,设备800包括处理组件820,其进一步包括一个或多个处理器,以及由存储器822所代表的存储器资源,用于存储可由处理组件820的执行的指令,例如应用程序。存储器822中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件820被配置为执行指令,以执行上述搜索意图识别方法。
设备800还可以包括一个电源组件824被配置为执行设备800的电源管理,一个有线或无线网络接口826被配置为将设备800连接到网络,和一个输入输出(I/O)接口828。设备800可以操作基于存储在存储器822的操作系统,例如WindowS ServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器822,上述指令可由设备800的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,所述计算机程序存储在计算机可读存储介质中,所述计算机程序可由设备800的处理器执行以完成上述方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (16)
1.一种搜索意图识别方法,其特征在于,所述方法包括:
响应于搜索请求,获得待识别搜索文本;
识别出所述待识别搜索文本中的至少一个实体词;
根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;
将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图;其中,将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;将所述拼接后文本输入至所述目标意图识别模型中的文本向量化模型,获得所述待识别搜索文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示;将所述字符向量表示和所述领域向量表示输入至所述目标意图识别模型中的向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示;将所述融合后向量表示输入至所述目标意图识别模型中的分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图。
2.根据权利要求1所述的搜索意图识别方法,其特征在于,所述将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图,包括:
将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;
将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图。
3.根据权利要求2所述的搜索意图识别方法,其特征在于,若所述实体领域标识具有多个,所述将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本,包括:
对多个所述实体领域标识进行排序,得到排序后领域标识;
将所述排序后领域标识添加至所述待识别搜索文本,得到所述拼接后文本。
4.根据权利要求1所述的搜索意图识别方法,其特征在于,所述向量融合模型包括自注意力机制层和向量融合层,所述将所述字符向量表示和所述领域向量表示输入至所述目标意图识别模型中的向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示,包括:
分别获取所述字符、所述实体领域标识在所述拼接后文本中的位置信息;
通过所述注意力机制层,基于所述位置信息,分别确定所述字符向量表示的注意力权重,以及,所述领域向量表示的注意力权重;
根据所述字符向量表示的注意力权重,对所述字符向量表示进行加权,以及,根据所述领域向量表示的注意力权重,对所述领域向量表示进行加权;
通过所述向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到所述融合后向量表示。
5.根据权利要求1所述的搜索意图识别方法,其特征在于,所述将所述融合后向量表示输入至所述目标意图识别模型中的分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图,包括:
将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到搜索意图分类结果;所述搜索意图分类结果包括至少一个候选搜索意图,且每个所述候选搜索意图具有对应的置信度;
将置信度最高的所述候选搜索意图,作为所述目标搜索意图。
6.根据权利要求1所述的搜索意图识别方法,其特征在于,所述方法还包括:
获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果;
获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本;
采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型;其中,所述待训练意图识别模型包括待训练的所述文本向量化模型、待训练的所述向量融合模型和待训练的所述分类模型。
7.根据权利要求6所述的搜索意图识别方法,其特征在于,所述采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型,包括:
将所述拼接后样本文本输入至待训练的所述文本向量化模型,获得所述拼接后样本文本中各个字符的字符特征向量,以及,获取所述样本搜索文本的实体领域标识对应的领域特征向量;
将所述字符特征向量和所述领域特征向量输入至待训练的所述向量融合模型,通过所述待训练的所述向量融合模型对所述字符特征向量和所述领域特征向量进行融合处理,得到融合后特征向量;
将所述融合后特征向量输入至待训练的所述分类模型,通过所述待训练的所述分类模型对所述融合后特征向量进行分类处理,得到搜索意图输出结果;
基于所述搜索意图输出结果与所述搜索意图标注结果间的差异,对所述待训练意图识别模型的模型参数进行调整,直至调整后的所述待训练意图识别模型满足预设的训练条件,得到所述目标意图识别模型。
8.一种搜索意图识别装置,其特征在于,包括:
响应单元,被配置为执行响应于搜索请求,获得待识别搜索文本;
提取单元,被配置为执行识别出所述待识别搜索文本中的至少一个实体词;
确定单元,被配置为执行根据所述至少一个实体词,确定实体领域标识;其中,所述实体领域标识为所述实体词表征的实体所属领域对应的标识;
识别单元,被配置为执行将所述待识别搜索文本和所述实体领域标识输入至目标意图识别模型,得到所述搜索请求对应的目标搜索意图;其中,将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;将所述拼接后文本输入至所述目标意图识别模型中的文本向量化模型,获得所述待识别搜索文本中各个字符的字符向量表示,以及,获取所述实体领域标识对应的领域向量表示;将所述字符向量表示和所述领域向量表示输入至所述目标意图识别模型中的向量融合模型,通过所述向量融合模型对所述字符向量表示和所述领域向量表示进行融合处理,得到融合后向量表示;将所述融合后向量表示输入至所述目标意图识别模型中的分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到所述目标搜索意图。
9.根据权利要求8所述的搜索意图识别装置,其特征在于,所述识别单元,具体被配置为执行将所述实体领域标识拼接至所述待识别搜索文本,得到拼接后文本;将所述拼接后文本输入至所述目标意图识别模型,得到所述目标搜索意图。
10.根据权利要求9所述的搜索意图识别装置,其特征在于,若所述实体领域标识具有多个,所述识别单元,具体被配置为执行对多个所述实体领域标识进行排序,得到排序后领域标识;将所述排序后领域标识添加至所述待识别搜索文本,得到所述拼接后文本。
11.根据权利要求8所述的搜索意图识别装置,其特征在于,所述向量融合模型包括自注意力机制层和向量融合层,所述识别单元,具体被配置为执行分别获取所述字符、所述实体领域标识在所述拼接后文本中的位置信息;通过所述注意力机制层,基于所述位置信息,分别确定所述字符向量表示的注意力权重,以及,所述领域向量表示的注意力权重;根据所述字符向量表示的注意力权重,对所述字符向量表示进行加权,以及,根据所述领域向量表示的注意力权重,对所述领域向量表示进行加权;通过所述向量融合层,融合加权后的字符向量表示和加权后的领域向量表示,得到所述融合后向量表示。
12.根据权利要求8所述的搜索意图识别装置,其特征在于,所述识别单元,具体被配置为执行将所述融合后向量表示输入至所述分类模型,通过所述分类模型对所述融合后向量表示进行分类处理,得到搜索意图分类结果;所述搜索意图分类结果包括至少一个候选搜索意图,且每个所述候选搜索意图具有对应的置信度;将置信度最高的所述候选搜索意图,作为所述目标搜索意图。
13.根据权利要求8所述的搜索意图识别装置,其特征在于,所述装置还包括:样本获取单元,被配置为执行获取训练样本集;所述训练样本集包括样本搜索文本与对应的搜索意图标注结果;拼接单元,被配置为执行获取所述样本搜索文本的实体领域标识,并将所述实体领域标识拼接至所述样本搜索文本,得到拼接后样本文本;训练单元,被配置为执行采用所述拼接后样本文本与对应的搜索意图标注结果,对待训练意图识别模型进行训练,得到所述目标意图识别模型;其中,所述待训练意图识别模型包括待训练的所述文本向量化模型、待训练的所述向量融合模型和待训练的所述分类模型。
14.根据权利要求13所述的搜索意图识别装置,其特征在于,所述训练单元,具体被配置为执行将所述拼接后样本文本输入至待训练的所述文本向量化模型,获得所述拼接后样本文本中各个字符的字符特征向量,以及,获取所述样本搜索文本的实体领域标识对应的领域特征向量;将所述字符特征向量和所述领域特征向量输入至待训练的所述向量融合模型,通过所述待训练的所述向量融合模型对所述字符特征向量和所述领域特征向量进行融合处理,得到融合后特征向量;将所述融合后特征向量输入至待训练的所述分类模型,通过所述待训练的所述分类模型对所述融合后特征向量进行分类处理,得到搜索意图输出结果;基于所述搜索意图输出结果与所述搜索意图标注结果间的差异,对所述待训练意图识别模型的模型参数进行调整,直至调整后的所述待训练意图识别模型满足预设的训练条件,得到所述目标意图识别模型。
15.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的搜索意图识别方法。
16.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至7中任一项所述的搜索意图识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110619306.5A CN113255354B (zh) | 2021-06-03 | 2021-06-03 | 搜索意图识别方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110619306.5A CN113255354B (zh) | 2021-06-03 | 2021-06-03 | 搜索意图识别方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255354A CN113255354A (zh) | 2021-08-13 |
CN113255354B true CN113255354B (zh) | 2021-12-07 |
Family
ID=77186206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110619306.5A Active CN113255354B (zh) | 2021-06-03 | 2021-06-03 | 搜索意图识别方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255354B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792116B (zh) * | 2021-08-25 | 2024-03-29 | 北京库睿科技有限公司 | 基于搜索词语义多垂域多意图分层判定方法和系统 |
CN114090740B (zh) * | 2021-11-19 | 2023-07-07 | 北京有竹居网络技术有限公司 | 意图识别方法、装置、可读介质及电子设备 |
CN116756294B (zh) * | 2023-08-14 | 2023-12-26 | 北京智精灵科技有限公司 | 对话意图识别模型的构建方法、对话意图识别方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298042A (zh) * | 2019-06-26 | 2019-10-01 | 四川长虹电器股份有限公司 | 基于Bilstm-crf与知识图谱影视实体识别方法 |
CN111310008A (zh) * | 2020-03-20 | 2020-06-19 | 北京三快在线科技有限公司 | 搜索意图识别方法、装置、电子设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9875296B2 (en) * | 2015-03-25 | 2018-01-23 | Google Llc | Information extraction from question and answer websites |
CN110069631B (zh) * | 2019-04-08 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN112035637A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医学领域意图识别方法、装置、设备及存储介质 |
-
2021
- 2021-06-03 CN CN202110619306.5A patent/CN113255354B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298042A (zh) * | 2019-06-26 | 2019-10-01 | 四川长虹电器股份有限公司 | 基于Bilstm-crf与知识图谱影视实体识别方法 |
CN111310008A (zh) * | 2020-03-20 | 2020-06-19 | 北京三快在线科技有限公司 | 搜索意图识别方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113255354A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN109117777B (zh) | 生成信息的方法和装置 | |
CN113283551B (zh) | 多模态预训练模型的训练方法、训练装置及电子设备 | |
CN112131978B (zh) | 一种视频分类方法、装置、电子设备和存储介质 | |
CN113255354B (zh) | 搜索意图识别方法、装置、服务器及存储介质 | |
Liu et al. | Open-world semantic segmentation via contrasting and clustering vision-language embedding | |
CN111966914B (zh) | 基于人工智能的内容推荐方法、装置和计算机设备 | |
CN112163122A (zh) | 确定目标视频的标签的方法、装置、计算设备及存储介质 | |
CN111582409A (zh) | 图像标签分类网络的训练方法、图像标签分类方法及设备 | |
CN113298197B (zh) | 数据聚类方法、装置、设备及可读存储介质 | |
CN113761153B (zh) | 基于图片的问答处理方法、装置、可读介质及电子设备 | |
CN111831924A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN111159485A (zh) | 尾实体链接方法、装置、服务器及存储介质 | |
CN113033507B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN115187910A (zh) | 视频分类模型训练方法、装置、电子设备及存储介质 | |
CN113704534A (zh) | 图像处理方法、装置及计算机设备 | |
CN113408282B (zh) | 主题模型训练和主题预测方法、装置、设备及存储介质 | |
JP7121819B2 (ja) | 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム | |
CN115114469B (zh) | 一种图片识别方法、装置、设备及存储介质 | |
CN114329004A (zh) | 数字指纹生成、数据推送方法、装置和存储介质 | |
CN112101154B (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
CN113128526A (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
Zhou et al. | Geo-location inference on news articles via multimodal pLSA | |
CN114357203B (zh) | 多媒体检索方法、装置及计算机设备 | |
CN115599953A (zh) | 视频文本检索模型的训练方法、检索方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |