CN106372132A - 基于人工智能的查询意图预测方法和装置 - Google Patents

基于人工智能的查询意图预测方法和装置 Download PDF

Info

Publication number
CN106372132A
CN106372132A CN201610728086.9A CN201610728086A CN106372132A CN 106372132 A CN106372132 A CN 106372132A CN 201610728086 A CN201610728086 A CN 201610728086A CN 106372132 A CN106372132 A CN 106372132A
Authority
CN
China
Prior art keywords
query intention
user
retrieval sentence
sentence
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610728086.9A
Other languages
English (en)
Inventor
吴文权
刘占
刘占一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610728086.9A priority Critical patent/CN106372132A/zh
Publication of CN106372132A publication Critical patent/CN106372132A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了一种基于人工智能的查询意图预测方法和装置,其中,方法包括:通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图;根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。该方法准确分析用户的查询意图,便于为用户提供符合其查询意图的检索结果,提高了检索性能。

Description

基于人工智能的查询意图预测方法和装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于人工智能的查询意图预测方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能最重要的方面就是语音识别技术。
随着互联网技术的发展,用户越来越习惯于在互联网上获取信息,比如,用户可在各门户网站、新闻应用、搜索引擎的等平台获取相关信息。
相关技术中,各门户网站、新闻应用、搜索引擎的等平台根据输入的检索语句中的关键词进行检索,然而,在很多应用场景下,用户输入的检索语句并不规范,可能检索语句中并不包含其要检索的实体对应的关键词,因而,导致根据关键词进行检索获得的搜索结果,与用户的查询意图不符,检索性能不高。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的查询意图预测方法,该方法准确分析用户的查询意图,便于为用户提供符合其查询意图的搜索结果,提高了检索性能。
本发明的第二个目的在于提出一种基于人工智能的查询意图预测装置。
为了实现上述目的,本发明第一方面实施例提出了一种基于人工智能的查询意图预测方法,包括:
通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图;
根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据所述意图分类模型预测与用户输入的检索语句对应的查询意图。
本发明实施例的基于人工智能的查询意图预测方法,通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图,并根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。由此,准确分析用户的查询意图,便于为用户提供符合其查询意图的搜索结果,提高了检索性能。
另外,本发明实施例的基于人工智能的查询意图预测方法,还具有如下附加的技术特征:
在本发明的一个实施例中,所述分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图,包括:
通过用户与搜索引擎交互的日志信息,分析用户在原始检索语句进行的检测变更行为;
根据所述检测变更行为,从用户后续输入的变更检索语句中确定所述原始检索语句的查询意图。
在本发明的一个实施例中,所述分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图,包括:
通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为;
根据所述点击行为,从所述搜索结果中确定所述原始检索语句的查询意图。
在本发明的一个实施例中,所述根据原始检索语句与查询意图的对应关系训练意图分类模型,包括:
生成包含原始检索语句与查询意图对应关系的训练语料;
将所述训练语料输入预设的神经网络模型进行训练,生成意图分类模型。
在本发明的一个实施例中,在所述根据原始检索语句与查询意图的对应关系训练意图分类模型之后,还包括:
对用户输入的检索语句进行分词处理,并将分词结果以向量形式依序输入所述意图分类模型的输入层;
通过所述意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为所述检索语句的表示;
通过所述意图分类模型的输出层对所述隐层值进行概率分析,获取所述检索测语句的查询意图。
为了实现上述目的,本发明第二方面实施例提出了一种基于人工智能的查询意图预测装置,包括:
分析模块,用于通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图;
训练模块,用于根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据所述意图分类模型预测与用户输入的检索语句对应的查询意图。
本发明实施例的基于人工智能的查询意图预测装置,通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图,并根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。由此,准确分析用户的查询意图,便于为用户提供符合其查询意图的搜索结果,提高了检索性能。
另外,本发明实施例的基于人工智能的查询意图预测装置,还具有如下附加的技术特征:
在本发明的一个实施例中,所述分析模块包括:
第一分析单元,用于通过用户与搜索引擎交互的日志信息,分析用户在原始检索语句进行的检测变更行为;
第一确定单元,用于根据所述检测变更行为,从用户后续输入的变更检索语句中确定所述原始检索语句的查询意图。
在本发明的一个实施例中,第一分析单元,用于通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为;
第二确定单元,用于根据所述点击行为,从所述搜索结果中确定所述原始检索语句的查询意图。
在本发明的一个实施例中,所述训练模块用于:
生成包含原始检索语句与查询意图对应关系的训练语料;
将所述训练语料输入预设的神经网络模型进行训练,生成意图分类模型。
在本发明的一个实施例中,所述装置还包括:
处理模块,用于对用户输入的检索语句进行分词处理;输入模块,用于将分词结果以向量形式依序输入所述意图分类模型的输入层;
第一获取模块,用于通过所述意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为所述检索语句的表示;
第二获取模块,用于通过所述意图分类模型的输出层对所述隐层值进行概率分析,获取所述检索测语句的查询意图。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于人工智能的查询意图预测方法的流程图;
图2是根据本发明一个实施例的神经网络模型的结构示意图;
图3是根据本发明另一个实施例的基于人工智能的查询意图预测方法的流程图;
图4是根据本发明一个实施例的基于人工智能的查询意图预测方法的应用结果示意图;
图5是根据本发明第一个实施例的基于人工智能的查询意图预测装置的结构示意图;
图6是根据本发明第二个实施例的基于人工智能的查询意图预测装置的结构示意图;
图7是根据本发明第三个实施例的基于人工智能的查询意图预测装置的结构示意图;以及
图8是根据本发明第四个实施例的基于人工智能的查询意图预测装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的查询意图预测方法和装置。
目前,随着互联网信息的丰富以及用户的增多,在用户在搜索引擎等平台进行检索时,输入的检索语句越来越多元化,用户的查询意图蕴含于用户提供的检索语句中,但是在一些场景下,该查询意图在检索语句中并不是以字面的形式进行表述,仅仅通过匹配检索语句中的关键词进行检索,得到的搜索结果并不符合用户的查询意图。
举例而言,当用户为了解地锅鸡在吉林的市场走向,在搜索引擎中输入的检索语句是“在吉林哪里可以卖地锅鸡吗”,则通过匹配检索语句中关键词“吉林”、“卖”和“地锅鸡”,会为用户提供在吉林卖地锅鸡的有名的饭店等搜索结果,该搜索结果显然与用户的查询意图不符。
为了解决上述问题,本发明提出了一种基于人工智能的查询意图预测方法,该方法可以正确理解用户的查询意图,以为用户提供符合其查询意图的搜索结果,提高了检索性能。
该基于人工智能的查询意图预测方法实施例的具体说明如下:
图1是根据本发明一个实施例的基于人工智能的查询意图预测方法的流程图。
如图1所示,该基于人工智能的查询意图预测方法可包括:
S110,通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图。
具体地,在实际应用中,用户的检索行为与其查询意图息息相关,因而可通过与搜索引擎交互的日志信息,分析原始搜索语句中的查询意图。
需要说明的是,根据具体应用场景的不同,通过分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图的方式有多种,举例说明如下:
第一种示例,由于用户的查询意图与用户的检测变更行为息息相关,比如,如果用户对当前搜索结果不满意,则会变更检索行为,比如会细化检索词等,以满足其查询意图。
因而可通过分析用户与搜索引擎交互的日志信息,分析用户的检测变更行为,以根据该检测变更行为获取原始检索语句的查询意图。
具体而言,在本示例中,通过与搜索引擎的交互日志信息,分析用户在原始检索语句进行的检测变更行为,并根据该检测变更行为,从用户后续输入的变更检索语句中确定原始检索语句中的查询意图。
举例而言,通过用户与搜索引擎的交互日志,获取用户的检索行为从“婚车上插花”变更为“婚车上插花的寓意”,则可以推测原始检索语句“婚车上插花”的查询意图之一为“寓意”。
第二种示例,由于用户的查询意图与用户的点击行为息息相关,比如,用户会对当前搜索结果中与查询意图符合的内容等。
因而可通过分析用户与搜索引擎交互的日志信息,分析用户的对搜索结果的点击行为,以根据该点击行为获取原始检索语句的查询意图。
具体而言,在本示例中,通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为,以根据点击行为,从搜索结果中确定原始检索语句的查询意图。
举例而言,针对检索语句“银行跨行取钱”的搜索结果,用户的点击的为标题为“银行跨行取钱手续费”的信息,则可以推测“手续费”为原始检索语句“银行跨行取钱”的意图之一。
S120,根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。
具体地,在确定原始检索语句的查询意图后,为了准确的分析用户输入的检索语句对应的查询意图,以原始检索语句和与其对应的查询意图为训练语料,根据原始检索语句与查询意图的对应关系训练意图分类模型。
需要说明的是,根据具体应用场景的不同,根据原始检索语句与查询意图的对应关系训练意图分类模型的方式有多种,举例说明如下:
第一种示例,可生成包含原始检索语句与查询意图对应关系的训练语料,并将训练语料输入预设的模型进行训练,以生成意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。
在本示例中,根据具体应用需求的不同,预设的模型可以为神经网络模型等。
第二种示例,可生成大量包含原始检索语句与查询意图对应关系的训练语料,并对原始检索语句与查询意图对应关系进行特征统计,以生成相应的包含检索语句与查询意图对应关系特征的特征库的意图分类模型,以便根据意图分类模型预测,与用户输入的检索语句的相关特征对应的查询意图。
基于以上描述,应当理解的是,本发明实施例的基于人工智能的查询意图预测方法,通过对用户与搜索引擎交互的日志信息的分析,挖掘各种类型的交互语句所蕴含的意图信息,将这些信息进行整合学习,能准确推理新的用户检索语句的查询意图,以便于通过该查询能够方便的找到与用户查询意图相符的后端资源。
即如下表1所示,当用户输入的检索语句为“近两年牙齿不好”时,根据意图分类模型预测与用户输入的检索语句对应的查询意图为“维生素”;当用户输入的检索语句为“盐业专卖存在”时,根据意图分类模型预测与用户输入的检索语句对应的查询意图为“原因”。
当用户输入的检索语句为“银行跨行取钱”时,根据意图分类模型预测与用户输入的检索语句对应的查询意图为“手续费”;当用户输入的检索语句为“假期做的一件有意义的事”时,根据意图分类模型预测与用户输入的检索语句对应的查询意图为“作文”等。
query 意图词
近两年牙齿经常不好缺什么 维生素
盐业专卖存在 原因
银行卡跨行取钱 手续费
假期做的一件有意义的事情 作文
手机话费充值10086 手机充值
1v适合年轻吗 适合人群
柳市好吃的地方 美食
表1
综上所述,本发明实施例的基于人工智能的查询意图预测方法,通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图,并根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。由此,准确分析用户的查询意图,便于为用户提供符合其查询意图的搜索结果,提高了检索性能。
基于以上实施例,进一步地,为了清楚的描述本发明实施例的基于人工智能的查询意图预测方法,下面结合意图分类模型对用户输入的检索语句对应的查询意图的具体预测过程进行说明。
在本示例中,意图分类模型通过预设的神经网络模型训练生成的,根据包含原始检索语句与查询意图对应关系的训练语料训练生成的。
其中,如图2所示,该预设的神经网络模型包括接收用户输入的检索语句的词的表示层,即输入层,对用户的检索语句中的词汇进行检索聚合等处理操作的词的聚合层和句子表示层,即隐层,以及输出与用户的检索语句对应的Softmax层,即输出层,其中,Softmax函数是用于对结果进行分类的函数。
图3是根据本发明另一个实施例的基于人工智能的查询意图预测方法的流程图,如图3所示,在上述步骤S120之后,该基于人工智能的查询意图预测方法还包括:
S210,对用户输入的检索语句进行分词处理,并将分词结果以向量形式依序输入意图分类模型的输入层。
具体地,为了便于处理,将用户输入的检索语句进行分析处理,比如,根据用户输入的检索语句中的词性,对检索语句进行分词处理,并将分词结果以向量形式,比如以浮点向量的形式依序输入意图分类模型的输入层。
S220,通过意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为检索语句的表示。
具体地,利用历史输入词语的特征等对输入的词语进行处理,即通过意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为检索语句的表示。
S230,通过意图分类模型的输出层对隐层值进行概率分析,获取检测语句的查询意图。
具体地,通过意图分类模型的输出层对隐层值进行概率分析,对意图进行分类,以获取检测语句的查询意图。
举例而言,如图4所示,当用户输入的检索语句是“明天下雨吗”时,通过意图分类模型,获取的该检索语句对应的查询意图是“天气”,从而,如图4所示,为用户提供的搜索结果中直接为用户提供天气信息即可满足需求。
综上所述,本发明实施例的基于人工智能的查询意图预测方法,对用户输入的检索语句进行分词处理,并将分词结果以向量形式依序输入意图分类模型的输入层,通过意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为检索语句的表示,进而通过意图分类模型的输出层对隐层值进行概率分析,获取检索语句的查询意图。由此,可准确为用户提供符合其查询意图的搜索结果,提高了检索性能。
为了实现上述实施例,本发明还提出了一种基于人工智能的查询意图预测装置,图5是根据本发明第一个实施例的基于人工智能的查询意图预测装置的结构示意图,如图5所示,该基于人工智能的查询意图预测装置包括:分析模块10和训练模块20。
其中,分析模块10,用于通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图。
需要说明的是,根据具体应用场景的不同,通过分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图的方式有多种,举例说明如下:
第一种示例,由于用户的查询意图与用户的检测变更行为息息相关,比如,如果用户对当前搜索结果不满意,则会变更检索行为,比如会细化检索词等,以满足其查询意图。
因而可通过分析用户与搜索引擎交互的日志信息,分析用户的检测变更行为,以根据该检测变更行为获取原始检索语句的查询意图。
具体而言,在本示例中,图6是根据本发明第二个实施例的基于人工智能的查询意图预测装置的结构示意图,如图6所示,在如图5所示的基础上,该分析模块10可包括:第一分析单元11和第一确定单元12。
其中,第一分析单元11,用于通过用户与搜索引擎交互的日志信息,分析用户在原始检索语句进行的检测变更行为。
第一确定单元12,用于根据检测变更行为,从用户后续输入的变更检索语句中确定原始检索语句的查询意图。
第二种示例,由于用户的查询意图与用户的点击行为息息相关,比如,用户会对当前搜索结果中与查询意图符合的内容等。
因而可通过分析用户与搜索引擎交互的日志信息,分析用户的对搜索结果的点击行为,以根据该点击行为获取原始检索语句的查询意图。
具体而言,在本示例中,图7是根据本发明第三个实施例的基于人工智能的查询意图预测装置的结构示意图,如图7所示,在如图5所示的基础上,该分析模块10可包括:第二分析单元13和第二确定单元14。
其中,第二分析单元13,用于通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为。
第二确定单元14,用于根据点击行为,从搜索结果中确定原始检索语句的查询意图。
训练模块20,用于根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。
具体地,在确定原始检索语句的查询意图后,为了准确的分析用户输入的检索语句对应的查询意图,训练模块20以原始检索语句和与其对应的查询意图为训练语料,根据原始检索语句与查询意图的对应关系训练意图分类模型。
需要说明的是,前述对基于人工智能的查询意图预测方法的描述,也适用于对本实施例的基于人工智能的查询意图预测装置的描述,其实现原理类似,对于本实施例中未披露的细节,在此不再赘述。
综上所述,本发明实施例的基于人工智能的查询意图预测装置,通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图,并根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据意图分类模型预测与用户输入的检索语句对应的查询意图。由此,准确分析用户的查询意图,便于为用户提供符合其查询意图的搜索结果,提高了检索性能。
基于以上实施例,进一步地,为了清楚的描述本发明实施例的基于人工智能的查询意图预测装置,下面结合意图分类模型对用户输入的检索语句对应的查询意图的具体预测过程进行说明,在本示例中,训练模块20用于:生成包含原始检索语句与查询意图对应关系的训练语料,并将训练语料输入预设的神经网络模型进行训练,生成意图分类模型。
图8是根据本发明第四个实施例的基于人工智能的查询意图预测装置的结构示意图,如图8所示,在如图5所示的基础上,该基于人工智能的查询意图预测装置还包括:处理模块30、输入模块40、第一获取模块50和第二获取模块60。
其中,处理模块30,用于对用户输入的检索语句进行分词处理。
输入模块40,用于将分词结果以向量形式依序输入意图分类模型的输入层。
第一获取模块50,用于通过意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为检索语句的表示。
第二获取模块60,用于通过意图分类模型的输出层对隐层值进行概率分析,获取检索语句的查询意图。
需要说明的是,前述对基于人工智能的查询意图预测方法的描述,也适用于对本实施例的基于人工智能的查询意图预测装置的描述,其实现原理类似,对于本实施例中未披露的细节,在此不再赘述。
综上所述,本发明实施例的基于人工智能的查询意图预测装置,对用户输入的检索语句进行分词处理,并将分词结果以向量形式依序输入意图分类模型的输入层,通过意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为检索语句的表示,进而通过意图分类模型的输出层对隐层值进行概率分析,获取检索语句的查询意图。由此,可准确为用户提供符合其查询意图的搜索结果,提高了检索性能。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于人工智能的查询意图预测方法,其特征在于,包括以下步骤:
通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图;
根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据所述意图分类模型预测与用户输入的检索语句对应的查询意图。
2.如权利要求1所述的方法,其特征在于,所述分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图,包括:
通过用户与搜索引擎交互的日志信息,分析用户在原始检索语句进行的检测变更行为;
根据所述检测变更行为,从用户后续输入的变更检索语句中确定所述原始检索语句的查询意图。
3.如权利要求1所述的方法,其特征在于,所述分析用户与搜索引擎交互的日志信息,获取原始检索语句的查询意图,包括:
通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为;
根据所述点击行为,从所述搜索结果中确定所述原始检索语句的查询意图。
4.如权利要求1所述的方法,其特征在于,所述根据原始检索语句与查询意图的对应关系训练意图分类模型,包括:
生成包含原始检索语句与查询意图对应关系的训练语料;
将所述训练语料输入预设的神经网络模型进行训练,生成意图分类模型。
5.如权利要求1-4任一所述的方法,其特征在于,在所述根据原始检索语句与查询意图的对应关系训练意图分类模型之后,还包括:
对用户输入的检索语句进行分词处理,并将分词结果以向量形式依序输入所述意图分类模型的输入层;
通过所述意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为所述检索语句的表示;
通过所述意图分类模型的输出层对所述隐层值进行概率分析,获取所述检索语句的查询意图。
6.一种基于人工智能的查询意图预测装置,其特征在于,包括:
分析模块,用于通过用户与搜索引擎交互的日志信息,分析原始检索语句的查询意图;
训练模块,用于根据原始检索语句与查询意图的对应关系训练意图分类模型,以便根据所述意图分类模型预测与用户输入的检索语句对应的查询意图。
7.如权利要求6所述的装置,其特征在于,所述分析模块包括:
第一分析单元,用于通过用户与搜索引擎交互的日志信息,分析用户在原始检索语句进行的检测变更行为;
第一确定单元,用于根据所述检测变更行为,从用户后续输入的变更检索语句中确定所述原始检索语句的查询意图。
8.如权利要求6所述的装置,其特征在于,所述分析模块包括:
第二分析单元,用于通过用户与搜索引擎交互的日志信息,分析用户对原始检索语句对应搜索结果的点击行为;
第二确定单元,用于根据所述点击行为,从所述搜索结果中确定所述原始检索语句的查询意图。
9.如权利要求6所述的装置,其特征在于,所述训练模块用于:
生成包含原始检索语句与查询意图对应关系的训练语料;
将所述训练语料输入预设的神经网络模型进行训练,生成意图分类模型。
10.如权利要求6-9任一所述的装置,其特征在于,还包括:
处理模块,用于对用户输入的检索语句进行分词处理;
输入模块,用于将分词结果以向量形式依序输入所述意图分类模型的输入层;
第一获取模块,用于通过所述意图分类模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取的隐层值作为所述检索语句的表示;
第二获取模块,用于通过所述意图分类模型的输出层对所述隐层值进行概率分析,获取所述检索语句的查询意图。
CN201610728086.9A 2016-08-25 2016-08-25 基于人工智能的查询意图预测方法和装置 Pending CN106372132A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610728086.9A CN106372132A (zh) 2016-08-25 2016-08-25 基于人工智能的查询意图预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610728086.9A CN106372132A (zh) 2016-08-25 2016-08-25 基于人工智能的查询意图预测方法和装置

Publications (1)

Publication Number Publication Date
CN106372132A true CN106372132A (zh) 2017-02-01

Family

ID=57878380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610728086.9A Pending CN106372132A (zh) 2016-08-25 2016-08-25 基于人工智能的查询意图预测方法和装置

Country Status (1)

Country Link
CN (1) CN106372132A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951433A (zh) * 2017-02-04 2017-07-14 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN107562816A (zh) * 2017-08-16 2018-01-09 深圳狗尾草智能科技有限公司 用户意图自动识别方法及装置
CN107862027A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN108509501A (zh) * 2018-02-28 2018-09-07 努比亚技术有限公司 一种查询处理方法、服务器及计算机可读存储介质
CN108763264A (zh) * 2018-03-30 2018-11-06 斑马网络技术有限公司 基于车辆的智能搜索系统及其搜索方法
CN109460458A (zh) * 2018-10-29 2019-03-12 清华大学 查询改写意图的预测方法及装置
CN109492104A (zh) * 2018-11-09 2019-03-19 北京京东尚科信息技术有限公司 意图分类模型的训练方法、分类方法、系统、设备和介质
CN110209764A (zh) * 2018-09-10 2019-09-06 腾讯科技(北京)有限公司 语料标注集的生成方法及装置、电子设备、存储介质
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN111133724A (zh) * 2017-09-25 2020-05-08 微软技术许可有限责任公司 会话调度助理计算系统中的自然语言处理和分析
CN111159381A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 数据搜索方法及装置
CN111177357A (zh) * 2019-12-31 2020-05-19 中国人民大学 一个基于记忆神经网络的对话式信息检索的方法
CN111353021A (zh) * 2020-02-28 2020-06-30 百度在线网络技术(北京)有限公司 意图识别方法和设备、电子设备和介质
CN112434086A (zh) * 2020-12-04 2021-03-02 崔秀芬 基于云计算和大数据的信息流挖掘方法及云计算互动中心
CN112487164A (zh) * 2020-12-01 2021-03-12 中译语通科技(青岛)有限公司 一种人工智能交互方法
CN112712800A (zh) * 2020-12-14 2021-04-27 杭州未名信科科技有限公司 应用于充电桩的数据处理方法、装置、存储介质及终端
CN113544661A (zh) * 2019-03-07 2021-10-22 微软技术许可有限责任公司 使用搜索日志训练的意图编码器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法
CN103268348A (zh) * 2013-05-28 2013-08-28 中国科学院计算技术研究所 一种用户查询意图识别方法
CN104951433A (zh) * 2015-06-24 2015-09-30 北京京东尚科信息技术有限公司 基于上下文进行意图识别的方法和系统
CN105335391A (zh) * 2014-07-09 2016-02-17 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法
CN103268348A (zh) * 2013-05-28 2013-08-28 中国科学院计算技术研究所 一种用户查询意图识别方法
CN105335391A (zh) * 2014-07-09 2016-02-17 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN104951433A (zh) * 2015-06-24 2015-09-30 北京京东尚科信息技术有限公司 基于上下文进行意图识别的方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAODONG ZHANG等: "A Joint Model of Intent Determination and Slot Filling for Spoken Language Understanding", 《TWENTY-FIFTH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
张晓娟: "查询意图自动分类与分析", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951433A (zh) * 2017-02-04 2017-07-14 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN106951433B (zh) * 2017-02-04 2020-08-28 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN107562816A (zh) * 2017-08-16 2018-01-09 深圳狗尾草智能科技有限公司 用户意图自动识别方法及装置
US11663416B2 (en) 2017-09-25 2023-05-30 Microsoft Technology Licensing, Llc Signal analysis in a conversational scheduling assistant computing system
CN111133724A (zh) * 2017-09-25 2020-05-08 微软技术许可有限责任公司 会话调度助理计算系统中的自然语言处理和分析
CN107862027A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
CN107862027B (zh) * 2017-10-31 2019-03-12 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN108170859B (zh) * 2018-01-22 2020-07-28 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN108509501A (zh) * 2018-02-28 2018-09-07 努比亚技术有限公司 一种查询处理方法、服务器及计算机可读存储介质
CN108509501B (zh) * 2018-02-28 2022-07-26 成都国恒空间技术工程股份有限公司 一种查询处理方法、服务器及计算机可读存储介质
CN108763264A (zh) * 2018-03-30 2018-11-06 斑马网络技术有限公司 基于车辆的智能搜索系统及其搜索方法
CN110517672B (zh) * 2018-05-03 2023-08-15 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN110209764B (zh) * 2018-09-10 2023-04-07 腾讯科技(北京)有限公司 语料标注集的生成方法及装置、电子设备、存储介质
CN110209764A (zh) * 2018-09-10 2019-09-06 腾讯科技(北京)有限公司 语料标注集的生成方法及装置、电子设备、存储介质
CN109460458A (zh) * 2018-10-29 2019-03-12 清华大学 查询改写意图的预测方法及装置
CN109492104A (zh) * 2018-11-09 2019-03-19 北京京东尚科信息技术有限公司 意图分类模型的训练方法、分类方法、系统、设备和介质
CN109492104B (zh) * 2018-11-09 2023-01-31 北京汇钧科技有限公司 意图分类模型的训练方法、分类方法、系统、设备和介质
CN113544661A (zh) * 2019-03-07 2021-10-22 微软技术许可有限责任公司 使用搜索日志训练的意图编码器
CN111177357B (zh) * 2019-12-31 2023-05-23 中国人民大学 一个基于记忆神经网络的对话式信息检索的方法
CN111159381B (zh) * 2019-12-31 2023-05-26 中国银行股份有限公司 数据搜索方法及装置
CN111177357A (zh) * 2019-12-31 2020-05-19 中国人民大学 一个基于记忆神经网络的对话式信息检索的方法
CN111159381A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 数据搜索方法及装置
CN111353021A (zh) * 2020-02-28 2020-06-30 百度在线网络技术(北京)有限公司 意图识别方法和设备、电子设备和介质
CN111353021B (zh) * 2020-02-28 2023-08-18 百度在线网络技术(北京)有限公司 意图识别方法和设备、电子设备和介质
CN112487164A (zh) * 2020-12-01 2021-03-12 中译语通科技(青岛)有限公司 一种人工智能交互方法
CN112434086B (zh) * 2020-12-04 2021-09-21 上海东方财富证券投资咨询有限公司 基于云计算和大数据的信息流挖掘方法及云计算互动中心
CN112434086A (zh) * 2020-12-04 2021-03-02 崔秀芬 基于云计算和大数据的信息流挖掘方法及云计算互动中心
CN112712800A (zh) * 2020-12-14 2021-04-27 杭州未名信科科技有限公司 应用于充电桩的数据处理方法、装置、存储介质及终端

Similar Documents

Publication Publication Date Title
CN106372132A (zh) 基于人工智能的查询意图预测方法和装置
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN103544255B (zh) 基于文本语义相关的网络舆情信息分析方法
CN107391493B (zh) 一种舆情信息提取方法、装置、终端设备及存储介质
CN106708966A (zh) 基于相似度计算的垃圾评论检测方法
CN110168535A (zh) 一种信息处理方法及终端、计算机存储介质
CN111182162B (zh) 基于人工智能的电话质检方法、装置、设备和存储介质
CN108549697A (zh) 基于语义关联的信息推送方法、装置、设备以及存储介质
CN109087205A (zh) 舆情指数的预测方法及装置、计算机设备和可读存储介质
CN107291840A (zh) 一种用户属性预测模型构建方法和装置
CN108108347B (zh) 对话模式分析系统及方法
CN113254643B (zh) 文本分类方法、装置、电子设备和
CN107102993A (zh) 一种用户诉求分析方法和装置
CN115048586B (zh) 一种融合多特征的新闻推荐方法及系统
CN112765974B (zh) 一种业务辅助方法、电子设备及可读存储介质
CN114780831A (zh) 基于Transformer的序列推荐方法及系统
CN109063171B (zh) 基于语义的资源匹配方法
CN106844330B (zh) 文章情感的分析方法和装置
CN110717090A (zh) 一种旅游景点网络口碑评价方法、系统及电子设备
CN110472136A (zh) 查询结果的推送方法、装置、存储介质和计算机设备
CN112613321A (zh) 一种抽取文本中实体属性信息的方法及系统
CN116030370A (zh) 基于多目标追踪的行为识别方法、装置及电子设备
CN109543041A (zh) 一种语言模型得分的生成方法及装置
CN117149996A (zh) 面向人工智能应用的人机界面数字会话挖掘方法及ai系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170201