CN110390004B - 一种信息处理方法、电子设备和存储介质 - Google Patents

一种信息处理方法、电子设备和存储介质 Download PDF

Info

Publication number
CN110390004B
CN110390004B CN201910579208.6A CN201910579208A CN110390004B CN 110390004 B CN110390004 B CN 110390004B CN 201910579208 A CN201910579208 A CN 201910579208A CN 110390004 B CN110390004 B CN 110390004B
Authority
CN
China
Prior art keywords
information
subset
preset
extracting
incidence relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910579208.6A
Other languages
English (en)
Other versions
CN110390004A (zh
Inventor
杨双涛
赵国光
胡长建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910579208.6A priority Critical patent/CN110390004B/zh
Publication of CN110390004A publication Critical patent/CN110390004A/zh
Application granted granted Critical
Publication of CN110390004B publication Critical patent/CN110390004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种信息处理方法,该方法包括:接收待搜索的第一信息;从第一信息中提取表征搜索意图的第二信息;基于预先生成的第一集合确定第一信息和第二信息之间的关联关系;其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;若关联关系符合预设关联关系,基于第二信息进行搜索以得到第一信息的搜索结果。本发明的实施例同时还公开了一种电子设备和存储介质。

Description

一种信息处理方法、电子设备和存储介质
技术领域
本发明涉及但不限于计算机技术领域,尤其涉及一种信息处理方法、电子设备和存储介质。
背景技术
随着互联网和计算机技术的不断发展,越来越多的信息通过电子文档和网络超文本协议发布。事实类问题是最常见、最普通的一类问题,它涵盖了互联网用户最常见的一系列信息需求。相关技术中,针对事实类问题采用自然语言理解模块对用户输入的待搜索问题进行分析;然而,由于自然语言理解模块精度有限,极易产生错误的分析结果;进一步地,基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低。
发明内容
为解决上述技术问题,本发明实施例期望提供一种信息处理方法、电子设备和存储介质,解决了相关技术中基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低的问题,提高搜索结果的准确率。
本发明的技术方案是这样实现的:
一种信息处理方法,所述方法包括:
接收待搜索的第一信息;
从所述第一信息中提取表征搜索意图的第二信息;
基于预先生成的第一集合确定所述第一信息和所述第二信息之间的关联关系;其中,所述第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若所述关联关系符合预设关联关系,基于所述第二信息进行搜索以得到所述第一信息的搜索结果。
可选的,所述基于预先生成的第一集合确定所述第一信息和所述第二信息之间的关联关系,包括:
从所述第一集合中提取与所述第一信息关联的第一子集;
基于所述第二信息与所述第一子集,确定所述关联关系。
可选的,所述从所述第一集合中提取与所述第一信息关联的第一子集,包括:
基于预设长度的滑动窗口,以所述第一信息中的第一个词为起点向所述第一信息中的最后一个词滑动,得到第四信息;其中,所述预设长度的数量为多个,所述预设长度用于指示词的个数;
从第一集合中提取与所述第四信息之间的相似度符合第一预设相似度的所述第一子集。
可选的,所述基于所述第二信息与所述第一子集,确定所述关联关系,包括:
从所述第一集合中提取与所述第二信息之间的相似度符合第二预设相似度的第二子集;
基于所述第一子集与所述第二子集,确定所述关联关系。
可选的,所述若所述关联关系符合所述预设关联关系,基于所述第二信息进行搜索以得到所述搜索结果,包括:
若所述关联关系表征所述第一子集包括所述第二子集,确定所述关联关系符合所述预设关联关系,并基于所述第二信息进行搜索以得到所述搜索结果。
可选的,所述第三信息所属领域与所述第一信息所属领域相同。
可选的,所述方法还包括:
获取所述第三信息中表征搜索意图的第五信息;
获取与所述第五信息之间的相似度符合第三预设相似度的词,得到所述目标词;
构建包括所述目标词的所述第一集合。
一种电子设备,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中存储的信息处理程序,以实现以下步骤:
接收待搜索的第一信息;
从所述第一信息中提取表征搜索意图的第二信息;
基于第一集合确定所述第一信息和所述第二信息之间的关联关系;其中,所述第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若所述关联关系符合预设关联关系,基于所述第二信息进行搜索以得到所述第一信息的搜索结果。
可选的,所述处理器还用于实现以下步骤:
基于预设长度的滑动窗口,以所述第一信息中的第一个词为起点向所述第一信息中的最后一个词滑动,得到第四信息;其中,所述预设长度的数量为多个,所述预设长度用于指示词的个数;
从第一集合中提取与所述第四信息之间的相似度符合第一预设相似度的第一子集;
基于所述第二信息与所述第一子集,确定所述关联关系。
一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述的信息处理的方法的步骤。
本发明实施例所提供的信息处理方法、电子设备和存储介质,接收待搜索的第一信息;从第一信息中提取表征搜索意图的第二信息;基于预先生成的第一集合确定第一信息和第二信息之间的关联关系;其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;若关联关系符合预设关联关系,基于第二信息进行搜索以得到第一信息的搜索结果;也就是说,本发明实施例中从待搜索的第一信息中提取出表征搜索意图的第二信息后,只有在第二信息与第一信息之间的关联关系符合预设关联关系的情况下,才基于第二信息进行搜索,否则不执行搜索操作;解决了相关技术中基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低的问题,提高搜索结果的准确率。
附图说明
图1为本发明的实施例提供的一种信息处理方法的流程示意图;
图2为本发明的实施例提供的另一种信息处理方法的流程示意图;
图3为本发明的实施例提供的一种搜索意图和语义单元集合之间的映射关系的示意图;
图4为本发明的实施例提供的一种第一信息与语义单元之间的映射关系的示意图;
图5为本发明的实施例提供的又一种信息处理方法的流程示意图;
图6为本发明的实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明的实施例提供一种信息处理方法,应用于电子设备,参照图1所示,该方法包括以下步骤:
步骤101、接收待搜索的第一信息。
本发明实施例中,第一信息包括但不限于与事实类问题关联的信息。
在实际应用中,电子设备可以通过自身的输入模块接收待搜索的第一信息;输入模块包括但不限于键盘、麦克风等。用户通过输入模块向电子设备输入当前待搜索的第一信息,进而电子设备接收到第一信息,并将第一信息作为搜索的参考信息,进而执行后续的步骤。
步骤102、从第一信息中提取表征搜索意图的第二信息。
本发明实施例中,第二信息表征用户当前输入想要表达的目的。电子设备获取到第一信息后,可以采用文本分类、信息抽取以及语义匹配等技术,从第一信息中提取表征搜索意图的第二信息。
步骤103、基于预先生成的第一集合确定第一信息和第二信息之间的关联关系。
其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词。
本发明实施例中,预先生成的第一集合可以称为语义单元集合。这里,第一集合与第一信息所属领域内的用户意图集合、该领域内的语料库中的至少一个相关联。
本发明实施例中,语义单元集合的定义和获取需要从用户意图集合和领域内的语料库分析入手;示例性的,可以先利用词向量或主题模型等针对领域内的语料库中的语料进行分布式表示;然后针对单个意图下面的词汇提取高频词和高频语言模型N-Gram片段,并基于词向量针对词和N-Gram片段进行分布式表示;然后结合业务知识针对词和N-Gram片段进行筛选,最终保留的词和N-Gram即为该用户意图必须具备的语义单元集合。
本发明实施例中,第一信息和第二信息之间的关联关系表征第二信息能够用于表征第一信息的搜索意图的准确程度。
在实际应用中,电子设备获取到第一信息,并从第一信息中提取出第二信息后,基于预先生成的第一集合确定第一信息和所述第二信息之间的关联关系。需要说明的是,确定出的第一信息和所述第二信息之间的关联关系,是进一步确定是否基于第二信息进行搜索的主要因素之一。
步骤104、若关联关系符合预设关联关系,基于第二信息进行搜索以得到第一信息的搜索结果。
本发明实施例中,电子设备将确定出的第一信息和所述第二信息之间的关联关系与预设关联关系进行比对,若关联关系符合预设关联关系,表征第二信息能够用于准确表示第一信息的搜索意图,则基于第二信息进行搜索以得到第一信息的搜索结果。
本发明实施例所提供的信息处理方法,接收待搜索的第一信息;从第一信息中提取表征搜索意图的第二信息;基于预先生成的第一集合确定第一信息和第二信息之间的关联关系;其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;若关联关系符合预设关联关系,基于第二信息进行搜索以得到第一信息的搜索结果;也就是说,本发明实施例中从待搜索的第一信息中提取出表征搜索意图的第二信息后,只有在第二信息与第一信息之间的关联关系符合预设关联关系的情况下,才基于第二信息进行搜索,否则不执行搜索操作;解决了相关技术中基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低的问题,提高搜索结果的准确率。
基于前述实施例,本发明的实施例提供一种信息处理方法,应用于电子设备,参照图2所示,该方法包括以下步骤:
步骤201、接收待搜索的第一信息。
步骤202、从第一信息中提取表征搜索意图的第二信息。
步骤203、从第一集合中提取与第一信息关联的第一子集。
其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词。本发明实施例中,第三信息所属领域与第一信息所属领域相同,以提高后续确定关联关系的准确性。
本发明实施例中,电子设备可以通过如下方式构建第一集合,
第一步、获取第三信息中表征搜索意图的第五信息。
本发明实施例中,第五信息表征用户历史输入想要表达的目的。电子设备获取到第三信息后,可以采用文本分类、信息抽取以及语义匹配等技术,从第三信息中提取表征搜索意图的第五信息。
第二步、获取与第五信息之间的相似度符合第三预设相似度的词,得到目标词。
本发明实施例中,目标词包括但不限于第五信息的同义词、近义词、衍生词。这里,电子设备获取到第三信息中表征搜索意图的第五信息后,进而获取到与第五信息之间的相似度符合第三预设相似度的目标词。
第三步、构建包括目标词的第一集合。
本发明实施例中,电子设备获取到第五信息和目标词后,至少基于第五信息和目标词构建第一集合;也就是说,第一集合至少包括第五信息和目标词。
示例性的,参见图3所示,31所指第二集合包括历史搜索的第三信息中的第五信息;32所指第一集合即语义单元集合包括第五信息和目标词。由图3可知,搜索意图和语义单元集合中的语音单元之间存在多对多的关系。
本发明实施例中,上述步骤203从第一集合中提取与第一信息关联的第一子集,包括:
步骤203a、基于预设长度的滑动窗口,以第一信息中的第一个词为起点向第一信息中的最后一个词滑动,得到第四信息。
其中,预设长度的数量为多个,预设长度用于指示词的个数。
本发明实施例中,滑动窗口的长度可以灵活设置,并且滑动窗口的个数为多个。也就是说,电子设备可以基于不同长度的滑动窗口以第一信息中的第一个词为起点向第一信息中的最后一个词滑动,得到不同的信息,并将所得到的不同信息组成第四信息。这里,电子设备基于不同长度的滑动窗口在第一信息上进行滑动,得到的是不同长度的关键词;进而得到用户输入中包含的全部语义单元。
示例性的,参见图4所示,电子设备基于长度与一的滑动窗口,以第一信息如41所指的信息“I want to update my phone can you help me?”中的第一个词为起点向第一信息中的最后一个词滑动,得到第四信息。例如,第四信息包括42所指的语义单元中的所有信息。
步骤203b、从第一集合中提取与第四信息之间的相似度符合第一预设相似度的第一子集。
本发明实施例两种,电子设备得到第四信息后,从第一集合中提取与第四信息之间的相似度符合第一预设相似度的第一子集;进一步地,将第一子集作为确定第一信息和所述第二信息之间的关联关系的主要因素之一。
步骤204、基于第二信息与第一子集,确定关联关系。
本发明实施例中,上述步骤204基于第二信息与第一子集,确定关联关系,包括:
步骤204a、从第一集合中提取与第二信息之间的相似度符合第二预设相似度的第二子集。
步骤204b、基于第一子集与第二子集,确定关联关系。
本发明实施例中,电子设备获取到第一子集和第二子集后,基于第一子集与第二子集,可以确定第一信息和所述第二信息之间的关联关系。
步骤205、若关联关系表征第一子集包括第二子集,确定关联关系符合预设关联关系,并基于第二信息进行搜索以得到搜索结果。
本发明实施例中,电子设备将第一子集与第二子集进行比对,得到第一信息和所述第二信息之间的关联关系;进一步地,电子设备确定关联关系表征第一子集包括第二子集,则确定关联关系符合预设关联关系,并基于第二信息进行搜索以得到搜索结果。
本发明实施例中,电子设备将第一子集与第二子集进行比对,得到第一信息和所述第二信息之间的关联关系;进一步地,电子设备确定关联关系表征第一子集不包括第二子集,则确定关联关系不符合预设关联关系,则不执行搜索操作。
由上述内容可知,本发明实施例中从待搜索的第一信息中提取出表征搜索意图的第二信息后,只有在第二信息与第一信息之间的关联关系符合预设关联关系的情况下,才基于第二信息进行搜索,否则不执行搜索操作;解决了相关技术中基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低的问题,提高搜索结果的准确率。
基于前述实施例,对本发明实施例提供所提供的信息处理方法作进一步的说明,该信息处理方法应用于电子设备,参照图5所示,该方法包括以下步骤:
这里,对本发明实施例中的电子设备包括的各个模块进行简要说明;输入模块,用于接收用户输入的待搜索的第一信息。自然语言理解模块,用于基于第一信息进行分析得到用户的搜索意图I。语义单元查询模块,用于基于第一集合查询得到用户的搜索意图I对应的语义单元集合S1。语义单元检测模块,用于确定第一信息对应的语义单元集合S2是否包括S1。
第一步,电子设备通过输入模块接收待搜索的第一信息。
第二步,电子设备通过自然语言理解模块对第一信息进行分析,得到相应用户意图I。
第三步,电子设备通过语义单元查询模块基于用户意图I,从第一集合中查询得到对应的语义单元集合S1。
第四步,电子设备通过语义单元检测模块检测第一信息对应的语义单元集合S2中是否出现了S1中包含的语义单元。
第五步,如果出现,电子设备确定检测通过,基于用户意图I进行搜索以得到所述第一信息的搜索结果。
第六步,如果未出现,电子设备确定检测未通过,不执行搜索操作。
在实际应用中,相关技术中的智能客服的自然语言理解模块由于分类器的类别覆盖不够全面、用户输入内部非关键特征带来的干扰等原因,会使分类器产生错误理解的情况。基于本发明实施例所提供的信息处理方法,电子设备通过对自然语言理解模块所理解的用户意图的检验,能够及时发现自然语言理解模块的理解错误,从而避免向用户推送错误的答案。
进一步地,本发明实施例所提供的信息处理方法,不仅能够及时发现自然语言理解模块的理解错误,从而避免向用户推送错误的答案,而且实现简单;而且,可以通过数据的积累,不断进行学习以改进自然语言理解模块的理解准确性。
由上述内容可知,本发明实施例中从待搜索的第一信息中提取出表征搜索意图的第二信息后,只有在第二信息与第一信息之间的关联关系符合预设关联关系的情况下,才基于第二信息进行搜索,否则不执行搜索操作;解决了相关技术中基于错误的分析结果进行搜索得到搜索结果,导致搜索结果的准确率较低的问题,提高搜索结果的准确率。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
基于前述实施例,本发明的实施例提供一种电子设备,该电子设备可以应用于图1~2对应的实施例提供的一种信息处理方法中,参照图6所示,该信息处理设备6包括:处理器61、存储器62和通信总线63,其中:
通信总线63用于实现处理器61和存储器62之间的通信连接。
处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
接收待搜索的第一信息;
从第一信息中提取表征搜索意图的第二信息;
基于预先生成的第一集合确定第一信息和第二信息之间的关联关系;其中,第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若关联关系符合预设关联关系,基于第二信息进行搜索以得到第一信息的搜索结果。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
从第一集合中提取与第一信息关联的第一子集;
基于第二信息与第一子集,确定关联关系。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
基于预设长度的滑动窗口,以第一信息中的第一个词为起点向第一信息中的最后一个词滑动,得到第四信息;其中,预设长度的数量为多个,预设长度用于指示词的个数;
从第一集合中提取与第四信息之间的相似度符合第一预设相似度的第一子集。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
从第一集合中提取与第二信息之间的相似度符合第二预设相似度的第二子集;
基于第一子集与第二子集,确定关联关系。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
若关联关系表征第一子集包括第二子集,确定关联关系符合预设关联关系,并基于第二信息进行搜索以得到搜索结果。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
第三信息所属领域与第一信息所属领域相同。
在本发明的其他实施例中,处理器61用于执行存储器62中存储的信息处理程序,以实现以下步骤:
获取第三信息中表征搜索意图的第五信息;
获取与第五信息之间的相似度符合第三预设相似度的词,得到目标词;
构建包括目标词的第一集合。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~2对应的实施例提供的信息处理方法中的实现过程,此处不再赘述。
基于前述实施例,本发明的实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:
接收待搜索的第一信息;
从所述第一信息中提取表征搜索意图的第二信息;
基于预先生成的第一集合确定所述第一信息和所述第二信息之间的关联关系;其中,所述第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若所述关联关系符合预设关联关系,基于所述第二信息进行搜索以得到所述第一信息的搜索结果。
在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:
从所述第一集合中提取与所述第一信息关联的第一子集;
基于所述第二信息与所述第一子集,确定所述关联关系。
在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:
基于预设长度的滑动窗口,以所述第一信息中的第一个词为起点向所述第一信息中的最后一个词滑动,得到第四信息;其中,所述预设长度的数量为多个,所述预设长度用于指示词的个数;
从第一集合中提取与所述第四信息之间的相似度符合第一预设相似度的所述第一子集。
在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:
从所述第一集合中提取与所述第二信息之间的相似度符合第二预设相似度的第二子集;
基于所述第一子集与所述第二子集,确定所述关联关系。
在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:
若所述关联关系表征所述第一子集包括所述第二子集,确定所述关联关系符合所述预设关联关系,并基于所述第二信息进行搜索以得到所述搜索结果。
在本发明的其他实施例中,所述第三信息所属领域与所述第一信息所属领域相同。
在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:
获取所述第三信息中表征搜索意图的第五信息;
获取与所述第五信息之间的相似度符合第三预设相似度的词,得到所述目标词;
构建包括所述目标词的所述第一集合。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~2对应的实施例提供的信息处理方法中的实现过程,此处不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (8)

1.一种信息处理方法,所述方法包括:
接收待搜索的第一信息;
从所述第一信息中提取表征搜索意图的第二信息;
从预先生成的第一集合中提取与所述第一信息关联的第一子集;
从所述第一集合中提取与所述第二信息之间的相似度符合第二预设相似度的第二子集;
基于所述第一子集与所述第二子集,确定所述第一信息和所述第二信息之间的关联关系;其中,所述第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若所述关联关系符合预设关联关系,基于所述第二信息进行搜索以得到所述第一信息的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一集合中提取与所述第一信息关联的第一子集,包括:
基于预设长度的滑动窗口,以所述第一信息中的第一个词为起点向所述第一信息中的最后一个词滑动,得到第四信息;其中,所述预设长度的数量为多个,所述预设长度用于指示词的个数;
从所述第一集合中提取与所述第四信息之间的相似度符合第一预设相似度的所述第一子集。
3.根据权利要求1所述的方法,其特征在于,所述若所述关联关系符合所述预设关联关系,基于所述第二信息进行搜索以得到所述搜索结果,包括:
若所述关联关系表征所述第一子集包括所述第二子集,确定所述关联关系符合所述预设关联关系,并基于所述第二信息进行搜索以得到所述搜索结果。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第三信息所属领域与所述第一信息所属领域相同。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
获取所述第三信息中表征搜索意图的第五信息;
获取与所述第五信息之间的相似度符合第三预设相似度的词,得到所述目标词;
构建包括所述目标词的所述第一集合。
6.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中存储的信息处理程序,以实现以下步骤:
接收待搜索的第一信息;
从所述第一信息中提取表征搜索意图的第二信息;
从预先生成的第一集合中提取与所述第一信息关联的第一子集;从所述第一集合中提取与所述第二信息之间的相似度符合第二预设相似度的第二子集;基于所述第一子集与所述第二子集,确定所述第一信息和所述第二信息之间的关联关系;其中,所述第一集合包括与历史搜索的第三信息的搜索意图关联的目标词;
若所述关联关系符合预设关联关系,基于所述第二信息进行搜索以得到所述第一信息的搜索结果。
7.根据权利要求6中所述的电子设备,其特征在于,所述处理器还用于实现以下步骤:
基于预设长度的滑动窗口,以所述第一信息中的第一个词为起点向所述第一信息中的最后一个词滑动,得到第四信息;其中,所述预设长度的数量为多个,所述预设长度用于指示词的个数;
从所述第一集合中提取与所述第四信息之间的相似度符合第一预设相似度的所述第一子集。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的信息处理的方法的步骤。
CN201910579208.6A 2019-06-28 2019-06-28 一种信息处理方法、电子设备和存储介质 Active CN110390004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910579208.6A CN110390004B (zh) 2019-06-28 2019-06-28 一种信息处理方法、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910579208.6A CN110390004B (zh) 2019-06-28 2019-06-28 一种信息处理方法、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN110390004A CN110390004A (zh) 2019-10-29
CN110390004B true CN110390004B (zh) 2022-04-19

Family

ID=68285992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910579208.6A Active CN110390004B (zh) 2019-06-28 2019-06-28 一种信息处理方法、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN110390004B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015014993A (ja) * 2013-07-08 2015-01-22 日本電信電話株式会社 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015014993A (ja) * 2013-07-08 2015-01-22 日本電信電話株式会社 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置

Also Published As

Publication number Publication date
CN110390004A (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN108829893B (zh) 确定视频标签的方法、装置、存储介质和终端设备
CN108052659B (zh) 基于人工智能的搜索方法、装置和电子设备
CN108509474B (zh) 搜索信息的同义词扩展方法及装置
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
CN106874441B (zh) 智能问答方法和装置
CN107291783B (zh) 一种语义匹配方法及智能设备
US11816441B2 (en) Device and method for machine reading comprehension question and answer
CN111783518A (zh) 训练样本生成方法、装置、电子设备及可读存储介质
CN110222045A (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
CN108388553B (zh) 对话消除歧义的方法、电子设备及面向厨房的对话系统
CN109635157B (zh) 模型生成方法、视频搜索方法、装置、终端及存储介质
CN110096599B (zh) 知识图谱的生成方法及装置
US11526512B1 (en) Rewriting queries
CN109829045A (zh) 一种问答方法和装置
CN111260428A (zh) 一种商品推荐方法和装置
CN110674378A (zh) 基于余弦相似度和最小编辑距离的中文语义识别方法
CN111881297A (zh) 语音识别文本的校正方法及装置
CN110781687A (zh) 相同意图语句的获取方法及装置
CN111291168A (zh) 图书检索方法、装置及可读存储介质
CN106021532B (zh) 关键词的显示方法和装置
CN110795942A (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN111324705A (zh) 自适应性调整关连搜索词的系统及其方法
CN108536665A (zh) 一种确定语句一致性的方法及装置
CN105786803A (zh) 翻译方法及翻译装置
CN110390004B (zh) 一种信息处理方法、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant