CN112463932A - 用于信息查询的方法、装置及设备 - Google Patents
用于信息查询的方法、装置及设备 Download PDFInfo
- Publication number
- CN112463932A CN112463932A CN202011466126.XA CN202011466126A CN112463932A CN 112463932 A CN112463932 A CN 112463932A CN 202011466126 A CN202011466126 A CN 202011466126A CN 112463932 A CN112463932 A CN 112463932A
- Authority
- CN
- China
- Prior art keywords
- query
- information
- result
- entity identification
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000009434 installation Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000007689 inspection Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000002860 competitive effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及信息检索技术领域,公开一种用于信息查询的方法。该方法包括:获取用户输入的查询信息;获取用户输入的查询信息;对所述查询信息进行实体识别,获得实体识别结果;根据所述实体识别结果确定所述用户的查询意图;根据所述查询意图获取所述查询信息所对应的查询结果。通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,然后根据查询意图获取查询信息所对应的查询结果;这样能够根据用户的查询意图返回与查询信息对应的查询结果,提高了用户进行信息查询时体验。本申请还公开一种用于信息查询的装置及设备。
Description
技术领域
本申请涉及信息检索技术领域,例如涉及一种用于信息查询的方法、装置及设备。
背景技术
随着互联网技术的快速发展,各种网站提供的内容信息更加丰富、信息量也更大。对于用户而言,面对网站提供的大量信息如何快速地获取自身所需的信息,通常需要通过后台服务器在网站上提供的入口输入查询信息,后台服务器根据该查询信息在数据库中进行检索,最后将检索到的查询结果返回用户端显示给用户。现有技术中,在理想情况下,用户输入查询信息后后台服务器能够给直接返回用户想要的查询结果并在用户端进行显示。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:后台服务器无法根据用户的查询意图进行查询。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于信息查询的方法、装置及设备,以能够根据用户的查询意图进行查询。
在一些实施例中,所述用于信息查询的方法,包括:
获取用户输入的查询信息;
对所述查询信息进行实体识别,获得实体识别结果;
根据所述实体识别结果确定所述用户的查询意图;
根据所述查询意图获取所述查询信息所对应的查询结果。
在一些实施例中,所述装置包括:包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述的用于信息查询的方法。
在一些实施例中,所述设备包括:上述的用于信息查询的装置。
本公开实施例提供的用于信息查询的方法、装置及设备,可以实现以下技术效果:通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,然后根据查询意图获取查询信息所对应的查询结果;这样能够根据用户的查询意图返回与查询信息对应的查询结果,提高了用户进行信息查询时体验。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于信息查询的方法的示意图;
图2是本公开实施例提供的另一个用于信息查询的方法的示意图;
图3是本公开实施例提供的一个用于信息查询的装置的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
结合图1所示,本公开实施例提供一种用于信息查询的方法,包括:
步骤S101,获取用户输入的查询信息;
步骤S102,对查询信息进行实体识别,获得实体识别结果;
步骤S103,根据实体识别结果确定用户的查询意图;
步骤S104,根据查询意图获取查询信息所对应的查询结果。
采用本公开实施例提供的用于信息查询的方法,通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,然后根据查询意图获取查询信息所对应的查询结果;这样能够根据用户的查询意图返回与查询信息对应的查询结果,提高了用户进行信息查询时体验。
可选地,对查询信息进行实体识别获得实体识别结果,包括:对查询信息进行归一化;对归一化后的查询信息进行实体识别,获得实体识别结果。
可选地,对查询信息进行归一化包括:对查询信息中的特殊符号进行过滤、将查询信息中出现的字母统一为小写字母、将查询信息中出现的繁体字统一为简体字和将查询信息的全角格式转为半角格式等中的一种或多种。
可选地,对归一化后的查询信息进行实体识别获得实体识别结果,包括:对归一化后的查询信息进行分词,获得分词结果;对分词结果进行实体识别,获得实体识别结果。
可选地,通过结合知识图谱的词典的分词方法对归一化后的查询信息进行分词,获得分词结果。可选地,结合知识图谱的词典,包括:将存储在预设的知识图谱数据库中的实体的属性名称加入到词典中。预设的知识图谱数据库中存储有各实体的名称、关系、属性等关联信息;还存储有查询类型和查询结果之间的对应关系。
可选地,通过结合知识图谱的词典的实体识别方法对分词结果进行实体识别,获得实体识别结果。
在一些实施例中,对进行归一化后的查询信息进行分词,分词采用的是基于词典的分词方法,并将存储在预设的知识图谱数据库中的实体的属性名称加入到词典中,通过词典对用户输入的查询信息进行分词得到分词结果。例如:用户输入的查询信息为“明察最新的安装手册”,对其进行分词得到分词结果为“明察”“最新的”“安装手册”。对分词结果进行实体识别,实体识别是基于词典的实体识别方法,并将存储在预设的知识图谱数据库中的实体的属性名称加入到词典中,通过词典对分词结果进行实体识别,得到“明察”及其属性“产品”、“安装手册”及其属性“文档类型”。
可选地,根据实体识别结果确定用户的查询意图,包括:确定出实体识别结果所满足的预设条件,将预设条件所对应的查询意图确定为用户的查询意图。
可选地,预设条件包括:第一预设条件、第二预设条件、第三预设条件、第四预设条件、第五预设条件、第六预设条件和第七预设条件。
可选地,在得到实体识别结果后,先判断该实体识别结果是否满足第一预设条件;在不满足第一预设条件的情况下,继续判断该实体识别结果是否满足其它预设条件;在满足第一预设条件的情况下,则将第一预设条件对应的查询意图作为用户的查询意图。若不满足第一预设条件,则判断该实体识别结果是否满足第二预设条件至第六预设条件中的一种,若满足第二预设条件至第六预设条件中的一种,则将该预设条件对应的查询意图确定为用户的查询意图;若不满足第二预设条件至第六预设条件中的一种,则确定该实体识别结果满足第七预设条件,并将第七预设条件对应的查询意图确定为用户的查询意图。
可选地,第一预设条件包括:实体识别结果是以实体结尾的文档类型。可选地,在该实体识别结果满足第一预设条件的情况下,第一预设条件所对应的查询意图为查询文档类型;并将查询文档类型作为用户的查询意图。
在一些实施例中,实体识别结果为“明察”及其属性“产品,名称”、“安装手册”及其属性“文档类型”;确定该实体识别结果满足第一预设条件,则将第一预设条件对应的查询意图作为用户的查询意图,即将查询文档类型作为用户的查询意图。
可选地,第二预设条件包括:实体识别结果中存只在单个实体;或,实体识别结果中存在多个实体,将实体结果放入实体列表中,以实体列表中的第一个实体为主,将其余实体确定为第一个实体的辅助查询的补充信息。可选地,在该实体识别结果满足第二预设条件的情况下,第二预设条件对应的查询意图为查询单个实体的所有相关属性。
在一些实施例中,实体识别结果为“明察”,确定该实体识别结果满足第二预设条件;或,实体识别结果为“张杰”及其属性“姓名”、“AI(Artificial Intelligence,人工智能)语义”及其属性“空”;或,实体识别结果为“尤旸”及其属性“姓名”、“知识图谱团队”及其属性“空”;则确定该实体识别结果满足第二预设条件,则将第二预设条件对应的查询意图作为用户的查询意图,即将查询实体的所有相关属性作为用户的查询意图。
可选地,第三预设条件包括:实体识别结果中只存在一个实体和该实体的属性词。在该实体识别结果满足第三预设条件的情况下,第三预设条件对应的查询意图为查询实体的特定属性。
在一些实施例中,实体识别结果为“匙朝阳”及其属性“员工,姓名”、“工号”及其属性“员工,工号”,则确定该实体识别结果满足第三预设条件;则将第三预设条件对应的查询意图作为用户的查询意图,即将查询实体的特定属性作为用户的查询意图。
可选地,第四预设条件包括:在实体识别结果中存在一个实体和与该实体相关联的关系词,且识别出的实体结果为主体和关系名。在该实体识别结果满足第四预设条件的情况下,第四预设条件对应的查询意图为查询某个实体对应的有特定关系的客体。
可选地,在预设的知识图谱数据库中存储有实体之间的关系,即在有特定关系的情况下实体为主体还是客体。例如:预设的知识图谱数据库中存储有产品和竞对产品的关系,即竞争关系;将“宝洁”存储为产品,“明察”存储为竞对产品;即“宝洁”为主体,“明察”为客体。这样就能在有特定关系的情况下判断出实体为主体还是客体。
在一些实施例中,实体识别结果为“宝洁”及其属性“客户,名称”、“竞争对手”,判断出实体为“宝洁”,关系为“竞争对手”;在关系为“竞争对手”的情况下,从预设的知识图谱数据库中获取与该关系对应的实体“宝洁”为主体,则确定该实体识别结果满足第四预设条件;则将第四预设条件对应的查询意图作为用户的查询意图,即将查询某个实体对应的有特定关系的客体作为用户的查询意图。
在一些实施例中,实体识别结果为“明察”及其属性“产品,名称”“团队成员”,判断出实体为“明察”,关系为“团队成员”;在关系为“团队成员”的情况下,从预设的知识图谱数据库中确定与该关系对应的实体“明察”为主体,则确定该实体识别结果满足第四预设条件;则将第四预设条件对应的查询意图作为用户的查询意图,即将查询某个实体对应的有特定关系的客体作为用户的查询意图。
可选地,第五预设条件包括:实体识别结果中存在一个实体和与该实体相关联的关系词,且识别出的实体结果为客体和关系名。在该实体识别结果满足第五预设条件的情况下,第五预设条件对应的查询意图为查询某个实体对应的有特定关系的主体。
在一些实施例中,实体识别结果为“匙朝阳”及其属性“员工,姓名”,“产品的经理”,判断出实体为“匙朝阳”,关系为“产品的经理”;在关系为“产品的经理”的情况下,从预设的知识图谱数据库中确定与该关系对应的实体“匙朝阳”为客体,则确定该实体识别结果满足第五预设条件;则将第五预设条件对应的查询意图作为用户的查询意图,即将查询某个实体对应的有特定关系的主体作为用户的查询意图。
可选地,第六预设条件包括:实体识别结果中存两个实体且带有预设短语。在该实体识别结果满足第六预设条件的情况下,第六预设条件对应的查询意图为查询两个实体间的关系。可选地,预设短语包括带有“关系”二字的短语,例如:“有什么关系”“是什么关系”“存在什么关系”“的关系”等。
在一些实施例中,实体识别结果为实体“公安知识图谱”及其属性“产品,名称”和实体“海致”及其属性“竞争对手”,以及短语“有什么关系”;则确定该实体识别结果满足第六预设条件;则将第六预设条件对应的查询意图作为用户的查询意图,即将查询两个实体间的关系作为用户的查询意图。
可选地,第七预设条件包括:实体识别结果不满足其他预设条件。在该实体识别结果满足第七预设条件的情况下,第七预设条件对应的查询意图为问答查询。
在一些实施例中,实体识别结果为“KOL”,该实体识别结果不满足其他预设条件,则确定“KOL”满足第七预设条件;则将第七预设条件对应的查询意图作为用户的查询意图,即将问答查询作为用户的查询意图。
通过结合知识图谱查询的方法,对用户输入的查询信息进行实体识别得到实体识别结果,根据实体识别结果获得用户的查询意图,并将用户的查询意图细分为七种类型,使得服务器能够更好的理解用户的查询意图。
可选地,根据查询意图获取查询信息所对应的查询结果,包括:根据查询意图确定查询类型;根据查询类型获取查询信息所对应的查询结果。
可选地,查询结果的类型为该查询信息对应的查询类型。
可选地,第一预设条件对应一种查询意图,该查询意图对应的查询类型为查询特定文档。
可选地,第二预设条件对应一种查询意图,该查询意图对应的查询类型为查询单个实体。
可选地,第三预设条件对应一种查询意图,该查询意图对应的查询类型为查询主体的属性。
可选地,第四预设条件对应一种查询意图,该查询意图对应的查询类型为查询和主体具有特定关系的客体。
可选地,第五预设条件对应一种查询意图,该查询意图对应的查询类型为查询和客体具有特定关系的主体。
可选地,第六预设条件对应一种查询意图,该查询意图对应的查询类型为查询主体和客体的关系。
可选地,第七预设条件对应一种查询意图,该查询意图对应的查询类型为查询QA(Query Answer,问答)。
可选地,第一预设条件对应的查询类型和第七预设条件对应的查询类型从ES(ElasticSearch)数据库中进行查询;第二预设条件至第六预设条件对应的查询类型从知识图谱数据库中进行查询。
可选地,通过对用户的查询信息进行归一化,并对归一化后的查询信息进行文本分词获取分词结果,然后根据知识图谱对分词结果进行实体识别,获得实体识别结果。
在一些实施例中,用户输入的查询信息为“明察#”,通过归一化对该查询信息进行处理,得到“明察”;通过基于知识图谱的实体识别方法对“明察”进行实体识别;确定“明察”为单个实体,则确定“明察”对应的查询意图为查询单个实体,则服务器反馈的查询结果为“明察”的所有属性,例如“明察”是一种产品、“明察”的功能、“明察”的简介等。
在一些实施例中,用户输入的查询信息为“匙朝阳的工号”,通过基于知识图谱的实体识别方法对“匙朝阳的工号”进行实体识别;得到实体识别结果“匙朝阳”及其属性“员工,姓名”,“工号”及其属性“员工,工号”;则确定出“匙朝阳”对应的主体为“员工,姓名”,“工号”对应的属性为“员工,工号”;确定出“匙朝阳”为主体,“工号”为主体的属性词,则确定“匙朝阳的工号”对应的查询意图为查询主体的特定属性,则服务器反馈的查询结果为“匙朝阳”的工号为0001等。
在一些实施例中,用户输入的查询信息为“宝洁的竞争对手”,通过基于知识图谱的实体识别方法对“宝洁的竞争对手”进行实体识别;得到实体识别结果“宝洁”及其属性“客户,名称”,关系为“竞争对手”,确定出“宝洁”为主体;则确定“宝洁的竞争对手”对应的查询意图为查询和主体具有特定关系的客体,则服务器反馈的查询结果为“联合利华”等。
在一些实施例中,用户输入的查询信息为“匙朝阳是哪个产品的经理”,通过基于知识图谱的实体识别方法对“匙朝阳是哪个产品的经理”进行实体识别;得到实体识别结果“匙朝阳”及其属性“员工,姓名”,关系为“产品的经理”,确定出“匙朝阳”为客体;则确定“匙朝阳是哪个产品的经理”对应的查询意图为查询和客体具有特定关系的主体,则服务器反馈的查询结果为“明察”等产品名称。
在一些实施例中,用户输入的查询信息为“匙朝阳和明察有什么关系”,通过基于知识图谱的实体识别方法对“匙朝阳和明察有什么关系”进行实体识别;得到实体识别结果“匙朝阳”及其属性“员工,姓名”,“明察”及其属性“产品,名称”,和带有“关系”二字的短语“有什么关系”,确定“匙朝阳”为主体,“明察”为客体;则确定“匙朝阳和明察有什么关系”对应的查询意图为查询主体和客体的关系,则服务器反馈的查询结果为“匙朝阳是明察的经理”和/或“匙朝阳是明察的负责人”等关系。
在一些实施例中,用户输入的查询信息为“KOL”,判断该查询信息不满足第一预设条件至第六预设条件中的任一种,则确定查询信息“KOL”满足第七预设条件,确定查询QA为“KOL”对应的查询意图,则服务器反馈的查询结果为“KOL”为产品等相关信息。
可选地,对分词结果进行实体识别还能识别出排序词,根据识别出的排序词对文档进行查询,并根据排序词显示查询结果。可选地,排序词包括:大于、小于、等于、升序、降序、小于等于、大于等于等。
在一些实施例中,用户输入的查询信息为“明察版本小于v1.6的安装手册”;对查询信息进行实体识别得到实体识别结果为“明察”及其属性“产品”、“安装手册”及其属性“文档类型”、“版本”及其属性“v1.6”。根据排序词对文档进行查询,确定“明察版本小于v1.6的安装手册”对应的查询意图为查询特定文档;则服务器反馈的查询结果为:得到的第一个查询结果为“明察版本为v1.5的安装手册”,第二个查询结果为“明察版本为v1.4的安装手册”,第三个查询结果为“明察版本为v1.3的安装手册”等。
可选地,根据查询意图获取查询信息所对应的查询结果后,还包括:对查询结果进行排序并显示。
可选地,对查询结果进行排序并显示,包括:获取查询结果与实体识别结果之间的相关性,根据相关性对查询结果进行排序并显示。
可选地,对查询结果进行排序并显示,包括:获取查询结果的重要性,根据重要性对查询结果进行排序并显示。
可选地,排序模型包括:相关性排序模型和重要性排序模型。
可选地,相关性排序模型包括:布尔模型、VS(Vectos Space,向量空间)模型、LSI(Latent Semantic Indexing,潜在语义索引)模型、BM25模型和LMIR(Language Model forInformation Retrieval,信息检索语言)模型等。
在一些实施例中,通过向量空间模型对查询结果进行排序;在欧式空间中将查询信息的实体识别结果用向量值表示,将查询结果用向量值表示;将实体识别结果的向量值和查询结果的向量值带入TF-IDF(term frequency-inverse document frequency,词频-逆文本频率指数)算法中进行计算,得到各查询结果与实体识别结果之间的相关性数值;按照相关性数值从高到低对各查询结果进行排序,并在用户端进行显示。
可选地,重要性排序模型包括:PR(PageRank,佩奇排序)模型和TR(TrustRank,信任指数)模型等。
在一些实施例中,通过PageRank模型对查询结果进行排序;查询结果的PR值越高,该查询结果越重要。每个查询结果中包括出链和入链。出链为该查询结果链接向其他查询结果的链接;入链为其他查询结果链接向该查询结果的连接。在获取到查询结果后,通过PR模型获取各个查询结果中入链的权值,然后对各个入链的权值进行求和得到该查询结果的PR值,并按照PR值从高到低对各查询结果进行排序,并在用户端进行显示。
结合图2所示,本公开实施例提供另一种用于信息查询的方法,包括:
步骤S201,获取用户输入的查询信息;
步骤S202,对查询信息进行实体识别,并获得实体识别结果;
步骤S203,判断该实体识别结果是否满足第一预设条件;若是,即执行步骤S204;若否,即执行步骤S205;
步骤S204,通过ES数据库对该实体识别结果对应的查询信息进行查询;
步骤S205,判断该实体识别结果是否满足第二预设条件至第六预设条件中的一种;若是,则执行步骤S206;若否,则执行步骤S207;
步骤S206,通过知识图谱数据库对该实体识别结果对应的查询信息进行查询;
步骤S207,确定该实体识别结果满足第七预设条件,并通过ES数据库对该实体识别结果对应的查询信息进行查询。
通过对用户输入的查询信息进行实体识别得到实体识别结果,对实体识别结果进行判断,获得用户的查询意图,并将用户的查询意图细分为七种类型,将不同类型的查询信息通过不同的数据库进行查询,使得服务器能够更好的理解用户的查询意图,并返回符合用户查询意图的查询结果,提高了用户进行信息查询时体验。
结合图3所示,本公开实施例提供一种用于信息查询的装置,包括处理器(processor)100和存储有程序指令的存储器(memory)101。可选地,该装置还可以包括通信接口(Communication Interface)102和总线103。其中,处理器100、通信接口102、存储器101可以通过总线103完成相互间的通信。通信接口102可以用于信息传输。处理器100可以调用存储器101中的程序指令,以执行上述实施例的用于信息查询的方法。
此外,上述的存储器101中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器101作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器100通过运行存储在存储器101中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于信息查询的方法。
存储器101可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器。
采用本公开实施例提供的用于信息查询的装置,通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,然后根据查询意图获取查询信息所对应的查询结果;这样能够根据用户的查询意图返回与查询信息对应的查询结果,提高了用户进行信息查询时体验。
本公开实施例提供了一种设备,包含上述的用于信息查询的装置。该设备通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,然后根据查询意图获取查询信息所对应的查询结果;这样能够根据用户的查询意图返回与查询信息对应的查询结果,提高了用户进行信息查询时体验。
可选地,设备包括手机、平板、电脑等。
可选地,设备包括服务器。服务器通过获取用户输入的查询信息,并对查询信息进行实体识别获得实体识别结果,通过实体识别结果获取用户的查询意图,服务器根据查询意图获取查询信息所对应的查询结果;然后服务器返回与查询信息对应的查询结果并发送给用户终端进行显示。
本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令设置为执行上述用于信息查询的方法。
本公开实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述用于信息查询的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (10)
1.一种用于信息查询的方法,其特征在于,包括:
获取用户输入的查询信息;
对所述查询信息进行实体识别,获得实体识别结果;
根据所述实体识别结果确定所述用户的查询意图;
根据所述查询意图获取所述查询信息所对应的查询结果。
2.根据权利要求1所述的方法,其特征在于,对所述查询信息进行实体识别获得实体识别结果,包括:
对所述查询信息进行归一化;
对归一化后的查询信息进行实体识别,获得实体识别结果。
3.根据权利要求2所述的方法,其特征在于,所述对归一化后的查询信息进行实体识别获得实体识别结果,包括:
对归一化后的查询信息进行分词,获得分词结果;
对所述分词结果进行实体识别,获得实体识别结果。
4.根据权利要求1所述的方法,其特征在于,根据所述实体识别结果确定所述用户的查询意图,包括:
确定出所述实体识别结果所满足的预设条件,将所述预设条件所对应的查询意图确定为所述用户的查询意图。
5.根据权利要求1所述的方法,其特征在于,根据所述查询意图获取所述查询信息所对应的查询结果,包括:
根据所述查询意图确定查询类型;
根据所述查询类型获取所述查询信息所对应的查询结果。
6.根据权利要求1至5任一项所述的方法,其特征在于,根据所述查询意图获取所述查询信息所对应的查询结果后,还包括:
对所述查询结果进行排序并显示。
7.根据权利要求6所述的方法,其特征在于,对所述查询结果进行排序并显示,包括:
获取所述查询结果与所述实体识别结果之间的相关性,根据所述相关性对所述查询结果进行排序并显示。
8.根据权利要求6所述的方法,其特征在于,对所述查询结果进行排序并显示,包括:
获取所述查询结果的重要性,根据所述重要性对所述查询结果进行排序并显示。
9.一种用于信息查询的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至8任一项所述的用于信息查询的方法。
10.一种设备,其特征在于,包括如权利要求9所述的用于信息查询的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466126.XA CN112463932A (zh) | 2020-12-14 | 2020-12-14 | 用于信息查询的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466126.XA CN112463932A (zh) | 2020-12-14 | 2020-12-14 | 用于信息查询的方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112463932A true CN112463932A (zh) | 2021-03-09 |
Family
ID=74803965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011466126.XA Pending CN112463932A (zh) | 2020-12-14 | 2020-12-14 | 用于信息查询的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463932A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109739964A (zh) * | 2018-12-27 | 2019-05-10 | 北京拓尔思信息技术股份有限公司 | 知识数据提供方法、装置、电子设备和存储介质 |
US20190205384A1 (en) * | 2017-12-28 | 2019-07-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Search method and device based on artificial intelligence |
CN110765342A (zh) * | 2019-09-12 | 2020-02-07 | 竹间智能科技(上海)有限公司 | 信息查询方法及装置、存储介质、智能终端 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN112015918A (zh) * | 2020-09-14 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 数据处理方法及装置 |
-
2020
- 2020-12-14 CN CN202011466126.XA patent/CN112463932A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190205384A1 (en) * | 2017-12-28 | 2019-07-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Search method and device based on artificial intelligence |
CN109739964A (zh) * | 2018-12-27 | 2019-05-10 | 北京拓尔思信息技术股份有限公司 | 知识数据提供方法、装置、电子设备和存储介质 |
CN110765342A (zh) * | 2019-09-12 | 2020-02-07 | 竹间智能科技(上海)有限公司 | 信息查询方法及装置、存储介质、智能终端 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN112015918A (zh) * | 2020-09-14 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
KR101999152B1 (ko) | 컨벌루션 신경망 기반 영문 텍스트 정형화 방법 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN110929038B (zh) | 基于知识图谱的实体链接方法、装置、设备和存储介质 | |
CN102298588B (zh) | 从非结构化文档中抽取对象的方法和装置 | |
KR102491172B1 (ko) | 자연어 질의응답 시스템 및 그 학습 방법 | |
US20080147578A1 (en) | System for prioritizing search results retrieved in response to a computerized search query | |
CN110674274A (zh) | 一种针对食品安全法规问答系统的知识图谱构建方法 | |
CN110765761A (zh) | 基于人工智能的合同敏感词校验方法、装置及存储介质 | |
CN111460090A (zh) | 基于向量的文档检索方法、装置、计算机设备及存储介质 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN111694946A (zh) | 文本关键词可视化显示方法、装置及计算机设备 | |
CN108875065B (zh) | 一种基于内容的印尼新闻网页推荐方法 | |
CN112100396A (zh) | 一种数据处理方法和装置 | |
CN111553151A (zh) | 一种基于字段相似度计算的问题推荐方法、装置和服务器 | |
CN111144068A (zh) | 一种相似仲裁案件推荐方法及装置 | |
CN110569419A (zh) | 问答系统优化方法、装置、计算机设备及存储介质 | |
CN107992563B (zh) | 一种用户浏览内容的推荐方法及系统 | |
JP6772478B2 (ja) | 情報検索プログラム及び情報検索装置 | |
CN110765765A (zh) | 基于人工智能的合同关键条款提取方法、装置及存储介质 | |
US20210049180A1 (en) | Presentation device, presentation method and presentation program | |
CN113836272A (zh) | 关键信息的展示方法、系统、计算机设备及可读存储介质 | |
Zen et al. | TF-IDF Method and Vector Space Model Regarding the Covid-19 Vaccine on Online News | |
CN104142947A (zh) | 文件分类系统及方法 | |
CN112463932A (zh) | 用于信息查询的方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |