CN117112595A - 一种信息查询方法、装置、电子设备及存储介质 - Google Patents
一种信息查询方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117112595A CN117112595A CN202310876657.3A CN202310876657A CN117112595A CN 117112595 A CN117112595 A CN 117112595A CN 202310876657 A CN202310876657 A CN 202310876657A CN 117112595 A CN117112595 A CN 117112595A
- Authority
- CN
- China
- Prior art keywords
- query
- information
- statement
- internal
- query statement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000013598 vector Substances 0.000 claims description 146
- 238000012545 processing Methods 0.000 claims description 34
- 238000013507 mapping Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 239000000047 product Substances 0.000 description 19
- 238000004891 communication Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- MJIHNNLFOKEZEW-UHFFFAOYSA-N lansoprazole Chemical compound CC1=C(OCC(F)(F)F)C=CN=C1CS(=O)C1=NC2=CC=CC=C2N1 MJIHNNLFOKEZEW-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息查询方法、装置、电子设备及存储介质,其中,方法包括:获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。本发明实施例的技术方案能够提高信息查询的准确率和完整度,从而提高信息查询的用户体验。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种信息查询方法、装置、电子设备及存储介质。
背景技术
在人们的日常工作中,难免会遇到需要咨询问题和查询问题的情况,随着AI(Artificial Intelligence,人工智能)的能力提高,自动化客户服务的普及度也在继续扩大。自动化客户服务技术主要依赖于AI聊天以提供快速且准确的客户服务。目前对聊天机器人作为客户服务主要通信方式的总体偏好较高,该技术已经得到了广泛的应用并在不断发展和改进中。
然而,虽然AI问答系统能够处理许多常见的和预设的问题,但它们通常对复杂或特定的问题的理解和处理能力有限。如果提出的问题超出了AI问答系统对应训练数据集的范围,则AI问答系统可能无法给出满意的答案。
发明内容
本发明实施例提供一种信息查询方法、装置、电子设备及存储介质,能够提高信息查询的准确率和完整度,从而提高信息查询的用户体验。
根据本发明的一方面,提供了一种信息查询方法,包括:
获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;
在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;
根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
根据本发明的另一方面,提供了一种信息查询装置,包括:
公开信息数据库查询模块,用于获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;
内部信息数据库查询模块,用于在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;
信息查询结果生成模块,用于根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的信息查询方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的信息查询方法。
本发明实施例通过对当前信息查询语句查询公开信息数据库,并在确定根据当前信息查询语句查询公开信息数据库的结果为空的情况下,根据当前信息查询语句查询内部信息数据库,以根据内部信息数据库的查询结果生成当前信息查询语句的信息查询结果,解决现有智能问答系统信息查询的准确率和完整度较低等问题,提高了信息查询的准确率和完整度,进而提高信息查询的用户体验。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种信息查询方法的流程图;
图2是本发明实施例二提供的一种信息查询方法的流程图;
图3是本发明实施例三提供的一种信息查询装置的示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例一提供的一种信息查询方法的流程图,本实施例可适用于结合公开信息数据库和内部信息数据库进行信息查询的情况,该方法可以由信息查询装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中,该电子设备可以是终端设备,也可以是服务器设备,只要能够具备智能问答系统的功能即可,本发明实施例并不对电子设备的具体设备类型进行限定。相应的,如图1所示,该方法包括如下操作:
S110、获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库。
其中,当前信息查询语句也即当前对智能问答系统发起的,用于查询某种信息的查询语句。当前信息查询语句可以是语音类型的查询语句,也还可以是文本类型的查询语句,本发明实施例对此并不进行限制。可以理解的是,如果当前信息查询语句为语音类型的查询语句,智能问答系统可以首先将当前信息查询语句转换为文本类型的查询语句,以便于智能问答系统后续的查询处理。公开信息数据库可以预先根据公开信息所构建的数据库。
在本发明实施例中,当用户对智能问答系统发起当前信息查询语句时,智能稳定系统可以首先根据当前信息查询语句查询公开信息数据库,以从公开信息数据库中检索与当前信息查询语句匹配的查询结果。
S120、在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库。
其中,内部信息数据库可以根据非公开的内部知识库所构建的数据库。可以理解的是,虽然非公开的内部知识库存储有对外部用户敏感的数据,但同时也存储有对外部用户非敏感的数据。也即,内部知识库中存储的数据部分可以对外公开。同时,内部知识库对于具有内部知识库访问权限的内部用户来说,都是可以公开的数据。
可选的,可以根据内部知识库存储数据的敏感度配置生成不同访问等级的内部信息数据库。示例性的,对于外部用户来说,可以从内部知识库中筛选出可对外公开的非敏感数据,并进一步整理生成可以用于对外部用户发起的信息查询语句进行信息查询的内部信息数据库。对于内部用户来说,可以直接将内部知识库的全部数据进一步整理生成可以用于对内部用户发起的信息查询语句进行信息查询的内部信息数据库。
可以理解的是,由于内部知识库通常包含大量有价值的信息和数据,但由于保密和安全性考虑,内部知识库存储的数据可能不被允许用于训练,导致降低智能问答系统提供全面支持的能力。而智能问答系统基于公开信息数据库进行信息查询会存在有限的理解和响应能力的情况,当用户的问题超出了训练数据集的范围,可能无法给出满意的答案,导致信息查询的准确率和完整度降低。
为解决上述问题,在本发明实施例中,当用户发起当前信息查询语句,且根据当前信息查询语句查询公开信息数据库无法查询到结果时,可以进一步根据当前信息查询语句查询内部信息数据库,以获取信息查询结果。示例性的,当发起当前信息查询语句为外部用户时,可以根据当前信息查询语句查询对外部用户公开的内部信息数据库。当发起当前信息查询语句为内部用户时,可以根据当前信息查询语句查询对内部用户公开的内部信息数据库。由此,不仅外部用户可以通过智能问答系统获取智能问答服务,内部用户也可以通过智能问答系统获取智能问答服务,以通过智能问答系统提供的智能问答服务快速获取非公开的内部信息,便于内部用户高效展开内部工作流程。
由此可见,通过结合内部信息数据库进行信息查询,可以突破公开信息数据库数据集的限制以及内部信息数据库的访问限制,有效提高智能问答系统的理解和响应能力,提升智能问题系统提供全面支持的能力,进而提高智能问题系统信息查询的准确率和完整度,从而提高智能问题系统的用户体验。
S130、根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
可选的,可以直接将内部信息数据库的查询结果作为当前信息查询语句的信息查询结果。或者,为了提高信息查询的智能性,还可以对内部信息数据库的查询结果进一步整合,如将碎片化的内部信息数据库的查询结果整合成符合人类语言习惯的信息查询结果等。
相应的,智能问答系统在获取到当前信息查询语句的信息查询结果之后,可以直接输出当前信息查询语句的信息查询结果。例如,可以采用文本、语音、视频或图文结合的方式等输出当前信息查询语句的信息查询结果。本发明实施例并不对信息查询结果的输出方式进行限定。
本发明实施例通过对当前信息查询语句查询公开信息数据库,并在确定根据当前信息查询语句查询公开信息数据库的结果为空的情况下,根据当前信息查询语句查询内部信息数据库,以根据内部信息数据库的查询结果生成当前信息查询语句的信息查询结果,解决现有智能问答系统信息查询的准确率和完整度较低等问题,提高了信息查询的准确率和完整度,进而提高信息查询的用户体验。
实施例二
图2是本发明实施例二提供的一种信息查询方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,给出了根据当前信息查询语句查询公开信息数据库和内部信息数据库,以及生成当前信息查询语句的信息查询结果的多种具体可选的实施例。相应的,如图2所示,本实施例的方法可以包括:
S210、从内部知识库中筛选非敏感内部数据,并对所述非敏感内部数据进行信息提取处理、标签化处理和分类处理,得到所述第一内部信息数据库。
S220、将所述内部知识库的全部内部数据进行信息提取处理、标签化处理和分类处理,得到所述第二内部信息数据库。
其中,所述第一内部信息数据库和所述第二内部信息数据库包括文档、文档元数据和文档标签。
其中,非敏感内部数据也即内部知识库中可以对外公开的数据。第一内部信息数据库可以是能够对外部用户公开的内部信息数据库。第二内部信息数据库可以是能够对内部用户公开的内部信息数据库。可以理解的是,第二内部信息数据库除了可以包括非敏感内部数据外,还包括敏感内部数据。以文档检索场景为例说明,第二内部信息数据库的敏感内部数据例如可以包括但不限于产品文档的内部配置信息等。非敏感内部数据例如可以包括但不限于系统功能的名称以及设定的数值范围。也即,对外公开非敏感内部数据不会造成内部敏感数据的泄露。
具体的,可以从内部知识库中筛选非敏感内部数据,并对筛选的非敏感内部数据进行信息提取处理、标签化处理和分类处理,从而得到第一内部信息数据库。同时,可以将内部知识库的全部内部数据进行信息提取处理、标签化处理和分类处理,从而得到第二内部信息数据库。
在一个具体的例子中,以文档查询应用场景为例说明,针对第一内部信息数据库,可以从内部知识库中存储的内部技术文档如研发设计文档和产品设计文档等筛选可以对外开放的文档信息,作为非敏感内部数据统一整理和索引。针对第二内部信息数据库,可以将内部知识库中存储的内部技术文档直接统一整理和索引。
在对内部知识库中的数据(适用于第一内部信息数据库和第二内部信息数据库)进行统一整理和索引时,可以首先提取产品关键信息,例如非敏感内部数据可以提取系统功能的名称、设定的数值范围等,敏感数据则可以提取产品配置信息等,对首次提取的产品关键信息进行标签化和分类,并对其设定所属项目和对应产品线等相关属性。同时,可以进一步提取文档的作者、创建日期和最后修改日期信息作为内部信息数据库的文档元数据。进一步的,可以利用自然语言处理技术再次进行关键信息提取,如提取主题、主要观点和技术细节等内容作为细化的关键信息。另外,还可以为内部知识库提取的文档分配对应的文档标签,文档标签可以基于文档元数据和提取的细化的关键信息确定。例如,可以为每个文档分配一个或多个主题标签,或者根据其内容给文档打上“研发设计”或“产品研究”等标签。最后,可以根据通过上述操作得到的信息创建Jira(一种项目与事务跟踪工具)数据库作为内部信息数据库,其中包含所有文档、文档元数据和文档标签。
上述技术方案,通过划分第一内部信息数据库和第二内部信息数据库,不仅充分利用了内部信息库可以对外公开的数据提供智能问答服务,又能保证内部信息库中敏感数据的安全性和可靠性,而且还能够对内部用户利用内部信息库中的敏感数据提供智能问答服务,如供用户快速查询产品的细化配置信息,以根据查询的细化配置信息实现对产品的快速优化等,极大地提升了智能问答系统的理解和响应能力,从而提高智能问答系统信息查询的准确率。
S230、获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库。
在本发明的一个可选实施例中,所述根据所述当前信息查询语句查询公开信息数据库,可以包括:获取所述公开信息数据库的向量集;其中,所述向量集中包括所述公开信息数据库中存储信息对应的向量,且各向量通过索引进行标识;获取所述当前信息查询语句的语句向量和特征信息;根据所述特征信息与各所述索引的匹配结果,从所述向量集中进行初步筛选获取候选向量集;计算所述语句向量与所述候选向量集中的各候选向量的相似度值,将相似度值超过阈值的候选向量作为目标向量;根据所述目标向量获取与所述当前信息查询语句匹配的公开信息查询结果。
在本发明的一个可选实施例中,当前信息查询语句可以包括当前文档信息查询语句。相应的,公开信息数据库可以为存储有产品文档相关数据的数据库。示例性的,公开信息数据库可以采用下述方式生成:从企业知识库中提取售后阶段的FAQ((FrequentlyAsked Questions,问答系统),并将其作为公开信息数据库直接训练成语料向量。训练语料向量的过程中,可以通过使用自然语言处理技术,如文本抽取及语料向量化等方法来实现。可选的,可以将公开信息数据库中需要查询的所有文档读取到内存中,通过NLTK(NaturalLanguage Toolkit,一种自然语言处理工具)进行语义识别进而切分成小的文本段,并将其转换为符合LLM(Large Language Model,大型语言模型)的结构。
相应的,可以将转换后的文本段发送给大语言模型的应用接口,如chartGPT-3(第三代通用语言预测模型)应用接口,大语言模型的应用接口会对各转换后的文本段进行向量化处理,获取各文本段对应的文本向量,并将文本向量存储到本地文件中,以供公开信息数据库进行读取,通过将文本形式转换为向量形式,从而便于后续的文本处理。除此之外,本发明实施方式还可以提取各文本向量的特征信息,并根据特征信息为文本向量创建索引,并将索引添加到对应的文本向量中。通过创建索引,可以加快搜索时的查询速度。例如,获取到20个文本段所对应的文本向量之后,将添加索引的各文本向量构建向量集,因此在向量集中包括查询文档中各文本段所对应的文本向量,并且各文本向量采用索引进行标识。需要说明的是,上述技术方案通过将待查询的文档转换成向量的形式,并在本地文件中以向量集的形式保存至公开信息数据库,而在后续主要是基于相似度匹配的方式,从所获取的向量集中进行文档的查询,可以加快文档的查询效率。
可选的,当前信息查询语句的语句向量和特征信息时,可以首先将当前信息查询语句进行关键字切分获取切分后的查询问题,并将切分后的查询问题发送给大语言模型的应用接口如chartGPT-3应用接口,以大语言模型的应用接口对切分后的查询问题进行处理,获取与切分后的查询问题对应的问题向量,进一步对问题向量进行关键信息提取获取问题向量的特征信息。
在一个具体的示例中,在进行信息查询时,可以通过人机交互界面接收用户所输入的当前信息查询语句,例如“请告诉我获取通信列表的接口是什么?”,并将当前信息查询语句进行关键字切分获取切分后的查询问题,例如,通过切分所获取的切分后的文档查询问题为“获取用户列表api”,并将切分后的查询问题发送给chartGPT-3应用接口,此时chartGPT-3应用接口会对切分后的查询问题进行向量化处理,以获取切分后的查询问题对应的问题向量。并且此处无需对切分后的文档查询问题进行LLM的结构转换就可以直接输入到chartGPT-3应用接口,并获取到问题向量。需要说明的是,在获取到问题向量之后,还会对问题向量进行关键信息的提取,并将所提取的关键信息作为问题向量的特征信息,其中,针对问题向量的特征信息提取方式,与针对文本向量的特征提取方式大致相同,不再进行赘述。
相应的,在获取当前信息查询语句的语句向量和特征信息之后,可以根据特征信息与各索引的匹配结果,从向量集中进行初步筛选获取候选向量集。具体的,可以将问题向量的特征信息与各索引进行匹配获取目标索引,其中,目标索引的特征信息与问题向量的特征信息相同,并将目标索引标识的文本向量作为候选向量,并根据候选向量构建候选向量集。进一步的,计算问题向量与候选向量集中的各候选向量的相似度值,将相似度值超过阈值的候选向量作为目标向量。可选的,计算问题向量与候选向量集中的各候选向量的相似度值时,可以获取问题向量的第一绝对值以及各候选向量的第二绝对值,并计算问题向量与各候选向量的第一乘积结果,以及第一绝对值和第二绝对值的第二乘积结果,最终将第一乘积结果与第二乘积结果的比值作为相似度值。相应的,在确定目标向量之后,即可根据目标向量获取与当前信息查询语句匹配的公开信息查询结果。根据目标向量获取与文档查询问题匹配的文档查询结果时,可以获取各目标向量所对应的目标文本段,并将各目标文本段按照指定规则进行融合,根据融合结果获取与文档查询问题匹配的文档查询结果。
在一个具体的例子中,以文档查询应用场景为例说明,在对查询问题和文档进行向量相似度求解之前,会首先通过索引对向量集进行初步筛选,例如,在向量集中包含20个文本段所对应的文本向量,并且各文本向量分别用索引进行标识,由于索引是基于文本向量的特征信息所创建的,因此在索引中包含了各文本向量的特征信息。例如,问题向量的特征信息为a,则获取出包含特征信息a的目标索引,当确定获取到5个目标索引时,则将5个目标索引标识的文本向量:向量A1、向量A2、向量A3、向量A4和向量A5作为候选向量,并根据候选向量构建候选向量集X={向量A1向量A2向量A3向量A4向量A5}。在获取到候选向量集之后,可以计算各候选向量与问题向量的相似度,通过Faiss矢量相似性搜索引擎对于问题在文档矢量集中进行相似性搜索,得到搜索结果。
可选的,可以使用余弦相似度来计算问题向量和候选向量集中各候选向量之间的相似度,余弦相似度是衡量一个内积空间的两个非零向量之间的相似度的度量,它测量它们之间夹角的余弦值。例如,当确定问题向量为B时,在计算向量A与向量B之间的相似度时,可以采用如下公式进行计算:
余弦相似度=(A*B)/(||A||*||B||)
其中,A为候选向量,B为问题向量,||A||和||B||是向量的大小。并将A*B作为第一乘积结果,||A||*||B||作为第二乘积结果。因此可以通过上述公式计算出各后候选向量与问题向量之间的余弦相似度。当然,本实施方式中仅是以余弦相似度计算相似度为例进行说明,并不对向量之间计算相似度所采用的具体计算方式进行限定。
需要说明的是,本发明实施方式中可以预先设定阈值,并将相似度值超过阈值的候选向量作为目标向量。例如,设定阈值为3,但经过计算确定只有候选向量A1、A2和A3与问题向量之间的相似度值超过了3,则将候选向量A1、A2和A3作为目标向量。相应的,在根据搜索结果获取到目标向量之后,可以调用OpenAI的combine功能进行融合,将碎片化的候选结果整合成符合人类语言习惯的输出。在具体实现中可以是获取目标向量A1、A2和A3分别对应的目标文本段1、目标文本段2和目标文本段3,并将各目标文本段按照指定规则进行融合,例如,按照顺序依次进行拼接获取融合结果,例如“通信列表的接口是接口1、接口2和接口3”,并将融合结果作为文档查询问题“请告诉我获取通信列表的接口是什么?”匹配的文档查询结果。
上述技术方案,通过将待查询信息和信息查询语句转化为向量的形式,并采用稳定向量的索引进行初步筛选后,根据信息查询语句和候选向量的相似度值对比得出目标向量,并将目标向量以可读的形式输出,提高了信息查询的效率,节省了搜索的人工成本,同时用户体验也得到了极大的提升。
S240、判断公开信息数据库的查询结果是否为空,若是,执行S260,否则,执行S250。
S250、根据公开信息数据库的查询结果生成当前信息查询语句的信息查询结果。
在本发明实施例中,如果根据当前信息查询语句查询公开信息数据库能够得到有效的查询结果,则可以直接根据公开信息数据库的查询结果生成当前信息查询语句的信息查询结果。可选的,可以直接将公开信息数据库的查询结果作为当前信息查询语句的信息查询结果。或者,为了提高信息查询的智能性,还可以对公开信息数据库的查询结果进一步整合,如将碎片化的公开信息数据库的查询结果整合成符合人类语言习惯的信息查询结果等。
S260、确定所述当前信息查询语句匹配的查询权限。
可以理解的是,不同类型用户发起的信息查询语句匹配的查询权限不同。示例性的,如果当前信息查询语句为外部用户发起的查询语句,则当前信息查询语句匹配的查询权限为第一级别查询权限。如果当前信息查询语句为内部用户发起的查询语句,则当前信息查询语句匹配的查询权限为第二级别查询权限。
S270、判断当前信息查询语句匹配的查询权限是否为第一级别查询权限,若是,执行S280,否则,执行S290。
其中,第一级别查询权限可以是查询第一内部信息数据库的权限。第二级别查询权限可以是查询第二内部信息数据库的权限。
S280、查询第一内部信息数据库。
S290、确定所述当前信息查询语句匹配的查询权限为第二级别查询权限,查询第二内部信息数据库。
相应的,如果确定当前信息查询语句匹配的查询权限为第一级别查询权限,表明发起当前信息查询语句的用户为外部用户,为避免内部敏感数据的泄露,仅对外部用户开放第一内部信息数据库,因此可以查询第一内部信息数据库获取查询结果。如果确定当前信息查询语句匹配的查询权限为第二级别查询权限,表明发起当前信息查询语句的用户为内部用户,可以对内部用户开放第二内部信息数据库,因此可以查询第二内部信息数据库获取查询结果。
在本发明的一个可选实施例中,所述根据所述当前信息查询语句查询内部信息数据库,可以包括:通过大语言模型对所述当前信息查询语句进行解析,得到查询语句解析结果;根据所述查询语句解析结果确定内部数据库目标查询语句的关联语句元素;根据所述关联语句元素和预设结构逻辑生成所述内部数据库目标查询语句的结构;根据所述内部数据库目标查询语句查询所述内部信息数据库。
其中,大语言模型也可称为大模型,是指的功能强大的,预先训练完成的模型。示例性的,大语言模型例如可以包括但不限于GPT(Generative Pre-Trained Transformer,生成式预训练Transformer模型)或LLaMA(Large Language Model Meta AI,一种开源的基础大语言模型)等,本发明实施例并不对大语言模型的模型类型进行限定。查询语句解析结果也即通过大语言模型对当前信息查询语句进行解析得到的结果。目标查询语句可以是智能问答系统根据当前信息查询语句生成的,用于查询内部数据库的语句类型。关联语句元素可以是构成目标查询语句的元素。预设结构逻辑可以是预先规定的,用于生成内部数据库目标查询语句的规则逻辑。
具体的,当需要根据当前信息查询语句查询内部信息数据库时,可以首先通过大语言模型完成对当前信息查询语句的预处理,如纠正语法错误,提取关键点,通过交互方式引导用户补充问题足够多的信息等,并对当前信息查询语句进行解析,得到查询语句解析结果。进一步的,可以根据查询语句解析结果构建用于查询内部数据库的内部数据库目标查询语句,具体可以根据查询语句解析结果确定内部数据库目标查询语句的关联语句元素,以根据关联语句元素和预设结构逻辑构建内部数据库目标查询语句的结构,生成内部数据库目标查询语句,最终通过内部数据库目标查询语句查询内部信息数据库。
在本发明的一个可选实施例中,所述根据所述查询语句解析结果确定内部数据库目标查询语句的关联语句元素,可以包括:确定所述内部数据库目标查询语句的元素映射方式;通过所述元素映射方式将所述查询语句解析结果映射至所述内部数据库目标查询语句的关联语句元素;其中,所述查询语句解析结果包括主题、对象和动作中的至少一项;所述关联语句元素包括字段、操作符和目标值中的至少一项。
其中,元素映射方式例如可以包括但不限于映射表的方式或使用某种学习模型的方式,本发明实施例并不对元素映射方式的具体映射类型进行限定。目标值可以是内部数据库目标查询语句的某个取值等。
具体的,在根据查询语句解析结果确定内部数据库目标查询语句的关联语句元素时,可以确定内部数据库目标查询语句的元素映射方式,如采用映射表或采用机器学习模型等,将查询语句解析结果映射至内部数据库目标查询语句的关联语句元素。示例性的,查询语句解析结果中的主题可以映射到内部数据库目标查询语句的一个字段,查询语句解析结果中的动作可以映射到内部数据库目标查询语句的一个操作符,查询语句解析结果中的对象可以映射到内部数据库目标查询语句的一个值。
在本发明的一个可选实施例中,所述根据所述关联语句元素和预设结构逻辑生成所述内部数据库目标查询语句的结构,可以包括:根据所述关联语句元素的元素类型和所述预设结构逻辑确定所述关联语句元素匹配的逻辑操作符;通过所述关联语句元素匹配的逻辑操作符对各所述关联语句元素进行排列组合,得到所述内部数据库目标查询语句的结构。
其中,逻辑操作符也即逻辑运算的操作符,例如可以包括但不限于“AND”和“OR”等类型的操作符。
在本发明实施例中,可以根据关联语句元素的元素类型和预设结构逻辑确定关联语句元素匹配的逻辑操作符,以利用关联语句元素匹配的逻辑操作符对各关联语句元素进行排列组合,最终得到内部数据库目标查询语句的结构。
在一个具体的例子中,假设当用户的问题无法从公开信息数据库中查询得到满意的答案时,可以通过预设的GPT3 promp(GPT3提示词)将问题解析,解析出主题的主题、对象、动作等信息作为查询语句解析结果。进一步的,将查询语句解析结果映射到JQL查询的元素。例如,问题的主题可能映射到JQL查询中的一个字段,问题的动作可能映射到JQL查询中的一个操作符,问题的对象可能映射到JQL查询中的一个值,可选的,可以通过构建映射表或使用一种机器学习模型来自动完成上述映射过程,最终可以查询针对内部数据库的JQL查询语句作为内部数据库目标查询语句。在生成内部数据库目标查询语句的过程中,可以通过一些预先设定的逻辑来确定内部数据库目标查询语句的具体结构。示例性的,在确定内部数据库目标查询语句是使用“AND”操作符还是“OR”操作符时,可以判断用户的问题中的关键词信息。如果用户的问题包含“和”或“同时”,则可以使用“AND”操作符。如果用户的问题包含“或者”或“任意一种”,则可以使用“OR”操作符。除此之外,还可以根据问题中的特定词汇决定查询结果的排序方式。例如,如果问题中包含“最新的”,则可以按日期降序排序的方式对查询结果进行排序。
S2110、根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
在本发明的一个可选实施例中,在所述根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果之后,还可以包括:通过大语言模型对所述当前信息查询语句的信息查询结果进行自然语言转换整合,得到整合查询结果;将所述整合查询结果按照预设输出格式模板进行输出。
其中,整合查询结果也即对当前信息查询语句的信息查询结果进行自然语言转换整合所得到的结果。预设输出格式模板可以是预先按照需求配置的查询结果输出的模板,可以对查询结果的输出实现个性化配置。
示例性的,通过JQL语句查询内部信息数据库得到相关的查询结果后,再经GPT3模型进行自然语言转换整合,并对查询结果进行二次处理,调用OpenAI的combine功能进行融合,按照预设输出格式模板整合成符合人类语言习惯的输出。
上述技术方案,结合了公开信息数据库和内部信息数据库作为信息查询参考的数据库,其中,信息数据库可以FAQ组成,其可以直接用于训练语料库。而内部信息数据库包含了更深入及更专业的信息,且根据用户访问权限的不同可以划分不同访问权限等级的内部信息数据库,不仅能够保证敏感数据的安全性和保密性,还能最大限度提高智能问答系统信息查询的准确率和完整度。另外,通过根据用户输入的信息查询语句构建用于查询内部信息数据库的目标查询语句,可以通过构建的目标查询语句快速查询内部信息数据库,提高了内部信息数据库的查询响应效率。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例三
图3是本发明实施例三提供的一种信息查询装置的示意图,如图3所示,所述装置包括:公开信息数据库查询模块310、内部信息数据库查询模块320以及信息查询结果生成模块330,其中:
公开信息数据库查询模块310,用于获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;
内部信息数据库查询模块320,用于在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;
信息查询结果生成模块330,用于根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
本发明实施例通过对当前信息查询语句查询公开信息数据库,并在确定根据当前信息查询语句查询公开信息数据库的结果为空的情况下,根据当前信息查询语句查询内部信息数据库,以根据内部信息数据库的查询结果生成当前信息查询语句的信息查询结果,解决现有智能问答系统信息查询的准确率和完整度较低等问题,提高了信息查询的准确率和完整度,进而提高信息查询的用户体验。
可选的,公开信息数据库查询模块310具体用于:获取所述公开信息数据库的向量集;其中,所述向量集中包括所述公开信息数据库中存储信息对应的向量,且各向量通过索引进行标识;获取所述当前信息查询语句的语句向量和特征信息;根据所述特征信息与各所述索引的匹配结果,从所述向量集中进行初步筛选获取候选向量集;计算所述语句向量与所述候选向量集中的各候选向量的相似度值,将相似度值超过阈值的候选向量作为目标向量;根据所述目标向量获取与所述当前信息查询语句匹配的公开信息查询结果。
可选的,内部信息数据库查询模块320,具体用于:确定所述当前信息查询语句匹配的查询权限;在确定所述当前信息查询语句匹配的查询权限为第一级别查询权限的情况下,查询第一内部信息数据库;在确定所述当前信息查询语句匹配的查询权限为第二级别查询权限的情况下,查询第二内部信息数据库。
可选的,信息查询装置还包括内部信息数据库生成模块,用于:从内部知识库中筛选非敏感内部数据,并对所述非敏感内部数据进行信息提取处理、标签化处理和分类处理,得到所述第一内部信息数据库;将所述内部知识库的全部内部数据进行信息提取处理、标签化处理和分类处理,得到所述第二内部信息数据库;其中,所述第一内部信息数据库和所述第二内部信息数据库包括文档、文档元数据和文档标签。
可选的,内部信息数据库查询模块320,具体用于:通过大语言模型对所述当前信息查询语句进行解析,得到查询语句解析结果;根据所述查询语句解析结果确定内部数据库目标查询语句的关联语句元素;根据所述关联语句元素和预设结构逻辑生成所述内部数据库目标查询语句的结构;根据所述内部数据库目标查询语句查询所述内部信息数据库。
可选的,内部信息数据库查询模块320,具体用于:确定所述内部数据库目标查询语句的元素映射方式;通过所述元素映射方式将所述查询语句解析结果映射至所述内部数据库目标查询语句的关联语句元素;其中,所述查询语句解析结果包括主题、对象和动作中的至少一项;所述关联语句元素包括字段、操作符和目标值中的至少一项。
可选的,内部信息数据库查询模块320,具体用于:根据所述关联语句元素的元素类型和所述预设结构逻辑确定所述关联语句元素匹配的逻辑操作符;通过所述关联语句元素匹配的逻辑操作符对各所述关联语句元素进行排列组合,得到所述内部数据库目标查询语句的结构。
可选的,信息查询装置还包括整合查询结果输出模块,用于:通过大语言模型对所述当前信息查询语句的信息查询结果进行自然语言转换整合,得到整合查询结果;将所述整合查询结果按照预设输出格式模板进行输出。
上述信息查询装置可执行本发明任意实施例所提供的信息查询方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的信息查询方法。
由于上述所介绍的信息查询装置为可以执行本发明实施例中的信息查询方法的装置,故而基于本发明实施例中所介绍的信息查询方法,本领域所属技术人员能够了解本实施例的信息查询装置的具体实施方式以及其各种变化形式,所以在此对于该信息查询装置如何实现本发明实施例中的信息查询方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中信息查询方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如信息查询方法。
也即,信息查询方法可以包括:获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
在一些实施例中,信息查询方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的信息查询方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行信息查询方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
Claims (10)
1.一种信息查询方法,其特征在于,包括:
获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;
在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;
根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前信息查询语句查询公开信息数据库,包括:
获取所述公开信息数据库的向量集;其中,所述向量集中包括所述公开信息数据库中存储信息对应的向量,且各向量通过索引进行标识;
获取所述当前信息查询语句的语句向量和特征信息;
根据所述特征信息与各所述索引的匹配结果,从所述向量集中进行初步筛选获取候选向量集;
计算所述语句向量与所述候选向量集中的各候选向量的相似度值,将相似度值超过阈值的候选向量作为目标向量;
根据所述目标向量获取与所述当前信息查询语句匹配的公开信息查询结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前信息查询语句查询内部信息数据库,包括:
确定所述当前信息查询语句匹配的查询权限;
在确定所述当前信息查询语句匹配的查询权限为第一级别查询权限的情况下,查询第一内部信息数据库;
在确定所述当前信息查询语句匹配的查询权限为第二级别查询权限的情况下,查询第二内部信息数据库。
4.根据权利要求3所述的方法,其特征在于,在所述获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库之前,还包括:
从内部知识库中筛选非敏感内部数据,并对所述非敏感内部数据进行信息提取处理、标签化处理和分类处理,得到所述第一内部信息数据库;
将所述内部知识库的全部内部数据进行信息提取处理、标签化处理和分类处理,得到所述第二内部信息数据库;
其中,所述第一内部信息数据库和所述第二内部信息数据库包括文档、文档元数据和文档标签。
5.根据权利要求1所述的方法,其特征在于,所述根据所述当前信息查询语句查询内部信息数据库,包括:
通过大语言模型对所述当前信息查询语句进行解析,得到查询语句解析结果;
根据所述查询语句解析结果确定内部数据库目标查询语句的关联语句元素;
根据所述关联语句元素和预设结构逻辑生成所述内部数据库目标查询语句的结构;
根据所述内部数据库目标查询语句查询所述内部信息数据库。
6.根据权利要求5所述的方法,其特征在于,所述根据所述查询语句解析结果确定内部数据库目标查询语句的关联语句元素,包括:
确定所述内部数据库目标查询语句的元素映射方式;
通过所述元素映射方式将所述查询语句解析结果映射至所述内部数据库目标查询语句的关联语句元素;
其中,所述查询语句解析结果包括主题、对象和动作中的至少一项;所述关联语句元素包括字段、操作符和目标值中的至少一项。
7.根据权利要求5所述的方法,其特征在于,所述根据所述关联语句元素和预设结构逻辑生成所述内部数据库目标查询语句的结构,包括:
根据所述关联语句元素的元素类型和所述预设结构逻辑确定所述关联语句元素匹配的逻辑操作符;
通过所述关联语句元素匹配的逻辑操作符对各所述关联语句元素进行排列组合,得到所述内部数据库目标查询语句的结构。
8.一种信息查询装置,其特征在于,包括:
公开信息数据库查询模块,用于获取当前信息查询语句,并根据所述当前信息查询语句查询公开信息数据库;
内部信息数据库查询模块,用于在确定根据所述当前信息查询语句查询所述公开信息数据库的结果为空的情况下,根据所述当前信息查询语句查询内部信息数据库;
信息查询结果生成模块,用于根据所述内部信息数据库的查询结果生成所述当前信息查询语句的信息查询结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一所述的信息查询方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一所述的信息查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310876657.3A CN117112595A (zh) | 2023-07-17 | 2023-07-17 | 一种信息查询方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310876657.3A CN117112595A (zh) | 2023-07-17 | 2023-07-17 | 一种信息查询方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117112595A true CN117112595A (zh) | 2023-11-24 |
Family
ID=88802871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310876657.3A Pending CN117112595A (zh) | 2023-07-17 | 2023-07-17 | 一种信息查询方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117112595A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786066A (zh) * | 2023-12-13 | 2024-03-29 | 暗物质(北京)智能科技有限公司 | 一种面向文档的知识问答方法、装置、设备及介质 |
CN117850924A (zh) * | 2024-03-08 | 2024-04-09 | 北京国科众安科技有限公司 | 基于大模型的问答会话数据调用处理方法、设备和介质 |
CN118069122A (zh) * | 2024-02-02 | 2024-05-24 | 朴道征信有限公司 | 结构化查询语句复用方法、装置、电子设备和介质 |
-
2023
- 2023-07-17 CN CN202310876657.3A patent/CN117112595A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786066A (zh) * | 2023-12-13 | 2024-03-29 | 暗物质(北京)智能科技有限公司 | 一种面向文档的知识问答方法、装置、设备及介质 |
CN118069122A (zh) * | 2024-02-02 | 2024-05-24 | 朴道征信有限公司 | 结构化查询语句复用方法、装置、电子设备和介质 |
CN117850924A (zh) * | 2024-03-08 | 2024-04-09 | 北京国科众安科技有限公司 | 基于大模型的问答会话数据调用处理方法、设备和介质 |
CN117850924B (zh) * | 2024-03-08 | 2024-05-14 | 北京国科众安科技有限公司 | 基于大模型的问答会话数据调用处理方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507099B (zh) | 对话理解模型的训练方法、装置、设备和存储介质 | |
EP3958145A1 (en) | Method and apparatus for semantic retrieval, device and storage medium | |
CN104361127B (zh) | 基于领域本体和模板逻辑的多语种问答接口快速构成方法 | |
WO2019091026A1 (zh) | 知识库文档快速检索方法、应用服务器及计算机可读存储介质 | |
CN107992585B (zh) | 通用标签挖掘方法、装置、服务器及介质 | |
WO2021114810A1 (zh) | 基于图结构的公文推荐方法、装置、计算机设备及介质 | |
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
KR20200007969A (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN116795973B (zh) | 基于人工智能的文本处理方法及装置、电子设备、介质 | |
CN117112595A (zh) | 一种信息查询方法、装置、电子设备及存储介质 | |
CN114861889B (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
CN114610845B (zh) | 基于多系统的智能问答方法、装置和设备 | |
CA3138556A1 (en) | Apparatuses, storage medium and method of querying data based on vertical search | |
CN114116997A (zh) | 知识问答方法、装置、电子设备及存储介质 | |
CN113434636A (zh) | 基于语义的近似文本搜索方法、装置、计算机设备及介质 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN110727769B (zh) | 语料库生成方法及装置、人机交互处理方法及装置 | |
CN118210908B (zh) | 一种检索增强方法、装置、电子设备及存储介质 | |
CN114253990A (zh) | 数据库查询方法、装置、计算机设备和存储介质 | |
CN110688559A (zh) | 一种检索方法及装置 | |
CN112052311A (zh) | 一种基于词向量技术和知识图谱检索的短文本问答方法及装置 | |
CN116610782B (zh) | 文本检索方法、装置、电子设备及介质 | |
CN113536788B (zh) | 信息处理方法、装置、存储介质及设备 | |
CN117931858B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN115828915B (zh) | 实体消歧方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |