CN115328956A - 基于人工智能的数据查询方法、装置和存储介质 - Google Patents

基于人工智能的数据查询方法、装置和存储介质 Download PDF

Info

Publication number
CN115328956A
CN115328956A CN202210963873.7A CN202210963873A CN115328956A CN 115328956 A CN115328956 A CN 115328956A CN 202210963873 A CN202210963873 A CN 202210963873A CN 115328956 A CN115328956 A CN 115328956A
Authority
CN
China
Prior art keywords
query
text
result
semantic
understanding result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210963873.7A
Other languages
English (en)
Inventor
甘露
张建兵
张新运
徐增辉
陈亮辉
孙珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210963873.7A priority Critical patent/CN115328956A/zh
Publication of CN115328956A publication Critical patent/CN115328956A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种基于人工智能的数据查询方法、装置和存储介质,涉及人工智能技术领域,具体涉及自然语言处理、大数据、知识图谱、智能搜索技术,可应用在智慧城市、城市治理等场景下。具体实现方案为:在获取到查询文本后,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段,并从基于关系数据库中文本内容的语义特征向量所预先建立的语义特征向量库中,对未被理解的文本片段进行语义索引,以得到该文本片段的语义理解结果,并根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。由此,提高了查询准确率。

Description

基于人工智能的数据查询方法、装置和存储介质
技术领域
本公开涉及为人工智能领域,具体涉及自然语言处理、大数据、知识图谱、智能搜索技术,可应用在智慧城市、城市治理等场景下,尤其涉及基于人工智能的数据查询方法、装置和存储介质。
背景技术
目前,通常采用关系数据数据库对结构化数据进行存储,并且,在一些场景中,在需要从关系数据库中查询可满足查询文本对应的查询结果。如何得到一个准确得到查询文本的查询结果,对于提升用户的查询体验是十分重要的。
发明内容
本公开提供了一种用于基于人工智能的数据查询方法、装置和存储介质。
根据本公开的一方面,提供了一种基于人工智能的数据查询方法,所述方法包括:获取查询文本;对所述查询文本进行查询理解,以得到所述查询文本的查询理解结果和所述查询文本中未被理解的文本片段;基于预先建立的语义特征向量库,确定出与所述文本片段相匹配的目标语义特征向量,其中,所述语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的;从所述语义特征向量库中获取与所述目标语义特征向量对应的目标文本内容,并基于所述目标文本内容确定所述文本片段的语义理解结果;根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
根据本公开的另一方面,提供了一种基于人工智能的数据查询装置,所述装置包括:第一获取模块,用于获取查询文本;查询理解模块,用于对所述查询文本进行查询理解,以得到所述查询文本的查询理解结果和所述查询文本中未被理解的文本片段;第一确定模块,用于基于预先建立的语义特征向量库,确定出与所述文本片段相匹配的目标语义特征向量,其中,所述语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的;第二确定模块,用于从所述语义特征向量库中获取与所述目标语义特征向量对应的目标文本内容,并基于所述目标文本内容确定所述文本片段的语义理解结果;数据查询模块,用于根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的基于人工智能的数据查询方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的基于人工智能的数据查询方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本公开的基于人工智能的数据查询方法。
上述申请中的一个实施例具有如下优点或有益效果:
在获取到查询文本后,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段,并从基于关系数据库中文本内容的语义特征向量所预先建立的语义特征向量库中,对未被理解的文本片段进行语义索引,以得到该文本片段的语义理解结果,并根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。由此,结合该查询文本对应的查询理解结果和查询文本中未被查询理解的文本片段的语义理解结果,从关系数据库中准确获取查询文本的查询结果,提高了查询准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是根据本公开第三实施例的示意图;
图4是根据本公开第四实施例的示意图;
图5是根据本公开第五实施例的示意图;
图6是根据本公开第六实施例的示意图;
图7是根据本公开第七实施例的示意图;
图8是根据本公开第八实施例的示意图;
图9是用来实现本公开实施例的基于人工智能的数据查询方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
相关技术中,在对关系数据库进行数据查询的过程中,严重依赖对查询文本的查询理解,如果查询文本的查询理解发生错漏,查询结果也一定会随之错漏。
为此,本公开提出了一种基于人工智能的数据查询方法,在获取到查询文本后,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段,并从基于关系数据库中文本内容的语义特征向量所预先建立的语义特征向量库中,对未被理解的文本片段进行语义索引,以得到该文本片段的语义理解结果,并根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。由此,结合该查询文本对应的查询理解结果和查询文本中未被查询理解的文本片段的语义理解结果,从关系数据库中准确获取查询文本的查询结果,旨在减少对查询理解的依赖,使得尽可能找到所有符合查询文本的查询结果,提高了查询准确率。
下面参考附图描述本公开实施例的基于人工智能的数据查询方法、装置和存储介质。
图1是根据本公开第一实施例的示意图,该实施例提供一种基于人工智能的数据查询方法。
如图1所示,该基于人工智能的数据查询方法可以包括:
步骤101,获取查询文本。
其中,需要说明的是,本实施例的基于人工智能的数据查询方法的执行主体为基于人工智能的数据查询装置,该基于人工智能的数据查询装置可以由软件和/或硬件实现,该基于人工智能的数据查询装置可以为电子设备,或者,可以配置在电子设备。
其中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
其中,查询文本可以是用户通过终端设备提供给基于人工智能的数据查询装置。
作为一种示例,在用户通过文本的方式在终端设备输入查询请求的情况下,对应地,基于人工智能的数据查询装置可接收终端设备发送的查询请求,直接从查询请求中获取查询文本。作为另一种示例,用户可通过语音的方式在终端设备输入查询请求,对应地,终端设备将查询请求发送给基于人工智能的数据查询装置,基于人工智能的数据查询装置对查询请求中的语音信息进行文字识别,以得到查询文本。作为另一种示例,在用户通过图片的方式输入查询请求的情况下,基于人工智能的数据查询装置可接收终端设备发送的查询请求,并对查询请求中的图片进行文字识别,以得到查询文本。其中,需要说明的是,基于人工智能的数据查询装置可通过任意可获取查询文本的方式获取查询文本,该实施例对获取查询文本的方式不作具体限定。
步骤102,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
在一些示例性的实施方式,基于人工智能的数据查询装置在获取查询文本后,可通过自身中的查询理解模块对该查询文本进行查询理解,以得到该查询文本的查询理解结果和查询文本中未被理解的文本片段。
作为一种示例性的实施方式,基于人工智能的数据查询装置中的查询理解结果可基于预先建立的标签体系,对查询文本进行查询理解,以得到该查询文本的查询理解结果。
其中,本示例的查询理解结果中可以包括查询文本的查询意图和查询文本中所包含的实体相关信息。
其中,实体相关信息可以包括但不限于实体的实体属性信息和实体关系信息中的至少一种。
例如,查询文本为“怎么去某某A地方”。对应地,查询理解模块对该查询文本进行查询理解,可获知该查询文本的查询意图是出行意图,并且可获知该查询文本中的实体为地点实体,并且该查询文本中的“某某A”属于地址名称,该地址名称的属性值为某某A。
其中,本示例中的文本片段是指在对查询文本进行查询理解时,没有被查询理解到的文本片段。
其中,本示例中的文本片段的数量可以为一个或者多个,该实施例对此不作具体限定。
步骤103,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
作为一种示例,基于关系数据库中文本内容的语义特征向量建立语义特征向量库的一种可能实现方式为:对于关系数据库中每个文本内容,可确定出该文本内容的语义特征向量,并基于文本内容和对应的语义特征向量建立语义特征向量库。
作为一种示例,为了可以准确且快速地确定出该文本内容的语义特征向量,可将该文本内容输入到预先训练好的语义模型中,以通过该语义模型得到该文本内容的语义特征向量。
作为一种示例,对于每个文本内容而言,可确定出该文本内容的长度是否大于该语义模型所支持的文本长度,如果大于该语义模型所支持的文本长度,可对该文本内容进行拆分,以得到多个短句,其中,拆分所得到的短句的长度均小于该语义模型所支持的文本长度。对应地,通过预先训练好的语义模型确定出多个短句各自对应的语义特征向量,并在语义特征向量库中保存多个短句和各自对应的语义特征向量这三者之间的关系。
作为一种示例,可根据该文本内容中的标点符号,对该文本内容进行拆分,以得到多个短句。
其中,标点符号可以包括但不限于逗号、分号、句号、问号、叹号等。
作为一种示例性的实施方式,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量的一种可能实现方式为:确定出文本片段的语义特征向量,并将该文本片段的语义特征向量与语义特征向量库中各个语义特征向量进行匹配,并从语义特征向量库中获取与文本片段的语义特征向量之间的匹配度最高的目标语义特征向量。
步骤104,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
作为一种示例性的实施方式,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容后,可确定该目标文本内容的语义理解结果,并将该目标文本内容的语义理解结果作为该文本片段的语义理解结果。
其中,语义理解结果可以包括该文本片段中实体的属性信息。作为一种示例,属性信息可以包括属性名以及对应的属性值。作为另一种示例,属性信息中可以仅包括属性值。
步骤105,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
作为一种示例性的实施方式,可查询理解结果和语义理解结果,确定出该查询文本对应的查询条件,并基于查询条件在关系数据库进行数据查询,以得到该查询文本的查询结果。
对应地,在查询结果为多个的情况下,确定各个查询结果和该查询文本之间的语义相似度和字面相似度,并根据语义相似度和字面相似度确定出各个查询结果和该查询文本之间的总相似度,并按照总相似度从大到小的顺序,对多个查询结果进行排序,以得到排序结果。对应地,还可以将排序结果返回给对应的终端设备。
在一些示例性的实施方式中,可对语义相似度和字面相似度进行加权求和,以得到各个查询结果和该查询文本之间的总相似度。
在本示例实施例中,在确定查询文本的查询结果的过程中,结合查询理解结果和未被理解的文本片段的语义理解结果进行数据查询,从而不再仅基于查询理解结果进行数据查询,可降低数据查询中对查询理解结果的依赖,可从关系数据库中尽可能全地找到满足查询文本的查询结果,提高了查询结果的获取的全面性的同时,提高了查询结果的准确性。
本公开实施例的基于人工智能的数据查询方法,在获取到查询文本后,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段,并从基于关系数据库中文本内容的语义特征向量所预先建立的语义特征向量库中,对未被理解的文本片段进行语义索引,以得到该文本片段的语义理解结果,并根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。由此,结合该查询文本对应的查询理解结果和查询文本中未被查询理解的文本片段的语义理解结果,从关系数据库中准确获取查询文本的查询结果,提高了查询准确率。
为了可以准确确定出与文本片段相匹配的目标语义特征向量,可对该文本片段进行划分,并结合划分所得到的多个文本块,来确定文本片段相匹配的目标语义特征向量,下面结合图2对该过程进行示例性描述,图2是根据本公开第二实施例的示意图。
如图2所示,该方法可以包括:
步骤201,获取查询文本。
步骤202,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
其中,需要说明的是,关于步骤201至步骤202的具体实现方式可参见上述实施例的相关描述,此处不再赘述。
步骤203,采用滑动窗口对文本片段进行划分,以得到多个文本块。
作为一种示例,可控制滑动窗口,以预设步长在该文本片段上进行滑动,而后将各次滑动后,处于滑动窗口内的语句划分为一个文本块。
其中,预设步长是预先设置的,例如,预设步长可以为2个字,或者一个字等,在实际应用中,可根据实际需求来设置该预设步长,该实施例对此不作具体限定。
作为另一种示例,可从该文本片段的第i个字所在的位置开始,对该文本片段依次施加窗口长度逐渐变小的滑动窗口,并将每次位于滑动窗口内的文本作为一个文本块。对应地,在对该文本片段所施加的窗口长度达到最小窗口长度的情况下,从该文本片段中第i+1个字所在的位置开始,对该文本片段依次施加窗口长度逐渐变小的滑动窗口,并将每次位于滑动窗口内的文本作为一个文本块。其中,i的取值范围1到N-1,其中,N为该文本片段中的总字数。
在本公开的一个示例中,可按照预设长度步长来减少该滑动窗口的窗口长度,直至滑动窗口的窗口长度达到最小窗口长度,例如,最小窗口长度可以为一个字。
作为一种示例,滑动窗口的起始窗口长度可以预先设置的,例如,滑动窗口的起始窗口长度可以为5个字,或者6个字所对应的窗口长度。
其中,预设长度步长是可根据实际需求来预先设置的,例如,预设长度步长可以为一个字,在实际应用中,可根据应用需求来设置该预设长度的取值,该实施例对此不作具体限定。
步骤204,针对每个文本块,在语义特征向量库中存在与文本块相匹配的语义特征向量的情况下,将文本块作为目标文本块。
在本公开的一个实施例中,针对每个文本块,为了可以准确确定该语义特征向量库中是否存在与该文本块相匹配的语义特征向量,上述针对每个文本块,在语义特征向量库中存在与文本块相匹配的语义特征向量的情况下,将文本块作为目标文本块的一种可能实现方式为:针对每个文本块,确定文本块的语义特征向量;将文本块的语义特征向量与语义特征向量库中的多个语义特征向量进行匹配;根据匹配结果,确定语义特征向量库中存在与文本块相匹配的语义特征向量;将文本块作为目标文本块。
在本公开的一个实施例中,为了可以准确且快速地确定出该文本块的语义特征向量,可将文本块输入到预先训练好的语义模型,以通过语义模型得到文本块的语义特征向量。由此,可通过预先训练好的语义模型快速且准确地确定出该文本块的语义特征向量,提高获取文本块的语义特征向量的准确性以及效率。
在本公开的一个实施例中,匹配结果中可以包括:文本块的语义特征向量和语义特征向量库中各个语义特征向量之间的匹配度,根据匹配结果,确定语义特征向量库中存在与文本块相匹配的语义特征向量的一种可能实现方式为:针对各个匹配度,将匹配度与预设匹配度阈值进行大小比较,以得到比较结果;在比较结果为匹配度大于预设匹配度阈值的情况下,确定语义特征向量库中存在与文本块相匹配的语义特征向量。由此,结合文本块的语义特征向量与语义特征向量库中各个语义特征向量之间的匹配度,准确确定出了语义特征向量库中是否存在与该文本块相匹配的语义特征向量。
其中,预设匹配度阈值是根据预先设置的匹配度的临界值,例如,上述预设匹配度阈值可以为0.8、0.85或者0.9等,在实际应用中,可根据实际应用需求来设置该预设匹配度阈值的取值,该实施例对此不作具体限定。
其中,可以理解的是,在该文本块的语义特征向量与语义特征向量库中的某个语义特征向量之间的匹配度大于该临界值的情况下,可确定语义特征向量库中存在与该文本块相匹配的语义特征向量。另外,在该匹配度小于或者等于该临界值的情况下,确定该语义特征向量库中不存在与该文本块相匹配的语义特征向量。
步骤205,根据目标文本块各自匹配到的语义特征向量,确定出与文本片段相匹配的目标语义特征向量。
在本公开的一个实施例中,可对根据目标文本块各自匹配到的语义特征向量进行拼接,并将拼接结果作为该与文本片段相匹配的目标语义特征向量。
在本公开的另一个实施例中,可将目标文本块各自匹配到的语义特征向量均作为与该文本片段匹配的目标语义特征向量。
在本公开的另一个实施例中,可从目标文本块各自匹配到的语义特征向量中,选择对应匹配度最高的语义特征向量作为与该文本片段相匹配的目标语义特征向量。
步骤206,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
步骤207,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
其中,需要说明的是,关于步骤206和步骤207的具体实现方式,可参见上述实施例的相关描述,此处不再赘述。
在本公开示例实施例中,在确定查询文本中未被理解的文本片段的语义理解结果的过程中,对该文本片段进行划分处理,以得到多个文本块,并基于各个文本块的语义特征向量与预先建立的语义特征向量库中的语义特征向量之间的匹配情况,来确定出该文本片段对应的目标语义特征向量。由此,结合各个文本块,准确确定出该文本片段的目标语义特征向量,进而可提高所确定出该文本片段的语义理解结果的准确性。
基于上述任意一个实施例的基础上,为了从关系数据库中可以准确确定出在与查询文本对应的查询结果,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果之前,还可以确定语义理解结果与查询理解结果不存在冲突。由此,可以使得后续所得到查询结果不存在冲突的情况,提高所确定出查询结果的准确性。
下面结合图3对该过程进行示例性描述,图3是根据本公开第二实施例的示意图。
如图3所示,该方法可以包括:
步骤301,获取查询文本。
步骤302,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
步骤303,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
步骤304,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
其中,需要说明的是,关于步骤301至步骤304的具体实现方式可参见上述实施例的相关描述,此处不再赘述。
步骤305,确定语义理解结果和查询理解结果中的共有属性值。
其中,共有属性值是指即存在语义理解结果又存在查询理解结果中的属性值。
步骤306,获取语义理解结果中与共有属性值所对应的第一属性名。
步骤307,获取查询理解结果中共有属性值所对应的第二属性名。
步骤308,在第一属性名和第二属性名相同的情况下,确定语义理解结果与查询理解结果不存在冲突。
作为另一种示例,在第一属性名和第二属性名不相同的情况下,可确定语义理解结果和查询理解结果存在冲突。
例如,查询理解结果中属性值“张某某”对应的第一属性名为姓名,对应地,未被理解的文本片段的语义理解结果中属性值“张某某”对应的第二属性名为地点名,此时,可确定出查询理解结果和语义理解结果存在冲突。
步骤309,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
在本示例实施例中,在确定出查询理解结果和未被理解的文本片段的语义理解结果后,确定查询理解结果和语义理解结果中的共有属性值,并结合该查询理解结果中该共有属性值的属性名称和该语义理解结果中该共有属性值的属性名称是否相同,来确定该查询理解结果和该语义理解结果是否存在冲突,并在不存在冲突的情况下,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果,由此,可避免存在冲突的查询结果的情况的出现,进一步提高了查询结果的准确度。
在一些场景中,可能存在查询理解结果和语义理解结果中存在不具有属性名的属性值,对于这种情况,为了可以清楚说明如何确定该查询理解结果和该语义理解结果是否存在冲突,下面结合图4对该过程进行示例性描述,图4是根据本公开第四实施例的示意图。
如图4所示,该方法可以包括:
步骤401,获取查询文本。
步骤402,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
步骤403,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
步骤404,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
其中,需要说明的是,关于步骤401至步骤404的具体实现方式可参见本公开实施例中的相关描述,此处不再赘述。
步骤405,确定语义理解结果和查询理解结果中的共有属性值。
步骤406,在语义理解结果中不存在与共有属性值对应的属性名,并且查询理解结果中不存在与共有属性值所对应的属性名的情况下,确定语义理解结果与查询理解结果不存在冲突。
在本公开的一个实施例中,在语义理解结果中存在与共有属性值对应的属性名,而查询理解结果中不存在与共有属性值所对应的属性名的情况下,确定语义理解结果与查询理解结果存在冲突。
在本公开的另一个实施例中,在语义理解结果中不存在与共有属性值对应的属性名,而查询理解结果中存在与共有属性值所对应的属性名的情况下,确定语义理解结果与查询理解结果存在冲突。
步骤407,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
在本示例实施例中,在确定出查询理解结果和未被理解的文本片段的语义理解结果后,确定查询理解结果和语义理解结果中的共有属性值,并在该查询理解结果中不存在该共有属性值的属性名称,并且该语义理解结果中不存在该共有属性的属性名称的情况下,确定该查询理解结果和该语义理解结果不存在冲突,并在不存在冲突的情况下,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果,由此,可避免存在冲突的查询结果的情况的出现,进一步提高了查询结果的准确度。
下面结合图5对该过程进行示例性描述,图5是根据本公开第五实施例的示意图。
如图5所示,该方法可以包括:
步骤501,获取查询文本。
步骤502,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
步骤503,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
步骤504,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
其中,需要说明的是,关于步骤501至步骤504的具体实现方式可参见本公开实施例中的相关描述,此处不再赘述。
步骤505,在文本片段为多个的情况下,从多个文本片段所对应的语义理解结果中,确定出与查询理解结果不存在冲突的目标语义理解结果。
其中,需要说明的是,针对每个文本片段,可基于公开实施例所公开的方式来确定对应文片段的语义理解结果和查询理解结果之间是否存在冲突,具体实现方式可参见本公开实施例的相关描述,此处不再赘述。
步骤506,根据查询理解结果和目标语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
在本公开的一个实施例中,为了准确得到该查询文本的查询结果,根据查询理解结果和目标语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果的一种可能实现方式可以为:对查询理解结果和目标语义理解结果进行数据合并,以得到数据合并结果;获取数据合并结果中不存在属性名的目标属性值;根据目标属性值在关系数据库中进行数据查询,以得到第一查询结果;根据数据合并结果中的除了目标属性值之外的其他内容,在关系数据库中进行数据查询,以得到第二查询结果;根据第一查询结果和第二查询结果,确定查询文本的查询结果。
在本示例实施例中,在确定出查询理解结果和多个文本片段的语义理解结果后,从多个文本片段的语义理解结果中获取与该查询理解结果不存在冲突的目标语义理解结果,根据查询理解结果和目标语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果,由此,可避免存在冲突的查询结果的情况的出现,进一步提高了查询结果的准确度。
基于上述任意一个实施例的基础上,为了可以准确获取查询文本对应的查询结果,根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果的一种可能方式,如图6所示,可以包括:
步骤601,获取查询文本。
步骤602,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
步骤603,基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
步骤604,从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
其中,需要说明的是,关于步骤601和步骤604的具体实现方式,可参见本公开实施例中的相关描述,此处不再赘述。
步骤605,对查询理解结果和语义理解结果进行数据合并,以得到数据合并结果。
步骤606,获取数据合并结果中不存在属性名的目标属性值。
步骤607,根据目标属性值生成第一查询条件,并基于数据合并结果中除了目标属性之外的其他内容生成第二查询条件。
可以理解的是,除了目标属性值之外的其他内容可以包括查询意图以及至少一个实体以及对应实体各自所对应的属性对信息和实体关系信息等,该实施例对此不作具体限定。
其中,属性对可以包括属性名以及对应的属性值。
步骤608,根据第一查询条件在关系数据库中的所有属性字段中进行数据查询,并根据第二查询条件在关系数据库中的指定属性字段中进行数据查询,以得到与第一查询条件和第二查询条件均匹配的查询结果,其中,指定属性字段是基于第二查询条件确定出的。
也就是说,在基于第一查询条件和第二查询条件对关系数据库中进行数据查询的过程中,为了可以尽可能获取全的查询结果,可根据第一查询条件对关系数据库进行全文检索,并根据第二查询条件对关系数据库进行非全文检索,以得到与第一查询条件和第二查询条件均匹配的查询结果。
其中,全文检索是指基于第一查询条件,对关系数据库中的所有属性字段进行数据查询。
在本公开的一个实施例中,可根据第二查询条件中实体的属性对信息中的属性名确定出在关系数据库中待查询的指定属性字段。
步骤609,将所得到的查询结果作为查询文本的查询结果。
在本示例实施例中,在获取查询理解结果和语义理解结果后,对查询理解结果和语义理解结果进行数据合并,以得到数据合并结果,并确定数据合并结果中不存在属性名的目标属性值以及除了该目标属性值之外的其他内容,并基于目标属性值在关系数据库中进行全文检索,并基于其他内容在关系数据库中进行数据查询,以确定出该查询文本的查询结果。由此,可以尽可能全地找到所有符合查询文本的查询结果,提高所获取的查询结果的全面性以及准确性。
为了实现上述实施例,本公开实施例还提供一种基于人工智能的数据查询装置。
图7是根据本公开第七实施例的示意图,该实施例提供一种基于人工智能的数据查询装置。
如图7所示,该基于人工智能的数据查询装置7可以包括第一获取模块71、查询理解模块72、第一确定模块73、第二确定模块74和数据查询模块75,其中:
第一获取模块71,用于获取查询文本。
查询理解模块72,用于对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段。
第一确定模块73,用于基于预先建立的语义特征向量库,确定出与文本片段相匹配的目标语义特征向量,其中,语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的。
第二确定模块74,用于从语义特征向量库中获取与目标语义特征向量对应的目标文本内容,并基于目标文本内容确定文本片段的语义理解结果。
数据查询模块75,用于根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
本公开实施例的基于人工智能的数据查询装置,在获取到查询文本后,对查询文本进行查询理解,以得到查询文本的查询理解结果和查询文本中未被理解的文本片段,并从基于关系数据库中文本内容的语义特征向量所预先建立的语义特征向量库中,对未被理解的文本片段进行语义索引,以得到该文本片段的语义理解结果,并根据查询理解结果和语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。由此,结合该查询文本对应的查询理解结果和查询文本中未被查询理解的文本片段的语义理解结果,从关系数据库中准确获取查询文本的查询结果,提高了查询准确率。
在本公开的一个实施例中,如图8所示,该基于人工智能的数据查询装置8可以包括:第一获取模块81、查询理解模块82、第一确定模块83、第二确定模块84、数据查询模块85、第三确定模块86和第四确定模块87,其中,第一确定模块83,包括划分单元831、第一确定单元832、第二确定单元833,第一确定单元832可以包括:第一确定子单元8321、匹配子单元8322、第二确定子单元8323和第三确定子单元8324;第三确定模块86可以包括第三确定单元861、第一获取单元862、第二获取单元863、第四确定单元864、第五确定单元865和第六确定单元866。
其中,需要说明的是,关于第一获取模块81、查询理解模块82和第二确定模块84的详细描述可参见上述图7中的第一获取模块71、查询理解模块72和第二确定模块74的说明,此处不再进行描述。
在本公开的一个实施例中,第一确定模块83,包括:
划分单元831,用于采用滑动窗口对文本片段进行划分,以得到多个文本块;
第一确定单元832,用于针对每个文本块,在语义特征向量库中存在与文本块相匹配的语义特征向量的情况下,将文本块作为目标文本块;
第二确定单元833,用于根据目标文本块各自匹配到的语义特征向量,确定出与文本片段相匹配的目标语义特征向量。
在本公开的一个实施例中,第一确定单元832,包括:
第一确定子单元8321,用于针对每个文本块,确定文本块的语义特征向量;
匹配子单元8322,用于将文本块的语义特征向量与语义特征向量库中的多个语义特征向量进行匹配;
第二确定子单元8323,用于根据匹配结果,确定语义特征向量库中存在与文本块相匹配的语义特征向量;
第三确定子单元8324,用于将文本块作为目标文本块。
在本公开的一个实施例中,第一确定子单元8321,具体用于:将文本块输入到预先训练好的语义模型,以通过语义模型得到文本块的语义特征向量。
在本公开的一个实施例中,匹配结果包括:文本块的语义特征向量和语义特征向量库中各个语义特征向量之间的匹配度,第二确定子单元8323,具体用于:针对各个匹配度,将匹配度与预设匹配度阈值进行大小比较,以得到比较结果;在比较结果为匹配度大于预设匹配度阈值的情况下,确定语义特征向量库中存在与文本块相匹配的语义特征向量。
在本公开的一个实施例中,该基于人工智能的数据查询装置8还可以包括:
第三确定模块86,用于确定语义理解结果与查询理解结果不存在冲突。
在本公开的一个实施例中,第三确定模块86,包括:
第三确定单元861,用于确定语义理解结果和查询理解结果中的共有属性值;
第一获取单元862,用于获取语义理解结果中与共有属性值所对应的第一属性名;
第二获取单元863,用于获取查询理解结果中共有属性值所对应的第二属性名;
第四确定单元864,用于在第一属性名和第二属性名相同的情况下,确定语义理解结果与查询理解结果不存在冲突。
在本公开的一个实施例中,第三确定模块86,包括:
第五确定单元865,用于确定语义理解结果和查询理解结果中的共有属性值;
第六确定单元866,用于在语义理解结果中不存在与共有属性值对应的属性名,并且查询理解结果中不存在与共有属性值所对应的属性名的情况下,确定语义理解结果与查询理解结果不存在冲突。
在本公开的一个实施例中,该基于人工智能的数据查询装置8还可以包括:
第四确定模块87,用于在文本片段为多个的情况下,从多个文本片段所对应的语义理解结果中,确定出与查询理解结果不存在冲突的目标语义理解结果。
数据查询模块85,具体用于:根据查询理解结果和目标语义理解结果,在关系数据数据库中进行数据查询,以得到查询文本的查询结果。
在本公开的一个实施例中,数据查询模块85,用于:对查询理解结果和语义理解结果进行数据合并,以得到数据合并结果;获取数据合并结果中不存在属性名的目标属性值;根据目标属性值在关系数据库中进行数据查询,以得到第一查询结果;根据目标属性值生成第一查询条件,并基于数据合并结果中除了目标属性之外的其他内容生成第二查询条件;根据第一查询条件在关系数据库中的所有属性字段中进行数据查询,并根据第二查询条件在关系数据库中的指定属性字段中进行数据查询,以得到与第一查询条件和第二查询条件均匹配的查询结果,其中,指定属性字段是基于第二查询条件确定出的;将所得到的查询结果作为查询文本的查询结果。
其中,需要说明的是,上述对基于人工智能的数据查询方法的解释说明也适用于本实施例中的基于人工智能的数据查询装置,该实施例对此不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,该电子设备900可以包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如基于人工智能的数据查询方法。例如,在一些实施例中,基于人工智能的数据查询方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的基于人工智能的数据查询方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于人工智能的数据查询方法。
本文中以上描述的装置和技术的各种实施方式可以在数字电子电路装置、集成电路装置、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上装置的装置(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程装置上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储装置、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储装置、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行装置、装置或设备使用或与指令执行装置、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体装置、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的装置和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的装置和技术实施在包括后台部件的计算装置(例如,作为数据服务器)、或者包括中间件部件的计算装置(例如,应用服务器)、或者包括前端部件的计算装置(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的装置和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算装置中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将装置的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机装置可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器可以是云服务器,也可以为分布式装置的服务器,或者是结合了区块链的服务器。
其中,需要说明的是,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (23)

1.一种基于人工智能的数据查询方法,包括:
获取查询文本;
对所述查询文本进行查询理解,以得到所述查询文本的查询理解结果和所述查询文本中未被理解的文本片段;
基于预先建立的语义特征向量库,确定出与所述文本片段相匹配的目标语义特征向量,其中,所述语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的;
从所述语义特征向量库中获取与所述目标语义特征向量对应的目标文本内容,并基于所述目标文本内容确定所述文本片段的语义理解结果;
根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
2.根据权利要求1所述的方法,其中,所述基于预先建立的语义特征向量库,确定出与所述文本片段相匹配的目标语义特征向量,包括:
采用滑动窗口对所述文本片段进行划分,以得到多个文本块;
针对每个文本块,在所述语义特征向量库中存在与所述文本块相匹配的语义特征向量的情况下,将所述文本块作为目标文本块;
根据所述目标文本块各自匹配到的语义特征向量,确定出与所述文本片段相匹配的目标语义特征向量。
3.根据权利要求2所述的方法,其中,所述针对每个文本块,在所述语义特征向量库中存在与所述文本块相匹配的语义特征向量的情况下,将所述文本块作为目标文本块,包括:
针对每个文本块,确定所述文本块的语义特征向量;
将所述文本块的语义特征向量与所述语义特征向量库中的多个语义特征向量进行匹配;
根据匹配结果,确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向量;
将所述文本块作为目标文本块。
4.根据权利要求3所述的方法,其中,所述确定所述文本块的语义特征向量,包括:
将所述文本块输入到预先训练好的语义模型,以通过所述语义模型得到所述文本块的语义特征向量。
5.根据权利要求3所述的方法,其中,所述匹配结果包括:所述文本块的语义特征向量和所述语义特征向量库中各个语义特征向量之间的匹配度,所述根据匹配结果,确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向量,包括:
针对各个匹配度,将所述匹配度与预设匹配度阈值进行大小比较,以得到比较结果;
在所述比较结果为所述匹配度大于预设匹配度阈值的情况下,确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向量。
6.根据权利要求1所述的方法,其中,在所述根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果之前,所述方法还包括:
确定所述语义理解结果与所述查询理解结果不存在冲突。
7.根据权利要求6所述的方法,所述确定所述语义理解结果与所述查询理解结果不存在冲突,包括:
确定所述语义理解结果和所述查询理解结果中的共有属性值;
获取所述语义理解结果中与所述共有属性值所对应的第一属性名;
获取所述查询理解结果中所述共有属性值所对应的第二属性名;
在所述第一属性名和所述第二属性名相同的情况下,确定所述语义理解结果与所述查询理解结果不存在冲突。
8.根据权利要求6所述的方法,所述确定所述语义理解结果与所述查询理解结果不存在冲突,包括:
确定所述语义理解结果和所述查询理解结果中的共有属性值;
在所述语义理解结果中不存在与所述共有属性值对应的属性名,并且所述查询理解结果中不存在与所述共有属性值所对应的属性名的情况下,确定所述语义理解结果与所述查询理解结果不存在冲突。
9.根据权利要求1所述的方法,在所述根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果之前,所述方法还包括:
在所述文本片段为多个的情况下,从多个所述文本片段所对应的语义理解结果中,确定出与所述查询理解结果不存在冲突的目标语义理解结果;
所述根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果,包括:
根据所述查询理解结果和所述目标语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
10.根据权利要求1-8任一项所述的方法,所述根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果,包括:
对所述查询理解结果和所述语义理解结果进行数据合并,以得到数据合并结果;
获取所述数据合并结果中不存在属性名的目标属性值;
根据所述目标属性值生成第一查询条件,并基于所述数据合并结果中除了所述目标属性之外的其他内容生成第二查询条件;
根据所述第一查询条件在所述关系数据库中的所有属性字段中进行数据查询,并根据所述第二查询条件在所述关系数据库中的指定属性字段中进行数据查询,以得到与所述第一查询条件和所述第二查询条件均匹配的查询结果,其中,所述指定属性字段是基于所述第二查询条件确定出的;
将所得到的查询结果作为所述查询文本的查询结果。
11.一种基于人工智能的数据查询装置,包括:
第一获取模块,用于获取查询文本;
查询理解模块,用于对所述查询文本进行查询理解,以得到所述查询文本的查询理解结果和所述查询文本中未被理解的文本片段;
第一确定模块,用于基于预先建立的语义特征向量库,确定出与所述文本片段相匹配的目标语义特征向量,其中,所述语义特征向量库是基于关系数据库中文本内容的语义特征向量而预先建立的;
第二确定模块,用于从所述语义特征向量库中获取与所述目标语义特征向量对应的目标文本内容,并基于所述目标文本内容确定所述文本片段的语义理解结果;
数据查询模块,用于根据所述查询理解结果和所述语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
12.根据权利要求11所述的装置,其中,所述第一确定模块,包括:
划分单元,用于采用滑动窗口对所述文本片段进行划分,以得到多个文本块;
第一确定单元,用于针对每个文本块,在所述语义特征向量库中存在与所述文本块相匹配的语义特征向量的情况下,将所述文本块作为目标文本块;
第二确定单元,用于根据所述目标文本块各自匹配到的语义特征向量,确定出与所述文本片段相匹配的目标语义特征向量。
13.根据权利要求12所述的装置,其中,所述第一确定单元,包括:
第一确定子单元,用于针对每个文本块,确定所述文本块的语义特征向量;
匹配子单元,用于将所述文本块的语义特征向量与所述语义特征向量库中的多个语义特征向量进行匹配;
第二确定子单元,用于根据匹配结果,确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向量;
第三确定子单元,用于将所述文本块作为目标文本块。
14.根据权利要求13所述的装置,其中,所述第一确定子单元,具体用于:
将所述文本块输入到预先训练好的语义模型,以通过所述语义模型得到所述文本块的语义特征向量。
15.根据权利要求13所述的装置,其中,所述匹配结果包括:所述文本块的语义特征向量和所述语义特征向量库中各个语义特征向量之间的匹配度,所述第二确定子单元,具体用于:
针对各个匹配度,将所述匹配度与预设匹配度阈值进行大小比较,以得到比较结果;
在所述比较结果为所述匹配度大于预设匹配度阈值的情况下,确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向量。
16.根据权利要求11所述的装置,其中,所述装置还包括:
第三确定模块,用于确定所述语义理解结果与所述查询理解结果不存在冲突。
17.根据权利要求16所述的装置,所述第三确定模块,包括:
第三确定单元,用于确定所述语义理解结果和所述查询理解结果中的共有属性值;
第一获取单元,用于获取所述语义理解结果中与所述共有属性值所对应的第一属性名;
第二获取单元,用于获取所述查询理解结果中所述共有属性值所对应的第二属性名;
第四确定单元,用于在所述第一属性名和所述第二属性名相同的情况下,确定所述语义理解结果与所述查询理解结果不存在冲突。
18.根据权利要求16所述的装置,所述第三确定模块,包括:
第五确定单元,用于确定所述语义理解结果和所述查询理解结果中的共有属性值;
第六确定单元,用于在所述语义理解结果中不存在与所述共有属性值对应的属性名,并且所述查询理解结果中不存在与所述共有属性值所对应的属性名的情况下,确定所述语义理解结果与所述查询理解结果不存在冲突。
19.根据权利要求11所述的装置,所述装置还包括:
第四确定模块,用于在所述文本片段为多个的情况下,从多个所述文本片段所对应的语义理解结果中,确定出与所述查询理解结果不存在冲突的目标语义理解结果;
所述数据查询模块,具体用于:
根据所述查询理解结果和所述目标语义理解结果,在所述关系数据数据库中进行数据查询,以得到所述查询文本的查询结果。
20.根据权利要求11-18任一项所述的装置,所述数据查询模块,具体用于:
对所述查询理解结果和所述语义理解结果进行数据合并,以得到数据合并结果;
获取所述数据合并结果中不存在属性名的目标属性值;
根据所述目标属性值生成第一查询条件,并基于所述数据合并结果中除了所述目标属性之外的其他内容生成第二查询条件;
根据所述第一查询条件在所述关系数据库中的所有属性字段中进行数据查询,并根据所述第二查询条件在所述关系数据库中的指定属性字段中进行数据查询,以得到与所述第一查询条件和所述第二查询条件均匹配的查询结果,其中,所述指定属性字段是基于所述第二查询条件确定出的;
将所得到的查询结果作为所述查询文本的查询结果。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1-10中任一项所述的方法的步骤。
CN202210963873.7A 2022-08-11 2022-08-11 基于人工智能的数据查询方法、装置和存储介质 Pending CN115328956A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210963873.7A CN115328956A (zh) 2022-08-11 2022-08-11 基于人工智能的数据查询方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210963873.7A CN115328956A (zh) 2022-08-11 2022-08-11 基于人工智能的数据查询方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN115328956A true CN115328956A (zh) 2022-11-11

Family

ID=83923307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210963873.7A Pending CN115328956A (zh) 2022-08-11 2022-08-11 基于人工智能的数据查询方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN115328956A (zh)

Similar Documents

Publication Publication Date Title
CN112560496A (zh) 语义分析模型的训练方法、装置、电子设备及存储介质
CN112560501A (zh) 语义特征的生成方法、模型训练方法、装置、设备及介质
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN113128209B (zh) 用于生成词库的方法及装置
CN112579727A (zh) 文档内容的提取方法、装置、电子设备及存储介质
CN113792154A (zh) 故障关联关系的确定方法、装置、电子设备及存储介质
CN112528641A (zh) 建立信息抽取模型的方法、装置、电子设备和可读存储介质
CN112559631A (zh) 分布式图数据库的数据处理方法、装置以及电子设备
JP2023015215A (ja) テキスト情報の抽出方法、装置、電子機器及び記憶媒体
CN113408273B (zh) 文本实体识别模型的训练与文本实体识别方法、装置
CN113408280B (zh) 负例构造方法、装置、设备和存储介质
US20220005461A1 (en) Method for recognizing a slot, and electronic device
CN112989797B (zh) 模型训练、文本扩展方法,装置,设备以及存储介质
CN112699237B (zh) 标签确定方法、设备和存储介质
CN113407698A (zh) 意图识别模型的训练与意图识别的方法、装置
CN115186163B (zh) 搜索结果排序模型的训练与搜索结果排序方法、装置
CN116049370A (zh) 信息查询方法和信息生成模型的训练方法、装置
CN113868254B (zh) 图数据库中的实体节点去重方法、设备和存储介质
CN112560481B (zh) 语句处理方法、设备和存储介质
CN114328855A (zh) 文档查询方法、装置、电子设备和可读存储介质
CN114841172A (zh) 文本匹配双塔模型的知识蒸馏方法、装置及程序产品
CN115328956A (zh) 基于人工智能的数据查询方法、装置和存储介质
CN114417862A (zh) 文本匹配方法、文本匹配模型的训练方法和装置
CN112905917A (zh) 内链生成方法、模型训练方法、相关装置及电子设备
CN116069914B (zh) 训练数据的生成方法、模型训练方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination