CN112069206A - 基于rpa及ai的数据查询方法、装置、介质及计算设备 - Google Patents

基于rpa及ai的数据查询方法、装置、介质及计算设备 Download PDF

Info

Publication number
CN112069206A
CN112069206A CN202011127609.7A CN202011127609A CN112069206A CN 112069206 A CN112069206 A CN 112069206A CN 202011127609 A CN202011127609 A CN 202011127609A CN 112069206 A CN112069206 A CN 112069206A
Authority
CN
China
Prior art keywords
query
statement
processed
query statement
normalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011127609.7A
Other languages
English (en)
Other versions
CN112069206B (zh
Inventor
张原�
张海雷
胡一川
汪冠春
褚瑞
李玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Original Assignee
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Benying Network Technology Co Ltd, Beijing Laiye Network Technology Co Ltd filed Critical Beijing Benying Network Technology Co Ltd
Publication of CN112069206A publication Critical patent/CN112069206A/zh
Application granted granted Critical
Publication of CN112069206B publication Critical patent/CN112069206B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开一种基于RPA及AI的数据查询方法、装置、介质及计算设备,该方法包括:获得所输入的用于查询表格的查询语句,作为待处理查询语句;利用当前对应关系对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象,其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象;基于预设语句规则以及待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句;利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以供表格查询,以实现提高所确定用于查询表格的查询结果的准确性,提高用户体验。

Description

基于RPA及AI的数据查询方法、装置、介质及计算设备
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种基于RPA及AI的数据查询方法、装置、介质及计算设备。
背景技术
RPA(Robotic Process Automation,机器人流程自动化),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence,人工智能)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
RPA具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Hand work+Head work,正在极大的改变劳动力的价值。
由于表格的高度结构化以及便于管理的特性,目前许多数据都是以表格的形式存在的。RPA在处理任务的过程中,会遇到大量的表格数据。特别是对于企事业单位而言,每天都可能面临海量的表格数据。目前,查询以表格的形式存在的数据时往往需要学习特殊的语法,如SQL(Structured Query Language,结构化查询语言)等,这就大大增加了表格的使用成本,因此,使用自然语言技术对以表格的形式存在的数据进行查询非常重要。
相关技术中使用自然语言技术对以表格的形式存在的数据进行查询的过程,一般是:获得用户输入的查询语句,将查询语句输入预先训练的表格查询模型,得到预先训练的表格查询模型输出的、用户输入的查询语句对应的查询目标和查询条件,进而,利用该查询目标和查询条件进行表格查询,得到用户输入的查询语句对应的查询结果,其中,该预先训练的表格查询模型为:利用样本查询语句和该表格的表头内容训练所得的神经网络模型。
在上述过程中,如果用户输入的查询语句不够合适,如预先训练的表格查询模型无法识别用户输入的查询语句,后续的该预先训练的表格查询模型所输出的查询目标和查询条件可能出现错误,进而导致查询表格时出现查询结果错误的情况,致使用户使用体验不佳。
发明内容
本发明提供了一种基于RPA及AI的数据查询方法、装置、介质及计算设备,以实现提高所确定用于查询表格的查询信息的准确性,提高用户体验。具体的技术方案如下:
第一方面,本发明实施例提供了一种基于RPA及AI的数据查询方法,所述方法包括:
获得所输入的用于查询表格的查询语句,作为待处理查询语句;
利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;
基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;
利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
可选的,所述查询信息包括所述待处理查询语句对应的查询目标和查询条件;
所述方法还包括:
利用所述查询目标和查询条件,查询所述表格,确定所述待处理查询语句对应的查询结果。
可选的,所述基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句的步骤,包括:
确定所述待处理查询语句对应的查询关键对象的词性;
利用预设自然语言词性排序顺序以及所述待处理查询语句对应的查询关键对象及其词性,确定所述待处理查询语句对应的待利用查询语句。
可选的,在所述利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象的步骤之前,所述方法还包括:
获得所述当前对应关系的过程,其中,所述过程包括:
第一种实现方式:
获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到所述当前对应关系;
第二种实现方式:
利用预设数据挖掘技术以及至少一个查询关键对象,确定至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第二历史对应关系中,得到所述当前对应关系;
第三种实现方式:
获得利用所述目标表格查询模型进行所述表格查询过程中,所对应查询信息出现异常的历史查询语句;
利用所述历史查询语句,更新第三历史对应关系,得到所述当前对应关系。
可选的,在所述利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息的步骤之前,所述方法还包括:
训练得到所述目标表格查询模型的过程,其中,所述过程包括:
获得初始表格查询模型;
获得多个用于查询所述表格的样本查询语句,以及每一样本查询语句对应的样本查询信息;
利用所述当前对应关系对每一样本查询语句中的样本待归一化对象进行归一化,确定每一样本查询语句对应的查询关键对象;
基于所述预设语句规则以及每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句;
利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练所述初始表格查询模型,直至所述初始表格查询模型达到预设收敛条件,得到所述目标表格查询模型。
可选的,基于自然语言处理NLP中的分词算法,对所述待处理查询语句进行分词,以使所述待处理查询语句中的待归一化对象以分词的形式存在;
其中,所述分词算法为:
最大匹配分词算法、最短路径分词算法、基于汉语语言模型N-Gram的分词算法或基于字的分词算法。第二方面,本发明实施例提供了一种基于RPA及AI的数据查询装置,所述装置包括:
第一获得模块,被配置为获得所输入的用于查询表格的查询语句,作为待处理查询语句;
第一确定模块,被配置为利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;
第二确定模块,被配置为基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;
第三确定模块,被配置为利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
可选的,所述查询信息包括所述待处理查询语句对应的查询目标和查询条件;
所述装置还包括:
第四确定模块,被配置为利用所述查询目标和查询条件,查询所述表格,确定所述待处理查询语句对应的查询结果。
可选的,所述第二确定模块,被具体配置为确定所述待处理查询语句对应的查询关键对象的词性;
利用预设自然语言词性排序顺序以及所述待处理查询语句对应的查询关键对象及其词性,确定所述待处理查询语句对应的待利用查询语句。
可选的,所述装置还包括:
第二获得模块,被配置为在所述利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象之前,获得所述当前对应关系,其中,所述第二获得模块,被具体配置为:
第一种实现方式:
获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到所述当前对应关系;
第二种实现方式:
利用预设数据挖掘技术以及至少一个查询关键对象,确定至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第二历史对应关系中,得到所述当前对应关系;
第三种实现方式:
获得利用所述目标表格查询模型进行所述表格查询过程中,所对应查询信息出现异常的历史查询语句;
利用所述历史查询语句,更新第三历史对应关系,得到所述当前对应关系。
可选的,所述装置还包括:
模型训练模块,被配置为在所述利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息之前,训练得到所述目标表格查询模型的过程,其中,所述模型训练模块,被具体配置为获得初始表格查询模型;
获得多个用于查询所述表格的样本查询语句,以及每一样本查询语句对应的样本查询信息;
利用所述当前对应关系对每一样本查询语句中的样本待归一化对象进行归一化,确定每一样本查询语句对应的查询关键对象;
基于所述预设语句规则以及每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句;
利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练所述初始表格查询模型,直至所述初始表格查询模型达到预设收敛条件,得到所述目标表格查询模型。
可选的,所述装置还包括:
分词模块,被配置为:基于自然语言处理NLP中的分词算法,对所述待处理查询语句进行分词,以使所述待处理查询语句中的待归一化对象以分词的形式存在;
其中,所述分词算法为:
最大匹配分词算法、最短路径分词算法、基于汉语语言模型N-Gram的分词算法或基于字的分词算法。
第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现本发明实施例所示的基于RPA及AI的数据查询方法。
第四方面,本发明实施例提供了一种计算设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明实施例所示的基于RPA及AI的数据查询方法。
由上述内容可知,本发明实施例提供的一种基于RPA及AI的数据查询方法、装置、介质及计算设备,获得所输入的用于查询表格的查询语句,作为待处理查询语句;利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象,其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象;基于预设语句规则以及待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句;利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息。
应用本发明实施例,可以通过当前对应关系对待处理查询语句中的待归一化对象进行归一化,以与表格表头对应的对象产生关联,得到待处理查询语句对应的查询关键对象,并结合预设语句规则和待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句,进而利用包含待处理查询语句对应的查询关键对象的待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以得到准确性更高的查询信息,进而保证后续查询表格所得的查询结果的准确性,提高用户使用体验。并且通过对待处理查询语句中的待归一化对象进行归一化,及结合预设语句规则,得到可以被目标表格查询模型更好的检测的待处理查询语句对应的待利用查询语句,以在一定程度上可以实现对目标表格查询模型出现错误的确定结果情况的干预。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
本发明实施例的创新点包括:
1、可以通过当前对应关系对待处理查询语句中的待归一化对象进行归一化,以与表格表头对应的对象产生关联,得到待处理查询语句对应的查询关键对象,并结合预设语句规则和待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句,进而利用包含待处理查询语句对应的查询关键对象的待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以得到准确性更高的查询信息,进而保证后续查询表格所得的查询结果的准确性,提高用户使用体验。并且通过对待处理查询语句中的待归一化对象进行归一化,及结合预设语句规则,得到可以被目标表格查询模型更好的检测的待处理查询语句对应的待利用查询语句,以在一定程度上可以实现对目标表格查询模型出现错误的确定结果情况的干预。
2、利用待处理查询语句对应的查询关键对象及其词性以及预设自然语言词性规则,得到符合自然语言语法的待处理查询语句对应的待利用查询语句,保证后续结合目标表格查询模型,可以得到准确性更高的查询表格的待处理查询语句对应的查询信息。
3、提供多种不同的方式获得当前对应关系,增加该当前对应关系的获得来源。并且可以利用目标表格查询模型进行表格查询过程中,所对应查询信息出现异常的历史查询语句,更新得到当前对应关系,以实现后续的利用更新后所得的当前对应关系,对目标表格查询模型出现确定错误的该类查询语句进行修正,进而,保证目标表格查询模型的确定结果的准确性,实现对目标表格查询模型出现错误的确定结果情况的干预。
4、可以利用当前对应关系,对样本查询语句中的样本待归一化对象进行归一化,并结合述预设语句规则以及归一化所得的每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句,进而利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练初始表格查询模型,得到可以确定结果的准确性更稳定的目标表格查询模型,为后续的得到准确性更高的待处理查询语句对应的查询信息提供基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例一提供的一种基于RPA及AI的数据查询方法的流程示意图;
图1b为本发明实施例一提供的一种通过对话机器人进行数据查询的交互界面截图;
图2为本发明实施例二提供的又一种基于RPA及AI的数据查询方法的流程示意图;
图3为本发明实施例三提供的一种优选的基于RPA及AI的数据查询方法的流程示意图;
图4为本发明实施例四提供的又一种优选的基于RPA及AI的数据查询方法的流程示意图;
图5为本发明实施例五提供的一种目标表格查询模型的训练方法的流程示意图;
图6为本发明实施例六提供的一种基于RPA及AI的数据查询装置的结构框图;
图7为本发明实施例六提供的计算机可读存储介质的一种结构示意图;
图8为本发明实施例六提供的计算设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含的一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
本发明的描述中,“对话机器人”,广义上来讲,是指能够与人类通过语音或文字进行对话交互的计算机程序。
本发明的描述中,术语“归一化”是为了减少自然语言的随机性,使其更接近机器学习算法预定义的“标准”。这有助于减少计算机必须处理的不同信息的数量,从而提高效率。
本发明的描述中,术语“分词”,是指在自然语言处理中,将一个汉字序列切分成一个个单独的词。
本发明提供了一种基于RPA及AI的数据查询方法、装置、介质及计算设备,以实现提高所确定用于查询表格的查询信息的准确性,提高用户体验。下面对本发明实施例进行详细说明。
实施例一
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence)是人工智能的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。本发明实施例提供的技术方案主要采用的是AI中的NLP(Natural Language Processing,自然语言处理)技术对查询语句进行分词、归一化处理等操作。
图1a为本发明实施例一提供的一种基于RPA及AI的数据查询方法的流程示意图。该方法可应用于表格数据的查询过程中,可由基于RPA及AI的数据查询装置来执行,该装置可通过软件和/或硬件的方式实现。如图1a所示,该方法可以包括如下步骤:
S101:获得所输入的用于查询表格的查询语句,作为待处理查询语句。
本发明实施例所提供的数据查询方法,可以应用于任意类型的具有计算能力的电子设备中,该电子设备可以为服务器或者终端。
在一种实现方式中,该电子设备可以设置有显示器件,该显示器可以显示供用户输入有关查询表格的查询请求的输入窗口,用户可以通过该显示器件所显示的输入窗口输入用于查询表格的查询语句。电子设备获得该用于查询表格的查询语句,作为待处理查询语句。
在另一种实现方式中,该电子设备可以与其他用于输入有关查询表格的查询请求的输入设备连接,该输入设备可以主动或被动控制的向该电子设备输入用于查询表格的查询语句。电子设备获得该用于查询表格的查询语句,作为待处理查询语句。
在另一种实现方式中,该电子设备可以主动触发输入用于查询表格的查询语句的功能,以得到待处理查询语句。
在另一种实现方式中,该电子设备可以承载对话机器人软件。用于查询表格的查询语句可以为:在对话机器人与用户交互过程中,用户输入的对话语句。其中,对话机器人是指能够与人类通过语音或文字进行对话交互的计算机程序。
该待处理查询语句的语言类型可以包括但不限于中文、英文以及日文等。举例而言,该待处理查询语句为中文,相应的,可以为“谁指导的xx”、“xx的导演是谁”以及“xx的女一号是谁”等,其中,“xx”可以包括但不限于电影名称以及电视剧名称。图1b为本发明实施例一提供的一种通过对话机器人进行数据查询的交互界面截图。如图1b所示,当用户想要查询某些电影信息时,可在与对话机器人的对话界面输入电影名称和查询的属性,例如,图1b中用户输入的待查询语句为“谁指导的飞驰人生”。
S102:利用当前对应关系对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象。
其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象。
电子设备本地或所连接的存储设备中,可以预先存储有当前对应关系,该当前对应关系包括至少一组待归一化对象与查询关键对象之间的对应关系。该查询关键对象可以以分词的形式存在,也可以以句子的形式存在,相应的,该待归一化对象可以以分词的形式存在,也可以以句子的形式存在,这都是可以的。该待归一化对象与查询关键对象之间的对应关系可以是一对一的对应关系,也可以是多对一的对应关系。
当前对应关系的查询关键对象可以包括表格表头对应的对象。可以理解的是,表格的表头可以存储有该表格内容的类型以及主要信息。例如:表格为存储YY电影的相关数据的表格,该表格的表头对应的对象可以包括但不限于:该YY电影的主要职员的职务类型和/或该YY电影的主要演员的演员番位。该主要职员的职务类型可以包括但不限于:导演、场务、制片人以及出品人等等职务类型,该主要演员的演员番位可以包括但不限于:男一号、女一号、男二号以及女二号等等演员番位。又例如:表格为存储zz小说的相关数据的表格,该表格的表头对应的对象包括但不限于:该zz小说的作者的姓名及简介、小说简介、小说主角名字以及各篇章的序号和标题等等。
当然,上述仅为针对表格所对应存储数据的数据类型的举例以及相应的表格表头对应的对象的类型的举例,并不对构成对表格所对应存储数据的数据类型以及相应的表格表头对应的对象的类型的限定。
电子设备获得待处理查询语句之后,可以利用当前对应关系中的待归一化对象与查询关键对象之间的对应关系,对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象。
一种实现中,若当前对应关系中的查询关键对象以分词的形式存在,电子设备获得待处理查询语句后,可以对待处理查询语句进行分词处理,得到待处理查询语句对应的以分词形式存在的待归一化对象。示例性的,可采用如下任意一种或多种算法进行分词处理:NLP中的最大匹配分词算法、最短路径分词算法、基于N-Gram(汉语语言模型)的分词算法和基于字的分词算法等,本实施例对此不作具体限定。
在得到以分词形式存在的待归一化对象后,可将待处理查询语句中的待归一化对象,与当前对应关系中的待归一化对象进行匹配,将当前对应关系中的与待处理查询语句中的待归一化对象匹配的待归一化对象对应查询关键对象,确定为待处理查询语句对应的查询关键对象。举例而言,当前对应关系中的待归一化对象与查询关键对象之间的对应关系包括:“谁指导的-导演”这一对应关系,其中,“谁指导的”为该对应关系中的待归一化对象,“导演”为该对应关系中的查询关键对象;“xx-xx”这一对应关系,其中,前一“xx”为该对应关系中的待归一化对象,后一“xx”为该对应关系中的查询关键对象。相应的,该待处理查询语句“谁指导的xx”对应的查询关键对象可以包括:导演和xx。如图1b所示,用户输入的待处理查询语句“谁指导的飞驰人生”对应的查询关键对象包括“导演”和“飞驰人生”。
另一种实现中,若当前对应关系中的查询关键对象以句子的形式存在,电子设备获得待处理查询语句后,可以将待处理查询语句作为一待归一化对象,与当前对应关系中的待归一化对象进行匹配,将当前对应关系中的与待处理查询语句中的待归一化对象匹配的待归一化对象对应查询关键对象,确定为待处理查询语句对应的查询关键对象。举例而言,当前对应关系中的待归一化对象与查询关键对象之间的对应关系包括:“谁指导的xx-xx的导演”这一对应关系,其中,“谁指导的xx”为该对应关系中的待归一化对象,“xx的导演”为该对应关系中的查询关键对象;相应的,该待处理查询语句“谁指导的xx”对应的查询关键对象可以包括:xx的导演。具体的,如图1b所示,用户输入的待处理查询语句“谁指导的飞驰人生”对应的查询关键对象包括“飞驰人生的导演”。
S103:基于预设语句规则以及待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句。
本步骤中,电子设备可以基于预设语句规则,调整待处理查询语句对应的查询关键对象的位置关系,并适应性的在待处理查询语句对应的查询关键对象之间添加连接词,以得到符合自然语言规则待处理查询语句对应的待利用查询语句。其中,所添加的连接词可以是任一词性的连接词。举例而言,在该待处理查询语句“谁指导的xx”对应的查询关键对象包括导演和xx的情况下,待处理查询语句对应的待利用查询语句可以为:“xx的导演是谁”。具体的,如图1b所示,用户输入的待处理查询语句“谁指导的飞驰人生”对应的待利用查询语句为“飞驰人生的导演是谁”。
S104:利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以供表格查询。
其中,该目标表格查询模型可以为:基于样本查询语句以及每一样本查询语句对应的样本查询信息训练所得的神经网络模型。其中,该神经网络模型可以为:基于深度学习的神经网络模型。一种情况,该目标表格查询模型可以为相关技术中,任一已基于样本查询语句以及每一样本查询语句对应的样本查询信息训练所得的基于深度学习的神经网络模型。
本步骤中,电子设备可以将待利用查询语句输入目标表格查询模型中,目标表格查询模型对待利用查询语句进行处理,确定出用于查询表格的待处理查询语句对应的查询信息。在一种情况中,该待处理查询语句对应的查询信息包括待处理查询语句对应的查询条件和查询目标。举例而言,在待处理查询语句对应的待利用查询语句可以为:“xx的导演是谁”的情况下,待处理查询语句对应的查询条件可以为:xx;待处理查询语句对应的查询目标为“导演”。
其中,为了保证后续的表格查询过程的可行性,该待处理查询语句对应的查询信息的格式与表格查询过程中所使用语言相关,该待处理查询语句对应的查询信息的格式为表格查询过程中所使用语言可识别的格式。后续的,电子设备或其他用于表格查询的设备可以基于待处理查询语句对应的查询信息进行表格查询,以得到该待处理查询语句对应的查询结果。具体的,对于用户输入的待处理查询语句“谁指导的飞驰人生”,其所对应的待利用查询语句为“飞驰人生的导演是谁”,该待处理查询语句对应的查询条件为:“飞驰人生”;待处理查询语句对应的查询目标为“导演”。如图1b所示,对于用户输入的待处理查询语句“谁指导的飞驰人生”,得到的查询结果为:“飞驰人生的导演是韩寒”。
应用本发明实施例,可以通过当前对应关系对待处理查询语句中的待归一化对象进行归一化,以与表格表头对应的对象产生关联,得到待处理查询语句对应的查询关键对象,并结合预设语句规则和待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句,进而利用包含待处理查询语句对应的查询关键对象的待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以得到准确性更高的查询信息,进而保证后续查询表格所得的查询结果的准确性,提高用户使用体验。并且通过对待处理查询语句中的待归一化对象进行归一化,及结合预设语句规则,得到可以被目标表格查询模型更好的检测的待处理查询语句对应的待利用查询语句,以在一定程度上可以实现对目标表格查询模型出现错误的确定结果情况的干预。
实施例二
图2为本发明实施例二提供的又一种基于RPA及AI的数据查询方法的流程示意图,本实施例在上述实施例的基础上,将“待处理查询语句对应的查询信息”细化为“查询目标和查询条件”,相应的,如图2所示,本实施例提供的基于RPA及AI的数据查询方法可以包括如下步骤:
S201:获得所输入的用于查询表格的查询语句,作为待处理查询语句。
S202:利用当前对应关系对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象。
其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象。
S203:基于预设语句规则以及待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句。
S204:利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以供表格查询。
其中,查询信息包括待处理查询语句对应的查询目标和查询条件。
S205:利用查询目标和查询条件,查询表格,确定待处理查询语句对应的查询结果。
其中,该S201与图1中所示的S101相同,该S202与图1中所示的S102相同,该S203与图1中所示的S103相同,该S204与图1中所示的S104相同,在此不再赘述。
本实施例中,电子设备确定出包括待处理查询语句对应的查询目标和查询条件的查询信息之后,可以直接利用查询目标和查询条件,查询表格,确定待处理查询语句对应的查询结果。举例而言,在查询目标为导演和查询条件为xx时,电子设备可以从该xx对应的表格中,查询到xx的导演为er,将er确定待处理查询语句对应的查询结果,并输出。以实现利用所确定出的准确性更高的待处理查询语句对应的查询目标和查询条件,确定出准确性更高的待处理查询语句对应的查询结果。
实施例三
图3为本发明实施例三提供的一种优选的基于RPA及AI的数据查询方法的流程示意图,本实施例在上述实施例的基础上,对“基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句”的过程进行了细化,如图3所示,本实施例提供的基于RPA及AI的数据查询方法包括:
S310、获得所输入的用于查询表格的查询语句,作为待处理查询语句。
S320、利用当前对应关系对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象。
其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象。
S330:确定待处理查询语句对应的查询关键对象的词性。
其中,所确定的待处理查询语句对应的每一查询关键对象的词性,可以为待处理查询语句对应的每一查询关键对象对应的待归一化对象在待处理查询语句中的词性,也可以为待处理查询语句对应的每一查询关键对象本身的词性,这都是可以的。
S340、利用预设自然语言词性排序顺序以及待处理查询语句对应的查询关键对象及其词性,确定待处理查询语句对应的待利用查询语句。
本实施例中,该预设语句规则可以为按照对象所对应词性顺序,对待处理查询语句对应的查询关键对象进行排序,和/或增添连接词的规则。该预设语句规则可以包括预设自然语言词性排序顺序。该电子设备可以确定待处理查询语句对应的每一查询关键对象的词性,进而利用预设自然语言词性排序顺序以及待处理查询语句对应的查询关键对象的词性,对待处理查询语句对应的查询关键对象进行排序,另外为了保证所得到的待处理查询语句对应的待利用查询语句更符合自然语言的语法规则,还可以根据待处理查询语句对应的查询关键对象的词性,在待处理查询语句对应的查询关键对象之间,和/或待处理查询语句对应的排在首位的查询关键对象之前的位置,和/或排在末位的查询关键对象添加之后的位置,添加连接词,以得到待处理查询语句对应的待利用查询语句。
S350、利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以供表格查询。
本实施例在上述实施例的基础上,通过利用预设自然语言词性排序顺序以及待处理查询语句对应的查询关键对象及其词性,确定待处理查询语句对应的待利用查询语句,可保证所得到待利用查询语句更符合自然语言的语法规则,从而有助于提高表格查询的准确性。
实施例四
图4为本发明实施例四提供的又一种优选的基于RPA及AI的数据查询方法的流程示意图,本实施例在上述实施例的基础上,对“当前对应关系”的获取过程进行了细化,如图4所示,本实施例提供的基于RPA及AI的数据查询方法包括:
S410、获得所输入的用于查询表格的查询语句,作为待处理查询语句。
S420、获得当前对应关系。
其中,当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,查询关键对象包括表格表头对应的对象。
本实施例中,获得当前对应关系可以通过如下三种实现方式中的任一种实现:
第一种实现方式为:获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到当前对应关系。
本实现方式中,该当前对应关系可以是用户人为设置的,用户可以根据其需求,针对有查询需求的以表格形式存在的数据,即表格设置当前对应关系。电子设备可以获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到当前对应关系。一种情况,在用户首次针对表格设置至少一组待归一化对象与查询关键对象之间的对应关系的情况下,该第一历史对应关系中所包含的待归一化对象与查询关键对象之间的对应关系为0组;在用户非首次针对表格设置至少一组待归一化对象与查询关键对象之间的对应关系的情况下,该第一历史对应关系中所包含的待归一化对象与查询关键对象之间的对应关系为至少一组。
在另一种情况中,用户还可以根据需求修改第一历史对应关系中所包含的待归一化对象与查询关键对象之间的对应关系,以得到当前对应关系。
第二种实现方式为:利用预设数据挖掘技术以及至少一个查询关键对象,确定至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第二历史对应关系中,得到当前对应关系。
其中,该预设数据挖掘技术可以包括但不限于:实体挖掘技术、句式挖掘技术以及意图识别技术等技术。电子设备可以基于该预设数据挖掘技术,针对每一查询关键对象从大量的数据中,确定出该查询关键对象相关联的对象,进而,得到至少一组待归一化对象与查询关键对象之间的对应关系,将该至少一组待归一化对象与查询关键对象之间的对应关系添加至第二历史对应关系中,得到当前对应关系。
一种情况中,用户还可以针对该第二历史对应关系中的待归一化对象与查询关键对象之间的对应关系进行修改。
第三种实现方式为:获得利用目标表格查询模型进行表格查询过程中,所对应查询信息出现异常的历史查询语句;利用历史查询语句,更新第三历史对应关系,得到当前对应关系。
本实施例中,在利用目标表格查询模型进行历史表格查询过程中,电子设备可以记录所对应查询信息出现异常的历史查询语句,可以立即或者在周期到来的情况下或者,所记录的所对应查询信息出现异常的历史查询语句对的数量达到预设阈值的情况下,利用历史查询语句,更新第三历史对应关系,得到当前对应关系。其中,可以人为标记所对应查询信息是否出现异常;或者可以通过判断用户是否触发指定操作,来标记所对应查询信息是否出现异常。
一种情况下,可以直接将历史查询语句作为待归一化对象,并针对每一历史查询语句设置其对应的查询关键对象,将该历史查询语句及对应其设置的查询关键对象作为一组对应关系,添加至第三历史对应关系,得到当前对应关系。
另一种情况,可以对每一历史查询语句进行分词,得到每一历史查询语句对应的至少一个待归一化对象,并针对每一历史查询语句对应的每一待归一化对象,设置其对应的查询关键对象,将每一历史查询语句对应的每一待归一化对象,以及每一待归一化对象对应的查询关键对象作为一组对应关系,添加至第三历史对应关系,得到当前对应关系。
其中,上述第一历史对应关系、第二历史对应关系以及第三历史对应关系之间可以包含相同的待归一化对象与查询关键对象之间的对应关系,也可以包含不同的待归一化对象与查询关键对象之间的对应关系,这都是可以的。
S430、利用当前对应关系对待处理查询语句中的待归一化对象进行归一化,确定待处理查询语句对应的查询关键对象。
S440、基于预设语句规则以及待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句。
S450、利用待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以供表格查询。
本实施例中,利用目标表格查询模型进行表格查询过程中,所对应查询信息出现异常的历史查询语句,更新得到当前对应关系,以实现后续的利用更新后所得的当前对应关系,对目标表格查询模型出现确定错误的该类查询语句进行修正,进而,保证目标表格查询模型的确定结果的准确性,实现对目标表格查询模型出现错误的确定结果情况的干预。
上述各个实施例中均应用了目标表格查询模型,在该模型被应用之前,需利用样本数据对初始表格查询模型进行训练,以得到目标表格查询模型。该目标表格查询模型的训练过程将在下述实施例五中进行详细说明。
实施例五
图5为本发明实施例五提供的一种目标表格查询模型的训练方法的流程示意图,如图5所示,本实施例提供的方法包括:
S510、获得初始表格查询模型。
本实施例中,电子设备可以训练得到目标表格查询模型。具体的,电子设备获得初始表格查询模型,其中,该初始表格查询模型可以为基于深度学习的神经网络模型。
S520、获得多个用于查询表格的样本查询语句,以及每一样本查询语句对应的样本查询信息。
其中,每一样本查询语句对应的样本查询信息可以包括该样本查询语句对应的样本查询目标和样本查询条件。
S530、利用当前对应关系对每一样本查询语句中的样本待归一化对象进行归一化,确定每一样本查询语句对应的查询关键对象。
示例性的,针对每一样本查询语句,可将该样本查询语句中的样本待归一化对象,与当前对应关系中的待归一化对象进行匹配,将当前对应关系中的与该样本查询语句中的样本待归一化对象匹配的待归一化对象对应查询关键对象,确定为该样本查询语句对应的查询关键对象。
S540、基于预设语句规则以及每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句。
示例性的,针对每一样本查询语句,可基于预设语句规则,调整该样本查询语句对应的查询关键对象的位置关系,并适应性地在该样本查询语句对应的查询关键对象之间添加连接词,以得到符合自然语言规则样本查询语句对应的目标查询语句。
S550、利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练初始表格查询模型,直至初始表格查询模型达到预设收敛条件,得到目标表格查询模型。
其中,利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练初始表格查询模型,是通过调整初始表格查询模型的模型参数,直至初始表格查询模型达到预设收敛条件,得到目标表格查询模型。其中,该利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练初始表格查询模型的过程,可以参见相关技术中表格查询模型的训练过程,在此不再赘述。
其中,该预设收敛条件可以包括但不限于:基于调整模型参数后的初始表格查询模型,对验证集中的每一查询语句对应的验证查询语句进行处理,所得到的验证集中的每一查询语句对应的预测查询信息,与该验证集中的每一查询语句对应的样本查询信息一致的占比,超过预设比例阈值;或者,可以为:基于调整模型参数后的初始表格查询模型,对验证集中的每一查询语句对应的验证查询语句进行处理,所得到的验证集中的每一查询语句对应的预测查询信息,与该验证集中的每一查询语句对应的样本查询信息一致的结果数量超过预设数量阈值;或者,可以为:迭代调整初始表格查询模型的模型参数的次数超过预设次数等。
其中,该验证集中的每一查询语句对应的验证查询语句为:基于当前对应关系对所对应查询语句中的待归一化对象进行归一化后所得到的、该查询语句对应的查询关键对象和预设语句规则确定的语句。
本实施例提供的技术方案,可以利用当前对应关系,对样本查询语句中的样本待归一化对象进行归一化,并结合预设语句规则以及归一化所得的每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句,进而利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练初始表格查询模型,得到可以确定结果的准确性更稳定的目标表格查询模型,为后续的得到准确性更高的待处理查询语句对应的查询信息提供基础。
实施例六
相应于上述方法实施例,图6为本发明实施例六提供的一种基于RPA及AI的数据查询装置的结构框图,如图6所示,所述装置包括:
第一获得模块610,被配置为获得所输入的用于查询表格的查询语句,作为待处理查询语句;
第一确定模块620,被配置为利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;
第二确定模块630,被配置为基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;
第三确定模块640,被配置为利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
应用本发明实施例,可以通过当前对应关系对待处理查询语句中的待归一化对象进行归一化,以与表格表头对应的对象产生关联,得到待处理查询语句对应的查询关键对象,并结合预设语句规则和待处理查询语句对应的查询关键对象,确定待处理查询语句对应的待利用查询语句,进而利用包含待处理查询语句对应的查询关键对象的待利用查询语句以及目标表格查询模型,确定用于查询表格的待处理查询语句对应的查询信息,以得到准确性更高的查询信息,进而保证后续查询表格所得的查询结果的准确性,提高用户使用体验。并且通过对待处理查询语句中的待归一化对象进行归一化,及结合预设语句规则,得到可以被目标表格查询模型更好的检测的待处理查询语句对应的待利用查询语句,以在一定程度上可以实现对目标表格查询模型出现错误的确定结果情况的干预。
在本发明的另一实施例中,所述查询信息包括所述待处理查询语句对应的查询目标和查询条件;
所述装置还包括:
第四确定模块(图中未示出),被配置为利用所述查询目标和查询条件,查询所述表格,确定所述待处理查询语句对应的查询结果。
在本发明的另一实施例中,所述第二确定模块630,被具体配置为确定所述待处理查询语句对应的查询关键对象的词性;
利用预设自然语言词性排序顺序以及所述待处理查询语句对应的查询关键对象及其词性,确定所述待处理查询语句对应的待利用查询语句。
在本发明的另一实施例中,所述装置还包括:
第二获得模块(图中未示出),被配置为在所述利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象之前,获得所述当前对应关系,其中,所述第二获得模块,被具体配置为:
第一种实现方式:
获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到所述当前对应关系;
第二种实现方式:
利用预设数据挖掘技术以及至少一个查询关键对象,确定至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第二历史对应关系中,得到所述当前对应关系;
第三种实现方式:
获得利用所述目标表格查询模型进行所述表格查询过程中,所对应查询信息出现异常的历史查询语句;
利用所述历史查询语句,更新第三历史对应关系,得到所述当前对应关系。
在本发明的另一实施例中,所述装置还包括:
模型训练模块(图中未示出),被配置为在所述利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息之前,训练得到所述目标表格查询模型的过程,其中,所述模型训练模块,被具体配置为获得初始表格查询模型;
获得多个用于查询所述表格的样本查询语句,以及每一样本查询语句对应的样本查询信息;
利用所述当前对应关系对每一样本查询语句中的样本待归一化对象进行归一化,确定每一样本查询语句对应的查询关键对象;
基于所述预设语句规则以及每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句;
利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练所述初始表格查询模型,直至所述初始表格查询模型达到预设收敛条件,得到所述目标表格查询模型。
可选的,所述装置还包括:
分词模块,被配置为:基于自然语言处理NLP中的分词算法,对所述待处理查询语句进行分词,以使所述待处理查询语句中的待归一化对象以分词的形式存在;
其中,所述分词算法为:
最大匹配分词算法、最短路径分词算法、基于汉语语言模型N-Gram的分词算法或基于字的分词算法。
相应于上述方法实施例,本发明实施例六还提供了一种计算机可读存储介质,其示例性的结构示意图如图7所示。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算设备上运行时,所述程序代码用于使所述计算设备执行本说明书上述方法实施例中描述的根据本发明各种示例性实施方式的数据查询方法中的步骤,例如,所述计算设备可以执行如图1中所示的操作S101,获得所输入的用于查询表格的查询语句,作为待处理查询语句;操作S102,利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;操作S103,基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;操作S104,利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图7所示,描述了根据本发明实施例的用于图表的数据查询的程序产品40,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言——诸如Java,C++等,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
相应于上述方法实施例,本发明实施例六还提供了一种计算设备,其示例性的结构示意图如图8所示。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的计算设备可以至少包括至少一个处理单元即处理器、以及至少一个存储单元即存储装置。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述方法实施例部分中描述的根据本发明各种示例性实施方式的数据查询方法中的步骤。例如,所述处理单元可以执行如图1中所示的操作S101,获得所输入的用于查询表格的查询语句,作为待处理查询语句;操作S102,利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;操作S103,基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;操作S104,利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
下面参照图8来描述根据本发明的这种实施方式的用于数据查询的计算设备50。如图8所示的计算设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算设备50以通用计算设备的形式表现。计算设备50的组件可以包括但不限于:上述至少一个处理单元501、上述至少一个存储单元502、连接不同系统组件(包括存储单元502和处理单元501)的总线503。
总线503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。存储单元502可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)和/或高速缓存存储器5022,还可以进一步包括只读存储器(ROM)5023。
存储单元502还可以包括具有一组(至少一个)程序模块5024的程序/实用工具5025,这样的程序模块5024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备50也可以与一个或多个外部设备504(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与计算设备50交互的设备通信,和/或与使得计算设备50能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口505进行。并且,计算设备50还可以通过网络适配器506与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器506通过总线503与计算设备50的其它模块通信。应当明白,尽管图中未示出,可以结合计算设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
上述装置、计算机可读存储介质以及计算设备实施例与方法实施例相对应,与该方法实施例具有同样的技术效果,具体说明参见方法实施例。装置实施例是基于方法实施例得到的,具体的说明可以参见方法实施例部分,此处不再赘述。本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种基于RPA及AI的数据查询方法,其特征在于,所述方法包括:
获得所输入的用于查询表格的查询语句,作为待处理查询语句;
利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;
基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;
利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
2.如权利要求1所述的方法,其特征在于,所述查询信息包括所述待处理查询语句对应的查询目标和查询条件;
所述方法还包括:
利用所述查询目标和查询条件,查询所述表格,确定所述待处理查询语句对应的查询结果。
3.如权利要求1所述的方法,其特征在于,所述基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句的步骤,包括:
确定所述待处理查询语句对应的查询关键对象的词性;
利用预设自然语言词性排序顺序以及所述待处理查询语句对应的查询关键对象及其词性,确定所述待处理查询语句对应的待利用查询语句。
4.如权利要求1-3任一项所述的方法,其特征在于,在所述利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象的步骤之前,所述方法还包括:
获得所述当前对应关系的过程,其中,所述过程包括:
第一种实现方式:
获得用户输入的至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第一历史对应关系中,得到所述当前对应关系;
第二种实现方式:
利用预设数据挖掘技术以及至少一个查询关键对象,确定至少一组待归一化对象与查询关键对象之间的对应关系,并添加至第二历史对应关系中,得到所述当前对应关系;
第三种实现方式:
获得利用所述目标表格查询模型进行所述表格查询过程中,所对应查询信息出现异常的历史查询语句;
利用所述历史查询语句,更新第三历史对应关系,得到所述当前对应关系。
5.如权利要求1-3任一项所述的方法,其特征在于,在所述利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息的步骤之前,所述方法还包括:
训练得到所述目标表格查询模型的过程,其中,所述过程包括:
获得初始表格查询模型;
获得多个用于查询所述表格的样本查询语句,以及每一样本查询语句对应的样本查询信息;
利用所述当前对应关系对每一样本查询语句中的样本待归一化对象进行归一化,确定每一样本查询语句对应的查询关键对象;
基于所述预设语句规则以及每一样本查询语句对应的查询关键对象,确定每一样本查询语句对应的目标查询语句;
利用每一样本查询语句对应的目标查询语句以及对应的样本查询信息,训练所述初始表格查询模型,直至所述初始表格查询模型达到预设收敛条件,得到所述目标表格查询模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于自然语言处理NLP中的分词算法,对所述待处理查询语句进行分词,以使所述待处理查询语句中的待归一化对象以分词的形式存在;
其中,所述分词算法为:
最大匹配分词算法、最短路径分词算法、基于汉语语言模型N-Gram的分词算法或基于字的分词算法。
7.一种基于RPA及AI的数据查询装置,其特征在于,所述装置包括:
第一获得模块,被配置为获得所输入的用于查询表格的查询语句,作为待处理查询语句;
第一确定模块,被配置为利用当前对应关系对所述待处理查询语句中的待归一化对象进行归一化,确定所述待处理查询语句对应的查询关键对象,其中,所述当前对应关系包括:待归一化对象与查询关键对象之间的对应关系,所述查询关键对象包括所述表格表头对应的对象;
第二确定模块,被配置为基于预设语句规则以及所述待处理查询语句对应的查询关键对象,确定所述待处理查询语句对应的待利用查询语句;
第三确定模块,被配置为利用所述待利用查询语句以及目标表格查询模型,确定用于查询所述表格的所述待处理查询语句对应的查询信息,以供所述表格查询。
8.如权利要求7所述的装置,其特征在于,所述查询信息包括所述待处理查询语句对应的查询目标和查询条件;
所述装置还包括:
第四确定模块,被配置为利用所述查询目标和查询条件,查询所述表格,确定所述待处理查询语句对应的查询结果。
9.一种计算机可读存储介质,其特征在于,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1-6中任一项的方法。
10.一种计算设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1-6中任一项的方法。
CN202011127609.7A 2020-03-31 2020-10-20 基于rpa及ai的数据查询方法、装置、介质及计算设备 Active CN112069206B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010249022 2020-03-31
CN2020102490227 2020-03-31

Publications (2)

Publication Number Publication Date
CN112069206A true CN112069206A (zh) 2020-12-11
CN112069206B CN112069206B (zh) 2022-02-22

Family

ID=73655460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011127609.7A Active CN112069206B (zh) 2020-03-31 2020-10-20 基于rpa及ai的数据查询方法、装置、介质及计算设备

Country Status (1)

Country Link
CN (1) CN112069206B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667697A (zh) * 2020-12-30 2021-04-16 北京来也网络科技有限公司 结合rpa和ai的房产信息的获取方法及装置
CN112667778A (zh) * 2020-12-30 2021-04-16 北京来也网络科技有限公司 结合rpa和ai的信息录入方法、装置、设备及存储介质
CN113807068A (zh) * 2021-09-30 2021-12-17 杭州分叉智能科技有限公司 一种基于RPA的Excel自动化方法
CN113836181A (zh) * 2021-09-01 2021-12-24 北京来也网络科技有限公司 结合rpa和ai的数据查询方法、装置、电子设备和存储介质
WO2023051021A1 (zh) * 2021-09-30 2023-04-06 阿里巴巴达摩院(杭州)科技有限公司 人机对话方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170364557A1 (en) * 2016-06-20 2017-12-21 TmaxData Co., Ltd. Method and apparatus for executing query and computer readable medium therefor
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN109408526A (zh) * 2018-10-12 2019-03-01 平安科技(深圳)有限公司 Sql语句生成方法、装置、计算机设备及存储介质
CN109582697A (zh) * 2018-12-24 2019-04-05 上海银赛计算机科技有限公司 多表动态关联查询方法、装置、服务器及存储介质
CN110347784A (zh) * 2019-05-23 2019-10-18 深圳壹账通智能科技有限公司 报表查询方法、装置、存储介质及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170364557A1 (en) * 2016-06-20 2017-12-21 TmaxData Co., Ltd. Method and apparatus for executing query and computer readable medium therefor
CN108170859A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 语音查询的方法、装置、存储介质及终端设备
CN109408526A (zh) * 2018-10-12 2019-03-01 平安科技(深圳)有限公司 Sql语句生成方法、装置、计算机设备及存储介质
CN109582697A (zh) * 2018-12-24 2019-04-05 上海银赛计算机科技有限公司 多表动态关联查询方法、装置、服务器及存储介质
CN110347784A (zh) * 2019-05-23 2019-10-18 深圳壹账通智能科技有限公司 报表查询方法、装置、存储介质及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667697A (zh) * 2020-12-30 2021-04-16 北京来也网络科技有限公司 结合rpa和ai的房产信息的获取方法及装置
CN112667778A (zh) * 2020-12-30 2021-04-16 北京来也网络科技有限公司 结合rpa和ai的信息录入方法、装置、设备及存储介质
CN113836181A (zh) * 2021-09-01 2021-12-24 北京来也网络科技有限公司 结合rpa和ai的数据查询方法、装置、电子设备和存储介质
CN113807068A (zh) * 2021-09-30 2021-12-17 杭州分叉智能科技有限公司 一种基于RPA的Excel自动化方法
WO2023051021A1 (zh) * 2021-09-30 2023-04-06 阿里巴巴达摩院(杭州)科技有限公司 人机对话方法、装置、设备及存储介质
CN113807068B (zh) * 2021-09-30 2024-01-26 杭州分叉智能科技有限公司 一种基于RPA的Excel自动化方法

Also Published As

Publication number Publication date
CN112069206B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN112069206B (zh) 基于rpa及ai的数据查询方法、装置、介质及计算设备
US10832658B2 (en) Quantized dialog language model for dialog systems
US20200226212A1 (en) Adversarial Training Data Augmentation Data for Text Classifiers
US9805718B2 (en) Clarifying natural language input using targeted questions
US12002456B2 (en) Using semantic frames for intent classification
US11189269B2 (en) Adversarial training data augmentation for generating related responses
US11295092B2 (en) Automatic post-editing model for neural machine translation
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
US11210286B2 (en) Facet-based conversational search
EP4109324A2 (en) Method and apparatus for identifying noise samples, electronic device, and storage medium
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
US11711469B2 (en) Contextualized speech to text conversion
US11188193B2 (en) Method and system for generating a prioritized list
US20200192941A1 (en) Search method, electronic device and storage medium
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
CN112466289A (zh) 语音指令的识别方法、装置、语音设备和存储介质
US10049108B2 (en) Identification and translation of idioms
US20220005461A1 (en) Method for recognizing a slot, and electronic device
US20230409294A1 (en) Adaptive user interfacing
CN111209746A (zh) 自然语言处理方法、装置、存储介质及电子设备
CN116257690A (zh) 一种资源推荐方法、装置、电子设备和存储介质
CN114595702A (zh) 一种文本翻译模型训练方法、文本翻译方法及相关装置
He Automatic detection of grammatical errors in english verbs based on rnn algorithm: auxiliary objectives for neural error detection models
WO2023206267A1 (zh) 调整自然语言语句的方法、装置及存储介质
US20240096312A1 (en) SYSTEM AND METHOD FOR ADAPTIVELY TRAVERSING CONVERSATION STATES USING CONVERSATIONAL Al TO EXTRACT CONTEXTUAL INFORMATION

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant after: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: Laiye Technology (Beijing) Co., Ltd

Address before: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant before: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Applicant before: Beijing Benying Network Technology Co., Ltd

GR01 Patent grant
GR01 Patent grant