CN113535931B - 一种信息处理方法、装置、电子设备及存储介质 - Google Patents
一种信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113535931B CN113535931B CN202111090318.XA CN202111090318A CN113535931B CN 113535931 B CN113535931 B CN 113535931B CN 202111090318 A CN202111090318 A CN 202111090318A CN 113535931 B CN113535931 B CN 113535931B
- Authority
- CN
- China
- Prior art keywords
- natural language
- query
- language
- strategy
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本申请提供了一种信息处理方法、装置、电子设备及存储介质,方法包括:响应用户向文字输入区域输入的自然语言文字,若当前输入的自然语言文字所构成的完整自然语言语句符合某一语言策略,则确定完整自然语言语句为带有查询意图的自然语言查询语句,并将完整自然语言语句所符合的语言策略作为目标语言策略;根据目标语言策略,对自然语言查询语句进行解析,得到对应的标准查询语句;根据标准查询语句,从联合数据源中获取数据查询结果;根据数据查询结果,生成数据可视化图表;将数据可视化图表显示于当前界面的侧边栏中。本申请能够在用户打字的过程中实时识别出带有查询意图的语句并根据其获取对应的图表形式结果,大幅降低了用户的使用门槛。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种信息处理方法、装置、电子设备及存储介质。
背景技术
在企业数字化转型过程中,企业内部每天都产生大量丰富的知识和密集的信息,而对这些知识和信息中的数据进行业务统计是必不可少的。
目前,用户进行业务统计的方式,是在业务数据对应的业务系统中,通过输入数据查询语言进行所需业务数据的查询,然后基于业务需求对所需业务数据进行处理生成图表,再将图表拷贝到文档中。
然而,现有方法需要用户具有一定的技术背景和较高的专业素养,包括会写查询语句,了解一些简单的脚本,有业务背景,了解底层数据的逻辑,数据的存储结构等等,具有较高的门槛,因此,普通用户根本无法完成对于企业信息的业务统计工作。
发明内容
有鉴于此,本申请的目的在于提供一种信息处理方法、装置、电子设备及存储介质,能够实时对用户当前输入的自然语言文字所构成的完整短句进行识别,若识别出该完整短句为具有查询意图的语句,则将其解析成数据库能够识别的标准查询语言,并以数据可视化图表的形式直观展示数据查询结果,这样,用户无需掌握数据查询编程语言,也无需依赖查询数据编程的专业技术人员,普通人的查询需求大都可以满足,大幅降低了使用门槛,提高了工作效率,降低了时间成本。
第一方面,本申请实施例提供了一种信息处理方法,所述方法包括:
响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略;
根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句;
根据所述标准查询语句,从联合数据源中获取数据查询结果;
根据所述数据查询结果,生成数据可视化图表;
将所述数据可视化图表显示于当前界面的侧边栏中。
在一种可能的实施方式中,所述文字输入区域包括:文档中的文字输入区域,会话文本中的文字输入区域。
在一种可能的实施方式中,所述方法还包括:
响应用户针对所述数据可视化图表的复制操作,以将所述数据可视化图表作为复制对象。
在一种可能的实施方式中,所述方法还包括:
将包含所述自然语言查询语句的文字输入框显示于所述当前界面的侧边栏中;
响应用户向所述文字输入框中输入的自然语言文字,若所述文字输入框中存在的修改后的完整自然语言语句符合某一预设语言策略,将所述修改后的完整自然语言语句确定为新的自然语言查询语句,并将所述修改后的完整自然语言语句所符合的预设语言策略作为新的目标语言策略;
根据所述新的目标语言策略,对所述新的自然语言查询语句进行解析,得到所述新的自然语言查询语句对应的新的标准查询语句;
根据所述新的标准查询语句,从所述联合数据源中获取新的数据查询结果;
根据所述新的数据查询结果,生成新的数据可视化图表;
将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述方法还包括:
将当前的标准查询语句中包括的查询信息显示于所述当前界面的侧边栏中,其中,所述查询信息包括以下至少一者:查询字段,标准查询语句语法;
响应用户针对所述查询信息的修改,对当前的标准查询语句进行相应的修改,得到修改后的标准查询语句;
根据所述修改后的标准查询语句,从所述联合数据源中获取修改后的数据查询结果;
根据所述修改后的数据查询结果,获取修改后的数据可视化图表;
将当前的数据可视化图表替换为所述修改后的数据可视化图表。
在一种可能的实施方式中,判断所述完整自然语言语句是否符合某一预设语言策略,包括:
针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句;
对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略。
在一种可能的实施方式中,若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述方法还包括:
计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度;
若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
在一种可能的实施方式中,所述根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句,包括:
根据所述目标语言策略,确定与所述自然语言查询语句匹配的标准查询语句模板,其中,所述标准查询语句模板中包括:所述目标语言策略对应的查询字段、所述目标语言策略对应的查询数据表和所述目标语言策略对应的标准查询语句语法;
对于所述自然语言查询语句中包括的每一实体词,将该实体词填入所述标准查询语句模板中对应的位置上,得到所述标准查询语句。
在一种可能的实施方式中,所述数据可视化图表是可编辑的。
在一种可能的实施方式中,所述方法还包括:
若检测到所述标准查询语句中包括的查询数据表中的数据发生了变动,且所述数据可视化图表未被编辑过,则根据所述标准查询语句,从发生了数据变动的联合数据源中获取新的数据查询结果;
根据所述新的数据查询结果,生成新的数据可视化图表;
将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述方法还包括:
对所述自然语言查询语句和所述数据可视化图表使用相对应的方式进行标记。
在一种可能的实施方式中,所述方法还包括:
根据所述目标语言策略,确定对应的总结报告模板;
根据所述数据可视化图表的内容,生成对应的总结语句;
对于每一所述总结语句,将该总结语句填入所述总结报告模板中对应的位置上,生成数据总结报告;
将所述数据总结报告存储于预先指定的文本中。
在一种可能的实施方式中,所述根据所述数据查询结果,生成数据可视化图表,包括:
根据所述目标语言策略,确定数据可视化图表的图表类型;
根据所述数据查询结果,生成所述图表类型下的所述数据可视化图表。
在一种可能的实施方式中,所述方法还包括:
响应用户的选择操作,确定所述选择操作在所述当前界面的文字输入区域中所选定的粘贴位置;
响应用户针对所述复制对象的粘贴操作,将所述复制对象粘贴至所述粘贴位置。
第二方面,本申请实施例提供了一种信息处理装置,所述装置包括:
第一响应模块,用于响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略;
解析模块,用于根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句;
查询模块,用于根据所述标准查询语句,从联合数据源中获取数据查询结果;
图表生成模块,用于根据所述数据查询结果,生成数据可视化图表;
显示模块,用于将所述数据可视化图表显示于当前界面的侧边栏中。
在一种可能的实施方式中,所述文字输入区域包括:文档中的文字输入区域,会话文本中的文字输入区域。
在一种可能的实施方式中,所述装置还包括:
第二响应模块,用于响应用户针对所述数据可视化图表的复制操作,以将所述数据可视化图表作为复制对象。
在一种可能的实施方式中,所述装置还包括:
所述显示模块,还用于将包含所述自然语言查询语句的文字输入框显示于所述当前界面的侧边栏中;
第三响应模块,用于响应用户向所述文字输入框中输入的自然语言文字,若所述文字输入框中存在的修改后的完整自然语言语句符合某一预设语言策略,将所述修改后的完整自然语言语句确定为新的自然语言查询语句,并将所述修改后的完整自然语言语句所符合的预设语言策略作为新的目标语言策略;
所述解析模块,还用于根据所述新的目标语言策略,对所述新的自然语言查询语句进行解析,得到所述新的自然语言查询语句对应的新的标准查询语句;
所述查询模块,还用于根据所述新的标准查询语句,从所述联合数据源中获取新的数据查询结果;
所述图表生成模块,还用于根据所述新的数据查询结果,生成新的数据可视化图表;
第一更新模块,用于将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
所述显示模块,还用于将当前的标准查询语句中包括的查询信息显示于所述当前界面的侧边栏中,其中,所述查询信息包括以下至少一者:查询字段,标准查询语句语法;
第四响应模块,用于响应用户针对所述查询信息的修改,对当前的标准查询语句进行相应的修改,得到修改后的标准查询语句;
所述查询模块,还用于根据所述修改后的标准查询语句,从所述联合数据源中获取修改后的数据查询结果;
所述图表生成模块,还用于根据所述修改后的数据查询结果,获取修改后的数据可视化图表;
第二更新模块,用于将当前的数据可视化图表替换为所述修改后的数据可视化图表。
在一种可能的实施方式中,所述第一响应模块在判断所述完整自然语言语句是否符合某一预设语言策略时,具体用于:
针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句;对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略。
在一种可能的实施方式中,若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述第一响应模块,还用于:
计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度;若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
在一种可能的实施方式中,所述解析模块,具体用于:
根据所述目标语言策略,确定与所述自然语言查询语句匹配的标准查询语句模板,其中,所述标准查询语句模板中包括:所述目标语言策略对应的查询字段、所述目标语言策略对应的查询数据表和所述目标语言策略对应的标准查询语句语法;对于所述自然语言查询语句中包括的每一实体词,将该实体词填入所述标准查询语句模板中对应的位置上,得到所述标准查询语句。
在一种可能的实施方式中,所述数据可视化图表是可编辑的。
在一种可能的实施方式中,所述装置还包括:
检测模块,用于若检测到所述标准查询语句中包括的查询数据表中的数据发生了变动,且所述数据可视化图表未被编辑过,则根据所述标准查询语句,从发生了数据变动的联合数据源中获取新的数据查询结果;
所述图表生成模块,还用于根据所述新的数据查询结果,生成新的数据可视化图表;
第三更新模块,用于将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
标记模块,用于对所述自然语言查询语句和所述数据可视化图表使用相对应的方式进行标记。
在一种可能的实施方式中,所述装置还包括:
报告生成模块,用于根据所述目标语言策略,确定对应的总结报告模板;根据所述数据可视化图表的内容,生成对应的总结语句;对于每一所述总结语句,将该总结语句填入所述总结报告模板中对应的位置上,生成数据总结报告;
存储模块,用于将所述数据总结报告存储于预先指定的文本中。
在一种可能的实施方式中,所述图表生成模块,具体用于:
根据所述目标语言策略,确定数据可视化图表的图表类型;根据所述数据查询结果,生成所述图表类型下的所述数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
第五响应模块,用于响应用户的选择操作,确定所述选择操作在所述当前界面的文字输入区域中所选定的粘贴位置;
第六响应模块,用于响应用户针对所述复制对象的粘贴操作,将所述复制对象粘贴至所述粘贴位置。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面任一项所述的信息处理方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面任一项所述的信息处理方法的步骤。
本申请实施例提供的一种信息处理方法、装置、电子设备及存储介质,能够实时对用户当前输入的自然语言文字所构成的完整短句进行识别,若识别出该完整短句为具有查询意图的语句,则将其解析成数据库能够识别的标准查询语言,并以数据可视化图表的形式直观展示数据查询结果,这样,用户无需掌握数据查询编程语言,也无需依赖查询数据编程的专业技术人员,普通人的查询需求大都可以满足,大幅降低了使用门槛,提高了工作效率,降低了时间成本。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种信息处理方法的流程图;
图2示出了本申请实施例提供的另一种信息处理方法的流程图;
图3示出了本申请实施例提供的另一种信息处理方法的流程图;
图4示出了本申请实施例提供的另一种信息处理方法的流程图;
图5示出了本申请实施例提供的另一种信息处理方法的流程图;
图6示出了本申请实施例提供的另一种信息处理方法的流程图;
图7示出了本申请实施例提供的另一种信息处理方法的流程图;
图8示出了本申请实施例提供的另一种信息处理方法的流程图;
图9示出了本申请实施例提供的另一种信息处理方法的流程图;
图10示出了本申请实施例提供的另一种信息处理方法的流程图;
图11示出了本申请实施例提供的一种信息处理装置的结构示意图;
图12示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。 应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
参照图1所示,为本申请实施例提供的一种信息处理方法的流程图,所述方法包括:
S101、响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略。
预先设置有一预设语言策略集,其中包含了若干条预设语言策略,用户可以对存储预设语言策略集的文件进行查看,此外,用户可以根据业务需求或语言习惯等,对预设语言策略进行调整。
自然语言文字包括中文文字、阿拉伯文字和英文文字等,例如,“今天天气真好”,“品牌手机最近1个月的销售情况”,“巧克力冰淇淋”,“一二三四五六七八九十”,“a”,“我”,“7”等等均是自然语言文字。
文字输入区域可以是进行业务统计的文档中的文字输入区域。
在用户进行文字输入前,文字输入区域中可以存在自然语言文字,也可以不存在。
一、文字输入区域中预先存在自然语言文字。
1、文字输入区域中预先存在自然语言文字内容,但不构成完整自然语言语句。
在本申请中,以特定字符作为完整自然语言语句之间的分界线,若不存在特定字符,仅存在自然语言文字,则判定不存在完整自然语言语句,且完整自然语言语句中只包括自然语言文字(最少包括一个自然语言文字),其中,特定字符可以是以下几者:逗号,句号,问号,省略号,叹号(可以根据情况进行调整,例如还可以加入空格字符等)。
例如,文字输入区域中预先存在内容“今天是雨天今天是晴天今天是阴天吗”,不存在任一特定字符,因此虽然存在自然语言文字内容但并不构成完整自然语言语句。
2、文字输入区域中预先存在自然语言文字内容,构成一个完整自然语言语句。
例如,文字输入区域中预先存在内容“今天是晴天,”,那么,“今天是晴天”即构成一个完整自然语言语句,在用户向文字输入区域中输入自然语言文字之前,对完整自然语言语句“今天是晴天”进行识别。
3、文字输入区域中预先存在自然语言文字内容,构成多个完整自然语言语句。
例如,文字输入区域中预先存在内容“今天是雨天,今天是晴天,今天是阴天,后天打雷”,那么,即判定文字输入区域中当前存在4个完整自然语言语句(分别是“今天是雨天”,“今天是晴天”,“今天是阴天”,“后天打雷”),在用户向文字输入区域中输入自然语言文字之前,分别对这4个完整自然语言语句进行识别。
用户可以在任一自然语言文字(或是标点符号)的前面或后面进行文字(或是标点符号)输入。
以1为例,用户可以在“吗”字的后面输入一个句号(即文字输入区域中当前存在的内容为“今天是晴天今天是雨天今天是阴天吗。”),这样就构成了一个完整自然语言语句“今天是晴天今天雨天今天是阴天吗”(若用户输入的标点符号并非特定字符,则依然不构成完整自然语言语句)。
以2为例,用户在“天”字后面输入一个叹号(即文字输入区域中当前存在的内容为“今天!是晴天,”),那么,当前便存在2个完整自然语言语句(分别是“今天”,“是晴天”),分别对这2个完整自然语言语句进行识别。
用户可以一次性输入一个自然语言文字,也可以是多个(包括以复制粘贴的形式将自然语言文字内容和/或标点符号粘贴到文字输入区域中)。
以3为例,用户将内容“拉面,泡芙,饼干”粘贴到“打”字和“雷”字之间,文字输入区域中当前存在的内容即为“今天是雨天,今天是晴天,今天是阴天,后天打拉面,泡芙,饼干雷”,构成6个完整自然语言语句(“今天是雨天”,“今天是晴天”,“今天是阴天”,“后天打拉面”,“泡芙”,“饼干雷”),分别对这6个完整自然语言语句进行识别。
此外,还包括响应用户对当前文字输入区域中已经存在的内容的删除。
以3为例,用户将“今天是阴天,后天打雷”删除(即文字输入区域中当前存在的内容为“今天是雨天,今天是晴天,”),那么,即对“今天是雨天”和“今天是晴天”2个完整自然语言语句分别进行识别。
二、文字输入区域中预先不存在自然语言文字。
①、文字输入区域中预先不存在任何内容。
用户依次向文字输入区域中输入内容“一”,“二”,“三”“,”,那么,在输入完“,”后,“一二三”才构成了完整自然语言语句,对完整自然语言语句“一二三”进行识别。
②、文字输入区域中预先不存在自然语言文字,但存在特定字符。
例如,文字输入区域中当前存在内容“,。”,若用户在逗号之前输入“一”,那么“一”即构成了一个完整自然语言语句,对完整自然语言语句“一”进行识别。
S102、根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句。
将自然语言查询语句转换为数据库能够直接进行识别的标准查询语句。标准查询语句包括但不限于:结构化查询语言(Stuctural Query Languege,SQL)、滚动查询(ElasticSearch,ES)检索语句、图检索语句等等。
S103、根据所述标准查询语句,从联合数据源中获取数据查询结果。
在本申请实施例中,联合数据源为通过接口对接了多个业务系统的数据库(即各个业务系统已经预先被打通,并用接口进行对接,这样,解决了用户跨系统获取信息的不便,用户无需确定想要查询的数据所在的原始业务系统,系统可以自动根据用户需求到对应业务系统中获取信息);
业务系统对应的类型包括但不限于:图谱数据库,ES索引表、关系数据库管理系统(Relational Database Management System,RDBMS)、多数据源组合表等等。
S104、根据所述数据查询结果,生成数据可视化图表。
数据可视化图表可以为商业智能(Business Intellegence,BI)图表。
S105、将所述数据可视化图表显示于当前界面的侧边栏中。
侧边栏是依附于文字输入区域的载体存在的。具体来说,例如,当文字输入区域是某文档中的文字输入区域时,侧边栏可以伴随文档共同打开,或者,点击该文档中对应的插件选项控制其开启,或者,在识别出第一个自然语言查询语句(即生成第一个数据可视化图表)时自动开启。侧边栏是以类似于文档的导航框的形式存在,用户可以对侧边栏进行拖拽,使其处于当前界面的任意位置中,以及,调整侧边栏对应的长和宽,以及,将侧边栏关闭等。
若当前存在多个数据可视化图表,对于每一数据可视化图表,可以将该数据可视化图表按照其对应的自然语言查询语句在文字输入区域中的先后顺序确定该数据可视化图表在侧边栏中的显示顺序,或者,按照该数据可视化图表对应的自然语言查询语句识别的先后顺序确定该数据可视化图表在侧边栏中的显示顺序(例如,自然语言查询语句1在文字输入区域中的位置位于自然语言查询语句2之前,但自然语言查询语句1是后输入的(即后识别出来的),那么自然语言查询语句1对应的数据可视化图表1显示在自然语言查询语句2对应的数据可视化图表2的下面)。
以及,当前若存在某一自然语言查询语句a,其对应的数据可视化图表显示在侧边栏中,用户针对该自然语言查询语句a删除了某一个或某几个自然语言文字或是增加了自然语言文字后,其不再为带有查询意图的自然语言查询语句,那么其对应的数据可视化图表便从侧边栏中消失。
在当前界面的侧边栏中存在的数据可视化图表数量较多时,侧边栏会相应出现滚动条,用户可通过拖拽滚动条或点击键盘上的上下键来浏览想要查看的数据可视化图表。
在一种可能的实施方式中,所述文字输入区域包括:文档中的文字输入区域,会话文本中的文字输入区域。
进一步地,在本申请实施例中,文档可以为任意能够进行文字书写的文档;会话文本可以是各种社交软件中的文字对话框。
例如在如下场景中:领导在某电脑版社交软件上询问相关工作人员业务情况,工作人员只需在该电脑版社交软件的打字框上以自然语言的形式将具体的相关文字内容进行输入,便可以得到直观的图表形式的具体业务情况,并向领导进行传达,提升了工作效率。
在一种可能的实施方式中,所述方法还包括:
响应用户针对所述数据可视化图表的复制操作,以将所述数据可视化图表作为复制对象。
在本申请实施例中,用户可以对数据可视化图表进行复制,然后将数据可视化图表复制到所需的地方,例如,其他文本中,或者是当前界面的文字输入区域中,这样,省去了人工再制作图表的时间,减少了用户的操作量。
在一种可能的实施方式中,参照图2所示,为本申请实施例提供的另一种信息处理方法的流程图,所述方法还包括:
S201、将包含所述自然语言查询语句的文字输入框显示于所述当前界面的侧边栏中。
将包含有与自然语言查询语句相同文字的文字输入框显示于侧边栏中(例如,某一自然语言查询语句为“企业知识库产品最近一个月的使用情况”,那么,文字输入框中也包含“企业知识库产品最近一个月的使用情况”),其中,为了便于用户观看,可以将该文字输入框显示于数据可视化图表的临近处(上方或下方均可)。
S202、响应用户向所述文字输入框中输入的自然语言文字,若所述文字输入框中存在的修改后的完整自然语言语句符合某一预设语言策略,将所述修改后的完整自然语言语句确定为新的自然语言查询语句,并将所述修改后的完整自然语言语句所符合的预设语言策略作为新的目标语言策略。
用户对文字输入框中的内容的修改并不会改变文字输入区域中的自然语言查询语句,而若文字输入区域中的自然语言查询语句发生了改变则会改变文字输入框中的内容。例如,文字输入区域中本来存在自然语言查询语句a,那么若将文字输入框中包含的自然语言查询语句a改为了自然语言查询语句b(也可以是改为不带有查询意图的普通的完整自然语言语句,那么则不会对数据可视化图表产生影响),并不会改变自然语言查询语句a;而若文字输入区域中本来存在的自然语言查询语句a变为了自然语言查询语句b,那么文字输入框中也会由包含自然语言查询语句a变为包含自然语言查询语句b。
若文字输入框中当前存在的修改后的完整自然语言语句为带有查询意图的自然语言语句的话,则将修改后的完整自然语言语句作为新的自然语言查询语句。
S203、根据所述新的目标语言策略,对所述新的自然语言查询语句进行解析,得到所述新的自然语言查询语句对应的新的标准查询语句。
S204、根据所述新的标准查询语句,从所述联合数据源中获取新的数据查询结果。
S205、根据所述新的数据查询结果,生成新的数据可视化图表。
S206、将当前的数据可视化图表替换为所述新的数据可视化图表。
结合步骤S201~S206,根据新的自然语言查询语句最终得到新的数据可视化图表后,用新的数据可视化替换掉当前的数据可视化图表。
在一种可能的实施方式中,参照图3所示,为本申请实施例提供的另一种信息处理方法的流程图,所述方法还包括:
S301、将当前的标准查询语句中包括的查询信息显示于所述当前界面的侧边栏中,其中,所述查询信息包括以下至少一者:查询字段,标准查询语句语法。
例如,某一自然语言查询语句为“企业知识库产品最近一个月的使用情况”,其对应的标准查询语句中包括的查询字段有“产品”、“操作时间”、“浏览”、“下载”、“收获”,对应的语法为计数(count),这样,能够更加直观的使用户得知当前所查询到的数据具体涉及到了哪些数据库中的查询字段或语法。
S302、响应用户针对所述查询信息的修改,对当前的标准查询语句进行相应的修改,得到修改后的标准查询语句。
用户可以直接针对查询字段进行修改,例如,删除查询字段中的“收获”字段,只保留“浏览”字段和“下载”字段,这样标准查询语句中的“收获”字段也被删除,得到的数据查询结果仅针对“浏览”字段和“下载”字段中对应的数据进行了计数。这里,对查询字段的修改并不会改变文字输入区域中其对应的自然语言查询语句“企业知识库产品最近一个月的使用情况”,也不会改变文字输入框中的文字。
S303、根据所述修改后的标准查询语句,从所述联合数据源中获取修改后的数据查询结果。
S304、根据所述修改后的数据查询结果,获取修改后的数据可视化图表。
S305、将当前的数据可视化图表替换为所述修改后的数据可视化图表。
结合步骤S303~S305,在对标准查询语句进行相应修改后,利用最终得到的修改后的数据可视化图表替换掉当前的数据可视化图表。
在一种可能的实施方式中,参照图4所示,为本申请实施例提供的另一种信息处理方法的流程图,判断所述完整自然语言语句是否符合某一预设语言策略,包括:
S401、针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句。
利用预先训练好的实体语句识别模型,识别出每一完整自然语言语句中包括的每一实体词。以完整自然语言语句“企业知识库产品最近一个月的使用情况”为例,其中,“企业知识库产品”为一个实体词,其对应的实体词类型(即目标类型的填充词,其包括但不限于:产品、客户、姓名、时间、地址、部门、数量等等,用户可根据公司业务关注的实体类型和数据类别来定义或调整实体词类型,并相应建立或调整各种不同的预设语言策略;每个实体词都存在其对应的实体词类型,例如,“张三”会被判定为实体词,其对应的实体词类型为“姓名”;“品牌手机”会被判定为实体词,其对应的实体词类型为“产品”)为“产品”,“一个月”为另一个实体词,其对应的实体词类型为“时间”,那么,将“企业知识库产品最近一个月的使用情况”中的“企业知识库产品”替换为“产品”,将“一个月”替换为“时间”,得到替换后的完整自然语言语句“产品最近时间的使用情况”。
S402、对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略。
按步骤S401中所述的,若存在某一预设语言策略为“产品最近时间的使用情况”(即与替换后的完整自然语言语句相同),那么该预设语言策略即为完整自然语言语句所符合的预设语言策略,该完整自然语言语句“企业知识库产品最近一个月的使用情况”被确定为带有查询意图的自然语言查询语句。
在一种可能的实施方式中,参照图5所示,为本申请实施例提供的另一种信息处理方法的流程图,若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述方法还包括:
S501、计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度。
S502、若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
结合步骤S501~S502,例如,某一完整自然语言语句为“最近一个月企业知识库产品的使用情况”,替换后的完整自然语言语句即为“最近时间产品的使用情况”,且任一预设语言策略均不与该替换后的完整自然语言语句相同,那么,计算替换后的完整自然语言语句“最近时间产品的使用情况”与每一预设语言策略之间的语义相似度。若其与预设语言策略“产品最近时间的使用情况”的语义相似度最高(假设为95%,预设阈值为80%),那么预设语言策略“产品最近时间的使用情况”即为完整自然语言语句“最近一个月企业知识库产品的使用情况”所符合的预设语言策略。
在一种可能的实施方式中,参照图6所示,为本申请实施例提供的另一种信息处理方法的流程图,所述根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句,包括:
S601、根据所述目标语言策略,确定与所述自然语言查询语句匹配的标准查询语句模板,其中,所述标准查询语句模板中包括:所述目标语言策略对应的查询字段、所述目标语言策略对应的查询数据表和所述目标语言策略对应的标准查询语句语法。
每个预设语言策略绑定有其对应的标准查询语句模板,模板中相应的位置上包括绑定的数据库中的查询字段,绑定的查询数据表(这里可以是单个数据表,也可以是由多个数据表组合而成的一个数据表),以及对应的结构化的查询语句语法(支持的标准查询语句语法包括计数、求和、求最大值、求最小值、求平均值、求占比、求同比、求环比等等)。
例如,以自然语言查询语句“企业知识库产品最近一个月的使用情况”为例,其符合的预设语言策略(即目标语言策略)为“产品最近时间的使用情况”,该目标语言策略对应的数据库中的查询字段(即标准查询语句中包括的查询字段)有“产品”、“操作时间”、“下载”、“浏览”、“收获”,对应的查询数据表为“用户日志信息表”,对应的语法为“计数”。
S602、对于所述自然语言查询语句中包括的每一实体词,将该实体词填入所述标准查询语句模板中对应的位置上,得到所述标准查询语句。
对于自然语言查询语句中包括的每一实体词,若在标准查询语句模板中存在与该实体词对应的位置的话,则将该实体词填入其对应的位置上。
在一种可能的实施方式中,所述数据可视化图表是可编辑的。
用户可以对数据可视化图表中进行诸如更改数据可视化图表中的横纵坐标名称,数据可视化图表中的横纵坐标的单位,数据可视化图表中某一个或某几个点的横纵坐标(若为折线图)数值等等。
在一种可能的实施方式中,参照图7所示,为本申请实施例提供的另一种信息处理方法的流程图,所述方法还包括:
S701、若检测到所述标准查询语句中包括的查询数据表中的数据发生了变动,且所述数据可视化图表未被编辑过,则根据所述标准查询语句,从发生了数据变动的联合数据源中获取新的数据查询结果。
S702、根据所述新的数据查询结果,生成新的数据可视化图表。
S703、将当前的数据可视化图表替换为所述新的数据可视化图表。
结合步骤S701~S703,在本申请实施例中,在未对数据可视化图表进行编辑的情况下,数据可视化图表会随着联合数据源中其对应的数据表的变化而进行实时更新。
例如,联合数据源中包括10个数据表,数据可视化图表A是根据第一个数据表中的数据得到的,这样,如果联合数据源中的第一个数据表中的数据发生了改变,那么根据标准查询语句重新进行查询以得到新的数据可视化图表,并用新的数据可视化图表替换掉当前的可视化图表;而若第一个数据表中的数据未发生变动,而是其他9个数据表中的某一个或某几个数据表中的数据发生了改变,那么不重新根据标准查询语句进行查询。
在现有的方式中,如果用户想要获取最新的数据查询结果,需要重新输入标准查询语句对数据库进行查询。通过本申请的方式,无需用户重复进行查询,特别是在已识别出的自然语言查询语句较多时,大幅减少了用户的操作量,并且提升了数据的实时性以及可靠性。
在一种可能的实施方式中,所述方法还包括:
对所述自然语言查询语句和所述数据可视化图表使用相对应的方式进行标记。
在文字输入区域中存在多个自然语言查询语句(即也存在多个数据可视化图表)时,为了便于用户进行区分,对自然语言查询语句和其对应的数据可视化图表采用相对应的进行标记(同一自然语言查询语句与其对应的数据可视化图表携带的标记相同,不同的自然语言查询语句携带的标记不同),其中,标记可以是在自然语言查询语句和其对应的数据可视化图表的临近处打上星号等标识,也可以是加深背景色,用户可以根据个人偏好对标记的类型进行设置。
例如,存在三个自然语言查询语句(自然语言查询语句1、自然语言查询语句2、自然语言查询语句3),对自然语言查询语句1和其对应的数据可视化图表1用浅蓝色背景色标记,对自然语言查询语句2和其对应的数据可视化图表2用黄色背景色标记,对自然语言查询语句3和其对应的数据可视化图表3用绿色背景色进行标记。
在一种可能的实施方式中,参照图8所示,为本申请实施例提供的另一种信息处理方法的流程图,所述方法还包括:
S801、根据所述目标语言策略,确定对应的总结报告模板。
S802、根据所述数据可视化图表的内容,生成对应的总结语句。
S803、对于每一所述总结语句,将该总结语句填入所述总结报告模板中对应的位置上,生成数据总结报告。
结合步骤S801~S803,每个预设语言策略绑定有对应的总结报告模板,在得到数据可视化图表后,还可以对数据可视化图表的内容进行解析,自动生成数据总结报告,无需用户自行总结,只需在其基础上进行微调,节省了用户的撰写时间。
S804、将所述数据总结报告存储于预先指定的文本中。
在具体实施中,文本可以是预先创建好的,也可以在存储时创建新的文本以进行存储,以及,用户可以对文本中已经存在的数据总结报告进行编辑、复制、剪切等操作。
在一种可能的实施方式中,参照图9所示,为本申请实施例提供的另一种信息处理方法的流程图,所述根据所述数据查询结果,生成数据可视化图表,包括:
S901、根据所述目标语言策略,确定数据可视化图表的图表类型。
每一预设语言策略绑定有其对应的数据可视化图表类型,在具体实施中,支持的数据可视化图表的类型包括但不限于:统计数、折线图、条形图、饼图、图分析、词云、明细等等。
S902、根据所述数据查询结果,生成所述图表类型下的所述数据可视化图表。
例如,若某一自然语言查询语言语句为“企业知识库产品最近一个月的使用情况”,其对应的(即其目标语言策略对应的)数据可视化图表类型为折线图,因此,生成折线图类型下的数据可视化图表。
若另一自然语言查询语句为“企业知识库产品的占比情况”,则其对应的图表类型为饼图。此外,每一预设语言策略所绑定的数据可视化图表类型也可以人为进行修改。
在一种可能的实施方式中,参照图10所示,为本申请实施例提供的另一种信息处理方法的流程图,所述方法还包括:
S1001、响应用户的选择操作,确定所述选择操作在所述当前界面的文字输入区域中所选定的粘贴位置。
S1002、响应用户针对所述复制对象的粘贴操作,将所述复制对象粘贴至所述粘贴位置。
结合步骤S1001~S1002,在对数据可视化图表进行复制后,在文字输入区域中选定要进行粘贴的位置(例如就在其对应的自然语言查询语句之后的位置)后进行粘贴。
本申请实施例提供的一种信息处理方法,能够实时对用户当前输入的自然语言文字所构成的完整短句进行识别,若识别出该完整短句为具有查询意图的语句,则将其解析成数据库能够识别的标准查询语言,并以数据可视化图表的形式直观展示数据查询结果,这样,用户无需掌握数据查询编程语言,也无需依赖查询数据编程的专业技术人员,普通人的查询需求大都可以满足,大幅降低了使用门槛,提高了工作效率,降低了时间成本。基于同一发明构思,本申请实施例中还提供了与信息处理方法对应的信息处理装置,由于本申请实施例中的信息处理装置解决问题的原理与本申请实施例上述信息处理方法相似,因此信息处理装置的实施可以参见信息处理方法的实施,重复之处不再赘述。
参照图11所示,为本申请实施例提供的一种信息处理装置示意图,所述装置包括:
第一响应模块1101,用于响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略;
解析模块1102,用于根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句;
查询模块1103,用于根据所述标准查询语句,从联合数据源中获取数据查询结果;
图表生成模块1104,用于根据所述数据查询结果,生成数据可视化图表;
显示模块1105,用于将所述数据可视化图表显示于当前界面的侧边栏中。
在一种可能的实施方式中,所述文字输入区域包括:文档中的文字输入区域,会话文本中的文字输入区域。
在一种可能的实施方式中,所述装置还包括:
第二响应模块,用于响应用户针对所述数据可视化图表的复制操作,以将所述数据可视化图表作为复制对象。
在一种可能的实施方式中,所述装置还包括:
所述显示模块1105,还用于将包含所述自然语言查询语句的文字输入框显示于所述当前界面的侧边栏中;
第三响应模块,用于响应用户向所述文字输入框中输入的自然语言文字,若所述文字输入框中存在的修改后的完整自然语言语句符合某一预设语言策略,将所述修改后的完整自然语言语句确定为新的自然语言查询语句,并将所述修改后的完整自然语言语句所符合的预设语言策略作为新的目标语言策略;
所述解析模块1102,还用于根据所述新的目标语言策略,对所述新的自然语言查询语句进行解析,得到所述新的自然语言查询语句对应的新的标准查询语句;
所述查询模块1103,还用于根据所述新的标准查询语句,从所述联合数据源中获取新的数据查询结果;
所述图表生成模块1104,还用于根据所述新的数据查询结果,生成新的数据可视化图表;
第一更新模块,用于将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
所述显示模块1105,还用于将当前的标准查询语句中包括的查询信息显示于所述当前界面的侧边栏中,其中,所述查询信息包括以下至少一者:查询字段,标准查询语句语法;
第四响应模块,用于响应用户针对所述查询信息的修改,对当前的标准查询语句进行相应的修改,得到修改后的标准查询语句;
所述查询模块1103,还用于根据所述修改后的标准查询语句,从所述联合数据源中获取修改后的数据查询结果;
所述图表生成模块1104,还用于根据所述修改后的数据查询结果,获取修改后的数据可视化图表;
第二更新模块,用于将当前的数据可视化图表替换为所述修改后的数据可视化图表。
在一种可能的实施方式中,所述第一响应模块1101在判断所述完整自然语言语句是否符合某一预设语言策略时,具体用于:
针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句;对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略。
在一种可能的实施方式中,若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述第一响应模块1101,还用于:
计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度;若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
在一种可能的实施方式中,所述解析模块1102,具体用于:
根据所述目标语言策略,确定与所述自然语言查询语句匹配的标准查询语句模板,其中,所述标准查询语句模板中包括:所述目标语言策略对应的查询字段、所述目标语言策略对应的查询数据表和所述目标语言策略对应的标准查询语句语法;对于所述自然语言查询语句中包括的每一实体词,将该实体词填入所述标准查询语句模板中对应的位置上,得到所述标准查询语句。
在一种可能的实施方式中,所述数据可视化图表是可编辑的。
在一种可能的实施方式中,所述装置还包括:
检测模块,用于若检测到所述标准查询语句中包括的查询数据表中的数据发生了变动,且所述数据可视化图表未被编辑过,则根据所述标准查询语句,从发生了数据变动的联合数据源中获取新的数据查询结果;
所述图表生成模块1104,还用于根据所述新的数据查询结果,生成新的数据可视化图表;
第三更新模块,用于将当前的数据可视化图表替换为所述新的数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
标记模块,用于对所述自然语言查询语句和所述数据可视化图表使用相对应的方式进行标记。
在一种可能的实施方式中,所述装置还包括:
报告生成模块,用于根据所述目标语言策略,确定对应的总结报告模板;根据所述数据可视化图表的内容,生成对应的总结语句;对于每一所述总结语句,将该总结语句填入所述总结报告模板中对应的位置上,生成数据总结报告;
存储模块,用于将所述数据总结报告存储于预先指定的文本中。
在一种可能的实施方式中,所述图表生成模块,具体用于:
根据所述目标语言策略,确定数据可视化图表的图表类型;根据所述数据查询结果,生成所述图表类型下的所述数据可视化图表。
在一种可能的实施方式中,所述装置还包括:
第五响应模块,用于响应用户的选择操作,确定所述选择操作在所述当前界面的文字输入区域中所选定的粘贴位置;
第六响应模块,用于响应用户针对所述复制对象的粘贴操作,将所述复制对象粘贴至所述粘贴位置。
本申请实施例提供的一种信息处理装置,能够实时对用户当前输入的自然语言文字所构成的完整短句进行识别,若识别出该完整短句为具有查询意图的语句,则将其解析成数据库能够识别的标准查询语言,并以数据可视化图表的形式直观展示数据查询结果,这样,用户无需掌握数据查询编程语言,也无需依赖查询数据编程的专业技术人员,普通人的查询需求大都可以满足,大幅降低了使用门槛,提高了工作效率,降低了时间成本。
参照图12所示,本申请实施例提供的一种电子设备1200,包括:处理器1201、存储器1202和总线,所述存储器1202存储有所述处理器1201可执行的机器可读指令,当电子设备运行时,所述处理器1201与所述存储器1202之间通过总线通信,所述处理器1201执行所述机器可读指令,以执行如上述信息处理方法的步骤。
具体地,上述存储器1202和处理器1201能够为通用的存储器和处理器,这里不做具体限定,当处理器1201运行存储器1202存储的计算机程序时,能够执行上述信息处理方法。
对应于上述方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述信息处理方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (15)
1.一种信息处理方法,其特征在于,所述方法包括:
响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略;
根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句;
根据所述标准查询语句,从联合数据源中获取数据查询结果;
根据所述数据查询结果,生成数据可视化图表;
将所述数据可视化图表显示于当前界面的侧边栏中;
判断所述完整自然语言语句是否符合某一预设语言策略,包括:
针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句;
对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略;
若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述方法还包括:
计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度;
若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
2.根据权利要求1所述的信息处理方法,其特征在于,所述文字输入区域包括:文档中的文字输入区域,会话文本中的文字输入区域。
3.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
响应用户针对所述数据可视化图表的复制操作,以将所述数据可视化图表作为复制对象。
4.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
将包含所述自然语言查询语句的文字输入框显示于所述当前界面的侧边栏中;
响应用户向所述文字输入框中输入的自然语言文字,若所述文字输入框中存在的修改后的完整自然语言语句符合某一预设语言策略,将所述修改后的完整自然语言语句确定为新的自然语言查询语句,并将所述修改后的完整自然语言语句所符合的预设语言策略作为新的目标语言策略;
根据所述新的目标语言策略,对所述新的自然语言查询语句进行解析,得到所述新的自然语言查询语句对应的新的标准查询语句;
根据所述新的标准查询语句,从所述联合数据源中获取新的数据查询结果;
根据所述新的数据查询结果,生成新的数据可视化图表;
将当前的数据可视化图表替换为所述新的数据可视化图表。
5.根据权利要求4所述的信息处理方法,其特征在于,所述方法还包括:
将当前的标准查询语句中包括的查询信息显示于所述当前界面的侧边栏中,其中,所述查询信息包括以下至少一者:查询字段,标准查询语句语法;
响应用户针对所述查询信息的修改,对当前的标准查询语句进行相应的修改,得到修改后的标准查询语句;
根据所述修改后的标准查询语句,从所述联合数据源中获取修改后的数据查询结果;
根据所述修改后的数据查询结果,获取修改后的数据可视化图表;
将当前的数据可视化图表替换为所述修改后的数据可视化图表。
6.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句,包括:
根据所述目标语言策略,确定与所述自然语言查询语句匹配的标准查询语句模板,其中,所述标准查询语句模板中包括:所述目标语言策略对应的查询字段、所述目标语言策略对应的查询数据表和所述目标语言策略对应的标准查询语句语法;
对于所述自然语言查询语句中包括的每一实体词,将该实体词填入所述标准查询语句模板中对应的位置上,得到所述标准查询语句。
7.根据权利要求1所述的信息处理方法,其特征在于,所述数据可视化图表是可编辑的。
8.根据权利要求7所述的信息处理方法,其特征在于,所述方法还包括:
若检测到所述标准查询语句中包括的查询数据表中的数据发生了变动,且所述数据可视化图表未被编辑过,则根据所述标准查询语句,从发生了数据变动的联合数据源中获取新的数据查询结果;
根据所述新的数据查询结果,生成新的数据可视化图表;
将当前的数据可视化图表替换为所述新的数据可视化图表。
9.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
对所述自然语言查询语句和所述数据可视化图表使用相对应的方式进行标记。
10.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
根据所述目标语言策略,确定对应的总结报告模板;
根据所述数据可视化图表的内容,生成对应的总结语句;
对于每一所述总结语句,将该总结语句填入所述总结报告模板中对应的位置上,生成数据总结报告;
将所述数据总结报告存储于预先指定的文本中。
11.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述数据查询结果,生成数据可视化图表,包括:
根据所述目标语言策略,确定数据可视化图表的图表类型;
根据所述数据查询结果,生成所述图表类型下的所述数据可视化图表。
12.根据权利要求3所述的信息处理方法,其特征在于,所述方法还包括:
响应用户的选择操作,确定所述选择操作在所述当前界面的文字输入区域中所选定的粘贴位置;
响应用户针对所述复制对象的粘贴操作,将所述复制对象粘贴至所述粘贴位置。
13.一种信息处理装置,其特征在于,所述装置包括:
第一响应模块,用于响应用户向当前界面的文字输入区域输入的自然语言文字,若用户当前输入的自然语言文字所构成的完整自然语言语句符合某一预设语言策略,则确定所述完整自然语言语句为带有查询意图的自然语言查询语句,并将所述完整自然语言语句所符合的预设语言策略作为目标语言策略;
解析模块,用于根据所述目标语言策略,对所述自然语言查询语句进行解析,得到所述自然语言查询语句对应的标准查询语句;
查询模块,用于根据所述标准查询语句,从联合数据源中获取数据查询结果;
图表生成模块,用于根据所述数据查询结果,生成数据可视化图表;
显示模块,用于将所述数据可视化图表显示于当前界面的侧边栏中;
所述第一响应模块在判断所述完整自然语言语句是否符合某一预设语言策略时,具体用于:
针对所述完整自然语言语句中的每个实体词,根据该实体词的目标类型,使用所述目标类型所对应的填充词替换该实体词,以得到替换后的完整自然语言语句;对于每一所述预设语言策略,若所述替换后的完整自然语言语句与该预设语言策略相同,则判定所述完整自然语言语句符合该预设语言策略;
若所述替换后的完整自然语言语句与任一预设语言策略均不相同,所述第一响应模块,还用于:
计算所述替换后的完整自然语言语句与每一所述预设语言策略之间的语义相似度;若存在至少一个与所述替换后的完整自然语言语句的语义相似度大于预设阈值的预设语言策略,则将其中语义相似度最高的预设语言策略判定为所述完整自然语言语句所符合的预设语言策略。
14.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至12任一项所述的信息处理方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至12任一项所述的信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111090318.XA CN113535931B (zh) | 2021-09-17 | 2021-09-17 | 一种信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111090318.XA CN113535931B (zh) | 2021-09-17 | 2021-09-17 | 一种信息处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113535931A CN113535931A (zh) | 2021-10-22 |
CN113535931B true CN113535931B (zh) | 2021-12-28 |
Family
ID=78093353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111090318.XA Active CN113535931B (zh) | 2021-09-17 | 2021-09-17 | 一种信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113535931B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114201602B (zh) * | 2022-02-15 | 2022-05-06 | 支付宝(杭州)信息技术有限公司 | 为可视化数据分析生成自然语言语句的方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795528A (zh) * | 2019-09-05 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170308571A1 (en) * | 2016-04-20 | 2017-10-26 | Google Inc. | Techniques for utilizing a natural language interface to perform data analysis and retrieval |
CN112800201B (zh) * | 2021-01-28 | 2023-06-09 | 杭州汇数智通科技有限公司 | 自然语言的处理方法、装置及电子设备 |
CN113051362B (zh) * | 2021-03-18 | 2024-03-22 | 中国工商银行股份有限公司 | 数据的查询方法、装置和服务器 |
CN112989011B (zh) * | 2021-04-26 | 2021-08-24 | 广州思迈特软件有限公司 | 数据查询方法、数据查询装置和电子设备 |
CN112989010A (zh) * | 2021-04-26 | 2021-06-18 | 广州思迈特软件有限公司 | 数据查询方法、数据查询装置和电子设备 |
CN112989145B (zh) * | 2021-05-11 | 2021-12-14 | 浙江大华技术股份有限公司 | 查询语句生成方法、装置、系统及计算机可读存储介质 |
-
2021
- 2021-09-17 CN CN202111090318.XA patent/CN113535931B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795528A (zh) * | 2019-09-05 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113535931A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021042521A1 (zh) | 一种合同自动生成方法、计算机设备及计算机非易失性存储介质 | |
CN106020950B (zh) | 基于复杂网络分析的函数调用图关键节点识别和标识方法 | |
US9977672B2 (en) | Attributing authorship to segments of source code | |
US8738415B2 (en) | Automated workflow assignment to print jobs | |
CN110738037B (zh) | 用于自动生成电子表格的方法、装置、设备及存储介质 | |
US8065267B2 (en) | Information processing device, file data merging method, file naming method, and file data output method | |
DE112016003626T5 (de) | Natürlichsprachliche Schnittstelle zu Datenbanken | |
CN104035772A (zh) | 基于静态分析的源码多版本函数调用关系差异性标识方法 | |
CN109145047A (zh) | 用户标签画像的配置方法、数据处理装置及存储介质 | |
CN113535931B (zh) | 一种信息处理方法、装置、电子设备及存储介质 | |
CN115576974B (zh) | 数据处理方法、装置、设备和介质 | |
CN110362596A (zh) | 一种文本抽取信息结构化数据处理的控制方法及装置 | |
CN114064851A (zh) | 一种政府办公文档多机检索方法及系统 | |
WO2023125032A1 (zh) | 基于数据快照的科研数据变动回顾方法及服务器 | |
CN114510611A (zh) | 一种构建元数据血缘图谱的方法、装置及相关设备 | |
CN107832447A (zh) | 用于移动终端的用户反馈纠错方法、装置及其设备 | |
CN114547077A (zh) | 基层政务表格数据智能处理系统及方法 | |
CN107493370B (zh) | 流量模板确定方法、流量信息识别方法及装置 | |
US20180018315A1 (en) | Information processing device, program, and information processing method | |
US10360302B2 (en) | Visual comparison of documents using latent semantic differences | |
CN103020035A (zh) | Faq制作辅助系统 | |
CN112230900A (zh) | 一种自定义设置表单模型的开发引擎系统及方法 | |
CN103677852A (zh) | 一种可扩充的类自然语言公式编辑器的设计方法 | |
CN108196921B (zh) | 单据开发方法、装置、计算机设备和存储介质 | |
CN113383312A (zh) | 在数据可视化用户界面中分析自然语言表达 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |