CN117216146A - 一种基于人工智能的数据分析及展现系统 - Google Patents

一种基于人工智能的数据分析及展现系统 Download PDF

Info

Publication number
CN117216146A
CN117216146A CN202311304975.9A CN202311304975A CN117216146A CN 117216146 A CN117216146 A CN 117216146A CN 202311304975 A CN202311304975 A CN 202311304975A CN 117216146 A CN117216146 A CN 117216146A
Authority
CN
China
Prior art keywords
report
field
data
historical
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311304975.9A
Other languages
English (en)
Other versions
CN117216146B (zh
Inventor
孙伟
沈峥
何慕蓉
凌光明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Red Sea Cloud Computing Ltd
Original Assignee
Guangzhou Red Sea Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Red Sea Cloud Computing Ltd filed Critical Guangzhou Red Sea Cloud Computing Ltd
Priority to CN202311304975.9A priority Critical patent/CN117216146B/zh
Publication of CN117216146A publication Critical patent/CN117216146A/zh
Application granted granted Critical
Publication of CN117216146B publication Critical patent/CN117216146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的数据分析及展现系统,该基于人工智能的数据分析及展现系统包括获取模块、匹配模块、演算模块和展示模块,能够根据用户实时选定的报表类型来预加载出多个报表模板,再根据用户的操作记录中的后撤操作以及报表模板的历史数据来确定用户选择的字段的展示候选数据,以向用户展示。可见,本发明能够实现更加智能化的BI报表分析,极大提高了用户使用BI报表的效率,可以有效减少出错,提高报表管理效果。

Description

一种基于人工智能的数据分析及展现系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于人工智能的数据分析及展现系统。
背景技术
随着企业的数字化程度的提高和数据人事管理意识的普及,越来越多的企业开始采用BI报表的形式来管理企业的数据,数据量也在不断地增大,这对企业的工作人员处理BI报表的效率提出了更高的要求。但现有技术在为企业的工作人员提供BI报表的设置或管理的服务时,仍然没有考虑到工作人员的历史操作记录来做相应的调整,其中后撤操作是工作人员的操作中较为值得注意的一种操作,其一般可以是工作人员撤回或删除后重新输入原来输入的数据,或是选择了特定字段的类型后又变更,其象征着工作人员在上一步操作中犯了错误,对系统或当前报表的业务或数据不熟悉,因此有效识别这些后撤操作,并以此来提高工作人员的BI报表任务的处理效率,至关重要。但现有技术尚未有效解决这一问题,因此存在缺陷,亟待改进。
发明内容
本发明所要解决的技术问题在于,提供一种基于人工智能的数据分析及展现系统,能够实现更加智能化的BI报表分析,极大提高了用户使用BI报表的效率,可以有效减少出错,提高报表管理效果。
为了解决上述技术问题,本发明第一方面公开了一种基于人工智能的数据分析及展现系统,所述系统包括:
获取模块,用于获取目标用户的新建BI报表操作对应的报表类型,和获取所述目标用户对应的历史操作记录;所述历史操作记录中包括所述目标用户在历史时间段的多个历史操作;
匹配模块,用于根据所述报表类型和所述历史操作记录,在预设的历史报表数据库中确定出多个报表模板和对应的模板历史数据;所述多个报表模板用于展示给所述目标用户以供选择;
演算模块,用于确定所述历史操作记录中的所有后撤操作,基于神经网络算法,从所述模板历史数据中匹配出每一所述后撤操作对应的模板字段历史数据;
展示模块,用于在所述目标用户选择报表字段时,根据所述报表字段对应的所述模板字段历史数据和所述后撤操作,确定用于展示的候选字段历史数据。
在一个可选的实施方式中,所述匹配模块具体用于执行以下步骤:
根据所述报表类型,在所述历史报表数据库中确定出所述报表类型对应的多个历史报表;
对于每一所述历史报表,计算该历史报表与所述历史操作记录之间的匹配度参数,计算该历史报表相对于其他所述历史报表的独一性参数;
计算所述匹配度参数和所述独一性参数的加权求和值,得到该历史报表对应的优先级参数;
根据所述优先级参数从大到小对所有所述历史报表进行排序以得到报表序列,将所述报表序列中前预设数量个的且所述优先级参数大于预设的第一参数阈值的所有历史报表,确定为候选报表;
根据所有所述候选报表,确定出多个报表模板;
将每一所述报表模板对应的所有所述候选报表确定为该报表模板对应的模板历史数据。
在一个可选的实施方式中,所述匹配模块计算该历史报表相对于其他所述历史报表的独一性参数的具体方式包括:
计算该历史报表与任一其他历史报表之间的相似度参数;
计算该历史报表与所有其他历史报表之间的所述相似度参数的加权求和平均值,以得到该历史报表对应的独一性参数;其中,每一所述相似度参数对应的权重包括第一权重和第二权重;所述第一权重与对应的其他历史报表的报表数据量成正比;所述第二权重与对应的其他历史报表对应的报表完整度参数成正比;所述报表完整度参数的计算方式包括:
计算历史报表中的字段值为空值或预设的无意义值的字段占所有字段总数量的比值,得到历史报表对应的空字段比值参数;
将历史报表中的所有字段包含在同一页面中以输出对应的页面图像;
计算该页面图像占所有像素的比值最大的像素颜色对应的比值,得到历史报表对应的图像空缺参数;
计算所述空字段比值参数和所述图像空缺参数的加权求和平均值,得到历史报表对应的报表完整度参数。
在一个可选的实施方式中,所述匹配模块根据所有所述候选报表,确定出多个报表模板的具体方式,包括:
计算任意两个所述候选报表之间的报表相似度;
根据所述报表相似度,对所有所述候选报表进行聚类划分,以得到多个候选报表集合;每一所述候选报表集合中的任意两个候选报表之间的所述报表相似度大于预设的相似度阈值;
对于任一所述候选报表集合,计算该候选报表集合中的任一候选报表中的任一字段在该候选报表集合中的所有候选报表中的出现次数;
根据所述出现次数从大到小,对该候选报表集合中的所有所述字段进行排序,得到字段序列;
将所述字段序列中前第二数量个的且所述出现次数与最高出现次数之间的比值大于预设的比值阈值的所有字段,确定为该候选报表集合对应的报表模板;所述最高出现次数为所有所述字段的所述出现次数中的最高值。
在一个可选的实施方式中,所述演算模块用于具体执行以下步骤:
基于预设的后撤操作规则,对所述历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作;
获取每一所述后撤操作对应的操作字段数据和操作页面位置;
对于任一所述模板历史数据中的任一模板字段历史数据,获取该模板字段历史数据对应的历史字段数据和历史显示位置;
将任一所述后撤操作对应的操作字段数据和操作页面位置,与任一所述模板字段数据对应的历史字段数据和历史显示位置,输入至训练好的BI相似度预测神经网络模型中,以得到该后撤操作和该模板字段数据之间的关联度参数;所述BI 相似度预测神经网络模型通过包括有多个训练操作参数和训练字段数据以及对应的关联度参数标注的数据训练集训练得到;
在所有所述关联度参数大于预设的第二参数阈值的所述后撤操作和所述模板字段数据之间建立起对应关系。
在一个可选的实施方式中,所述演算模块基于预设的后撤操作规则,对所述历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作的具体方式包括:
根据所述历史操作记录,以及神经网络算法,确定所述目标用户对应的熟悉度水平参数;
对于所述历史操作记录中的任一所述历史操作,计算该历史操作与预设的后撤操作类型规则的第一匹配度;所述后撤操作类型规则用于限定属于后撤操作的操作类型;
将该历史操作与其对应的任一相邻操作组成至少一个操作组,计算所有所述操作组与预设的组合后撤操作类型规则的匹配度的平均值,得到第二匹配度;所述组合后撤操作类型规则用于限定与后撤操作相关的多个操作的类型组合;
计算所述第一匹配度和所述第二匹配度的匹配度平均值;
计算所述匹配度平均值与所述熟悉度水平参数的乘积,得到该历史操作对应的后撤可能性参数;
根据所述后撤可能性参数从大到小对所有所述历史操作进行排序得到操作序列,并将所述操作序列中前第三数量个的且所述后撤可能性参数大于第三参数阈值的所有历史操作,确定为后撤操作。
在一个可选的实施方式中,所述演算模块根据所述历史操作记录,以及神经网络算法,确定所述目标用户对应的熟悉度水平参数的具体方式包括:
将所述历史操作记录,输入至训练好的熟悉度预测神经网络模型,以得到所述目标用户对应的熟悉度水平参数;所述熟悉度预测神经网络模型通过包括有多个训练用户操作记录和对应的用户熟悉度标注的训练数据集进行训练;其中,所述用户熟悉度标注是由人工基于熟悉度标注规则对所述训练用户操作记录进行标注得到;所述熟悉度标注规则中包括针对用户操作记录中不同的操作频次、不同后撤操作占比和用户本身的不同系统操作时长对应的熟悉度量化规则。
在一个可选的实施方式中,所述展示模块具体用于执行以下步骤:
响应于所述目标用户选择报表字段的操作,确定所述目标用户选择的目标报表字段;
根据所述目标报表字段,在所有所述模板字段历史数据中确定出字段相匹配的多个字段历史数据,得到多个匹配字段历史数据;
对于任一所述匹配字段历史数据,根据该匹配字段历史数据对应的所有所述后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数;
根据所述字段优先级参数,从所述多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据;
根据所述字段优先级参数从大到小对所有所述候选字段历史数据进行排序,得到第一数据序列;
在展示所述多个候选字段历史数据时,根据所述第一数据序列进行展示。
在一个可选的实施方式中,所述展示模块根据该匹配字段历史数据对应的所有所述后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数的具体方式包括:
计算该匹配字段历史数据对应的所有所述后撤操作的操作总数量;
计算该匹配字段历史数据对应的数据时间参数与当前时间点之间的数据时间差;
计算该匹配字段历史数据在多个历史时间点的展示次序的次序平均值;
计算所述操作总数量、所述数据时间差和所述次序平均值的加权求和值,得到该匹配字段历史数据对应的字段优先级参数。
在一个可选的实施方式中,所述展示模块根据所述字段优先级参数,从所述多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据的具体方式包括:
根据所述字段优先级参数从大到小对所有所述匹配字段历史数据进行排序,得到第二数据序列;
将所述第二数据序列中前第四数量个的且所述字段优先级参数大于预设的第四参数阈值的所有匹配字段历史数据,确定为用于展示的多个候选字段历史数据。
与现有技术相比,本发明具有以下有益效果:
本发明能够根据用户实时选定的报表类型来预加载出多个报表模板,再根据用户的操作记录中的后撤操作以及报表模板的历史数据来确定用户选择的字段的展示候选数据,以向用户展示,从而能够实现更加智能化的BI报表分析,极大提高了用户使用BI报表的效率,可以有效减少出错,提高报表管理效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于人工智能的数据分析及展现系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或端没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
具体的,请参阅图1,图1是本发明实施例公开的一种基于人工智能的数据分析及展现系统的结构示意图。如图1所示,该基于人工智能的数据分析及展现系统至少包括获取模块101、匹配模块102、演算模块103和展示模块104。
具体的,获取模块101用于获取目标用户的新建BI报表操作对应的报表类型,和获取目标用户对应的历史操作记录。
具体的,历史操作记录中包括目标用户在历史时间段的多个历史操作。具体的,历史操作的类型可以包括点击操作、输入操作、修改操作或删除操作。
具体的,匹配模块102用于根据报表类型和历史操作记录,在预设的历史报表数据库中确定出多个报表模板和对应的模板历史数据。
其中具体的,多个报表模板用于展示给目标用户以供选择,用户可以在选择了他认为满意或符合要求的模板后进行下一步的具体的字段的设置。
具体的,演算模块103用于确定历史操作记录中的所有后撤操作,基于神经网络算法,从模板历史数据中匹配出每一后撤操作对应的模板字段历史数据。
具体的,展示模块104用于在目标用户选择报表字段时,根据报表字段对应的模板字段历史数据和后撤操作,确定用于展示的候选字段历史数据。
在一个具体的实施方案中,采用了三层B/S的体系结构,并结合分布式组件技术,采用J2EE、大型关系数据库相结合,Spring MVC框架模式作为架构实现了一个可以用于企业的BI报表配置的系统,该系统的表示层可以使用不同的客户端程序,具有更好的分布性,可以适应分布式管理的要求。而用J2EE来构建系统的主要框架,使系统具有跨平台的特性,结构中的三个层次可以处于不同的平台下进行协作应用,同时,要把企业部门里不同语言写成的,运行于不同平台上的各种程序集成起来必然会花费很大的开发力量。通过WEB服务可以使用标准的方法把功能和数据暴露出来,供其他程序使用。
通过上述系统,能够根据用户实时选定的报表类型来预加载出多个报表模板,再根据用户的操作记录中的后撤操作以及报表模板的历史数据来确定用户选择的字段的展示候选数据,以向用户展示,从而能够实现更加智能化的BI报表分析,极大提高了用户使用BI报表的效率,可以有效减少出错,提高报表管理效果。
在一个可选的实施例中,匹配模块102具体用于执行以下步骤:
根据报表类型,在历史报表数据库中确定出报表类型对应的多个历史报表;
对于每一历史报表,计算该历史报表与历史操作记录之间的匹配度参数,计算该历史报表相对于其他历史报表的独一性参数;
计算匹配度参数和独一性参数的加权求和值,得到该历史报表对应的优先级参数;
根据优先级参数从大到小对所有历史报表进行排序以得到报表序列,将报表序列中前预设数量个的且优先级参数大于预设的第一参数阈值的所有历史报表,确定为候选报表;
根据所有候选报表,确定出多个报表模板;
将每一报表模板对应的所有候选报表确定为该报表模板对应的模板历史数据。
可选的,本发明中所述的相似度、匹配度或匹配度参数的计算,均可以通过分析数据之间的相同程度或利用向量距离公式等相似度算法来进行计算。
通过上述实施例,能够实现对优先级参数的计算并基于优先级参数筛选出多个独特且与用户的操作相匹配的报表,以用于报表模版的确定,能够为用户确定出更加匹配的报表模版,提高用户的工作效率和系统使用体验。
在一个可选的实施例中,匹配模块102计算该历史报表相对于其他历史报表的独一性参数的具体方式包括:
计算该历史报表与任一其他历史报表之间的相似度参数;
计算该历史报表与所有其他历史报表之间的相似度参数的加权求和平均值,以得到该历史报表对应的独一性参数;其中,每一相似度参数对应的权重包括第一权重和第二权重;第一权重与对应的其他历史报表的报表数据量成正比;第二权重与对应的其他历史报表对应的报表完整度参数成正比;报表完整度参数的计算方式包括:
计算历史报表中的字段值为空值或预设的无意义值的字段占所有字段总数量的比值,得到历史报表对应的空字段比值参数;
将历史报表中的所有字段包含在同一页面中以输出对应的页面图像;
计算该页面图像占所有像素的比值最大的像素颜色对应的比值,得到历史报表对应的图像空缺参数;
计算空字段比值参数和图像空缺参数的加权求和平均值,得到历史报表对应的报表完整度参数。
通过上述实施例,能够通过相似度参数的权重计算和平均计算,来确定每一历史报表对应的独一性参数,该参数能够有效表征该历史报表相对于其他报表的独特性和非重复性,可以用于在后续确定模板时提供给用户更多有用的信息。
在一个可选的实施例中,匹配模块102根据所有候选报表,确定出多个报表模板的具体方式,包括:
计算任意两个候选报表之间的报表相似度;
根据报表相似度,对所有候选报表进行聚类划分,以得到多个候选报表集合;每一候选报表集合中的任意两个候选报表之间的报表相似度大于预设的相似度阈值;
对于任一候选报表集合,计算该候选报表集合中的任一候选报表中的任一字段在该候选报表集合中的所有候选报表中的出现次数;
根据出现次数从大到小,对该候选报表集合中的所有字段进行排序,得到字段序列;
将字段序列中前第二数量个的且出现次数与最高出现次数之间的比值大于预设的比值阈值的所有字段,确定为该候选报表集合对应的报表模板;该最高出现次数为所有字段的出现次数中的最高值。
通过上述实施例,能够通过报表相似度的计算来对所有候选报表进行分组,并根据分组得到的多个相互之间相似的报表集合来根据字段的出现次数确定多个对应的报表模板,从而能够得到更加匹配的报表模板。
在一个可选的实施例中,演算模块103用于具体执行以下步骤:
基于预设的后撤操作规则,对历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作;
获取每一后撤操作对应的操作字段数据和操作页面位置;
对于任一模板历史数据中的任一模板字段历史数据,获取该模板字段历史数据对应的历史字段数据和历史显示位置;
将任一后撤操作对应的操作字段数据和操作页面位置,与任一模板字段数据对应的历史字段数据和历史显示位置,输入至训练好的BI相似度预测神经网络模型中,以得到该后撤操作和该模板字段数据之间的关联度参数;BI 相似度预测神经网络模型通过包括有多个训练操作参数和训练字段数据以及对应的关联度参数标注的数据训练集训练得到;
在所有关联度参数大于预设的第二参数阈值的后撤操作和模板字段数据之间建立起对应关系。
可选的,本发明中的神经网络模型均可以为CNN结构、RNN结构或LTSM结构的神经网络模型,操作人员可以根据具体的实施场景或数据特点来选择,本发明在此不做限定。
通过上述实施例,能够根据训练好的BI相似度预测神经网络模型来预测得到后撤操作和模板字段数据之间的关联度参数,以将相互关联的后撤操作和模板字段数据之间建立起对应关系,便于后续的计算。
在一个可选的实施例中,演算模块103基于预设的后撤操作规则,对历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作的具体方式包括:
根据历史操作记录,以及神经网络算法,确定目标用户对应的熟悉度水平参数;
对于历史操作记录中的任一历史操作,计算该历史操作与预设的后撤操作类型规则的第一匹配度;后撤操作类型规则用于限定属于后撤操作的操作类型;
将该历史操作与其对应的任一相邻操作组成至少一个操作组,计算所有操作组与预设的组合后撤操作类型规则的匹配度的平均值,得到第二匹配度;组合后撤操作类型规则用于限定与后撤操作相关的多个操作的类型组合;
计算第一匹配度和第二匹配度的匹配度平均值;
计算匹配度平均值与熟悉度水平参数的乘积,得到该历史操作对应的后撤可能性参数;
根据后撤可能性参数从大到小对所有历史操作进行排序得到操作序列,并将操作序列中前第三数量个的且后撤可能性参数大于第三参数阈值的所有历史操作,确定为后撤操作。
通过上述实施例,能够根据第一匹配度和第二匹配度和熟悉度水平参数的计算,来综合评价不同的历史操作可能是后撤操作的可能性,以更加精确地筛选出后撤操作以用于后续的计算。
在一个可选的实施例中,演算模块103根据历史操作记录,以及神经网络算法,确定目标用户对应的熟悉度水平参数的具体方式包括:
将历史操作记录,输入至训练好的熟悉度预测神经网络模型,以得到目标用户对应的熟悉度水平参数;熟悉度预测神经网络模型通过包括有多个训练用户操作记录和对应的用户熟悉度标注的训练数据集进行训练;其中,用户熟悉度标注是由人工基于熟悉度标注规则对训练用户操作记录进行标注得到;熟悉度标注规则中包括针对用户操作记录中不同的操作频次、不同后撤操作占比和用户本身的不同系统操作时长对应的熟悉度量化规则。
通过上述实施例,能够通过训练好的熟悉度预测神经网络模型来预测目标用户对应的熟悉度水平参数,该参数能够有效表征用户对于系统或当前业务的熟悉程度,在不熟悉的情况下做出后撤操作的可能性也更高,从而有利于后续计算出的后撤可能性参数更加精确和合理。
在一个可选的实施例中,展示模块104具体用于执行以下步骤:
响应于目标用户选择报表字段的操作,确定目标用户选择的目标报表字段;
根据目标报表字段,在所有模板字段历史数据中确定出字段相匹配的多个字段历史数据,得到多个匹配字段历史数据;
对于任一匹配字段历史数据,根据该匹配字段历史数据对应的所有后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数;
根据字段优先级参数,从多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据;
根据字段优先级参数从大到小对所有候选字段历史数据进行排序,得到第一数据序列;
在展示多个候选字段历史数据时,根据第一数据序列进行展示。
通过上述实施例,可以根据字段优先级参数,从多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据并确定出展示的序列顺序,从而能够筛选出对于用户更为适用和方便的多个候选数据来给用户进行展示和选择,极大提高了用户使用BI报表的效率,可以有效减少出错,提高报表管理效果。
在一个可选的实施例中,展示模块104根据该匹配字段历史数据对应的所有后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数的具体方式包括:
计算该匹配字段历史数据对应的所有后撤操作的操作总数量;
计算该匹配字段历史数据对应的数据时间参数与当前时间点之间的数据时间差;
计算该匹配字段历史数据在多个历史时间点的展示次序的次序平均值;
计算操作总数量、数据时间差和次序平均值的加权求和值,得到该匹配字段历史数据对应的字段优先级参数。
通过上述实施例,通过对操作总数量、数据时间差和次序平均值的计算和加权,可以有效结合字段的历史操作熟悉度、即时性和历史优先级等方面的数据来确定字段的优先级,以在后续计算出可以筛选出更匹配和合理的字段历史数据。
在一个可选的实施例中,展示模块104根据字段优先级参数,从多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据的具体方式包括:
根据字段优先级参数从大到小对所有匹配字段历史数据进行排序,得到第二数据序列;
将第二数据序列中前第四数量个的且字段优先级参数大于预设的第四参数阈值的所有匹配字段历史数据,确定为用于展示的多个候选字段历史数据。
通过上述实施例,可以根据字段优先级参数的大小和排序来筛选出用于展示的多个候选字段历史数据,以提高筛选的有效性和精确性。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field ProgrammableGateArray, FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera HardwareDescriptionLanguage)、 Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL (Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后应说明的是:本发明实施例公开的一种基于人工智能的数据分析及展现系统所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种基于人工智能的数据分析及展现系统,其特征在于,所述系统包括:
获取模块,用于获取目标用户的新建BI报表操作对应的报表类型,和获取所述目标用户对应的历史操作记录;所述历史操作记录中包括所述目标用户在历史时间段的多个历史操作;
匹配模块,用于根据所述报表类型和所述历史操作记录,在预设的历史报表数据库中确定出多个报表模板和对应的模板历史数据;所述多个报表模板用于展示给所述目标用户以供选择;
演算模块,用于确定所述历史操作记录中的所有后撤操作,基于神经网络算法,从所述模板历史数据中匹配出每一所述后撤操作对应的模板字段历史数据;
展示模块,用于在所述目标用户选择报表字段时,根据所述报表字段对应的所述模板字段历史数据和所述后撤操作,确定用于展示的候选字段历史数据。
2.根据权利要求1所述的基于人工智能的数据分析及展现系统,其特征在于,所述匹配模块具体用于执行以下步骤:
根据所述报表类型,在所述历史报表数据库中确定出所述报表类型对应的多个历史报表;
对于每一所述历史报表,计算该历史报表与所述历史操作记录之间的匹配度参数,计算该历史报表相对于其他所述历史报表的独一性参数;
计算所述匹配度参数和所述独一性参数的加权求和值,得到该历史报表对应的优先级参数;
根据所述优先级参数从大到小对所有所述历史报表进行排序以得到报表序列,将所述报表序列中前预设数量个的且所述优先级参数大于预设的第一参数阈值的所有历史报表,确定为候选报表;
根据所有所述候选报表,确定出多个报表模板;
将每一所述报表模板对应的所有所述候选报表确定为该报表模板对应的模板历史数据。
3.根据权利要求2所述的基于人工智能的数据分析及展现系统,其特征在于,所述匹配模块计算该历史报表相对于其他所述历史报表的独一性参数的具体方式包括:
计算该历史报表与任一其他历史报表之间的相似度参数;
计算该历史报表与所有其他历史报表之间的所述相似度参数的加权求和平均值,以得到该历史报表对应的独一性参数;其中,每一所述相似度参数对应的权重包括第一权重和第二权重;所述第一权重与对应的其他历史报表的报表数据量成正比;所述第二权重与对应的其他历史报表对应的报表完整度参数成正比;所述报表完整度参数的计算方式包括:
计算历史报表中的字段值为空值或预设的无意义值的字段占所有字段总数量的比值,得到历史报表对应的空字段比值参数;
将历史报表中的所有字段包含在同一页面中以输出对应的页面图像;
计算该页面图像占所有像素的比值最大的像素颜色对应的比值,得到历史报表对应的图像空缺参数;
计算所述空字段比值参数和所述图像空缺参数的加权求和平均值,得到历史报表对应的报表完整度参数。
4.根据权利要求2所述的基于人工智能的数据分析及展现系统,其特征在于,所述匹配模块根据所有所述候选报表,确定出多个报表模板的具体方式,包括:
计算任意两个所述候选报表之间的报表相似度;
根据所述报表相似度,对所有所述候选报表进行聚类划分,以得到多个候选报表集合;每一所述候选报表集合中的任意两个候选报表之间的所述报表相似度大于预设的相似度阈值;
对于任一所述候选报表集合,计算该候选报表集合中的任一候选报表中的任一字段在该候选报表集合中的所有候选报表中的出现次数;
根据所述出现次数从大到小,对该候选报表集合中的所有所述字段进行排序,得到字段序列;
将所述字段序列中前第二数量个的且所述出现次数与最高出现次数之间的比值大于预设的比值阈值的所有字段,确定为该候选报表集合对应的报表模板;所述最高出现次数为所有所述字段的所述出现次数中的最高值。
5.根据权利要求1所述的基于人工智能的数据分析及展现系统,其特征在于,所述演算模块用于具体执行以下步骤:
基于预设的后撤操作规则,对所述历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作;
获取每一所述后撤操作对应的操作字段数据和操作页面位置;
对于任一所述模板历史数据中的任一模板字段历史数据,获取该模板字段历史数据对应的历史字段数据和历史显示位置;
将任一所述后撤操作对应的操作字段数据和操作页面位置,与任一所述模板字段数据对应的历史字段数据和历史显示位置,输入至训练好的BI相似度预测神经网络模型中,以得到该后撤操作和该模板字段数据之间的关联度参数;所述BI 相似度预测神经网络模型通过包括有多个训练操作参数和训练字段数据以及对应的关联度参数标注的数据训练集训练得到;
在所有所述关联度参数大于预设的第二参数阈值的所述后撤操作和所述模板字段数据之间建立起对应关系。
6.根据权利要求5所述的基于人工智能的数据分析及展现系统,其特征在于,所述演算模块基于预设的后撤操作规则,对所述历史操作记录中的所有历史操作进行匹配,将匹配得到的历史操作确定为后撤操作的具体方式包括:
根据所述历史操作记录,以及神经网络算法,确定所述目标用户对应的熟悉度水平参数;
对于所述历史操作记录中的任一所述历史操作,计算该历史操作与预设的后撤操作类型规则的第一匹配度;所述后撤操作类型规则用于限定属于后撤操作的操作类型;
将该历史操作与其对应的任一相邻操作组成至少一个操作组,计算所有所述操作组与预设的组合后撤操作类型规则的匹配度的平均值,得到第二匹配度;所述组合后撤操作类型规则用于限定与后撤操作相关的多个操作的类型组合;
计算所述第一匹配度和所述第二匹配度的匹配度平均值;
计算所述匹配度平均值与所述熟悉度水平参数的乘积,得到该历史操作对应的后撤可能性参数;
根据所述后撤可能性参数从大到小对所有所述历史操作进行排序得到操作序列,并将所述操作序列中前第三数量个的且所述后撤可能性参数大于第三参数阈值的所有历史操作,确定为后撤操作。
7.根据权利要求5所述的基于人工智能的数据分析及展现系统,其特征在于,所述演算模块根据所述历史操作记录,以及神经网络算法,确定所述目标用户对应的熟悉度水平参数的具体方式包括:
将所述历史操作记录,输入至训练好的熟悉度预测神经网络模型,以得到所述目标用户对应的熟悉度水平参数;所述熟悉度预测神经网络模型通过包括有多个训练用户操作记录和对应的用户熟悉度标注的训练数据集进行训练;其中,所述用户熟悉度标注是由人工基于熟悉度标注规则对所述训练用户操作记录进行标注得到;所述熟悉度标注规则中包括针对用户操作记录中不同的操作频次、不同后撤操作占比和用户本身的不同系统操作时长对应的熟悉度量化规则。
8.根据权利要求1所述的基于人工智能的数据分析及展现系统,其特征在于,所述展示模块具体用于执行以下步骤:
响应于所述目标用户选择报表字段的操作,确定所述目标用户选择的目标报表字段;
根据所述目标报表字段,在所有所述模板字段历史数据中确定出字段相匹配的多个字段历史数据,得到多个匹配字段历史数据;
对于任一所述匹配字段历史数据,根据该匹配字段历史数据对应的所有所述后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数;
根据所述字段优先级参数,从所述多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据;
根据所述字段优先级参数从大到小对所有所述候选字段历史数据进行排序,得到第一数据序列;
在展示所述多个候选字段历史数据时,根据所述第一数据序列进行展示。
9.根据权利要求8所述的基于人工智能的数据分析及展现系统,其特征在于,所述展示模块根据该匹配字段历史数据对应的所有所述后撤操作,以及该匹配字段历史数据对应的数据参数,计算该匹配字段历史数据对应的字段优先级参数的具体方式包括:
计算该匹配字段历史数据对应的所有所述后撤操作的操作总数量;
计算该匹配字段历史数据对应的数据时间参数与当前时间点之间的数据时间差;
计算该匹配字段历史数据在多个历史时间点的展示次序的次序平均值;
计算所述操作总数量、所述数据时间差和所述次序平均值的加权求和值,得到该匹配字段历史数据对应的字段优先级参数。
10.根据权利要求8所述的基于人工智能的数据分析及展现系统,其特征在于,所述展示模块根据所述字段优先级参数,从所述多个匹配字段历史数据中,筛选出用于展示的多个候选字段历史数据的具体方式包括:
根据所述字段优先级参数从大到小对所有所述匹配字段历史数据进行排序,得到第二数据序列;
将所述第二数据序列中前第四数量个的且所述字段优先级参数大于预设的第四参数阈值的所有匹配字段历史数据,确定为用于展示的多个候选字段历史数据。
CN202311304975.9A 2023-10-10 2023-10-10 一种基于人工智能的数据分析及展现系统 Active CN117216146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311304975.9A CN117216146B (zh) 2023-10-10 2023-10-10 一种基于人工智能的数据分析及展现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311304975.9A CN117216146B (zh) 2023-10-10 2023-10-10 一种基于人工智能的数据分析及展现系统

Publications (2)

Publication Number Publication Date
CN117216146A true CN117216146A (zh) 2023-12-12
CN117216146B CN117216146B (zh) 2024-05-14

Family

ID=89046138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311304975.9A Active CN117216146B (zh) 2023-10-10 2023-10-10 一种基于人工智能的数据分析及展现系统

Country Status (1)

Country Link
CN (1) CN117216146B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190124107A1 (en) * 2017-10-20 2019-04-25 International Business Machines Corporation Security management for data systems
CN113312889A (zh) * 2021-06-01 2021-08-27 平安证券股份有限公司 报表处理方法、装置、终端和存储介质
CN115687345A (zh) * 2022-10-17 2023-02-03 中国工商银行股份有限公司 报表生成方法、装置、存储介质以及电子设备
CN116468010A (zh) * 2023-02-27 2023-07-21 河钢数字技术股份有限公司 报表生成方法、装置、终端及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190124107A1 (en) * 2017-10-20 2019-04-25 International Business Machines Corporation Security management for data systems
CN113312889A (zh) * 2021-06-01 2021-08-27 平安证券股份有限公司 报表处理方法、装置、终端和存储介质
CN115687345A (zh) * 2022-10-17 2023-02-03 中国工商银行股份有限公司 报表生成方法、装置、存储介质以及电子设备
CN116468010A (zh) * 2023-02-27 2023-07-21 河钢数字技术股份有限公司 报表生成方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN117216146B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
US11853107B2 (en) Dynamic phase generation and resource load reduction for a query
US11816436B2 (en) Automated summarization of extracted insight data
US11120364B1 (en) Artificial intelligence system with customizable training progress visualization and automated recommendations for rapid interactive development of machine learning models
US20230376857A1 (en) Artificial inelligence system with intuitive interactive interfaces for guided labeling of training data for machine learning models
CN113641896A (zh) 一种模型训练以及推荐概率预测方法及装置
CN113849166B (zh) 智慧水环境积木式零代码开发平台
CN117216327B (zh) 基于可视化数据关系的数据分析系统
CN116414906A (zh) 一种数据处理及可视化的方法、装置、介质和设备
US20230153681A1 (en) Machine learning techniques for hybrid temporal-utility classification determinations
CN116757278B (zh) 一种预测模型的训练方法、装置、存储介质及电子设备
US11868436B1 (en) Artificial intelligence system for efficient interactive training of machine learning models
CN116821647B (zh) 基于样本偏离评估的数据标注的优化方法、装置及设备
CN116842060B (zh) 一种基于代理模型重排技术的推理查询优化方法及装置
US12050974B1 (en) System and method for enhanced distribution of data to compute nodes
CN116402113B (zh) 一种任务执行的方法、装置、存储介质及电子设备
CN117216146B (zh) 一种基于人工智能的数据分析及展现系统
CN116821494A (zh) 一种分析数据的方法、装置、设备及介质
CN116091895A (zh) 一种面向多任务知识融合的模型训练方法及装置
CN114860967A (zh) 一种模型训练的方法、信息推荐的方法以及装置
CN114116813A (zh) 一种信息推荐的方法及推荐装置
CN116881724B (zh) 一种样本标注方法、装置及设备
CN117688351B (zh) 一种基于模型处理结果的辅助甄别方法、装置及设备
CN117520627B (zh) 项目检索数据处理方法及装置
CN117494068B (zh) 一种结合深度学习与因果推断的网络舆情分析方法及装置
CN116340852B (zh) 一种模型训练、业务风控的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant