CN117667841A - 一种企业数据管理平台及方法 - Google Patents

一种企业数据管理平台及方法 Download PDF

Info

Publication number
CN117667841A
CN117667841A CN202311430566.3A CN202311430566A CN117667841A CN 117667841 A CN117667841 A CN 117667841A CN 202311430566 A CN202311430566 A CN 202311430566A CN 117667841 A CN117667841 A CN 117667841A
Authority
CN
China
Prior art keywords
data
identifying
text
enterprise data
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311430566.3A
Other languages
English (en)
Inventor
周显敬
刘虎
汪寒雨
桂顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zhuoer Information Technology Co ltd
Original Assignee
Wuhan Zhuoer Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Zhuoer Information Technology Co ltd filed Critical Wuhan Zhuoer Information Technology Co ltd
Priority to CN202311430566.3A priority Critical patent/CN117667841A/zh
Publication of CN117667841A publication Critical patent/CN117667841A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种企业数据管理平台及方法,该平台包括:数据接入模块,用于接入不同类型企业数据,并标识数据类别和文件类型;特征分析模块,用于基于企业数据的文件类型识别文件内容,并提取企业数据特征,添加对应的特征标签;数据关联模块,用于基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;检索引擎模块,用于基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;数据分析模块,用于基于匹配数据和关联数据进行多维度分析,生成分析报告。通过该方案可以提升企业数据检索分析的准确性和可靠性。

Description

一种企业数据管理平台及方法
技术领域
本发明属于计算机技术领域,尤其涉及一种企业数据管理平台及方法。
背景技术
企业在生产运营中会产生大量的数据,如设备生产监测数据、销售数据、财务数据以及日常工作报表等,这些数据通常由各部门人员分别上传至企业的管理系统中,并由各部门的子系统对上传数据进行分别管理。当需要调取关联数据时,需要申请权限去对应部门的子系统上获取,并在对应的子系统上去检索关联数据。在实际数据检索中,由于获取人员无法清楚了解各部门运作情况,在数据检索分析时,需要各部门人员的相互配合,且子系统检索得到也是具体的文件,这就需要检索人员临时提取内容进行分析。
目标,针对这类数据检索问题,通过大数据检索分析可以快速得到目标数据,并能根据检索数据生成分析报告,但这只适用于特定类型的文件,比如文本文件,检索得到的也是关键词相匹配的文件,对于不同类型的文件,如表格、图片、音视频等,检索及分析准确度较差。
发明内容
有鉴于此,本发明实施例提供了一种企业数据管理平台及方法,用于解决现有数据管理平台在进行数据检索及分析时,其准确度较差的问题。
在本发明实施例的第一方面,提供了一种企业数据管理平台,包括:
数据接入模块,用于接入不同类型企业数据,并标识数据类别和文件类型;
特征分析模块,用于基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
数据关联模块,用于基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
检索引擎模块,用于基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
数据分析模块,用于基于匹配数据和关联数据进行多维度分析,生成分析报告。
在本发明实施例的第二方面,提供了一种企业数据管理方法,包括:
接入不同类型企业数据,并标识数据类别和文件类型;
基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
基于匹配数据和关联数据进行多维度分析,生成分析报告。
在本发明实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例第一方面所述方法的步骤。
在本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。
本发明实施例中,通过深度学习模型识别不同类型企业的内容,提取企业数据特征,并建立企业数据间的关联关系,可以在用户进行数据检索,不仅能进行关键词及其特征的匹配,而且能输出匹配数据和关联数据。从而能保障检索结果的准确性和可靠性,同时,基于匹配数据和关联数据的多维度分析,可以提升分析结果的准确性,相较于传统简单的统计分析,本发明可以为用户提供更丰富、可靠的分析结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述的附图仅仅是本发明的一些实施例,对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他附图。
图1为本发明一个实施例提供的一种企业数据管理平台的结构示意图;
图2为本发明一个实施例提供的一种企业数据管理方法的流程示意图;
图3为本发明的一个实施例提供的一种电子设备的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
应当理解,本发明的说明书或权利要求书及上述附图中的术语“包括”以及其他相近意思表述,意指覆盖不排他的包含,如包含一系列步骤或单元的过程、方法或系统、设备没有限定于已列出的步骤或单元。此外,“第一”“第二”用于区分不同对象,并非用于描述特定顺序。
请参阅图1,本发明实施例提供的一种企业数据管理平台的结构示意图,包括:
数据接入模块110,用于接入不同类型企业数据,并标识数据类别和文件类型;
对于企业日常生产经营产生的大量数据,可以在数据上传时,由上传人员选定数据类别,比如分为生产数据、销售数据、仓储数据、财务收支、会议材料、研发数据、员工数据等,其中,生产数据中可以分为生产设备数据、生产材料数据、流程管理、出厂数据等,生产设备数据等还可以进一步划分。上传人员在上传时,选定数据具体类别后,直接上传文件。可以理解,数据上传人员由于职位不同,其数据上传权限也存在区别。
对于日常生产经营中产生的数据,则可以直接根据数据来源,确定数据类别,比如,生产设备接入的数据,可以标识其数据类型。
平台对于上传的文件,可以直接根据文件格式识别出文件类型。
特征分析模块120,用于基于企业数据的文件类型识别文件内容,并提取企业数据特征,添加对应的特征标签;
对于不同类型、不同格式的企业数据,需要通过深度学习模型识别文件的内容,文件内容可以通过高频词汇、关键词、场景等标识。对于特定类型的企业数据,则可以直接识别提取目标内容。
具体的,当文件类型为文本文档,则通过文本识别模型识别文档内容并提取高频词汇;
当文件类型为图片,则通过图片识别模型识别图片内容,并基于文本识别模型识别图片中的文本内容;
当文件类型为表格,则通过文本识别模型识别表格中的文本内容;
当文件类型为音频,则通过语音识别模型转换为文本,并通过文本识别模型识别文本内容;
当文件类型为视频,则截取视频帧,通过图像识别模型识别视频帧内容,并结合语音识别模型和文本识别模型,识别视频中的音频内容和文本内容。
所述企业数据特征可以根据数据类别、文件名称、内容标题、内容关键词、数据型值、数据分布特征等多个维度,进行特征提取。对于不同类型的数据,其特征标签也不相同。
示例性的,对于设备维修日常的财务报表,根据报表日期、用途、内容等,可以为报表添加标签,如xx设备、维修、财务支出、支出项目、负责人等。
数据关联模块130,用于基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
由于企业数据间存在一定的关联性,可以基于数据的特征标签建立数据间的关联关系,这种关联关系可以通过树状图表示。
示例性的,对于企业设备维修,维修报表的特征标签若为设备型号、维修、财务支出、支出项目、负责人等,可以设备型号与采购记录、生产批次关联,维修可以与同类型设备维修记录关联,财务支出可以与其年度维修费用关联,负责人可以与其负责维修项目、员工资料等关联,由此,维修报表可以与采购记录、生产批次、同类型设备维修记录、年度维修费用、负责人信息等建立关联。
具体的,将企业数据的根节点设定为数据所属类别,将叶子节点设定为与当前数据相关联的不同类别的企业数据。比如,对于维修报表,其根节点为生产设备维修、子节点可以为采购记录、生产批次、同类型设备维修记录、年度维修费用等,邻居节点(同属于生产设备维修)可以为其他类型生产设备的维修报表。
在一些实施例汇总,基于不同的关联关系可以赋予一定的权重系数,当数据内容或特征超过一定值,可以提升权重系数。比如,当设备维修费用超过一定金额,或维修次数超过预定值,则可以增强当前数据与设备采购数据,以及同类型设备维修数据的关联关系,并将其作为关联数据。
检索引擎模块140,用于基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
用户通过设置筛选项或直接输入关键词进行匹配检索时,可以按照关键词及关键词特征,根据匹配度进行数据内容或文件展示,并直接匹配内容展示完后,展示相关联的数据或文件。
示例性的,当用户输入xx设备、维修两个关键词后,可以直接展示最近该设备最近月度维修汇总表、年度维修汇总表,用户可以直接点击进行查看,并可以展示每次的维修记录,并将关联的发票、维修现场视频、证明文件图片等作为一个链接目录与每次维修记录关联。同时,可以将xx设备维修支出的财务报表作为管理数据进行展示。
数据分析模块150,用于基于匹配数据及关联数据进行多维度分析,生成分析报告。
匹配数据一般对应有原始的文件或数据内容,用户可以直接查看原始文件,关联数据则是与当前检索内容相关联的文件或数据。平台可以设定展示相匹配和相关联的文件数量,及文件类别、文件间的关联。
基于匹配数据及关联数据,用户可以设定关联范围和分析方向,也可以由平台根据文件内容识别结果进行自动分析。其中,关联范围可以根据管理数据与目标检索数据的关联程度进行表示,一般可以设定为相应的权重或预定值,当管理权重超过一定比例或超过预定值,则可以作为关联数据。管理数据与目标检索数据在内容和特征上具有一定相似度。比如,用户需要检索设备某一月度设备维修记录,则可以将临近月度(上一月或下一月)的维修数据进行展示,也可以将年度维修数据作为关联数据进行展示分析。
对于匹配数据及关联数据的分析,可以根据检索内容的不同,采用不同维度的分析方式。比如,对于设备维修,可以分析采购型号、采购金额,维修支出费用、故障概率、生产贡献等,从采购、生产、维修等维度进行分析判断,判断是否存在数据缺失或数据错误,以及分析设备的产出与支出,在生成分析报告时,可以生成对应的建议,比如,优化生产流程,或更换设备型号等。可以理解,在进行多维度分析时,用户也可以设定仅对匹配数据的多维度分析,增加关联数据的分析,即可以验证数据分析结果是否准确,也可以保障分析结果的可靠性。
本实施例中,通过对不同类型上传数据进行内容识别,提取数据特征,基于数据特征构建数据间的关联关系,在进行数据检索时可以基于关键词及关键词特征进行数据内容及特征匹配,保障检索结果的准确性,同时可以基于匹配数据及其管理数据进行分析,提升分析结果的准确性和可靠性。
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图2为本发明实施例提供的一种企业数据管理方法的流程示意图,该方法包括:
S201、接入不同类型企业数据,并标识数据类别和文件类型;
S202、基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
具体的,当文件类型为文本文档,则通过文本识别模型识别文档内容并提取高频词汇;
当文件类型为图片,则通过图片识别模型识别图片内容,并基于文本识别模型识别图片中的文本内容;
当文件类型为表格,则通过文本识别模型识别表格中的文本内容;
当文件类型为音频,则通过语音识别模型转换为文本,并通过文本识别模型识别文本内容;
当文件类型为视频,则截取视频帧,通过图像识别模型识别视频帧内容,并结合语音识别模型和文本识别模型,识别视频中的音频内容和文本内容。
S203、基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
其中,将企业数据的根节点设定为数据所属类别,将叶子节点设定为与当前数据相关联的不同类别的企业数据。
S204、基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
S205、基于匹配数据和关联数据进行多维度分析,生成分析报告。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和模块的具体工作过程可以参考前述方法实施例中对应的过程,在此不再赘述。
图3是本发明一实施例提供的一种电子设备的结构示意图。所述电子设备用于企业数据管理。如图3所示,该实施例的电子设备3包括:存储器310、处理器320以及系统总线330,所述存储器310包括存储其上的可运行的程序3101,本领域技术人员可以理解,图3中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对电子设备的各个构成部件进行具体的介绍:
存储器310可用于存储软件程序以及模块,处理器320通过运行存储在存储器310的软件程序以及模块,从而执行电子设备的各种功能应用以及数据处理。存储器310可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如缓存数据)等。此外,存储器310可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在存储器310上包含网络请求方法的可运行程序3101,所述可运行程序3101可以被分割成一个或多个模块/单元,所述一个或多个模块/单元被存储在所述存储器310中,并由处理器320执行,以进行企业数据管理等,所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序3101在所述电子设备3中的执行过程。例如,所述计算机程序3101可以被分割为数据接入模块、特征分析模块、数据关联模块、检索引擎模块和数据分析模块等功能模块。
处理器320是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器310内的软件程序和/或模块,以及调用存储在存储器310内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体状态监控。可选的,处理器320可包括一个或多个处理单元;优选的,处理器320可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器320中。
系统总线330是用来连接计算机内部各功能部件,可以传送数据信息、地址信息、控制信息,其种类可以是例如PC I总线、I SA总线、CAN总线等。处理器320的指令通过总线传递至存储器310,存储器310反馈数据给处理器320,系统总线330负责处理器320与存储器310之间的数据、指令交互。当然系统总线330还可以接入其他设备,例如网络接口、显示设备等。
在本发明实施例中,该电子设备所包括的处理320执行的可运行程序包括:
接入不同类型企业数据,并标识数据类别和文件类型;
基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
基于匹配数据和关联数据进行多维度分析,生成分析报告。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种企业数据管理平台,其特征在于,包括:
数据接入模块,用于接入不同类型企业数据,并标识数据类别和文件类型;
特征分析模块,用于基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
数据关联模块,用于基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
检索引擎模块,用于基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
数据分析模块,用于基于匹配数据和关联数据进行多维度分析,生成分析报告。
2.根据权利要求1所述的平台,其特征在于,所述基于企业数据的文件类型通过深度学习模型识别文件内容包括:
当文件类型为文本文档,则通过文本识别模型识别文档内容并提取高频词汇;
当文件类型为图片,则通过图片识别模型识别图片内容,并基于文本识别模型识别图片中的文本内容;
当文件类型为表格,则通过文本识别模型识别表格中的文本内容;
当文件类型为音频,则通过语音识别模型转换为文本,并通过文本识别模型识别文本内容;
当文件类型为视频,则截取视频帧,通过图像识别模型识别视频帧内容,并结合语音识别模型和文本识别模型,识别视频中的音频内容和文本内容。
3.根据权利要求1所述的平台,其特征在于,所述建立企业数据间的关联关系,并构建树状关联图谱包括:
将企业数据的根节点设定为数据所属类别,将叶子节点设定为与当前数据相关联的不同类别的企业数据。
4.一种企业数据管理方法,其特征在于,至少包括:
接入不同类型企业数据,并标识数据类别和文件类型;
基于企业数据的文件类型通过深度学习模型识别文件内容,并提取企业数据特征,添加对应的特征标签;
基于特征标签,建立企业数据间的关联关系,并构建树状关联图谱;
基于用户输入内容进行关键词及关键词特征检索,输出匹配数据及关联数据;
基于匹配数据和关联数据进行多维度分析,生成分析报告。
5.根据权利要求4所述的方法,其特征在于,所述基于企业数据的文件类型通过深度学习模型识别文件内容包括:
当文件类型为文本文档,则通过文本识别模型识别文档内容并提取高频词汇;
当文件类型为图片,则通过图片识别模型识别图片内容,并基于文本识别模型识别图片中的文本内容;
当文件类型为表格,则通过文本识别模型识别表格中的文本内容;
当文件类型为音频,则通过语音识别模型转换为文本,并通过文本识别模型识别文本内容;
当文件类型为视频,则截取视频帧,通过图像识别模型识别视频帧内容,并结合语音识别模型和文本识别模型,识别视频中的音频内容和文本内容。
6.根据权利要求4所述的方法,其特征在于,所述建立企业数据间的关联关系,并构建树状关联图谱包括:
将企业数据的根节点设定为数据所属类别,将叶子节点设定为与当前数据相关联的不同类别的企业数据。
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求4至6任一项所述的一种企业数据管理方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求4至6任一项所述的一种企业数据管理方法的步骤。
CN202311430566.3A 2023-10-28 2023-10-28 一种企业数据管理平台及方法 Pending CN117667841A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311430566.3A CN117667841A (zh) 2023-10-28 2023-10-28 一种企业数据管理平台及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311430566.3A CN117667841A (zh) 2023-10-28 2023-10-28 一种企业数据管理平台及方法

Publications (1)

Publication Number Publication Date
CN117667841A true CN117667841A (zh) 2024-03-08

Family

ID=90065240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311430566.3A Pending CN117667841A (zh) 2023-10-28 2023-10-28 一种企业数据管理平台及方法

Country Status (1)

Country Link
CN (1) CN117667841A (zh)

Similar Documents

Publication Publication Date Title
US20210319032A1 (en) Systems and methods for contextual retrieval and contextual display of records
US9659043B2 (en) Data system and method
US10713306B2 (en) Content pattern based automatic document classification
US8527451B2 (en) Business semantic network build
US20130275420A1 (en) Computer-Implemented System And Method For Conducting A Document Search Via Metaprints
CN113836131B (zh) 一种大数据清洗方法、装置、计算机设备及存储介质
US20220019739A1 (en) Item Recall Method and System, Electronic Device and Readable Storage Medium
US20080086490A1 (en) Discovery of services matching a service request
US20120078969A1 (en) System and method to extract models from semi-structured documents
US10891314B2 (en) Detection and creation of appropriate row concept during automated model generation
CA2977847A1 (en) Automated extraction tools and their use in social content tagging systems
US10936637B2 (en) Associating insights with data
CN104750776A (zh) 使用元数据访问数据库平台中的信息内容
US10146881B2 (en) Scalable processing of heterogeneous user-generated content
CN111192176A (zh) 一种支持教育信息化评估的在线数据采集方法及装置
JP2020030818A (ja) 提案依頼書(rfp)に基づいて提案書を生成するためのシステム及び方法
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN116383193A (zh) 一种数据管理方法、装置、电子设备和存储介质
CN110720097A (zh) 图数据库中元组和边的功能性等价
US9984108B2 (en) Database joins using uncertain criteria
US20070282804A1 (en) Apparatus and method for extracting database information from a report
CN117251777A (zh) 数据处理方法、装置、计算机设备和存储介质
CN110941952A (zh) 一种完善审计分析模型的方法及装置
US20210295036A1 (en) Systematic language to enable natural language processing on technical diagrams
CN117667841A (zh) 一种企业数据管理平台及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination