CN115080546B - 一种基于大数据的企业数据诊断系统 - Google Patents
一种基于大数据的企业数据诊断系统 Download PDFInfo
- Publication number
- CN115080546B CN115080546B CN202210850105.0A CN202210850105A CN115080546B CN 115080546 B CN115080546 B CN 115080546B CN 202210850105 A CN202210850105 A CN 202210850105A CN 115080546 B CN115080546 B CN 115080546B
- Authority
- CN
- China
- Prior art keywords
- data
- user
- enterprise
- access
- delta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/217—Database tuning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/552—Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/604—Tools and structures for managing or administering access control systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于大数据的企业数据诊断系统,尤其涉及企业数据处理技术领域,包括数据获取模块,与所述数据获取模块连接的数据划分模块,所述数据划分模块用以对数据获取模块获取的企业数据进行划分;与所述数据划分模块连接的数据存储模块,通过对企业数据进行获取,并通过设置数据划分模块对企业数据进行数据划分,并针对划分完成的不同的企业数据,设置可访问企业数据数据库的用户权限和设置删除时间期限,从而保证对企业运营过程产生的数据的控制精准度,避免重要数据丢失或非重要数据删除不及时的问题,提高了企业数据库的运行效率。
Description
技术领域
本发明涉及企业数据处理技术领域,尤其涉及一种基于大数据的企业数据诊断系统。
背景技术
随着数字化的到来,大到国家,小到个人,及各行各业都通过数字化的方式实现着社会的运转,数字化在提高着我们的效率,在这信息爆炸的社会里,同样也造成了信息泛滥,对于企业来说,这把是双刃剑同时也会带来忧患,而对于中大型企业来讲,其在运营过程中,有专业的团队和对应的运营平台对企业产生的数据进行整理,而小微企业没法做到,但小微企业在运营过程中,也会产生较多的数据,而大量数据中包含有用数据和无用数据,而通过建立专业团队处理数据,会增加成本和人力。
中国专利公开号:CN110968482A公开了一种数据监控技术领域的企业服务及应用智能监控系统,包括系统服务监控和运营数据监控,系统服务监控由八个模块组成:服务性能数据采集模块、业务数据采集模块、其他的数据采集模块、报警系统、Prometheus监控系统、配置管理模块、告警规则更新模块、Grafana模块;本发明解决企业分布式系统中,因多应用多服务的系统出现问题,而无法及时定位问题,同时解决业务运营数据得不到实时监控,无法实时呈现当前状态的问题。在定位问题和排查问题上减少百分之九十的人力及时间成本,将这些人力物力更好的投入到解决问题和开发生产中去,不仅可以挽回因事故而造成的直接经济损失,同时还可以有效的提高了企业的生产率。由此可见,所述一种数据监控技术领域的企业服务及应用智能监控系统。存在以下问题:
1、不适用小微企业运营数据的管理;
2、对企业生产过程中的数据处理过程控制不够精确,造成重要数据丢失或者非重要数据删除不及时,进而导致企业数据库运行效率低的问题。
发明内容
为此,本发明提供基于大数据的企业数据诊断系统,用以克服现有技术中对企业生产过程中的数据处理过程控制不够精确,从而造成重要数据丢失或者非重要数据删除不及时,进而导致企业数据库运行效率低的问题。
为实现上述目的,本发明提供基于大数据的企业数据诊断系统,包括:
数据获取模块,其包括用以获取企业数据的数据获取单元;
数据划分模块,其与所述数据获取模块连接,所述数据划分模块用以对数据获取模块获取的所述企业数据进行划分;
数据存储模块,其与所述数据划分模块连接,所述数据存储模块用以将划分完成后的所述数据存储在对应的数据库;
其中,数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与所述企业数据相关的大数据进行关联,根据若干关键词和关联大数据的关联度确定所述企业数据的等级,并在数据访问过程中,获取用户历史数据,根据用户历史数据确定用户的合格率,且在确定用户合格率完成时,确定用户是否可继续访问数据库以及可访问数据库时可提取的最大数据量。
进一步地,所述数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与企业数据的关联大数据进行比对,计算若干关键词与关联大数据的关联度R,设定R=D/Dz,根据该关联度R和预设关联度的比对结果确定所述企业数据的划分,其中D为若干所述关键词中与关联大数据中相同的数据量,Dz为关联大数据的数据量,所述预设关联度包括第一预设关联度R1和第二预设关联度R2,R1<R2,
若R≤R1,所述数据划分模块确定所述企业数据为第一企业数据;
若R1<R≤R2,所述数据划分模块确定所述企业数据为第二企业数据;
若R>R2,所述数据划分模块确定所述企业数据为第三企业数据。
进一步地,所述数据获取模块还包括用以获取用户的访问请求并确定用户访问请求是否合格的访问识别单元,分别与所述数据存储模块和访问识别单元连接的用以在确定所述用户访问请求合格时提取对应数据库中的数据的数据提取单元。
进一步地,所述访问识别单元在识别到用户访问请求时,获取用户权限,根据用户权限确定是否可访问和/或提取所述企业数据,并在确定可进行所述企业数据的访问和/或提取时,获取用户数据,所述访问识别单元在获取用户数据完成时,提取用户数据的关键词,并根据该用户数据的关键词确定用户访问是否合格,
若所述用户数据的关键词中存在敏感词,则所述访问识别单元确定用户访问不合格;
若所述用户数据的关键词中不存在敏感词,则所述访问识别单元确定用户访问合格。
进一步地,所述访问识别单元在确定所述用户访问不合格时,获取用户历史访问的合格率Y,设定Y=P/Pz,并根据该合格率Y与预设合格率Y0的比对结果确定用户是否可继续访问企业数据,其中P为历史访问不合格次数,Pz为历史访问总次数,
若Y≤Y0,所述访问识别单元确定用户仅可继续访问第一企业数据;
若Y>Y0,所述访问识别单元确定用户可继续访问企业数据。
进一步地,所述数据提取单元在所述访问识别单元确定用户可继续访问所述企业数据时,计算所述合格率Y与预设合格率Y0的第一合格率差值ΔYa,设定ΔYa=Y-Y0,并根据该第一合格率差值与预设合格率差值的比对结果确定用户可提取数据的最大数据量,
其中,所述数据提取单元设置有第一预设误差率差值ΔY1、第二预设误差率差值ΔY2、第一最大数据量Q1、第二最大数据量Q2以及第三最大数据量Q3,其中ΔY1<ΔY2,Q1<Q2<Q3,
当ΔYa≤ΔY1时,所述数据提取单元确定用户可提取数据的最大数据量为Q1;
当ΔY1<ΔYa≤ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q2;
当ΔYa>ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q3。
进一步地,所述访问识别单元在确定所述用户访问不合格时,根据用户数据中敏感词在用户数据中的比例B与预设比例B0的比对结果确定是否对用户权限值进行调整,
若B>B0,则所述访问识别单元确定对所述用户权限值进行调整,
若B≤B0,则所述访问识别单元确定不对所述用户权限值进行调整。
进一步地,所述数据划分模块还包括与所述访问识别单元连接的数据调整单元,数据调整单元在确定所述访问识别单元对所述用户权限值进行调整时,计算所述比例B与预设比例B0的比例差值ΔB,设定ΔB=B-B0,并根据该比例差值与预设比例差值的比对结果选取对应的调节系数对用户权限值进行调整,
其中,所述数据调整单元设有第一预设比例差值ΔB1、第二预设比例差值ΔB2、第一调节系数K1、第二调节系数K2以及第三调节系数K3,其中ΔB1<ΔB2,设定0.5<K3<K2<K1<1,
当ΔB≤ΔB1时,所述数据调整单元选取第一调节系数K1对所述用户权限值进行调整;
当ΔB1<ΔB≤ΔB2时,所述数据调整单元选取第二调节系数K2对所述用户权限值进行调整;
当ΔB>ΔB2时,所述数据调整单元选取第三调节系数K3对所述用户权限值进行调整;
当所述数据调整单元选取第i调节系数Ki对所述用户权限值进行调整时,设定i=1,2,3,所述调整单元将调整后的用户权限值设置为Ak,设定Ak=An×Ki,其中An为调节前用户权限值,n为大于零的正整数。
进一步地,所述数据划分模块在提取若干所述关键词时,根据所述企业数据的数据量W与预设数据量的比对结果确定提取所述关键词的数量,其中所述数据划分模块设有第一预设数据量W1、第二预设数据量W2、第一关键词数量G1、第二关键词数量G2以及第三关键词数量G3,其中W1<W2,G1<G2<G3,
当W≤W1时,所述数据划分模块确定所述关键词数量为G1;
当W1<W≤W2时,所述数据划分模块确定所述关键词数量为G2;
当W>W2时,所述数据划分模块确定所述关键词数量为G3。
进一步地,所述数据存储模块在所述数据划分模块划分数据完成时,生成所述第一企业数据对应的非存储数据库、第二企业数据和第三企业数据对应的存储数据库,所述访问识别单元中设有针对存储数据库的用户权限等级对应的用户权限值An;所述数据调整单元设有针对非存储数据库的数据存储时长t。
与现有技术相比,本发明的有益效果在于,本发明通过对企业数据进行获取,并通过设置数据划分模块数据进行划分,并针对划分完成的不同企业数据,设置可访问企业数据数据库的用户权限,和设置删除时间期限,从而保证对企业运营过程产生的数据的控制精准度,避免重要数据丢失或非重要数据删除不及时的问题,提高了企业数据库的运行效率。
尤其,本发明通过在数据划分模块设置访问识别单元和数据提取单元,并在数据划分模块划分企业运营产生的数据且存储在对应的数据库中时,通过访问识别单元对访问过程进行识别,从而确定用户是否可取用数据,并对用户访问过程的用户数据进行获取,提取用户访问过程是否存在违规访问,进一步提高了对企业运营过程产生的数据的控制精准度,从而进一步提高了数据库的运用效率。
进一步地,本发明通过在数据划分模块设置预设关联度,并在企业数据和关联大数据进行比对,从而确定企业数据是否为企业经营相关的数据,进而确定产生数据对企业的重要性,通过计算产生数据与大数据的关联度,并将计算得到的关联度与预设关联度进行比对,根据比对结果精确确定产生数据为重要数据或非重要数据,进一步提高了对企业运营过程产生的数据的控制精准度,从而进一步提高了数据库的运用效率。
进一步地,本发明在存储重要数据完成且有用户访问重要数据时,通过访问识别单元提取用户数据,并通过对用户数据的关键词进行敏感判断,从而确定用户访问是否合格,在用户访问合格时,通过数据提取单元提取数据给用户,在用户不合格时,根据用户历史的合格率确定用户是否可继续访问重要数据,进一步提高了对企业运营过程产生的数据的控制精准度,从而进一步提高了数据库的运用效率。
进一步地,本发明通过在数据提取单元设置多个预设合格率差值和最大数据量,并在确定用户可继续访问数据时,通过计算用户的违规率与预设违规率的第一合格率差值,根据第一合格率差值与多个预设合格率差值的比对结果确定用户可提取的最大数据量,进一步对企业运营过程产生的数据的控制精准度,从而进一步提高了数据库的运用效率。
进一步地,本发明通过在访问识别单元设置预设比例、多个预设比例差值和调整系数,并在确定用户访问不合格时,根据用户访问数据的关键词中存在敏感词的比例和预设比例的比对结果确定是否对用户权限值进行调节,以及在确定对用户权限值进行调节时,根据计算比例与预设比例的比例差值与多个预设比例差值的比对结果选取对应的调节系数对用户权限值进行调节,进一步提高了对企业运营过程产生的数据的控制精准度,从而进一步提高了数据库的运用效率。
附图说明
图1为本发明所述基于大数据的企业数据诊断系统的结构框图。
图中:1-数据获取模块,2-数据划分模块,3-数据存储模块。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明基于大数据的企业数据诊断系统的结构框图。
本发明实施例基于大数据的企业数据诊断系统,包括:
数据获取模块,其包括用以获取企业数据的数据获取单元;
数据划分模块,其与所述数据获取模块连接,所述数据划分模块用以对数据获取模块获取的所述企业数据进行划分;
数据存储模块,其与所述数据划分模块连接,所述数据存储模块用以将划分完成后的所述数据存储在对应的数据库;
其中,数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与所述企业数据相关的大数据进行关联,根据若干关键词和关联大数据的关联度确定所述企业数据的等级,并在数据访问过程中,获取用户历史数据,根据用户历史数据确定用户的合格率,且在确定用户合格率完成时,确定用户是否可继续访问数据库以及可访问数据库时可提取的最大数据量。
本发明实施例中,企业数据包括企业生产经营过程中产生的合同数据、财务数据、报表数据以及客户信息数据,其中,财务数据至少包括企业营业额、利润和税收,报表数据至少包括企业生产经营过程中日常产生的所有报表。本发明通过对企业上述数据进行分析,并通过提取上述数据中的关键词,例如,通过从合同数据中提取约定、合同、合作、甲乙方、项目名、项目种类、保密和银行账户等关键词,从财务数据中提取收款账户、付款账户、企业名称等关键词、从报表数据中提取项目中各项产品名称、型号等关键词,从客户信息数据中提取客户、客户名称、客户生产经营的项目等关键词。在获取上述关键词完成时,通过大数据分析,从而得到与本企业生产经营过程相关联的公开的数据。
具体而言,所述数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与企业数据的关联大数据进行比对,计算若干关键词与关联大数据的关联度R,设定R=D/Dz,根据该关联度R和预设关联度的比对结果确定所述企业数据的划分,其中D为若干所述关键词中与关联大数据中相同的数据量,Dz为关联大数据的数据量,所述预设关联度包括第一预设关联度R1和第二预设关联度R2,R1<R2,
若R≤R1,所述数据划分模块确定所述企业数据为第一企业数据;
若R1<R≤R2,所述数据划分模块确定所述企业数据为第二企业数据;
若R>R2,所述数据划分模块确定所述企业数据为第三企业数据。
具体而言,所述数据获取模块还包括用以获取用户的访问请求并确定用户访问请求是否合格的访问识别单元,分别与所述数据存储模块和访问识别单元连接的用以在确定所述用户访问请求合格时提取对应数据库中的数据的数据提取单元。
具体而言,所述访问识别单元在识别到用户访问请求时,获取用户权限,根据用户权限确定是否可访问和/或提取所述企业数据,并在确定可进行所述企业数据的访问和/或提取时,获取用户数据,所述访问识别单元在获取用户数据完成时,提取用户数据的关键词,并根据该用户数据的关键词确定用户访问是否合格,
若所述用户数据的关键词中存在敏感词,则所述访问识别单元确定用户访问不合格;
若所述用户数据的关键词中不存在敏感词,则所述访问识别单元确定用户访问合格。
具体而言,所述访问识别单元在确定所述用户访问不合格时,获取用户历史访问的合格率Y,设定Y=P/Pz,并根据该合格率Y与预设合格率Y0的比对结果确定用户是否可继续访问企业数据,其中P为历史访问不合格次数,Pz为历史访问总次数,
若Y≤Y0,所述访问识别单元确定用户仅可继续访问第一企业数据;
若Y>Y0,所述访问识别单元确定用户可继续访问企业数据。
具体而言,所述数据提取单元在所述访问识别单元确定用户可继续访问所述企业数据时,计算所述合格率Y与预设合格率Y0的第一合格率差值ΔYa,设定ΔYa=Y-Y0,并根据该第一合格率差值与预设合格率差值的比对结果确定用户可提取数据的最大数据量,
其中,所述数据提取单元设置有第一预设误差率差值ΔY1、第二预设误差率差值ΔY2、第一最大数据量Q1、第二最大数据量Q2以及第三最大数据量Q3,其中ΔY1<ΔY2,Q1<Q2<Q3,
当ΔYa≤ΔY1时,所述数据提取单元确定用户可提取数据的最大数据量为Q1;
当ΔY1<ΔYa≤ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q2;
当ΔYa>ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q3。
本发明实施例中,所述用户历史数据包括企业内部人员和企业外部人员在访问企业时产生的数据,通过对访问企业的访问人员的数据进行获取,并通过对历史访问产生数据进行分析,确定访问人员是否存在输入与企业生产经营不符的敏感词或与访问人员身份权限不符的敏感词,从而形成对访问人员的访问行为的监督。
具体而言,所述访问识别单元在确定所述用户访问不合格时,根据用户数据中敏感词在用户数据中的比例B与预设比例B0的比对结果确定是否对用户权限值进行调整,
若B>B0,则所述访问识别单元确定对所述用户权限值进行调整,
若B≤B0,则所述访问识别单元确定不对所述用户权限值进行调整。
具体而言,所述数据划分模块还包括与所述访问识别单元连接的数据调整单元,数据调整单元在确定所述访问识别单元对所述用户权限值进行调整时,计算所述比例B与预设比例B0的比例差值ΔB,设定ΔB=B-B0,并根据该比例差值与预设比例差值的比对结果选取对应的调节系数对用户权限值进行调整,
其中,所述数据调整单元设有第一预设比例差值ΔB1、第二预设比例差值ΔB2、第一调节系数K1、第二调节系数K2以及第三调节系数K3,其中ΔB1<ΔB2,设定0.5<K3<K2<K1<1,
当ΔB≤ΔB1时,所述数据调整单元选取第一调节系数K1对所述用户权限值进行调整;
当ΔB1<ΔB≤ΔB2时,所述数据调整单元选取第二调节系数K2对所述用户权限值进行调整;
当ΔB>ΔB2时,所述数据调整单元选取第三调节系数K3对所述用户权限值进行调整;
当所述数据调整单元选取第i调节系数Ki对所述用户权限值进行调整时,设定i=1,2,3,所述调整单元将调整后的用户权限值设置为Ak,设定Ak=An×Ki,其中An为调节前用户权限值,n为大于零的正整数。
具体而言,所述数据划分模块在提取若干所述关键词时,根据所述企业数据的数据量W与预设数据量的比对结果确定提取所述关键词的数量,其中所述数据划分模块设有第一预设数据量W1、第二预设数据量W2、第一关键词数量G1、第二关键词数量G2以及第三关键词数量G3,其中W1<W2,G1<G2<G3,
当W≤W1时,所述数据划分模块确定所述关键词数量为G1;
当W1<W≤W2时,所述数据划分模块确定所述关键词数量为G2;
当W>W2时,所述数据划分模块确定所述关键词数量为G3。
具体而言,所述数据存储模块在所述数据划分模块划分数据完成时,生成所述第一企业数据对应的非存储数据库、第二企业数据和第三企业数据对应的存储数据库,所述访问识别单元中设有针对存储数据库的用户权限等级对应的用户权限值An;所述数据调整单元设有针对非存储数据库的数据存储时长t。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于大数据的企业数据诊断系统,其特征在于,包括:
数据获取模块,其包括用以获取企业数据的数据获取单元;
数据划分模块,其与所述数据获取模块连接,所述数据划分模块用以对数据获取模块获取的所述企业数据进行划分;
数据存储模块,其与所述数据划分模块连接,所述数据存储模块用以将划分完成后的所述数据存储在对应的数据库;
其中,数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与所述企业数据相关的大数据进行关联,根据若干关键词和关联大数据的关联度确定所述企业数据的等级,并在数据访问过程中,获取用户历史数据,根据用户历史数据确定用户的合格率,且在确定用户合格率完成时,确定用户是否可继续访问数据库以及可访问数据库时可提取的最大数据量;
并根据用户数据中的敏感词比例确定是否对用户权限进行调整,以及在确定对用户权限进行调整时,根据敏感词比例确定对应的调节系数对用户权限值进行调整;
所述数据获取模块还包括用以获取用户的访问请求并确定用户访问请求是否合格的访问识别单元,分别与所述数据存储模块和访问识别单元连接的用以在确定所述用户访问请求合格时提取对应数据库中的数据的数据提取单元;
所述访问识别单元在识别到用户访问请求时,获取用户权限,根据用户权限确定是否可访问和/或提取所述企业数据,并在确定可进行所述企业数据的访问和/或提取时,获取用户数据,所述访问识别单元在获取用户数据完成时,提取用户数据的关键词,并根据该用户数据的关键词确定用户访问是否合格,
若所述用户数据的关键词中存在敏感词,则所述访问识别单元确定用户访问不合格;
若所述用户数据的关键词中不存在敏感词,则所述访问识别单元确定用户访问合格;
所述访问识别单元在确定所述用户访问不合格时,获取用户历史访问的合格率Y,设定Y=P/Pz,并根据该合格率Y与预设合格率Y0的比对结果确定用户是否可继续访问企业数据,其中P为历史访问不合格次数,Pz为历史访问总次数,
若Y≤Y0,所述访问识别单元确定用户仅可继续访问第一企业数据;
若Y>Y0,所述访问识别单元确定用户可继续访问企业数据;
所述数据提取单元在所述访问识别单元确定用户可继续访问所述企业数据时,计算所述合格率Y与预设合格率Y0的第一合格率差值ΔYa,设定ΔYa=Y-Y0,并根据该第一合格率差值与预设合格率差值的比对结果确定用户可提取数据的最大数据量。
2.根据权利要求1所述的基于大数据的企业数据诊断系统,其特征在于,所述数据划分模块在将所述企业数据进行划分时,提取所述企业数据的若干关键词,并将若干关键词与企业数据的关联大数据进行比对,计算若干关键词与关联大数据的关联度R,设定R=D/Dz,根据该关联度R和预设关联度的比对结果确定所述企业数据的划分,其中D为若干所述关键词中与关联大数据中相同的数据量,Dz为关联大数据的数据量,所述预设关联度包括第一预设关联度R1和第二预设关联度R2,R1<R2,
若R≤R1,所述数据划分模块确定所述企业数据为第一企业数据;
若R1<R≤R2,所述数据划分模块确定所述企业数据为第二企业数据;
若R>R2,所述数据划分模块确定所述企业数据为第三企业数据。
3.根据权利要求2所述的基于大数据的企业数据诊断系统,其特征在于所述数据提取单元设置有第一预设误差率差值ΔY1、第二预设误差率差值ΔY2、第一最大数据量Q1、第二最大数据量Q2以及第三最大数据量Q3,其中ΔY1<ΔY2,Q1<Q2<Q3,
当ΔYa≤ΔY1时,所述数据提取单元确定用户可提取数据的最大数据量为Q1;
当ΔY1<ΔYa≤ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q2;
当ΔYa>ΔY2时,所述数据提取单元确定用户可提取数据的最大数据量为Q3。
4.根据权利要求3所述的基于大数据的企业数据诊断系统,其特征在于,所述访问识别单元在确定所述用户访问不合格时,根据用户数据中敏感词在用户数据中的比例B与预设比例B0的比对结果确定是否对用户权限值进行调整,
若B>B0,则所述访问识别单元确定对所述用户权限值进行调整,
若B≤B0,则所述访问识别单元确定不对所述用户权限值进行调整。
5.根据权利要求4所述的基于大数据的企业数据诊断系统,其特征在于,所述数据划分模块还包括与所述访问识别单元连接的数据调整单元,数据调整单元在确定所述访问识别单元对所述用户权限值进行调整时,计算所述比例B与预设比例B0的比例差值ΔB,设定ΔB=B-B0,并根据该比例差值与预设比例差值的比对结果选取对应的调节系数对用户权限值进行调整,
其中,所述数据调整单元设有第一预设比例差值ΔB1、第二预设比例差值ΔB2、第一调节系数K1、第二调节系数K2以及第三调节系数K3,其中ΔB1<ΔB2,设定0.5<K3<K2<K1<1,
当ΔB≤ΔB1时,所述数据调整单元选取第一调节系数K1对所述用户权限值进行调整;
当ΔB1<ΔB≤ΔB2时,所述数据调整单元选取第二调节系数K2对所述用户权限值进行调整;
当ΔB>ΔB2时,所述数据调整单元选取第三调节系数K3对所述用户权限值进行调整;
当所述数据调整单元选取第i调节系数Ki对所述用户权限值进行调整时,设定i=1,2,3,所述调整单元将调整后的用户权限值设置为Ak,设定Ak=An×Ki,其中An为调节前用户权限值,n为大于零的正整数。
6.根据权利要求5所述的基于大数据的企业数据诊断系统,其特征在于,所述数据划分模块在提取若干所述关键词时,根据所述企业数据的数据量W与预设数据量的比对结果确定提取所述关键词的数量,其中所述数据划分模块设有第一预设数据量W1、第二预设数据量W2、第一关键词数量G1、第二关键词数量G2以及第三关键词数量G3,其中W1<W2,G1<G2<G3,
当W≤W1时,所述数据划分模块确定所述关键词数量为G1;
当W1<W≤W2时,所述数据划分模块确定所述关键词数量为G2;
当W>W2时,所述数据划分模块确定所述关键词数量为G3。
7.根据权利要求6所述的基于大数据的企业数据诊断系统,其特征在于,所述数据存储模块在所述数据划分模块划分数据完成时,生成所述第一企业数据对应的非存储数据库、第二企业数据和第三企业数据对应的存储数据库,所述访问识别单元中设有针对存储数据库的用户权限等级对应的用户权限值An;所述数据调整单元设有针对非存储数据库的数据存储时长t。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210850105.0A CN115080546B (zh) | 2022-07-20 | 2022-07-20 | 一种基于大数据的企业数据诊断系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210850105.0A CN115080546B (zh) | 2022-07-20 | 2022-07-20 | 一种基于大数据的企业数据诊断系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115080546A CN115080546A (zh) | 2022-09-20 |
CN115080546B true CN115080546B (zh) | 2022-11-11 |
Family
ID=83259687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210850105.0A Active CN115080546B (zh) | 2022-07-20 | 2022-07-20 | 一种基于大数据的企业数据诊断系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080546B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115454951B (zh) * | 2022-10-18 | 2023-06-30 | 读书郎教育科技有限公司 | 一种教学数据共享系统 |
CN115935400A (zh) * | 2023-03-10 | 2023-04-07 | 山东科技职业学院 | 一种基于工业互联网的数据加密存储系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2565814A2 (en) * | 2011-09-02 | 2013-03-06 | Tata Consultancy Services Limited | Assigning access rights in enterprise digital rights management systems |
CN106682527A (zh) * | 2016-12-25 | 2017-05-17 | 北京明朝万达科技股份有限公司 | 一种基于数据分类分级的数据安全管控方法及系统 |
CN109597843A (zh) * | 2018-12-19 | 2019-04-09 | 北京锐安科技有限公司 | 大数据环境的数据管理方法、装置、存储介质及电子设备 |
CN114003943A (zh) * | 2021-12-31 | 2022-02-01 | 北京国信网联科技有限公司 | 一种用于机房托管管理的安全双控管理平台 |
CN114418246A (zh) * | 2022-03-30 | 2022-04-29 | 深圳谱盈科技有限公司 | 基于大数据的项目预测系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921514B (zh) * | 2018-07-02 | 2019-12-06 | 深圳云集智造系统技术有限公司 | 一种基于互联网的企业移动办公系统 |
CN112464215B (zh) * | 2020-12-15 | 2024-06-04 | 深圳市中博科创信息技术有限公司 | 一种针对企业服务系统的身份鉴别及控制方法 |
-
2022
- 2022-07-20 CN CN202210850105.0A patent/CN115080546B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2565814A2 (en) * | 2011-09-02 | 2013-03-06 | Tata Consultancy Services Limited | Assigning access rights in enterprise digital rights management systems |
CN106682527A (zh) * | 2016-12-25 | 2017-05-17 | 北京明朝万达科技股份有限公司 | 一种基于数据分类分级的数据安全管控方法及系统 |
CN109597843A (zh) * | 2018-12-19 | 2019-04-09 | 北京锐安科技有限公司 | 大数据环境的数据管理方法、装置、存储介质及电子设备 |
CN114003943A (zh) * | 2021-12-31 | 2022-02-01 | 北京国信网联科技有限公司 | 一种用于机房托管管理的安全双控管理平台 |
CN114418246A (zh) * | 2022-03-30 | 2022-04-29 | 深圳谱盈科技有限公司 | 基于大数据的项目预测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115080546A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115080546B (zh) | 一种基于大数据的企业数据诊断系统 | |
CN112001586B (zh) | 基于区块链共识机制的企业联网大数据审计风险控制架构 | |
CN110781930A (zh) | 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统 | |
CN112699175A (zh) | 一种数据治理系统及其方法 | |
CN108763957A (zh) | 一种数据库的安全审计系统、方法及服务器 | |
CN110008201A (zh) | 一种面向大数据的数据质量稽核监控方法 | |
WO2023071761A1 (zh) | 一种异常定位方法及装置 | |
CN118133339B (zh) | 一种基于数据行为特征分析的合规智能预警系统及预警方法 | |
CN113127563B (zh) | 一种基于区块链的智能零售管理方法及系统 | |
CN109039710A (zh) | 路由数据稽核方法、装置、服务器及存储介质 | |
CN116976318A (zh) | 基于深度学习和模型推理的电网倒闸操作票智能审核系统 | |
CN116881687B (zh) | 一种基于特征提取的电网敏感数据识别方法及装置 | |
CN112910974B (zh) | 一种基于区块链系统架构的系统及方法 | |
CN116055194A (zh) | 一种面向大数据平台的基于群体画像的安全评估方法 | |
CN116108030A (zh) | 基于联盟链的企业平台数据关联方法 | |
CN115033464A (zh) | 一种基于人工智能的分布式灾备演练数据预警方法及系统 | |
CN109308606A (zh) | 一种基于bim技术的建筑工程成本管理系统及方法 | |
CN113822679A (zh) | 一种自动决策的智能反欺诈贷中管理系统及方法 | |
CN115423361A (zh) | 风险视图的数据处理方法、装置、存储介质和设备 | |
CN115600168A (zh) | 一种安全型数据库系统 | |
CN115239066A (zh) | 一种通信信息化数据管控平台 | |
CN114706881A (zh) | 一种基于数据库中间件针对高危查询sql的方法 | |
Zhou et al. | Design of intelligent power material storage information management system based on blockchain technology | |
CN117726435B (zh) | 一种影像数据管理方法及系统 | |
CN116821867B (zh) | 权限授权数据的回收管理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |