CN116226213B - 一种基于大数据的信息推荐系统及方法 - Google Patents

一种基于大数据的信息推荐系统及方法 Download PDF

Info

Publication number
CN116226213B
CN116226213B CN202310146868.1A CN202310146868A CN116226213B CN 116226213 B CN116226213 B CN 116226213B CN 202310146868 A CN202310146868 A CN 202310146868A CN 116226213 B CN116226213 B CN 116226213B
Authority
CN
China
Prior art keywords
data
enterprise
analysis unit
module
referenceable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310146868.1A
Other languages
English (en)
Other versions
CN116226213A (zh
Inventor
杨永秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jilian Information Technology Co ltd
Original Assignee
Guangzhou Jilian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jilian Information Technology Co ltd filed Critical Guangzhou Jilian Information Technology Co ltd
Priority to CN202310146868.1A priority Critical patent/CN116226213B/zh
Publication of CN116226213A publication Critical patent/CN116226213A/zh
Application granted granted Critical
Publication of CN116226213B publication Critical patent/CN116226213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于大数据的信息推荐系统及方法,涉及大数据信息推荐技术领域,包括:数据获取模块,用以获取用户企业的历史运营数据;数据溯源模块,用以得到所述运营数据的数据源特征;大数据分析模块,用以进行大数据运营数据提取和分析;数据库模块,用以存储用户企业运营数据和从大数据中提取的数据;信息推荐模块,用以将可参考数据和影响系数等推荐给评估模块;评估模块,用以评估企业未来的运营数据。本发明能够根据企业当前的运营状况进行信息推荐,为企业下一阶段的运营数据评估提供参考,用以解决难以高效、准确地从海量数据中提取信息并保证信息的有效性的问题。

Description

一种基于大数据的信息推荐系统及方法
技术领域
本发明涉及大数据信息推荐技术领域,尤其涉及一种基于大数据的信息推荐系统及方法。
背景技术
随着现代信息技术的不断发展,人们已进入大数据时代,基于大数据的数据挖掘有助于企业在竞争激烈的市场环境中快速有效的挖掘出对管理和决策有效的信息与学问,能够帮助企业更好的收集整合数据,对企业当前情况进行分析,为未来走向提供参考依据。
中国专利公开号CN110750583A公开了一种基于大数据的计算机数据挖掘探索方法及系统,其方法包括以下步骤,采集计算机数据,形成原始大数据;对原始大数据进行预处理,并存入数据仓库;基于支持向量机、模式查询和数据挖掘工具构建数据挖掘模型,并利用数据挖掘模型在数据仓库中进行数据挖掘;得到挖掘数据;基于遗传算法对挖掘数据进行探索分析,得到挖掘探索信息。该发明采用网络爬虫抓取数据的方式进行数据的收集整理,采用数据的全量抽取和增量抽取的方式进行数据的提取、转换、加载并存入数据仓库供数据挖掘和数据探索作铺垫,并利用支持向量机、模式查询和数据挖掘工具进行数据挖掘,以及利用遗传算法进行数据探索,可以全面高效的挖掘出大数据中的有效信息。
然而现有技术大都致力于改进数据挖掘算法,如何高效、准确地从海量数据中提取信息并保证信息的有效性仍是亟待解决的问题。
发明内容
为此,本发明提供一种基于大数据的信息推荐系统及方法,能够根据企业当前的运营状况进行信息推荐,为企业下一阶段的运营数据评估提供参考,用以解决难以高效、准确地从海量数据中提取信息并保证信息的有效性的问题。
为实现上述目的,本发明提供一种基于大数据的信息推荐系统,包括:
数据获取模块,用以获取用户企业的运营数据,并将数据存储至数据库模块;
数据溯源模块,其与所述数据获取模块相连接,用以对所述数据获取模块获取的运营数据进行溯源,得到所述运营数据的数据源,同时分析所述数据源的数据源特征;
大数据分析模块,其与所述数据溯源模块相连接,用以进行大数据中运营数据的提取和分析,包括,
数据提取单元,用以从大数据中提取所述运营数据和与用户企业关联的上、下游企业的关联运营数据的数据源特征相同或吻合的其他企业的运营数据;
数据分析单元,用以分析所述用户企业的运营数据和/或所述关联运营数据与所述其他企业的运营数据的相似度,判断所述数据提取单元提取的运营数据是否为可参考数据,并记录和分析可参考数据的数据量,判断所述数据量是否达标,以及计算和分析上、下游企业的影响系数;
数据库模块,其与所述数据获取模块和所述大数据分析模块相连接,包括用以存储用户企业运营数据的第一数据库,用以存储所述数据提取单元提取的与用户企业的运营数据的数据源特征相同的其他企业的相同运营数据的第二数据库,以及用以存储所述数据提取单元提取的与用户企业运营数据的数据源特征吻合的其他企业的吻合运营数据的第三数据库;
信息推荐模块,其与所述大数据分析模块和数据库模块相连接,用以将可参考数据和用户企业的上、下游企业的影响系数推荐给评估模块并在总影响系数超限的条件下进行补充推荐;
评估模块,其与所述信息推荐模块相连接,用以评估企业未来的运营数据。
进一步地,所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N,并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1,计算相同特征比例B,B=N1/N,并将其与相同特征比例标准进行比对,以判断数据源特征是否吻合,所述数据提取单元中设有相同特征比例标准B1,
若所述数据提取单元计算相同特征比例处于第一比例水平,则所述数据提取单元判定数据源特征不吻合;
若所述数据提取单元计算相同特征比例处于第二比例水平,则所述数据提取单元判定数据源特征吻合;
其中,所述第一比例水平为B<B1,第二比例水平为B≥B1;
进一步地,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1,并将其与相似度标准进行比对,以判断所述企业的运营数据是否为可参考数据,所述数据分析单元设有相似度标准S0,
若所述数据分析单元分析相似度处于第一相似度水平,则所述数据分析单元判定相似度不达标,所述企业的运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第二相似度水平,则所述数据分析单元判定相似度达标,所述企业的运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第一相似度水平为S1<S0,第二相似度水平为S1≥S0;
进一步地,所述数据分析单元记录可参考数据量D,并将其与可参考数据量标准进行比对,以判断可参考数据量是否达标,所述数据分析单元设有可参考数据量标准D1,
若所述数据分析单元分析可参考数据量处于第一数据量水平,则所述数据分析单元判定可参考数据量不达标;
若所述数据分析单元分析可参考数据量处于第二数据量水平,则所述数据分析单元判定可参考数据量达标;
其中,所述第一数据量水平为D<D1,第二数据量水平为D≥D1;
进一步地,若所述数据分析单元判定可参考数据量不达标,则所述数据提取单元从所述第三数据库中提取所述吻合运营数据,所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2,并将其与相似度标准S0进行比对,以判断所述吻合运营数据是否为可参考数据,
若所述数据分析单元分析相似度处于第三相似度水平,则所述数据分析单元判定相似度不达标,所述吻合运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第四相似度水平,则所述数据分析单元判定相似度达标,所述吻合运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第三相似度水平为S2<S0,第四相似度水平为S2≥S0;
进一步地,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正,所述数据分析单元计算数据量缺口比Q,并将其与数据量缺口比标准进行比对,根据比对结果对所述相似度标准进行修正,通过以下公式计算数据量缺口比Q,
所述数据分析单元设有第一数据量缺口比标准Q1和第二数据量缺口比标准Q2,所述数据分析单元还设有第一修正系数K1、第二修正系数K2和第三修正系数K3,其中Q1<Q2,0<K3<K2<K1<1,
在第一数据量缺口比对比结果下,所述数据分析单元采用第一修正系数K1对相似度标准进行修正;
在第二数据量缺口比对比结果下,所述数据分析单元采用第二修正系数K2对相似度标准进行修正;
在第三数据量缺口比对比结果下,所述数据分析单元采用第三修正系数K3对相似度标准进行修正;
其中,所述第一数据量缺口比对比结果为Q≤Q1,第二数据量缺口比对比结果为Q1<Q≤Q2,第三数据量缺口比对比结果为Q>Q2;
所述数据分析单元设置修正后的相似度标准为S0′=S0×Ki,i=1,2,3。
进一步地,所述大数据分析模块分析用户企业的上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算第i个上游或下游企业影响系数δi,由以下公式计算得到,
δi=ΔEi×αi×βi, i=1,2,3…n (2)
其中,ΔE i为所述上游或下游企业未来营收变化的预测值,αi为所述上游或下游企业营收中与用户企业相关联业务营收所占的比例,βi为用户企业营收中与所述上游或下游企业相关联业务营收所占的比例,n为用户企业上、下游企业的总个数;
所述信息推荐模块将用户企业所有上、下游企业的影响系数推荐给评估模块;
进一步地,所述数据分析单元计算用户企业上、下游企业的总影响系数δ,由以下公式计算得到,
所述数据分析单元设有总影响系数标准δa,将其与所述总影响系数δ进行比对,以判断总影响系数是否超限,
若所述数据分析单元分析总影响系数处于第一总影响系数水平,则所述数据分析单元判定总影响系数未超限;
若所述数据分析单元分析总影响系数处于第二总影响系数水平,则所述数据分析单元判定总影响系数超限;
其中,所述第一总影响系数水平为δ≤δa,第二总影响系数水平为δ>δa;
进一步地,若所述数据分析单元判定总影响系数超限,所述数据分析单元计算总影响系数超差Δδ,Δδ=δ-δa,并将其与总影响系数超差标准Δδa进行比对,以确定数据的推荐方案,
在第一影响系数超差对比结果下,所述信息推荐模块采用第一推荐方案进行补充推荐;
在第二影响系数超差对比结果下,所述信息推荐模块采用第二推荐方案进行补充推荐;
其中,所述第一影响系数超差对比结果为Δδ≤Δδa,第二影响系数超差对比结果为Δδ>Δδa;
所述第一推荐方案为所述数据分析单元分析第二数据库中单个企业的上、下游企业的总影响系数δ′,若δ′≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块;
所述第二推荐方案为所述数据分析单元分析第二数据库和第三数据库中单个企业的上、下游企业的总影响系数δ″,若δ″≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块;
进一步地,本发明提供一种基于大数据的信息推荐方法,包括以下步骤:
步骤S1,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S2,所述数据分析单元记录可参考数据量,判断可参考数据量是否达标,则所述数据提取单元从所述第三数据库中提取运营数据;
步骤S3,所述数据分析单元分析第三数据库中某企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S4,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正;
步骤S5,所述大数据分析模块分析用户企业上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算上、下游企业的影响系数,所述信息推荐模块将所述影响系数推荐给评估模块;
步骤S6,所述数据分析单元计算用户企业上、下游企业的总影响系数并判断其是否超限,若所述数据分析单元判定总影响系数超限,则所述信息推荐模块进行运营数据的补充推荐。
与现有技术相比,本发明的有益效果在于,本发明获取用户企业的历史运营数据,存储至第一数据库,并对数据进行溯源,分析数据源的特征,其特征包括数据源的行业、领域和业务内容等,数据提取单元从大数据中提取与用户企业数据源特征相同或吻合的其他企业的运营数据分别存储至第二数据库和第三数据库,从而从海量的大数据当中筛选得到行业、领域和业务内容等相同或近似的企业的运营数据,大大缩小了数据的搜索范围,提升了信息提取的效率和准确性,提高了信息推荐的有效性。
进一步地,本发明所述数据分析单元分析第二数据库中某企业的运营数据与第一数据库中运营数据的相似度,将相似度达标的企业的运营数据判定为可参考数据,并将可参考数据推荐至评估模块作为评估企业未来运营数据的参考,从而进一步提升了信息提取的效率和准确性,保证了信息推荐的有效性。
进一步地,本发明所述数据分析单元记录可参考数据量,判断可参考数据量是否达标,若判定可参考数据量不达标,则所述数据提取单元从所述第三数据库中提取相似度达标的运营数据,以保证推荐的可参考数据量充足,确保后续评估的准确性,从而进一步保证了信息推荐的有效性。
进一步地,本发明所述大数据分析模块分析用户企业的上、下游企业的影响系数,并将影响系数推荐给评估模块,该影响系数反映了上、下游企业未来营收变化对用户企业未来运营数据的影响,考虑该影响可提高后续评估的准确性,从而进一步保证了信息推荐的有效性。
进一步地,所述数据分析单元计算用户企业上、下游企业的总影响系数,并判断总影响系数是否超限,总影响系数超限表示上、下游企业未来营收变化对用户企业未来运营数据具有重大影响,所述信息推荐模块将第二数据库或第三数据库中出现过总影响系数超限的企业的运营数据补充推荐至评估模块,提供遭遇此特殊情况的数据参考,从而进一步保证了信息推荐的有效性。
附图说明
图1为本发明所述基于大数据的信息推荐系统的结构示意图;
图2为本发明所述基于大数据的信息推荐系统中大数据分析模块的结构示意图;
图3为本发明所述基于大数据的信息推荐系统中数据库模块的结构示意图;
图4为本发明所述基于大数据的信息推荐方法的步骤流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1至图3所示,图1为本发明所述基于大数据的信息推荐系统的结构示意图,图2为本发明所述基于大数据的信息推荐系统中大数据分析模块的结构示意图,图3为本发明所述基于大数据的信息推荐系统中数据库模块的结构示意图。
本发明实施例一种基于大数据的信息推荐系统,包括:
数据获取模块,用以获取用户企业的运营数据,并将数据存储至数据库模块;
数据溯源模块,其与所述数据获取模块相连接,用以对所述数据获取模块获取的运营数据进行溯源,得到所述运营数据的数据源,同时分析所述数据源的数据源特征;
大数据分析模块,其与所述数据溯源模块相连接,用以进行大数据中运营数据的提取和分析,包括,
数据提取单元,用以从大数据中提取所述运营数据和与用户企业关联的上、下游企业的关联运营数据的数据源特征相同或吻合的其他企业的运营数据;
数据分析单元,用以分析所述用户企业的运营数据和/或所述关联运营数据与所述其他企业的运营数据的相似度,判断所述数据提取单元提取的运营数据是否为可参考数据,并记录和分析可参考数据的数据量,判断所述数据量是否达标,以及计算和分析上、下游企业的影响系数;
数据库模块,其与所述数据获取模块和所述大数据分析模块相连接,包括用以存储用户企业运营数据的第一数据库,用以存储所述数据提取单元提取的与用户企业的运营数据的数据源特征相同的其他企业的相同运营数据的第二数据库,以及用以存储所述数据提取单元提取的与用户企业运营数据的数据源特征吻合的其他企业的吻合运营数据的第三数据库;
信息推荐模块,其与所述大数据分析模块和数据库模块相连接,用以将可参考数据和用户企业的上、下游企业的影响系数推荐给评估模块并在总影响系数超限的条件下进行补充推荐;
评估模块,其与所述信息推荐模块相连接,用以评估企业未来的运营数据。具体而言,所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N,并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1,计算相同特征比例B,B=N1/N,并将其与相同特征比例标准进行比对,以判断数据源特征是否吻合,所述数据提取单元中设有相同特征比例标准B1,
若所述数据提取单元计算相同特征比例处于第一比例水平,则所述数据提取单元判定数据源特征不吻合;
若所述数据提取单元计算相同特征比例处于第二比例水平,则所述数据提取单元判定数据源特征吻合;
其中,所述第一比例水平为B<B1,第二比例水平为B≥B1;
具体而言,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1,并将其与相似度标准进行比对,以判断所述企业的运营数据是否为可参考数据,所述数据分析单元设有相似度标准S0,
若所述数据分析单元分析相似度处于第一相似度水平,则所述数据分析单元判定相似度不达标,所述企业的运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第二相似度水平,则所述数据分析单元判定相似度达标,所述企业的运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第一相似度水平为S1<S0,第二相似度水平为S1≥S0;
具体而言,所述数据分析单元记录可参考数据量D,并将其与可参考数据量标准进行比对,以判断可参考数据量是否达标,所述数据分析单元设有可参考数据量标准D1,
若所述数据分析单元分析可参考数据量处于第一数据量水平,则所述数据分析单元判定可参考数据量不达标;
若所述数据分析单元分析可参考数据量处于第二数据量水平,则所述数据分析单元判定可参考数据量达标;
其中,所述第一数据量水平为D<D1,第二数据量水平为D≥D1;
具体而言,若所述数据分析单元判定可参考数据量不达标,则所述数据提取单元从所述第三数据库中提取所属吻合运营数据,所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2,并将其与相似度标准S0进行比对,以判断所述吻合运营数据是否为可参考数据,
若所述数据分析单元分析相似度处于第三相似度水平,则所述数据分析单元判定相似度不达标,所述吻合运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第四相似度水平,则所述数据分析单元判定相似度达标,所述吻合运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第三相似度水平为S2<S0,第四相似度水平为S2≥S0;
具体而言,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正,所述数据分析单元计算数据量缺口比Q,并将其与数据量缺口比标准进行比对,根据比对结果对所述相似度标准进行修正,通过以下公式计算数据量缺口比Q,
所述数据分析单元设有第一数据量缺口比标准Q1和第二数据量缺口比标准Q2,所述数据分析单元还设有第一修正系数K1、第二修正系数K2和第三修正系数K3,其中Q1<Q2,0<K3<K2<K1<1,
在第一数据量缺口比对比结果下,所述数据分析单元采用第一修正系数K1对相似度标准进行修正;
在第二数据量缺口比对比结果下,所述数据分析单元采用第二修正系数K2对相似度标准进行修正;
在第三数据量缺口比对比结果下,所述数据分析单元采用第三修正系数K3对相似度标准进行修正;
其中,所述第一数据量缺口比对比结果为Q≤Q1,第二数据量缺口比对比结果为Q1<Q≤Q2,第三数据量缺口比对比结果为Q>Q2;
所述数据分析单元设置修正后的相似度标准为S0′=S0×Ki,i=1,2,3。
具体而言,所述大数据分析模块分析用户企业的上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算第i个上游或下游企业影响系数δi,由以下公式计算得到,
δi=ΔEi×αi×βi, i=1,2,3…n (2)
其中,ΔEi为所述上游或下游企业未来营收变化的预测值,αi为所述上游或下游企业营收中与用户企业相关联业务营收所占的比例,βi为用户企业营收中与所述上游或下游企业相关联业务营收所占的比例,n为用户企业上、下游企业的总个数;
所述信息推荐模块将用户企业所有上、下游企业的影响系数推荐给评估模块;
具体而言,所述数据分析单元计算用户企业上、下游企业的总影响系数δ,由以下公式计算得到,
所述数据分析单元设有总影响系数标准δa,将其与所述总影响系数δ进行比对,以判断总影响系数是否超限,
若所述数据分析单元分析总影响系数处于第一总影响系数水平,则所述数据分析单元判定总影响系数未超限;
若所述数据分析单元分析总影响系数处于第二总影响系数水平,则所述数据分析单元判定总影响系数超限;
其中,所述第一总影响系数水平为δ≤δa,第二总影响系数水平为δ>δa;
具体而言,若所述数据分析单元判定总影响系数超限,所述数据分析单元计算总影响系数超差Δδ,Δδ=δ-δa,并将其与总影响系数超差标准Δδa进行比对,以确定数据的推荐方案,
在第一影响系数超差对比结果下,所述信息推荐模块采用第一推荐方案进行补充推荐;
在第二影响系数超差对比结果下,所述信息推荐模块采用第二推荐方案进行补充推荐;
其中,所述第一影响系数超差对比结果为Δδ≤Δδa,第二影响系数超差对比结果为Δδ>Δδa;
所述第一推荐方案为所述数据分析单元分析第二数据库中单个企业的上、下游企业的总影响系数δ′,若δ′≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块;
所述第二推荐方案为所述数据分析单元分析第二数据库和第三数据库中单个企业的上、下游企业的总影响系数δ″,若δ″≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块;
请参阅图4所示,图4为本发明所述基于大数据的信息推荐方法的步骤流程图;
具体而言,本发明实施例提供一种基于大数据的信息推荐方法,包括以下步骤:
步骤S1,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S2,所述数据分析单元记录可参考数据量,判断可参考数据量是否达标,则所述数据提取单元从所述第三数据库中提取运营数据;
步骤S3,所述数据分析单元分析第三数据库中某企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S4,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正;
步骤S5,所述大数据分析模块分析用户企业上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算上、下游企业的影响系数,所述信息推荐模块将所述影响系数推荐给评估模块;
步骤S6,所述数据分析单元计算用户企业上、下游企业的总影响系数并判断其是否超限,若所述数据分析单元判定总影响系数超限,则所述信息推荐模块进行运营数据的补充推荐。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的信息推荐系统,包括用以评估企业未来的运营数据的评估模块,其特征在于,还包括:
数据获取模块,用以获取用户企业的运营数据,并将数据存储至数据库模块;
数据溯源模块,其与所述数据获取模块相连接,用以对所述数据获取模块获取的运营数据进行溯源,得到所述运营数据的数据源,同时分析所述数据源的数据源特征;
大数据分析模块,其与所述数据溯源模块相连接,用以进行大数据中运营数据的提取和分析,包括,
数据提取单元,用以从大数据中提取所述运营数据和与用户企业关联的上、下游企业的关联运营数据的数据源特征相同或吻合的其他企业的运营数据;
数据分析单元,用以分析所述用户企业的运营数据和/或所述关联运营数据与所述其他企业的运营数据的相似度,判断所述数据提取单元提取的运营数据是否为可参考数据,并记录和分析可参考数据的数据量,判断所述数据量是否达标,以及计算和分析上、下游企业的影响系数;
数据库模块,其与所述数据获取模块和所述大数据分析模块相连接,包括用以存储用户企业运营数据的第一数据库,用以存储所述数据提取单元提取的与用户企业的运营数据的数据源特征相同的其他企业的相同运营数据的第二数据库,以及用以存储所述数据提取单元提取的与用户企业运营数据的数据源特征吻合的其他企业的吻合运营数据的第三数据库;
信息推荐模块,其与所述大数据分析模块和数据库模块相连接,用以将可参考数据和用户企业的上、下游企业的影响系数推荐给评估模块并在总影响系数超限的条件下进行补充推荐。
2.根据权利要求1所述的基于大数据的信息推荐系统,其特征在于,所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N,并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1,计算相同特征比例B,B=N1/N,并将其与相同特征比例标准进行比对,以判断数据源特征是否吻合,所述数据提取单元中设有相同特征比例标准B1,
若所述数据提取单元计算相同特征比例处于第一比例水平,则所述数据提取单元判定数据源特征不吻合;
若所述数据提取单元计算相同特征比例处于第二比例水平,则所述数据提取单元判定数据源特征吻合;
其中,所述第一比例水平为B<B1,第二比例水平为B≥B1。
3.根据权利要求2所述的基于大数据的信息推荐系统,其特征在于,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1,并将其与相似度标准进行比对,以判断所述企业的运营数据是否为可参考数据,所述数据分析单元设有相似度标准S0,
若所述数据分析单元分析相似度处于第一相似度水平,则所述数据分析单元判定相似度不达标,所述企业的运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第二相似度水平,则所述数据分析单元判定相似度达标,所述企业的运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第一相似度水平为S1<S0,第二相似度水平为S1≥S0。
4.根据权利要求3所述的基于大数据的信息推荐系统,其特征在于,所述数据分析单元记录可参考数据量D,并将其与可参考数据量标准进行比对,以判断可参考数据量是否达标,所述数据分析单元设有可参考数据量标准D1,
若所述数据分析单元分析可参考数据量处于第一数据量水平,则所述数据分析单元判定可参考数据量不达标;
若所述数据分析单元分析可参考数据量处于第二数据量水平,则所述数据分析单元判定可参考数据量达标;
其中,所述第一数据量水平为D<D1,第二数据量水平为D≥D1。
5.根据权利要求4所述的基于大数据的信息推荐系统,其特征在于,若所述数据分析单元判定可参考数据量不达标,则所述数据提取单元从所述第三数据库中提取所述吻合运营数据,所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2,并将其与相似度标准S0进行比对,以判断所述吻合运营数据是否为可参考数据,
若所述数据分析单元分析相似度处于第三相似度水平,则所述数据分析单元判定相似度不达标,所述吻合运营数据为不可参考数据;
若所述数据分析单元分析相似度处于第四相似度水平,则所述数据分析单元判定相似度达标,所述吻合运营数据为可参考数据,所述信息推荐模块将其推荐给评估模块;
其中,所述第三相似度水平为S2<S0,第四相似度水平为S2≥S0。
6.根据权利要求5所述的基于大数据的信息推荐系统,其特征在于,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正,所述数据分析单元计算数据量缺口比Q,并将其与数据量缺口比标准进行比对,根据比对结果对所述相似度标准进行修正,通过以下公式计算数据量缺口比Q,
所述数据分析单元设有第一数据量缺口比标准Q1和第二数据量缺口比标准Q2,所述数据分析单元还设有第一修正系数K1、第二修正系数K2和第三修正系数K3,其中Q1<Q2,0<K3<K2<K1<1,
在第一数据量缺口比对比结果下,所述数据分析单元采用第一修正系数K1对相似度标准进行修正;
在第二数据量缺口比对比结果下,所述数据分析单元采用第二修正系数K2对相似度标准进行修正;
在第三数据量缺口比对比结果下,所述数据分析单元采用第三修正系数K3对相似度标准进行修正;
其中,所述第一数据量缺口比对比结果为Q≤Q1,第二数据量缺口比对比结果为Q1<Q≤Q2,第三数据量缺口比对比结果为Q>Q2;
所述数据分析单元设置修正后的相似度标准为S0′=S0×Ki,i=1,2,3。
7.根据权利要求6所述的基于大数据的信息推荐系统,其特征在于,所述大数据分析模块分析用户企业的上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算第i个上游或下游企业影响系数δi,由以下公式计算得到,
δi=ΔEi×αi×βi, i=1,2,3…n (2)
其中,ΔEi为所述上游或下游企业未来营收变化的预测值,αi为所述上游或下游企业营收中与用户企业相关联业务营收所占的比例,βi为用户企业营收中与所述上游或下游企业相关联业务营收所占的比例,n为用户企业上、下游企业的总个数;
所述信息推荐模块将用户企业所有上、下游企业的影响系数推荐给评估模块。
8.根据权利要求7所述的基于大数据的信息推荐系统,其特征在于,所述数据分析单元计算用户企业上、下游企业的总影响系数δ,由以下公式计算得到,
所述数据分析单元设有总影响系数标准δa,将其与所述总影响系数δ进行比对,以判断总影响系数是否超限,
若所述数据分析单元分析总影响系数处于第一总影响系数水平,则所述数据分析单元判定总影响系数未超限;
若所述数据分析单元分析总影响系数处于第二总影响系数水平,则所述数据分析单元判定总影响系数超限;
其中,所述第一总影响系数水平为δ≤δa,第二总影响系数水平为δ>δa。
9.根据权利要求8所述的基于大数据的信息推荐系统,其特征在于,若所述数据分析单元判定总影响系数超限,所述数据分析单元计算总影响系数超差Δδ,Δδ=δ-δa,并将其与总影响系数超差标准Δδa进行比对,以确定数据的推荐方案,
在第一影响系数超差对比结果下,所述信息推荐模块采用第一推荐方案进行补充推荐;
在第二影响系数超差对比结果下,所述信息推荐模块采用第二推荐方案进行补充推荐;
其中,所述第一影响系数超差对比结果为Δδ≤Δδa,第二影响系数超差对比结果为Δδ>Δδa;
所述第一推荐方案为所述数据分析单元分析第二数据库中单个企业的上、下游企业的总影响系数δ′,若δ′≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块;
所述第二推荐方案为所述数据分析单元分析第二数据库和第三数据库中单个企业的上、下游企业的总影响系数δ″,若δ″≥δa,则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块。
10.一种应用于权利要求1-9任一项所述的基于大数据的信息推荐系统的信息推荐方法,其特征在于,包括以下步骤:
步骤S1,所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S2,所述数据分析单元记录可参考数据量,判断可参考数据量是否达标,则所述数据提取单元从所述第三数据库中提取运营数据;
步骤S3,所述数据分析单元分析第三数据库中某企业的运营数据与第一数据库中运营数据的相似度,判断该企业的运营数据是否为可参考数据,若该企业的运营数据为可参考数据,则所述信息推荐模块将其推荐给评估模块;
步骤S4,所述数据分析单元再次判断可参考数据量是否达标,若所述数据分析单元判定可参考数据量仍不达标,则所述数据分析单元对所述相似度标准进行修正;
步骤S5,所述大数据分析模块分析用户企业上、下游企业的可参考数据,所述信息推荐模块将所述可参考数据推荐给评估模块,所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值,所述数据分析单元计算上、下游企业的影响系数,所述信息推荐模块将所述影响系数推荐给评估模块;
步骤S6,所述数据分析单元计算用户企业上、下游企业的总影响系数并判断其是否超限,若所述数据分析单元判定总影响系数超限,则所述信息推荐模块进行运营数据的补充推荐。
CN202310146868.1A 2023-02-22 2023-02-22 一种基于大数据的信息推荐系统及方法 Active CN116226213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310146868.1A CN116226213B (zh) 2023-02-22 2023-02-22 一种基于大数据的信息推荐系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310146868.1A CN116226213B (zh) 2023-02-22 2023-02-22 一种基于大数据的信息推荐系统及方法

Publications (2)

Publication Number Publication Date
CN116226213A CN116226213A (zh) 2023-06-06
CN116226213B true CN116226213B (zh) 2023-11-10

Family

ID=86572672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310146868.1A Active CN116226213B (zh) 2023-02-22 2023-02-22 一种基于大数据的信息推荐系统及方法

Country Status (1)

Country Link
CN (1) CN116226213B (zh)

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647460A (zh) * 2012-03-30 2012-08-22 华为技术有限公司 一种业务数据下载方法和移动终端
CN103488657A (zh) * 2012-06-14 2014-01-01 华为技术有限公司 一种数据表关联方法及装置
CN103699550A (zh) * 2012-09-27 2014-04-02 腾讯科技(深圳)有限公司 数据挖掘系统及数据挖掘方法
CN104299105A (zh) * 2014-11-02 2015-01-21 中国科学院软件研究所 一种支持复杂企业环境的信用数据管理系统及方法
CN104699735A (zh) * 2014-11-20 2015-06-10 国家电网公司 企业级数据中心的数据处理方法及装置
CN104966133A (zh) * 2015-06-11 2015-10-07 安徽融信金模信息技术有限公司 一种中小企业经营状况分析方法
CN104992234A (zh) * 2015-06-11 2015-10-21 安徽融信金模信息技术有限公司 一种基于多种运营数据的企业风险评估方法
CN106408483A (zh) * 2016-08-31 2017-02-15 国信优易数据有限公司 一种气象云智能商务方法与系统
CN107248062A (zh) * 2017-05-26 2017-10-13 郑连涛 一种人才评估与推荐系统
CN107493275A (zh) * 2017-08-08 2017-12-19 北京盛华安信息技术有限公司 异构网络安全日志信息的自适应提取和分析方法及系统
CN107577791A (zh) * 2017-09-18 2018-01-12 河北省科学院应用数学研究所 一种企业征信人名重名消歧的方法及运用该方法的征信系统
CN109063148A (zh) * 2018-08-07 2018-12-21 黑龙江阳光惠远信息技术有限公司 一种基于第三方平台的相关专利推荐系统及推荐方法
CN110782043A (zh) * 2019-10-29 2020-02-11 腾讯科技(深圳)有限公司 模型优化方法、装置、存储介质及服务器
US10572544B1 (en) * 2015-12-14 2020-02-25 Open Text Corporation Method and system for document similarity analysis
CN110851706A (zh) * 2019-10-10 2020-02-28 百度在线网络技术(北京)有限公司 用户点击模型的训练方法、装置、电子设备及存储介质
CN111062602A (zh) * 2019-12-12 2020-04-24 百望股份有限公司 企业信用风险评估的方法、装置及存储介质
CN111932268A (zh) * 2020-08-03 2020-11-13 中国工商银行股份有限公司 企业风险识别方法及装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法
CN112434158A (zh) * 2020-11-13 2021-03-02 北京创业光荣信息科技有限责任公司 一种企业标签的获取方法、获取装置、存储介质和计算机设备
CN112581189A (zh) * 2020-12-29 2021-03-30 科技谷(厦门)信息技术有限公司 一种供应商智能推荐系统及方法
CN114048892A (zh) * 2021-10-20 2022-02-15 杭州航策信息科技有限公司 一种基于大数据的中小企业风险预警系统及方法
CN114298805A (zh) * 2021-12-23 2022-04-08 上海乐畅信息技术有限公司 告警信息生成方法和设备
CN114328816A (zh) * 2021-11-19 2022-04-12 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN115168509A (zh) * 2022-07-19 2022-10-11 平安国际融资租赁有限公司 风控数据的处理方法及装置、存储介质、计算机设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10970291B2 (en) * 2018-08-10 2021-04-06 MachineVantage, Inc. Detecting topical similarities in knowledge databases

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647460A (zh) * 2012-03-30 2012-08-22 华为技术有限公司 一种业务数据下载方法和移动终端
CN103488657A (zh) * 2012-06-14 2014-01-01 华为技术有限公司 一种数据表关联方法及装置
CN103699550A (zh) * 2012-09-27 2014-04-02 腾讯科技(深圳)有限公司 数据挖掘系统及数据挖掘方法
CN104299105A (zh) * 2014-11-02 2015-01-21 中国科学院软件研究所 一种支持复杂企业环境的信用数据管理系统及方法
CN104699735A (zh) * 2014-11-20 2015-06-10 国家电网公司 企业级数据中心的数据处理方法及装置
CN104992234A (zh) * 2015-06-11 2015-10-21 安徽融信金模信息技术有限公司 一种基于多种运营数据的企业风险评估方法
CN104966133A (zh) * 2015-06-11 2015-10-07 安徽融信金模信息技术有限公司 一种中小企业经营状况分析方法
US10572544B1 (en) * 2015-12-14 2020-02-25 Open Text Corporation Method and system for document similarity analysis
CN106408483A (zh) * 2016-08-31 2017-02-15 国信优易数据有限公司 一种气象云智能商务方法与系统
CN107248062A (zh) * 2017-05-26 2017-10-13 郑连涛 一种人才评估与推荐系统
CN107493275A (zh) * 2017-08-08 2017-12-19 北京盛华安信息技术有限公司 异构网络安全日志信息的自适应提取和分析方法及系统
CN107577791A (zh) * 2017-09-18 2018-01-12 河北省科学院应用数学研究所 一种企业征信人名重名消歧的方法及运用该方法的征信系统
CN109063148A (zh) * 2018-08-07 2018-12-21 黑龙江阳光惠远信息技术有限公司 一种基于第三方平台的相关专利推荐系统及推荐方法
CN110851706A (zh) * 2019-10-10 2020-02-28 百度在线网络技术(北京)有限公司 用户点击模型的训练方法、装置、电子设备及存储介质
CN110782043A (zh) * 2019-10-29 2020-02-11 腾讯科技(深圳)有限公司 模型优化方法、装置、存储介质及服务器
CN111062602A (zh) * 2019-12-12 2020-04-24 百望股份有限公司 企业信用风险评估的方法、装置及存储介质
CN111932268A (zh) * 2020-08-03 2020-11-13 中国工商银行股份有限公司 企业风险识别方法及装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法
CN112434158A (zh) * 2020-11-13 2021-03-02 北京创业光荣信息科技有限责任公司 一种企业标签的获取方法、获取装置、存储介质和计算机设备
CN112581189A (zh) * 2020-12-29 2021-03-30 科技谷(厦门)信息技术有限公司 一种供应商智能推荐系统及方法
CN114048892A (zh) * 2021-10-20 2022-02-15 杭州航策信息科技有限公司 一种基于大数据的中小企业风险预警系统及方法
CN114328816A (zh) * 2021-11-19 2022-04-12 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN114298805A (zh) * 2021-12-23 2022-04-08 上海乐畅信息技术有限公司 告警信息生成方法和设备
CN115168509A (zh) * 2022-07-19 2022-10-11 平安国际融资租赁有限公司 风控数据的处理方法及装置、存储介质、计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
国内基于大数据的个性化服务研究进展:核心内容;孙雨生;于凡;郝丽静;朱礼军;;情报杂志(10);第170-175+191页 *
大数据时代的企业信息化管理策略;孙胜利;;电子技术与软件工程(06);第178页 *
融合语义分类的企业竞争力影响因素分析研究;张玉峰;何超;王志芳;周磊;;现代图书情报技术(09);第61-66页 *

Also Published As

Publication number Publication date
CN116226213A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
US7389306B2 (en) System and method for processing semi-structured business data using selected template designs
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN108417033A (zh) 基于多维因素的高速路交通事故分析预测方法
CN102792332A (zh) 图像管理装置、图像管理方法、程序、记录媒体及集成电路
CN103337113A (zh) 电子流水日志智能分析方法、装置及处理器
CN112581189A (zh) 一种供应商智能推荐系统及方法
CN110889310A (zh) 金融文档信息智能提取系统及方法
CN111127068A (zh) 一种工程量清单自动组价方法和装置
CN111444106B (zh) 一种对软件可测试需求的分析方法及系统
CN110750588A (zh) 面向多源异构的数据融合方法、系统、装置及存储介质
CN115630621A (zh) 一种基于pdf财务数据报表的数据采集、处理的方法及系统
Goel et al. Mining company sustainability reports to aid financial decision-making
CN116226213B (zh) 一种基于大数据的信息推荐系统及方法
CN106022640B (zh) 电量指数核对系统及方法
CN114266457A (zh) 一种配电线路异损诱因检测的方法
CN114238464A (zh) 一种多元能源数据的异构融合方法
CN110990384B (zh) 一种大数据平台bi分析方法
CN117391534A (zh) 施工质量的监测方法、装置、电子设备和存储介质
CN117200202A (zh) 一种两阶段光伏出力辨识方法、设备、存储介质
CN112036150A (zh) 电价政策条款解析方法、存储介质及计算机
CN101334793B (zh) 一种自动识别需求依赖关系的方法
CN103853817B (zh) 基于gis的海量统计数据的空间奇异点发掘方法
CN115951295A (zh) 一种日清电量异常的自动识别方法及系统
CN114066219A (zh) 一种关联矩阵下用电异常点智能识别的窃电分析方法
CN114398942A (zh) 一种基于集成的个人所得税异常检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant