CN116226213B

CN116226213B - 一种基于大数据的信息推荐系统及方法

Info

Publication number: CN116226213B
Application number: CN202310146868.1A
Authority: CN
Inventors: 杨永秀
Original assignee: Guangzhou Jilian Information Technology Co ltd
Current assignee: Guangzhou Jilian Information Technology Co ltd
Priority date: 2023-02-22
Filing date: 2023-02-22
Publication date: 2023-11-10
Anticipated expiration: 2043-02-22
Also published as: CN116226213A

Abstract

本发明涉及一种基于大数据的信息推荐系统及方法，涉及大数据信息推荐技术领域，包括：数据获取模块，用以获取用户企业的历史运营数据；数据溯源模块，用以得到所述运营数据的数据源特征；大数据分析模块，用以进行大数据运营数据提取和分析；数据库模块，用以存储用户企业运营数据和从大数据中提取的数据；信息推荐模块，用以将可参考数据和影响系数等推荐给评估模块；评估模块，用以评估企业未来的运营数据。本发明能够根据企业当前的运营状况进行信息推荐，为企业下一阶段的运营数据评估提供参考，用以解决难以高效、准确地从海量数据中提取信息并保证信息的有效性的问题。

Description

一种基于大数据的信息推荐系统及方法

技术领域

本发明涉及大数据信息推荐技术领域，尤其涉及一种基于大数据的信息推荐系统及方法。

背景技术

随着现代信息技术的不断发展，人们已进入大数据时代，基于大数据的数据挖掘有助于企业在竞争激烈的市场环境中快速有效的挖掘出对管理和决策有效的信息与学问，能够帮助企业更好的收集整合数据，对企业当前情况进行分析，为未来走向提供参考依据。

中国专利公开号CN110750583A公开了一种基于大数据的计算机数据挖掘探索方法及系统，其方法包括以下步骤，采集计算机数据，形成原始大数据；对原始大数据进行预处理，并存入数据仓库；基于支持向量机、模式查询和数据挖掘工具构建数据挖掘模型，并利用数据挖掘模型在数据仓库中进行数据挖掘；得到挖掘数据；基于遗传算法对挖掘数据进行探索分析，得到挖掘探索信息。该发明采用网络爬虫抓取数据的方式进行数据的收集整理，采用数据的全量抽取和增量抽取的方式进行数据的提取、转换、加载并存入数据仓库供数据挖掘和数据探索作铺垫，并利用支持向量机、模式查询和数据挖掘工具进行数据挖掘，以及利用遗传算法进行数据探索，可以全面高效的挖掘出大数据中的有效信息。

然而现有技术大都致力于改进数据挖掘算法，如何高效、准确地从海量数据中提取信息并保证信息的有效性仍是亟待解决的问题。

发明内容

为此，本发明提供一种基于大数据的信息推荐系统及方法，能够根据企业当前的运营状况进行信息推荐，为企业下一阶段的运营数据评估提供参考，用以解决难以高效、准确地从海量数据中提取信息并保证信息的有效性的问题。

为实现上述目的，本发明提供一种基于大数据的信息推荐系统，包括：

数据获取模块，用以获取用户企业的运营数据，并将数据存储至数据库模块；

数据溯源模块，其与所述数据获取模块相连接，用以对所述数据获取模块获取的运营数据进行溯源，得到所述运营数据的数据源，同时分析所述数据源的数据源特征；

大数据分析模块，其与所述数据溯源模块相连接，用以进行大数据中运营数据的提取和分析，包括，

数据提取单元，用以从大数据中提取所述运营数据和与用户企业关联的上、下游企业的关联运营数据的数据源特征相同或吻合的其他企业的运营数据；

数据分析单元，用以分析所述用户企业的运营数据和/或所述关联运营数据与所述其他企业的运营数据的相似度，判断所述数据提取单元提取的运营数据是否为可参考数据，并记录和分析可参考数据的数据量，判断所述数据量是否达标，以及计算和分析上、下游企业的影响系数；

数据库模块，其与所述数据获取模块和所述大数据分析模块相连接，包括用以存储用户企业运营数据的第一数据库，用以存储所述数据提取单元提取的与用户企业的运营数据的数据源特征相同的其他企业的相同运营数据的第二数据库，以及用以存储所述数据提取单元提取的与用户企业运营数据的数据源特征吻合的其他企业的吻合运营数据的第三数据库；

信息推荐模块，其与所述大数据分析模块和数据库模块相连接，用以将可参考数据和用户企业的上、下游企业的影响系数推荐给评估模块并在总影响系数超限的条件下进行补充推荐；

评估模块，其与所述信息推荐模块相连接，用以评估企业未来的运营数据。

进一步地，所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N，并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1，计算相同特征比例B，B＝N1/N，并将其与相同特征比例标准进行比对，以判断数据源特征是否吻合，所述数据提取单元中设有相同特征比例标准B1，

若所述数据提取单元计算相同特征比例处于第一比例水平，则所述数据提取单元判定数据源特征不吻合；

若所述数据提取单元计算相同特征比例处于第二比例水平，则所述数据提取单元判定数据源特征吻合；

其中，所述第一比例水平为B＜B1，第二比例水平为B≥B1；

进一步地，所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1，并将其与相似度标准进行比对，以判断所述企业的运营数据是否为可参考数据，所述数据分析单元设有相似度标准S0，

若所述数据分析单元分析相似度处于第一相似度水平，则所述数据分析单元判定相似度不达标，所述企业的运营数据为不可参考数据；

若所述数据分析单元分析相似度处于第二相似度水平，则所述数据分析单元判定相似度达标，所述企业的运营数据为可参考数据，所述信息推荐模块将其推荐给评估模块；

其中，所述第一相似度水平为S1＜S0，第二相似度水平为S1≥S0；

进一步地，所述数据分析单元记录可参考数据量D，并将其与可参考数据量标准进行比对，以判断可参考数据量是否达标，所述数据分析单元设有可参考数据量标准D1，

若所述数据分析单元分析可参考数据量处于第一数据量水平，则所述数据分析单元判定可参考数据量不达标；

若所述数据分析单元分析可参考数据量处于第二数据量水平，则所述数据分析单元判定可参考数据量达标；

其中，所述第一数据量水平为D＜D1，第二数据量水平为D≥D1；

进一步地，若所述数据分析单元判定可参考数据量不达标，则所述数据提取单元从所述第三数据库中提取所述吻合运营数据，所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2，并将其与相似度标准S0进行比对，以判断所述吻合运营数据是否为可参考数据，

若所述数据分析单元分析相似度处于第三相似度水平，则所述数据分析单元判定相似度不达标，所述吻合运营数据为不可参考数据；

若所述数据分析单元分析相似度处于第四相似度水平，则所述数据分析单元判定相似度达标，所述吻合运营数据为可参考数据，所述信息推荐模块将其推荐给评估模块；

其中，所述第三相似度水平为S2＜S0，第四相似度水平为S2≥S0；

进一步地，所述数据分析单元再次判断可参考数据量是否达标，若所述数据分析单元判定可参考数据量仍不达标，则所述数据分析单元对所述相似度标准进行修正，所述数据分析单元计算数据量缺口比Q，并将其与数据量缺口比标准进行比对，根据比对结果对所述相似度标准进行修正，通过以下公式计算数据量缺口比Q，

所述数据分析单元设有第一数据量缺口比标准Q1和第二数据量缺口比标准Q2，所述数据分析单元还设有第一修正系数K1、第二修正系数K2和第三修正系数K3，其中Q1＜Q2,0＜K3＜K2＜K1＜1，

在第一数据量缺口比对比结果下，所述数据分析单元采用第一修正系数K1对相似度标准进行修正；

在第二数据量缺口比对比结果下，所述数据分析单元采用第二修正系数K2对相似度标准进行修正；

在第三数据量缺口比对比结果下，所述数据分析单元采用第三修正系数K3对相似度标准进行修正；

其中，所述第一数据量缺口比对比结果为Q≤Q1，第二数据量缺口比对比结果为Q1＜Q≤Q2，第三数据量缺口比对比结果为Q＞Q2；

所述数据分析单元设置修正后的相似度标准为S0′＝S0×Ki，i＝1，2，3。

进一步地，所述大数据分析模块分析用户企业的上、下游企业的可参考数据，所述信息推荐模块将所述可参考数据推荐给评估模块，所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值，所述数据分析单元计算第i个上游或下游企业影响系数δi，由以下公式计算得到，

δi＝ΔEi×αi×βi， i＝1，2，3…n (2)

其中，ΔE i为所述上游或下游企业未来营收变化的预测值，αi为所述上游或下游企业营收中与用户企业相关联业务营收所占的比例，βi为用户企业营收中与所述上游或下游企业相关联业务营收所占的比例，n为用户企业上、下游企业的总个数；

所述信息推荐模块将用户企业所有上、下游企业的影响系数推荐给评估模块；

进一步地，所述数据分析单元计算用户企业上、下游企业的总影响系数δ，由以下公式计算得到，

所述数据分析单元设有总影响系数标准δa，将其与所述总影响系数δ进行比对，以判断总影响系数是否超限，

若所述数据分析单元分析总影响系数处于第一总影响系数水平，则所述数据分析单元判定总影响系数未超限；

若所述数据分析单元分析总影响系数处于第二总影响系数水平，则所述数据分析单元判定总影响系数超限；

其中，所述第一总影响系数水平为δ≤δa，第二总影响系数水平为δ＞δa；

进一步地，若所述数据分析单元判定总影响系数超限，所述数据分析单元计算总影响系数超差Δδ，Δδ＝δ-δa，并将其与总影响系数超差标准Δδa进行比对，以确定数据的推荐方案，

在第一影响系数超差对比结果下，所述信息推荐模块采用第一推荐方案进行补充推荐；

在第二影响系数超差对比结果下，所述信息推荐模块采用第二推荐方案进行补充推荐；

其中，所述第一影响系数超差对比结果为Δδ≤Δδa，第二影响系数超差对比结果为Δδ＞Δδa；

所述第一推荐方案为所述数据分析单元分析第二数据库中单个企业的上、下游企业的总影响系数δ′，若δ′≥δa，则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块；

所述第二推荐方案为所述数据分析单元分析第二数据库和第三数据库中单个企业的上、下游企业的总影响系数δ″，若δ″≥δa，则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块；

进一步地，本发明提供一种基于大数据的信息推荐方法，包括以下步骤：

步骤S1，所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中运营数据的相似度，判断该企业的运营数据是否为可参考数据，若该企业的运营数据为可参考数据，则所述信息推荐模块将其推荐给评估模块；

步骤S2，所述数据分析单元记录可参考数据量，判断可参考数据量是否达标，则所述数据提取单元从所述第三数据库中提取运营数据；

步骤S3，所述数据分析单元分析第三数据库中某企业的运营数据与第一数据库中运营数据的相似度，判断该企业的运营数据是否为可参考数据，若该企业的运营数据为可参考数据，则所述信息推荐模块将其推荐给评估模块；

步骤S4，所述数据分析单元再次判断可参考数据量是否达标，若所述数据分析单元判定可参考数据量仍不达标，则所述数据分析单元对所述相似度标准进行修正；

步骤S5，所述大数据分析模块分析用户企业上、下游企业的可参考数据，所述信息推荐模块将所述可参考数据推荐给评估模块，所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值，所述数据分析单元计算上、下游企业的影响系数，所述信息推荐模块将所述影响系数推荐给评估模块；

步骤S6，所述数据分析单元计算用户企业上、下游企业的总影响系数并判断其是否超限，若所述数据分析单元判定总影响系数超限，则所述信息推荐模块进行运营数据的补充推荐。

与现有技术相比，本发明的有益效果在于，本发明获取用户企业的历史运营数据，存储至第一数据库，并对数据进行溯源，分析数据源的特征，其特征包括数据源的行业、领域和业务内容等，数据提取单元从大数据中提取与用户企业数据源特征相同或吻合的其他企业的运营数据分别存储至第二数据库和第三数据库，从而从海量的大数据当中筛选得到行业、领域和业务内容等相同或近似的企业的运营数据，大大缩小了数据的搜索范围，提升了信息提取的效率和准确性，提高了信息推荐的有效性。

进一步地，本发明所述数据分析单元分析第二数据库中某企业的运营数据与第一数据库中运营数据的相似度，将相似度达标的企业的运营数据判定为可参考数据，并将可参考数据推荐至评估模块作为评估企业未来运营数据的参考，从而进一步提升了信息提取的效率和准确性，保证了信息推荐的有效性。

进一步地，本发明所述数据分析单元记录可参考数据量，判断可参考数据量是否达标，若判定可参考数据量不达标，则所述数据提取单元从所述第三数据库中提取相似度达标的运营数据，以保证推荐的可参考数据量充足，确保后续评估的准确性，从而进一步保证了信息推荐的有效性。

进一步地，本发明所述大数据分析模块分析用户企业的上、下游企业的影响系数，并将影响系数推荐给评估模块，该影响系数反映了上、下游企业未来营收变化对用户企业未来运营数据的影响，考虑该影响可提高后续评估的准确性，从而进一步保证了信息推荐的有效性。

进一步地，所述数据分析单元计算用户企业上、下游企业的总影响系数，并判断总影响系数是否超限，总影响系数超限表示上、下游企业未来营收变化对用户企业未来运营数据具有重大影响，所述信息推荐模块将第二数据库或第三数据库中出现过总影响系数超限的企业的运营数据补充推荐至评估模块，提供遭遇此特殊情况的数据参考，从而进一步保证了信息推荐的有效性。

附图说明

图1为本发明所述基于大数据的信息推荐系统的结构示意图；

图2为本发明所述基于大数据的信息推荐系统中大数据分析模块的结构示意图；

图3为本发明所述基于大数据的信息推荐系统中数据库模块的结构示意图；

图4为本发明所述基于大数据的信息推荐方法的步骤流程图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1至图3所示，图1为本发明所述基于大数据的信息推荐系统的结构示意图，图2为本发明所述基于大数据的信息推荐系统中大数据分析模块的结构示意图，图3为本发明所述基于大数据的信息推荐系统中数据库模块的结构示意图。

本发明实施例一种基于大数据的信息推荐系统，包括：

评估模块，其与所述信息推荐模块相连接，用以评估企业未来的运营数据。具体而言，所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N，并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1，计算相同特征比例B，B＝N1/N，并将其与相同特征比例标准进行比对，以判断数据源特征是否吻合，所述数据提取单元中设有相同特征比例标准B1，

其中，所述第一比例水平为B＜B1，第二比例水平为B≥B1；

具体而言，所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1，并将其与相似度标准进行比对，以判断所述企业的运营数据是否为可参考数据，所述数据分析单元设有相似度标准S0，

具体而言，所述数据分析单元记录可参考数据量D，并将其与可参考数据量标准进行比对，以判断可参考数据量是否达标，所述数据分析单元设有可参考数据量标准D1，

具体而言，若所述数据分析单元判定可参考数据量不达标，则所述数据提取单元从所述第三数据库中提取所属吻合运营数据，所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2，并将其与相似度标准S0进行比对，以判断所述吻合运营数据是否为可参考数据，

具体而言，所述数据分析单元再次判断可参考数据量是否达标，若所述数据分析单元判定可参考数据量仍不达标，则所述数据分析单元对所述相似度标准进行修正，所述数据分析单元计算数据量缺口比Q，并将其与数据量缺口比标准进行比对，根据比对结果对所述相似度标准进行修正，通过以下公式计算数据量缺口比Q，

具体而言，所述大数据分析模块分析用户企业的上、下游企业的可参考数据，所述信息推荐模块将所述可参考数据推荐给评估模块，所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值，所述数据分析单元计算第i个上游或下游企业影响系数δi，由以下公式计算得到，

δi＝ΔEi×αi×βi， i＝1，2，3…n (2)

其中，ΔEi为所述上游或下游企业未来营收变化的预测值，αi为所述上游或下游企业营收中与用户企业相关联业务营收所占的比例，βi为用户企业营收中与所述上游或下游企业相关联业务营收所占的比例，n为用户企业上、下游企业的总个数；

具体而言，所述数据分析单元计算用户企业上、下游企业的总影响系数δ，由以下公式计算得到，

具体而言，若所述数据分析单元判定总影响系数超限，所述数据分析单元计算总影响系数超差Δδ，Δδ＝δ-δa，并将其与总影响系数超差标准Δδa进行比对，以确定数据的推荐方案，

请参阅图4所示，图4为本发明所述基于大数据的信息推荐方法的步骤流程图；

具体而言，本发明实施例提供一种基于大数据的信息推荐方法，包括以下步骤：

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于大数据的信息推荐系统，包括用以评估企业未来的运营数据的评估模块，其特征在于，还包括：

信息推荐模块，其与所述大数据分析模块和数据库模块相连接，用以将可参考数据和用户企业的上、下游企业的影响系数推荐给评估模块并在总影响系数超限的条件下进行补充推荐。

2.根据权利要求1所述的基于大数据的信息推荐系统，其特征在于，所述数据提取单元记录大数据中单个企业的运营数据的数据源特征数量N，并记录其中与第一数据库中用户企业运营数据的数据源特征相同的数据源特征数量N1，计算相同特征比例B，B＝N1/N，并将其与相同特征比例标准进行比对，以判断数据源特征是否吻合，所述数据提取单元中设有相同特征比例标准B1，

其中，所述第一比例水平为B＜B1，第二比例水平为B≥B1。

3.根据权利要求2所述的基于大数据的信息推荐系统，其特征在于，所述数据分析单元分析第二数据库中单个企业的运营数据与第一数据库中用户企业运营数据的相似度S1，并将其与相似度标准进行比对，以判断所述企业的运营数据是否为可参考数据，所述数据分析单元设有相似度标准S0，

其中，所述第一相似度水平为S1＜S0，第二相似度水平为S1≥S0。

4.根据权利要求3所述的基于大数据的信息推荐系统，其特征在于，所述数据分析单元记录可参考数据量D，并将其与可参考数据量标准进行比对，以判断可参考数据量是否达标，所述数据分析单元设有可参考数据量标准D1，

其中，所述第一数据量水平为D＜D1，第二数据量水平为D≥D1。

5.根据权利要求4所述的基于大数据的信息推荐系统，其特征在于，若所述数据分析单元判定可参考数据量不达标，则所述数据提取单元从所述第三数据库中提取所述吻合运营数据，所述数据分析单元分析第三数据库中单个企业的所述吻合运营数据与第一数据库中运营数据的相似度S2，并将其与相似度标准S0进行比对，以判断所述吻合运营数据是否为可参考数据，

其中，所述第三相似度水平为S2＜S0，第四相似度水平为S2≥S0。

6.根据权利要求5所述的基于大数据的信息推荐系统，其特征在于，所述数据分析单元再次判断可参考数据量是否达标，若所述数据分析单元判定可参考数据量仍不达标，则所述数据分析单元对所述相似度标准进行修正，所述数据分析单元计算数据量缺口比Q，并将其与数据量缺口比标准进行比对，根据比对结果对所述相似度标准进行修正，通过以下公式计算数据量缺口比Q，

7.根据权利要求6所述的基于大数据的信息推荐系统，其特征在于，所述大数据分析模块分析用户企业的上、下游企业的可参考数据，所述信息推荐模块将所述可参考数据推荐给评估模块，所述评估模块经过评估得到所述上、下游企业未来营收变化的预测值，所述数据分析单元计算第i个上游或下游企业影响系数δi，由以下公式计算得到，

δi＝ΔEi×αi×βi， i＝1，2，3…n (2)

所述信息推荐模块将用户企业所有上、下游企业的影响系数推荐给评估模块。

8.根据权利要求7所述的基于大数据的信息推荐系统，其特征在于，所述数据分析单元计算用户企业上、下游企业的总影响系数δ，由以下公式计算得到，

其中，所述第一总影响系数水平为δ≤δa，第二总影响系数水平为δ＞δa。

9.根据权利要求8所述的基于大数据的信息推荐系统，其特征在于，若所述数据分析单元判定总影响系数超限，所述数据分析单元计算总影响系数超差Δδ，Δδ＝δ-δa，并将其与总影响系数超差标准Δδa进行比对，以确定数据的推荐方案，

所述第二推荐方案为所述数据分析单元分析第二数据库和第三数据库中单个企业的上、下游企业的总影响系数δ″，若δ″≥δa，则所述信息推荐模块将该企业的运营数据补充推荐至所述评估模块。

10.一种应用于权利要求1-9任一项所述的基于大数据的信息推荐系统的信息推荐方法，其特征在于，包括以下步骤：