CN111581226B - 基于大数据平台的数据共享方法、装置及政企云平台 - Google Patents

基于大数据平台的数据共享方法、装置及政企云平台 Download PDF

Info

Publication number
CN111581226B
CN111581226B CN202010416261.7A CN202010416261A CN111581226B CN 111581226 B CN111581226 B CN 111581226B CN 202010416261 A CN202010416261 A CN 202010416261A CN 111581226 B CN111581226 B CN 111581226B
Authority
CN
China
Prior art keywords
enterprise
data
vector
target
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010416261.7A
Other languages
English (en)
Other versions
CN111581226A (zh
Inventor
倪向东
胡建敏
费红琳
胡幼华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Doctor Information Technology Research Institute Co ltd
Original Assignee
Guangzhou Doctor Information Technology Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Doctor Information Technology Research Institute Co ltd filed Critical Guangzhou Doctor Information Technology Research Institute Co ltd
Priority to CN202010416261.7A priority Critical patent/CN111581226B/zh
Publication of CN111581226A publication Critical patent/CN111581226A/zh
Application granted granted Critical
Publication of CN111581226B publication Critical patent/CN111581226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,具体而言,提供了一种基于大数据平台的数据共享方法、装置及政企云平台。详细地,本发明所提供的基于大数据平台的数据共享方法、装置及政企云平台一方面能够主动地检测数据更新信息和企业端服务器的更新情况,确保企业端服务器获取目标共享数据的时效性;另一方面,向每个企业端服务器发送的目标共享数据是根据每个企业端服务器对应的竞争关系和匹配度在咨询数据库中对目标数据进行关联性处理得到的,实现了针对不同的企业端服务器的针对性和差异性数据共享。

Description

基于大数据平台的数据共享方法、装置及政企云平台
技术领域
本发明涉及政企数据处理技术领域,具体而言,涉及一种基于大数据平台的数据共享方法、装置及政企云平台。
背景技术
大数据的发展为企业提供了项目申报和评估的便利。企业可以通过政企数据云平台进行项目申报信息的查询和数据咨询。一般而言,一个政企数据云平台会对接多个企业。常见的政企云平台的运作方式是根据每个企业端发送的数据咨询请求查找出对应的数据咨询结果然后返回给企业端,当多个企业端发送的数据咨询请求相同或相似时,政企云平台服务器会将相同的数据咨询结果共享给这些企业端。但这种方法存在以下缺点:
(1)由于政企云平台是接收到企业端发送的数据咨询请求后才返回数据咨询结果,数据咨询结果的生成时刻可能早于企业端发送数据咨询请求的时刻,在这种情况下,使得企业端无法在数据咨询请求生成时及时获取数据咨询请求。无法确保企业端获取数据咨询结果的时效性。
(2)政企云平台在共享数据咨询结果时是根据数据咨询请求直接进行的,存在共享数据咨询结果时的针对性不强。
发明内容
为了至少克服现有技术中的上述不足,本发明的目的之一在于提供一种基于大数据平台的数据共享方法、装置及政企云平台。
本发明实施例的第一方面,提供了一种基于大数据平台的数据共享方法,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,所述方法包括:
检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据;
针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息;
基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系;
根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度;
基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
在一种可替换的实施方式中,所述基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系,包括:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
在一种可替换的实施方式中,所述根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度,包括:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
在一种可替换的实施方式中,所述基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果,包括:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
本发明实施例的第二方面,提供了一种基于大数据平台的数据共享装置,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,所述装置包括:
检测模块,用于检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据;
判断模块,用于针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息;
确定模块,用于基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系;
匹配模块,用于根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度;
发送模块,用于基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
在一种可替换的实施方式中,所述确定模块,用于:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
在一种可替换的实施方式中,所述匹配模块,用于:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
在一种可替换的实施方式中,所述发送模块,用于:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
本发明实施例的第三方面,提供了一种政企云平台,包括处理器以及与所述处理器连接的存储器和总线;其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的基于大数据平台的数据共享方法。
本发明实施例的第四方面,提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的基于大数据平台的数据共享方法。
本发明实施例所提供的一种基于大数据平台的数据共享方法、装置及政企云平台,政企云平台能够实时检咨询数据库的数据更新情况以及每个企业端服务器的企业信息更新情况,并实时获取每个企业端服务器对应的用户画像信息,从而确定出每个企业端服务器之间的竞争关系并确定出每个企业端服务器与目标数据的匹配度,进而实现根据每个企业端服务器对应的竞争关系和匹配度对目标数据针对性的关联性处理,然后根据每个企业端服务器对应的关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将目标共享数据进行发送。如此,一方面能够主动地检测数据更新信息和企业端服务器的更新情况,确保企业端服务器获取目标共享数据的时效性。另一方面,向每个企业端服务器发送的目标共享数据是根据每个企业端服务器对应的竞争关系和匹配度在咨询数据库中对目标数据进行关联性处理得到的,实现了针对不同的企业端服务器的针对性和差异性数据共享。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种基于大数据平台的数据共享方法的流程图。
图2为本发明实施例所提供的一种基于大数据平台的数据共享装置的功能模块框图。
图3为本发明实施例所提供的一种政企云平台的方框示意图。
图标:
200-基于大数据平台的数据共享装置;201-检测模块;202-判断模块;203-确定模块;204-匹配模块;205-发送模块;
300-政企云平台;301-处理器;302-存储器;303-总线。
具体实施方式
下面将参照附图更详细地描述本发明公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
图1为根据本发明一个实施例提供的基于大数据平台的数据共享方法的流程图,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,该方法可以包括以下内容:
步骤S21,检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据。
步骤S22,针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息。
步骤S23,基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系。
步骤S24,根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度。
步骤S25,基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
可以理解,通过步骤S21-步骤S25,政企云平台能够实时检咨询数据库的数据更新情况以及每个企业端服务器的企业信息更新情况,并实时获取每个企业端服务器对应的用户画像信息,从而确定出每个企业端服务器之间的竞争关系并确定出每个企业端服务器与目标数据的匹配度,进而实现根据每个企业端服务器对应的竞争关系和匹配度对目标数据针对性的关联性处理,然后根据每个企业端服务器对应的关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将目标共享数据进行发送。如此,一方面能够主动地检测数据更新信息和企业端服务器的更新情况,确保企业端服务器获取目标共享数据的时效性。另一方面,向每个企业端服务器发送的目标共享数据是根据每个企业端服务器对应的竞争关系和匹配度在咨询数据库中对目标数据进行关联性处理得到的,实现了针对不同的企业端服务器的针对性和差异性数据共享。
在具体实施时,为了提高数据共享的针对性,在步骤S23中,所述基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系,具体可以包括以下内容:
步骤S231,针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量。
步骤S232,判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同。
步骤S233,在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量。
步骤S234,在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量。
步骤S235,针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
可以理解,通过步骤S231-步骤S235,能够根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息,对每个企业端服务器之间的用户画像进行特征提取和分析,从而准确确定出每个企业端服务器之间的竞争关系,确保后续根据该竞争关系对目标数据进行差异化处理。
在具体实施时,为了进一步实现对多个企业端服务器进行数据共享的差异化处理,在步骤S24中,所述根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度,具体可以包括以下内容:
步骤S241,从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量。
步骤S242,从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值。
步骤S243,根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量。
步骤S244,确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
可以理解,通过步骤S241-步骤S244,能够基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息进行关键词和词向量的分析,从而准确确定出每个企业端服务器与目标数据的匹配度,从而确保后续对目标数据进行关联性处理的针对性,进而实现对多个企业端服务器进行数据共享的差异化处理。
在具体实施时,为了确保向每个企业端服务器共享的数据的差异性,需要对针对不同的企业端服务器对目标数据进行关联性处理。为此,在步骤S25中,所述基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果,具体可以包括以下内容:
步骤S251,确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据。
步骤S252,确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据。
步骤S253,针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数。
步骤S254,针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
可以理解,通过步骤S251-步骤S254,能够针对不同的企业端服务器对目标数据进行关联性处理,从而得到与每个企业端服务器对应的关联性处理结果,如此,能够确保向每个企业端服务器共享的数据的差异性。
可选地,在发送目标共享数据时,为了确保企业端服务器接收目标共享数据的时效性,减少每个企业端服务器接收各自对应的目标共享数据的延时,在步骤S25中,所述根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送,具体可以包括以下内容:
步骤S251,针对每个企业端服务器,从该企业端服务器中解析出当前时段数据接收线程状态。
步骤S252,判断该企业端服务器的当前时段数据接收线程状态相对于该企业端服务器的上一时段数据接收线程状态是否改变。
步骤S253,如果是,将从该企业端服务器中解析出的当前时段数据接收线程状态确定为该企业端服务器的有效数据接收线程状态,并基于所述有效数据接收线程状态判断该企业端服务器接收与该企业端服务器对应的目标共享数据的接收时长是否超过预定时长,若所述接收时长没有超过所述预定时长,将与该企业端服务器对应的目标共享数据发送至该企业端服务器,若所述接收时长超过所述预定时长,对所述有效数据接收线程进行压缩并基于压缩后的有效数据接收线程将与该企业端服务器对应的目标共享数据发送至该企业端服务器。
步骤S254,否则,基于上一时段数据接收线程状态将与该企业端服务器对应的目标共享数据发送至该企业端服务器。
可以理解,通过步骤S251-步骤S254,能够每个企业端服务器接收各自对应的目标共享数据的延时,进而确保企业端服务器接收目标共享数据的时效性。
在上述基础上,本发明实施例提供了一种基于大数据平台的数据共享装置200。图2为根据本发明一个实施例提供的一种基于大数据平台的数据共享装置200的功能模块框图,该基于大数据平台的数据共享装置200包括:
检测模块201,用于检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据。
判断模块202,用于针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息。
确定模块203,用于基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系。
匹配模块204,用于根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度。
发送模块205,用于基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
在一种可替换的实施方式中,所述确定模块203,用于:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
在一种可替换的实施方式中,所述匹配模块204,用于:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
在一种可替换的实施方式中,所述发送模块205,用于:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
所述政企云平台300包括处理器和存储器,上述检测模块201、判断模块202、确定模块203、匹配模块204和发送模块205等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数主动地检测数据更新信息和企业端服务器的更新情况,确保企业端服务器获取目标共享数据的时效性并实现针对不同的企业端服务器的针对性和差异性数据共享。
本发明实施例提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现所述基于大数据平台的数据共享方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行的所述基于大数据平台的数据共享方法如下:
A1.一种基于大数据平台的数据共享方法,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,所述方法包括:
检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据;
针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息;
基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系;
根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度;
基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
A2.根据A1所述的数据共享方法,所述基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系,包括:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
A3.根据A1所述的数据共享方法,所述根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度,包括:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
A4.根据A1所述的数据共享方法,基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果,包括:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
本发明实施例中,如图3所示,政企云平台300包括至少一个处理器301、以及与处理器301连接的至少一个存储器302、总线;其中,处理器301、存储器302通过总线303完成相互间的通信;处理器301用于调用存储器302中的程序指令,以执行上述的基于大数据平台的数据共享方法。本文中的政企云平台300可以是政企云平台、PC、PAD、手机等。
本申请是参照根据本申请实施例的方法、政企云平台(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理政企云平台的处理器以产生一个机器,使得通过计算机或其他可编程数据处理政企云平台的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,政企云平台包括一个或多个处理器(CPU)、存储器和总线。政企云平台还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储政企云平台或任何其他非传输介质,可用于存储可以被计算政企云平台访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者政企云平台不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者政企云平台所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者政企云平台中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种基于大数据平台的数据共享方法,其特征在于,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,所述方法包括:
检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据;
针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息;
基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系;
根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度;
基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
2.根据权利要求1所述的数据共享方法,其特征在于,所述基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系,包括:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
3.根据权利要求1-2任一项所述的数据共享方法,其特征在于,所述根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度,包括:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
4.根据权利要求3所述的数据共享方法,其特征在于,所述基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果,包括:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
5.一种基于大数据平台的数据共享装置,其特征在于,应用于与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始用户画像信息,所述政企云平台中设置有咨询数据库,所述装置包括:
检测模块,用于检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据;
判断模块,用于针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息;
确定模块,用于基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器之间的竞争关系;
匹配模块,用于根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度;
发送模块,用于基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。
6.根据权利要求5所述的数据共享装置,其特征在于,所述确定模块,用于:
针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对应的第二画像特征向量;
判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维度是否相同;
在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;
在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向量和所述第二目标特征向量;
针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第一企业端服务器和所述第二企业端服务器之间的竞争关系。
7.根据权利要求5-6任一项所述的数据共享装置,其特征在于,所述匹配模块,用于:
从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一关键词和每个第一关键词的第一词向量;
从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值;
根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量;
确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服务器与所述目标数据的匹配度。
8.根据权利要求7所述的数据共享装置,其特征在于,所述发送模块,用于:
确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类别数据;
确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对应的历史数据中的标识数据存在一致性的数据;
针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数;
针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二关联性数据确定出与该企业端服务器对应的关联性处理结果。
9.一种政企云平台,其特征在于,包括处理器以及与所述处理器连接的存储器和总线;其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述权利要求1-4任一项所述的基于大数据平台的数据共享方法。
10.一种可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时实现上述权利要求1-4任一项所述的基于大数据平台的数据共享方法。
CN202010416261.7A 2020-05-17 2020-05-17 基于大数据平台的数据共享方法、装置及政企云平台 Active CN111581226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010416261.7A CN111581226B (zh) 2020-05-17 2020-05-17 基于大数据平台的数据共享方法、装置及政企云平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010416261.7A CN111581226B (zh) 2020-05-17 2020-05-17 基于大数据平台的数据共享方法、装置及政企云平台

Publications (2)

Publication Number Publication Date
CN111581226A CN111581226A (zh) 2020-08-25
CN111581226B true CN111581226B (zh) 2020-12-08

Family

ID=72110903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010416261.7A Active CN111581226B (zh) 2020-05-17 2020-05-17 基于大数据平台的数据共享方法、装置及政企云平台

Country Status (1)

Country Link
CN (1) CN111581226B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215288B (zh) * 2020-10-13 2024-04-30 中国光大银行股份有限公司 目标企业的类别确定方法及装置、存储介质、电子装置
CN113055766B (zh) * 2021-03-19 2022-06-03 中国联合网络通信集团有限公司 端到端业务处理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399527A (zh) * 2018-01-31 2018-08-14 合肥和钧正策信息技术有限公司 一种基于大数据平台的企业政策咨询方法及系统
US10296732B1 (en) * 2016-11-30 2019-05-21 Intuit Inc. Computer software product grant management system
CN110348732A (zh) * 2019-07-08 2019-10-18 泰华智慧产业集团股份有限公司 基于哈希算法的企业画像数据预处理方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296732B1 (en) * 2016-11-30 2019-05-21 Intuit Inc. Computer software product grant management system
CN108399527A (zh) * 2018-01-31 2018-08-14 合肥和钧正策信息技术有限公司 一种基于大数据平台的企业政策咨询方法及系统
CN110348732A (zh) * 2019-07-08 2019-10-18 泰华智慧产业集团股份有限公司 基于哈希算法的企业画像数据预处理方法和系统

Also Published As

Publication number Publication date
CN111581226A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN110609844B (zh) 一种数据更新方法,装置及系统
CN109635019B (zh) 请求处理方法、装置、设备及存储介质
CN108563734B (zh) 制度信息查询方法、装置、计算机设备和存储介质
CN111581226B (zh) 基于大数据平台的数据共享方法、装置及政企云平台
CN111163072B (zh) 机器学习模型中特征值的确定方法、装置及电子设备
CN108717426B (zh) 企业数据的更新方法、装置、计算机设备及存储介质
CN110134738B (zh) 分布式存储系统资源预估方法、装置
CN110704418A (zh) 区块链信息查询方法、装置和设备
JP3521176B2 (ja) 検索方法および検索装置
CN108564462A (zh) 征信数据的获取方法、终端设备及介质
CN114338413A (zh) 网络中设备的拓扑关系的确定方法、装置以及存储介质
CN112131507A (zh) 网站内容处理方法、装置、服务器和计算机可读存储介质
CN114285893A (zh) 访问请求的处理方法、系统、装置、存储介质及电子设备
CN116522401B (zh) 基于云数据安全的信息去标识化处理方法及系统
CN110336731B (zh) 一种群组中的用户匹配方法及设备
CN115237960A (zh) 信息推送方法、装置、存储介质以及电子设备
CN115271861A (zh) 一种请求过滤方法、装置、设备及存储介质
CN114092211A (zh) 核算数据的处理方法、电子设备和可读存储介质
CN110110081B (zh) 用于移动互联网海量监测数据的分级分类处理方法及系统
CN111241376A (zh) 多级信息匹配方法、装置及云服务平台
CN111161012B (zh) 一种信息推送方法、装置及计算机设备
CN113297358A (zh) 数据处理方法、装置、服务器和计算机可读存储介质
CN111382337A (zh) 一种信息对接匹配方法、装置、服务器及可读存储介质
CN111400574A (zh) 一种异步爬虫系统及数据爬取方法
CN116107761B (zh) 性能调优方法、系统、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant