CN110795471A - 数据匹配的方法及装置、计算机可读存储介质、电子设备 - Google Patents

数据匹配的方法及装置、计算机可读存储介质、电子设备 Download PDF

Info

Publication number
CN110795471A
CN110795471A CN201911054209.5A CN201911054209A CN110795471A CN 110795471 A CN110795471 A CN 110795471A CN 201911054209 A CN201911054209 A CN 201911054209A CN 110795471 A CN110795471 A CN 110795471A
Authority
CN
China
Prior art keywords
enterprise
matched
matching
enterprises
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911054209.5A
Other languages
English (en)
Other versions
CN110795471B (zh
Inventor
房留凯
柳超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dike Technology Co Ltd
Original Assignee
Beijing Dike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dike Technology Co Ltd filed Critical Beijing Dike Technology Co Ltd
Priority to CN201911054209.5A priority Critical patent/CN110795471B/zh
Publication of CN110795471A publication Critical patent/CN110795471A/zh
Application granted granted Critical
Publication of CN110795471B publication Critical patent/CN110795471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种数据匹配的方法及装置、计算机可读存储介质、电子设备,该方法包括:获取待匹配企业的企业信息,其中,企业信息包括在预设维度下所述待匹配企业的企业特征数据;针对每一预设维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;从数据库中查找至少满足一项所确定的匹配条件的企业。相比现有技术,本申请提供的方案可根据待匹配企业推测出潜在客户。

Description

数据匹配的方法及装置、计算机可读存储介质、电子设备
技术领域
本发明涉及大数据技术领域,尤其涉及一种数据匹配的方法及装置、计算机可读存储介质、电子设备。
背景技术
企业都有其自身的主营业务,例如有为消费者提供服务的To C(To Customer)的业务,也有为企业提供服务的To B(To Business)的业务。目前针对To B业务的对象,一般通过做广告、地推等无差异化宣传,吸引有需求的企业客户前来咨询,或者通过人脉关系经中间人介绍可能存在该方面需求的企业客户,但上述挖掘潜在客户的方式普遍存在针对性都不太强,挖掘的效率低等问题。
综上所述,现有的技术方法针对To B业务的潜在客户的挖掘效率较低,无法进行针对性的服务宣传和推荐。
发明内容
本发明实施例提供了一种数据匹配的方法及装置、计算机可读存储介质、电子设备,可提升To B业务的潜在客户的挖掘效率。
本发明实施例提供的一种数据匹配的方法,该方法包括:
获取待匹配企业的企业信息,其中,所述企业信息包括在预设维度下所述待匹配企业的企业特征数据;
针对每一所述预设维度,确定所述待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
从数据库中查找至少满足一项所确定的匹配条件的企业。
较佳地,该方法还包括:
根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,其中,所查找到的企业所满足的匹配条件的项数与该企业与所述待匹配企业的匹配度正相关;
按照所确定匹配度由大到小的顺序,选取第一预设数量个所查找到的企业。
较佳地,根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,包括:
根据所查找到的企业所满足的匹配条件的项数,以及该匹配条件对应的预设维度的权重,确定所查找到的企业与所述待匹配企业的匹配度。
较佳地,从数据库中查找至少满足一项所确定的匹配条件的企业,包括:
从数据库中逐一选取满足第二预设数量个匹配条件的企业,若已选取的企业的数量满足第一预设数量,则停止查找,否则持续选取,直到搜索数据库中未选取的企业满足的匹配条件的项数小于第二预设数量,则将所述预设数量减一,并更新所述预设数量,再从所述数据库的未选取的企业中逐一选取满足更新后的第二预设数量个匹配条件的企业,直到已选取的企业的数量满足第一预设数量。
较佳地,基于统计的数量,确定该预设维度对应的匹配条件,包括:
选取所述待匹配企业的数量最多的分区集合,并确定所选取的分区集合的条件为该预设维度对应的匹配条件,其中,所述分区集合的条件为所述分区集合中每一元素均满足的条件。
较佳地,选取所述待匹配企业的数量最多的分区集合,包括:
针对每一分区集合,将该分区集合中待匹配企业的数量与所有分区集合中待匹配企业的总数的比值,确定为该分区集合的比值;
从所述分区集合中选取所述分区集合的比值最高的分区集合。
较佳地,获取待匹配企业的企业信息,包括:
接收用户上传的企业名单,并基于所述企业名单中的标识,从所述数据库中确定所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的标识;或者,
接收用户上传的企业名单,并从所述企业名单中获取所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的企业信息。
本发明实施例提供的一种数据匹配的装置,该装置包括:
获取模块,用于获取待匹配企业的企业信息,其中,所述企业信息包括在预设维度下所述待匹配企业的企业特征数据;
统计模块,用于针对每一所述预设维度,确定所述待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
匹配模块,用于从数据库中查找至少满足一项所确定的匹配条件的企业。
较佳地,所述匹配模块还用于:
根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,其中,所查找到的企业所满足的匹配条件的项数与该企业与所述待匹配企业的匹配度正相关;
按照所确定匹配度由大到小的顺序,选取第一预设数量个所查找到的企业。
较佳地,所述匹配模块在执行根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度步骤时,具体用于:
根据所查找到的企业所满足的匹配条件的项数,以及该匹配条件对应的预设维度的权重,确定所查找到的企业与所述待匹配企业的匹配度。
较佳地,所述匹配模块,具体用于:
从数据库中逐一选取满足第二预设数量个匹配条件的企业,若已选取的企业的数量满足第一预设数量,则停止查找,否则持续选取,直到搜索数据库中未选取的企业满足的匹配条件的项数小于第二预设数量,则将所述预设数量减一,并更新所述预设数量,再从所述数据库的未选取的企业中逐一选取满足更新后的第二预设数量个匹配条件的企业,直到已选取的企业的数量满足第一预设数量。
较佳地,所述统计模块在执行基于统计的数量,确定该预设维度对应的匹配条件步骤时,具体用于:
选取所述待匹配企业的数量最多的分区集合,并确定所选取的分区集合的条件为该预设维度对应的匹配条件,其中,所述分区集合的条件为所述分区集合中每一元素均满足的条件。
较佳地,所述统计模块在执行选取所述待匹配企业的数量最多的分区集合步骤时,具体用于:
针对每一分区集合,将该分区集合中待匹配企业的数量与所有分区集合中待匹配企业的总数的比值,确定为该分区集合的比值;
从所述分区集合中选取所述分区集合的比值最高的分区集合。
较佳地,所述获取模块,具体用于:
接收用户上传的企业名单,并基于所述企业名单中的标识,从所述数据库中确定所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的标识;或者,
接收用户上传的企业名单,并从所述企业名单中获取所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的企业信息。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述一种数据匹配的方法步骤。
本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述一种数据匹配的方法步骤。
本发明实施例提供了一种数据匹配的方法及装置、计算机可读存储介质、电子设备,本发明通过获取待匹配企业的企业信息,其中,企业信息包括在预设维度下所述待匹配企业的企业特征数据;针对每一预设维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;从数据库中查找至少满足一项所确定的匹配条件的企业。即本发明通过对待匹配企业的特征数据的分析,探寻待匹配企业之间的通性,并基于通性从数据库中查找相似企业,相比现有技术,本申请提供的方案可根据待匹配企业推测出潜在客户。
附图说明
图1为本发明实施例提供的一种数据匹配的流程示意图;
图2为本发明实施例提供的另一种数据匹配的流程示意图;
图3为本发明实施例提供的一种数据匹配的结构示意图。
具体实施方式
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一:
参见图1,图1为本发明实施例提供的一种数据匹配的方法的流程示意图,如图所示,该方法包括步骤S110~130:
S110、获取待匹配企业的企业信息;其中,企业信息包括在预设维度下所述待匹配企业的企业特征数据;
S120、针对每一预设维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
S130、从数据库中查找至少满足一项所确定的匹配条件的企业。
本发明通过对待匹配企业的特征数据的分析,探寻待匹配企业之间的通性,并基于通性从数据库中查找相似企业。若待匹配企业是重点目标客户,那么从数据库中查找到的与重点目标客户相似的企业,由于其较强的关联性,相似企业很可能就是潜在客户。相比现有的无差异化宣传,对潜在客户进行有针对性的宣传,宣传效率会显著提高。
实施例二:
参见图2,图2为本发明实施例提供的另一种数据匹配的方法的流程示意图,如图所示,该方法包括步骤S110~S150:
S110、获取待匹配企业的企业信息。
其中,企业信息包括在预设维度下,待匹配企业的企业特征数据。预设维度可以根据用户上传的企业名单确定的,也可以是后台工作人员根据经验设置的,还可以是通过匹配的大数据通过训练后的深度学习模型得到的。预设维度可以包括但不限于下述维度:企业背景维度、风险信息维度、企业发展维度、经营信息维度以及知识产权维度。当然还可以按更细的维度进行划分,例如注册资本维度、注册年份维度、注册地址维度、行业分类维度、企业类型维度、参保维度、法律诉讼维度、被执行人维度、失信被执行人维度、动产抵押维度、投资事件维度、融资历史维度、上市状态维度、招聘信息维度、商标信息维度、专利信息维度、作品著作权维度、网站备案维度、联系方式维度等。
为便于理解,下面以北京自如资产管理有限公司(后文称“自如”)为例,列举自如的企业信息包括:
在注册资本的维度下,自如的企业特征数据为3200万人民币;
在行业分类的维度下,自如的企业特征数据为商务服务业;
在企业类型的维度下,自如的企业特征数据为有限责任公司;
在商标信息的维度下,自如的企业特征数据为98条;
在专利信息的维度下,自如的企业特征数据为0条;
在著作权的维度下,自如的企业特征数据为3条。
具体的,步骤S110中获取企业信息的方法,在不同情境下存在多种获取方式,本发明实施例中主要列举两种:
第一种情境,即用户上传的企业名单中只有待匹配企业的标识,没有其他的企业特征数据(参见表1),或可提供的企业特征数据极少(参见表2)。在这种情景下,步骤S110包括:
接收用户上传的企业名单,并基于该企业名单中的企业标识,从数据库中查找并确定待匹配企业的企业信息;
待匹配企业
北京自如资产管理有限公司
房妈妈
诸葛找房
表1
待匹配企业 商标信息 专利信息
北京自如资产管理有限公司 98 -
厦门房妈妈信息技术有限公司 - -
北京诸葛找房信息技术有限公司 - -
表2
第二种情境,即用户上传的企业名单中包括有待匹配企业的企业信息(参见表3)。在这种情况下,步骤S110包括:
接收用户上传的企业名单,并从该企业名单中获取待匹配企业的企业信息。
待匹配企业 商标信息 专利信息
北京自如资产管理有限公司 98 0
厦门房妈妈信息技术有限公司 2 0
北京诸葛找房信息技术有限公司 80 12
表3
为了方案的完整性,在接收到用户上传的企业名单的步骤之后,该方法还包括:检测用户上传的企业名单是否包括匹配所需的企业信息,若是则符合第二种情境,执行第二种方法即可,若否则符合第一种情景,执行第一种方法即可。
因此,无论用户能否提供待匹配企业的相关信息,通过本发明提供的方法都可以为用户匹配到与待匹配企业存在通性的潜在客户。
S120、针对每一预设维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件。
其中,预设维度中包括至少两个分区集合,且预设维度中的分区集合不相交。为便于理解,结合表3中的商标信息维度来说明:
假设商标信息维度包括,申请量较少的分区集合、申请量适中的分区集合、申请量较多的分区集合,其中,商标申请量为0-50件的企业属于申请量较少的分区集合,商标申请量为51-1000件的企业属于申请量适中的分区集合,商标申请量大于1000件的企业属于申请量较多的分区集合。
针对表3中三个待匹配企业的企业特征数据,首先,逐一确定待匹配企业在该预设维度下的企业特征数据,并确定该企业所属的分区集合,例如,自如在商标信息维度下的企业特征数据为98,属于申请量适中的分区集合;厦门房妈妈信息技术有限公司(下文简称“房妈妈”)在商标信息维度下的企业特征数据为2,属于申请量较少的分区集合;北京诸葛找房信息技术有限公司(下文简称“诸葛找房”)在商标信息维度下的企业特征数据为80,属于申请量适中的分区集合。
其次,统计各分区集合中待匹配企业的数量,例如,该企业名单中属于申请量较少的分区集合的有1家公司,属于申请量适中的分区集合的有2家公司。
最后,选取待匹配企业的数量最多的分区集合,并确定所选取的分区集合的条件为该预设维度对应的匹配条件,例如,先确定待匹配企业的数量最多的分区集合为属于申请量适中的分区集合的有2家公司,也就是说,该企业名单中大多数是属于申请量适中的分区集合的企业,后设置商标信息维度对应的匹配条件为该企业是否属于申请量适中的分区集合或该企业的商标申请量是否满足51-1000件这一区间。
另外,分区集合既可以是区间集合(如上文所述的分区集合),还可以是字符集合,例如,行业分类的维度包括,商务服务业的分区集合、科技推广和应用服务业的分区集合等。
此外,针对步骤S120,本发明还提供了另外一种实施例,即当商标信息维度下企业特征数据不完整的情景下时,步骤S120包括:
首先,针对每一预测维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量;
其次,针对每一分区集合,将该分区集合中待匹配企业的数量与所有分区集合中待匹配企业的总数的比值,确定为该分区集合的比值,并选取分区集合的比值最高的分区集合;
最后,确定所选取的分区集合的条件为该预设维度对应的匹配条件。其中,分区集合的条件为分区集合中每一元素均满足的条件。
通过该实施例提供的方法,针对缺失数据不多的情况,依然可以快速的确定出该预设维度对应的匹配条件,无需从数据库中搜索并补充相关数据。
S130、从数据库中查找至少满足一项所确定的匹配条件的企业。
具体地,当对匹配速度无要求或要求不高时,可以从数据库中将所有满足条件的企业均查找出来,后期还可以考虑按照企业的匹配程度向用户推荐,供用户选择。但当数据库为大数据库甚至超大数据库时,若按照步骤S130执行,则匹配效率将极低,对此,针对步骤S130,本发明提供另一种实施例,该方法包括:
从数据库中逐一选取满足第二预设数量个匹配条件的企业,若已选取的企业的数量满足第一预设数量,则停止查找,否则持续选取,直到搜索数据库中未选取的企业满足的匹配条件的项数小于第二预设数量,则将所述预设数量减一,并更新所述预设数量,再从所述数据库的未选取的企业中逐一选取满足更新后的第二预设数量个匹配条件的企业,直到已选取的企业的数量满足第一预设数量。
为便于理解,上文所述的第一预设数量为想要匹配得到的企业的数量,即待反馈的潜在客户的数量,该数量可以是用户预设的,也可以是根据用户的权限分配的数值。另外,上位所述的第二预设数量为步骤S120确定的匹配条件的总数。也就是,先从数据库中选取全部满足匹配条件的企业,若选取的企业数量达不到反馈数量,就放宽要求,满足部分匹配条件即可。
S140、根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与待匹配企业的匹配度。
具体地,该步骤可以直接将所查找到的企业所满足的匹配条件的项数,确定为所查找到的企业与待匹配企业的匹配度。当然其他只要满足“所确定的匹配度与所满足的匹配条件的项数正相关”这一条件的所有确定匹配度的方法均可。
此外,针对步骤S140,本发明还提供了另外一种实施例,该方法包括:
根据所查找到的企业所满足的匹配条件的项数,以及该匹配条件对应的预设维度的权重,确定所查找到的企业与待匹配企业的匹配度。
具体地,可以先确定所查找到的企业所满足的匹配条件,再确定该匹配条件对应的预设维度的权重,最后将所确定的权重值相加,即得到所查找到的企业与待匹配企业的匹配度。或者,将所查找到的企业所满足的匹配条件标记为1,不满足的匹配条件标记为0,再根据匹配条件对应的维度的权重,对标记数量进行加权求和,即得到所查找到的企业与待匹配企业的匹配度。
此外,预设维度的权重可以是根据经验设置的,用于表示该维度在匹配计算中的重要程度。
S150、按照所确定匹配度由大到小的顺序,选取第一预设数量个所查找到的企业。
在步骤S150之后,该方法还包括:展示所选取的第一预设数量个企业。
本发明实施例所提供的数据匹配的方法的执行主体可以是客户端,例如,可以是企业查询软件、企业匹配软件等。上述执行主体还可以是为客户端提供服务的服务端,还可以是为客户端提供运行环境的设备,例如,可以是计算机、平板电脑、手机等。
本发明实施例提供了数据匹配的方法,通过对待匹配企业的特征数据的分析,探寻待匹配企业之间的通性,并基于通性从数据库中查找相似企业。若待匹配企业是重点目标客户,那么从数据库中查找到的与重点目标客户相似的企业,由于其较强的关联性,相似企业很可能就是潜在客户。相比现有的无差异化宣传,对潜在客户进行有针对性的宣传,宣传效率会显著提高
参见图3,本发明实施例提供了一种数据匹配的装置,该装置包括:
获取模块210,用于获取待匹配企业的企业信息,其中,所述企业信息包括在预设维度下所述待匹配企业的企业特征数据;
统计模块220,用于针对每一所述预设维度,确定所述待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
匹配模块230,用于从数据库中查找至少满足一项所确定的匹配条件的企业。
具体地,所述匹配模块还用于:
根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,其中,所查找到的企业所满足的匹配条件的项数与该企业与所述待匹配企业的匹配度正相关;
按照所确定匹配度由大到小的顺序,选取第一预设数量个所查找到的企业。
具体地,所述匹配模块在执行根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度步骤时,具体用于:
根据所查找到的企业所满足的匹配条件的项数,以及该匹配条件对应的预设维度的权重,确定所查找到的企业与所述待匹配企业的匹配度。
具体地,所述匹配模块,具体用于:
从数据库中逐一选取满足第二预设数量个匹配条件的企业,若已选取的企业的数量满足第一预设数量,则停止查找,否则持续选取,直到搜索数据库中未选取的企业满足的匹配条件的项数小于第二预设数量,则将所述预设数量减一,并更新所述预设数量,再从所述数据库的未选取的企业中逐一选取满足更新后的第二预设数量个匹配条件的企业,直到已选取的企业的数量满足第一预设数量。
具体地,所述统计模块在执行基于统计的数量,确定该预设维度对应的匹配条件步骤时,具体用于:
选取所述待匹配企业的数量最多的分区集合,并确定所选取的分区集合的条件为该预设维度对应的匹配条件,其中,所述分区集合的条件为所述分区集合中每一元素均满足的条件。
具体地,所述统计模块在执行选取所述待匹配企业的数量最多的分区集合步骤时,具体用于:
针对每一分区集合,将该分区集合中待匹配企业的数量与所有分区集合中待匹配企业的总数的比值,确定为该分区集合的比值;
从所述分区集合中选取所述分区集合的比值最高的分区集合。
具体地,所述获取模块,具体用于:
接收用户上传的企业名单,并基于所述企业名单中的标识,从所述数据库中确定所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的标识;或者,
接收用户上传的企业名单,并从所述企业名单中获取所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的企业信息。
本发明实施例还提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现本发明实施例提供的数据匹配的方法。
也就是说,本发明实施例提供的方法即可依附于服务器中的处理器运行,也可以在独立于服务器的数据匹配装置中运行。当在数据匹配装置中运行时,也就降低了在各自系统中转换所带来的工作量,提升了转换效率。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现本发明实施例提供的数据匹配的方法中的步骤。
综上所述,本发明实施例提供了一种数据匹配的方法及装置、计算机可读存储介质、电子设备,本发明通过获取待匹配企业的企业信息,其中,企业信息包括在预设维度下所述待匹配企业的企业特征数据;针对每一预设维度,确定待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;从数据库中查找至少满足一项所确定的匹配条件的企业。即本发明通过对待匹配企业的特征数据的分析,探寻待匹配企业之间的通性,并基于通性从数据库中查找相似企业,相比现有技术,本申请提供的方案可根据待匹配企业推测出潜在客户。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种数据匹配的方法,其特征在于,该方法包括:
获取待匹配企业的企业信息,其中,所述企业信息包括在预设维度下所述待匹配企业的企业特征数据;
针对每一所述预设维度,确定所述待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
从数据库中查找至少满足一项所确定的匹配条件的企业。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,其中,所查找到的企业所满足的匹配条件的项数与该企业与所述待匹配企业的匹配度正相关;
按照所确定匹配度由大到小的顺序,选取第一预设数量个所查找到的企业。
3.根据权利要求2所述的方法,其特征在于,根据所查找到的企业所满足的匹配条件的项数,确定所查找到的企业与所述待匹配企业的匹配度,包括:
根据所查找到的企业所满足的匹配条件的项数,以及该匹配条件对应的预设维度的权重,确定所查找到的企业与所述待匹配企业的匹配度。
4.根据权利要求1所述的方法,其特征在于,从数据库中查找至少满足一项所确定的匹配条件的企业,包括:
从数据库中逐一选取满足第二预设数量个匹配条件的企业,若已选取的企业的数量满足第一预设数量,则停止查找,否则持续选取,直到搜索数据库中未选取的企业满足的匹配条件的项数小于第二预设数量,则将所述预设数量减一,并更新所述预设数量,再从所述数据库的未选取的企业中逐一选取满足更新后的第二预设数量个匹配条件的企业,直到已选取的企业的数量满足第一预设数量。
5.根据权利要求1-4任一项所述的方法,其特征在于,基于统计的数量,确定该预设维度对应的匹配条件,包括:
选取所述待匹配企业的数量最多的分区集合,并确定所选取的分区集合的条件为该预设维度对应的匹配条件,其中,所述分区集合的条件为所述分区集合中每一元素均满足的条件。
6.根据权利要求5所述的方法,其特征在于,选取所述待匹配企业的数量最多的分区集合,包括:
针对每一分区集合,将该分区集合中待匹配企业的数量与所有分区集合中待匹配企业的总数的比值,确定为该分区集合的比值;
从所述分区集合中选取所述分区集合的比值最高的分区集合。
7.根据权利要求1所述的方法,其特征在于,获取待匹配企业的企业信息,包括:
接收用户上传的企业名单,并基于所述企业名单中的标识,从所述数据库中确定所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的标识;或者,
接收用户上传的企业名单,并从所述企业名单中获取所述待匹配企业的企业信息,其中,所述企业名单包括所述待匹配企业的企业信息。
8.一种数据匹配的装置,其特征在于,该装置包括:
获取模块,用于获取待匹配企业的企业信息,其中,所述企业信息包括在预设维度下所述待匹配企业的企业特征数据;
统计模块,用于针对每一所述预设维度,确定所述待匹配企业在该预设维度下的企业特征数据所属的分区集合,统计各分区集合中待匹配企业的数量,并基于统计的数量,确定该预设维度对应的匹配条件;其中,所述预设维度中包括至少两个分区集合,且所述预设维度中的分区集合不相交;
匹配模块,用于从数据库中查找至少满足一项所确定的匹配条件的企业。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的方法步骤。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
CN201911054209.5A 2019-10-31 2019-10-31 数据匹配的方法及装置、计算机可读存储介质、电子设备 Active CN110795471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911054209.5A CN110795471B (zh) 2019-10-31 2019-10-31 数据匹配的方法及装置、计算机可读存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911054209.5A CN110795471B (zh) 2019-10-31 2019-10-31 数据匹配的方法及装置、计算机可读存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN110795471A true CN110795471A (zh) 2020-02-14
CN110795471B CN110795471B (zh) 2022-06-07

Family

ID=69442473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911054209.5A Active CN110795471B (zh) 2019-10-31 2019-10-31 数据匹配的方法及装置、计算机可读存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN110795471B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563683A (zh) * 2020-05-09 2020-08-21 中国银行股份有限公司 用于跨境撮合活动的多轮次排桌方法及装置
CN111985808A (zh) * 2020-08-19 2020-11-24 中国银行股份有限公司 撮合活动排桌方法及装置
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备
CN116151847A (zh) * 2023-03-17 2023-05-23 深圳市企企通科技有限公司 合作邀约单生成方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077369A (zh) * 2014-06-20 2014-10-01 用友软件股份有限公司 多维度数据的匹配装置和匹配方法
CN108268660A (zh) * 2018-02-08 2018-07-10 深圳市口袋网络科技有限公司 一种客户数据推荐方法、服务器及存储介质
CN108427695A (zh) * 2017-08-04 2018-08-21 平安科技(深圳)有限公司 企业推荐方法及应用服务器
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109299362A (zh) * 2018-09-21 2019-02-01 平安科技(深圳)有限公司 相似企业推荐方法、装置、计算机设备及存储介质
CN109582969A (zh) * 2018-12-04 2019-04-05 联想(北京)有限公司 实体匹配方法、装置及电子设备
CN109857938A (zh) * 2019-01-30 2019-06-07 杭州太火鸟科技有限公司 基于企业信息的搜索方法、搜索装置及计算机存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077369A (zh) * 2014-06-20 2014-10-01 用友软件股份有限公司 多维度数据的匹配装置和匹配方法
CN108427695A (zh) * 2017-08-04 2018-08-21 平安科技(深圳)有限公司 企业推荐方法及应用服务器
CN108268660A (zh) * 2018-02-08 2018-07-10 深圳市口袋网络科技有限公司 一种客户数据推荐方法、服务器及存储介质
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109299362A (zh) * 2018-09-21 2019-02-01 平安科技(深圳)有限公司 相似企业推荐方法、装置、计算机设备及存储介质
CN109582969A (zh) * 2018-12-04 2019-04-05 联想(北京)有限公司 实体匹配方法、装置及电子设备
CN109857938A (zh) * 2019-01-30 2019-06-07 杭州太火鸟科技有限公司 基于企业信息的搜索方法、搜索装置及计算机存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563683A (zh) * 2020-05-09 2020-08-21 中国银行股份有限公司 用于跨境撮合活动的多轮次排桌方法及装置
CN111985808A (zh) * 2020-08-19 2020-11-24 中国银行股份有限公司 撮合活动排桌方法及装置
CN111985808B (zh) * 2020-08-19 2023-08-22 中国银行股份有限公司 撮合活动排桌方法及装置
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备
CN116151847A (zh) * 2023-03-17 2023-05-23 深圳市企企通科技有限公司 合作邀约单生成方法、装置、设备及介质

Also Published As

Publication number Publication date
CN110795471B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN110795471B (zh) 数据匹配的方法及装置、计算机可读存储介质、电子设备
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN110807085B (zh) 故障信息的查询方法及装置、存储介质、电子装置
CN105721629B (zh) 用户标识匹配方法和装置
WO2019024496A1 (zh) 企业推荐方法及应用服务器
CN108334625B (zh) 用户信息的处理方法、装置、计算机设备和存储介质
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN106980703A (zh) 用于群组搜索的方法及装置、电子设备、计算机可读介质
CN107038166A (zh) 查询可预约仓库容量、预约及取消预约入库方法及装置
KR101559719B1 (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
CN114429364A (zh) 业务数据管理方法和装置、存储介质及电子设备
CN111191111A (zh) 内容推荐方法、装置及存储介质
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
CN106844320B (zh) 一种财务报表整合方法和设备
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN107704357B (zh) 日志生成方法和装置
CN112632409A (zh) 同一用户识别方法、装置、计算机设备和存储介质
CN114265974A (zh) 一种客户画像标签推荐系统及方法
CN112307297B (zh) 一种基于优先级规则的用户标识统一方法及系统
CN107784591B (zh) 名单数据处理方法及装置
CN111222923A (zh) 一种判断潜在客户的方法及装置、电子设备和存储介质
CN107203633B (zh) 数据表推数处理方法、装置及电子设备
US10063646B2 (en) Content distribution system, content distribution method, and non-transitory computer readable storage medium
CN112182107B (zh) 名单数据获取方法、装置、计算机设备及存储介质
CN109754151B (zh) 基于交易数据的地铁站点识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant