CN112395501A - 企业推荐方法、装置、存储介质及电子设备 - Google Patents

企业推荐方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN112395501A
CN112395501A CN202011287735.9A CN202011287735A CN112395501A CN 112395501 A CN112395501 A CN 112395501A CN 202011287735 A CN202011287735 A CN 202011287735A CN 112395501 A CN112395501 A CN 112395501A
Authority
CN
China
Prior art keywords
enterprise
candidate
similarity
target
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011287735.9A
Other languages
English (en)
Inventor
乔振浩
刘雅婷
王泽皓
王志刚
刘芬
林文辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN202011287735.9A priority Critical patent/CN112395501A/zh
Publication of CN112395501A publication Critical patent/CN112395501A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及企业推荐方法、装置、存储介质及电子设备,所述方法包括:获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业,解决了相关技术企业推荐不准确的问题。

Description

企业推荐方法、装置、存储介质及电子设备
技术领域
本公开涉及通信技术领域,具体地,涉及企业推荐方法、装置、存储介质及电子设备。
背景技术
一件产品从原材料到成品需要多个企业合作完成,这种合作关系形成了产业链。对于某条产业链中的目标企业,需要准确匹配到其上游企业与下游企业,才能保证生产工作的高效、稳定运行。
上游企业提供了原材料,若无法匹配到合适的上游企业,则目标企业缺少原材料,而下游企业对产品进一步深加工,若无法匹配到合适的下游企业,则企业生产的产品也无用武之地。因此,上下游企业推荐对于目标企业的正常生产活动有着至关重要的意义。
相关技术中,采用较为宏观的信息,导致企业推荐不准确,需要人工进行二次筛选,耗费大量人力和时间。
发明内容
本公开的目的是提供一种企业推荐方法、装置、存储介质及电子设备,解决了相关技术企业推荐不准确的问题。
为了实现上述目的,本公开提供一种企业推荐方法,所述方法包括:
获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;
针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;
根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业。
可选地,所述方法还包括:
对获取到的目标企业和候选企业的商品信息进行预处理,所述预处理用于去除所述商品信息中的噪声信息;
所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
针对每个所述候选企业,根据预处理后的所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度。
可选地,在所述相似度包括所述商品名称向量相似度的情况下,所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
确定与所述目标企业对应的商品名称向量矩阵;以及
确定与每个所述候选企业对应的商品名称向量矩阵;
针对每个所述候选企业,计算该候选企业对应的商品名称向量矩阵与所述目标企业对应的商品名称向量矩阵的余弦距离,并将该余弦距离作为所述目标企业与该候选企业的商品名称向量相似度。
可选地,所述确定与所述目标企业对应的商品名称向量矩阵;以及确定与每个所述候选企业对应的商品名称向量矩阵包括:
将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标企业对应的商品名称向量矩阵;
针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的商品名称向量矩阵。
可选地,所述确定与所述目标企业对应的商品名称向量矩阵;以及确定与每个所述候选企业对应的商品名称向量矩阵包括:
将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标对应的初始商品名称向量矩阵;以及
对该初始商品名称向量矩阵进行聚类,得到与该目标企业对应的商品名称向量矩阵;
针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的初始商品名称向量矩阵;以及
对该初始商品名称向量矩阵进行聚类,得到与该候选企业对应的商品名称向量矩阵。
可选地,在所述相似度包括所述商品名称字符相似度的情况下,所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
针对每个所述候选企业,计算该候选企业的商品名称与所述目标企业的商品名称的编辑距离;以及
将该编辑距离作为所述目标企业与该候选企业的商品名称字符相似度。
可选地,所述根据所述目标企业与每个所述候选企业的相似度值,确定目标推荐企业包括:
针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度和所述目标企业与该候选企业的商品名称字符相似度进行加权,得到所述目标企业与该候选企业的第一综合相似度;
在所有所述第一综合相似度中确定相似度最大的第一目标综合相似度,并将所述第一目标综合相似度对应的候选企业作为目标推荐企业。
可选地,获取所述目标企业和每个所述候选企业的商品的商品价格;
针对每个所述候选企业,根据所述目标企业和该候选企业的商品的商品价格,确定所述目标企业与该候选企业的商品价格相似度;
所述根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业包括:
针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度、所述商品名称字符相似度以及所述商品价格相似度进行加权,得到所述目标企业与该候选企业的第二综合相似度;
在所有所述第二综合相似度中确定值最大的第二目标综合相似度,并将所述第二目标综合相似度对应的候选企业作为目标推荐企业。
可选地,按照第二综合相似度从高到低的顺序,对所述候选企业进行排序,得到第一推荐列表;
对所述第一推荐列表中的候选企业进行划分,以得到至少一个处于同一预设相似度区间内子列表;
获取每个所述候选企业对应的商品总额;
针对每个所述子列表,按照商品总额从高到低的顺序,对该子列表中候选企业进行排序,得到更新子列表;
按照所有所述子列表在所述第一推荐列表中的排列顺序,将得到的每个所述更新子列表进行拼接,得到第二推荐列表;
推送所述第二推荐列表至用户终端。
第二方面,本公开提供一种企业推荐装置,所述装置包括:
获取模块,用于获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;
第一相似度计算模块,用于针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;
推荐模块,用于根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业。
第三方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面中所述方法的步骤。
第四方面,本公开提供一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面中的所述方法的步骤。
通过上述技术方案,通过考虑企业的商品类信息,从商品名称向量相似度和商品名称字符相似度多种维度确定目标企业与候选企业的相似度,其中,商品类信息作为最能反应企业生产状况的信息,因此,以该类信息作为确定目标推荐企业的基础,能提高企业的推荐准确度,避免了由人工进行二次筛选。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种企业推荐方法的流程图。
图2是根据一示例性实施例示出的步骤S102的流程图。
图3是根据一示例性实施例示出的一种企业推荐方法的另一流程图。
图4是根据一示例性实施例示出的一种企业推荐装置的框图。
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
相关技术中,企业推荐相关方法使用了较为宏观的信息,如行业特征、地域特征、商品编码等信息。这些信息虽然能在一定程度上反应了企业的特征,然而,企业生产、购买的商品信息作为最能反应企业生产状况的信息却被忽略,造成企业推荐不准确,需要人工进行二次筛选,耗时耗力。
基于此,本公开提供一种企业推荐方法,图1是根据一示例性实施例示出的一种企业推荐方法的流程图,如图1所示,所述方法包括以下步骤:
在步骤S101中,获取目标企业和多个候选企业的商品信息,商品信息包括商品名称。
在步骤S102中,针对每个候选企业,根据目标企业与该候选企业的商品信息,确定目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度。
在步骤S103中,根据目标企业与每个候选企业的相似度,确定目标推荐企业。
在本公开中,考虑最能反映企业的生产状况的商品名称信息,通过商品名称向量相似度和商品名称字符相似度(即字面相似度)确定目标企业与候选企业的相似度,提高企业推荐的准确度。
值得说明的是,获取的目标企业的商品若是该企业生产的商品(即主营商品),则获取的候选企业的商品则是该企业需要购入的商品(即主购商品)。相对应的,获取的目标企业的商品若是该企业需要购入的商品,则获取的候选企业的商品则是该企业生产的商品。
以目标企业的商品若是该企业生产的商品,候选企业的商品则是该企业需要购入的商品为例,若目标企业生产的产品与候选企业的购入产品的相似度越高,则越表征该候选企业就是目标企业的下游企业,相应地,该目标企业也是候选企业的上游商业。
在一种可能的实施方式中,可以对获取到的目标企业和候选企业的商品信息进行预处理,所述预处理用于去除所述商品信息中的噪声信息。其中,所述噪声信息例如标点符号、商品规格等信息。
举例来讲,可以采用规则化表达式对商品信息进行预处理。相应地,在计算相似度时,根据预处理后的目标企业和该候选企业的商品信息,确定目标企业与该候选企业的相似度,以提高相似度计算的准确率。
在本公开中,相似度包括商品名称向量相似度和商品名称字符相似度。以下将以相似度包括商品名称向量相似度时,对上述步骤S102进行进一步说明,具体的,图2是根据一示例性实施例示出的步骤S102的流程图,如图2所示,步骤S102包括以下步骤:
在步骤S201中,确定与目标企业对应的商品名称向量矩阵;以及确定与每个候选企业对应的商品名称向量矩阵。
在步骤S202中,针对每个候选企业,计算该候选企业对应的商品名称向量矩阵与目标企业对应的商品名称向量矩阵的余弦距离,并将该余弦距离作为目标企业与该候选企业的商品名称向量相似度。
需要说明的是,通过计算商品向量之间的相似度来衡量商品在语义空间上的相似度。
以目标企业的商品为主营商品,候选企业的商品为主购商品为例,与目标企业对应的商品名称向量矩阵=A[m*d],与每个候选企业对应的商品名称向量矩阵=B[n*d],其中,m、n为商品个数,d为商品名称词向量维度。经过余弦相似度(即余弦距离)计算,可以得到[m*n]的相似度矩阵,该相似度矩阵的第1行(共n列)代表了目标企业主营商品1与候选企业n个主购商品间的相似度。
可选地,上述步骤S201具体可以包括:将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标企业对应的商品名称向量矩阵;针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的商品名称向量矩阵。
值得说明的是,相较于传统的Word to vector模型,BERT模型有更加强大的向量表示能力,且使用BERT模型获取词向量不需要进行分词操作,避免了分词错误引入干扰信息。此外,在缺乏训练数据的情况下,BERT模型也能获得很好的表达效果。Word to vector模型是一个将单词转换为向量形式的工具。
可选地,上述步骤S201具体可以包括:将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标对应的初始商品名称向量矩阵;以及对该初始商品名称向量矩阵进行聚类,得到与该目标企业对应的商品名称向量矩阵;针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的初始商品名称向量矩阵;以及对该初始商品名称向量矩阵进行聚类,得到与该候选企业对应的商品名称向量矩阵。
值得说明的是,分别对初始的向量矩阵(初始商品名称向量矩阵和初始商品名称向量矩阵)计算类别中心向量,分别得到聚类后的矩阵,[k*d]与[j*d],其中,k和j为聚类中心的个数,d为商品名称词向量维度。当目标企业和候选企业的商品数量特别多时,可采用上述聚类算法对矩阵进行聚类,以降低后续数据的计算量。
可选的,例如采用mean-shift聚类算法对初始商品名称向量矩阵和初始商品名称向量矩阵进行聚类。
以下将以相似度包括商品名称字符相似度时,对上述步骤S102进行进一步说明,具体的,步骤S102例如可以包括:针对每个候选企业,计算该候选企业的商品名称与目标企业的商品名称的编辑距离;以及将该编辑距离作为目标企业与该候选企业的商品名称字符相似度。
需要说明的是,商品名称字符相似度可以使用编辑距离来刻画商品名称字面间的相似度,即两个字符串之间由一个转成另一个所需的最少编辑操作次数。可采用下述计算式得到两个字符串之间的相似度:
Figure BDA0002782915300000091
其中,sim(str1,str2)表示字符串str1,str2的编辑距离,str1和str2均表示字符串,ldst为str1与str2间的类编辑距离,len(str1)表示str1的字符长度,len(str2)表示str2的字符长度。在具体应用上述计算式时,str1可以为目标企业的商品名称,str2可以为候选企业的商品名称。
在一种可能的实施方式中,上述步骤S103例如可以包括:针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度和所述目标企业与该候选企业的商品名称字符相似度进行加权,得到所述目标企业与该候选企业的第一综合相似度;在所有所述第一综合相似度中确定相似度最大的第一目标综合相似度,并将所述第一目标综合相似度对应的候选企业作为目标推荐企业。
在本公开中,基于商品名称的向量相似度和字符相似度,求得候选企业与目标企业的综合相似度,从多个维度综合考虑,提高企业推荐的准确度。
需要说明的是,商品名称向量相似度和商品名称字符相似度之间的权重系数根据实际情况进行设定。基于设定的权重系数对商品名称向量相似度和商品名称字符相似度进行加权。
在一种可能的实施方式中,图3是根据一示例性实施例示出的一种企业推荐方法的另一流程图,如图3所示,包括以下步骤:
在步骤S301中,获取目标企业和每个候选企业的商品的商品价格。
在步骤S302中,针对每个候选企业,根据目标企业和该候选企业的商品的商品价格,确定目标企业与该候选企业的商品价格相似度。
在步骤S303中,针对每个候选企业,将目标企业与该候选企业的商品名称向量相似度、商品名称字符相似度以及商品价格相似度进行加权,得到目标企业与该候选企业的第二综合相似度。
在步骤S304中,在所有第二综合相似度中确定值最大的第二目标综合相似度,并将该第二目标综合相似度对应的候选企业作为目标推荐企业。
在本公开中,考虑到在商品名称相似的基础上,进一步考虑商品价格相似度,以此来确定目标推荐企业,实现匹配到的目标推荐企业标定的商品价格与目标企业标定的商品价格相差最小,保证推荐的成功率,进一步提高企业推荐的准确度。在一种可能的实施方式中,采用以下计算式方式计算目标企业与候选企业的商品价格相似度,具体的:
分别将目标企业的每一商品与候选企业的每一商品计算商品价格相似度,再利用得到的所有商品间的相似度来确定目标企业与候选企业的商品价格相似度。
另外,采取以下计算式确定目标企业的每一商品与候选企业的每一商品的商品价格相似度:
D=1-|a-b|/a;
其中,D为商品价格相似度,a为目标企业商品1的价格,b为候选企业商品2的价格,且商品1和商品2是相似商品。
需要说明的是,商品名称向量相似度、商品名称字符相似度和商品价格相似度之间的权重系数根据实际情况进行设定。基于设定的权重系数对商品名称向量相似度、商品名称字符相似度和商品价格相似度进行加权。
需要说明的是,在执行步骤S301之前,可以选取第一综合相似度大于预设阈值的候选企业作为新的候选企业,在新的候选企业中进一步结合商品名称向量相似度、商品名称字符相似度和商品价格相似度进行目标推荐企业。
在本公开中,商品价格相似度用于衡量不同企业商品的定位,例如在商品名称相同的情况下,购买高端商品的下游企业更有可能是生产高端商品企业的目标企业。此外,为了便于目标企业在候选企业中确定目标推荐企业,可以生成一个排序列表。具体的包括以下步骤:
第一,按照第二综合相似度从高到低的顺序,对所述候选企业进行排序,得到第一推荐列表。先依据从商品名称的相似度方面考虑,对候选企业进行排序,以将商品相似度高的企业排列在前。
第二,对所述第一推荐列表中的候选企业进行划分,以得到至少一个处于同一预设相似度区间内子列表。依照预设的划分区间,将第一推荐列表进行划分,得到多个子列表。示例地,划分区间为0.9~1、0.7~0.9、0.5~0.7,则根据该划分区间,可以将第一推荐列表最多划分成3个子列表,且3个子列表的范围分别是0.9~1、0.7~0.9、0.5~0.7。
第三,获取每个所述候选企业对应的商品总额。
第四,针对每个所述子列表,按照商品总额从高到低的顺序,对该子列表中候选企业进行排序,得到更新子列表。按照商品总额对每个子列表中的候选企业进行再次排序。示例地,若以子列表内包括3个候选企业为例,该子列表具体为[{企业名称:雨润,相似度0.96,商品总额1000},{企业名称:金华,相似度0.94,商品总额1200},{企业名称:双汇,相似度0.92,商品总额1100}],该列表是按照相似度高低进行排序得到的。进而再根据商品总额对该子列表再一次排序得到的更新子列表为[{企业名称:金华,相似度0.94,商品总额1200},{企业名称:双汇,相似度0.92,商品总额1100},{企业名称:雨润,相似度0.96,商品总额1000}],该更新子列表是按照商品总额排序得到的。可以看出的是,更新后的子列表相较于原子列表内的目标企业的排列顺序发生了改变,这种排序方法兼顾了相似商品与优质企业两种指标。
第五,按照所有所述子列表在所述第一推荐列表中的排列顺序,将得到的每个所述更新子列表进行拼接,得到第二推荐列表。按照所有所述子列表在所述第一推荐列表中的排列顺序,对更新子列表进行更新,可以保证得到的第二推荐列表相似度值最大的区间的更新子列表会排列在前。
第六,推送所述第二推荐列表至用户终端。用户可以根据用户终端上显示的第二推荐列表查看各个候选企业的数据情况。
基于同一发明构思,本公开还提供一种企业推荐装置,图4是根据一示例性实施例示出的一种企业推荐装置的框图。如图4所示,所述装置400包括:
获取模块401,用于获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;
第一相似度计算模块402,用于针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;
推荐模块403,用于根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业。
可选地,所述装置400还包括预处理模块,用于对获取到的目标企业和候选企业的商品信息进行预处理,所述预处理用于去除所述商品信息中的噪声信息。
可选地,所述确定模块具体用于针对每个所述候选企业,根据预处理后的所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度。
可选地,在所述相似度包括所述商品名称向量相似度的情况下,第一相似度计算模块402包括:
向量确定子模块,用于确定与所述目标企业对应的商品名称向量矩阵;以及确定与每个所述候选企业对应的商品名称向量矩阵;
名称向量相似度计算子模块,用于针对每个所述候选企业,计算该候选企业对应的商品名称向量矩阵与所述目标企业对应的商品名称向量矩阵的余弦距离,并将该余弦距离作为所述目标企业与该候选企业的商品名称向量相似度。
可选地,所述向量确定子模块具体用于将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标企业对应的商品名称向量矩阵;针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的商品名称向量矩阵。
可选地,所述向量确定子模块具体用于将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标对应的初始商品名称向量矩阵;以及对该初始商品名称向量矩阵进行聚类,得到与该目标企业对应的商品名称向量矩阵;针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的初始商品名称向量矩阵;以及对该初始商品名称向量矩阵进行聚类,得到与该候选企业对应的商品名称向量矩阵。
可选地,在所述相似度包括所述商品名称字符相似度的情况下,第一相似度计算模块402还包括:
商品名称字符相似度计算子模块,用于针对每个所述候选企业,计算该候选企业的商品名称与所述目标企业的商品名称的编辑距离;以及将该编辑距离作为所述目标企业与该候选企业的商品名称字符相似度。
可选地,所述确定模块403包括:
第一综合相似度计算子模块,用于针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度和所述目标企业与该候选企业的商品名称字符相似度进行加权,得到所述目标企业与该候选企业的第一综合相似度。
确定子模块,用于在所有所述第一综合相似度中确定相似度最大的第一目标综合相似度,并将所述第一目标综合相似度对应的候选企业作为目标推荐企业。
可选地,所述装置400还包括:
价格获取模块,用于获取所述目标企业和每个候选企业的商品的商品价格。
第二相似度计算模块,针对每个所述候选企业,根据所述目标企业和该候选企业的商品的商品价格,确定所述目标企业与该候选企业的商品价格相似度。
所述确定模块403具体用于针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度、所述商品名称字符相似度以及所述商品价格相似度进行加权,得到所述目标企业与该候选企业的第二综合相似度;在所有所述第二综合相似度中确定值最大的第二目标综合相似度,并将所述第二目标综合相似度对应的候选企业作为目标推荐企业。
所述装置400还包括:
第一排序模块,用于按照第二综合相似度从高到低的顺序,对所述候选企业进行排序,得到第一推荐列表。
划分模块,用于对所述第一推荐列表中的候选企业进行划分,以得到至少一个处于同一预设相似度区间内子列表。
商品总额获取模块,用于获取每个所述候选企业对应的商品总额。
第二排序模块,用于针对每个所述子列表,按照商品总额从高到低的顺序,对该子列表中候选企业进行排序,得到更新子列表。
拼接模块,用于按照所有所述子列表在所述第一推荐列表中的排列顺序,将得到的每个所述更新子列表进行拼接,得到第二推荐列表。
推送模块,用于推送所述第二推荐列表至用户终端。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本公开还提供一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时上述方法实施例中所述企业推荐方法的步骤。
基于同一发明构思,本公开还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述方法实施例中所述企业推荐方法的步骤。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电力组件506,多媒体组件508,音频组件510,输入/输出(I/O)接口512,以及通信组件514。
处理组件502通常控制装置500的整体操作,诸如与显示,数据通信和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述企业推荐方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件506为装置500的各种组件提供电力。电力组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当装置500处于操作模式,如语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件514发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
输入/输出(I/O)接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
通信组件514被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件514经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件514还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述企业推荐方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述企业推荐方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的企业推荐方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (12)

1.一种企业推荐方法,其特征在于,所述方法包括:
获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;
针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;
根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对获取到的目标企业和候选企业的商品信息进行预处理,所述预处理用于去除所述商品信息中的噪声信息;
所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
针对每个所述候选企业,根据预处理后的所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度。
3.根据权利要求1所述的方法,其特征在于,在所述相似度包括所述商品名称向量相似度的情况下,所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
确定与所述目标企业对应的商品名称向量矩阵;以及
确定与每个所述候选企业对应的商品名称向量矩阵;
针对每个所述候选企业,计算该候选企业对应的商品名称向量矩阵与所述目标企业对应的商品名称向量矩阵的余弦距离,并将该余弦距离作为所述目标企业与该候选企业的商品名称向量相似度。
4.根据权利要求3所述的方法,其特征在于,所述确定与所述目标企业对应的商品名称向量矩阵;以及确定与每个所述候选企业对应的商品名称向量矩阵包括:
将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标企业对应的商品名称向量矩阵;
针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的商品名称向量矩阵。
5.根据权利要求3所述的方法,其特征在于,所述确定与所述目标企业对应的商品名称向量矩阵;以及确定与每个所述候选企业对应的商品名称向量矩阵包括:
将所述目标企业的商品名称输入至训练好的BERT模型中,得到与该目标对应的初始商品名称向量矩阵;以及
对该初始商品名称向量矩阵进行聚类,得到与该目标企业对应的商品名称向量矩阵;
针对每个所述候选企业,将该候选企业的商品名称输入至训练好的BERT模型中,得到与该候选企业对应的初始商品名称向量矩阵;以及
对该初始商品名称向量矩阵进行聚类,得到与该候选企业对应的商品名称向量矩阵。
6.根据权利要求1所述的方法,其特征在于,在所述相似度包括所述商品名称字符相似度的情况下,所述针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度包括:
针对每个所述候选企业,计算该候选企业的商品名称与所述目标企业的商品名称的编辑距离;以及
将该编辑距离作为所述目标企业与该候选企业的商品名称字符相似度。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述根据所述目标企业与每个所述候选企业的相似度值,确定目标推荐企业包括:
针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度和所述目标企业与该候选企业的商品名称字符相似度进行加权,得到所述目标企业与该候选企业的第一综合相似度;
在所有所述第一综合相似度中确定相似度最大的第一目标综合相似度,并将所述第一目标综合相似度对应的候选企业作为目标推荐企业。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取所述目标企业和每个所述候选企业的商品的商品价格;
针对每个所述候选企业,根据所述目标企业和该候选企业的商品的商品价格,确定所述目标企业与该候选企业的商品价格相似度;
所述根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业包括:
针对每个所述候选企业,将所述目标企业与该候选企业的商品名称向量相似度、所述商品名称字符相似度以及所述商品价格相似度进行加权,得到所述目标企业与该候选企业的第二综合相似度;
在所有所述第二综合相似度中确定值最大的第二目标综合相似度,并将所述第二目标综合相似度对应的候选企业作为目标推荐企业。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
按照第二综合相似度从高到低的顺序,对所述候选企业进行排序,得到第一推荐列表;
对所述第一推荐列表中的候选企业进行划分,以得到至少一个处于同一预设相似度区间内子列表;
获取每个所述候选企业对应的商品总额;
针对每个所述子列表,按照商品总额从高到低的顺序,对该子列表中候选企业进行排序,得到更新子列表;
按照所有所述子列表在所述第一推荐列表中的排列顺序,将得到的每个所述更新子列表进行拼接,得到第二推荐列表;
推送所述第二推荐列表至用户终端。
10.一种企业推荐装置,其特征在于,所述装置包括:
获取模块,用于获取目标企业和多个候选企业的商品信息,所述商品信息包括商品名称;
第一相似度计算模块,用于针对每个所述候选企业,根据所述目标企业和该候选企业的商品信息,确定所述目标企业与该候选企业的相似度,该相似度包括商品名称向量相似度和商品名称字符相似度;
推荐模块,用于根据所述目标企业与每个所述候选企业的相似度,确定目标推荐企业。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-9中任一项所述方法的步骤。
12.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-9中任一项所述方法的步骤。
CN202011287735.9A 2020-11-17 2020-11-17 企业推荐方法、装置、存储介质及电子设备 Pending CN112395501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011287735.9A CN112395501A (zh) 2020-11-17 2020-11-17 企业推荐方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011287735.9A CN112395501A (zh) 2020-11-17 2020-11-17 企业推荐方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN112395501A true CN112395501A (zh) 2021-02-23

Family

ID=74605874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011287735.9A Pending CN112395501A (zh) 2020-11-17 2020-11-17 企业推荐方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN112395501A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948553A (zh) * 2021-02-26 2021-06-11 平安国际智慧城市科技股份有限公司 法律智能问答方法、装置、电子设备及存储介质
CN113569036A (zh) * 2021-07-20 2021-10-29 上海明略人工智能(集团)有限公司 一种媒体信息的推荐方法、装置及电子设备
CN113837844A (zh) * 2021-10-19 2021-12-24 北京邮电大学 一种多级联下游企业推荐系统、方法及可存储介质
CN113947456A (zh) * 2021-10-19 2022-01-18 广州华多网络科技有限公司 线上商铺匹配方法及其装置、设备、介质、产品
CN114154829A (zh) * 2021-11-25 2022-03-08 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质
CN115563377A (zh) * 2022-09-22 2023-01-03 盐城金堤科技有限公司 企业的确定方法、装置、存储介质及电子设备
CN114154829B (zh) * 2021-11-25 2024-06-28 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702631B1 (en) * 2006-03-14 2010-04-20 Google Inc. Method and system to produce and train composite similarity functions for product normalization
CN106383894A (zh) * 2016-09-23 2017-02-08 深圳市由心网络科技有限公司 一种企业供需信息匹配方法和装置
CN108427695A (zh) * 2017-08-04 2018-08-21 平安科技(深圳)有限公司 企业推荐方法及应用服务器
CN108694600A (zh) * 2017-04-10 2018-10-23 北京智慧联合科技有限公司 一种为目标企业推荐上下游企业群的方法
CN109300003A (zh) * 2018-09-17 2019-02-01 平安科技(深圳)有限公司 企业推荐方法、装置、计算机设备和存储介质
CN109300014A (zh) * 2018-10-24 2019-02-01 中南民族大学 基于日志挖掘的商品推荐方法、装置、服务器及存储介质
CN109919737A (zh) * 2019-03-20 2019-06-21 中电科大数据研究院有限公司 一种生产销售商品的推荐方法及系统
CN110334185A (zh) * 2019-07-05 2019-10-15 政采云有限公司 一种平台中数据的处理方法和装置
CN110517077A (zh) * 2019-08-21 2019-11-29 天津货比三价科技有限公司 基于属性距离的商品相似度分析方法、装置及存储介质
CN110674378A (zh) * 2019-09-26 2020-01-10 科大国创软件股份有限公司 基于余弦相似度和最小编辑距离的中文语义识别方法
CN110795634A (zh) * 2019-10-31 2020-02-14 秒针信息技术有限公司 商品推荐方法、装置、计算机设备和可读存储介质
CN111311381A (zh) * 2020-04-07 2020-06-19 广州翼云科技有限公司 一种商品推荐方法及系统
CN111445903A (zh) * 2020-03-27 2020-07-24 中国工商银行股份有限公司 企业名称识别方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702631B1 (en) * 2006-03-14 2010-04-20 Google Inc. Method and system to produce and train composite similarity functions for product normalization
CN106383894A (zh) * 2016-09-23 2017-02-08 深圳市由心网络科技有限公司 一种企业供需信息匹配方法和装置
CN108694600A (zh) * 2017-04-10 2018-10-23 北京智慧联合科技有限公司 一种为目标企业推荐上下游企业群的方法
CN108427695A (zh) * 2017-08-04 2018-08-21 平安科技(深圳)有限公司 企业推荐方法及应用服务器
CN109300003A (zh) * 2018-09-17 2019-02-01 平安科技(深圳)有限公司 企业推荐方法、装置、计算机设备和存储介质
CN109300014A (zh) * 2018-10-24 2019-02-01 中南民族大学 基于日志挖掘的商品推荐方法、装置、服务器及存储介质
CN109919737A (zh) * 2019-03-20 2019-06-21 中电科大数据研究院有限公司 一种生产销售商品的推荐方法及系统
CN110334185A (zh) * 2019-07-05 2019-10-15 政采云有限公司 一种平台中数据的处理方法和装置
CN110517077A (zh) * 2019-08-21 2019-11-29 天津货比三价科技有限公司 基于属性距离的商品相似度分析方法、装置及存储介质
CN110674378A (zh) * 2019-09-26 2020-01-10 科大国创软件股份有限公司 基于余弦相似度和最小编辑距离的中文语义识别方法
CN110795634A (zh) * 2019-10-31 2020-02-14 秒针信息技术有限公司 商品推荐方法、装置、计算机设备和可读存储介质
CN111445903A (zh) * 2020-03-27 2020-07-24 中国工商银行股份有限公司 企业名称识别方法及装置
CN111311381A (zh) * 2020-04-07 2020-06-19 广州翼云科技有限公司 一种商品推荐方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948553A (zh) * 2021-02-26 2021-06-11 平安国际智慧城市科技股份有限公司 法律智能问答方法、装置、电子设备及存储介质
CN113569036A (zh) * 2021-07-20 2021-10-29 上海明略人工智能(集团)有限公司 一种媒体信息的推荐方法、装置及电子设备
CN113837844A (zh) * 2021-10-19 2021-12-24 北京邮电大学 一种多级联下游企业推荐系统、方法及可存储介质
CN113947456A (zh) * 2021-10-19 2022-01-18 广州华多网络科技有限公司 线上商铺匹配方法及其装置、设备、介质、产品
CN114154829A (zh) * 2021-11-25 2022-03-08 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质
WO2023093116A1 (zh) * 2021-11-25 2023-06-01 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质
CN114154829B (zh) * 2021-11-25 2024-06-28 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质
CN115563377A (zh) * 2022-09-22 2023-01-03 盐城金堤科技有限公司 企业的确定方法、装置、存储介质及电子设备
CN115563377B (zh) * 2022-09-22 2024-05-17 盐城天眼察微科技有限公司 企业的确定方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN112395501A (zh) 企业推荐方法、装置、存储介质及电子设备
WO2016150354A1 (zh) 一种对电子商务平台的用户进行分类的方法及系统
CN104615721B (zh) 用于基于退货关联信息推荐商品的方法和系统
US11544534B2 (en) Systems and methods for generating recommendations using neural network and machine learning techniques
CN112070577A (zh) 一种商品推荐方法、系统、设备及介质
WO2010144234A1 (en) Systems, methods and computer program products for computing and outputting a timeline value, indication of popularity, and recommendation
CN110852785B (zh) 用户分级方法、装置及计算机可读存储介质
CN110347786B (zh) 一种语义模型的调优方法及系统
CN112365283B (zh) 一种优惠券发放方法、装置、终端设备及存储介质
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
JP2009129087A (ja) 商品情報分類装置、プログラム、商品情報分類方法
CN110046928A (zh) 确定标签的方法、装置、电子设备及可读存储介质
WO2018013518A1 (en) Image-based shopping system
CN110019798B (zh) 一种用于对进销项商品种类差异进行度量的方法及系统
CN117151830A (zh) 一种基于大数据的商品推荐方法及系统
US20150012264A1 (en) Dictionary generation device, dictionary generation method, dictionary generation program and computer-readable recording medium storing same program
CN109003013A (zh) 一种基于语音技术的商品盘点方法
KR20150081383A (ko) 사용자 로그 기반 상품 추천 방법, 이를 위한 시스템 및 장치
CN111325614B (zh) 电子对象的推荐方法、装置和电子设备
CN103389981A (zh) 网络标签自动识别方法及其系统
CN107977876B (zh) 用于处理订单信息的方法及装置
US20230055597A1 (en) System, Method, Program and Recording Medium Recording Program for Recommendation Item Determination and Personality Model Generation
CN111782850A (zh) 一种基于手绘图的物品搜索方法和装置
CN113919895A (zh) 排序方法、装置、设备和存储介质
CN116012115A (zh) 一种基于商品图谱及供应链的人群兴趣动态标签方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination