CN115563377B - 企业的确定方法、装置、存储介质及电子设备 - Google Patents
企业的确定方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115563377B CN115563377B CN202211160435.3A CN202211160435A CN115563377B CN 115563377 B CN115563377 B CN 115563377B CN 202211160435 A CN202211160435 A CN 202211160435A CN 115563377 B CN115563377 B CN 115563377B
- Authority
- CN
- China
- Prior art keywords
- enterprise
- vector representation
- preset
- target
- triplet data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 199
- 230000006870 function Effects 0.000 claims description 60
- 238000012549 training Methods 0.000 claims description 53
- 238000005457 optimization Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 description 40
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005314 correlation function Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种企业的确定方法、装置、存储介质及电子设备,其中,该方法包括:确定输入的第一企业;获取第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;根据第一目标向量表示和第二目标向量表示,从多个候选企业中确定与第一企业匹配的目标企业;其中,第一目标向量表示和第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对预设企业集合中的每个企业的预设向量表示调整后得到的,预设企业集合包括第一企业和多个候选企业。本发明涉及的企业的确定方法、装置、存储介质及电子设备,能够更全面、更准确地从多个候选企业中确定出与第一企业匹配的目标企业,提高相似企业匹配的准确率。
Description
技术领域
本发明涉及计算机技术领域,具体地,涉及一种企业的确定方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的不断发展,互联网上的信息呈指数级增长,这无疑会增大获取准确有用信息的难度。在企业推荐领域,一些场景中需要确定出与用户输入企业相似的一个或者多个企业,这就需要根据互联网上的企业信息进行相应的企业推荐。
相关技术中,在进行企业推荐时,通常采用人为的方式确定出与目标企业相似的企业,但这会因为人为因素的主观判断,导致确定出的相似企业的准确性较低;或者根据企业画像数据得到企业的特征信息,然后根据该特征信息基于推荐算法进行企业推荐,但企业画像数据得到的特征信息较单一,无法全面反应企业特征,这也会影响企业推荐的准确性。
发明内容
本发明的目的是提供一种企业的确定方法、装置、存储介质和电子设备。
第一方面,本发明提供一种企业的确定方法,所述方法包括:
确定输入的第一企业;
获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;
根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;
其中,所述第一目标向量表示和所述第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业。
可选地,所述根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业包括:
根据所述第一目标向量表示和每个所述候选企业的所述第二目标向量表示,通过预设企业确定模型确定与所述第一企业匹配的至少一个待确定企业;
从至少一个所述待确定企业中确定所述目标企业。
可选地,所述第一目标向量表示和所述第二目标向量表示通过以下方式调整得到:
获取多个三元组数据,每个所述三元组数据表征第二企业和第三企业之间的关联关系;所述第二企业为所述两个相关联企业中的一个企业,所述第三企业为所述两个相关联企业中的另一个企业;
针对所述预设企业集合中每两个相关联企业,获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示;
根据每个所述三元组数据调整所述第一预设向量表示和所述第二预设向量表示,并将调整后的每个企业的向量表示作为所述第一目标向量表示或所述第二目标向量表示。
可选地,所述根据每个所述三元组数据调整所述第一预设向量表示和所述第二预设向量表示包括:
根据所述三元组数据确定训练样本,所述训练样本包括正样本和负样本;
根据所述三元组数据创建企业关联函数;
根据所述训练样本和所述企业关联函数构建目标优化函数;
根据所述训练样本采用预设训练算法训练所述目标优化函数,并调整所述第一预设向量表示和所述第二预设向量表示。
可选地,所述根据所述三元组数据确定训练样本包括:
将每个所述三元组数据作为所述正样本;
针对每个所述三元组数据,将该三元组数据中的第二企业替换为第四企业,将该三元组数据中的第三企业替换为第五企业,其中所述第四企业为多个所述三元组数据中除该三元组数据中的第二企业之外的任一企业,所述第五企业为多个所述三元组数据中除该三元组数据中的第三企业之外的任一企业;
将企业替换后的每个三元组数据作为所述负样本。
可选地,所述根据所述训练样本和所述企业关联函数构建目标优化函数包括:
将所述正样本作为所述企业关联函数的输入,得到所述正样本对应的第一企业关联函数;
将所述负样本作为所述企业关联函数的输入,得到所述负样本对应的第二企业关联函数;
根据所述第一企业关联函数和所述第二企业关联函数构建所述目标优化函数。
可选地,在所述获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示之前,所述方法还包括:
针对每个所述三元组数据,对该三元组数据中的每个元素分别进行向量初始化,得到该三元组数据中每个元素分别对应的初始化向量;
所述获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示包括:
从向量初始化后的每个三元组数据中确定所述第二企业对应的所述第一预设向量表示以及所述第三企业对应的所述第二预设向量表示。
第二方面,本发明提供一种企业的确定装置,所述装置包括:
第一确定模块,用于确定输入的第一企业;
获取模块,用于获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;
第二确定模块,用于根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;
其中,所述第一目标向量表示和所述第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业。
第三方面,本发明提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面所述方法的步骤。
第四方面,本发明提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本发明第一方面所述方法的步骤。
通过上述技术方案,确定输入的第一企业;获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;其中,目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业,由于企业的目标向量表示是基于相关联企业之间的关联关系预先建立的,可以更全面的反应企业之间的关联特征,因此,基于每个企业的目标向量表示可以更全面、更准确地从多个候选企业中确定与用户输入的第一企业匹配的目标企业,提高相似企业匹配的准确率,并且直接基于企业的向量表示进行相似企业的推荐,避免了对企业画像数据的特征提取过程,从而可以提高企业推荐的效率。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是根据一示例性实施例示出的一种企业的确定方法的流程图;
图2是根据一示例性实施例示出的一种建立企业的目标向量表示的方法的流程图;
图3是根据一示例性实施例示出的步骤S204的方法的流程图;
图4是根据一示例性实施例示出的一种企业的确定装置的框图;
图5是根据一示例性实施例示出的另一种企业的确定装置的框图;
图6是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
需要说明的是,本发明中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
图1是根据一示例性实施例示出的一种企业的确定方法的流程图,如图1所示,该方法包括以下步骤:
在步骤S101中,确定输入的第一企业。
其中,该第一企业通常是指用户输入的企业,例如,用户想要查询与企业A相似的企业,可以在企业查询平台上输入企业A,以便通过该企业查询平台查询到与企业A相似的企业。
一种实现方式中,用户在输入该第一企业后,终端可以获取到企业查询请求消息(或者称之为企业推荐请求消息),之后可以通过解析该企业查询请求消息确定用户输入的该第一企业。
在步骤S102中,获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示。
其中,所述第一目标向量表示和所述第二目标向量表示是预先根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业,这里的关联关系,例如可以包括股权投资、合作竞争、招投标、法律诉讼等关系类型。
在步骤S103中,根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业。
在本步骤中,可以根据所述第一目标向量表示和每个所述候选企业的所述第二目标向量表示,通过预设企业确定模型确定与所述第一企业匹配的至少一个待确定企业;从至少一个所述待确定企业中确定所述目标企业。
其中,这里的预设企业确定模型可以为预先训练得到的任意的深度学习模型,本发明对该预设企业确定模型的模型结构和模型参数不作限定。
一种可能的实现方式中,可以将该预设企业确定模型预先部署至企业推荐平台(如基于Faiss(Facebook AI Similarity Search)实现的企业推荐平台),终端可以从Faiss对应的预设企业数据库中获取到预设企业集合中每个企业的目标向量表示(包括该第一目标向量表示和该第二目标向量表示),然后将各个企业的目标向量表示输入该企业推荐平台上的预设企业确定模型,模型可以计算该第一企业与任一候选企业的目标向量表示的向量相似度(如余弦相似度),然后通过模型输出与第一企业匹配的至少一个待确定企业,与此同时,模型还可以输出每个待确定企业与该第一企业的向量相似度,之后可以从至少一个待确定企业中选取向量相似度大于预设相似度阈值的企业作为该目标企业,或者将至少一个该待确定企业按照向量相似度由高到低的顺序进行排序,选取向量相似度高的预设数量的待确定企业作为该目标企业。
采用上述方法,由于企业的目标向量表示是基于相关联企业之间的关联关系预先建立的,可以更全面的反应企业之间的关联特征,因此,基于每个企业的目标向量表示可以更全面、更准确地从多个候选企业中确定与用户输入的第一企业匹配的目标企业,提高相似企业匹配的准确率,并且直接基于企业的向量表示进行相似企业的推荐,避免了对企业画像数据的特征提取过程,从而可以提高企业推荐的效率。
图2是根据一示例性实施例示出的一种建立企业的目标向量表示的方法的流程图,如图2所示,该第一目标向量表示和该第二目标向量表示可以通过以下步骤调整得到:
在步骤S201中,获取多个三元组数据,每个所述三元组数据表征第二企业和第三企业之间的关联关系;所述第二企业为所述两个相关联企业中的一个企业,所述第三企业为所述两个相关联企业中的另一个企业。
本发明主要基于企业之间的关联关系建立各个企业的向量表示,上述已经提及,该关联关系可以包括股权投资、合作竞争、招投标、法律诉讼等关系类型,一种实施例中,可以通过预设企业数据库存储各个企业,以及企业之间的关联关系,在本发明中,可以将预设企业数据库中存储的企业数据以三元组数据的形式进行展现,一个三元组数据可以包括第二企业、第三企业以及第二企业和第三企业之间的关系类型,其中,第二企业和第三企业可以用企业的预设企业标识表示,不同的企业对应的预设企业标识不相同,企业之间的关系类型可以设置为与该关系类型相对应的类型标识,例如,可以用0~3中的一个整数表示股权投资、合作竞争、招投标、法律诉讼四种关系类型中的一种关系类型,例如,假设A企业的预设企业标识为g1,B企业的预设企业标识为g2,并且A企业向B企业投资,那么A企业和B企业属于股权投资的关系,若股权投资对应的类型标识为0,那么A企业和B企业对应的其中一种三元组数据可以为(g1,0,g2),此处仅是举例说明,本发明对此不作限定。
需要说明的是,存在关联关系的两个相关联企业之中,一个企业可以视为主体企业,另一个企业可以视为客体企业,在本发明中,第二企业即为主体企业,第三企业即为客体企业,举例来说,假设A企业和B企业属于股权投资的关系,并且是A企业向B企业投资,那么A企业可以视为该主体企业(即第二企业),B企业可以视为该客体企业(即第三企业);再比如,假设C企业和D企业属于法律诉讼的关系,并且C企业属于提起诉讼方,B企业属于被诉讼方,那么C企业可以视为该主体企业(即第二企业),D企业可以视为该客体企业(即第三企业),这里的示例仅是举例说明,也就是说,在本发明中两个相关联企业之间的关联关系属于有向关系。
因此,在本发明中,预设企业集合中每两个相关联企业对应一个或者多个三元组数据,若两个相关联企业之间存在多种关系类型,那么这两个相关联企业也会相应地对应多个三元组数据。
在步骤S202中,针对每个所述三元组数据,对该三元组数据中的每个元素分别进行向量初始化,得到该三元组数据中每个元素分别对应的初始化向量。
其中,一个三元组数据可以包括第二企业、第三企业以及关系类型(即当前的三元组数据中第二企业和第三企业之间的关系类型)三个元素。
在本步骤一种可能的实现方式中,可以使用正态分布初始化每个三元组数据中的各个元素对应的向量。
示例地,假设一个三元组数据可以表示为(h,l,t),其中h为预先设置的该三元组数据中第二企业(即主体企业)的表征向量,t为该三元组数据中第三企业(即客体企业)的表征向量,l为该三元组数据中关系类型的表征向量,并且可以预先设置该三元组数据中每个元素对应的向量维度可以为100维,每维为数据类型为浮点型的数字,基于正态分布对该三元组数据进行向量初始化以后,可以将表征向量h、l、t分别初始化为一个100维,每维的数据范围均位于0~1之内的初始化向量,并且每个元素的表征向量的初始化向量中,这100维数据符合正态分布,此处仅是举例说明,本发明对此不作限定。
在步骤S203中,针对所述预设企业集合中每两个相关联企业,获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示。
在执行步骤S202以后,即可得到预设企业集合中各个企业的初始化向量,该初始化向量即为各个企业对应的预设向量表示,因此,在本步骤中,可以从向量初始化后的每个三元组数据中确定所述第二企业对应的所述第一预设向量表示以及所述第三企业对应的所述第二预设向量表示。
在步骤S204中,根据每个所述三元组数据调整所述第一预设向量表示和所述第二预设向量表示。
图3是根据一示例性实施例示出的步骤S204的方法的流程图,如图3所示,该方法包括以下步骤:
在步骤S2041中,根据所述三元组数据确定训练样本,所述训练样本包括正样本和负样本。
在本发明中,为了优化各个企业的向量表示,在训练过程中引入了负样本,以三元组数据(h,l,t)为例,在负样本中,h和t可以被替换成不属于这个三元组的h1和t1。
因此,在本步骤中,可以通过以下方式确定该训练样本:
将每个所述三元组数据作为所述正样本;针对每个所述三元组数据,将该三元组数据中的第二企业替换为第四企业,将该三元组数据中的第三企业替换为第五企业,其中所述第四企业为多个所述三元组数据中除该三元组数据中的第二企业之外的任一企业,所述第五企业为多个所述三元组数据中除该三元组数据中的第三企业之外的任一企业;将企业替换后的每个三元组数据作为所述负样本。
在步骤S2042中,根据所述三元组数据创建企业关联函数。
本发明是基于每两个相关联的企业之间的关联关系训练得到企业的向量表示,对于三元组数据(h,l,t)来说,向量l表示两个相关联的企业之间的关联关系,因此,可以理解的是,在训练过程中,对应每个三元组数据(h,l,t),需要向量h+l能够和向量t相似,因此,在本发明中,可以预先定义该企业关联函数为:
其中,h为三元组数据中第二企业的表征向量,t为该三元组数据中第三企业的表征向量,l为该三元组数据中关系类型的表征向量。
在步骤S2043中,根据所述训练样本和所述企业关联函数构建目标优化函数。
在本步骤中,可以将所述正样本作为所述企业关联函数的输入,得到所述正样本对应的第一企业关联函数;将所述负样本作为所述企业关联函数的输入,得到所述负样本对应的第二企业关联函数;根据所述第一企业关联函数和所述第二企业关联函数构建所述目标优化函数。
示例地,假设其中一个正样本可以表示为三元组数据(h,l,t),一个负样本可以表示为(h1,l,t1),将该正样本输入公式(1)所示的企业关联函数,得到第一企业关联函数可以表示为d(h+l,t),将该负样本输入公式(1)所示的企业关联函数,得到第一企业关联函数可以表示为d(h1+l,t1),又因为对于正样本来说,在训练中应尽量减少向量h+l和向量t的差,而对于负样本来说,在训练中应尽量增大向量h1+l和向量t1的差,因此,该目标优化函数可以为:
其中,S表示正样本集合,S1表示负样本集合,r表示预设调节系数。
上述示例仅是举例说明,本发明对此不作限定。
在步骤S2044中,根据所述训练样本采用预设训练算法训练所述目标优化函数,并调整所述第一预设向量表示和所述第二预设向量表示。
一种可能的实现方式中,可以从训练样本(该训练样本中包括正样本,也包括负样本)中选取预设数量的训练样本(如32个)作为一个批次(batch)的训练样本,然后将该batch中的每个训练样本(一个训练样本即为一个三元组数据)依次输入公式(1)后,得到各个训练样本分别对应的企业关联函数值,然后选取一个正样本对应的企业关联函数值和一个负样本对应的企业关联函数值后计算公式(2)中的loss函数L,然后采用随机梯度下降法训练该目标优化函数L,并在训练过程中不断调整各个企业的表征向量h和t,以及企业之间的关系表征向量l,之后可以将训练结束时预设企业集合中每个企业的向量表示作为所述目标向量表示。
另外,一种实现方式中,当确定当前的训练次数达到预设训练次数阈值的情况下,可以确定训练结束,或者在确定当前的目标优化函数收敛的情况下,确定训练结束。
在执行图2和图3所示实施例的步骤后,即可得到每个企业分别对应的目标向量表示,之后可以将各个企业的目标向量表示更新至基于Faiss创建的企业推荐平台的预设企业数据库中,以便后续该企业推荐平台可以根据各个企业的目标向量表示确定与输入的第一企业相似的一个或者多个目标企业,提高企业推荐的准确性。
采用上述方法,可以基于相关联企业之间的关联关系预先建立各个企业的目标向量表示,从而可以基于每个企业的目标向量表示更准确地从多个候选企业中确定与用户输入的第一企业匹配的目标企业,提高相似企业匹配的准确率,并且直接基于企业的向量表示进行相似企业的推荐,避免了对企业画像数据的特征提取过程,从而可以提高企业推荐的效率。
图4是根据一示例性实施例示出的一种企业的确定装置的框图,如图4所示,该装置包括:
第一确定模块401,用于确定输入的第一企业;
获取模块402,用于获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;
第二确定模块403,用于根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;
其中,所述第一目标向量表示和所述第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业。
可选地,所述第二确定模块403,用于根据所述第一目标向量表示和每个所述候选企业的所述第二目标向量表示,通过预设企业确定模型确定与所述第一企业匹配的至少一个待确定企业;从至少一个所述待确定企业中确定所述目标企业。
可选地,图5是根据图4所示实施例示出的一种企业的确定装置的框图,如图5所示,该装置还包括:
向量生成模块404,用于获取多个三元组数据,每个所述三元组数据表征第二企业和第三企业之间的关联关系;所述第二企业为所述两个相关联企业中的一个企业,所述第三企业为所述两个相关联企业中的另一个企业;针对所述预设企业集合中每两个相关联企业,获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示;根据每个所述三元组数据调整所述第一预设向量表示和所述第二预设向量表示,并将调整后的每个企业的向量表示作为所述第一目标向量表示或所述第二目标向量表示。
可选地,所述向量生成模块404,用于根据所述三元组数据确定训练样本,所述训练样本包括正样本和负样本;根据所述三元组数据创建企业关联函数;根据所述训练样本和所述企业关联函数构建目标优化函数;根据所述训练样本采用预设训练算法训练所述目标优化函数,并调整所述第一预设向量表示和所述第二预设向量表示。
可选地,所述向量生成模块404,用于将每个所述三元组数据作为所述正样本;针对每个所述三元组数据,将该三元组数据中的第二企业替换为第四企业,将该三元组数据中的第三企业替换为第五企业,其中所述第四企业为多个所述三元组数据中除该三元组数据中的第二企业之外的任一企业,所述第五企业为多个所述三元组数据中除该三元组数据中的第三企业之外的任一企业;将企业替换后的每个三元组数据作为所述负样本。
可选地,所述向量生成模块404,用于将所述正样本作为所述企业关联函数的输入,得到所述正样本对应的第一企业关联函数;将所述负样本作为所述企业关联函数的输入,得到所述负样本对应的第二企业关联函数;根据所述第一企业关联函数和所述第二企业关联函数构建所述目标优化函数。
可选地,所述向量生成模块404,用于针对每个所述三元组数据,对该三元组数据中的每个元素分别进行向量初始化,得到该三元组数据中每个元素分别对应的初始化向量;从向量初始化后的每个三元组数据中确定所述第二企业对应的所述第一预设向量表示以及所述第三企业对应的所述第二预设向量表示。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
采用上述装置,由于企业的目标向量表示是基于相关联企业之间的关联关系预先建立的,可以更全面的反应企业之间的关联特征,因此,基于每个企业的目标向量表示可以更全面、更准确地从多个候选企业中确定与用户输入的第一企业匹配的目标企业,提高相似企业匹配的准确率,并且直接基于企业的向量表示进行相似企业的推荐,避免了对企业画像数据的特征提取过程,从而可以提高企业推荐的效率。
图6是根据一示例性实施例示出的一种电子设备600的框图。如图6所示,该电子设备600可以包括:处理器601,存储器602。该电子设备600还可以包括多媒体组件603,输入/输出(I/O)接口604,以及通信组件605中的一者或多者。
其中,处理器601用于控制该电子设备600的整体操作,以完成上述的企业的确定方法中的全部或部分步骤。存储器602用于存储各种类型的数据以支持在该电子设备600的操作,这些数据例如可以包括用于在该电子设备600上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件603可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或通过通信组件605发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口604为处理器601和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件605用于该电子设备600与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件605可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的企业的确定方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的企业的确定方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器602,上述程序指令可由电子设备600的处理器601执行以完成上述的企业的确定方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的企业的确定方法的代码部分。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
Claims (7)
1.一种企业的确定方法,其特征在于,所述方法包括:
确定输入的第一企业;
获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;
根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;
其中,所述第一目标向量表示和所述第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业;
所述第一目标向量表示和所述第二目标向量表示通过以下方式调整得到:获取多个三元组数据,每个所述三元组数据表征第二企业和第三企业之间的关联关系;所述第二企业为所述两个相关联企业中的一个企业,所述第三企业为所述两个相关联企业中的另一个企业;针对所述预设企业集合中每两个相关联企业,获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示;根据所述三元组数据确定训练样本,所述训练样本包括正样本和负样本;根据所述三元组数据创建企业关联函数;根据所述训练样本和所述企业关联函数构建目标优化函数;根据所述训练样本采用预设训练算法训练所述目标优化函数,并调整所述第一预设向量表示和所述第二预设向量表示,并将调整后的每个企业的向量表示作为所述第一目标向量表示或所述第二目标向量表示;
所述根据所述三元组数据确定训练样本包括:
将每个所述三元组数据作为所述正样本;
针对每个所述三元组数据,将该三元组数据中的第二企业替换为第四企业,将该三元组数据中的第三企业替换为第五企业,其中所述第四企业为多个所述三元组数据中除该三元组数据中的第二企业之外的任一企业,所述第五企业为多个所述三元组数据中除该三元组数据中的第三企业之外的任一企业;
将企业替换后的每个三元组数据作为所述负样本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业包括:
根据所述第一目标向量表示和每个所述候选企业的所述第二目标向量表示,通过预设企业确定模型确定与所述第一企业匹配的至少一个待确定企业;
从至少一个所述待确定企业中确定所述目标企业。
3.根据权利要求1所述的方法,所述根据所述训练样本和所述企业关联函数构建目标优化函数包括:
将所述正样本作为所述企业关联函数的输入,得到所述正样本对应的第一企业关联函数;
将所述负样本作为所述企业关联函数的输入,得到所述负样本对应的第二企业关联函数;
根据所述第一企业关联函数和所述第二企业关联函数构建所述目标优化函数。
4.根据权利要求1所述的方法,其特征在于,在所述获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示之前,所述方法还包括:
针对每个所述三元组数据,对该三元组数据中的每个元素分别进行向量初始化,得到该三元组数据中每个元素分别对应的初始化向量;
所述获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示包括:
从向量初始化后的每个三元组数据中确定所述第二企业对应的所述第一预设向量表示以及所述第三企业对应的所述第二预设向量表示。
5.一种企业的确定装置,其特征在于,所述装置包括:
第一确定模块,用于确定输入的第一企业;
获取模块,用于获取所述第一企业的第一目标向量表示,以及多个候选企业的第二目标向量表示;
第二确定模块,用于根据所述第一目标向量表示和所述第二目标向量表示,从多个所述候选企业中确定与所述第一企业匹配的目标企业;
其中,所述第一目标向量表示和所述第二目标向量表示是根据预设企业集合中每两个相关联企业之间的关联关系,对所述预设企业集合中的每个企业的预设向量表示调整后得到的,所述预设企业集合包括所述第一企业和所述多个候选企业;
所述第一目标向量表示和所述第二目标向量表示通过以下方式调整得到:获取多个三元组数据,每个所述三元组数据表征第二企业和第三企业之间的关联关系;所述第二企业为所述两个相关联企业中的一个企业,所述第三企业为所述两个相关联企业中的另一个企业;针对所述预设企业集合中每两个相关联企业,获取所述第二企业对应的第一预设向量表示,以及所述第三企业对应的第二预设向量表示;根据所述三元组数据确定训练样本,所述训练样本包括正样本和负样本;根据所述三元组数据创建企业关联函数;根据所述训练样本和所述企业关联函数构建目标优化函数;根据所述训练样本采用预设训练算法训练所述目标优化函数,并调整所述第一预设向量表示和所述第二预设向量表示,并将调整后的每个企业的向量表示作为所述第一目标向量表示或所述第二目标向量表示;
所述根据所述三元组数据确定训练样本包括:
将每个所述三元组数据作为所述正样本;
针对每个所述三元组数据,将该三元组数据中的第二企业替换为第四企业,将该三元组数据中的第三企业替换为第五企业,其中所述第四企业为多个所述三元组数据中除该三元组数据中的第二企业之外的任一企业,所述第五企业为多个所述三元组数据中除该三元组数据中的第三企业之外的任一企业;
将企业替换后的每个三元组数据作为所述负样本。
6.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
7.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211160435.3A CN115563377B (zh) | 2022-09-22 | 2022-09-22 | 企业的确定方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211160435.3A CN115563377B (zh) | 2022-09-22 | 2022-09-22 | 企业的确定方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115563377A CN115563377A (zh) | 2023-01-03 |
CN115563377B true CN115563377B (zh) | 2024-05-17 |
Family
ID=84740495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211160435.3A Active CN115563377B (zh) | 2022-09-22 | 2022-09-22 | 企业的确定方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563377B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151847A (zh) * | 2023-03-17 | 2023-05-23 | 深圳市企企通科技有限公司 | 合作邀约单生成方法、装置、设备及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8799177B1 (en) * | 2010-07-29 | 2014-08-05 | Intuit Inc. | Method and apparatus for building small business graph from electronic business data |
CN109299362A (zh) * | 2018-09-21 | 2019-02-01 | 平安科技(深圳)有限公司 | 相似企业推荐方法、装置、计算机设备及存储介质 |
CN110971674A (zh) * | 2019-11-15 | 2020-04-07 | 北京明略软件系统有限公司 | 一种实现信息处理的方法、装置、计算机存储介质及终端 |
CN112395501A (zh) * | 2020-11-17 | 2021-02-23 | 航天信息股份有限公司 | 企业推荐方法、装置、存储介质及电子设备 |
CN112650951A (zh) * | 2020-12-21 | 2021-04-13 | 撼地数智(重庆)科技有限公司 | 一种企业相似度匹配方法、系统和计算装置 |
CN113705192A (zh) * | 2021-08-31 | 2021-11-26 | 平安银行股份有限公司 | 文本处理方法、装置与存储介质 |
CN114140007A (zh) * | 2021-12-07 | 2022-03-04 | 航天信息股份有限公司 | 一种风险企业的识别方法、装置及存储介质 |
CN114219328A (zh) * | 2021-12-20 | 2022-03-22 | 中国建设银行股份有限公司 | 一种企业间关系的确定方法及装置 |
CN114970495A (zh) * | 2022-05-23 | 2022-08-30 | 北京金堤科技有限公司 | 人名消歧方法、装置、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874617B2 (en) * | 2012-11-14 | 2014-10-28 | International Business Machines Corporation | Determining potential enterprise partnerships |
US11194840B2 (en) * | 2019-10-14 | 2021-12-07 | Microsoft Technology Licensing, Llc | Incremental clustering for enterprise knowledge graph |
-
2022
- 2022-09-22 CN CN202211160435.3A patent/CN115563377B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8799177B1 (en) * | 2010-07-29 | 2014-08-05 | Intuit Inc. | Method and apparatus for building small business graph from electronic business data |
CN109299362A (zh) * | 2018-09-21 | 2019-02-01 | 平安科技(深圳)有限公司 | 相似企业推荐方法、装置、计算机设备及存储介质 |
CN110971674A (zh) * | 2019-11-15 | 2020-04-07 | 北京明略软件系统有限公司 | 一种实现信息处理的方法、装置、计算机存储介质及终端 |
CN112395501A (zh) * | 2020-11-17 | 2021-02-23 | 航天信息股份有限公司 | 企业推荐方法、装置、存储介质及电子设备 |
CN112650951A (zh) * | 2020-12-21 | 2021-04-13 | 撼地数智(重庆)科技有限公司 | 一种企业相似度匹配方法、系统和计算装置 |
CN113705192A (zh) * | 2021-08-31 | 2021-11-26 | 平安银行股份有限公司 | 文本处理方法、装置与存储介质 |
CN114140007A (zh) * | 2021-12-07 | 2022-03-04 | 航天信息股份有限公司 | 一种风险企业的识别方法、装置及存储介质 |
CN114219328A (zh) * | 2021-12-20 | 2022-03-22 | 中国建设银行股份有限公司 | 一种企业间关系的确定方法及装置 |
CN114970495A (zh) * | 2022-05-23 | 2022-08-30 | 北京金堤科技有限公司 | 人名消歧方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于专利耦合的企业间技术相似性可视化研究;洪勇;李英敏;;科学学研究;20130715(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115563377A (zh) | 2023-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009059B (zh) | 用于生成模型的方法和装置 | |
CN111768231B (zh) | 产品信息推荐方法及装置 | |
CN109446171B (zh) | 一种数据处理方法和装置 | |
CN105894028B (zh) | 用户识别方法和装置 | |
CN103246690A (zh) | 标签继承 | |
CN110489574B (zh) | 一种多媒体信息推荐方法、装置和相关设备 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
CN111813910A (zh) | 客服问题的更新方法、系统、终端设备及计算机存储介质 | |
CN115563377B (zh) | 企业的确定方法、装置、存储介质及电子设备 | |
US20220019916A1 (en) | Apparatus and method for recommending federated learning based on tendency analysis of recognition model and method for federated learning in user terminal | |
CN114119123A (zh) | 信息推送的方法和装置 | |
CN113014564A (zh) | 一种用户的匹配方法、装置、计算机设备和存储介质 | |
CN110097004B (zh) | 面部表情识别方法和装置 | |
CN116821324A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN113722546B (zh) | 异常用户账户获取方法及装置、电子设备、存储介质 | |
CN113220828A (zh) | 意图识别模型处理方法、装置、计算机设备及存储介质 | |
CN113128278A (zh) | 一种图像识别方法及装置 | |
CN112541446B (zh) | 一种生物特征库更新方法、装置及电子设备 | |
CN113098974B (zh) | 一种确定人口数量的方法、服务器及存储介质 | |
CN113157704B (zh) | 层级关系分析方法、装置、设备及计算机可读存储介质 | |
CN112541548A (zh) | 关系网络的生成方法、装置、计算机设备及存储介质 | |
CN112101023A (zh) | 文本处理方法、装置以及电子设备 | |
CN111582456A (zh) | 用于生成网络模型信息的方法、装置、设备和介质 | |
CN110704648B (zh) | 用户行为属性的确定方法、装置、服务器及存储介质 | |
CN113704640B (zh) | 用户常驻地址的预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230728 Address after: 224008 Rooms 404-405 and 504, Building B-17-1, Big data Industrial Park, Kecheng Street, Yannan High tech Zone, Yancheng, Jiangsu Province Applicant after: Yancheng Tianyanchawei Technology Co.,Ltd. Address before: 224008 room 501-503, building b-17-1, Xuehai road big data Industrial Park, Kecheng street, Yannan high tech Zone, Yancheng City, Jiangsu Province (CNK) Applicant before: Yancheng Jindi Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |