CN112559897B - 匹配关系的识别方法、装置及设备 - Google Patents

匹配关系的识别方法、装置及设备 Download PDF

Info

Publication number
CN112559897B
CN112559897B CN202110200963.6A CN202110200963A CN112559897B CN 112559897 B CN112559897 B CN 112559897B CN 202110200963 A CN202110200963 A CN 202110200963A CN 112559897 B CN112559897 B CN 112559897B
Authority
CN
China
Prior art keywords
resource
network
matching
relation
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110200963.6A
Other languages
English (en)
Other versions
CN112559897A (zh
Inventor
朱培源
苑爱泉
桑梓森
芦亚飞
马骐
万家雪
何旺贵
王宇昊
许林隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN202110200963.6A priority Critical patent/CN112559897B/zh
Publication of CN112559897A publication Critical patent/CN112559897A/zh
Application granted granted Critical
Publication of CN112559897B publication Critical patent/CN112559897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种匹配关系的识别方法、装置及设备,涉及互联网技术领域,能够在匹配关系识别的过程中强化资源主体的表达,降低模型受到数均分布的影响,提高匹配关系的识别效率。其中方法包括:首先设置特征元组分类,将作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,匹配关系网络包括第一关系网络和第二关系网络,然后根据特征元组分类的属性,将特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到特征元组分类的泛化嵌入式表达向量;利用第二关系网络,对特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系。

Description

匹配关系的识别方法、装置及设备
技术领域
本申请涉及互联网技术领域,尤其是涉及到一种匹配关系的识别方法、装置及设备。
背景技术
随着电子商务技术的不断发展,线下的商务机会与互联网结合的模式,让互联网成为线下交易的网络平台。通常情况下,网络平台的关键作用之一就是建立资源主体之间的匹配关系,并利用各个资源主体之间的匹配关系,向资源主体提供资源线索。以具体应用场景为例,资源主体包括用户和线上入驻的店铺,网络平台需要根据用户兴趣爱好、用户所处场景、用户搜索串和店铺特点,为用户准确匹配到符合需求的店铺。
相关技术中,可以使用神经网络算法去预估各个资源主体之间的匹配关系,首先根据平台需求构造神经网络模型训练的样本集,其中,样本集往往包含了几百甚至上千个特征,每一个特征描述了资源主体某一维度的信息,并使用样本集进行神经网络模型的训练来预测各个资源主体之间的匹配关系。然而,现有神经网络模型受到模型结构的影响,更多的是描述资源主体中某一特征之间的匹配关系,例如,用户特征和距离之间的匹配关系,但该模型结构并未考虑到资源特征主体之间的匹配关系,使得匹配关系的识别过程中资源主体的表达较弱,模型受到数据分布的影响较大,进而导致匹配关系的识别准确率较低。
发明内容
有鉴于此,本申请提供了一种匹配关系的识别方法、装置及设备,主要目的在于解决现有技术中模型结构并未考虑到资源特征主体之间的匹配关系,使得匹配关系的识别过程中资源主体的表达较弱,模型受到数据分布的影响较大,进而导致匹配关系的识别准确率较低的问题。
根据本申请的第一个方面,提供了一种匹配关系的识别方法,该方法包括:
设置特征元组分类,其中,所述特征元组分类包含作用于相同资源主体的资源特征;
将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,其中,所述匹配关系网络包括第一关系网络和第二关系网络,所述第一关系网络具有不同的属性识别能力,所述第二关系网络具有资源主体之间匹配关系的挖掘能力;
根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量,其中,所述泛化嵌入式表达向量用于表达特征元组分类映射的资源主体;
利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系。
进一步地,所述设置特征元组分类,具体包括:
获取包含各类资源主体的资源特征;
根据所述资源主体的属性标识,确定所述资源特征作用的资源主体;
将作用于相同资源主体的资源特征组成特征元组,并按照资源主体所属类别设置特征元组分类。
进一步地,所述利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,具体包括:
利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系;
按照所述资源主体之间的建模关系,计算所述特征元组分类的泛化嵌入式表达向量之间的余弦相似度,得到资源主体之间的第一匹配关系。
进一步地,所述利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系,具体包括:
利用所述第二关系网络的建模目标,对所述特征元组分类的泛化嵌入式表达向量进行组合,得到所述特征元组分类映射至少两个资源主体;
将所述特征元组分类映射至少两个资源主体进行匹配,得到资源主体之间的建模关系。
进一步地,在所述将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络之前,所述方法还包括:
利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络;
所述利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络,所述具体包括:
结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数;
利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络。
进一步地,所述结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数,具体包括:
结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,针对第一匹配关系所涉及的匹配结果构造损失函数;
根据所述第一匹配关系所涉及匹配结果对第一网络模型的影响因子,确定每个匹配结果在第一网络模型中的占比值;
按照所述每个匹配结果在第一网络模型中的占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
进一步地,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,在所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络之前,所述方法还包括:
利用包含作用于不同资源主体的资源特征所携带的任务标签对至少一个第二网络模型中的模型参数进行训练,将训练过程中至少一个第二网络模型中输出资源主体之间的至少一个第二匹配关系拼接至第一网络模型输出资源主体之间的第一匹配关系,得到资源主体之间的第三匹配关系;
结合所述资源主体之间的第三匹配关系以及包含作用于不同资源主体的资源特征所携带的任务标签,构造至少一个第二网络模型损失函数。
进一步地,所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络,具体还包括:
将所述第一网络模型损失函数与所述至少一个第二网络模型损失函数相结合,构建所述匹配关系网络的损失函数;
利用所述匹配关系网络的损失函数调整所述第一网络模型中的模型参数以及所述至少一个第二网络模型中的模型参数,构建匹配关系网络。
进一步地,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述方法还包括:
将所述作用于不同资源主体的资源特征形成特征向量输入至至少一个第三关系网络,预测资源主体之间的至少一个第二匹配关系;
结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系。
进一步地,所述结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系,具体包括:
利用预先为至少一个第三关系网络设置的权重值,对所述资源主体之间的至少一个第二匹配关系进行加权计算;
结合加权计算后形成的匹配关系以及所述第一匹配关系,确定所述资源主体之间的第三匹配关系。
根据本申请的第二个方面,提供了一种匹配关系的识别装置,该装置包括:
设置单元,用于设置特征元组分类,其中,所述特征元组分类包含作用于相同资源主体的资源特征;
拼接单元,用于将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,其中,所述匹配关系网络包括第一关系网络和第二关系网络,所述第一关系网络具有不同的属性识别能力,所述第二关系网络具有资源主体之间匹配关系的挖掘能力;
分配单元,用于根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量,其中,所述泛化嵌入式表达向量用于表达特征元组分类映射的资源主体;
挖掘单元,用于利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系。
进一步地,所述设置单元包括:
获取模块,用于获取包含各类资源主体的资源特征;
第一确定模块,用于根据所述资源主体的属性标识,确定所述资源特征作用的资源主体;
组成模块,用于将作用于相同资源主体的资源特征组成特征元组,并按照资源主体所属类别设置特征元组分类。
进一步地,所述挖掘单元包括:
提取模块,用于利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系;
计算模块,用于按照所述资源主体之间的建模关系,计算所述特征元组分类的泛化嵌入式表达向量之间的余弦相似度,得到资源主体之间的第一匹配关系。
进一步地,所述提取模块包括:
组合子模块,用于利用所述第二关系网络的建模目标,对所述特征元组分类的泛化嵌入式表达向量进行组合,得到所述特征元组分类映射至少两个资源主体;
匹配子模块,用于将所述特征元组分类映射至少两个资源主体进行匹配,得到资源主体之间的建模关系。
进一步地,所述装置还包括:
训练单元,用于在所述将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络之前,利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络;所述训练单元包括:
第一构造模块,用于结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数;
调整模块,用于利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络。
进一步地,所述第一构造模块包括:
构造子模块,用于结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,针对第一匹配关系所涉及的匹配结果构造损失函数;
确定子模块,用于根据所述第一匹配关系所涉及匹配结果对第一网络模型的影响因子,确定每个匹配结果在第一网络模型中的占比值;
累加子模块,用于按照所述每个匹配结果在第一网络模型中的占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
进一步地,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述训练单元还包括:
拼接模块,用于在所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络之前,利用包含作用于不同资源主体的资源特征所携带的任务标签对至少一个第二网络模型中的模型参数进行训练,将训练过程中至少一个第二网络模型中输出资源主体之间的至少一个第二匹配关系拼接至第一网络模型输出资源主体之间的第一匹配关系,得到资源主体之间的第三匹配关系;
第二构造模块,用于结合所述资源主体之间的第三匹配关系以及包含作用于不同资源主体的资源特征所携带的任务标签,构造至少一个第二网络模型损失函数。
进一步地,所述调整模块,具体用于将所述第一网络模型损失函数与所述至少一个第二网络模型损失函数相结合,构建所述匹配关系网络的损失函数;
所述调整模块,具体还用于利用所述匹配关系网络的损失函数调整所述第一网络模型中的模型参数以及所述至少一个第二网络模型中的模型参数,构建匹配关系网络。
进一步地,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述装置还包括:
预测单元,用于将所述作用于不同资源主体的资源特征形成特征向量输入至至少一个第三关系网络,预测资源主体之间的至少一个第二匹配关系;
确定单元,用于结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系。
进一步地,所述确定单元包括:
加权模块,用于利用预先为至少一个第三关系网络设置的权重值,对所述资源主体之间的至少一个第二匹配关系进行加权计算;
第二确定模块,用于结合加权计算后形成的匹配关系以及所述第一匹配关系,确定所述资源主体之间的第三匹配关系。
根据本申请的第三个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述匹配关系的识别方法。
根据本申请的第四方面,提供了一种服务器设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述匹配关系的识别方法。
借由上述技术方案,本申请提供的一种匹配关系的识别方法、装置及设备,与目前现有方式中使用神经网络模型对资源主体之间的匹配关系进行识别的方式相比,本申请通过设置特征元组分类,该特征元组分类包含有作用于相同资源主体的资源特征,并将作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,这里匹配关系网络包括第一关系网络和第二关系网络,该第一关系网络具有不同的属性识别能力,根据特征元组分类的属性,能够识别得到特征元组分类的泛化嵌入式表达向量,提供了资源主体之间可描述的匹配关系,并且可消除部分在数据层面带来的匹配关系偏移,该第二关系网络具有资源主体之间匹配关系的挖掘能力,能够对特征元组的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,能够在匹配关系识别过程中强化资源主体的表达,提高匹配关系的识别效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种匹配关系的识别方法的流程示意图;
图2示出了本申请实施例提供的另一种匹配关系的识别方法的流程示意图;
图3示出了本申请实施例提供的一种匹配关系网络的组成框图;
图4示出了本申请实施例提供的另一种匹配关系网络的组成框图;
图5示出了本申请实施例提供的一种匹配关系的识别装置的结构示意图;
图6示出了本申请实施例提供的另一种匹配关系的识别装置的结构示意图;
图7示出了本申请实施例提供的另一种匹配关系的识别装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
相关技术中,网络平台需要利用资源主体之间的匹配关系,向资源主体提供资源线索,而神经网络算法能够提供一种关系网络来预估不同场景下资源主体之间的匹配关系,其中,包括相关性预估、点击率预估、交易概率预估等多个场景。但是神经网络算法受限于模型结构的特点,侧重于描述资源主体所包含特征之间的匹配关系,例如,模型结构侧重于描述用户特征与距离之间的匹配关系,而资源主体之间的匹配关系解释较弱,使得训练数据的构造方式对网络模型的训练结果影响较大,容易受到数据偏移、数据稀疏的影响,导致网络模型只关注数据中最主要的一部分特征,进而使得神经网络算法作为预估算法匹配效率较低。
为了解决该问题,本实施例提供了一种匹配关系的识别方法,如图1所示,该方法应用于网络平台的服务端,包括如下步骤:
101、设置特征元组分类。
其中,特征元组分类包含作用于相同资源主体的资源特征,这里资源主体为匹配关系识别的主体,可以包括不同类型的主体,例如,对象类的主体,如用户、店铺、服务人员等,动作类的主体,如搜索、访问、分配等,应用类的主体,如场景、环境等,当然还可以根据实际的需求添加更多类型的资源主体。针对作用于相同资源主体的资源特征,如果资源主体为用户类型,资源特征可以包括用户职业、用户喜好等,如果资源主体为店铺类型,资源特征可以包括店铺名称、店铺类目等,如果资源主体为搜索类型,资源特征可以包括搜索意图、所属类目,如果资源主体为场景类型,资源特征可以包括距离、时间等。
通常情况下,特征元组分类是针对任务场景在识别过程中所设置的特征分类,处于特征元组分类中的资源特征具有属性共性,例如,用户类的特征元组包含的均为描述用户的特征。另外,针对任务场景所涉及到的资源主体不同,所包含特征元组分类也不相同,例如,针对向用户推送资源信息的任务场景需要结合用户属性、用户所处场景、用户在网络平台中历史搜索串进行识别,此时涉及到的资源主体包括用户类、场景类、搜索串类,相应包含用户类、场景类、搜索串类三个特征元组分类,针对向店铺推送用户资源需要结合用户属性、用户所处场景、店铺以及用户在网络平台中历史搜索串进行预测,此时涉及到的资源主体包括用户类、搜索串类、店铺类、场景类,相应包含用户类、搜索串类、店铺类、场景类四个特征元组分类。
对于本发明实施例的执行主体可以为网络平台的服务端,该服务端可以收集作用于不同资源主体的资源特征,具体可以通过网络平台采集到来自线上的用户使用数据,每一个用户使用数据作为样本数据会包含大量的资源特征,样本数据中的某一个维度的数据描述了其所属资源主体的某种属性,例如,用户职业是样本数据中的一个资源特征,描述了用户职业,用户喜好是样本数据中的一个资源特征,描述了用户喜好,一个用户使用数据所形成的样本数据包含了若干个资源特征,进一步针对作用于相同资源主体的资源特征进行分类,形成特征元组分类,利用特征元组分类来增加不同资源主体在后续匹配关系识别过程中的表达力度。
102、将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络。
由于每个资源特征表现为向量特征,通过将作用于相同资源主体的资源特征拼接到一起,可以得到特征元组向量,该特征元组向量即为特征元组分类对应的初始化输入向量,预先构建的匹配关系网络包括第一关系网络和第二关系网络,该第一关系网络具有不同的属性识别能力,通过将特征元组向量输入至预先构建的匹配关系网络过程中,首先经过第一关系网络,该第一关系网络相当于专项神经网络,能够针对特征元组分类中资源特征的特征进行相应设计,例如,针对搜索串类特征元组分类中资源特征,可以设置基于自注意力机制的神经网络来加强搜索串的上下文表达,通过专用神经网络的压缩、降维、非线性激活等计算。需要说明的是,这里每个特征元组分类中资源特征会对应输入至一个专项神经网络,得到一个输出向量,多个特征元组分类会得到多个输出向量,每个输出向量作为表征相应资源主体的元组向量,然后将多个元组向量经过第二关系网络,该第二关系网络具有资源主体之间匹配关系的挖掘能力,能够针对第一关系网络的多个元组向量,按照资源主体设置的任务场景进行相似度匹配计算,例如,任务场景为用户与商户的二元组的匹配,具体在相似度匹配计算需要计算用户类元组向量、商户类元组向量之间的相似度,进而得到用户与商户之间的匹配关系。
上述第二关系网络在进行相似度计算过程中,可以使用余弦相似度计算两个特征元组之间的相似度,还可以使用欧几里得距离计算两个特征元组之间的相似度,还可以使用其他相似度算法进行计算,这里不进行限定。
103、根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量。
由于第一关系网络具有与不同特征元组分类相映射的专项神经网络,每个专项神经网络作为第一关系网络中的一个子网络,能够针对特征元组向量进行属性识别,以获取特征元组分类的泛化嵌入式表达向量,该泛化嵌入式表达向量用于表达特征元组分类映射的资源主体,例如,用户类特征元组向量输入至专项神经网络后输出表达用户类的泛化嵌入式表达向量,最终每个特征元组向量输入至相应的专用神经网络后,会形成形成相应特征元组分类的泛化嵌入式表达向量。
104、利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系。
在第二关系网络中,针对不同特征元组分类的泛化嵌入式表达向量,可根据场景任务设置匹配关系计算,通过汇总匹配计算结果得到资源主体之间的第一匹配关系。该场景任务设置的匹配关系计算至少包括两个不同特征元组分类的泛化嵌入式表达向量之间的匹配结果,有的匹配结果可能涉及两个特征元组分类的泛化嵌入式表达向量,例如,用户与商户的泛化嵌入式表达向量进行匹配计算,有的匹配结果可能涉及三个特征元组分类的泛化嵌入式表达向量,例如,用户、搜索串与商户的泛化嵌入式表达向量进行匹配计算。
以任务场景为用户与商户的匹配关系进行举例说明,在该任务场景下需要分别计算用户与商户之间的匹配,用户与场景之间的匹配,用户、商户与场景之间的匹配,那么针对用户与商户的泛化嵌入式表达向量会计算得到一个相似度匹配结果,针对用户与场景的泛化嵌入式表达向量会计算得到一个相似度匹配结果,针对用户、商户与场景的泛化嵌入式表达向量会计算得到一个相似度匹配结果,通过汇总将匹配计算的输出结果作为用户与商户之间的匹配关系。具体需要根据任务场景需要考虑的匹配组合,例如,上述针对用户与商户之间的匹配关系计算,还可以加入商户和场景之间的匹配以及商户、搜索串、用户之间的匹配,这里针对任务场景所需的匹配组合以及匹配组合数量不进行限定,可根据实际需求进行配置。
本申请实施例提供的匹配关系的识别方法,与目前现有方式中使用神经网络模型对资源主体之间的匹配关系进行识别的方式相比,本申请通过设置特征元组分类,该特征元组分类包含有作用于相同资源主体的资源特征,并将作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,这里匹配关系网络包括第一关系网络和第二关系网络,该第一关系网络具有不同的属性识别能力,根据特征元组分类的属性,能够识别得到特征元组分类的泛化嵌入式表达向量,提供了资源主体之间可描述的匹配关系,并且可消除部分在数据层面带来的匹配关系偏移,该第二关系网络具有资源主体之间匹配关系的挖掘能力,能够对特征元组的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,能够在匹配关系识别过程中强化资源主体的表达,提高匹配关系的识别效率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,本实施例提供了另一种匹配关系的识别方法,如图2所示,该方法包括:
201、获取包含各类资源主体的资源特征。
网络平台在运营过程中,针对不同资源主体会沉淀出大量的资源数据,该资源数据包含了资源主体不同维度上的资源特征,例如,针对商户创建店铺会沉淀出店铺资源数据,该店铺资源数据可以包括店铺信息维度、店铺营业维度、店铺营业类型维度等资源特征。这里的资源数据通常为资源主体在网络平台中的操作所形成,例如,用户浏览网络平台中店铺的行为,用户购买店铺中的商品的行为。
具体在资源数据的沉淀过程中,网络平台可以借助服务收集日志来获取资源数据,由服务器自动生成,还可以借助客户端收集用户行为数据,当用户反问网页时触发日志收集服务器发送请求,从而记录用户访问数据。
202、根据所述资源主体的属性标识,确定所述资源特征作用的资源主体。
由于资源特征依附于不同的资源主体,此时资源数据会包含有大量针对不同资源主体的资源特征,例如,针对用户类的资源特征,例如,用户喜好、用户职业等,针对搜索类的特征,例如,搜索时间、搜索次数等,针对场景类的特征,例如,位置特征、距离特征等,具体可以根据资源主体的属性标识,如用户ID、店铺ID等,按照资源主体的属性标识确定作用于相应资源主体的资源特征,并将资源特征进行标记,得到携带有不同资源主体标签的资源特征。
203、将作用于相同资源主体的资源特征组成特征元组,并按照资源主体所属类别设置特征元组分类。
针对资源主体标签对资源特征进行分类,将作用于相同资源主体的资源特征组成特征元组,例如,用户类的特征元组、商户类的特征元组、搜索串类特征元组,以针对不同资源主体的特征元组形成特征元组分类。
204、利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络。
其中,任务标签可以为资源主体的执行结果,可以为用户是否点击店铺中的某个商品、用户是否购买店铺中的某个商品等,通常为0或1两个值。通过结合资源特征所携带的任务标签可以了解围绕资源主体所产生的资源特征对执行结果的影响情况,例如,浏览商品次数较多的用户购买该商品的可能性较高,关注商品的用户购买商品的可能性较高。
由于不同特征元组分类具有不同分类属性下资源主体的特征,具体在构建匹配关系网络的过程中,可以利用第一网络模型来训练第一关系网络,该第一网络模型为针对特征元组分类的特性所设置的专用神经网络,能够提取表征资源主体的泛化嵌入式表达向量,然后针对资源主体的泛化嵌入式表达向量进行匹配相似度计算,形成多重匹配关系的相似度结果,该相似度结果能够从不同方面反映资源主体之间的匹配关系,进一步汇总多重匹配关系的相似度结果,得到资源主体之间的最终匹配关系。
进一步地,为了保证模型参数的准确性,具体在第一网络模型的训练过程中,可以结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数,然后利用第一网络模型损失函数调整第一网络模型中的模型参数,构建匹配关系网络,由于匹配关系网络输出资源主体之间的匹配关系受限于模型的权重参数,如果模型的权重参数并不理想,输出的匹配关系往往与实际偏差也较大,对于偏差较大情况说明匹配关系网络的精度较低,通过第一网络模型损失函数限制真实值与理想值之间的差异,以提高匹配关系网络的识别精度。
由于第一网络模型的输出至少包括两个不同特征元组分类的泛化嵌入式表达向量之间的匹配结果所形成的第一匹配关系,具体在构造第一网络模型损失函数的过程中,可以结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,针对第一匹配关系所涉及的匹配结果构造损失函数,这里第一网络模型损失函数的构造可以结合相似度算法进行配置,例如,对于相似度算法使用余弦相似度的情况,第一网络模型损失函数可以是均方误差损失函数的形式,进一步根据第一匹配关系所涉及匹配结果对第一网络模型的影响因子,确定每个匹配结果在第一网络模型中的占比值,例如,搜索场景下资源主体的匹配关系识别中涉及搜索串类特征元组分类的泛化嵌入式表达向量之间的匹配结果对第一网络模型的影响较重,可以将涉及搜索串类的匹配结果设置较高的占比值,当然还可以设置平均占比,进一步按照每个匹配结果在第一网络模型中的占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
在具体应用场景中,四个特征元组分类的泛化嵌入式表达向量分别为用户类
Figure 994210DEST_PATH_IMAGE001
、店铺类
Figure 847765DEST_PATH_IMAGE002
、搜索串类
Figure 926580DEST_PATH_IMAGE003
、场景类
Figure 424557DEST_PATH_IMAGE004
,且这四个表达向量的维度是相同的,进一步对四个特征元组分类的泛化嵌入式表达向量进行关系匹配组合,并计算余弦相似度,针对用户与店铺的任务场景,该关系匹配组合可以包括如下几种,分别包括三元组的匹配以及两元组的匹配,其中,两元组的匹配包括用户类与店铺类形成的匹配,场景类与店铺类形成的匹配,三元组的匹配包括用户类、店铺类以及场景类形成的匹配,用户类、商铺类以及搜索串类形成的匹配,商铺类、搜索串类以及场景类形成的匹配,计算相似度的结果如下所示,进一步将余弦相似度结果作为第一网络模型的输出。
Figure 196204DEST_PATH_IMAGE005
Figure 146843DEST_PATH_IMAGE006
Figure 216299DEST_PATH_IMAGE007
Figure 568783DEST_PATH_IMAGE008
Figure 511331DEST_PATH_IMAGE009
作为一种实施方式,结合余弦相似度结果以及特征元组分类中资源特征所携带的任务标签
Figure 949265DEST_PATH_IMAGE010
构造损失函数,由于匹配组合方式有多重,余弦相似度结果同样也有多种,针对每一种组合方式都会构造出一个损失函数,该损失函数输入为不同匹配方式输出的余弦相似度结果与任务标签,此时损失函数的基础形式是均方差损失函数(
Figure 369882DEST_PATH_IMAGE011
),具体不同匹配方式所构造损失函数如下所示,进一步通过对不同匹配方式所构造损失函数取平均,构造第一网络模型的损失函数。
Figure 780135DEST_PATH_IMAGE012
Figure 893585DEST_PATH_IMAGE013
Figure 818815DEST_PATH_IMAGE014
Figure 43123DEST_PATH_IMAGE015
Figure 104620DEST_PATH_IMAGE016
Figure 388971DEST_PATH_IMAGE017
需要说明的是,上述是对不同匹配方式所构造损失函数取平均的方式来构造第一网络模型的损失函数,实际应用场景中还可以设置匹配结果在第一网络模型中的占比值,按照占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
205、将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络。
206、根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量。
可以理解的是,不同特征元组分类所形成特征元组向量维度由资源特征的维度确定,该特征元组分类中资源特征的维度越多,所形成特征元组向量的维度越多。但是在对特征元组向量进行匹配关系识别后,第一关系网络输出特征元组分类的泛化嵌入式表达向量维度是相同的,以便于后续资源主体之间的匹配关系计算。
207、利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系。
其中,建模目标相当于基于场景任务所设置的匹配关系组合,而不同匹配关系组合所需要特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系也不相同,该匹配关系组合可以包括两个特征元组之间的建模关系,还可以包括三个特征元组之间的建模关系,例如,针对用户与店铺之间匹配关系的任务场景,该匹配关系组合包括用户、搜索串、店铺、场景中所形成三个特征元组之间的建模关系和两个特征元组之间的建模关系,三个特征元组之间的建模关系可以包括用户、搜索串、店铺形成的建模关系,以及场景、用户、店铺形成的建模关系,以及场景、搜索串、店铺形成的建模关系,两个特征元组之间的建模关系可以包括用户、店铺形成的建模关系,以及场景、店铺形成的建模关系。上述建模关系可以根据实际建模目标进行调整,以形成针对不同应用场景下资源主体之间的建模关系。
208、按照所述资源主体之间的建模关系,计算所述特征元组分类的泛化嵌入式表达向量之间的余弦相似度,得到资源主体之间的第一匹配关系。
具体在实际应用场景中,如图3所示,图3示出的匹配关系网络即为特征元组匹配关系显示建模网络,并由第一关系网络和第二关系网络组成,在训练匹配关系网络过程中,使用第一网络模型作为原始网络,首先将样本数据划分为四个特征元组分类,分别为用户特征元组、店铺特征元组、搜索串特征元组以及场景特征元组,然后将特征元组中的资源向量拼接后分别输入至神经网络中,也就是第一关系网络,然后将第一关系网络输出不同特征元组的嵌入式表达向量进行多重匹配组合的余弦交叉相似度计算,也就是第二关系网络,并且在对第一网络模型进行训练的过程中,利用任务标签以及每种匹配组合的余弦相似度结果构造特征元组匹配关系显示建模网络的损失函数,并利用第一网络模型的损失函数不断调整第一网络模型中的模型参数,最终形成匹配关系网络。
上述实施例为匹配关系网络中包括第一关系网络和第二关系网络的应用场景,而匹配关系网络还可能包括至少一个第三关系网络,该第三关系网络具有资源主体之间匹配关系的预测能力,那么针对步骤204在构建匹配关系网络过程中,还包括利用包含作用于不同资源主体的资源特征所携带的任务标签对至少一个第二网络模型中的模型参数进行训练,将训练过程中至少一个第二网络模型中输出资源主体之间的至少一个第二匹配关系拼接至第一网络模型输出资源主体之间的第一匹配关系,得到资源主体之间的第三匹配关系,结合资源主体之间的第三匹配关系以及包含作用于不同资源主体的资源特征所携带的任务标签,构造至少一个第二网络模型损失函数,并后续在构建匹配关系网络的过程中,将第一网络模型损失函数与至少一个第二网络模型损失函数相结合,构建匹配关系网络的损失函数,利用匹配关系网络的损失函数调整第一网络模型中的模型参数以及至少一个第二网络模型中的模型参数,构建匹配关系网络。
相应的,具体在识别最终资源主体之间的匹配关系过程中,还包括将作用于不同资源主体的资源特征形成特征向量输入至至少一个第三关系网络,预测资源主体之间的至少一个第二匹配关系,结合资源主体之间的第一匹配关系以及资源主体之间的至少一个第二匹配关系,确定资源主体之间的第三匹配关系,该第三关系网络可以为现有神经网络模型,由于第一匹配关系为经过第一关系网络和第二关系网络输出的,能够凸显资源主体表征,而这里将第一关系网络和第二关系网络能够形成特征元组匹配关系显示建模网络,这里可以将特征元组匹配关系显示建模网络输出资源主体之间的匹配关系拼接到现有神经网络模型,也就是至少一个第三关系网络中,以体现特征元组匹配关系显示建模网络的通用性,以针对原有神经网络输出资源主体之间的匹配关系进行优化,提高匹配关系的识别准确率。
具体在实际应用场景中,如图4所示,图4示出的匹配关系网络由第一关系网络、第二关系网络以及第三关系网络组成,第一关系网络和第二关系网络组合形成特征元组匹配关系显示建模网络,使用第一网络模型作为特征元组匹配关系显示建模网络的原始网络,第三关系网络为主任务神经网络,使用第二网络模型作为主任务神经网络的原始网络,一方面,如图3中所描述的过程一样,将样本数据划分为四个特征元组分类,输入至特征元组匹配关系显示建模网络,输出不同匹配组合所得到的的相似度计算结果,同样在对第一网络模型进行训练的过程中,针对每种匹配组合的余弦相似度结果构造特征元组匹配关系显示建模网络的损失函数,另一方面,如图4所示,将样本数据混合在一起输入至主任务神经网络,并将输出的匹配结果与特征元组匹配关系显示建模网络的匹配结果进行拼接,以得到匹配关系预测值,在对第二网络模型进行训练的过程中,利用任务标签以及匹配关系预测值构造主任务损失函数,进一步将特征元组匹配关系显示建模网络的损失函数与主任务损失函数构造匹配关系网络的损失函数,并利用匹配关系网络的损失函数不断调整第一网络模型中的模型参数以及第二网络模型中的模型参数,最终形成匹配关系网络。
应说明的是,上述主任务神经网络还可以为多个神经网络,相应的在匹配关系网络的训练过程中,需要将特征元组匹配关系显示建模网络的输出与多个神经网络进行拼接,以及在构造损失函数的过程中,需要针对多个神经网络构造主任务损失函数,并调整匹配关系网络的损失函数。
进一步的,作为图1-图2方法的具体实现,本申请实施例提供了一种应用于服务端的匹配关系的识别装置,如图5所示,该装置包括:设置单元31、拼接单元32、分配单元33、挖掘单元34。
设置单元31,可以用于设置特征元组分类,其中,所述特征元组分类包含作用于相同资源主体的资源特征;
拼接单元32,可以用于将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,其中,所述匹配关系网络包括第一关系网络和第二关系网络,所述第一关系网络具有不同的属性识别能力,所述第二关系网络具有资源主体之间匹配关系的挖掘能力;
分配单元33,可以用于根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量,其中,所述泛化嵌入式表达向量用于表达特征元组分类映射的资源主体;
挖掘单元34,可以用于利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系。
本发明实施例提供的匹配关系的识别装置,与目前现有方式中使用神经网络模型对资源主体之间的匹配关系进行识别的方式相比,本申请通过设置特征元组分类,该特征元组分类包含有作用于相同资源主体的资源特征,并将作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,这里匹配关系网络包括第一关系网络和第二关系网络,该第一关系网络具有不同的属性识别能力,根据特征元组分类的属性,能够识别得到特征元组分类的泛化嵌入式表达向量,提供了资源主体之间可描述的匹配关系,并且可消除部分在数据层面带来的匹配关系偏移,该第二关系网络具有资源主体之间匹配关系的挖掘能力,能够对特征元组的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,能够在匹配关系识别过程中强化资源主体的表达,提高匹配关系的识别效率。
在具体的应用场景中,如图6所示,所述设置单元31包括:
获取模块311,可以用于获取包含各类资源主体的资源特征;
第一确定模块312,可以用于根据所述资源主体的属性标识,确定所述资源特征作用的资源主体;
组成模块313,可以用于将作用于相同资源主体的资源特征组成特征元组,并按照资源主体所属类别设置特征元组分类。
在具体的应用场景中,如图6所示,所述挖掘单元34包括:
提取模块341,可以用于利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系;
计算模块342,可以用于按照所述资源主体之间的建模关系,计算所述特征元组分类的泛化嵌入式表达向量之间的余弦相似度,得到资源主体之间的第一匹配关系。
在具体的应用场景中,如图6所示,所述提取模块341包括:
组合子模块3411,可以用于利用所述第二关系网络的建模目标,对所述特征元组分类的泛化嵌入式表达向量进行组合,得到所述特征元组分类映射至少两个资源主体;
匹配子模块3412,可以用于将所述特征元组分类映射至少两个资源主体进行匹配,得到资源主体之间的建模关系。
在具体的应用场景中,如图6所示,所述装置还包括:
训练单元35,可以用于在所述将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络之前,利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络;所述训练单元35包括:
第一构造模块351,可以用于结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数;
调整模块352,可以用于利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络。
在具体的应用场景中,如图6所示,所述第一构造模块351包括:
构造子模块3511,可以用于结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,针对第一匹配关系所涉及的匹配结果构造损失函数;
确定子模块3512,可以用于根据所述第一匹配关系所涉及匹配结果对第一网络模型的影响因子,确定每个匹配结果在第一网络模型中的占比值;
累加子模块3513,可以用于按照所述每个匹配结果在第一网络模型中的占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
在具体的应用场景中,如图6所示,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述训练单元35还包括:
拼接模块353,可以用于在所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络之前,利用包含作用于不同资源主体的资源特征所携带的任务标签对至少一个第二网络模型中的模型参数进行训练,将训练过程中至少一个第二网络模型中输出资源主体之间的至少一个第二匹配关系拼接至第一网络模型输出资源主体之间的第一匹配关系,得到资源主体之间的第三匹配关系;
第二构造模块354,可以用于结合所述资源主体之间的第三匹配关系以及包含作用于不同资源主体的资源特征所携带的任务标签,构造至少一个第二网络模型损失函数。
在具体的应用场景中,所述调整模块352,具体可以用于将所述第一网络模型损失函数与所述至少一个第二网络模型损失函数相结合,构建所述匹配关系网络的损失函数;
所述调整模块352,具体还可以用于利用所述匹配关系网络的损失函数调整所述第一网络模型中的模型参数以及所述至少一个第二网络模型中的模型参数,构建匹配关系网络。
在具体的应用场景中,如图7所示,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述装置还包括:
预测单元36,可以用于将所述作用于不同资源主体的资源特征形成特征向量输入至至少一个第三关系网络,预测资源主体之间的至少一个第二匹配关系;
确定单元37,可以用于结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系。
在具体的应用场景中,如图7所示,所述确定单元37包括:
加权模块371,可以用于利用预先为至少一个第三关系网络设置的权重值,对所述资源主体之间的至少一个第二匹配关系进行加权计算;
第二确定模块372,可以用于结合加权计算后形成的匹配关系以及所述第一匹配关系,确定所述资源主体之间的第三匹配关系。
需要说明的是,本实施例提供的一种可应用于服务端侧的匹配关系的识别装置所涉及各功能单元的其它相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1-图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1-图2所示的匹配关系的识别方法;
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1-图2所示的方法,以及图5-图7所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种服务端实体设备,具体可以为计算机,服务器,或者其他网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上如图1-图2所示的匹配关系的识别方法。
可选的,上述实体设备都还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种匹配关系的识别的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述店铺搜索信息处理的实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有方式相比,本申请通过将作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,这里匹配关系网络包括第一关系网络和第二关系网络,该第一关系网络具有不同的属性识别能力,根据特征元组分类的属性,能够识别得到特征元组分类的泛化嵌入式表达向量,提供了资源主体之间可描述的匹配关系,并且可消除部分在数据层面带来的匹配关系偏移,该第二关系网络具有资源主体之间匹配关系的挖掘能力,能够对特征元组的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,能够在匹配关系识别过程中强化资源主体的表达,提高匹配关系的识别效率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (13)

1.一种匹配关系的识别方法,其特征在于,包括:
设置特征元组分类,其中,所述特征元组分类包含作用于相同资源主体的资源特征;
将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,其中,所述匹配关系网络包括第一关系网络和第二关系网络,所述第一关系网络具有不同的属性识别能力,所述第二关系网络具有资源主体之间匹配关系的挖掘能力;
根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量,其中,所述泛化嵌入式表达向量用于表达特征元组分类映射的资源主体,所述第一关系网络具有与不同特征元组分类相映射的专项神经网络;
利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,所述第二关系网络用于针对所述第一关系网络输出的泛化嵌入式表达向量,按照资源主体设置的任务场景进行相似度匹配计算。
2.根据权利要求1所述的方法,其特征在于,所述设置特征元组分类,具体包括:
获取包含各类资源主体的资源特征;
根据所述资源主体的属性标识,确定所述资源特征作用的资源主体;
将作用于相同资源主体的资源特征组成特征元组,并按照资源主体所属类别设置特征元组分类。
3.根据权利要求1所述的方法,其特征在于,所述利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,具体包括:
利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系;
按照所述资源主体之间的建模关系,计算所述特征元组分类的泛化嵌入式表达向量之间的余弦相似度,得到资源主体之间的第一匹配关系。
4.根据权利要求3所述的方法,其特征在于,所述利用所述第二关系网络的建模目标,提取所述特征元组分类的泛化嵌入式表达向量形成资源主体之间的建模关系,具体包括:
利用所述第二关系网络的建模目标,对所述特征元组分类的泛化嵌入式表达向量进行组合,得到所述特征元组分类映射至少两个资源主体;
将所述特征元组分类映射至少两个资源主体进行匹配,得到资源主体之间的建模关系。
5.根据权利要求1-4中任一项所述的方法,其特征在于,在所述将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络之前,所述方法还包括:
利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络;
所述利用特征元组分类中资源特征所携带的任务标签对第一网络模型中的模型参数进行训练,构建匹配关系网络,具体包括:
结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数;
利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络。
6.根据权利要求5所述的方法,其特征在于,所述结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,构造第一网络模型损失函数,具体包括:
结合训练过程中第一网络模型输出资源主体之间的第一匹配关系以及特征元组分类中资源特征所携带的任务标签,针对第一匹配关系所涉及的匹配结果构造损失函数;
根据所述第一匹配关系所涉及匹配结果对第一网络模型的影响因子,确定每个匹配结果在第一网络模型中的占比值;
按照所述每个匹配结果在第一网络模型中的占比值将第一匹配关系所涉及匹配结果构造的损失函数进行累加,构造第一网络模型的损失函数。
7.根据权利要求5所述的方法,其特征在于,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,在所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络之前,所述方法还包括:
利用包含作用于不同资源主体的资源特征所携带的任务标签对至少一个第二网络模型中的模型参数进行训练,将训练过程中至少一个第二网络模型中输出资源主体之间的至少一个第二匹配关系拼接至第一网络模型输出资源主体之间的第一匹配关系,得到资源主体之间的第三匹配关系;
结合所述资源主体之间的第三匹配关系以及包含作用于不同资源主体的资源特征所携带的任务标签,构造至少一个第二网络模型损失函数。
8.根据权利要求7所述的方法,其特征在于,所述利用所述第一网络模型损失函数调整所述第一网络模型中的模型参数,构建匹配关系网络,具体还包括:
将所述第一网络模型损失函数与所述至少一个第二网络模型损失函数相结合,构建所述匹配关系网络的损失函数;
利用所述匹配关系网络的损失函数调整所述第一网络模型中的模型参数以及所述至少一个第二网络模型中的模型参数,构建匹配关系网络。
9.根据权利要求1-4中任一项所述的方法,其特征在于,所述匹配关系网络还包括至少一个第三关系网络,所述第三关系网络具有资源主体之间匹配关系的预测能力,所述方法还包括:
将作用于不同资源主体的资源特征形成特征向量输入至至少一个第三关系网络,预测资源主体之间的至少一个第二匹配关系;
结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系。
10.根据权利要求9所述的方法,其特征在于,所述结合所述资源主体之间的第一匹配关系以及所述资源主体之间的至少一个第二匹配关系,确定所述资源主体之间的第三匹配关系,具体包括:
利用预先为至少一个第三关系网络设置的权重值,对所述资源主体之间的至少一个第二匹配关系进行加权计算;
结合加权计算后形成的匹配关系以及所述第一匹配关系,确定所述资源主体之间的第三匹配关系。
11.一种匹配关系的识别装置,其特征在于,包括:
设置单元,用于设置特征元组分类,其中,所述特征元组分类包含作用于相同资源主体的资源特征;
拼接单元,用于将所述作用于相同资源主体的资源特征拼接形成特征元组向量输入至预先构建的匹配关系网络,其中,所述匹配关系网络包括第一关系网络和第二关系网络,所述第一关系网络具有不同的属性识别能力,所述第二关系网络具有资源主体之间匹配关系的挖掘能力;
分配单元,用于根据所述特征元组分类的属性,将所述特征元组向量分配至具有相应属性识别能力的第一关系网络中,得到所述特征元组分类的泛化嵌入式表达向量,其中,所述泛化嵌入式表达向量用于表达特征元组分类映射的资源主体,所述第一关系网络具有与不同特征元组分类相映射的专项神经网络;
挖掘单元,用于利用所述第二关系网络,对所述特征元组分类的泛化嵌入式表达向量进行匹配关系挖掘,得到资源主体之间的第一匹配关系,所述第二关系网络用于针对所述第一关系网络输出的泛化嵌入式表达向量,按照资源主体设置的任务场景进行相似度匹配计算。
12.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至10中任一项所述的匹配关系的识别方法。
13.一种服务端设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至10中任一项所述的匹配关系的识别方法。
CN202110200963.6A 2021-02-23 2021-02-23 匹配关系的识别方法、装置及设备 Active CN112559897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110200963.6A CN112559897B (zh) 2021-02-23 2021-02-23 匹配关系的识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110200963.6A CN112559897B (zh) 2021-02-23 2021-02-23 匹配关系的识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112559897A CN112559897A (zh) 2021-03-26
CN112559897B true CN112559897B (zh) 2021-05-18

Family

ID=75034559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110200963.6A Active CN112559897B (zh) 2021-02-23 2021-02-23 匹配关系的识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112559897B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858552A (zh) * 2019-01-31 2019-06-07 深兰科技(上海)有限公司 一种用于细粒度分类的目标检测方法及设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8468119B2 (en) * 2010-07-14 2013-06-18 Business Objects Software Ltd. Matching data from disparate sources
CN104050605B (zh) * 2014-06-18 2017-10-27 广东电网公司电力科学研究院 电力设备匹配方法和系统
CN109993190B (zh) * 2018-01-02 2021-05-11 中国移动通信有限公司研究院 一种本体匹配方法、装置和计算机存储介质
CN109885713A (zh) * 2019-01-03 2019-06-14 刘伯涵 基于语音情绪识别的表情图像推荐方法以及装置
CN112148964B (zh) * 2019-06-29 2022-11-18 阿里巴巴集团控股有限公司 信息处理、推荐方法、系统及设备
CN111782962B (zh) * 2020-09-04 2021-01-12 浙江口碑网络技术有限公司 模式匹配方法、装置及电子设备
CN112131881B (zh) * 2020-09-27 2023-11-21 腾讯科技(深圳)有限公司 信息抽取方法及装置、电子设备、存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858552A (zh) * 2019-01-31 2019-06-07 深兰科技(上海)有限公司 一种用于细粒度分类的目标检测方法及设备

Also Published As

Publication number Publication date
CN112559897A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
EP3989131A1 (en) Method and system for realizing machine learning modeling process
KR102472572B1 (ko) 사용자 의도 프로파일링 방법 및 이를 위한 장치
KR101939554B1 (ko) 일시적 거래 한도 결정
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN109492772B (zh) 生成信息的方法和装置
US20190012683A1 (en) Method for predicting purchase probability based on behavior sequence of user and apparatus for the same
KR20200123015A (ko) 정보를 추천하는 방법, 장치, 기기 및 저장 매체
WO2022252363A1 (zh) 数据处理方法、计算机设备以及可读存储介质
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
CN116194936A (zh) 识别拟合目标域的传递学习过程的源数据集
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN111626767B (zh) 资源数据的发放方法、装置及设备
CN116578925B (zh) 基于特征画像的行为预测方法、装置及存储介质
Anusha et al. Segmentation of retail mobile market using HMS algorithm
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
JP7454630B2 (ja) ラベル推奨モデルのトレーニング方法及び装置、ラベル取得方法及び装置
CN116862641A (zh) 信贷产品推荐方法、装置、电子设备及存储介质
CN112559897B (zh) 匹配关系的识别方法、装置及设备
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
US11741099B2 (en) Supporting database queries using unsupervised vector embedding approaches over unseen data
Wasilewski et al. Clustering methods for adaptive e-commerce user interfaces
CN111460300A (zh) 网络内容推送方法、装置及存储介质
CN110851655A (zh) 一种用于简化复杂网络的方法和系统
CN114547448B (zh) 数据处理、模型训练方法、装置、设备、存储介质及程序
CN111078638B (zh) 电子资源处理方法、装置、介质及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant