CN113420847B - 基于人工智能的目标对象匹配方法及相关设备 - Google Patents

基于人工智能的目标对象匹配方法及相关设备 Download PDF

Info

Publication number
CN113420847B
CN113420847B CN202110972130.1A CN202110972130A CN113420847B CN 113420847 B CN113420847 B CN 113420847B CN 202110972130 A CN202110972130 A CN 202110972130A CN 113420847 B CN113420847 B CN 113420847B
Authority
CN
China
Prior art keywords
target
matched
pairs
similarity
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110972130.1A
Other languages
English (en)
Other versions
CN113420847A (zh
Inventor
袁雅云
张莉
任杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110972130.1A priority Critical patent/CN113420847B/zh
Publication of CN113420847A publication Critical patent/CN113420847A/zh
Application granted granted Critical
Publication of CN113420847B publication Critical patent/CN113420847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种基于人工智能的目标对象匹配方法及相关设备,首先对原始的孪生神经网络进行改进,并基于相似样本对和不相似样本对对改进后的孪生神经网络进行训练,得到学习能力和泛化性能较高的相似度计算模型;其次,在获取多个待匹配对象之后,根据待匹配对象的目标数据为对应的待匹配对象标识目标标签,从而将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;最后使用相似度计算模型计算每个待匹配对象对的相似度,从而根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。本发明能够准确且快速批量的为目标对象进行配对。

Description

基于人工智能的目标对象匹配方法及相关设备
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的目标对象匹配方法、装置、电子设备及存储介质。
背景技术
在保险行业中,保险代理人的个人特征和展业行为特征,在很大程度上影响其成单概率和最终业绩水平。企业通过网上学习平台为保险代理人推荐课程资源,以提高他们的出单率。
发明人在实现本发明的过程中发现,现有的推荐系统主要是根据保险代理人的用户特征进行课程推荐,然而对于用户特征相似的两个保险代理人,比如同一个地区同样年龄的代理人,出勤率、走访频率、电访频率等也相似,却可能产生不同的出单结果和业绩,因此,目标对象的配对不准确导致推荐系统的推荐效果也较差。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的目标对象匹配方法、装置、电子设备及存储介质,能够准确的进行目标对象的匹配。
本发明的第一方面提供一种基于人工智能的目标对象匹配方法,所述方法包括:
获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。
在一个可选的实施方式中,所述对所述原始孪生神经网络进行改进包括:
获取所述原始孪生神经网络中的N个全连接层;
使用卷积层替换前N-1个全连接层;
在前N-2个卷积层中的每一个卷积层加入一层最大池化层,并在每个卷积层中加入一层批归一化层,得到改进后的孪生神经网络。
在一个可选的实施方式中,所述基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型包括:
随机选取至少一个目标正样本对及至少一个目标负样本对;
对所述目标正样本对中的至少一个特征数据进行擦除处理,及对目标负样本对中的至少一个特征数据进行擦除处理;
根据擦除处理后的目标正样本对和擦除处理后的目标负样本对得到训练样本对集;
将所述训练样本对集中的每个训练样本对通过一个卷积层进行特征降维,得到降维特征;
将所述降维特征通过ReLU函数进行激活,得到激活特征;
将所述激活特征通过下一个卷积层进行升维,得到升维特征;
将所述升维特征通过sigmoid函数进行归一化,得到归一化特征;
将所述归一化特征通过最大池化操作,得到池化特征;
根据所述池化特征对改进后的孪生神经网络进行训练,得到相似度计算模型。
在一个可选的实施方式中,所述根据所述目标数据为对应的所述待匹配对象标识目标标签包括:
将所述目标数据与预设多个数据范围进行匹配;
确定与所述目标数据匹配的目标数据范围;
将所述目标数据范围对应的标签标识为所述目标数据对应的待匹配对象的目标标签。
在一个可选的实施方式中,所述根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对包括:
计算标识有第一目标标签对应的待匹配对象的第一数量;
计算标识有第二目标标签对应的待匹配对象的第二数量;
根据所述第一数量及所述第二数量创建初始矩阵;
将所述相似度写入所述初始矩阵中,得到相似度矩阵;
搜索所述相似度矩阵的每列中的最大相似度;
根据所述最大相似度确定目标待匹配对象对。
在一个可选的实施方式中,所述获取多个正样本对及多个负样本对包括:
获取每个样本的特征数据并将每个样本的特征数据进行标准化处理得到标准数据;
将每两个样本进行配对得到多个样本对;
根据所述标准数据计算每个所述样本对中两个样本之间的欧氏距离;
将欧式距离进行排序,并根据排序后的欧式距离从所述多个样本对中获取所述多个正样本对及所述多个负样本对。
在一个可选的实施方式中,所述方法还包括:
获取所述目标待匹配对象对中标识有所述第二目标标签的目标对象的课程列表;
将所述课程列表推荐给所述目标待匹配对象对中标识有所述第一目标标签的目标对象。
本发明的第二方面提供一种基于人工智能的目标对象匹配装置,所述装置包括:
获取模块,用于获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
训练模块,用于获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
标识模块,用于获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
配对模块,用于将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
计算模块,用于使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的目标对象匹配方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的目标对象匹配方法。
综上所述,本发明所述的基于人工智能的目标对象匹配方法、装置、电子设备及存储介质,首先对原始的孪生神经网络进行改进,并基于相似样本对和不相似样本对对改进后的孪生神经网络进行训练,得到学习能力和泛化性能较高的相似度计算模型;其次,在获取多个待匹配对象之后,根据待匹配对象的目标数据为对应的待匹配对象标识目标标签,从而将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;最后使用相似度计算模型计算每个待匹配对象对的相似度,从而根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。本发明能够准确且快速批量的为目标对象进行配对。
附图说明
图1是本发明实施例一提供的基于人工智能的目标对象匹配方法的流程图。
图2是本发明实施例二提供的基于人工智能的目标对象匹配装置的结构图。
图3是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的目标对象匹配方法由电子设备执行,相应地,基于人工智能的目标对象匹配装置运行于电子设备中。
实施例一
图1是本发明实施例一提供的基于人工智能的目标对象匹配方法的流程图。
本申请实施例可以基于人工智能技术对目标对象进行匹配。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
所述基于人工智能的目标对象匹配方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本。
计算机设备中可以预先存储大量的样本及描述每个样本的多个特征数据。计算机设备根据特征数据创建正负样本对,正样本对为由两个第一样本构成的数据对,负样本对为由两个第二样本构成的数据对。
在不同的应用场景中,样本可以具有不同的指代。例如,在保险场景中,样本可以是保险代理人。在跟踪场景中,样本可以是行人,车辆等。
描述样本的特征数据可以包括,但不限于:个人背景信息、出勤相关特征、展业活动特征、所在营业部特征等。
在一个可选的实施方式中,所述获取多个正样本对及多个负样本对包括:
获取每个样本的特征数据并将每个样本的特征数据进行标准化处理得到标准数据;
将每两个样本进行配对得到多个样本对;
根据所述标准数据计算每个所述样本对中两个样本之间的欧氏距离;
将欧式距离进行排序,并根据排序后的欧式距离从所述多个样本对中获取所述多个正样本对及所述多个负样本对。
其中,标准化处理可以包括归一化处理,数据清洗处理等。
可以将计算得到的欧式距离进行从大到小排序,将排序后位于第一至第K1个欧式距离的样本对作为负样本对,将排序后位于倒数第一至倒数第K2个欧式距离的样本对作为正样本对。还可以将计算得到的欧式距离进行从小到大排序,将排序后位于第一至第K3个欧式距离的样本对作为正样本对,将排序后位于倒数第一至倒数第K4个欧式距离的样本对作为负样本对。其中,K1,K2,K3,K4均为大于1且小于N的整数,N表示将每两个样本进行配对得到的多个样本对的数量。即,正样本对中的两个相似样本是指欧式距离较近的两个样本,负样本对中的两个不相似样本是指欧式距离较远的两个样本。
该可选的实施方式中,通过计算描述对象的特征数据之间的欧式距离来计算对象标识之间的相似度,从而选取出多个正样本对及多个负样本对,有利于后续基于样本对训练相似度计算模型,提高相似度计算模型的计算效果。
S12,获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型。
孪生神经网络(Siamese Network)为双分支Siamese网络,该双分支Siamese网络由两支相同的Siamese网络并联拼接而成。原始的孪生神经网络的每支Siamese网络均具有多个全连接层,通常为7个全连接层,最后一层全连接层根据第6层全连接层的特征进行计算得到相似度。
对原始孪生神经网络进行改进得到改进后的孪生神经网络,对改进后的孪生神经网络进行训练,其中,本实施例采用多个正样本对及多个负样本对对改进后的孪生神经网络进行训练。
本实施例中,由于正样本对为相似的两个样本构成的数据对,负样本对为不相似的两个样本对构成的数据对,选取不同相似性的样本对来对改进后的孪生神经网络进行训练,能够使得训练得到的相似度计算模型更精确。
在一个可选的实施方式中,所述对所述原始孪生神经网络进行改进包括:
获取所述原始孪生神经网络中的N个全连接层;
使用卷积层替换前N-1个全连接层;
在前N-2个卷积层中的每一个卷积层加入一层最大池化层,并在每个卷积层中加入一层批归一化层,得到改进后的孪生神经网络。
假设,N为7,即原始孪生神经网络中有7个全连接层。
将原始孪生神经网络中前6个全连接层的每一个全连接层替换为卷积层,并在前5个卷积层的每一个卷积层中加入最大池化层,第6个卷积层不加入最大池化层,在前6个卷积层的每一个卷积层中加入批归一化层。
改进后的孪生神经网络的最后一层使用全连接层以生成定长的特征向量,并使用ReLU作为激活函数。
该可选的实施方式中,相比全连接层的上层神经元连接下一层的所有神经元,由于卷积层的卷积核较小,则进行的是局部连接,局部连接大大减少了模型的参数量,能够有效的提高模型的训练速度。此外,加入最大池化层并在每一个卷积层加入了批归一化层,能够防止过拟合,同时能够进一步加快模型的训练速度和训练效率。
在一个可选的实施方式中,所述基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型包括:
随机选取至少一个目标正样本对及至少一个目标负样本对;
对所述目标正样本对中的至少一个特征数据进行擦除处理,及对目标负样本对中的至少一个特征数据进行擦除处理;
根据擦除处理后的目标正样本对和擦除处理后的目标负样本对得到训练样本对集;
将所述训练样本对集中的每个训练样本对通过一个卷积层进行特征降维,得到降维特征;
将所述降维特征通过ReLU函数进行激活,得到激活特征;
将所述激活特征通过下一个卷积层进行升维,得到升维特征;
将所述升维特征通过sigmoid函数进行归一化,得到归一化特征;
将所述归一化特征通过最大池化操作,得到池化特征;
根据所述池化特征对改进后的孪生神经网络进行训练,得到相似度计算模型。
将训练样本对集中的两个训练样本对分别输入改进后的孪生神经网络的两分支网络中,改进后的孪生神经网络的两分支网络输出训练样本对的相似度,计算两分支网络输出的相似度与该训练样本对已知的相似度之间的误差值;根据所述误差值对两分支网络的网络参数反复进行调整,直到所述误差值小于预设误差值。
由于最终的目的是让相似的训练样本对的距离尽可能小,不相似的训练样本对的距离尽可能大,所以采用Contrastive Loss损失函数:
Figure 577660DEST_PATH_IMAGE001
其中,
Figure 207355DEST_PATH_IMAGE002
,表示孪生神经网络输出的欧氏距离,
Figure 944367DEST_PATH_IMAGE003
为设定的阈值,是模型超参数,能避免模型输出的都是零向量;
Figure 467752DEST_PATH_IMAGE004
表示训练样本对是否相似,
Figure 897597DEST_PATH_IMAGE005
表示训练样本对相似,
Figure 139222DEST_PATH_IMAGE006
表示训练样本对不相似。Contrastive Loss损失函数可以很好地表达训练样本对之间的匹配程度。最终训练出的Siamese输出转换后的一对向量。计算这对输出向量的欧氏距离,采用sigmoid函数归一化处理后得到的值,表示输入的训练样本对的相似度。
该可选的实施方式中,通过对所述目标正负样本对中的至少一个特征数据进行擦除处理,并将擦除处理后的目标正负样本对添加至多个正样本对及多个负样本对中,得到的样本对作为训练样本对集,不仅扩充了训练样本对集的数量,使得基于训练样本对集训练改进后的孪生神经网络,能够提高训练效果,且对目标正负样本对中的至少一个特征数据进行擦除处理,还能够提高模型的学习能力,从而提高模型的泛化性能。
将所述激活特征通过下一个卷积层进行升维,得到的升维特征的维度与训练样本对的维度相同,通过sigmoid函数进行归一化,得到归一化特征并将所述归一化特征通过最大池化操作,得到池化特征,相当于将池化特征作为重要程度,依照重要程度去提升有用的特征并抑制对当前任务用处不大的特征,能够进一步提升模型的训练效果。
S13,获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签。
待匹配对象是指需要进行目标对象匹配的对象。
在保险场景中,待匹配对象可以是待进行匹配的保险代理人,所述目标数据可以是待进行匹配的保险代理人的历史业绩数据。在跟踪场景中,待匹配对象可以是待进行匹配的行人,所述目标数据可以是待进行匹配的行人的历史位置数据。
在一个可选的实施方式中,所述根据所述目标数据为对应的所述待匹配对象标识目标标签包括:
将所述目标数据与预设多个数据范围进行匹配;
确定与所述目标数据匹配的目标数据范围;
将所述目标数据范围对应的标签标识为所述目标数据对应的待匹配对象的目标标签。
计算机设备中预先存储有多个数据范围,例如,第一数据范围[X1,X2),第二数据范围[X2,X3),第三数据范围[X3,X4)。其中,X1<X2<X3<X4。数据范围的数量可以根据实际需求进行修改和调整。
不同的数据范围对应不同的标签,第一数据范围对应第一标签,第二数据范围对应第二标签,第三数据范围对应第三标签,其中,第一标签<第二标签<第三标签。
S14,将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对。
计算机设备可以获取描述每个待匹配对象的特征数据,例如,个人背景信息、出勤相关特征、展业活动特征、所在营业部特征等,并将描述每个待匹配对象的特征数据进行标准化处理,得到待匹配对象的标准数据。
在得到待匹配对象的标准数据之后,可以将标识有不同目标标签的待匹配对象的标准数据进行两两配对,得到多个待匹配对象对。
应当理解的是,标识有相同目标标签的待匹配对象的标准数据不进行两两配对。
示例性的,将标识有第一目标标签的待匹配对象的标准数据与标识有第二目标标签的待匹配对象的标准数据进行两两配对,将标识有第二目标标签的待匹配对象的标准数据与标识有第三目标标签的待匹配对象的标准数据进行两两配对,将标识有第一目标标签的待匹配对象的标准数据与标识有第三目标标签的待匹配对象的标准数据进行两两配对。
S15,使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。
将每个待匹配对象对依次输入相似度计算模型中,通过相似度计算模型输出待匹配对象对的相似度。
相似度越大,表明待匹配对象对中的两个待匹配对象越匹配,相似度越小,表明待匹配对象对中的两个待匹配对象越不匹配。
在一个可选的实施方式中,所述根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对包括:
计算标识有第一目标标签对应的待匹配对象的第一数量;
计算标识有第二目标标签对应的待匹配对象的第二数量;
根据所述第一数量及所述第二数量创建初始矩阵;
将所述相似度写入所述初始矩阵中,得到相似度矩阵;
搜索所述相似度矩阵的每列中的最大相似度;
根据所述最大相似度确定目标待匹配对象对。
可以将所述初始矩阵的行确定为标识有第一目标标签对应的待匹配对象,将所述初始矩阵的列确定为标识有第二目标标签对应的待匹配对象。将标识有第一目标标签对应的待匹配对象的目标数据进行从小到大排序,并按照排序后的顺序,在初始矩阵的行中依次写入标识有第一目标标签对应的待匹配对象。将标识有第二目标标签对应的待匹配对象的目标数据进行从小到大排序,并按照排序后的顺序,在初始矩阵的行中依次写入标识有第二目标标签对应的待匹配对象。
假设第一数量为L,第二数量为M,则初始矩阵为(L+1)*(m+1),将标识有第一目标标签对应的第一个待匹配对象与标识有第二目标标签对应的第一个待匹配对象的相似度写入初始矩阵的第一行第一列的单元格中,将标识有第一目标标签对应的第二个待匹配对象与标识有第二目标标签对应的第一个待匹配对象的相似度写入初始矩阵的第一行第二列的单元格中,以此类推,将所有计算得到的相似度写入初始矩阵对应的单元格中,得到相似度矩阵。
由于标识有第一目标标签对应的待匹配对象的目标数据小于标识有第二目标标签对应的待匹配对象的目标数据,因而,只需要读取相似度矩阵中的每列中的最大相似度即可为标识有第一目标标签对应的待匹配对象找寻最合适作为参考对象的待匹配对象。
该可选的实施方式中,通过标识有第一目标标签对应的待匹配对象的数量及标识有第二目标标签对应的待匹配对象的数量创建初始矩阵,并将相似度写入初始矩阵得到相似度矩阵,并遍历相似度矩阵的每一行中的最大相似度,能够快速的确定目标待匹配对象对,且确定的目标待匹配对象对中标识有第一目标标签对应的待匹配对象是唯一的。
在一个可选的实施方式中,在所述根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对之后,所述方法还包括:
获取所述目标待匹配对象对中标识有所述第二目标标签的目标对象的课程列表;
将所述课程列表推荐给所述目标待匹配对象对中标识有所述第一目标标签的目标对象。
标识有所述第二目标标签的目标对象可以是高业绩的代理人,标识有所述第一目标标签的目标对象可以是低业绩的代理人,由于每个低业绩的代理人,均从高业绩的代理人中匹配出了特征最相似的代理人,作为低业绩代理人的学习对象,因而可以将高业绩的代理人的课程列表推荐给低业绩的代理人,作为低业绩的代理人的参考。
在其他实施例中,还可以将高业绩的代理人的出单产品种类,销售路径等推荐给低业绩的代理人。
本发明首先对原始的孪生神经网络进行改进,并基于相似样本对和不相似样本对对改进后的孪生神经网络进行训练,得到学习能力和泛化性能较高的相似度计算模型;其次,在获取多个待匹配对象之后,根据待匹配对象的目标数据为对应的待匹配对象标识目标标签,从而将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;最后使用相似度计算模型计算每个待匹配对象对的相似度,从而根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。本发明能够准确且快速批量的为目标对象进行配对。
实施例二
图2是本发明实施例二提供的基于人工智能的目标对象匹配装置的结构图。
在一些实施例中,所述基于人工智能的目标对象匹配装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的目标对象匹配装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的目标对象匹配的功能。
本实施例中,所述基于人工智能的目标对象匹配装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、训练模块202、标识模块203、配对模块204、计算模块205及推荐模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述获取模块201,用于获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本。
计算机设备中可以预先存储大量的样本及描述每个样本的多个特征数据。计算机设备根据特征数据创建正负样本对,正样本对为由两个第一样本构成的数据对,负样本对为由两个第二样本构成的数据对。
在不同的应用场景中,样本可以具有不同的指代。例如,在保险场景中,样本可以是保险代理人。在跟踪场景中,样本可以是行人,车辆等。
描述样本的特征数据可以包括,但不限于:个人背景信息、出勤相关特征、展业活动特征、所在营业部特征等。
在一个可选的实施方式中,所述获取模块201获取多个正样本对及多个负样本对包括:
获取每个样本的特征数据并将每个样本的特征数据进行标准化处理得到标准数据;
将每两个样本进行配对得到多个样本对;
根据所述标准数据计算每个所述样本对中两个样本之间的欧氏距离;
将欧式距离进行排序,并根据排序后的欧式距离从所述多个样本对中获取所述多个正样本对及所述多个负样本对。
其中,标准化处理可以包括归一化处理,数据清洗处理等。
可以将计算得到的欧式距离进行从大到小排序,将排序后位于第一至第K1个欧式距离的样本对作为负样本对,将排序后位于倒数第一至倒数第K2个欧式距离的样本对作为正样本对。还可以将计算得到的欧式距离进行从小到大排序,将排序后位于第一至第K3个欧式距离的样本对作为正样本对,将排序后位于倒数第一至倒数第K4个欧式距离的样本对作为负样本对。其中,K1,K2,K3,K4均为大于1且小于N的整数,N表示将每两个样本进行配对得到的多个样本对的数量。即,正样本对中的两个相似样本是指欧式距离较近的两个样本,负样本对中的两个不相似样本是指欧式距离较远的两个样本。
该可选的实施方式中,通过计算描述对象的特征数据之间的欧式距离来计算对象标识之间的相似度,从而选取出多个正样本对及多个负样本对,有利于后续基于样本对训练相似度计算模型,提高相似度计算模型的计算效果。
所述训练模块202,用于获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型。
孪生神经网络(Siamese Network)为双分支Siamese网络,该双分支Siamese网络由两支相同的Siamese网络并联拼接而成。原始的孪生神经网络的每支Siamese网络均具有多个全连接层,通常为7个全连接层,最后一层全连接层根据第6层全连接层的特征进行计算得到相似度。
对原始孪生神经网络进行改进得到改进后的孪生神经网络,对改进后的孪生神经网络进行训练,其中,本实施例采用多个正样本对及多个负样本对对改进后的孪生神经网络进行训练。
本实施例中,由于正样本对为相似的两个样本构成的数据对,负样本对为不相似的两个样本对构成的数据对,选取不同相似性的样本对来对改进后的孪生神经网络进行训练,能够使得训练得到的相似度计算模型更精确。
在一个可选的实施方式中,所述训练模块202对所述原始孪生神经网络进行改进包括:
获取所述原始孪生神经网络中的N个全连接层;
使用卷积层替换前N-1个全连接层;
在前N-2个卷积层中的每一个卷积层加入一层最大池化层,并在每个卷积层中加入一层批归一化层,得到改进后的孪生神经网络。
假设,N为7,即原始孪生神经网络中有7个全连接层。
将原始孪生神经网络中前6个全连接层的每一个全连接层替换为卷积层,并在前5个卷积层的每一个卷积层中加入最大池化层,第6个卷积层不加入最大池化层,在前6个卷积层的每一个卷积层中加入批归一化层。
改进后的孪生神经网络的最后一层使用全连接层以生成定长的特征向量,并使用ReLU作为激活函数。
该可选的实施方式中,相比全连接层的上层神经元连接下一层的所有神经元,由于卷积层的卷积核较小,则进行的是局部连接,局部连接大大减少了模型的参数量,能够有效的提高模型的训练速度。此外,加入最大池化层并在每一个卷积层加入了批归一化层,能够防止过拟合,同时能够进一步加快模型的训练速度和训练效率。
在一个可选的实施方式中,所述训练模块202基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型包括:
随机选取至少一个目标正样本对及至少一个目标负样本对;
对所述目标正样本对中的至少一个特征数据进行擦除处理,及对目标负样本对中的至少一个特征数据进行擦除处理;
根据擦除处理后的目标正样本对和擦除处理后的目标负样本对得到训练样本对集;
将所述训练样本对集中的每个训练样本对通过一个卷积层进行特征降维,得到降维特征;
将所述降维特征通过ReLU函数进行激活,得到激活特征;
将所述激活特征通过下一个卷积层进行升维,得到升维特征;
将所述升维特征通过sigmoid函数进行归一化,得到归一化特征;
将所述归一化特征通过最大池化操作,得到池化特征;
根据所述池化特征对改进后的孪生神经网络进行训练,得到相似度计算模型。
将训练样本对集中的两个训练样本对分别输入改进后的孪生神经网络的两分支网络中,改进后的孪生神经网络的两分支网络输出训练样本对的相似度,计算两分支网络输出的相似度与该训练样本对已知的相似度之间的误差值;根据所述误差值对两分支网络的网络参数反复进行调整,直到所述误差值小于预设误差值。
由于最终的目的是让相似的训练样本对的距离尽可能小,不相似的训练样本对的距离尽可能大,所以采用Contrastive Loss损失函数:
Figure 476663DEST_PATH_IMAGE001
其中,
Figure 120134DEST_PATH_IMAGE002
,表示孪生神经网络输出的欧氏距离,
Figure 455300DEST_PATH_IMAGE003
为设定的阈值,是模型超参数,能避免模型输出的都是零向量;
Figure 184222DEST_PATH_IMAGE004
表示训练样本对是否相似,
Figure 263036DEST_PATH_IMAGE005
表示训练样本对相似,
Figure 761013DEST_PATH_IMAGE006
表示训练样本对不相似。Contrastive Loss损失函数可以很好地表达训练样本对之间的匹配程度。最终训练出的Siamese输出转换后的一对向量。计算这对输出向量的欧氏距离,采用sigmoid函数归一化处理后得到的值,表示输入的训练样本对的相似度。
该可选的实施方式中,通过对所述目标正负样本对中的至少一个特征数据进行擦除处理,并将擦除处理后的目标正负样本对添加至多个正样本对及多个负样本对中,得到的样本对作为训练样本对集,不仅扩充了训练样本对集的数量,使得基于训练样本对集训练改进后的孪生神经网络,能够提高训练效果,且对目标正负样本对中的至少一个特征数据进行擦除处理,还能够提高模型的学习能力,从而提高模型的泛化性能。
将所述激活特征通过下一个卷积层进行升维,得到的升维特征的维度与训练样本对的维度相同,通过sigmoid函数进行归一化,得到归一化特征并将所述归一化特征通过最大池化操作,得到池化特征,相当于将池化特征作为重要程度,依照重要程度去提升有用的特征并抑制对当前任务用处不大的特征,能够进一步提升模型的训练效果。
所述标识模块203,用于获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签。
待匹配对象是指需要进行目标对象匹配的对象。
在保险场景中,待匹配对象可以是待进行匹配的保险代理人,所述目标数据可以是待进行匹配的保险代理人的历史业绩数据。在跟踪场景中,待匹配对象可以是待进行匹配的行人,所述目标数据可以是待进行匹配的行人的历史位置数据。
在一个可选的实施方式中,所述标识模块203根据所述目标数据为对应的所述待匹配对象标识目标标签包括:
将所述目标数据与预设多个数据范围进行匹配;
确定与所述目标数据匹配的目标数据范围;
将所述目标数据范围对应的标签标识为所述目标数据对应的待匹配对象的目标标签。
计算机设备中预先存储有多个数据范围,例如,第一数据范围[X1,X2),第二数据范围[X2,X3),第三数据范围[X3,X4)。其中,X1<X2<X3<X4。数据范围的数量可以根据实际需求进行修改和调整。
不同的数据范围对应不同的标签,第一数据范围对应第一标签,第二数据范围对应第二标签,第三数据范围对应第三标签,其中,第一标签<第二标签<第三标签。
所述配对模块204,用于将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对。
计算机设备可以获取描述每个待匹配对象的特征数据,例如,个人背景信息、出勤相关特征、展业活动特征、所在营业部特征等,并将描述每个待匹配对象的特征数据进行标准化处理,得到待匹配对象的标准数据。
在得到待匹配对象的标准数据之后,可以将标识有不同目标标签的待匹配对象的标准数据进行两两配对,得到多个待匹配对象对。
应当理解的是,标识有相同目标标签的待匹配对象的标准数据不进行两两配对。
示例性的,将标识有第一目标标签的待匹配对象的标准数据与标识有第二目标标签的待匹配对象的标准数据进行两两配对,将标识有第二目标标签的待匹配对象的标准数据与标识有第三目标标签的待匹配对象的标准数据进行两两配对,将标识有第一目标标签的待匹配对象的标准数据与标识有第三目标标签的待匹配对象的标准数据进行两两配对。
所述计算模块205,用于使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。
将每个待匹配对象对依次输入相似度计算模型中,通过相似度计算模型输出待匹配对象对的相似度。
相似度越大,表明待匹配对象对中的两个待匹配对象越匹配,相似度越小,表明待匹配对象对中的两个待匹配对象越不匹配。
在一个可选的实施方式中,所述计算模块205根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对包括:
计算标识有第一目标标签对应的待匹配对象的第一数量;
计算标识有第二目标标签对应的待匹配对象的第二数量;
根据所述第一数量及所述第二数量创建初始矩阵;
将所述相似度写入所述初始矩阵中,得到相似度矩阵;
搜索所述相似度矩阵的每列中的最大相似度;
根据所述最大相似度确定目标待匹配对象对。
可以将所述初始矩阵的行确定为标识有第一目标标签对应的待匹配对象,将所述初始矩阵的列确定为标识有第二目标标签对应的待匹配对象。将标识有第一目标标签对应的待匹配对象的目标数据进行从小到大排序,并按照排序后的顺序,在初始矩阵的行中依次写入标识有第一目标标签对应的待匹配对象。将标识有第二目标标签对应的待匹配对象的目标数据进行从小到大排序,并按照排序后的顺序,在初始矩阵的行中依次写入标识有第二目标标签对应的待匹配对象。
假设第一数量为L,第二数量为M,则初始矩阵为(L+1)*(m+1),将标识有第一目标标签对应的第一个待匹配对象与标识有第二目标标签对应的第一个待匹配对象的相似度写入初始矩阵的第一行第一列的单元格中,将标识有第一目标标签对应的第二个待匹配对象与标识有第二目标标签对应的第一个待匹配对象的相似度写入初始矩阵的第一行第二列的单元格中,以此类推,将所有计算得到的相似度写入初始矩阵对应的单元格中,得到相似度矩阵。
由于标识有第一目标标签对应的待匹配对象的目标数据小于标识有第二目标标签对应的待匹配对象的目标数据,因而,只需要读取相似度矩阵中的每列中的最大相似度即可为标识有第一目标标签对应的待匹配对象找寻最合适作为参考对象的待匹配对象。
该可选的实施方式中,通过标识有第一目标标签对应的待匹配对象的数量及标识有第二目标标签对应的待匹配对象的数量创建初始矩阵,并将相似度写入初始矩阵得到相似度矩阵,并遍历相似度矩阵的每一行中的最大相似度,能够快速的确定目标待匹配对象对,且确定的目标待匹配对象对中标识有第一目标标签对应的待匹配对象是唯一的。
在一个可选的实施方式中,在所述根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对之后,所述推荐模块206,用于获取所述目标待匹配对象对中标识有所述第二目标标签的目标对象的课程列表;将所述课程列表推荐给所述目标待匹配对象对中标识有所述第一目标标签的目标对象。
标识有所述第二目标标签的目标对象可以是高业绩的代理人,标识有所述第一目标标签的目标对象可以是低业绩的代理人,由于每个低业绩的代理人,均从高业绩的代理人中匹配出了特征最相似的代理人,作为低业绩代理人的学习对象,因而可以将高业绩的代理人的课程列表推荐给低业绩的代理人,作为低业绩的代理人的参考。
在其他实施例中,还可以将高业绩的代理人的出单产品种类,销售路径等推荐给低业绩的代理人。
本发明首先对原始的孪生神经网络进行改进,并基于相似样本对和不相似样本对对改进后的孪生神经网络进行训练,得到学习能力和泛化性能较高的相似度计算模型;其次,在获取多个待匹配对象之后,根据待匹配对象的目标数据为对应的待匹配对象标识目标标签,从而将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;最后使用相似度计算模型计算每个待匹配对象对的相似度,从而根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。本发明能够准确且快速批量的为目标对象进行配对。
实施例三
本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的目标对象匹配方法实施例中的步骤,例如图1所示的S11-S15:
S11,获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
S12,获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
S13,获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
S14,将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
S15,使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对。
或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-206:
所述获取模块201,用于获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
所述训练模块202,用于获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
所述标识模块203,用于获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
所述配对模块204,用于将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
所述计算模块205,用于使用所述相似度计算模型计算每个所述待匹配对象对的相似度,并根据所述相似度确定所述多个待匹配对象对中的目标待匹配对象对;
所述推荐模块206,用于获取所述目标待匹配对象对中标识有所述第二目标标签的目标对象的课程列表;将所述课程列表推荐给所述目标待匹配对象对中标识有所述第一目标标签的目标对象。
实施例四
参阅图3所示,为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的目标对象匹配方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的目标对象匹配方法的全部或者部分步骤;或者实现基于人工智能的目标对象匹配装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processingunit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种基于人工智能的目标对象匹配方法,其特征在于,所述方法包括:
获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
使用所述相似度计算模型计算每个所述待匹配对象对的相似度,计算标识有第一目标标签对应的待匹配对象的第一数量;计算标识有第二目标标签对应的待匹配对象的第二数量;根据所述第一数量及所述第二数量创建初始矩阵;将所述相似度写入所述初始矩阵中,得到相似度矩阵;搜索所述相似度矩阵的每列中的最大相似度;根据所述最大相似度确定目标待匹配对象对。
2.如权利要求1所述的基于人工智能的目标对象匹配方法,其特征在于,所述对所述原始孪生神经网络进行改进包括:
获取所述原始孪生神经网络中的N个全连接层;
使用卷积层替换前N-1个全连接层;
在前N-2个卷积层中的每一个卷积层加入一层最大池化层,并在每个卷积层中加入一层批归一化层,得到改进后的孪生神经网络。
3.如权利要求2所述的基于人工智能的目标对象匹配方法,其特征在于,所述基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型包括:
随机选取至少一个目标正样本对及至少一个目标负样本对;
对所述目标正样本对中的至少一个特征数据进行擦除处理,及对目标负样本对中的至少一个特征数据进行擦除处理;
根据擦除处理后的目标正样本对和擦除处理后的目标负样本对得到训练样本对集;
将所述训练样本对集中的每个训练样本对通过一个卷积层进行特征降维,得到降维特征;
将所述降维特征通过ReLU函数进行激活,得到激活特征;
将所述激活特征通过下一个卷积层进行升维,得到升维特征;
将所述升维特征通过sigmoid函数进行归一化,得到归一化特征;
将所述归一化特征通过最大池化操作,得到池化特征;
根据所述池化特征对改进后的孪生神经网络进行训练,得到相似度计算模型。
4.如权利要求1所述的基于人工智能的目标对象匹配方法,其特征在于,所述根据所述目标数据为对应的所述待匹配对象标识目标标签包括:
将所述目标数据与预设多个数据范围进行匹配;
确定与所述目标数据匹配的目标数据范围;
将所述目标数据范围对应的标签标识为所述目标数据对应的待匹配对象的目标标签。
5.如权利要求1至4中任意一项所述的基于人工智能的目标对象匹配方法,其特征在于,所述获取多个正样本对及多个负样本对包括:
获取每个样本的特征数据并将每个样本的特征数据进行标准化处理得到标准数据;
将每两个样本进行配对得到多个样本对;
根据所述标准数据计算每个所述样本对中两个样本之间的欧氏距离;
将欧式距离进行排序,并根据排序后的欧式距离从所述多个样本对中获取所述多个正样本对及所述多个负样本对。
6.如权利要求1至4中任意一项所述的基于人工智能的目标对象匹配方法,其特征在于,所述方法还包括:
获取所述目标待匹配对象对中标识有所述第二目标标签的目标对象的课程列表;
将所述课程列表推荐给所述目标待匹配对象对中标识有所述第一目标标签的目标对象。
7.一种基于人工智能的目标对象匹配装置,其特征在于,所述装置包括:
获取模块,用于获取多个正样本对及多个负样本对,其中,所述正样本对中的两个样本为相似样本,所述负样本对中的两个样本为不相似样本;
训练模块,用于获取原始孪生神经网络并对所述原始孪生神经网络进行改进,基于所述多个正样本对及所述多个负样本对对改进后的孪生神经网络进行训练,得到相似度计算模型;
标识模块,用于获取多个待匹配对象的目标数据,并根据所述目标数据为对应的所述待匹配对象标识目标标签;
配对模块,用于将标识有不同目标标签的待匹配对象进行两两配对,得到多个待匹配对象对;
计算模块,用于使用所述相似度计算模型计算每个所述待匹配对象对的相似度,计算标识有第一目标标签对应的待匹配对象的第一数量;计算标识有第二目标标签对应的待匹配对象的第二数量;根据所述第一数量及所述第二数量创建初始矩阵;将所述相似度写入所述初始矩阵中,得到相似度矩阵;搜索所述相似度矩阵的每列中的最大相似度;根据所述最大相似度确定目标待匹配对象对。
8.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6中任意一项所述基于人工智能的目标对象匹配方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述基于人工智能的目标对象匹配方法。
CN202110972130.1A 2021-08-24 2021-08-24 基于人工智能的目标对象匹配方法及相关设备 Active CN113420847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110972130.1A CN113420847B (zh) 2021-08-24 2021-08-24 基于人工智能的目标对象匹配方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110972130.1A CN113420847B (zh) 2021-08-24 2021-08-24 基于人工智能的目标对象匹配方法及相关设备

Publications (2)

Publication Number Publication Date
CN113420847A CN113420847A (zh) 2021-09-21
CN113420847B true CN113420847B (zh) 2021-11-16

Family

ID=77719447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110972130.1A Active CN113420847B (zh) 2021-08-24 2021-08-24 基于人工智能的目标对象匹配方法及相关设备

Country Status (1)

Country Link
CN (1) CN113420847B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115497633B (zh) * 2022-10-19 2024-01-30 联仁健康医疗大数据科技股份有限公司 一种数据处理方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368934A (zh) * 2020-03-17 2020-07-03 腾讯科技(深圳)有限公司 图像识别模型训练方法、图像识别方法以及相关装置
CN112287957A (zh) * 2020-01-22 2021-01-29 京东安联财产保险有限公司 目标匹配方法与装置
CN112685642A (zh) * 2021-01-06 2021-04-20 北京三快在线科技有限公司 一种标签推荐方法、装置、电子设备及存储介质
CN112784130A (zh) * 2021-01-27 2021-05-11 杭州网易云音乐科技有限公司 孪生网络模型训练、度量方法、装置、介质和设备
CN112906614A (zh) * 2021-03-08 2021-06-04 中南大学 基于注意力指导的行人重识别方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200193271A1 (en) * 2018-11-05 2020-06-18 Incucomm, Inc. System and method for vigorous artificial intelligence

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287957A (zh) * 2020-01-22 2021-01-29 京东安联财产保险有限公司 目标匹配方法与装置
CN111368934A (zh) * 2020-03-17 2020-07-03 腾讯科技(深圳)有限公司 图像识别模型训练方法、图像识别方法以及相关装置
CN112685642A (zh) * 2021-01-06 2021-04-20 北京三快在线科技有限公司 一种标签推荐方法、装置、电子设备及存储介质
CN112784130A (zh) * 2021-01-27 2021-05-11 杭州网易云音乐科技有限公司 孪生网络模型训练、度量方法、装置、介质和设备
CN112906614A (zh) * 2021-03-08 2021-06-04 中南大学 基于注意力指导的行人重识别方法、装置及存储介质

Also Published As

Publication number Publication date
CN113420847A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
Bhavsar et al. Machine learning in transportation data analytics
CN113657495B (zh) 基于概率预测模型的保险产品推荐方法、装置、设备
CN112801718B (zh) 用户行为预测方法、装置、设备及介质
CN112231586A (zh) 基于迁移学习的课程推荐方法、装置、设备及介质
CN112328646B (zh) 多任务课程推荐方法、装置、计算机设备及存储介质
CN112288337B (zh) 行为推荐方法、装置、设备及介质
CN112860848B (zh) 信息检索方法、装置、设备及介质
CN113435202A (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN113592019A (zh) 基于多模型融合的故障检测方法、装置、设备及介质
CN115146865A (zh) 基于人工智能的任务优化方法及相关设备
CN114663223A (zh) 基于人工智能的信用风险评估方法、装置及相关设备
CN113901236A (zh) 基于人工智能的目标识别方法、装置、电子设备及介质
CN114880449B (zh) 智能问答的答复生成方法、装置、电子设备及存储介质
Bureva et al. Generalized net model of fingerprint recognition with intuitionistic fuzzy evaluations
CN114187489B (zh) 车辆异常驾驶风险检测方法、装置、电子设备及存储介质
CN113420847B (zh) 基于人工智能的目标对象匹配方法及相关设备
CN114862520A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN114201212A (zh) 配置文件处理方法、装置、计算机设备及存储介质
CN113658002A (zh) 基于决策树的交易结果生成方法、装置、电子设备及介质
CN113656690A (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN113256325A (zh) 二手车估价方法、系统、计算设备和存储介质
CN112269875A (zh) 文本分类方法、装置、电子设备及存储介质
CN111651452A (zh) 数据存储方法、装置、计算机设备及存储介质
CN115658858A (zh) 基于人工智能的对话推荐方法及相关设备
CN115169360A (zh) 基于人工智能的用户意图识别方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant