CN113901236A - 基于人工智能的目标识别方法、装置、电子设备及介质 - Google Patents
基于人工智能的目标识别方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113901236A CN113901236A CN202111305664.5A CN202111305664A CN113901236A CN 113901236 A CN113901236 A CN 113901236A CN 202111305664 A CN202111305664 A CN 202111305664A CN 113901236 A CN113901236 A CN 113901236A
- Authority
- CN
- China
- Prior art keywords
- target
- artificial intelligence
- knowledge graph
- department
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明涉及人工智能技术领域,提供一种基于人工智能的目标识别方法、装置、电子设备及介质,在获取到客户之间的关联关系、产品之间的标签关系及客户与预设企业之间的所属关系之后,基于关联关系、标签关系及所属关系建立以客户为节点的初始知识图谱,初始知识图谱的信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此节点的表达能力较强,接着根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱,基于所述目标知识图谱对图卷积神经网络进行训练时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率,通过训练后的图卷积神经网络对多个待识别对象进行识别,得到了识别准确度较高的目标对象。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的目标识别方法、装置、电子设备及介质。
背景技术
挖掘优质客户并实现精准化差异化的客户服务是营销策略上重要的一环。发明人在实现本发明的过程中发现,在现有技术中,对优质客户这一目标对象识别等涉及金融信息数据挖掘处理的技术中,大部分停留在非标准和非量化的阶段,造成了目标对象的识别手段单一,识别度差的弊端。虽有通过层次分析模型进行目标对象的识别,然而,层级分析模型仅涉及对象这个单一的数据维度,导致优质客户的识别结果误差较大,识别准确度较差。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的目标识别方法、装置、电子设备及介质,能够融合多个维度的数据构建知识图谱并训练得到识别准确度较高的图卷积神经网络,从而提高了目标对象的识别准确度。
本发明的第一方面提供一种基于人工智能的目标识别方法,所述方法包括:
获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
基于所述目标知识图谱对图卷积神经网络进行训练;
通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
在一个可选的实施方式中,所述方法还包括:
从所述第三维度数据中提取所述客户所属部门的部门名称;
根据预设规则对所述部门名称进行过滤,得到目标部门名称;
根据所述目标部门名称对所述部门进行分组;
将同组内的部门名称按照文本长度进行排序,并将组名确定为文本长度最短的部门名称。
在一个可选的实施方式中,所述根据所述目标部门名称对所述部门进行分组包括:
对所述目标部门名称进行分词处理,得到多个关键词;
提取每个所述关键词的词向量;
基于每个所述关键词的词向量拼接得到对应的所述目标部门名称的特征向量;
基于所述特征向量计算任意两个目标部门名称的相似度;
根据所述相似度对所述部门进行分组。
在一个可选的实施方式中,所述方法还包括:
若无法从所述第三维度数据中提取所述客户所属部门的部门名称时,获取所述客户使用企业设备的记录数据;
从所述记录数据中提取所述企业设备的设备标识号;
获取同一设备标识号对应的WIFI名称;
将WIFI名称相同的且同一设备标识号对应的客户确定为同事关系。
在一个可选的实施方式中,所述预设规则包括以下中的任意一种或多种的组合:
过滤掉部门名称中含有预设字段的部门名称;
过滤掉部门名称为职称的部门名称;
过滤掉部门名称为省县市名称的部门名称。
在一个可选的实施方式中,所述基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱包括:
建立以客户为节点的初始知识图谱;
在具有所述关联关系或者具有所述所属关系的两个客户对应的节点之间建立边;
将所述标签关系作为所述客户对应的节点的属性特征。
在一个可选的实施方式中,所述通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识包括:
基于每个所述待识别对象的多个维度的数据构建待识别知识图谱;
输入所述待识别知识图谱至所述训练后的图卷积神经网络中;
获取所述训练后的图卷积神经网络输出的每个所述待识别对象的类别概率;
将大于预设概率阈值的类别概率选取出来;
将选取出来的类别概率对应的对象标识确定为目标对象标识。
本发明的第二方面提供一种基于人工智能的目标识别装置,所述装置包括:
第一获取模块,用于获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
第二获取模块,用于获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
第三获取模块,用于获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
图谱建立模块,用于基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
权重优化模块,用于根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
网络训练模块,用于基于所述目标知识图谱对图卷积神经网络进行训练;
目标输出模块,用于通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的目标识别方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的目标识别方法。
综上所述,本发明所述的基于人工智能的目标识别方法、装置、电子设备及介质,在获取到多个客户之间的关联关系、多个产品之间的标签关系及客户与预设企业之间的所属关系之后,基于关联关系、标签关系及所属关系,建立以客户为节点的初始知识图谱,得到的初始知识图谱的信息汇集了多个维度的数据,因此信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此,节点的表达能力较强,接着根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱,基于所述目标知识图谱对图卷积神经网络进行训练时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率,通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识,得到了识别准确度较高的目标对象。
附图说明
图1是本发明实施例一提供的基于人工智能的目标识别方法的流程图。
图2是本发明实施例二提供的基于人工智能的目标识别装置的结构图。
图3是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的目标识别方法由电子设备执行,相应地,基于人工智能的目标识别装置运行于电子设备中。
实施例一
图1是本发明实施例一提供的基于人工智能的目标识别方法的流程图。所述基于人工智能的目标识别方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系。
本实施例中的客户可以指与企业中的代理人有互动关系或者与企业中的产品有购买关系的用户。其中,第一维度数据可以为客户关系维度的数据,电子设备可以获取每个客户购买预设产品时提供的基本信息(例如,姓名,电话号码等)、在预设企业的预设应用程序中的操作信息、与第三方通讯的记录信息等。所述预设企业为需要进行客户价值识别的对象,所述预设产品为所述预设企业研发的一个或多个产品,所述预设应用程序可以为所述预设企业开发的供客户使用的应用型程序软件。电子设备可以从预设企业的客户数据库中获取所述基本信息、所述操作信息及所述记录信息,并将获取的所述基本信息、所述操作信息及所述记录信息作为所述第一维度数据。
所述关联关系可以包括:客户之间为家庭关系,客户之间为朋友关系,客户之间为同事关系,客户之间为同乡关系等。
第一维度数据对应的数据字段包括:寿险保单信息,健康险保单信息,wifi联机记录,设备使用记录,客户基本信息,主副卡信息及转账信息。
S12,获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系。
其中,第二维度数据可以为产品关系维度的数据,电子设备可以获取每个客户购买预设产品的产品信息(例如,产品型号,产品名称)、所述预设产品的迭代信息(例如,版本号)等。电子设备可以从预设企业的产品数据库中获取所述产品信息、所述迭代信息,并将获取的所述产品信息、所述迭代信息作为所述第二维度数据。
所述标签关系可以包括:产品之间为同质产品标签,产品之间为互补产品标签、客户及产品的关系标签等。
第二维度数据对应的数据字段包括:产品信息,客户购买次数,客户购买金额。
S13,获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系。
其中,第三维度数据可以为企业关系维度的数据,电子设备可以获取每个客户与所述预设企业的记录信息。
客户与预设企业之间的关系可以包括:客户与理财经理的关系、客户与代理人的关系、客户与企业客服的关系等。
第三维度数据对应的数据字段包括:代理人客户名单,客户登录代理人等。
在一个可选的实施方式中,所述方法包括:
从所述第三维度数据中提取所述客户所属部门的部门名称;
根据预设规则对所述部门名称进行过滤,得到目标部门名称;
根据所述目标部门名称对所述部门进行分组;
将同组内的部门名称按照文本长度进行排序,并将组名确定为文本长度最短的部门名称。
在其他实施方式中,还可以先对数据进行数据清洗,例如,去除数据中的数字、符号、乱码等异常数据,得到干净数据,然后基于干净数据提取部门的部门名称。
在一个可选的实施方式中,所述预设规则可以包括以下中的任意一种或多种的组合:过滤掉部门名称中含有预设字段的部门名称;过滤掉部门名称为职称的部门名称;过滤掉部门名称为省县市名称的部门名称。其中,预设字段可以为自由业、无业、个体、独立。
在对目标部门名称进行分组后,为了确定每个组的组名,可以将同一个组内的目标部门名称按照文本长度进行从大到小或者从小到大进行排序,将文本长度最短的目标部门名称确定为对应组的组名。文本长度是指目标部门名称的字符长度。
若组名包含有单位信息,由于同单位大概率显示此两客户认识,则以该组名确定为最终组名。
在一个可选的实施方式中,所述根据所述目标部门名称对所述部门进行分组包括:
对所述目标部门名称进行分词处理,得到多个关键词;
提取每个所述关键词的词向量;
基于每个所述关键词的词向量拼接得到对应的所述目标部门名称的特征向量;
基于所述特征向量计算任意两个目标部门名称的相似度;
根据所述相似度对所述部门进行分组。
电子设备在基于每个关键词的词向量拼接得到对应目标部门名称的特征向量后,计算任意两个目标部门名称的特征向量的欧式距离或者余弦夹角,得到这任意两个目标部门名称的相似度。相似度越高,越将这任意两个目标部门名称分为一组。相似度越低,越将这任意两个目标部门名称分为不同的组。
在一个可选的实施方式中,所述方法还包括:
若无法从所述第三维度数据中提取所述客户所属部门的部门名称时,获取所述客户使用企业设备的记录数据;
从所述记录数据中提取所述企业设备的设备标识号;
获取同一设备标识号对应的WIFI名称;
将WIFI名称相同的且同一设备标识号对应的客户确定为同事关系。
由于仅确认在同家公司工作不能代表有实体关系,因此再以wifi/设备联结记录做二次验证。
S14,基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱。
关联关系代表了客户与客户之间的关系,标签关系代表了客户与企业的产品之间的关系,所属关系代表了客户与企业之间的关系,通过这三个维度的关系最终建立起一个以客户为节点的初始知识图谱。其中客户的工作、家庭、产品购买情况等可以作为属性,节点之间的边代表客户之间的关系为同事、家庭、同乡或朋友。
在一个可选的实施方式中,所述基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱包括:
建立以客户为节点的初始知识图谱;
在具有所述关联关系或者具有所述所属关系的两个客户对应的节点之间建立边,所述关联关系或者所述所属关系作为对应边的权重;
将所述标签关系作为所述客户对应的节点的属性特征。
该可选的实施方式中,构建的初始知识图谱结合了多个维度的数据,因此得到的初始知识图谱的信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此,节点的表达能力较强,便于后续基于较强表达能力的节点的知识图像训练图卷积神经网络时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率。
S15,根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱。
预设权重优化策略是指预先设置并存储于电子设备中的权重优化规则,可以包括,但不限于:为节点之间的关系设置不同的权重系数。
假设现在有N个节点,每个节点代表一个客户,并且有自己的属性特征,比如年龄、性别、产品购买情况等,这些节点的特征组成一个N*D维的矩阵X,每个节点之间的关系会形成一个N*N维的矩阵A。可以事先为不同关系定义不同的权重系数,比如家庭关系权重系数为4,朋友关系权重系数为3,同事关系权重系数为2,同乡关系权重系数为1,如果节点间没有关系,对应的关系权重系数为0。
S16,基于所述目标知识图谱对图卷积神经网络进行训练。
具体实施时,采用有监督的训练方式,通过人工标识客户中的优化客户和非优质客户,并将优质客户作为正样本,非优质客户作为负样本,正样本对应第一标签,负样本对应第二标签。本实施例通过将目标知识图谱作为图卷积神经网络的输入,获取图卷积神经网络最后一层每个节点的向量作为节点的embedding特征,将每两个节点的embedding向量拼接起来,再输入图卷积神经网络的全连接层,通过全连接层预测这两个节点之间是否有关联关系。用已被人工标识的节点的属性特征来迭代训练图卷积神经网络,在迭代次数达到预设阈值时,停止训练。
S17,通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
待识别对象为需要进行识别的客户,这些待识别对象可能是企业中的优质客户。在图卷积神经网络训练完成之后,即可使用训练完成的图卷积神经网络对多个待识别对象进行识别,以识别哪些对象为优质客户,哪些对象为非优质客户。
在一个可选的实施方式中,所述通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识包括:
基于每个所述待识别对象的多个维度的数据构建待识别知识图谱;
输入所述待识别知识图谱至所述训练后的图卷积神经网络中;
获取所述训练后的图卷积神经网络输出的每个所述待识别对象的类别概率;
将大于预设概率阈值的类别概率选取出来;
将选取出来的类别概率对应的对象标识确定为目标对象标识。
其中,待识别对象的多个维度的数据包括所述第一维度数据、所述第二维度数据及所述第三维度数据,基于待识别对象的第一维度数据、第二维度数据及第三维度数据构建以待识别对象为节点的知识图谱,作为待识别知识图谱并输入至所述训练后的图卷积神经网络中。
类别概率用于标识对应的待识别对象为优质客户的可能性。类别概率越高,表明对应的待识别对象越可能为优质客户,类别概率越低,表明对应的待识别对象越不可能为优质客户。
电子设备预先设置概率阈值,用以作为筛选优质客户的临界值。将大于预设概率阈值的类别概率选取出来后,获取选取出来的类别概率对应的待识别对象的标识,这选取出来的待识别对象的标识作为目标对象标识。
本发明所述的基于人工智能的目标识别方法,在获取到多个客户之间的关联关系、多个产品之间的标签关系及客户与预设企业之间的所属关系之后,基于关联关系、标签关系及所属关系,建立以客户为节点的初始知识图谱,得到的初始知识图谱的信息汇集了多个维度的数据,因此信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此,节点的表达能力较强,接着根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱,基于所述目标知识图谱对图卷积神经网络进行训练时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率,通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识,得到了识别准确度较高的目标对象。
实施例二
图2是本发明实施例二提供的基于人工智能的目标识别装置的结构图。
在一些实施例中,所述基于人工智能的目标识别装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的目标识别装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的目标识别的功能。
本实施例中,所述基于人工智能的目标识别装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:第一获取模块201、第二获取模块202、第三获取模块203、关系确定模块204、图谱建立模块205、权重优化模块206、网络训练模块207及目标输出模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述第一获取模块201,用于获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系。
本实施例中的客户可以指与企业中的代理人有互动关系或者与企业中的产品有购买关系的用户。其中,第一维度数据可以为客户关系维度的数据,电子设备可以获取每个客户购买预设产品时提供的基本信息(例如,姓名,电话号码等)、在预设企业的预设应用程序中的操作信息、与第三方通讯的记录信息等。所述预设企业为需要进行客户价值识别的对象,所述预设产品为所述预设企业研发的一个或多个产品,所述预设应用程序可以为所述预设企业开发的供客户使用的应用型程序软件。电子设备可以从预设企业的客户数据库中获取所述基本信息、所述操作信息及所述记录信息,并将获取的所述基本信息、所述操作信息及所述记录信息作为所述第一维度数据。
所述关联关系可以包括:客户之间为家庭关系,客户之间为朋友关系,客户之间为同事关系,客户之间为同乡关系等。
第一维度数据对应的数据字段包括:寿险保单信息,健康险保单信息,wifi联机记录,设备使用记录,客户基本信息,主副卡信息及转账信息。
所述第二获取模块202,用于获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系。
其中,第二维度数据可以为产品关系维度的数据,电子设备可以获取每个客户购买预设产品的产品信息(例如,产品型号,产品名称)、所述预设产品的迭代信息(例如,版本号)等。电子设备可以从预设企业的产品数据库中获取所述产品信息、所述迭代信息,并将获取的所述产品信息、所述迭代信息作为所述第二维度数据。
所述标签关系可以包括:产品之间为同质产品标签,产品之间为互补产品标签、客户及产品的关系标签等。
第二维度数据对应的数据字段包括:产品信息,客户购买次数,客户购买金额。
所述第三获取模块203,用于获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系。
其中,第三维度数据可以为企业关系维度的数据,电子设备可以获取每个客户与所述预设企业的记录信息。
客户与预设企业之间的关系可以包括:客户与理财经理的关系、客户与代理人的关系、客户与企业客服的关系等。
第三维度数据对应的数据字段包括:代理人客户名单,客户登录代理人等。
在一个可选的实施方式中,所述关系确定模块204,用于:
从所述第三维度数据中提取所述客户所属部门的部门名称;
根据预设规则对所述部门名称进行过滤,得到目标部门名称;
根据所述目标部门名称对所述部门进行分组;
将同组内的部门名称按照文本长度进行排序,并将组名确定为文本长度最短的部门名称。
在其他实施方式中,还可以先对数据进行数据清洗,例如,去除数据中的数字、符号、乱码等异常数据,得到干净数据,然后基于干净数据提取部门的部门名称。
在一个可选的实施方式中,所述预设规则可以包括以下中的任意一种或多种的组合:过滤掉部门名称中含有预设字段的部门名称;过滤掉部门名称为职称的部门名称;过滤掉部门名称为省县市名称的部门名称。其中,预设字段可以为自由业、无业、个体、独立。
在对目标部门名称进行分组后,为了确定每个组的组名,可以将同一个组内的目标部门名称按照文本长度进行从大到小或者从小到大进行排序,将文本长度最短的目标部门名称确定为对应组的组名。文本长度是指目标部门名称的字符长度。
若组名包含有单位信息,由于同单位大概率显示此两客户认识,则以该组名确定为最终组名。
在一个可选的实施方式中,所述根据所述目标部门名称对所述部门进行分组包括:
对所述目标部门名称进行分词处理,得到多个关键词;
提取每个所述关键词的词向量;
基于每个所述关键词的词向量拼接得到对应的所述目标部门名称的特征向量;
基于所述特征向量计算任意两个目标部门名称的相似度;
根据所述相似度对所述部门进行分组。
电子设备在基于每个关键词的词向量拼接得到对应目标部门名称的特征向量后,计算任意两个目标部门名称的特征向量的欧式距离或者余弦夹角,得到这任意两个目标部门名称的相似度。相似度越高,越将这任意两个目标部门名称分为一组。相似度越低,越将这任意两个目标部门名称分为不同的组。
在一个可选的实施方式中,所述关系确定模块204,还用于:
若无法从所述第三维度数据中提取所述客户所属部门的部门名称时,获取所述客户使用企业设备的记录数据;
从所述记录数据中提取所述企业设备的设备标识号;
获取同一设备标识号对应的WIFI名称;
将WIFI名称相同的且同一设备标识号对应的客户确定为同事关系。
由于仅确认在同家公司工作不能代表有实体关系,因此再以wifi/设备联结记录做二次验证。
所述关系确定模块204能够辅助确定所述客户与预设企业之间的所属关系。
所述图谱建立模块205,用于基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱。
关联关系代表了客户与客户之间的关系,标签关系代表了客户与企业的产品之间的关系,所属关系代表了客户与企业之间的关系,通过这三个维度的关系最终建立起一个以客户为节点的初始知识图谱。其中客户的工作、家庭、产品购买情况等可以作为属性,节点之间的边代表客户之间的关系为同事、家庭、同乡或朋友。
在一个可选的实施方式中,所述图谱建立模块205基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱包括:
建立以客户为节点的初始知识图谱;
在具有所述关联关系或者具有所述所属关系的两个客户对应的节点之间建立边,所述关联关系或者所述所属关系作为对应边的权重;
将所述标签关系作为所述客户对应的节点的属性特征。
该可选的实施方式中,构建的初始知识图谱结合了多个维度的数据,因此得到的初始知识图谱的信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此,节点的表达能力较强,便于后续基于较强表达能力的节点的知识图像训练图卷积神经网络时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率。
所述权重优化模块206,用于根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱。
预设权重优化策略是指预先设置并存储于电子设备中的权重优化规则,可以包括,但不限于:为节点之间的关系设置不同的权重系数。
假设现在有N个节点,每个节点代表一个客户,并且有自己的属性特征,比如年龄、性别、产品购买情况等,这些节点的特征组成一个N*D维的矩阵X,每个节点之间的关系会形成一个N*N维的矩阵A。可以事先为不同关系定义不同的权重系数,比如家庭关系权重系数为4,朋友关系权重系数为3,同事关系权重系数为2,同乡关系权重系数为1,如果节点间没有关系,对应的关系权重系数为0。
所述网络训练模块207,用于基于所述目标知识图谱对图卷积神经网络进行训练。
具体实施时,采用有监督的训练方式,通过人工标识客户中的优化客户和非优质客户,并将优质客户作为正样本,非优质客户作为负样本,正样本对应第一标签,负样本对应第二标签。本实施例通过将目标知识图谱作为图卷积神经网络的输入,获取图卷积神经网络最后一层每个节点的向量作为节点的embedding特征,将每两个节点的embedding向量拼接起来,再输入图卷积神经网络的全连接层,通过全连接层预测这两个节点之间是否有关联关系。用已被人工标识的节点的属性特征来迭代训练图卷积神经网络,在迭代次数达到预设阈值时,停止训练。
所述目标输出模块208,用于通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
待识别对象为需要进行识别的客户,这些待识别对象可能是企业中的优质客户。在图卷积神经网络训练完成之后,即可使用训练完成的图卷积神经网络对多个待识别对象进行识别,以识别哪些对象为优质客户,哪些对象为非优质客户。
在一个可选的实施方式中,所述目标输出模块208通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识包括:
基于每个所述待识别对象的多个维度的数据构建待识别知识图谱;
输入所述待识别知识图谱至所述训练后的图卷积神经网络中;
获取所述训练后的图卷积神经网络输出的每个所述待识别对象的类别概率;
将大于预设概率阈值的类别概率选取出来;
将选取出来的类别概率对应的对象标识确定为目标对象标识。
其中,待识别对象的多个维度的数据包括所述第一维度数据、所述第二维度数据及所述第三维度数据,基于待识别对象的第一维度数据、第二维度数据及第三维度数据构建以待识别对象为节点的知识图谱,作为待识别知识图谱并输入至所述训练后的图卷积神经网络中。
类别概率用于标识对应的待识别对象为优质客户的可能性。类别概率越高,表明对应的待识别对象越可能为优质客户,类别概率越低,表明对应的待识别对象越不可能为优质客户。
电子设备预先设置概率阈值,用以作为筛选优质客户的临界值。将大于预设概率阈值的类别概率选取出来后,获取选取出来的类别概率对应的待识别对象的标识,这选取出来的待识别对象的标识作为目标对象标识。
本发明所述的基于人工智能的目标识别装置,在获取到多个客户之间的关联关系、多个产品之间的标签关系及客户与预设企业之间的所属关系之后,基于关联关系、标签关系及所属关系,建立以客户为节点的初始知识图谱,得到的初始知识图谱的信息汇集了多个维度的数据,因此信息较为丰富,初始知识图谱中的每个节点包括多个属性特征,因此,节点的表达能力较强,接着根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱,基于所述目标知识图谱对图卷积神经网络进行训练时,能提高图卷积神经网络的训练性能,从而提高图卷积神经网络的预测概率,通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识,得到了识别准确度较高的目标对象。
实施例三
本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的目标识别方法实施例中的步骤,例如图1所示的S11-S17:
S11,获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
S12,获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
S13,获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
S14,基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
S15,根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
S16,基于所述目标知识图谱对图卷积神经网络进行训练;
S17,通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-206:
所述第一获取模块201,用于获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
所述第二获取模块202,用于获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
所述第三获取模块203,用于获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
所述关系确定模块204,用以辅助确定所述客户与预设企业之间的所属关系;
所述图谱建立模块205,用于基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
所述权重优化模块206,用于根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
所述网络训练模块207,用于基于所述目标知识图谱对图卷积神经网络进行训练;
所述目标输出模块208,用于通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
实施例四
参阅图3所示,为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的目标识别方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的目标识别方法的全部或者部分步骤;或者实现基于人工智能的目标识别装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的目标识别方法,其特征在于,所述方法包括:
获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
基于所述目标知识图谱对图卷积神经网络进行训练;
通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
2.如权利要求1所述的基于人工智能的目标识别方法,其特征在于,所述方法还包括:
从所述第三维度数据中提取所述客户所属部门的部门名称;
根据预设规则对所述部门名称进行过滤,得到目标部门名称;
根据所述目标部门名称对所述部门进行分组;
将同组内的部门名称按照文本长度进行排序,并将组名确定为文本长度最短的部门名称。
3.如权利要求2所述的基于人工智能的目标识别方法,其特征在于,所述根据所述目标部门名称对所述部门进行分组包括:
对所述目标部门名称进行分词处理,得到多个关键词;
提取每个所述关键词的词向量;
基于每个所述关键词的词向量拼接得到对应的所述目标部门名称的特征向量;
基于所述特征向量计算任意两个目标部门名称的相似度;
根据所述相似度对所述部门进行分组。
4.如权利要求2所述的基于人工智能的目标识别方法,其特征在于,所述方法还包括:
若无法从所述第三维度数据中提取所述客户所属部门的部门名称时,获取所述客户使用企业设备的记录数据;
从所述记录数据中提取所述企业设备的设备标识号;
获取同一设备标识号对应的WIFI名称;
将WIFI名称相同的且同一设备标识号对应的客户确定为同事关系。
5.如权利要求2所述的基于人工智能的目标识别方法,其特征在于,所述预设规则包括以下中的任意一种或多种的组合:
过滤掉部门名称中含有预设字段的部门名称;
过滤掉部门名称为职称的部门名称;
过滤掉部门名称为省县市名称的部门名称。
6.如权利要求1至5中任意一项所述的基于人工智能的目标识别方法,其特征在于,所述基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱包括:
建立以客户为节点的初始知识图谱;
在具有所述关联关系或者具有所述所属关系的两个客户对应的节点之间建立边,所述关联关系或者所述所属关系作为对应边的权重;
将所述标签关系作为所述客户对应的节点的属性特征。
7.如权利要求1至5中任意一项所述的基于人工智能的目标识别方法,其特征在于,所述通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识包括:
基于每个所述待识别对象的多个维度的数据构建待识别知识图谱;
输入所述待识别知识图谱至所述训练后的图卷积神经网络中;
获取所述训练后的图卷积神经网络输出的每个所述待识别对象的类别概率;
将大于预设概率阈值的类别概率选取出来;
将选取出来的类别概率对应的对象标识确定为目标对象标识。
8.一种基于人工智能的目标识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取多个客户的第一维度数据,并基于所述第一维度数据识别所述多个客户之间的关联关系;
第二获取模块,用于获取多个产品的第二维度数据,并基于所述第二维度数据识别所述多个产品之间的标签关系;
第三获取模块,用于获取所述多个客户的第三维度数据,并基于所述第三维度数据识别对应的所述客户与预设企业之间的所属关系;
图谱建立模块,用于基于所述关联关系、所述标签关系及所述所属关系,建立以客户为节点的初始知识图谱;
权重优化模块,用于根据预设权重优化策略对所述初始知识图谱进行权重优化,得到目标知识图谱;
网络训练模块,用于基于所述目标知识图谱对图卷积神经网络进行训练;
目标输出模块,用于通过训练后的图卷积神经网络对多个待识别对象进行识别并输出目标对象标识。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于人工智能的目标识别方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于人工智能的目标识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111305664.5A CN113901236A (zh) | 2021-11-05 | 2021-11-05 | 基于人工智能的目标识别方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111305664.5A CN113901236A (zh) | 2021-11-05 | 2021-11-05 | 基于人工智能的目标识别方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113901236A true CN113901236A (zh) | 2022-01-07 |
Family
ID=79193632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111305664.5A Pending CN113901236A (zh) | 2021-11-05 | 2021-11-05 | 基于人工智能的目标识别方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113901236A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372732A (zh) * | 2022-03-22 | 2022-04-19 | 杭州杰牌传动科技有限公司 | 实现用户需求智能匹配的减速电机协同制造方法和系统 |
CN114491084A (zh) * | 2022-04-12 | 2022-05-13 | 平安科技(深圳)有限公司 | 基于自编码器的关系网络信息挖掘方法、装置及设备 |
CN115511396A (zh) * | 2022-11-22 | 2022-12-23 | 成都银光软件有限公司 | 基于数据分析的食品管理设备运行监控方法及系统 |
-
2021
- 2021-11-05 CN CN202111305664.5A patent/CN113901236A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372732A (zh) * | 2022-03-22 | 2022-04-19 | 杭州杰牌传动科技有限公司 | 实现用户需求智能匹配的减速电机协同制造方法和系统 |
CN114491084A (zh) * | 2022-04-12 | 2022-05-13 | 平安科技(深圳)有限公司 | 基于自编码器的关系网络信息挖掘方法、装置及设备 |
CN115511396A (zh) * | 2022-11-22 | 2022-12-23 | 成都银光软件有限公司 | 基于数据分析的食品管理设备运行监控方法及系统 |
CN115511396B (zh) * | 2022-11-22 | 2023-03-24 | 成都银光软件有限公司 | 基于数据分析的食品管理设备运行监控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113901236A (zh) | 基于人工智能的目标识别方法、装置、电子设备及介质 | |
WO2021218336A1 (zh) | 用户信息判别方法、装置、设备及计算机可读存储介质 | |
CN110263157B (zh) | 一种数据风险预测方法、装置及设备 | |
CN110674312B (zh) | 构建知识图谱方法、装置、介质及电子设备 | |
CN110995459B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN113435202A (zh) | 基于用户画像的产品推荐方法、装置、电子设备及介质 | |
CN113657495B (zh) | 基于概率预测模型的保险产品推荐方法、装置、设备 | |
CN110852785B (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN113592605B (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 | |
CN117114514B (zh) | 一种基于大数据的人才信息分析管理方法、系统及装置 | |
CN111652278A (zh) | 用户行为检测方法、装置、电子设备及介质 | |
CN113886691A (zh) | 基于历史数据的智能推荐方法、装置、电子设备及介质 | |
CN111984898A (zh) | 基于大数据的标签推送方法、装置、电子设备及存储介质 | |
CN111652282B (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN113362162A (zh) | 基于网络行为数据的风控识别方法、装置、电子设备及介质 | |
CN111651452A (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
CN114708073B (zh) | 一种围标串标智能检测方法、装置、电子设备及存储介质 | |
CN113420847B (zh) | 基于人工智能的目标对象匹配方法及相关设备 | |
CN115510219A (zh) | 话术推荐方法、装置、电子设备及存储介质 | |
CN115718807A (zh) | 人员关系分析方法、装置、设备及存储介质 | |
CN114996386A (zh) | 业务角色识别方法、装置、设备及存储介质 | |
CN112084408B (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 | |
CN114219367A (zh) | 用户评分方法、装置、设备及存储介质 | |
CN113449002A (zh) | 车辆推荐方法、装置、电子设备及存储介质 | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |