CN110135890A - 基于知识关系挖掘的产品数据推送方法及相关设备 - Google Patents

基于知识关系挖掘的产品数据推送方法及相关设备 Download PDF

Info

Publication number
CN110135890A
CN110135890A CN201910299400.XA CN201910299400A CN110135890A CN 110135890 A CN110135890 A CN 110135890A CN 201910299400 A CN201910299400 A CN 201910299400A CN 110135890 A CN110135890 A CN 110135890A
Authority
CN
China
Prior art keywords
user
community
node
address list
communication record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910299400.XA
Other languages
English (en)
Inventor
裴阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN201910299400.XA priority Critical patent/CN110135890A/zh
Publication of CN110135890A publication Critical patent/CN110135890A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/146Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及金融保险技术领域,尤其涉及一种基于知识关系挖掘的产品数据推送方法及相关设备。该方法包括:访问用户保单数据库,获取多项用户ID和用户通讯录,将用户通讯录进行标记后生成通讯录ID;从用户画像数据库中获取用户ID对应的用户画像,生成用户知识图谱;将用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;获取社区内所有节点的属性,筛选出共同特征最多的一项或多项,以共同特征对应的产品数据进行推送。本发明引入社区挖掘算法,将用户划分为多个社区,基于社区中的人员具有同质化特点,利用用户共同属性进行产品营销,提高保险营销效率。

Description

基于知识关系挖掘的产品数据推送方法及相关设备
技术领域
本发明涉及金融保险技术领域,尤其涉及一种基于知识关系挖掘的产品数据推送方法及相关设备。
背景技术
保险营销是以保险这一特殊商品为客体,以消费者对这一特殊商品的需求为导向,以满足消费者转嫁风险的需求为中心,运用整体营销或协同营销的手段,将保险商品转移给消费者,以实现保险公司长远经营目标的一系列活动。
现有的保险行业,在进行保险营销时,主要靠人工电话的方式对保险产品进行推荐。致使要求保险人员需要一定的专业性,进行保险营销之前,需要进行专业培训,其培训成本高,培训周期长,导致这种人工推荐保险的效率低。
发明内容
有鉴于此,有必要针对采用人工电话方式推荐保险产品效率低的问题,提供一种基于知识关系挖掘的产品数据推送方法及相关设备。
一种基于知识关系挖掘的产品数据推送方法,包括:
访问用户保单数据库,从所述用户保单数据库中查询历史保单数据,从所述历史保单数据中获取多项用户ID和用户通讯录,将所述用户通讯录进行标记后生成通讯录ID,一项所述用户ID对应至少一个通讯录ID;
从用户画像数据库中获取所述用户ID对应的用户画像,将所述用户画像定义为属性,将所述用户ID定义为实体,将所述通讯录ID定义为关系,生成用户知识图谱;
将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;
获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送。
一种可能的设计中,所述将所述用户通讯录进行标记后生成通讯录ID,包括:
将所述用户通讯录在预设的通讯录登记表进行查找,若所述通讯录登记表中含有所述用户通讯录,则获取所述用户通讯录对应的标记,将所述用户通讯录替换为所述标记,得到通讯录ID;
若所述通讯录登记表中未含有所述用户通讯录,则自动生成一区别所述通讯录登记表中所有标记的新的标记,将所述用户通讯录替换为所述标记,得到通讯录ID;
将所述用户ID、对应的用户通讯录及对应的新的所述标记记录在所述通讯录登记表中。
一种可能的设计中,所述将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区,包括:
将所述用户知识图谱中的每个实体定义为一个节点,将每个所述节点均定义为一个独立的社区;
对第i个节点分配到每个邻居节点所在的社区,调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,并记录ΔQ最大的邻居节点,如果maxΔQ>0,则把节点i分配ΔQ最大的所述邻居节点所在的社区,否则保持不变,重复本步骤,直到所有节点的所属社区不再变化;
将所有在同一个社区的节点定义为一个新的节点,不同所述社区间的边权重定义为新的所述节点间的边权重,重复上一步,直到新的所述节点的所属社区不再变化,即划分出了多个社区,每个所述社区中含有多个节点。
一种可能的设计中,所述调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,包括:
调用所述社区挖掘算法,所述社区挖掘算法为模块度算法,计算分配前的模块度Q和分配后的模块度Q,所述模块度变化ΔQ为:
ΔQ=|Qi-Qij|
其中,Qi为第i个节点分配到第j个邻居节点前的模块度Q的值,Qij为第i个节点分配到第j个邻居节点后的模块度Q的值;
所述模块度Q的计算公式如下:
其中,Aij表示节点i和节点j之间边的权重,当两个节点直接相连时,Aij=1,否则Aij=0;ki=∑jAij表示所有与节点i相连的边的权重之和;ci表示节点i所属的社区;表示所有边的权重之和,2m是整个网络的度,δ(μ,υ)判断节点μ、υ是否在同一个社区内,在同一个社区内δ(μ,υ)=1,否则δ(μ,υ)=0。
一种可能的设计中,所述调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,包括:
从保险营销数据库中获取预设的用户通话记录表,从所述用户通话记录表中获取所述用户知识图谱中所有通讯录ID对应的通话频次,将通话频次设置为通讯录ID对应的关系权重;
在进行所述模块度Q的计算时,将节点i和节点j之间边的权重Aij定义为当两个节点直接相连时,Aij=节点i和节点j之间的关系权重,否则Aij=0。
一种可能的设计中,所述获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送,包括:
依次将筛选出的一项或多项所述共同特征在预设的保险推送表进行查找,获取所述共同特征对应的产品数据及定价信息;
按所述共同特征从多到少将多个所述产品数据及对应的所述定价信息进行排序,调用推送模板,将排序后的多个所述产品数据及对应的所述定价信息填入所述推送模板中,形成产品推送文件;
获取所述社区内的所有节点的通讯录ID,根据所述通讯录ID获取对应的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给用户。
一种可能的设计中,所述获取所述社区内的所有节点的通讯录ID,根据所述通讯录ID获取对应的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给用户,包括:
将所述社区中的Aij从高到底进行排序,取前N个节点定义为种子用户;
根据所述通讯录ID获取所述种子用户的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给所述种子用户。
一种基于知识关系挖掘的产品数据推送装置,包括:
获取用户数据模块,用于访问用户保单数据库,从所述用户保单数据库中查询历史保单数据,从所述历史保单数据中获取多项用户ID和用户通讯录,将所述用户通讯录进行标记后生成通讯录ID,一项所述用户ID对应至少一个通讯录ID;
生成用户知识图谱模块,用于从用户画像数据库中获取所述用户ID对应的用户画像,将所述用户画像定义为属性,将所述用户ID定义为实体,将所述通讯录ID定义为关系,生成用户知识图谱;
挖掘社区模块,用于将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;
推送模块,用于获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述基于知识关系挖掘的产品数据推送方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述基于知识关系挖掘的产品数据推送方法的步骤。
上述基于知识关系挖掘的产品数据推送方法及相关设备,包括访问用户保单数据库,从所述用户保单数据库中查询历史保单数据,从所述历史保单数据中获取多项用户ID和用户通讯录,将所述用户通讯录进行标记后生成通讯录ID,一项所述用户ID对应至少一个通讯录ID;从用户画像数据库中获取所述用户ID对应的用户画像,将所述用户画像定义为属性,将所述用户ID定义为实体,将所述通讯录ID定义为关系,生成用户知识图谱;将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送。本发明引入社区挖掘算法,将用户划分为多个社区,基于社区中的人员具有同质化特点,利用用户共同属性进行产品营销,提高保险营销效率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明一个实施例中的基于知识关系挖掘的产品数据推送方法的流程图;
图2为本发明一个实施例中的用户知识图谱的结构图;
图3为本发明一个实施例中基于知识关系挖掘的产品数据推送装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
图1为本发明一个实施例中的基于知识关系挖掘的产品数据推送方法的流程图,如图1所示,一种基于知识关系挖掘的产品数据推送方法,包括以下步骤:
步骤S1,获取用户数据:访问用户保单数据库,从用户保单数据库中查询历史保单数据,从历史保单数据中获取多项用户ID和用户通讯录,将用户通讯录进行标记后生成通讯录ID,一项用户ID对应至少一个通讯录ID。
本步骤在访问用户保单数据库时,可以通过SQL语句直接连接数据库并查询数据,查询到的结果,通过文本的方式导出并保存到本地数据库中。从本地数据库中的历史保单数据中获取多项用户ID和对应的用户通讯录。历史保单数据一般包括用户ID、用户姓名、用户通讯录、保险品类等,且一个用户ID可能存在多个用户通讯录。
在一个实施例中,步骤S1,包括:
步骤S101,查找及标记:将用户通讯录在预设的通讯录登记表进行查找,若通讯录登记表中含有用户通讯录,则获取用户通讯录对应的标记,将用户通讯录替换为标记,得到通讯录ID。
本步骤的通讯录登记表预设在本地数据库中,通讯录登记表包括用户ID、用户姓名、用户通讯录、用户通讯录对应的标记等。在通讯录登记表中查找是否已经存在用户通讯录对应的标记,以便于相同的用户通讯录对应得到相同的通讯录ID,为后续生成用户知识图谱提供精确数据。
步骤S102,生成新的标记:若通讯录登记表中未含有用户通讯录,则自动生成一区别通讯录登记表中所有标记的新的标记,将用户通讯录替换为标记,得到通讯录ID。
在生成新的标记时,可以采用随机数发生器,生成预设长度以内的随机数,随机数的长度可以根据用户通讯录的数量自定义。将随机数与通讯录登记表中所有的标记进行比较,若通讯录登记表中含有此随机数,则重新生成一新的随机数,再次进行比较,直到通讯录登记表中未含有随机数,则认为此随机数是区别于通讯录登记表中所有标记的,将此随机数定义为新的标记。
步骤S103,记录新的标记:将用户ID、对应的用户通讯录及对应的新的标记记录在通讯录登记表中。
在步骤S102生成新的标记后,还将此新的标记及对应的用户通讯录、用户ID都添加到通讯录登记表中,实现相同的用户通讯录对应得到相同的通讯录ID的目的。
本实施例将用户通讯录与预设的通讯录登记表进行比对的方式,确保相同的用户通讯录生成相同的通讯录ID,不同的用户通讯录生成具有区别的通讯录ID,实现了通讯录ID的唯一性。通过本实施例得到的用户ID及对应的通讯录ID的数据格式如下表1所示:
用户ID 用户通讯录对应的通讯录ID
1001 1002,1004
1002 1003,1009
1003 1001,1005
1004 1002,1005
1005 100010,1003,1002
1006 10000,100010
1007 100000,10000
1008 100010,1007
1009 100081,1007
1010 12098,1001,1817,12223
表1
步骤S2,生成用户知识图谱:从用户画像数据库中获取用户ID对应的用户画像,将用户画像定义为属性,将用户ID定义为实体,将通讯录ID定义为关系,生成用户知识图谱。
用户画像数据库中预设有所有用户ID对应的用户画像,本步骤通过SQL语句直接连接用户画像数据库并查询用户ID对应的用户画像,将查询到的结果,通过文本的方式导出并保存到本地数据库中,从本地数据库中获取用户画像。
本步骤的用户知识图谱是一种以实体、属性及实体之间的关系来描述的知识体系,将实体与实体之间通过共同的关系来进行关联,且以图谱形式存储在图数据库中,本步骤的用户知识图谱是一种社区网络结构,它将用户ID定义为实体,通讯录ID定义为关系,用户画像定义为属性,以上表1为例,得到如图2所示的用户知识图谱,图2中省略了实体的属性。
步骤S3,挖掘多个社区:将用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区。
在用户知识图谱的数据网络结构中具有社区结构,即整个网络由若干个社区组成,社区之间的连接相对稀疏、社区内部的连接相对稠密。本步骤的社区挖掘算法是利用用户知识图谱中所蕴藏的信息,从复杂网络中解析出其模块化的社区结构。本步骤采用的社区挖掘算法可以采用Louvain算法,Louvain算法基于文章《Fast unfolding ofcommunities in large networks》,Louvain算法是基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度。
在一个实施例中,步骤S3,包括:
步骤S301,定义节点:将用户知识图谱中的每个实体定义为一个节点,将每个节点均定义为一个独立的社区。
本步骤通过上述定义后,此时社区网络中,社区的数目与节点的个数相同。
步骤S302,挖掘社区:对第i个节点分配到每个邻居节点所在的社区,调用社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,并记录ΔQ最大的邻居节点,如果maxΔQ>0,则把节点i分配ΔQ最大的邻居节点所在的社区,否则保持不变,重复本步骤,直到所有节点的所属社区不再变化。
本步骤中的社区挖掘算法为基于模块度的模块度算法,模块度变化ΔQ为:
ΔQ=|Qi-Qij|
其中,Qi为第i个节点分配到第j个邻居节点前的模块度Q的值,Qij为第i个节点分配到第j个邻居节点后的模块度Q的值;
模块度Q是评估一个社区网络划分好坏的度量方法,其物理含义是社区内节点的连边数与随机情况下的边数之差,取值范围是[_1/2,1)。模块度Q的计算公式如下:
其中,Aij表示节点i和节点j之间边的权重,当两个节点直接相连时,Aij=1,否则Aij=0;ki=∑jAij表示所有与节点i相连的边的权重之和;ci表示节点i所属的社区;表示所有边的权重之和,2m是整个网络的度,δ(μ,υ)判断节点μ、υ是否在同一个社区内,在同一个社区内δ(μ,υ)=1,否则δ(μ,υ)=0。
公式中节点j连接到任意一个节点的概率是由于节点i有ki的度数,因此在随机情况下节点i与j的边为则上述模块度Q的计算公式可以简化为:
其中,∑in表示社区c内的边的权重之和,∑tot表示与社区c内的节点相连的边的权重之和。
在一个实施例中,步骤S302,还包括:
步骤S30201,获取关系权重:从保险营销数据库中获取预设的用户通话记录表,从用户通话记录表中获取用户知识图谱中所有通讯录ID对应的通话频次,将通话频次设置为通讯录ID对应的关系权重。
通讯录ID对应用户通讯录,其对应关系可以从预设的通讯录登记表中获取。保险营销数据库中的用户通话记录表保存有所有用户通话记录,通过用户通话记录表中查找通讯录ID对应的通话频次,一次通话频次认定为两个节点之间关系的关系权重。
步骤S30202,定义边的权重:在进行模块度Q的计算时,将节点i和节点j之间边的权重Aij定义为当两个节点直接相连时,Aij=节点i和节点j之间的关系权重,否则Aij=0。
步骤S302中在计算模块度Q时,当两个节点具有相同关系,即直接连接时,默认Aij=1,否则Aij=0,而本步骤重新定义两个具有相同关系的节点的边的权重,其边的权重为步骤S30201得到的关系权重。
本实施例为了优化社区划分,还对用户知识图谱中的关系重新定义边的权重,以便于确定两个节点之间的关系的重要程度。
步骤S303,划分社区:将所有在同一个社区的节点定义为一个新的节点,不同社区间的边权重定义为新的节点间的边权重,重复上一步,直到新的节点的所属社区不再变化,即划分出了多个社区,每个社区中含有多个节点。
本步骤将在同一社区的节点进行压缩成一个新的节点,社区内节点之间的边的权重转化为新的节点的环的权重,社区间的边的权重转化为新的节点之间边的权重,将每个新的节点均定义为一个独立的社区,重复步骤S302,挖掘社区,直到整个用户知识图谱的模块度不再发生变化。
本实施例通过基于模块度的社区挖掘算法,能产生层次性的社区结构,挖掘和划分社区计算速度快,划分出的社区较为理想。
步骤S4,推送产品数据:获取社区内所有节点的属性,在所有节点的属性中,筛选出共同特征最多的一项或多项,以共同特征对应的产品数据进行推送。
本步骤中节点的属性,即为任一用户ID对应的用户画像,用户画像包含有多项特征,如身份特征、消费特征、兴趣爱好特征、社交特征。身份特征如年龄层、学历、婚姻状况、工作性质、风险偏好等,消费特征如主要消费内容、消费等级、消费渠道、信用等级等,社交特征如社交工具、社交活动等。
本步骤将在同一社区内的所有节点对应的属性进行筛选,筛选出共同特征最多的几项,例如在同一社区内,具有5个节点,每个节点的婚姻状况都是已婚,3个节点的工作性质为国企,4个节点的消费等级为一级,2个节点的社交工具为微博。则从5个节点的属性中筛选出共同特征最多的3项特征,分别为婚姻状况是已婚的婚姻状况特征、工作性质为国企的工作性质特征、消费等级为一级的消费等级特征,通过这些共同特征进行产品数据的推送。
在一个实施例中,步骤S4,包括:
步骤S401,筛选及查找:依次将筛选出的一项或多项共同特征在预设的保险推送表进行查找,获取共同特征对应的产品数据及定价信息。
本步骤在推送产品数据前,在本地数据库中预设保险推送表,此保险推送表中含有多项特征,每项特征对应至少一类保险产品数据,每类保险产品数据对应一种定价信息。在筛选出共同特征后,在保险推送表中查找此共同特征对应的保险产品数据和定价信息。
步骤S402,生成产品推送文件:按共同特征从多到少将多个产品数据及对应的定价信息进行排序,调用推送模板,将排序后的多个产品数据及对应的定价信息填入推送模板中,形成产品推送文件。
共同特征最多的产品数据认为是本社区中同质化的特点,因此将共同特征最多的排在最上面,如将步骤S4中婚姻状况特征、工作性质特征及消费等级特征进行排序,排序后是婚姻状况是已婚的婚姻状况特征、消费等级为一级的消费等级特征、工作性质为国企的工作性质特征。
本步骤的推送模板是预设在本地数据库中,推送模板的形式可以是文本格式、工作表形式或其他格式。本步骤将多个共同特征对应的产品数据及定价信息写入推送模板中,形成产品推送文件。
步骤S403,自动推送:获取社区内的所有节点的通讯录ID,根据通讯录ID获取对应的用户通讯录,将产品推送文件通过用户通讯录自动发送给用户。
一个社区内节点的通讯录ID即为节点的关系,可在用户知识图谱中直接获取。在获取用户通讯录时,可以通过预设的通讯录登记表进行查找。用户的通讯录不限于手机、邮件等。本步骤在获取到一个社团中所有用户通讯录后,还对此社团中的用户进行筛选,筛选方式为:
将社区中的Aij从高到底进行排序,取前N个节点定义为种子用户;根据通讯录ID获取种子用户的用户通讯录,将产品推送文件通过用户通讯录自动发送给种子用户。
Aij越高表示节点与其他邻居节点的紧密度更好,因此本步骤筛选Aij最高的几个节点作为种子用户,针对种子用户进行产品数据的推送。
本实施例通过筛选社区中节点的属性,获取多个节点中共同特征,以共同特征对应的产品数据进行推送,具有针对性营销,能大大提高产品推送的效率及后续的成单率。
本实施例基于知识关系挖掘的产品数据推送方法,通过对用户保单数据库中的历史保单数据获取用户通讯录,以用户通讯录确定用户之间的关联关系,生成用户知识图谱,此用户知识图谱的数据可靠。通过社区挖掘算法对用户知识图谱进行社区划分,确定多个社区。以社区为特定群体,以社区内多个节点的共同特征为数据,得到较为准确的产品数据进行推送,推送效率非常高。
在一个实施例中,提出了一种基于知识关系挖掘的产品数据推送装置,如图3所示,包括如下模块:
获取用户数据模块,用于访问用户保单数据库,从用户保单数据库中查询历史保单数据,从历史保单数据中获取多项用户ID和用户通讯录,将用户通讯录进行标记后生成通讯录ID,一项用户ID对应至少一个通讯录ID;
生成用户知识图谱模块,用于从用户画像数据库中获取用户ID对应的用户画像,将用户画像定义为属性,将用户ID定义为实体,将通讯录ID定义为关系,生成用户知识图谱;
挖掘社区模块,用于将用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;
推送模块,用于获取社区内所有节点的属性,在所有节点的属性中,筛选出共同特征最多的一项或多项,以共同特征对应的产品数据进行推送。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行计算机可读指令时实现上述各实施例的基于知识关系挖掘的产品数据推送方法中的步骤。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例的基于知识关系挖掘的产品数据推送方法中的步骤。其中,存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于知识关系挖掘的产品数据推送方法,其特征在于,包括:
访问用户保单数据库,从所述用户保单数据库中查询历史保单数据,从所述历史保单数据中获取多项用户ID和用户通讯录,将所述用户通讯录进行标记后生成通讯录ID,一项所述用户ID对应至少一个通讯录ID;
从用户画像数据库中获取所述用户ID对应的用户画像,将所述用户画像定义为属性,将所述用户ID定义为实体,将所述通讯录ID定义为关系,生成用户知识图谱;
将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;
获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送。
2.根据权利要求1所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述将所述用户通讯录进行标记后生成通讯录ID,包括:
将所述用户通讯录在预设的通讯录登记表进行查找,若所述通讯录登记表中含有所述用户通讯录,则获取所述用户通讯录对应的标记,将所述用户通讯录替换为所述标记,得到通讯录ID;
若所述通讯录登记表中未含有所述用户通讯录,则自动生成一区别所述通讯录登记表中所有标记的新的标记,将所述用户通讯录替换为所述标记,得到通讯录ID;
将所述用户ID、对应的用户通讯录及对应的新的所述标记记录在所述通讯录登记表中。
3.根据权利要求1所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区,包括:
将所述用户知识图谱中的每个实体定义为一个节点,将每个所述节点均定义为一个独立的社区;
对第i个节点分配到每个邻居节点所在的社区,调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,并记录ΔQ最大的邻居节点,如果maxΔQ>0,则把节点i分配ΔQ最大的所述邻居节点所在的社区,否则保持不变,重复本步骤,直到所有节点的所属社区不再变化;
将所有在同一个社区的节点定义为一个新的节点,不同所述社区间的边权重定义为新的所述节点间的边权重,重复上一步,直到新的所述节点的所属社区不再变化,即划分出了多个社区,每个所述社区中含有多个节点。
4.根据权利要求3所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,包括:
调用所述社区挖掘算法,所述社区挖掘算法为模块度算法,计算分配前的模块度Q和分配后的模块度Q,所述模块度变化ΔQ为:
ΔQ=|Qi-Qij|
其中,Qi为第i个节点分配到第j个邻居节点前的模块度Q的值,Qij为第i个节点分配到第j个邻居节点后的模块度Q的值;
所述模块度Q的计算公式如下:
其中,Aij表示节点i和节点j之间边的权重,当两个节点直接相连时,Aij=1,否则Aij=0;ki=∑jAij表示所有与节点i相连的边的权重之和;ci表示节点i所属的社区;表示所有边的权重之和,2m是整个网络的度,δ(μ,υ)判断节点μ、υ是否在同一个社区内,在同一个社区内δ(μ,υ)=1,否则δ(μ,υ)=0。
5.根据权利要求4所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述调用所述社区挖掘算法,计算分配前与分配后的模块度变化ΔQ,包括:
从保险营销数据库中获取预设的用户通话记录表,从所述用户通话记录表中获取所述用户知识图谱中所有通讯录ID对应的通话频次,将通话频次设置为通讯录ID对应的关系权重;
在进行所述模块度Q的计算时,将节点i和节点j之间边的权重Aij定义为当两个节点直接相连时,Aij=节点i和节点j之间的关系权重,否则Aij=0。
6.根据权利要求1所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送,包括:
依次将筛选出的一项或多项所述共同特征在预设的保险推送表进行查找,获取所述共同特征对应的产品数据及定价信息;
按所述共同特征从多到少将多个所述产品数据及对应的所述定价信息进行排序,调用推送模板,将排序后的多个所述产品数据及对应的所述定价信息填入所述推送模板中,形成产品推送文件;
获取所述社区内的所有节点的通讯录ID,根据所述通讯录ID获取对应的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给用户。
7.根据权利要求6所述的基于知识关系挖掘的产品数据推送方法,其特征在于,所述获取所述社区内的所有节点的通讯录ID,根据所述通讯录ID获取对应的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给用户,包括:
将所述社区中的Aij从高到底进行排序,取前N个节点定义为种子用户;
根据所述通讯录ID获取所述种子用户的用户通讯录,将所述产品推送文件通过所述用户通讯录自动发送给所述种子用户。
8.一种基于知识关系挖掘的产品数据推送装置,其特征在于,包括:
获取用户数据模块,用于访问用户保单数据库,从所述用户保单数据库中查询历史保单数据,从所述历史保单数据中获取多项用户ID和用户通讯录,将所述用户通讯录进行标记后生成通讯录ID,一项所述用户ID对应至少一个通讯录ID;
生成用户知识图谱模块,用于从用户画像数据库中获取所述用户ID对应的用户画像,将所述用户画像定义为属性,将所述用户ID定义为实体,将所述通讯录ID定义为关系,生成用户知识图谱;
挖掘社区模块,用于将所述用户知识图谱中的每个实体定义为一个节点,调用预设的社区挖掘算法,对多个节点进行社区划分,得到最佳的多个社区;
推送模块,用于获取所述社区内所有节点的属性,在所述所有节点的属性中,筛选出共同特征最多的一项或多项,以所述共同特征对应的产品数据进行推送。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述基于知识关系挖掘的产品数据推送方法的步骤。
10.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述基于知识关系挖掘的产品数据推送方法的步骤。
CN201910299400.XA 2019-04-15 2019-04-15 基于知识关系挖掘的产品数据推送方法及相关设备 Pending CN110135890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910299400.XA CN110135890A (zh) 2019-04-15 2019-04-15 基于知识关系挖掘的产品数据推送方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910299400.XA CN110135890A (zh) 2019-04-15 2019-04-15 基于知识关系挖掘的产品数据推送方法及相关设备

Publications (1)

Publication Number Publication Date
CN110135890A true CN110135890A (zh) 2019-08-16

Family

ID=67569660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910299400.XA Pending CN110135890A (zh) 2019-04-15 2019-04-15 基于知识关系挖掘的产品数据推送方法及相关设备

Country Status (1)

Country Link
CN (1) CN110135890A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503481A (zh) * 2019-08-26 2019-11-26 北京亚联之星信息技术有限公司 基于图论模型的目标用户确定方法及装置
CN110706118A (zh) * 2019-09-09 2020-01-17 中国平安财产保险股份有限公司 基于数据分析的风险案件筛选方法及相关设备
CN111125596A (zh) * 2019-12-11 2020-05-08 海南港澳资讯产业股份有限公司 一种基于金融资讯的短信形成方法
CN111835622A (zh) * 2020-07-10 2020-10-27 腾讯科技(深圳)有限公司 信息拦截方法、装置、计算机设备和存储介质
CN111986006A (zh) * 2020-09-02 2020-11-24 深圳壹账通智能科技有限公司 基于知识图谱的产品推荐方法、装置、计算机设备及存储介质
CN112463977A (zh) * 2020-10-22 2021-03-09 三盟科技股份有限公司 基于知识图谱的社区挖掘方法、系统、计算机及存储介质
CN112948469A (zh) * 2021-04-16 2021-06-11 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN112989059A (zh) * 2019-12-17 2021-06-18 中国移动通信集团浙江有限公司 潜在客户识别方法及装置、设备及可读计算机存储介质
WO2021175021A1 (zh) * 2020-03-06 2021-09-10 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN114168745A (zh) * 2021-11-30 2022-03-11 大连理工大学 面向环氧乙烷衍生品生产过程的知识图谱构建方法
CN115689066A (zh) * 2022-12-30 2023-02-03 湖南三湘银行股份有限公司 基于图数据算法的目标供应商风险预测方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295832A1 (en) * 2010-05-28 2011-12-01 International Business Machines Corporation Identifying Communities in an Information Network
WO2017211051A1 (zh) * 2016-06-06 2017-12-14 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法、服务器和存储介质
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
CN107909493A (zh) * 2017-12-04 2018-04-13 泰康保险集团股份有限公司 保单信息处理方法、装置、计算机设备和存储介质
CN108509551A (zh) * 2018-03-19 2018-09-07 西北大学 一种基于Spark环境下的微博网络关键用户挖掘系统及方法
CN108648094A (zh) * 2018-05-08 2018-10-12 阿里巴巴集团控股有限公司 一种社区发现方法、装置以及设备
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN109087140A (zh) * 2018-08-07 2018-12-25 广州航海学院 一种基于spark大数据的闭环目标客户识别方法
CN109299997A (zh) * 2018-09-03 2019-02-01 中国平安人寿保险股份有限公司 产品推荐方法、装置及计算机可读存储介质
CN109359199A (zh) * 2018-08-27 2019-02-19 平安科技(深圳)有限公司 基金经理社团划分方法、系统、计算机设备和存储介质
CN109428928A (zh) * 2017-08-31 2019-03-05 腾讯科技(深圳)有限公司 信息推送对象的选择方法、装置及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295832A1 (en) * 2010-05-28 2011-12-01 International Business Machines Corporation Identifying Communities in an Information Network
WO2017211051A1 (zh) * 2016-06-06 2017-12-14 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法、服务器和存储介质
CN109428928A (zh) * 2017-08-31 2019-03-05 腾讯科技(深圳)有限公司 信息推送对象的选择方法、装置及设备
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
CN107909493A (zh) * 2017-12-04 2018-04-13 泰康保险集团股份有限公司 保单信息处理方法、装置、计算机设备和存储介质
CN108509551A (zh) * 2018-03-19 2018-09-07 西北大学 一种基于Spark环境下的微博网络关键用户挖掘系统及方法
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108648094A (zh) * 2018-05-08 2018-10-12 阿里巴巴集团控股有限公司 一种社区发现方法、装置以及设备
CN109087140A (zh) * 2018-08-07 2018-12-25 广州航海学院 一种基于spark大数据的闭环目标客户识别方法
CN109359199A (zh) * 2018-08-27 2019-02-19 平安科技(深圳)有限公司 基金经理社团划分方法、系统、计算机设备和存储介质
CN109299997A (zh) * 2018-09-03 2019-02-01 中国平安人寿保险股份有限公司 产品推荐方法、装置及计算机可读存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503481A (zh) * 2019-08-26 2019-11-26 北京亚联之星信息技术有限公司 基于图论模型的目标用户确定方法及装置
CN110706118A (zh) * 2019-09-09 2020-01-17 中国平安财产保险股份有限公司 基于数据分析的风险案件筛选方法及相关设备
CN110706118B (zh) * 2019-09-09 2023-08-01 中国平安财产保险股份有限公司 基于数据分析的风险案件筛选方法及相关设备
CN111125596A (zh) * 2019-12-11 2020-05-08 海南港澳资讯产业股份有限公司 一种基于金融资讯的短信形成方法
CN112989059A (zh) * 2019-12-17 2021-06-18 中国移动通信集团浙江有限公司 潜在客户识别方法及装置、设备及可读计算机存储介质
WO2021175021A1 (zh) * 2020-03-06 2021-09-10 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN111835622B (zh) * 2020-07-10 2023-07-07 腾讯科技(深圳)有限公司 信息拦截方法、装置、计算机设备和存储介质
CN111835622A (zh) * 2020-07-10 2020-10-27 腾讯科技(深圳)有限公司 信息拦截方法、装置、计算机设备和存储介质
CN111986006A (zh) * 2020-09-02 2020-11-24 深圳壹账通智能科技有限公司 基于知识图谱的产品推荐方法、装置、计算机设备及存储介质
CN112463977A (zh) * 2020-10-22 2021-03-09 三盟科技股份有限公司 基于知识图谱的社区挖掘方法、系统、计算机及存储介质
CN112948469A (zh) * 2021-04-16 2021-06-11 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN112948469B (zh) * 2021-04-16 2023-10-13 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN114168745B (zh) * 2021-11-30 2022-08-09 大连理工大学 面向环氧乙烷衍生品生产过程的知识图谱构建方法
CN114168745A (zh) * 2021-11-30 2022-03-11 大连理工大学 面向环氧乙烷衍生品生产过程的知识图谱构建方法
CN115689066A (zh) * 2022-12-30 2023-02-03 湖南三湘银行股份有限公司 基于图数据算法的目标供应商风险预测方法及装置

Similar Documents

Publication Publication Date Title
CN110135890A (zh) 基于知识关系挖掘的产品数据推送方法及相关设备
CN108920716B (zh) 基于知识图谱的数据检索与可视化系统及方法
CN100504866C (zh) 一种综合搜索结果的排序系统及方法
JP5560367B2 (ja) ネットワーク内の友人の動的情報を管理するための方法、システムおよびサーバ
CN102402605B (zh) 用于搜索引擎索引的混合分布模型
CN101119326B (zh) 一种即时通信会话记录的管理方法及装置
CN105740333A (zh) 一种可视化的广告管理平台和实现方法
CN109582849A (zh) 一种基于知识图谱的网络资源智能检索方法
JP2009099124A (ja) データ構築方法とシステム
CN107229718A (zh) 处理报表数据的方法和装置
CN104778237A (zh) 一种基于关键用户的个性化推荐方法和系统
CN110851663B (zh) 管理元数据的方法和装置
Manley et al. New forms of data for understanding urban activity in developing countries
CN105786810B (zh) 类目映射关系的建立方法与装置
CN104462095B (zh) 一种查询语句公共部分的提取方法及装置
CN108985567B (zh) 基于自定义指标标签动态生成指标分析标签的方法和系统
CN104408189A (zh) 关键词排名的展示方法和装置
CN111190965A (zh) 基于文本数据的即席关系分析系统及方法
CN108319626B (zh) 一种基于名称信息的对象分类方法与设备
CN110633267B (zh) 一种可支持多业务行使报表功能的方法及系统
CN106611339B (zh) 种子用户筛选方法、产品的用户影响力评价方法及装置
KR102138967B1 (ko) 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법
CN106775694A (zh) 一种软件配置代码制品的层次分类方法
CN106126739A (zh) 一种处理业务关联数据的装置
CN109902148A (zh) 一种通讯录联系人的企业名称自动补全的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination