CN108647301A

CN108647301A - 一种用户关系网的创建方法及终端设备

Info

Publication number: CN108647301A
Application number: CN201810436180.6A
Authority: CN
Inventors: 任钢林
Original assignee: Ping An Puhui Enterprise Management Co Ltd
Current assignee: Ping An Puhui Enterprise Management Co Ltd
Priority date: 2018-05-09
Filing date: 2018-05-09
Publication date: 2018-10-12

Abstract

本发明适用于计算机技术领域，提供了一种用户关系网的创建方法及终端设备，包括：获取用户数据库中各个用户的用户信息；将用户信息与预设的关键词字典内的各个关键词进行匹配，得到用户的关键词序列；根据各个用户的关键词序列分别计算各个用户之间的匹配度，并识别匹配度大于关联阈值的两个用户互为关联用户；基于各个用户的关联用户，创建用户数据库的用户关系网。本发明将用户信息与关键词进行匹配得到关键词序列，由于关键词与用户信息相比，数据量较少，更能够提取用户信息中的关键内容，并基于两个用户之间是否存在相同的关键内容，从而判定两个用户之间是否存在关联关系，提高了关联用户识别的准确性，从而提高了用户关系网的准确率。

Description

一种用户关系网的创建方法及终端设备

技术领域

本发明属于计算机技术领域，尤其涉及一种用户关系网的创建方法及其设备。

背景技术

用户关系网，作为对用户的信用评级以及风险评估时的常用手段，其准确性将直接影响评级以及评估的准确性。现有的用户关系网的建立技术，一般是采集用户的多项信息，与其客户对应的信息进行匹配，根据相同的信息的数量，来确定两者是否为关联客户。然而上述方式中，需要用户信息完全相同才认为匹配，但某些信息可能因为表达问题，或本身两个信息主体相同，只是部分信息不相同，却认为两个用户信息不关联，从而忽略了大部分实际存在关联关系，降低了关系网建立的准确性。

发明内容

有鉴于此，本发明实施例提供了一种用户关系网的创建方法及其设备，以解决现有的用户关系网的创建方法，忽略了大部分实际存在关联关系，准确率低问题。

本发明实施例的第一方面提供了一种用户关系网的创建方法，包括：

获取用户数据库中各个用户的用户信息；

将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列；

根据各个用户的关键词序列分别计算各个所述用户之间的匹配度，并识别所述匹配度大于关联阈值的两个用户互为关联用户；

基于各个所述用户的关联用户，创建所述用户数据库的用户关系网。

本发明实施例的第二方面提供了一种用户关系网的创建设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取用户数据库中各个用户的用户信息；

本发明实施例的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取用户数据库中各个用户的用户信息；

实施本发明实施例提供的一种用户关系网的创建方法及终端设备具有以下有益效果：

本发明实施例通过获取各个用户的用户信息，并将该用户信息与关键词字典中的各个关键词进行匹配，得到该用户对应的关键词序列，并基于各个用户的关键词序列，确定各个用户之间的匹配度，继而选取匹配度大于预设的关联阈值的用户作为关联用户，生成用户关系网。与现有的用户关系网的创建方法相比，本发明实施例不再根据用户信息是否相同确定两个用户是否关联，而是先将用户信息与关键词进行匹配得到关键词序列，由于关键词与用户信息相比，数据量较少，更能够提取用户信息中的关键内容，并基于两个用户之间是否存在相同的关键内容，从而判定两个用户之间是否存在关联关系，提高了关联用户识别的准确性，从而提高了用户关系网的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种用户关系网的创建方法的实现流程图；

图2是本发明第一实施例提供的一种用户关系网示意图；

图3是本发明第二实施例提供的一种用户关系网的创建方法S102具体实现流程图；

图4是本发明第三实施例提供的一种用户关系网的创建方法S102以及S103具体实现流程图；

图5是本发明第四实施例提供的一种用户关系网的创建方法具体实现流程图；

图6是本发明第四实施例提供的一种用户关系网的创建方法具体实现流程图；

图7是本发明一实施例提供的一种用户关系网的创建设备的结构框图；

图8是本发明另一实施例提供的一种用户关系网的创建设备的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例通过获取各个用户的用户信息，并将该用户信息与关键词字典中的各个关键词进行匹配，得到该用户对应的关键词序列，并基于各个用户的关键词序列，确定各个用户之间的匹配度，继而选取匹配度大于预设的关联阈值的用户作为关联用户，生成用户关系网，解决了现有的用户关系网的创建方法，忽略了大部分实际存在关联关系，准确率低问题。

在本发明实施例中，流程的执行主体为用户关系网的创建设备。该用户关系网的创建设备包括但不限于：笔记本电脑、计算机、服务器等终端设备。需要强调的是，该用户关系网的创建设备记录有各个用户的用户信息，上述用户信息可以存储于本地的存储单元中，也可以从一外设的用户数据库服务器中获取得到。图1示出了本发明第一实施例提供的用户关系网的创建方法的实现流程图，详述如下：

在S101中，获取用户数据库中各个用户的用户信息。

在本实施例中，用户数据库可以存储于用户关系网的创建设备的本地存储器内，在该情况下，创建设备可以直接读取本地存储器的数据，即可获得各个用户的用户信息；用户数据库还可以存储于外设的用户数据库服务器内，在该情况下，创建设备会向该用户数据库服务器获取数据读取指令，当数据库服务器接收到该数据读取指令，则会向该创建设备返回所需用户的用户信息。

在本实施例中，用户数据库中存储的用户可以为主动录入的合法用户，在该情况下，创建设备为某一应用程序的服务器，用户通过本地终端安装的客户端登录该服务器之前，需要录入相关的信息成为合法用户后才能够成为通过客户端发起相关的业务请求。创建设备会将获取得到的各个合法用户的用户信息存储到该用户数据库中。

可选地，用户数据库中包含的用户可以为通过交易渠道或采集图像等方式采集得到。例如，某一用户通过银行卡购买隶属于用户关系网的创建设备的产品，在该情况下，创建设备会向银行卡对应的金融机构发出用户信息获取请求，然后该金融机构的数据库会将该用户信息返回给创建设备，从而完成用户信息的采集。又例如，某一用户进入该用户关系网的创建设备的管辖区域，该管辖区域内设置有分布式摄像终端，通过分布式摄像终端采集进入该管辖区域的用户的图像，并通过用户信息提取算法提取该用户的图像中表征的用户信息，并将该用户信息与用户数据库中已存储的用户信息进行比对，判断是否已经存储了该用户的用户信息，对于为存储的用户信息则予以保存，从而实现对用户数据库扩充的目的。

在S102中，将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列。

在本实施例中，创建设备存储有一关键词字典，该关键词字典包含多个关键词，每个关键词以固定的顺序依次排列，即每个关键词在关键词字典中有一固定的字典编号。因此，将不同的用户信息与关键词字典进行匹配，得到的关键词序列中相同位置的元素所对应的关键词是相同的。

在本实施例中，创建设备会将用户信息与该关键词字典中的各个关键词进行匹配，判断该用户信息中是否包含该关键词。若包含该关键词，则在关键词序列中对应位置的元素中填入该关键词，从而输出的关键词序列则表示该用户信息中包含了那些关键词。由于关键词匹配相对于用户信息匹配而言，精确度较高，能够确定该用户信息中包含的关键信息有哪些，继而将两个用户信息中包含的关键信息的个数进行比对，确定两个用户信息是否为存在关联，从而确定两个用户是否为关联用户。举例性地，某一用户的用户信息为“深圳市南山区海岸集团大厦16楼”，通过关键词字典后识别得到的关键词序列为：{深圳、南山、海岸、集团、16}；而另一用户的用户信息为“深圳市福田区海岸集团大楼5楼”，通过关键词匹配后得到的关键词序列为：{深圳、福田、海岸、集团、5}，由此可见，两个用户信息相同的关键词的个数为3个，可以识别两个用户信息为关联的用户信息。

可选地，该关键词字典可以从上位服务器中获取得到，上位服务器会定时更新该关键词字典。随着社会的不断发展，常常会出现新兴词语，因此关键词字典需要定时进行更新，从而提高对用户信息中关键词识别的准确性。

在S103中，根据各个用户的关键词序列分别计算各个所述用户之间的匹配度，并识别所述匹配度大于关联阈值的两个用户互为关联用户。

在本实施例中，确定了各个用户所对应的关键词序列后，可以基于关键词序列计算各个关键词序列之间的匹配度，继而根据各个用户之间的匹配度确定两个用户之间是否为关联用户。需要说明的是，创建设备会将所有用户两两进行组合，计算所有用户对之间的匹配度，若用户数据库中用户的个数为n，n为大于2的正整数，则组合得到的用户对的个数为

在本实施例中，该关联阈值可以为关键词序列中相同关键词的个数，在该情况下，创建设备会统计任意两个关键词序列中相同关键词的个数，将该个数作为两个用户之间的匹配度，若该两个用户之间的相同关键词的个数大于预设的关联阈值，则识别两个用户互为关联用户；反之，若该相同关键词的个数小于预设的关联阈值，则识别两个用户为无关用户。该关联阈值还可以为一相似度阈值，在该情况下，创建设备会计算两个关键词序列的相似度，即相同位置的元素是否相同，计算公式可以为其中，S为相同元素的个数，Q为元素的总个数，从而得到两个关键词序列之间的相似度，并将该相似度与相似度阈值进行比对，确定两个用户之间是否为关联用户。优选地，在确定两个关键词序列是否相似时，除了判定相同位置的元素是否相同外，还可以判定相同位置的元素是否相似，创建设备记录了与各个关键词关联的模糊关键词，例如“太阳”与“日”两个关键词由于指代的实物均相同，因此可以识别两个关键词之间具有关联性，并识别相同位置具有关键关系的关键词为相似关键词，在计算相似度时，除了考虑相同关键词个数外，还会考虑相似关键词的个数，在该情况下，计算相似度的公式可以为：

其中，a₁、a₂为加权系数，Y为两个关键词序列之间的相似度；S为相同位置的元素也相同的个数；Sl为相同位置的元素相似的个数；Q为关键词序列中元素的总个数。

在S104中，基于各个所述用户的关联用户，创建所述用户数据库的用户关系网。

在本实施例中，创建设备在确定各个用户之间的匹配度后，会基于关联阈值识别得到关联用户，并统计各个用户的关联用户，建立关联用户对应关系列表，该对应关系列表中包含两列，第一列记录了中心用户，第二列记录了与该中心用户的关联用户，即该关联用户对应关系列表中每一行可创建一个以中心用户为中心的星型用户关系图。举例性地，该关联用户对应关系列表可以如表1所示。

中心用户	关联用户
		用户A	用户B、用户D、用户F、用户G
用户B	用户A、用户C、用户D、用户X、用户Z
		用户C	用户B、用户D、用户X
用户D	用户A、用户B、用户C

表1

在本实施例中，创建设备会基于各个用户的关联用户，建立关于该用户数据库中所有用户的用户关系网，在该用户关系网中每个用户为一个用户节点，若某两个用户之间为关联用户，则两个用户节点之间会创建一条关联线段，用于表示关联关系，从而通过所有用户之间的关联关系，可以绘制出一幅多个用户节点之间相互连接的用户关系网，举例性地，图2示出了本发明实施例提供的用户关系网示意图。

可选地，在本实施例中，用户数据库包含的用户除了有正常用户之外，还有存在异常交易情况的异常用户，从而创建设备可以根据该用户关系网确定与异常用户存在关联的正常用户，作为风险用户，能够进一步对风险用户进行风险规避操作，避免使风险用户转变为异常用户，对企业造成经济损失。

以上可以看出，本发明实施例提供的一种用户关系网的创建方法通过获取各个用户的用户信息，并将该用户信息与关键词字典中的各个关键词进行匹配，得到该用户对应的关键词序列，并基于各个用户的关键词序列，确定各个用户之间的匹配度，继而选取匹配度大于预设的关联阈值的用户作为关联用户，生成用户关系网。与现有的用户关系网的创建方法相比，本发明实施例不再根据用户信息是否相同确定两个用户是否关联，而是先将用户信息与关键词进行匹配得到关键词序列，由于关键词与用户信息相比，数据量较少，更能够提取用户信息中的关键内容，并基于两个用户之间是否存在相同的关键内容，从而判定两个用户之间是否存在关联关系，提高了关联用户识别的准确性，从而提高了用户关系网的准确率。

图3示出了本发明第二实施例提供的一种用户关系网的创建方法S102的具体实现流程图。参见图3所示，相对于图1所述实施例，本实施例提供的一种用户关系网的创建方法中S102包括S1021～S1025，具体详述如下：

在S1021中，初始化所述关键词序列，所述关键词序列中的每个元素依序分别对应所述关键词字典中的一个关键词。

在本实施例中，用户关系网的创建设备在确定用户信息所对应的关键词序列之前，会初始化关键词序列，以使该关键词序列中元素的个数与关键词字典的个数相同，且关键词序列中每一个元素分别对应关键词字典中的一个关键词。具体地，关键词序列中第N个元素对应关键词字典中第N个关键词，即某一元素与其对应的关键词的序号是相同的。

在本实施例中，创建设备初始化关键词序列的过程具体为：读取关键词字典中关键词的个数，并创建一个包含相同个数元素的序列，且该序列中各个元素并未赋值，等待匹配完成后，根据用户信息中是否存在某一关键词从而确定该关键词对应元素所赋的位值。

在S1022中，根据各个关键词在所述关键词字典中的次序，依次判断所述用户信息中是否包含各个关键词。

在本实施例中，创建设备会根据各个关键词在关键词字典中的次序，依次识别该用户信息中是否包含各个关键词，基于识别结果判断是执行S1023的操作，还是执行S1024的操作。若该用户信息中包含该关键词，则执行S1023的操作；反之，若该用户信息中不包含该关键词，则执行S1024的操作。

可选地，在本实施例中，除了可以判断该用户信息中是否包含该关键词外，还可以判断该用户信息是否包含与该关键词相关的模糊关键词。其中，模糊关键词的定义可参见S103的相关描述，在此不再赘述。需要说明的是，在S1022中，除了与关键词相近的近义词可以作为模糊关键词外，关键词的同音词或形近词也可以作为模糊关键词。由于部分用户在输入用户信息时，可能将打错了部分文字，打成同音字或形近字，因此可以将上述两类词语作为关键词的模糊关键词，作为判定是否包含关键词的依据。

在S1023中，若所述关键词字典中的关键词被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第一位值。

在本实施例中，创建设备确定了用户信息包含关键词字典中的某一关键词，则获取该关键词所对应的序号，并基于该序号在关键词序列中确定与之对应的元素，并将该元素设置为第一位值，例如用位值“1”表示包含该关键词，因此创建设备可以提取该关键词序列中为第一位值的元素的序号，查询关键词字典，即可确定该用户信息中包含哪些关键词，由于位值相对于关键词而言，数据量较少，从而减少了关键词序列的数据量大小，从而能够提高关键词序列的存储效率。

在S1024中，若所述关键词字典中的关键词不被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第二位值。

在本实施例中，创建设备确定了用户信息不包含关键词字典中的某一关键词，则获取该关键词所对应的序号，并基于该序号在关键词序列中确定与之对应的元素，并将该元素设置为第二位值，例如用位值“0”表示包含该关键词。

在S1025中，基于各个所述元素的位值生成所述用户的关键词序列。

在本实施例中，创建设备在对关键词字典中各个关键词进行识别之后，则可根据各个元素所对应的位值以及其对应的元素序号，生成该用户信息所对应的关键词序列。

例如，该关键词字典中包含6个关键词{深圳、福田、海岸、6、银行、男}，若包含某一关键词则用位值“1”表示，若不包含某一关键词则用位置“0”表示，用户A的用户信息为“深圳市南山区海岸大厦9楼中国银行女性”，用户B的用户信息为“广州市越秀区海岸大厦6楼交通银行男性”，则对于用户A的用户信息而言，匹配得到的关键词序列为：101010，而对于用户B的用户信息经过匹配之后，得到的关键词序列为：001111。基于上述两个关键词序列，可以确定两个用户信息之间的匹配度，从而判定两个用户是否为关联用户。

在本发明实施例中，通过将关键字字典中的各个关键词与用户信息进行包含性识别，得到由第一位值以及第二位值构成的关键词序列，不仅能够减少关键词序列的数据量大小，还能够快速确定两个用户之间的匹配度，提高了关联用户识别的效率。

图4示出了本发明第三实施例提供的一种用户关系网的创建方法S102以及S103的具体实现流程图。参见图4所示，相对于图1所述实施例，本实施例提供的一种用户关系网的创建方法S102包括S401以及S402，S103包括S403以及S404，具体详述如下：

进一步地，作为本发明另一实施例，所述用户信息包含多个信息项目；所述将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列，包括：

在S401中，分别将所述用户信息中的各个所述信息项目与关键词字典内的各个关键词进行匹配，得到各个所述信息项目的关键词子序列。

在本实施例中，用户信息包含多个信息项目，不同的信息项目用于记录该用户不同类型的用户信息。举例性地，用户信息包含：性别、电话号码、住所、工作地点、所在单位、配偶关系6项信息项目，分别记录该用户在各个维度的对应的用户资料，因此创建设备会为每个信息项目确定对应的关键词子序列，从而通过关键词子序列构建该用户所对应的关键词序列。

可选地，在本实施例中，在确定不同信息项目的关键词子序列时，创建设备会查询该信息项目的关键词字典，即创建设备会为每个关键词序列生成与之对应的关键词列表。由于某些关键词只会出现在某些信息项目中，而必然不会出现在部分信息项目，例如对于关键词“深圳”与“广州”，上述两个关键词属于地理位置的关键词，则必然不会出现在“性别”、“配偶关系”以及“电话号码”这三项信息项目内。因此，为了避免单个关键词字典的数据量过大并且在确定关键词序列时进行过多无效的匹配操作，创建设备会为不同的信息项目确定与之对应的关键词字典，从而提高了关键词序列的生成效率。

在S402中，基于各个所述关键词子序列，确定所述用户的关键词序列。

在本实施例中，创建设备在对各个信息项目进行匹配操作后，得到各个信息项目的关键词子序列，继而将各个关键词子序列进行组合，构建该用户所对应的关键词序列。具体地，关键词序列可以为一矩阵，该矩阵中每一行所构成的序列即为各个信息项目的关键词子序列；创建设备还可以将各个关键词子序列根据信息项目的顺序依次拼接，在每一个关键词子序列之间通过一个分割标识符来进行区分，从而得到该用户的关键词序列。

进一步地，所述根据各个用户的关键词序列分别计算各个所述用户之间的匹配度，并识别所述匹配度大于关联阈值的两个用户互为关联用户，包括：

在S403中，基于所述关键词子序列，分别计算各个所述用户对应的信息项目之间的相似度。

在本实施例中，创建设备在确定了各个信息项目的关键词子序列后，在计算各个用户之间的匹配度之前，会计算各个用户对应信息项目之间关键词子序列的相似度。例如，在计算用户A和用户B之间的匹配度时，会计算用户A的居住地的关键词子序列与用户B的居住地的关键词子序列之间的相似度，然后在计算用户A工作单位的关键词子序列与用户B工作单位的关键词子序列之间的相似度，直到计算了两个用户之间所有信息项目之间的相似度，则执行S404的相关操作。

在本实施例中，计算两个关键词子序列的相似度的具体方式可以为：统计两个关键词子序列相同关键词的第一个数，并计算第一个数与关键词序列总的元素个数之间的比值，作为两个关键词子序列之间的相似度。若部分用户某些信息项目缺失，则识别关于该信息项目的相似度为0。

在S404中，将各个所述信息项目的相似度导入到匹配度转换模型，计算所述匹配度；所述匹配度转换模型具体为：

其中，Q为所述匹配度；B_k为任意两个所述用户的第k个所述项目信息之间的相似度；α_k为第k个所述项目信息的匹配权重；n为项目信息的个数。

在本实施例中，创建设备将各个信息项目所对应的相似度导入到预设的匹配度转换模型内，该匹配转换模型定义了不同信息项在计算匹配度时所占的匹配权重，创建设备会根据各个匹配权重以及对应信息项目的相似度，计算两个用户之间的匹配度。

在本实施例中，匹配权重可以从上位机服务器中下载得到，还可以有用户根据实际场景的需求，调整不同信息项目的匹配权重。当然，若用户需要忽略部分信息项目对于匹配度计算的影响，可以设置该类的信息项目的匹配权重为0，从而不考虑该部分信息项目对于用户关联判定的影响。

在本发明实施例中，通过分类计算不同信息项目之间的相似度，并基于多个信息项目确定两个用户之间的匹配度，从而提高了关联用户识别的准确性。

图5示出了本发明第四实施例提供的一种用户关系网的创建方法的具体实现流程图。参见图5所示，相对于图1～图4所述实施例，本实施例提供的一种用户关系网的创建方法在所述基于各个所述用户的关联用户，创建所述用户数据库的用户关系网之后，还包括：S501以及S502，具体详述如下：

在S501中，若接收到新增用户添加指令，则在所述用户关系网中创建一个新增用户节点。

在本实施例中，创建设备在建立了用户关系网之后，检测到用户数据库中添加入新的用户信息，或者接收到新增用户添加指令，则会执行S501的相关操作，对已建立的用户关系网进行更新。

在本实施例中，创建设备会在用户关系网中创建一个用户节点，当然，若新增用户添加指令中包含多个所需添加的用户信息，则会创建与添加的用户信息数量相同的用户节点，每个用户节点对应一个用户信息。可选地，创建设备可以将用户信息导入到该用户节点内，从而管理员可以通过该用户关系网快速提取各个用户的用户信息。

在S502中，连接所述新增用户节点以及该新增用户节点对应的关联用户的节点，更新所述用户关系网。

在本实施例中，创建设备可以根据S102以及S103的相关操作步骤，确定与该新增用户所关联的已存储用户，并从用户关系网中定位所关联的已存储用户的用户节点，与该新增用户节点建立连接，实现对用户关系网的更新操作。

在本实施例中，确定新增用户对应的关联用户的方式具体为：将该新增用户的用户信息与关键词字典中各个关键词进行匹配，确定该新增用户所对应的关键词序列，并将新增用户的关键词序列与各个已存储用户的关键词序列进行匹配，选取匹配度高于关联阈值的已存储用户作为该新增用户的关联用户，完成关联用户的识别操作。

在本发明实施例中，在接收到新增用户添加指令后，只需确定该新增用户所关联的关联用户，即可对用户关系网进行更新，无需重新对所有用户进行关联性识别，提高了用户关系网的更新效率。

图6示出了本发明第五实施例提供的一种用户关系网的创建方法的具体实现流程图。参见图6所示，相对于图1所述实施例，本实施例提供的一种用户关系网的创建方法所述用户关系网的创建方法，还包括：S601以及S602，具体详述如下：

在S601中，将所述用户信息进行分词处理，得到多个候选关键词。

在本实施例中，创建设备会对用户数据库中的用户信息进行分词处理，将用户信息划分为多个候选关键词。需要说明的是，若用户信息中某几个文字可以组合成两个或以上的词语，则可生成多个候选关键词，例如：用户信息中包含“海岸大厦”这四个文字，而“海岸”、“大厦”以及“海岸大厦”均可以作为三个独立的词语，则得到生成3个候选关键词。

在本实施例中，进行分词处理的算法具体为语义分词算法，创建设备会先对用户信息进行语义分析，将连续且具有明确含义的字符串作为一个词组，并提取出来作为一个候选关键词。

在S602中，若所述关键词字典中不存在所述候选关键词，则将所述候选关键词添加到所述关键词字典内。

在本实施例中，创建设备根据用户信息得到的多个候选关键词与关键词字典中已存储的各个关键词进行匹配，确定该关键词字典中是否已经存储了该候选关键词，若已经存在与候选关键词相同的关键词，则将该候选关键词进行丢弃，不予以保存；反之，若该关键词词典中并未存储该候选关键词，则将该候选关键词添加到关键词字典中，并为新增的关键词设置一个字典编号。

在本发明实施例中，关键词字典的扩展可以通过采集得到的用户信息完成，无需管理员手动更新关键词字典，进一步提高了关键词字典的扩展效率，从而提高了关联用户的识别效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

图7示出了本发明一实施例提供的一种用户关系网的创建设备的结构框图，该用户关系网的创建设备包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。

参见图7，所述用户关系网的创建设备包括：

用户信息获取单元71，用于获取用户数据库中各个用户的用户信息；

关键词序列获取单元72，用于将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列；

关联用户确定单元73，用于根据各个用户的关键词序列分别计算各个所述用户之间的匹配度，并识别所述匹配度大于关联阈值的两个用户互为关联用户；

用户关系网创建单元74，用于基于各个所述用户的关联用户，创建所述用户数据库的用户关系网。

可选地，关键词序列获取单元72包括：

关键词序列初始化单元，用于初始化所述关键词序列，所述关键词序列中的每个元素依序分别对应所述关键词字典中的一个关键词；

关键词识别单元，用于根据各个关键词在所述关键词字典中的次序，依次判断所述用户信息中是否包含各个关键词；

第一赋值单元，用于若所述关键词字典中的关键词被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第一位值；

第二赋值单元，用于若所述关键词字典中的关键词不被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第二位值；

关键词序列生成单元，用于基于各个所述元素的位值生成所述用户的关键词序列。

可选地，所述用户信息包含多个信息项目；所述关键词序列获取单元72包括：

关键词子序列确定单元，用于分别将所述用户信息中的各个所述信息项目与关键词字典内的各个关键词进行匹配，得到各个所述信息项目的关键词子序列；

关键词子序列组合单元，用于基于各个所述关键词子序列，确定所述用户的关键词序列；

所述关联用户确定单元73包括：

相似度计算单元，用于基于所述关键词子序列，分别计算各个所述用户对应的信息项目之间的相似度；

匹配度转换单元，用于将各个所述信息项目的相似度导入到匹配度转换模型，计算所述匹配度；所述匹配度转换模型具体为：

其中，Q为所述匹配度；B_k为任意两个所述用户的第k个所述项目信息之间的相似度；α_k为第k个所述项目信息之间的匹配权重；n为项目信息的个数。

可选地，用户关系网的创建设备还包括：

用户节点创建单元，用于若接收到新增用户添加指令，则在所述用户关系网中创建一个新增用户节点；

用户关系网更新单元，用于连接所述新增用户节点以及该新增用户节点对应的关联用户的节点，更新所述用户关系网。

可选地，用户关系网的创建设备还包括：

候选关键词获取单元，用于将所述用户信息进行分词处理，得到多个候选关键词；

关键词添加单元，用于若所述关键词字典中不存在所述候选关键词，则将所述候选关键词添加到所述关键词字典内。

因此，本发明实施例提供的用户关系网的创建设备不再根据用户信息是否相同确定两个用户是否关联，而是先将用户信息与关键词进行匹配得到关键词序列，由于关键词与用户信息相比，数据量较少，更能够提取用户信息中的关键内容，并基于两个用户之间是否存在相同的关键内容，从而判定两个用户之间是否存在关联关系，提高了关联用户识别的准确性，从而提高了用户关系网的准确率。

图8是本发明另一实施例提供的一种用户关系网的创建设备的示意图。如图8所示，该实施例的用户关系网的创建设备8包括：处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82，例如用户关系网的创建程序。所述处理器80执行所述计算机程序82时实现上述各个用户关系网的创建方法实施例中的步骤，例如图1所示的S101至S104。或者，所述处理器80执行所述计算机程序82时实现上述各装置实施例中各单元的功能，例如图7所示模块71至74功能。

示例性的，所述计算机程序82可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器81中，并由所述处理器80执行，以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序82在所述用户关系网的创建设备8中的执行过程。例如，所述计算机程序82可以被分割成用户信息获取单元、关键词序列获取单元、关联用户确定单元以及用户关系网创建单元，各单元具体功能如上所述。

所述用户关系网的创建设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述用户关系网的创建设备可包括，但不仅限于，处理器80、存储器81。本领域技术人员可以理解，图8仅仅是用户关系网的创建设备8的示例，并不构成对用户关系网的创建设备8的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述用户关系网的创建设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是所述用户关系网的创建设备8的内部存储单元，例如用户关系网的创建设备8的硬盘或内存。所述存储器81也可以是所述用户关系网的创建设备8的外部存储设备，例如所述用户关系网的创建设备8上配备的插接式硬盘，智能存储卡(SmartMedia Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器81还可以既包括所述用户关系网的创建设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述用户关系网的创建设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种用户关系网的创建方法，其特征在于，包括：

获取用户数据库中各个用户的用户信息；

2.根据权利要求1所述的创建方法，其特征在于，所述将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列，包括：

初始化所述关键词序列，所述关键词序列中的每个元素依序分别对应所述关键词字典中的一个关键词；

根据各个关键词在所述关键词字典中的次序，依次判断所述用户信息中是否包含各个关键词；

若所述关键词字典中的关键词被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第一位值；

若所述关键词字典中的关键词不被包含于所述用户信息，则设置该关键词在所述关键词序列中的元素为第二位值；

基于各个所述元素的位值生成所述用户的关键词序列。

3.根据权利要求1所述的创建方法，其特征在于，所述用户信息包含多个信息项目；所述将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列，包括：

分别将所述用户信息中的各个所述信息项目与关键词字典内的各个关键词进行匹配，得到各个所述信息项目的关键词子序列；

基于各个所述关键词子序列，确定所述用户的关键词序列；

所述根据各个用户的关键词序列分别计算各个所述用户之间的匹配度，并识别所述匹配度大于关联阈值的两个用户互为关联用户，包括：

基于所述关键词子序列，分别计算各个所述用户对应的信息项目之间的相似度；

将各个所述信息项目的相似度导入到匹配度转换模型，计算所述匹配度；所述匹配度转换模型具体为：

4.根据权利要求1-3任一项所述的创建方法，其特征在于，在所述基于各个所述用户的关联用户，创建所述用户数据库的用户关系网之后，还包括：

若接收到新增用户添加指令，则在所述用户关系网中创建一个新增用户节点；

连接所述新增用户节点以及该新增用户节点对应的关联用户的节点，更新所述用户关系网。

5.根据权利要求1所述的创建方法，其特征在于，所述用户关系网的创建方法，还包括：

将所述用户信息进行分词处理，得到多个候选关键词；

若所述关键词字典中不存在所述候选关键词，则将所述候选关键词添加到所述关键词字典内。

6.一种用户关系网的创建设备，其特征在于，所述用户关系网的创建设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

获取用户数据库中各个用户的用户信息；

7.根据权利要求6所述的用户关系网的创建设备，其特征在于，所述将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列，包括：

基于各个所述元素的位值生成所述用户的关键词序列。

8.根据权利要求6所述的用户关系网的创建设备，其特征在于，所述用户信息包含多个信息项目；所述将所述用户信息与预设的关键词字典内的各个关键词进行匹配，得到所述用户的关键词序列，包括：

基于各个所述关键词子序列，确定所述用户的关键词序列；

9.根据权利要求6-8任一项所述的用户关系网的创建设备，其特征在于，在所述基于各个所述用户的关联用户，创建所述用户数据库的用户关系网之后，所述处理器执行所述计算机程序时还实现如下步骤：

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。