CN113378073B - 用户关系的识别方法及装置 - Google Patents
用户关系的识别方法及装置 Download PDFInfo
- Publication number
- CN113378073B CN113378073B CN202010162601.8A CN202010162601A CN113378073B CN 113378073 B CN113378073 B CN 113378073B CN 202010162601 A CN202010162601 A CN 202010162601A CN 113378073 B CN113378073 B CN 113378073B
- Authority
- CN
- China
- Prior art keywords
- user
- communication
- relationship
- information
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种用户关系的识别方法及装置,以解决现有技术中对目标关系的识别准确性较低的问题。该方法包括:获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;根据通讯信息,确定待识别用户与各第一用户在预设时段内的通讯关系信息;根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系。该技术方案根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息、并结合预先建立的用户关系识别模型,确定待识别用户与各第一用户之间是否属于目标关系,由于通讯信息不受用户居住远近的影响,因此本案能够提升目标关系识别的准确性以及精准度。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种用户关系的识别方法及装置。
背景技术
现有技术中,在识别各用户之间是否具有某种关系时,通常基于各用户的相关信息之间的关联性来识别。以家庭关系为例,在识别各用户之间是否具有家庭关系时,一般采用共同的信令基站和交往圈信息来确定,这种识别方法能够智能识别出居住在一起的用户,但是这些用户之间不一定存在家庭关系。并且基于目前家庭成员分布特点,血缘较近的家庭成员大部分不居住在一起。因此现有的算法不能正确识别各用户之间是否存在家庭关系,无法完全正确刻画家庭特征,对家庭营销存在一定的影响。
发明内容
本发明实施例提供一种用户关系的识别方法及装置,以解决现有技术中对目标关系的识别准确性较低的问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种用户关系的识别方法,包括:
获取待识别用户和与所述待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;所述通讯信息包括所述待识别用户对应的本机号码、所述第一用户对应的对端号码、所述本机号码与所述对端号码之间的通讯次数、通讯时长中的至少一项;
根据所述通讯信息,确定所述待识别用户与各所述第一用户在所述预设时段内的通讯关系信息;
根据预先建立的用户关系识别模型及所述通讯关系信息,确定所述待识别用户与各所述第一用户之间是否属于目标关系;所述用户关系识别模型根据已知用户关系的多个样本用户在所述预设时段内的通讯信息训练得到。
第二方面,本发明实施例还提供了一种用户关系的识别装置,包括:
第一获取模块,用于获取待识别用户和与所述待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;所述通讯信息包括所述待识别用户对应的本机号码、所述第一用户对应的对端号码、所述本机号码与所述对端号码之间的通讯次数、通讯时长中的至少一项;
第一确定模块,用于根据所述通讯信息,确定所述待识别用户与各所述第一用户在所述预设时段内的通讯关系信息;
第二确定模块,用于根据预先建立的用户关系识别模型及所述通讯关系信息,确定所述待识别用户与各所述第一用户之间是否属于目标关系;所述用户关系识别模型根据已知用户关系的多个样本用户在所述预设时段内的通讯信息训练得到。
第三方面,本发明实施例还提供了一种用户关系的识别设备,包括:
存储器,存储有计算机程序指令;
处理器,当所述计算机程序指令被所述处理器执行时实现如上述任一项所述的用户关系的识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得所述计算机执行如上述任一项所述的用户关系的识别方法。
在本发明实施例中,该技术方案在识别目标关系时,能够采集目标关系识别所需的通讯信息(包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长),并根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息,由于通讯信息不受用户居住远近的影响,因此本方案能够提升目标关系识别的准确性;此外,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系,实现了用户之间目标关系的自动化识别,从而提高目标关系的识别效率以及精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一个实施例中一种用户关系的识别方法的示意性流程图。
图2是本发明的一个实施例中建立用户关系识别模型的示意性流程图。
图3是本发明的另一个实施例中一种用户关系的识别方法的示意性流程图。
图4是本发明的一个实施例中一种用户关系的识别装置的结构示意图。
图5是本发明的一个实施例中一种用户关系的识别设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明的一个实施例中一种用户关系的识别方法的示意性流程图。图1的方法可包括:
S102,获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息。
其中,通讯信息可包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长等。
在一个实施例中,预设时段可包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段、以季度为单位的时段、以年为单位的时段等。
此外,还可将每天(包括工作日或节假日)的时段进行细化,如细化为临近下班时段、睡眠时段、娱乐时段、就餐时段等。例如,可将工作日的时段细化为工作时段(09:00-12:00、14:00-18:00)、就餐时段(12:00-13:00、18:00-19:00)、睡眠时段(13:00-14:00、00:00-06:00、22:00-24:00)、娱乐时段(19:00-22:00)、临近下班时段(17:00-19:00)等。可将细化后的时段作为预设时段,例如预设时段可以是每个工作日的就餐时段。
S104,根据通讯信息,确定待识别用户与各第一用户在预设时段内的通讯关系信息。
在一个实施例中,通讯关系信息可包括待识别用户与各第一用户在预设时段内的第一通讯值相对第一总通讯值的第一占比信息。其中,通讯值可包括通讯次数、通讯时长等。
S106,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系。
其中,用户关系识别模型根据已知用户关系的多个样本用户在预设时段内的通讯信息训练得到。
在一个实施例中,目标关系可为家庭关系。
在本发明实施例中,该技术方案在识别目标关系时,能够采集目标关系识别所需的通讯信息(包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长),并根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息,由于通讯信息不受用户居住远近的影响,因此本方案能够提升目标关系识别的准确性;此外,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系,实现了用户之间目标关系的自动化识别,从而提高目标关系的识别效率以及精准度。
在一个实施例中,用户关系可包括目标关系和/或非目标关系。在识别用户关系之前,可根据已知用户关系的多个样本用户在预设时段内的通讯信息训练得到用户关系识别模型。
其中,非目标关系指除目标关系外的其他用户关系。假设目标关系为家庭关系,则非目标关系(即非家庭关系)可为地缘关系、业缘关系、趣缘关系等。
下面详细说明如何训练用户关系识别模型。训练用户关系识别模型可包括如下步骤A1-A4:
步骤A1,获取多个样本用户。
多个样本用户可包括属于目标关系的第一类样本用户和属于非目标关系的第二类样本用户。
在获取多个样本用户时,可根据各样本用户的参数信息,确定各样本用户是否为属于目标关系的第一类样本用户或属于非目标关系的第二类样本用户。
其中,参数信息可包括用户信息、开通的通讯业务类型、对应的地理位置信息、社交信息等信息。
例如,若多个样本用户的用户信息(如身份证上的地址信息、实名制登记的信息等)相同或相关,则确定上述样本用户属于第一类样本用户;若多个样本用户之间开通的通讯业务类型为包含目标关系的业务,则确定上述样本用户属于第一类样本用户;若多个样本用户对应的地理位置均相同,则确定上述样本用户属于第一类样本用户;若多个样本用户之间存在较紧密的社交联系或存在于同一通讯成员表上,则确定上述样本用户属于第一类样本用户;等等。
在本实施例中,能够根据各样本用户的参数信息,确定各样本用户是否属于第一类样本用户或第二类样本用户,有效区分出了第一类样本用户和第二类样本用户,为后续训练用户关系识别模型提供了可靠的数据基础。
步骤A2,确定第一类样本用户为训练用户关系识别模型的正样本,及,确定第二类样本用户为训练用户关系识别模型的负样本。
可选的,可利用正样本及负样本构建逻辑线性回归方程,并使用极大似然估计计算回归系数,得到用户关系识别模型。
在本实施例中,在获取样本用户之后能够明确训练用户关系识别模型时的正样本和负样本,使得训练得到的用户关系识别模型更加可靠,且能够识别出两种用户关系(即目标关系和非目标关系)。
步骤A3,分别确定第一类样本用户中的第二用户与第一类样本用户中的其他各用户在预设时段内的第二通讯值、第二类样本用户中的第三用户与第二类样本用户中的其他各用户在预设时段内的第三通讯值、第二用户与第一类样本用户中的其他各用户在预设时段内的第二总通讯值、以及第三用户与第二类样本用户中的其他各用户在预设时段内的第三总通讯值。
其中,第二用户可为第一类样本用户中的任一个用户,并且对各第二用户都需要确定其与第一类样本用户中的其他各用户在预设时段内的第二通讯值,即需要确定第一类样本用户中两两用户之间在预设时段内的第二通讯值。
步骤A4,确定第二通讯值相对第二总通讯值的第二占比信息;及,确定第三通讯值相对第三总通讯值的第三占比信息。
步骤A5,基于第二占比信息、第三占比信息及多个样本用户之间的用户关系,训练用户关系识别模型。
在本实施例中,能够根据已知用户关系的多个样本用户在预设时段内的通讯信息,训练得到用户关系识别模型,使得得到的用户关系识别模型更加可靠,提升了用户关系识别的准确性。
通过以上实施例可训练得到用户关系识别模型,使得在进行用户关系的识别时,能够根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系。下面详细说明如何得到通讯关系信息。
在一个实施例中,可根据通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息。
其中,可获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息。通讯信息可包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长等。预设时段可包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段等。
本实施例中,通讯关系信息可为第一占比信息。在根据通讯信息确定待识别用户与各第一用户在预设时段内的第一占比信息时,可首先根据通讯信息分别确定待识别用户与各第一用户在预设时段内的第一通讯值,并确定待识别用户与各第一用户在预设时段内的第一总通讯值;其次,分别确定各第一通讯值相对第一总通讯值的第一占比信息。
其中,通讯值可包括通讯次数、通讯时长等。
本实施例中,若预设时段为以天为单位的第一时段,可首先根据通讯信息分别确定待识别用户与各第一用户在第一时段内的第一通讯值,并确定待识别用户与各第一用户在第一时段内的第一总通讯值;其次,确定第一时段内的第一通讯值相对第一总通讯值的第一占比信息。
若预设时段为以周为单位的第二时段,可首先根据各第一时段内的第一通讯值,以周为单位汇总为在第二时段内的第一通讯值,并根据各第一时段内的第一总通讯值,以周为单位汇总为在第二时段内的第一总通讯值;其次,确定第二时段内的第一通讯值相对第一总通讯值的第一占比信息。
若预设时段为以月为单位的第三时段,可首先根据各第一时段内的第一通讯值,以月为单位汇总为在第三时段内的第一通讯值,并根据各第一时段内的第一总通讯值,以月为单位汇总为在第三时段内的第一总通讯值;其次,确定第三时段内的第一通讯值相对第一总通讯值的第一占比信息。
例如,待识别用户对应的本机号码为i,第一用户对应的对端号码为j,预设时段为以天为单位的第一时段dt,本机号码与对端号码之间的通讯次数(即i与j之间的通讯次数)用表征,本机号码与对端号码之间的通讯时长(即i与j之间的通讯时长)用表征,本机号码在第一时段内的总通讯次数用表征,本机号码在第一时段内的总通讯时长用表征,用l表示与本机号码i有通讯往来的人数。那么,待识别用户i与第一用户j在第一时段内的第一通讯值用表征,待识别用户与各第一用户在第一时段内的第一总通讯值可用表征,在第一时段内各第一通讯值相对第一总通讯值的第一占比信息记为其中
本例中,还可按第三时段mt汇总待识别用户与各第一用户在第一时段内的第一通讯值记为待识别用户与各第一用户在第三时段内的第一总通讯值可用表征,在第三时段内各第一通讯值相对第一总通讯值的第一占比信息记为其中
基于上述实施例,可根据预先建立的用户关系识别模型及第一占比信息,确定待识别用户与各第一用户之间是否属于目标关系。
本实施例中,用户关系识别模型的输入数据为待识别用户的通讯信息,输出数据可以是各待识别用户之间属于目标关系的概率,也可以是各待识别用户之间是否属于目标关系的判定结果。
在确定待识别用户与各第一用户之间是否属于目标关系时,可根据用户关系识别模型的输出数据来确定。若用户关系识别模型的输出数据为各待识别用户之间属于目标关系的概率,则可根据该概率值的大小来确定待识别用户之间是否属于目标关系。例如可设定一个概率阈值,若输出的概率值达到该概率阈值,则可确定待识别用户之间属于目标关系;反之,若输出的概率值未达到该概率阈值,则可确定待识别用户之间属于非目标关系。若用户关系识别模型的输出数据为各待识别用户之间是否属于目标关系的判定结果,则可直接根据该判定结果获知待识别用户之间是否属于目标关系。
此外,若待识别用户对应的本机号码i与多个第一用户对应的对端号码(j1,j2,…,jm)之间均可构成目标关系,但j1,j2,…,jm不属于同一个目标关系中,可确定用户关系识别模型输出的概率最大值对应的对端号码与本机号码i之间属于目标关系。假设本机号码i与多个对端号码j1,j2,…,jm之间属于同一目标关系的概率是则对应的对端号码作为最终确定的与本机号码i之间属于目标关系的对端号码。
在本实施例中,通讯关系信息体现了待识别用户与各第一用户之间的通讯往来情况,通过通信关系信息及预先建立的用户关系识别模型,能够准确的确定待识别用户与各第一用户之间是否属于目标关系。
图2是本发明的一个实施例中建立用户关系识别模型的示意性流程图。其中,用户关系包括家庭关系和/或非家庭关系。图2的方法可包括:
S201,获取多个样本用户,并根据各样本用户的参数信息,确定各样本用户是否为属于家庭关系的第一类样本用户或属于非家庭关系的第二类样本用户。
其中,多个样本用户包括属于家庭关系的第一类样本用户和属于非家庭关系的第二类样本用户。参数信息可包括:用户信息、开通的通讯业务类型、对应的地理位置信息、社交信息等信息。
例如,若多个样本用户的用户信息(如身份证上的地址信息、实名制登记的信息等)相同或相关,则确定上述样本用户属于第一类样本用户;若多个样本用户之间开通的通讯业务类型为包含目标关系的业务,则确定上述样本用户属于第一类样本用户;若多个样本用户对应的地理位置均相同,则确定上述样本用户属于第一类样本用户;若多个样本用户之间存在较紧密的社交联系或存在于同一通讯成员表上,则确定上述样本用户属于第一类样本用户;等等。
S202,确定第一类样本用户为训练用户关系识别模型的正样本,及,确定第二类样本用户为训练用户关系识别模型的负样本。
S203,分别确定第一类样本用户中的第二用户与第一类样本用户中的其他各用户在预设时段内的第二通讯值、第二类样本用户中的第三用户与第二类样本用户中的其他各用户在预设时段内的第三通讯值。
本例中,可确定属于同一家庭关系中的第二用户对应的本机号码a和其他用户对应的对端号码b,分别在第一时段内、第二时段内、第三时段内的第二通讯值;可分别确定不属于同一家庭关系中的第三用户对应的本机号码c(c只和号码a所在家庭关系中的唯一a号码有通话,c归属于其他家庭关系中)和其他用户对应的对端号码a(即第二用户对应的本机号码a),在第一时段内、第二时段内、第三时段内的第三通讯值。
其中,第二用户可为第一类样本用户中的任一个用户,并且对各第二用户都需要确定其与第一类样本用户中的其他各用户在预设时段内的第二通讯值,即需要确定第一类样本用户中两两用户之间在预设时段内的第二通讯值。
S204,分别确定第一类样本用户中的第二用户与第一类样本用户中的其他各用户在预设时段内的第二总通讯值、第二类样本用户中的第三用户与第二类样本用户中的其他各用户在预设时段内的第三总通讯值。
S205,确定第二通讯值相对第二总通讯值的第二占比信息,及,确定第三通讯值相对第三总通讯值的第三占比信息。
S206,基于第二占比信息、第三占比信息及多个样本用户之间的用户关系,训练用户关系识别模型。
图3是本发明的另一个实施例中一种用户关系的识别方法的示意性流程图。本实施例中,可根据图2建立的用户关系识别模型对用户关系进行识别。其中,用户关系包括家庭关系和/或非家庭关系。图3的方法可包括:
S301,获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息。
其中,通讯信息可包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长等。
在一个实施例中,预设时段可包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段等。
S302,根据通讯信息,分别确定待识别用户与各第一用户在预设时段内的第一通讯值,及,确定待识别用户与各第一用户在预设时段内的第一总通讯值。
其中,通讯值可包括通讯次数、通讯时长等。
本实施例中,若预设时段为以天为单位的第一时段,可首先根据通讯信息分别确定待识别用户与各第一用户在第一时段内的第一通讯值,并确定待识别用户与各第一用户在第一时段内的第一总通讯值。
S303,分别确定各第一通讯值相对第一总通讯值的第一占比信息。
S304,根据预先建立的用户关系识别模型及第一占比信息,确定待识别用户与各第一用户之间是否属于家庭关系。
本实施例中,用户关系识别模型的输入数据为待识别用户的通讯信息,输出数据可以是各待识别用户之间属于目标关系的概率,也可以是各待识别用户之间是否属于目标关系的判定结果。
在确定待识别用户与各第一用户之间是否属于目标关系时,可根据用户关系识别模型的输出数据来确定。若用户关系识别模型的输出数据为各待识别用户之间是否属于目标关系的判定结果,则可直接根据该判定结果获知待识别用户之间是否属于目标关系。
在本发明实施例中,该技术方案在识别家庭关系时,能够采集家庭关系识别所需的通讯信息(包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长),并根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息,由于通讯信息不受用户居住远近的影响,因此本方案能够提升家庭关系识别的准确性;此外,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于家庭关系,实现了用户之间家庭关系的自动化识别,从而提高家庭关系的识别效率以及精准度。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图4是本发明的一个实施例中一种用户关系的识别装置的结构示意图。请参考图4,一种用户关系的识别装置可包括:
第一获取模块410,用于获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;通讯信息包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长中的至少一项;
第一确定模块420,用于根据通讯信息,确定待识别用户与各第一用户在预设时段内的通讯关系信息;
第二确定模块430,用于根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系;用户关系识别模型根据已知用户关系的多个样本用户在预设时段内的通讯信息训练得到。
在一个实施例中,第一确定模块420包括:
第一确定单元,用于根据通讯信息,分别确定待识别用户与各第一用户在预设时段内的第一通讯值,及,确定待识别用户与各第一用户在预设时段内的第一总通讯值;通讯值包括通讯次数和/或通讯时长;
第二确定单元,用于分别确定各第一通讯值相对第一总通讯值的第一占比信息;
第二确定模块包括:
第三确定单元,用于根据用户关系识别模型及第一占比信息,确定待识别用户与各第一用户之间是否属于目标关系。
在一个实施例中,用户关系包括目标关系和/或非目标关系;一种用户关系的识别装置还包括:
第二获取模块,用于获取多个样本用户;多个样本用户包括属于目标关系的第一类样本用户和属于非目标关系的第二类样本用户;
第三确定模块,用于分别确定第一类样本用户中的第二用户与第一类样本用户中的其他各用户在预设时段内的第二通讯值、第二类样本用户中的第三用户与第二类样本用户中的其他各用户在预设时段内的第三通讯值、第二用户与第一类样本用户中的其他各用户在预设时段内的第二总通讯值、以及第三用户与第二类样本用户中的其他各用户在预设时段内的第三总通讯值;
第四确定模块,用于确定第二通讯值相对第二总通讯值的第二占比信息;及,确定第三通讯值相对第三总通讯值的第三占比信息;
训练模块,用于基于第二占比信息、第三占比信息及多个样本用户之间的用户关系,训练用户关系识别模型。
在一个实施例中,第二获取模块包括:
第四确定单元,用于根据各样本用户的参数信息,确定各样本用户是否属于第一类样本用户或第二类样本用户;
参数信息包括以下至少一项:用户信息、开通的通讯业务类型、对应的地理位置信息、社交信息。
在一个实施例中,一种用户关系的识别装置还包括:
第五确定模块,用于在获取多个样本用户之后确定第一类样本用户为训练用户关系识别模型的正样本;及,确定第二类样本用户为训练用户关系识别模型的负样本。
在一个实施例中,预设时段包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段中的至少一项。
本发明实施例提供的用户关系的识别装置能够实现上述方法实施例中用户关系的识别方法实现的各个过程,为避免重复,这里不再赘述。
在本发明实施例中,该装置在识别目标关系时,能够采集目标关系识别所需的通讯信息(包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长),并根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息,由于通讯信息不受用户居住远近的影响,因此本方案能够提升目标关系识别的准确性;此外,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系,实现了用户之间目标关系的自动化识别,从而提高目标关系的识别效率以及精准度。
请参阅图5,图5是本发明实施例应用的用户关系的识别设备的结构图,能够实现上述实施例中由用户关系的识别设备执行的用户关系的识别方法的细节,并达到相同的效果。如图5所示,用户关系的识别设备500包括:处理器501、收发机502、存储器503、用户接口504和总线接口,其中:
在本发明实施例中,用户关系的识别设备500还包括:存储在存储器上503并可在处理器501上运行的计算机程序,计算机程序被处理器501执行时实现如下步骤:
获取待识别用户和与待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;通讯信息包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长中的至少一项;
根据通讯信息,确定待识别用户与各第一用户在预设时段内的通讯关系信息;
根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系;用户关系识别模型根据已知用户关系的多个样本用户在预设时段内的通讯信息训练得到。
在图5中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器501代表的一个或多个处理器和存储器503代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机502可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备,用户接口504还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
处理器501负责管理总线架构和通常的处理,存储器503可以存储处理器501在执行操作时所使用的数据。
可选的,计算机程序被处理器501执行时还可实现如下步骤:
根据通讯信息,分别确定待识别用户与各第一用户在预设时段内的第一通讯值,及,确定待识别用户与各第一用户在预设时段内的第一总通讯值;通讯值包括通讯次数和/或通讯时长;
分别确定各第一通讯值相对第一总通讯值的第一占比信息;
相应的,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系,包括:
根据用户关系识别模型及第一占比信息,确定待识别用户与各第一用户之间是否属于目标关系。
可选的,用户关系包括目标关系和/或非目标关系;
计算机程序被处理器501执行时还可实现如下步骤:
获取多个样本用户;多个样本用户包括属于目标关系的第一类样本用户和属于非目标关系的第二类样本用户;
分别确定第一类样本用户中的第二用户与第一类样本用户中的其他各用户在预设时段内的第二通讯值、第二类样本用户中的第三用户与第二类样本用户中的其他各用户在预设时段内的第三通讯值、第二用户与第一类样本用户中的其他各用户在预设时段内的第二总通讯值、以及第三用户与第二类样本用户中的其他各用户在预设时段内的第三总通讯值;
确定第二通讯值相对第二总通讯值的第二占比信息;及,确定第三通讯值相对第三总通讯值的第三占比信息;
基于第二占比信息、第三占比信息及多个样本用户之间的用户关系,训练用户关系识别模型。
可选的,计算机程序被处理器501执行时还可实现如下步骤:
根据各样本用户的参数信息,确定各样本用户是否属于第一类样本用户或第二类样本用户;
参数信息包括以下至少一项:用户信息、开通的通讯业务类型、对应的地理位置信息、社交信息。
可选的,计算机程序被处理器501执行时还可实现如下步骤:
获取多个样本用户之后,确定第一类样本用户为训练用户关系识别模型的正样本;及,确定第二类样本用户为训练用户关系识别模型的负样本。
可选的,预设时段包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段中的至少一项。
在本发明实施例中,该设备在识别目标关系时,能够采集目标关系识别所需的通讯信息(包括待识别用户对应的本机号码、第一用户对应的对端号码、本机号码与对端号码之间的通讯次数、通讯时长),并根据采集到的通讯信息确定待识别用户与各第一用户在预设时段内的通讯关系信息,由于通讯信息不受用户居住远近的影响,因此本方案能够提升目标关系识别的准确性;此外,根据预先建立的用户关系识别模型及通讯关系信息,确定待识别用户与各第一用户之间是否属于目标关系,实现了用户之间目标关系的自动化识别,从而提高目标关系的识别效率以及精准度。
优选的,本发明实施例还提供一种用户关系的识别设备,包括处理器501,存储器503,存储在存储器503上并可在所述处理器501上运行的计算机程序,该计算机程序被处理器501执行时实现上述用户关系的识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述用户关系的识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种用户关系的识别方法,其特征在于,包括:
获取待识别用户和与所述待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;所述通讯信息包括所述待识别用户对应的本机号码、所述第一用户对应的对端号码、所述本机号码与所述对端号码之间的通讯次数、通讯时长中的至少一项;
根据所述通讯信息,确定所述待识别用户与各所述第一用户在所述预设时段内的通讯关系信息;
根据预先建立的用户关系识别模型及所述通讯关系信息,确定所述待识别用户与各所述第一用户之间是否属于目标关系;所述用户关系识别模型根据已知用户关系的多个样本用户在所述预设时段内的通讯信息训练得到;
其中,在用户关系识别模型的输出数据为所述待识别用户与各所述第一用户之间属于目标关系的概率的情况下,若所述待识别用户对应的本机号码与多个所述第一用户对应的对端号码之间均可构成目标关系,但多个所述第一用户对应的对端号码不属于同一个目标关系,则确定所述用户关系模型输出的概率最大值对应的对端号码的所述第一用户与所述待识别用户之间属于所述目标关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述通讯信息,确定所述待识别用户与各所述第一用户在所述预设时段内的通讯关系信息,包括:
根据所述通讯信息,分别确定所述待识别用户与各所述第一用户在所述预设时段内的第一通讯值,及,确定所述待识别用户与各所述第一用户在所述预设时段内的第一总通讯值;所述通讯值包括通讯次数和/或通讯时长;
分别确定各所述第一通讯值相对所述第一总通讯值的第一占比信息;
相应的,所述根据预先建立的用户关系识别模型及所述通讯关系信息,确定所述待识别用户与各所述第一用户之间是否属于目标关系,包括:
根据所述用户关系识别模型及所述第一占比信息,确定所述待识别用户与各所述第一用户之间是否属于所述目标关系。
3.根据权利要求1所述的方法,其特征在于,所述用户关系包括所述目标关系和/或非目标关系;所述方法还包括:
获取所述多个样本用户;所述多个样本用户包括属于所述目标关系的第一类样本用户和属于所述非目标关系的第二类样本用户;
分别确定所述第一类样本用户中的第二用户与所述第一类样本用户中的其他各用户在所述预设时段内的第二通讯值、所述第二类样本用户中的第三用户与所述第二类样本用户中的其他各用户在所述预设时段内的第三通讯值、所述第二用户与所述第一类样本用户中的其他各用户在所述预设时段内的第二总通讯值、以及所述第三用户与所述第二类样本用户中的其他各用户在所述预设时段内的第三总通讯值;
确定所述第二通讯值相对所述第二总通讯值的第二占比信息;及,确定所述第三通讯值相对所述第三总通讯值的第三占比信息;
基于所述第二占比信息、所述第三占比信息及所述多个样本用户之间的用户关系,训练所述用户关系识别模型。
4.根据权利要求3所述的方法,其特征在于,所述获取所述多个样本用户,包括:
根据各所述样本用户的参数信息,确定各所述样本用户是否属于所述第一类样本用户或所述第二类样本用户;
所述参数信息包括以下至少一项:用户信息、开通的通讯业务类型、对应的地理位置信息、社交信息。
5.根据权利要求3所述的方法,其特征在于,所述获取所述多个样本用户之后,还包括:
确定所述第一类样本用户为训练所述用户关系识别模型的正样本;及,确定所述第二类样本用户为训练所述用户关系识别模型的负样本。
6.根据权利要求1所述的方法,其特征在于,所述预设时段包括以天为单位的第一时段、以周为单位的第二时段、以月为单位的第三时段中的至少一项。
7.一种用户关系的识别装置,其特征在于,包括:
第一获取模块,用于获取待识别用户和与所述待识别用户有通讯往来的各第一用户在预设时段内的通讯信息;所述通讯信息包括所述待识别用户对应的本机号码、所述第一用户对应的对端号码、所述本机号码与所述对端号码之间的通讯次数、通讯时长中的至少一项;
第一确定模块,用于根据所述通讯信息,确定所述待识别用户与各所述第一用户在所述预设时段内的通讯关系信息;
第二确定模块,用于根据预先建立的用户关系识别模型及所述通讯关系信息,确定所述待识别用户与各所述第一用户之间是否属于目标关系;所述用户关系识别模型根据已知用户关系的多个样本用户在所述预设时段内的通讯信息训练得到;
其中,在用户关系识别模型的输出数据为所述待识别用户与各所述第一用户之间属于目标关系的概率的情况下,若所述待识别用户对应的本机号码与多个所述第一用户对应的对端号码之间均可构成目标关系,但多个所述第一用户对应的对端号码不属于同一个目标关系,所述第二确定模块,用于确定所述用户关系模型输出的概率最大值对应的对端号码的所述第一用户与所述待识别用户之间属于所述目标关系。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于根据所述通讯信息,分别确定所述待识别用户与各所述第一用户在所述预设时段内的第一通讯值,及,确定所述待识别用户与各所述第一用户在所述预设时段内的第一总通讯值;所述通讯值包括通讯次数和/或通讯时长;
第二确定单元,用于分别确定各所述第一通讯值相对所述第一总通讯值的第一占比信息;
第二确定模块包括:
第三确定单元,用于根据所述用户关系识别模型及所述第一占比信息,确定所述待识别用户与各所述第一用户之间是否属于所述目标关系。
9.一种用户关系的识别设备,其特征在于,包括:
存储器,存储有计算机程序指令;
处理器,当所述计算机程序指令被所述处理器执行时实现如权利要求1至6中任一项所述的用户关系的识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1至6中任一项所述的用户关系的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010162601.8A CN113378073B (zh) | 2020-03-10 | 2020-03-10 | 用户关系的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010162601.8A CN113378073B (zh) | 2020-03-10 | 2020-03-10 | 用户关系的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113378073A CN113378073A (zh) | 2021-09-10 |
CN113378073B true CN113378073B (zh) | 2023-04-07 |
Family
ID=77568820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010162601.8A Active CN113378073B (zh) | 2020-03-10 | 2020-03-10 | 用户关系的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378073B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106658564A (zh) * | 2016-11-17 | 2017-05-10 | 广州杰赛科技股份有限公司 | 一种家庭用户的识别方法及装置 |
CN107392781A (zh) * | 2017-06-20 | 2017-11-24 | 挖财网络技术有限公司 | 用户关系的识别方法、对象关系的识别方法及装置 |
CN109829485A (zh) * | 2019-01-08 | 2019-05-31 | 科大国创软件股份有限公司 | 一种基于移动通信数据的用户关系挖掘方法及系统 |
CN110019996A (zh) * | 2017-12-11 | 2019-07-16 | 中国移动通信集团广东有限公司 | 一种家庭关系识别方法和系统 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557942B (zh) * | 2015-09-30 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 一种用户关系的识别方法和装置 |
-
2020
- 2020-03-10 CN CN202010162601.8A patent/CN113378073B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106658564A (zh) * | 2016-11-17 | 2017-05-10 | 广州杰赛科技股份有限公司 | 一种家庭用户的识别方法及装置 |
CN107392781A (zh) * | 2017-06-20 | 2017-11-24 | 挖财网络技术有限公司 | 用户关系的识别方法、对象关系的识别方法及装置 |
CN110019996A (zh) * | 2017-12-11 | 2019-07-16 | 中国移动通信集团广东有限公司 | 一种家庭关系识别方法和系统 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
CN109829485A (zh) * | 2019-01-08 | 2019-05-31 | 科大国创软件股份有限公司 | 一种基于移动通信数据的用户关系挖掘方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113378073A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN105824813B (zh) | 一种挖掘核心用户的方法及装置 | |
US8670527B2 (en) | Method and system for detecting voice mail spam | |
CN106993048B (zh) | 确定推荐信息的方法及装置、信息推荐方法及装置 | |
CN102215504A (zh) | 新入网用户的类别识别方法及系统 | |
CN113412607B (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN106936971B (zh) | 一种来电人信息提示系统及提示方法 | |
CN109636433A (zh) | 基于大数据分析的养卡识别方法、装置、设备和存储介质 | |
CN107920154A (zh) | 陌生来电的处理方法及终端 | |
CN111131493A (zh) | 一种数据获取、用户画像生成方法、装置 | |
CN113206909A (zh) | 骚扰电话拦截方法及装置 | |
CN113205129B (zh) | 一种作弊团伙识别方法、装置、电子设备及存储介质 | |
CN110113748A (zh) | 骚扰电话监控方法、装置 | |
CN113378073B (zh) | 用户关系的识别方法及装置 | |
CN112307075B (zh) | 用户关系识别方法及装置 | |
CN112688821B (zh) | 网络容量预测方法、装置及电子设备 | |
CN102752462B (zh) | 电信业务推荐方法与系统 | |
CN110166635B (zh) | 可疑终端识别方法和可疑终端识别系统 | |
CN114970495A (zh) | 人名消歧方法、装置、电子设备及存储介质 | |
CN110856159B (zh) | 确定家庭圈成员的方法、装置及存储介质 | |
CN104065821A (zh) | 来电提示方法和通信终端 | |
CN107734157A (zh) | 一种来电号码提醒方法、移动终端及存储介质 | |
CN114764419A (zh) | 家庭宽带用户的挖掘方法、装置及相关设备 | |
CN111756910A (zh) | 来电免打扰方法、系统、计算机设备及存储介质 | |
CN115529581A (zh) | 一种离网用户识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |