CN111626754B - 养卡用户识别方法及装置 - Google Patents

养卡用户识别方法及装置 Download PDF

Info

Publication number
CN111626754B
CN111626754B CN202010470197.0A CN202010470197A CN111626754B CN 111626754 B CN111626754 B CN 111626754B CN 202010470197 A CN202010470197 A CN 202010470197A CN 111626754 B CN111626754 B CN 111626754B
Authority
CN
China
Prior art keywords
user
card
data
users
keeping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010470197.0A
Other languages
English (en)
Other versions
CN111626754A (zh
Inventor
周雪
张少华
冯家刚
孟琳琳
赵锡成
李娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202010470197.0A priority Critical patent/CN111626754B/zh
Publication of CN111626754A publication Critical patent/CN111626754A/zh
Application granted granted Critical
Publication of CN111626754B publication Critical patent/CN111626754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种养卡用户识别方法及装置,该方法包括获取样本用户的用户数据,筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户以及根据所有正常用户的用户社交数据确定初始正常用户,并将目标用户的用户社交数据作为目标数据,对初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据进行聚类识别养卡用户。通过利用用户的社交数据难以伪造的特性,采用用户社交数据设置聚类算法的初始点,对目标样本的社交数据进行分析,提高了识别养卡用户结果的准确性。

Description

养卡用户识别方法及装置
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种养卡用户识别方法及装置。
背景技术
在通信运营商和代理商的合作过程中,一些代理商为了获得更高的报酬,往往通过批量开通虚拟账户的作弊手段提升销售业绩,这种行为被称为养卡。大量的养卡用户会造成运营商客户虚增,出现运营、活动成本提高但是运营商的业务收入却在下降的情况,导致运营商的直接经济损失。因此,需要准确地识别出养卡用户并及时进行处理。
目前,一般采用对已确认养卡用户的通信数据进行分析,发现养卡用户的数据特征,例如养卡用户的主叫分钟和被叫分钟远低于正常通信分钟数,或者短信次数和上网流量少等通信数据特征。通过对养卡用户的数据特征进行分析以及构建识别养卡用户的判断模型,并根据该判断模型对全网数据进行分析,挖掘异常用户行为,确定疑似养卡用户名单。
然而,现有养卡用户通过将一批手机卡插入到一个养卡器中,并通过设置国际移动设备识别码(International Mobile Equipment Identity,简称IMEI)日常通信活动,伪造正常的用户行为数据,导致判断模型不能进行有效识别养卡用户,依然存在养卡用户识别不准确和误判的问题。
发明内容
本发明实施例提供一种养卡用户识别方法及装置,以提高养卡用户的识别结果的准确性。
第一方面,本发明实施例提供一种养卡用户识别方法,包括:
获取样本用户的用户数据,并根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合;
获取所述疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中所述初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所述正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中所述正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户;
将所述养卡用户的信息发送至运营商监管平台。
在一种可能的设计中,所述获取所有目标用户的用户社交数据作为目标数据,将所述初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户,包括:
将所述初始疑似养卡用户的用户社交数据以及所述初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点;
分别获取每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有属性数据的欧氏距离,并根据每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有属性数据的欧氏距离确定目标养卡用户集合,所述目标养卡用户集合中每个目标养卡用户与所述第一中心点之间的欧氏距离小于所述目标养卡用户与所述第二中心点之间的欧氏距离;
根据所述目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户,所述养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离的总合最小。
在一种可能的设计中,所述用户数据包括用户消费金额、用户主叫分钟、用户被叫分钟、短信条数、上网流量和上网时长;所述第一预设条件的预设阈值包括预设用户消费金额、预设用户主叫分钟、预设用户被叫分钟、预设短信条数、预设上网流量和预设上网时长;所述根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,包括:
若所述用户消费金额小于所述预设用户消费金额、所述用户主叫分钟小于所述预设用户主叫分钟、所述用户被叫分钟小于所述预设用户被叫分钟、所述短信条数小于所述预设短信条数、所述上网流量小于所述预设上网流量以及所述上网时长小于所述预设上网时长,则确定所述样本用户为疑似养卡用户,并将所有疑似养卡用户作为疑似养卡用户集合;
若所述用户消费金额大于所述预设用户消费金额、所述用户主叫分钟大于所述预设用户主叫分钟、所述用户被叫分钟大于所述预设用户被叫分钟、所述短信条数大于所述预设短信条数、所述上网流量大于所述预设上网流量以及所述上网时长大于所述预设上网时长,则确定所述样本用户为正常用户,并将所有正常用户作为正常用户集合。
在一种可能的设计中,所述用户社交数据包括以下信息中的一种或多种:
用户的参与活动活跃度,是否有亲密联系人,以及用户、用户第一联系人、用户第二联系人、用户第三联系人和用户第一联系人的第一联系人的号码基础信息;其中所述号码基础信息包括号码稳定度、号码是否为三低用户、号码是否低出账用户、号码归属运营商的信用分、号码星级以及号码的前五位联系人中疑似养卡用户的个数。
在一种可能的设计中,所述用户社交数据还包括多样度,所述多样度包括主叫号码多样度、被叫号码多样度以及是否有亲密联系人;
所述号码稳定度还包括号码高稳定度、号码中稳定度及号码低稳定度;
所述号码基础信息还包括号码高阶度,所述号码高阶度为所述号码稳定度与所述号码归属运营商的信用分、所述号码星级的乘积以及所述号码联系人中最常用基站为相同基站的用户数量。
在一种可能的设计中,在所述对所述样本数据进行聚类识别养卡用户之前,还包括:
对所述样本数据的所有属性数据进行归一化处理。
在一种可能的设计中,在所述获取样本用户的用户数据之前,还包括:
获取运营商运营的所有用户,删除离网用户、无交易金额用户以及无通信数据用户,得到样本用户。
第二方面,本发明实施例提供一种养卡用户识别装置,包括:
获取模块,用于获取样本用户的用户数据,并根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合;
识别模块,用于获取所述疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中所述初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取所述正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中所述正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户;
发送模块,用于将所述养卡用户的信息发送至运营商监管平台。
第三方面,本发明实施例提供一种服务器,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的方法。
本发明实施例提供的养卡用户识别方法及装置,该方法通过获取及筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户以及根据所有正常用户的用户社交数据确定初始正常用户,并将目标用户的用户社交数据作为目标数据,对初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据进行聚类识别养卡用户。通过利用用户的社交数据难以伪造的特性,采用用户社交数据设置聚类算法的初始点,对目标样本的社交数据进行分析,提高了识别养卡用户结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的养卡用户识别方法场景示意图;
图2为本发明实施例提供的养卡用户识别方法流程示意图一;
图3为本发明实施例提供的养卡用户识别方法流程示意图二;
图4为本发明实施例提供的养卡用户识别装置的结构示意图;
图5为本发明实施例提供的服务器的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的养卡用户识别方法场景示意图。如图1所示:本发明实施例中用户调度应用场景主要包括:服务器10和养卡用户集合。其中,养卡用户集合包括第一养卡用户201、第二养卡用户202、第三养卡用户203、第四养卡用户204及第五养卡用户205,其中第一养卡用户201、第二养卡用户202、第三养卡用户203、第四养卡用户204及第五养卡用户205已经识别为养卡用户。
服务器10通过对第一养卡用户201、第二养卡用户202、第三养卡用户203、第四养卡用户204及第五养卡用户205的通信数据进行分析获得养卡用户集合20中所有养卡用户的通信数据特征,并以此构建识别养卡用户的判断模型。利用识别养卡用户的判断模型对运营商下运营的所有用户的通信数据进行分析,识别疑似养卡用户。
然而,现有养卡用户通过将一批手机卡插入到一个养卡器中,并通过设置IMEI进行虚拟拨打电话、发送短信或者上网等行为模拟正常用户日常通信活动,伪造正常的用户行为数据,影响识别养卡用户的判断模型识别养卡用户结果的准确性。
为了避免上述技术问题,本发明对于上述场景的识别养卡用户的方法进行了改进,通过获取每个疑似养卡用户的用户社交数据确定初始养卡用户以及获取每个正常用户的用户社交数据确定初始正常用户,并将目标用户的用户社交数据作为目标数据,对初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据进行聚类识别养卡用户。本发明提供的识别养卡用户通过利用用户的社交数据难以伪造的特性,采用用户社交数据设置聚类算法的初始点,通过对目标样本的社交数据进行分析,提高了识别养卡用户结果的准确性。
图2为本发明实施例提供的养卡用户识别方法流程示意图一。本实施例的方法的执行主体可以为图1中的服务器,如图2所示,养卡用户识别方法包括以下步骤:
S201:获取样本用户的用户数据,并根据第一预设条件筛选样本用户的用户数据获得疑似养卡用户集合及正常用户集合。
根据用户的基本通信数据可以初步识别出样本用户为养卡用户或者正常用户,由此可获得疑似养卡用户集合及正常用户集合。具体的,用户数据包括用户消费金额、用户主叫分钟、用户被叫分钟、短信条数、上网流量和上网时长。其中,第一预设条件的预设阈值包括预设用户消费金额、预设用户主叫分钟、预设用户被叫分钟、预设短信条数、预设上网流量和预设上网时长。若用户消费金额小于预设用户消费金额、用户主叫分钟小于预设用户主叫分钟、用户被叫分钟小于预设用户被叫分钟、短信条数小于预设短信条数、上网流量小于预设上网流量以及上网时长小于预设上网时长,则确定样本用户为疑似养卡用户,并将所有疑似养卡用户作为疑似养卡用户集合;若用户消费金额大于预设用户消费金额、用户主叫分钟大于预设用户主叫分钟、用户被叫分钟大于预设用户被叫分钟、短信条数大于预设短信条数、上网流量大于预设上网流量以及上网时长大于预设上网时长,则确定样本用户为正常用户,并将所有正常用户作为正常用户集合。
如表1所示,设置第一预设条件的预设阈值为:预设用户消费金额为10元、预设用户主叫分钟为5分钟、预设用户被叫分钟10分钟、预设短信条数为4条、预设上网流量3MB和预设上网时长为10分钟。若根据表1中的样本用户满足以下3个条件:过去三个月均用户消费金额小于10元、被叫小于10分钟以及上网累计小于10分钟,则判定此用户为三低用户。如表1所示,根据第一预设条件判断以下9个样本用户中疑似养卡用户集合包括用户2、用户7和用户8,正常集合包括用户3、用户6和用户9。
表1
Figure BDA0002514058050000071
S202:获取疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小。
具体的,用户社交数据包括以下信息:用户的参与活动活跃度,是否有亲密联系人,以及用户、用户第一联系人、用户第二联系人、用户第三联系人和用户第一联系人的第一联系人的号码基础信息;其中号码基础信息包括号码稳定度、号码是否为三低用户、号码是否低出账用户、号码归属运营商的信用分、号码星级以及号码的前五位联系人中疑似养卡用户数量。其中,用户的参与活动活跃度为用户参加运营商组织的营销活动的次数,用户的被叫号码数为用户在一定时期内被呼叫通话的次数,用户第一联系人Top1、用户第二联系人Top2和用户第三联系人Top3分别为与用户联系的第一频繁、第二频繁和第三频繁联系人,用户第一联系人的第一联系人Top1的Top1为用户第一频繁联系人的最常联系人,Top5为与用户联系频率最高的前五名联系人。
示例性的,号码基础信息中号码稳定度为根据该号码用户的在网时间、每月消费浮动情况以及语音流量使用量波动情况评估的数值;号码是否为三低用户即该号码用户的的用户的用户数据是否同时小于第一预设条件中设定的预设用户主叫分钟、预设短信条数以及预设上网流量,如果同时满足上述三个条件,则该号码用户为三低用户;号码是否低出账用户即该号码用户每月出账金额是否低于最低套餐的消费金额;号码归属运营商的信用分即该号码用户的信用额度,用户的欠费金额在信用额度之内可以享受不停机服务;号码星级是根据该号码用户的累计消费、充值习惯、套餐等级、在网时长、是否企业用户等通信数据评估的;号码的前五位联系人中疑似养卡用户的个数,即该号码用户的最常联系的前五位联系人中属于疑似养卡用户集合中的用户的数量。
如表2所示,表2为疑似养卡用户集合中用户2、用户7和用户8的用户社交数据。
表2
Figure BDA0002514058050000081
Figure BDA0002514058050000091
示例性的,根据表2中用户2、用户7和用户8的用户社交数据确定初始养卡用户。疑似养卡用户集合中包含三个点,将用户2记作疑似养卡用户集合的第一个点,即n=1;将用户7记作疑似养卡用户集合的第二个点,即n=2;将用户8记作疑似养卡用户集合的第三个点,即n=3。疑似养卡用户集合中每个用户共包含32项属性,每项属性的取值参数用x表示,则xij表示第i个点的第j项属性。计算每个疑似养卡用户的所有项属性与疑似养卡用户集合中其他所有用户之间的每一项属性数据欧式距离的总合,其中两个疑似养卡用户之间欧式距离为32项属性差值的平方和,再开根号,则欧式距离的总合公式如(1)所示:
Figure BDA0002514058050000101
其中Di为疑似养卡用户集合中的第i个点到其他点的欧式距离总合,q是每个点的特征数,xip是第i个点的第p个特征的值。示例性的,表2中的的疑似养卡用户集合的q为32。
通过公式(1)可计算出疑似养卡用户集合中每个点到其他点的欧式距离总合,即计算出所有的D1、D2……Dn。由此获得疑似养卡用户集合的欧式距离总合数组Distinct=[D1,D2……Dn],并筛选出欧式距离总合中最小的Di,即确定该点的用户即为疑似养卡用户集合的初始养卡用户。表2中D1最小,则第一个点即用2为疑似养卡用户集合的初始养卡用户。
S203:获取正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小。
如表3所示,表3为正常集合中的用户3、用户6和用户9。
表3
Figure BDA0002514058050000102
Figure BDA0002514058050000111
根据正常用户集合中的每个正常用户的用户社交数据确定初始正常用户的方法与S202中的方法相同,在此不再赘述。根据表2确定的初始正常用户为用户6。
S204:获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据,对样本数据进行聚类识别养卡用户。
目标用户的用户社交数据如表4所示,获取1001至1010的目标用户的用户社交数据,其中,每个目标用户的用户社交数据与样本用户的用户社交数据的属性一致。基于距离聚类算法,将初始养卡用户即用户2和初始正常用户即用户6的用户社交数据,以及根据表3中的所有目标用户的用户社交数据作为目标数据对样本数据进行聚类识别养卡用户。
表4
Figure BDA0002514058050000121
Figure BDA0002514058050000131
S205:将养卡用户的信息发送至运营商监管平台。
若识别目标企业为养卡用户,则将该养卡用户的企业信息发送至运营商监管平台,由运营商监管平台的管理部门负责对养卡用户进行及时停卡销户处理。
从上述实施例可知,通过筛选样本用户的用户数据获得疑似养卡用户集合及正常用户集合,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户以及根据所有正常用户的用户社交数据确定初始正常用户,并将目标用户的用户社交数据作为目标数据,对初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据进行聚类识别养卡用户。通过利用用户的社交数据难以伪造的特性,采用用户社交数据设置聚类算法的初始点,通过对目标样本的社交数据进行分析,提高了识别养卡用户结果的准确性。
在一种可能的实现方式中,用户社交数据还包括多样度,多样度包括主叫号码多样度、被叫号码多样度以及是否有亲密联系人;其中,号码稳定度还包括号码高稳定度、号码中稳定度及号码低稳定度;号码基础信息还包括号码高阶度,号码高阶度为号码稳定度与号码归属运营商的信用分、号码星级的乘积以及号码的前五位联系人中在疑似养卡用户集合中的号码个数。
具体的,用户社交数据的多样度包括主叫多样度和被叫多样度,其中主叫多样度和被叫多样度分别表示用户主叫号码和被叫号码是否大于预设的最低联系人数量,例如预设最低联系人数量为5,则若该用户本月主叫号码的数量大于或者等于5,则该号码的主叫多样度为1;同理若该用户本月被叫号码的数量大于或者等于5,则该号码的被叫多样度为1。养卡号码通常同一批数量较少的其他养卡号码进行虚拟拨打电话等行为模拟正常用户,因此可通过设置主叫多样度和被叫多样度筛选疑似养卡号码。
具体的,是否有亲密联系人即表示该用户的是否与同一号码用户通信频繁,该用户与同一号码用户通信频繁的通话时长和短信互发条数大于预设的通话时长和预设的短信互发条数,则说明该用户与此号码用户为亲密联系人关系,则改用户的是否有亲密联系人数值设为1。是否有亲密联系人参数为1时说明该用户的通信数据与养卡用户的模拟的通信数据特征不同,养卡用户是通过将一批手机卡插入到一个养卡器中,并通过设置国际移动设备识别码IMEI日常通信活动,伪造正常的用户行为数据,养卡用户的通信特征中没有与同一联系人联系频繁的情况,因此可通过设置是否有亲密联系人筛选疑似养卡号码。
号码稳定度还包括号码高稳定度、号码中稳定度及号码低稳定度,其中号码稳定度为根据该号码用户的在网时间、每月消费浮动情况以及语音流量使用量波动情况评估的数值,若该号码用户每月的在网时间、每月消费浮动情况以及语音流量使用量波动较小,则号码高稳定度为1,号码中稳定度为0及号码低稳定度为0;若该号码用户每月的在网时间、每月消费浮动情况以及语音流量使用量存在较小的波动,则号码高稳定度为0,号码中稳定度为1及号码低稳定度为0;若该号码用户每月的在网时间、每月消费浮动情况以及语音流量使用量存在较大的波动,则号码高稳定度为0,号码中稳定度为0及号码低稳定度为1。号码高稳定度为1、号码中稳定度为0及号码低稳定度为0时说明该用户的通信行为比较稳定,然而养卡用户由于需要伪造和模拟通信数据等影响的号码稳定度,因此通过设置号码高稳定度、号码中稳定度及号码低稳定度筛选疑似养卡号码。
具体的,号码基础信息中的号码高阶度为号码稳定度与号码归属运营商的信用分以及号码星级的乘积。号码稳定度、号码归属运营商的信用分以及号码星级可以侧面反映用户的通信行为,因此可以通过计算号码稳定度、号码归属运营商的信用分以及号码星级的乘积作为号码高阶度,综合判断用户的通信数据特征,提高识别养卡用户的准确性。
一种可能的实现方式中,号码基础信息还包括号码的联系人中最常用基站为相同基站的用户数量为若该号码用户的联系人中使用相同位置基站进行通信数据传输的联系人数量。养卡用户是通过将一批手机卡插入到一个养卡器中,并通过设置国际移动设备识别码IMEI日常通信活动,伪造正常的用户行为数据。因此同一批养卡用户之间通过同一位置基站进行相互通信。若号码的联系人中最常用基站为相同基站的用户数量值比较大,说明该用户为养卡用户的几率比较高。因此,通过获取号码的联系人中最常用基站为相同基站的用户数量作为号码的社交属性数据,提高识别养卡用户结果的准确性。
一种可能的实现方式中,用户社交数据还包括用户号码人脉属性,其中用户号码人脉属性与以下关联信息相关:Top1的Top5联系人中在疑似养卡用户集合中的号码个数、Top2的Top5联系人中在疑似养卡用户集合中的号码个数以及Top3的Top5联系人中在疑似养卡用户集合中的号码个数确定的。由于不同级别的联系人对于用户号码的人脉属性影响的重要程度不同,因此号码人脉属性的取值与以上各个关联信息的权重系数不同,根据Top1至Top5的顺序依次减小。例如,用户号码人脉属性=Top1的Top5联系人中在疑似养卡用户集合中的号码个数*m+Top2的Top5联系人中在疑似养卡用户集合中的号码个数*n+Top3的Top5联系人中在疑似养卡用户集合中的号码个数*q,其中m大于n,n大于q,m、n和q小于1。
从上述实施例可知,通过设置用户社交数据还包括多样度,多样度包括主叫号码多样度、被叫号码多样度以及是否有亲密联系人;其中,号码稳定度还包括号码高稳定度、号码中稳定度及号码低稳定度;号码基础信息还包括号码高阶度,号码高阶度为号码稳定度与号码归属运营商的信用分、号码星级的乘积以及号码的联系人中最常用基站为相同基站的用户数量,提高了识别养卡用户结果的准确性。
图3为本发明实施例提供的养卡用户识别方法流程示意图二。如图3所示,在图2实施例的基础上,步骤S204的一种具体实现方式为:
S301:将初始疑似养卡用户的用户社交数据以及初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点。
具体的,对样本数据进行聚类时采用k均值聚类算法。其中,k均值聚类算法是一种迭代求解的聚类分析算法。将初始养卡用户和初始正常用户作为聚类算法的第一中心点和第二中心点,即选取k为2,其中用户2和用户6的用户社交数据为本实施例中k均值聚类算法的两个种子点。
S302:分别获取每个目标用户与第一中心点和第二中心点之间用户社交数据中所有属性数据的欧氏距离,并根据每个目标用户与第一中心点和第二中心点之间用户社交数据中所有属性数据的欧氏距离确定目标养卡用户集合,目标养卡用户集合中每个目标养卡用户与第一中心点之间的欧氏距离小于目标养卡用户与第二中心点之间的欧氏距离。
具体的,分别计算表4中所有目标用户的社交属性数据与用户2和用户6的用户社交数据中所有属性数据的欧氏距离。例如,计算目标用户1001与用户2每一项属性数据的差值以及32项属性数据差值的合,计算目标用户1001与用户6每一项属性数据的差值以及32项属性数据差值的合。若目标用户1001与用户2的32项属性数据欧氏距离小于目标用户1001与用户6的32项属性数据欧氏距离,则确定用户6为目标养卡用户。通过计算所有目标用户与用户2和用户6每一项属性数据的差值以及32项属性数据差值的合获得目标养卡用户集合。其中,表4中获得的目标养卡用户集合包括第一目标养卡用户1004、第二目标养卡用户1005、第三目标养卡用户1009和第四目标养卡用户1010。
具体的,在对样本数据进行聚类识别养卡用户之前,对样本数据的所有属性数据进行归一化处理。为了便于对样本数据进行聚类,将样本数据映射到0~1范围之内,提高了聚类算法的效率。
S303:根据目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户,养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离的总合最小。
根据目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户。示例性的,表4中获得的目标养卡用户集合包括第一目标养卡用户1004、第二目标养卡用户1005、第三目标养卡用户1009和第四目标养卡用户1010。计算第一目标养卡用户1004与第二目标养卡用户1005、第三目标养卡用户1009和第四目标养卡用户1010之间每一项属性数据的差值及欧氏距离为D11、D12、D13及D14,再计算D11、D12、D13及D14的总合作为用户1004的欧氏距离D1。同理,依次计算第二目标养卡用户1005、第三目标养卡用户1009和第四目标养卡用户1010的欧氏距离总合D2、D3及D4。筛选出D1、D2、D3及D4中最小的欧氏距离D3确定第三目标养卡用户1009为养卡用户。
从上述实施例可知,通过设置初始疑似养卡用户和初始正常用户作为聚类算法中两个给定的中心点,并根据每个目标用户与第一中心点和第二中心点之间用户社交数据中所有属性数据的欧氏距离确定目标养卡用户集合。通过样本用户的社交属性数据获得的初始疑似养卡用户和初始正常用户能够比较准确的表示疑似养卡用户集合与正常用户的中心点,即初始疑似养卡用户的数据特征能够代表养卡用的数据特征,因此将初始疑似养卡用户和初始正常用户作为聚类算法中两个给定的中心点,并将初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据,提高了识别目标用户中养卡用户结果的准确性。
在一种可能的实现方式中,在获取样本用户的用户数据之前,获取运营商运营的所有用户,删除离网用户、无交易金额用户以及无通信数据用户,得到样本用户。
由于离网用户、无交易金额用户以及无通信数据用户的通信数据特征为用户消费金额低、用户主叫分钟少、用户被叫分钟少、短信条数少、上网流量少和上网时长短,与疑似养卡用户的数据特征类似。若样本用户中包括离网用户、无交易金额用户以及无通信数据用户时会被误判为疑似养卡用户,影响识别养卡用户的准确性。因此获取运营商运营的所有用户,删除离网用户、无交易金额用户以及无通信数据用户,得到样本用户。根据样本用户获得疑似养卡用户集合的准确性较高。
从上述实施例可知,通过删除运营商运营的所有用户中的离网用户、无交易金额用户以及无通信数据用户获得样本用户,根据筛选后的样本用户识别养卡用户,提高了识别养卡用户结果的准确性。
图4为本发明实施例提供的养卡用户识别装置的结构示意图。如图4所示,该养卡用户识别装置40包括:获取模块401、处理模块402以及发送模块403。
获取模块401,用于获取样本用户的用户数据,并根据第一预设条件筛选样本用户的用户数据获得疑似养卡用户集合及正常用户集合。
处理模块402,用于获取疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据,对样本数据进行聚类识别养卡用户。
发送模块403,用于将养卡用户的信息发送至运营商监管平台。
在本发明的一个实施例中,处理模块402具体还用于:将初始疑似养卡用户的用户社交数据以及初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点;分别获取每个目标用户与第一中心点和第二中心点之间用户社交数据中所有属性数据的欧氏距离,并根据每个目标用户与第一中心点和第二中心点之间用户社交数据中所有属性数据的欧氏距离确定目标养卡用户集合,目标养卡用户集合中每个目标养卡用户与第一中心点之间的欧氏距离小于所述目标养卡用户与所述第二中心点之间的欧氏距离;根据所述目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户,所述养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离的总合最小。
在本发明的一个实施例中,处理模块902具体还用于:所述用户数据包括用户消费金额、用户主叫分钟、用户被叫分钟、短信条数、上网流量和上网时长;所述第一预设条件的预设阈值包括预设用户消费金额、预设用户主叫分钟、预设用户被叫分钟、预设短信条数、预设上网流量和预设上网时长;所述根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,包括:若所述用户消费金额小于所述预设用户消费金额、所述用户主叫分钟小于所述预设用户主叫分钟、所述用户被叫分钟小于所述预设用户被叫分钟、所述短信条数小于所述预设短信条数、所述上网流量小于所述预设上网流量以及所述上网时长小于所述预设上网时长,则确定所述样本用户为疑似养卡用户,并将所有疑似养卡用户作为疑似养卡用户集合;若所述用户消费金额大于所述预设用户消费金额、所述用户主叫分钟大于所述预设用户主叫分钟、所述用户被叫分钟大于所述预设用户被叫分钟、所述短信条数大于所述预设短信条数、所述上网流量大于所述预设上网流量以及所述上网时长大于所述预设上网时长,则确定所述样本用户为正常用户,并将所有正常用户作为正常用户集合。
在本发明的一个实施例中,处理模块402具体还用于:对所述样本数据的所有属性数据进行归一化处理。
在本发明的一个实施例中,养卡用户识别装置40还包括删除模块:获取运营商运营的所有用户,删除离网用户、无交易金额用户以及无通信数据用户,得到样本用户。
本实施例提供的养卡用户识别装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图5为本发明实施例提供的服务器的硬件结构示意图。如图5所示,本实施例提供的服务器50包括:至少一个处理器501和存储器502。其中,处理器501和存储器502通过总线503连接。
在具体实现过程中,至少一个处理器501执行所述存储器502存储的计算机执行指令,使得至少一个处理器501执行如上服务器50所执行的养卡用户识别方法。
处理器501的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图5所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上服务器执行的养卡用户识别方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上服务器执行的养卡用户识别方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种养卡用户识别方法,其特征在于,包括:
获取样本用户的用户数据,并根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合;
获取所述疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中所述初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所述正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中所述正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户;
将所述养卡用户的信息发送至运营商监管平台;
所述获取所有目标用户的用户社交数据作为目标数据,将所述初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户,包括:
将所述初始疑似养卡用户的用户社交数据以及所述初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点;
分别获取每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有项属性数据的欧式距离,并根据每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有项属性数据的欧式距离确定目标养卡用户集合,所述目标养卡用户集合中每个目标养卡用户与所述第一中心点之间的欧式距离小于所述目标养卡用户与所述第二中心点之间的欧式距离;
根据所述目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户,所述养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离的总合最小。
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括用户消费金额、用户主叫分钟、用户被叫分钟、短信条数、上网流量和上网时长;所述第一预设条件的预设阈值包括预设用户消费金额、预设用户主叫分钟、预设用户被叫分钟、预设短信条数、预设上网流量和预设上网时长;
所述根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,包括:
若所述用户消费金额小于所述预设用户消费金额、所述用户主叫分钟小于所述预设用户主叫分钟、所述用户被叫分钟小于所述预设用户被叫分钟、所述短信条数小于所述预设短信条数、所述上网流量小于所述预设上网流量以及所述上网时长小于所述预设上网时长,则确定所述样本用户为疑似养卡用户,并将所有疑似养卡用户作为疑似养卡用户集合;
若所述用户消费金额大于所述预设用户消费金额、所述用户主叫分钟大于所述预设用户主叫分钟、所述用户被叫分钟大于所述预设用户被叫分钟、所述短信条数大于所述预设短信条数、所述上网流量大于所述预设上网流量以及所述上网时长大于所述预设上网时长,则确定所述样本用户为正常用户,并将所有正常用户作为正常用户集合。
3.根据权利要求1所述的方法,其特征在于,所述用户社交数据包括以下信息中的一种或多种:
用户的参与活动活跃度,是否有亲密联系人,以及用户、用户第一联系人、用户第二联系人、用户第三联系人和用户第一联系人的第一联系人的号码基础信息;其中所述号码基础信息包括号码稳定度、号码是否为三低用户、号码是否低出账用户、号码归属运营商的信用分、号码星级以及号码的前五位联系人中在疑似养卡用户集合中的号码个数。
4.根据权利要求3所述的方法,其特征在于,所述用户社交数据还包括多样度,所述多样度包括主叫号码多样度、被叫号码多样度以及是否有亲密联系人;
所述号码稳定度还包括号码高稳定度、号码中稳定度及号码低稳定度;
所述号码基础信息还包括号码高阶度,所述号码高阶度为所述号码稳定度与所述号码归属运营商的信用分、所述号码星级的乘积以及所述号码的联系人中最常用基站为相同基站的用户数量。
5.根据权利要求1所述的方法,其特征在于,在所述对所述样本数据进行聚类识别养卡用户之前,还包括:
对所述样本数据的所有项属性数据进行归一化处理。
6.根据权利要求1所述的方法,其特征在于,在所述获取样本用户的用户数据之前,还包括:
获取运营商运营的所有用户,删除离网用户、无交易金额用户以及无通信数据用户,得到样本用户。
7.一种养卡用户识别装置,其特征在于,包括:
获取模块,用于获取样本用户的用户数据,并根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合;
识别模块,用于获取所述疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中所述初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取所述正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中所述正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户;
发送模块,用于将所述养卡用户的信息发送至运营商监管平台;
所述识别模块,具体用于:将所述初始疑似养卡用户的用户社交数据以及所述初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点;分别获取每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有项属性数据的欧式距离,并根据每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有项属性数据的欧式距离确定目标养卡用户集合,所述目标养卡用户集合中每个目标养卡用户与所述第一中心点之间的欧式距离小于所述目标养卡用户与所述第二中心点之间的欧式距离;根据所述目标养卡用户集合中每个目标养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离确定养卡用户,所述养卡用户与其他所有目标养卡用户之间用户社交数据中每一项属性数据的欧氏距离的总合最小。
8.一种服务器,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至6任一项所述的养卡用户识别方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至6任一项所述的养卡用户识别方法。
CN202010470197.0A 2020-05-28 2020-05-28 养卡用户识别方法及装置 Active CN111626754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010470197.0A CN111626754B (zh) 2020-05-28 2020-05-28 养卡用户识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010470197.0A CN111626754B (zh) 2020-05-28 2020-05-28 养卡用户识别方法及装置

Publications (2)

Publication Number Publication Date
CN111626754A CN111626754A (zh) 2020-09-04
CN111626754B true CN111626754B (zh) 2023-07-07

Family

ID=72260715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010470197.0A Active CN111626754B (zh) 2020-05-28 2020-05-28 养卡用户识别方法及装置

Country Status (1)

Country Link
CN (1) CN111626754B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113422836B (zh) * 2021-07-01 2022-08-05 中国联合网络通信集团有限公司 养卡用户识别方法、装置、设备以及存储介质
CN114268939B (zh) * 2021-11-12 2024-03-08 重庆市中冉数字科技有限公司 一种移动通信中异常用户识别的方法及智能设备
CN114239823A (zh) * 2021-12-17 2022-03-25 中国电信股份有限公司 号卡用户的行为预测模型的建模、使用方法及相关设备
CN114282940A (zh) * 2021-12-17 2022-04-05 中国电信股份有限公司 用于意图识别的方法及装置、存储介质及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084619A (zh) * 2019-04-03 2019-08-02 中国联合网络通信集团有限公司 养卡行为的识别方法、装置及计算机可读存储介质
WO2020062690A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 基于大数据分析的非法用户识别方法及装置、电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10147049B2 (en) * 2015-08-31 2018-12-04 International Business Machines Corporation Automatic generation of training data for anomaly detection using other user's data samples
US10565272B2 (en) * 2015-10-26 2020-02-18 International Business Machines Corporation Adjusting system actions, user profiles and content in a social network based upon detected skipped relationships

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020062690A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 基于大数据分析的非法用户识别方法及装置、电子设备
CN110084619A (zh) * 2019-04-03 2019-08-02 中国联合网络通信集团有限公司 养卡行为的识别方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN111626754A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111626754B (zh) 养卡用户识别方法及装置
CN110401779B (zh) 一种识别电话号码的方法、装置和计算机可读存储介质
CN106022834B (zh) 广告反作弊方法及装置
CN107248082B (zh) 养卡识别方法及装置
US20210073669A1 (en) Generating training data for machine-learning models
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN110490646A (zh) 汽车品牌目标用户的确定方法及装置
CN110362751B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN113206909A (zh) 骚扰电话拦截方法及装置
CN110611655B (zh) 一种黑名单筛选方法和相关产品
CN109636378B (zh) 账户识别方法和装置、电子设备
CN110929285B (zh) 一种隐私数据的处理方法及装置
CN117611250A (zh) 问卷数据处理方法、装置、计算机设备和存储介质
CN112199388A (zh) 陌电识别方法、装置、电子设备及存储介质
CN110796379B (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN109711984B (zh) 一种基于催收的贷前风险监控方法及装置
CN111062422A (zh) 一种套路贷体系化识别方法及装置
CN113610175B (zh) 一种业务策略生成方法、装置及计算机可读存储介质
CN110210884A (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN114268939B (zh) 一种移动通信中异常用户识别的方法及智能设备
CN112215386A (zh) 一种人员活跃度预测方法、装置和计算机可读存储介质
CN111242147A (zh) 一种亲密联系人和频繁活跃区域识别的方法及装置
CN114912525A (zh) 一种特征的处理方法、装置、电子设备及存储介质
CN114331532A (zh) 一种应用程序账号的会员等级确定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant