CN109145050A - 一种计算设备 - Google Patents
一种计算设备 Download PDFInfo
- Publication number
- CN109145050A CN109145050A CN201811151415.3A CN201811151415A CN109145050A CN 109145050 A CN109145050 A CN 109145050A CN 201811151415 A CN201811151415 A CN 201811151415A CN 109145050 A CN109145050 A CN 109145050A
- Authority
- CN
- China
- Prior art keywords
- user
- account
- information
- fund
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种计算方案,包括:接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;通过所述计算机程序代码将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和账户关联活动信息;提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征,根据提取的特征属性,对所有用户使用聚类算法进行聚类计算;输出聚类计算结果,并存储在所述存储器中。本发明通过提供一种计算设备,实现对用户源数据的自动聚类,从而实现对某一类具有特定属性特征的用户的自动分类。
Description
技术领域
本发明涉及大数据分析领域,尤指一种计算设备。
背景技术
在金融或通信行业中,大数据分析经常被用来对用户的潜在真实需求进行发掘,通过计算设备和计算系统对用户的账户信息数据进行分析,寻找特定的目标用户或者目标用户群,以实现对用户使用金融或通信服务行为的内在需求进行发掘,一方面为用户推荐更为个性化的服务需求,一方面可以识别部分用户的违法欺诈行为。
传统的计算设备和计算系统通过对用户的信息进行一步步筛选过滤的方式进行分析,将相同或者近似的数据进行归类,这种迭代分析过程复杂而繁琐,且当数据量到达一定程度,或复杂程度较高时,分析效率会变得较低。
发明内容
本发明的目的是提供一种计算设备、计算系统,实现对用户源数据的自动聚类,从而实现对某一类具有特定属性特征的用户的自动分类。
本发明提供的技术方案如下:
本发明提供
至少一个处理器;以及
至少一个存储器,其包含计算机程序代码,所述至少一个存储器和所述计算机程序代码经配置以利用所述至少一个处理器使所述设备至少执行:
接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,
其中所述用户的一个或多个基本信息包括用户的身份识别号、与用户身份相关的初始配置信息,所述初始配置信息包括用户的账户信息;
其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;
将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和用户关联活动信息;
提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征,根据提取的特征属性,对所有用户使用聚类算法进行聚类计算;
输出聚类计算结果,并存储在所述存储器中
源数据指金融系统、通信系统(如支付宝、微信、QQ等互动平台)、或网络交易系统(如淘宝、阿里巴巴等)或者出行系统等中已经存储的数据,包括用户的基本身份信息,如身份证号、账户名、账户数、各账户注册时间、各账户注册地点等已经被获取的数据,本发明不限制源数据的来源,任何存在大数据分析的数据平台,平台中的用户信息包括基本信息及活动信息都在本发明数据分析的对象之中。
计算机程序代码指存储于设备的存储器内的进行计算的程序代码,包括接收源数据、分析源数据、转化源数据为图数据、存储转化后的图数据、以及对图数据进行分析和计算的各种程序代码;
图数据指提取一个或多个包含用户的基本信息和账户关联活动信息转化形成的数据库,比如提取用户资金账户、转账金额及转出目标账户等属性信息形成的图数据库。
用户的图结构特征指的是基于转化后的图数据库,使用node2vec算法提取的用户的图结构特征数据。
用户的基本信息指用户在原数据库中存储的一些原始数据信息,比如用户的用户名、身份信息、资金账户余额、手机账户余额,或基于原始数据库可以直接统计计算出的数据,如某时间段内资金账户余额变动次数、手机通话次数等。
用户的账户关联活动信息指用户在日常的经济、社交通信、出行或者网络交易等活动引起的账户中原始信息的更新信息,如更名记录、资金账户余额变动记录、资金账户转账记录、手机账户余额变动记录、手机通话记录等。
聚类计算指针对用户基本信息和/或关联活动的特征属性信息进行计算,将在提取的一个或多个特征属性上拥有相同或相近数据信息的用户进行归类。
进一步地,在上述计算设备中,用户的源数据中的一个或多个基本信息可以包括:
所述用户的资金账户余额;
所述用户的资金账户历史额度信息,所述历史额度信息包括最高历史额度和最低历史额度。
历史额度信息指,从用户注册该资金账户开始,该账户中记录的具有明显特征的额度信息,如最高历史额度、最低历史额度等信息。
进一步地,在上述计算设备中,用户的源数据中的一个或多个和所述用户账户关联活动信息至少包括:
一个或多个与用户的资金账户产生业务往来的账户的基本信息,该信息指与用户账户有联系的第二到第N用户的账户信息;
一个或多个与用户的资金账户产生业务往来的账户的资金交易次数,该次数指用户与第二到第N用户的账户进行的交易的总次数;
一个或多个与用户的资金账户产生业务往来的账户的资金交易时间,该交易时间指用户与第二到第N用户的账户进行的每一次交易的时间;
一个或多个与用户的资金账户产生业务往来的账户的资金交易额度,该额度指用户与第二到第N用户的账户进行的每一次交易的额度,当额度为正时,为转入交易,当额度为负时,为转出交易;
一个或多个与用户的资金账户产生业务往来的账户的资金交易频率,该频率指用户与第二到第N用户的账户进行的预设时间段内交易的次数。
进一步地,在上述计算设备中,将所述源数据转化为图数据存储在所述存储器中,所述图数据至少包括:
所有用户的资金账户和与其产生业务往来的账户的资金交易次数,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的次数等信息;
所有用户的资金账户和与其产生业务往来的账户的资金交易时间,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的时间等信息;
所有用户的资金账户和与其产生业务往来的账户的资金交易额度,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的资金额度等信息;
所有用户的资金账户和与其产生业务往来的账户的资金交易频率,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、预设时间段内交易的时间等信息。
进一步地,在上述计算设备中,所述提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征包括:
所述用户的资金账号开户日期;和/或
所述用户的资金账号开户营业网点代码;和/或
所述用户的资金账户余额;和/或
所述用户的资金账户转账次数;和/或
所述用户的资金账户最高历史额度;和/或
所述用户的资金账户最低历史额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易次数;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易时间;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易频率。
对图数据中的信息属性进行提取,可以根据所需完成聚类的用户类型进行随意组合,例如,选择用户的资金账号开户日期、开户网点、与一个或多个用户的资金账户产生业务往来的账户的资金交易时间等作为提取图数据的信息属性,用以进行聚类计算,可以得出在哪些用户在相近日期、相近网点进行开户,且这些用户与一个或多个用户资金账户产生业务往来的账户的资金交易时间相近,从而将该类用户聚类为某种行为相近的用户群。
进一步地,在上述计算设备中,所述用户的源数据中的一个或多个基本信息还可以包括:
所述用户的手机号码;
所述用户的手机号码常用通话时间,指的是所述用户每次使用通话服务的时间;
所述用户的手机号码常用通话地址代码,指的是所述用户每次使用通话服务时的地址进行相应转化后的代码。
进一步地,在上述计算设备中,所述用户的源数据中的和所述用户账户关联活动信息包括:
一个或多个与所述用户的手机号码通话的目标手机号码的通话频率,该频率指用户与第二到第N用户的手机号码在预设时间按段进行的通话的总次数;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点,该时间点指用户与第二到第N用户的手机号码每次进行的通话的时间点;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长,该时长指用户与第二到第N用户的手机号码每次进行的通话的时长。
进一步地,在上述计算设备中,将所述源数据转化为图数据存储在所述存储器中,所述图数据包括:
所有用户的手机号码通话次数和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的次数等信息;
所有用户的手机号码通话时间点和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的时间点等信息;
所有用户的手机号码通话时长和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的时长等信息。
进一步地,在上述计算设备中,所述提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征至少包括:
所述用户的手机号码常用通话时间;和/或
所述用户的手机号码常用通话地址代码;和/或
一个或多个与所述用户的手机号码通话的目标手机号码;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话频率;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长。
对图数据中的信息属性进行提取,可以根据所需完成聚类的用户类型进行随意组合,例如,选择用户的手机号码常用通话时间、常用通话地址代码、一个或多个与所述用户的手机号码通话的目标手机号码的通话频率、一个或多个与所述用户的手机号码通话的目标手机号码的通话时长等作为提取图数据的信息属性,用以进行聚类计算,可以得出在哪些用户在相近时间点、相近地址,进行了相近频率的手机通话,而且其每次通话时长相近,从而将该类用户聚类为某种行为相近的用户群。
进一步地,在上述计算设备中,所述根据提取的特征属性,对所有用户使用聚类算法进行聚类计算,至少包括:
根据所述提取图数据中的一个或多个基本属性、一个或多个账户关联活动信息属性,使用包括但不限于K-MEANS算法、K-MEDOIDS算法、CLARANS算法对所述所有用户使用聚类算法进行聚类计算。
进一步地,在上述计算设备中,所述输出聚类计算结果,并存储在所述存储器中包括:
通过所述设备自带输出装置对聚类计算结果进行输出;或
发送所述计算结果至具备显示功能的设备中显示。
输出装置指可以进行图像或数据显示的显示屏、或者具备语音播报功能的语音装置。
本发明还提供一种计算系统,包括:
至少一个处理模块;以及
至少一个存储模块,其至少存储有接收源数据、处理源数据为图数据、提取数据、聚类计算等程序代码。
进一步地,在上述计算系统中,所述存储模块至少包括:
至少一个接收子模块;
至少一个数据转化子模块;
至少一个数据提取子模块;
至少一个聚类计算子模块;
至少一个存储子模块。
通过本发明提供的一种计算设备、计算系统,能够带来以下至少一种有益效果:
1、本发明中,通过将源数据转化为图数据,基于图数据对用户的特征信息进行提取,根据提取出的特征进行聚类的方法,实现了输入源数据和需要进行提取的特征属性,自动进行聚类计算并输出计算结果,大大提高了数据分析的效率。
2、本发明中,通过对金融行业、通信平台,网络交易系统、出行系统等等的用户基本数据和活动数据转化为图数据,并基于图数据对用户账户信息、关联账户信息的特征提取,根据提取出的特征进行聚类的方法,实现了根据需求,将含有提取特征属性的用户进行自动聚类的效果,在具体的金融系统反欺诈中,实现自动识别嫌疑用户群的效果。
3、本发明中,通过对同行行业用户数据转化为图数据,并基于图数据对用户的手机号码信息、与其有通话行为的手机号码用户信息的特征提取,根据提取出的特征进行聚类的方法,实现了根据需求,将含有提取特征属性的用户进行自动聚类的效果,在具体的通信行业违法活动侦察中,实现自动识别嫌疑用户群的效果。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种计算设备的一个实施例的结构图;
图2是本发明一种计算设备的另一个实施例的结构图;
图3是本发明一种计算设备的又一个实施例的结构图;
图4是本发明一种计算设备的另一个实施例的结构图。
具体实施方式
在金融或通信行业中,通过计算设备和计算系统对用户的账户信息中海量的数据进行大数据分析,寻找特定的目标用户或者目标用户群,以实现对用户使用金融或通信服务行为内在需求的发掘,一方面是为了给用户推荐更为个性化的服务,一方面可以识别部分用户的违法欺诈行为。
传统的计算设备和计算系统通过对用户的信息进行一步步筛选过滤的方式进行分析,将相同或者近似的数据进行归类,这种迭代分析过程复杂而繁琐,且当数据量到达一定程度,或复杂程度较高时,分析效率会变低。
本发明体提供一种设备、一种系统,基于金融或通信行业的原始数据库,将数据库中的源数据转化为分析效率更高的图结构数据,进而对图数据中的用户信息特征、行为特征进行提取,进一步地,对用户的这些特征进行聚类,从而得到具有一个或多个相同或相似的特征的用户群。本发明大大提高了用户数据分析效率,在金融或通信行业具有丰富的应用场景。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明第一实施例,如图1所示:
本发明的目的是提供一种计算设备、计算系统,实现对用户源数据的自动聚类。
本发明提供的技术方案如下:
本发明提供至少一个处理器;以及
至少一个存储器,其包含计算机程序代码,所述至少一个存储器和所述计算机程序代码经配置以利用所述至少一个处理器使所述设备至少执行:
接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,
其中所述用户的一个或多个基本信息包括用户的身份识别号、与用户身份相关的初始配置信息,所述初始配置信息包括用户的账户信息;
其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;
将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和用户关联活动信息;
提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征,根据提取的特征属性,对所有用户使用聚类算法进行聚类计算;
输出聚类计算结果,并存储在所述存储器中源数据指金融系统、通信系统(如支付宝、微信、QQ等互动平台)、或网络交易系统(如淘宝、阿里巴巴等)或者出行系统等中已经存储的数据,包括用户的基本身份信息,如身份证号、账户名、账户数、各账户注册时间、各账户注册地点等已经被获取的数据,本发明不限制源数据的来源,任何存在大数据分析的数据平台,平台中的用户信息包括基本信息及活动信息都在本发明数据分析的对象之中。该等数据只是其中的举例,并非限定为本发明的具体实施范围,本领域一般技术人员可以知道,任何可以图数据化的一个或者若干个数据,为了避免用户聚类分析,都可被涵盖于本发明的技术思想内。
计算机程序代码指存储于设备的存储器内的进行计算的程序代码,包括接收源数据、提取源数据、转化源数据为图数据、存储转化后的图数据、以及对图数据进行分析和计算的各种程序代码;
图数据指提取一个或多个包含用户的基本信息和账户关联活动信息转化形成的数据库,比如提取用户资金账户、转账金额及转出目标账户等属性信息形成的图数据库。
用户的图结构特征指的是基于转化后的图数据库,使用node2vec算法提取的用户的图结构特征数据。
用户的基本信息指用户在原数据库中存储的一些原始数据信息,比如用户的用户名、身份信息、资金账户余额、手机账户余额,或基于原始数据库可以直接统计计算出的数据,如某时间段内资金账户余额变动次数、手机通话次数等。
用户的账户关联活动信息指用户在日常的经济、通话等活动引起的账户中原始信息的更新信息,如更名记录、资金账户余额变动记录、资金账户转账记录、手机账户余额变动记录、手机通话记录等。
申请人特别指出的是,在金融系统或通信系统、出行系统、网络交易系统中用户账户的上述基本信息或者用户的关联活动信息只是其中的举例,并非限定为本发明的具体实施范围,本领域一般技术人员可以知道,任何可以图数据化的一个或者若干个数据,为了避免用户聚类分析,都可被涵盖于本发明的技术思想内。
聚类计算指针对用户基本信息和/或关联活动的特征属性信息进行计算,将在提取的一个或多个特征属性上拥有相同或相近数据信息的用户进行归类。
具体地,本发明中,通过设备中的对外接口获取源数据,所述的源数据可以是文本数据、社交数据、关系数据、实时流数据和系统日志等,源数据中包含的信息有用户的用户名、身份证号、账户名、账户数、各账户注册时间、各账户注册地点等数据。
通过对外接口获取源数据后,使用存储器中的相应的程序,对源数据进行转化,将其转化为图结构数据,并将图数据存储于存储器当中,在当前图数据中,用户的一个或多个基本信息和账户关联活动信息都被存储。例如,用户的账户名,用户账户关联的活动的具体内容,在一个实施例中,用户账户为手机账户,活动内容为通话,关联活动的目标账户为另一个手机账户,三个因素分别构成图数据的节点、边、终点。
设备完成源数据的导入和转化后,使用存储器中的特征提取程序,对图数据中用户的基本信息特征和关联活动信息特征进行提取。根据提取出的特征属性,对包含所有用户的图数据进行聚类计算,按照相应的特征属性,将图数据分成若干类别,同一类别下的用户相应的特征属性相似,不同类别下的用户相应的特征属性不同。
具体的,在第一实施例中,这些特征属性包括但不限于用户的身份证号,用于鉴别用户的唯一身份信息;
特征属性包括但不限于用户的账号,用于识别用户进行活动所使用的账号信息;
特征属性包括但不限于用户的账号开户日期、开户营业网点地址,用于记录用户账号初始状态信息;
特征属性包括但不限于与用户的账户产生业务往来的账户信息,用来记录用户活动内容的目标对象;
进一步地,特征属性还可以包括用户的账户闲置时长等其他特征属性。
这些特征属性可以进行任意的组合,比如将用户的开户日期、用户的身份证号进行组合,可以计算出开户日期相近、身份证号信息相近的用户群,而身份证号包含用户的出生日期和户籍注册地信息,这样就完成了将户籍地相近、年龄相仿、开户日期相近的用户的聚类,具体地,在一个实施例中,用户账户表现为手机账户,而开户日期临近大学开学日期,那么这种用户群可能代表来自同一地区的大学新生群体。也就是说,通信服务供应商可以通过本发明方便地实现系统中来自同一地区的大学新生群体的聚类分析。
完成聚类计算之后,设备输出计算结果,并将计算结果存储在存储器中。
本发明第二实施例,一种计算设备中用户的源数据中的一个或多个基本信息可以包括:
所述用户的资金账户余额;
所述用户的资金账户历史额度信息,所述历史额度信息包括最高历史额度和最低历史额度。
历史额度信息指,从用户注册该资金账户开始,该账户中记录的具有明显特征的额度信息,如最高历史额度、最低历史额度等信息。
进一步地,在上述计算设备中,用户的源数据中的一个或多个和所述用户账户关联活动信息至少包括:
一个或多个与用户的资金账户产生业务往来的账户的基本信息,该信息指与用户账户有联系的第二到第N用户的账户信息;
一个或多个与用户的资金账户产生业务往来的账户的资金交易次数,该次数指用户与第二到第N用户的账户进行的交易的总次数;
一个或多个与用户的资金账户产生业务往来的账户的资金交易时间,该交易时间指用户与第二到第N用户的账户进行的每一次交易的时间;
一个或多个与用户的资金账户产生业务往来的账户的资金交易额度,该额度指用户与第二到第N用户的账户进行的每一次交易的额度,当额度为正时,为转入交易,当额度为负时,为转出交易;
一个或多个与用户的资金账户产生业务往来的账户的资金交易频率,该频率指用户与第二到第N用户的账户进行的预设时间段内交易的次数。
具体地,第二实施例中,用户账户表现为银行的资金账户,所以其账户的基本信息还包括但不限于用户在该账户下的余额,用户该账户的历史额度信息,进一步地,还包括用户账户的闲置时间(余额未变动时间);其账户的关联活动信息为与该账户产生业务往来的活动信息,即转入或者转出资金等交易活动,以及每一次交易活动发生时的其他相关属性信息,包括但不限于交易的时间、交易的次数、交易的额度、交易的频率等信息。
进一步地,在第二个实施例中,一种计算设备将所述源数据转化为图数据存储在所述存储器中,所述图数据至少包括:
所有用户的资金账户和与其产生业务往来的账户的资金交易次数,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的次数等信息,在一个实施例中,用户资金账户、用户交易次数、用户交易目标账户分别构成图数据的节点、边、终点;
所有用户的资金账户和与其产生业务往来的账户的资金交易时间,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的时间等信息,在一个实施例中,用户资金账户、用户交易时间、用户交易目标账户分别构成图数据的节点、边、终点;
所有用户的资金账户和与其产生业务往来的账户的资金交易额度,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的资金额度等信息,在一个实施例中,用户资金账户、用户交易额度、用户交易目标账户分别构成图数据的节点、边、终点;
所有用户的资金账户和与其产生业务往来的账户的资金交易频率,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、预设时间段内交易的时间等信息,在一个实施例中,用户资金账户、用户交易频次、用户交易目标账户分别构成图数据的节点、边、终点。
在第二个实施例中,上述计算设备提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征包括:
所述用户的资金账号开户日期;和/或
所述用户的资金账号开户营业网点代码;和/或
所述用户的资金账户余额;和/或
所述用户的资金账户转账次数;和/或
所述用户的资金账户最高历史额度;和/或
所述用户的资金账户最低历史额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易次数;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易时间;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易频率。
对图数据中的信息属性进行提取,可以根据所需完成聚类的用户类型进行随意组合,例如,选择用户的资金账号开户日期、开户网点、与一个或多个用户的资金账户产生业务往来的账户的资金交易时间等作为提取图数据的信息属性,用以进行聚类计算,可以得出哪些用户在相近日期、相近网点进行开户,且这些用户与一个或多个用户资金账户产生业务往来的账户的资金交易时间相近,从而将该类用户聚类为某种行为相近的用户群。
在第二实施例中,还可以通过提取用户身份信息、与一个或多个用户的资金账户产生业务往来的账户的资金交易额度、与一个或多个用户的资金账户产生业务往来的账户的资金交易时间、与一个或多个用户的资金账户产生业务往来的账户的资金交易频率、闲置时长等特征属性,用以进行聚类计算,可以得出哪些用户在交易额度、时间、频率、闲置时长上类似,当上述特征属性数据符合某个洗钱网络的数据特征时,判断该用户群可能是洗钱网络用户群。
本发明第三实施例,一种计算设备中所述用户的源数据中的一个或多个基本信息还可以包括:
所述用户的手机号码;
所述用户的手机号码常用通话时间,指的是所述用户每次使用通话服务的时间;
所述用户的手机号码常用通话地址代码,指的是所述用户每次使用通话服务时的地址进行相应转化后的代码。
进一步地,在上述计算设备中,所述用户的源数据中的和所述用户账户关联活动信息包括:
一个或多个与所述用户的手机号码通话的目标手机号码的通话频率,该频率指用户与第二到第N用户的手机号码在预设时间按段进行的通话的总次数;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点,该时间点指用户与第二到第N用户的手机号码每次进行的通话的时间点;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长,该时长指用户与第二到第N用户的手机号码每次进行的通话的时长。
具体地,第三实施例中,用户账户表现为手机账户,所以其账户的基本信息还包括但不限于用户的手机号码,用户常用通话时间,用户常用通话地址代码,其中用户通话时间用以确定用户在何时进行通话,用户常用通话地址代码用以确定用户在什么地方进行通话;其账户的关联活动信息还包括用户与一个或多个目标用户通话的频率、时间点、时长,这些特征数据用以确定用户在通话活动中的习惯特征。
进一步地,在第三个实施例中,一种计算设备将所述源数据转化为图数据存储在所述存储器中,所述图数据包括:
所有用户的手机号码通话次数和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的次数等信息,在一个实施例中,用户手机号码、用户通话次数、用户通话目标手机号码分别构成图数据的节点、边、终点;
所有用户的手机号码通话时间点和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的时间点等信息,在一个实施例中,用户手机号码、用户通话时间点、用户通话目标手机号码分别构成图数据的节点、边、终点;
所有用户的手机号码通话时长和通话目标手机号码,即是指转化后的图数据记录的数据为用户手机号码、用户通话的目标手机号码、通话的时长等信息,在一个实施例中,用户手机号码、用户通话时长、用户通话目标手机号码分别构成图数据的节点、边、终点。
在第三个实施例中,上述计算设备提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征至少包括:
所述用户的手机号码常用通话时间;和/或
所述用户的手机号码常用通话地址代码;和/或
一个或多个与所述用户的手机号码通话的目标手机号码;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话频率;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点;和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长。
对图数据中的信息属性进行提取,可以根据所需完成聚类的用户类型进行随意组合,例如,选择用户的手机号码常用通话时间、常用通话地址代码、一个或多个与所述用户的手机号码通话的目标手机号码的通话频率、一个或多个与所述用户的手机号码通话的目标手机号码的通话时长等作为提取图数据的信息属性,用以进行聚类计算,可以得出在哪些用户在相近时间点、相近地址,进行了相近频率的手机通话,而且其每次通话时长相近,从而将该类用户聚类为某种行为相近的用户群。具体地,在进行电话诈骗网络侦察时,对于在相近的可疑时间点、相近的可疑地址,进行了相近可疑频率的手机通话,且每次通话时长相近的用户群,可能是某个有组织的电信诈骗群。
本发明第四实施例,一种计算设备,根据提取的图数据特征属性,对所有用户使用聚类算法进行聚类计算,至少包括:
根据所述提取图数据中的一个或多个基本属性、一个或多个账户关联活动信息属性,使用包括但不限于K-MEANS算法、K-MEDOIDS算法、CLARANS算法对所述所有用户使用聚类算法进行聚类计算。
进一步地,在上述计算设备中,所述输出聚类计算结果,并存储在所述存储器中包括:
通过所述设备自带输出装置对聚类计算结果进行输出;或
发送所述计算结果至具备显示功能的设备中显示。
输出装置指可以进行图像或数据显示的显示屏、或者具备语音播报功能的语音装置、或者具备通信功能的通信装置。
设备如果包括一显示装置,通过显示装置直接显示计算结果;设备如果包括一语音装置,通过语音装置播报计算结果;设备如果包括通信装置,通过通信装置将计算结果发送至其他设备。
本发明第五实施例,一种计算系统,包括:
至少一个处理模块;以及
至少一个存储模块,其至少存储有接收源数据、处理源数据为图数据、提取数据、聚类计算等程序代码。
进一步地,在上述计算系统中,所述存储模块至少包括:
至少一个接收子模块;
至少一个数据转化子模块;
至少一个数据提取子模块;
至少一个聚类计算子模块;
至少一个存储子模块。
具体地,本实施例为上述第一实施例的系统实施例,其原理相似,效果参见上述第一实施例,在此不作赘述。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种计算设备,其特征在于,包括:
至少一个处理器;以及
至少一个存储器,其包含计算机程序代码,所述至少一个存储器和所述计算机程序代码经配置以利用所述至少一个处理器使所述设备至少执行:
接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,
其中所述用户的一个或多个基本信息包括用户的身份识别信息、与用户身份相关的初始配置信息,所述初始配置信息包括用户的账户信息;
其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;
将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和用户关联活动信息;
提取图数据中用户的图结构特征、一个或多个基本信息特征、一个或多个账户关联活动信息特征,根据提取的特征属性,对所有用户使用聚类算法进行聚类计算;
输出聚类计算结果,并存储在所述存储器中。
2.根据权利要求1所述的一种计算设备,其特征在于,所述用户的源数据中的一个或多个基本信息还包括:
所述用户的资金账户余额或
所述用户的资金账户历史额度信息,所述历史额度信息包括最高历史额度和最低历史额度。
3.根据权利要求2所述的一种计算设备,其特征在于,所述用户的源数据中的一个或多个和所述用户账户关联活动信息包括:
一个或多个与用户的账户产生业务往来的账户的基本信息、
一个或多个与用户的账户产生业务往来的账户的通信次数或资金交易次数、
一个或多个与用户的账户产生业务往来的账户的资金交易时间、
一个或多个与用户的账户产生业务往来的账户的资金交易额度、
或者一个或多个与用户的账户产生业务往来的账户的资金交易频率、或者一个或多个用户自身的活动信息。
4.根据权利要求2所述的一种计算设备,其特征在于,将所述源数据转化为图数据存储在所述存储器中,所述图数据包括以下信息中的一个或多个:
所有用户的账户和与其产生业务往来的账户的资金交易次数;
所有用户的账户和与其产生业务往来的账户的资金交易时间;
所有用户的账户和与其产生业务往来的账户的资金交易额度;
所有用户的账户和与其产生业务往来的账户的资金交易频率。
5.根据权利要求1到4任意一项所述的一种计算设备,其特征在于,所述提取图数据中用户的一个或多个基本信息特征、一个或多个账户关联活动信息特征包括:
提取所述用户的资金账号开户日期,和/或
所述用户的资金账号开户营业网点代码;和/或
所述用户的资金账户余额;和/或
所述用户的资金账户转账次数;和/或
所述用户的资金账户最高历史额度;和/或
所述用户的资金账户最低历史额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易次数;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易时间;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易额度;和/或
一个或多个与用户的资金账户产生业务往来的账户的资金交易频率。
6.根据权利要求1所述的一种计算设备,其特征在于,所述用户的源数据中的一个或多个基本信息还包括:
所述用户的手机号码、
所述用户的手机号码常用通话时间、或
所述用户的手机号码常用通话地址代码。
7.根据权利要求6所述的一种计算设备,其特征在于,所述源数据中,用户一个或多个的账户关联活动信息包括:
一个或多个与所述用户的手机号码通话的目标手机号码的通话次数;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点;
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长。
8.根据权利要求7所述的一种计算设备,其特征在于,将所述源数据转化为图数据存储在所述存储器中,所述图数据还包括:
所有用户的手机号码通话次数和通话目标手机号码;
所有用户的手机号码通话时间点和通话目标手机号码;
所有用户的手机号码通话时长和通话目标手机号码。
9.根据权利要求1、权利要求6至8任意一项所述的一种计算设备,其特征在于,所述提取图数据中用户的一个或多个基本信息特征、一个或多个账户关联活动信息特征包括:
提取所述用户的手机号码,和/或
所述用户的手机号码常用通话时间,和/或
所述用户的手机号码常用通话地址代码;
和/或
一个或多个与所述用户的手机号码通话的目标手机号码,和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话频率,和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时间点,和/或
一个或多个与所述用户的手机号码通话的目标手机号码的通话时长。
10.根据权利要求9所述的一种计算设备,其特征在于,所述根据提取的特征属性,对所有用户使用聚类算法进行聚类计算具体包括:
根据所述提取图数据中的一个或多个基本属性、一个或多个账户关联活动信息属性,使用包括但不限于K-MEANS算法、K-MEDOIDS算法、CLARANS算法对所述所有用户使用聚类算法进行聚类计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811151415.3A CN109145050B (zh) | 2018-09-29 | 2018-09-29 | 一种计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811151415.3A CN109145050B (zh) | 2018-09-29 | 2018-09-29 | 一种计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109145050A true CN109145050A (zh) | 2019-01-04 |
CN109145050B CN109145050B (zh) | 2022-04-01 |
Family
ID=64813992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811151415.3A Active CN109145050B (zh) | 2018-09-29 | 2018-09-29 | 一种计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145050B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903098A (zh) * | 2019-03-12 | 2019-06-18 | 安徽赛迪信息技术有限公司 | 一种客户身份识别和自动归类系统 |
CN110134701A (zh) * | 2019-04-30 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 一种缓冲补账方法及装置 |
CN110647522A (zh) * | 2019-09-06 | 2020-01-03 | 中国建设银行股份有限公司 | 一种数据挖掘方法、装置及其系统 |
CN110675196A (zh) * | 2019-09-27 | 2020-01-10 | 中国工商银行股份有限公司 | 用户识别方法、装置、电子设备和存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074870A1 (en) * | 2004-09-30 | 2006-04-06 | Microsoft Corporation | Query graphs |
CN101790743A (zh) * | 2007-08-03 | 2010-07-28 | 奥马尔科网络解决方案有限公司 | 处置多功能交易的系统及方法 |
CN102200988A (zh) * | 2010-03-01 | 2011-09-28 | 微软公司 | 具有推荐的社交网络系统 |
CN102496109A (zh) * | 2011-12-29 | 2012-06-13 | 湖南省通信产业服务有限公司 | 一种移动金融服务系统及方法 |
CN103606079A (zh) * | 2013-11-27 | 2014-02-26 | 南通芯迎设计服务有限公司 | 一种基于近场通信的结账方法 |
CN104376456A (zh) * | 2013-08-12 | 2015-02-25 | 黄金富知识产权咨询(深圳)有限公司 | 结合实时通信和语音通话的移动转账系统和相应方法 |
CN105208179A (zh) * | 2014-06-06 | 2015-12-30 | 北京壹人壹本信息科技有限公司 | 电话号码识别方法、系统及电子产品 |
CN105719180A (zh) * | 2014-12-05 | 2016-06-29 | 阿里巴巴集团控股有限公司 | 交易账户的自动分类方法及其装置 |
CN105894376A (zh) * | 2016-03-07 | 2016-08-24 | 浙江爱贷金融服务外包股份有限公司 | 一种金融账户资金管理系统及方法 |
CN105913235A (zh) * | 2016-04-21 | 2016-08-31 | 中国农业银行股份有限公司 | 一种客户转账关系分析方法及系统 |
US20170060661A1 (en) * | 2013-04-29 | 2017-03-02 | Moogsoft, Inc. | System for decomposing events from managed infrastructures |
CN106549974A (zh) * | 2016-12-06 | 2017-03-29 | 北京知道创宇信息技术有限公司 | 预测社交网络账户是否恶意的设备、方法及系统 |
US20170091246A1 (en) * | 2015-09-25 | 2017-03-30 | Microsoft Technology Licensing, Llc | Distributed graph database |
CN107330115A (zh) * | 2017-07-12 | 2017-11-07 | 广东工业大学 | 一种信息推荐方法及装置 |
CN107730262A (zh) * | 2017-10-23 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种欺诈识别方法和装置 |
CN107835113A (zh) * | 2017-07-05 | 2018-03-23 | 中山大学 | 一种基于网络映射的社交网络中异常用户检测方法 |
CN108280755A (zh) * | 2018-02-28 | 2018-07-13 | 阿里巴巴集团控股有限公司 | 可疑洗钱团伙的识别方法和识别装置 |
-
2018
- 2018-09-29 CN CN201811151415.3A patent/CN109145050B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074870A1 (en) * | 2004-09-30 | 2006-04-06 | Microsoft Corporation | Query graphs |
CN101790743A (zh) * | 2007-08-03 | 2010-07-28 | 奥马尔科网络解决方案有限公司 | 处置多功能交易的系统及方法 |
CN102200988A (zh) * | 2010-03-01 | 2011-09-28 | 微软公司 | 具有推荐的社交网络系统 |
CN102496109A (zh) * | 2011-12-29 | 2012-06-13 | 湖南省通信产业服务有限公司 | 一种移动金融服务系统及方法 |
US20170060661A1 (en) * | 2013-04-29 | 2017-03-02 | Moogsoft, Inc. | System for decomposing events from managed infrastructures |
CN104376456A (zh) * | 2013-08-12 | 2015-02-25 | 黄金富知识产权咨询(深圳)有限公司 | 结合实时通信和语音通话的移动转账系统和相应方法 |
CN103606079A (zh) * | 2013-11-27 | 2014-02-26 | 南通芯迎设计服务有限公司 | 一种基于近场通信的结账方法 |
CN105208179A (zh) * | 2014-06-06 | 2015-12-30 | 北京壹人壹本信息科技有限公司 | 电话号码识别方法、系统及电子产品 |
CN105719180A (zh) * | 2014-12-05 | 2016-06-29 | 阿里巴巴集团控股有限公司 | 交易账户的自动分类方法及其装置 |
US20170091246A1 (en) * | 2015-09-25 | 2017-03-30 | Microsoft Technology Licensing, Llc | Distributed graph database |
CN105894376A (zh) * | 2016-03-07 | 2016-08-24 | 浙江爱贷金融服务外包股份有限公司 | 一种金融账户资金管理系统及方法 |
CN105913235A (zh) * | 2016-04-21 | 2016-08-31 | 中国农业银行股份有限公司 | 一种客户转账关系分析方法及系统 |
CN106549974A (zh) * | 2016-12-06 | 2017-03-29 | 北京知道创宇信息技术有限公司 | 预测社交网络账户是否恶意的设备、方法及系统 |
CN107835113A (zh) * | 2017-07-05 | 2018-03-23 | 中山大学 | 一种基于网络映射的社交网络中异常用户检测方法 |
CN107330115A (zh) * | 2017-07-12 | 2017-11-07 | 广东工业大学 | 一种信息推荐方法及装置 |
CN107730262A (zh) * | 2017-10-23 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种欺诈识别方法和装置 |
CN108280755A (zh) * | 2018-02-28 | 2018-07-13 | 阿里巴巴集团控股有限公司 | 可疑洗钱团伙的识别方法和识别装置 |
Non-Patent Citations (2)
Title |
---|
T. K. THIVAKARAN 等: ""Probable Sequence Determination Using Incremental Association Rule Mining and Transaction Clustering"", 《2009 INTERNATIONAL CONFERENCE ON ADVANCES IN COMPUTING, CONTROL, AND TELECOMMUNICATION TECHNOLOGIES》 * |
顾洪博: ""改进的聚类分析算法的研究"", 《黑龙江科技信息 》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903098A (zh) * | 2019-03-12 | 2019-06-18 | 安徽赛迪信息技术有限公司 | 一种客户身份识别和自动归类系统 |
CN110134701A (zh) * | 2019-04-30 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 一种缓冲补账方法及装置 |
CN110134701B (zh) * | 2019-04-30 | 2023-10-27 | 创新先进技术有限公司 | 一种缓冲补账方法及装置 |
CN110647522A (zh) * | 2019-09-06 | 2020-01-03 | 中国建设银行股份有限公司 | 一种数据挖掘方法、装置及其系统 |
CN110675196A (zh) * | 2019-09-27 | 2020-01-10 | 中国工商银行股份有限公司 | 用户识别方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109145050B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145050A (zh) | 一种计算设备 | |
US11809458B2 (en) | System and method for providing database abstraction and data linkage | |
Singh | Leapfrogging development?: the political economy of telecommunications restructuring | |
CN110782335B (zh) | 基于人工智能处理信贷数据的方法、装置及存储介质 | |
CN110070364A (zh) | 基于图模型检测团伙欺诈的方法和装置、存储介质 | |
CN108921686A (zh) | 一种个人用户的信用评分方法和装置 | |
CN109389501A (zh) | 一种计算设备、计算系统 | |
CN111833871A (zh) | 基于意图识别的智能外呼系统及其方法 | |
CN108416670A (zh) | 信贷配单方法及服务器 | |
CN108833720A (zh) | 诈骗电话号码识别方法与系统 | |
CN109711801A (zh) | 一种网银对账方法及装置 | |
CN111383093A (zh) | 账单逾期智能催收方法及系统 | |
CN109688047A (zh) | 基于xml的消息适配方法、设备和存储介质 | |
CN108989581A (zh) | 一种用户风险识别方法、装置及系统 | |
CN107563588A (zh) | 一种个人信用的获取方法和获取系统 | |
CN111861717A (zh) | 一种合约账户的管理方法、装置、设备及存储介质 | |
CN114398512A (zh) | 一种基于大数据的通信运营商行业客户语音画像分析方法 | |
CN106293354A (zh) | 快捷菜单自适应显示控制方法、服务器及便携式终端 | |
CN109871129B (zh) | 人机交互方法、装置、客服设备和存储介质 | |
CN113556430B (zh) | 外呼系统和外呼方法 | |
CN109639918A (zh) | 软电话通信方法、装置、设备及计算机可读存储介质 | |
CN109858901A (zh) | 基于手机信令大数据的移动用户支付识别方法 | |
CN108564380B (zh) | 一种基于迭代决策树的电信用户分类方法 | |
CN112241760A (zh) | 网络小额贷款服务中的黑中介自动挖掘方法与系统 | |
CN111222844A (zh) | 一种智能化信息共享管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |