CN113486072A - 数据分析方法、装置、电子设备及计算机可读存储介质 - Google Patents

数据分析方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113486072A
CN113486072A CN202010187576.9A CN202010187576A CN113486072A CN 113486072 A CN113486072 A CN 113486072A CN 202010187576 A CN202010187576 A CN 202010187576A CN 113486072 A CN113486072 A CN 113486072A
Authority
CN
China
Prior art keywords
data
user
short message
analyzed
different business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010187576.9A
Other languages
English (en)
Other versions
CN113486072B (zh
Inventor
黄庆荣
林恪
卢美倩
谢振锋
郑志欢
李井生
陈钰铖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Fujian Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Fujian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Fujian Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010187576.9A priority Critical patent/CN113486072B/zh
Publication of CN113486072A publication Critical patent/CN113486072A/zh
Application granted granted Critical
Publication of CN113486072B publication Critical patent/CN113486072B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请公开一种数据分析方法、装置、电子设备及计算机可读存储介质。其中,通过将异业客户提供的异业数据中的消息时间序列与运营商短消息库中的短消息的消息时间序列进行匹配,进而根据匹配得到的短消息对应的基站地址对异业数据的健康度进行分析,以在实现对异业数据的有效分析的同时,避免泄露用户隐私。

Description

数据分析方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及通信技术领域,具体而言,涉及一种数据分析方法、装置、电子设备及计算机可读存储介质。
背景技术
相关技术中,在对异业用户提供的待分析用户对应的异业数据进行数据健康性分析时,需要基于用户手机号实现,但如果异业客户提供包含用户手机号的异业数据给数据分析方,将会导致用户隐私泄露。
发明内容
对于上述问题,本申请实施例提供了一种数据分析方法、装置、电子设备及计算机可读存储介质,具体如下。
第一方面,本申请实施例提供一种数据分析方法,包括:
获取异业客户提供的待分析的异业数据,所述异业数据中包括多个消息时间序列,所述消息时间序列为所述异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间;
将所述多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识作为所述待分析用户的用户标识,以及将匹配得到的短消息中的端口号作为行业端口号;
根据所述行业端口号和所述待分析用户的用户标识从所述运营商短消息库中提取出与所述待分析用户对应的短消息,形成短消息数据集;
根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据;
基于所述用户位置数据对所述异业数据的健康性进行分析。
进一步,作为一种可能的实现方式,所述异业数据中还包括待分析的指定地址,在执行所述根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据的步骤之前,所述方法还包括:
基于各所述短消息对应的基站位置与所述指定地址之间的距离,从所述短消息数据集中剔除所述距离大于第一预设值的基站位置对应的短消息。
进一步,作为一种可能的实现方式,根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据的步骤,包括:
分别获取所述短消息数据集中的各所述短消息对应的基站位置,形成位置数据集;
从所述位置数据集中选取出现概率最大的基站位置,作为所述待分析用户的常驻位置,以及将所述位置数据集中除所述常驻位置之外的位置作为待分析位置。
进一步,作为一种可能的实现方式,所述基于所述用户位置数据对所述异业数据的健康性进行分析的步骤,包括:
获取所述待分析位置在所述位置数据集中的概率值;
当在所述概率值大于第二预设值时,判定所述待分析用户对应的异业数据存在健康风险。
进一步,作为一种可能的实现方式,所述异业数据中还包括待分析的指定地址,所述基于所述用户位置数据对所述异业数据的健康性进行分析的步骤,包括:
将所述用户位置数据与所述指定地址进行比对;
在比对结果为所述用户位置数据与所述指定地址不匹配时,判定所述待分析用户对应的异业数据存在健康风险。
进一步,作为一种可能的实现方式,所述指定地址为商户地址或POS机备案地址。
第二方面,本申请实施例还提供一种数据分析装置,包括:
异业数据获取模块,用于获取异业客户提供的待分析的异业数据,所述异业数据中包括多个消息时间序列,所述消息时间序列为所述异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间;
端口号确定模块,用于将所述多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识以及端口号作为所述待分析用户的行业端口号和用户标识;
短消息提取模块,用于根据所述行业端口号和所述待分析用户的用户标识从所述运营商短消息库中提取出与所述待分析用户对应的短消息,形成短消息数据集;
位置确定模块,用于根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据;
健康性分析模块,用于基于所述用户位置数据对所述异业数据的健康性进行分析。
进一步,作为一种可能的实现方式,所述装置还包括:
数据清洗模块,用于在所述异业数据中还包括待分析的指定地址时,基于各所述短消息对应的基站位置与所述指定地址之间的距离,从所述短消息数据集中剔除所述距离大于第一预设值的基站位置对应的短消息。
第三方面,本申请实施例还提供一种电子设备,包括:
至少一个处理器;
与所述处理器连接的至少一个存储器;
其中,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上所述的方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述存储介质存储有计算机指令,所述计算机指令使所述计算机执行如上所述的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过将异业客户提供的异业数据中的消息时间序列与运营商短消息库中的短消息的消息时间序列进行匹配,进而根据匹配得到的短消息对应的基站地址对异业数据的健康度进行分析,能够在实现对用户数据的健康度的有效判断的同时,避免用户隐私泄露的问题发生。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的数据分析方法的流程示意图。
图2为本申请实施例提供的数据分析方法的另一流程示意图。
图3为本申请实施例提供的数据分析装置的框图。
图4为本申请实施例提供的电子设备的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
目前,在异业客户的授权下,数据分析方可通过与异业客户之间建立的数据接入服务获取待分析用户的异业数据,例如,用户ID、用户手机号、消费时间等,进而通过将异业数据中包含的用户手机号与运营商中的用户手机号进行关联匹配,根据匹配结果查询用户位置数据、用户标签等,以分析异业数据的数据健康度,例如,用户在哪里消费、是否存在跨行业消费等。
但是,以异业客户为金融行业中的银行客户为例,考虑到金融行业必须保护用户隐私,不能提供包含用户隐私的异业数据(如用户手机号等)给数据分析方(如通信运营商),否则,会存在泄露用户隐私的问题发生。
鉴于此,本申请给出一种数据分析方法、装置、电子设备及计算机可读存储介质,可通过异业客户提供的消息时间序列(消息指纹)实现对用户数据的健康性的分析,有效避免了用户隐私泄露问题的发生。下面结合附图对本申请给出的技术方案进行详细说明。
如图1所示,为本申请实施例提供的数据分析方法的流程示意图,该数据分析方法可以由,但不限于电子设备执行,如服务器、电脑等,具体可以由电子设备中的软件或/和硬件实现。请再次参阅图1,数据分析方法包括如下步骤。
S11,获取异业客户提供的待分析的异业数据,异业数据中包括多个消息时间序列,消息时间序列为异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间。
需要说明的是,异业客户以及异业数据中的“异业”是指不同的业务,例如,假设数据分析方为通信运营商,那么,如金融行业中的银行客户等相对于通信运营商而言均是涉及不同业务的异业客户,异业客户提供的用户数据为异业数据,如在银行办理金融业务的用户的业务数据等。
相对于直接将包括用户手机号、身份证号、姓名等信息的异业数据提供给数据分析方而言,本实施例中给出的异业数据中仅包括了一些私密等级相对较低的用户信息,例如,可以包括异业客户与待分析用户之间进行信息收发时的消息时间序列、发卡行信息等,以实现对用户隐私的保护,本实施例在此不做限制。
另外,预设时间段可以是一个月、一年等。
S13,将多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识作为待分析用户的用户标识,以及将匹配得到的短消息中的端口号作为行业端口号。
其中,行业端口号是指异业客户与待分析用户进行通信时所使用的号码,如农业银行的行业端口号为95599、建设银行的行业端口号为95533等。
由于一个异业客户同时可能与多个不同的用户之间存在信息往来,因此,为了提高确定得到的行业端口号的准确性,本实施例中,异业客户提供给数据分析方的消息时间序列可以为一段时间内的多个短消息对应的多个连续消息时间序列,如1万个时间序列等,以确保后续数据分析的准确性。
示例性地,假设异业数据中包括的消息时间序列为A1、A2、A3、A4、……、A10000,电子设备通过将A1、A2、A3、A4、……、A10000与运营商短消息库中的短消息的消息时间序列进行匹配,若能匹配到与A1、A2、A3、A4、……、A10000相同的时间序列,如匹配到的消息时间序列为B1、B2、B3、B4、……、B10000,可将B1、B2、B3、B4、……、B10000这些消息时间序列对应的短消息上的行业端口号作为异业客户的行业端口号,将短消息对应的用户标识作为待分析用户的用户标识。可以理解的是,行业端口号是异业客户与待分析用户进行通信时的号码,用户标识为待分析用户的唯一标识信息,如用户卡号、用户名称、用户身份证号、用户手机号等。
应注意的是,在进行消息时间序列匹配时,如果匹配度大于预设值(如95%、99%等)时,也可以判定为匹配成功,从而提高数据分析过程中的容错性,避免由于数据缺失导致的数据分析无效等问题发生。例如,延续上述示例,如果电子设备将A1、A2、A3、A4、……、A10000与运营商短消息库中的短消息的消息时间序列进行匹配,由于运营商短消息库中存在个别短消息的缺失,导致消息时间序列A4未匹配到,但除A4之外的消息时间序列均能够匹配到,那么也可判定为匹配成功。
S15,根据行业端口号和待分析用户的用户标识从运营商短消息库中提取出与待分析用户对应的短消息,形成短消息数据集。
S17,根据短消息数据集中的各短消息对应的基站位置确定待分析用户的用户位置数据。
本申请中是利用基站实现短消息收发的特性来实现用户位置数据的确定,如通过收发短消息的基站的基站位置来确定用户位置数据。作为一种可能的实现方式,S17可通过S171和S173实现,内容如下。
S171,分别获取短消息数据集中的各短消息对应的基站位置,形成位置数据集。
S173,从位置数据集中选取出现概率最大的基站位置,作为待分析用户的常驻位置,以及将位置数据集中除常驻位置之外的位置作为待分析位置。
示例性地,假设位置数据集中包括有W1、W1、W1、W2、W1、W1、W3、W1、W1、W1共10个位置数据,其中,位置W1出现有8次,也就是说,W1是出现概率最大的基站位置,因此,W1为常驻位置,W2、W3为待分析位置。
S19,基于用户位置数据对异业数据的健康性进行分析。
在基于用户位置数据对异业数据的健康性进行分析时,可以如S191和193中所示的常驻位置与待分析位置进行分析,也可以如S195和S197中所示的基于异业数据中包括的指定地址以及S17中得到的用户位置数据进行分析,内容如下。
示例1
S191,获取待分析位置在位置数据集中的概率值;
S193,当在概率值大于第二预设值时,判定待分析用户对应的异业数据存在健康风险。
假设通过异业数据的分析获取用户使用POS机的过程是否正常(应注意,待分析用户使用POS机的位置与待分析用户收到的异业客户发送的短信的位置相同),那么,由S17分析可知,待分析用户使用POS机的常驻位置为W1,但由于待分析用户在W2、W3等待分析位置处也使用POS机,且占比大于第二预设值(如2%),因此,考虑到待分析用户使用POS机的位置偏离了常驻位置,从而判定待分析用户存在非法使用POS机的行为,如跨行业、跨区域盗刷等,也就是异业数据存在健康风险。
示例2
S195,将用户位置数据与指定地址进行比对;其中,指定地址为包含在异业数据中,由异业客户提供的待分析用户的商铺地址、POS机备案地址等。
S197,在比对结果为用户位置数据与指定地址不匹配时,判定待分析用户对应的异业数据存在健康风险。
依旧延用示例1,考虑到金融行业中,为了规范POS机的使用,防止盗刷等问题出现,目前,在POS机使用前,使用该POS机的用户(如商部、超市等)需要对POS机的使用地址进行备案。对此,本实施例中可将S17中分析得到的用户位置数据与指定地址(如POS机的备案地址)进行比对,假设指定地址为W1,而分析得到的用户地址为W1、W2、W3等,由于分析得到的用户位置数据与指定地址并不匹配,从而判定待分析用户存在非法使用POS机的行为,如跨行业、跨区域盗刷等,也就是异业数据存在健康风险。
除上述两种实现方式之外,本实施例给出的数据分析方法还可在不同的应用场景中使用,本实施例对此不做限制。
由前述内容可以看出,通过异业客户提供的消息时间序列和运营商短消息库中的短信消息长期进行匹配,尤其在待分析用户对应的短消息的量足够多时,便能形成待分析用户(运营商用户)独有的短信指纹,就可以与异业客户进行关联匹配,而不需要通过用户手机号进行匹配以进行数据健康度分析,从而达到保护客户隐私的要求。
进一步,作为一种可能的实现方式,为了提高数据分析结果的准确性,在执行S17之前,数据分析方法还包括图2所示的S16,内容如下。
S16,基于各短消息对应的基站位置与指定地址之间的距离,从短消息数据集中剔除距离大于第一预设值的基站位置对应的短消息。
通过S16给出的方法,能够有效的从各短消息中剔除干扰短信,有效提高数据匹配度,进一步确保数据分析结果的准确性。应注意,第一预设值的大小可根据需求设计,本实施例在此不做限制。
由前述给出的数据分析方法可以看出,本申请至少具有以下技术效果:
通过将异业客户提供的异业数据中的消息时间序列与运营商短消息库中的短消息的消息时间序列进行匹配,进而根据匹配得到的短消息对应的基站地址对异业数据的健康度进行分析,在实现对用户数据的健康度的有效判断的同时,避免了用户隐私泄露的问题发生。
此外,本申请中还通过指定地址与基站位置之间的距离从短信数据中剔除无效的短信数据,进一步提高了数据分析结果的可靠性。
实施例二
如图3所示,为根据一示例性实施例示出的一种数据分析装置100的框图,该数据分析装置100可应用于电子设备。参照图3,数据分析装置100包括异业数据获取模块110、端口号确定模块120、短消息提取模块130、位置确定模块140和健康性分析模块130。
异业数据获取模块110,用于获取异业客户提供的待分析的异业数据,异业数据中包括多个消息时间序列,消息时间序列为异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间;
端口号确定模块120,用于将多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识作为待分析用户的用户标识,以及将匹配得到的短消息中的端口号作为行业端口号;
短消息提取模块130,用于根据行业端口号和所述待分析用户的用户标识从运营商短消息库中提取出与待分析用户对应的短消息,形成短消息数据集;
位置确定模块140,用于根据短消息数据集中的各短消息对应的基站位置确定待分析用户的用户位置数据;
健康性分析模块150,用于基于用户位置数据对异业数据的健康性进行分析。
进一步,作为一种可能的实现方式,装置100还可包括:
数据清洗模块,用于在异业数据中还包括待分析的指定地址时,基于各短消息对应的基站位置与指定地址之间的距离,从短消息数据集中剔除距离大于第一预设值的基站位置对应的短消息。
关于本实施例中的装置100,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。例如,关于参数获取模块110的详细描述可参照前述实施例一中对S11的描述、关于参数调节模块120的详细描述可参照前述实施例一中对S13的描述等。
实施例三
请参阅图4,为根据一实施例性实施例提供的一种电子设备10的框图,该电子设备10可至少包括处理器11,用于存储处理器11可执行指令的存储器12。其中,处理器11被配置为执行指令,以实现如上述实施例中的数据分析方法的全部步骤或部分步骤。
处理器11、存储器12之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,处理器11用于读/写存储器中存储的数据或程序,并执行相应地功能。
存储器12用于存储程序或者数据,如存储处理器11可执行指令。该存储器12可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read OnlyMemory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
进一步,作为一种可能的实现方式,电子设备10还可包括电源组件、多媒体组件、音频组件、输入/输出(I/O)接口、传感器组件以及通信组件等。
电源组件为电子设备10的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源、以及其他与为电子设备10生成、管理和分配电力相关联的组件。
多媒体组件包括在电子设备10和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件包括一个前置摄像头和/或后置摄像头。当电子设备10处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当电子设备10处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器12或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
I/O接口为处理组件和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件包括一个或多个传感器,用于为电子设备10提供各个方面的状态评估。例如,传感器组件可以检测到电子设备10的打开/关闭状态,组件的相对定位,例如组件为电子设备10的显示器和小键盘,传感器组件还可以检测电子设备10或电子设备10一个组件的位置改变,用户与电子设备10接触的存在或不存在电子设备10方位或加速/减速和电子设备10的温度变化。传感器组件可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件被配置为便于电子设备10和其他设备之间有线或无线方式的通信。电子设备10可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备10可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
应当理解的是,图4所示的结构仅为电子设备10的结构示意图,该电子设备10还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
实施例四
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器12,上述指令可由电子设备10的处理器11执行以完成上述数据分析方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种数据分析方法,其特征在于,包括:
获取异业客户提供的待分析的异业数据,所述异业数据中包括多个消息时间序列,所述消息时间序列为所述异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间;
将所述多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识作为所述待分析用户的用户标识,以及将匹配得到的短消息中的端口号作为行业端口号;
根据所述行业端口号和所述待分析用户的用户标识从所述运营商短消息库中提取出与所述待分析用户对应的短消息,形成短消息数据集;
根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据;
基于所述用户位置数据对所述异业数据的健康性进行分析。
2.根据权利要求1所述的数据分析方法,其特征在于,根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据的步骤,包括:
分别获取所述短消息数据集中的各所述短消息对应的基站位置,形成位置数据集;
从所述位置数据集中选取出现概率最大的基站位置,作为所述待分析用户的常驻位置,以及将所述位置数据集中除所述常驻位置之外的位置作为待分析位置。
3.根据权利要求2所述的数据分析方法,其特征在于,所述基于所述用户位置数据对所述异业数据的健康性进行分析的步骤,包括:
获取所述待分析位置在所述位置数据集中的概率值;
在所述概率值大于第二预设值时,判定所述待分析用户对应的异业数据存在健康风险。
4.根据权利要求1所述的数据分析方法,其特征在于,所述异业数据中还包括待分析的指定地址,所述基于所述用户位置数据对所述异业数据的健康性进行分析的步骤,包括:
将所述用户位置数据与所述指定地址进行比对;
在比对结果为所述用户位置数据与所述指定地址不匹配时,判定所述待分析用户对应的异业数据存在健康风险。
5.根据权利要求4所述的数据分析方法,其特征在于,所述指定地址为商户地址或POS机备案地址。
6.根据权利要求1所述的数据分析方法,其特征在于,所述异业数据中还包括待分析的指定地址,在执行所述根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据的步骤之前,所述方法还包括:
基于各所述短消息对应的基站位置与所述指定地址之间的距离,从所述短消息数据集中剔除距离大于第一预设值的基站位置对应的短消息。
7.一种数据分析装置,其特征在于,包括:
异业数据获取模块,用于获取异业客户提供的待分析的异业数据,所述异业数据中包括多个消息时间序列,所述消息时间序列为所述异业客户与待分析用户在预设时间段内进行短消息交互时的短消息的收发时间;
端口号确定模块,用于将所述多个消息时间序列与预设的运营商短消息库中的短消息对应的消息时间序列进行匹配,将匹配得到的短消息中的用户标识以及端口号作为所述待分析用户的行业端口号和用户标识;
短消息提取模块,用于根据所述行业端口号和所述待分析用户的用户标识从所述运营商短消息库中提取出与所述待分析用户对应的短消息,形成短消息数据集;
位置确定模块,用于根据所述短消息数据集中的各所述短消息对应的基站位置确定所述待分析用户的用户位置数据;
健康性分析模块,用于基于所述用户位置数据对所述异业数据的健康性进行分析。
8.根据权利要求7所述的数据分析装置,其特征在于,所述装置还包括:
数据清洗模块,用于在所述异业数据中还包括待分析的指定地址时,基于各所述短消息对应的基站位置与所述指定地址之间的距离,从所述短消息数据集中剔除距离大于第一预设值的基站位置对应的短消息。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
与所述处理器连接的至少一个存储器;
其中,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机指令,所述计算机指令使所述计算机执行如权利要求1至6中任一项所述的方法。
CN202010187576.9A 2020-03-17 2020-03-17 数据分析方法、装置、电子设备及计算机可读存储介质 Active CN113486072B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010187576.9A CN113486072B (zh) 2020-03-17 2020-03-17 数据分析方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010187576.9A CN113486072B (zh) 2020-03-17 2020-03-17 数据分析方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113486072A true CN113486072A (zh) 2021-10-08
CN113486072B CN113486072B (zh) 2024-06-18

Family

ID=77932595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010187576.9A Active CN113486072B (zh) 2020-03-17 2020-03-17 数据分析方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113486072B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103003803A (zh) * 2010-08-11 2013-03-27 株式会社日立制作所 时序数据处理装置及其方法
CN104239475A (zh) * 2014-09-03 2014-12-24 北京优特捷信息技术有限公司 一种时间序列数据分析方法及装置
US20160162543A1 (en) * 2014-12-05 2016-06-09 General Electric Company Searching for and finding data across industrial time series data
CN106779803A (zh) * 2016-11-24 2017-05-31 久远谦长(北京)技术服务有限公司 一种将金融机构流水与运营商数据匹配的方法
CN109918272A (zh) * 2018-12-18 2019-06-21 阿里巴巴集团控股有限公司 报警消息的周期性确定方法、装置及设备
CN110337075A (zh) * 2019-06-28 2019-10-15 北京奇才天下科技有限公司 一种基于app业务类型的短信消息发送方法、装置及电子设备
JP2020027324A (ja) * 2018-08-09 2020-02-20 株式会社東芝 分析システム、分析方法、プログラム、及び記憶媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103003803A (zh) * 2010-08-11 2013-03-27 株式会社日立制作所 时序数据处理装置及其方法
CN104239475A (zh) * 2014-09-03 2014-12-24 北京优特捷信息技术有限公司 一种时间序列数据分析方法及装置
US20160162543A1 (en) * 2014-12-05 2016-06-09 General Electric Company Searching for and finding data across industrial time series data
CN106779803A (zh) * 2016-11-24 2017-05-31 久远谦长(北京)技术服务有限公司 一种将金融机构流水与运营商数据匹配的方法
JP2020027324A (ja) * 2018-08-09 2020-02-20 株式会社東芝 分析システム、分析方法、プログラム、及び記憶媒体
CN109918272A (zh) * 2018-12-18 2019-06-21 阿里巴巴集团控股有限公司 报警消息的周期性确定方法、装置及设备
CN110337075A (zh) * 2019-06-28 2019-10-15 北京奇才天下科技有限公司 一种基于app业务类型的短信消息发送方法、装置及电子设备

Also Published As

Publication number Publication date
CN113486072B (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
CN110457965B (zh) 一种射频卡功能调用方法及装置
CN107230060B (zh) 一种账号挂失的方法和装置
CN106920170B (zh) 交易提醒方法和装置
CN106445189A (zh) 候选词显示方法及装置
CN106454800A (zh) 身份验证方法、装置及系统
CN108021932A (zh) 数据检测方法、装置及电子设备
CN110610090A (zh) 信息处理方法及装置、存储介质
US20170034092A1 (en) Method and device for processing short message
CN105303120B (zh) 短信读取方法及装置
CN109246094B (zh) 用户终端的验证方法、装置及存储介质
CN106372943A (zh) 一种消息处理的方法和装置
US20240028858A1 (en) System and method for generating a dynamic machine readable code
CN111598527A (zh) 一种投保方法、装置及电子设备
CN113486072B (zh) 数据分析方法、装置、电子设备及计算机可读存储介质
CN106408304B (zh) 账户安全管理方法和装置
EP3236377B1 (en) Method, device and system for preventing account from being broken into
CN105825381B (zh) 信息存储方法及装置
CN113691440B (zh) 消息处理方法和装置
CN106570697B (zh) 移动终端支付验证方法及装置以及安全认证工具
CN114240442A (zh) 资源转移数据校验方法、装置、电子设备及存储介质
CN118170466A (zh) 交易的操作处理方法、装置、设备及存储介质
CN116188001A (zh) 收款码生成方法、装置、电子设备和存储介质
CN115618315A (zh) 屏幕解锁方法、装置、电子设备及存储介质
CN114640469A (zh) 用户确定方法、装置、存储介质及电子设备
CN113159581A (zh) 业务管理方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant