CN109191334A - 五重去重传销数据分析方法 - Google Patents

五重去重传销数据分析方法 Download PDF

Info

Publication number
CN109191334A
CN109191334A CN201810465345.2A CN201810465345A CN109191334A CN 109191334 A CN109191334 A CN 109191334A CN 201810465345 A CN201810465345 A CN 201810465345A CN 109191334 A CN109191334 A CN 109191334A
Authority
CN
China
Prior art keywords
duplicate removal
multiple level
level marketing
carried out
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810465345.2A
Other languages
English (en)
Inventor
秦玉海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA COLLEGE OF CRIMINAL POLICE
Original Assignee
CHINA COLLEGE OF CRIMINAL POLICE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA COLLEGE OF CRIMINAL POLICE filed Critical CHINA COLLEGE OF CRIMINAL POLICE
Priority to CN201810465345.2A priority Critical patent/CN109191334A/zh
Publication of CN109191334A publication Critical patent/CN109191334A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于电子数据取证方法领域,尤其涉及一种五重去重传销数据分析方法,通过对于检验用的传销信息数据库进行检验分析,检验出与传销相关的信息;对传销信息数据库中的数据进行检验分析,得到管理员和普通会员的基本信息,以及会员层级、下线会员数量、涉案金额等内容,具体分析步骤如下:(1)根据注册手机号进行去重;(2)根据注册姓名进行去重;(3)根据网络社交应用或资金账户信息进行去重;(4)根据身份证号信息进行去重;(5)根据登录IP地址信息进行去重。本发明传销数据分析效率高,成本低,解决了现有传销数据库中存放记录是账户信息,与传销案件司法解释中按照人数立案的标准无法衔接的问题。

Description

五重去重传销数据分析方法
技术领域
本发明属于电子数据取证方法领域,尤其涉及一种五重去重传销数据分析方法。
背景技术
传销自20世纪80年代传入中国,至今已有30余年的历史,早期主要出现在南方及沿海大中型城市,20世纪90年代在全国范围内蔓延开来。其表现形式也由最早的单层次直销转变为多层次直销与层压式推销,甚至现在与互联网产业相结合而逐步衍生出的网络传销等新颖形式。近年来,随着网络技术的高速发展,信息获取的途径更加多样,支付方式更加方便快捷,促使传销信息传播的范围更加广泛。传销组织对外宣称小额投资即有高额回报,吸引不明真相的群众在传销网站注册会员。群众通过网络支付工具转账、银行电子汇款等方式缴纳入会费,实际上在入会后需要通过发展多层级下线的方式来获取收益。由于借助网络进行传播,如今的网络传销扩展速度极快,危害的范围极广,产生的影响也极为深远。
我国法律对待传销的态度在历经多次变化后,最终是对其进行严厉的取缔与打击。我国在2009年施行的《刑法修正案(七)》中,在刑法第二百二十四条后增加一条,作为第二百二十四条之一,加入组织、领导传销活动罪,但也对侦查取证提出了较高要求,在针对传销组织者、领导者立案追诉的标准上,涉嫌组织、领导传销活动的传销活动人员在三十人以上且层级在三级以上的才能立案追诉,追究其刑事责任。对于网络传销,我国《刑法》中虽然没有直接规定其罪名,但网络传销也是传销的一种表现形式,应当同样承担从事传销的法律责任。为解决具体案件中传销组织层级及人数的认定问题,在2013年印发的《关于办理组织领导传销活动刑事案件适用法律若干问题的意见》中对组织、领导传销活动罪有了进一步的明确,若涉案的传销组织内部人员数目达到三十人且传销层级达到三层以上的,应当依法追究该传销组织的组织者、领导者的刑事责任。对涉案传销人员数目累计达到一百二十人以上的,涉案传销资金数目总额达到二百五十万元以上的,达到刑法第二百二十四条之一规定中的“情节严重”的级别。从以上规定可以发现,在对网络传销案件勘查取证时,不仅要进行常规的网络犯罪案件的取证操作,还要针对此类案件进行专门侧重。尤其是在面对一起传销案件的定罪,取证人员的检验取证重心应放在:会员层级、下线会员数量、涉案金额等内容。
在取证人员进行取证的过程中,依据案件性质的不同,对案件处理的方式和步骤也有所不同。但一般来说,大体依照以下步骤。
(1)对传销组织的网络信息系统进行现场勘查或远程勘验检查,主要获取传销网站服务器或传销相关的数据库系统及其网站数据。
(2)对传销组织的成立时间、规模以及运营模式进行调查,评估案件对社会的影响程度、案件影响覆盖区域,确定主要涉案人员。
(3)通过对传销组织相关的数据库进行数据分析,确定传销人数、所在层级,涉案金额,确定是否达到立案标准。
(4)查明传销组织的返利方式、分红方式以及获利情况。
(5)验证数据,确保数据的真实可靠,撰写鉴定意见书、检验报告。
传销案件的电子数据分析对检验鉴定人员的知识要求较高。在一般网络传销案件中,后台数据库存储着庞大的数据,对数据的数据分析也是一项非常耗费时间和精力的工作。特别在遇到传销体系庞大的案件时,对数据进行高效率的数据分析是非常关键的。若在确定涉案传销人数时按照一定的思路进行处理,往往能够达到事半功倍的效果。
近些年,传销案件的数量正在逐年上升,传销案件的规模正在逐年庞大,在社会上的影响也日益加深。在传销案件的侦破过程中,对其中出现的犯罪证据进行取证尤为重要。在对当今多数涉及数据库的传销案件中进行电子数据取证的过程中,如何确定涉案人数、涉案人员所在层级、涉案金额以及传销分红、返利方式已成为处理传销案件的关键。目前在电子数据取证的过程中,传销人数的确定尚未形成一个模式化的取证方式。现有传销数据分析方法普遍着存在效率低,成本高等问题。
发明内容
本发明旨在解决现有传销数据库中存放的记录是账户信息,与传销案件司法解释中按照人数立案的标准无法衔接等问题,进而提供一种传销数据分析效率高,成本低的五重去重传销数据分析方法。
为解决上述技术问题,本发明是这样实现的:
五重去重传销数据分析方法,通过对于检验用的传销信息数据库进行检验分析,检验出与传销相关的信息;对数据库中的数据进行检验分析,得到管理员和普通会员的基本信息,以及会员层级、下线会员数量、涉案金额等内容;通过五重去重传销数据分析方法找到了一种账户数据统计数与参与传销人数之间的统计关系;具体分析步骤如下:
(1)根据注册手机号进行去重;
(2)根据注册姓名进行去重;
(3)根据网络社交应用或资金账户信息进行去重;
(4)根据身份证号信息进行去重;
(5)根据IP地址信息进行去重。
本发明是将违法传销所用服务器中传销信息数据库进行账户统计得出每个账户下线账户数,并对该数据再进行五重去重,所统计出的账户数即可认为是下线人数的最小集合。
五重去重的过程划分为五个阶段,每个阶段根据一定的筛选条件将可能重复注册的账户进行过滤,通过多重筛选条件去重后精确得到的统计数据即为下线人数的最小集合。五重去重的筛选条件没有顺序性,筛选顺序不同结果相同。
第一重去重可以根据注册手机号进行去重,将手机号重复的账户统计为同一账户,将手机号为空值的账户统计为一个账户,这样根据手机号将总账户数降到最低。
第二重去重可以根据注册姓名进行去重。根据姓名去重,考虑到注册用户可能存在重复姓名的情况,但仍将其统计为同一账户,这样统计出的结果是下线人数的较小集合。
第三重去重可以根据网络社交应用或资金账户信息进行去重。网络社交应用或资金账户信息是指电子邮箱、QQ、微信号、网银账户、支付宝账户等信息。在注册传销网站账号时通常需要添加这些注册信息以解决信息交流的问题,且在当今众多网络传销案件中,使用网络平台账户(包括网银账户、微信账户、支付宝账户等)进行交易的案件占绝大多数,使用邮箱进行客户信息反馈也是网站交流的常用方法。因此在数据库中网络社交应用或资金账户的注册信息准确性较高,故将其作为第三重去重条件对去除冗余账户非常有效。
第四重去重可以根据身份证号进行去重。身份证号的去重重要性毋庸置疑。在电子数据取证中,核实涉案人员身份信息的重要来源之一即身份证号。虽然身份证号造假的可能性依然存在,但依据其低重复度和较高的真实度仍可极大地提升去重效率。
第五重去重可以根据IP地址进行去重。IP地址对于网络犯罪案件具有重要意义,也是五重去重法中最为关键的一环。在网络犯罪案件中,通常需要通过记录网站访问痕迹,然后写入日志文件或用户数据库的登陆IP地址字段,以此可以确定访问网站用户的登陆位置信息。IP地址是分配给连接到使用互联网协议进行通信的计算机网络的每个设备的数字标签。Internet协议版本4(IPv4)将IP地址定义为32位的二进制数。根据网络地址与主机地址位数的不同,可以将IP地址分为A、B、C、D、E五类地址,适用的网络类型分别为大型、中型、小型网络、多目地址和备用地址,其中用户常用的是B类地址和C类地址。在去重工作中,IP种类的不同是对去重结果是有一定影响的。对于基于TCP/IP协议的局域网,IP地址的管理方式主要有静态分配IP地址和动态分配IP地址。静态分配IP地址,即固定IP地址。由于静态IP地址的数量有限,通常不会更改,但可能会因网络管理而发生变化。从系统的静态IP地址,可以获得许多信息,如计算机所在的国家,地区和城市,为特定计算机提供服务的互联网服务提供商(Internet Service Provider,简称ISP)和一些非技术信息,如国家的精确纬度和经度,以及计算机的语言环境等。动态分配IP地址,是临时IP地址。这些IP地址每次连接到Internet时都会由DHCP服务器分配给一台网络终端设备。大多数采用ADSL方式上网的用户,由于在上网的时间和空间方面具有离散性,为每个用户分配一个固定的IP地址是不现实的,这样也会极大地浪费IP地址资源,因此对于普通用户采用动态分配IP进行分配管理。但这样会引发其他问题:由于大多数用户使用的都是动态IP,即每次上线所使用的IP都是由用户所在的互联网提供商(Internet Service Provider,简称ISP)动态分配的,每次上线所使用的IP一般都不相同。但动态IP并不是随时都在变化,同一个IP地址一旦分配至少会维持到下一次重新启动。因此,网站中用户登录的IP地址和实际参与注册用户的数量并不是一一对应的。若要明确账户数与人数之间的对应关系,就必须对IP地址进行去重。一般网络犯罪案件的后台数据库都拥有日志文件,主要包括用户类型、登录IP、访问时间、登录状态等多个方面。因此IP地址可以通过日志文件获得,也可以通过用户数据库拥有的登陆IP地址字段获得。
附图说明
下面结合附图和具体实施方式对本发明作进一步说明。本发明的保护范围不仅局限于下列内容的表述。
图1为本发明实施例登录后会员管理系统界面图。
图2为本发明实施例会员综合管理系统后台管理界面图。
图3为本发明实施例数据库界面图。
图4为本发明实施例投资平台账户界面图。
图5为本发明实施例平台注册账户界面图。
图6为本发明实施例注册电话去重界面图。
图7为本发明实施例注册姓名界面图。
图8为本发明实施例网络社交应用或资金账户信息去重界面图。
图9为本发明实施例身份证号信息去重界面图。
图10为本发明实施例IP地址信息去重界面图。
具体实施方式
如图所示,五重去重传销数据分析方法,对于检验用的传销信息数据库进行检验分析,检验出与传销相关的信息;对数据库中的数据进行检验分析,得到管理员和普通会员的基本信息,以及会员层级、下线会员数量、涉案金额等内容。通过五重去重传销数据分析方法实现了账户数与人数之间的相对关系。五重去重传销数据分析方法分析步骤如下:
(1)根据注册手机号进行去重;
(2)根据注册姓名进行去重;
(3)根据网络社交应用或资金账户信息进行去重;
(4)根据身份证号信息进行去重;
(5)根据IP地址信息进行去重。
作为一种优选方案,本实施例所述网络社交应用账户信息是指电子邮箱。
使用本发明对分析数据进行分类,将相同的表项内容归为同一类,空值归为同一类。依据注册手机号数据项进行第一次去重;依据注册姓名数据项进行第二次去重;依据电子邮箱数据项进行第三次去重;依据身份证号数据项进行第四次去重;依据IP地址数据项进行第五次去重。
实施例。
(1)基本信息检验。
对现场获得硬盘的克隆备份使用电子数据取证软件进行取证,检验出与传销网站“www.gtmcom.com”相关的信息。对服务器中的数据进行检验分析,得到投资平台的网络运行架构、管理员及普通会员账号等基本信息。
服务器在启动后,会自动运行网站管理系统程序。管理类系统可以通过三个入口进入系统,入口分别为普通会员网页登录入口、管理员网页登录入口、普通会员移动端登录入口,登录后分别进入会员管理系统(如图1所示)、会员综合管理系统后台管理(如图2所示)、移动端会员管理系统,三者都与一个名为gtm的数据库相连接。
通过SQL Server查看“gtm”数据库(如图3所示),检查数据库中的表项内容。在数据库中,可查看到名为“tb_zMemberInfo”的数据表,表内记录了与注册会员账户相关的全部数据,表内记录共91294条,即该投资平台有91294个注册账户,部分账户信息如图4所示。在“tb_zMemberInfo”的数据表中记录了注册账户的用户名、密码、手机号、邮箱、身份证号等相关信息,这些表项包含取证过程中寻找相关人员的关键信息,也是使用“五重去重法”进行操作的几项重要根据。
(2)平台注册账户数量检验
在获取投资平台全部会员账户数量后,需要依据数据表中的相关信息进行去重处理。在本案例中,由于平台的特殊性,数据表“tb_zMemberInfo”中有“BuyNums”和“ActiveState”两个表项,分别表示会员的实际购买金额及账户激活的状态信息,只有进行实际购买且账户为激活状态的注册账户才能被计入人数行列。对平台注册账户进行第一轮筛选,检验结果为90534(如图5)。
第一重去重根据注册手机号进行去重。依据Telephone数据项进行第一次去重,检验结果共46417条记录(如图6)。
第二重去重根据注册姓名进行去重。依据RealName数据项进行第二次去重,检验结果共40627条记录(如图7)。
第三重去重根据网络社交应用或资金账户信息进行去重。依据Email数据项进行第三次去重,检验结果共21278条记录(如图8)。
第四重去重根据身份证号进行去重。依据IdCard数据项进行第四次去重,检验结果共20462条记录(如图9)。
第五重去重可以根据IP地址进行去重。在gtm数据库中,记录相关IP的数据库表一共有三个,表名分别为“tb_MoneyPayment”、“zMemberMsgList”和“tb_UsersLog”。“tb_MoneyPayment”是对账户在线支付的记录,“zMemberMsgList”是对后台客服消息的记录,“tb_UsersLog”是服务器的用户登录日志,其中记录了账户类型、登录账户用户名、登录IP、登录时间以及登录状态,共2403230条登录记录。显而易见,“tb_UsersLog”数据库表与确定实际传销人数有重大关联。将数据表“tb _UsersLog”与“tb_zMemberInfo”通过UserSysId表项,选择出现在“tb _UsersLog”中的所有数据,即表明曾经登录过该网站的账户数。
经过第五次去重后,检验结果共20459条记录(如图10)。经过五重去重法,总记录数缩减至原记录数的22%。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和思想的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (3)

1.五重去重传销数据分析方法,其特征在于:通过对于检验用的传销信息数据库进行检验分析,检验出与传销相关的信息;对数据库中的数据进行检验分析,得到管理员和普通会员的基本信息,以及会员层级、下线会员数量及涉案金额;具体分析步骤如下:
(1)根据注册手机号进行去重;
(2)根据注册姓名进行去重;
(3)根据网络社交应用或资金账户信息进行去重;
(4)根据身份证号信息进行去重;
(5)根据登录IP地址信息进行去重。
2.根据权利要求1所述的五重去重传销数据分析方法,其特征在于:所述网络社交应用或资金账户信息包括电子邮箱、QQ、微信号、网银账户及支付宝账户。
3.根据权利要求2所述的五重去重传销数据分析方法,其特征在于:对统计结果进行归组,将相同的表项内容统计为同一项,空值归为同一项;依据注册手机号数据项进行第一次去重;依据注册姓名数据项进行第二次去重;依据电子邮箱、QQ、微信号、网银账户或支付宝账户数据项进行第三次去重;依据身份证号数据项进行第四次去重;依据所登录的IP地址数据项进行第五次去重。
CN201810465345.2A 2018-05-16 2018-05-16 五重去重传销数据分析方法 Pending CN109191334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810465345.2A CN109191334A (zh) 2018-05-16 2018-05-16 五重去重传销数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810465345.2A CN109191334A (zh) 2018-05-16 2018-05-16 五重去重传销数据分析方法

Publications (1)

Publication Number Publication Date
CN109191334A true CN109191334A (zh) 2019-01-11

Family

ID=64948504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810465345.2A Pending CN109191334A (zh) 2018-05-16 2018-05-16 五重去重传销数据分析方法

Country Status (1)

Country Link
CN (1) CN109191334A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157704A (zh) * 2021-05-06 2021-07-23 成都卫士通信息产业股份有限公司 层级关系分析方法、装置、设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254543A (zh) * 2016-09-27 2016-12-21 盐城工学院 基于云计算架构的分布式互联网金融网贷方法和系统
CN106411853A (zh) * 2016-09-05 2017-02-15 广东聚联电子商务股份有限公司 一种网络实名制信息补充完善的方法
CN107066616A (zh) * 2017-05-09 2017-08-18 北京京东金融科技控股有限公司 用于账号处理的方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411853A (zh) * 2016-09-05 2017-02-15 广东聚联电子商务股份有限公司 一种网络实名制信息补充完善的方法
CN106254543A (zh) * 2016-09-27 2016-12-21 盐城工学院 基于云计算架构的分布式互联网金融网贷方法和系统
CN107066616A (zh) * 2017-05-09 2017-08-18 北京京东金融科技控股有限公司 用于账号处理的方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋鹏: "电子证据在网络传销案件侦查中的运用", 《湖南警察学院学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157704A (zh) * 2021-05-06 2021-07-23 成都卫士通信息产业股份有限公司 层级关系分析方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
Wang et al. Data quality requirements analysis and modeling
CN110099059A (zh) 一种域名识别方法、装置及存储介质
TW201737072A (zh) 一種對應用程序進行項目評估的方法及系統
JP2003523578A (ja) ネットワーク上の対話の妥当性を決定するためのシステムおよび方法
US8255392B2 (en) Real time data collection system and method
Creamer et al. Segmentation and automated social hierarchy detection through email network analysis
Tajalizadehkhoob et al. Apples, oranges and hosting providers: Heterogeneity and security in the hosting market
CN111176867A (zh) 数据共享交换及开放应用平台
CN110109908A (zh) 基于社会基础信息挖掘人物潜在关系的分析系统及方法
CN107483381A (zh) 关联账户的监控方法及装置
Lauw et al. Stevent: Spatio-temporal event model for social network discovery
CN112291261A (zh) 一种知识图谱驱动的网络安全日志审计分析方法
CN109284978B (zh) 一种精准识别贫困户的系统及识别方法
CN109191334A (zh) 五重去重传销数据分析方法
CN111833182B (zh) 识别风险对象的方法和装置
US8918422B2 (en) Method and system for using email domains to improve quality of name and postal address matching
CN109729054A (zh) 访问数据监测方法及相关设备
CN109947797A (zh) 一种数据检查装置及方法
Kalugina et al. Comparative analysis and experience of using social network analysis information systems
CN114186118A (zh) 一种网络舆情话题信息处理系统、方法、存储介质、终端
CN108304731A (zh) 一种管理企业数据调用的方法、系统及信息处理平台
CN113989005A (zh) 一种税务风险企业挖掘方法及装置
CN105025115A (zh) 一种生成集体宿舍ip库的方法和装置
CN110991906B (zh) 云系统信息安全风险评估方法
JP2022098476A (ja) 利益分配のための方法、コンピューティングデバイス、及びシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111

RJ01 Rejection of invention patent application after publication