CN110362609A - 一种基于二部图的股票协同交易疑点群体检测方法 - Google Patents
一种基于二部图的股票协同交易疑点群体检测方法 Download PDFInfo
- Publication number
- CN110362609A CN110362609A CN201910585215.7A CN201910585215A CN110362609A CN 110362609 A CN110362609 A CN 110362609A CN 201910585215 A CN201910585215 A CN 201910585215A CN 110362609 A CN110362609 A CN 110362609A
- Authority
- CN
- China
- Prior art keywords
- account
- transaction
- stock
- doubtful point
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004220 aggregation Methods 0.000 claims abstract description 48
- 230000002776 aggregation Effects 0.000 claims abstract description 47
- 238000004364 calculation method Methods 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 11
- 238000012790 confirmation Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract description 3
- 230000007246 mechanism Effects 0.000 description 4
- 230000007306 turnover Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/407—Cancellation of a transaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于二部图的股票协同交易疑点群体检测方法,包括:根据股票交易历史数据,将交易事件和疑点账户作为二部图的两种不同节点,以循环迭代更新的方式搜索交易事件及筛选疑点账户,直至交易事件集合和疑点账户集合收敛;在收敛的交易事件集合和疑点账户集合的基础之上,构建账户间交易协同图,并基于账户间交易协同图进行社区划分,发现协同进行股票交易的账户社区,作为股票协同交易疑点群体。本发明通过挖掘与给定的疑点账户紧密同步交易股票的账户,以及频繁着重参与给定的股票交易事件的账户,揭露隐藏的账户之间异常交易协同行为,反映账户间通过协同交易影响甚至控制股价走势的潜在可能性,为股票二级市场风险预警提供参考。
Description
技术领域
本发明涉及信息技术领域,特别涉及一种基于二部图的股票协同交易疑点群体检测方法。
背景技术
股票是股份公司发行的所有权凭证,是股份公司为筹集资金而发行给各个股东作为持股凭证并借以取得股息和红利的一种有价证券。每股股票都代表股东对企业拥有一个基本单位的所有权。每家上市公司都会发行股票。
股票是股份公司资本的构成部分,可以转让、买卖,是资本市场的主要长期信用工具,但不能要求公司返还其出资。在股票二级市场中,一定规模的交易者群体按一定规律对某些股票进行交易委托可以显著影响该股票的价格走势,利用这种规律蓄意操纵股价将对股票市场的正常机能造成损害。
基于股票二级市场交易者历史交易数据,对股票交易者进行社区划分的技术手段尚处于欠缺状态。合理有效的股票交易者社区划分,既可以辅助证券监管部门进行合规监察,又可以辅助政府、企业及个体投资者进行市场预测。
发明内容
本发明的目的在于提出一种基于二部图的股票协同交易疑点群体检测方法,以满足当前对股票二级市场中交易者的群体行为特性进行社区发现的需求。
为了实现上述目的,本发明采用如下技术方案:
一种基于二部图的股票协同交易疑点群体检测方法,首先采集疑点账户集合和交易事件集合,然后进行如下步骤:
S101)、判断所采集的疑点账户集合是否存在更新:存在更新跳转至步骤S102);否则,跳转步骤S106);
S102)、搜索交易事件:对疑点账户集合内每一个疑点账户,检索该疑点账户的股票交易历史数据,构造交易事件,并将构造的交易事件添加至交易事件备选集合;
S103)、计算交易事件参与阈值:根据交易事件集合规模、交易事件备选集合规模或迭代历史,计算交易事件参与阈值;
S104)、更新交易事件集合:对交易事件备选集合内每一个交易事件,计算其参与度,选出所有参与度高于交易事件参与阈值的交易事件,添加至交易事件集合;完成后,清空交易事件备选集合;
S105)、判断疑点账户集合和交易事件集合是否收敛:判断疑点账户集合和交易事件集合在最近一次更新前后,所含元素是否完全相同,若不完全相同,则视为未收敛,跳转步骤S101);若完全相同,则视为已收敛,跳转步骤S109);
S106)、搜索疑点账户:对交易事件集合内每一个交易事件,检索发生在该交易事件内的股票交易历史数据,选出参与过至少任意一起交易事件的股票账户,将符合条件的股票账户添加至疑点账户备选集合;
S107)、计算疑点账户参与阈值:根据疑点账户集合规模、疑点账户备选集合规模或迭代历史,计算疑点账户参与阈值;
S108)、更新疑点账户集合:对疑点账户备选集合内每一个股票账户,计算其参与度,选出所有参与度高于疑点账户参与阈值的股票账户,作为疑点账户,添加至疑点账户集合;完成后,清空疑点账户备选集合;
S109)、构建账户交易协同图:构建描述所有疑点账户在所有交易事件上协同情况的账户间交易协同图;
S110)基于账户间交易协同图进行群体划分:从交易协同图中划分出依据交易协同度紧密连接的若干账户社区,将各协同密集的账户社区作为不同的股票协同交易疑点群体,并确认各疑点群体操控或参与的交易事件,作为交易事件群体;输出股票协同交易疑点群体及对应操控或参与的股票交易事件群体,检测结束。
进一步的,第一次执行步骤S101)时,接受原始输入为疑点账户集合ACC和交易事件集合STK,且两项输入中至少一项具备有效值;若基于原始输入第一次进入判断步骤S101)且原始输入中疑点账户集合存在有效值,或基于算法循环进入判断步骤S101)且疑点账户集合相对于上一次进入判断步骤S101)存在更新,跳转步骤S102);否则,跳转步骤S106)。
进一步的,步骤S101)中疑点账户集合,其初始值是通过先验信息确认或主观怀疑存在异常交易的股票账户的集合,其任意元素,即疑点账户,均为曾经在券商或其他合法的证券营业机构注册,现今已经注销或仍然在使用的独立开立的个人股票账户或机构股票账户。
进一步的,步骤S101)中交易事件集合,其初始值是通过先验信息确认或主观怀疑存在异常交易的交易事件的集合,其任意元素,即交易事件,是被交易股票stk和交易起止时间tb、te构成的三元组,对股票stk的异常交易发生在起始时间tb和终止时间te之间,起始时间tb应早于终止时间te,且对于同一起交易事件,起始时间tb与终止时间te的间隔不大于一定的正数阈值tgap;任意交易事件表示为(stk,tb,te)|tb<te,te-tb<tgap,tgap>0。
大写STK指代“交易事件集合”,小写stk指代不特定的某一只“股票”。
进一步的,步骤S102)和步骤S106)中股票交易是指股票账户对股票进行交易委托或撤销交易委托的行为,不论该交易是否成交。
进一步的,步骤S103)中的交易事件参与阈值THRSTK确定了一个备选的交易事件被正式认定为交易事件在参与度上的应该具有的最低限度,步骤S107)中疑点账户参与阈值THRACC确定了一个备选的股票账户被正式认定为疑点账户在参与度上应该具有的最低限度,上述两项阈值应当使用相同或相似的计算方法确定,且应该随循环迭代的进行而非严格递增,其计算方法可以是:视第n次循环包含自第2n-1次执行步骤S101)至第2n次执行步骤S105)间的所有操作,交易事件参与阈值与疑点账户参与阈值均取为循环次数的自然对数值,计算公式为:
THRSTK(n)=THRACC(n)=ln(n)。
进一步的,步骤S104)中的交易事件的参与度PSTK描述了一个备选的交易事件被疑点账户着重参与的程度,步骤S108)中股票账户的参与度PACC确定了一个备选的股票账户着重参与交易事件的程度,上述两项参与度应当使用相同或相似的计算方法确定,其计算方法可以是:交易事件的参与度,取为疑点账户集合中着重参与该交易事件的疑点账户的数量NACC,即PSTK=NACC;股票账户的参与度,取为该股票账户着重参与交易事件集合中交易事件的数量NSTK,即PACC=NSTK。其中,着重参与,是指账户在一定时间内,将账户内资金主体投入某支股票的交易行为,或账户内资金主体虽未投入该支股票交易,但交易量或交易额已经明显影响该支股票正常交易的交易行为。在实际进行着重参与界定时,可以采用以下标准:任意疑点账户acc在任意交易事件(stk,tb,te)中的交易资金之和(总买入金额与总卖出金额之和)大于资金阈值THRAMT,或交易资金之和大于在交易事件时段内,即自起始时间tb至终止时间te,股票stk的平均日成交金额的一定比例RATAMT,即存在或时,认定疑点账户acc着重参与交易事件(stk,tb,te)。其中,THRAMT>0,RATAMT>0,二者均为经验参数,依据股票市场的数据分析和业务经验确定。
进一步的,步骤S109)具体包括:对于疑点账户集合和交易事件集合,以疑点账户对交易事件的参与情况为基础,计算任意两个账户间股票交易的协同度SIM,并以疑点账户为节点,以两两疑点账户之间的协同股票交易为边,以两账户间的协同度为边的权值,构建描述所有疑点账户在所有交易事件上协同情况的账户间交易协同图GSIM。
进一步的,疑点账户集合ACC内任意一个股票账户accx和另一股票账户accy之间的交易协同度SIMxy,为有向协同度或无向协同度,是反映两账户在交易事件集合STK中所有事件上的总体协同情况的标量协同度,或者是以每一维度独立反映两账户在交易事件集合中的一起事件(stk,tb,te)上的协同情况的向量协同度,其计算方法可以是:令股票账户accx、accy在交易事件集合中分别重度参与交易事件nx、nx起,二者共同重度参与的交易事件nx&y起,则二者协同度为二者共同参与事件数nx&y与各自参与事件数nx、nx比值的算术平均值,该协同度计算方法在后文中使用“默认协同度计算方法”这一称谓指代,计算公式为:
进一步的,步骤S110)中社区发现的可选方案,可以是重叠社区发现或非重叠社区发现,目的是从交易协同图中划分出依据交易协同度紧密连接的账户社区,实际选用的方法应当与交易协同图相适应,能够充分反映不同账户间交易协同度的权值特性。例如,在采用默认协同度计算方法的情况下,对于建立在疑点账户集合和交易事件集合上的交易协同图GSIM,采用DBSCAN算法,将交易协同图GSIM分割成若干子图(GSIM,1),(GSIM,2),(GSIM,3)…及散点,并令每个子图代表一个账户社区,子图内所包含的所有节点对应的股票账户构成本账户社区的协同交易疑点群体,子图内所包含的所有边对应的交易事件构成本账户社区的交易事件群体。
进一步的,步骤S110)中协同密集,是指账户社区内任意两账户间协同度SIM不低于阈值SIM0的边的数目E与理论任意两账户全连接边的数目Ec的比值不低于阈值Pint,即其中SIM0>0,0<Pint<1,二者为经验参数,依据实际采用的协同度计算方法、股票市场的数据分析和业务经验确定。
进一步的,步骤S110)中股票协同交易疑点群体,是指在对应交易事件群体内的所有交易事件上同步着重参与,进而对相关股票的股价走势存在可能的潜在影响的股票账户的集合,所有股票协同交易疑点群体及其对应的交易事件群体是整个股票协同交易疑点群体检测方法的最终输出。
相对于现有技术,本发明具有以下有益效果:
本发明依据股票交易历史数据,通过检索疑点账户的股票交易历史数据,构建交易事件,更新交易事件集合;查找参与交易事件的股票账户,筛选涉及事件的疑点账户,更新疑点账户集合;对上述过程按一定顺序进行循环迭代,直至交易事件集合与疑点账户集合迭代收敛;以疑点账户为节点,以在交易事件上的账户间协同关系为边,构建账户间交易协同图;对账户间交易协同图进行社区发现,划分账户社区;最终得到股票协同交易疑点群体及相关的股票交易事件。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种基于二部图的股票协同交易疑点群体检测方法的整体流程图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
请参阅图1所示,本发明提供一种基于二部图的股票协同交易疑点群体检测方法,首先采集疑点账户集合和交易事件集合,然后进行如下步骤:
S101)、判断所采集的疑点账户集合是否存在更新
在接受原始输入第一次执行步骤S101)时,接受原始输入为疑点账户集合ACC和交易事件集合STK,且两项输入中至少一项具备有效值;若基于原始输入第一次进入判断步骤S101)且原始输入中疑点账户集合存在有效值,或基于算法循环进入判断步骤S101)且疑点账户集合相对于上一次进入判断步骤S101)存在更新,跳转步骤S102);否则,跳转步骤S106)。
步骤S101)中疑点账户集合ACC,其初始值是通过先验信息确认或主观怀疑存在异常交易的股票账户的集合,其任意元素,即疑点账户,均为曾经在券商或其他合法的证券营业机构注册,现今已经注销或仍然在使用的独立开立的个人股票账户或机构股票账户。
步骤S101)中交易事件集合STK,其初始值是通过先验信息确认或主观怀疑存在异常交易的交易事件的集合,其任意元素,即交易事件,是被交易股票stk和交易起止时间tb、te构成的三元组,对股票stk的异常交易发生在起始时间tb和终止时间te之间,起始时间tb应早于终止时间te,且对于同一起交易事件,起始时间tb与终止时间te的间隔不大于一定的正数阈值tgap;任意交易事件表示为(stk,tb,te)|tb<te,te-tb<tgap,tgap>0。在实际进行交易事件划分时,可以根据经验预先设定交易事件时间跨度tgap和股票协同交易疑点群体检测的起始时间t0,从而对每一只股票stk,涉及该股票的交易事件被限制在集合{(stk,t0,t0+tgap),(stk,t0+tgap,t0+2*tgap),…,(stk,t0+(k-1)*tgap,k*tgap),(stk,t0+k*tgap,tnow)|tnow<t0+(k+1)*tgap}中,tnow为股票协同交易疑点群体检测的终止时间。
S102)、搜索交易事件
本发明定义的股票交易,是指独立的个人股票账户或机构股票账户对股票二级市场上的任意一只或多只股票进行买卖委托或撤销买卖委托的行为,不论该股票买卖是否全部成交、部分成交或全部未成交。
本发明定义的股票交易历史数据,是指证监会等监察执法机构、券商等资管机构以及其他能够提供部分或全部股票交易账户连续、完整的成交、委托等股票交易信息的数据源提供的,在预先指定的时间段内(若未预先指定时间段,则视为指定时间段为自账户开立至今),股票账户所有的股票交易记录。
本步骤中,搜索交易事件是指,检索疑点账户集合ACC中全部疑点账户的股票交易历史数据,在步骤S101)的说明中预先设定的所有交易事件中,明确其中被涉及的交易事件,将全部被涉及的交易事件添加至交易事件备选集合。
S103)、计算交易事件参与阈值
交易事件参与阈值THRSTK确定了一个备选的交易事件被正式认定为交易事件在参与度上的应该具有的最低限度,应当根据交易事件集合规模、交易事件备选集合规模或迭代历史进行计算,且应该随循环迭代的进行而非严格递增。在实际进行交易事件参与阈值计算时,可以依据后述方法具体实施:视第n次循环包含自第2n-1次执行步骤S101)至第2n次执行步骤S105)间的所有操作,交易事件参与阈值取为循环次数的自然对数值,计算公式为:
THRsTK(n)=ln(n)。
本发明中交易事件参与阈值计算方法为示例性的说明,本领域一般技术人员根据实际情况可以采用其他方法进行计算。
S104)、更新交易事件集合
计算交易事件备选集合内每一个备选的交易事件的参与度PSTK,选出所有参与度高于交易事件参与阈值THRSTK的交易事件,添加至交易事件集合STK;完成后,清空交易事件备选集合。
交易事件的参与度PSTK描述了一个备选的交易事件被疑点账户着重参与的程度,其计算方法应当与交易事件参与阈值相匹配。在实际更新交易事件集合时,如果交易事件参与阈值是按照步骤S103)中的具体实施方法进行计算的,则交易事件的参与度可以依据后述方法进行计算:交易事件的参与度,取为疑点账户集合中着重参与该交易事件的疑点账户的数量NACC,即PSTK=NACC。
S105)、判断疑点账户集合和交易事件集合是否收敛
判断疑点账户集合ACC和交易事件集合STK在最近一次更新前后,所含元素是否完全相同,若不完全相同,则视为未收敛,跳转步骤S101),继续进行基于二部图的交易事件和疑点账户迭代更新;若完全相同,则视为已收敛,跳转步骤S109),进行进一步的分析处理。
S106)、搜索疑点账户
对交易事件集合STK内每一个交易事件(stk,tb,te),检索发生在该交易事件内的股票交易历史数据,即自起始时间tb至终止时间te这一时间段内对股票stk的历史交易数据,选出参与过至少任意一起交易事件的股票账户,将符合条件的股票账户添加至疑点账户备选集合。
S107)、计算疑点账户参与阈值
疑点账户参与阈值THRACC确定了一个备选的股票账户被正式认定为疑点账户在参与度上应该具有的最低限度,应当根据疑点账户集合规模、疑点账后备选集合规模或迭代历史进行计算,且应该随循环迭代的进行而非严格递增。在实际进行疑点账户参与阈值计算时,可以依据后述方法具体实施:视第n次循环包含自第2n-1次执行步骤S101)至第2n次执行步骤S105)间的所有操作,疑点账户参与阈值取为循环次数的自然对数值,计算公式为:
THRACC(n)=ln(n)。
本发明中疑点账户参与阈值计算方法为示例性的说明,本领域一般技术人员根据实际情况可以采用其他方法进行计算。
S108)、更新疑点账户集合
计算疑点账户备选集合内每一个备选的股票账户的参与度PACC,选出所有参与度高于疑点账户参与阈值THRACC的股票账户,添加至疑点账户集合ACC;完成后,清空疑点账户备选集合。
股票账户的参与度PACC确定了一个备选的股票账户着重参与交易事件的程度,其计算方法应当与疑点账户参与阈值相匹配。在实际更新疑点账户集合时,如果疑点账户参与阈值是按照步骤S107)中的具体实施方法进行计算的,则股票账户的参与度可以依据后述方法进行计算:股票账户的参与度,取为该股票账户着重参与交易事件集合中交易事件的数量NSTK,即PACC=NSTK。
S109)、构建账户交易协同图
对于疑点账户集合ACC和交易事件集合STK,以疑点账户对交易事件的参与情况为基础,计算任意两个账户间股票交易的协同度SIM,并以疑点账户为节点,以两两疑点账户之间的协同股票交易为边,以两账户间的协同度为边的权值,构建描述所有疑点账户在所有交易事件上协同情况的账户间交易协同图GSIM。
其中,疑点账户集合ACC内任意一个股票账户accx和另一股票账户accy之间的交易协同度SIMxy,可以是有向协同度或无向协同度,可以是反映两账户在交易事件集合STK中所有事件上的总体协同情况的标量协同度,或者是以每一维度独立反映两账户在交易事件集合STK中的一起交易事件(stk,tb,te)上的协同情况的向量协同度。在实际进行协同度计算时,建议采用默认协同度计算方法:令股票账户accx、accy在交易事件集合中分别重度参与交易事件nx、nx起,二者共同重度参与的交易事件nx&y起,则二者协同度为二者共同参与事件数nx&y与各自参与事件数nx、nx比值的算术平均值,计算公式为:
S110)基于账户间交易协同图进行群体划分
使用与交易协同图GSIM相适应的重叠社区发现方法或非重叠社区发现方法进行疑点账户社区划分,在充分反映不同账户间交易协同度SIM的权值特性的情况下,划分出依据交易协同度紧密连接的若干账户社区。
在采用默认协同度计算方法的情况下,对于建立在疑点账户集合和交易事件集合上的交易协同图GSIM,建议采用DBSCAN算法,将交易协同图GSIM分割成若干子图(GSIM,1),(GSIM,2),(GSIM,3)…及散点,并令每个子图代表一个账户社区,子图内所包含的所有节点对应的股票账户构成本账户社区的协同交易疑点群体,子图内所包含的所有边对应的交易事件构成本账户社区的交易事件群体。
本发明定义的股票协同交易疑点群体,是指在对应交易事件群体内的所有交易事件上同步着重参与,进而对相关股票的股价走势存在可能的潜在影响的股票账户的集合。
将各协同密集的账户社区作为不同的股票协同交易疑点群体,并确认各疑点群体操控或参与的交易事件,作为交易事件群体;输出所有的股票协同交易疑点群体及对应操控或参与的股票交易事件群体,检测结束。
其中,协同密集是指账户社区内任意两账户间协同度SIM不低于阈值SIM0的边的数目E与理论任意两账户全连接边的数目Ec的比值不低于阈值Pint,即其中SIM0>0,0<Pint<1,二者为经验参数,依据实际采用的协同度计算方法、股票市场的数据分析和业务经验确定,在采用默认协同度计算方法时,建议SIM0取值为0.3,建议Pint取值为0.3。
本发明步骤S103)中的交易事件参与阈值THRSTK与步骤S107)中疑点账户参与阈值THRACC应当使用相同或相似的计算方法确定,以确保基于二部图的交易事件和疑点账户迭代更新的对称性、一致性。
本发明步骤S104)与步骤S108)中定义的着重参与,是指账户在一定时间内,将账户内资金主体投入某支股票的交易行为,或账户内资金主体虽未投入该支股票交易,但交易量或交易额已经明显影响该支股票正常交易的交易行为。在实际进行着重参与界定时,可以采用以下标准:任意疑点账户acc在任意交易事件(stk,tb,te)中的交易资金之和(总买入金额与总卖出金额之和)大于资金阈值THRAMT,或交易资金之和大于在交易事件时段内,即自起始时间tb至终止时间te,股票stk的平均日成交金额的一定比例RATAMT,即存在或时,认定疑点账户acc着重参与交易事件(stk,tb,te)。其中,THRAMT>0,RATAMT>0,二者均为经验参数,依据股票市场的数据分析和业务经验确定,建议THRAMT取值为1,000,000人民币,建议RATAMT取值为0.001。
股票违法操作有两类:
第一类是个体行为,这类行为个人意志表现比较强,没有太多规律,但是技术通过设定各类规则,已经可以有效检测。
第二类是对抗监察规则的协同违规行为,本意在于通过多个账户的协同,使得每个账户不具有显著恶意性。因此,现有技术无法从庞大的数据中挖掘和发现不同账户之间的协同性,无法实现有效检测。
本发明针对第二类问题,通过检索疑点账户的股票交易历史数据,构建交易事件,更新交易事件集合;查找参与交易事件的股票账户,筛选涉及事件的疑点账户,更新疑点账户集合;对上述过程按一定顺序进行循环迭代,直至交易事件集合与疑点账户集合迭代收敛;以疑点账户为节点,以在交易事件上的账户间协同关系为边,构建账户间交易协同图;对账户间交易协同图进行社区发现,划分账户社区;最终得到股票协同交易疑点群体及相关的股票交易事件,从而发现和明确不同账户之间的协同性。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
Claims (10)
1.一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,首先采集疑点账户集合和交易事件集合,然后进行如下步骤:
S101)、判断所采集的疑点账户集合是否存在更新:存在更新跳转至步骤S102);否则,跳转步骤S106);
S102)、搜索交易事件:对疑点账户集合内每一个疑点账户,检索该疑点账户的股票交易历史数据,构造交易事件,并将构造的交易事件添加至交易事件备选集合;
S103)、计算交易事件参与阈值:根据交易事件集合规模、交易事件备选集合规模或迭代历史,计算交易事件参与阈值;
S104)、更新交易事件集合:对交易事件备选集合内每一个交易事件,计算其参与度,选出所有参与度高于交易事件参与阈值的交易事件,添加至交易事件集合;完成后,清空交易事件备选集合;
S105)、判断疑点账户集合和交易事件集合是否收敛:判断疑点账户集合和交易事件集合在最近一次更新前后,所含元素是否完全相同,若不完全相同,则视为未收敛,跳转步骤S101);若完全相同,则视为已收敛,跳转步骤S109);
S106)、搜索疑点账户:对交易事件集合内每一个交易事件,检索发生在该交易事件内的股票交易历史数据,选出参与过至少任意一起交易事件的股票账户,将符合条件的股票账户添加至疑点账户备选集合;
S107)、计算疑点账户参与阈值:根据疑点账户集合规模、疑点账户备选集合规模或迭代历史,计算疑点账户参与阈值;
S108)、更新疑点账户集合:对疑点账户备选集合内每一个股票账户,计算其参与度,选出所有参与度高于疑点账户参与阈值的股票账户,作为疑点账户,添加至疑点账户集合;完成后,清空疑点账户备选集合;
S109)、构建账户交易协同图:构建描述所有疑点账户在所有交易事件上协同情况的账户间交易协同图;
S110)基于账户间交易协同图进行群体划分:从交易协同图中划分出依据交易协同度紧密连接的若干账户社区,将各协同密集的账户社区作为不同的股票协同交易疑点群体,并确认各疑点群体操控或参与的交易事件,作为交易事件群体;输出股票协同交易疑点群体及对应操控或参与的股票交易事件群体,检测结束。
2.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,第一次执行步骤S101)时,接受原始输入为疑点账户集合和交易事件集合,且两项输入中至少一项具备有效值;若基于原始输入第一次进入判断步骤S101)且原始输入中疑点账户集合存在有效值,或基于算法循环进入判断步骤S101)且疑点账户集合相对于上一次进入判断步骤S101)存在更新,跳转步骤S102);否则,跳转步骤S106)。
3.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S101)中交易事件集合,其初始值是通过先验信息确认或主观怀疑存在异常交易的交易事件的集合,其任意元素,即交易事件,是被交易股票stk和交易起止时间tb、te构成的三元组,对股票stk的异常交易发生在起始时间tb和终止时间te之间,起始时间tb应早于终止时间te,且对于同一起交易事件,起始时间tb与终止时间te的间隔不大于一定的正数阈值tgap;任意交易事件表示为(stk,tb,te)|tb<te,te-tb<tgap,tgap>0。
4.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S102)和步骤S106)中股票交易是指股票账户对股票进行交易委托或撤销交易委托的行为,不论该交易是否成交。
5.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S103)中的交易事件参与阈值THRSTK确定了一个备选的交易事件被正式认定为交易事件在参与度上的应该具有的最低限度,步骤S107)中疑点账户参与阈值THRACC确定了一个备选的股票账户被正式认定为疑点账户在参与度上具有的最低限度,上述两项阈值使用相同或相似的计算方法确定,且随循环迭代的进行而非严格递增。
6.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S104)中的交易事件的参与度PSTK描述了一个备选的交易事件被疑点账户着重参与的程度,步骤S108)中股票账户的参与度PACC确定了一个备选的股票账户着重参与交易事件的程度,上述两项参与度使用相同或相似的计算方法确定,且与各自的参与阈值相匹配。
7.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S109)具体包括:对于疑点账户集合和交易事件集合,以疑点账户对交易事件的参与情况为基础,计算任意两个账户间股票交易的协同度SIM,并以疑点账户为节点,以两两疑点账户之间的协同股票交易为边,以两账户间的协同度为边的权值,构建描述所有疑点账户在所有交易事件上协同情况的账户间交易协同图GSIM。
8.根据权利要求7所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,疑点账户集合内任意一个股票账户accx和另一股票账户accy之间的交易协同度SIMxy,为有向协同度或无向协同度,是反映两账户在交易事件集合中所有事件上的总体协同情况的标量协同度,或者是以每一维度独立反映两账户在交易事件集合中的一起事件(stk,tb,te)上的协同情况的向量协同度。
9.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S110)中协同密集,是指账户社区内任意两账户间协同度SIM不低于阈值SIM0的边的数目E与理论任意两账户全连接边的数目Ec的比值不低于阈值Pint,即其中0<Pint<1。
10.根据权利要求1所述的一种基于二部图的股票协同交易疑点群体检测方法,其特征在于,步骤S110)中股票协同交易疑点群体,是指在对应交易事件群体内的所有交易事件上同步着重参与,进而对相关股票的股价走势存在可能的潜在影响的股票账户的集合,所有股票协同交易疑点群体及其对应的交易事件群体是整个股票协同交易疑点群体检测方法的最终输出。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910585215.7A CN110362609B (zh) | 2019-07-01 | 2019-07-01 | 一种基于二部图的股票协同交易疑点群体检测方法 |
PCT/CN2019/115103 WO2021000475A1 (zh) | 2019-07-01 | 2019-11-01 | 一种基于二部图的股票协同交易疑点群体检测方法 |
US17/105,513 US20210081964A1 (en) | 2019-07-01 | 2020-11-26 | Method for detecting suspicious groups in collaborative stock transactions based on bipartite graph |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910585215.7A CN110362609B (zh) | 2019-07-01 | 2019-07-01 | 一种基于二部图的股票协同交易疑点群体检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110362609A true CN110362609A (zh) | 2019-10-22 |
CN110362609B CN110362609B (zh) | 2021-09-07 |
Family
ID=68217852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910585215.7A Active CN110362609B (zh) | 2019-07-01 | 2019-07-01 | 一种基于二部图的股票协同交易疑点群体检测方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210081964A1 (zh) |
CN (1) | CN110362609B (zh) |
WO (1) | WO2021000475A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648231A (zh) * | 2019-08-13 | 2020-01-03 | 北京航空航天大学 | 基于大数据的股票市场的内幕交易行为的识别方法 |
WO2021000475A1 (zh) * | 2019-07-01 | 2021-01-07 | 西安交通大学 | 一种基于二部图的股票协同交易疑点群体检测方法 |
CN112785441A (zh) * | 2020-04-20 | 2021-05-11 | 招商证券股份有限公司 | 数据处理方法、装置、终端设备及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113935832A (zh) * | 2021-09-29 | 2022-01-14 | 光大科技有限公司 | 一种异常行为检测处理方法及装置 |
US11797480B2 (en) * | 2021-12-31 | 2023-10-24 | Tsx Inc. | Storage of order books with persistent data structures |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199832A (zh) * | 2014-08-01 | 2014-12-10 | 西安理工大学 | 基于信息熵的金融网络异常交易社区发现方法 |
CN105931046A (zh) * | 2015-12-16 | 2016-09-07 | 中国银联股份有限公司 | 一种可疑交易节点集合侦测方法及装置 |
KR20170052940A (ko) * | 2015-11-05 | 2017-05-15 | 이민형 | 휴대용 단말기를 통한 상품 구매 및 정보제공 시스템 및 방법 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
US20180262478A1 (en) * | 2009-03-25 | 2018-09-13 | The 41St Parameter, Inc. | Systems and methods of sharing information through a tag-based consortium |
US10135788B1 (en) * | 2014-02-11 | 2018-11-20 | Data Visor Inc. | Using hypergraphs to determine suspicious user activities |
CN109272319A (zh) * | 2018-08-14 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 社区映射及交易违规社区标识方法、装置、电子设备 |
CN109472694A (zh) * | 2017-09-08 | 2019-03-15 | 上海诺悦智能科技有限公司 | 一种可疑交易行为发现系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU5677599A (en) * | 1998-08-21 | 2000-03-14 | Marketxt, Inc. | A real-time computerized stock trading system |
US8612169B2 (en) * | 2011-04-26 | 2013-12-17 | International Business Machines Corporation | Method and system for detecting anomalies in a bipartite graph |
US9069963B2 (en) * | 2012-07-05 | 2015-06-30 | Raytheon Bbn Technologies Corp. | Statistical inspection systems and methods for components and component relationships |
US9077744B2 (en) * | 2013-03-06 | 2015-07-07 | Facebook, Inc. | Detection of lockstep behavior |
US8955129B2 (en) * | 2013-04-23 | 2015-02-10 | Duke University | Method and system for detecting fake accounts in online social networks |
US10721336B2 (en) * | 2017-01-11 | 2020-07-21 | The Western Union Company | Transaction analyzer using graph-oriented data structures |
US10380594B1 (en) * | 2018-08-27 | 2019-08-13 | Beam Solutions, Inc. | Systems and methods for monitoring and analyzing financial transactions on public distributed ledgers for suspicious and/or criminal activity |
CN109408634A (zh) * | 2018-09-17 | 2019-03-01 | 重庆邮电大学 | 一种基于派系过滤的意见垃圾用户群检测方法 |
CN110362609B (zh) * | 2019-07-01 | 2021-09-07 | 西安交通大学 | 一种基于二部图的股票协同交易疑点群体检测方法 |
WO2021076651A1 (en) * | 2019-10-18 | 2021-04-22 | Feedzai-Consultadoria E Inovacao Technologica, S.A. | Graph decomposition for fraudulent transaction analysis |
-
2019
- 2019-07-01 CN CN201910585215.7A patent/CN110362609B/zh active Active
- 2019-11-01 WO PCT/CN2019/115103 patent/WO2021000475A1/zh active Application Filing
-
2020
- 2020-11-26 US US17/105,513 patent/US20210081964A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180262478A1 (en) * | 2009-03-25 | 2018-09-13 | The 41St Parameter, Inc. | Systems and methods of sharing information through a tag-based consortium |
US10135788B1 (en) * | 2014-02-11 | 2018-11-20 | Data Visor Inc. | Using hypergraphs to determine suspicious user activities |
CN104199832A (zh) * | 2014-08-01 | 2014-12-10 | 西安理工大学 | 基于信息熵的金融网络异常交易社区发现方法 |
KR20170052940A (ko) * | 2015-11-05 | 2017-05-15 | 이민형 | 휴대용 단말기를 통한 상품 구매 및 정보제공 시스템 및 방법 |
CN105931046A (zh) * | 2015-12-16 | 2016-09-07 | 中国银联股份有限公司 | 一种可疑交易节点集合侦测方法及装置 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
CN109472694A (zh) * | 2017-09-08 | 2019-03-15 | 上海诺悦智能科技有限公司 | 一种可疑交易行为发现系统 |
CN109272319A (zh) * | 2018-08-14 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 社区映射及交易违规社区标识方法、装置、电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021000475A1 (zh) * | 2019-07-01 | 2021-01-07 | 西安交通大学 | 一种基于二部图的股票协同交易疑点群体检测方法 |
CN110648231A (zh) * | 2019-08-13 | 2020-01-03 | 北京航空航天大学 | 基于大数据的股票市场的内幕交易行为的识别方法 |
CN112785441A (zh) * | 2020-04-20 | 2021-05-11 | 招商证券股份有限公司 | 数据处理方法、装置、终端设备及存储介质 |
CN112785441B (zh) * | 2020-04-20 | 2023-12-05 | 招商证券股份有限公司 | 数据处理方法、装置、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20210081964A1 (en) | 2021-03-18 |
CN110362609B (zh) | 2021-09-07 |
WO2021000475A1 (zh) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362609A (zh) | 一种基于二部图的股票协同交易疑点群体检测方法 | |
Rosner et al. | Understanding and regulating twenty-first century payment systems: The ripple case study | |
Bessembinder et al. | Does an electronic stock exchange need an upstairs market? | |
Park | The conceptual flaws of decentralized automated market making | |
Sharfman | Activist hedge funds in a world of board independence: Creators or destroyers of long-term value | |
Li et al. | Empirical bid or no bid decision process in international construction projects: Structural equation modeling framework | |
Collin-Dufresne et al. | Informed trading in the stock market and option-price discovery | |
Lehar et al. | Decentralized exchange: The uniswap automated market maker | |
Brauneis et al. | A high-frequency analysis of bitcoin markets | |
Hansson | Arbitrage in crypto markets: An analysis of primary ethereum blockchain data | |
Conlon et al. | ICO fraud and regulation | |
Hess | Bridging Policy and Practice: A Pragmatic Approach to Decentralized Finance, Risk, and Regulation | |
Austin | Protecting market integrity in an era of fragmentation and cross-border trading | |
Vergos et al. | Evaluating interdependencies in African markets A VECM approach | |
Cao et al. | Market microstructure patterns powering trading and surveillance agents | |
Marquez et al. | Selling assets: Are sellers better off with strong buyers? | |
Crabo et al. | An Investigation into the Interactions Between the Bitcoin Spot and Futures Markets | |
Saengchote et al. | Network topology in decentralized finance | |
Buckley | Blockchain based prediction markets | |
Wieland | Case Study–The IPO of Neobroker Robinhood | |
Park et al. | A 2023 Primer for Crypto Credit Markets | |
Arora et al. | SecDeLP: Secure Decentralized Lending Platforms against Oracle Manipulation Attacks | |
Zhang et al. | Unobservable Information Acquisition and Insider Trading | |
Rath et al. | Profiling Cryptocurrency Pump and Dump Schemes in DeFi: A Chain-Level Analysis of Coins and Participants | |
Raza | Executive wealth and options trading around litigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |