CN110400082B - 异常交易企业的识别方法和装置 - Google Patents

异常交易企业的识别方法和装置 Download PDF

Info

Publication number
CN110400082B
CN110400082B CN201910687075.4A CN201910687075A CN110400082B CN 110400082 B CN110400082 B CN 110400082B CN 201910687075 A CN201910687075 A CN 201910687075A CN 110400082 B CN110400082 B CN 110400082B
Authority
CN
China
Prior art keywords
transaction
enterprise
historical
historical transaction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910687075.4A
Other languages
English (en)
Other versions
CN110400082A (zh
Inventor
刘华杰
李晓萍
徐祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN201910687075.4A priority Critical patent/CN110400082B/zh
Publication of CN110400082A publication Critical patent/CN110400082A/zh
Application granted granted Critical
Publication of CN110400082B publication Critical patent/CN110400082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供一种异常交易企业的识别方法和装置,该方法包括:根据企业基本信息以及历史交易数据获取历史交易图数据;对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;根据该历史交易特征数据获取历史交易编码;根据该历史交易编码识别异常交易企业,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。

Description

异常交易企业的识别方法和装置
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种异常交易企业的识别方法和装置。
背景技术
在金融系统中,风险防范一直是最重要的课题。随着经济高速发展,企业兼并重组、跨业经营越来越多,投资扩张、集团化趋势明显,企业之间的关联关系、交易越来越多而且越来越复杂,导致风险识别的难度极大。
交易异常作为企业风险的一种,不仅可能导致信贷违约风险也可能隐藏着关联交易等风险,因此,需要一种有效的技术手段识别交易异常。
目前,往往利用专家系统或者交易模型来识别异常交易企业。比如:利用专家系统或者交易模型识别交易金额异常、交易对手异常等。但是,上述方法需要丰富的专家经验,并且容易误识别,不能适应越来越频繁的经济活动的需求。
发明内容
针对现有技术中的问题,本发明提供一种异常交易企业的识别方法、装置、电子设备以及计算机可读存储介质,能够至少部分地解决现有技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
第一方面,提供一种异常交易企业的识别方法,包括:
根据企业基本信息以及历史交易数据获取历史交易图数据;
对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;
根据该历史交易特征数据获取历史交易编码;
根据该历史交易编码识别异常交易企业。
进一步地,该根据历史交易编码识别异常交易企业,包括:
对该历史交易编码进行聚类分析得到异常交易企业。
进一步地,该对该历史交易编码进行聚类分析得到异常交易企业,包括:
对该历史交易编码进行聚类得到预设数量的历史交易编码集合;
将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
进一步地,该根据该特征编码识别异常交易企业,包括:
获取已知异常交易企业对应的历史交易编码;
计算各条历史交易编码与该已知异常交易企业对应的历史交易编码的相似度;
将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
进一步地,该历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;该企业基本信息包括:企业主基本信息以及企业账户基本信息;
该根据企业基本信息以及历史交易数据获取历史交易图数据,包括:
根据该历史交易数据中的该本方账户标识获取所属企业的基本信息;
根据所属企业的基本信息将该历史交易数据转换为历史交易图数据;
其中,该历史交易图数据为交易点-交易边的形式;该交易点代表交易主体,包括企业基本信息;该交易边代表交易关系,包括交易金额、交易次数。
进一步地,该对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据,包括:
对该历史交易图数据进行标准化;
对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据。
进一步地,该对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据,包括:
根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将该历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
进一步地,该根据该历史交易特征数据获取历史交易编码包括:
采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码;
将该企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
第二方面,提供一种异常交易企业的识别装置,包括:
历史交易图数据获取模块,根据企业基本信息以及历史交易数据获取历史交易图数据;
特征处理模块,对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;
编码模块,根据该历史交易特征数据获取历史交易编码;
异常交易企业识别模块,根据该历史交易编码识别异常交易企业。
进一步地,该异常交易企业识别模块包括:
聚类分析单元,对该历史交易编码进行聚类分析得到异常交易企业。
进一步地,该聚类分析单元包括:
聚类子单元,对该历史交易编码进行聚类得到预设数量的历史交易编码集合;
第一识别子单元,将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
进一步地,该异常交易企业识别模块包括:
异常获取单元,获取已知异常交易企业对应的历史交易编码;
相似度计算单元,计算各条历史交易编码与该已知异常交易企业对应的历史交易编码的相似度;
第二识别子单元,将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
进一步地,该历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;该企业基本信息包括:企业主基本信息以及企业账户基本信息;
该历史交易图数据获取模块包括:
基本信息获取单元,根据该历史交易数据中的该本方账户标识获取所属企业的基本信息;
数据转换单元,根据所属企业的基本信息将该历史交易数据转换为历史交易图数据;
其中,该历史交易图数据为交易点-交易边的形式;该交易点代表交易主体,包括企业基本信息;该交易边代表交易关系,包括交易金额、交易次数。
进一步地,该特征处理模块包括:
标准化单元,对该历史交易图数据进行标准化;
分箱单元,对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据。
进一步地,该分箱单元包括:
分箱子单元,根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将该历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
进一步地,该编码模块包括:
向量转换单元,采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码;
编码叠加单元,将该企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述的异常交易企业的识别方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的异常交易企业的识别方法的步骤。
本发明提供的异常交易企业的识别方法、装置、电子设备以及计算机可读存储介质,该方法包括:根据企业基本信息以及历史交易数据获取历史交易图数据;对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;根据该历史交易特征数据获取历史交易编码;根据该历史交易编码识别异常交易企业,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中的服务器S1与客户端设备B1之间的架构示意图;
图2为本发明实施例中的服务器S1、客户端设备B1及数据库服务器S2之间的架构示意图;
图3是本发明实施例中的异常交易企业的识别方法的流程示意图一;
图4示出了本发明实施例中资金交易图谱;
图5示出了图3中步骤S400的一种具体步骤;
图6示出了图3中步骤S400的另一种具体步骤;
图7示出了图3中步骤S100的具体步骤;
图8示出了图3中步骤S300的一种具体步骤;
图9是本发明实施例中的异常交易企业的识别装置的结构框图;
图10为本发明实施例电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
现有技术利用专家系统或者交易模型来识别异常交易企业。比如:利用专家系统或者交易模型识别交易金额异常、交易对手异常等。但是,上述方法需要丰富的专家经验,并且容易误识别,不能适应越来越频繁的经济活动的需求。
为至少部分解决现有技术中存在的上述技术问题,本发明实施例提供了一种异常交易企业的识别方法,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
有鉴于此,本申请提供了一种异常交易企业的识别装置,该装置可以为一种服务器S1,参见图1,该服务器S1可以与至少一个客户端设备B1通信连接,所述客户端设备B1可以将历史交易数据发送至所述服务器S1,所述服务器S1可以在线接收所述历史交易数据。所述服务器S1可以在线或者离线对获取的历史交易数据进行预处理,根据企业基本信息以及历史交易数据获取历史交易图数据;对该历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;根据该历史交易特征数据获取历史交易编码;根据该历史交易编码识别异常交易企业。
其中,该客户端设备可为金融系统所在服务器。
另外,参见图2,所述服务器S1还可以与至少一个数据库服务器S2通信连接,所述数据库服务器S2用于存储企业基本信息,例如,该数据库服务器可为金融企业的服务器,里面记载有企业的信息以及账户的信息,和/或可为公安系统或工商部门的服务器,记载有企业以及企业法人代表的相关信息。所述数据库服务器S2在线将所述企业基本信息发送至所述服务器S1,所述服务器S1可以在线接收所述企业基本信息。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
图3是本发明实施例中的异常交易企业的识别方法的流程示意图一。如图3所示,该异常交易企业的识别方法可以包括以下内容:
步骤S100:根据企业基本信息以及历史交易数据获取历史交易图数据。
其中,历史交易数据为金融系统中的所有账户的历史交易数据。
历史交易数据包括往来账户基本信息,比如:本方账户标识(如账户编号、账户名称)、对方账户标识(如账户编号、账户名称)、交易金额、资金流向、开户行等,其中,资金流向包括:资金借贷方向、资金月总金额、资金月交易次数等;所述企业基本信息包括:企业主基本信息以及企业账户基本信息等,企业主是指企业的法人代表,是一个自然人,企业主基本信息包括:企业主身份标识(身份证号、护照号等)、企业主姓名、企业主性别、企业主年龄以及企业主学历等。
其中,所述历史交易图数据按照图数据格式存储在图数据库中,用于构造资金交易图谱,如图4所示。
资金交易图谱由交易点、交易边组成,所述交易点代表交易主体,包括企业基本信息、账户的基本信息等;所述交易边代表交易关系,包括交易金额、交易次数、企业主与企业的从属关系等。
步骤S200:对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据。
其中,标准化包括:对开户行进行归一化、对企业所属行业进行归一化、对地址信息进行归并等,具体地,不同银行对开户行的名称叫法有所不同,通过获取所有银行对开户行名称的规定,将历史交易数据中所有涉及到的开户行的叫法进行归一化,使同一开户行的名称统一;通过对企业所属行业进行归一化,比如采用同义词库方法,使得相同行业的名称统一,对地址信息进行归并时需要一个地址规则进行同一,比如,采用城市、街道名称命名实体抽取方法,并对城市人工建立同义词库,使得地址信息统一化。
其中,历史交易特征数据也按照图数据格式存储在图数据库中。
另外,对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据,即:根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将所述历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
具体地,交易金额、次数分箱是指对数值型变量,进行区间划分。比如,交易金额小于10000、10000到500000、500000到1000000、大于1000000化分成四个箱子,标注成1、2、3、4。同理,交易次数也进行分箱处理,便于后续特征编码使用。分箱的依据是预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表。
步骤S300:根据所述历史交易特征数据获取历史交易编码。
通过将历史交易特征数据进行编码量化,可以利用后续找到各历史交易特征数据的关联和相似度。
步骤S400:根据所述历史交易编码识别异常交易企业。
其中,本发明实施例提供了两种异常交易企业识别方法,一是未知交易风险,挖掘发现异常交易数据,二是已知异常交易风险节点,挖掘发现类似节点数据。
具体地,可以采用聚类分析的方法挖掘未知的交易风险,即资金交易图谱中的异常交易节点,也可在已知异常交易企业的基础上,计算资金交易图谱中的其他节点与该已知异常交易企业的相似度,进而根据相似度筛选出异常交易企业。
值得说明的是,此处识别异常交易企业为可疑的企业,受限于机器处理的精度,可疑的企业并不是百分之百存在异常,此时,可以人工根据资金交易图谱判断识别的异常交易企业是否真的存在风险。
通过上述技术方案可以得知,本发明实施例提供的异常交易企业的识别方法,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
在一个可选的实施例中,可以通过对所述历史交易编码进行聚类分析得到异常交易企业,参见图5,该步骤S400可以包括以下内容:
步骤S410:对所述历史交易编码进行聚类得到预设数量的历史交易编码集合。
具体地,聚类算法可以采用LDA(Latent Dirichlet Allocation)或者K-means聚类算法。在聚类时需要预设分类的数量。
值得说明的是,在进行异常交易企业识别时,可以首先根据业务关注逻辑抽取关注节点群,比如,抽取上海地区电力能源行业的企业。
步骤S420:将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
其中,该预设值可以根据应用需求由用户设置。
举例来说,可以按照业务关注点进行聚类分析,比如用户关注于北京地区房地产行业的企业风险,可根据行业信息抽取北京地区房地产企业的向量,然后进行聚类分析,聚类方法可以采用K-means聚类算法,距离函数采用余弦距离函数。得到聚类的类别后,可以找到一些异常值,提示给风险管理者。
通过采用上述技术方案,可以有效利用交易中各种信息的内在联系,挖掘未知的交易风险,灵活方便。
图6示出了图3中步骤S400的另一种具体步骤。如图6所示,该步骤S400可以包括以下技术内容:
步骤S410’:获取已知异常交易企业对应的历史交易编码。
步骤S420’:计算各条历史交易编码与所述已知异常交易企业对应的历史交易编码的相似度。
其中,该相似度可选用两个编码的余弦相似度。
步骤S430’:将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
具体地,在已知一些企业发生交易风险后,使用发生交易风险的企业的向量,到图中进行遍历计算,可以得到每家企业的和发生交易风险企业的相似度。若节点的相似度高于预设阈值,则确定该节点为疑似交易风险节点,所述交易节点的交易数据为交易风险数据。
通过采用上述技术方案,能够在已知交易风险的基础上,挖掘出相似的交易企业,以便利用历史经验进行风险挖掘,准确度高,利于推广应用。
图7示出了图3中步骤S100的具体步骤。如图7所示,该步骤S100可以包括以下内容:
步骤S110:根据所述历史交易数据中的所述本方账户标识获取所属企业的基本信息;
其中,所述历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;所述企业基本信息包括:企业主基本信息以及企业账户基本信息。
具体地,可以根据本方账户标识去公安系统的数据库、工商管理部门的数据库以及银行系统的数据中调用所属企业的基本信息。
步骤S120:根据所属企业的基本信息将所述历史交易数据转换为历史交易图数据。
具体地,将所属企业的基本信息将所述历史交易数据转换为交易点-交易边的形式;所述交易点代表交易主体,包括企业基本信息;所述交易边代表交易关系,包括交易金额、交易次数。
图8示出了图3中步骤S300的一种具体步骤。如图8所示,该步骤S300具体包括以下内容:
步骤S310:采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码。
步骤S320:将所述企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
具体地,one-hot方法是对分类特征的一种向量编码方式,例如:性别有男女、行业有农林牧渔等,地区有各个城市。则性别特征可以编码成01表示男,10表示女。同理假设行业有10个,则农业可以编码成1000000000,林业编码成0100000000。通过采用向量编码方式将各个特征转换为向量后,进行向量拼接与相加。比如:企业账户A,企业主性别为男、学历为本科、企业账户为农业、交易对手账户B,交易对手账户B的企业账户行业为金融业,交易对手账户C,交易对手账户C企业账户行业为林业。则性别特征编码01、学历001、行业1000000000,交易对手B行业特征编码0010000000、交易对手C行业特征编码0100000000。最终特征加工后的编码为性别、学历、行业进行特征拼接后,和交易对手特征编码进行相加。拼接采用性别|学历|行业得到010011000000000,交易对手B为000000010000000,交易对手C为000000100000000。对此编码进行相加得到最终编码010011110000000。
在一个可选的实施例中,特征编码方式可采用词袋编码方式。
具体的编码方法如下:企业A,交易对手为企业B、企业C等,根据之前加工后的特征,按照词袋编码方式进行编码,将所有出现过的单词装进一个袋子里,忽略词法与语序,每个单词都是独立的。那么单词的维度就是词袋的大小(用单词的出现次数表达)。如企业A的行业为房地产,交易对手B的行业为金融业,C的行业为建筑业,假设共有10个行业,则行业向量编码为1100000000。同理交易金额、次数也可以编码为010000,0010。然后将此向量进行拼接得到最终企业A的向量11000000000100000010。
在一个可选的实施例中,该异常交易企业的识别方法还可以包括:
对企业基本信息以及历史交易数据进行数据清洗,比如数据拼接、数据格式转换、异常数据处理等。
综上所述,本发明实施例提供的异常交易企业的识别方法,主要通过构建交易资金流向信息和交易双方信息构建企业交易图谱,并借助向量编码方法自动进行节点向量编码。此向量编码基于大量的交易数据构建,里面隐含着企业的特征和企业和企业的关系,然后根据节点向量可以进行聚类分析,挖掘出异常交易企业,并且在已知交易风险企业节点后可以进行快速筛查出类似的企业节点信息提供给风险管理者。此方法极大的减少了风险管理者的人力投入,无需编写具体的业务规则。对交易风险的挖掘更加准确。此外,本发明随着企业的增加,交易的改变,无需进行人工业务干预调整,自行就会进行图谱重构,自行进行异常交易发现。相比于专家经验编写,在经济发展,企业经济活动变换下,专家经验往往失效,而此方法并不存在失效重新投入人力挖掘的问题。
基于同一发明构思,本申请实施例还提供了一种异常交易企业的识别装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于异常交易企业的识别装置解决问题的原理与上述方法相似,因此异常交易企业的识别装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图9是本发明实施例中的异常交易企业的识别装置的结构框图。如图9所示,该异常交易企业的识别装置具体包括:历史交易图数据获取模块10、特征处理模块20、编码模块30以及异常交易企业识别模块40。
历史交易图数据获取模块10根据企业基本信息以及历史交易数据获取历史交易图数据;
其中,历史交易数据为金融系统中的所有账户的历史交易数据。
历史交易数据包括往来账户基本信息,比如:本方账户标识(如账户编号、账户名称)、对方账户标识(如账户编号、账户名称)、交易金额、资金流向、开户行等,其中,资金流向包括:资金借贷方向、资金月总金额、资金月交易次数等;所述企业基本信息包括:企业主基本信息以及企业账户基本信息等,企业主是指企业的法人代表,是一个自然人,企业主基本信息包括:企业主身份标识(身份证号、护照号等)、企业主姓名、企业主性别、企业主年龄以及企业主学历等。
其中,所述历史交易图数据按照图数据格式存储在图数据库中,用于构造资金交易图谱。
资金交易图谱由交易点、交易边组成,所述交易点代表交易主体,包括企业基本信息、账户的基本信息等;所述交易边代表交易关系,包括交易金额、交易次数、企业主与企业的从属关系等。
特征处理模块20对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;
编码模块30根据所述历史交易特征数据获取历史交易编码;
通过将历史交易特征数据进行编码量化,可以利用后续找到各历史交易特征数据的关联和相似度。
异常交易企业识别模块40根据所述历史交易编码识别异常交易企业。
其中,本发明实施例提供了两种异常交易企业识别方法,一是未知交易风险,挖掘发现异常交易数据,二是已知异常交易风险节点,挖掘发现类似节点数据。
具体地,可以采用聚类分析的方法挖掘未知的交易风险,即资金交易图谱中的异常交易节点,也可在已知异常交易企业的基础上,计算资金交易图谱中的其他节点与该已知异常交易企业的相似度,进而根据相似度筛选出异常交易企业。
值得说明的是,此处识别异常交易企业为可疑的企业,受限于机器处理的精度,可疑的企业并不是百分之百存在异常,此时,可以人工根据资金交易图谱判断识别的异常交易企业是否真的存在风险。
通过上述技术方案可以得知,本发明实施例提供的异常交易企业的识别装置,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
在一个可选的实施例中,所述异常交易企业识别模块40包括:聚类分析单元,用于对所述历史交易编码进行聚类分析得到异常交易企业。
具体地,聚类分析单元包括:聚类子单元以及第一识别子单元。
聚类子单元对所述历史交易编码进行聚类得到预设数量的历史交易编码集合;
具体地,聚类算法可以采用LDA(Latent Dirichlet Allocation)或者K-means聚类算法。在聚类时需要预设分类的数量。
值得说明的是,在进行异常交易企业识别时,可以首先根据业务关注逻辑抽取关注节点群,比如,抽取上海地区电力能源行业的企业。
第一识别子单元将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
其中,该预设值可以根据应用需求由用户设置。
举例来说,可以按照业务关注点进行聚类分析,比如用户关注于北京地区房地产行业的企业风险,可根据行业信息抽取北京地区房地产企业的向量,然后进行聚类分析,聚类方法可以采用K-means聚类算法,距离函数采用余弦距离函数。得到聚类的类别后,可以找到一些异常值,提示给风险管理者。
通过采用上述技术方案,可以有效利用交易中各种信息的内在联系,挖掘未知的交易风险,灵活方便。
在另一个可选的实施例中,所述异常交易企业识别模块40包括:异常获取单元、相似度计算单元以及第二识别子单元。
异常获取单元获取已知异常交易企业对应的历史交易编码;
相似度计算单元计算各条历史交易编码与所述已知异常交易企业对应的历史交易编码的相似度;
其中,该相似度可选用两个编码的余弦相似度。
第二识别子单元将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
具体地,在已知一些企业发生交易风险后,使用发生交易风险的企业的向量,到图中进行遍历计算,可以得到每家企业的和发生交易风险企业的相似度。若节点的相似度高于预设阈值,则确定该节点为疑似交易风险节点,所述交易节点的交易数据为交易风险数据。
通过采用上述技术方案,能够在已知交易风险的基础上,挖掘出相似的交易企业,以便利用历史经验进行风险挖掘,准确度高,利于推广应用。
在一个可选的实施例中,所述历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;所述企业基本信息包括:企业主基本信息以及企业账户基本信息;
所述历史交易图数据获取模块10包括:基本信息获取单元、数据转换单元。
基本信息获取单元根据所述历史交易数据中的所述本方账户标识获取所属企业的基本信息;
具体地,可以根据本方账户标识去公安系统的数据库、工商管理部门的数据库以及银行系统的数据中调用所属企业的基本信息。
数据转换单元根据所属企业的基本信息将所述历史交易数据转换为历史交易图数据;
具体地,将所属企业的基本信息将所述历史交易数据转换为交易点-交易边的形式;所述交易点代表交易主体,包括企业基本信息等;所述交易边代表交易关系,包括交易金额、交易次数等。
在一个可选的实施例中,所述特征处理模块20包括:标准化单元以及分箱单元。
标准化单元对所述历史交易图数据进行标准化;
其中,标准化包括:对开户行进行归一化、对企业所属行业进行归一化、对地址信息进行归并等,具体地,不同银行对开户行的名称叫法有所不同,通过获取所有银行对开户行名称的规定,将历史交易数据中所有涉及到的开户行的叫法进行归一化,使同一开户行的名称统一;通过对企业所属行业进行归一化,比如采用同义词库方法,使得相同行业的名称统一,对地址信息进行归并时需要一个地址规则进行同一,比如,采用城市、街道名称命名实体抽取方法,并对城市人工建立同义词库,使得地址信息统一化。
其中,历史交易特征数据也按照图数据格式存储在图数据库中。
分箱单元对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据。
在一个可选的实施例中,所述分箱单元包括:分箱子单元,根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将所述历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
具体地,交易金额、次数分箱是指对数值型变量,进行区间划分。比如,交易金额小于10000、10000到500000、500000到1000000、大于1000000化分成四个箱子,标注成1、2、3、4。同理,交易次数也进行分箱处理,便于后续特征编码使用。分箱的依据是预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表。
在一个可选的实施例中,所述编码模块30包括:向量转换单元以及编码叠加单元。
向量转换单元采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码;
编码叠加单元将所述企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
具体地,one-hot方法是对分类特征的一种向量编码方式,例如:性别有男女、行业有农林牧渔等,地区有各个城市。则性别特征可以编码成01表示男,10表示女。同理假设行业有10个,则农业可以编码成1000000000,林业编码成0100000000。通过采用向量编码方式将各个特征转换为向量后,进行向量拼接与相加。比如:企业账户A,企业主性别为男、学历为本科、企业账户为农业、交易对手账户B,交易对手账户B的企业账户行业为金融业,交易对手账户C,交易对手账户C企业账户行业为林业。则性别特征编码01、学历001、行业1000000000,交易对手B行业特征编码0010000000、交易对手C行业特征编码0100000000。最终特征加工后的编码为性别、学历、行业进行特征拼接后,和交易对手特征编码进行相加。拼接采用性别|学历|行业得到010011000000000,交易对手B为000000010000000,交易对手C为000000100000000。对此编码进行相加得到最终编码010011110000000。
在一个可选的实施例中,特征编码方式可采用词袋编码方式。
具体的编码方法如下:企业A,交易对手为企业B、企业C等,根据之前加工后的特征,按照词袋编码方式进行编码,将所有出现过的单词装进一个袋子里,忽略词法与语序,每个单词都是独立的。那么单词的维度就是词袋的大小(用单词的出现次数表达)。如企业A的行业为房地产,交易对手B的行业为金融业,C的行业为建筑业,假设共有10个行业,则行业向量编码为1100000000。同理交易金额、次数也可以编码为010000,0010。然后将此向量进行拼接得到最终企业A的向量11000000000100000010。
在一个可选的实施例中,该异常交易企业的识别装置还可以包括:数据清洗模块,用于对企业基本信息以及历史交易数据进行数据清洗,比如数据拼接、数据格式转换、异常数据处理等。
综上所述,本发明实施例提供的异常交易企业的识别装置,主要通过构建交易资金流向信息和交易双方信息构建企业交易图谱,并借助向量编码方法自动进行节点向量编码。此向量编码基于大量的交易数据构建,里面隐含着企业的特征和企业和企业的关系,然后根据节点向量可以进行聚类分析,挖掘出异常交易企业,并且在已知交易风险企业节点后可以进行快速筛查出类似的企业节点信息提供给风险管理者。此方法极大的减少了风险管理者的人力投入,无需编写具体的业务规则。对交易风险的挖掘更加准确。此外,本发明随着企业的增加,交易的改变,无需进行人工业务干预调整,自行就会进行图谱重构,自行进行异常交易发现。相比于专家经验编写,在经济发展,企业经济活动变换下,专家经验往往失效,而此方法并不存在失效重新投入人力挖掘的问题。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现下述步骤:
根据企业基本信息以及历史交易数据获取历史交易图数据;
对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;
根据所述历史交易特征数据获取历史交易编码;
根据所述历史交易编码识别异常交易企业。
从上述描述可知,本发明实施例提供的电子设备,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
下面参考图10,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图10所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现下述步骤:
根据企业基本信息以及历史交易数据获取历史交易图数据;
对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据;
根据所述历史交易特征数据获取历史交易编码;
根据所述历史交易编码识别异常交易企业。
从上述描述可知,本发明实施例提供的计算机可读存储介质,能够自动识别异常交易企业,不需要丰富的专家经验,不容易误识别,能适应越来越频繁的经济活动的需求。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种异常交易企业的识别方法,其特征在于,包括:
根据企业基本信息以及历史交易数据获取历史交易图数据;
对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据,分箱的依据是预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表;
根据所述历史交易特征数据获取历史交易编码;
根据所述历史交易编码识别异常交易企业;
所述根据所述历史交易特征数据获取历史交易编码包括:
通过采用向量编码方式将各个特征数据转换为向量后,进行向量拼接与相加,得到历史交易编码;
所述历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;所述企业基本信息包括:企业主基本信息以及企业账户基本信息;
所述根据企业基本信息以及历史交易数据获取历史交易图数据,包括:
根据所述历史交易数据中的所述本方账户标识获取所属企业的基本信息;
根据所属企业的基本信息将所述历史交易数据转换为历史交易图数据;
其中,所述历史交易图数据为交易点-交易边的形式;所述交易点代表交易主体,包括企业基本信息;所述交易边代表交易关系,包括交易金额、交易次数;
所述根据所述历史交易特征数据获取历史交易编码包括:
采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码;
将所述企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
2.根据权利要求1所述的异常交易企业的识别方法,其特征在于,所述根据所述历史交易编码识别异常交易企业,包括:
对所述历史交易编码进行聚类分析得到异常交易企业。
3.根据权利要求2所述的异常交易企业的识别方法,其特征在于,所述对所述历史交易编码进行聚类分析得到异常交易企业,包括:
对所述历史交易编码进行聚类得到预设数量的历史交易编码集合;
将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
4.根据权利要求1所述的异常交易企业的识别方法,其特征在于,所述根据所述历史交易编码识别异常交易企业,包括:
获取已知异常交易企业对应的历史交易编码;
计算各条历史交易编码与所述已知异常交易企业对应的历史交易编码的相似度;
将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
5.根据权利要求1所述的异常交易企业的识别方法,其特征在于,所述对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据,包括:
对所述历史交易图数据进行标准化;
对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据。
6.根据权利要求5所述的异常交易企业的识别方法,其特征在于,所述对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据,包括:
根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将所述历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
7.一种异常交易企业的识别装置,其特征在于,包括:
历史交易图数据获取模块,根据企业基本信息以及历史交易数据获取历史交易图数据;
特征处理模块,对所述历史交易图数据进行标准化和交易金额分箱处理得到历史交易特征数据,分箱的依据是预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表;
编码模块,根据所述历史交易特征数据获取历史交易编码;
异常交易企业识别模块,根据所述历史交易编码识别异常交易企业;
所述编码模块,通过采用向量编码方式将各个特征数据转换为向量后,进行向量拼接与相加,得到历史交易编码;
所述历史交易数据包括:本方账户标识、对方账户标识、交易金额和资金流向;所述企业基本信息包括:企业主基本信息以及企业账户基本信息;
所述历史交易图数据获取模块包括:
基本信息获取单元,根据所述历史交易数据中的所述本方账户标识获取所属企业的基本信息;
数据转换单元,根据所属企业的基本信息将所述历史交易数据转换为历史交易图数据;
其中,所述历史交易图数据为交易点-交易边的形式;所述交易点代表交易主体,包括企业基本信息;所述交易边代表交易关系,包括交易金额、交易次数;
所述编码模块包括:
向量转换单元,采用one-hot方式对历史交易特征数据中的企业基本信息进行特征向量编码,得到企业特征编码;
编码叠加单元,将所述企业特征编码与对方企业的企业特征编码相加得到历史交易编码。
8.根据权利要求7所述的异常交易企业的识别装置,其特征在于,所述异常交易企业识别模块包括:
聚类分析单元,对所述历史交易编码进行聚类分析得到异常交易企业。
9.根据权利要求8所述的异常交易企业的识别装置,其特征在于,所述聚类分析单元包括:
聚类子单元,对所述历史交易编码进行聚类得到预设数量的历史交易编码集合;
第一识别子单元,将元素数量小于预设值的历史交易编码集合对应的交易企业作为异常交易企业。
10.根据权利要求7所述的异常交易企业的识别装置,其特征在于,所述异常交易企业识别模块包括:
异常获取单元,获取已知异常交易企业对应的历史交易编码;
相似度计算单元,计算各条历史交易编码与所述已知异常交易企业对应的历史交易编码的相似度;
第二识别子单元,将相似度超过预设阈值的历史交易编码对应的交易企业作为异常交易企业。
11.根据权利要求7所述的异常交易企业的识别装置,其特征在于,所述特征处理模块包括:
标准化单元,对所述历史交易图数据进行标准化;
分箱单元,对标准化后的历史交易图数据进行交易金额分箱处理得到历史交易特征数据。
12.根据权利要求11所述的异常交易企业的识别装置,其特征在于,所述分箱单元包括:
分箱子单元,根据预设的交易金额-金额等级的转换关系表和/或预设的交易次数-次数等级的转换关系表将所述历史交易图数据中的交易金额和/或交易次数转换为对应的金额等级和/或次数等级,得到历史交易特征数据。
13.一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的异常交易企业的识别方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的异常交易企业的识别方法的步骤。
CN201910687075.4A 2019-07-29 2019-07-29 异常交易企业的识别方法和装置 Active CN110400082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910687075.4A CN110400082B (zh) 2019-07-29 2019-07-29 异常交易企业的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910687075.4A CN110400082B (zh) 2019-07-29 2019-07-29 异常交易企业的识别方法和装置

Publications (2)

Publication Number Publication Date
CN110400082A CN110400082A (zh) 2019-11-01
CN110400082B true CN110400082B (zh) 2022-12-13

Family

ID=68324426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910687075.4A Active CN110400082B (zh) 2019-07-29 2019-07-29 异常交易企业的识别方法和装置

Country Status (1)

Country Link
CN (1) CN110400082B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907009B (zh) * 2019-12-04 2023-04-18 贝壳技术有限公司 标准化模型的构建方法、装置、存储介质及设备
CN111178615B (zh) * 2019-12-24 2023-10-27 成都数联铭品科技有限公司 一种企业风险识别模型的构建方法及系统
CN112598428A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 交易数据的处理方法、装置、计算机设备及存储介质
CN113935574B (zh) * 2021-09-07 2023-09-29 中金支付有限公司 异常交易的监测方法、装置、计算机设备和存储介质
CN114723554B (zh) * 2022-06-09 2022-09-23 中国工商银行股份有限公司 异常账户识别方法及装置
CN116932766B (zh) * 2023-09-15 2023-12-29 腾讯科技(深圳)有限公司 对象分类方法、装置、设备、存储介质及程序产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165950A (zh) * 2018-08-10 2019-01-08 哈尔滨工业大学(威海) 一种基于金融时间序列特征的异常交易识别方法,设备及可读存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9652391B2 (en) * 2014-12-30 2017-05-16 Arteris, Inc. Compression of hardware cache coherent addresses
US10528948B2 (en) * 2015-05-29 2020-01-07 Fair Isaac Corporation False positive reduction in abnormality detection system models
CN107133833A (zh) * 2016-02-26 2017-09-05 阿里巴巴集团控股有限公司 异常交易识别方法及装置
CN107679859B (zh) * 2017-07-18 2020-08-25 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统
CN107918905B (zh) * 2017-11-22 2021-10-15 创新先进技术有限公司 异常交易识别方法、装置及服务器
CN108985929B (zh) * 2018-06-11 2022-04-08 创新先进技术有限公司 训练方法、业务数据分类处理方法及装置、电子设备
CN108960833B (zh) * 2018-08-10 2022-03-11 哈尔滨工业大学(威海) 一种基于异构金融特征的异常交易识别方法,设备及存储介质
CN109934268B (zh) * 2019-02-20 2021-01-22 中国工商银行股份有限公司 异常交易检测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165950A (zh) * 2018-08-10 2019-01-08 哈尔滨工业大学(威海) 一种基于金融时间序列特征的异常交易识别方法,设备及可读存储介质

Also Published As

Publication number Publication date
CN110400082A (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN110400082B (zh) 异常交易企业的识别方法和装置
CN110489520B (zh) 基于知识图谱的事件处理方法、装置、设备和存储介质
CN110197280B (zh) 一种知识图谱构建方法、装置及系统
Zemánková Artificial intelligence and blockchain in audit and accounting: Literature review
CN110489561A (zh) 知识图谱构建方法、装置、计算机设备和存储介质
CN110659318A (zh) 基于大数据的策略推送方法、系统及计算机设备
US20230071328A1 (en) Mapping consumer ownership of financial assets to geographic localities and computer-implemented methods and computer systems thereof
KR20200039852A (ko) 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법
CN112990281A (zh) 异常投标识别模型训练方法、异常投标识别方法及装置
Skyrius et al. The potential of big data in banking
CN111027832A (zh) 一种税务风险确定方法、装置及存储介质
CN114463138A (zh) 风险监测方法、装置、设备及存储介质
Owda et al. Financial discussion boards irregularities detection system (fdbs-ids) using information extraction
CN112598526A (zh) 资产数据的处理方法及装置
López-Díaz et al. A stochastic comparison of customer classifiers with an application to customer attrition in commercial banking
CN113408627A (zh) 目标对象的确定方法、装置和服务器
CN117033431A (zh) 工单处理方法、装置、电子设备和介质
Kasztelnik Innovative bank market risk measurement strategies using a modern machine learning approach: A novel aglomerative clustering model analysis
CN116757835A (zh) 信用卡客户贷中交易风险监控方法及装置
CN115994331A (zh) 基于决策树的报文分拣方法及装置
CN114493850A (zh) 基于人工智能的在线公证方法、系统及存储介质
Mahalle et al. Data Acquisition and Preparation
CN114064801A (zh) 基于知识图谱的区块链数据监管方法、系统及计算机设备
CN113159733A (zh) 公积金提取业务线上处理方法、装置、设备及存储介质
CN112468556A (zh) 一种服务产品信息的推送方法及装置、计算机设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant