CN111626854A - 可疑业务筛查图谱生成方法、装置、计算机设备 - Google Patents
可疑业务筛查图谱生成方法、装置、计算机设备 Download PDFInfo
- Publication number
- CN111626854A CN111626854A CN202010299301.4A CN202010299301A CN111626854A CN 111626854 A CN111626854 A CN 111626854A CN 202010299301 A CN202010299301 A CN 202010299301A CN 111626854 A CN111626854 A CN 111626854A
- Authority
- CN
- China
- Prior art keywords
- data
- screening
- suspicious
- entity
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012216 screening Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010276 construction Methods 0.000 claims abstract description 17
- 238000003860 storage Methods 0.000 claims abstract description 12
- 238000001914 filtration Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 27
- 238000004140 cleaning Methods 0.000 claims description 12
- 238000004900 laundering Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000005192 partition Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 230000009469 supplementation Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000011850 initial investigation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种可疑业务筛查图谱生成方法、装置、计算机设备和存储介质。所述方法包括:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。采用本方法用户可以通过图形化构建并展示的可疑业务筛查图谱进行可疑业务的快速筛查,提高了筛查工作的准确性和效率。
Description
技术领域
本申请涉及业务数据处理技术领域,特别是涉及一种可疑业务筛查图谱生成方法、装置、计算机设备和存储介质。
背景技术
随着我国经济的不断加快,金融等行业发展极为迅速,各机构之间交易、业务往来的数据大幅度增加,业务数据处理技术也在不断发展,尤其是对于洗钱等可疑交易和特殊业务的排查也越来越受到重视。对于很多机构而言,反洗钱是降低财务、监管和商誉风险的重要措施之一。
在传统技术中,进行可疑业务的排查时,一般是将各公司或机构的业务数据进行汇总后,利用模型等得到相对较为可疑的数据,然后依靠人工逐条进行甄别,由于基础业务数据量很庞大,利用模型等得到的可疑数据量不仅庞大而且可能存在偏差,在人为甄别和分析时,也没有很好的方法能够从这些数据中快速筛查、准确锁定可疑的业务数据,使得可疑业务筛查工作的准确度和效率无法保证。
发明内容
基于此,有必要针对上述技术问题,提供一种可疑业务筛查图谱生成方法、装置、计算机设备和存储介质,用户可以通过可疑业务筛查图谱进行可疑业务的准确、高效的筛查。
一种可疑业务筛查图谱生成的方法,上述方法包括:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,对业务数据进行筛选处理,包括:通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤。
在一个实施例中,对业务数据进行筛选处理,包括:通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
在一个实施例中,根据实体信息和实体关系信息生成知识图谱,包括:根据实体信息以及实体关系信息生成节点-关系-节点的固定格式的结构化数据;将结构化数据导入图数据库,利用图数据库生成知识图谱。
在一个实施例中,将结构化数据导入图数据库,包括:将结构化数据导出成字符分隔格式文件,然后将字符分隔格式文件通过离线方式导入图数据库。
在一个实施例中,将结构化数据导入图数据库,包括:将结构化数据实时插入至图数据库。
在一个实施例中,将知识图谱进行图形化构建,包括:将不同的实体或所属类型不同的实体,以不同的图形分别进行构建;将类型不同或程度不同的关系信息,以不同的连接方式分别进行构建;将实体与实体之间关系的流向进行指向性构建。
在一个实施例中,上述方法还包括:接收指定更新时间、关系层级、关系层数或节点主体的查询指令,根据所述查询指令查询并展示指定区间内的可疑业务筛查图谱。
在一个实施例中,上述方法还包括:接收指定可疑实体的查询指令,根据查询指令查询并展示与可疑实体相关联的可疑业务筛查图谱。
在一个实施例中,在对业务数据进行筛选处理之前,还包括:对业务数据进行初步清洗。
在一个实施例中,初步清洗包括:脏数据过滤、数据格式标准化和/或漏缺数据补充。
一种可疑业务筛查图谱生成装置,上述装置包括:数据处理模块,用于对业务数据进行筛选处理,获得待筛查业务数据;节点提取模块,用于提取待筛查业务数据中的实体信息和实体关系信息;图谱生成模块,用于根据实体信息和实体关系信息生成知识图谱;构建展示模块,用于将知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
上述可疑业务筛查图谱生成方法、装置、计算机设备和存储介质,利用筛选后的业务数据生成知识图谱,并基于知识图谱构建可疑业务筛查图谱,用户可以通过图形化构建并展示的可疑业务筛查图谱进行可疑业务的快速筛查,提高了筛查工作的准确性和效率。
附图说明
图1为一个实施例中可疑业务筛查图谱生成方法的流程示意图;
图2为一个实施例中可疑业务筛查图谱的显示界面的示意图;
图3为一个实施例中可疑业务筛查图谱生成装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种可疑业务筛查图谱生成方法,包括以下步骤:
步骤S10:对业务数据进行筛选处理,获得待筛查业务数据;
其中,业务数据为各个金融机构或公司等业务系统中存储的与交易、转账等相关的业务数据。
具体地,对获取的业务数据进行筛选处理,从业务数据中筛选出数量级相对较小的待筛查数据,作为后续生成可疑业务筛查图谱所依据的目标业务数据。数据的筛选处理可以是基于用户的意向,通过设置筛查范围和方向实现,也可以通过各种反洗钱模型进行初步甄别,筛选出有待进一步筛查的可疑数据。
在本步骤中,由于各金融机构或公司的业务量非常庞大,从其业务系统中获得的业务数据量也很庞大,所以在生成图谱前需要对业务数据进行筛选,从繁杂庞大的业务数据中筛选目标范围以内的数据,可以缩小数据处理范围,降低数据处理的数量级,提高后续图谱生成的效率和精确度,从而实现可疑业务的高效筛查。
步骤S20:提取待筛查业务数据中的实体信息和实体关系信息;
具体地,实体信息指的是参与业务往来的用户的相关信息,可以是用户户头号、设备编号、身份证号、密码、联系号码或转出账户等属性信息,实体关系指的是实体与实体之间的关系信息,包括:交易时间、转账时间、交易金额等与业务往来相关的属性信息。
步骤S30:根据实体信息和实体关系信息生成知识图谱;
具体地,根据业务数据中的实体与实体、实体与关系、关系与关系之间的关联,生成反映各个实体之间关系逻辑的知识图谱。
步骤S40:将知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示;
具体地,将生成的知识图谱进行图形化构建,可以利用不同的标识、图案、形状、线条或颜色等将知识图谱的各个部分进行区分,构建出有利于分析和筛查的可疑业务筛查图谱,并将构建好的图谱在显示界面进行展示。
上述可疑业务筛查图谱生成的方法,利用筛选后的业务数据生成知识图谱,并基于知识图谱构建可疑业务筛查图谱,用户可以通过图形化构建并展示的可疑业务筛查图谱进行可疑业务的快速筛查,提高了筛查工作的准确性和效率。
在一个实施例中,对业务数据进行筛选处理,包括:通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤。
在本实施例中,可以通过小额交易过滤、不记名账户过滤和/或特定人群过滤等方式对业务数据进行过滤。具体地,小额交易过滤,通过设定交易额的数值或数值范围,可以将交易额达不到设置数值或数值范围的数据过滤在目标数据以外;不记名账户过滤,可以将不记名的账户所产生的交易、转账等业务数据过滤在目标数据以外;特定人群过滤,通过设置特定人群,可以只保留特定人群的业务数据,也可以将特定人群的业务数据过滤在目标数据以外等。本实施例,用户可以根据意向,设置待筛查数据的范围,可以根据意向进行针对性排查,大大减小了排查工作量,保证了后续图谱的生成的效率。
在一个实施例中,对业务数据进行筛选处理,包括:通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
在本实施例中,可以利用离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型等模型,对业务数据进行可疑数据的初步排查。除上述模型外,其他任何可以利用在可疑交易甄别上的反洗钱模型均可以用来进行上述业务数据筛选的处理。本实施例,通过反洗钱模型,可以初步将异常、可疑的数据筛选出来,大大缩小了数据筛查范围,提高了图谱生成的可靠性和精准性。
在一个实施例中,根据实体信息和实体关系信息生成知识图谱,包括:根据实体信息以及实体关系信息生成节点-关系-节点的固定格式的结构化数据;将结构化数据导入图数据库,利用图数据库生成知识图谱。
在本实施例中,具体地,可以利用图数据库来生成知识图谱,可以是neo4j图数据库,也可以是其他图数据库;导入方法有很多种,可以采用传统的离线导入方法,也可以利用大数据技术在开放的生产环境下进行数据的实时插入,还可以将多种导入方式结合使用。在导入图数据库之前,首先将数据转化为可导入的结构化数据,例如在导入neo4j图数据库时,neo4j图数据库的入库格式为“节点-关系-节点”,其中,节点为相关实体信息,可以包括:用户户头号、设备编号、身份证号、联系号码、密码或转出账户等。利用图数据库可以快速方便地生成知识图谱。
在一个实施例中,将结构化数据导入图数据库,包括:将结构化数据导出成csv(Comma Separated Value,字符分隔)文件,然后将csv文件通过离线方式导入图数据库。这种导入方式简单实用,适合于离线导入的场景。
在一个实施例中,将结构化数据导入图数据库,包括:将结构化数据实时插入至图数据库。将结构化数据进行数据库导入的时候可以采用实时插入的方式,例如可以通过大数据的spark技术,将大数据生成的节点-关系-节点的固定格式的结构化数据,直接导入到neo4j图数据库中,此种方法可以避免开放生产环境的数据文件无法直接处理的问题,也可以做到实时数据实时插入,实现快速建立图谱,及时发现风险的目的。
在一个实施例中,将结构化数据导入图数据库,包括:将结构化数据根据所述查询指令查询并展示与指定可疑实体相关联的可疑业务筛查图谱。
在本实施例中,用户可以通过显示界面200的查询板块202中节点关键词一栏输入特定的可疑实体,根据锚定的可疑对象,可以快速查询到与其关联的其他交易实体,能够最大限度挖掘关联交易账户信息及交易路径。
在一个实施例中,对业务数据进行筛选处理之前,还包括:对所述业务数据进行初步清洗;初步清洗可以包括:脏数据过滤、数据格式标准化和/或漏缺数据补充等。通过初步清洗实现数据的查漏补缺及标准化,为后续的数据筛选处理做准备。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种可疑业务筛查图谱生成装置,包括:数据处理模块10、节点提取模块20、图谱生成模块30和构建展示模块40,其中:
数据处理模块10,用于对业务数据进行筛选处理,获得待筛查业务数据;
节点提取模块20,用于提取待筛查业务数据中的实体信息和实体关系信息;
图谱生成模块30,用于根据实体信息和实体关系信息生成知识图谱;
构建展示模块40,用于将知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,上述数据处理模块10,还用于通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤。
在一个实施例中,上述数据处理模块10,还用于通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
在一个实施例中,上述图谱生成模块30,还用于根据实体信息以及实体关系信息生成节点-关系-节点的固定格式的结构化数据;将结构化数据导入图数据库,利用图数据库生成知识图谱。
在一个实施例中,上述图谱生成模块30,还用于将结构化数据导出成字符分隔格式文件,然后将字符分隔格式文件通过离线方式导入图数据库。
在一个实施例中,上述图谱生成模块30,还用于将结构化数据实时插入至图数据库。
在一个实施例中,上述构建展示模块40,还用于将不同的实体或所属类型不同的实体,以不同的图形分别进行构建;将类型不同或程度不同的关系信息,以不同的连接方式分别进行构建;将实体与实体之间关系的流向进行指向性构建。
在一个实施例中,上述构建展示模块40,还用于接收指定更新时间、关系层级、关系层数或节点主体的查询指令,根据所述查询指令查询并展示指定区间内的可疑业务筛查图谱。
在一个实施例中,上述构建展示模块40,还用于接收指定可疑实体的查询指令,根据查询指令查询并展示与可疑实体相关联的可疑业务筛查图谱。
在一个实施例中,上述数据处理模块10,还用于在对业务数据进行筛选处理之前,对业务数据进行初步清洗。
在一个实施例中,上述数据处理模块10,还用于脏数据过滤、数据格式标准化和/或漏缺数据补充。
关于可疑业务筛查图谱生成装置的具体限定可以参见上文中对于可疑业务筛查图谱生成方法的限定,在此不再赘述。上述装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种可疑业务筛查图谱生成方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,处理器执行计算机程序实现上述对业务数据进行筛选处理的步骤时,具体实现以下步骤:通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤。
在一个实施例中,处理器执行计算机程序实现上述对业务数据进行筛选处理的步骤时,具体实现以下步骤:通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
在一个实施例中,处理器执行计算机程序实现上述根据实体信息和实体关系信息生成知识图谱的步骤时,具体实现以下步骤:根据实体信息以及实体关系信息生成节点-关系-节点的固定格式的结构化数据;将结构化数据导入图数据库,利用图数据库生成知识图谱。
在一个实施例中,处理器执行计算机程序实现上述将结构化数据导入图数据库的步骤时,具体实现以下步骤:将结构化数据导出成字符分隔格式文件,然后将字符分隔格式文件通过离线方式导入图数据库。
在一个实施例中,处理器执行计算机程序实现上述将结构化数据导入图数据库的步骤时,具体实现以下步骤:将结构化数据实时插入至图数据库。
在一个实施例中,处理器执行计算机程序实现上述将将知识图谱进行图形化构建的步骤时,具体实现以下步骤:将不同的实体或所属类型不同的实体,以不同的图形分别进行构建;将类型不同或程度不同的关系信息,以不同的连接方式分别进行构建;将实体与实体之间关系的流向进行指向性构建。
在一个实施例中,处理器执行计算机程序还实现以下步骤:接收指定更新时间、关系层级、关系层数或节点主体的查询指令,根据所述查询指令查询并展示指定区间内的可疑业务筛查图谱。
在一个实施例中,处理器执行计算机程序还实现以下步骤:接收指定可疑实体的查询指令,根据查询指令查询并展示与可疑实体相关联的可疑业务筛查图谱。
在一个实施例中,处理器执行计算机程序实现上述对业务数据进行筛选处理的步骤之前,还实现以下步骤:对业务数据进行初步清洗。
在一个实施例中,处理器执行计算机程序实现上述对业务数据进行初步清洗的步骤时,具体实现以下步骤:脏数据过滤、数据格式标准化和/或漏缺数据补充。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:对业务数据进行筛选处理,获得待筛查业务数据;提取所述待筛查业务数据中的实体信息和实体关系信息;根据所述实体信息和所述实体关系信息生成知识图谱;将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
在一个实施例中,计算机程序被处理器执行实现上述对业务数据进行筛选处理的步骤时,具体实现以下步骤:通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤。
在一个实施例中,计算机程序被处理器执行实现上述对业务数据进行筛选处理的步骤时,具体实现以下步骤:通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
在一个实施例中,计算机程序被处理器执行上述根据实体信息和实体关系信息生成知识图谱的步骤时,具体实现以下步骤:根据实体信息以及实体关系信息生成节点-关系-节点的固定格式的结构化数据;将结构化数据导入图数据库,利用图数据库生成知识图谱。
在一个实施例中,计算机程序被处理器执行实现上述将结构化数据导入图数据库的步骤时,具体实现以下步骤:将结构化数据导出成字符分隔格式文件,然后将字符分隔格式文件通过离线方式导入图数据库。
在一个实施例中,计算机程序被处理器执行实现上述将结构化数据导入图数据库的步骤时,具体实现以下步骤:将结构化数据实时插入至图数据库。
在一个实施例中,计算机程序被处理器执行实现上述将知识图谱进行图形化构建的步骤时,具体实现以下步骤:将不同的实体或所属类型不同的实体,以不同的图形分别进行构建;将类型不同或程度不同的关系信息,以不同的连接方式分别进行构建;将实体与实体之间关系的流向进行指向性构建。
在一个实施例中,计算机程序被处理器执行还实现以下步骤:接收指定更新时间、关系层级、关系层数或节点主体的查询指令,根据所述查询指令查询并展示指定区间内的可疑业务筛查图谱。
在一个实施例中,计算机程序被处理器执行还实现以下步骤:接收指定可疑实体的查询指令,根据查询指令查询并展示与可疑实体相关联的可疑业务筛查图谱。
在一个实施例中,计算机程序被处理器执行实现上述对业务数据进行筛选处理的步骤之前,还实现以下步骤:对业务数据进行初步清洗。
在一个实施例中,计算机程序被处理器执行实现上述对业务数据进行初步清洗的步骤时,具体实现以下步骤:脏数据过滤、数据格式标准化和/或漏缺数据补充。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种可疑业务筛查图谱生成方法,所述方法包括:
对业务数据进行筛选处理,获得待筛查业务数据;
提取所述待筛查业务数据中的实体信息和实体关系信息;
根据所述实体信息和所述实体关系信息生成知识图谱;
将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
2.根据权利要求1所述的方法,其特征在于,所述对业务数据进行筛选处理,包括:
通过小额交易过滤、不记名账户过滤和/或特定人群过滤的方式对业务数据进行过滤;
和/或,
通过离群特征分析模型、异常点检测模型和/或团伙发现关系网络模型对业务数据进行反洗钱过滤。
3.根据权利要求1所述的方法,其特征在于,所述根据所述实体信息和所述实体关系信息生成知识图谱,包括:
根据所述实体信息以及所述实体关系信息生成节点-关系-节点的固定格式的结构化数据;
将所述结构化数据导入图数据库,利用所述图数据库生成所述知识图谱。
4.根据权利要求3所述的方法,其特征在于,所述将所述结构化数据导入图数据库,包括:
将所述结构化数据导出成字符分隔格式文件,然后将字符分隔格式文件通过离线方式导入图数据库;
和/或,将所述结构化数据实时插入至图数据库。
5.根据权利要求1所述的方法,其特征在于,所述将所述知识图谱进行图形化构建,包括:
将不同的实体或所属类型不同的实体,以不同的图形分别进行构建;
将类型不同或程度不同的关系信息,以不同的连接方式分别进行构建;
将实体与实体之间关系的流向进行指向性构建。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收指定更新时间、关系层级、关系层数或节点类型的查询指令,根据所述查询指令查询并展示指定区间内的可疑业务筛查图谱;
和/或,
接收指定可疑实体的查询指令,根据所述查询指令查询并展示与所述可疑实体相关联的可疑业务筛查图谱。
7.根据权利要求1至6任一项所述的方法,其特征在于,在所述对业务数据进行筛选处理之前,还包括:
对所述业务数据进行初步清洗;
优选的,所述初步清洗包括:脏数据过滤、数据格式标准化和/或漏缺数据补充。
8.一种可疑业务筛查图谱生成装置,其特征在于,所述装置包括:
数据处理模块,用于对业务数据进行筛选处理,获得待筛查业务数据;
节点提取模块,用于提取所述待筛查业务数据中的实体信息和实体关系信息;
图谱生成模块,用于根据所述实体信息和所述实体关系信息生成知识图谱;
构建展示模块,用于将所述知识图谱进行图形化构建,生成可疑业务筛查图谱,并将所述可疑业务筛查图谱在显示界面进行展示。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299301.4A CN111626854A (zh) | 2020-04-16 | 2020-04-16 | 可疑业务筛查图谱生成方法、装置、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299301.4A CN111626854A (zh) | 2020-04-16 | 2020-04-16 | 可疑业务筛查图谱生成方法、装置、计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111626854A true CN111626854A (zh) | 2020-09-04 |
Family
ID=72258870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010299301.4A Pending CN111626854A (zh) | 2020-04-16 | 2020-04-16 | 可疑业务筛查图谱生成方法、装置、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626854A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215616A (zh) * | 2020-11-30 | 2021-01-12 | 四川新网银行股份有限公司 | 一种基于网络的自动识别资金异常交易的方法和系统 |
CN113157941A (zh) * | 2021-04-08 | 2021-07-23 | 支付宝(杭州)信息技术有限公司 | 业务特征数据处理、文本生成方法、装置及电子设备 |
CN114676266A (zh) * | 2022-03-29 | 2022-06-28 | 建信金融科技有限责任公司 | 基于多层关系图谱的冲突识别方法、装置、设备及介质 |
CN115545935A (zh) * | 2022-11-18 | 2022-12-30 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657066A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 基于多视角的知识图谱构建方法、装置和计算机设备 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
CN110543571A (zh) * | 2019-08-07 | 2019-12-06 | 北京市天元网络技术股份有限公司 | 用于水利信息化的知识图谱构建方法以及装置 |
-
2020
- 2020-04-16 CN CN202010299301.4A patent/CN111626854A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657066A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 基于多视角的知识图谱构建方法、装置和计算机设备 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
CN110543571A (zh) * | 2019-08-07 | 2019-12-06 | 北京市天元网络技术股份有限公司 | 用于水利信息化的知识图谱构建方法以及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215616A (zh) * | 2020-11-30 | 2021-01-12 | 四川新网银行股份有限公司 | 一种基于网络的自动识别资金异常交易的方法和系统 |
CN112215616B (zh) * | 2020-11-30 | 2021-04-30 | 四川新网银行股份有限公司 | 一种基于网络的自动识别资金异常交易的方法和系统 |
CN113157941A (zh) * | 2021-04-08 | 2021-07-23 | 支付宝(杭州)信息技术有限公司 | 业务特征数据处理、文本生成方法、装置及电子设备 |
CN114676266A (zh) * | 2022-03-29 | 2022-06-28 | 建信金融科技有限责任公司 | 基于多层关系图谱的冲突识别方法、装置、设备及介质 |
CN114676266B (zh) * | 2022-03-29 | 2024-02-27 | 建信金融科技有限责任公司 | 基于多层关系图谱的冲突识别方法、装置、设备及介质 |
CN115545935A (zh) * | 2022-11-18 | 2022-12-30 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
CN115545935B (zh) * | 2022-11-18 | 2023-02-28 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111626854A (zh) | 可疑业务筛查图谱生成方法、装置、计算机设备 | |
CN108804548B (zh) | 测试数据查询方法、装置、计算机设备和存储介质 | |
CN110751550B (zh) | 对账方法、装置、计算机设备和存储介质 | |
CN112232818A (zh) | 数据对账方法、装置、计算机设备和存储介质 | |
CN110347545A (zh) | 一种业务平台缓存策略的测试方法及装置 | |
CN109299334A (zh) | 一种知识图谱的数据处理方法及装置 | |
CN112612813A (zh) | 一种测试数据的生成方法和装置 | |
CN111666346A (zh) | 信息归并方法、交易查询方法、装置、计算机及存储介质 | |
WO2019033741A1 (zh) | 投资产品的资源处理方法、装置、存储介质和计算机设备 | |
CN110147495A (zh) | 基于在线配置的页面响应方法、装置、设备及介质 | |
CN201435074Y (zh) | 一种基于构件生成测试案例的装置 | |
CN107944866B (zh) | 交易记录排重方法及计算机可读存储介质 | |
CN110275703A (zh) | 键值对数据的赋值方法、装置、计算机设备和存储介质 | |
CN112433753A (zh) | 基于参数信息的接口文档生成方法、装置、设备和介质 | |
CN112967138A (zh) | 基于区块链和云计算的信息推送方法及信息推送系统 | |
CN114547157A (zh) | 一种知识图谱分析系统及方法 | |
CN112559644B (zh) | 一种产品部件动态组装方法、装置、设备及存储介质 | |
CN114462859A (zh) | 工作流处理方法、装置、计算机设备和存储介质 | |
CN111984798A (zh) | 图谱数据预处理方法及装置 | |
CN112231377A (zh) | 数据映射方法、系统、装置、服务器和存储介质 | |
CN111340622A (zh) | 一种异常交易集群的检测方法及装置 | |
CN110222290B (zh) | 页面生成方法、装置、计算机设备和存储介质 | |
Choucri | Applications of econometric analysis to forecasting in international relations | |
CN110597871B (zh) | 数据处理方法、装置、计算机设备和计算机可读存储介质 | |
CN117216164A (zh) | 金融数据同步处理方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200904 |