CN116757709A - 一种基于知识图谱的铜精矿进口风险分析方法及系统 - Google Patents
一种基于知识图谱的铜精矿进口风险分析方法及系统 Download PDFInfo
- Publication number
- CN116757709A CN116757709A CN202311058850.2A CN202311058850A CN116757709A CN 116757709 A CN116757709 A CN 116757709A CN 202311058850 A CN202311058850 A CN 202311058850A CN 116757709 A CN116757709 A CN 116757709A
- Authority
- CN
- China
- Prior art keywords
- entity
- information
- copper concentrate
- risk
- import
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 title claims abstract description 147
- 229910052802 copper Inorganic materials 0.000 title claims abstract description 147
- 239000010949 copper Substances 0.000 title claims abstract description 147
- 239000012141 concentrate Substances 0.000 title claims abstract description 115
- 230000008676 import Effects 0.000 title claims abstract description 93
- 238000012502 risk assessment Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000010276 construction Methods 0.000 claims abstract description 10
- 238000001514 detection method Methods 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 15
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 claims description 8
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 8
- 229910052737 gold Inorganic materials 0.000 claims description 8
- 239000010931 gold Substances 0.000 claims description 8
- 229910052709 silver Inorganic materials 0.000 claims description 8
- 239000004332 silver Substances 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000003723 Smelting Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000013590 bulk material Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识图谱的铜精矿进口风险分析方法及系统,涉及风险评估技术领域。所述方法包括数据采集、确定关键词、确定实体信息、确定实体关系、构建铜精矿进口知识图谱、待测实体信息获取、风险分析,通过对大数据进行分析,合理选择关键词,根据关键词确定实体关系,提高了实体关系确定的精度和速度,同时,用简单的框架展示各个环节及历史报关信息的关联,以进口铜精矿历史报关信息及其关联的检验结果为基础数据,扩展、收集、完善进口铜精矿进口各个环节的中信息,及时给出准确的风险分析结果。
Description
技术领域
本发明涉及风险评估技术领域,尤其涉及一种基于知识图谱的铜精矿进口风险分析方法及系统。
背景技术
近几年,随着我国经济的快速发展,铜需求与消费持续高涨,而铜精矿作为铜冶炼的主要原料,每年需要大量进口才能满足消费需求。
进口铜精矿的贸易风险隐藏在生产、存储、运输、交易各个环节中,这些贸易风险体现在进口的铜精矿是否合规、是否符合环保政策以及数量/重量及价格是否存在欺诈、产品品质是否达到合同要求、是否是多矿混合等,如何精准的识别这些风险,是风险预警的难点。目前,海关对于进口铜精矿的风险布控是基于合规强制性要求、历史风险信息等制定的一种分类布控,如何精准反馈铜精矿历史风险信息以及铜精矿关键风险参数信息是识别铜精矿潜在风险的关键。
现有技术中,通过人工对每一批次进口的铜精矿的材料进行审查,包括合同、提单、发票、质检单据等铜精矿进口涉及的所有单据,整个审查过程工作量具大、效率低、且人工分析、审查也常常会出现结果不准确、数据出现纰漏等问题,并不能很好的规避上述风险。
知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单元是“实体—关系—实体”的三元组,其中实体、关系中可包含若干个相关的属性键值对,实体间通过关系相互联结,构成网状的知识结构。知识图谱可以自动构建行业图谱,摆脱原始的人工输入,可以应用于智能搜索、文本分析、机器阅读理解、异常监控、风险控制等场景,达到真正的智能和自动。现有技术中,并未发现针对铜精矿进口风险分析过程中采用知识图谱的技术方案,并且,在铜精矿进口风险分析领域,如何使用各种各样的数据,这也是铜精矿风险分析的一大难点;同时,在针对铜精矿进口风险分析领域,如何高效利用各种复杂繁琐的数据,从而尽可能快的得到风险分析结果也是目前面临解决的一大技术难题。
基于此,将知识图谱与铜精矿进口风险分析相结合,通过多种类型数据实现自动快速的对各种数据进行审查、分类、汇总、提取关键信息,自动进行风险分析的研究十分必要。
发明内容
针对现有技术存在的缺陷,本发明提出一种基于知识图谱的铜精矿进口风险分析方法,具体包括如下步骤:
步骤S1,数据采集:从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
步骤S2,确定关键词:根据所述历史风险记录,确定与所述进口风险相关的关键词;
步骤S3,确定实体信息:按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
步骤S4,确定实体关系:所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
步骤S5,构建铜精矿进口知识图谱:根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
步骤S6,待测实体信息获取:对待测进口铜精矿的报关资料进行处理,获取待测实体信息;
步骤S7:风险分析:将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
进一步的,步骤S2中,所述关键词包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、收货企业名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
进一步的,步骤S3中,按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息具体包括:
按照信息完整度由高到低对所述历史报关资料中的各个文件进行排序;
根据得到的顺序依次对各个文件进行关键词识别,判断在后文件中识别到的关键词是否出现在在先文件中;
若在后文件中识别到的关键词已出现在在先文件中,且已获取到所述关键词对应的实体信息,则不再进行在后文件中该关键词对应实体信息的获取;
若在后文件中识别到的关键词已出现在在先文件中,但未获取到所述关键词对应的实体信息,则获取在后文件中该关键词对应实体信息;
若在后文件中识别到的关键词未出现在在先文件中,则获取在后文件中该关键词对应的实体信息。
进一步的,所述信息完整度为所述历史报关资料中不同文件包含的关键词的数量,所述文件中包含关键词的数量越多,所述信息完整度越高;所述文件中包含关键词的数量越少,所述信息完整度越低。
进一步的,步骤S5,根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱,具体包括:
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的实体信息;
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的历史风险记录;
通过所述商品质量实体关系、经营状况实体关系、信用状况实体关系构建铜精矿进口知识图谱。
进一步的,与所述商品质量实体关系相关的实体信息包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
进一步的,与所述经营状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、收货人名称、装运船舶名称、税则子目、税率、计价信息、检测报告中的不合格信息。
进一步的,与所述信用状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、检测报告中的不合格信息。
一种基于知识图谱的铜精矿进口风险分析系统,使用如上任一项所述的基于知识图谱的铜精矿进口风险分析方法,包括如下模块:
数据采集模块:用于从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
关键词确定模块:与所述数据采集模块连接,用于根据所述历史风险记录,确定与所述进口风险相关的关键词;
实体信息确定模块:与所述关键词确定模块连接,用于按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
实体关系确定模块:与所述实体信息确定模块连接,所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
铜精矿进口知识图谱构建模块:与所述实体关系确定模块连接,用于根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
风险分析模块:与所述铜精矿进口知识图谱构建模块连接,用于将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
与现有技术相比较,本发明的有益效果在于:
其一,本发明采用知识图谱对铜精矿进口贸易进行风险分析,用简单的框架展示各个环节及历史报关信息的关联,以进口铜精矿历史报关信息及其关联的检验结果为基础数据,扩展、收集、完善进口铜精矿贸易各个环节的中信息,及时给出准确的风险分析结果;
其二,本发明通过对大数据进行分析,合理选择关键词,根据关键词确定实体信息,建立实体关系,可使风险预测结果更加客观准确;
其三,本发明通过不断对报关资料进行分析选择,最终确定出用于筛选实体的关键词,并根据关键词提取相应实体信息;通过实体信息去确定构建实体关系,确定了用于铜精矿进口风险分析的实体关系:商品质量实体关系、经营状况实体关系、信用状况实体关系,进而提高风险评估的速度和准确率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于知识图谱的铜精矿进口风险分析方法流程图;
图2为报关单节点及关系图谱;
图3为风险预警示例图;
图4为基于知识图谱的铜精矿进口风险分析系统结构图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
下面结合附图(表)对本发明的具体实施方式做出说明。
针对现有技术中,通过人工对每一批次进口的铜精矿的材料进行审查,包括合同、提单、发票、质检单据等铜精矿进口涉及的所有单据,整个审查过程工作量大、效率低、且人工分析、审查也常常会出现结果不准确、数据出现纰漏等问题,本发明提出了一种基于知识图谱的铜精矿进口风险分析方法及系统。
实施例1
一种基于知识图谱的铜精矿进口风险分析方法,如图1所示,包括如下步骤:
步骤S1,数据采集:从报关系统中获取进口铜精矿的历史报关资料。
历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录。
报关单中的信息包括:发货人、收货人、生产企业、合同号、装运船名、成交方式、成交金额、毛重、税则子目等;
合同中的信息包括:买卖双方、税率、计价信息、收货地址等;
发票中的信息包括:计价信息、重量、税率等;
提单中的信息包括:生产企业、收货企业、产出矿山信息、运输船舶信息等;
原产地证中的信息包括:生产企业、产出矿山信息等;
检测报告中的信息包括:品质指标信息(如装港铜含量、装港金含量、装港银含量)、不合格信息等。
历史风险信息包含了在铜精矿进口过程中曾经发生过的风险事件、发生事件的主体等,用于为待测进口铜精矿进口风险分析提供评估依据。
步骤S2,确定关键词:根据所述历史风险记录,确定与所述进口风险相关的关键词。
报关单、合同、发票、提单、原产地证、检测报告、历史风险记录等,多以纸质文件存在,需要先将这些资料转化为编码形式,以便于计算机直接进行识别和处理。现有技术中,编码转换已经是非常成熟的技术,可直接应用于本发明中。
在现有技术中,通过知识图谱在对铜精矿进口风险分析时,很少有考虑到如何快速准确的获取到实体关系进而形成知识图谱,而且,由于铜精矿进口过程中涉及很多环节,很多信息,如何在这么多的信息中快速提炼对铜精矿进口风险分析有用的信息是面临的一个难点问题,本发明提出了通过关键词去获取实体关系的技术方案,从而大大提高了实体关系的建立精度。
在确定关键词时,通过对大量的过往铜精矿进口的风险记录进行调研,分析,并对过往铜精矿进口案例进行验证,确定出了针对于报关单、合同、发票、原产地证、检测报告中的识别精度较高的关键词,进而提高了实体关系的建立精度。
具体地,所述关键词包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、收货企业名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
步骤S3,确定实体信息:按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息。
按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息具体包括:
按照信息完整度由高到低对所述历史报关资料中的各个文件进行排序;
根据得到的顺序依次对各个文件进行关键词识别,判断在后文件中识别到的关键词是否出现在在先文件中;
若在后文件中识别到的关键词已出现在在先文件中,且已获取到所述关键词对应的实体信息,则不再进行在后文件中该关键词对应实体信息的获取;
若在后文件中识别到的关键词已出现在在先文件中,但未获取到所述关键词对应的实体信息,则获取在后文件中该关键词对应实体信息;
若在后文件中识别到的关键词未出现在在先文件中,则获取在后文件中该关键词对应的实体信息。
所述信息完整度为所述历史报关资料中不同文件包含的关键词的数量,所述文件中包含关键词的数量越多,所述信息完整度越高;所述文件中包含关键词的数量越少,所述信息完整度越低。
之所以通过上述确定方法,是出于以下考虑:
1、从信息完整度高的文件开始提取信息,保证一次性提取出尽量多的信息,为在后的文件识别节省时间,提高信息识别的效率;
2、保证了每个关键词都可以提取出相应的有效信息。报关资料中包含多个文件,不同文件中的信息经常会存在重复的实体对象,如果反复的识别,也会出现很多重复的信息,需要进一步的去重,必然会导致风险评估的效率低下;
3、会为信息识别提供保障,在前次信息提取失败的情况下,自动对后面的文件进行识别,保证了数据提取的完整性。
步骤S4,确定实体关系:所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系。
通过上述分析,在充分考虑了历史报关资料中的信息,通过不断对报关资料进行分析选择,最终确定出用于筛选实体的关键词,提高了报关单数据集的建立精度;通过关键词去确定构建实体关系所需要的信息,从而形成报关单数据集,进而提高实体关系建立的速度。
经过上述步骤,并根据不断的对铜精矿进口风险的分析,最终确定了最能够体现铜精矿进口风险的实体关系:所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系,并根据选出的实体关系,得到了清晰的实体类型和关系类型,如表1、表2所示。
表1 铜精矿知识图谱实体类型示例
实体类型 | 属性项目 |
报关单 | 报关单编号、货物名称、重量等 |
合同 | 支付率、粗炼及精炼扣减单价、计价周期等 |
贸易企业(包括收货人、发货人、生产企业、消费使用企业) | 中英文名称、编号、地址等 |
装运船舶 | 中英文名称、船舶类型、IMO编号等 |
国家地区 | 中英文名称、国际代码等 |
港口 | 中英文名称、国际代码等 |
铜矿山 | 中英文名称、储量、产量等 |
不合格信息 | 不合格类别、不合格描述等 |
经营问题 | 问题描述、发生日期等 |
归类风险 | 描述、发生日期等 |
欺诈风险 | 描述、发生日期等 |
税则子目 | 货品名称、标识号、税率等 |
税则品目 | 名称、标识号 |
税则章目 | 名称、标识号 |
表2 铜精矿知识图谱关系示例
实体类型 | 关系类型{关系属性项目} | 实体类型 |
报关单 | 收货人or发货人or生产企业or消费使用企业 | 贸易企业 |
报关单 | 运输工具 | 装运船舶 |
报关单 | 货物原产国 | 国家地区 |
报关单 | 来源 | 铜矿山 |
报关单 | 检出 | 不合格信息 |
报关单 | 执行 | 合同 |
报关单 | 商品归类 | 税则子目 |
贸易企业 | 位于 | 国家地区 |
贸易企业 | 运营 | 铜矿山 |
贸易企业 | 商品质量风险 | 不合格信息 |
贸易企业 | 经营风险 | 经营问题 |
铜矿山 | 位于 | 国家地区 |
铜矿山 | 商品质量风险 | 不合格信息 |
铜矿山 | 经营风险 | 经营问题 |
装运船舶 | 重量欺诈 | 欺诈风险 |
税则子目 | 协定税率{协定名称、税率} | 国家地区 |
税则子目 | 特惠税率{协定名称、税率} | 国家地区 |
步骤S5,构建铜精矿进口知识图谱:根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱。
根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱,具体包括:
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的实体信息;
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的历史风险记录;
通过所述商品质量实体关系、经营状况实体关系、信用状况实体关系构建铜精矿进口知识图谱。
与所述商品质量实体关系相关的实体信息包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
与所述经营状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、收货人名称、装运船舶名称、税则子目、税率、计价信息、检测报告中的不合格信息。
与所述信用状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、检测报告中的不合格信息。
将上述实体信息、实体关系、历史风险记录输入知识图谱,获得每一批进口铜精矿的报关单节点及关系图谱。
在一个实施例中,根据表3中的报关单信息,可得到报关单节点及关系图谱,如图2所示。
表3 报关单信息表
报关单号 | ****20220101000001 |
货物名称 | 铜精矿 |
税则子目 | 26030000 |
报关日期 | 20220101 |
境内收货人 | 公司1 |
消费使用单位 | 公司1 |
境外发货人 | 公司2 |
来源矿山 | 矿山1 |
包装形式 | 散装 |
成交方式 | CIF |
成交金额 | 28395788.19美元 |
公式定价备案号 | ***20190101* |
提单湿重 | 10100000kg |
装港水分 | 10.749% |
装港铜含量 | 24% |
装港金含量 | 15.49g/DMT |
装港银含量 | 52.5g/DMT |
步骤S6,待测实体信息获取:对待测进口铜精矿的报关资料进行处理,获取待测实体信息。
获取待检测的进口铜精矿的报关单据,包括报关单、合同、发票、提单、原产地证、检测报告,并对这些数据进行处理。
步骤S61,从报关系统中获取待检测进口铜精矿的报关资料;
步骤S62,按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息。
步骤S7,风险分析:将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
风险信息包括:商品质量风险、经营风险、欺诈风险。
与商品质量风险相关的数据包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、检测报告中的不合格信息;
与经营风险相关的数据包括:铜矿山名称、装运船舶名称、生产企业名称、发货人名称、收货人名称;
与欺诈风险相关的数据包括:铜矿山名称、发货人名称、生产企业名称、装运船舶名称、检测报告中的不合格信息、税则子目、税率、计价信息、重量。
风险预警功能是一项综合应用,是对新增的“报关单”节点进行综合检索,并列明与之关联的风险信息,是一种复杂的查询,具体步骤如下:
(1)若Neo4j中还未创建新批次进口铜精矿“报关单”节点,则先在Neo4j数据库中创建节点,并建立“报关单”节点与“贸易企业”、“铜矿山”等目标节点的关系;
(2)根据风险预警目标需求为导向,设计查询步骤,转化为系统代码语言,如检索是否存在与新“报关单”节点有间接关联的“不合格信息”或“经营问题”目标节点;
(3)根据信息展示需求,获取目标节点属性信息,并通过自定义页面综合呈现。
由新“报关单”节点出发,经2个路径关系可检索到关联在来源矿山的多条“不合格信息”目标节点和关联在装运船舶的多条“欺诈风险”目标节点,获取目标节点属性信息,从而实现辅助风险预警,帮助现场查验人员和实验室检测人员进行风险识别、评价及决策。
如图3 所示,将表3中的报关单信息输入铜精矿进口知识图谱,得到风险分析结果:
该批货物来源矿山1存在3条商品质量风险信息,请取样送检排查风险;
装运船舶1存在3条重量欺诈信息,建议使用衡器计重。
知识图谱本身就是一种数据库,数据统计分析也是一项基本功能。在知识图谱中,数据信息都以属性键值对的形式保存在节点上,对于同一类型的节点应该制定统一属性结构、属性值单位及表示方式,确保数据规范,降低数据统计分析难度。
当历年的铜精矿报关单信息全部导入Neo4j中,可以通过“报关单”节点属性中的“报关日期”,逐年检索出当年的所有“报关单”节点,再遍历这些节点,从每一个节点中获取货物重量和货值的属性值,求和得到当年进口重量和货值,存入数据列表中,再利用适当的可视化技术(ECharts),在系统页面中展示出来。
使用历史数据,通过时间、出口国家、出口企业等参数,筛选出某时间段内企业或国家出口铜精矿品质信息,利用可视化技术呈现铜精矿品质指标分布情况、变化趋势等,并可借此判别新进口铜精矿品质水平。
实施例2
一种基于知识图谱的铜精矿进口风险分析系统,使用如实施例1中任一项所述的基于知识图谱的铜精矿进口风险分析方法,如图4所示,包括如下模块:
数据采集模块:用于从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
关键词确定模块:与所述数据采集模块连接,用于根据所述历史风险记录,确定与所述进口风险相关的关键词;
实体信息确定模块:与所述关键词确定模块连接,用于按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
实体关系确定模块:与所述实体信息确定模块连接,所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
铜精矿进口知识图谱构建模块:与所述实体关系确定模块连接,用于根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
风险分析模块:与所述铜精矿进口知识图谱构建模块连接,用于将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
本发明探索了铜精矿知识图谱的创建,利用Neo4j技术创建了试验性知识图谱,通过紧密的关系网络精准识别潜在风险,实现了辅助风险预警功能,为进口商品风险预警提供新思路。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,包括如下步骤:
步骤S1,数据采集:从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
步骤S2,确定关键词:根据所述历史风险记录,确定与所述进口风险相关的关键词;
步骤S3,确定实体信息:按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
步骤S4,确定实体关系:所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
步骤S5,构建铜精矿进口知识图谱:根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
步骤S6,待测实体信息获取:对待测进口铜精矿的报关资料进行处理,获取待测实体信息;
步骤S7:风险分析:将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
2.根据权利要求1所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,步骤S2中,所述关键词包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、收货企业名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
3.根据权利要求1所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,步骤S3中,按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息具体包括:
按照信息完整度由高到低对所述历史报关资料中的各个文件进行排序;
根据得到的顺序依次对各个文件进行关键词识别,判断在后文件中识别到的关键词是否出现在在先文件中;
若在后文件中识别到的关键词已出现在在先文件中,且已获取到所述关键词对应的实体信息,则不再进行在后文件中该关键词对应实体信息的获取;
若在后文件中识别到的关键词已出现在在先文件中,但未获取到所述关键词对应的实体信息,则获取在后文件中该关键词对应实体信息;
若在后文件中识别到的关键词未出现在在先文件中,则获取在后文件中该关键词对应的实体信息。
4.根据权利要求3所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,所述信息完整度为所述历史报关资料中不同文件包含的关键词的数量,所述文件中包含关键词的数量越多,所述信息完整度越高;所述文件中包含关键词的数量越少,所述信息完整度越低。
5.根据权利要求1所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,步骤S5,根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱,具体包括:
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的实体信息;
分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的历史风险记录;
通过所述商品质量实体关系、经营状况实体关系、信用状况实体关系构建铜精矿进口知识图谱。
6.根据权利要求5所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,与所述商品质量实体关系相关的实体信息包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
7.根据权利要求5所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,与所述经营状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、收货人名称、装运船舶名称、税则子目、税率、计价信息、检测报告中的不合格信息。
8.根据权利要求5所述的一种基于知识图谱的铜精矿进口风险分析方法,其特征在于,与所述信用状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、检测报告中的不合格信息。
9.一种基于知识图谱的铜精矿进口风险分析系统,使用如权利要求1-8任一项所述的基于知识图谱的铜精矿进口风险分析方法,其特征在于,包括如下模块:
数据采集模块:用于从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
关键词确定模块:与所述数据采集模块连接,用于根据所述历史风险记录,确定与所述进口风险相关的关键词;
实体信息确定模块:与所述关键词确定模块连接,用于按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
实体关系确定模块:与所述实体信息确定模块连接,所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
铜精矿进口知识图谱构建模块:与所述实体关系确定模块连接,用于根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
风险分析模块:与所述铜精矿进口知识图谱构建模块连接,用于将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311058850.2A CN116757709B (zh) | 2023-08-22 | 2023-08-22 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311058850.2A CN116757709B (zh) | 2023-08-22 | 2023-08-22 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116757709A true CN116757709A (zh) | 2023-09-15 |
CN116757709B CN116757709B (zh) | 2023-11-14 |
Family
ID=87953802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311058850.2A Active CN116757709B (zh) | 2023-08-22 | 2023-08-22 | 一种基于知识图谱的铜精矿进口风险分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757709B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124497A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | System for automated capture and analysis of business information for reliable business venture outcome prediction |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN113537796A (zh) * | 2021-07-22 | 2021-10-22 | 大路网络科技有限公司 | 一种企业风险评估方法、装置及设备 |
WO2022218186A1 (zh) * | 2021-04-15 | 2022-10-20 | 京东科技控股股份有限公司 | 个性化知识图谱的生成方法、装置及计算机设备 |
CN115456438A (zh) * | 2022-09-22 | 2022-12-09 | 城云科技(中国)有限公司 | 企业经营行为异常预警方法及其应用 |
CN116307671A (zh) * | 2022-09-07 | 2023-06-23 | 中国建设银行股份有限公司 | 风险预警方法、装置、计算机设备、存储介质 |
-
2023
- 2023-08-22 CN CN202311058850.2A patent/CN116757709B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124497A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | System for automated capture and analysis of business information for reliable business venture outcome prediction |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
WO2022218186A1 (zh) * | 2021-04-15 | 2022-10-20 | 京东科技控股股份有限公司 | 个性化知识图谱的生成方法、装置及计算机设备 |
CN113537796A (zh) * | 2021-07-22 | 2021-10-22 | 大路网络科技有限公司 | 一种企业风险评估方法、装置及设备 |
CN116307671A (zh) * | 2022-09-07 | 2023-06-23 | 中国建设银行股份有限公司 | 风险预警方法、装置、计算机设备、存储介质 |
CN115456438A (zh) * | 2022-09-22 | 2022-12-09 | 城云科技(中国)有限公司 | 企业经营行为异常预警方法及其应用 |
Non-Patent Citations (2)
Title |
---|
孙晨;付英男;程文亮;钱卫宁;: "面向企业知识图谱构建的中文实体关系抽取", 华东师范大学学报(自然科学版), no. 03, pages 55 - 66 * |
林煜超 等: "构建海关特殊监管区域风险防控知识图谱刍议", 《 西部学刊》, pages 167 - 172 * |
Also Published As
Publication number | Publication date |
---|---|
CN116757709B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401777B (zh) | 企业风险的评估方法、装置、终端设备及存储介质 | |
Fatimah et al. | Cyber-physical system enabled in sustainable waste management 4.0: a smart waste collection system for Indonesian semi-urban cities | |
CN107292744A (zh) | 基于机器学习的投资趋势分析方法及其系统 | |
CN111798297A (zh) | 一种财务风险预警分析的方法与装置 | |
CN109815480B (zh) | 一种数据处理方法和装置、及存储介质 | |
CN111612627A (zh) | 一种评估债券风险影响指标的方法 | |
CN115757660A (zh) | 一种自动生成数据库表间关联关系的方法、系统、电子设备及程序产品 | |
CN110019798B (zh) | 一种用于对进销项商品种类差异进行度量的方法及系统 | |
CN112508671A (zh) | 一种企业财务数据处理方法、系统、装置及介质 | |
CN113450009A (zh) | 一种企业成长性评价的方法及系统 | |
CN115204995A (zh) | 一种税务数据采集分析方法、系统及计算机存储介质 | |
CN114118793A (zh) | 一种地方交易所风险预警方法、装置及设备 | |
CN117764724A (zh) | 一种智能化的信用评级报告构建方法及系统 | |
CN116757709B (zh) | 一种基于知识图谱的铜精矿进口风险分析方法及系统 | |
CN117114812A (zh) | 一种针对企业的金融产品推荐方法及装置 | |
CN111428725A (zh) | 数据结构化处理方法、装置和电子设备 | |
CN110543910A (zh) | 信用状态监测系统和监测方法 | |
CN114282951B (zh) | 一种网络零售预测方法、设备及介质 | |
CN109522309A (zh) | 一种基于审计系统采购信息记录异常值处理方法 | |
CN115563176A (zh) | 一种电子商务数据处理系统及方法 | |
CN115170032A (zh) | 一种医药行业的储运管理系统 | |
AlAmoudi et al. | Extracting attractive app aspects from app reviews using clustering techniques based on kano model | |
CN113298291A (zh) | 快递件量预测方法、装置、设备及存储介质 | |
CN115187387B (zh) | 一种风险商家的识别方法及设备 | |
CN113240353B (zh) | 一种面向跨境电商的出口工厂分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |