CN109408694A - 一种海关过关舱单分析方法、系统及装置 - Google Patents

一种海关过关舱单分析方法、系统及装置 Download PDF

Info

Publication number
CN109408694A
CN109408694A CN201811115550.2A CN201811115550A CN109408694A CN 109408694 A CN109408694 A CN 109408694A CN 201811115550 A CN201811115550 A CN 201811115550A CN 109408694 A CN109408694 A CN 109408694A
Authority
CN
China
Prior art keywords
shipping bill
matching
risk
data
customs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811115550.2A
Other languages
English (en)
Inventor
黄晓晖
陈乐华
涂继来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Idatatech Co Ltd
Original Assignee
Guangdong Idatatech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Idatatech Co Ltd filed Critical Guangdong Idatatech Co Ltd
Priority to CN201811115550.2A priority Critical patent/CN109408694A/zh
Publication of CN109408694A publication Critical patent/CN109408694A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种海关过关舱单分析方法、系统及装置,方法包括:通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;对标准化数据进行识别分类;对识别分类结果进行风险品名匹配,得到第一匹配结果;对识别分类结果进行舱单分析匹配,得到第二匹配结果;对第一匹配结果和第二匹配结果进行训练学习;根据训练学习的结果,对待分析舱单进行风险评估。系统包括获取单元、分类单元、第一匹配单元、第二匹配单元、训练单元和风险评估单元。装置包括存储器和处理器。本发明提高了海关查获率,加强商品与风险的关联关系,大大提升了海关事前风险鉴别的能力,安全性高,可广泛应用于风险管理技术领域。

Description

一种海关过关舱单分析方法、系统及装置
技术领域
本发明涉及风险管理技术领域,尤其是一种海关过关舱单分析方法、系统及装置。
背景技术
目前海关对商品信息的分析处理大都集中在报关单阶段,现有技术已经建立了大量模型来对报关单中的商品信息进行风险管理。但随着新舱单改革,在新舱单模式下,进口货物的相关舱单数据需在货物抵达码头前24小时向海关发送。在对外贸易中,舱单是向海关报关时必须交验的单据之一,是一份商家自填的、逐票列明全船实际载运货物的明细表。
由于舱单内填写的内容-属于非结构化数据,现有技术无法从这些不具备规范性的数据中提取标准化信息,更不能将不规范的商品名称描述转换为海关税则的标准名称,因此无法提前对入关商品进行风险管理,风险鉴别能力弱且安全性不高。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种风险鉴别能力强且安全性高的海关过关舱单分析方法、系统及装置。
本发明所采取的技术方案的一方面为:
一种海关过关舱单分析方法,包括以下步骤:
通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
对标准化数据进行识别分类;
对识别分类结果进行风险品名匹配,得到第一匹配结果;
对识别分类结果进行舱单分析匹配,得到第二匹配结果;
对第一匹配结果和第二匹配结果进行训练学习;
根据训练学习的结果,对待分析舱单进行风险评估。
进一步,所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,包括以下步骤:
通过分词算法,对互联网数据进行切分处理;
对切分处理的结果进行文本分析和语义分析;
对文本分析和语义分析的结果进行语义量化计算,得到标准化数据。
进一步,所述对标准化数据进行识别分类这一步骤,其具体为:
基于预设的风险类别,对标准化数据进行识别。
进一步,还包括以下步骤:
基于预设时间,对预设专家库进行业务数据积累。
进一步,所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,还包括以下步骤:
根据互联网数据建立商品模型,所述商品模型包括商品描述信息和商品风险信息。
进一步,所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,具体为:
根据第一匹配结果和第二匹配结果,分别对舱单的舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次进行多纬度训练。
进一步,所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,包括以下步骤:
根据第一匹配结果建立风险分析模型,所述风险分析模型包括风险类别信息和商品描述信息;
根据第一匹配结果建立舱单税则匹配模型,所述舱单税则匹配模型包括税则信息和商品描述信息。
进一步,还包括以下步骤:
基于设定的时间频率,对待分析舱单的风险评估结果和和税则匹配结果进行循环展示;
其中,所述风险评估结果包括分类编号、分类名称、监管要求和违规内容,所述税则匹配结果包括税号和舱单信息。
本发明另一方面所采取的技术方案是:
一种海关过关舱单分析系统,包括:
获取单元,用于通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
分类单元,用于对标准化数据进行识别分类;
第一匹配单元,用于对识别分类结果进行风险品名匹配,得到第一匹配结果;
第二匹配单元,用于对识别分类结果进行舱单分析匹配,得到第二匹配结果;
训练单元,用于对第一匹配结果和第二匹配结果进行训练学习;
风险评估单元,用于根据训练学习的结果,对待分析舱单进行风险评估。
本发明另一方面所采取的技术方案是:
一种海关过关舱单分析装置,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载程序,以执行所述的一种海关过关舱单分析方法。
本发明的有益效果是:本发明基于互联网数据,实现了对舱单的风险评估,能够对海关风险进行事前分流,对商品违法手段进行分类预判,提高了海关查获率,加强商品与风险的关联关系,大大提升了海关事前风险鉴别的能力,安全性高。
附图说明
图1为本发明一种海关过关舱单分析方法的步骤流程图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
参照图1,本发明一种海关过关舱单分析方法,包括以下步骤:
通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
对标准化数据进行识别分类;
对识别分类结果进行风险品名匹配,得到第一匹配结果;
对识别分类结果进行舱单分析匹配,得到第二匹配结果;
对第一匹配结果和第二匹配结果进行训练学习;
根据训练学习的结果,对待分析舱单进行风险评估。
进一步作为优选的实施方式,所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,包括以下步骤:
通过分词算法,对互联网数据进行切分处理;
对切分处理的结果进行文本分析和语义分析;
对文本分析和语义分析的结果进行语义量化计算,得到标准化数据。
进一步作为优选的实施方式,所述对标准化数据进行识别分类这一步骤,其具体为:
基于预设的风险类别,对标准化数据进行识别。
进一步作为优选的实施方式,还包括以下步骤:
基于预设时间,对预设专家库进行业务数据积累。
进一步作为优选的实施方式,所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,还包括以下步骤:
根据互联网数据建立商品模型,所述商品模型包括商品描述信息和商品风险信息。
进一步作为优选的实施方式,所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,具体为:
根据第一匹配结果和第二匹配结果,分别对舱单的舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次进行多纬度训练。
进一步作为优选的实施方式,所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,包括以下步骤:
根据第一匹配结果建立风险分析模型,所述风险分析模型包括风险类别信息和商品描述信息;
根据第一匹配结果建立舱单税则匹配模型,所述舱单税则匹配模型包括税则信息和商品描述信息。
其中,本发明可自动分析文本数据、互联网数据及内部网络归集数据,进行机器自学习,学习新词和词的权值,不需人工干预;另外,还可以自动学习用户的使用记录,根据用户对货物与商品分类编号的匹配度调整作匹配排序自动更新。对于业务专项词汇,本发明可对专项词汇设置权值或做其它特殊处理,产品将对专项词汇操作进行自学习。
进一步作为优选的实施方式,还包括以下步骤:
基于设定的时间频率,对待分析舱单的风险评估结果和和税则匹配结果进行循环展示;
其中,所述风险评估结果包括分类编号、分类名称、监管要求和违规内容,所述税则匹配结果包括税号和舱单信息。
与图1的方法相对应,本发明一种海关过关舱单分析系统,包括:
获取单元,用于通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
分类单元,用于对标准化数据进行识别分类;
第一匹配单元,用于对识别分类结果进行风险品名匹配,得到第一匹配结果;
第二匹配单元,用于对识别分类结果进行舱单分析匹配,得到第二匹配结果;
训练单元,用于对第一匹配结果和第二匹配结果进行训练学习;
风险评估单元,用于根据训练学习的结果,对待分析舱单进行风险评估。
与图1的方法相对应,本发明一种海关过关舱单分析装置,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载程序,以执行所述的一种海关过关舱单分析方法。
下面对本发明一种海关过关舱单分析方法的具体实施步骤进行详细描述:
S1、通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
具体地,本实施例为了丰富商品和舱单训练数据来源,通过爬虫技术来获取外部网站的商品分类和品牌信息,作为数据比对和信息筛查的一种重要数据来源补充。采集得到的互联网数据可以按照不同目标网站进行分类存放。
进一步作为步骤S1的优选实施方式,所述步骤S1包括以下步骤:
S11、通过分词算法,对互联网数据进行切分处理;
S12、对切分处理的结果进行文本分析和语义分析;
S13、对文本分析和语义分析的结果进行语义量化计算,得到标准化数据。
具体地,本实施例通过分词算法,对风险信息中进行自动切分处理,通过对风险信息的文本多层次、多语种分析,实现语义量化计算,使风险信息中的商品描述可与风险分类中的标准化名称对应,并通过风险提示判别可能存在的风险,提示可能存在的违规手法。
本发明通过配置的方式,定时和/或定向搜集电商网站的互联网公开数据,形成数据文件进行保存,并可进行基于内容的自动分类。
进一步作为步骤S1的优选实施方式,还包括以下步骤:
基于预设时间,对预设专家库进行业务数据积累。
具体地,本实施例通过海关业务人员专业的业务能力和知识储备,通过手工维护的方式来录入并积累专家库业务数据,进一步丰富商品和舱单训练数据来源,通过将已经确定的数据和标签,在风险匹配的时候,将以更高权重进行筛查。专家库的业务数据可作为数据比对和信息筛查的另一种重要数据来源补充。其中,本实施例可设置分词的权值,对不同的词库类型的不同词语进行分词权值设置,并可通过使用频率自动调整分词权重,比如,专家库的数据权值较高。
进一步作为步骤S1的优选实施方式,还包括以下步骤:
S14、根据互联网数据建立商品模型,所述商品模型包括商品描述信息和商品风险信息。
S2、对标准化数据进行识别分类;
其中,所述步骤S2具体为:基于预设的风险类别,对标准化数据进行识别。通过对文本描述中的商品主体识别,自动提取,并将识别的主体进行分类,同时提供关联资料提示,识别的主体可以供后续分析使用。
S3、对识别分类结果进行风险品名匹配,得到第一匹配结果;
S4、对识别分类结果进行舱单分析匹配,得到第二匹配结果;
S5、对第一匹配结果和第二匹配结果进行训练学习;
其中,步骤S5具体为:根据第一匹配结果和第二匹配结果,分别对舱单的舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次进行多纬度训练。
所述步骤S5包括以下步骤:
根据第一匹配结果建立风险分析模型,所述风险分析模型包括风险类别信息和商品描述信息;
根据第一匹配结果建立舱单税则匹配模型,所述舱单税则匹配模型包括税则信息和商品描述信息。
S6、根据训练学习的结果,对待分析舱单进行风险评估;
S7、基于设定的时间频率,对待分析舱单的风险评估结果和和税则匹配结果进行循环展示;
其中,所述风险评估结果包括分类编号、分类名称、监管要求和违规内容,所述税则匹配结果包括税号和舱单信息。
下面以基于本发明的海关过关舱单分析方法来创建的系统为例,对本发明的方案作进一步的描述:
本实施例的系统包括互联网采集数据管理模块、专家库数据管理模块、商品训练数据模块、风险品名训练数据模块、舱单分析训练数据模块、品名关键字搜索模块、品名批量查询模块、舱单实时监控模块以及舱单分析关键字搜索模块。
其中,互联网采集数据管理模块,用于采集互联网数据;具体地,该模块可以按照不同目标网站,分类存放数据。互联网采集数据管理模块下的管理界面可以查看数量统计、最后更新时间以及采集到的详细数据页,其详细业务功能描述如下:1、能够按照一定的查询条件,对采集到的数据进行查询;2、能够标识不同目标来源的数据;3、提供采集到明细数据的查看功能;4、提供无效数据标识功能,被标识为无效的数据不参与业务数据比对;5、提供采集到明细数据的导出功能。该模块对应的数据权限为:1、普通用户:具有此功能模块查询、导出功能;2、业务管理员:具有此功能模块查询、导出及标识功能;3、系统管理员:具有此功能模块查询、导出及标识功能。
专家库数据管理模块,用于通过海关业务人员专业的业务能力和知识储备,以手工维护的方式来录入并积累专家库业务数据,进一步丰富商品和舱单训练数据来源,通过已经确定的数据和标签,在风险匹配的时候,以更高权重进行筛查。专家库数据可以作为数据比对和信息筛查的另一种重要数据来源补充。该模块的详细业务功能描述如下:1、提供专家库查询功能;2、提供专家库新增功能;3、提供专家库编辑功能;4、提供专家库删除功能;5、提供专家库数据导入Excel功能,实现数据批量维护;6、提供专家库数据导出功能;7、提供主题分类功能,目前主要有可疑公司名单和查发案件两类,可疑公司名单中的标题和正文的两项权重不一样。该模块对应的数据权限为:1、普通用户:具有此功能模块查询、导出功能;2、业务管理员:具有此功能模块查询、导出,新增、编辑和删除功能;3、系统管理员:具有此功能模块查询、导出,新增、编辑和删除功能。该模块可输入的搜索字段包括主题分类,标题,正文,联系电话,法人和单位代码等。
商品训练数据模块,用于通过对某一类数据进行建模(比如影子商品),自动提取商品描述的关键字。海关内部数据库包含改单等数据,通过查验大量历史数据,当新舱单和报关单到来时,该模块可以用作识别可能伪报的影子商品风险。该模块的详细业务功能描述如下:1、提供训练数据表查询功能;2、提供训练数据表新增功能;3、提供训练数据表编辑功能;
4、提供训练数据表删除功能;5、为训练数据表提供定时获取数据功能,本实施例的定时时间暂定为每天凌晨一点。
另外,训练表需要指定特定数据结构,本实施例的结构如表1所示:
表1
字段名 类型 备注
REAL_ITEM Varchar(200) 真实品名
REAL_CODE_TS Varchar(20) 真实税号
FAKE_ITEM Varchar(200) 伪报品名
FAKE_CODE_TS Varchar(20) 伪报(改单前)税号
商品训练数据模块的数据权限为:普通用户:具有此功能模块查询功能;业务管理员:具有此功能模块查询、新增、编辑和删除功能;系统管理员:具有此功能模块查询、新增、编辑和删除功能。该模块能够将历史查发、历史改单数据下发到本地数据库。
风险品名训练数据模块,用于建立风险类别模型,当海关业务专家对某类商品确认为风险商品,将包含某些风险类别的数据传入特定结构的数据表。通过该模块,当新舱单或者报关单匹配到对应的商品描述(包含别名,同义)时,系统可以直接提示存在的风险识别信息。该模块的详细业务功能描述如下:1、提供训练数据表查询功能;2、提供训练数据表新增功能;3、提供训练数据表编辑功能;4、提供训练数据表删除功能;5、同一品名可以对应多个风险类别,风险类别可供用户通过后台自定义传入(如:毒品,濒危等);6、通过对某些查验报关单进行分析和系统外审核流程控制,将分类后的数据导入训练表中;如将品名为除锈剂,类别是“易制毒”风险加入训练数据表中;7、为训练数据表提供定时获取数据功能,本实施例的定时时间暂定为每天凌晨一点。
另外,风险品名训练数据模块的训练表需要指定特定数据结构,本实施例的训练表数据结构如表2所示:
表2
字段名 类型 备注
ITEM Varchar(200) 品名描述
RISK Varchar(200) 风险描述,多标签用|分隔
风险品名训练数据模块的数据权限为:1、普通用户:具有此功能模块查询功能;2、业务管理员:具有此功能模块查询、新增、编辑和删除功能;3、系统管理员:具有此功能模块查询、新增、编辑和删除功能。本实施例能够将风险维度的品名数据下发到本地数据库。
舱单分析训练数据模块,用于对舱单的舱单货物简要描述、舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次五个纬度进行训练。本实施例的模块结合互联网数据,将海关内部数据对舱单的舱单货物简要描述、舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次五个纬度进行训练,进而得到舱单税则匹配模型和风险分析模型,从而实现在货到前进行综合风险预警。该模块的详细业务功能描述如下:1、提供训练数据表查询功能;2、提供训练数据表新增功能;3、提供训练数据表编辑功能;4、提供训练数据表删除功能;5、训练因子包含舱单货物简要描述、舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次共五项;6、如果查验处理结果代码、人工查询记录和机器查询记录三个字段为空,则表示未查验;7、如果查询处理结果代码为04、05、07、08、11、12、16、18,则加入训练数据;8、如果查询处理结果代码为04、05、07、11、12、16、08、18,则判定为查获,查获率等于查获的报送单数量除以被查验的报关单总数量;9、为训练数据表提供定时获取数据功能,本实施例的定时时间暂定为每天凌晨一点。
另外,舱单分析训练数据模块的训练表的数据结构如表3所示:
表3
舱单分析训练数据模块的数据权限为:1、普通用户:具有此功能模块查询功能;2、业务管理员:具有此功能模块查询、新增、编辑和删除功能;3、系统管理员:具有此功能模块查询、新增、编辑和删除功能。本实施例可以将历史查验的舱单数据下发到本地数据库。
品名关键字搜索模块,用于通过输入品名,税号(4、6或者8位)和风险类别等关键字实现数据查询,并返回查询结果给用户。该模块的详细业务功能描述如下:1、提供关键字输入查询功能;2、提供查询结果返回页面,返回结果包含的详细信息内容为:品名描述,可能税号,可能真实商品描述,风险类别;3、提供查询结果导出功能。该模块授权所有用户进行数据查询操作。
品名批量查询模块,用于通过输入未知品名的表名,实现批量数据查询,并将查询结果回填到原数据表,用户可通过存储过程调用此数据表的数据进行二次利用。该模块提供了系统后台运算并将查询结果回填至数据表功能,所述数据表的具体结构如下:
品名批量查询模块授权所有用户进行数据查询操作。
舱单实时监控模块,用于实时获取舱单数据并进行分析,通过对舱单文本多层次、多语种分析,实现语义量化计算,使舱单中的商品描述可与税则中的标准化名称对应,并通过税则编码判别可能存在的风险,实行事前风险甄别及风险分流控制,达到安全准入风险防控的目的。舱单实时监控模块的详细业务功能描述如下:1、循环自动切换显示存在税号和对应的舱单风险,每10秒刷新一次;2、显示税号以及与税号匹配的舱单商品信息;3、显示与税号相匹配的历史舱单风险信息,包括分类编号、分类名称和监管要求;4、显示可能存在的相关风险预估信息,提示可能存在的违规手法。舱单实时监控模块授权所有用户进行数据查询操作。
舱单分析关键字搜索模块,用于通过输入的完整或者部分舱单号,查询到相关的舱单信息,以及相关的历史查发、专家库和互联网信息。舱单分析关键字搜索模块的详细业务功能描述如下:1、提供关键字输入查询功能;2、提供查询结果返回页面,返回结果包含的舱单相关信息内容,如舱单号,商品描述,公司名字;3、提供查询返回结果信息显示功能,显示的内容包括与关键字相关的公司地址,历史舱单,历史查发,税号,互联网别名;4、提供查询结果导出功能;5、显示舱单描述分词情况,并显示各分词的匹配度。本实施例的舱单分析关键字搜索模块授权所有用户进行数据查询操作。
综上所述,本发明一种海关过关舱单分析方法、系统及装置可以实现海关风险事前分流、商品违法手段分类预判等智能化业务应用,提高海关查获率,加强商品与风险的关联关系,大大提升了海关事前风险鉴别的能力,辅助海关部门对风险的度量和评估以及制定应变策略。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种海关过关舱单分析方法,其特征在于:包括以下步骤:
通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
对标准化数据进行识别分类;
对识别分类结果进行风险品名匹配,得到第一匹配结果;
对识别分类结果进行舱单分析匹配,得到第二匹配结果;
对第一匹配结果和第二匹配结果进行训练学习;
根据训练学习的结果,对待分析舱单进行风险评估。
2.根据权利要求1所述的一种海关过关舱单分析方法,其特征在于:所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,包括以下步骤:
通过分词算法,对互联网数据进行切分处理;
对切分处理的结果进行文本分析和语义分析;
对文本分析和语义分析的结果进行语义量化计算,得到标准化数据。
3.根据权利要求1所述的一种海关过关舱单分析方法,其特征在于:所述对标准化数据进行识别分类这一步骤,其具体为:
基于预设的风险类别,对标准化数据进行识别。
4.根据权利要求1所述的一种海关过关舱单分析方法,其特征在于:还包括以下步骤:
基于预设时间,对预设专家库进行业务数据积累。
5.根据权利要求2所述的一种海关过关舱单分析方法,其特征在于:所述通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据这一步骤,还包括以下步骤:
根据互联网数据建立商品模型,所述商品模型包括商品描述信息和商品风险信息。
6.根据权利要求1所述的一种海关过关舱单分析方法,其特征在于:所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,具体为:
根据第一匹配结果和第二匹配结果,分别对舱单的舱单收货人信息、舱单发货人信息、舱单通知人信息、码头货仓代码和航班航次进行多纬度训练。
7.根据权利要求1所述的一种海关过关舱单分析方法,其特征在于:所述对第一匹配结果和第二匹配结果进行训练学习这一步骤,包括以下步骤:
根据第一匹配结果建立风险分析模型,所述风险分析模型包括风险类别信息和商品描述信息;
根据第一匹配结果建立舱单税则匹配模型,所述舱单税则匹配模型包括税则信息和商品描述信息。
8.根据权利要求7所述的一种海关过关舱单分析方法,其特征在于:还包括以下步骤:
基于设定的时间频率,对待分析舱单的风险评估结果和和税则匹配结果进行循环展示;
其中,所述风险评估结果包括分类编号、分类名称、监管要求和违规内容,所述税则匹配结果包括税号和舱单信息。
9.一种海关过关舱单分析系统,其特征在于:包括:
获取单元,用于通过爬虫技术获取互联网数据,并对互联网数据进行分词处理,得到标准化数据;
分类单元,用于对标准化数据进行识别分类;
第一匹配单元,用于对识别分类结果进行风险品名匹配,得到第一匹配结果;
第二匹配单元,用于对识别分类结果进行舱单分析匹配,得到第二匹配结果;
训练单元,用于对第一匹配结果和第二匹配结果进行训练学习;
风险评估单元,用于根据训练学习的结果,对待分析舱单进行风险评估。
10.一种海关过关舱单分析装置,其特征在于:包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载程序,以执行如权利要求1-8任一项所述的一种海关过关舱单分析方法。
CN201811115550.2A 2018-09-25 2018-09-25 一种海关过关舱单分析方法、系统及装置 Pending CN109408694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811115550.2A CN109408694A (zh) 2018-09-25 2018-09-25 一种海关过关舱单分析方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811115550.2A CN109408694A (zh) 2018-09-25 2018-09-25 一种海关过关舱单分析方法、系统及装置

Publications (1)

Publication Number Publication Date
CN109408694A true CN109408694A (zh) 2019-03-01

Family

ID=65465981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811115550.2A Pending CN109408694A (zh) 2018-09-25 2018-09-25 一种海关过关舱单分析方法、系统及装置

Country Status (1)

Country Link
CN (1) CN109408694A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160063653A1 (en) * 2014-08-28 2016-03-03 Ncr Corporation In-vehicle content systems and methods
CN106056514A (zh) * 2016-05-27 2016-10-26 广东南方海岸科技服务有限公司 一种移动电子通关系统及方法
CN106970909A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种二次匹配语义的语义分析方法
CN107229695A (zh) * 2017-05-23 2017-10-03 深圳大学 多平台航空电子大数据系统及方法
CN107451710A (zh) * 2017-04-27 2017-12-08 北京鼎泰智源科技有限公司 一种信息风险等级五级分类方法及系统
CN108108744A (zh) * 2016-11-25 2018-06-01 同方威视技术股份有限公司 用于辐射图像辅助分析的方法及其系统
CN108121824A (zh) * 2018-01-12 2018-06-05 北京融快线科技有限公司 一种面向金融服务的聊天机器人及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160063653A1 (en) * 2014-08-28 2016-03-03 Ncr Corporation In-vehicle content systems and methods
CN106970909A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种二次匹配语义的语义分析方法
CN106056514A (zh) * 2016-05-27 2016-10-26 广东南方海岸科技服务有限公司 一种移动电子通关系统及方法
CN108108744A (zh) * 2016-11-25 2018-06-01 同方威视技术股份有限公司 用于辐射图像辅助分析的方法及其系统
CN107451710A (zh) * 2017-04-27 2017-12-08 北京鼎泰智源科技有限公司 一种信息风险等级五级分类方法及系统
CN107229695A (zh) * 2017-05-23 2017-10-03 深圳大学 多平台航空电子大数据系统及方法
CN108121824A (zh) * 2018-01-12 2018-06-05 北京融快线科技有限公司 一种面向金融服务的聊天机器人及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘慧: "基于模糊神经网络的进口货物风险评估的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
褚继锋: "海关缉毒风险管理系统研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑》 *

Similar Documents

Publication Publication Date Title
CN108776671A (zh) 一种网络舆情监控系统及方法
US20050043961A1 (en) System and method for identification, detection and investigation of maleficent acts
CN111444353B (zh) 一种警情知识图谱的构建及使用方法
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN110334178A (zh) 数据检索方法、装置、设备及可读存储介质
KR101335540B1 (ko) 온톨로지 기반의 문서 분류 방법 및 장치
CN111105209A (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
KR20180072167A (ko) 유사특허 추출 시스템 및 그 방법
CN109241068A (zh) 前后台数据比对的方法、装置及终端设备
CN101203847B (zh) 用于管理列表的系统和方法
CN111159387A (zh) 基于多维度报警信息文本相似度分析的推荐方法
CN113239130A (zh) 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
CN110288451B (zh) 一种财务报销方法、系统、设备及存储介质
CN115547466B (zh) 基于大数据的医疗机构登记评审系统及其方法
CN110009224A (zh) 嫌疑人违规概率预测方法、装置、计算机设备及存储介质
CN112116168B (zh) 一种用户行为的预测方法、装置及电子设备
CN109902151A (zh) 询问笔录的记录方法、装置及电子设备
CN114462556A (zh) 企业关联产业链分类方法、训练方法、装置、设备和介质
CN110490750B (zh) 数据识别的方法、系统、电子设备及计算机存储介质
CN111815485A (zh) 一种基于深度学习bert模型的量刑预测方法和装置
van den Braak et al. Combining and analyzing judicial databases
CN109408694A (zh) 一种海关过关舱单分析方法、系统及装置
Domashova et al. Detection of non-typical users of the electronic marketplace" Freight transportation" to prevent the competitive intelligence
CN112561714B (zh) 基于nlp技术的核保风险预测方法、装置及相关设备
CN110119464A (zh) 一种合同中数值的智能推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190301