CN112508361B - 产品出口受阻信息处理方法、装置、电子设备及存储介质 - Google Patents
产品出口受阻信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112508361B CN112508361B CN202011331730.1A CN202011331730A CN112508361B CN 112508361 B CN112508361 B CN 112508361B CN 202011331730 A CN202011331730 A CN 202011331730A CN 112508361 B CN112508361 B CN 112508361B
- Authority
- CN
- China
- Prior art keywords
- product
- information
- document
- blocked
- import
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000903 blocking effect Effects 0.000 title claims abstract description 61
- 230000010365 information processing Effects 0.000 title claims abstract description 23
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 230000008676 import Effects 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 14
- 238000013519 translation Methods 0.000 claims description 13
- 230000014616 translation Effects 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 abstract description 11
- 239000000047 product Substances 0.000 description 188
- 235000015278 beef Nutrition 0.000 description 10
- 239000003814 drug Substances 0.000 description 9
- 229940079593 drug Drugs 0.000 description 8
- 238000009826 distribution Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940126601 medicinal product Drugs 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种产品出口受阻信息处理方法、装置、电子设备及存储介质。包括步骤:读取预设的关于产品进出口贸易信息发布的网址的网页内容;从网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;基于公文内容判断该公文是否是对产品进口限制的公文;当是对产品进口限制的公文时,从公文内容中读取区域信息;对公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因;利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告。该方法在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
Description
技术领域
本发明涉及数据统计领域,具体涉及一种产品出口受阻信息处理方法、装置、电子设备及存储介质。
背景技术
产品在进出口过程中,由于不同区域的地方标准或者要求不同,产品进口国往往会对所进口产品进行严格的筛查和检测,对于不符合当地标准或者要求的产品进行公示,并且阐明相应的原因。例如,对农产品或者药物等方面的进口都会有严格的审核标准,然后进行相应的公示。
而对于出口方,及时准确地获知这些信息能够减少大量的不必要损失。然而,对于产品出口受阻信息的统计通常是由人工收集得到的,统计费时费力,不仅效率低而且很容易出现错误。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中对产品出口受阻信息进行统计时,不仅效率低而且很容易出现错误的缺陷,从而提供一种产品出口受阻信息处理方法,包括如下步骤:
读取预设的关于产品进出口贸易信息发布的网址的网页内容;
从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;
基于所述公文内容判断该公文是否是对产品进口限制的公文;
当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域;
对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因;
利用所述区域信息、所述产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告。
优选地,所述从所述公文内容中读取区域信息,包括:
利用预先构建的区域数据库中的区域标识与所述公文内容进行比对,其中,所述区域数据库中每个区域标识唯一表示一个地理区域;
获取比对成功的区域标识对应的地理区域名称,作为所述区域信息。
优选地,所述对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因,包括:
利于预先构建的字段数据库中的字段与所述公文内容中的关键字进行匹配,获取与所述关键字对应的出口受阻的产品信息和产品受阻原因。
优选地,所述字段数据库包括重点字段表;所述利于预先构建的字段数据库中的字段与所述公文内容中的关键字进行匹配,获取与所述关键字对应的出口受阻的产品信息和产品受阻原因,包括:
将所述重点字段表中的字段与所述公文内容中的关键字进行匹配,获取与所述重点字段表中的字段对应的信息;
根据重点字段表中的译文,将与所述重点字段表中的字段对应的信息翻译为相应的译文,所述译文包括所述产品信息和/或产品受阻原因。
优选地,当所述公文内容中的关键字未匹配到所述字段数据库中的字段时,获取与未匹配到所述字段数据库中的字段的关键字对应的信息,并标记。
优选地,所述关键字为所述公文内容中的子标题。
优选地,所述字段数据库中的字段包括:通报号、通报日期、通报类别、通报地区、产品产地、产品代码、产品名称、产品图片、产品数量、产品价值、产品类别、制造商信息、进口商信息、销售商信息、海关编码、国际标准分类号、产品销售信息、产品库存信息、产品标识标签信息、产品包装信息、产品受阻原因、产品造成的事故、风险类别以及进口国采取的措施中的至少一个。
本发明另一方面还提供了一种产品出口受阻信息处理装置,包括:
第一读取模块,用于读取预设的关于产品进出口贸易信息发布的网址的网页内容;
第一获取模块,用于从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;
判断模块,用于基于所述公文内容判断该公文是否是对产品进口限制的公文;
第二读取模块,用于当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域;
第二获取模块,用于对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因;
统计模块,用于利用所述区域信息、所述产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告。
本发明另一方面还提供了一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行上述的产品出口受阻信息处理方法。
本发明另一方面还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行上述的产品出口受阻信息处理方法。
本发明技术方案,具有如下优点:
1.本发明提供的产品出口受阻信息处理方法,通过读取预定的网页内容,从所读取的网页内容中确定出是对产品进口限制的公文,对确定的公文内容进行区域信息、出口受阻的产品信息和产品受阻原因的获取,利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告,该方法在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
2.本发明提供的产品出口受阻信息处理装置,第一读取模块、第一获取模块以及判断模块通过读取预定的网页内容,从所读取的网页内容中确定出是对产品进口限制的公文,第二读取模块及第二获取模块对确定的公文内容进行区域信息、出口受阻的产品信息和产品受阻原因的获取,统计模块利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告,该装置在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中产品出口受阻信息处理方法的流程图;
图2为本发明实施例2中产品出口受阻信息处理装置的原理框图;
图3为本发明实施例3中电子设备的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
在对技术性贸易措施的相关研究中,统计与分析进口国所公示的不符合当地标准或者要求的产品及其原因,为企业及研究机构等提供定向信息,通过对数据的统计与分析,不仅能给研究人员提供相应的数据支持,还能够给企业等出口商提供出口决策。针对产品出口受阻信息的统计分析,如果由人工来操作不仅效率低,而且可能会因为粗心造成数据的错误,导致整个结果与客观结果有较大的误差。因此,提供一种由机器操作的系统来执行整个产品出口受阻信息的统计分析是很有必要的。
实施例1
本实施例提供了一种产品出口受阻信息处理方法,图1是说明根据本发明某些实施例,通过对公文版块的识别与判断、公文内容的读取及统计以形成产品出口受阻信息报告的流程图。虽然下文描述的过程包括以特定的顺序出现的多个操作,但是应该清楚地了解到,这些过程也可以包括更多或者更少的操作,这些操作可以顺序执行或者并行执行(例如使用并行处理器或者多线程环境)。
如图1所示,本实施例提供的产品出口受阻信息处理方法,该方法可由一个数据统计分析的系统来执行,包括如下步骤:
S101、读取预设的关于产品进出口贸易信息发布的网址的网页内容。
在上述实施步骤中,预先将各国关于产品进出口贸易信息发布网址的信息添加到系统中,产品进出口贸易信息发布网址的信息可以为该网址的链接、该网址的二维码及该网址的名称等等。
在需要进行相关信息统计分析时,系统进入到相关网址的网页内并读取该网页的内容。例如,当需要统计分析A国家的食药类产品出口到B国家的受阻信息时,系统进入到B国家的食品药品管理局(该网址链接已预先添加到系统相应的位置)的官方网页内,并读取该网站的网页内容。再如,当需要统计分析A国家的食药类产品出口到C国家的受阻信息时,系统进入到C国家的进出口信息发布网(该网址链接已预先添加到系统相应的位置)的官方网页内,并读取该网站的网页内容。
S102、从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容。
在上述实施步骤中,经步骤S101读取到相关网页内容后,从网页内容中识别出商品进口的公文版块所在的位置,并获取已发布的与进口商品相关的公文内容。例如,当步骤S101读取的是B国家的食品药品管理局的网页内容时,系统从所读取的该网页内容中识别出商品进口的公文版块所在的位置,并获取已发布的与进口商品相关的公文内容,如发布的牛肉进口相关信息、牛肉进口限制相关信息或牛肉进口质量相关信息等等。再如,当步骤S101读取的是C国家进出口信息发布网的网页内容时,系统从所读取的该网页内容中识别出商品进口的公文版块所在的位置,并获取已发布的与进口商品相关的公文内容,如发布的口罩进口相关信息、口罩进口限制相关信息或口罩进口质量相关信息等等。
S103、基于所述公文内容判断该公文是否是对产品进口限制的公文。
在上述实施步骤中,因步骤S102中所获取的已发布的与进口商品相关的公文内容具有多种情况,如从B国家的食品药品管理局官方网站内获取的已发布的牛肉进口相关信息、牛肉进口限制相关信息和牛肉进口质量相关信息,再如从C国家进出口信息发布网内获取的已发布的口罩进口相关信息、口罩进口限制相关信息或口罩进口质量相关信息。
为了对产品出口受阻信息进行处理,需要对所获取的公文内容进行判断,识别出是对产品进口限制的公文,过滤掉与对产品进口限制无关的公文,如选择从B国家的食品药品管理局官方网站内获取的牛肉进口限制相关信息,过滤掉牛肉进口相关信息和牛肉进口质量相关信息,再如从C国家进出口信息发布网内获取的口罩进口限制相关信息,过滤掉口罩进口相关信息和口罩进口质量相关信息。
S104、当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域。
在上述实施步骤中,当经步骤S103判断出所获取的已发布的公文内容是对产品进口限制的公文时,从所获取的公文内容中读取区域信息,将所读取到的区域信息作为被做出产品进口限制的区域。其中,区域信息为生产地的地理区域名称。例如,从B国家的食品药品管理局官方网站内获取的牛肉进口限制相关信息中,所读取的区域信息为A国B省C市,再如,从C国家进出口信息发布网内获取的口罩进口限制相关信息中,所读取的区域信息为A国D市。所读取到的“A国B省C市”和“A国D市”都为被做出产品进口限制的区域。
当需要对某个特定区域的产品做出口受阻信息统计分析时,如特定区域为A国B省C市,则从相关网站内获取到所有由A国B省C市出口的产品受阻信息;再如特定区域为A国B省,从相关网站内获取到所有由A国家B省(包括B省所有市县)出口的产品受阻信息;再如特定区域为A国,从相关网站内获取到所有由A国(包括A国所有的省市)出口的产品受阻信息。
从公文内容中读取区域信息,可以通过以下方式读取:
方式1:预先构建好一个区域数据库,该区域数据库中具有多个区域标识,并且每个区域标识唯一表示一个地理区域,利用预先构建好的区域数据库中的区域标识与公文内容(公文内容中的产品产地信息、制造商信息等,也可以是单独固定某个特定区域)进行对比,获取对比成功的区域标识对应的地理区域名称,作为区域信息。
区域标识可以为对应地理区域的中文、英文或日语等文字,也可以为对应地理区域的特定标记或符号;当对应的地理区域为国家时,区域标识也可以为对应国家的缩写代号。
方式2:从公文内容的产品产地信息或者制造商信息中,读取相关的省市或国家名称,例如,当B国家食品药品管理局发布的公文内容中,产品产地信息上的城市为“a市”或“b市”等属于A国B省的城市名时,确定出该被做出产品进口限制的区域,当所统计分析的是A国B省的产品出口受阻信息时,则将上述城市出口的产品都归为A国B省出口的产品。再如,当B国家食品药品管理局发布的公文内容中,产品产地信息上的名称带有“A国a市”、“A国b市”、“A国c市”、“A国d市”或“A国e市”等时,当所统计分析的是A国全国的产品出口受阻信息时,确定该被做出产品进口限制的区域都属于A国。
S105、对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因。
在上述实施步骤中,对所确定为产品进口限制的公文进行字段识别,从而获取到出口受阻的产品信息和产品受阻原因。同时,本步骤S105也可以在获取区域信息之前进行,也可以与获取区域信息同步进行,在此不做限定。
在对公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因时,可通过以下方式获取:
预先构建好一个字段数据库,该字段数据库具有多个不同的字段,例如,字段数据库中的字段包括:通报号、通报日期、通报类别、通报地区、产品产地、产品代码、产品名称、产品图片、产品数量、产品价值、产品类别、制造商信息、进口商信息、销售商信息、海关编码、国际标准分类号、产品销售信息、产品库存信息、产品标识标签信息、产品包装信息、产品受阻原因、产品造成的事故、风险类别以及进口国采取的措施等中的至少一个,其中制造商信息包括制造商注册码、注册商地址和注册商名称等,进口商信息包括进口商名称和进口商地址等,销售商信息包括销售商名称和销售商地址等。即与出口受阻的产品信息和产品受阻原因对应的字段至少包括上述字段。
利用预先构建好的字段数据库中的字段与确定为产品进口限制的公文内容中的关键字进行匹配,获取与所匹配到的关键字对应的出口受阻的产品信息和受阻原因。例如,在对B国食品药品管理局发布的公文内容进行统计分析时,字段数据库中的字段与公文内容中关键字的对应关系如表1:
表1
确定为产品进口限制的公文内容中的关键字为公文内容中的子标题,如表2所示,“Manufacturer's City”、“Refusal Date”以及“Product Code”所在的位置为公文内容中的子标题,表2中的“Yiwu”、“01-Jul-2020”以及“86HQZ”则分别为与关键字“Manufacturer's City”、“Refusal Date”以及“Product Code”对应的信息。
Manufacturer's City | Yiwu |
Refusal Date | 01-Jul-2020 |
Product Code | 86HQZ |
表2
当系统在进行字段匹配时,如果公文内容中关键字存在未匹配到字段数据库中字段的情况时,则获取与未匹配到字段数据库中的字段的关键字对应的信息,并标记,以提醒操作人员及时发现所获取的信息,同时方便后续由操作人员对字段进行实时更新,防止重要信息的遗漏。
在获取到出口受阻的产品信息和产品受阻原因后,可由人工对所获取的信息进行筛查,人工将脏数据删除及将缺失数据补全。
S106、利用所述区域信息、所述产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告。
在上述实施步骤中,将所获取到的区域信息、产品信息和产品受阻原因进行统计及分析,生成对应区域的产品出口受阻信息报告。例如,当获取的产品信息和产品受阻原因为A国B省C市的出口产品,则生成A国B省C市的产品出口受阻信息报告;当获取的产品信息和产品受阻原因为A国B省的出口产品,则生成A国B省的产品出口受阻信息报告。
产品出口受阻信息报告可以为统计该地区中相同产品受阻原因的分布情况、该地区中受阻数量最多的产品情况以及该地区中受阻原因最多的情况等等。关于生成产品出口受阻信息报告的方法采用现有技术即可,在本实施例中不做过多描述。所生成的产品出口受阻信息报告可以定时通过邮箱、短信等方式推送给预约用户,也可放置在相关网站内供用户下载查看。
由于在统计时的时候,通常是针对国外的网站进行信息的采集,所采集到的信息大多为外文,例如英文、日文或者韩文等外文,为了方便相关人员对产品出口受阻信息报告的查看,字段数据库包括重点字段表,与重点字段表中的字段对应的信息具有译文,例如,具有对应的中文翻译。重点字段表可以包括:通报类别、通报地区、产品产地、产品类别、海关编码、国际标准分类号、产品受阻原因、风险类别、进口国采取的措施等中的一个或多个。例如,重点字段表包括产品类别和产品受阻原因,与重点字段表中的字段对应信息的译文如表3和表4所示:
表3
表4
将重点字段表中的字段(本例中即为产品类别和产品受阻原因)与公文内容中的关键字进行匹配,获取与重点字段表中的字段对应的信息,并根据重点字段表中的译文,将与重点字段表中的字段对应的信息翻译为相应的译文,在本实施例中,译文为产品类别和产品受阻原因的中文翻译。
在本实施例中,通过读取预定的网页内容,从所读取的网页内容中确定出是对产品进口限制的公文,对确定的公文内容进行区域信息、出口受阻的产品信息和产品受阻原因的获取,利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告,该方法在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
实施例2
本实施例提供了一种产品出口受阻信息处理装置,该装置应用于对产品出口受阻信息处理,如图2所示,包括:
第一读取模块201,用于读取预设的关于产品进出口贸易信息发布的网址的网页内容;详细内容参见上述方法实施例1对应步骤S101的相关描述,此处不再赘述。
第一获取模块202,用于从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;详细内容参见上述方法实施例1对应步骤S102的相关描述,此处不再赘述。
判断模块203,用于基于所述公文内容判断该公文是否是对产品进口限制的公文;详细内容参见上述方法实施例1对应步骤S103的相关描述,此处不再赘述。
第二读取模块204,用于当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域;详细内容参见上述方法实施例1对应步骤S104的相关描述,此处不再赘述。
第二获取模块205,用于对所述公文内容进行字段识别,获取出口受阻的产品信息和受阻原因;详细内容参见上述方法实施例1对应步骤S105的相关描述,此处不再赘述。
统计模块206,用于利用所述区域信息、所述产品信息和受阻原因生成对应区域的产品出口受阻信息报告。详细内容参见上述方法实施例1对应步骤S106的相关描述,此处不再赘述。
在本实施例中,第一读取模块201、第一获取模块202以及判断模块203通过读取预定的网页内容,从所读取的网页内容中确定出是对产品进口限制的公文,第二读取模块204及第二获取模块205对确定的公文内容进行区域信息、出口受阻的产品信息和产品受阻原因的获取,统计模块206利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告,该装置在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
实施例3
本实施例提供了一种产品出口受阻信息处理方法,如图3所示,该设备包括处理器301和存储器302,其中处理器301和存储器302可以通过总线或者其他方式连接,图3中以通过总线连接为例。
处理器301可以为中央处理器(Central Processing Unit,CPU)。处理器301还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、图形处理器(Graphics Processing Unit,GPU)、嵌入式神经网络处理器(Neural-network ProcessingUnit,NPU)或者其他专用的深度学习协处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器302作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中产品出口受阻信息处理方法对应的程序指令/模块(如图2所示的第一读取模块201、第一获取模块202、判断模块203、第二读取模块204、第二获取模块205以及统计模块206)。处理器301通过运行存储在存储器302中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例1中的产品出口受阻信息处理方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器301所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至处理器301。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器302中,当被所述处理器301执行时,执行如图1所示产品出口受阻信息处理方法。
在本实施例中,存储器302存储有产品出口受阻信息处理方法的程序指令或模块,处理器301执行存储在存储器302内的程序指令或模块时,通过读取预定的网页内容,从所读取的网页内容中确定出是对产品进口限制的公文,对确定的公文内容进行区域信息、出口受阻的产品信息和产品受阻原因的获取,利用区域信息、产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告,该方法在对产品出口受阻信息进行统计分析时效率高,而且由于是采用机器进行统计分析,相比于由人工去统计出现错误的概率更低,进而保证了数据的可信度。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的产品出口受阻信息处理方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (9)
1.一种产品出口受阻信息处理方法,其特征在于,包括如下步骤:
读取预设的关于产品进出口贸易信息发布的网址的网页内容;
从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;
基于所述公文内容判断该公文是否是对产品进口限制的公文;
当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域;
对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因;
利用所述区域信息、所述产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告;
所述从所述公文内容中读取区域信息,包括:
利用预先构建的区域数据库中的区域标识与所述公文内容进行比对,其中,所述区域数据库中每个区域标识唯一表示一个地理区域;
获取比对成功的区域标识对应的地理区域名称,作为所述区域信息。
2.根据权利要求1所述的产品出口受阻信息处理方法,其特征在于,所述对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因,包括:
利用预先构建的字段数据库中的字段与所述公文内容中的关键字进行匹配,获取与所述关键字对应的出口受阻的产品信息和产品受阻原因。
3.根据权利要求2所述的产品出口受阻信息处理方法,其特征在于,所述字段数据库包括重点字段表;所述利用预先构建的字段数据库中的字段与所述公文内容中的关键字进行匹配,获取与所述关键字对应的出口受阻的产品信息和产品受阻原因,包括:
将所述重点字段表中的字段与所述公文内容中的关键字进行匹配,获取与所述重点字段表中的字段对应的信息;
根据重点字段表中的译文,将与所述重点字段表中的字段对应的信息翻译为相应的译文,所述译文包括所述产品信息和/或产品受阻原因。
4.根据权利要求2所述的产品出口受阻信息处理方法,其特征在于,当所述公文内容中的关键字未匹配到所述字段数据库中的字段时,获取与未匹配到所述字段数据库中的字段的关键字对应的信息,并标记。
5.根据权利要求2-4任一所述的产品出口受阻信息处理方法,其特征在于,所述关键字为所述公文内容中的子标题。
6.根据权利要求2-4任一所述的产品出口受阻信息处理方法,其特征在于,所述字段数据库中的字段包括:通报号、通报日期、通报类别、通报地区、产品产地、产品代码、产品名称、产品图片、产品数量、产品价值、产品类别、制造商信息、进口商信息、销售商信息、海关编码、国际标准分类号、产品销售信息、产品库存信息、产品标识标签信息、产品包装信息、产品受阻原因、产品造成的事故、风险类别以及进口国采取的措施中的至少一个。
7.一种产品出口受阻信息处理装置,其特征在于,包括:
第一读取模块,用于读取预设的关于产品进出口贸易信息发布的网址的网页内容;
第一获取模块,用于从所述网页内容中识别商品进口的公文版块所在位置,获取已发布的与进口商品相关的公文内容;
判断模块,用于基于所述公文内容判断该公文是否是对产品进口限制的公文;
第二读取模块,用于当是对产品进口限制的公文时,从所述公文内容中读取区域信息,其中,所述区域信息为被做出产品进口限制的区域;
第二获取模块,用于对所述公文内容进行字段识别,获取出口受阻的产品信息和产品受阻原因;
统计模块,用于利用所述区域信息、所述产品信息和产品受阻原因生成对应区域的产品出口受阻信息报告;
所述第二读取模块具体用于:
利用预先构建的区域数据库中的区域标识与所述公文内容进行比对,其中,所述区域数据库中每个区域标识唯一表示一个地理区域;
获取比对成功的区域标识对应的地理区域名称,作为所述区域信息。
8.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-6中任一项所述的产品出口受阻信息处理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-6中任一项所述的产品出口受阻信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011331730.1A CN112508361B (zh) | 2020-11-24 | 2020-11-24 | 产品出口受阻信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011331730.1A CN112508361B (zh) | 2020-11-24 | 2020-11-24 | 产品出口受阻信息处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508361A CN112508361A (zh) | 2021-03-16 |
CN112508361B true CN112508361B (zh) | 2024-03-29 |
Family
ID=74959760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011331730.1A Active CN112508361B (zh) | 2020-11-24 | 2020-11-24 | 产品出口受阻信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508361B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104737187A (zh) * | 2012-08-31 | 2015-06-24 | 邓白氏公司 | 将进口数据和/或出口数据与公司标识符关联的系统及过程 |
CN107563625A (zh) * | 2017-08-24 | 2018-01-09 | 江苏丹森资讯顾问有限公司 | 标准信息管理方法 |
CN107943954A (zh) * | 2017-11-24 | 2018-04-20 | 杭州安恒信息技术有限公司 | 网页敏感信息的检测方法、装置及电子设备 |
CN110362800A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 产品信息的配置方法、装置、电子设备及介质 |
CN111177511A (zh) * | 2019-12-24 | 2020-05-19 | 平安资产管理有限责任公司 | 利用爬虫获取并解析公告信息方法及装置 |
CN111859076A (zh) * | 2020-07-31 | 2020-10-30 | 平安健康保险股份有限公司 | 数据爬取方法、装置、计算机设备及计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040243484A1 (en) * | 2003-02-05 | 2004-12-02 | Smith Todd R. | System and method for facilitating customs compliance in the importation of merchandise |
US8417646B2 (en) * | 2010-03-02 | 2013-04-09 | Sap Ag | Methods, apparatus, systems and computer readable mediums for use in generating a customs export document |
US20130060658A1 (en) * | 2011-09-07 | 2013-03-07 | Beijing Ace of Trade Technology Co., Ltd. | Method and system for import and export trading |
-
2020
- 2020-11-24 CN CN202011331730.1A patent/CN112508361B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104737187A (zh) * | 2012-08-31 | 2015-06-24 | 邓白氏公司 | 将进口数据和/或出口数据与公司标识符关联的系统及过程 |
CN107563625A (zh) * | 2017-08-24 | 2018-01-09 | 江苏丹森资讯顾问有限公司 | 标准信息管理方法 |
CN107943954A (zh) * | 2017-11-24 | 2018-04-20 | 杭州安恒信息技术有限公司 | 网页敏感信息的检测方法、装置及电子设备 |
CN110362800A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 产品信息的配置方法、装置、电子设备及介质 |
CN111177511A (zh) * | 2019-12-24 | 2020-05-19 | 平安资产管理有限责任公司 | 利用爬虫获取并解析公告信息方法及装置 |
CN111859076A (zh) * | 2020-07-31 | 2020-10-30 | 平安健康保险股份有限公司 | 数据爬取方法、装置、计算机设备及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
Modeling and Verifying Combinatorial Interactions to Test Data Intensive Systems: Experience at the Norwegian Customs Directorate;Sagar Sen,等;《IEEE Transactions on Reliability》;20170331;第66卷(第1期);3-16 * |
空港检验检疫进口货物电子监管的解决方案研究;吴斌;中国优秀硕士学位论文全文数据库;20090815;第信息科技辑卷(第2009年第08期);I138-1282 * |
Also Published As
Publication number | Publication date |
---|---|
CN112508361A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239891B (zh) | 一种基于大数据的招投标审核方法 | |
US10296552B1 (en) | System and method for automated identification of internet advertising and creating rules for blocking of internet advertising | |
CN108496190B (zh) | 用于从电子数据结构中提取属性的注释系统 | |
CN112989990B (zh) | 医疗票据识别方法、装置、设备及存储介质 | |
CN110427375B (zh) | 字段类别的识别方法及装置 | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
CN113220875B (zh) | 基于行业标签的互联网信息分类方法、系统及电子设备 | |
CN111814793A (zh) | 药品图文信息违规检测方法及系统 | |
CN110134844A (zh) | 细分领域舆情监控方法、装置、计算机设备及存储介质 | |
CN112232075A (zh) | 基于时间格式和网页元素特征的文章发布时间识别方法 | |
CN115858751A (zh) | 表格问答数据的处理方法、装置及电子设备 | |
CN112508361B (zh) | 产品出口受阻信息处理方法、装置、电子设备及存储介质 | |
CN112765965A (zh) | 文本多标签分类方法、装置、设备和存储介质 | |
CN111506791A (zh) | 一种属地网站医药内容监测方法 | |
CN109144999B (zh) | 一种数据定位方法、装置及存储介质、程序产品 | |
CN115544620A (zh) | 图纸中门窗表解析方法、装置、设备及存储介质 | |
CN113642291A (zh) | 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端 | |
CN115063784A (zh) | 票据图像的信息提取方法和装置、存储介质及电子设备 | |
CN114943219A (zh) | 物料清单测试数据的生成方法、装置、设备及存储介质 | |
CN112131215B (zh) | 自底向上的数据库信息获取方法及装置 | |
CN112508362A (zh) | 产品出口信息处理方法、装置、电子设备及存储介质 | |
EP3220286A1 (en) | Data verification program, data verification method and data verification device | |
CN112256988A (zh) | 监测跨境购房网站的方法及装置、电子设备及存储介质 | |
CN106709675A (zh) | 物品流通量追踪方法及系统 | |
CN114283437A (zh) | 图例识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |