CN117035695A - 一种信息预警的方法、装置、可读存储介质以及电子设备 - Google Patents
一种信息预警的方法、装置、可读存储介质以及电子设备 Download PDFInfo
- Publication number
- CN117035695A CN117035695A CN202311293167.7A CN202311293167A CN117035695A CN 117035695 A CN117035695 A CN 117035695A CN 202311293167 A CN202311293167 A CN 202311293167A CN 117035695 A CN117035695 A CN 117035695A
- Authority
- CN
- China
- Prior art keywords
- information
- trade
- trade measure
- measure
- industry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000003860 storage Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 85
- 239000013598 vector Substances 0.000 claims description 35
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 230000000875 corresponding effect Effects 0.000 description 109
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000393496 Electra Species 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书公开了一种信息预警的方法、装置、可读存储介质以及电子设备,可以通过预设的文本处理模型,来将每个贸易措施文件信息对应的贸易措施关联信息与各行业的行业信息进行匹配,并建立以及保存企业、行业与各贸易措施关联信息之间的对应关系,从而使得当出台新的贸易措施文件信息时,可以通过预先建立并保存的该对应关系,快速的确定出与新出台的贸易措施文件信息相匹配的行业,并向归属于匹配出的行业的企业发送预警信息,从而有效地保证了企业免受不必要的损失。
Description
技术领域
本说明书涉及人工智能领域以及计算机技术领域,尤其涉及一种信息预警的方法、装置、可读存储介质以及电子设备。
背景技术
目前,企业出口工业产品和农产品需遵循世界贸易组织(World TradeOrganization,WTO)下技术性贸易壁垒协定(TechnicalBarriers to Trade,TBT)的多形式非关税壁垒措施(以下简称措施),若因产品不满足措施提出的生产、检验检测和资格评定等要求,会导致企业产品无法出口销售和被召回。而因为全球各国高频发布的贸易措施文件信息是多语种(多国语言)、多模态(图片、文字、表格)形式,导致解析工作量大,难度高。同时因为贸易措施文件信息引用的海量非结构化法规会导致人工评议这些措施合理性的效率非常低,所以大部分企业无法做到及时应对,从而带来经济损失。
所以,如何向企业、行业协会进行及时和精准的措施信息传达,则是亟待解决的问题。
发明内容
本说明书提供一种信息预警的方法、装置、可读存储介质以及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种信息预警的方法,包括:
获取各贸易措施文件信息,以及获取各企业的企业信息;
针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种;
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存;
当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
可选地,所述文本处理模型包括:第一文本处理模型和第二文本处理模型;
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,具体包括:
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到所述第一文本处理模型,以使所述第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息;
针对每个贸易措施关联信息,将该贸易措施关联信息与该贸易措施关联信息对应的候选行业信息进行文本拼接,得到拼接文本,并将所述拼接文本输入到所述第二文本处理模型中,以使所述第二文本处理模型确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据所述相关度,确定与该贸易措施关联信息相匹配的行业信息。
可选地,针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,具体包括:
当该贸易措施文件信息为图像数据时,将该贸易措施文件信息转换成文本数据,以提取出该贸易措施文件信息中所包含的文字信息;
将所述文字信息进行字符分割,得到文本分割结果;
根据所述文本分割结果,从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息。
可选地,所述方法还包括:
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,则将所述文字信息输入到预设的识别模型,以通过所述识别模型,确定出该贸易措施文件信息对应的贸易措施关联信息。
可选地,所述识别模型包括:HS识别模型和ICS识别模型;
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,则将所述文字信息输入到预设的识别模型,以通过所述识别模型,确定出该贸易措施文件信息对应的贸易措施关联信息,具体包括:
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,将所述文字信息输入到所述HS识别模型,以通过所述HS识别模型,确定出该贸易措施文件信息对应的HScode,以及将所述文字信息输入到所述ICS识别模型中,以通过所述ICS识别模型,确定出该贸易措施文件信息对应的ICScode。
可选地,针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,具体包括:
针对每个贸易措施文件信息,若确定该贸易措施文件信息不为标准语言下的贸易措施文件信息,则将该贸易措施文件信息转换为所述标准语言下的贸易措施文件信息;
将所述标准语言下的贸易措施文件信息输入到预设模型中,以通过所述预设模型,确定与所述标准语言下的贸易措施文件信息相匹配的贸易描述信息;
根据每个贸易描述信息与各贸易措施关联信息之间的对应关系,确定出该贸易措施文件信息对应的贸易措施关联信息。
本说明书提供了一种信息预警的装置,包括:
获取模块,用于获取各贸易措施文件信息,以及获取各企业的企业信息;
确定模块,用于针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种;
保存模块,用于将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存;
预警模块,用于当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
可选地,所述文本处理模型包括:第一文本处理模型和第二文本处理模型;
所述保存模块具体用于,将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到所述第一文本处理模型,以使所述第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息;针对每个贸易措施关联信息,将该贸易措施关联信息与该贸易措施关联信息对应的候选行业信息进行文本拼接,得到拼接文本,并将所述拼接文本输入到所述第二文本处理模型中,以使所述第二文本处理模型确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据所述相关度,确定与该贸易措施关联信息相匹配的行业信息。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息预警的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述信息预警的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
从上述方法中可以看出,由于本申请所提供的信息预警的方法,可以通过预设的文本处理模型,来将每个贸易措施文件信息对应的贸易措施关联信息与各行业的行业信息进行匹配,并建立以及保存企业、行业与各贸易措施关联信息之间的对应关系,从而使得当出台新的贸易措施文件信息时,可以通过预先建立并保存的该对应关系,快速的确定出与新出台的贸易措施文件信息相匹配的行业,并向归属于匹配出的行业的企业发送预警信息,从而有效地保证了企业免受不必要的损失。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种信息预警的方法的流程示意图;
图2为本说明书提供的一种信息预警的装置的示意图;
图3为本说明书中提供的一种对应于图1的电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种信息预警的方法的流程示意图,包括以下步骤:
S101:获取各贸易措施文件信息,以及获取各企业的企业信息。
本说明书提供的信息预警的方法的执行主体可以是诸如台式电脑、笔记本电脑等终端设备,也可以是服务器,为了便于说明,本说明书仅以服务器为执行主体,对所提供的信息预警的方法进行说明。
为了保护各企业在国际贸易中的财产,降低各企业在国际贸易中所面临的的风险,本说明书提供了一种信息预警的方法,主要通过对各种贸易措施文件以及各企业的企业信息进行分析,来建立企业、行业与各贸易措施关联信息之间的关系。这样一来,当出台新的贸易措施文件信息时,则可以确定新出台的贸易措施文件信息对应的贸易措施关联信息,并通过预先确定出的对应关系,来定位该新出台的贸易措施文件信息所针对的行业,进而将属于该行业的相关信息进行信息预警。
为此,服务器可以先获取各贸易措施文件信息以及获取各企业的企业信息,其中,服务器可以从贸易措施的相关网站上获取各贸易措施文件信息,以及从各企业或是行业协会的公开网站上获取各企业的企业信息。
需要说明的是,为了保证后续建立的各企业、各行业以及各贸易措施关联信息之间对应关系的实时性,可以实时监控各网站的信息发布情况,以进行及时的增强更新。
S102:针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种。
在实际应用中,需要综合贸易措施文件信息的共性特点,来建立后续使用的对应关系,所以,在本说明书中,服务器可以针对每个贸易措施文件信息,来确定该贸易措施文件信息对应的贸易措施关联信息。
贸易措施关联信息可以用于反映贸易措施文件信息所要针对的产品信息或是国际标准信息等,所以,在本说明书中,贸易措施关联信息实际上可以包括商品名称及编码协调制度(Harmonization System Code,HScode)以及国际标准分类(InternationalClassification for Standards,ICScode)。
其中,HScode用于反映对各种不同产品出入境应征/应退关税税率进行量化管理的制度。各国海关、商品出入境管理机构确认商品类别、进行商品分类管理、审核关税标准、检验商品品质指标的基本要素就是进出口商品通用的身份证明——HS code。
而对于ICScode来说,其是由国际标准化组织(ISO)制定的一种用于对国际标准、地区标准和国家标准等进行统一分类的编码体系,ICScode可以帮助用户在标准目录和其他规范文件中快速查找所需的内容。
由于上述提到的HScode和ICScode能够有效的反映贸易措施文件信息所要针对的产品信息或是国际标准信息等,所以,可以将其作为贸易措施关联信息,与后续提到的各企业、各行业建立对应关系。
为此,在本说明书中,服务器可以针对每个贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息。其中,若是获取到的该贸易措施文件信息是文本形式的信息,那么,可以直接从该贸易措施文件信息中提取出贸易措施关联信息。
而若是该贸易措施文件信息为图像信息,则服务器可以先将图像形式的贸易措施文件信息转化为可供文字识别的文本信息,然后再从文本信息中提取出贸易措施关联信息。
所以,当该贸易措施文件信息为图像数据时,服务器可以通过诸如光学字符识别(Optical Character Recognition,OCR),从该贸易措施文件信息中提取出文字信息,然后可以将该文字信息进行字符分割,以得到文本分割结果,进而根据文本分割结果,从该文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息。
其中,服务器可以利用字符分割技术,来从文字信息中获取到关键字段,如贸易措施编码、贸易措施名称、贸易措施出台日期等信息,如果获取到的关键字段中已经包含有上述贸易措施关联信息,则可以从中将其提取。
当然,在实际应用中,也可以会存在贸易措施文件信息中本身并不包含有贸易措施关联信息的情况,那么,可以根据贸易措施文件信息中所描述的内容,来推测出该贸易措施文件信息所对应的贸易措施关联信息。
所以,在本说明书中,服务器若是无法从上述文字信息中直接提取出贸易措施关联信息,则可以将该文字信息输入到预先训练的识别模型中,以通过该识别模型,来确定出该贸易措施文件信息对应的贸易措施关联信息。
需要说明的是,由于贸易措施关联信息涉及两种不同的标准的信息,即HScode和ICScode,所以,在本说明书中,服务器可以使用不同的识别模型,来确定贸易措施文件信息对应的HScode和ICScode。
具体的,上述识别模型可以包括HS识别模型和ICS识别模型,而基于此,服务器实际上未能从上述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,那么则可以将该文字信息输入到预先训练的HS识别模型中,该HS识别模型可以对该文字信息进行识别,以根据该文字信息中所描述的内容,输出预测出的该贸易措施文件信息所对应的HScode。
而对于ICS识别模型来说,服务器可以将该文字信息输入到预先训练的ICS识别模型中,ICS识别模型可以对该文字信息进行识别,以根据该文字信息中所描述的内容,输出预测出的该贸易措施文件信息所对应的ICScode。
在本说明书中,HS识别模型和ICS识别模型的具体形式可以有多种,例如,HS识别模型和ICS识别模型可以基于all-MiniLM-L6-v2模型构建分类模型,所以,HS识别模型和ICS识别模型可以对输入的文字信息进行编码,并通过编码后得到的向量来进行向量相似度搜索,以确定出贸易措施文件信息对应的HS code和ICS code。
而对于HS识别模型和ICS识别模型的训练方式来说,可以采用有监督的训练方式对其进行训练。以HS识别模型为例,服务器可以预先获取到第一样本文本,该第一样本文本用于描述一种产品,可以将该第一样本文本输入到HS识别模型中,该HS识别模型会根据该第一样本文本中描述的内容,来推理该第一样本文本中涉及的产品所对应的HS code,而后,服务器可以以HS识别模型输出的错误HS code描述与该第一样本文本之间的偏差为优化目标,对HS识别模型进行训练。
而对于ICS识别模型的训练过程来说,与上述HS识别模型的训练过程基本相同,即服务器可以预先获取到第二样本文本,该第二样本文本用于描述一种产品,可以将该第二样本文本输入到ICS识别模型中,该ICS识别模型会根据该第二样本文本中描述的内容,来预测该第二样本文本中涉及的产品所对应的ICS code,而后,服务器可以以ICS识别模型输出的错误ICS code描述与该第二样本文本之间的偏差为优化目标,对ICS识别模型进行训练。
从上述方法可以看出,本申请不仅仅适用于从文本信息中确定出贸易措施关联信息,也可以从图像形式的贸易措施文件信息中,确定出贸易措施关联信息,从而实现了从多模态形式的信息中获取贸易措施关联信息。并且,即使在贸易措施文件信息本身并没有记录贸易措施关联信息的情况下,也可以通过预先训练的识别模型(即HS识别模型和ICS识别模型),基于贸易措施文件信息中所描述的内容,来确定出贸易措施文件信息对应的贸易措施关联信息(即HScode和ICScode),从而保证了对各种贸易措施文件信息的有效支撑。
而对于获取到的各企业的企业信息来说,服务器需要基于这些企业信息,确定出各企业所属行业的行业信息。
所以,在本说明书中,服务器可以对获取到的企业信息进行数据清洗,以去除存在错误或是无效的部分信息。与此同时,由于在实际应用中,不同企业的企业信息可能不采用不同的数据结构形式来记录,所以,服务器可以将数据清洗后得到的各企业信息进行结构化处理,得到结构化形式的企业信息,进而通过对结构化形式的企业信息进行文本分析,以确定出每个企业所属行业的行业信息。
S103:将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存。
在确定出每个贸易措施文件信息对应的贸易措施关联信息后,服务器可以针对每个贸易措施文件信息,将该贸易措施文件信息对应的贸易措施关联信息以及确定出的各企业所属行业的行业信息输入到预设的文本处理模型。该文本处理模型可以将该贸易措施文件信息对应的贸易措施关联信息与各行业信息进行匹配,以确定出每种行业的行业信息与各贸易措施关联信息之间的匹配关系。
可以看出,该匹配关系实际上用于描述一种行业与哪种HScode或是ICScode相关联。而在此基础上,服务器可以基于上述匹配关系以及各企业与各行业之间的归属关系,构建出各企业、各行业与各贸易措施关联信息之间的对应关系,并保存。
在本说明书中,文本处理模型可以包括:第一文本处理模型和第二文本处理模型。这两个文本处理模型可以实现分阶段的进行贸易措施关联信息与各行业信息之间的匹配。
具体的,服务器将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息可以先输入到第一文本处理模型,以使第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息。
也就是说,第一文本处理模型实际上对应的是粗召回阶段,即,先将与该贸易措施关联信息在特征向量上较为匹配的前N个ICS code或HS code进行召回,其中,确定上述向量相似度的方式可以有多种,如计算特征向量之间的欧式距离,余弦距离等,本说明书对此不进行限定。而后,将召回的行业信息,作为该贸易措施关联信息对应的候选行业信息。而第一文本处理模型的基础预训练模型也可以有多种,如BERT和ELECTRA等文本编码模型。
而在得到该贸易措施关联信息对应的候选行业信息,服务器则可以将该贸易措施关联信息与候选行业信息进行文本拼接,得到拼接文本,并将拼接文本输入到第二文本处理模型中。第二文本处理模型则将确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据该相关度,来确定与该贸易措施关联信息相匹配的行业信息。
所以,使用第二文本处理模型的过程可以理解为精召回阶段,即从粗召回阶段中召回的前N个行业信息(即上述的候选行业信息)中,进一步地筛选出与该贸易措施关联信息高度相关的行业信息,作为该贸易措施关联信息所匹配的行业信息。而这里提到的第二文本处理模型也可以有多种形式,如LLaMA、ChatGLM等。
在第二文本处理模型执行信息匹配的过程中,实际上可以将其视作将贸易措施关联信息与候选行业信息拼接为长文本问题输入到第二文本处理模型中,以确定出与该贸易措施关联信息相匹配的行业信息。
例如,以贸易措施关联信息为Hscode举例,将HScode与候选行业信息进行拼接后输入到第二文本处理模型后,第二文本处理模型实际上可以得到:已知行业信息描述:{IND_RECALLED}这种问题描述,进而基于这种问题描述,输出与商品编码描述:{HS_CODE}相关的行业描述。具体的输出内容可以数字索引的形式体现,如,通过事先存储的数字索引和行业信息之间的关系表,可以查询出第二文本处理模型所输出的数字索引所对应的行业信息,进而与该HScode相匹配的行业信息。
对于确定ICScode所匹配的行业信息的过程来说,与上述过程类似,在此就不再进行详细赘述了。
需要说明的是,在实际应用中,不同地区的贸易措施文件信息可能采用不同的语言来描述,而为了便于信息的统一管理以及便于在后续过程中实现快速的信息预警,在本说明书中,需要将贸易措施文件信息转换成所规定的标准语言(如英语)来进行处理。
所以,服务器针对每个贸易措施文件信息,若确定该贸易措施文件信息不为标准语言下的贸易措施文件信息,则可以将该贸易措施文件信息转换为标准语言下的贸易措施文件信息。而针对任意一个贸易措施文件信息来说,可以将标准语言下的该贸易措施文件信息输入到预设模型中,该预设模型可以确定出与标准语言下的该贸易措施文件信息相匹配的贸易描述信息,进而根据每个贸易描述信息与各贸易措施关联信息之间的对应关系,可以确定出贸易措施文件信息对应的贸易措施关联信息,其中,这里提到的贸易描述信息可以包括:商品名称及编码协调制度产品描述(Harmonization System description,HSDESC)或是国际标准分类产品描述(International Classification for Standardsdescription,ICSDESC),其中,HSDESC为HScode对应的贸易描述信息,ICSDESC为ICScode对应的贸易描述信息,所谓的贸易描述信息即是用于描述贸易相关产品的信息。
例如,假设标准语言为英文时,对于非英文的贸易措施文件信息来说,可以先将该贸易措施文件信息翻译成英文,然后将翻译后的贸易措施文件信息输入到预设模型,该预设模型将会输出与该翻译后的贸易措施文件信息相匹配的HSDESC,而后,通过各HSDESC与各HScode之间的对应关系,可以确定出翻译后的贸易措施文件信息所对应的贸易措施关联信息HScode。
而在非标准语言的贸易措施文件信息下,确定与之对应的ICScode与上述过程基本相同,在此就不详细赘述了。
另外,还需指出的是,在确定上述企业信息的过程中,实际上也可以将其转换成标准语言下的企业信息,然后再与贸易措施关联信息一同输入到文本处理模型中。
还需说明的是,在上述内容中介绍了以第一文本处理模型进行粗召回,以及使用第二文本处理模型进行精召回的方式,来确定贸易措施关联信息所匹配的行业信息,而在本说明书中,也可以通过其他的模型来实现上述功能。例如,服务器可以使用一个文本搜索引擎进行粗召回,再应用大模型等进行精召回。
通过这种文件处理模型,同样能够实现贸易措施关联信息与行业信息的匹配。也可以是使用一个端到端的大文本模型,即,该文本处理模型不再先进行粗召回,而是利用提示工程对贸易措施关联信息与行业信息处理后,直接进行推理,以确定出贸易措施关联信息所匹配的行业信息。
S104:当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
由于已经构建并保存了上述对应关系,那么实际上已经确定出了各企业与各行业的归属关系,以及各行业所关联的贸易措施关联信息(即HScode和ICScode),那么,当获取到目标贸易措施文件信息时,则可以通过上述所描述的方式,先确定出目标贸易措施文件信息对应的贸易措施关联信息,进而根据构建并保存的上述对应关系,确定出当前的目标贸易措施文件信息到底是针对哪一行业的,进而根据该对应关系中所涉及的各企业与各行业之间的归属关系,确定出与这一行业相关联的企业,作为目标企业,并向目标企业发送预警信息,以提示目标企业提前做好保护措施。其中,这里提到的目标贸易措施文件信息即可理解为新出台的贸易措施文件信息。
进一步地,在本说明书中,服务器也可以在后续过程中,根据各企业的反馈信息,来对模型进行优化,以使得模型能够对贸易措施文件信息的风险等级进行判断,进而可以根据确定出的风险等级,来确定当何种风险等级的贸易措施文件信息出台时,才需要对相关企业进行信息预警。
即,企业可以在接收到服务器发送的预警信息后,根据自身的实际情况,向服务器返回该目标贸易措施文件信息对企业自身是否会造成影响的反馈信息,服务器可以基于反馈信息以及该目标贸易措施文件信息,构建用于训练评判贸易措施文件信息的风险等级的评估模型,并对该评估模型进行训练。
以上为本说明书的一个或多个实施的方法,基于同样的思路,本说明书还提供了相应的信息预警的装置,如图2所示。
图2为本说明书提供的一种信息预警的装置的示意图,包括:
获取模块201,用于获取各贸易措施文件信息,以及获取各企业的企业信息;
确定模块202,用于针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种;
保存模块203,用于将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存;
预警模块204,用于当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
可选地,所述文本处理模型包括:第一文本处理模型和第二文本处理模型;
所述保存模块203具体用于,将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到所述第一文本处理模型,以使所述第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息;针对每个贸易措施关联信息,将该贸易措施关联信息与该贸易措施关联信息对应的候选行业信息进行文本拼接,得到拼接文本,并将所述拼接文本输入到所述第二文本处理模型中,以使所述第二文本处理模型确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据所述相关度,确定与该贸易措施关联信息相匹配的行业信息。
可选地,所述确定模块202具体用于,当该贸易措施文件信息为图像数据时,将该贸易措施文件信息转换成文本数据,以提取出该贸易措施文件信息中所包含的文字信息;将所述文字信息进行字符分割,得到文本分割结果;根据所述文本分割结果,从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息。
可选地,所述确定模块202还用于,若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,则将所述文字信息输入到预设的识别模型,以通过所述识别模型,确定出该贸易措施文件信息对应的贸易措施关联信息。
可选地,所述识别模型包括:HS识别模型和ICS识别模型;
所述确定模块202具体用于,若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,将所述文字信息输入到所述HS识别模型,以通过所述HS识别模型,确定出该贸易措施文件信息对应的HScode,以及将所述文字信息输入到所述ICS识别模型中,以通过所述ICS识别模型,确定出该贸易措施文件信息对应的ICScode。
可选地,所述确定模块202具体用于,针对每个贸易措施文件信息,若确定该贸易措施文件信息不为标准语言下的贸易措施文件信息,则将该贸易措施文件信息转换为所述标准语言下的贸易措施文件信息;将所述标准语言下的贸易措施文件信息输入到预设模型中,以通过所述预设模型,确定与所述标准语言下的贸易措施文件信息相匹配的贸易描述信息;根据每个贸易描述信息与各贸易措施关联信息之间的对应关系,确定出该贸易措施文件信息对应的贸易措施关联信息。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种信息预警的方法。
本说明书还提供了图3所示的一种对应于图1的电子设备的示意结构图。如图3所示,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述信息预警的方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种信息预警的方法,其特征在于,包括:
获取各贸易措施文件信息,以及获取各企业的企业信息;
针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种;
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存;
当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
2.如权利要求1所述的方法,其特征在于,所述文本处理模型包括:第一文本处理模型和第二文本处理模型;
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,具体包括:
将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到所述第一文本处理模型,以使所述第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息;
针对每个贸易措施关联信息,将该贸易措施关联信息与该贸易措施关联信息对应的候选行业信息进行文本拼接,得到拼接文本,并将所述拼接文本输入到所述第二文本处理模型中,以使所述第二文本处理模型确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据所述相关度,确定与该贸易措施关联信息相匹配的行业信息。
3.如权利要求1所述的方法,其特征在于,针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,具体包括:
当该贸易措施文件信息为图像数据时,将该贸易措施文件信息转换成文本数据,以提取出该贸易措施文件信息中所包含的文字信息;
将所述文字信息进行字符分割,得到文本分割结果;
根据所述文本分割结果,从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,则将所述文字信息输入到预设的识别模型,以通过所述识别模型,确定出该贸易措施文件信息对应的贸易措施关联信息。
5.如权利要求4所述的方法,其特征在于,所述识别模型包括:HS识别模型和ICS识别模型;
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,则将所述文字信息输入到预设的识别模型,以通过所述识别模型,确定出该贸易措施文件信息对应的贸易措施关联信息,具体包括:
若根据所述文本分割结果未从所述文字信息中提取出该贸易措施文件信息对应的贸易措施关联信息,将所述文字信息输入到所述HS识别模型,以通过所述HS识别模型,确定出该贸易措施文件信息对应的HScode,以及将所述文字信息输入到所述ICS识别模型中,以通过所述ICS识别模型,确定出该贸易措施文件信息对应的ICScode。
6.如权利要求1所述的方法,其特征在于,针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,具体包括:
针对每个贸易措施文件信息,若确定该贸易措施文件信息不为标准语言下的贸易措施文件信息,则将该贸易措施文件信息转换为所述标准语言下的贸易措施文件信息;
将所述标准语言下的贸易措施文件信息输入到预设模型中,以通过所述预设模型,确定与所述标准语言下的贸易措施文件信息相匹配的贸易描述信息;
根据每个贸易描述信息与各贸易措施关联信息之间的对应关系,确定出该贸易措施文件信息对应的贸易措施关联信息。
7.一种信息预警的装置,其特征在于,包括:
获取模块,用于获取各贸易措施文件信息,以及获取各企业的企业信息;
确定模块,用于针对每个贸易措施文件信息,根据该贸易措施文件信息,确定该贸易措施文件信息对应的贸易措施关联信息,以及针对每个企业,根据该企业的企业信息,确定所述企业所属行业的行业信息,所述贸易措施关联信息包括:商品名称及编码协调制度HScode以及国际标准分类ICScode中的至少一种;
保存模块,用于将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到预设的文本处理模型,以通过所述文本处理模型,确定出每种行业所匹配的贸易措施关联信息,并基于每种行业的行业信息与各贸易措施关联信息之间的匹配关系以及各企业与各行业的归属关系,构建各企业、各行业以及各贸易措施关联信息之间的对应关系,并保存;
预警模块,用于当获取到目标贸易措施文件信息时,确定所述目标贸易措施文件信息对应的贸易措施关联信息,并根据所述对应关系,确定出所述目标贸易措施文件信息所针对的目标企业,并向所述目标企业发送预警信息。
8.如权利要求7所述的装置,其特征在于,所述文本处理模型包括:第一文本处理模型和第二文本处理模型;
所述保存模块具体用于,将每个贸易措施文件信息对应的贸易措施关联信息和确定出的各企业所属行业的行业信息输入到所述第一文本处理模型,以使所述第一文本处理模型确定每个贸易措施关联信息对应的特征向量以及每个行业信息对应的特征向量,并针对每个贸易措施关联信息,按照该贸易措施关联信息对应的特征向量与每个行业信息对应特征向量之间的向量相似度从大到小的顺序,将各行业信息进行排序,并将排在设定排位前的行业信息作为该贸易措施关联信息对应的候选行业信息;针对每个贸易措施关联信息,将该贸易措施关联信息与该贸易措施关联信息对应的候选行业信息进行文本拼接,得到拼接文本,并将所述拼接文本输入到所述第二文本处理模型中,以使所述第二文本处理模型确定每个候选行业信息与该贸易措施关联信息之间的相关度,并根据所述相关度,确定与该贸易措施关联信息相匹配的行业信息。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311293167.7A CN117035695B (zh) | 2023-10-08 | 2023-10-08 | 一种信息预警的方法、装置、可读存储介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311293167.7A CN117035695B (zh) | 2023-10-08 | 2023-10-08 | 一种信息预警的方法、装置、可读存储介质以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117035695A true CN117035695A (zh) | 2023-11-10 |
CN117035695B CN117035695B (zh) | 2024-03-05 |
Family
ID=88632243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311293167.7A Active CN117035695B (zh) | 2023-10-08 | 2023-10-08 | 一种信息预警的方法、装置、可读存储介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035695B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001095224A1 (en) * | 2000-06-09 | 2001-12-13 | I B Net, Ltd. | Interactive business matching and promotion |
CN108108755A (zh) * | 2017-12-18 | 2018-06-01 | 广东广业开元科技有限公司 | 一种基于大数据分类算法的贸易摩擦预警模型 |
CN109359901A (zh) * | 2018-12-13 | 2019-02-19 | 泰康保险集团股份有限公司 | 基于区块链的企业风险确定方法及装置、介质和电子设备 |
CN111488458A (zh) * | 2020-04-13 | 2020-08-04 | 上海朗曦信息技术有限公司 | 国际贸易商品代码的自动识别处理方法及系统 |
CN114021001A (zh) * | 2021-10-28 | 2022-02-08 | 天元大数据信用管理有限公司 | 一种基于大数据的企业措施匹配方法、设备及介质 |
CN114428861A (zh) * | 2022-01-27 | 2022-05-03 | 陕西煤业股份有限公司 | 一种企业政策智能解读方法、系统、设备及存储介质 |
CN114625834A (zh) * | 2022-03-04 | 2022-06-14 | 北京百度网讯科技有限公司 | 企业的行业信息确定方法、装置及电子设备 |
CN114969498A (zh) * | 2021-02-24 | 2022-08-30 | 京东科技控股股份有限公司 | 一种行业龙头信息的推荐方法及装置 |
CN116127155A (zh) * | 2022-12-29 | 2023-05-16 | 武汉大数据产业发展有限公司 | 一种措施推送方法、系统、电子设备及存储介质 |
CN116681561A (zh) * | 2023-04-24 | 2023-09-01 | 上海亿通国际股份有限公司 | 一种政策匹配方法、装置、电子设备及存储介质 |
CN116775851A (zh) * | 2023-06-25 | 2023-09-19 | 数字重庆政务科技有限公司 | 一种政策精准推荐方法、系统及介质 |
-
2023
- 2023-10-08 CN CN202311293167.7A patent/CN117035695B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001095224A1 (en) * | 2000-06-09 | 2001-12-13 | I B Net, Ltd. | Interactive business matching and promotion |
CN108108755A (zh) * | 2017-12-18 | 2018-06-01 | 广东广业开元科技有限公司 | 一种基于大数据分类算法的贸易摩擦预警模型 |
CN109359901A (zh) * | 2018-12-13 | 2019-02-19 | 泰康保险集团股份有限公司 | 基于区块链的企业风险确定方法及装置、介质和电子设备 |
CN111488458A (zh) * | 2020-04-13 | 2020-08-04 | 上海朗曦信息技术有限公司 | 国际贸易商品代码的自动识别处理方法及系统 |
CN114969498A (zh) * | 2021-02-24 | 2022-08-30 | 京东科技控股股份有限公司 | 一种行业龙头信息的推荐方法及装置 |
CN114021001A (zh) * | 2021-10-28 | 2022-02-08 | 天元大数据信用管理有限公司 | 一种基于大数据的企业措施匹配方法、设备及介质 |
CN114428861A (zh) * | 2022-01-27 | 2022-05-03 | 陕西煤业股份有限公司 | 一种企业政策智能解读方法、系统、设备及存储介质 |
CN114625834A (zh) * | 2022-03-04 | 2022-06-14 | 北京百度网讯科技有限公司 | 企业的行业信息确定方法、装置及电子设备 |
CN116127155A (zh) * | 2022-12-29 | 2023-05-16 | 武汉大数据产业发展有限公司 | 一种措施推送方法、系统、电子设备及存储介质 |
CN116681561A (zh) * | 2023-04-24 | 2023-09-01 | 上海亿通国际股份有限公司 | 一种政策匹配方法、装置、电子设备及存储介质 |
CN116775851A (zh) * | 2023-06-25 | 2023-09-19 | 数字重庆政务科技有限公司 | 一种政策精准推荐方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117035695B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984779B (zh) | 一种对话文本分析方法、装置、设备和可读介质 | |
CN113221555B (zh) | 一种基于多任务模型的关键词识别方法、装置及设备 | |
CN110008991B (zh) | 风险事件的识别、风险识别模型的生成方法、装置、设备及介质 | |
CN111538794A (zh) | 一种数据融合方法、装置及设备 | |
CN112417093B (zh) | 一种模型训练的方法及装置 | |
CN117076650B (zh) | 一种基于大语言模型的智能对话方法、装置、介质及设备 | |
CN112966113A (zh) | 一种数据的风险防控方法、装置及设备 | |
CN114817538A (zh) | 文本分类模型的训练方法、文本分类方法及相关设备 | |
CN113887206B (zh) | 一种模型训练及关键词提取方法及装置 | |
CN113379528A (zh) | 风控模型建立方法、装置和风险控制方法 | |
CN117035695B (zh) | 一种信息预警的方法、装置、可读存储介质以及电子设备 | |
CN116822606A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN116757183A (zh) | 项目信息处理方法及装置 | |
CN111143203B (zh) | 机器学习、隐私代码确定方法、装置及电子设备 | |
CN110245136B (zh) | 数据检索方法及装置、设备及存储设备 | |
CN115374190B (zh) | 一种类案检索的方法、装置、存储介质及电子设备 | |
CN116225770B (zh) | 补丁匹配方法、装置、设备及存储介质 | |
CN111461352B (zh) | 模型训练、业务节点识别方法、装置及电子设备 | |
CN113268613B (zh) | 一种用于获取侵权线索的方法、设备、介质及程序产品 | |
CN108804603B (zh) | 人机书面对话方法及系统、服务器、介质 | |
CN110728150B (zh) | 一种命名实体筛取方法、装置、设备和可读介质 | |
CN115018579A (zh) | 一种推荐语生成方法、装置、存储介质及电子设备 | |
CN114519631A (zh) | 基于产品匹配的融资数据处理方法及装置 | |
CN117933424A (zh) | 一种模型训练方法、业务风控方法、装置以及存储介质 | |
CN116739801A (zh) | 投保监测方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |