CN114996453A - 一种推荐进出口商品商品编码的方法、装置、电子设备 - Google Patents
一种推荐进出口商品商品编码的方法、装置、电子设备 Download PDFInfo
- Publication number
- CN114996453A CN114996453A CN202210631885.XA CN202210631885A CN114996453A CN 114996453 A CN114996453 A CN 114996453A CN 202210631885 A CN202210631885 A CN 202210631885A CN 114996453 A CN114996453 A CN 114996453A
- Authority
- CN
- China
- Prior art keywords
- classified
- information
- commodity
- commodities
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0831—Overseas transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种推荐进出口商品商品编码的方法、装置、电子设备,涉及商品归类技术领域,包括获取用户的待归类商品信息;将待归类商品信息输入历史申报数据模型,得到若干个待归类商品信息的第一推荐编码;将待归类商品信息输入专业申报数据模型,得到若干个待归类商品信息的第二推荐编码;基于分数加权规则确定若干个目标推荐编码的编码推荐分数;当存在编码推荐分数超过阈值时,将所有编码推荐分数超过阈值的目标推荐编码进行正序排列;向用户推荐正序排列的推荐分数的前N(N≥1)名的目标推荐编码。本申请降低了申报进出口商品商品编码的门槛,提升了申报进出口商品商品编码的准确度,从而也减轻了企业的负担。
Description
技术领域
本发明涉及商品归类技术领域,尤其涉及一种推荐进出口商品商品编码的方法、装置、电子设备。
背景技术
商品编码(又称HS编码),我国目前使用的商品编码,一共10位,其中前面8位称为主码,后两位称为附加码。商品编码是国际贸易中一种通用的经济语言,是进出口商品通用的身份证明。目前,我国商品编码共22类,98章,合计1万3千多条目。在报关业务中,申报的商品编码、品名必须与运单、发票、装箱单及其它相关证明文件所显示的品名相符,同时与实际进出口货物保持一致。若商品编码不符,会直接导致海关征税的不同,造成法检商品的逃检、漏检,影响口岸通关速度,降低企业的报关效率及信用,情节严重的还将会承担行政或刑事上的法律责任。而商品归类的目的就是为进出口商品查找出其对应的商品编码,从而准确地确定税率、申报要素、进出口管制措施、适用原产地规则和出口退税率等。
目前,海关商品编码归类有两种途径,一种是根据商品关键字基于海关历史用户申报的商品名称进行简单的模糊匹配,返回海关历史用户申报的数据,商品编码存在重复或找不到的情况,对于返回的多个商品编码也没有优先级;另一种是根据海关商品编码前几位,返回所有包含该海关编码的海关历史用户申报的数据,同样也商品编码存在重复或找不到的情况。这两种方法由于基础数据不全、更新不及时等原因,准确性都比较低。
因此,提出一种推荐进出口商品商品编码的方法、装置、电子设备。
发明内容
本说明书提供一种推荐进出口商品商品编码的方法、装置、电子设备,降低了申报进出口商品商品编码的门槛,提升了申报进出口商品商品编码的准确度,从而也减轻了企业的负担。
本申请提供的一种推荐进出口商品商品编码的方法采用如下的技术方案,包括:
获取用户的待归类商品信息;
将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断是否存在所述编码推荐分数超过阈值;
当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码
可选的,所述将所述待归类商品信息输入历史申报数据模型,得到所述待归类商品信息的第一推荐编码,包括:
将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
可选的,所述将所述待归类商品信息输入专业申报数据模型,得到所述待归类商品信息的第二推荐编码,包括:
将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组;
判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组;
当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
可选的,所述构建的进出口商品图谱,包括:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
可选的,所述方法还包括:
当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收所述用户端的自查结果;
当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
接收所述用户端修改后的待归类商品信息;
返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
可选的,所述方法还包括:
存储所述用户的待归类商品信息和商品归类信息;
按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
本申请提供的一种推荐进出口商品商品编码的装置采用如下的技术方案,包括:
获取模块,用以获取用户的待归类商品信息;
第一输入模块,用以将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
第二输入模块,用以将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
确定分数模块,用以基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断模块,用以判断是否存在所述编码推荐分数超过阈值;
排列模块,用以当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
推荐模块,用以向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
可选的,所述第一输入模块,包括:
第一输入单元,用以将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
第二输入单元,用以将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
预测单元,用以将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
可选的,所述第二输入模块,包括:
第三输入单元,用以将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组;
判断单元,用以判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组;
确定编码单元,用以当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
可选的,所述构建的进出口商品图谱,包括:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
可选的,所述装置还包括:
推送窗口模块,用以当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收模块,用以接收所述用户端的自查结果;
确认模块,用以当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
否认模块,用以当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
修订模块,用以接收所述用户端修改后的待归类商品信息;
返回模块,用以返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
可选的,所述装置还包括:
存储模块,用以存储所述用户的待归类商品信息和商品归类信息;
更新模块,用以按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
本说明书还提供一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一项方法。
本说明书还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现上述任一项方法。
本申请为了解决现有技术进出口商品编码归类效率以及差错率偏高的问题,采用了获取用户的待归类商品信息;将待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;将待归类商品信息输入专业申报数据模型,得到若干个待归类商品信息的第二推荐编码;基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;判断是否存在编码推荐分数超过阈值;当存在编码推荐分数超过阈值时,将所有编码推荐分数超过阈值的目标推荐编码进行正序排列;向用户推荐正序排列的推荐分数的前N(N≥1)名的目标推荐编码。从而,降低了申报进出口商品商品编码的门槛,提升了申报进出口商品商品编码的准确度,从而也减轻了企业的负担。
附图说明
图1为本发明实施例涉及的一种推荐进出口商品商品编码的系统结构示意图;
图2为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例的流程示意图;
图3是本发明实施例提供的历史申报数据模型的示意图;
图4为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例步骤S120的一个细化流程示意图;
图5为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例步骤S130的一个细化流程示意图;
图6是本发明实施例提供的构建的进出口商品图谱的示意图;
图7为本发明实施例提供的一种推荐进出口商品商品编码的装置的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请为了解决现有技术进出口商品编码归类效率以及差错率偏高的问题,采用了获取用户的待归类商品信息;将待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;将待归类商品信息输入专业申报数据模型,得到若干个待归类商品信息的第二推荐编码;基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;判断是否存在编码推荐分数超过阈值;当存在编码推荐分数超过阈值时,将所有编码推荐分数超过阈值的目标推荐编码进行正序排列;向用户推荐正序排列的推荐分数的前N(N≥1)名的目标推荐编码。从而,降低了申报进出口商品商品编码的门槛,提升了申报进出口商品商品编码的准确度,从而也减轻了企业的负担。
为了更好地理解上述技术方案,下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本领域技术人员可以理解,图1所示的一种推荐进出口商品商品编码的系统结构并不构成对一种推荐进出口商品商品编码的系统的限定,一种推荐进出口商品商品编码的系统可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
作为一种实现方式,可以如图1所示,图1为本发明实施例涉及的一种推荐进出口商品商品编码的系统结构示意图。
处理器1100可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1100中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1100可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1200,处理器1100读取存储器1200中的信息,结合其硬件完成上述方法的步骤。
可以理解,本发明实施例中的存储器1200可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本发明实施例描述的系统和方法的存储器1200旨在包括但不限于这些和任意其它适合类型的存储器。
在本申请实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
获取用户的待归类商品信息;
将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断是否存在所述编码推荐分数超过阈值;
当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
在一实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
在一实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组;
判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组;
当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
在一实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
在一实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收所述用户端的自查结果;
当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
接收所述用户端修改后的待归类商品信息;
返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
在一实施例中,处理器1100可以用于调用存储在存储器1200中的推荐进出口商品商品编码程序,并执行以下操作:
存储所述用户的待归类商品信息和商品归类信息;
按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
由于本申请实施例提供的推荐进出口商品商品编码装置,为实施本申请实施例的方法所采用的推荐进出口商品商品编码装置,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该智能归类装置的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的推荐进出口商品商品编码装置都属于本申请所欲保护的范围。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
对于软件实现,可通过执行本发明实施例所述功能的模块(例如过程、函数等)来实现本发明实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
基于上述结构,提出本发明的实施例。
参照图2,图2为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例的流程示意图包括以下步骤:
步骤S110,获取用户的待归类商品信息。
在本实施例中,待归类商品信息包含有该待归类商品的相关信息,相关信息包括产品名称、明细以及生产、交易公司名字等,如以智能手机为例子,数据信息可以是:“智能手机、6.1英寸、IOS系统、128GB、带充电器、320.00g/台”。获取方式可以是使用外部键盘输入,也可以是使用触摸屏输入,还可以是使用语音等方式提供。
步骤S120,将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码。
在本实施例中,根据用户提供的待归类商品信息在历史申报数据模型中查找与待归类商品信息相匹配的企业申报历史数据,从而确定待归类商品信息的第一推荐编码。在本实施例中,还可以在输出第一推荐编码之前,基于分数规则确定若干个第一推荐码的分值,判断是否存在第一推荐码的分值是否超过第一阈值,当存在第一推荐码的分值超过第一阈值时,输出第一推荐码的分值超过第一阈值的第一推荐码。在本实施例中,第一阈值可以是根据经验设定的值,也可以是统计分析得到的值。在本实施例中,参照图3,图3是本发明实施例提供的历史申报数据模型的示意图,历史申报数据模型利用企业申报历史数据训练,得到企业申报历史数据与其相对应的商品编码。企业申报历史数据是从报关信息网或其他相关网站定时获取,用于参与训练的。
参照图4,图4为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例步骤S120的一个细化流程示意图包括以下步骤:
步骤S121,将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量。
在本实施例中,预训练语言表征子模型包括BERT(Bidirectional EncoderRepresentation from Transformers),是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练,而是采用新的掩码语言(MLM,Masked Language Model),以致能生成深度的双向语言表征。通过BERT的Embedding将待归类商品信息转换为关键词向量。Embedding是一个将离散变量转为连续向量表示的一个方式。
步骤S122,将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征。
在本实施例中,抽取文本特征子模型包括TextCNN,TextCNN在文本分类问题上有着更加卓越的表现。从直观上理解,TextCNN通过一维卷积来获取句子中n-gram的特征表示。TextCNN对文本浅层特征的抽取能力很强,在短文本领域如搜索、对话领域专注于意图分类时效果很好,应用广泛,且速度快,一般是首选;对长文本领域,TextCNN主要靠filter窗口抽取特征,在长距离建模方面能力受限,且对语序不敏感。通过TextCNN将关键词向量转换为关键词向量的表达特征。
步骤S123,将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
在本实施例中,分类预测子模型包括Softmax,Softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类。通过Softmax确定表达特征对应的分类,基于其对应的分类确定其对应的第一推荐编码。
步骤S130,将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码。
在本实施例中,根据用户提供的待归类商品信息在专业申报数据模型中查找余待归类商品信息相匹配的海关局制定的海关商品编码及其对应的商品名称、商品规格等,从而确定待归类商品信息的第二推荐编码。在本实施例中,还可以在输出第二推荐编码之前,基于分数规则确定若干个第二推荐码的分值,判断是否存在第二推荐码的分值是否超过第二阈值,当存在第二推荐码的分值超过第二阈值时,输出第二推荐码的分值超过第二阈值的第二推荐码。在本实施例中,第二阈值可以是根据经验设定的值,也可以是统计分析得到的值。在本实施例中,历史申报数据模型利用海关局制定的海关商品编码及其对应的商品名称、商品规格等训练,得到商品名称、商品规格等与其相对应的商品编码。海关局制定的海关商品编码及其对应的商品名称、商品规格等是从报关信息网或其他相关网站定时获取,用于参与训练的。
参照图5,图5为本发明实施例提供的一种推荐进出口商品商品编码的方法第一实施例步骤S130的一个细化流程示意图包括以下步骤:
步骤S131,将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组。
在本实施例中,分词子模型包括HMM模型(Hidden Markov Model,隐马尔科夫模型)、CRF模型(Conditional Random Field Algorithm,条件随机场算法模型)、LSTM模型(Long Short-Term Memory,长短期记忆)。HMM模型是结构最简单的动态贝叶斯网络,是一种尤其著名的有向图结构,主要用于时序数据的建模,在语音识别、自然语言处理等领域有广泛应用,在分词算法中,隐马尔可夫经常用作能够发现新词的算法,通过海量的数据学习,能够将人名、地名、互联网上的新词等一一识别出来,具有广泛的应用场景。CRF结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。LSTM是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。在本实施例中,将待归类商品信息输入LSTM模型,得到待归类商品的最小颗粒度目标词组,比如将“21英寸的重量1.27kg/片的不带触摸功能的液晶显示屏”输入LSTM模型,得到“21英寸”、“1.27kg/片”、“不带触摸”、“液晶显示屏”。
步骤S132,判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组。
步骤S133,当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
参照图6,图6是本发明实施例提供的构建的进出口商品图谱的示意图,在本实施例中,所述构建的进出口商品图谱,包括:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
在本实施例中,已归类商品信息及其对应的已归类商品编码即海关局制定的海关商品编码及其对应的商品名称、商品规格等,将商品名称、商品规格等输入LSTM模型,得到与商品名称、商品规格等相对应的最小颗粒度目标词组。基于已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;将若干个商品映射关系网进行整合,得到进出口商品知识图谱。
步骤S140,基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码。
在本实施例中,分数加权规则可以是先行分别为若干个第一推荐码、若干个第二推荐码与待归类商品信息的相关度,相关度越高推荐分数越高。再分别赋予第一推荐码的推荐分数、第二推荐码的推荐分数不同的权重值,比如第一推荐码的推荐分数赋予0.3的权重值,第二推荐码的推荐分数赋予0.7的权重值。即,当第一推荐码与第二推荐码重复时,编码推荐分数为0.3*第一推荐码的推荐分数+0.7*第二推荐码的推荐分数;当第一推荐码与第二推荐码不重复时,第一推荐编码的推荐分数为0.3*第一推荐码的推荐分数,第二推荐编码的推荐分数为0.7*第二推荐码的推荐分数。
步骤S150,判断是否存在所述编码推荐分数超过阈值。
步骤S160,当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列。
步骤S170,向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
在本实施例中,所述方法还包括:
当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收所述用户端的自查结果;
当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
接收所述用户端修改后的待归类商品信息;
返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
在本实施例中,阈值可以是根据经验设定的值,也可以是统计分析得到的值。判断是否存在编码推荐分数超过阈值,当存在时,将编码推荐分数超过阈值的目标推荐编码进行正序排列,并向用户推荐正序排列的推荐分数前N名的目标推荐编码,前N名可以是基于用户的喜好进行选择的,也可以是根据经验值设定的。具体可为向用户推荐正序排列的推荐分数的前5名的目标推荐编码。当不存在时,推送自查窗口给用户,以便于用户对输入的待归类商品信息进行自查,是否存在错别字等,接收用户的自查结果,当用户自查确认无误时,该待分类商品信息可能是新商品还未存在历史数据,即不做出推荐;当用户自查确认存在错误时,即用户输入的待归类商品信息存在错别字等,用户基于修改窗口进行修改,再重新返回步骤S120。
在本实施例中,所述方法还包括:
存储所述用户的待归类商品信息和商品归类信息;
按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
在本实施例中,存储用户的待归类商品信息和最终确定的商品归类信息,当存储预设时间后,将用户的待归类信息和最终确定的商品归类信息更新至历史申报数据模型,建立系统数据的自我更新,自我迭代。
基于同一发明构思,本发明还提供一种推荐进出口商品商品编码的装置,如图7所示,图7为本发明实施例提供的一种推荐进出口商品商品编码的装置的结构示意图,所述系统包括:获取模块10、第一输入模块20、第二输入模块30、确定分数模块40、判断模块50、排列模块60与推荐模块70。
获取模块10,用以获取用户的待归类商品信息;
第一输入模块20,用以将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
第二输入模块30,用以将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
确定分数模块40,用以基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断模块50,用以判断是否存在所述编码推荐分数超过阈值;
排列模块60,用以当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
推荐模块70,用以向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
可选的,所述第一输入模块20,包括:
第一输入单元,用以将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
第二输入单元,用以将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
预测单元,用以将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
可选的,所述第二输入模块30,包括:
第三输入单元,用以将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组;
判断单元,用以判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组;
确定编码单元,用以当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
可选的,所述构建的进出口商品图谱,包括:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
可选的,所述装置还包括:
推送窗口模块,用以当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收模块,用以接收所述用户端的自查结果;
确认模块,用以当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
否认模块,用以当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
修订模块,用以接收所述用户端修改后的待归类商品信息;
返回模块,用以返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
可选的,所述装置还包括:
存储模块,用以存储所述用户的待归类商品信息和商品归类信息;
更新模块,用以按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
本发明实施例的装置的功能已经在上述的方法实施例中进行了描述,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有推荐进出口商品商品编码的程序,所述推荐进出口商品商品编码的程序被处理器执行时实现如上所述的推荐进出口商品商品编码的方法的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
由于本申请实施例提供的计算机可读存储介质,为实施本申请实施例的方法所采用的计算机可读存储介质,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的计算机可读存储介质都属于本申请所欲保护的范围。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种推荐进出口商品商品编码的方法,其特征在于,包括:
获取用户的待归类商品信息;
将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断是否存在所述编码推荐分数超过阈值;
当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
2.如权利要求1所述的推荐进出口商品商品编码的方法,其特征在于,所述将所述待归类商品信息输入历史申报数据模型,得到所述待归类商品信息的第一推荐编码,包括:
将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
3.如权利要求1所述的推荐进出口商品商品编码的方法,其特征在于,所述将所述待归类商品信息输入专业申报数据模型,得到所述待归类商品信息的第二推荐编码,包括:
将所述待归类商品信息输入分词子模型,得到所述待归类商品信息的最小颗粒度目标词组;
判断构建的进出口商品图谱中是否存在所述最小颗粒度目标词组;
当所述构建的进出口商品知识图谱中存在所述最小颗粒度目标词组时,基于所述进出口商品知识图谱确定所述待归类商品信息的第二推荐编码。
4.如权利要求3所述的推荐进出口商品商品编码的方法,其特征在于,所述构建的进出口商品图谱,包括:
获取已归类商品信息及其对应的已归类商品编码;
将所述已归类商品信息输入所述分词子模型,得到所述已归类商品信息的最小颗粒度样本词组;
基于所述已归类商品信息的最小颗粒度样本词组与已归类商品编码之间的关系,形成商品编码映射关系网;
将若干个所述商品映射关系网进行整合,得到进出口商品知识图谱。
5.如权利要求3所述的推荐进出口商品商品编码的方法,其特征在于,还包括:
当不存在所述编码推荐分数超过所述阈值时,推送自查窗口至用户端,所述自查窗口包括确认所述用户的待归类商品信息正确与否;
接收所述用户端的自查结果;
当自查结果为所述用户端确认所述自查窗口时,判断所述用户的待归类商品信息正确,结束运行;
当自查结果为所述用户端否认所述自查窗口时,判断所述用户的待归类商品信息错误,推送修改窗口至所述用户端;
接收所述用户端修改后的待归类商品信息;
返回将所述修改后的待归类商品信息输入构建的历史申报数据模型,得到所述修改后的待归类商品信息的第一推荐编码。
6.如权利要求1所述的推荐进出口商品商品编码的方法,其特征在于,还包括:
存储所述用户的待归类商品信息和商品归类信息;
按照预设时间将所述用户的待归类商品信息和商品归类信息更新至所述历史申报数据模型。
7.一种推荐进出口商品商品编码的装置,其特征在于,包括:
获取模块,用以获取用户的待归类商品信息;
第一输入模块,用以将所述待归类商品信息输入历史申报数据模型,得到若干个所述待归类商品信息的第一推荐编码;
第二输入模块,用以将所述待归类商品信息输入专业申报数据模型,得到若干个所述待归类商品信息的第二推荐编码;
确定分数模块,用以基于分数加权规则确定若干个目标推荐编码的编码推荐分数,所述目标推荐编码包括若干个所述第一推荐编码、若干个所述第二推荐编码;
判断模块,用以判断是否存在所述编码推荐分数超过阈值;
排列模块,用以当存在所述编码推荐分数超过所述阈值时,将所有所述编码推荐分数超过所述阈值的目标推荐编码进行正序排列;
推荐模块,用以向用户推荐所述正序排列的推荐分数的前N(N≥1)名的目标推荐编码。
8.如权利要求7所述的推荐进出口商品商品编码的方法,其特征在于,所述第一输入模块,包括:
第一输入单元,用以将所述待归类商品信息输入预训练语言表征子模型,得到所述待归类商品信息的关键词向量;
第二输入单元,用以将所述关键词向量输入抽取文本特征子模型,得到所述关键词向量的表达特征;
预测单元,用以将所述表达特征输入分类预测子模型,得到所述待归类商品信息的第一推荐编码。
9.一种电子设备,其中,该电子设备包括:
处理器;
以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210631885.XA CN114996453A (zh) | 2022-05-30 | 2022-05-30 | 一种推荐进出口商品商品编码的方法、装置、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210631885.XA CN114996453A (zh) | 2022-05-30 | 2022-05-30 | 一种推荐进出口商品商品编码的方法、装置、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114996453A true CN114996453A (zh) | 2022-09-02 |
Family
ID=83032823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210631885.XA Pending CN114996453A (zh) | 2022-05-30 | 2022-05-30 | 一种推荐进出口商品商品编码的方法、装置、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114996453A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117171587A (zh) * | 2023-09-27 | 2023-12-05 | 珠海云建数据信息技术有限公司 | 材料信息的编码方法、平台、电子设备及存储介质 |
CN117541139A (zh) * | 2023-05-12 | 2024-02-09 | 昆山双叶软件科技有限公司 | 一种基于物联网的物流关务管理系统 |
-
2022
- 2022-05-30 CN CN202210631885.XA patent/CN114996453A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117541139A (zh) * | 2023-05-12 | 2024-02-09 | 昆山双叶软件科技有限公司 | 一种基于物联网的物流关务管理系统 |
CN117171587A (zh) * | 2023-09-27 | 2023-12-05 | 珠海云建数据信息技术有限公司 | 材料信息的编码方法、平台、电子设备及存储介质 |
CN117171587B (zh) * | 2023-09-27 | 2024-03-22 | 珠海云建数据信息技术有限公司 | 材料信息的编码方法、平台、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021027533A1 (zh) | 文本语义识别方法、装置、计算机设备和存储介质 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN114996453A (zh) | 一种推荐进出口商品商品编码的方法、装置、电子设备 | |
CN110377733B (zh) | 一种基于文本的情绪识别方法、终端设备及介质 | |
CN115082920B (zh) | 深度学习模型的训练方法、图像处理方法和装置 | |
CN113313022A (zh) | 文字识别模型的训练方法和识别图像中文字的方法 | |
CN112632224B (zh) | 基于案例知识图谱的案件推荐方法、装置和电子设备 | |
CN112528637A (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN112084435A (zh) | 搜索排序模型训练方法及装置、搜索排序方法及装置 | |
CN110928992A (zh) | 文本搜索方法、装置、服务器及存储介质 | |
CN113204618A (zh) | 基于语义增强的信息识别方法、装置、设备及存储介质 | |
CN112632226A (zh) | 基于法律知识图谱的语义搜索方法、装置和电子设备 | |
CN116245097A (zh) | 训练实体识别模型的方法、实体识别方法及对应装置 | |
CN115374845A (zh) | 商品信息推理方法和装置 | |
CN116152833A (zh) | 基于图像的表格还原模型的训练方法及表格还原方法 | |
CN115221332A (zh) | 一种危化品事故事理图谱的构建方法与系统 | |
CN114817467A (zh) | 一种意图识别响应方法、装置、设备及存储介质 | |
CN114742016A (zh) | 一种基于多粒度实体异构图的篇章级事件抽取方法及装置 | |
CN112632956A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN112395407A (zh) | 企业实体关系的抽取方法、装置及存储介质 | |
CN116089605A (zh) | 基于迁移学习和改进词袋模型的文本情感分析方法 | |
CN115495566A (zh) | 一种增强文本特征的对话生成方法和系统 | |
US20210241147A1 (en) | Method and device for predicting pair of similar questions and electronic equipment | |
CN115238080A (zh) | 实体链接方法及相关设备 | |
CN114254622A (zh) | 一种意图识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |