CN113779933A - 商品的编码方法、电子设备及计算机可读存储介质 - Google Patents

商品的编码方法、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113779933A
CN113779933A CN202111029941.4A CN202111029941A CN113779933A CN 113779933 A CN113779933 A CN 113779933A CN 202111029941 A CN202111029941 A CN 202111029941A CN 113779933 A CN113779933 A CN 113779933A
Authority
CN
China
Prior art keywords
commodity
customs
code
codes
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111029941.4A
Other languages
English (en)
Other versions
CN113779933B (zh
Inventor
何浩
刘佳伟
黄小明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Langhua Supply Chain Service Co ltd
Original Assignee
Shenzhen Langhua Supply Chain Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Langhua Supply Chain Service Co ltd filed Critical Shenzhen Langhua Supply Chain Service Co ltd
Priority to CN202111029941.4A priority Critical patent/CN113779933B/zh
Publication of CN113779933A publication Critical patent/CN113779933A/zh
Application granted granted Critical
Publication of CN113779933B publication Critical patent/CN113779933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及海关商品编码技术领域,公开了商品的编码方法、电子设备及计算机可读存储介质。该方法包括:获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。通过上述方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。

Description

商品的编码方法、电子设备及计算机可读存储介质
技术领域
本申请涉及海关商品编码技术领域,特别是涉及商品的编码方法、电子设备及计算机可读存储介质。
背景技术
海关商品归类是海关实施征税、监管、缉私、统计工作的重要基础,是海关准确、统一执法的重要保障。《中华人民共和国海关进出口货物商品归类管理规定》明确规定,商品归类是指在《商品名称及编码协调制度公约》商品分类目录体系下,以《中华人民共和国进出口税则》(简称《税则》)为基础,按照《进出口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、商品归类决定的要求,确定进出口货物商品编码(以下简称“商品编码,HS Code”)的活动。
商品归类在进出口业务中具有重要意义,商品编码(HS Code)决定了货物的关税率、贸易管制要求、出口退税率、能否享受减免税等。商品归类的准确与否,反映了企业进出口管理的合规性水平。
同时,商品归类具有相当的技术难度,影响商品正确归类的因素很多,即便是微小的商品规格型号差异都可能导致归类结果的不同。错误的商品编码还会对企业的运营成本带来重大影响,例如增加缴税成本、对进出口货品产生不必要的限制、影响通关效率等等。
发明内容
本申请主要解决的技术问题是提供商品的编码方法、电子设备及计算机可读存储介质,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。
为了解决上述问题,本申请采用的一种技术方案是提供一种商品的编码方法,该方法包括:获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。
其中,为每个关键信息确定多个参考商品编码,包括:将每个关键信息与所有海关商品编码的每一关键信息进行比对,得到比对结果;根据比对结果确定多个参考商品编码。
其中,根据比对结果确定多个参考商品编码,包括:获取超过预设值的比对结果;将超过预设值的比对结果对应的海关商品编码确定为参考商品编码。
其中,从多个参考商品编码中确定待归类商品的目标商品编码,包括:计算每一参考商品编码对应的信息熵;基于信息熵计算每一参考商品编码对应的信息增益;将信息增益最大的参考商品编码确定为待归类商品的目标商品编码。
其中,采用以下公式进行计算:
Figure BDA0003244862950000021
其中,D表示所有参考商品编码数量,pk表示D中第k类参考商品编码所占的比例;基于信息熵计算每一参考商品编码对应的信息增益,包括:采用以下公式进行计算:
Figure BDA0003244862950000022
其中,Gain表示信息增益,a表示参考商品编码,Dv表示第v个节点包含了D中所有在特征α上取值为αv的样本总数,
Figure BDA0003244862950000023
表示第v个节点的权重。
其中,该方法还包括:构建海关商品编码推荐模型;将训练样本输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第一预测编码;利用第一预测编码和训练样本中的真实编码确定分类错误率;利用分类错误率对海关商品编码推荐模型进行修正。
其中,海关商品编码推荐模型包括多个分支节点;利用分类错误率对海关商品编码推荐模型进行修正,包括:根据每个分支节点的分类错误率及每个分支节点的权重,计算每一分支节点的第一分类错误率;计算每一分支节点被修剪后的第二分类错误率;若第二分类错误率大于第一分类错误率,则保留分支节点。
其中,该方法还包括:获取真实编码的关键信息;将关键信息输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第二预测编码;利用第二预测编码和真实编码确定分类错误率;利用分类错误率对海关商品编码推荐模型进行修正。
为了解决上述问题,本申请采用的另一种技术方案是提供一种电子设备,该电子设备包括处理器以及与处理器耦接的存储器;其中,存储器用于存储计算机程序,处理器用于执行计算机程序,以实现如上述技术方案提供的方法。
为了解决上述问题,本申请采用的另一种技术方案是提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现如上述技术方案提供的方法。
本申请的有益效果是:区别于现有技术的情况,本申请的一种商品的编码方法,该方法通过获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码的方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请提供的商品的编码方法一实施例的流程示意图;
图2是本申请提供的商品的编码方法另一实施例的流程示意图;
图3是本申请提供的商品的编码方法另一实施例的流程示意图;
图4是本申请提供的商品的编码方法另一实施例的流程示意图;
图5是本申请提供的商品的编码方法另一实施例的流程示意图;
图6是本申请提供的步骤54一实施例的流程示意图;
图7是本申请提供的商品的编码方法另一实施例的流程示意图;
图8是本申请提供的电子设备一实施例的结构示意图;
图9是本申请提供的计算可读存储介质一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
海关商品归类是海关实施征税、监管、缉私、统计工作的重要基础,是海关准确、统一执法的重要保障。《中华人民共和国海关进出口货物商品归类管理规定》明确规定,商品归类是指在《商品名称及编码协调制度公约》商品分类目录体系下,以《中华人民共和国进出口税则》(简称《税则》)为基础,按照《进出口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、商品归类决定的要求,确定进出口货物商品编码(以下简称“商品编码,HS Code”)的活动。
商品归类在进出口业务中具有重要意义,商品编码(HS Code)决定了货物的关税率、贸易管制要求、出口退税率、能否享受减免税等。商品归类的准确与否,反映了企业进出口管理的合规性水平。
同时,商品归类具有相当的技术难度,影响商品正确归类的因素很多,即便是微小的商品规格型号差异都可能导致归类结果的不同。错误的商品编码还会对企业的运营成本带来重大影响,例如增加缴税成本、对进出口货品产生不必要的限制、影响通关效率等等。
为了解决上述问题,本申请提出以下技术方案:
参阅图1,图1是本申请提供的商品的编码方法一实施例的流程示意图。该方法包括:
步骤11:获取待归类商品的数据信息。
待归类商品的数据信息包含有该待归类商品的相关信息,如以液晶显示屏为例子,数据信息可以是:“液晶显示屏、42英寸、带背光,不带触摸功能、视频接口、解码板、高频头板、已灌液晶、已切割、1.27kg/片”。
步骤12:从数据信息中获取至少一个关键信息。
从数据信息中获取至少一个关键信息,如上述液晶显示屏的例子,可以将液晶、不带触摸功能、视频接口、高频头板、42英寸作为关键信息。
步骤13:为每个关键信息确定多个参考商品编码。
此时,可以根据每一个关键信息确定对应的多个参考商品编码。
步骤14:从多个参考商品编码中确定待归类商品的目标商品编码。
然后从多个参考商品编码中确定待归类商品的目标商品编码。
在一些实施例中,可以将获取的待归类商品的数据信息输入至已训练的海关商品编码推荐模型,以使海关商品编码推荐模型输出待归类商品的目标商品编码。
在海关商品编码推荐模型中,会对每个关键信息确定多个参考商品编码,然后根据多个参考商品编码确定待归类商品的目标商品编码。
在本实施例中,通过获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码的方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。
参阅图2,图2是本申请提供的商品的编码方法另一实施例的流程示意图。该方法包括:
步骤21:获取待归类商品的数据信息。
步骤22:从数据信息中获取至少一个关键信息。
步骤21-步骤22与上述实施例的技术方案相同或相似,这里不做赘述。
步骤23:将每个关键信息与所有海关商品编码的每一关键信息进行比对,得到比对结果。
在一些实施例中,可以为每一海关商品的编码设置权重,在执行指标23时,可以根据对应的权重来计算每个关键信息与所有海关商品编码的每一关键信息的比对结果。
步骤24:根据比对结果确定多个参考商品编码。
在一些实施例中,参阅图3,步骤24可以是如下流程:
步骤241:获取超过预设值的比对结果。
步骤242:将超过预设值的比对结果对应的海关商品编码确定为参考商品编码。
步骤25:从多个参考商品编码中确定待归类商品的目标商品编码。
在一些实施例中,参阅图4,步骤25可以是如下流程:
步骤251:计算每一参考商品编码对应的信息熵。
采用以下公式进行计算:
Figure BDA0003244862950000061
其中,D表示所有参考商品编码数量,pk表示D中第k类参考商品编码所占的比例。
步骤252:基于信息熵计算每一参考商品编码对应的信息增益。
采用以下公式计算每一参考商品编码对应的信息增益:
Figure BDA0003244862950000062
其中,Gain表示信息增益,a表示关键信息,Dv表示第v个节点包含了D中所有在特征α上取值为av的样本总数,
Figure BDA0003244862950000063
表示第v个节点的权重。
步骤253:将信息增益最大的参考商品编码确定为待归类商品的目标商品编码。
在本实施例中,通过上述方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。
参阅图5,图5是本申请提供的商品的编码方法另一实施例的流程示意图。
步骤51:构建海关商品编码推荐模型。
步骤52:将训练样本输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第一预测编码。
步骤53:利用第一预测编码和训练样本中的真实编码确定分类错误率。
步骤54:利用分类错误率对海关商品编码推荐模型进行修正。
结合下表1进行说明:
Figure BDA0003244862950000071
决策树学习的关键在于如何选择最优的划分属性,所谓的最优划分属性,对于二元分类而言,就是尽量使划分的样本属于同一类别,即“纯度”最高的属性。那么如何来度量特征(features)的纯度,这时候就要用到“信息熵(informationentropy)”。先来看看信息熵的定义:假如当前样本集D中第k类样本所占的比例为Pk(k=1,2,3,...|K|),K为类别的总数(对于二元分类来说,K=2)。则样本集的信息熵为:
Figure BDA0003244862950000081
Ent(D)的值越小,则D的纯度越高。再来看一个概念信息增益(informationgain),假定离散属性α有V个可能的取值(a1,a2,...,an},如果使用特征α来对数据集D进行划分,则会产生V个分支结点,其中第v个节点包含了数据集D中所有在特征α上取值为αv的样本总数,记为Dv。因此可以根据上面信息熵的公式计算出信息熵,再考虑到不同的分支节点所包含的样本数量不同,给分支节点赋予权重
Figure BDA0003244862950000082
即样本数越多的分支节点的影响越大,因此,能够计算出特征α对样本集D进行划分所获得的“信息增益”:
Figure BDA0003244862950000083
一般而言,信息增益越大,则表示使用特征α对数据集划分所获得的“纯度提升”越大。所以信息增益可以用于决策树划分属性的选择,其实就是选择信息增益最大的属性,ID3算法就是采用的信息增益来划分属性。
数据集是类别为二元的20个样本,有效样本为17个,正例(类别为1的样本)占的比例为:
Figure BDA0003244862950000084
反例(类别为0的样本)占的比例为:
Figure BDA0003244862950000085
根据信息熵的公式能够计算出数据集D的信息熵为:
Figure BDA0003244862950000091
Figure BDA0003244862950000092
Figure BDA0003244862950000093
其中,D1对应表1的关键信息A,D2对应表1的关键信息B,D3对应表1的关键信息C。
以此类推对每一关键信息进行信息增益计算,
Figure BDA0003244862950000094
Figure BDA0003244862950000095
Figure BDA0003244862950000096
因此,商品编码9013803090取得最大增益,将此商品编码最为最优值被推荐使用。
在其他实施例中,海关商品编码推荐模型包括多个分支节点;参阅图6,步骤54可以是以下流程:
步骤541:根据每个分支节点的分类错误率及每个分支节点的权重,计算每一分支节点的第一分类错误率。
步骤542:计算每一分支节点被修剪后的第二分类错误率。
步骤543:若第二分类错误率大于第一分类错误率,则保留分支节点。
通过这种方式,对分支节点进行修剪,以减少海关商品编码推荐模型的计算,提升运算能力,从而提高对待归类商品推荐海关商品编码的效率。
在一些实施例中,海关商品的归类都会在流入系统后进行自然语言识别、智能提取、智能分词的动作,通过关务人员选择为系统提供正反馈和负反馈,完成机器学习训练,构建供应链行业模型,将数据分类进入不同的类别。
在推荐系统内,每次关务人员的选择,都会把当前操作的每一条数据对应的每一个关键信息进行重新计算权重的操作,同一个关键信息重复被选中为同一个商品编码,其权重会在权重基数的基础上增加其权重,系统关键字段加权。推荐出系统内匹配度最高的N条数据,由关务人员进行选择操作,逐步形成供应链行业的数据模型。
在选择过程中,加入决策树算法,在决策树充分生长后,修剪掉多余的分支。根据每个分支的分类错误率及每个分支的权重,计算该节点不修剪时预期分类错误率;对于每个非叶节点,计算该节点被修剪后的分类错误率,如果修剪后分类错误率变大,即放弃修剪;否则将该节点强制为叶节点,并标记类别。产生一系列修剪过的决策树候选之后,利用测试数据(未参与建模的数据)对各候选决策树的分类准确性进行评价,保留分类错误率最小的决策树。
通过这种方式,能够提高海关商品编码推荐模型推荐海关商品编码的准确性。
进一步,参阅图7,在执行步骤54后,该方法还包括:
步骤71:获取真实编码的关键信息。
步骤72:将关键信息输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第二预测编码。
步骤73:利用第二预测编码和真实编码确定分类错误率。
步骤74:利用分类错误率对海关商品编码推荐模型进行修正。
通过步骤71-74的方案,在利用训练样本对海关商品编码推荐模型训练后,使用真实编码的关键信息对海关商品编码推荐模型进行验证,以提升海关商品编码推荐模型的准确性。
在上述训练过程中,通过多次迭代上述过程,使海关商品编码推荐模型输入的预测编码无限接近真实编码,此时则结束训练,并将训练后的模型用于上述商品的编码方法。
可以理解,在上述海关商品编码推荐模型训练完成后,每一关键信息均对应有相应的参考商品编码,以及对应的权重,在需要对海关商品编码时,将海关商品的数据输入至海关商品编码推荐模型中,海关商品编码推荐模型根据数据中的关键信息,获取对应的参考商品编码以及权重,然后根据这些参考商品编码以及权重计算出最佳的海关商品编码,作为该海关商品的海关商品编码。
参阅图8,图8是本申请提供的电子设备一实施例的结构示意图,该电子设备80包括处理器81以及与处理器81耦接的存储器82;其中,存储器82用于存储计算机程序,处理器81用于执行计算机程序,以实现以下方法:
获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。
可以理解,处理器81还用于执行计算机程序,以实现上述任一实施例提供的方法。
参阅图9,图9是本申请提供的计算可读存储介质一实施例的结构示意图。该计算机可读存储介质90用于存储计算机程序91,计算机程序91在被处理器执行时,用于实现以下方法:
获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。
可以理解,计算机程序91在被处理器执行时,还用于实现上述任一实施例提供的方法。
在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述其他实施方式中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种海关商品的编码方法,其特征在于,所述方法包括:
获取待归类商品的数据信息;
从所述数据信息中获取至少一个关键信息;
为每个关键信息确定多个参考商品编码;
从多个所述参考商品编码中确定所述待归类商品的目标商品编码。
2.根据权利要求1所述的方法,其特征在于,
所述为每个关键信息确定多个参考商品编码,包括:
将每个关键信息与所有海关商品编码的每一关键信息进行比对,得到比对结果;
根据所述比对结果确定多个所述参考商品编码。
3.根据权利要求2所述的方法,其特征在于,
所述根据所述比对结果确定多个所述参考商品编码,包括:
获取超过预设值的所述比对结果;
将超过预设值的所述比对结果对应的海关商品编码确定为所述参考商品编码。
4.根据权利要求1所述的方法,其特征在于,
所述从多个所述参考商品编码中确定所述待归类商品的目标商品编码,包括:
计算每一参考商品编码对应的信息熵;
基于所述信息熵计算每一所述参考商品编码对应的信息增益;
将所述信息增益最大的参考商品编码确定为所述待归类商品的所述目标商品编码。
5.根据权利要求4所述的方法,其特征在于,
所述计算每一参考商品编码对应的信息熵,包括:
采用以下公式进行计算:
Figure FDA0003244862940000011
其中,D表示所有参考商品编码数量,pk表示D中第k类参考商品编码所占的比例;
所述基于所述信息熵计算每一所述参考商品编码对应的信息增益,包括:
采用以下公式进行计算:
Figure FDA0003244862940000021
其中,Gain表示所述信息增益,a表示参考商品编码,Dv表示第v个节点包含了D中所有在特征α上取值为av的样本总数,
Figure FDA0003244862940000022
表示第v个节点的权重。
6.根据权利要求1所述的方法,其特征在于,
构建海关商品编码推荐模型;
将训练样本输入至所述海关商品编码推荐模型,以得到所述海关商品编码推荐模型输出的第一预测编码;
利用所述第一预测编码和所述训练样本中的真实编码确定分类错误率;
利用所述分类错误率对所述海关商品编码推荐模型进行修正。
7.根据权利要求6所述的方法,其特征在于,
所述海关商品编码推荐模型包括多个分支节点;
所述利用所述分类错误率对所述海关商品编码推荐模型进行修正,包括:
根据每个分支节点的分类错误率及每个分支节点的权重,计算每一所述分支节点的第一分类错误率;
计算每一所述分支节点被修剪后的第二分类错误率;
若所述第二分类错误率大于所述第一分类错误率,则保留所述分支节点。
8.根据权利要求7所述的方法,其特征在于,
所述方法还包括:
获取所述真实编码的关键信息;
将所述关键信息输入至所述海关商品编码推荐模型,以得到所述海关商品编码推荐模型输出的第二预测编码;
利用所述第二预测编码和所述真实编码确定分类错误率;
利用所述分类错误率对所述海关商品编码推荐模型进行修正。
9.一种电子设备,其特征在于,所述电子设备包括处理器以及与所述处理器耦接的存储器;
其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序在被处理器执行时,用于实现如权利要求1-8任一项所述的方法。
CN202111029941.4A 2021-09-03 2021-09-03 商品的编码方法、电子设备及计算机可读存储介质 Active CN113779933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111029941.4A CN113779933B (zh) 2021-09-03 2021-09-03 商品的编码方法、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111029941.4A CN113779933B (zh) 2021-09-03 2021-09-03 商品的编码方法、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113779933A true CN113779933A (zh) 2021-12-10
CN113779933B CN113779933B (zh) 2024-07-09

Family

ID=78840971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111029941.4A Active CN113779933B (zh) 2021-09-03 2021-09-03 商品的编码方法、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113779933B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116776831A (zh) * 2023-03-27 2023-09-19 阿里巴巴(中国)有限公司 海关、报关编码确定、决策树构建方法和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120130927A1 (en) * 2010-11-19 2012-05-24 Kotaro Shimogori Shipping System and Method with Taxonomic Tariff Harmonization
US20170169496A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for generating commodity quick response code
CN107862046A (zh) * 2017-11-07 2018-03-30 宁波爱信诺航天信息有限公司 一种基于短文本相似度的税务商品编码分类方法及系统
CN110851587A (zh) * 2018-07-25 2020-02-28 阿里巴巴集团控股有限公司 商品编码预测模型生成和确定商品编码方法、装置及设备
CN111476319A (zh) * 2020-05-08 2020-07-31 网易(杭州)网络有限公司 商品推荐方法、装置、存储介质和计算设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120130927A1 (en) * 2010-11-19 2012-05-24 Kotaro Shimogori Shipping System and Method with Taxonomic Tariff Harmonization
US20170169496A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for generating commodity quick response code
CN107862046A (zh) * 2017-11-07 2018-03-30 宁波爱信诺航天信息有限公司 一种基于短文本相似度的税务商品编码分类方法及系统
CN110851587A (zh) * 2018-07-25 2020-02-28 阿里巴巴集团控股有限公司 商品编码预测模型生成和确定商品编码方法、装置及设备
CN111476319A (zh) * 2020-05-08 2020-07-31 网易(杭州)网络有限公司 商品推荐方法、装置、存储介质和计算设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116776831A (zh) * 2023-03-27 2023-09-19 阿里巴巴(中国)有限公司 海关、报关编码确定、决策树构建方法和介质
CN116776831B (zh) * 2023-03-27 2023-12-22 阿里巴巴(中国)有限公司 海关、报关编码确定、决策树构建方法和介质

Also Published As

Publication number Publication date
CN113779933B (zh) 2024-07-09

Similar Documents

Publication Publication Date Title
CN108320171B (zh) 热销商品预测方法、系统及装置
CN109240901B (zh) 性能分析方法、性能分析装置、存储介质和电子设备
US7930262B2 (en) System and method for the longitudinal analysis of education outcomes using cohort life cycles, cluster analytics-based cohort analysis, and probabilistic data schemas
CN109902159A (zh) 一种基于自然语言处理的智能运维语句相似度匹配方法
CN108898476A (zh) 一种贷款客户信用评分方法和装置
CN111310860B (zh) 改进梯度提升决策树性能的方法及计算机可读存储介质
CN110046298A (zh) 一种查询词推荐方法、装置、终端设备及计算机可读介质
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN107193915A (zh) 一种企业信息分类方法及装置
CN110232154A (zh) 基于随机森林的产品推荐方法、装置及介质
CN112149737A (zh) 选择模型训练方法、模型选择方法、装置及电子设备
CN112036483B (zh) 基于AutoML的对象预测分类方法、装置、计算机设备及存储介质
CN111368096A (zh) 基于知识图谱的信息分析方法、装置、设备和存储介质
CN110276382A (zh) 基于谱聚类的人群分类方法、装置及介质
CN111428142A (zh) 一种基于随机森林分类器的代码评审人推荐系统及方法
CN110990711A (zh) 基于机器学习的微信公众号推荐算法及系统
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及系统
US10467276B2 (en) Systems and methods for merging electronic data collections
CN113779933A (zh) 商品的编码方法、电子设备及计算机可读存储介质
CN112487021B (zh) 业务数据的关联分析方法、装置及设备
CN112966177A (zh) 咨询意图的识别方法、装置、设备以及存储介质
CN111930944A (zh) 文件标签分类方法及装置
CN111400413B (zh) 一种确定知识库中知识点类目的方法及系统
CN114092057A (zh) 一种项目模型的构建方法、装置、终端设备和存储介质
CN113934894A (zh) 基于指标树的数据显示方法、终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant