CN109598517A - 商品通关处理、对象的处理及其类别预测方法和装置 - Google Patents

商品通关处理、对象的处理及其类别预测方法和装置 Download PDF

Info

Publication number
CN109598517A
CN109598517A CN201710910632.5A CN201710910632A CN109598517A CN 109598517 A CN109598517 A CN 109598517A CN 201710910632 A CN201710910632 A CN 201710910632A CN 109598517 A CN109598517 A CN 109598517A
Authority
CN
China
Prior art keywords
information
classification
commodity
sample
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710910632.5A
Other languages
English (en)
Other versions
CN109598517B (zh
Inventor
林沛坤
王浩
朱洪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710910632.5A priority Critical patent/CN109598517B/zh
Publication of CN109598517A publication Critical patent/CN109598517A/zh
Application granted granted Critical
Publication of CN109598517B publication Critical patent/CN109598517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种商品通关处理、对象的处理及其类别预测方法和装置。其中,该方法包括:获取用户对商品进行描述的商品描述信息;基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别;基于商品的类别,生成报关单。本发明解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。

Description

商品通关处理、对象的处理及其类别预测方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种商品通关处理、对象的处理及其类别预测方法和装置。
背景技术
HSCode(Harmoniszation System Code,国际商品统一分类代码)是由国际海关理事会制定的编码协调制度,对各种不同产品出入境应征或应退关税税率进行量化管理的一个统一标准。HSCode共包含96个主要类别章节,前六位是国际通用的,后两位或四位由各国根据需求对货物进行更细的分类,中国采用的是十位编码。HSCode可以应用在各种通关业务场景,分别以如下几个类别进行举例:
(1)跨境电商海淘商品挂载
卖家进行海淘商品上架时,需要认真查看税则书明确税则号,并补充相关属性信息,然后申请上架;后台运营人员需要对税则号进行严格审核,否则可能影响平台报关资质。
(2)外贸服务平台商品出口报关
外贸服务平台业务中一个比较重要的环节即是根据用户填写的一些商品描述进行产品归类,并根据税则书的要求补充商品相关的申报要素属性信息,不仅需要让用户填写足够的信息,同时在申报要素信息不明确时需要进行核实,存在着反复确认的过程。
(3)进出口代理企业通关申报
商家进行进出口贸易时,需要找进出口代理企业协助进行通关申报,代理企业在申报时,首选需要认真查看税则书,填写报关单,然后由海关进行审核,审核不通过则需要根据海关的建议重新进行申报,严重影响通关时间。
由此可见,在进出口业务中,填写HSCode是非常重要的环节,传统的方式是由卖家或报关单位根据商品描述,对照《中华人民共和国海关进出口税则》(以下简称税则书)相关说明找到对应的HSCode(又称为税则号)后进行填写,然后进行人工审核,审核不通过则给出建议的HSCode让卖家或报关单位确认并重新填写。
但是HSCode类目繁多,其包括22个大类,96个主要类别章节,总共包括上万个子类。通关时涉及HSCode归类可利用的信息主要为商品名称和商品规格(即申报要素),而全量的十位编码上万个,由卖家或报关单位填写,难以区分且容易出错;而且人工审核覆盖面有限,且需要专家知识,同时专家经验规则难以覆盖所有HSCode。因此传统的由用户前端填写,人工后台审核的方式存在着极大的弊端:周期较长,耗费大量人力,且极易出错。这种交互方式费时费力,而且出错概率非常高。也就是说,在相关技术中,采用人工填写HSCode时,会导致在对采用HSCode分类的对象(例如,商品)的类别进行确定时,效率较低。
针对相关技术中由人工填写HSCode导致对象类别确定效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种商品通关处理、对象的处理及其类别预测方法和装置,以至少解决相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
根据本发明实施例的一个方面,提供了一种商品通关处理方法,包括:获取用户对商品进行描述的商品描述信息;基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别;基于所述商品的类别,生成报关单。
根据本发明实施例的一个方面,提供了一种商品通关处理装置,包括:第一获取模块,用于获取用户对商品进行描述的商品描述信息;确定模块,用于基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别;生成模块,用于基于所述商品的类别,生成报关单。
根据本发明实施例的一个方面,提供了一种对象类别预测方法,包括:获取待预测类别的对象的对象描述信息;根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
根据本发明实施例的另一方面,还提供了一种对象处理方法,包括:接收对待处理对象进行处理的业务请求;根据业务请求,显示用于提供对待处理对象的对象描述信息进行输入的输入区域;接收在输入区域输入的对象描述信息;根据接收的对象描述信息,以及预先训练的分类模型,对待处理对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到;根据预测的类别,对待处理对象进行处理。
根据本发明实施例的另一方面,还提供了一种对象类别预测装置,包括:获取模块,用于获取待预测类别的对象的对象描述信息;第一预测模块,用于根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
根据本发明实施例的另一方面,还提供了一种对象处理装置,包括:第一接收模块,用于接收对待处理对象进行处理的业务请求;显示模块,用于根据业务请求,显示用于提供对待处理对象的对象描述信息进行输入的输入区域;第二接收模块,用于接收在输入区域输入的对象描述信息;第二预测模块,用于根据接收的对象描述信息,以及预先训练的分类模型,对待处理对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到;处理模块,用于根据预测的类别,对待处理对象进行处理。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行对象类别预测方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述对象类别预测方法。
根据本发明实施例的另一方面,还提供了一种系统,其特征在于,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:步骤1,获取待预测类别的对象的对象描述信息;步骤2,根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
此处需要说明的是,上述对象类别预测方法实现了通关商品的自动归类,从而可以根据商品的描述信息自动确定商品的税则号,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。使用上述实施例提供的方案,发货人只需简单填写商品描述,甚至只需要根据商品的实际情况下对预设的选项进行选择,即可进行自动归类,无需翻阅税则书及其反复确认,也不需要具备专业的知识,降低了使用门槛,简化了整个申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
在本发明实施例中,获取待预测类别的对象的对象描述信息;根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。上述方案实现了对象的类别待预测,从而实现了通关商品的自动归类,进而解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本申请实施例1的一种对象类别预测方法的示意图;
图2是根据现有技术的一种税则号的示意图;
图3是根据本申请实施例2的一种用于实现对象类别预测方法的计算机终端(或移动设备)的硬件结构框图;
图4是根据本发明实施例2的一种商品通关处理方法的流程图;
图5是根据本发明实施例3的一种对象类别预测方法的流程图;
图6是根据实施例4的一种对象处理方法的流程图;
图7是根据实施例5的一种商品通关处理装置的示意图;
图8是根据实施例6的一种对象类别预测装置;
图9是根据实施例7的一种对象类别预测装置;
图10是根据本申请实施例6的一种系统的示意图;以及
图11是根据本申请实施例8的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
HSCode:即国际商品统一分类代码,是编码协调制度的简称,是由国际海关理事会制定,对各种不同产品出入境应征或应退关税税率进行量化管理的一个统一标准。HSCode共包含96个主要类别章节,前六位是国际通用的,后两位或四位由各国根据自己的需求对货物进行更细的分类,中国采用的是十位编码。同时,每个HSCode都会附加一些品类描述、申报要素和关税信息等。
中文分词:中文分词就是将一个汉字序列切分成一个个有单独含义的词的过程。词是中文语义的最小单元,中文文本由连续的字符构成,不像英文等其它语言存在天然的分隔符,因此需要通过一些方式正确切分出单词。中文分词方法包括基于词典、基于统计、基于规则的分词算法。当前的方法主要是基于人工标注的语料训练分词模型即进行模型参数估计,分词时通过模型计算各种分词出现的概率,并取概率最大的结果,该类能够很好地处理歧义和未登录词,典型的方法如隐马尔科夫模型(Hidden Markov Model,HMM)和条件随机场(Conditional Random Field,CRF)。
多层分类:多层分类用于解决类别总数成千上万且类别之间存在层次化关系的分类问题,通常分为局部策略和全局策略。局部策略采用自顶向下的方式构造一系列分类器,每个分类器只局部考虑全部类别中的一部分,分类时,从根结点出发自顶向下逐步确定样本的类别。而全局策略使用一个单一的、相对复杂的分类模型完成多层分类任务,如简单的Flat方法,完全忽略层次结构,独立地看待各个类别;或者改造现有的单层分类算法用于多层分类。
one-hot表示法:将词组进行编号,每个词为一个很长的向量,维度等于词表大小,每个词组在对应位置数字为1,其他位置数字为0。
distributed表示法:通过训练将每个词映射成k维实数向量,可通过词之间的距离来判断其语义相似度,如google的word2vec。
实施例1
对于需要进出口的商品,发货人需要依照相关的规定,在规定的时间内采用电子数据报关单或纸质报关单的形式,向海关报告实际进出口商品的情况。在申报的过程中,需要发货人填写该商品对应的税则号,即HSCode。目前所使用的方式是人工根据商品的描述,通过查找税则书确定商品对应的HSCode,并对商品填写的HSCode进行人工审核。但由于HSCode涉及到类目繁多,工填写非常容易出错,即使加入了人工审核机制,也很难避免,由此导致商品通关所耗费的时间过长,通关效率低。
为了解决上述技术问题,本申请提出了一种对象类别预测方法,上述对象可以是待通关的商品,该方法通过对商品进行自动归类,可以确定商品的类别,从而确定商品的HSCode,该方法在跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等通关业务场景中有着非常重要的作用。
图1是根据本申请实施例1的一种对象类别预测方法的示意图,对象类别预测可以应用于对通关商品进行自动归类,本实施例主要应用多层级联、词向量化和多分类的思想系统地解决通关商品自动归类的问题。该对象类别预测方法主要包括两个步骤,第一个步骤S11为建立分类模型,第二个步骤S12为通过建立的分类模型对商品的类别进行预测,下面,分别对这两个步骤进行描述,在下述实施例中,对象用于表示待预测类别的商品。
步骤S11,建立分类模型。
图2是根据现有技术的一种税则号的示意图,如图2所示,中国海关税则号由十位编码级联而成,前六位为国际通用编码,分为章、税目、子目;后四位为中国根据需求细分的编码。如果直接对十位进行文本分类,总共存在上万个类别,模型效果有限,因此需要使用级联分类器,采用自顶向下的分类策略,在不同层次重新计算特征向量,将每个分类器需要预测的类别限定在百级别,使得数据规模和样本分布处于一个合理的范围。
作为一种可选的实施例,可以进行2+8的两层划分,即将10位税则号的前两位作为第一层,将10位税则号的后八位作为第二层。训练时对于第一层模型,将所有类别的样本数据进行词向量和分类器的训练;对于后八位的模型,针对前两位所属的不同类别分别进行词向量和分类器的训练;假设前两位总共有100个类别,则总共需要100个第二层的模型。预测时先使用第一层模型预测前两位,得到前两位的预测结果之后,再使用第一层模型的预测结果对应的第二层模型,对后八位进行预测。
下面对每层分类模型的训练过程进行描述,为了得到每一层的分类模型,可以针对不同层级的模型自顶而下进行训练。
步骤S111,样本抽取。
具体的,上述样本抽取即为获取训练样本的过程。具体的,可以通过获取历史人工数据中,已确定税则号的商品作为样品,并确定样品的样品描述信息以及样品的税则号为用于训练模型的样本。
可选的,上述样品的描述信息可以为历史人工数据中的文本信息(包括:商品名称、商品规格等)和税则说明书中的文本信息(包括商品描述、商品名称及备注),在将样品描述信息和样品的税则号抽取出来之后,可以构成样本集合[(sentence,hscode),...],其中,sentence用于表征样品描述信息,hscode用于表征样品的税则号。
步骤S122,预处理。具体的,该步骤为对样本描述信息中的中文进行预处理。
作为一种可选的实施例中,上述预处理的步骤可以分两步进行:
(1)对样品描述信息进行中文分词
在一种可选的实施例中可以将样品描述信息的中文作为汉字序列,将这个汉字序列根据语义切分为一个一个单独的词组。
(2)对分词后的结果所包括的词组进行预处理,该预处理的步骤可以包括如下任意之一:过滤停用词,过滤高频词,过滤低频词。
在对样品描述信息的中文进行分词之后,还可以对分词后得到的词组进行过滤。过滤的过程可以包括:去除停用词,停用词几乎不携带任何信息,如虚词、标点符号等;去掉高频词,这类词没有特殊性,如某些在大部分文本中都出现的单词;去掉低频词,这类词没有普适性,如只在一两个文本中出现的单词。由此,样本集合转化为[([word1,word2,word3,...],hscode),...]。(word1,word2,word3,……)即为对sentence进行分词及过滤停用词、高频词、低频词后的结果。
步骤S123,特征提取,具体的,上述特征提取即为将预处理后的词组进行词向量化,然后再对词组进行文本向量化。
词向量化(word embedding)是一个将词表征为实数值向量的过程。在一种可选的实施例中,可以采用distributed表示法,通过word2vec/fasttext进行词向量的训练,需要将样本集合中的词组单独提取出来作为输入[([word1,word2,word3,...]),...],输出为词向量[(word1,vector1),(word2,vector2),...]。
文本向量化则是将词组转化为实数值向量的过程。上述样本集合中每一个样本由词组及其类别组成,需要进行合理的转化为向量。转化的方式有多种,如average pooling等。average pooling是指将文本中词组的词向量简单求平均的过程,计算过程如下公式所示:其中,h为此向量化后的结果,C是文本中的word数,Xn用于表征分词后得到的每个词组,Vwn是w的词向量。文本向量化后,样本集合转化为[(vector,hscode),...],也即,将词组word由对应的向量vector来表示。
步骤S124,模型训练。上述训练模型为对抽取的样本进行训练的过程。
在样本构建完成后,即可进行模型的训练,因为分成不同层级后,每个层级依然是一个多分类问题,因此需要选择多分类算法,如多元逻辑回归等。选择一个合适的多分类算法对样本进行训练,则得到每个层对应的层级分类模型。
具体的,多分类是指利用算法解决多分类问题的过程。很多二分类算法可直接推广到多分类(如逻辑回归可通过softmax推广到多分类中);其它情形下则需要将多分类任务拆分为若干个二分类任务进行求解,常用的拆分策略包括一对一OvO和一对其余OvR。OvO将N个类别两两配对,从而产生N(N-1)/2个分类任务,测试时得到N(N-1)/2个分类结果,最终结果通过投票产生;OvR产生N个分类任务,将某一个类作为正例,其他类作为反例,测试时选择置信度最大正类作为分类结果。
步骤S12,通过建立的分类模型对商品的类别进行预测。在预测过程中,仍采用自顶向下逐级预测的方式进行。
步骤S121,获取预测数据。
预测过程首先需要将预测数据中的商品描述抽取出来作为待预测商品的描述信息,即输入sentence。
作为一种可选的实施例,待预测商品的商品描述信息,可以是用户直接输入的文本信息,也可以根据用户对预设选项的选择结果来确定。例如:用户在报关时直接输入的文本信息、或根据用户输入的视频文件、图像文件以及用户输入的语音文件提取得到的文本信息。再例如:用于报关的客户端向用户提供属性选项:商品名称、商品规格、商品类别、商品代号、商品描述以及商品备注,用户根据商品的实际情况,对每个选项进行选择,在获取用户的选择结果之后,根据选择结果生成商品的描述信息。
步骤S122,预处理
具体的,在进行分类的过程中,为了使待预测的商品能够适应步骤S11中训练的模型,需要对待预测商品进行与步骤S112中的样品相同的预处理步骤。该步骤可以包括分词、去停用词、去高低频词处理,得到词组[word1,word2,word3,...]。
步骤S123,文本向量化
与步骤S113相同,将词组转化为实数值向量,操作方式与模型训练中的文本向量化类似,最终得到模型预测的输入向量vector。
步骤S124,模型预测
在上述步骤中,利用预先训练好的层级分类模型,对待预测商品进行预测,得到商品的税则号。
此处需要说明的是,上述对象类别预测方法实现了通关商品的自动归类,从而可以根据商品的描述信息自动确定商品的税则号,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。
以上几种场景中,包括卖家、商家、运营人员和进出口代理企业等,都非海关归类专家,并不具备非常专业的知识,让他们进行税则号填写或者审核,不仅消耗人力物力,同时出错概率非常高。而使用上述实施例提供的解决方案,用户只需简单填写商品描述,甚至只需要根据商品的实际情况对预设的选项进行选择,即可进行自动归类,无需翻阅税则书和反复确认,也无需具备专业的知识,降低了使用门槛,简化了过关的申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
实施例2
根据本发明实施例,还提供了一种对象类别预测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图3示出了一种用于实现对象类别预测方法的计算机终端(或移动设备)的硬件结构框图。如图3所示,计算机终端30(或移动设备30)可以包括一个或多个(图中采用302a、302b,……,302n来示出)处理器302(处理器302可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器304、以及用于通信功能的传输模块306。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图3所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端30还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。
应当注意到的是上述一个或多个处理器302和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端30(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器304可用于存储应用软件的软件程序以及模块,如本发明实施例中的对象类被预测方法对应的程序指令/数据存储装置,处理器302通过运行存储在存储器304内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的对象类别预测方法。存储器304可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器304可进一步包括相对于处理器302远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端30。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端30的通信供应商提供的无线网络。在一个实例中,传输装置306包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置306可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(Liquid Crystal Display,LCD),该液晶显示器可使得用户能够与计算机终端30(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图3所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图3仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在上述运行环境下,本申请提供了如图4所示的商品通关处理方法。图4是根据本发明实施例2的一种商品通关处理方法的流程图。
步骤S41,获取用户对商品进行描述的商品描述信息。
具体的,用户对商品的描述信息可以为发货人输入的描述信息,该描述信息可以为用于表述商品的名称、类型、产地、含量、用途等信息。上述描述信息可以是文本类型的信息,也可以是其他多媒体类型的信息中提取到的文本信息。
步骤S43,基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别。
具体的,可以通过获取历史人工数据中,已确定税则号的商品作为样品,并确定样品的样品描述信息以及样品的税则号为用于训练模型的样本,其中,样品的税则号则用于表征样品的类别。在上述步骤中,商品的类别可以是得到对象的税则号,通过税则号来表示对象的类别。
在一种可选的实施例中,获取预先训练的分类模型,并获取商品的描述信息,从商品的描述信息中进行特征提取,提取描述信息中的关键词,再将关键词进行词向量化,并将词向量化后的词向量进行文本向量化,将文本向量化后的描述信息作为预测参数,输入至分类模型,分类模型根据接收到的预测参数,输出商品对应的类别,或直接输出商品对应的税则号。
步骤S45,基于商品的类别,生成报关单。
在上述步骤中,在确定商品的类别的情况下,能够根据商品的类别得到商品对应的税则号,从而能够生成商品对应的报关单。
此处需要说明的是,上述商品通关处理方法实现了通关商品的自动归类,并生成对应的报关单,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。使用上述实施例提供的方案,发货人只需简单填写商品描述,甚至只需要根据商品的实际情况对预设的选项进行选择,即可进行自动归类,无需翻阅税则书及其反复确认,也不需要具备专业的知识,降低了使用门槛,简化了整个申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
由此,上述方案解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
作为一种可选的实施例,步骤S43,基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别包括:
步骤S431,对商品的类别划分层级。
具体的,上述对商品的类别划分层级,可以为对税则号所表征的类别进行划分层级。例如,结合图2所示,中国海关税则号由十位编码级联而成,第一位和第二位用于表征章,第三位和第四位用于表征税目,第五位和第六位用于表征子目,剩余四位用于根据需求进行细分编码。在这种情况下,作为一种可选的实施例,可以进行2+8的两层划分,即将10位税则号的前两为作为第一层,将10位税则号的后八位作为第二层。作为另一种可选的实施例,还可以进行4+6的两层划分,即将10位税则号的前四位作为第一层,将10为税则号的后六位作为第二层。同理,还可以进行2+2+6的三层层级划分。
上述对商品的类别进行层级划分的目的在于,提高分类模型的准确度。如果直接对税则号的10位进行文本分类,总共存在上万个类别,每个类别对应的特征向量可能存在较接近的情况,因此导致分类模型的效果有限,为了提高分类模型的效果,可以多层分类的方式,使用级联分类器,采用自顶向下的分类策略,在不同层次重新计算特征向量,将每个分类器需要预测的类别限定在百级别,使得数据规模和样本分布处于一个合理的范围。
步骤S433,依据划分的层级自顶向下,根据获取的商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别,其中,分类模型包括每层对应的层级分类模型。
具体的,上述自顶向下用于表征,在使用多层的层级分类模型对商品的类别进行分类时,先使用最上层的层级分类模型进行分类,再将最上层的层级分类模型的分类结果,作为该分类结果对应的第二层层级分类模型的输入,再次进行分类,直至进行完所有层级的分类,最后一层的层级分类模型输出的即为商品的类别的最终分类结果。
作为一种可选的实施例,以2+8的两层层级分类模型进行说明。首先将商品的描述信息输入至第一层层级分类模型,第一层层级分类模型输出的结果可以表示税则号的前两位。如果第一层层级分类模型的输出结果总共有100个类别,由于每个第一层层级分类模型的分类结果都会对应一个第二层层级分类模型,因此会包括100个第二层层级分类模型。再将前两位的预测结果输入至预测结果对应的第二层层级分类模型,得到后八位的分类结果。
步骤S435,在确定完划分的所有层级的层级类别时得到商品的类别。
作为一种可选的实施例,在依据划分的层级自顶向下,根据获取的商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别之前,还包括:步骤S435,通过以下方式训练得到每层级对应的层级分类模型:
步骤S4351,提取预定数量的商品样品的样品描述信息的特征内容。
具体的,可以通过获取历史人工数据中,已确定税则号的商品作为商品样品,并确定商品样品的样品描述信息以及样品的税则号为用于训练模型的样本。上述特征内容可以是对样品模式描述进行特征提取后,在对特征提取的词组进行向量化得到的内容。
步骤S4353,对提取的预定数量的特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
在上述步骤中,上述每个层级分类模型都将分别进行模型训练,将足够数量样本输入分类模型中,进行多轮的模型迭代,得到相应的分类模型。
在一种可选的实施例中,仍以2+8的层级分类模型进行说明,在训练两层的层级分类模型时,首先训练第一层。将样本的特征内容输入至第一层层级分类模型进行训练,模型训练结束后进行模型预测时可输出预测样本所属的章。同时将样本根据税则号的前两位划分到不同的章节中,再针对每个章节进行第二层层级分类模型的训练,得到第二层层级的分类模型。由此,得到最终的多层分类模型。
作为一种可选的实施例,步骤S4351,在商品样品的样品描述信息采用中文语言描述的情况下,提取预定数量的商品样品的样品描述信息的特征内容,包括:对样品描述信息的中文进行分词,得到多个词组;对得到的多个词组进行词组向量化,得到多个词向量;对得到的多个词向量进行文本向量化,得到样品描述信息对应的文本向量,其中,文本向量表征样品描述信息的特征内容。
具体的,对得到的多个词组进行词组向量化是一个将词表征为实数值向量的过程。以n-gram统计语言模型为例,假设当前词组的出现概率只与它前面的n-1个词有关,考虑最大化转移概率,该方法将词看做原子单位,相互独立,不考虑词之间的相似性,但效果受限于语料规模。而将词进行向量化,可以在不丢失信息的情况下降低维度,适应并行计算并可通过向量余弦夹角衡量词间的相似度。可用的表示方法包括one-hot表示法和distributed表示法。
作为一种可选的实施例,对样品描述信息的中文进行分词,得到多个词组,包括:对样品描述信息的中文进行分词后,对样品描述信息的中文进行预处理,其中,预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;获得进行预处理后得到的多个词组。
作为一种可选的实施例,上述样品的描述信息可以为历史人工数据中的文本信息(包括:商品名称、商品规格等)和税则说明书中的文本信息(包括商品描述、商品名称及备注),在将样品的样品描述信息和样品的税则号抽取出来之后,可以构成样本集合[(sentence,hscode),...],其中,sentence用于表征样品的样品描述信息,hscode用于表征样品的税则号。
在对样品描述信息的中文进行分词之后,还可以对分词后得到的词组进行过滤。过滤的过程可以包括:去除停用词,停用词几乎不带任何信息,如虚词、标点符号等;去掉高频词,这类词没有特殊性,如某些在大部分文本中都出现的单词;去掉低频词,这类词没有普适性,如只在一两个文本中出现的单词。由此,样本集合转化为[([word1,word2,word3,...],hscode),...]。(word1,word2,word3,……)即为对sentence进行分词后的结果。
对于分词后或过滤后得到的结果,可以通过word2vec/fasttext进行词向量的训练,需要将样本集合中的词组单独提取出来作为输入[([word1,word2,word3,...]),...],输出为词向量[(word1,vector1),(word2,vector2),...]。
对词组进行向量化则是将词组转化为实数值向量的过程。上述样本集合中每一个样本由词组及其类别组成,需要进行合理的转化为向量。转化的方式有多种,如averagepooling等。average pooling是指将文本中词组的词向量简单求平均的过程,计算过程如下公式所示:其中,C是文本中的word数,Vw是w的词向量。文本向量化后,样本集合转化为[(vector,hscode),...],也即,将词组word由对应的向量vector来表示。
作为一种可选的实施例,依据划分的层级自顶向下,步骤S433,根据获取的商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别包括:
步骤S4331,在商品描述信息采用中文语言描述的情况下,对获取的商品描述信息进行分词得到多个词组,对多个词组进行词组向量化得到多个词向量,对多个词向量进行文本向量化得到表征商品描述信息的文本向量。
具体的,文本向量化则是将词组转化为实数值向量的过程。上述样本集合中每一个样本由词组及其类别组成,其并不能作为多分类算法的输入,因此需要进行合理的转化,在经过文本向量化后,样本集合转化为[(vector,hscode),...]。
步骤S4333,根据得到的文本向量,以及层级对应的预先训练得到的层级分类模型,确定层级对应的层级类别。
在一种可选的实施例中,仍以2+8的层级分类模型进行说明,首先将商品描述信息输入至第一层层级分类模型,得到第一层层级分类模型的分类结果,由于每一个第一层层级分类模型的分类结果都对应一个第二层层级分类模型,因此根据第一层层级分类模型的分类结果,将商品的描述信息输入至对应的第二层层级分类模型。最后再将两层层级分类模型的分类结果进行合并或组合,得到商品最终的类别,以及商品对应的报关单。
作为一种可选的实施例,步骤S41,获取用户对商品进行描述的商品描述信息包括:
步骤S411,接收用户输入的选项输入信息,其中,选项输入信息为用户对商品的属性进行描述的信息。
步骤S413,根据接收的选项输入信息,确定用户对商品进行描述的商品描述信息。
在一种可选的实施例中,客户端向用户提供了多种用于选择属性信息的接口,每个接口都提供多种属性,发货人根据商品的实际情况对每个属性选择商品对应的选项,从而生成商品的描述信息。
作为一种可选的实施例,商品的属性包括以下至少之一:商品名称,商品描述,商品备注,其中,商品描述包括以下至少之一:厂家、规格型号、用途。对象描述还可以包括其它申报要素等。
作为一种可选的实施例,商品描述信息包括以下至少之一:商品的文本描述信息,商品的图像信息,商品的语音描述信息,商品的动画信息。
实施例3
根据本发明实施例,还提供了一种对象类别预测方法的实施例,图5是根据实施例3的一种对象类别预测方法的流程图,结合图5所示,该方法包括如下步骤:
步骤S51,获取待预测类别的对象的对象描述信息。
具体的,上述待预测类别的对象可以为需要进行通关的商品。
步骤S53,根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
此处需要说明的是,上述对象类别预测方法实现了通关商品的自动归类,从而可以根据商品的描述信息自动确定商品的税则号,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。使用上述实施例提供的方案,发货人只需简单填写商品描述,甚至只需要根据商品的实际情况对预设的选项进行选择,即可进行自动归类,无需翻阅税则书及其反复确认,也不需要具备专业的知识,降低了使用门槛,简化了整个申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
由此,上述方案解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
作为一种可选的实施例,步骤S53,根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测包括:
步骤S531,对待预测类别的对象的类别划分层级。步骤S533,依据划分的层级自顶向下,根据获取的对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测,其中,分类模型包括每层对应的层级分类模型。步骤S535,在对划分的所有层级的层级类别预测完成时得到对象的类别。
作为一种可选的实施例,在依据划分的层级自顶向下,根据获取的对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测之前,上述方法还包括:步骤S535,通过以下方式训练得到每层级对应的层级分类模型,步骤S433包括:
步骤S5351,提取预定数量的样品的样品描述信息的特征内容。
步骤S5353,对提取的预定数量的特征内容以及对应的对象类别进行训练得到每层级对应的层级分类模型。作为一种可选的实施例,步骤S5351,在样品的样品描述信息采用中文语言描述的情况下,提取预定数量的样品的样品描述信息的特征内容,包括:对样品描述信息的中文进行分词,得到多个词组;对得到的多个词组进行词组向量化,得到多个词向量;对得到的多个词向量进行文本向量化,得到样品描述信息对应的文本向量,其中,文本向量表征样品描述信息的特征内容。
作为一种可选的实施例,对样品描述信息的中文进行分词,得到多个词组,包括:对样品描述信息的中文进行分词后,对样品描述信息的中文进行预处理,其中,预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;获得进行预处理后得到的多个词组。作为一种可选的实施例,依据划分的层级自顶向下,步骤S533,根据获取的对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测,包括:
步骤S5331,在对象描述信息采用中文语言描述的情况下,对获取的对象描述信息进行分词得到多个词组,对多个词组进行词组向量化得到多个词向量,对多个词向量进行文本向量化得到表征对象描述信息的文本向量。
步骤S5333,根据得到的文本向量,以及层级对应的预先训练得到的层级分类模型,对层级对应的层级类别进行预测。
作为一种可选的实施例,步骤S51,获取待预测类别的对象的对象描述信息包括:
步骤S511,接收选项输入信息,其中,选项输入信息用于描述待预测类别的对象的属性。
步骤S513,根据接收的选项输入信息,确定待预测类别的对象的对象描述信息。
作为一种可选的实施例,对象的属性包括以下至少之一:对象名称,对象描述,对象备注。其中,对象描述包括以下至少之一:厂家、规格型号、用途,对象描述还可以包括其它申报要素等。
作为一种可选的实施例,对象描述信息包括以下至少之一:对象的文本描述信息,对象的图像信息,对象的语音描述信息,对象的动画信息。
实施例4
根据本发明实施例,还提供了一种对象处理方法的实施例,图6是根据实施例4的一种对象处理方法的流程图,结合图6所示,该方法包括:
步骤S61,接收对待处理对象进行处理的业务请求。
作为一种可选的实施例,上述业务请求包括以下至少之一:用于请求对待挂载对象进行挂载的挂载请求;用于请求对待出口对象进行出口的出品报关请求;用于请求对待进口对象进行进口的进口通关请求。
步骤S63,根据业务请求,显示用于提供对待处理对象的对象描述信息进行输入的输入区域。具体的,可以通过设置于终端的客户端为用户提供进行输入的输入区域。
步骤S65,接收在输入区域输入的对象描述信息。
具体的,上述对象可以是待预测类别的商品,对象描述信息可以包括:商品名称、厂家、规格型号、用途以及其它申报要素等。
步骤S67,根据接收的对象描述信息,以及预先训练的分类模型,对待处理对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
步骤S69,根据预测的类别,对待处理对象进行处理。
此处需要说明的是,上述对象类别预测方法实现了通关商品的自动归类,从而可以根据商品的描述信息自动确定商品的税则号,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。使用上述实施例提供的方案,发货人只需简单填写商品描述,甚至只需要根据商品的实际情况下对预设的选项进行选择,即可进行自动归类,无需翻阅税则书及其反复确认,也不需要具备专业的知识,降低了使用门槛,简化了整个申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
由此,上述方案解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
实施例5
根据本发明实施例,还提供了一种商品通关处理装置的实施例,图7是根据实施例5的一种商品通关处理装置的示意图,结合图7所示,该装置700包括:
第一获取模块70,用于获取用户对商品进行描述的商品描述信息。
确定模块72,用于基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别。
生成模块74,用于基于所述商品的类别,生成报关单。
作为一种可选的实施例,所述确定模块包括:
第一划分单元,用于对所述商品的类别划分层级。
第一确定单元,用于依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别,其中,所述分类模型包括每层对应的层级分类模型。
第一获得单元,用于在确定完划分的所有层级的层级类别时得到所述商品的类别。
作为一种可选的实施例,所述确定模块还包括:第一训练单元,用于在依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别之前,通过以下方式训练得到每层级对应的层级分类模型:
提取预定数量的商品样品的样品描述信息的特征内容。
对提取的所述预定数量的所述特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
作为一种可选的实施例,所述第一训练单元包括:
第一分词子单元,在所述商品样品的样品描述信息采用中文语言描述的情况下,对所述样品描述信息的中文进行分词,得到多个词组。
第一词向量化子单元,对得到的所述多个词组进行词组向量化,得到多个词向量。
第一文本向量子单元,对得到的所述多个词向量进行文本向量化,得到所述样品描述信息对应的文本向量,其中,所述文本向量表征所述样品描述信息的特征内容。
作为一种可选的实施例,所述第一分词子单元包括:
第一预处理次子单元,对所述样品描述信息的中文进行分词后,对所述样品描述信息的中文进行预处理,其中,所述预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词。
第一获得次子单元,获得进行预处理后得到的所述多个词组。
作为一种可选的实施例,所述第一确定单元包括:
第一处理子单元,在所述商品描述信息采用中文语言描述的情况下,对获取的所述商品描述信息进行分词得到多个词组,对所述多个词组进行词组向量化得到多个词向量,对所述多个词向量进行文本向量化得到表征所述商品描述信息的文本向量。
确定子单元,根据得到的所述文本向量,以及层级对应的预先训练得到的层级分类模型,确定层级对应的层级类别。
作为一种可选的实施例,所述第一获取模块包括:
第一接收单元,用于接收所述用户输入的选项输入信息,其中,所述选项输入信息为所述用户对所述商品的属性进行描述的信息。
第三确定单元,用于根据接收的所述选项输入信息,确定所述用户对所述商品进行描述的所述商品描述信息。
作为一种可选的实施例,所述商品的属性包括以下至少之一:
商品名称,商品描述,商品备注,其中,所述商品描述包括以下至少之一:厂家、规格型号、用途。
作为一种可选的实施例,所述商品描述信息包括以下至少之一:
商品的文本描述信息,商品的图像信息,商品的语音描述信息,商品的动画信息。
实施例6
根据本发明实施例,还提供了一种对象类别预测装置的实施例,图8是根据实施例6的一种对象类别预测装置,结合图8所示,该装置800包括:
第二获取模块80,用于获取待预测类别的对象的对象描述信息。
第一预测模块82,用于根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
作为一种可选的实施例,第一预测模块82包括:
第二划分单元,用于对待预测类别的对象的类别划分层级。
预测单元,用于依据划分的层级自顶向下,根据获取的对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测,其中,分类模型包括每层对应的层级分类模型。
第二获得单元,用于在对划分的所有层级的层级类别预测完成时得到对象的类别。
作为一种可选的实施例,还包括:第二训练单元,用于在依据划分的层级自顶向下,根据获取的对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测之前,通过以下方式训练得到每层级对应的层级分类模型:
提取预定数量的样品的样品描述信息的特征内容。
对提取的预定数量的特征内容以及对应的对象类别进行训练得到每层级对应的层级分类模型。
作为一种可选的实施例,第二训练单元包括:
第二分词子单元,用于在样品的样品描述信息采用中文语言描述的情况下,对样品描述信息的中文进行分词,得到多个词组。
第二词向量化子单元,用于对得到的多个词组进行词组向量化,得到多个词向量。
第二文本向量子单元,用于对得到的多个词向量进行文本向量化,得到样品描述信息对应的文本向量,其中,文本向量表征样品描述信息的特征内容。
作为一种可选的实施例,第二分词子单元包括:
第二预处理次子单元,用于对样品描述信息的中文进行分词后,对样品描述信息的中文进行预处理,其中,预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词。
第二获得次子单元,用于获得进行预处理后得到的多个词组。
作为一种可选的实施例,预测单元包括:
第二处理子单元,用于在对象描述信息采用中文语言描述的情况下,对获取的对象描述信息进行分词得到多个词组,对多个词组进行词组向量化得到多个词向量,对多个词向量进行文本向量化得到表征对象描述信息的文本向量。
预测子单元,用于根据得到的文本向量,以及层级对应的预先训练得到的层级分类模型,对层级对应的层级类别进行预测。
作为一种可选的实施例,第二获取模块包括:
第二接收单元,用于接收选项输入信息,其中,选项输入信息用于描述待预测类别的对象的属性。
第四确定单元,用于根据接收的选项输入信息,确定待预测类别的对象的对象描述信息。
作为一种可选的实施例,对象的属性包括以下至少之一:对象名称,对象描述,对象备注。其中,对象描述可以包括以下至少之一:厂家、规格型号、用途,还可以包括其它申报要素等。
作为一种可选的实施例,对象描述信息包括以下至少之一:对象的文本描述信息,对象的图像信息,对象的语音描述信息,对象的动画信息。
实施例7
根据本发明实施例,还提供了一种对象类别预测装置的实施例,图9是根据实施例7的一种对象类别预测装置,结合图9所示,该装置900包括:
第一接收模块90,用于接收对待处理对象进行处理的业务请求。
显示模块92,用于根据业务请求,显示用于提供对待处理对象的对象描述信息进行输入的输入区域。
第二接收模块94,用于接收在输入区域输入的对象描述信息。
第二预测模块96,用于根据接收的对象描述信息,以及预先训练的分类模型,对待处理对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
处理模块98,用于根据预测的类别,对待处理对象进行处理。
作为一种可选的实施例,业务请求包括以下至少之一:用于请求对待挂载对象进行挂载的挂载请求;用于请求对待出口对象进行出口的出品报关请求;用于请求对待进口对象进行进口的进口通关请求。
实施例8
根据本发明实施例,还提供了一种系统,图10是根据本申请实施例6的一种系统的示意图,结合图10所示,该系统包括:
处理器100;以及
存储器102,与处理器连接,用于为处理器提供处理以下处理步骤的指令:
步骤1,获取待预测类别的对象的对象描述信息;
步骤2,根据获取的对象描述信息,以及预先训练的分类模型,对待预测类别的对象的类别进行预测,其中,分类模型依据样品的样品描述信息以及对应的样品的对象类别训练得到。
具体的,上述存储器还可以为处理器提供实施例2中的其他步骤,此处不再赘述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例9
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的商品通关处理方法中以下步骤的程序代码:获取用户对商品进行描述的商品描述信息;基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别;基于商品的类别,生成报关单。
可选地,图11是根据本申请实施例9的一种计算机终端的结构框图。如图9示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1102、存储器1104、以及外设接口1106。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的商品通关处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的商品通关处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取用户对商品进行描述的商品描述信息;基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别;基于商品的类别,生成报关单。
可选的,上述处理器还可以执行如下步骤的程序代码:对商品的类别划分层级;依据划分的层级自顶向下,根据获取的商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别,其中,分类模型包括每层对应的层级分类模型;在确定完划分的所有层级的层级类别时得到商品的类别。
可选的,上述处理器还可以执行如下步骤的程序代码:提取预定数量的商品样品的样品描述信息的特征内容;对提取的预定数量的特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
可选的,上述处理器还可以执行如下步骤的程序代码:对样品描述信息的中文进行分词,得到多个词组;对得到的多个词组进行词组向量化,得到多个词向量;对得到的多个词向量进行文本向量化,得到样品描述信息对应的文本向量,其中,文本向量表征样品描述信息的特征内容。
可选的,上述处理器还可以执行如下步骤的程序代码:对样品描述信息的中文进行分词后,对样品描述信息的中文进行预处理,其中,预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;获得进行预处理后得到的多个词组。
可选的,上述处理器还可以执行如下步骤的程序代码:在商品描述信息采用中文语言描述的情况下,对获取的商品描述信息进行分词得到多个词组,对多个词组进行词组向量化得到多个词向量,对多个词向量进行文本向量化得到表征商品描述信息的文本向量;根据得到的文本向量,以及层级对应的预先训练得到的层级分类模型,确定层级对应的层级类别。
可选的,上述处理器还可以执行如下步骤的程序代码:接收用户输入的选项输入信息,其中,选项输入信息为用户对商品的属性进行描述的信息;根据接收的选项输入信息,确定用户对商品进行描述的商品描述信息。
可选的,上述处理器还可以执行如下步骤的程序代码:商品名称,商品描述,商品备注,其中,商品描述包括以下至少之一:厂家、规格型号、用途。
可选的,上述处理器还可以执行如下步骤的程序代码:商品描述信息包括以下至少之一:商品的文本描述信息,商品的图像信息,商品的语音描述信息,商品的动画信息。
上述商品通关处理方法实现了通关商品的自动归类,并生成对应的报关单,可应用于各种通关业务场景,如跨境电商海淘商品挂载、外贸服务平台商品出口报关、进出口代理企业通关申报等。使用上述实施例提供的方案,发货人只需简单填写商品描述,甚至只需要根据商品的实际情况下对预设的选项进行选择,即可进行自动归类,无需翻阅税则书及其反复确认,也不需要具备专业的知识,降低了使用门槛,简化了整个申报流程;同时降低了归类的错误率,提高了通关申报的效率,极大地方便了用户。
采用本发明实施例,提供了一种商品通关处理方法。获取用户对商品进行描述的商品描述信息;基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别;基于商品的类别,生成报关单。上述方案实现了对象的类别待预测,从而实现了通关商品的自动归类,进而解决了相关技术中由人工填写HSCode导致对象类别确定效率低的技术问题。
本领域普通技术人员可以理解,图11所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例8
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的商品通关处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取用户对商品进行描述的商品描述信息;基于商品描述信息,利用预先训练得到的分类模型,确定商品的类别;基于商品的类别,生成报关单。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (20)

1.一种商品通关处理方法,其特征在于,包括:
获取用户对商品进行描述的商品描述信息;
基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别;
基于所述商品的类别,生成报关单。
2.根据权利要求1所述的方法,其特征在于,基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别包括:
对所述商品的类别划分层级;
依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别,其中,所述分类模型包括每层对应的层级分类模型;
在确定完划分的所有层级的层级类别时得到所述商品的类别。
3.根据权利要求2所述的方法,其特征在于,在依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别之前,还包括:通过以下方式训练得到每层级对应的层级分类模型:
提取预定数量的商品样品的样品描述信息的特征内容;
对提取的所述预定数量的所述特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
4.根据权利要求3所述的方法,其特征在于,在所述商品样品的样品描述信息采用中文语言描述的情况下,提取所述预定数量的所述商品样品的样品描述信息的特征内容,包括:
对所述样品描述信息的中文进行分词,得到多个词组;
对得到的所述多个词组进行词组向量化,得到多个词向量;
对得到的所述多个词向量进行文本向量化,得到所述样品描述信息对应的文本向量,其中,所述文本向量表征所述样品描述信息的特征内容。
5.根据权利要求4所述的方法,其特征在于,对所述样品描述信息的中文进行分词,得到所述多个词组,包括:
对所述样品描述信息的中文进行分词后,对所述样品描述信息的中文进行预处理,其中,所述预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;
获得进行预处理后得到的所述多个词组。
6.根据权利要求2所述的方法,其特征在于,依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别包括:
在所述商品描述信息采用中文语言描述的情况下,对获取的所述商品描述信息进行分词得到多个词组,对所述多个词组进行词组向量化得到多个词向量,对所述多个词向量进行文本向量化得到表征所述商品描述信息的文本向量;
根据得到的所述文本向量,以及层级对应的预先训练得到的层级分类模型,确定层级对应的层级类别。
7.根据权利要求1所述的方法,其特征在于,获取所述用户对所述商品进行描述的所述商品描述信息包括:
接收所述用户输入的选项输入信息,其中,所述选项输入信息为所述用户对所述商品的属性进行描述的信息;
根据接收的所述选项输入信息,确定所述用户对所述商品进行描述的所述商品描述信息。
8.根据权利要求7所述的方法,其特征在于,所述商品的属性包括以下至少之一:
商品名称,商品描述,商品备注,其中,所述商品描述包括以下至少之一:厂家、规格型号、用途。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述商品描述信息包括以下至少之一:
商品的文本描述信息,商品的图像信息,商品的语音描述信息,商品的动画信息。
10.一种对象类别预测方法,其特征在于,包括:
获取待预测类别的对象的对象描述信息;
根据获取的所述对象描述信息,以及预先训练的分类模型,对所述待预测类别的对象的类别进行预测,其中,所述分类模型依据样品的样品描述信息以及对应的所述样品的对象类别训练得到。
11.根据权利要求10所述的方法,其特征在于,根据获取的所述对象描述信息,以及预先训练的所述分类模型,对所述待预测类别的对象的类别进行预测包括:
对所述待预测类别的对象的类别划分层级;
依据划分的层级自顶向下,根据获取的所述对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测,其中,所述分类模型包括每层对应的层级分类模型;
在对划分的所有层级的层级类别预测完成时得到所述对象的类别。
12.根据权利要求11所述的方法,其特征在于,在依据划分的层级自顶向下,根据获取的所述对象描述信息,以及层级对应的预先训练的层级分类模型,对层级对应的层级类别进行预测之前,还包括:通过以下方式训练得到每层级对应的层级分类模型:
提取预定数量的所述样品的样品描述信息的特征内容;
对提取的所述预定数量的所述特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
13.根据权利要求12所述的方法,其特征在于,在所述样品的样品描述信息采用中文语言描述的情况下,提取所述预定数量的所述样品的样品描述信息的特征内容,包括:
对所述样品描述信息的中文进行分词,得到多个词组;
对得到的所述多个词组进行词组向量化,得到多个词向量;
对得到的所述多个词向量进行文本向量化,得到所述样品描述信息对应的文本向量,其中,所述文本向量表征所述样品描述信息的特征内容。
14.根据权利要求13所述的方法,其特征在于,对所述样品描述信息的中文进行分词,得到所述多个词组,包括:
对所述样品描述信息的中文进行分词后,对所述样品描述信息的中文进行预处理,其中,所述预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;
获得进行预处理后得到的所述多个词组。
15.根据权利要求10所述的方法,其特征在于,获取所述待预测类别的对象的所述对象描述信息包括:
接收选项输入信息,其中,所述选项输入信息用于描述所述待预测类别的对象的属性;
根据接收的所述选项输入信息,确定所述待预测类别的对象的所述对象描述信息。
16.一种对象处理方法,其特征在于,包括:
接收对待处理对象进行处理的业务请求;
根据所述业务请求,显示用于提供对所述待处理对象的对象描述信息进行输入的输入区域;
接收在所述输入区域输入的对象描述信息;
根据接收的所述对象描述信息,以及预先训练的分类模型,对所述待处理对象的类别进行预测,其中,所述分类模型依据样品的样品描述信息以及对应的所述样品的对象类别训练得到;
根据预测的所述类别,对所述待处理对象进行处理。
17.根据权利要求16所述的方法,其特征在于,所述业务请求包括以下至少之一:
用于请求对待挂载对象进行挂载的挂载请求;
用于请求对待出口对象进行出口的出品报关请求;
用于请求对待进口对象进行进口的进口通关请求。
18.一种商品通关处理装置,其特征在于,包括:
第一获取模块,用于获取用户对商品进行描述的商品描述信息;
确定模块,用于基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别;
生成模块,用于基于所述商品的类别,生成报关单。
19.一种对象类别预测装置,其特征在于,包括:
第二获取模块,用于获取待预测类别的对象的对象描述信息;
第一预测模块,用于根据获取的所述对象描述信息,以及预先训练的分类模型,对所述待预测类别的对象的类别进行预测,其中,所述分类模型依据样品的样品描述信息以及对应的所述样品的对象类别训练得到。
20.一种对象处理装置,其特征在于,包括:
第一接收模块,用于接收对待处理对象进行处理的业务请求;
显示模块,用于根据所述业务请求,显示用于提供对所述待处理对象的对象描述信息进行输入的输入区域;
第二接收模块,用于接收在所述输入区域输入的对象描述信息;
第二预测模块,用于根据接收的所述对象描述信息,以及预先训练的分类模型,对所述待处理对象的类别进行预测,其中,所述分类模型依据样品的样品描述信息以及对应的所述样品的对象类别训练得到;
处理模块,用于根据预测的所述类别,对所述待处理对象进行处理。
CN201710910632.5A 2017-09-29 2017-09-29 商品通关处理、对象的处理及其类别预测方法和装置 Active CN109598517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710910632.5A CN109598517B (zh) 2017-09-29 2017-09-29 商品通关处理、对象的处理及其类别预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710910632.5A CN109598517B (zh) 2017-09-29 2017-09-29 商品通关处理、对象的处理及其类别预测方法和装置

Publications (2)

Publication Number Publication Date
CN109598517A true CN109598517A (zh) 2019-04-09
CN109598517B CN109598517B (zh) 2023-09-12

Family

ID=65955404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710910632.5A Active CN109598517B (zh) 2017-09-29 2017-09-29 商品通关处理、对象的处理及其类别预测方法和装置

Country Status (1)

Country Link
CN (1) CN109598517B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062786A (zh) * 2019-12-25 2020-04-24 创新奇智(青岛)科技有限公司 一种基于建立商品外观特征映射表的模型更新方法
CN111221970A (zh) * 2019-12-31 2020-06-02 论客科技(广州)有限公司 基于行为结构和语义内容联合分析的邮件分类方法及装置
CN111667235A (zh) * 2020-05-18 2020-09-15 上海兴亚报关有限公司 一种报关信息管理方法、系统、装置及存储介质
CN111737465A (zh) * 2020-06-15 2020-10-02 上海理想信息产业(集团)有限公司 一种多层级多类别的中文文本分类的实现方法及装置
CN112395429A (zh) * 2020-12-02 2021-02-23 上海三稻智能科技有限公司 基于图神经网络的hs编码判定、推送、应用方法、系统及存储介质
CN113361787A (zh) * 2021-06-11 2021-09-07 上海跨境电子商务公共服务有限公司 商品归类系统、方法、存储介质及终端
CN113744006A (zh) * 2020-05-29 2021-12-03 北京达佳互联信息技术有限公司 类目推荐方法、装置、电子设备及存储介质
CN116166805A (zh) * 2023-02-24 2023-05-26 北京青萌数海科技有限公司 一种预测商品编码的方法和装置

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1534526A (zh) * 2003-03-29 2004-10-06 鸿富锦精密工业(深圳)有限公司 Edi报关管理申报系统及方法
US20100131379A1 (en) * 2008-11-25 2010-05-27 Marc Dorais Managing consistent interfaces for merchandise and assortment planning business objects across heterogeneous systems
US20120246293A1 (en) * 2011-03-23 2012-09-27 Douglas De Jager Fast device classification
CN103646343A (zh) * 2013-12-18 2014-03-19 世纪禾光科技发展(北京)有限责任公司 一种基于文本的商品分类处理方法及其系统
US20140114979A1 (en) * 2011-08-03 2014-04-24 Tencent Technology (Shenzhen) Company Limited Method and apparatus for classifying commodities on e-commerce platform
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
CN105354194A (zh) * 2014-08-19 2016-02-24 上海中怡通信息科技有限公司 商品智能归类方法和系统
US20160070731A1 (en) * 2014-09-10 2016-03-10 Adobe Systems Incorporated Analytics based on scalable hierarchical categorization of web content
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
CN106326346A (zh) * 2016-08-06 2017-01-11 上海高欣计算机系统有限公司 文本分类方法及终端设备
CN106339718A (zh) * 2016-08-18 2017-01-18 苏州大学 一种基于神经网络的分类方法及装置
KR20170026264A (ko) * 2015-08-26 2017-03-08 옴니어스 주식회사 상품 영상 검색 및 시스템
CN106845930A (zh) * 2016-12-30 2017-06-13 宁波贤晟信息技术有限公司 一种报关数据处理系统
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法
WO2017113232A1 (zh) * 2015-12-30 2017-07-06 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
CN106997350A (zh) * 2016-01-22 2017-08-01 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN107103514A (zh) * 2017-04-25 2017-08-29 北京京东尚科信息技术有限公司 商品性别标签确定方法和装置
CN107133854A (zh) * 2017-05-26 2017-09-05 北京小度信息科技有限公司 信息推荐方法和装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1534526A (zh) * 2003-03-29 2004-10-06 鸿富锦精密工业(深圳)有限公司 Edi报关管理申报系统及方法
US20100131379A1 (en) * 2008-11-25 2010-05-27 Marc Dorais Managing consistent interfaces for merchandise and assortment planning business objects across heterogeneous systems
US20120246293A1 (en) * 2011-03-23 2012-09-27 Douglas De Jager Fast device classification
US20140114979A1 (en) * 2011-08-03 2014-04-24 Tencent Technology (Shenzhen) Company Limited Method and apparatus for classifying commodities on e-commerce platform
CN103646343A (zh) * 2013-12-18 2014-03-19 世纪禾光科技发展(北京)有限责任公司 一种基于文本的商品分类处理方法及其系统
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
CN105354194A (zh) * 2014-08-19 2016-02-24 上海中怡通信息科技有限公司 商品智能归类方法和系统
US20160070731A1 (en) * 2014-09-10 2016-03-10 Adobe Systems Incorporated Analytics based on scalable hierarchical categorization of web content
KR20170026264A (ko) * 2015-08-26 2017-03-08 옴니어스 주식회사 상품 영상 검색 및 시스템
WO2017113232A1 (zh) * 2015-12-30 2017-07-06 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
CN106997350A (zh) * 2016-01-22 2017-08-01 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
CN106326346A (zh) * 2016-08-06 2017-01-11 上海高欣计算机系统有限公司 文本分类方法及终端设备
CN106339718A (zh) * 2016-08-18 2017-01-18 苏州大学 一种基于神经网络的分类方法及装置
CN106845930A (zh) * 2016-12-30 2017-06-13 宁波贤晟信息技术有限公司 一种报关数据处理系统
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法
CN107103514A (zh) * 2017-04-25 2017-08-29 北京京东尚科信息技术有限公司 商品性别标签确定方法和装置
CN107133854A (zh) * 2017-05-26 2017-09-05 北京小度信息科技有限公司 信息推荐方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062786A (zh) * 2019-12-25 2020-04-24 创新奇智(青岛)科技有限公司 一种基于建立商品外观特征映射表的模型更新方法
CN111221970A (zh) * 2019-12-31 2020-06-02 论客科技(广州)有限公司 基于行为结构和语义内容联合分析的邮件分类方法及装置
CN111667235A (zh) * 2020-05-18 2020-09-15 上海兴亚报关有限公司 一种报关信息管理方法、系统、装置及存储介质
CN113744006A (zh) * 2020-05-29 2021-12-03 北京达佳互联信息技术有限公司 类目推荐方法、装置、电子设备及存储介质
CN111737465A (zh) * 2020-06-15 2020-10-02 上海理想信息产业(集团)有限公司 一种多层级多类别的中文文本分类的实现方法及装置
CN112395429A (zh) * 2020-12-02 2021-02-23 上海三稻智能科技有限公司 基于图神经网络的hs编码判定、推送、应用方法、系统及存储介质
CN113361787A (zh) * 2021-06-11 2021-09-07 上海跨境电子商务公共服务有限公司 商品归类系统、方法、存储介质及终端
CN116166805A (zh) * 2023-02-24 2023-05-26 北京青萌数海科技有限公司 一种预测商品编码的方法和装置
CN116166805B (zh) * 2023-02-24 2023-09-22 北京青萌数海科技有限公司 一种预测商品编码的方法和装置

Also Published As

Publication number Publication date
CN109598517B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN109598517A (zh) 商品通关处理、对象的处理及其类别预测方法和装置
CN109493166B (zh) 一种针对电子商务导购场景任务型对话系统的构建方法
CN108304468B (zh) 一种文本分类方法以及文本分类装置
CN110032632A (zh) 基于文本相似度的智能客服问答方法、装置及存储介质
CN107180023B (zh) 一种文本分类方法及系统
EP4009219A1 (en) Analysis of natural language text in document using hierarchical graph
CN108509413A (zh) 文摘自动提取方法、装置、计算机设备及存储介质
CN110619051B (zh) 问题语句分类方法、装置、电子设备及存储介质
CN109492222A (zh) 基于概念树的意图识别方法、装置及计算机设备
CN110457708A (zh) 基于人工智能的词汇挖掘方法、装置、服务器及存储介质
CN108304373A (zh) 语义词典的构建方法、装置、存储介质和电子装置
CN113254643B (zh) 文本分类方法、装置、电子设备和
CN108108347B (zh) 对话模式分析系统及方法
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN114330354B (zh) 一种基于词汇增强的事件抽取方法、装置及存储介质
CN114911945A (zh) 基于知识图谱的多价值链数据管理辅助决策模型构建方法
CN110457470A (zh) 一种文本分类模型学习方法及装置
CN109447273A (zh) 模型训练方法、广告推荐方法、相关装置、设备及介质
CN113449084A (zh) 基于图卷积的关系抽取方法
CN114997288A (zh) 一种设计资源关联方法
CN109471953A (zh) 一种语音数据检索方法及终端设备
CN111428486B (zh) 物品信息数据处理方法、装置、介质及电子设备
CN110874408B (zh) 模型训练方法、文本识别方法、装置及计算设备
CN116644148A (zh) 关键词识别方法、装置、电子设备及存储介质
CN115357720B (zh) 基于bert的多任务新闻分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant