CN115222463A - 数据处理方法、装置、电子设备和存储介质 - Google Patents

数据处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115222463A
CN115222463A CN202110343766.XA CN202110343766A CN115222463A CN 115222463 A CN115222463 A CN 115222463A CN 202110343766 A CN202110343766 A CN 202110343766A CN 115222463 A CN115222463 A CN 115222463A
Authority
CN
China
Prior art keywords
feature
commodity
information
determining
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110343766.XA
Other languages
English (en)
Inventor
王冠颖
张振华
戈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Cainiao Smart Logistics Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cainiao Smart Logistics Holding Ltd filed Critical Cainiao Smart Logistics Holding Ltd
Priority to CN202110343766.XA priority Critical patent/CN115222463A/zh
Publication of CN115222463A publication Critical patent/CN115222463A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种数据处理方法,所述的方法包括:依据商品的商品信息,在第一特征空间中确定第一特征向量;依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量;依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系;该方法能够提升对商品的分类效率。

Description

数据处理方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备和一种存储介质。
背景技术
在一些场景中,通常需要对商品进行归类,并按照商品所属的类别,对商品进行相应的处理。例如,在海关进出口的场景中,通常需要对商品进行归类,并按照商品所属的类别,确定商品的税率,以对商品进行征税。
目前,通常采用人工归类的方式,对商品进行分类,例如,在海关进出口的场景中,通常通过人工识别商品的各项特征(如商品类型、商品属性、商品计量方式等),并按照海关进出口的税则对商品进行归类,确定相应的商品海关编号,以按照商品海关编号确定商品的税率。
但是采用人工归类的方式,对于一项商品通常需要十五分钟左右的时间进行分类,对商品的分类效率低。
发明内容
本申请实施例提供了一种数据处理方法,以提升对商品的分类效率。
相应的,本申请实施例还提供了一种数据处理装置、一种电子设备和一种存储介质,用以保证上述系统的实现及应用。
为了解决上述问题,本申请实施例公开了一种数据处理方法,所述的方法包括:依据商品的商品信息,在第一特征空间中确定第一特征向量;依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量;依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。
为了解决上述问题,本申请实施例公开了一种数据处理方法,所述的方法包括:获取商品信息,并依据特征提取模型进行特征提取,确定对应第一特征空间的第一特征向量;按照第一特征空间与第二特征空间之间的映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,所述第二特征空间依据商品的编码信息和编码描述信息进行特征提取后确定;确定第二特征空间中组成第二特征向量的目标属性节点,并确定编码结果,所述属性节点包括用于组成编码结果的属性码。
为了解决上述问题,本申请实施例公开了一种数据处理装置,所述装置包括:第一特征获取模块,用于依据商品的商品信息,在第一特征空间中确定第一特征向量;第二特征获取模块,用于依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量;映射关系获取模块,用于依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。
为了解决上述问题,本申请实施例公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如上述实施例中一个或多个所述的方法。
为了解决上述问题,本申请实施例公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如上述实施例中一个或多个所述的方法。
与现有技术相比,本申请实施例包括以下优点:
本申请实施例中,可以依据已分类的商品的商品信息,生成对应第一特征空间的第一特征向量,依据已分类的商品的编码信息和编码描述信息,在第二特征空间中生成第二特征向量;之后,依据第一特征向量和第二特征向量,建立第一特征空间与第二特征空间之间的映射关系,以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。相比于采用人工分类的方式,本申请实施例可以利用第一特征空间和第二特征空间之间的映射关系,更加高效的确定待分类的商品所对应的编码结果(分类)。
附图说明
图1是本申请一个实施例的数据处理方法的流程示意图;
图2是本申请另一个实施例的数据处理方法的流程示意图;
图3是本申请再一个实施例的数据处理方法的流程示意图;
图4是本申请再一个实施例的数据处理方法的流程示意图;
图5是本申请一个实施例的数据处理装置的结构示意图;
图6是本申请另一个实施例的数据处理装置的结构示意图;
图7是本申请一个实施例提供的示例性装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例可以应用在商品分类领域,商品分类是指按照预设的分类规则,对商品的各类属性进行分析,从而确定商品的归类信息,以按照归类信息,对商品采取相应的处理。例如,在海关商品分类的场景中,可以按照海关商品的分类规则,对海关商品进行分类,并依据海关商品的分类,确定相应的税率,以确定相应的税费。
本申请实施例可以依据已经分类后的商品信息,建立对应商品特征的第一特征空间,并依据商品的归类信息和归类描述信息,建立对应商品属性的第二特征空间,之后为第一特征空间和第二特征空间之间建立映射关系。从而利用映射关系,为待分类的商品进行分类处理。
如图1所示,本申请实施例可以划分为准备过程和归类过程,其中,准备过程是指确定第一特征空间和第二特征空间之间映射关系的过程,准备过程可以包括三个阶段,分别为:建立第一特征空间的第一阶段、建立第二特征空间的第二阶段和建立映射关系的第三阶段。归类过程是指依据映射关系对待分类的商品进行分类的过程。
具体来说,在准备过程的第一阶段中,可以获取已分类的商品的商品信息,并基于特征提取模型提取商品信息中的商品特征,作为第一特征向量,并添加到第一特征空间中。其中,商品信息可以包括商品名称、商品规格和商品说明信息中的至少一种,对于不同类的商品信息,可以采用相应的数据处理方式进行数据处理,从而确定商品特征,举例来说,对于商品名称来说,可以对商品名称进行分词处理,从而确定商品特征;对于商品规格来说,可以对商品规格进行归一化处理,从而确定商品特征;对于商品说明信息来说,可以进行实体识别,并依据提取出的实体确定商品特征。
在准备过程的第二阶段中,可以获取已分类的商品的编码信息和编码描述信息,之后,一方面可以确定编码信息包含的属性码,另一方面可以对编码描述信息间正则抽取,得到属性项(property)和属性值(value),作为结构化数据,进而依据结构化数据在第二特征空间中建立节点,并在属性节点中添加属性值和属性码,进而依据编码信息筛选出相应的属性节点,并添加连接边,形成第二特征向量。商品的编码信息表征商品所属的类别,例如,在十位商品海关编码(The Harmonization System Code,HScode)中,HScode是对各种不同商品出入境应征/应退关税税率进行量化管理的制度。HS编码共22大类98章,每个HScode对应着海关定义的一种货品,该定义与货物的具体种类和详细属性有关。具体的,HScode前两位数字表征商品所属的章节,第三至第六位的四位数字表征商品所属的税目,后六位表征商品所属的子目。商品的编码描述信息为对该商品的属性的描述,在海关商品分类的场景中,商品的编码信息可以理解为税则描述,例如,对商品1的编码描述信息可以为“以重量计的唇用化妆品”。商品的结构化数据中属性值可以理解为对属性项的描述,如属性项和属性值可以为“品名(属性项):唇膏(属性值)”。
在准备过程的第三阶段中,可以依据第一特征向量与第二特征向量之间的对应关系,建立第一特征空间与第二特征空间之间的映射关系,具体的,在一个可选的实施例中,可以将第一特征空间内的第一特征向量映射到映射层中,将第二特征空间内的第二特征向量映射到映射层中,进而确定两个特征之间的相似度,从而得到映射关系。在另一个可选的实施例中,可以将第一特征空间内的第一特征向量映射到第二特征空间内,从而确定映射关系。在另一个可选的实施例中,可以将第二特征空间内的第二特征向量映射到第一特征空间中,从而确定映射关系。
在准备过程完成之后,可以对待归类的商品进行归类过程,具体的,可以获取待分类的商品的商品信息,并依据特征提取模型进行特征提取,确定对应第一特征空间的第一特征向量,并按照第一特征空间和第二特征空间之间的映射关系,确定对应的第二特征向量。然后确定组成第二特征向量的目标属性节点,并获取各目标属性节点的属性码,组合成为编码结果,其中,编码结果对应商品的分类,以便按照编码结果对商品采取相应的处理。具体的,在海关进出口的场景中,可以确定待分类商品对应的商品海关编码,进而确定相应的税率,并按照税率进行纳税。另外,为了方便确定待分类商品所属的分类,本申请实施例还可以在属性节点中加入属性码说明信息,以便利用属性码说明信息来对商品所属的分类进行说明,便于了解商品的归类原因。
本申请实施例中,可以依据已分类的商品的商品信息,生成对应第一特征空间的第一特征向量,依据已分类的商品的编码信息和编码描述信息,在第二特征空间中生成第二特征向量;之后,依据第一特征向量和第二特征向量,建立第一特征空间与第二特征空间之间的映射关系。以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。相比于采用人工分类的方式,本申请实施例可以利用第一特征空间和第二特征空间之间的映射关系,更加高效的确定待分类的商品所对应的编码结果(分类)。
另外,部分方案也会采用商品的编码和商品信息来训练分类模型,以通过分类模型来对待分类的商品进行分类。但是采用该方案训练出的分类模型通常只能够对分类模型训练过程中识别过的商品进行识别分类,对于分类模型未识别过的商品则无法进行识别。而本申请实施例可以将编码描述信息拆分为多个属性节点的组合,从而能够对模型未识别过的商品进行识别,确定其相似的分类编码并输出,工作人员可以按照该分类编号来为待分类的商品进行归类,能够提升商品的分类效率。举例来说,部分方案可以依据已编号的商品11(编码为:3304990039)来训练分类模型,在使用该分类模型对编码为3304990029的商品12进行识别时,由于该分类模型并未采用商品12进行模型的训练,即分类模型中不存在商品12对应的编号(或称类别、分类),因此,该分类模型可能无法确定商品12的编码。而采用本申请实施例的方式,可以将商品11切分,得到三个属性节点,分别对应编码3304990039中的33、0499和990039三个属性,从而训练分类模型。在采用该分类模型进行商品12(编号为:3304990029)的识别过程,可以基于属性节点1(对应33)和属性节点2(对应0499),识别出商品12与商品11共有的两个属性,并输出。分类人员可以按照分类模型识别出的属性,进一步对该商品12进行分类,得到商品12的编码结果,以便对商品12进行处理。
本申请实施例是对于商品分类的准备阶段进行的优化处理,因此,本申请实施例可以应用在各类对于商品进行分类的场景中,例如,本申请实施例可以应用在海关商品分类的场景中,还可以应用在进行国内物流的商品分类的场景中,还可以应用在对电商商品的分类场景中,还可以应用在对二手商品的分类场景中。
举例来说,在对海关商品分类的场景中,本申请实施例可以在准备过程中,依据已通关的商品的商品信息,确定第一特征空间中的第一特征向量;依据已通关的商品的编码信息(商品海关编码)和编码描述信息,确定第二特征空间中的第二特征向量,进而确定第一特征空间和第二特征空间之间的映射关系。在对海关商品进行分类的过程中,可以依据海关商品的商品信息(如商品名称、商品规格、商品说明信息),提取相应的特征,确定对应第一特征空间的第一特征向量,然后依据第一特征空间和第二特征空间之间的映射关系,确定对应的第二特征向量,从而更加快速的得到相应的编码结果(商品海关编码),以便依据商品海关编码,确定相应的税率,并按照税率进行纳税。
再举例来说,对于国内物流领域内的商品,在物流过程中可能需要对商品进行分类存储,如一些医药类、食用类商品可能需要在冷冻的条件下运输,本申请实施例可以依据已经分类后的商品确定第一特征空间和第二特征空间,并建立映射关系,从而依据映射关系,对物流的商品进行分类,并按照分类对物流的商品采取相应的物流方式,便于进行商品的物流。
再举例来说,本申请实施例可以应用在对电商商品(或二手商品)进行分类的场景中,本申请实施例可以采集发布在电商平台上的电商商品的商品信息,确定第一特征空间和第二特征空间,并建立映射关系,从而依据映射关系,在电商商品的发布过程中,采集待发布的电商商品的商品信息(如依据商品外观图像确定的商品名、商品规格、商品说明等),确定电商商品所述的分类,进而按照电商商品的分类,形成电商商品的发布参考信息,便于用户发布商品。
本申请实施例提供一种数据处理方法,本方法对应准备过程,可以通过服务端来执行,能够依据已分类的商品的商品信息建立第一特征空间,依据已分类的商品的编码信息和编码描述信息,建立第二特征空间,并确定第一特征空间和第二特征空间之间的映射关系,以便依据该映射关系,更加高效的进行商品的分类。具体来说,如图2所示,所述方法包括:
步骤202、依据商品的商品信息,在第一特征空间中确定第一特征向量。商品的商品信息可以包括商品名称、商品规格和商品说明信息中的至少一个。在一个可选的实施例中,本申请实施例可以拍摄商品的商品图像,并依据商品的商品图像来进行文字识别,提取商品名称、商品规格和商品说明信息。在另一个可选的实施例中,本申请实施例可以提供商品信息上传页面,以接收编辑的商品信息。在另一个可选的实施例中,本申请实施例可以拍摄商品的商品图像,并依据商品图像进行文字识别,提取商品名称和商品规格等信息,进而依据商品名称、商品规格进行检索,获得商品相关的商品说明信息。在另一个可选的实施例中,商品信息也可以通过扫描商品的信息码来获取,信息码可以为商品的一维条码、二维码等。
对于商品的商品信息,可以提取商品信息中的目标信息(或称关键信息、特征信息),并将目标信息输入到特征提取模型中,得到相应的特征向量。具体的,作为一个可选的实施例,所述依据商品的商品信息,在第一特征空间中确定第一特征向量,包括:确定商品信息所属的分类,并按照对应的类别对商品信息进行处理,得到商品信息向量;将各商品信息向量进行拼接,并输入到特征提取模型中,确定第一特征向量,并添加到第一特征空间中。可以判断商品信息的类别时属于商品名称分类、商品规格分类和商品说明分类中的哪一类,进而按照对应的类别,采取相应的数据处理方式,确定相应的商品信息向量,进而将各类别的商品信息向量进行拼接,并输入到特征提取模型中进行特征提取,得到对应第一特征空间的第一特征向量。
本申请实施例可以预先设置多种不同的数据处理方式,以对各类型的商品信息进行数据处理,以便提取特征。具体的,作为一个可选的实施例,所述按照对应的类别对商品信息进行处理,得到商品信息向量,包括:在所述商品信息属于商品名称分类时,对商品名称进行分词处理,得到名称向量,作为商品信息向量;在所述商品信息属于商品规格分类时,对商品规格进行归一化,得到规格向量,作为商品信息向量;在所述商品信息属于商品说明分类时,对商品说明信息进行实体识别,并依据提取出的实体确定实体向量,作为商品信息向量。
数据处理方式可以包括分词处理、归一化处理、和实体识别处理中的至少一种,其中,分词处理是指将由多个字组成的数据切分为词组,分词处理可以先将由多个字组成的数据切分为单个字,再对相邻的字进行词法分析,进而确定相邻的字是否可以组合成为词组。本申请实施例可以预先训练分词处理模型,以通过分词处理模型对商品名称进行处理,提取其中的名称词组,作为名称向量。归一化处理可以理解为将不同单位的多个数据重新归一为统一单位的数据,例如,对于100毫升和1升的两个数据,可以划分为0.1升和1升,得到归一化的数据。实体识别是指从数据中提取出实体的过程,实体可以理解为人名、地名等实体。本申请实施例可以预先训练实体提取模型,以通过训练好的实体提取模型来提取相应的实体,作为实体向量。在确定了名称向量、规格向量和实体向量之后,可以将名称向量、规格向量和实体向量进行拼接,并将拼接后的向量输入到特征提取模型中,得到第一特征向量。本申请实施例可以预先设定第一特征向量的长度,从而输出统一长度的第一特征向量,以便进行特征之间的分析。
在准备过程的第二阶段中,可以在步骤204中,依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量。商品的编码信息表征商品所属的分类,商品的编码描述信息是对商品所述的分类的描述,例如,在海关商品分类场景下,对于商品1分类后的编码描述信息可以为“以重量计的唇用化妆品”。本申请实施例可以依据编码描述信息确定结构化数据,并依据结构化数据和编码信息,确定第二特征空间内的第二特征向量。具体的,作为一个可选的实施例,所述依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量,包括:对编码描述信息进行正则抽取,得到结构化数据,所述结构化数据包括属性项和属性值;依据所述结构化数据,在第二特征空间中建立属性节点,并在属性节点中添加属性值;依据所述编码信息,为属性节点之间添加连接边,形成第二特征向量。
正则抽取可以理解为利用正则表达式来抽取商品的编码描述信息中的数据,正则表达式,还可以称为规则表达式(RegularExpression,RE),正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。在商品分类的场景中,通常会按照一定的规则对商品的类别配置商品描述信息,因此,本申请实施例可以利用正则表达式来检索到对应的文本,并进行提取,形成属性值,并依据属性值配置对应的属性项,形成结构化数据。
在抽取出相应的数据之后,可以利用人工校验的方式对数据进行审核,从而得到结构化数据。具体的,作为一个可选的实施例,所述对编码描述信息进行正则抽取,得到结构化数据,包括:对编码描述信息进行正则抽取,得到抽取出的数据;提供校验页面,以展示抽取出的数据;依据对结构化数据的校验信息,确定属性项和属性值,作为结构化数据。在确定了抽取出的数据之后,可以向校验人员提供校验页面,通过校验页面展示抽取出的数据。之后,可以通过校验页面,获取校验人员对抽取出的数据进行审核或修改,以便确定属性项和属性值,得到结构化数据。
在确定结构化数据之后,可以依据结构化数据在第二特征空间中构建相应的属性节点,并为编码信息对应的多个属性节点之间添加连接边,形成第二特征向量。具体的,作为一个可选的实施例,所述依据所述编码信息,为属性节点之间建立连接边,形成第二特征向量包括:确定编码信息的各属性码对应的目标属性节点;向目标属性节点中添加属性码,并为目标属性节点之间添加连接边,形成第二特征向量。本实施例可以将编码信息拆分为属性码,并确定属性码对应的目标属性节点。之后,一方面,将属性码添加到目标属性节点中,以便确定待分类的商品对应的编码,另一方面,为目标属性节点之间建立连接边,从而形成第二特征向量。
在确定第一特征向量和第二特征向量之后,可以在步骤206中,依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。在一个可选的实施例中,在第一特征空间和第二特征空间之间可以设置映射层,使得第一特征空间的特征向量和第二特征空间的特征向量映射到映射层中,进而确定相应的映射关系,具体的,所述依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系,包括:将第一特征向量映射到映射层,得到第一映射特征;将第二特征向量映射到映射层,得到第二映射特征;依据所述第一映射特征和所述第二映射特征,确定第一特征空间与第二特征空间之间的映射关系。
在另一个可选的实施例中,本申请实施例还可以将第一特征空间的特征向量映射到第二特征空间中,从而确定相应的映射关系。具体的,所述依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系,包括:将第一特征空间的第一特征向量映射到第二特征空间中,得到第三映射特征;依据所述第二特征向量和第三映射特征,确定映射关系。在另一个可选的实施例中,本申请实施例还可以将第二特征空间的特征向量映射到第一特征空间中,从而确定相应的映射关系。具体的,所述依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系,包括:将第二特征空间的第二特征向量映射到第一特征空间中,得到第四映射特征;依据所述第一特征向量和第四映射特征,确定映射关系。
本申请实施例中,可以依据已分类的商品的商品信息,生成对应第一特征空间的第一特征向量,依据已分类的商品的编码信息和编码描述信息,在第二特征空间中生成第二特征向量;之后,依据第一特征向量和第二特征向量,建立第一特征空间与第二特征空间之间的映射关系,以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。相比于采用人工分类的方式,本申请实施例可以利用第一特征空间和第二特征空间之间的映射关系,更加高效的确定待分类的商品所对应的编码结果(分类)。
需要说明的是,本申请实施例是以将数据处理方法应用在服务端为例进行描述,本申请实施例的数据处理方法也可以分开在不同的设备上进行处理,例如,可以在一个设备上完成部分步骤,在另一个设备上完成其他部分的步骤,具体可以依据需求进行配置,举例来说,可以在第一服务器完成步骤202,在第二服务器完成步骤204,在第三服务器完成步骤206,具体的,第一服务器可以依据商品信息和特征提取模型来确定第一特征向量。第二服务端可以依据商品的编码信息和编码描述信息,确定第二特征向量。第三服务器从第一服务器获取第一特征向量,并从第二服务器获取第二特征向量,之后,第三服务器可以依据第一特征向量和第二特征向量确定第一特征空间和第二特征空间之间的映射关系,以便对商品进行分类。其中,第一服务器、第二服务器和第三服务器可以依据场景进行配置,例如,商品报关的场景中,第一服务器可以为仓库服务器,可存储商品信息,以依据存储的商品信息确定第一特征向量,以便第三服务器直接从第一服务器调用第一特征向量;第二服务器可以为存储商品的编码信息和编码描述信息的服务器,便于第三服务器从第二服务器调用第二特征向量。第三服务器可以为用于计算的服务器,以便确定映射关系。再例如,在对电商商品进行分类的场景中,第一服务器可以为电子商务服务器,其可存储电商商品信息,第二服务器可以为存储电商商品的分类信息和分类描述信息的服务器,第三服务器可以为用于计算的服务器。
下面以一个具体的示例,对本申请实施例的准备过程进行描述,具体的,
本申请实施例可以依据商品信息来确定第一特征向量,商品的商品信息可以包括商品名称(title)、商品规格和商品说明信息(description),商品规格还可以称为商品属性(property),相应的,可以通过商品名称、商品规格和商品说明信息,按照以下公式1,表示第一特征向量(Item)。
Item=w*pool(conv([title,description,property]))+b公式1。
其中,w为预设参数,b为预设常数。
本申请实施例可以依据商品的编码信息和编码描述信息,确定第二特征向量,可以依据编码描述信息和编码信息,确定结构化数据,结构化数据包括属性项(property)和属性值(value)。之后,可以依据结构化数据,建立多个属性节点,并将多个属性节点进行连接,形成第二特征向量。具体可通过以下公式2进行表示。
HScode=w*[(v1-p1),(v2-p2)…(vn-pn)]+b公式2。
其中,HScode代表第二特征向量,w为预设参数,b为预设常数,vi-pi表示第i个属性节点对应的向量。
在确定多个样本的第一特征向量和第二特征向量之后,可以将样本划分为正样本和负样本,对于属于同一商品的特征向量,可以看做为正样本,对于不同商品的特征向量,可以看做是负样本,对于正样本来说,正样本的特征之间的相似度应该趋向于1,因此,可以通过以下公式3来确定正样本的损失函数cos_pos_loss,以对特征进行调整。
cos_pos_loss(item,hscode)=1-cosine(item,hscode)公式3。
对于负样本来说,样本特征之间相似度应该在0-1之间,因此可以依据以下公式4来确定第二损失函数cos_neg_loss,以对特征进行调整。
cos_neg_loss(item,hscode)=max(cosine(item,hscode),0)公式4。
将正样本和负样本的损失函数进行组合后,得到公式5。
cos_loss(item,hscode)=label*cos_pos_loss(item,hscode)+(1-label)*cos_neg_loss(item,hscode)公式5
其中,label为标注参数。
对于第一特征向量和第二特征向量,可以将第一特征向量和第二特征向量映射到映射层中,从而确第一特征空间和第二特征空间中特征之间的相似度,具体的,可以通过以下公式6来确定映射层的损失函数,以通过映射层的损失函数来确定映射参数。
loss=cos_final_loss(w*hscode,item)+cos_final_loss(w*item,hscode)
公式6。
其中,cos_final_loss表征特征向量映射到映射层后特征向量之间的损失函数。本申请实施例可以采取双向映射的方式,将第一特征向量和第二特征向量映射到映射层中,以确定第一特征空间和第二特征空间之间的映射关系。
在上述实施例的基础上,本申请实施例还提供一种数据处理方法,可以应用在服务端,具体来说,如图3所示,所述方法包括:
步骤302、确定商品的商品信息所属的分类,并按照对应的类别对商品信息进行处理,得到商品信息向量。作为一个可选的实施例,所述按照对应的类别对商品信息进行处理,得到商品信息向量,包括:在所述商品信息属于商品名称分类时,对商品名称进行分词处理,得到名称向量,作为商品信息向量;在所述商品信息属于商品规格分类时,对商品规格进行归一化,得到规格向量,作为商品信息向量;在所述商品信息属于商品说明分类时,对商品说明信息进行实体识别,并依据提取出的实体确定实体向量,作为商品信息向量。
步骤304、将各商品信息向量进行拼接,并输入到特征提取模型中,确定第一特征向量,并添加到第一特征空间中。
步骤306、对编码描述信息进行正则抽取,得到抽取出的数据。
步骤308、提供校验页面,以展示抽取出的数据。
步骤310、依据对结构化数据的校验信息,确定属性项和属性值,作为结构化数据,所述结构化数据包括属性项和属性值。
步骤312、依据所述结构化数据,在第二特征空间中建立属性节点,并在属性节点中添加属性值。
步骤314、确定编码信息的各属性码对应的目标属性节点。
步骤316、向目标属性节点中添加属性码,并为目标属性节点之间添加连接边,形成第二特征向量。
步骤318、将第一特征向量映射到映射层,得到第一映射特征。
步骤320、将第二特征向量映射到映射层,得到第二映射特征。
步骤322、依据所述第一映射特征和所述第二映射特征,确定第一特征空间与第二特征空间之间的映射关系。
本申请实施例中,一方面,可以对商品信息进行分类,以便按照商品信息对应的分类,对商品信息采取相应的数据处理方式,得到商品信息向量,并将商品信息向量进行拼接之后,输入到特征提取模型中,得到已分类商品的第一特征向量并添加到第一特征空间中。另一方面,可以对编码描述信息进行正则抽取,并依据抽取出的数据,确定属性项和属性值,进而在第二特征空间中建立属性节点,并为属性节点配置属性值和属性码,进而依据编码信息,将属性节点之间通过连接边进行连接,得到已分类商品的第二特征向量。之后可以将第一特征向量和第二特征向量映射到映射层中,并在映射层中确定第一特征空间和第二特种空间之间的映射关系,以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。
在上述实施例的基础上,本申请实施例还提供一种数据处理方法,对应归类过程,本方法可以应用在服务端,能够利用第一映射空间和第二映射空间之间的映射关系,为待分类的商品进行分类,从而对商品采取相应的处理。具体来说,如图4所示,所述方法包括:
步骤402、获取商品信息,并依据特征提取模型进行特征提取,确定对应第一特征空间的第一特征向量。
步骤404、按照第一特征空间与第二特征空间之间的映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,所述第二特征空间依据商品的编码信息和编码描述信息进行特征提取后确定。
步骤406、确定第二特征空间中组成第二特征向量的目标属性节点,并确定编码结果,所述属性节点包括用于组成编码结果的属性码。
需要说明的是,本申请实施例是以将数据处理方法应用在服务端为例进行描述,本申请实施例的数据处理方法也可以分开在不同的设备上进行处理,例如,可以在终端完成部分步骤,在服务端完成其他部分的步骤,具体可以依据需求进行配置,举例来说,可以在终端完成步骤402,在服务端完成步骤404和步骤406,具体的,终端在获取到商品信息之后,可以在终端完成依据特征提取模型和商品信息来提取第一特征向量的步骤,并通过终端将第一特征向量上传给服务端。服务端接收到第一特征向量之后,可以依据第一特征向量,确定对应的第二特征向量,并确定相应的编码结果。其中,终端和服务端可以依据需求进行配置,例如,在对海关商品进行分类的场景中,终端可以为商家的终端(如手机、电脑等设备);终端还可以为海关平台提供的终端设备。服务端可以为用于计算的设备,如海关的服务器设备、其他平台提供计算服务的设备等。
本申请实施例可以依据各目标属性节点包含的属性码,来确定相应的编码结果,具体的,作为一个可选的实施例,所述确定第二特征空间中组成第二特征向量的目标属性节点,并确定编码结果,包括:确定第二特征空间中组成第二特征向量的目标属性节点;获取各目标属性节点的属性码,并组合成编码结果。本申请实施例除了可以确定商品对应的分类之外,还可以确定相应的分类说明,以便用户了解商品的分类原因。具体的,作为一个可选的实施例,所述属性节点还包括属性码说明信息,所述方法还包括:依据组成第二特征向量的属性节点,确定相应的属性码说明信息。本申请实施例可以应用在各类对商品进行分类的场景中,例如,可以应用在海关商品的分类场景中,以通过对海关商品的分类,确定相应的税率。具体的,作为一个可选的实施例,所述编码信息包括海关税则编码信息,所述编码描述信息包括海关税则编码描述信息,所述方法还包括:依据所述编码结果,确定税率信息。
本申请实施例的实施方式与上述方法实施例的实施方式类似,具体实施过程可以参考上述方法实施例的具体实施过程,此处不再赘述。
本申请实施例中,可以预先基于已分类的商品,确定第一特征空间与第二特征空间之间的映射关系。之后,可以依据待分类的商品的商品信息,确定对应第一特征空间的第一特征向量;可以依据映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,并筛选出组成第二特征向量的目标属性节点,并将各目标属性节点的属性码组合成为编码结果。之后可以基于具体的商品分类场景,依据编码结果对商品进行处理,例如,本申请可以应用在海关商品的分类场景中,以确定相应的商品海关编码,并依据商品海关编码确定相应的税率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图5,具体可以包括如下模块:
第一特征获取模块502,用于依据商品的商品信息,在第一特征空间中确定第一特征向量。
第二特征获取模块504,用于依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量。
映射关系获取模块506,用于依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。
综上,本申请实施例中,可以依据已分类的商品的商品信息,生成对应第一特征空间的第一特征向量,依据已分类的商品的编码信息和编码描述信息,在第二特征空间中生成第二特征向量;之后,依据第一特征向量和第二特征向量,建立第一特征空间与第二特征空间之间的映射关系,以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。相比于采用人工分类的方式,本申请实施例可以利用第一特征空间和第二特征空间之间的映射关系,更加高效的确定待分类的商品所对应的编码结果(分类)。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,具体可以包括如下模块:
商品信息获取处理模块,用于确定商品的商品信息所属的分类,并按照对应的类别对商品信息进行处理,得到商品信息向量。作为一个可选的实施例,所述商品信息获取处理模块,包括:在所述商品信息属于商品名称分类时,对商品名称进行分词处理,得到名称向量,作为商品信息向量;在所述商品信息属于商品规格分类时,对商品规格进行归一化,得到规格向量,作为商品信息向量;在所述商品信息属于商品说明分类时,对商品说明信息进行实体识别,并依据提取出的实体确定实体向量,作为商品信息向量。
第一特征获取处理模块,用于将各商品信息向量进行拼接,并输入到特征提取模型中,确定第一特征向量,并添加到第一特征空间中。编码描述获取处理模块,用于对编码描述信息进行正则抽取,得到抽取出的数据。校验页面提供处理模块,用于提供校验页面,以展示抽取出的数据。结构化数据获取处理模块,用于依据对结构化数据的校验信息,确定属性项和属性值,作为结构化数据,所述结构化数据包括属性项和属性值。
属性节点建立处理模块,用于依据所述结构化数据,在第二特征空间中建立属性节点,并在属性节点中添加属性值。属性节点筛选处理模块,用于确定编码信息的各属性码对应的目标属性节点。第二特征获取处理模块,用于向目标属性节点中添加属性码,并为目标属性节点之间添加连接边,形成第二特征向量。第一特征映射处理模块,用于将第一特征向量映射到映射层,得到第一映射特征。第二特征映射处理模块,用于将第二特征向量映射到映射层,得到第二映射特征。映射关系获取处理模块,用于依据所述第一映射特征和所述第二映射特征,确定第一特征空间与第二特征空间之间的映射关系。
本申请实施例中,一方面,可以对商品信息进行分类,以便按照商品信息对应的分类,对商品信息采取相应的数据处理方式,得到商品信息向量,并将商品信息向量进行拼接之后,输入到特征提取模型中,得到第一特征向量并添加到第一特征空间中。另一方面,可以对编码描述信息进行正则抽取,并依据抽取出的数据,确定属性项和属性值,进而在第二特征空间中建立属性节点,并为属性节点配置属性值和属性码,进而依据编码信息,将属性节点之间通过连接边进行连接,得到第二特征向量。之后可以将第一特征向量和第二特征向量映射到映射层中,并在映射层中确定第一特征空间和第二特种空间之间的映射关系,以便依据该映射关系和待分类商品的商品信息,为待分类的商品进行分类。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图6,具体可以包括如下模块:
第一特征确定模块602,用于获取商品信息,并依据特征提取模型进行特征提取,确定对应第一特征空间的第一特征向量。
第二特征确定模块604,用于按照第一特征空间与第二特征空间之间的映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,所述第二特征空间依据商品的编码信息和编码描述信息进行特征提取后确定。
编码结果确定模块606,用于确定第二特征空间中组成第二特征向量的目标属性节点,并确定编码结果,所述属性节点包括用于组成编码结果的属性码。
本申请实施例可以依据各目标属性节点包含的属性码,来确定相应的编码结果,具体的,作为一个可选的实施例,所述编码结果确定模块606,具体包括:确定第二特征空间中组成第二特征向量的目标属性节点;获取各目标属性节点的属性码,并组合成编码结果。本申请实施例除了可以确定商品对应的分类之外,还可以确定相应的分类说明,以便用户了解商品的分类原因。具体的,作为一个可选的实施例,所述属性节点还包括属性码说明信息,所述装置还包括:属性码说明获取模块,用于依据组成第二特征向量的属性节点,确定相应的属性码说明信息。本申请实施例可以应用在各类对商品进行分类的场景中,例如,可以应用在海关商品的分类场景中,以通过对海关商品的分类,确定相应的税率。具体的,作为一个可选的实施例,所述编码信息包括海关税则编码信息,所述编码描述信息包括海关税则编码描述信息,所述装置还包括:海关税率获取模块,用于依据所述编码结果,确定税率信息。
综上,本申请实施例中,可以预先基于已分类的商品,确定第一特征空间与第二特征空间之间的映射关系。之后,可以依据待分类的商品的商品信息,确定对应第一特征空间的第一特征向量;可以依据映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,并筛选出组成第二特征向量的目标属性节点,并将各目标属性节点的属性码组合成为编码结果。之后可以基于具体的商品分类场景,依据编码结果对商品进行处理,例如,本申请可以应用在海关商品的分类场景中,以确定相应的商品海关编码,并依据商品海关编码确定相应的税率。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括服务器、终端设备等设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括服务器(集群)、终端等电子设备。图7示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置700。
对于一个实施例,图7示出了示例性装置700,该装置具有一个或多个处理器702、被耦合到(一个或多个)处理器702中的至少一个的控制模块(芯片组)704、被耦合到控制模块704的存储器706、被耦合到控制模块704的非易失性存储器(NVM)/存储设备708、被耦合到控制模块704的一个或多个输入/输出设备710,以及被耦合到控制模块704的网络接口712。
处理器702可包括一个或多个单核或多核处理器,处理器702可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置700能够作为本申请实施例中所述服务端、终端等设备。
在一些实施例中,装置700可包括具有指令714的一个或多个计算机可读介质(例如,存储器706或NVM/存储设备708)以及与该一个或多个计算机可读介质相合并被配置为执行指令714以实现模块从而执行本公开中所述的动作的一个或多个处理器702。
对于一个实施例,控制模块704可包括任意适当的接口控制器,以向(一个或多个)处理器702中的至少一个和/或与控制模块704通信的任意适当的设备或组件提供任意适当的接口。
控制模块704可包括存储器控制器模块,以向存储器706提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器706可被用于例如为装置700加载和存储数据和/或指令714。对于一个实施例,存储器706可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器706可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,控制模块704可包括一个或多个输入/输出控制器,以向NVM/存储设备708及(一个或多个)输入/输出设备710提供接口。
例如,NVM/存储设备708可被用于存储数据和/或指令714。NVM/存储设备708可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备708可包括作为装置700被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备708可通过网络经由(一个或多个)输入/输出设备710进行访问。
(一个或多个)输入/输出设备710可为装置700提供接口以与任意其他适当的设备通信,输入/输出设备710可以包括通信组件、音频组件、传感器组件等。网络接口712可为装置700提供接口以通过一个或多个网络通信,装置700可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器702中的至少一个可与控制模块704的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器702中的至少一个可与控制模块704的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器702中的至少一个可与控制模块704的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器702中的至少一个可与控制模块704的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,装置700可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置700可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置700包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
本申请实施例还提供了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。
本申请实施例还提供了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种数据处理方法、一种数据处理装置、一种电子设备和一种存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据处理方法,其特征在于,所述的方法包括:
依据商品的商品信息,在第一特征空间中确定第一特征向量;
依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量;
依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。
2.根据权利要求1所述的方法,其特征在于,所述依据商品的商品信息,在第一特征空间中确定第一特征向量,包括:
确定商品信息所属的分类,并按照对应的类别对商品信息进行处理,得到商品信息向量;
将各商品信息向量进行拼接,并输入到特征提取模型中,确定第一特征向量,并添加到第一特征空间中。
3.根据权利要求1所述的方法,其特征在于,所述依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量,包括:
对编码描述信息进行正则抽取,得到结构化数据,所述结构化数据包括属性项和属性值;
依据所述结构化数据,在第二特征空间中建立属性节点,并在属性节点中添加属性值;
依据所述编码信息,为属性节点之间添加连接边,形成第二特征向量。
4.根据权利要求3所述的方法,其特征在于,所述对编码描述信息进行正则抽取,得到结构化数据,包括:
对编码描述信息进行正则抽取,得到抽取出的数据;
提供校验页面,以展示抽取出的数据;
依据对结构化数据的校验信息,确定属性项和属性值,作为结构化数据。
5.根据权利要求1所述的方法,其特征在于,所述依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系,包括:
将第一特征向量映射到映射层,得到第一映射特征;
将第二特征向量映射到映射层,得到第二映射特征;
依据所述第一映射特征和所述第二映射特征,确定第一特征空间与第二特征空间之间的映射关系。
6.一种数据处理方法,其特征在于,所述的方法包括:
获取商品信息,并依据特征提取模型进行特征提取,确定对应第一特征空间的第一特征向量;
按照第一特征空间与第二特征空间之间的映射关系,确定第二特征空间中与第一特征向量对应的第二特征向量,所述第二特征空间依据商品的编码信息和编码描述信息进行特征提取后确定;
确定第二特征空间中组成第二特征向量的目标属性节点,并确定编码结果,所述属性节点包括用于组成编码结果的属性码。
7.根据权利要求6所述的方法,其特征在于,所述属性节点还包括属性码说明信息,所述方法还包括:
依据组成第二特征向量的属性节点,确定相应的属性码说明信息。
8.一种数据处理装置,其特征在于,所述装置包括:
第一特征获取模块,用于依据商品的商品信息,在第一特征空间中确定第一特征向量;
第二特征获取模块,用于依据商品的编码信息和编码描述信息,在第二特征空间中确定第二特征向量;
映射关系获取模块,用于依据第一特征向量和第二特征向量,确定第一特征空间与第二特征空间之间的映射关系。
9.一种电子设备,其特征在于,包括:处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-7中一个或多个所述的方法。
10.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-7中一个或多个所述的方法。
CN202110343766.XA 2021-03-30 2021-03-30 数据处理方法、装置、电子设备和存储介质 Pending CN115222463A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110343766.XA CN115222463A (zh) 2021-03-30 2021-03-30 数据处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110343766.XA CN115222463A (zh) 2021-03-30 2021-03-30 数据处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN115222463A true CN115222463A (zh) 2022-10-21

Family

ID=83604674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110343766.XA Pending CN115222463A (zh) 2021-03-30 2021-03-30 数据处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115222463A (zh)

Similar Documents

Publication Publication Date Title
WO2020077877A1 (zh) 平台商品入驻方法、装置、计算机设备及存储介质
CN108229341B (zh) 分类方法和装置、电子设备、计算机存储介质
US9785898B2 (en) System and method for identifying retail products and determining retail product arrangements
US9892437B2 (en) Digitization of a catalog of retail products
CN107180064A (zh) 一种物流信息处理方法、装置及物流信息系统
CN113627411A (zh) 一种基于超分辨率的商品识别与价格匹配方法及系统
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN114170482B (zh) 一种文档预训练模型训练方法、装置、设备及介质
WO2019072098A1 (zh) 一种识别核心产品词的方法和系统
CN111784372A (zh) 门店商品推荐方法及设备
CN111768553A (zh) 一种自动售货柜的售货方法及自动售货柜
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN110362702B (zh) 图片管理方法及设备
CN117115571A (zh) 一种细粒度智能商品识别方法、装置、设备及介质
CN111651981B (zh) 数据的审核方法、装置及设备
CN114417146A (zh) 数据处理方法、装置、电子设备和存储介质
CN110766460A (zh) 一种用户画像的方法、装置、存储介质及计算机设备
CN115222464A (zh) 数据处理方法、装置、电子设备和存储介质
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN115222463A (zh) 数据处理方法、装置、电子设备和存储介质
CN115168575A (zh) 应用于审计领域的主语补全方法及相关设备
CN113129071A (zh) 一种商家产品sku分析方法和装置
CN114596241A (zh) 图像、视频处理方法、装置、设备和存储介质
CN110610393A (zh) 一种信息推荐的方法和装置
CN111027326A (zh) 商品归类方法、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination