CN110334185A - 一种平台中数据的处理方法和装置 - Google Patents

一种平台中数据的处理方法和装置 Download PDF

Info

Publication number
CN110334185A
CN110334185A CN201910605008.3A CN201910605008A CN110334185A CN 110334185 A CN110334185 A CN 110334185A CN 201910605008 A CN201910605008 A CN 201910605008A CN 110334185 A CN110334185 A CN 110334185A
Authority
CN
China
Prior art keywords
classification
text
similarity
default
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910605008.3A
Other languages
English (en)
Inventor
杨万新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zheng Wei Yun Ltd
Original Assignee
Zheng Wei Yun Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zheng Wei Yun Ltd filed Critical Zheng Wei Yun Ltd
Priority to CN201910605008.3A priority Critical patent/CN110334185A/zh
Publication of CN110334185A publication Critical patent/CN110334185A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种平台中数据的处理方法和装置,所述方法包括获取平台中的类目集,根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值,直接将预设类目及预设类目中属性名称填写完整的商品信息发布至另一平台目标类目对应属性名称中,不仅降低了商品发布人员的工作量,节省了商品发布所需的人力成本,而且提高了商品的发布效率。

Description

一种平台中数据的处理方法和装置
技术领域
本申请涉及数据处理技术领域,具体为一种平台中数据的处理方法和装置、计算设备及计算机可读存储介质。
背景技术
伴随着互联网的发展,消费者在网上进行购物变得十分便利,商家传统经营模式也转变成电商模式,而消费者和商家的交易场所就是电子商务平台,电子商务平台实际上就是为企业或个人提供网上交易洽谈的平台。
目前,大部分商家会通过多个电子商务平台来销售产品,但是每个电商平台都有各自的商品发布规则,商品发布就需要在电商平台上填写电商平台设定的所需填写信息,比如发布一款笔记本电脑,就要填写笔记本电脑品牌、屏幕尺寸、内存等参数。
现有的每个电商平台不仅对商品信息填写的要求不同,而且各电商平台对同一款笔记本电脑需要填写的参数设定了不同的名称,导致厂家在一个电商平台上填写完笔记本电脑的所有信息后,在其它电商平台上发布时,还要根据其它电商平台的商品发布规则,再次填写笔记本电脑的所有信息,额外增加了商品发布人员的工作量及商品的销售成本。
发明内容
有鉴于此,本申请实施例提供了一种平台中数据的处理方法和装置、计算设备以及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
本申请实施例公开了一种平台中数据的处理方法,包括:
获取平台中的类目集,所述类目集包括原类目;
根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;
关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;
根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
本申请实施例还公开了一种平台中数据的处理装置,包括:
获取模块,被配置为获取平台中的类目集,所述类目集包括原类目;
处理模块,被配置为根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;
关联模块,被配置为关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;
确定模块,被配置为根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
本申请实施例公开了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现如上所述的平台中数据的处理方法的步骤。
本申请实施例公开了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如上所述的平台中数据的处理方法的步骤。
本申请提供的一种平台中数据的处理的方法和装置,通过获取平台中的类目集,根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值,这样商家在一个电商平台上填写完商品的所有信息后,无需工作人员再次手动向其它电商平台上输入商品信息,通过本申请的方法直接将预设类目及预设类目中属性名称填写完整的商品信息发布至另一平台目标类目对应属性名称中,不仅降低了商品发布人员的工作量,节省了商品发布所需的人力成本,而且提高了商品发布的效率。
附图说明
图1是本申请实施例的计算设备的结构示意图;
图2是本申请一实施例的平台中数据的处理方法的流程示意图;
图3是本申请平台中数据的处理方法中获得目标类目的流程示意图;
图4是本申请平台中数据的处理方法中关联所述预设属性名称与所述相似度最高的属性名称的流程示意图;
图5是本申请一实施例的平台中数据的处理方法的流程示意图;
图6是本申请实施例的平台中数据的处理装置的结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
知识增强的语义表示(Enhanced Representation from kNowledgeIntEgration,ERNIE)模型:通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,直接对语义知识进行建模,具有语义表示能力。
在本申请中,提供了一种平台中数据的处理方法和装置、计算设备以及计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1是示出了根据本申请一实施例的计算设备100的结构示意图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。
计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备100还可以是移动式或静止式的服务器。
其中,处理器120可以执行图2所示方法中的步骤。图2是示出了根据本申请一实施例的平台中数据的处理方法的流程示意图,包括步骤202至步骤208。
步骤202:获取平台中的类目集,所述类目集包括原类目。
所述平台可以是商品销售或提供服务的电商平台,即所述平台能够为企业或个人提供网上交易商品或服务。平台上为满足商品生产、流通、消费活动的全部或部分需要对商品进行分类管理,将管理范围内的商品集合总体以所选择的适当的商品基本特征作为分类标志,逐次归纳为若干个范围更小、特质更趋一致的类目。平台中的类目集中包括若干个原类目。
比如平台中的一级类目包括数码,其中,一级类目的数码下的二级类目包括电脑和相机,二级类目中的电脑下的三级类目包括台式电脑和笔记本电脑,上述原类目包括数码>电脑>笔记本电脑和数码>电脑>台式电脑,平台中所有原类目的集合即为类目集。
在上述步骤之后,合并所述类目集中原类目的子级类目的字符得到原类目对应原类目文本。
所述原类目包括至少一个子集类目,原类目中可以有一个、两个、三个或四个子集类目,比如上述列举的原类目为三个子集类目分别为一级类目、二级类目和三级类目。
上述原类目包括数码>电脑>笔记本电脑和数码>电脑>台式电脑,合并所述原类目的一、二、三级类目的字符得到原类目对应原类目文本,则原类目文本分别为数码电脑笔记本电脑和数码电脑台式电脑。
步骤204:根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目。
参见图3所示,所述步骤204包括步骤302至步骤304。
步骤302:合并预设类目的子级类目的字符获取预设类目文本。
获取预设类目,所述预设类目为商家要发布的商品已选择的类目,预设类目对应的属性名称的属性值已填写完成,比如可以通过商家已经发布在一个电商平台中获取商品的类目作为预设类目,或获取商家上传的已确定的类目作为预设类目,当然通过也可以其它途径获取预设类目。
比如商家要发布商品为笔记本电脑,在另一个电商平台上发布的一级类目为电子设备,二级类目为笔记本电脑,所述预设类目还对应有预设属性名称,预设属性名称可以包括品牌名称、屏幕尺寸和内存大小,属性名称中的属性值已经填写确定。
即笔记本电脑的预设类目为电子设备>笔记本电脑,则合并后的预设类目文本为电子设备笔记本电脑。
为了便于理解,对预设类目进一步说明,商品的类目商家已经在一个平台上选择确定,以及商品的类目对应的属性名称的属性值商家已填写完成,上述商品的类目即为预设类目,商品已经在一个平台上发布销售。上述商品的类目属性名称即为预设属性名称,下述步骤就是根据商家已经选择的类目和填写好属性名称中的属性值,直接完成其它平台上同一商品的发布。
步骤304:根据所述预设类目文本和每个所述原类目文本,将所述类目集中与预设类目对应的原类目作为目标类目。
步骤304包括步骤3042至步骤3044。
步骤3042:分析预设类目文本与每个所述原类目文本的相似度。
比如,上述得到的预设类目文本为电子设备笔记本电脑。
原类目文本包括数码电脑笔记本电脑和数码电脑台式电脑。
分析预设类目文本“电子设备笔记本电脑”与原类目文本“数码电脑笔记本电脑”的相似度,分析预设类目文本“电子设备笔记本电脑”与原类目文本“数码电脑台式电脑”的相似度。
本申请平台中数据的处理方法中实现步骤3042包括以下三种具体方式。
第一种方式是通过余弦相似度算法计算预设类目文本与每个所述原类目文本的字符相似度。
余弦相似度算法是通过计算两个向量的夹角余弦值来评估他们的相似度。通过下面的例子来说明字符相似度的计算。
假设:文本A“这只皮靴号码大了。那只号码合适”,文本B“这只皮靴号码不小,那只更合适”。
首先,将文本A和B分别进行分词,得到如下分词结果。
文本A“这只/皮靴/号码/大了。那只/号码/合适”和文本B“这只/皮靴/号码/不/小,那只/更/合适”。
其次,计算两个文本中的词频,来计算文本A和B的相似度,具体如下。
将文本A和文本B进行编码,计算每个分词出现的次数。
得出文本A和文本B的词频向量。
文本A的词频向量为[0,1,1,1,2,1,0,2,1,1]。
文本B的词频向量为[1,0,1,1,2,1,1,1,1,0]。
得出文本A和文本B的词频向量之后,通过下述公式(1)计算两个向量之间夹角的余弦值,余弦值越大字符相似度越高。
其中,cos(θ)为余弦值,xi为文本A的词频向量,yi为文本B的词频向量。通过公式(1)计算文本A和文本B的词频向量来确定两个文本的相似度。
计算得到的余弦值cos(θ)为0.81,即文本A和文本B的字符相似度为0.81。字符相似度为0.81接近于1,因此文本A和文本B基本相似。
第二种方式是将所述预设类目文本与每个所述原类目文本输入语义相似度模型。
所述语义相似度模型输出所述预设类目文本与每个所述原类目文本的语义相似度。
语句分词模型可以为多种,利用知识增强的语义表示模型,即ERNIE模型,能够精确地实现所述预设类目文本和原类目文本的语义级分词,将预设类目文本的词语和原类目文本的词语输入训练好的语义相似度模型,语义相似度模型输出每个所述原类目文本与预设类目文本的语义相似度。
第三种方式是分析预设类目文本与每个所述原类目文本的字符相似度和语义相似度。
上述字符相似度和语义相似度的获得参照第一种方式和第二种方式,此处不再赘述。
步骤3044:提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
通过上述第一种方式和第二种方式分析预设类目文本与每个所述原类目文本的相似度,就直接提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
通过上述第三种方式提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
其中,可以通过上述余弦相似度算法和利用语义相似度模型来分别分析预设类目文本与每个所述原类目文本的语义相似度和字符相似度,对所述原类目文本对应的语义相似度和字符相似度分别配置权重,根据实际情况,来配置语义相似度和字符相似度的权重,最后得到所述预设类目文本对应的相似度。这样能够大幅提高提取与预设类目文本对应的目标类目的准确度,保证商品能够准确地发布至其它平台中。
步骤206:关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称。
参见图4所示,所述步骤206包括步骤402至步骤406。
步骤402:分析所述预设属性名称与所述目标类目中每个属性名称的相似度。
比如上述预设类目为电子设备>笔记本电脑,所述预设类目还对应有预设属性名称,预设属性名称包括品牌名称、屏幕尺寸和内存大小。预设属性名称为品牌名称对应的属性值为星星,预设属性名称为屏幕尺寸对应的属性值为14寸,预设属性名称为内存大小对应的属性值为8G。
假设上述目标类目对应的属性名称包括产品品牌、屏幕大小和内存容量。
比如分析所述预设属性名称“品牌名称”分别与目标类目对应的属性名称“产品品牌”、“屏幕大小”和“内存容量”的相似度。
依次类推,得到预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”的相似度;得到预设属性名称“品牌名称”与目标类目对应的属性名称“屏幕大小”的相似度;得到预设属性名称“品牌名称”与目标类目对应的属性名称“内存容量”的相似度,这样下述步骤中提取与预设属性名称“品牌名称”相似度最高的目标类目对应的属性名称为“产品品牌”。
本申请中分析所述预设属性名称与所述目标类目中每个属性名称的相似度包括第三具体方式。
第一种方式是通过余弦相似度算法计算所述预设属性名称与所述目标类目中每个属性名称的字符相似度。
第二种方式将预设属性名称与所述目标类目中每个属性名称输入语义相似度模型;
所述语义相似度模型输出所述预设类目文本与所述目标类目中每个属性名称的语义相似度。
第三种方式是分析所述预设属性名称与所述目标类目中每个属性名称的字符相似度和语义相似度。
上述三种方式获得的语义相似度和上述预设类目与类目集中的原类目的相似度获得的技术构思相同,此处不再赘述。
步骤404:提取所述目标类目中与所述预设属性名称相似度最高的属性名称。
上述第一种方式和第二种方式直接提取所述目标类目中与所述预设属性名称相似度最高的属性名称。
通过第三种方式,则所述目标类目中每个属性名称的语义相似度和字符相似度分别配置权重,计算所述目标类目中每个属性名称对应的相似度。
确定所述目标类目中与所述预设属性名称相似度最高的属性名称。
步骤406:关联所述预设属性名称与所述相似度最高的属性名称。
比如提取上述预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”的相似度最高,则将预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”关联。
若出现目标类目对应的个别属性名称无法与预设属性名称关联,则目标类目对应的个别属性名称不进行填写,若目标类目对应的个别属性名称中的属性值是必填项,则随机填写一个属性值,以满足平台的商品发布规则。
步骤208:根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
所述步骤208具体包括步骤2082至步骤2084。
步骤2082:将所述预设属性名称的属性值填入至所述目标类目中对应的属性名称。
上述例子中将预设属性名称为品牌名称对应的属性值“星星”填入至目标类目对应的属性名称的产品品牌中,将所述目标类目对应的每个属性名称的属性值填写完成。
步骤2084:确定所述平台中目标类目对应的每个属性名称的属性值。
本实施例通过获取平台中的类目集,根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值,这样商家在一个电商平台上填写完商品的所有信息后,无需工作人员再次手动向其它电商平台上输入商品信息,上述方法直接将预设类目及预设类目中属性名称填写完整的商品信息发布至另一平台目标类目对应属性名称中,不仅降低了商品发布人员的工作量,节省了商品发布所需的人力成本,而且提高了商品发布的效率。
图5示出了本申请一实施例的平台中数据的处理方法,包括步骤502至步骤514。
为了便于理解,本申请一实施例以下述要发布的商品为例,来对本申请的平台中数据的处理的技术方案进行示意性的说明。
假设商家在第一平台上已经发布的商品为笔记本电脑,在第一平台上获取的预设类目为电子设备>笔记本电脑,预设属性名称包括品牌名称、屏幕尺寸和内存大小,所述品牌名称、屏幕尺寸和内存大小分别对应的属性值为星星、14寸和8G。
商家想要把第一平台上的笔记本电脑发布至第二平台上。
步骤502:获取平台中的类目集,所述类目集包括原类目。
获取第二平台的类目集,表1示出了列举出来的类目集中的原类目。
表1
平台中的一级类目包括数码和童装玩具,其中,一级类目的数码下的二级类目包括电脑和相机,二级类目中的电脑下的三级类目包括台式电脑和笔记本电脑,下面对表1中的原类目进行示例性地列举。
上述原类目包括数码>电脑>台式电脑、数码>电脑>笔记本电脑、数码>相机>单反相机、数码>相机>相机配件和童装玩具>玩具>毛绒玩具,获取平台中设置的所有原类目。
步骤504:合并所述类目集中原类目的子级类目的字符得到原类目对应原类目文本。
合并所述原类目的一、二、三级类目的字符得到原类目对应原类目文本,则原类目文本分别为数码电脑笔记本电脑、数码电脑台式电脑、数码相机单反相机、数码相机相机配件和童装玩具玩具毛绒玩具。
步骤506:合并预设类目的子级类目的字符获取预设类目文本。
合并后第一平台中子级类目的字符获取的预设类目文本为“电子设备笔记本电脑”。
步骤508:分析预设类目文本与每个所述原类目文本的字符相似度和语义相似度。
分析预设类目文本“电子设备笔记本电脑”与原类目文本“数码电脑笔记本电脑”的相似度,分析预设类目文本“电子设备笔记本电脑”与原类目文本“数码电脑台式电脑”的相似度,以此类推,得到每个原类目文本与预设类目文本的相似度。
步骤510:提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
提取与预设类目文本相似度最高的原类目文本“数码电脑笔记本电脑”作为目标类目,即目标类目为数码>电脑>笔记本电脑。
确定第二平台中目标类目后,得到目标类目对应的属性名称为产品品牌、屏幕大小和内存容量。
步骤512:关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称。
分析所述预设属性名称与所述目标类目中每个属性名称的相似度。
比如分析所述预设属性名称“品牌名称”分别与目标类目对应的属性名称“产品品牌”、“屏幕大小”和“内存容量”的相似度。
依次类推,得到预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”的相似度;得到预设属性名称“品牌名称”与目标类目对应的属性名称“屏幕大小”的相似度;得到预设属性名称“品牌名称”与目标类目对应的属性名称“内存容量”的相似度。
提取上述预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”的相似度最高,则将预设属性名称“品牌名称”与目标类目对应的属性名称“产品品牌”关联,依次类推,得到预设属性名称“屏幕尺寸”与目标类目对应的属性名称“屏幕大小”关联;得到预设属性名称“内存大小”与目标类目对应的属性名称“内存容量”关联。
步骤514:根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
最终将商品发布至第二平台中的类目为数码>电脑>笔记本电脑,第二平台中笔记本电脑的属性名称中属性值填写的结果参见表2。
表2
属性名称 产品品牌 屏幕大小 内存容量
属性值 星星 14寸 8G
将预设属性名称为“品牌名称”对应的属性值“星星”填入至目标类目对应的属性名称的“产品品牌”中,将预设属性名称为“屏幕尺寸”对应的属性值“14寸”填入至目标类目对应的属性名称的“屏幕大小”中,将预设属性名称为“内存大小”对应的属性值“8G”填入至目标类目对应的属性名称的“内存容量”中。
本申请的上述实施例中,无需工作人员再次手动向第二平台上输入商品信息,上述方法直接将预设类目及预设类目中属性名称填写完整的商品信息发布至第二平台目标类目对应属性名称中,不仅降低了商品发布人员的工作量,节省了商品发布所需的人力成本,而且提高了商品发布的效率。
图6示出了平台中数据的处理装置的结构示意图,所述装置包括:
获取模块602,被配置为获取平台中的类目集,所述类目集包括原类目;
处理模块604,被配置为根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;
关联模块606,被配置为关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;
确定模块608,被配置为根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
优选地,所述装置还包括:合并模块,被配置为合并所述类目集中原类目的子级类目的字符得到原类目对应原类目文本;
所述处理模块604被进一步配置为合并预设类目的子级类目的字符获取预设类目文本;
根据所述预设类目文本和每个所述原类目文本,将所述类目集中与预设类目对应的原类目作为目标类目。
优选地,所述处理模块604被进一步配置为分析预设类目文本与每个所述原类目文本的相似度;
提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
优选地,所述处理模块604被进一步配置为通过余弦相似度算法计算预设类目文本与每个所述原类目文本的字符相似度。
优选地,所述处理模块604还被配置为将所述预设类目文本与每个所述原类目文本输入语义相似度模型;
所述语义相似度模型输出所述预设类目文本与每个所述原类目文本的语义相似度。
优选地,所述处理模块604还被配置为分析预设类目文本与每个所述原类目文本的字符相似度和语义相似度;
对所述原类目文本对应的语义相似度和字符相似度分别配置权重,计算每个所述预设类目文本对应的相似度;
确定与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
优选地,所述关联模块606被进一步配置为分析所述预设属性名称与所述目标类目中每个属性名称的相似度;
提取所述目标类目中与所述预设属性名称相似度最高的属性名称;
关联所述预设属性名称与所述相似度最高的属性名称。
优选地,所述关联模块606被进一步配置为通过余弦相似度算法计算所述预设属性名称与所述目标类目中每个属性名称的字符相似度。
优选地,所述关联模块606还被配置为将预设属性名称与所述目标类目中每个属性名称输入语义相似度模型;
所述语义相似度模型输出所述预设类目文本与所述目标类目中每个属性名称的语义相似度。
优选地,所述关联模块606还被配置为分析所述预设属性名称与所述目标类目中每个属性名称的字符相似度和语义相似度;
对所述目标类目中每个属性名称的语义相似度和字符相似度分别配置权重,计算所述目标类目中每个属性名称对应的相似度;
确定所述目标类目中与所述预设属性名称相似度最高的属性名称。
优选地,所述确定模块608被进一步配置为将所述预设属性名称的属性值填入至所述目标类目中对应的属性名称;
确定所述平台中目标类目对应的每个属性名称的属性值。
本实施例通过上述平台中数据的处理装置,这样商家在一个电商平台上填写完商品的所有信息后,无需工作人员再次手动向其它电商平台上输入商品信息,上述装置直接将预设类目及预设类目中属性名称填写完整的商品信息发布至另一平台目标类目对应属性名称中,不仅降低了商品发布人员的工作量,节省了商品发布所需的人力成本,而且提高了商品发布的效率。
本申请一实施例还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现如前所述平台中数据的处理方法的步骤。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述平台中数据的处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述平台中数据的处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述平台中数据的处理方法的技术方案的描述。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (14)

1.一种平台中数据的处理方法,其特征在于,包括:
获取平台中的类目集,所述类目集包括原类目;
根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;
关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;
根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
2.根据权利要求1所述的方法,其特征在于,获取平台中的类目集之后,还包括:
合并所述类目集中原类目的子级类目的字符得到原类目对应原类目文本;
根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目,包括:
合并预设类目的子级类目的字符获取预设类目文本;
根据所述预设类目文本和每个所述原类目文本,将所述类目集中与预设类目对应的原类目作为目标类目。
3.根据权利要求2所述的方法,其特征在于,根据所述预设类目文本和每个所述原类目文本,将所述类目集中与预设类目对应的原类目作为目标类目,包括:
分析预设类目文本与每个所述原类目文本的相似度;
提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
4.根据权利要求3所述的方法,其特征在于,分析预设类目文本与每个所述原类目文本的相似度,包括:
通过余弦相似度算法计算预设类目文本与每个所述原类目文本的字符相似度。
5.根据权利要求3所述的方法,其特征在于,分析预设类目文本与每个所述原类目文本的相似度,包括:
将所述预设类目文本与每个所述原类目文本输入语义相似度模型;
所述语义相似度模型输出所述预设类目文本与每个所述原类目文本的语义相似度。
6.根据权利要求3所述的方法,其特征在于,分析预设类目文本与每个所述原类目文本的相似度,包括:
分析预设类目文本与每个所述原类目文本的字符相似度和语义相似度;
提取与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目,包括:
对所述原类目文本对应的语义相似度和字符相似度分别配置权重,计算每个所述预设类目文本对应的相似度;
确定与预设类目文本相似度最高的原类目文本对应的原类目作为目标类目。
7.根据权利要求1所述的方法,其特征在于,关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称,包括:
分析所述预设属性名称与所述目标类目中每个属性名称的相似度;
提取所述目标类目中与所述预设属性名称相似度最高的属性名称;
关联所述预设属性名称与所述相似度最高的属性名称。
8.根据权利要求7所述的方法,其特征在于,分析所述预设属性名称与所述目标类目中每个属性名称的相似度,包括:
通过余弦相似度算法计算所述预设属性名称与所述目标类目中每个属性名称的字符相似度。
9.根据权利要求7所述的方法,其特征在于,分析所述预设属性名称与所述目标类目中每个属性名称的相似度,包括:
将预设属性名称与所述目标类目中每个属性名称输入语义相似度模型;
所述语义相似度模型输出所述预设类目文本与所述目标类目中每个属性名称的语义相似度。
10.根据权利要求7所述的方法,其特征在于,分析所述预设属性名称与所述目标类目中每个属性名称的相似度,包括:
分析所述预设属性名称与所述目标类目中每个属性名称的字符相似度和语义相似度;
提取所述目标类目中与所述预设属性名称相似度最高的属性名称,包括:
对所述目标类目中每个属性名称的语义相似度和字符相似度分别配置权重,计算所述目标类目中每个属性名称对应的相似度;
确定所述目标类目中与所述预设属性名称相似度最高的属性名称。
11.根据权利要求1所述的方法,其特征在于,根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值,包括:
将所述预设属性名称的属性值填入至所述目标类目中对应的属性名称;
确定所述平台中目标类目对应的每个属性名称的属性值。
12.一种平台中数据的处理装置,其特征在于,包括:
获取模块,被配置为获取平台中的类目集,所述类目集包括原类目;
处理模块,被配置为根据预设类目和所述类目集,确定所述类目集中与预设类目对应的原类目作为目标类目;
关联模块,被配置为关联所述预设类目对应的预设属性名称与所述目标类目对应的属性名称;
确定模块,被配置为根据所述预设属性名称的属性值,确定所述平台中目标类目对应属性名称的属性值。
13.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-11任意一项所述方法的步骤。
14.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-11任意一项所述方法的步骤。
CN201910605008.3A 2019-07-05 2019-07-05 一种平台中数据的处理方法和装置 Pending CN110334185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605008.3A CN110334185A (zh) 2019-07-05 2019-07-05 一种平台中数据的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605008.3A CN110334185A (zh) 2019-07-05 2019-07-05 一种平台中数据的处理方法和装置

Publications (1)

Publication Number Publication Date
CN110334185A true CN110334185A (zh) 2019-10-15

Family

ID=68144390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605008.3A Pending CN110334185A (zh) 2019-07-05 2019-07-05 一种平台中数据的处理方法和装置

Country Status (1)

Country Link
CN (1) CN110334185A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667245A (zh) * 2020-06-09 2020-09-15 政采云有限公司 一种服务项目商品化方法及装置
CN111723117A (zh) * 2020-06-19 2020-09-29 深圳市蓝思网络技术有限公司 大数据产品开发筛选方法、装置及计算机可读存储介质
CN112395501A (zh) * 2020-11-17 2021-02-23 航天信息股份有限公司 企业推荐方法、装置、存储介质及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203548A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 属性获取方法和装置
CN109389451A (zh) * 2017-08-08 2019-02-26 阿里巴巴集团控股有限公司 一种确定推荐信息的方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203548A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 属性获取方法和装置
CN109389451A (zh) * 2017-08-08 2019-02-26 阿里巴巴集团控股有限公司 一种确定推荐信息的方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667245A (zh) * 2020-06-09 2020-09-15 政采云有限公司 一种服务项目商品化方法及装置
CN111723117A (zh) * 2020-06-19 2020-09-29 深圳市蓝思网络技术有限公司 大数据产品开发筛选方法、装置及计算机可读存储介质
CN112395501A (zh) * 2020-11-17 2021-02-23 航天信息股份有限公司 企业推荐方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN105468742B (zh) 恶意订单识别方法及装置
CN107491534A (zh) 信息处理方法和装置
CN110334185A (zh) 一种平台中数据的处理方法和装置
CN107077698A (zh) 使用色彩调色板的自动化基于图像的推荐
CN107330750A (zh) 一种推荐产品配图方法及装置,电子设备
CN108287857A (zh) 表情图片推荐方法及装置
CN107730346A (zh) 物品聚类的方法和装置
CN103631874B (zh) 社交平台的ugc标签类别确定方法和装置
CN107870984A (zh) 识别搜索词的意图的方法和装置
CN109670065A (zh) 基于图像识别的问答处理方法、装置、设备和存储介质
CN108319888A (zh) 视频类型的识别方法及装置、计算机终端
CN109903127A (zh) 一种群组推荐方法、装置、存储介质及服务器
CN111915400B (zh) 一种基于深度学习的个性化服装推荐方法、装置
CN110222728A (zh) 物品鉴别模型的训练方法、系统及物品鉴别方法、设备
CN108509458A (zh) 一种业务对象识别方法及装置
CN109508373A (zh) 企业舆情指数的计算方法、设备及计算机可读存储介质
CN109117474A (zh) 语句相似度的计算方法、装置及存储介质
CN110223358A (zh) 可视图案设计方法、训练方法、装置、系统及存储介质
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN107885784A (zh) 提取用户特征数据的方法和装置
CN109299445A (zh) 获取文件模板的方法、装置、计算设备及存储介质
CN107798622A (zh) 一种识别用户意图的方法和装置
CN110110035A (zh) 数据处理方法和装置以及计算机可读存储介质
CN107346344A (zh) 文本匹配的方法和装置
CN110059178A (zh) 问题派发方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015

RJ01 Rejection of invention patent application after publication