CN111738808A - 数据处理方法、装置及设备 - Google Patents

数据处理方法、装置及设备 Download PDF

Info

Publication number
CN111738808A
CN111738808A CN202010719994.8A CN202010719994A CN111738808A CN 111738808 A CN111738808 A CN 111738808A CN 202010719994 A CN202010719994 A CN 202010719994A CN 111738808 A CN111738808 A CN 111738808A
Authority
CN
China
Prior art keywords
data
entity
description data
image description
word segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010719994.8A
Other languages
English (en)
Other versions
CN111738808B (zh
Inventor
段梦琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN202010719994.8A priority Critical patent/CN111738808B/zh
Publication of CN111738808A publication Critical patent/CN111738808A/zh
Application granted granted Critical
Publication of CN111738808B publication Critical patent/CN111738808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种数据处理方法、装置及设备,涉及数据处理技术领域,能够将对象规格的描述数据形成不同规格的图像在页面中进行展示,提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。其中方法包括:响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。

Description

数据处理方法、装置及设备
技术领域
本申请涉及数据处理技术领域,尤其是涉及到一种数据处理方法、装置及设备。
背景技术
随着电商平台的迅速崛起,通过网络平台进行对象交易的方式已经逐渐渗入至人们的日常生活,用户可以通过网络平中执行操作来获取大量的对象数据,例如,通过页面浏览操作获取对象数据、通过对象搜索操作来获取对象数据、通过对象选择操作来获取对象数据等。
为了便于用户选择,针对不同品类的对象数据,网络平台可以向用户展示关于对象规格的描述数据,例如,重量规格、口味规格等。然而,现有对象规格的描述数据在页面中通常为文字形式,展示方式比较单一,无法直观呈现出对象规格的描述数据,降低用户的操作体验。
发明内容
有鉴于此,本申请提供了一种数据处理方法、装置及设备,主要目的在于解决现有技术中无法直观呈现出对象规格的描述数据,降低用户操作体验的问题。
根据本申请的第一个方面,提供了一种数据处理方法,该方法包括:
响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;
基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;
将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
在本发明另一实施例中,在所述提取所述对象描述数据中描述对象的实体关键词之前,所述方法还包括:
判断所述对象描述数据是否由预先配置的规格预选渠道进行输入;
所述提取所述对象描述数据中描述对象的实体关键词,具体包括:
若是,则利用所述预先配置的规格预选渠道查询输入的对象描述数据,提取所述对象描述数据中描述对象的实体关键词;
若否,则利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词。
在本发明另一实施例中,所述实体识别模型为基于条件随机场框架训练的深度学习网络模型,所述实体识别模型包含多层结构,所述利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词,具体包括:
利用所述实体识别模型中查表层内预先嵌入的词向量矩阵,将所述对象描述数据处理为文本分词向量;
利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值;
利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型;
基于所述文本分词向量对应的实体类型,提取所述对象描述数据中描述对象的实体关键词。
在本发明另一实施例中,所述利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值,具体包括:
利用所述实体识别模型中双向时序记忆层将所述文本分词向量拼接为完整的隐状态序列;
将所述完整的隐状态序列所对应的向量维度处理至预设维度,得到文本分词向量的分类矩阵,所述分类矩阵记录有文本分词向量映射至不同实体类型上的概率值。
在本发明另一实施例中,所述利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型,具体包括:
利用所述条件随机场框架预先为所述对象描述数据中的文本分词向量标注的位置信息,设置文本分词向量的转移矩阵;
基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型。
在本发明另一实施例中,所述基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型,具体包括:
按照预先为所述对象描述数据中的文本分词向量标注的顺序,将所述文本分词向量在不同实体分类上的概率值形成多个实体识别结果;
以所述文本分词向量的转移矩阵作为所述多个实体识别结果的约束条件,计算所述多个实体识别结果对应的评估分数;
选取评估分数最高的实体识别结果作为文本分词向量对应的实体类型。
在本发明另一实施例中,若所述描述对象的实体关键词为至少两个,则所述基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据,具体包括:
基于所述描述对象的至少两个实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述至少两个实体关键词相匹配对象的图像描述数据;
按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据。
在本发明另一实施例中,所述对象的图像描述数据包括对象的状态信息以及对象的图像信息,所述按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据,具体包括:
按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于首位的实体关键词相匹配对象的状态信息;
按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于末位的实体关键词相匹配对象的图像信息;
将所述对象的状态信息与所述对象的图像信息进行合并处理,形成对象的图像描述数据。
根据本申请的第二个方面,提供了一种数据处理方法,该方法包括:
响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
传输所述待展示对象规格数据。
根据本申请的第三个方面,提供了一种数据处理方法,该方法包括:
输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
接收待展示对象规格数据。
在本发明另一实施例中,在所接收待展示对象规格数据之后,所述方法还包括:
基于所述待展示对象规格数据中对象的状态信息,设置所述对象规格数据进行展示的动画效果;
按照所述对象规格数据进行展示的动画效果,展示所述待展示对象规格数据中对象的图像信息。
根据本申请的第四个方面,提供了一种数据处理方法,该方法包括:
响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
接收对象在预设规格参数上的图像描述数据;
将所述图像描述数据映射至对象在预设规格参数上的状态信息以及图像信息后进行展示。
根据本申请的第五个方面,提供了一种应用于服务端的数据处理装置,该装置包括:
提取单元,用于响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;
选取单元,用于基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;
处理单元,用于将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
在本发明另一实施例中,所述装置还包括:
判断单元,用于在所述提取所述对象描述数据中描述对象的实体关键词之前,判断所述对象描述数据是否由预先配置的规格预选渠道进行输入;
所述提取单元,具体用于若对象描述数据是由预先配置的规格预选渠道进行输入,则利用所述预先配置的规格预选渠道查询输入的对象描述数据,提取所述对象描述数据中描述对象的实体关键词;
所述提取单元,具体还用于若对象描述数据不是由预先配置的规格预选渠道进行输入,则利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词。
在本发明另一实施例中,所述实体识别模型为基于条件随机场框架训练的深度学习网络模型,所述实体识别模型包含多层结构,所述提取单元包括:
处理模块,用于利用所述实体识别模型中查表层内预先嵌入的词向量矩阵,将所述对象描述数据处理为文本分词向量;
计算模块,用于利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值;
校验模块,用于利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型;
提取模块,用于基于所述文本分词向量对应的实体类型,提取所述对象描述数据中描述对象的实体关键词。
在本发明另一实施例中,所述计算模块包括:
拼接子模块,用于利用所述实体识别模型中双向时序记忆层将所述文本分词向量拼接为完整的隐状态序列;
处理子模块,用于将所述完整的隐状态序列所对应的向量维度处理至预设维度,得到文本分词向量的分类矩阵,所述分类矩阵记录有文本分词向量映射至不同实体类型上的概率值。
在本发明另一实施例中,所述校验模块包括:
设置子模块,用于利用所述条件随机场框架预先为所述对象描述数据中的文本分词向量标注的位置信息,设置文本分词向量的转移矩阵;
调整子模块,用于基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型。
在本发明另一实施例中,调整子模块,具体用于按照预先为所述对象描述数据中的文本分词向量标注的顺序,将所述文本分词向量在不同实体分类上的概率值形成多个实体识别结果;
调整子模块,具体还用于以所述文本分词向量的转移矩阵作为所述多个实体识别结果的约束条件,计算所述多个实体识别结果对应的评估分数;
调整子模块,具体还用于选取评估分数最高的实体识别结果作为文本分词向量对应的实体类型。
在本发明另一实施例中,若所述描述对象的实体关键词为至少两个,则所述选取单元包括:
选取模块,用于基于所述描述对象的至少两个实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述至少两个实体关键词相匹配对象的图像描述数据;
合并模块,用于按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据。
在本发明另一实施例中,所述对象的图像描述数据包括对象的状态信息以及对象的图像信息,所述合并模块包括:
第一选取子模块,用于按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于首位的实体关键词相匹配对象的状态信息;
第二选取子模块,用于按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于末位的实体关键词相匹配对象的图像信息;
合并子模块,用于将所述对象的状态信息与所述对象的图像信息进行合并处理,形成对象的图像描述数据。
根据本申请的第六个方面,提供了一种应用于服务端的数据处理装置,该装置包括:
筛选单元,用于在所述将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据之后,响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
传输单元,用于传输所述待展示对象规格数据。
根据本申请的第七个方面,提供了一种应用于客户端的数据处理装置,该装置包括:
输出单元,用于输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
第一生成单元,用于响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第一接收单元,用于接收待展示对象规格数据。
在本发明另一实施例中,所述装置还包括:
设置单元,用于在所接收待展示对象规格数据之后,基于所述待展示对象规格数据中对象的状态信息,设置所述对象规格数据进行展示的动画效果;
展示单元,用于按照所述对象规格数据进行展示的动画效果,展示所述待展示对象规格数据中对象的图像信息。
根据本申请的第八个方面,提供了一种应用于客户端的数据处理装置,该装置包括:
第二生成单元,用于响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第二接收单元,用于接收对象在预设规格参数上的图像描述数据;
映射单元,用于将所述图像描述数据映射至为对象在预设规格参数上的状态信息以及图像信息后进行展示。
根据本申请的第九个方面,提供了一种数据处理系统,该系统包括接收端和发送端;
所述发送端输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
当所述发送端响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
响应于对象规格数据的展示请求,所述接收端根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
所述接收端传输所述待展示对象规格数据;
所述发送端接收待展示对象规格数据。
根据本申请的第十个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述数据处理方法。
根据本申请的第十一个方面,提供了一种客户端设备和服务器设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数据处理方法。
借由上述技术方案,本申请提供的一种数据处理方法、装置及设备,与目前现有方式中对象规格的描述数据在页面通常为文字形式的展示方式相比,本申请通过响应于对象描述数据的处理请求,提取对象描述数据中描述对象的实体关键词,进而基于描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与实体关键词相匹配对象的图像描述数据,进一步将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据,以使得对象规格的描述数据可以形成不同规格的图像在页面中进行展示,提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种数据处理方法的流程示意图;
图2示出了本申请实施例提供的另一种数据处理方法的流程示意图;
图3示出了本申请实施例提供的另一种数据处理方法的流程示意图;
图4示出了本申请实施例提供的另一种数据处理方法的流程示意图;
图5示出了本申请实施例提供的另一种数据处理方法的流程示意图;
图6a示出了本申请实施例提供的一种数据处理方法的交互时序图;
图6b示出了本申请实施例提供的另一种数据处理方法的交互时序图;
图7示出了本申请实施例提供的另一种数据处理方法的流程示意图;
图8a示出了本申请实施例提供的一种实体对象客户端中对象描述数据的展示效果图;
图8b示出了本申请实施例提供的一种用户客户端中对象规格数据的展示效果图;
图9示出了本申请实施例提供的一种数据处理装置的结构示意图;
图10示出了本申请实施例提供的另一种数据处理装置的结构示意图;
图11示出了本申请实施例提供的另一种数据处理装置的结构示意图;
图12示出了本申请实施例提供的另一种数据处理装置的结构示意图;
图13示出了本申请实施例提供的另一种数据处理装置的结构示意图;
图14示出了本申请实施例提供的另一种数据处理装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请涉及的数据处理系统包括发送端和接收端,其中,发送端为用户客户端,为了能够更直观展示对象规格数据,用于输出绑定有对象在不同规格参数上图像描述数据的选项按钮,响应于对绑定有对象在预设规格参数上图像描述数据的检测按钮的触发操作,生成并发送对象规格数据的展示请求,该展示请求携带有预设规格参数,接收待展示对象规格数据。接收端为服务端,可以为网络平台对应的服务端,用于响应于对象描述数据的处理请求,提取对象描述数据中描述对象的实体关键词,进一步基于描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与实体关键词相匹配对象的图像描述数据,将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。具体在实际应用过程中,一方面服务端与实体对象的客户端进行交互,服务端能够基于实体对象的客户端输入的实体对象描述数据,将实体对象的描述数据处理为对象在不同规格参数上的图像描述数据,另一方面服务端与用户的客户端进行交互,服务端能够针对用户的客户端所产生对预设参数规格上图像描述数据的触发操作,从服务端获取预设参数规格上的图像描述数据作为对象规格数据进行展示,进而提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
为了解决该问题,本实施例提供了一种数据处理方法,如图1所示,该方法应用于服务端,包括如下步骤:
101、响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词。
其中,对象描述数据的处理请求通常由实体对象的客户端所触发,该实体对象相当于网络平台中所对接的线上店铺、线上卖家等,具体应用于实体对象的客户端与服务端之间的交互过程,对象描述数据可以为对象在页面中进行展示所需要的描述数据,包括但不局限于对象的基本信息、对象图片、对象详情等描述字段,这里对象的基本信息具体可以包括对象名称、对象类目、对象条码等,基于不同对象类目所设置的对象详情不同,对于饮品类目所设置的对象详情具体可以包括对象品类、对象主材料、可附加材料等,对于食品类目所设置的对象详情具体可以包括对象品类、对象组分明细、对象口味等。通常情况下,对象描述数据是由对象实体来配置,当对象实体需要添加或者更新对象在网络平台中的显示信息时,可以通过向网络平台中输入相应对象描述数据,网络平台的服务端在接收到对象描述数据后,由于对象描述数据可能包含有冗余信息或者错误信息,并非是可以直接展示的数据形式,进一步触发对象描述数据的处理请求,将对象描述数据处理为可在客户端进行展示的对象规格数据。
在本发明实施例中,对象实体在提交对象描述数据的过程中,为了便于用户选取,实体对象还可以预先设置不同的对象规格参数,例如,分量规格参数,口味规格参数、辅料添加规格参数等,进一步将对象的规格参数作为后续对象规格数据展示的依据,并向用户提供更丰富的规格选项,提高用户的选择体验。
具体在提取对象描述数据中描述对象的实体关键词的过程中,由于实体对象输入的对象描述数据可能存在不符合展示规则的情况,可以利用关系抽取技术来提取对象描述数据中描述对象的实体关键词,该关系抽取技术能够根据训练数据设计有效的特征,从而学习各种分类模型,然后使用训练好的分类预测关系,从对象描述数据中抽取出关系三元组,例如,针对对象描述数据“好吃的辣椒酱”,其中,辣椒是实体1,酱是实体2,好吃的是非实体,进一步从关系三元组中提取实体关键词。
对于本实施例的执行主体可以为数据处理装置或设备,可以配置在网络平台的服务端,当服务端接收到实体对象提交的对象描述数据后,服务端需要将对象描述数据处理为可展示的对象在不同规格参数上的图像描述数据,进而当客户端触发对不同规格参数的对象规格数据的展示指令时,基于服务端处理的图像描述数据,筛选出预设规格参数的图像描述数据作为对象规格数据进行展示。
102、基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据。
通常情况下,为了提高对象描述数据的处理效率,服务端的数据平台会预先收集不同对象的图像描述数据,通常针对实际应用中经常会使用到的对象食材,例如,辣椒、花生、胡椒、番茄酱、千岛酱等。
其中,对象的图像描述数据可以包括但不局限于对象名称、对象状态、对象图像等,现有技术中对象规格的描述数据通常只包含文本描述,为了使得页面中能够更直观展示对象规格的描述数据,可以在展示对象规格的描述数据时,将对象的图像描述数据加入至客户端页面中进行展示,以使得客户端页面中可以展示出不同样式对象规格的描述数据,提高对象规格数据的展示效果。
应说明的是,对象描述数据中可能包含多个实体对象,此时,描述对象的实体关键词可表示为至少一个分词,每个分词作为一个对象可以从数据平台中预先收集不同对象的描述数据中选取出一个对象的图像描述数据,对于实体关键词表示为一个分词的情况,可以直接从数据平台中确定出与之匹配对象的图像描述数据,而对于实体关键词表示为至少两个分词的情况,会从数据平台中选取出至少两个与之匹配对象的图像描述数据,例如,辣椒可以选取出一个对象的图像描述数据,酱可以选取出一个对象的图像描述数据,而辣椒酱作为两个实体关键词,可以选取出两个对象的图像描述数据,此时确定对象的图像描述数据的方式,可以从至少两个与之匹配对象的图像描述数据中随机选取出一个作为对象的图像描述数据,还可以将至少两个与之匹配对象的图像描述数据进行组合,形成对象的图像描述数据,这里不进行限定。
103、将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
由于对象的图像描述数据可以从对象状态、对象图像等维度来描述,而不同对象状态、对象图像可以形成的规格参数并不相同,对于液态对象状态的饮品,规格参数可以表示为冷热,例如,冷饮,热饮,还可以表示为毫升,例如,大杯(1000ml)、中杯(800ml)、小杯(500ml);对于固态对象状态的食品,规格参数可以表示为克数,例如,500g、700g、1000g,还可以表示为食品搭配等,例如,搭配辣酱、搭配麻酱等,这里不进行限定。
应说明的是,这里的规格参数通常指对象在份量或者搭配上表现的差异,还可以根据实体对象所设置的搭配来进行组合,例如,主食、搭配食品、搭配酱汁进行组合后的规格参数,针对每种主食可以选择不同的搭配食品以及不同的搭配酱汁,从而形成对象在不同规格参数上的图像描述数据。
本申请实施例提供的数据处理方法,与目前现有方式中对象规格的描述数据在页面通常为文字形式的展示方式相比,本申请通过响应于对象描述数据的处理请求,提取对象描述数据中描述对象的实体关键词,进而基于描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与实体关键词相匹配对象的图像描述数据,进一步将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据,以使得对象规格的描述数据可以形成不同规格的图像在页面中进行展示,提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,本实施例提供了另一种数据处理方法,如图2所示,该方法包括:
201、响应于对象描述数据的处理请求,判断所述对象描述数据是否由预先配置的规格预选渠道进行输入。
为了便于实体对象进行数据配置,网络平台对应的服务端可以在页面中预先配置规格预选渠道,该规格预选渠道内设置有各种对象的规格选项,该规格选项可以为复选框或者下拉菜单等多种选择方式,以使得实体对象可以通过规格预选渠道来选取适用于描述对象的规格选项,无需手动输入对象描述数据。
可以理解的是,由于规格预选渠道内的规格选项受到对象描述文本的限制,无法完全符合实体对象的需求,而此时如果用户需要输入其他的规格选项或者自定义规格选项,网络平台对应的服务端可以在页面中定义其他的输入渠道,作为对象描述数据的输入渠道,实体对象可以利用该输入渠道来自定义输入具有特色的对象描述数据,例如,美味辣酱、甜甜的蜂蜜、超燃辣椒等。
在本发明实施例中,通过预先配置的规格预选渠道进行输入的对象描述数据可以直接获取到规格选项,进而将规格选项作为描述对象的实体关键词,并在选取与实体关键词相匹配的图像描述数据后,展示对象规格数据;而未通过预先配置的规格预选渠道进行输入的对象描述数据无法直接获取到规格选项,需要进一步识别对象描述数据中的实体关键词,并选取与实体关键词相匹配的图像描述数据后,展示对象规格数据。
202、若是,则利用所述预先配置的规格预选渠道查询输入的对象描述数据,提取所述对象描述数据中描述对象的实体关键词。
在实际应用过程中,针对一个对象,实体对象利用规格预选渠道所配置的规格选项可能包含多个类型,例如,重量规格类型、口味规格类型、辅料规格类型等,具体可以将每一种规格类型的规格选项形成一种规格类型上不同规格参数的对象描述数据,进而将多个规格类型的规格选项形成多个规格类型在不同规格参数上的对象描述数据,通过提取每种规格类型中规格选项所对应的实体,作为对象描述数据中描述对象的实体关键词。
通常情况下,每种规格类型的规格选项都有映射有不同尺寸的实体或者不同类型的实体,例如,重量规格类型的规格选项映射有描述对象体积或者大小的单位实体,可以为碗、杯或者盒,口味规格类型的规格选项映射有描述口味的对象,可以为辣椒、芥末、麻酱等,辅料规格类型的规格选项映射有描述辅料的对象,可以为珍珠、绿豆、花生等。
相应的,与步骤202并列执行的有步骤203、若否,则利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词。
其中,实体识别模型为基于条件随机场框架训练的深度学习网络模型,该实体识别模型包含多层结构,可以识别对象描述数据,并对对象描述数据中描述对象的文字进行标注,进而提取出描述对象的实体关键词。
在本发明实施例中,实体识别模型的结构包括查表层、双向时序记忆层以及布置的条件随机场框架,具体可以利用实体识别模型中查表层内预先嵌入的词向量矩阵,将对象描述数据处理为文本分词向量,然后利用实体识别模型中双向时序记忆层计算文本分词向量在不同实体分类上的概率值,进一步利用条件随机场框架对文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型,最后基于文本分词向量对应的实体类型,提取对象描述数据中描述对象的实体关键词。
具体利用实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值的过程中,可以利用实体识别模型中双向时序记忆层将文本分词向量拼接为完整的隐状态序列;将完整的隐状态序列所对应的向量维度处理至预设维度,得到文本分词向量的分类矩阵,该分类矩阵记录有文本分词向量映射至不同实体类型上的概率值。
具体利用条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型的过程中,可以利用条件随机场框架预先为对象描述数据中的文本分词向量标注的位置信息,设置文本分词向量的转移矩阵,基于文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型。
应说明的是,由于文本分词向量的转移矩阵形成有多个实体识别结果,为了更准确选取出文本分词向量对应的实体类型,在基于文本分词向量的转移矩阵调整文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型的过程中,具体可以按照预先为对象描述数据中的文本分词向量标注的顺序,将文本分词向量在不同实体分类上的概率值形成多个实体识别结果,以文本分词向量的转移矩阵作为多个实体识别结果的约束条件,计算多个实体识别结果对应的评估分数,选取评估分数最高的实体识别结果作为文本分词向量对应的实体类型。
具体应用过程中,对于是输入对象描述数据为“好吃的辣椒酱”利用实体识别模型的查表层内预先嵌入的词向量矩阵,这里可以由one-hot向量将对象描述数据所形成的文本句子映射为词向量
Figure 388337DEST_PATH_IMAGE001
,得到文本分词向量,记作
Figure 856227DEST_PATH_IMAGE002
,然后利用实体识别模型中双向时序记忆层来自动提取对象描述数据所形成的文本句子的句子特征,将文本分词向量转换为正向的隐状态向量
Figure 498561DEST_PATH_IMAGE003
和反向的隐状态向量
Figure 820827DEST_PATH_IMAGE004
,并将正向的隐状态向量和反向的隐状态向量拼接为完整的隐状态向量
Figure 382258DEST_PATH_IMAGE005
,进一步接入一个线性层,将完整的隐状态向量从维映射到维,从而得到文本分词向量的分类矩阵,记作
Figure 947232DEST_PATH_IMAGE006
,可以将
Figure 206306DEST_PATH_IMAGE007
的每一维
Figure 930548DEST_PATH_IMAGE008
都是作为将字
Figure 380990DEST_PATH_IMAGE001
分类到第
Figure 761156DEST_PATH_IMAGE009
个实体类型标签上的概率值,最后利用条件随机场框架进行对象描述数据所形成的文本句子的序列标注,利用矩阵
Figure 479713DEST_PATH_IMAGE010
表示从第
Figure 809194DEST_PATH_IMAGE011
个标签到第
Figure 853374DEST_PATH_IMAGE009
个标签的转移概率值,进而为一个位置进行标注的时候可以利用此前已标注过的标签,以使得对象描述数据所形成的文本句子中每个位置的概率值需要由两部分来决定,一部分是双向时序记忆层所输出矩阵
Figure 563578DEST_PATH_IMAGE012
所形成的概率值,另一部分是条件随机场框架所输出矩阵
Figure 85827DEST_PATH_IMAGE010
所形成的概率值,根据部分概率值对文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体分类,进一步提取出对象描述数据中的实体关键词为“辣椒”、“酱”。
204、若所述描述对象的实体关键词为至少两个,则基于所述描述对象的至少两个实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述至少两个实体关键词相匹配对象的图像描述数据。
可以理解的是,实体对象自定义输入的对象描述数据很有可能包含至少两个实体关键词,至少两个实体关键词可以从数据平台中预先收集不同对象的图像描述数据中选取与出至少两个实体关键词相匹配对象的图像描述数据。
205、按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据。
通常情况下,至少两个实体关键词所形成的对象在用户客户端仅能对应一种图像描述数据,这里可以将至少两个实体关键词组合成一个新的实体关键词,例如,蜂蜜柚子、柠檬养乐多、芥末酱等,而针对新的实体关键词,可以从数据平台中预先收集不同对象的图像描述数据中选取出多个图像描述数据,进一步从多个图像描述数据中选取出最适合作为新的实体关键词的图像描述数据。
在本发明实施例中,对象的图像描述数据包括对象的状态信息以及对象的图像信息,在从多个图像描述数据中选取出最适合作为新的实体关键词的图像描述数据过程中,具体可以按照至少两个实体关键词描述对象的语义顺序,选取语义顺序处于首位的实体关键词相匹配对象的状态信息,按照至少两个实体关键词描述对象的语义顺序,选取语义顺序处于末位的实体关键词相匹配对象的图像信息,将对象的状态信息与对象的图像信息进行合并处理,形成对象的图像描述数据。
206、将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
在本发明实施例中,具体可以基于对象的图像描述数据提取出对象的状态信息和对象的图像信息,查询对象的状态信息所适用的规格参数,并按照对象的状态信息所适用的规格参数,将对象的图像信息处理为对象在不同规格参数上的图像描述数据。
在实际应用过程中,如果对象的状态信息为液态,对象的图像信息通常为瓶子、杯子等液态的承装容器,而对象的状态信息所适用的规格参数通常为大中小杯或者具体的单位数值,这里可以基于规格参数所划分的等级,对承装容器进行分割,还可以选择表征不同等级的承装容器,从而更直观展示出对象的规格参数,以供用户进行选择。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,如图3所示,该方法应用于服务端,包括如下步骤:
301、响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据。
其中,对象规格的展示请求通常由用户的客户端所触发,具体应用于用户客户端与服务端之间的交互过程,并在用户客户端展示不同规格类型的图像描述数据,一旦服务端接收到用户客户端请求展示预设规格参数上对象规格数据的触发指令时,可以从预先配置对象在不同规格参数上的图像描述数据中进行筛选,进而筛选出与预设规格参数相匹配的图像描述数据作为待展示对象规格数据。
302、传输所述待展示对象规格数据。
本实施例提供了另一种数据处理方法,如图4所示,该方法应用于客户端,包括如下步骤:
401、输出绑定有对象在不同规格参数上图像描述数据的选项按钮。
在本发明实施例中,这里的客户端相当于用户客户端,通过触发选项按钮可以在用户客户端界面中展示对象在不同规格参数上的图像描述数据,由于线上平台为了更直观展示对象的描述数据,针对服务端所配置的对象规格数据,会设置不同规格参数的选项按钮,用户可通过选择对象规格参数的选项按钮,展示对象在相应规格参数上图像描述数据,进而提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
402、响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求。
其中,展示请求携带有预设规格参数。由于用户在客户端触发预设规格参数的选项按钮后需要更直观了解预设规格参数上描述对象规格的图形表现,此时,如果接收到预设规格参数的选项按钮的触发操作,则说明用户想要查看预设规格参数所形成对象规格数据,进一步将向服务端发送预设规格参数的图像描述数据进行展示的请求,由到服务端来获取预设规格参数上的图像描述数据,并将预设规格参数上的图像描述数据形成对象规格数据进行展示。
403、接收待展示对象规格数据。
进一步地,为了便于用户客户端能够具有更生动的展示效果,可以在接收待展示对象规格数据后,基于待展示对象规格数据中对象的状态信息,设置对象规格数据进行展示的动画效果,例如,对象的状态信息为液体,可以设置液体流动的动画效果,对象的状态信息为粉末状固体,可以设置固体抖动的动画效果,然后按照对象规格数据进行展示的动画效果,展示待展示对象规格数据中对象的图像信息。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,如图5所示,该方法应用于客户端,包括如下步骤:
501、响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求。
其中,展示请求携带有预设规格参数,可以为重量大小、口味轻重等,展示的对象规格数据可以为描述对象在各个规格参数上图片信息、状态信息等等。
502、接收对象在预设规格参数上的图像描述数据。
通常情况下,用户在选取对象的过程中,页面中会展示绑定有各种规格参数的选项按钮,当用户触发对象在预设规格参数上的选项按钮时,用户客户端会将携带有预设规格参数的展示请求发送至网络平台的服务端,以使得服务端从预先配置对象的图像描述数据中筛选出预设规格参数上对象的图像描述数据,进而根据预设规格参数上对象的图像描述数据进行展示。
503、将所述图像描述数据映射至对象在预设规格参数上的状态信息以及图像信息后进行展示。
在本发明实施例中,由于图像描述数据中记录有预先定义好描述对象在各个规格参数上的图片信息、状态信息,为了能够更直观展示对象的规格参数,用户客户端可将图像描述数据映射至对象在预设规格参数上的状态信息以及图像信息,作为对象的规格数据进行展示。
具体在展示对象规格数据的应用场景中,首先确定对象的图片信息和状态信息,例如,液体为瓶装或杯装图片,固体为瓶装图片,辅助搭配为食材图片,然后按照预设规格参数调整规格类型在图片信息中的容量占比,控制容量显示高度,例如,杯装容量为1500ml,规格参数包括500ml、1000ml和1500ml,则每个规格参数在图片信息中的容量占比为1/3,容量显示高度为整杯的1/3,进一步将对象的图像信息调整至预设规格参数上的图片信息,对于规格参数增加或者减少的情况,同样可以调高或调低图片信息中的容量占比,控制增加或减少容量显示高度,并根据规格类型的状态信息来设置展示的动画效果,例如,液体的规格类型可以设置液体流动的动态效果,固体的规格类型可以设置固体抖动的动态效果,以提高规格参数在展示过程中的灵活性。
具体用户在选择对象规格数据的应用场景中,用户客户端在输出绑定有对象在不同规格参数上图像描述数据的选项按钮同时,还可以输出绑定有最佳搭配规格参数上图像描述数据的选项按钮,针对对象在不同规格参数上图像描述数据的选项按钮,用户可以进行单个选择或者多个合并选择,例如,多个规格的辅料搭配、多种口味的酱料,对于绑定有最佳搭配规格参数上图像描述数据的选项按钮,该最佳搭配规格参数对应有多种不同的规格参数组合,可以由网络平台预先配置好,还可由实体对象预先配置好,每当用户点击该选项按钮,可以向用户推荐一种规格参数组合,如果用户对当前提供的规格参数组合不是很满意,可以重复点击该选项按钮或者触发该选项按钮所提供的刷新,进而向用户推荐另一种规格参数组合,当然为了节省用户规格参数组合的选择时间,网络平台还可以利用对象历史订单数据来统计不同规格参数组合的订单情况,预先对多种不同的规格参数组合设置推荐顺序,这里可以按照规格参数组合的订单数量设置推荐顺序,例如,订单数量越多,推荐顺序越靠前,还可以按照用户对规格订单组合的评分设置推荐顺序,另外,为了便于用户能够灵活选取适用于不同群体的规格参数组合,还可以按照规格参数组合所适用推荐人群设置分类选项,例如,适用于推荐儿童群体的规格组合参数的选项,适用推荐健身群体的规格参数组合的选项,从而提高规格参数组合的推荐成功率。
本发明实施例提供了另一种数据处理方法,如图6a所示,该方法涉及到用户客户端与服务端之间的交互,包括:用户客户端输出绑定有对象在不同规格参数上图像描述数据的选项按钮,当用户客户端响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,该展示请求携带有预设规格参数,响应于对象规格数据的展示请求,服务端根据展示请求所携带的预设规格参数从对象在不同规格参数上的图像描述数据中筛选出与预设规格参数相匹配的图像描述数据作为待展示对象规格数据,服务端传输待展示对象规格数据,用户客户端接收待展示对象规格数据。
本发明实施例提供了另一种数据处理方法,如图6b所示,该方法涉及到实体对象客户端、用户客户端、服务端之间的交互,包括:实体对象客户端可以利用预先配置的规格预选渠道输入对象描述数据,或者利用其它输入渠道输入对象描述数据,进而将对象描述数据发送至服务端,服务端根据不同的输入渠道提取出对象描述数据中描述对象的实体关键词,并从数据平台中预先收集不同对象的图像描述数据中选取出与实体关键词相匹配对象的图像描述数据,并将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据,进而在用户客户端输出绑定有对象在不同规格参数上图像描述数据的选项按钮,当用户客户端响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,该展示请求携带有预设规格参数,服务端可以响应于对象规格数据的展示请求,并根据展示请求所携带的预设规格参数从对象在不同规格参数上的图像描述数据中筛选出与预设规格参数相匹配的图像描述数据作为待展示对象规格数据,传输待展示对象规格数据至用户客户端,最后用户客户端接收待展示对象规格数据进行展示。
具体应用场景中,实体对象客户端、用户客户端分别与服务端在进行交互的过程中所形成数据处理的流程框图,如图7所示,以服务端作为描述主体,服务端预先在数据平台收集不同对象的图像描述数据,在接收到实体对象客户端输入对象口味规格后,判断对象口味规格是否存在,如果存在,则对象口味规格作为实体关键词,可以直接从数据平台中提取与实体关键词相映射对象的图像描述数据,进而发送至用户客户端进行展示,如果不存在,则对象口味规格为作为自定义规格,可以设置相应的分级,并利用实体识别模型提取口味规格中的实体关键词,进一步从数据平台中提取与实体关键词相映射对象的图像描述数据,发送至用户客户端进行展示,并基于用户选择预设规格参数,在用户客户端展示相应的动画效果。
具体应用在实体对象客户端的实际场景中,实体对象客户端中对象描述数据的展示效果图可以如图8a所示,实体对象客户端可以从预先配置的常规规格中进行选取,还可以从自定义规格中选取,当然还可以自行输入自定义规格,这里对自定义规格的展示效果不进行限定,进一步由实体对象客户端基于现有的食材图片进行上传,形成自定义规格的展示效果,还可以由服务端相应自行匹配食材图片,形成自定义规格的展示效果。
具体应用在用户客户端的实际场景中,用户客户端中对象规格数据的展示效果图可以如图8b所示,针对黑椒牛肉套餐,在用户客户端展示对象规格数据后,用户可从界面中直观的看到配料、主食、自选酱料等食材图片,进一步可根据自己喜好从对象规格数据中分别选择黄瓜,白米饭+芝麻酱,完成对象规格数据的选取过程,进一步跳转至结算界面,根据选择的对象规格数据进行结算操作。
进一步的,作为图1-图2方法的具体实现,本申请实施例提供了一种应用于服务端的数据处理装置,如图9所示,该装置包括:提取单元61、选取单元62、处理单元63。
提取单元61,可以用于响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;
选取单元62,可以用于基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;
处理单元63,可以用于将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
本发明实施例提供的数据处理装置,与目前现有方式中对象规格的描述数据在页面通常为文字形式的展示方式相比,本申请通过响应于对象描述数据的处理请求,提取对象描述数据中描述对象的实体关键词,进而基于描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与实体关键词相匹配对象的图像描述数据,进一步将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据,以使得对象规格的描述数据可以形成不同规格的图像在页面中进行展示,提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
在具体的应用场景中,如图10所示,所述装置还包括:
判断单元64,可以用于在所述提取所述对象描述数据中描述对象的实体关键词之前,判断所述对象描述数据是否由预先配置的规格预选渠道进行输入;
所述提取单元61,具体可以用于若对象描述数据是由预先配置的规格预选渠道进行输入,则利用所述预先配置的规格预选渠道查询输入的对象描述数据,提取所述对象描述数据中描述对象的实体关键词;
所述提取单元61,具体还可以用于若对象描述数据不是由预先配置的规格预选渠道进行输入,则利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词。
在具体的应用场景中,如图10所示,所述实体识别模型为基于条件随机场框架训练的深度学习网络模型,所述实体识别模型包含多层结构,所述提取单元61包括:
处理模块611,可以用于利用所述实体识别模型中查表层内预先嵌入的词向量矩阵,将所述对象描述数据处理为文本分词向量;
计算模块612,可以用于利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值;
校验模块613,可以用于利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型;
提取模块614,可以用于基于所述文本分词向量对应的实体类型,提取所述对象描述数据中描述对象的实体关键词。
在具体的应用场景中,所述计算模块612包括:
拼接子模块6121,可以用于利用所述实体识别模型中双向时序记忆层将所述文本分词向量拼接为完整的隐状态序列;
处理子模块6122,可以用于将所述完整的隐状态序列所对应的向量维度处理至预设维度,得到文本分词向量的分类矩阵,所述分类矩阵记录有文本分词向量映射至不同实体类型上的概率值。
在具体的应用场景中,如图10所示,所述校验模块613包括:
设置子模块6131,可以用于利用所述条件随机场框架预先为所述对象描述数据中的文本分词向量标注的位置信息,设置文本分词向量的转移矩阵;
调整子模块6132,可以用于基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型。
在具体的应用场景中,调整子模块6132,具体可以用于按照预先为所述对象描述数据中的文本分词向量标注的顺序,将所述文本分词向量在不同实体分类上的概率值形成多个实体识别结果;
调整子模块6132,具体还可以用于以所述文本分词向量的转移矩阵作为所述多个实体识别结果的约束条件,计算所述多个实体识别结果对应的评估分数;
调整子模块6132,具体还可以用于选取评估分数最高的实体识别结果作为文本分词向量对应的实体类型。
在具体的应用场景中,如图10所示,若所述描述对象的实体关键词为至少两个,则所述选取单元62包括:
选取模块621,可以用于基于所述描述对象的至少两个实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述至少两个实体关键词相匹配对象的图像描述数据;
合并模块622,可以用于按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据。
在具体的应用场景中,如图10所示,所述对象的图像描述数据包括对象的状态信息以及对象的图像信息,所述合并模块622包括:
第一选取子模块6221,可以用于按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于首位的实体关键词相匹配对象的状态信息;
第二选取子模块6222,可以用于按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于末位的实体关键词相匹配对象的图像信息;
合并子模块6223,可以用于将所述对象的状态信息与所述对象的图像信息进行合并处理,形成对象的图像描述数据。
需要说明的是,本实施例提供的一种可应用于服务端侧的数据处理装置所涉及各功能单元的其它相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
进一步地,作为图3方法的具体实现,本申请实施例提供了一种应用于服务端的数据处理装置,如图11所示,该装置包括:筛选单元71、传输单元72。
筛选单元71,可以用于在所述将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据之后,响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
传输单元72,可以用于传输所述待展示对象规格数据。
需要说明的是,本实施例提供的一种可应用于服务端侧的数据处理装置所涉及各功能单元的其它相应描述,可以参考图3中的对应描述,在此不再赘述。
进一步地,作为图4方法的具体实现,本申请实施例提供了一种应用于客户端的数据处理装置,如图12所示,该装置包括:输出单元81、第一生成单元82、接收单元83。
输出单元81,可以用于输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
第一生成单元82,可以用于响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第一接收单元83,可以用于接收待展示对象规格数据。
在具体的应用场景中,如图13所示,所述装置还包括:
设置单元84,可以用于在所接收待展示对象规格数据之后,基于所述待展示对象规格数据中对象的状态信息,设置所述对象规格数据进行展示的动画效果;
展示单元85,可以用于按照所述对象规格数据进行展示的动画效果,展示所述待展示对象规格数据中对象的图像信息。
需要说明的是,本实施例提供的一种可应用于客户端侧的数据处理装置所涉及各功能单元的其它相应描述,可以参考图4中的对应描述,在此不再赘述。
进一步地,作为图5方法的具体实现,本申请实施例提供了一种应用于客户端的数据处理装置,如图14所示,该装置包括:第二生成单元91、第二接收单元92、映射单元93。
第二生成单元91,可以用于响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第二接收单元92,可以用于接收对象在预设规格参数上的图像描述数据;
映射单元93,可以用于将所述图像描述数据映射至为对象在预设规格参数上的状态信息以及图像信息后进行展示。
需要说明的是,本实施例提供的一种可应用于客户端侧的数据处理装置所涉及各功能单元的其它相应描述,可以参考图5中的对应描述,在此不再赘述。
基于上述如图1-图3所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1-图3所示的数据处理方法;基于上述如图4-5所示方法,相应的,本申请实施例还提供了另一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图4-5所示的数据处理方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1-图3所示的方法,以及图9-图11所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种服务端实体设备,具体可以为计算机,服务器,或者其他网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上如图1-图3所示的数据处理方法。
基于上述如图4-5所示的方法,以及图12-图14所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种客户端实体设备,具体可以为计算机,智能手机,平板电脑,智能手表,或者网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图4-5所示的数据处理方法。
可选的,上述两种实体设备都还可以包括用户接口、网络接口、摄像头、射频(Radio Frequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种数据处理的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述店铺搜索信息处理的实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有方式相比,本申请从数据平台中预先收集不同对象的图像描述数据中选取与实体关键词相匹配对象的图像描述数据,进一步将对象的图像描述数据处理为对象在不同规格参数上的图像描述数据,以使得对象规格的描述数据可以形成不同规格的图像在页面中进行展示,提供给用户更直观的规格展示,提高对象规格的描述数据在页面中的展示效果。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (19)

1.一种数据处理方法,其特征在于,包括:
响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;
基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;
将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
2.根据权利要求1所述的方法,其特征在于,在所述提取所述对象描述数据中描述对象的实体关键词之前,所述方法还包括:
判断所述对象描述数据是否由预先配置的规格预选渠道进行输入;
所述提取所述对象描述数据中描述对象的实体关键词,具体包括:
若是,则利用所述预先配置的规格预选渠道查询输入的对象描述数据,提取所述对象描述数据中描述对象的实体关键词;
若否,则利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词。
3.根据权利要求2所述的方法,其特征在于,所述实体识别模型为基于条件随机场框架训练的深度学习网络模型,所述实体识别模型包含多层结构,所述利用预先构建的实体识别模型对所述对象描述数据进行识别,提取所述对象描述数据中描述对象的实体关键词,具体包括:
利用所述实体识别模型中查表层内预先嵌入的词向量矩阵,将所述对象描述数据处理为文本分词向量;
利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值;
利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型;
基于所述文本分词向量对应的实体类型,提取所述对象描述数据中描述对象的实体关键词。
4.根据权利要求3所述的方法,其特征在于,所述利用所述实体识别模型中双向时序记忆层计算所述文本分词向量在不同实体分类上的概率值,具体包括:
利用所述实体识别模型中双向时序记忆层将所述文本分词向量拼接为完整的隐状态序列;
将所述完整的隐状态序列所对应的向量维度处理至预设维度,得到文本分词向量的分类矩阵,所述分类矩阵记录有文本分词向量映射至不同实体类型上的概率值。
5.根据权利要求3所述的方法,其特征在于,所述利用所述条件随机场框架对所述文本分词向量在不同实体分类上的概率值进行校验,得到文本分词向量对应的实体类型,具体包括:
利用所述条件随机场框架预先为所述对象描述数据中的文本分词向量标注的位置信息,设置文本分词向量的转移矩阵;
基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述文本分词向量的转移矩阵调整所述文本分词向量在不同实体分类上的概率值,得到文本分词向量对应的实体类型,具体包括:
按照预先为所述对象描述数据中的文本分词向量标注的顺序,将所述文本分词向量在不同实体分类上的概率值形成多个实体识别结果;
以所述文本分词向量的转移矩阵作为所述多个实体识别结果的约束条件,计算所述多个实体识别结果对应的评估分数;
选取评估分数最高的实体识别结果作为文本分词向量对应的实体类型。
7.根据权利要求1-6中任一项所述的方法,其特征在于,若所述描述对象的实体关键词为至少两个,则所述基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据,具体包括:
基于所述描述对象的至少两个实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述至少两个实体关键词相匹配对象的图像描述数据;
按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据。
8.根据权利要求7所述的方法,其特征在于,所述对象的图像描述数据包括对象的状态信息以及对象的图像信息,所述按照所述至少两个实体关键词描述对象的语义顺序,将所述至少两个实体关键词相匹配对象的图像描述数据合并处理,形成对象的图像描述数据,具体包括:
按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于首位的实体关键词相匹配对象的状态信息;
按照所述至少两个实体关键词描述对象的语义顺序,选取所述语义顺序处于末位的实体关键词相匹配对象的图像信息;
将所述对象的状态信息与所述对象的图像信息进行合并处理,形成对象的图像描述数据。
9.一种数据处理方法,其特征在于,包括:
响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
传输所述待展示对象规格数据。
10.一种数据处理方法,其特征在于,包括:
输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
接收待展示对象规格数据。
11.根据权利要求10所述的方法,其特征在于,在所接收待展示对象规格数据之后,所述方法还包括:
基于所述待展示对象规格数据中对象的状态信息,设置所述对象规格数据进行展示的动画效果;
按照所述对象规格数据进行展示的动画效果,展示所述待展示对象规格数据中对象的图像信息。
12.一种数据处理方法,其特征在于,包括:
响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
接收对象在预设规格参数上的图像描述数据;
将所述图像描述数据映射至对象在预设规格参数上的状态信息以及图像信息后进行展示。
13.一种数据处理装置,其特征在于,包括:
提取单元,用于响应于对象描述数据的处理请求,提取所述对象描述数据中描述对象的实体关键词;
选取单元,用于基于所述描述对象的实体关键词,从数据平台中预先收集不同对象的图像描述数据中选取与所述实体关键词相匹配对象的图像描述数据;
处理单元,用于将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据。
14.一种数据处理装置,其特征在于,包括:
筛选单元,用于在所述将所述对象的图像描述数据处理为对象在不同规格参数上的图像描述数据之后,响应于对象规格数据的展示请求,根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
传输单元,用于传输所述待展示对象规格数据。
15.一种数据处理装置,其特征在于,包括:
输出单元,用于输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
第一生成单元,用于响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第一接收单元,用于接收待展示对象规格数据。
16.一种数据处理装置,其特征在于,包括:
第二生成单元,用于响应于对象在预设规格参数上进行数据展示的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
第二接收单元,用于接收对象在预设规格参数上的图像描述数据;
映射单元,用于将所述图像描述数据映射至为对象在预设规格参数上的状态信息以及图像信息后进行展示。
17.一种数据处理系统,其特征在于,包括:接收端和发送端;
所述发送端输出绑定有对象在不同规格参数上图像描述数据的选项按钮;
当所述发送端响应于对绑定有对象在预设规格参数上图像描述数据的选项按钮的触发操作,生成并发送对象规格数据的展示请求,所述展示请求携带有预设规格参数;
响应于对象规格数据的展示请求,所述接收端根据所述展示请求所携带的预设规格参数从所述对象在不同规格参数上的图像描述数据中筛选出与所述预设规格参数相匹配的图像描述数据作为待展示对象规格数据;
所述接收端传输所述待展示对象规格数据;
所述发送端接收待展示对象规格数据。
18.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至12中任一项所述的数据处理方法。
19.一种服务端设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至12中任一项所述的数据处理方法。
CN202010719994.8A 2020-07-24 2020-07-24 数据处理方法、装置及设备 Active CN111738808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010719994.8A CN111738808B (zh) 2020-07-24 2020-07-24 数据处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010719994.8A CN111738808B (zh) 2020-07-24 2020-07-24 数据处理方法、装置及设备

Publications (2)

Publication Number Publication Date
CN111738808A true CN111738808A (zh) 2020-10-02
CN111738808B CN111738808B (zh) 2021-04-13

Family

ID=72657559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010719994.8A Active CN111738808B (zh) 2020-07-24 2020-07-24 数据处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111738808B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657100A (zh) * 2021-07-20 2021-11-16 北京百度网讯科技有限公司 实体识别方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165384A (zh) * 2018-08-23 2019-01-08 成都四方伟业软件股份有限公司 一种命名实体识别方法及装置
CN109344390A (zh) * 2018-08-23 2019-02-15 昆明理工大学 一种基于多特征神经网络的柬语实体识别的方法
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN110189749A (zh) * 2019-06-06 2019-08-30 四川大学 语音关键词自动识别方法
CN110955750A (zh) * 2019-11-11 2020-04-03 北京三快在线科技有限公司 评论区域和情感极性的联合识别方法、装置、电子设备
CN111429912A (zh) * 2020-03-17 2020-07-17 厦门快商通科技股份有限公司 关键词检测方法、系统、移动终端及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN109165384A (zh) * 2018-08-23 2019-01-08 成都四方伟业软件股份有限公司 一种命名实体识别方法及装置
CN109344390A (zh) * 2018-08-23 2019-02-15 昆明理工大学 一种基于多特征神经网络的柬语实体识别的方法
CN110189749A (zh) * 2019-06-06 2019-08-30 四川大学 语音关键词自动识别方法
CN110955750A (zh) * 2019-11-11 2020-04-03 北京三快在线科技有限公司 评论区域和情感极性的联合识别方法、装置、电子设备
CN111429912A (zh) * 2020-03-17 2020-07-17 厦门快商通科技股份有限公司 关键词检测方法、系统、移动终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
左手执笔: "手机淘宝怎么一单买一个商品下的多个规格", 《HTTPS://JINGYAN.BAIDU.COM/ARTICLE/4E5B3E190045C091901E24A3.HTML》 *
曾文: "《基于科技大数据的情报分析方法与技术研究》", 30 September 2018 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657100A (zh) * 2021-07-20 2021-11-16 北京百度网讯科技有限公司 实体识别方法、装置、电子设备及存储介质
CN113657100B (zh) * 2021-07-20 2023-12-15 北京百度网讯科技有限公司 实体识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111738808B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN107092608B (zh) 一种目标对象的搜索、推荐方法和设备
CN105446972B (zh) 基于及融合用户关系数据的搜索方法、装置和系统
US8682929B2 (en) User access to item information
KR101132509B1 (ko) 모바일 검색을 위한 모바일 시스템, 검색 시스템 및 검색 결과 제공 방법
US9251523B2 (en) Method and system for automatically completed general recommended word and advertisement recommended word
JP6938680B2 (ja) 関連コンテンツを使用した画像の効率的な増強
WO2012118892A1 (en) Food or drink product searching and matching system and method
US20130085900A1 (en) Enhancing the search experience in a networked publication system by improved search and listing process
CN105893564A (zh) 一种基于搜索引擎客户端的搜索方法和装置
JP6310599B1 (ja) 検索装置、検索方法および検索プログラム
CN111738808B (zh) 数据处理方法、装置及设备
KR20160146273A (ko) 지능형 매칭 커머스 제공 시스템 및 방법
JP2017134744A (ja) 情報処理システム、情報処理方法、および情報処理プログラム
US20070143217A1 (en) Network access to item information
CN112711706A (zh) 信息交互方法、装置、可读存储介质和电子设备
CN112883719A (zh) 一种品类词识别方法、模型训练方法、装置及系统
CN110850997A (zh) 一种输入法及其系统
CN113191834A (zh) 商品对象发布、识别方法、装置、电子设备和存储介质
JP7354329B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN112445909A (zh) 商品检索方法及装置
CN111737565A (zh) 显示控制方法、设备、系统、客户端、服务器及存储介质
CN115795136A (zh) 一种数据处理方法、装置及设备
Qiu et al. A deep matching model for detecting reviews mismatched with products in e-commerce
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム
CN112445921A (zh) 摘要生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant