CN111507774A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN111507774A
CN111507774A CN202010348082.4A CN202010348082A CN111507774A CN 111507774 A CN111507774 A CN 111507774A CN 202010348082 A CN202010348082 A CN 202010348082A CN 111507774 A CN111507774 A CN 111507774A
Authority
CN
China
Prior art keywords
user
information
attribute information
feedback information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010348082.4A
Other languages
English (en)
Inventor
杨俊�
韦明书
金彦
陈峤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yitu Network Science and Technology Co Ltd
Original Assignee
Shanghai Yitu Network Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yitu Network Science and Technology Co Ltd filed Critical Shanghai Yitu Network Science and Technology Co Ltd
Priority to CN202010348082.4A priority Critical patent/CN111507774A/zh
Publication of CN111507774A publication Critical patent/CN111507774A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,尤其涉及一种数据处理方法及装置,获取用户的语音信息和图像信息;根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理,这样,通过语音和图像分析处理获得的用户属性信息和用户对于目标对象的反馈信息,并与用户关联存储,进而实现将用户的数据进行收集,能够提高数据收集效率。

Description

一种数据处理方法及装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种数据处理方法及装置。
背景技术
目前,企业通常可以通过用户声音(Voice of Customer,VOC)对服务进行改进和升级,因此,如何能够更有效地获得用户数据是非常必要的。
现有技术中,主要是通过传统的方式来收集用户数据,例如,通过调查问卷方式收集用户数据,但现有技术中的这种方法依赖人工操作,耗费的成本较高,效率较低,并且若用户积极性不高不予配合时,则无法获取到有效的用户数据,另外,由于现有技术中的这种方法受限于调查群体和事后反馈,因此,也无法保证用户反馈数据的真实性,因此,如何提高数据收集效率,成为了一个亟待解决的问题。
发明内容
本申请实施例提供一种数据处理方法及装置,以提高数据收集效率。
本申请实施例提供的具体技术方案如下:
一种数据处理方法,包括:
获取用户的语音信息和图像信息;
根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;
将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理。
可选的,根据所述语音信息和所述图像信息,获得所述用户的用户属性信息,具体包括:
提取所述图像信息的图像特征信息;
基于已训练的图像识别模型,以所述图像特征信息为输入参数,获得所述用户的用户属性信息,其中,所述图像识别模型为根据训练图像样本集迭代训练获得的,所述训练图像样本集中包括多个训练图像样本,所述训练图像样本为有用户属性信息标注的图像样本。
可选的,所述用户属性信息中至少包括用户外表特征,则获得所述用户的用户属性信息,具体包括:
对所述图像信息进行特征提取,获得所述用户的用户外表特征。
可选的,根据所述语音信息和所述图像信息,获得所述用户对于目标对象的反馈信息,具体包括:
基于语音识别方法,将所述语音信息转换为相应的文本信息;
根据已训练的语义识别模型,以所述文本信息为输入参数,获得所述用户对于目标对象的反馈信息,其中,所述语义识别模型为根据文本样本集迭代训练获得的,所述文本样本集中至少包括多个文本样本,所述文本样本表征用户针对目标对象的反馈信息。
可选的,所述用户属性信息中至少包括预设表征用户身份标识的身份属性信息;
将所述用户属性信息和所述反馈信息,与所述用户关联存储,具体包括:
分别将所述身份属性信息与存储的各用户的身份属性信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,所述图像信息中至少包括人脸图像信息,则将所述用户属性信息和所述反馈信息,与所述用户关联存储,具体包括:
分别将所述人脸图像信息与存储的各用户的人脸图像信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,将所述用户属性信息和所述反馈信息,与所述用户关联存储之后,进一步包括:
根据所述反馈信息,确定与所述反馈信息对应的目标对象的对象编号;
建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
接收用户属性信息查找指令,并根据所述用户属性信息查找指令中的用户编号,查找与所述用户编号对应的用户属性信息,并返回查找到的用户属性信息,其中,所述用户属性信息查找指令中至少包括用户编号。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
接收反馈信息查找指令,并根据所述反馈信息查找指令中的对象编号,查找与所述对象编号对应的反馈信息,并返回查找到的反馈信息,其中,所述反馈信息查找指令中至少包括对象编号。
一种数据处理装置,包括:
获取模块,用于获取用户的语音信息和图像信息;
分析模块,用于根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;
存储模块,用于将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理。
可选的,根据所述语音信息和所述图像信息,获得所述用户的用户属性信息时,分析模块具体用于:
提取所述图像信息的图像特征信息;
基于已训练的图像识别模型,以所述图像特征信息为输入参数,获得所述用户的用户属性信息,其中,所述图像识别模型为根据训练图像样本集迭代训练获得的,所述训练图像样本集中包括多个训练图像样本,所述训练图像样本为有用户属性信息标注的图像样本。
可选的,所述用户属性信息中至少包括用户外表特征,则获得所述用户的用户属性信息时,分析模块具体用于:
对所述图像信息进行特征提取,获得所述用户的用户外表特征。
可选的,根据所述语音信息和所述图像信息,获得所述用户对于目标对象的反馈信息时,分析模块具体用于:
基于语音识别方法,将所述语音信息转换为相应的文本信息;
根据已训练的语义识别模型,以所述文本信息为输入参数,获得所述用户对于目标对象的反馈信息,其中,所述语义识别模型为根据文本样本集迭代训练获得的,所述文本样本集中至少包括多个文本样本,所述文本样本表征用户针对目标对象的反馈信息。
可选的,所述用户属性信息中至少包括预设表征用户身份标识的身份属性信息;
存储模块具体用于:
分别将所述身份属性信息与存储的各用户的身份属性信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,所述图像信息中至少包括人脸图像信息,则存储模块具体用于:
分别将所述人脸图像信息与存储的各用户的人脸图像信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,将所述用户属性信息和所述反馈信息,与所述用户关联存储之后,进一步包括:
确定模块,用于根据所述反馈信息,确定与所述反馈信息对应的目标对象的对象编号;
关联模块,用于建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
第一查找模块,用于接收用户属性信息查找指令,并根据所述用户属性信息查找指令中的用户编号,查找与所述用户编号对应的用户属性信息,并返回查找到的用户属性信息,其中,所述用户属性信息查找指令中至少包括用户编号。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
第二查找模块,用于接收反馈信息查找指令,并根据所述反馈信息查找指令中的对象编号,查找与所述对象编号对应的反馈信息,并返回查找到的反馈信息,其中,所述反馈信息查找指令中至少包括对象编号。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数据处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法的步骤。
本申请实施例中,获取用户的语音信息和图像信息,对语音信息和图像信息进行分析,获得用户的用户属性信息和用户对于目标对象的反馈信息,将用户属性信息和反馈信息,与用户关联存储,用户属性信息和反馈信息用于相关服务升级处理,这样,通过将分析处理获得的用户属性信息和用户对于目标对象的反馈信息,与用户管理存储,能够实现将用户的数据进行收集,这样,无需通过人工操作,就能够收集用户的数据,并且不依赖于用户的配合,不受限于调查群体和事后反馈,就能够获取到有效的用户数据,不仅保证了用户反馈数据的真实性,还提高了数据收集效率。
附图说明
图1为本申请实施例中一种数据处理方法的流程图;
图2为本申请实施例中另一种数据处理方法的流程图;
图3为本申请实施例中数据处理装置的结构示意图;
图4为本申请实施例中电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,企业通常可以通过用户声音(Voice of Customer,VOC)或调查用户意向对服务进行改进和升级,例如,在服装店的应用场景中,相关工作人员通常通过调查用户意向,调查不同的用户对服装的喜好,进而对服装进行改进,因此,如何能够更有效地获得用户数据是非常必要的。
现有技术中,主要是通过传统的方式来收集用户数据,例如,在服装店的应用场景中,相关工作人员通常会通过调查问卷方式或询问用户的意见的方式收集用户数据,但现有技术中的这种方法依赖人工操作,例如,需要用户配合填表反馈,这样,不仅耗费的成本较高,效率较低,并且若用户积极性不高不予配合时,例如,在服装店的应用场景中,有些用户不愿意配合调查,或者在店员询问意见时,不予配合,这样,很难获取到有效的用户数据,另外,由于现有技术中的这种方法受限于调查群体和事后反馈,因此,也无法保证用户反馈数据的真实性,因此,如何提高数据收集效率,成为了一个亟待解决的问题。
本申请实施例中,获取用户的语音信息和图像信息,根据语音信息和图像信息,获得用户的用户属性信息和用户对于目标对象的反馈信息,并将用户属性信息和反馈信息,与用户关联存储,其中,用户属性信息和反馈信息用于相关服务升级处理,这样,通过语音和图像获取用户的用户属性信息和反馈信息,并与用户关联存储,能够多方位采集用户的数据,进行结构化并归总,无需依赖于人工操作,就能够获取到有效的用户数据,并提高了数据收集效率。
基于上述实施例,参阅图1所示,为本申请实施例中一种数据处理方法的流程图,具体包括:
步骤100:获取用户的语音信息和图像信息。
本申请实施例中,执行主体可以为服务器,也可以为终端,例如,当执行主体为服务器时,则通过采集设备采集用户的语音信息和图像信息,进而将采集到的用户的语音信息和图像信息发送到服务器,由服务器进行后续的处理。
又例如,当执行主体为终端时,则可由终端上的采集设备采集用户的语音信息和图像信息,并上传到终端上,进而终端进行后续的处理,本申请实施例中,终端例如可以为前端网络摄像机(Internet Protocol Camera,IPC),本申请实施例中对此并不进行限制。
步骤110:根据所述语音信息和所述图像信息,获得用户的用户属性信息和用户对于目标对象的反馈信息。
本申请实施例中,在获取到用户的语音信息和图像信息之后,通过预设的分析方式分别对获取到的用户的语音信息和图像信息进行分析,获得用户的用户属性信息和用户对于目标对象的反馈信息。
例如,本申请实施例中对语音信息的分析方式可以为语音识别、语义识别等,对图像信息的分析方法可以为人脸识别、特征提取等,本申请实施例中对此并不进行限制。
例如,可将人脸识别、语音识别、自然语言处理(Natural Language Processing,NLP)组合和预设算法内置到IPC中,对获取到的语音信息和图像信息进行分析提取,本申请实施例中对此并不进行限制。
步骤120:将用户属性信息和反馈信息,与用户关联存储。
其中,用户属性信息和反馈信息用于相关服务升级处理。
例如,若服务为商品升级,则目标对象可以表示商品。
本申请实施例中,在将用户数据信息和反馈信息,与用户存储关联之前,首先需要获取到用户的语音信息和图像信息,并将用户的语音信息和图像信息进行分析,进而获得用户属性信息和用户对于目标对象的反馈信息,下面分别对于步骤110中获得用户属性信息和反馈信息的步骤进行详细阐述。
本申请实施例中,获得用户属性信息,提供了以下几种可能的实施方式,具体包括:
第一种实施方式:S1:提取图像信息的图像特征信息。
本申请实施例中,当获得用户的图像信息之后,对图像信息进行特征提取,获得图像信息的图像特征信息。
本申请实施例中,当通过摄像头获得用户的图像信息之后,对图像信息进行特征提取,获得用户的穿着、人脸等图像特征信息,本申请实施例中对此并不进行限制。
S2:基于已训练的图像识别模型,以图像特征信息为输入参数,获得用户的用户属性信息。
其中,图像识别模型为根据训练图像样本集迭代训练获得的,训练图像样本集中包括多个训练图像样本,训练图像样本为有用户属性信息标注的图像样本。
本申请实施例中,基于已训练的图像识别模型,将图像信息进行特征提取后的图像信息特征输入到已训练的图像识别模型中,输出用户属性信息。
其中,用户属性信息例如可以为年龄、性别等,本申请实施例中对此并不进行限制。
例如,将用户的图像信息特征“眼睛”输入到已训练的图像识别模型中,获得用户属性信息“年龄”为“中年”,见该用户的图像信息特征“头发”输入到已训练的图像识别模型中,获得用户属性信息“性别”为“男性”,本申请实施例中对此并不进行限制。
第二种实施方式:进一步地,本申请实施例中,当用户属性信息中至少包括用户外表特征时,则获得用户的用户属性信息,具体包括:
对图像信息进行特征提取,获得用户的用户外表特征。
本申请实施例中,当用户属性信息为用户外表特征时,则不需要通过图像识别模型获得用户属性信息,只需通过对图像信息进行特征提取,就能够获得用户的用户外表特征。
本申请实施例中的用户外表特征例如可以是用户的穿着,有没有戴帽子,有没有戴眼镜等,这些通过特征提取就能够获得的用户外表特征,无需通过图像识别模型进行获取,本申请实施例中对此并不进行限制。
本申请实施例中,获得用户对于目标对象的反馈信息,具体包括:
S1:基于语音识别方法,将语音信息转换为相应的文本信息。
本申请实施例中,在通过采集设备采集到用户的语音信息之后,基于语音识别方法,将用户的语音信息转换为相应的文本信息。
例如,在服装店的应用场景中,用户在逛店购物时,如衣物店铺,用户试衣服时会和同伴或者店员交流样式和喜好,例如,用户向店员交流喜好“我喜欢尺码宽松的衣服”,则终端上的麦克风能够采集到用户输入的语音信息,并将语音信息转换为相应的文本信息“我喜欢尺码宽松的衣服”,本申请实施例中对语音信息并不进行限制。
S2:根据已训练的语义识别模型,以文本信息为输入参数,获得用户对于目标对象的反馈信息。
其中,语义识别模型为根据文本样本集迭代训练获得的,文本样本集中至少包括多个文本样本,文本样本表征用户针对目标对象的反馈信息。
本申请实施例中,由于语义识别模型为根据文本样本集通过迭代训练获得的,文本样本表征用户针对目标对象的反馈信息,也就是说,该文本样本集中至少包括用户针对目标对象的反馈信息的文本样本,例如,文本样本集中包括用户针对目标对象的反馈信息的文本样本“中号的衣服太大”等,本申请实施例中对此并不进行限制。
进而将文本信息输入到已训练的语义识别模型中,就能够获得用户对于目标对象的反馈信息,例如,将语音信息转换为相应的文本信息为“这件黄色的衣服颜色太暗了”,则将该文本信息输入到已训练的语义识别模型中,获得用户对于目标对象的反馈信息“黄色的衣服颜色暗”,本申请实施例中对此并不进行限制。又例如,还可以获取图像信息,结合获取到的图像信息,获取用户对于目标对象的反馈信息,例如,通过采集用户的图像信息,从中确定用户试穿或评价的衣服为黄色,并结合语音信息,将语音信息转换为相应的文本信息为“这件衣服颜色太暗了”,可知用户对该件衣服反馈信息为“黄色的衣服暗”,对于具体实施方式,本申请实施例中并不进行限制。
当获得用户的用户属性信息和用户对于目标对象的反馈信息之后,则将用户属性信息和反馈信息,与用户存储关联,具体可以分为以下几种不同的方式。
第一种方式:根据身份属性信息将用户属性信息和反馈信息与用户存储关联。
则将用户属性信息和反馈信息,与用户存储关联,具体包括:
S1:分别将身份属性信息与存储的各用户的身份属性信息进行匹配。
本申请实施例中,当用户属性信息中包括身份属性信息时,则分别将身份属性信息与存储的各用户的身份属性信息进行匹配,并判断是否匹配成功,进而能过实现从存储的各个用户中查找到是否有对应的用户。
其中,身份属性信息例如可以是用户佩戴的个性化首饰或配饰,本申请实施例中对此并不进行限制。
S2:若确定匹配成功,则将用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储。
具体地,若确定用户的身份属性信息与存储的其中一个用户的用户身份属性信息匹配成功,并将用户属性信息和反馈信息,与匹配成功的用户对应的用户编号关联存储。
本申请实施例中,为存储的每个用户分配一个用户编号,并将用户属性信息和用户对于目标对象的反馈信息都与该用户编号进行关联,这样,当获取到用户的用户属性信息和反馈信息之后,相关工作人员在对服务进行升级和改进时,能够根据用户编号查找到对应的用户的用户属性信息和反馈信息,进而能够获取到有效的数据。
S3:若确定匹配未成功,则为用户生成一个用户编号,并将用户属性信息和反馈信息,与生成的用户编号关联存储。
本申请实施例中,当获取到用户的身份属性信息之后,将用户的身份属性信息与存储的用户的身份属性信息进行匹配,若此时该用户身份属性信息与存储的各个用户的身份属性信息均不匹配时,则确定匹配失败,无法从用户数据库中查找到对应的用户,则此时为该用户生成一个新的用户编码,并将经过分析处理获得的用户属性信息和用户对于目标对象的反馈信息与该新生成的用户编码进行关联存储,这样,当再次获取到该用户的语音信息和图像信息时,则能过直接与该用户进行关联存储。
例如,当确定匹配失败时,则新生成一个用户编号为12,并将用户的用户属性信息和反馈信息与该用户编号“12”进行关联存储,本申请实施例中对此并不进行限制。
第二种方式:根据用户人脸图像信息将用户属性信息和反馈信息与用户关联存储。
则本申请实施例中,将用户属性信息和反馈信息,与用户存储关联,具体包括:
S1:分别将人脸图像信息与存储的各用户的人脸图像信息进行匹配。
本申请实施例中,当获取到用户的图像信息中的人脸图像信息时,可直接通过人脸图像信息与存储的各用户的人脸图像信息进行匹配,并判断是否匹配成功,进而能够实现从存储的各个用户中查找到是否有对应的用户。
其中,人脸图像信息为通过采集设备获取到的用户的图像信息中,将用户的人脸作为人脸图像信息。
S2:若确定匹配成功,则将用户属性信息和反馈信息,与匹配成功的用户对应的用户编号关联存储。
具体地,若确定用户的人脸图像信息与存储的其中一个用户的用户人脸图像信息匹配成功,并将用户属性信息和反馈信息,与匹配成功的用户对应的用户编号关联存储。
S3:若确定匹配未成功,则为用户生成一个用户编号,并将用户属性信息和反馈信息,与生成的用户编号关联存储。
本申请实施例中,当获取到用户的人脸图像信息之后,将用户的人脸图像信息与存储的用户的人脸图像信息进行匹配,若此时该用户人脸图像信息与存储的各个用户的人脸图像信息均不匹配时,则确定匹配失败,无法从用户数据库中查找到对应的用户,则此时为该用户生成一个新的用户编码,并将经过分析处理获得的用户属性信息和用户对于目标对象的反馈信息与该新生成的用户编码进行关联存储,这样,当再次获取到该用户的语音信息和图像信息时,则能过直接与该用户进行关联存储。
另外,本申请实施例中还可以即还可以根据语音信息提取用户属性信息、身份属性信息或其它信息等,例如,通过提取语音特征,如音色、音调等,通过音色、音调等语音特征,并基于训练的语音识别模型,识别获得用户的年龄、性别等用户属性信息,并且还可以根据提取的语音特征,用于身份识别,从而识别出对应的用户,将用户属性信息和反馈信息与用户存储关联。
将用户属性信息和反馈信息,与用户关联存储之后,进一步包括:
S1:根据反馈信息,确定与反馈信息对应的目标对象的对象编号。
本申请实施例中,根据反馈信息,确定与反馈信息对应的目标对象,并确定与目标对象对应的对象编号,例如根据反馈信息,能够确定用户反馈信息中对应的目标对象为“裤子”,并确定与目标对象“裤子”对应的对象编号为“11”,本申请实施例中对此并不进行限制。
其中,为存储的各个目标对象分配一个对象编号,并将反馈信息与该对象编号关联存储,这样,当获取到用户的用户属性信息之后,相关工作人员在对服务进行改进和升级时,能够根据对象编号,查找到目标对象对应的所有反馈信息,进而能够提高对服务改进的效率。
S2:建立用户属性信息、反馈信息、用户编号以及对象编号的关联关系。
本申请实施例中,建立用户属性信息、反馈信息、用户编号以及对象编号的关联关系,能够使得每一个用户都与其所喜好的目标对象进行关联,这样,当相关工作人员在对服务进行升级和改进时,能够根据关联关系,及时获取到有效的数据。
本申请实施例中,通过将采集到的用户的语音信息和图像信息进行分析,获得用户的用户属性信息和用户对于目标对象的反馈信息,并建立用户属性信息、反馈信息、用户编号以及对象编号的关联关系,进而关联存储,这样,多方位采集数据,能够将采集到的用户的语音信息和图像信息都关联到用户上,不依赖于人工操作,能够保证用户反馈数据的真实性。
在建立关联关系之后,相关工作人员还可以根据用户编号或对象编号,查找到对应的用户属性信息或反馈信息。
本申请实施例中提供了两种查找指令。
第一种:用户属性信息查找指令。
若查找指令为用户属性信息查找指令,则具体包括:
接收用户属性信息查找指令,并根据用户属性信息查找指令中的用户编号,查找与用户编号对应的用户属性信息,并返回查找到的用户属性信息。
其中,用户属性信息查找指令中至少包括用户编号。
本申请实施例中,接收到用户属性信息查找指令之后,根据用户属性信息查找指令中的用户编号,查找到与用户编号对应的用户的所有的用户属性信息,并返回查找到的用户属性信息,例如,假设用户属性信息查找指令中的用户编号为“11”,则返回用户编号为“11”的用户的所有用户属性信息。
进一步地,还可以为不同类型的用户属性信息设置一个属性编号,例如,可为用户属性信息“男性”设置一个属性编号,并建立属性编号与用户编号的关联关系,这样,在接收查找指令时,则能够根据用户属性信息“男性”返回所有性别为男性的用户的用户属性信息,本申请实施例中对此并不进行限制。
第二种:反馈信息查找指令。
若查找指令为反馈信息查找指令,则具体包括:
接收反馈信息查找指令,并根据反馈信息查找指令中的对象编号,查找与对象编号对应的反馈信息,并返回查找到的反馈信息。
其中,反馈信息查找指令中至少包括对象编号。
具体地,当接收到反馈信息查找指令之后,则可以根据反馈信息查找指令中的对象编号,查找到与对象编号对应的所有的反馈信息,并返回查找到的反馈信息,这样,相关工作人员能够清晰获知查找的目标对象对应的全部反馈信息。
进一步地,还可以为不同类型的用户属性信息设置一个属性编号,例如,可为用户属性信息“男性”设置一个属性编号,并建立属性编号、对象编号与对象编号的关联关系,这样,在接收反馈信息查找指令时,则能够根据用户属性信息“男性”返回所有性别为男性的用户的对于该目标对象的反馈信息,本申请实施例中对此并不进行限制。
本申请实施例中,在获取到用户的语音信息和图像信息之后,对语音信息和图像信息进行分析,获得用户的用户属性信息和用户对于目标对象的反馈信息,并将用户属性信息和反馈信息,与用户进行关联存储,这样,通过建立用户属性信息、反馈信息和用户之间的关联关系,能够结构化存储用户的数据,无需依赖人工操作,且耗费的成本较低。
基于上述实施例,下面以查找指令为用户属性信息查找指令为例,对本申请实施例中的数据处理方法进行示例性阐述,参阅图2所示,为本申请实施例中另一种数据处理方法的流程图,具体包括:
步骤200:获取用户的语音信息和图像信息。
步骤201:提取图像信息的图像特征信息。
步骤202:基于已训练的图像识别模型,以图像特征信息为输入参数,获得用户的用户属性信息。
其中,图像识别模型为根据训练图像样本集迭代训练获得的,训练图像样本集中包括多个训练图像样本,训练图像样本为有用户属性信息标注的图像样本。
步骤203:基于语音识别方法,将语音信息转换为相应的文本信息。
步骤204:根据已训练的语义识别模型,以文本信息为输入参数,获得用户对于目标对象的反馈信息。
其中,语义识别模型为根据文本样本集迭代训练获得的,文本样本集中至少包括多个文本样本,文本样本表征用户针对目标对象的反馈信息。
本申请实施例中,步骤201-步骤202和步骤203-步骤204为同时进行的,不存在先后顺序。
步骤205:分别将图像信息中的人脸图像信息与存储的各用户的人脸图像信息进行匹配,并判断是否匹配成功,若是,则执行步骤207,若否,则执行步骤208。
本申请实施例中,分别将图像信息中的人脸图像信息与存储的各用户的人脸图像信息进行匹配,若确定匹配成功,则将用户属性信息和反馈信息,与匹配成功的用户对应的用户编号关联存储,若确定匹配未成功,则为用户生成一个用户编号,并将用户属性信息和反馈信息,与生成的用户编号关联存储。
步骤206:将用户属性信息和反馈信息,与匹配成功的用户对应的用户编号关联存储。
步骤207:为用户生成一个用户编号,并将用户属性信息和反馈信息,与生成的用户编号关联存储。
步骤208:根据反馈信息,确定与反馈信息对应的目标对象的对象编号。
步骤209:建立用户属性信息、反馈信息、用户编号以及对象编号的关联关系。
步骤210:接收用户属性信息查找指令,并根据用户属性信息查找指令中的用户编号,查找与用户编号对应的用户属性信息,并返回查找到的用户属性信息。
其中,用户属性信息查找指令中至少包括用户编号。
本申请实施例中,在获取到用户的语音信息和图像信息之后,对语音信息和图像信息进行分析,获得用户的用户属性信息和用户对于目标对象的反馈信息,将用户属性信息和反馈信息,与用户关联存储,这样,不仅不受限于调查群体和事后反馈,还能够保证用户反馈数据的真实性,提高了数据收集效率。
基于同一发明构思,本申请实施例中还提供了一种数据处理装置,该数据处理装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例,参阅图3所示,本申请实施例中数据处理装置的结构示意图,具体包括:
获取模块300,用于获取用户的语音信息和图像信息;
分析模块310,用于根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;
存储模块320,用于将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理。
可选的,根据所述语音信息和所述图像信息,获得所述用户的用户属性信息时,分析模块310具体用于:
提取所述图像信息的图像特征信息;
基于已训练的图像识别模型,以所述图像特征信息为输入参数,获得所述用户的用户属性信息,其中,所述图像识别模型为根据训练图像样本集迭代训练获得的,所述训练图像样本集中包括多个训练图像样本,所述训练图像样本为有用户属性信息标注的图像样本。
可选的,所述用户属性信息中至少包括用户外表特征,则获得所述用户的用户属性信息时,分析模块310具体用于:
对所述图像信息进行特征提取,获得所述用户的用户外表特征。
可选的,根据所述语音信息和所述图像信息,获得所述用户对于目标对象的反馈信息时,分析模块310具体用于:
基于语音识别方法,将所述语音信息转换为相应的文本信息;
根据已训练的语义识别模型,以所述文本信息为输入参数,获得所述用户对于目标对象的反馈信息,其中,所述语义识别模型为根据文本样本集迭代训练获得的,所述文本样本集中至少包括多个文本样本,所述文本样本表征用户针对目标对象的反馈信息。
可选的,所述用户属性信息中至少包括预设表征用户身份标识的身份属性信息;
存储模块320具体用于:
分别将所述身份属性信息与存储的各用户的身份属性信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,所述图像信息中至少包括人脸图像信息,则存储模块320具体用于:
分别将所述人脸图像信息与存储的各用户的人脸图像信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
可选的,将所述用户属性信息和所述反馈信息,与所述用户关联存储之后,进一步包括:
确定模块330,用于根据所述反馈信息,确定与所述反馈信息对应的目标对象的对象编号;
关联模块340,用于建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
第一查找模块350,用于接收用户属性信息查找指令,并根据所述用户属性信息查找指令中的用户编号,查找与所述用户编号对应的用户属性信息,并返回查找到的用户属性信息,其中,所述用户属性信息查找指令中至少包括用户编号。
可选的,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
第二查找模块360,用于接收反馈信息查找指令,并根据所述反馈信息查找指令中的对象编号,查找与所述对象编号对应的反馈信息,并返回查找到的反馈信息,其中,所述反馈信息查找指令中至少包括对象编号。
基于上述实施例,参阅图4所示为本申请实施例中电子设备的结构示意图。
本申请实施例提供了一种电子设备,该电子设备可以包括处理器410(CenterProcessing Unit,CPU)、存储器420、输入设备430和输出设备440等,输入设备430可以包括键盘、鼠标、触摸屏等,输出设备440可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器420可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器410提供存储器420中存储的程序指令和数据。在本申请实施例中,存储器420可以用于存储本申请实施例中任一种数据处理方法的程序。
处理器410通过调用存储器420存储的程序指令,处理器410用于按照获得的程序指令执行本申请实施例中任一种数据处理方法。
基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的数据处理方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取用户的语音信息和图像信息;
根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;
将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理。
2.如权利要求1所述的方法,其特征在于,根据所述语音信息和所述图像信息,获得所述用户的用户属性信息,具体包括:
提取所述图像信息的图像特征信息;
基于已训练的图像识别模型,以所述图像特征信息为输入参数,获得所述用户的用户属性信息,其中,所述图像识别模型为根据训练图像样本集迭代训练获得的,所述训练图像样本集中包括多个训练图像样本,所述训练图像样本为有用户属性信息标注的图像样本。
3.如权利要求1所述的方法,其特征在于,根据所述语音信息和所述图像信息,获得所述用户对于目标对象的反馈信息,具体包括:
基于语音识别方法,将所述语音信息转换为相应的文本信息;
根据已训练的语义识别模型,以所述文本信息为输入参数,获得所述用户对于目标对象的反馈信息,其中,所述语义识别模型为根据文本样本集迭代训练获得的,所述文本样本集中至少包括多个文本样本,所述文本样本表征用户针对目标对象的反馈信息。
4.如权利要求1-3任一项所述的方法,其特征在于,所述图像信息中至少包括人脸图像信息,则将所述用户属性信息和所述反馈信息,与所述用户关联存储,具体包括:
分别将所述人脸图像信息与存储的各用户的人脸图像信息进行匹配;
若确定匹配成功,则将所述用户属性信息和所述反馈信息,与匹配成功的用户对应的用户编号关联存储;
若确定匹配未成功,则为所述用户生成一个用户编号,并将所述用户属性信息和所述反馈信息,与生成的用户编号关联存储。
5.如权利要求1所述的方法,其特征在于,将所述用户属性信息和所述反馈信息,与所述用户关联存储之后,进一步包括:
根据所述反馈信息,确定与所述反馈信息对应的目标对象的对象编号;
建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系。
6.如权利要求5所述的方法,其特征在于,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
接收用户属性信息查找指令,并根据所述用户属性信息查找指令中的用户编号,查找与所述用户编号对应的用户属性信息,并返回查找到的用户属性信息,其中,所述用户属性信息查找指令中至少包括用户编号。
7.如权利要求5所述的方法,其特征在于,建立所述用户属性信息、所述反馈信息、用户编号以及所述对象编号的关联关系之后,进一步包括:
接收反馈信息查找指令,并根据所述反馈信息查找指令中的对象编号,查找与所述对象编号对应的反馈信息,并返回查找到的反馈信息,其中,所述反馈信息查找指令中至少包括对象编号。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取用户的语音信息和图像信息;
分析模块,用于根据所述语音信息和所述图像信息,获得所述用户的用户属性信息和所述用户对于目标对象的反馈信息;
存储模块,用于将所述用户属性信息和所述反馈信息,与所述用户关联存储,其中,所述用户属性信息和反馈信息用于相关服务升级处理。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
CN202010348082.4A 2020-04-28 2020-04-28 一种数据处理方法及装置 Pending CN111507774A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010348082.4A CN111507774A (zh) 2020-04-28 2020-04-28 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010348082.4A CN111507774A (zh) 2020-04-28 2020-04-28 一种数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN111507774A true CN111507774A (zh) 2020-08-07

Family

ID=71878184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010348082.4A Pending CN111507774A (zh) 2020-04-28 2020-04-28 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN111507774A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330897A (zh) * 2020-08-19 2021-02-05 深圳Tcl新技术有限公司 用户语音对应性别改变方法、装置、智能门铃及存储介质
CN112784606A (zh) * 2021-01-15 2021-05-11 北京搜狗科技发展有限公司 一种确定用户属性信息的方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1662922A (zh) * 2002-06-27 2005-08-31 皇家飞利浦电子股份有限公司 通过视觉和语音识别测量内容分级
CN106355171A (zh) * 2016-11-24 2017-01-25 深圳凯达通光电科技有限公司 一种视频监控联网系统
CN107612815A (zh) * 2017-09-19 2018-01-19 北京金山安全软件有限公司 一种信息发送方法、装置及设备
CN108470023A (zh) * 2018-01-18 2018-08-31 阿里巴巴集团控股有限公司 业务功能的推荐方法及装置
CN110610705A (zh) * 2019-09-20 2019-12-24 上海数鸣人工智能科技有限公司 一种基于人工智能的语音交互提示器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1662922A (zh) * 2002-06-27 2005-08-31 皇家飞利浦电子股份有限公司 通过视觉和语音识别测量内容分级
CN106355171A (zh) * 2016-11-24 2017-01-25 深圳凯达通光电科技有限公司 一种视频监控联网系统
CN107612815A (zh) * 2017-09-19 2018-01-19 北京金山安全软件有限公司 一种信息发送方法、装置及设备
CN108470023A (zh) * 2018-01-18 2018-08-31 阿里巴巴集团控股有限公司 业务功能的推荐方法及装置
CN110610705A (zh) * 2019-09-20 2019-12-24 上海数鸣人工智能科技有限公司 一种基于人工智能的语音交互提示器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330897A (zh) * 2020-08-19 2021-02-05 深圳Tcl新技术有限公司 用户语音对应性别改变方法、装置、智能门铃及存储介质
CN112784606A (zh) * 2021-01-15 2021-05-11 北京搜狗科技发展有限公司 一种确定用户属性信息的方法及相关装置

Similar Documents

Publication Publication Date Title
US20230237328A1 (en) Information processing method and terminal, and computer storage medium
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN107590224B (zh) 基于大数据的用户偏好分析方法与装置
CN105979376A (zh) 一种推荐方法和装置
CN110781805B (zh) 一种目标物体检测方法、装置、计算设备和介质
US11037071B1 (en) Cross-category item associations using machine learning
KR20210002410A (ko) 외형인식모델 학습용 데이터셋 구축 방법, 장치 및 프로그램
CN111507774A (zh) 一种数据处理方法及装置
CN106844638A (zh) 信息检索方法、装置及电子设备
CN110148393B (zh) 音乐生成方法、装置和系统以及数据处理方法
CN111626813A (zh) 产品推荐方法及其系统
CN112052784A (zh) 物品的搜索方法、装置、设备及计算机可读存储介质
CN113204636A (zh) 基于知识图谱的用户动态个性化画像方法
US20220075804A1 (en) Method and device for providing guide information for enhancement of artist's reputation
CN114186024A (zh) 推荐方法及装置
CN111126457A (zh) 信息的获取方法和装置、存储介质和电子装置
CN113971831A (zh) 一种动态更新的人脸识别方法、装置及电子设备
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN117420998A (zh) 一种客户端ui交互组件生成方法、装置、终端及介质
CN108959289B (zh) 网站类别获取方法和装置
CN112070552A (zh) 一种基于大数据的电子商务平台
CN112035655A (zh) 银行人力资源系统及工作方法
US20220101407A1 (en) Method for determining a recommended product, electronic apparatus, and non-transitory computer-readable storage medium
CN114266921A (zh) 图像描述信息获取方法、装置、服务器及存储介质
JP2023088441A (ja) データ処理装置、データ処理方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination