CN113177816A - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN113177816A
CN113177816A CN202010019661.4A CN202010019661A CN113177816A CN 113177816 A CN113177816 A CN 113177816A CN 202010019661 A CN202010019661 A CN 202010019661A CN 113177816 A CN113177816 A CN 113177816A
Authority
CN
China
Prior art keywords
attribute information
target
user
information
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010019661.4A
Other languages
English (en)
Inventor
刘刚
郑斯奇
索宏彬
雷昀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010019661.4A priority Critical patent/CN113177816A/zh
Publication of CN113177816A publication Critical patent/CN113177816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/18Artificial neural networks; Connectionist approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种信息处理方法及装置。在本申请中,在目标用户与电子设备进行语音交互的过程中,电子设备可以获取目标用户的目标语音信息;提取目标语音信息的目标语音特征;将目标语音特征输入事先训练的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息,如此,在本申请中,即使用户之前未购买过商品,但电子设备可以实时根据目标用户的目标语音信息以及第一属性信息识别模型确定出目标用户的诸如身份、年龄以及性别等目标属性信息,进而可以根据目标属性信息精准地向目标用户推荐目标用户感兴趣的商业服务信息。

Description

一种信息处理方法及装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息处理方法及装置。
背景技术
随着互联网的普及和电商行业的迅猛发展,如何给用户推荐合适的商品成为电商领域的主要问题之一。
当前,现有技术公开了一种基于用户购买行为的商品推荐方法,包括:采集用户的历史购买行为数据,根据用户的历史购买行为数据确定用户的消费偏好,再根据用户的消费偏好向用户推荐商品。
然而,发明人在实现本发明的过程中发现:现有技术的推荐商品的精准度较低。
发明内容
为解决上述技术问题,本申请示出了一种信息处理方法及装置。
第一方面,本申请示出了一种信息处理方法,应用于电子设备,包括:
在目标用户在所述电子设备上使用娱乐应用的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
在所述目标属性信息为预设属性信息的情况下,设置所述娱乐应用的关闭时刻,并输出第二提示信息,所述第二提示信息用于提示所述电子设备将在所述关闭时刻时关闭所述娱乐应用。
在一个可选的实现方式中,还包括:
在所述关闭时刻时如果所述预测应用未被关闭,则关闭所述娱乐应用。
在一个可选的实现方式中,所述设置所述娱乐应用的关闭时刻,包括:
根据所述目标属性信息获取适用于所述目标用户的关闭时刻;
将所述娱乐应用的关闭时刻设置为获取到的设置时刻。
在一个可选的实现方式中,所述根据所述目标属性信息获取适用于所述目标用户的关闭时刻,包括:
在属性信息与关闭时刻之间的对应关系中,查找与所述目标属性信息相对应的关闭时刻。
在一个可选的实现方式中,所述设置所述娱乐应用的关闭时刻,包括:
获取所述目标用户使用所述娱乐应用的已持续使用时长;
根据目标属性信息获取适用于所述目标用户的可持续使用时长;
根据所述已持续使用时长和所述可持续使用时长获取所述目标用户使用所述娱乐应用的剩余使用时长;
根据所述电子设备的当前时刻与所述剩余使用时长确定所述关闭时刻;
将所述娱乐应用的关闭时刻设置为确定出的设置时刻。
在一个可选的实现方式中,所述根据目标属性信息获取适用于所述目标用户的可持续使用时长,包括:
在属性信息与可持续使用时长之间的对应关系中,查找与所述目标属性信息相对应的可持续使用时长。
在一个可选的实现方式中,还包括:
获取所述电子设备将在所述关闭时刻时关闭所述娱乐应用的原因;
输出所述原因。
在一个可选的实现方式中,所述电子设备至少包括:智能电视、智能音响、虚拟现实VR眼镜、游戏机、手机以及电脑。
第二方面,本申请示出了一种信息处理方法,应用于电子设备,包括:
在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
在所述目标属性信息为预设属性信息的情况下,拒绝为所述目标用户分配所述娱乐应用的用户账号。
在一个可选的实现方式中,还包括:
获取所述电子设备拒绝为所述目标用户分配所述娱乐应用的用户账号的原因;
输出所述原因。
第三方面,本申请示出了一种信息处理方法,应用于电子设备,包括:
当需要为目标用户开通电子设备的使用权限时,输出第一提示信息,所述第一提示信息用于提示输入用于验证使用权限的语音信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的辅助验证请求,所述辅助验证请求携带用户终端的终端标识,所述辅助验证请求用于请求所述电子设备根据所述终端标识从所述用户终端上获取用于验证使用权限的语音信息;
根据所述终端标识向所述用户终端发送获取指令,所述获取指令用于获取用于在所述电子设备上验证使用权限的语音信息;
接收所述用户终端根据所述获取指令发送的语音信息,所述语音信息是使用所述用户终端的辅助用户在所述用户终端上输入的;
基于所述语音信息以及第一属性信息识别模型获取属性信息;
在所述属性信息为预设属性信息的情况下,为所述目标用户开通电子设备的使用权限。
在一个可选的实现方式中,还包括:
输出第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
向所述用户终端发送第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限,以使所述用户终端输出所述第三提示信息。
第四方面,本申请示出了一种信息处理方法,应用于用户终端,包括:
当需要为目标用户开通电子设备的使用权限时,接收获取指令,所述获取指令用于获取用于在电子设备上验证身份信息的语音信息;
根据所述获取指令输出第二提示信息,所述第二提示信息用于提示输入语音信息;
获取使用所述用户终端的辅助用户根据所述第二提示信息输入的语音信息;
向所述电子设备发送所述语音信息,以使所述电子设备基于所述语音信息以及第一属性信息识别模型获取属性信息,并在所述属性信息为预设属性信息的情况下,为所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
接收所述电子设备发送的第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限;
输出所述第三提示信息。
第五方面,本申请示出了一种信息处理方法,包括:
获取目标用户的目标语音信息;
提取所述目标语音信息的目标语音特征;
在多个特征模板中查找与所述目标语音特征匹配的目标特征模板;
在未查找到所述目标特征模板的情况下,将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述第一属性信息识别模型的训练方式包括:
获取样本数据集,所述样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
构建第一属性信息识别模型的网络结构;
使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,直至所述第一属性信息识别模型中的权重收敛,得到所述第一属性信息识别模型。
在一个可选的实现方式中,所述网络结构包括:
至少一个向量化层、延时神经网络TDNN、平均池化层以及至少一个全连接层以及归一化层;
所述向量化层用于将多个样本语音特征分别转换为特征向量;
所述TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充;
所述平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量;
所述至少一个全连接层用于根据所述池化向量预测所述样本用户的属性信息。
在一个可选的实现方式中,所述样本数据集为多个,不同的样本数据集中的样本语音信息所呈现的语言种类不同;
所述使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,包括:
基于不同的样本数据集分别训练适用于不同的语言种类的第一属性信息识别模型。
在一个可选的实现方式中,所述将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息,包括:
确定所述目标语音信息所呈现的目标语言种类;
在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于所述目标语言种类的第一属性信息识别模型;
所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述构建第一属性信息识别模型的网络结构,包括:
确定所述第一属性信息识别模型所应用的至少一个业务场景;
对于每一个业务场景,构建所述第一属性信息识别模型的适用于所述业务场景的网络结构。
在一个可选的实现方式中,业务场景至少包括:
游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景。
在一个可选的实现方式中,所述将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息,包括:
确定当前所处的业务场景;
在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于所述业务场景的第一属性信息识别模型;
所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述样本用户的样本属性信息的获取方式,包括:
获取所述样本用户上传的所述样本用户的样本属性信息;
或者,
提取所述样本语音信息的样本语音特征,将所述样本语音特征输入第二属性信息识别模型中,得到所述第二属性信息识别模型输出的所述样本用户的样本属性信息。
在一个可选的实现方式中,所述在多个特征模板中查找与所述目标语音特征匹配的目标特征模板,包括:
获取所述多个特征模板分别与所述目标语音特征之间的特征相似度;
确定最高的特征相似度是否大于预设阈值;
在最高的相似度大于或等于预设阈值的情况下,在所述多个特征模板中,将与所述目标语音特征之间的特征相似度最高的特征模板确定为所述目标特征模板。
在一个可选的实现方式中,还包括:
在查找到所述目标特征模板的情况下,在用户的特征模板与用户的属性信息之间的对应关系中,查找与所述目标特征模板相对应的属性信息,并作为所述目标属性信息。
在一个可选的实现方式中,所述方法还包括:
在查找到所述目标特征模板的情况下,基于所述目标语音特征对所述目标特征模板进行更新。
在一个可选的实现方式中,还包括:
在未查找到所述目标特征模板的情况下,基于所述目标语音特征生成目标特征模板;
将生成的目标特征模板与所述目标属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
第六方面,本申请示出了一种信息处理装置,应用于电子设备,包括:
第一输出模块,用于在目标用户在所述电子设备上使用娱乐应用的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
第一获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第一确定模块,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
设置模块,用于在所述目标属性信息为预设属性信息的情况下,设置所述娱乐应用的关闭时刻;
第二输出模块,用于输出第二提示信息,所述第二提示信息用于提示所述电子设备将在所述关闭时刻时关闭所述娱乐应用。
在一个可选的实现方式中,还包括:
关闭模块,用于在所述关闭时刻时如果所述预测应用未被关闭,则关闭所述娱乐应用。
在一个可选的实现方式中,所述设置模块包括:
第一获取单元,用于根据所述目标属性信息获取适用于所述目标用户的关闭时刻;
第一设置单元,用于将所述娱乐应用的关闭时刻设置为获取到的设置时刻。
在一个可选的实现方式中,所述第一获取单元具体用于:在属性信息与关闭时刻之间的对应关系中,查找与所述目标属性信息相对应的关闭时刻。
在一个可选的实现方式中,所述设置模块包括:
第二获取单元,用于获取所述目标用户使用所述娱乐应用的已持续使用时长;
第三获取单元,用于根据目标属性信息获取适用于所述目标用户的可持续使用时长;
第四获取单元,用于根据所述已持续使用时长和所述可持续使用时长获取所述目标用户使用所述娱乐应用的剩余使用时长;
第一确定单元,用于根据所述电子设备的当前时刻与所述剩余使用时长确定所述关闭时刻;
第二设置单元,用于将所述娱乐应用的关闭时刻设置为确定出的设置时刻。
在一个可选的实现方式中,所述第三获取单元具体用于:在属性信息与可持续使用时长之间的对应关系中,查找与所述目标属性信息相对应的可持续使用时长。
在一个可选的实现方式中,还包括:
第二获取模块,用于获取所述电子设备将在所述关闭时刻时关闭所述娱乐应用的原因;
第三输出模块,用于输出所述原因。
在一个可选的实现方式中,所述电子设备至少包括:智能电视、智能音响、虚拟现实VR眼镜、游戏机、手机以及电脑。
第七方面,本申请示出了一种信息处理装置,应用于电子设备,包括:
第四输出模块,用于在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
第三获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第二确定模块,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
拒绝模块,用于在所述目标属性信息为预设属性信息的情况下,拒绝为所述目标用户分配所述娱乐应用的用户账号。
在一个可选的实现方式中,还包括:
第四获取模块,用于获取所述电子设备拒绝为所述目标用户分配所述娱乐应用的用户账号的原因;
第五输出模块,用于输出所述原因。
第八方面,本申请示出了一种信息处理装置,应用于电子设备,包括:
第六输出模块,用于当需要为目标用户开通电子设备的使用权限时,输出第一提示信息,所述第一提示信息用于提示输入用于验证使用权限的语音信息;
第五获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的辅助验证请求,所述辅助验证请求携带用户终端的终端标识,所述辅助验证请求用于请求所述电子设备根据所述终端标识从所述用户终端上获取用于验证使用权限的语音信息;
第一发送模块,用于根据所述终端标识向所述用户终端发送获取指令,所述获取指令用于获取用于在所述电子设备上验证使用权限的语音信息;
第一接收模块,用于接收所述用户终端根据所述获取指令发送的语音信息,所述语音信息是使用所述用户终端的辅助用户在所述用户终端上输入的;
第六获取模块,用于基于所述语音信息以及第一属性信息识别模型获取属性信息;
开通模块,用于在所述属性信息为预设属性信息的情况下,为所述目标用户开通电子设备的使用权限。
在一个可选的实现方式中,还包括:
第七输出模块,用于输出第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
第二发送模块,用于向所述用户终端发送第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限,以使所述用户终端输出所述第三提示信息。
第九方面,本申请是示出了一种信息处理装置,应用于用户终端,包括:
第二接收模块,用于当需要为目标用户开通电子设备的使用权限时,接收获取指令,所述获取指令用于获取用于在电子设备上验证身份信息的语音信息;
第八输出模块,用于根据所述获取指令输出第二提示信息,所述第二提示信息用于提示输入语音信息;
第七获取模块,用于获取使用所述用户终端的辅助用户根据所述第二提示信息输入的语音信息;
第三发送模块,用于向所述电子设备发送所述语音信息,以使所述电子设备基于所述语音信息以及第一属性信息识别模型获取属性信息,并在所述属性信息为预设属性信息的情况下,为所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
第三接收模块,用于接收所述电子设备发送的第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限;
第九输出模块,用于输出所述第三提示信息。
第十方面,本申请示出了一种信息处理装置,包括:
第八获取模块,用于获取目标用户的目标语音信息;
提取模块,用于提取所述目标语音信息的目标语音特征;
第一查找模块,用于在多个特征模板中查找与所述目标语音特征匹配的目标特征模板;
输入模块,用于在未查找到所述目标特征模板的情况下,将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,还包括:
第九获取模块,用于获取样本数据集,所述样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
构建模块,用于构建第一属性信息识别模型的网络结构;
训练模块,用于使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,直至所述第一属性信息识别模型中的权重收敛,得到所述第一属性信息识别模型。
在一个可选的实现方式中,所述网络结构包括:
至少一个向量化层、延时神经网络TDNN、平均池化层以及至少一个全连接层以及归一化层;
所述向量化层用于将多个样本语音特征分别转换为特征向量;
所述TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充;
所述平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量;
所述至少一个全连接层用于根据所述池化向量预测所述样本用户的属性信息。
在一个可选的实现方式中,所述样本数据集为多个,不同的样本数据集中的样本语音信息所呈现的语言种类不同;
所述训练模块具体用于:基于不同的样本数据集分别训练适用于不同的语言种类的第一属性信息识别模型。
在一个可选的实现方式中,所述输入模块包括:
第二确定单元,用于确定所述目标语音信息所呈现的目标语言种类;
第一选择单元,用于在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于所述目标语言种类的第一属性信息识别模型;
第一输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述构建模块包括:
第三确定单元,用于确定所述第一属性信息识别模型所应用的至少一个业务场景;
构建单元,用于对于每一个业务场景,构建所述第一属性信息识别模型的适用于所述业务场景的网络结构。
在一个可选的实现方式中,业务场景至少包括:
游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景。
在一个可选的实现方式中,所述输入模块包括:
第四确定单元,用于确定当前所处的业务场景;
第二选择单元,用于在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于所述业务场景的第一属性信息识别模型;
第二输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述第九获取模块具体用于:获取所述样本用户上传的所述样本用户的样本属性信息;或者,提取所述样本语音信息的样本语音特征,将所述样本语音特征输入第二属性信息识别模型中,得到所述第二属性信息识别模型输出的所述样本用户的样本属性信息。
在一个可选的实现方式中,所述第一查找模块包括:
第五获取单元,获取所述多个特征模板分别与所述目标语音特征之间的特征相似度;
第五确定单元,用于确定最高的特征相似度是否大于预设阈值;
第六确定单元,用于在最高的相似度大于或等于预设阈值的情况下,在所述多个特征模板中,将与所述目标语音特征之间的特征相似度最高的特征模板确定为所述目标特征模板。
在一个可选的实现方式中,还包括:
第二查找模块,用于在查找到所述目标特征模板的情况下,在用户的特征模板与用户的属性信息之间的对应关系中,查找与所述目标特征模板相对应的属性信息,并作为所述目标属性信息。
在一个可选的实现方式中,还包括:
更新模块,用于在查找到所述目标特征模板的情况下,基于所述目标语音特征对所述目标特征模板进行更新。
在一个可选的实现方式中,还包括:
生成模块,用于在未查找到所述目标特征模板的情况下,基于所述目标语音特征生成目标特征模板;
存储模块,用于将生成的目标特征模板与所述目标属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
第十一方面,本申请实施例示出了一种智能电视,所述电子设备包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如第一方面、第二方面、第三方面以及第五方面所述的信息处理方法。
第十二方面,本申请实施例示出了一种智能电视,所述电子设备包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如第一方面、第二方面、第三方面以及第五方面所述的信息处理方法。
第十三方面,本申请实施例示出了一种智能电视,所述电子设备包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如第一方面、第二方面、第三方面以及第五方面所述的信息处理方法。
第十四方面,本申请实施例示出了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如第一方面、第二方面、第三方面以及第五方面所述的信息处理方法。
第十五方面,本申请实施例示出了一种智能电视,所述电子设备包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如第二方面所述的信息处理方法。
第十六方面,本申请实施例示出了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如第二方面所述的信息处理方法。
与现有技术相比,本申请实施例包括以下优点:
在现有技术中,根据用户的历史购买行为数据确定用户的消费偏好,再根据用户的消费偏好向用户推荐商品,然而,如果用户此前未购买过商品,则就不会得到用户的历史购买行为数据,从而也就无法确定出用户的消费偏好,进而无法精准地向用户推荐用户感兴趣的商品,从而导致推荐精准度较低。
而在本申请中,在目标用户与电子设备进行语音交互的过程中,电子设备可以获取目标用户的目标语音信息;提取目标语音信息的目标语音特征;将目标语音特征输入事先训练的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
如此,在本申请中,即使用户之前未购买过商品,但电子设备可以实时根据目标用户的目标语音信息以及第一属性信息识别模型确定出目标用户的诸如身份、年龄以及性别等目标属性信息,进而可以根据目标属性信息精准地向目标用户推荐目标用户感兴趣的商业服务信息。
其次,通过本申请,还可以限制孩子在电子设备上使用娱乐应用的使用时间,避免孩子长时间在电子设备上使用娱乐应用而沉迷于娱乐应用。
另外,通过本申请,为了避免家庭中的孩子沉迷于娱乐应用,例如,沉迷于游戏或直播等,如果是孩子在电子设备上注册娱乐应用的用户账号,就可以拒绝在电子设备上为孩子分配娱乐应用的用户账号,以避免孩子基于用户账号在电子设备上使用娱乐应用,避免孩子沉迷于娱乐应用。
以及,在本申请中,如果电子设备非所有者需要使用电子设备,则需要得到所有者的授权,之后非所有者才能使用电子设备。然而如果电子设备的所有者不在电子设备的附近,则可以借助所有者的用户终端来采集所有者的语音信息,然后用户终端再将所有者的语音信息发送给电子设备,电子设备基于该语音信息获取所有者的属性信息,在电子设备在属性信息为预设属性信息的情况下,为目标用户开通电子设备的使用权限。通过本申请,可以实现借助电子设备的所有者的语音来为非所有者开通电子设备的使用权限,从而实现语音验证,以方便电子设备的非所有者使用电子设备。
附图说明
图1是本申请示出的一种信息处理方法的步骤流程图;
图2是本申请示出的一种训练属性信息识别模型的方法的步骤流程图;
图3是本申请示出的一种属性信息识别模型的网络结构的示意图;
图4是本申请示出的一种信息处理方法的步骤流程图;
图5是本申请示出的一种信息处理方法的步骤流程图;
图6是本申请示出的一种查找目标特征模板的方法的步骤流程图;
图7是本申请示出的一种信息处理方法的步骤流程图;
图8是本申请示出的一种信息处理方法的步骤流程图;
图9是本申请示出的一种信息处理方法的步骤流程图;
图10是本申请示出的一种信息处理装置的结构框图;
图11是本申请示出的一种信息处理装置的结构框图;
图12是本申请示出的一种信息处理装置的结构框图;
图13是本申请示出的一种信息处理装置的结构框图;
图14是本申请示出的一种信息处理装置的结构框图;
图15是本申请示出的一种信息处理装置的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本发明实施例的一种信息处理方法的步骤流程图,该方法可以应用于电子设备中,电子设备至少包括:智能电视、智能音响、VR(Virtual Reality,虚拟现实)眼镜、游戏机、手机以及电脑等,电脑至少包括平板电脑、台式电脑以及笔记本电脑等,该方法具体可以包括如下步骤:
在步骤S101中,获取目标用户的目标语音信息;
在本申请一个场景中,在用户使用电子设备的过程中,可能需要电子设备为用户推荐一些商业服务信息,例如,推荐可购买的商品等。
为了能够向用户精准地推荐用户感兴趣的商业服务信息,以提高推荐的转化率,进而提高用户体验,在本申请中,电子设备可以根据用户确定出用户的属性信息,然后根据用户的属性信息来精准地向用户推荐用户感兴趣的商业服务信息。
其中,属性信息包括用户的身份、年龄、性别、身高、体重以及职业、等,本申请对此不加以限定。
其中,为了用户方便地使用电子设备,用户可以与电子设备进行语音交互,以通过语音来控制电子设备。例如,假设电子设备为智能音箱,用户在使用智能音箱的过程中,用户可以通过语音来控制智能音箱,例如,如果用户想要使得智能音箱播放歌曲“123”,则用户可以对着智能音箱说出一段语音,例如,说出“播放器歌曲123”,智能音箱通过麦克风可以采集用户说出的这段语音,然后进行语音分析,确定出用户想要播放歌曲“123”,然后控制智能音箱播放歌曲“123”。
如此,用户在开启电子设备之后,用户通常会与电子设备进行至少一句话的语音交互。由于不同的用户输出的语音信息的语音特征之间是有区别的,因此,在本申请中,可以通过用户输出的语音信息的语音特征来区分用户,也即,可以通过用户输出的语音信息的语音特征来确定用户是谁,在确定出用户是谁之后,再确定用户的属性信息。这就不需要用户主动向电子设备人工注册自己的属性信息,在用户与电子设备之间正常进行语音交互的情况下且在用户未感知的情况下,电子设备就能够确定出用户的属性信息,从而可以简化用户的操作。
具体地,可以通过麦克风采集目标用户的目标语音信息,然后执行步骤S102。
在步骤S102中,提取目标语音信息的目标语音特征;
在本申请中,可以确定目标语音信息占据了哪些频率区间,然后确定在各个不同的频率区间内的振幅,以及,还可以获取目标语音的梅尔倒谱系数等,然后将获取的这些特征作为目标语音特征等。
当然,也可以通过其他方式来提取目标语音信息的目标语音特征,本申请对目标语音特征的具体获取方法不做限定,任何获取方法都在本申请的保护范围之内。
在步骤S103中,在多个特征模板中查找与目标语音特征匹配的目标特征模板;
在本申请的一个场景中,一个电子设备可以为固定群体服务,例如,一个家庭购买了电子设备,则该家庭中的所有家庭成员都可以使用电子设备。
对于任意一个家庭成员,在历史过程中,当该家庭成员第一次与电子设备进行一次语音交互时,电子设备就可以通过麦克风采集该家庭成员的语音信息,然后提取该语音信息的语音特征。
如果该家庭成员为了使得电子设备之后能够为其精准地推荐其感兴趣的商业服务信息,而在电子设备中注册其属性信息,则电子设备就可以获取该家庭成员注册的该属性信息,然后根据该家庭成员的语音特征生成该家庭成员的特征模板,例如,由于此次是该家庭成员第一次与电子设备进行语音交互,也即,电子设备是第一次得到该家庭成员的语音特征,因此,可以将该家庭成员的语音特征直接作为该家庭成员的特征模板,然后将该家庭成员的特征模板与该家庭成员的属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
如果该家庭成员未向电子设备输入其属性信息,则可以通过事先训练的第一属性信息识别模型来预测该家庭成员的属性信息,其中,第一属性信息识别模型的训练方式参见之后如图2所示的实施例,在此不做详述。然后根据该家庭成员的语音特征生成该家庭成员的特征模板,例如,由于此次是该家庭成员第一次与电子设备进行语音交互,也即,电子设备是第一次得到该家庭成员的语音特征,因此,可以将该家庭成员的语音特征直接作为该家庭成员的特征模板,然后将该家庭成员的特征模板与该家庭成员的属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
如此,当该家庭成员之后再一次使用电子设备时,如果需要电子设备为其精准地推荐其感兴趣的商业服务信息,则电子设备可以采集该家庭成员的语音信息,然后提取该语音信息的语音特征,之后在用户的特征模板与用户的属性信息之间的对应关系中查找与该语音特征匹配的特征模板,即,之前在用户的特征模板与用户的属性信息之间的对应关系中存储的该家庭成员的特征模板,然后在用户的特征模板与用户的属性信息之间的对应关系中查找与该特征模板相对应的属性信息,从而得到该家庭成员的属性信息,进而可以根据该家庭成员的属性信息为该家庭成员精准地推荐其感兴趣的商业服务信息。
另外,对于任意一个家庭成员,同样如此。
然而,虽然不同的用户的语音特征之间有区别,但是对于同一用户而言,其语音特征并不是一个唯一固定不变的特征数据,而通常是一个特征范围,例如,一个用户有时候发出的语音在30KHz频段的响度为30分贝,有时候发出的语音在30KHz频段的响度为35分贝,有时候发出的语音在30KHz频段的响度为32分贝以及有时候发出的语音在30KHz频段的响度为37分贝等。
如果仅仅根据用户的某一特定的语音特征来生成用户的特征模板,则可能会导致该特征模板对该用户的泛化能力较低,例如,在30KHz频段内,仅仅根据35分贝的响度生成该用户的特征模板,则之后如果该用户发出的语音在30KHz频段的响度为37分贝,则可能会将该用户确定为其他用户,导致身份识别错误。
因此,为了避免出现身份识别错误的情况,每当该用户再次使用语音设备,电子设备在采集该用户的语音信息并提取该用户的语音信息的语音特征之后,可以根据提取的语义特征对用户的特征模板与用户的属性信息之间的对应关系中的该用户的特征模板进行更新,以使该用户的特征模板尽可能地能囊括该用户更多的语音特征,进而可以避免出现身份识别错误的情况发生。
其中,在多个特征模板中查找与目标语音特征匹配的目标特征模板的具体查找方法可以参见之后图6所示的实施例,在此不做详述。其中,多个特征模板包括用户的特征模板与用户的属性信息之间的对应关系中存储的特征模板等。
然而,有时候目标用户可能是第一次使用使用电子设备,即,目标用户对于电子设备而言是一个新用户,在这种情况下,电子设备中的用户的特征模板与用户的属性信息之间的对应关系中并未存储有目标用户的特征模板以及目标用户的属性信息,因此,也就无法基于用户的特征模板与用户的属性信息之间的对应关系得到目标用户的属性信息,而为了能够得到目标用户的属性信息,电子设备可以执行步骤S104。
在查找到目标特征模板的情况下,在步骤S104中,将目标语音特征输入事先训练的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
进一步地,为了使得之后目标用户再一次使用电子设备时,电子设备能够为目标用户精准地推荐目标用户感兴趣的商业服务信息,在得到第一属性信息识别模型输出的目标用户的目标属性信息之后,可以基于目标语音特征生成目标特征模板,然后将生成的目标特征模板与目标属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
如此,之后在目标用户再一次使用电子设备时,如果需要电子设备为其精准地推荐其感兴趣的商业服务信息,则电子设备可以采集目标用户的语音信息并提取该语音信息的语音特征,之后可以在用户的特征模板与用户的属性信息之间的对应关系中查找与该语音特征匹配的特征模板,即,之前在用户的特征模板与用户的属性信息之间的对应关系中存储的目标特征模板,然后在用户的特征模板与用户的属性信息之间的对应关系中查找与目标特征模板相对应的属性信息,即目标用户的目标属性信息,进而就可以根据目标用户的目标属性信息为目标用户精准地推荐目标用户感兴趣的商业服务信息。
进一步地,在未查找到目标特征模板的情况下,在步骤S105中,在用户的特征模板与用户的属性信息之间的对应关系中查找与目标特征模板相对应的属性信息,并作为目标属性信息,进而就可以根据目标用户的目标属性信息为目标用户精准地推荐目标用户感兴趣的商业服务信息。
在现有技术中,根据用户的历史购买行为数据确定用户的消费偏好,再根据用户的消费偏好向用户推荐商品,然而,如果用户此前未购买过商品,则就不会得到用户的历史购买行为数据,从而也就无法确定出用户的消费偏好,进而无法精准地向用户推荐用户感兴趣的商品,从而导致推荐精准度较低。
而在本申请中,在目标用户与电子设备进行语音交互的过程中,电子设备可以获取目标用户的目标语音信息;提取目标语音信息的目标语音特征;将目标语音特征输入事先训练的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
如此,在本申请中,即使用户之前未购买过商品,但电子设备可以实时根据目标用户的目标语音信息以及第一属性信息识别模型确定出目标用户的诸如身份、年龄以及性别等目标属性信息,进而可以根据目标属性信息精准地向目标用户推荐目标用户感兴趣的商业服务信息。
在本申请一个实施例中,参见图2,第一属性信息识别模型的训练方式包括:
在步骤S201中,获取样本数据集,样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
其中,获取多个样本用户的样本语音信息的方式,包括:
可以搜集大量的样本用户的样本语音信息,在一个实施例中,由于不同的用户输出的语音信息的语音特征有区别,而同一用户输出的多个语音的语音特征之间相同,或者,即使同一用户输出的多个语音的语音特征之间有区别,但之间的特征相似度也非常高,因此,为了提高训练出的属性信息识别模型的泛化程度,可以使得不同的样本语音信息所属的样本用户不同,也即,对于任意一个样本用户,只搜集这个样本用户的一个样本语音信息即可,以增加样本语音信息的多样性,进而可以提高训练出的属性信息识别模型的泛化程度。
其中提取样本语音信息的样本语音特征的过程可以参见步骤S102的描述,在此不做详述。
其中,获取样本用户的标注样本属性信息的方式,包括:可以获取每一个样本用户上传的各自的样本属性信息,并作为样本用户的标注样本属性信息;例如,每一个样本用户可以上传各自的样本属性信息,样本用户上传的样本属性信息通常为样本用户自己真实的属性信息,因此,将样本用户自己真实的属性信息作为训练模型时的标注数据,可以提高训练出的第一属性信息识别模型在预测属性信息时的预测精准度。
在另一个实施例中,在大量的样本用户中,有时候部分样本用户可能未提供其样本属性信息,这样,就无法得到这部分样本用户的真实的属性信息。
虽然这部分样本用户提供了样本语音信息,电子设备也能够提取这部分样本用户的样本语音信息的样本语音特征,但是由于没有这部分样本用户的真实的属性信息作为标注数据,因此,无法使用这部分样本用户的样本语音特征来训练属性信息识别模型,或者说,这部分样本用户的样本语音特征对训练属性信息识别模型起不到有效的作用,电子设备仅可以使用另一部分样本用户的样本语音特征以及样本属性信息来训练第一属性信息识别模型。
然而,由于只有另一部分样本用户的样本语音特征以及样本属性信息在训练第一属性信息识别模型时起到了有效的作用,因此,会导致训练第一属性信息识别模型时所使用的样本数据较少,导致训练出的第一属性信息识别模型的泛化程度较低。
因此,为了尽可能提高训练出的第一属性信息识别模型的泛化程度,在本申请另一实施例中,对于未提供标注样本属性信息的任意一个样本用户的样本语音信息,可以提取该样本语音信息的样本语音特征,然后将该样本语音特征输入既有的第二属性信息识别模型中,得到既有的第二属性信息识别模型输出的样本用户的样本属性信息。对于未提供标注样本属性信息的其他每一个样本用户的样本语音信息,同样执行上述操作。
既有的第二属性信息识别模型包括:在训练第一属性信息识别模型之前市面上已存在的一种属性信息识别模型。
之前训练第二属性信息识别模型所使用的训练数据通常与训练第一属性信息识别模型所需要使用的样本语音特征、标注样本属性信息不同。
在本申请中,为了提高在预测属性信息时的预测精准度,需要使用新的样本数据来重新训练一个属性信息识别模型,即,第一属性信息识别模型。
为了避免损失这部分样本用户在训练第一属性信息识别模型所起的作用,可以借助市面上已有的第二属性信息识别模型来预测出这部分样本用户的标注样本属性信息,从而得到这部分样本用户的样本语音特征的标注数据,以使这部分样本用户的语音特征可以在训练第一属性信息识别模型时起到作用,进而提高训练出的第一属性信息识别模型的泛化程度。
在步骤S202中,构建第一属性信息识别模型的网络结构;
在一个实施例中,参见图3,网络结构包括:至少一个向量化层、TDNN(Time-DelayNeural Network,延时神经网络)、平均池化层、至少一个全连接层以及归一化层等。当然,也可以根据实际情况来包括其他模块,本申请对此不加以限定。
向量化层用于将多个样本语音特征分别转换为特征向量。例如,一个样本语音包括多帧语音,每一帧语音可以具有语音特征,向量化层可以将每一帧语音的语音特征转换为一个特征向量。TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充。平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量。至少一个全连接层用于根据池化向量预测样本用户的的属性信息。
在本申请中,可以根据基于需求来构建第一属性信息识别模型的网络结构,例如,训练的第一属性信息识别模型之后可能会应用到不同的业务场景中,不同的业务场景适用的第一属性信息识别模型的网络结构不同。
在步骤S203中,使用样本数据集对第一属性信息识别模型的网络参数进行训练,直至第一属性信息识别模型中的权重收敛,得到第一属性信息识别模型。
其中,在训练第一属性信息识别模型时,可以训练多个第一属性信息识别模型,不同的第一属性信息识别模型所适用于的语言种类不同,语言种类包括:汉语、英语、德语、日语、汉语、俄语以及法语等多个国家的语言,或者,还可以包括:汉语中的普通话、四川话、广东话、山东话以及东北话等各个地区的方言。
为了训练分别适用于不同的语言种类的第一属性信息识别模型,需要事先搜集多个样本数据集,不同的样本数据集中的样本语音信息所呈现的语言种类不同。
如此,在使用样本数据集对第一属性信息识别模型的网络参数进行训练时,可以基于不同的样本数据集训练适用于不同的语言种类的第一属性信息识别模型。
其中,对于任意一个语言种类,在基于目标语音特征和第一属性信息识别模型获取目标用户的目标属性信息时,使用适用于该语言种类的第一属性信息识别模型获取的目标用户的目标属性信息的精准度高于使用其他第一属性信息识别模型获取的目标用户的目标属性信息的精准度。
因此,在本申请另一实施例中,参见图4,在步骤S104中,包括:
在步骤S301中,确定目标语音信息所呈现的目标语言种类;
其中,事先可以搜集样本语音集,样本语音集中包括了多个标注有语言种类的样本语音信息。然后基于样本语音集对模型进行训练,直至模型中的参数均收敛,从而得到语言种类识别模型。该模型包括:CNN(卷积神经网络,Convolutional Neural Networks)、LSTM(长短时记忆网络,Long Short-Term Memory)以及DNN(深度神经网络,Deep NeuralNetworks)等,本申请对此不加以限定。
如此,在本步骤中,可以将目标语音信息输入已训练的、语言种类识别模型中,得到语言种类识别模型输出的目标语音信息所呈现的目标语言种类。
在步骤S302中,在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于目标语言种类的第一属性信息识别模型;
其中,对于任意一个语言种类,事先在训练出适用于该语言种类的第一属性信息识别模型之后,可以将该语言种类与训练出的该第一属性信息识别模型组成对应表项,并存储在语言种类与第一属性信息识别模型之间的对应关系中,对于其他每一个语言种类,同样如此。
因此,在本步骤中,可以在语言种类与第一属性信息识别模型之间的对应关系中,查找与目标语言种类相对应的第一属性信息识别模型,并作为适用于目标语言种类的第一属性信息识别模型。
在步骤S303中,将目标语音特征输入选择的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
其中,在训练第一属性信息识别模型时,可以训练多个第一属性信息识别模型,不同的第一属性信息识别模型所适用于的业务场景不同,业务场景包括:游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景等。
为了训练分别适用于不同的业务场景的第一属性信息识别模型,事先在构建第一属性信息识别模型的网络结构时,可以确定第一属性信息识别模型所应用的至少一个业务场景,然后对于任意一个业务场景,构建第一属性信息识别模型的适用于该业务场景的网络结构,对于其他每一个业务场景,同样如此。其中,适用于不同的业务场景的网络结构中的TDNN的数量不同,和/或,全连接层的数量不同等。
如此,在使用样本数据集对第一属性信息识别模型的网络参数进行训练时,对于任一个业务场景,可以获取包括网络结构适用于该业务场景的第一属性信息识别模型,然后基于样本数据集,对包括网络结构适用于该业务场景的第一属性信息识别模型的网络参数进行训练,从而得到适用于该业务场景的第一属性信息识别模型。对于其他每一个业务场景,同样如此。
其中,对于任意一个业务场景,在基于目标语音特征和第一属性信息识别模型获取目标用户的目标属性信息时,使用适用于该业务场景的第一属性信息识别模型获取的目标用户的目标属性信息的精准度高于使用其他第一属性信息识别模型获取的目标用户的目标属性信息的精准度。
因此,在本申请另一实施例中,参见图5,在步骤S104中,包括:
在步骤S401中,确定电子设备所处的当前业务场景;
业务场景至少包括:游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景等。
在步骤S402中,在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于当前业务场景的第一属性信息识别模型;
其中,对于任意一个业务场景,事先在训练出适用于该业务场景的第一属性信息识别模型之后,可以将该业务场景与训练出的该第一属性信息识别模型组成对应表项,并存储在业务场景与第一属性信息识别模型之间的对应关系中,对于其他每一个业务场景,同样如此。
因此,在本步骤中,可以在业务场景与第一属性信息识别模型之间的对应关系中,查找与当前业务场景相对应的第一属性信息识别模型,并作为适用于当前业务场景的第一属性信息识别模型。
在步骤S403中,将目标语音特征输入选择的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
在本申请另一实施例中,参见图6,步骤S103包括:
在步骤S501中,计算多个特征模板分别与目标语音特征之间的特征相似度;
在本申请中,可以基于PLDA(Probabilistic Linear Discriminant Analysis概率线性判别分析)和CDS(Cosine Distance Scoring,余弦距离分值)来计算目标语音特征分别与每一个特征模板之间的特征相似度。
其中,对于任意一个特征模板,可以计算该特征模板与目标语音特征之间的距离的倒数,并作为该特征模板与目标语音特征之间的特征相似度。
例如,假设在该特征模板中,在30KHz频段内的语音响度为30-37分贝,
如果目标语音特征表明目标语音信息在30KHz频段的响度位于30-37分贝内,则目标在该特征模板与目标语音特征之间在30KHz频段的距离为0。
如果目标语音特征表明目标语音信息在30KHz频段的响度小于30分贝,则在该特征模板与目标语音特征之间在30KHz频段的距离为30分贝与目标语音信息在30KHz频段的响度之间的差值。
如果目标语音特征表明了目标语音信息在30KHz频段的响度大于37分贝,则在该特征模板与目标语音特征之间在30KHz频段的距离为目标语音信息在30KHz频段的响度与37分贝之间的差值。
将目标语音信息分别在每一个频段分别对应的差值求和,然后计算求和得到的数值的倒数,得到该特征模板与目标语音特征之间的特征相似度。
对于其他每一个特征模板,同样执行上述操作,从而可以得到每一个特征模板分别与目标语音特征之间的特征相似度。
在步骤S502中,确定最高的特征相似度是否大于预设阈值;
预设阈值可以为事先在电子设备中设置的数值,例如,50%、60%或70%等,本申请对此不加以限定。
在最高的相似度大于或等于预设阈值的情况下,在步骤S503中,在多个特征模板中将与目标语音特征之间的特征相似度最高的特征模板确定为目标特征模板;
然而,虽然不同的用户的语音特征之间有区别,但是目标用户而言,其语音特征并不是一个唯一固定不变的特征数据,而通常是一个特征范围,例如,一个用户有时候发出的语音在30KHz频段的响度为30分贝,有时候发出的语音在30KHz频段的响度为35分贝,有时候发出的语音在30KHz频段的响度为32分贝以及有时候发出的语音在37KHz频段的响度为37分贝。
如果仅仅根据目标用户的某一特定的语音特征来生成用户的特征模板,则可能会导致该特征模板对该用户的泛化能力较低,例如,在30KHz频段内,仅仅根据35分贝的响度生成该用户的特征模板,则之后如果该用户发出的语音在37KHz频段的响度为37分贝,则可能会将目标用户确定为其他用户,导致身份识别错误。
因此,为了避免出现身份识别错误的情况发生,在本申请另一实施例中,在最高的相似度大于或等于预设阈值的情况下,在用户的特征模板与用户的属性信息之间的对应关系中,可以根据目标语音特征对用户的特征模板与用户的属性信息之间的对应关系中的目标特征模板进行更新,以使更新后的目标特征模板尽可能地能囊括目标用户更多的语音特征,进而可以避免出现身份识别错误的情况发生。
参照图7,示出了本发明实施例的一种信息处理方法的步骤流程图,该方法可以应用于电子设备中,电子设备至少包括:智能电视、智能音响、VR眼镜、游戏机、手机以及电脑等,电脑至少包括平板电脑、台式电脑以及笔记本电脑等,该方法具体可以包括如下步骤:
在步骤S601中,在目标用户在电子设备上使用娱乐应用的过程中,输出第一提示信息,第一提示信息用于提示输入语音信息;
在本申请中,用户可以在电子设备上安装各种娱乐应用,然后在电子设备上使用娱乐应用,例如,娱乐应用包括用于娱乐的应用程序,例如,游戏应用程序、视频应用程序、直播应用程序以及博客应用程序等。用户可以在电子设备使用娱乐应用来满足用户的娱乐需求。
其中,有时候电子设备可以被多个人共享使用,例如,在一个家庭中,家庭成员包括爸爸、妈妈以及孩子等,三个人都可以使用家里的智能电视。
在不同的家庭成员在电子设备上使用娱乐应用时,电子设备基于不同的家庭成员的语音信息就可以确定出哪个家庭成员正在电子设备上使用娱乐应用。
为了避免家庭中的孩子沉迷于娱乐应用,例如,沉迷于游戏或直播等,如果是孩子在电子设备上使用娱乐应用,就可以限制孩子在电子设备上使用娱乐应用的使用时间,避免孩子长时间在电子设备上使用娱乐应用而沉迷于娱乐应用。
因此,为了避免孩子长时间在电子设备上使用娱乐应用而沉迷于娱乐应用,在本申请中,在目标用户在电子设备上使用娱乐应用的过程中,输出第一提示信息,第一提示信息用于提示输入语音信息,例如,在屏幕上显示第一提示信息或者使用麦克风播放第一提示信息,其中,可以定期输出第一提示信息,或者,在电子设备运行娱乐应用的时长较长的情况下,输出第一提示信息,目标用户在感知到的第一提示信息之后,可以向电子设备输入目标语音信息,然后电子设备执行步骤S602。
在步骤S602中,获取使用娱乐应用的目标用户根据第一提示信息输入的目标语音信息;
其中,如果在电子设备输出第一提示信息之后的预设时长内接收到使用娱乐应用的目标用户输入的语音信息,则可以直接关闭娱乐应用等。
在步骤S603中,基于目标语音信息以及第一属性信息识别模型确定目标用户的目标属性信息;
本步骤可以参见步骤S102~S105的流程,在此不做详述。
在步骤S604中,在目标属性信息为预设属性信息的情况下,设置娱乐应用的关闭时刻,并输出第二提示信息,第二提示信息用于提示电子设备将在关闭时刻时关闭娱乐应用。
通过上述流程可以确定出目标用户的目标属性信息,例如,目标用户的性别、年龄、职业、身高以及体重等,在目标属性信息为预设属性信息的情况下,则说明目标用户不适合长时间在电子设备上使用娱乐应用,例如,假设目标用户的年龄为10岁,则说明目标用户为儿童,其不适合长时间在电子设备上使用娱乐应用,否则容易沉迷于娱乐应用。
所以,需要设置娱乐应用的关闭时刻,例如,可以将关闭时刻设置的较早,以使目标用户可以尽早结束使用娱乐应用,其次,可以输出第二提示信息,以提示目标用户电子设备将在关闭时刻时关闭娱乐应用,另外,也可以提示目标用户尽早关闭娱乐应用。目标用户在看到第二提示信息之后,可以获知其不适合长时间在电子设备上使用娱乐应用,需要尽早关闭娱乐应用。
另外,如果电子设备在关闭时刻时检测到预测应用未被关闭,则电子设备可以直接关闭娱乐应用,以避免目标用户继续在电子设备上使用娱乐应用。
其中,在一个实施例中,在设置娱乐应用的关闭时刻时,可以根据目标属性信息设置适用于目标用户的关闭时刻。
例如,对于10岁的儿童而言,其自制力较差,且需要充足休息,为避免其晚上长时间使用娱乐应用,且为避免其熬夜,需要将关闭时刻设置的较早,例如,每天的20点整或20点30分等。而对于15岁的青少年而言,其自制力适中,且需要适当的休息,为避免其晚上较长时间使用娱乐应用,且为避免其熬夜,需要将关闭时刻设置的适中,例如,每天的21点整或21点30分等。而对于18岁的成年人而言,其自制力较好,且需要休息,为避免其晚上时间使用娱乐应用,且为避免其过度熬夜,可以将关闭时刻设置的较晚,例如,每天的22点整或22点30分等。
如此,对于任意一个属性信息,事先可以设置适用于该属性信息的用户的关闭时刻,然后将该属性信息与该关闭时刻组成对应表项,并存储在属性信息与关闭时刻之间的对应关系中,对于其他每一个属性信息,同样如此。
因此,在设置娱乐应用的关闭时刻时,可以在属性信息与关闭时刻之间的对应关系中,查找与目标属性信息相对应的关闭时刻,可以将娱乐应用的关闭时刻设置为获取到的设置时刻。
其中,在另一个实施例中,设置娱乐应用的关闭时刻时,可以获取目标用户使用娱乐应用的已持续使用时长;根据目标属性信息获取适用于目标用户的可持续使用时长;根据已持续使用时长和可持续使用时长获取目标用户使用娱乐应用的剩余使用时长;根据电子设备的当前时刻与剩余使用时长确定关闭时刻,可以将娱乐应用的关闭时刻设置为确定出的设置时刻。
其中,适用于不同属性信息用户使用娱乐应用的可持续使用时长不同,例如,对于10岁的儿童而言,其自制力较差,且需要充足休息,为避免其长时间使用娱乐应用,需要将可持续使用时长设置的较短,例如,30分钟等。而对于15岁的青少年而言,其自制力适中,且需要适当的休息,为其较长时间使用娱乐应用,需要将可持续使用时长设置的适中,例如,一个小时等。而对于18岁的成年人而言,其自制力较好,且需要休息,为避免其时间使用娱乐应用,可以将可持续使用时长设置的较长,例如,两个小时等。
如此,对于任意一个属性信息,事先可以设置适用于该属性信息的用户使用娱乐应用的可持续使用时长,然后将该属性信息与该可持续使用时长组成对应表项,并存储在属性信息与可持续使用时长之间的对应关系中,对于其他每一个属性信息,同样如此。
因此,在根据目标属性信息获取适用于目标用户的可持续使用时长时,可以在属性信息与可持续使用时长之间的对应关系中,查找与目标属性信息相对应的可持续使用时长。
进一步地,在本申请中,为了避免降低用户体验,电子设备还可以获取电子设备将在关闭时刻时关闭娱乐应用的原因;例如,原因包括:目标用户在电子设备上使用娱乐应用的已持续使用时长已超标,或者,目标用户在电子设备上使用娱乐应用的时刻已超过预定时刻,为了目标用户保持健康,避免其沉迷于娱乐应用,需要停止使用娱乐应用,所以要关闭娱乐应用。然后电子设备可以输出该原因。以使目标用户获知电子设备为什么需要在关闭时刻时关闭娱乐应用,避免目标用户不知道该原因而不知所措,进而避免降低用户体验。
通过本申请,可以限制孩子在电子设备上使用娱乐应用的使用时间,避免孩子长时间在电子设备上使用娱乐应用而沉迷于娱乐应用。
参照图8,示出了本发明实施例的一种信息处理方法的步骤流程图,该方法可以应用于电子设备中,电子设备至少包括:智能电视、智能音响、VR眼镜、游戏机、手机以及电脑等,电脑至少包括平板电脑、台式电脑以及笔记本电脑等,该方法具体可以包括如下步骤:
在步骤S701中,在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息,第一提示信息用于提示输入语音信息;
在本申请中,用户可以在电子设备上安装各种娱乐应用,然后在电子设备上使用娱乐应用,例如,娱乐应用包括用于娱乐的应用程序,例如,游戏应用程序、视频应用程序、直播应用程序以及博客应用程序等。用户可以在电子设备使用娱乐应用来满足用户的娱乐需求。
然而,用户在电子设备上使用娱乐应用之前,需要先在电子设备上注册娱乐应用的用户账号,然后基于用户账号才能在电子设备上使用娱乐应用。
其中,有时候电子设备可以被多个人共享使用,例如,在一个家庭中,家庭成员包括爸爸、妈妈以及孩子等,三个人都可以使用家里的智能电视。
在不同的家庭成员在电子设备上注册娱乐应用的用户账号时,电子设备基于不同的家庭成员的语音信息就可以确定出哪个家庭成员正在电子设备上注册娱乐应用的用户账号。
为了避免家庭中的孩子沉迷于娱乐应用,例如,沉迷于游戏或直播等,如果是孩子在电子设备上注册娱乐应用的用户账号,就可以拒绝在电子设备上为孩子分配娱乐应用的用户账号,以避免孩子基于用户账号在电子设备上使用娱乐应用,避免孩子沉迷于娱乐应用。
因此,为了避免孩子沉迷于娱乐应用,在本申请中,在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息,第一提示信息用于提示输入语音信息;例如,在屏幕上显示第一提示信息或者使用麦克风播放第一提示信息,目标用户在感知到的第一提示信息之后,可以向电子设备输入目标语音信息,然后电子设备执行步骤S702。
在步骤S702中,获取使用娱乐应用的目标用户根据第一提示信息输入的目标语音信息;
在步骤S703中,基于目标语音信息以及第一属性信息识别模型确定目标用户的目标属性信息;
本步骤可以参见步骤S102~S105的流程,在此不做详述。
在步骤S704中,在目标属性信息为预设属性信息的情况下,拒绝为目标用户分配娱乐应用的用户账号。
通过上述流程可以确定出目标用户的目标属性信息,例如,目标用户的性别、年龄、职业、身高以及体重等,在目标属性信息为预设属性信息的情况下,则说明目标用户不适合在电子设备上使用娱乐应用,例如,假设目标用户的年龄为10岁,则说明目标用户为儿童,其不适合在电子设备上使用娱乐应用,否则容易沉迷于娱乐应用,因此,可以拒绝为目标用户分配娱乐应用的用户账号。
进一步地,在本申请中,为了避免降低用户体验,电子设备还可以获取电子设备拒绝为目标用户分配娱乐应用的用户账号的原因;例如,原因包括:其年龄过小,不适合电子设备上使用娱乐应用等,然后电子设备可以输出该原因。以使目标用户获知电子设备为什么需要拒绝为目标用户分配娱乐应用的用户账号,避免目标用户不知道该原因而不知所措,进而避免降低用户体验。
通过本申请,为了避免家庭中的孩子沉迷于娱乐应用,例如,沉迷于游戏或直播等,如果是孩子在电子设备上注册娱乐应用的用户账号,就可以拒绝在电子设备上为孩子分配娱乐应用的用户账号,以避免孩子基于用户账号在电子设备上使用娱乐应用,避免孩子沉迷于娱乐应用。
参照图9,示出了本发明实施例的一种信息处理方法的步骤流程图,该方法可以应用于信息处理系统中,系统处理系统中包括电子设备以及用户终端,电子设备与用户终端之间通信连接,电子设备至少包括:智能电视、智能音响、VR眼镜、游戏机、手机以及电脑等,用户终端至少包括:智能电视、智能音响、VR眼镜、游戏机、手机以及电脑等,电脑至少包括平板电脑、台式电脑以及笔记本电脑等,该方法具体可以包括如下步骤:
在步骤S801中,当需要为目标用户开通电子设备的使用权限时,电子设备输出第一提示信息,第一提示信息用于提示输入用于验证使用权限的语音信息;
在本申请中,用户可以在电子设备上安装各种娱乐应用,然后在电子设备上使用娱乐应用,例如,娱乐应用包括用于娱乐的应用程序,例如,游戏应用程序、视频应用程序、直播应用程序以及博客应用程序等。用户可以在电子设备使用娱乐应用来满足用户的娱乐需求。
然而,电子设备具有至少一个所有者,所有者具有使用电子设备的权限,例如,所有者可以在电子设备上使用娱乐应用等,而电子设备的非所有者不具有使用电子设备的权限。
如果非所有者需要使用电子设备,则需要得到所有者的授权,之后非所有者才能使用电子设备。
如果目标用户需要开通电子设备的使用权限以使用电子设备,需要向电子设备提出开通请求,电子设备接收到该开通请求之后,就可以确定此时需要为目标用户开通电子设备的使用权限,然后输出第一提示信息,第一提示信息用于提示输入用于验证使用权限的语音信息;例如,在屏幕上显示第一提示信息或者使用麦克风播放第一提示信息,目标用户在感知到的第一提示信息之后,目标用户可以向电子设备输入语音信息,如果目标用户是电子设备的所有者,则目标用户再向电子设备输入语音信息之后,电子设备就可以基于目标用户的语音信息经由步骤S101~步骤S105的流程来确定出目标用户是电子设备的所有者,然后为目标用户开通电子设备的使用权限,之后作为所有者的目标用户就可以使用电子设备。
然而,如果目标用户是电子设备的非所有者,则目标用户可以请求得到电子设备的所有者的授权,授权后就非所有者就可以使用电子设备。
例如,目标用户可以在电子设备中输入辅助验证请求,电子设备获取使用娱乐应用的目标用户根据第一提示信息输入的辅助验证请求,辅助验证请求携带用户终端的终端标识,辅助验证请求用于请求电子设备根据该终端标识从用户终端上获取用于验证使用权限的语音信息;
在步骤S802中,电子设备获取使用娱乐应用的目标用户根据第一提示信息输入的辅助验证请求,辅助验证请求携带用户终端的终端标识,辅助验证请求用于请求电子设备根据该终端标识从用户终端上获取用于验证使用权限的语音信息;
在步骤S803中,电子设备根据该终端标识向用户终端发送获取指令,该获取指令用于获取用于在电子设备上验证使用权限的语音信息;
在步骤S804中,用户终端接收该获取指令,该获取指令用于获取用于在电子设备上验证身份信息的语音信息;
在步骤S805中,用户终端根据该获取指令输出第二提示信息,第二提示信息用于提示输入语音信息;
用户终端可以在屏幕上显示第二提示信息或者使用麦克风播放第而提示信息,使用用户终端的辅助用户在感知到的第而提示信息之后,如果决定可以为目标用户进行辅助验证,以使电子设备能够为目标用户开通使用权限,则可以向用户终端输入语音信息。
在步骤S806中,用户终端获取使用用户终端的辅助用户根据第二提示信息输入的语音信息;
在步骤S807中,用户终端向电子设备发送该语音信息;
在步骤S808中,电子设备接收用户终端根据该获取指令发送的该语音信息;
在步骤S809中,电子设备基于该语音信息以及第一属性信息识别模型获取属性信息;
本步骤具体可以参见步骤S102~步骤S105,在此不做详述。
在步骤S810中,电子设备在该属性信息为预设属性信息的情况下,为目标用户开通电子设备的使用权限。
预设属性信息包括电子设备的所有者的属性信息等。电子设备事先存储有电子设备的所有者的属性信息。
进一步地,可以输出第三提示信息,第三提示信息用于提示已对目标用户开通电子设备的使用权限,目标用户在感知到第三提示信息之后,就可以获知电子设备已为其开通电子设备的使用权限,之后目标用户就可以使用电子设备。
进一步地,电子设备还可以向所述用户终端发送第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限,用户终端接收所述电子设备发送的第三提示信息,输出所述第三提示信息。以使使用用户终端的辅助用户可以获知电子设备已经对所述目标用户开通所述电子设备的使用权限。
在本申请中,如果电子设备非所有者需要使用电子设备,则需要得到所有者的授权,之后非所有者才能使用电子设备。然而如果电子设备的所有者不在电子设备的附近,则可以借助所有者的用户终端来采集所有者的语音信息,然后用户终端再将所有者的语音信息发送给电子设备,电子设备基于该语音信息获取所有者的属性信息,在电子设备在属性信息为预设属性信息的情况下,为目标用户开通电子设备的使用权限。通过本申请,可以实现借助电子设备的所有者的语音来为非所有者开通电子设备的使用权限,从而实现语音验证,以方便电子设备的非所有者使用电子设备。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作并不一定是本申请所必须的。
图10是根据一示例性实施例示出的一种信息处理装置的框图,应用于电子设备,如图10所示,该装置包括:
第一输出模块11,用于在目标用户在所述电子设备上使用娱乐应用的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
第一获取模块12,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第一确定模块13,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
设置模块14,用于在所述目标属性信息为预设属性信息的情况下,设置所述娱乐应用的关闭时刻;
第二输出模块15,用于输出第二提示信息,所述第二提示信息用于提示所述电子设备将在所述关闭时刻时关闭所述娱乐应用。
在一个可选的实现方式中,还包括:
关闭模块,用于在所述关闭时刻时如果所述预测应用未被关闭,则关闭所述娱乐应用。
在一个可选的实现方式中,所述设置模块包括:
第一获取单元,用于根据所述目标属性信息获取适用于所述目标用户的关闭时刻;
第一设置单元,用于将所述娱乐应用的关闭时刻设置为获取到的设置时刻。
在一个可选的实现方式中,所述第一获取单元具体用于:在属性信息与关闭时刻之间的对应关系中,查找与所述目标属性信息相对应的关闭时刻。
在一个可选的实现方式中,所述设置模块包括:
第二获取单元,用于获取所述目标用户使用所述娱乐应用的已持续使用时长;
第三获取单元,用于根据目标属性信息获取适用于所述目标用户的可持续使用时长;
第四获取单元,用于根据所述已持续使用时长和所述可持续使用时长获取所述目标用户使用所述娱乐应用的剩余使用时长;
第一确定单元,用于根据所述电子设备的当前时刻与所述剩余使用时长确定所述关闭时刻;
第二设置单元,用于将所述娱乐应用的关闭时刻设置为确定出的设置时刻。
在一个可选的实现方式中,所述第三获取单元具体用于:在属性信息与可持续使用时长之间的对应关系中,查找与所述目标属性信息相对应的可持续使用时长。
在一个可选的实现方式中,还包括:
第二获取模块,用于获取所述电子设备将在所述关闭时刻时关闭所述娱乐应用的原因;
第三输出模块,用于输出所述原因。
在一个可选的实现方式中,所述电子设备至少包括:智能电视、智能音响、虚拟现实VR眼镜、游戏机、手机以及电脑。
通过本申请,可以限制孩子在电子设备上使用娱乐应用的使用时间,避免孩子长时间在电子设备上使用娱乐应用而沉迷于娱乐应用。
图11是根据一示例性实施例示出的一种信息处理装置的框图,应用于电子设备,如图11所示,该装置包括:
第四输出模块21,用于在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息,所述第一提示信息用于提示输入语音信息;
第三获取模块22,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第二确定模块23,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
拒绝模块24,用于在所述目标属性信息为预设属性信息的情况下,拒绝为所述目标用户分配所述娱乐应用的用户账号。
在一个可选的实现方式中,还包括:
第四获取模块,用于获取所述电子设备拒绝为所述目标用户分配所述娱乐应用的用户账号的原因;
第五输出模块,用于输出所述原因。
通过本申请,为了避免家庭中的孩子沉迷于娱乐应用,例如,沉迷于游戏或直播等,如果是孩子在电子设备上注册娱乐应用的用户账号,就可以拒绝在电子设备上为孩子分配娱乐应用的用户账号,以避免孩子基于用户账号在电子设备上使用娱乐应用,避免孩子沉迷于娱乐应用。
图12是根据一示例性实施例示出的一种信息处理装置的框图,应用于电子设备,如图12所示,该装置包括:
第六输出模块31,用于当需要为目标用户开通电子设备的使用权限时,输出第一提示信息,所述第一提示信息用于提示输入用于验证使用权限的语音信息;
第五获取模块32,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的辅助验证请求,所述辅助验证请求携带用户终端的终端标识,所述辅助验证请求用于请求所述电子设备根据所述终端标识从所述用户终端上获取用于验证使用权限的语音信息;
第一发送模块33,用于根据所述终端标识向所述用户终端发送获取指令,所述获取指令用于获取用于在所述电子设备上验证使用权限的语音信息;
第一接收模块34,用于接收所述用户终端根据所述获取指令发送的语音信息,所述语音信息是使用所述用户终端的辅助用户在所述用户终端上输入的;
第六获取模块35,用于基于所述语音信息以及第一属性信息识别模型获取属性信息;
开通模块36,用于在所述属性信息为预设属性信息的情况下,为所述目标用户开通电子设备的使用权限。
在一个可选的实现方式中,还包括:
第七输出模块,用于输出第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
第二发送模块,用于向所述用户终端发送第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限,以使所述用户终端输出所述第三提示信息。
在本申请中,如果电子设备非所有者需要使用电子设备,则需要得到所有者的授权,之后非所有者才能使用电子设备。然而如果电子设备的所有者不在电子设备的附近,则可以借助所有者的用户终端来采集所有者的语音信息,然后用户终端再将所有者的语音信息发送给电子设备,电子设备基于该语音信息获取所有者的属性信息,在电子设备在属性信息为预设属性信息的情况下,为目标用户开通电子设备的使用权限。通过本申请,可以实现借助电子设备的所有者的语音来为非所有者开通电子设备的使用权限,从而实现语音验证,以方便电子设备的非所有者使用电子设备。
图13是根据一示例性实施例示出的一种信息处理装置的框图,应用于用户终端,如图13所示,该装置包括:
第二接收模块41,用于当需要为目标用户开通电子设备的使用权限时,接收获取指令,所述获取指令用于获取用于在电子设备上验证身份信息的语音信息;
第八输出模块42,用于根据所述获取指令输出第二提示信息,所述第二提示信息用于提示输入语音信息;
第七获取模块43,用于获取使用所述用户终端的辅助用户根据所述第二提示信息输入的语音信息;
第三发送模块44,用于向所述电子设备发送所述语音信息,以使所述电子设备基于所述语音信息以及第一属性信息识别模型获取属性信息,并在所述属性信息为预设属性信息的情况下,为所述目标用户开通所述电子设备的使用权限。
在一个可选的实现方式中,还包括:
第三接收模块,用于接收所述电子设备发送的第三提示信息,所述第三提示信息用于提示已对所述目标用户开通所述电子设备的使用权限;
第九输出模块,用于输出所述第三提示信息。
在本申请中,如果电子设备非所有者需要使用电子设备,则需要得到所有者的授权,之后非所有者才能使用电子设备。然而如果电子设备的所有者不在电子设备的附近,则可以借助所有者的用户终端来采集所有者的语音信息,然后用户终端再将所有者的语音信息发送给电子设备,电子设备基于该语音信息获取所有者的属性信息,在电子设备在属性信息为预设属性信息的情况下,为目标用户开通电子设备的使用权限。通过本申请,可以实现借助电子设备的所有者的语音来为非所有者开通电子设备的使用权限,从而实现语音验证,以方便电子设备的非所有者使用电子设备。
图14是根据一示例性实施例示出的一种信息处理装置的框图,应用于电子设备,如图14所示,该装置包括:
第八获取模块51,用于获取目标用户的目标语音信息;
提取模块52,用于提取所述目标语音信息的目标语音特征;
第一查找模块53,用于在多个特征模板中查找与所述目标语音特征匹配的目标特征模板;
输入模块54,用于在未查找到所述目标特征模板的情况下,将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,还包括:
第九获取模块,用于获取样本数据集,所述样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
构建模块,用于构建第一属性信息识别模型的网络结构;
训练模块,用于使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,直至所述第一属性信息识别模型中的权重收敛,得到所述第一属性信息识别模型。
在一个可选的实现方式中,所述网络结构包括:
至少一个向量化层、延时神经网络TDNN、平均池化层以及至少一个全连接层以及归一化层;
所述向量化层用于将多个样本语音特征分别转换为特征向量;
所述TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充;
所述平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量;
所述至少一个全连接层用于根据所述池化向量预测所述样本用户的属性信息。
在一个可选的实现方式中,所述样本数据集为多个,不同的样本数据集中的样本语音信息所呈现的语言种类不同;
所述训练模块具体用于:基于不同的样本数据集分别训练适用于不同的语言种类的第一属性信息识别模型。
在一个可选的实现方式中,所述输入模块包括:
第二确定单元,用于确定所述目标语音信息所呈现的目标语言种类;
第一选择单元,用于在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于所述目标语言种类的第一属性信息识别模型;
第一输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述构建模块包括:
第三确定单元,用于确定所述第一属性信息识别模型所应用的至少一个业务场景;
构建单元,用于对于每一个业务场景,构建所述第一属性信息识别模型的适用于所述业务场景的网络结构。
在一个可选的实现方式中,业务场景至少包括:
游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景。
在一个可选的实现方式中,所述输入模块包括:
第四确定单元,用于确定当前所处的业务场景;
第二选择单元,用于在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于所述业务场景的第一属性信息识别模型;
第二输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
在一个可选的实现方式中,所述第九获取模块具体用于:获取所述样本用户上传的所述样本用户的样本属性信息;或者,提取所述样本语音信息的样本语音特征,将所述样本语音特征输入第二属性信息识别模型中,得到所述第二属性信息识别模型输出的所述样本用户的样本属性信息。
在一个可选的实现方式中,所述第一查找模块包括:
第五获取单元,获取所述多个特征模板分别与所述目标语音特征之间的特征相似度;
第五确定单元,用于确定最高的特征相似度是否大于预设阈值;
第六确定单元,用于在最高的相似度大于或等于预设阈值的情况下,在所述多个特征模板中,将与所述目标语音特征之间的特征相似度最高的特征模板确定为所述目标特征模板。
在一个可选的实现方式中,还包括:
第二查找模块,用于在查找到所述目标特征模板的情况下,在用户的特征模板与用户的属性信息之间的对应关系中,查找与所述目标特征模板相对应的属性信息,并作为所述目标属性信息。
在一个可选的实现方式中,还包括:
更新模块,用于在查找到所述目标特征模板的情况下,基于所述目标语音特征对所述目标特征模板进行更新。
在一个可选的实现方式中,还包括:
生成模块,用于在未查找到所述目标特征模板的情况下,基于所述目标语音特征生成目标特征模板;
存储模块,用于将生成的目标特征模板与所述目标属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
在现有技术中,根据用户的历史购买行为数据确定用户的消费偏好,再根据用户的消费偏好向用户推荐商品,然而,如果用户此前未购买过商品,则就不会得到用户的历史购买行为数据,从而也就无法确定出用户的消费偏好,进而无法精准地向用户推荐用户感兴趣的商品,从而导致推荐精准度较低。
而在本申请中,在目标用户与电子设备进行语音交互的过程中,电子设备可以获取目标用户的目标语音信息;提取目标语音信息的目标语音特征;将目标语音特征输入事先训练的第一属性信息识别模型中,得到第一属性信息识别模型输出的目标用户的目标属性信息。
如此,在本申请中,即使用户之前未购买过商品,但电子设备可以实时根据目标用户的目标语音信息以及第一属性信息识别模型确定出目标用户的诸如身份、年龄以及性别等目标属性信息,进而可以根据目标属性信息精准地向目标用户推荐目标用户感兴趣的商业服务信息。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个的对象推荐方法。本申请实施例中,电子设备包括服务器、网关、子设备等,子设备为物联网设备等设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括服务器(集群)、终端设备如IoT设备等电子设备。
图15示意性地示出了可被用于实现本申请中的各个实施例的示例性装置1300。
对于一个实施例,图15示出了示例性装置1300,该装置具有一个或多个处理器1302、被耦合到(一个或多个)处理器1302中的至少一个的控制模块(芯片组)1304、被耦合到控制模块1304的存储器1306、被耦合到控制模块1304的非易失性存储器(NVM)/存储设备1308、被耦合到控制模块1304的一个或多个输入/输出设备1310,以及被耦合到控制模块1306的网络接口1312。
处理器1302可包括一个或多个单核或多核处理器,处理器1302可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1300能够作为本申请实施例中网关或控制器等服务器设备。
在一些实施例中,装置1300可包括具有指令1314的一个或多个计算机可读介质(例如,存储器1306或NVM/存储设备1308)以及与该一个或多个计算机可读介质相合并被配置为执行指令1314以实现模块从而执行本公开中的动作的一个或多个处理器1302。
对于一个实施例,控制模块1304可包括任意适当的接口控制器,以向(一个或多个)处理器1302中的至少一个和/或与控制模块1304通信的任意适当的设备或组件提供任意适当的接口。
控制模块1304可包括存储器控制器模块,以向存储器1306提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1306可被用于例如为装置1300加载和存储数据和/或指令1314。对于一个实施例,存储器1306可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1306可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,控制模块1304可包括一个或多个输入/输出控制器,以向NVM/存储设备1308及(一个或多个)输入/输出设备1310提供接口。
例如,NVM/存储设备1308可被用于存储数据和/或指令1314。NVM/存储设备1308可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1308可包括在物理上作为装置1300被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1308可通过网络经由(一个或多个)输入/输出设备1310进行访问。
(一个或多个)输入/输出设备1310可为装置1300提供接口以与任意其他适当的设备通信,输入/输出设备1310可以包括通信组件、音频组件、传感器组件等。网络接口1312可为装置1300提供接口以通过一个或多个网络通信,装置1300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,装置1300可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1300可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1300包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
本申请实施例提供了一种电子设备,包括:一个或多个处理器;和,其上存储有指令的一个或多个机器可读介质,当由一个或多个处理器执行时,使得处理器执行如本申请实施例中一个或多个的信息处理方法。
其中,电子设备至少包括:智能电视、智能音响、VR眼镜、游戏机、手机以及电脑等,电脑至少包括平板电脑、台式电脑以及笔记本电脑等。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种信息处理方法装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (46)

1.一种信息处理方法,应用于电子设备,包括:
在目标用户在所述电子设备上使用娱乐应用的过程中,输出第一提示信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
在所述目标属性信息为预设属性信息的情况下,设置所述娱乐应用的关闭时刻,并输出第二提示信息。
2.根据权利要求1所述的方法,还包括:
在所述关闭时刻时如果所述预测应用未被关闭,则关闭所述娱乐应用。
3.根据权利要求1所述的方法,所述设置所述娱乐应用的关闭时刻,包括:
根据所述目标属性信息获取适用于所述目标用户的关闭时刻;
将所述娱乐应用的关闭时刻设置为获取到的设置时刻。
4.根据权利要求3所述的方法,所述根据所述目标属性信息获取适用于所述目标用户的关闭时刻,包括:
在属性信息与关闭时刻之间的对应关系中,查找与所述目标属性信息相对应的关闭时刻。
5.根据权利要求1所述的方法,所述设置所述娱乐应用的关闭时刻,包括:
获取所述目标用户使用所述娱乐应用的已持续使用时长;
根据目标属性信息获取适用于所述目标用户的可持续使用时长;
根据所述已持续使用时长和所述可持续使用时长获取所述目标用户使用所述娱乐应用的剩余使用时长;
根据所述电子设备的当前时刻与所述剩余使用时长确定所述关闭时刻;
将所述娱乐应用的关闭时刻设置为确定出的设置时刻。
6.根据权利要求5所述的方法,所述根据目标属性信息获取适用于所述目标用户的可持续使用时长,包括:
在属性信息与可持续使用时长之间的对应关系中,查找与所述目标属性信息相对应的可持续使用时长。
7.根据权利要求1所述的方法,还包括:
获取所述电子设备将在所述关闭时刻时关闭所述娱乐应用的原因;
输出所述原因。
8.根据权利要求1所述的方法,其特征在于,所述电子设备至少包括:智能电视、智能音响、虚拟现实VR眼镜、游戏机、手机以及电脑。
9.一种信息处理方法,应用于电子设备,包括:
在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
在所述目标属性信息为预设属性信息的情况下,拒绝为所述目标用户分配所述娱乐应用的用户账号。
10.根据权利要求9所述的方法,还包括:
获取所述电子设备拒绝为所述目标用户分配所述娱乐应用的用户账号的原因;
输出所述原因。
11.一种信息处理方法,应用于电子设备,包括:
当需要为目标用户开通电子设备的使用权限时,输出第一提示信息;
获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的辅助验证请求,所述辅助验证请求携带用户终端的终端标识;
根据所述终端标识向所述用户终端发送获取指令;
接收所述用户终端根据所述获取指令发送的语音信息,所述语音信息是使用所述用户终端的辅助用户在所述用户终端上输入的;
基于所述语音信息以及第一属性信息识别模型获取属性信息;
在所述属性信息为预设属性信息的情况下,为所述目标用户开通电子设备的使用权限。
12.根据权利要求11所述的方法,还包括:
输出第三提示信息。
13.根据权利要求11所述的方法,还包括:
向所述用户终端发送第三提示信息。
14.一种信息处理方法,应用于用户终端,包括:
当需要为目标用户开通电子设备的使用权限时,接收获取指令;
根据所述获取指令输出第二提示信息;
获取使用所述用户终端的辅助用户根据所述第二提示信息输入的语音信息;
向所述电子设备发送所述语音信息。
15.根据权利要求14所述的方法,还包括:
接收所述电子设备发送的第三提示信息;
输出所述第三提示信息。
16.一种信息处理方法,包括:
获取目标用户的目标语音信息;
提取所述目标语音信息的目标语音特征;
在多个特征模板中查找与所述目标语音特征匹配的目标特征模板;
在未查找到所述目标特征模板的情况下,将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息。
17.根据权利要求16所述的方法,所述第一属性信息识别模型的训练方式包括:
获取样本数据集,所述样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
构建第一属性信息识别模型的网络结构;
使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,直至所述第一属性信息识别模型中的权重收敛,得到所述第一属性信息识别模型。
18.根据权利要求17所述的方法,所述网络结构包括:
至少一个向量化层、延时神经网络TDNN、平均池化层以及至少一个全连接层以及归一化层;
所述向量化层用于将多个样本语音特征分别转换为特征向量;
所述TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充;
所述平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量;
所述至少一个全连接层用于根据所述池化向量预测所述样本用户的属性信息。
19.根据权利要求17所述的方法,所述样本数据集为多个,不同的样本数据集中的样本语音信息所呈现的语言种类不同;
所述使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,包括:
基于不同的样本数据集分别训练适用于不同的语言种类的第一属性信息识别模型。
20.根据权利要求19所述的方法,所述将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息,包括:
确定所述目标语音信息所呈现的目标语言种类;
在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于所述目标语言种类的第一属性信息识别模型;
所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
21.根据权利要求18所述的方法,所述构建第一属性信息识别模型的网络结构,包括:
确定所述第一属性信息识别模型所应用的至少一个业务场景;
对于每一个业务场景,构建所述第一属性信息识别模型的适用于所述业务场景的网络结构。
22.根据权利要求21所述的方法,业务场景至少包括:
游戏场景、直播场景、短视频场景、场视频场景、博客场景以及购物场景。
23.根据权利要求21所述的方法,所述将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息,包括:
确定当前所处的业务场景;
在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于所述业务场景的第一属性信息识别模型;
所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
24.根据权利要求17所述的方法,所述样本用户的样本属性信息的获取方式,包括:
获取所述样本用户上传的所述样本用户的样本属性信息;
或者,
提取所述样本语音信息的样本语音特征,将所述样本语音特征输入第二属性信息识别模型中,得到所述第二属性信息识别模型输出的所述样本用户的样本属性信息。
25.根据权利要求16所述的方法,所述在多个特征模板中查找与所述目标语音特征匹配的目标特征模板,包括:
获取所述多个特征模板分别与所述目标语音特征之间的特征相似度;
确定最高的特征相似度是否大于预设阈值;
在最高的相似度大于或等于预设阈值的情况下,在所述多个特征模板中,将与所述目标语音特征之间的特征相似度最高的特征模板确定为所述目标特征模板。
26.根据权利要求16所述的方法,还包括:
在查找到所述目标特征模板的情况下,在用户的特征模板与用户的属性信息之间的对应关系中,查找与所述目标特征模板相对应的属性信息,并作为所述目标属性信息。
27.根据权利要求16所述的方法,所述方法还包括:
在查找到所述目标特征模板的情况下,基于所述目标语音特征对所述目标特征模板进行更新。
28.根据权利要求16所述的方法,还包括:
在未查找到所述目标特征模板的情况下,基于所述目标语音特征生成目标特征模板;
将生成的目标特征模板与所述目标属性信息存储在用户的特征模板与用户的属性信息之间的对应关系中。
29.一种信息处理装置,应用于电子设备,包括:
第一输出模块,用于在目标用户在所述电子设备上使用娱乐应用的过程中,输出第一提示信息;
第一获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第一确定模块,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
设置模块,用于在所述目标属性信息为预设属性信息的情况下,设置所述娱乐应用的关闭时刻;
第二输出模块,用于输出第二提示信息。
30.一种信息处理装置,应用于电子设备,包括:
第四输出模块,用于在目标用户在电子设备注册娱乐应用的用户账号的过程中,输出第一提示信息;
第三获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的目标语音信息;
第二确定模块,用于基于目标语音信息以及第一属性信息识别模型确定所述目标用户的目标属性信息;
拒绝模块,用于在所述目标属性信息为预设属性信息的情况下,拒绝为所述目标用户分配所述娱乐应用的用户账号。
31.一种信息处理装置,应用于电子设备,包括:
第六输出模块,用于当需要为目标用户开通电子设备的使用权限时,输出第一提示信息;
第五获取模块,用于获取使用所述娱乐应用的目标用户根据所述第一提示信息输入的辅助验证请求,所述辅助验证请求携带用户终端的终端标识;
第一发送模块,用于根据所述终端标识向所述用户终端发送获取指令;
第一接收模块,用于接收所述用户终端根据所述获取指令发送的语音信息,所述语音信息是使用所述用户终端的辅助用户在所述用户终端上输入的;
第六获取模块,用于基于所述语音信息以及第一属性信息识别模型获取属性信息;
开通模块,用于在所述属性信息为预设属性信息的情况下,为所述目标用户开通电子设备的使用权限。
32.一种信息处理装置,应用于用户终端,包括:
第二接收模块,用于当需要为目标用户开通电子设备的使用权限时,接收获取指令;
第八输出模块,用于根据所述获取指令输出第二提示信息;
第七获取模块,用于获取使用所述用户终端的辅助用户根据所述第二提示信息输入的语音信息;
第三发送模块,用于向所述电子设备发送所述语音信息。
33.一种信息处理装置,包括:
第八获取模块,用于获取目标用户的目标语音信息;
提取模块,用于提取所述目标语音信息的目标语音特征;
第一查找模块,用于在多个特征模板中查找与所述目标语音特征匹配的目标特征模板;
输入模块,用于在未查找到所述目标特征模板的情况下,将所述目标语音特征输入第一属性信息识别模型中,得到所述第一属性信息识别模型输出的所述目标用户的目标属性信息。
34.根据权利要求33所述的装置,还包括:
第九获取模块,用于获取样本数据集,所述样本数据集包括:多个样本用户的样本语音信息的样本语音特征以及样本用户的标注样本属性信息;
构建模块,用于构建第一属性信息识别模型的网络结构;
训练模块,用于使用所述样本数据集对第一属性信息识别模型的网络参数进行训练,直至所述第一属性信息识别模型中的权重收敛,得到所述第一属性信息识别模型。
35.根据权利要求34所述的装置,所述网络结构包括:
至少一个向量化层、延时神经网络TDNN、平均池化层以及至少一个全连接层以及归一化层;
所述向量化层用于将多个样本语音特征分别转换为特征向量;
所述TDNN用于基于多个向量中相邻的至少两个向量之间的关系对多个向量分别进行特征补充;
所述平均池化层用于对特征补充完毕的多个向量进行平均池化,得到池化向量;
所述至少一个全连接层用于根据所述池化向量预测所述样本用户的属性信息。
36.根据权利要求34所述的装置,所述样本数据集为多个,不同的样本数据集中的样本语音信息所呈现的语言种类不同;
所述训练模块具体用于:基于不同的样本数据集分别训练适用于不同的语言种类的第一属性信息识别模型。
37.根据权利要求36所述的装置,所述输入模块包括:
第二确定单元,用于确定所述目标语音信息所呈现的目标语言种类;
第一选择单元,用于在分别适用于不同的语言种类的第一属性信息识别模型中,选择适用于所述目标语言种类的第一属性信息识别模型;
第一输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
38.根据权利要求35所述的装置,所述构建模块包括:
第三确定单元,用于确定所述第一属性信息识别模型所应用的至少一个业务场景;
构建单元,用于对于每一个业务场景,构建所述第一属性信息识别模型的适用于所述业务场景的网络结构。
39.根据权利要求38所述的装置,所述输入模块包括:
第四确定单元,用于确定当前所处的业务场景;
第二选择单元,用于在分别适用于不同的业务场景的第一属性信息识别模型中,选择适用于所述业务场景的第一属性信息识别模型;
第二输入单元,用于所述将所述目标语音特征输入选择的第一属性信息识别模型中,得到选择的第一属性信息识别模型输出的所述目标用户的目标属性信息。
40.根据权利要求34所述的装置,所述第九获取模块具体用于:获取所述样本用户上传的所述样本用户的样本属性信息;或者,提取所述样本语音信息的样本语音特征,将所述样本语音特征输入第二属性信息识别模型中,得到所述第二属性信息识别模型输出的所述样本用户的样本属性信息。
41.一种智能音箱,包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-8、9-10、11-13以及16-28中一个或多个所述的信息处理方法。
42.一种智能电视,包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-8、9-10、11-13以及16-28中一个或多个所述的信息处理方法。
43.一种游戏机,包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-8、9-10、11-13以及16-28中一个或多个所述的信息处理方法。
44.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-8、9-10、11-13以及16-28中一个或多个所述的信息处理方法。
45.一种用户终端,包括:
处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求14-15中一个或多个所述的信息处理方法。
46.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求14-15中一个或多个所述的信息处理方法。
CN202010019661.4A 2020-01-08 2020-01-08 一种信息处理方法及装置 Pending CN113177816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010019661.4A CN113177816A (zh) 2020-01-08 2020-01-08 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010019661.4A CN113177816A (zh) 2020-01-08 2020-01-08 一种信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN113177816A true CN113177816A (zh) 2021-07-27

Family

ID=76921415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010019661.4A Pending CN113177816A (zh) 2020-01-08 2020-01-08 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN113177816A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114707076A (zh) * 2022-03-11 2022-07-05 重庆邮电大学 一种个性化物联网实体推荐方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6161091A (en) * 1997-03-18 2000-12-12 Kabushiki Kaisha Toshiba Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
CN105740686A (zh) * 2016-01-28 2016-07-06 百度在线网络技术(北京)有限公司 应用的控制方法和装置
CN105760720A (zh) * 2016-02-23 2016-07-13 北京奇虎科技有限公司 应用程序的解锁方法及解锁装置
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
CN107731234A (zh) * 2017-09-06 2018-02-23 阿里巴巴集团控股有限公司 一种身份验证的方法及装置
CN107993071A (zh) * 2017-11-21 2018-05-04 平安科技(深圳)有限公司 电子装置、基于声纹的身份验证方法及存储介质
CN108172230A (zh) * 2018-01-03 2018-06-15 平安科技(深圳)有限公司 基于声纹识别模型的声纹注册方法、终端装置及存储介质
CN108600559A (zh) * 2018-07-20 2018-09-28 Oppo广东移动通信有限公司 静音模式的控制方法、装置、存储介质及电子设备
CN108632294A (zh) * 2018-05-17 2018-10-09 东莞市华睿电子科技有限公司 一种控制终端使用的方法
CN109346059A (zh) * 2018-12-20 2019-02-15 广东小天才科技有限公司 一种方言语音的识别方法及电子设备
CN109670286A (zh) * 2018-11-28 2019-04-23 歌尔股份有限公司 一种应用控制方法和装置
CN109947984A (zh) * 2019-02-28 2019-06-28 北京奇艺世纪科技有限公司 一种针对儿童的内容推送方法及推送装置
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN110164415A (zh) * 2019-04-29 2019-08-23 腾讯科技(深圳)有限公司 一种基于语音识别的推荐方法、装置及介质
CN110634491A (zh) * 2019-10-23 2019-12-31 大连东软信息学院 语音信号中针对通用语音任务的串联特征提取系统及方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6161091A (en) * 1997-03-18 2000-12-12 Kabushiki Kaisha Toshiba Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
CN105740686A (zh) * 2016-01-28 2016-07-06 百度在线网络技术(北京)有限公司 应用的控制方法和装置
CN105760720A (zh) * 2016-02-23 2016-07-13 北京奇虎科技有限公司 应用程序的解锁方法及解锁装置
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
CN107731234A (zh) * 2017-09-06 2018-02-23 阿里巴巴集团控股有限公司 一种身份验证的方法及装置
CN107993071A (zh) * 2017-11-21 2018-05-04 平安科技(深圳)有限公司 电子装置、基于声纹的身份验证方法及存储介质
CN108172230A (zh) * 2018-01-03 2018-06-15 平安科技(深圳)有限公司 基于声纹识别模型的声纹注册方法、终端装置及存储介质
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108632294A (zh) * 2018-05-17 2018-10-09 东莞市华睿电子科技有限公司 一种控制终端使用的方法
CN108600559A (zh) * 2018-07-20 2018-09-28 Oppo广东移动通信有限公司 静音模式的控制方法、装置、存储介质及电子设备
CN109670286A (zh) * 2018-11-28 2019-04-23 歌尔股份有限公司 一种应用控制方法和装置
CN109346059A (zh) * 2018-12-20 2019-02-15 广东小天才科技有限公司 一种方言语音的识别方法及电子设备
CN109947984A (zh) * 2019-02-28 2019-06-28 北京奇艺世纪科技有限公司 一种针对儿童的内容推送方法及推送装置
CN110164415A (zh) * 2019-04-29 2019-08-23 腾讯科技(深圳)有限公司 一种基于语音识别的推荐方法、装置及介质
CN110634491A (zh) * 2019-10-23 2019-12-31 大连东软信息学院 语音信号中针对通用语音任务的串联特征提取系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《年度文化产业案例选粹》编写组编: "《文化产业案例选粹》", 31 October 2013, 暨南大学出版社, pages: 177 *
苗晓晓等: "应用于短时语音语种识别的时长扩展方法", 《清华大学学报(自然科学版)》, no. 03, pages 32 - 37 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114707076A (zh) * 2022-03-11 2022-07-05 重庆邮电大学 一种个性化物联网实体推荐方法

Similar Documents

Publication Publication Date Title
CN107886949B (zh) 一种内容推荐方法及装置
CN107978311B (zh) 一种语音数据处理方法、装置以及语音交互设备
US11568876B2 (en) Method and device for user registration, and electronic device
CN110100447B (zh) 信息处理方法及装置、多媒体设备及存储介质
CN109643549B (zh) 基于说话者识别的语音识别方法和装置
US11238870B2 (en) Interaction method, electronic device, and server
CN108958810A (zh) 一种基于声纹的用户识别方法、装置及设备
US20140350933A1 (en) Voice recognition apparatus and control method thereof
JP6785904B2 (ja) 情報プッシュ方法及び装置
KR20170001550A (ko) 인공 지능에 기초한 인간-컴퓨터 지능형 채팅 방법 및 장치
CN107580237A (zh) 电视的操作方法、装置、系统和存储介质
US20180108358A1 (en) Voice Categorisation
JP2015517709A (ja) コンテキストに基づくメディアを適応配信するシステム
CN110727868A (zh) 对象推荐方法、装置和计算机可读存储介质
CN111199729B (zh) 声纹识别方法及装置
CN114267345B (zh) 模型训练方法、语音处理方法及其装置
WO2019101099A1 (zh) 视频节目识别方法、设备、终端、系统和存储介质
CN113314119A (zh) 语音识别智能家居控制方法及装置
CN110659387A (zh) 用于提供视频的方法和设备
CN113177816A (zh) 一种信息处理方法及装置
KR20200095947A (ko) 전자 장치 및 이의 제어 방법
CN113393834B (zh) 一种控制方法及装置
CN112750448B (zh) 声音场景的识别方法、装置、设备及存储介质
WO2021139589A1 (zh) 一种语音处理方法、介质及系统
CN114970494A (zh) 一种评论生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination