CN112423063A - 一种智能电视自动设置方法、装置及存储介质 - Google Patents

一种智能电视自动设置方法、装置及存储介质 Download PDF

Info

Publication number
CN112423063A
CN112423063A CN202011215044.8A CN202011215044A CN112423063A CN 112423063 A CN112423063 A CN 112423063A CN 202011215044 A CN202011215044 A CN 202011215044A CN 112423063 A CN112423063 A CN 112423063A
Authority
CN
China
Prior art keywords
setting
identity
information
voice
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011215044.8A
Other languages
English (en)
Inventor
王云华
余冠融
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202011215044.8A priority Critical patent/CN112423063A/zh
Publication of CN112423063A publication Critical patent/CN112423063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种智能电视自动设置方法,包括:获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征;根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识;获取设置存储器中与身份标识对应的设置信息;基于设置信息进行设置。解决了现有技术中的智能电视不区分用户身份,针对不同用户群体实行相同系统设置,导致用户体验差的技术问题,达到了智能区分不同用户,根据不同用户群体的不同需求个性设置,提升用户体验的技术效果。

Description

一种智能电视自动设置方法、装置及存储介质
技术领域
本发明涉及智能电视自动设置技术领域,尤其涉及一种智能电视自动设置方法、装置及存储介质。
背景技术
同一台智能电视中的应用、主题等一旦设定好就无法随时改变,针对不同用户是通用的,即使有一些个性化元素,无法满足不同家庭成员对智能电视的不同需求。而用户家庭往往由老中青三代人组成,不同年龄身份的用户对智能电视需求不同,千篇一律的服务会影响用户的体验。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种智能电视自动设置方法,旨在解决现有技术中智能电视无法区分观众类型,对不同类型的观众设置同一种参数造成用户体验差的技术问题。
为实现上述目的,本发明提供一种智能电视自动设置方法,所述方法包括:
获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征;
根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识;
获取设置存储器中与所述身份标识对应的设置信息;
基于所述设置信息进行设置。
优选地,所述获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征,包括:
对所述语音控制信息进行分帧处理得到至少两帧控制语音;
基于特征参数,对所述至少两帧控制语音进行特征提取,每帧所述控制语音提取到一条控制声纹特征,生成至少两条控制声纹特征。
优选地,所述根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识之前,还包括:
获取初始语音信息,根据所述初始语音信息生成至少两条初始声纹特征;
将所述至少两条初始声纹特征输入概率计算模型,得到所述至少两条初始声纹特征对应的至少两个后验概率值;
基于预设规则对所述至少两个后验概率值进行分类筛选处理,得到所述初始语音信息的身份标识;
将所述身份标识存储于所述身份存储器中。
优选地,所述根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识,包括:
将所述至少两条控制声纹特征与所述至少两条初始声纹特征进行匹配;
将匹配度最高的所述初始声纹特征对应的身份标识,确定为与所述语音控制信息匹配的身份标识。
优选地,所述基于预设规则对所述至少两个后验概率值进行分类筛选处理,得到所述初始语音信息的身份标识,还包括:
对所述至少两个后验概率值进行独热编码,每个所述后验概率值得到一个独热值,得到至少两个独热值;
将所述至少两个独热值中具有相同独热值的所述初始声纹特征标记为相同的类型标识;
根据所述类型标识和所述预设规则确定所述初始语音信息的身份标识。
优选地,所述获取设置存储器中与所述身份标识对应的设置信息之前,还包括:
基于所述身份标识生成与之对应的设置权限;
获取所述设置权限下的所述设置信息;
将所述设置信息存储于所述设置存储器中。
所述获取所述设置权限下不同设置类型对应的所述设置信息,包括:
获取所述身份标识具有所述设置权限的设置类型;
对所述语音控制信息进行语音识别得到期待设置信息;
判断所述期待设置信息是否属于具有所述设置权限的所述设置类型;若是,则
将所述期待设置信息保存为设置信息。
此外,为实现上述目的,本发明还提供了一种智能电视自动设置装置,所述装置包括:
第一获取单元,用于获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征;
匹配单元,用于根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识;
第二获取单元,用于获取设置存储器中与所述身份标识对应的设置信息;
执行单元,用于基于所述设置信息进行设置。
优选地,所述第一获取单元,包括:
所述第一获取单元,还用于对所述语音控制信息进行分帧处理得到至少两帧控制语音;
所述第一获取单元,还用于基于特征参数,对所述至少两帧控制语音进行特征提取,每帧所述控制语音提取到一条控制声纹特征,生成至少两条控制声纹特征。
优选地,所述匹配单元,还包括:
所述匹配单元,还用于获取初始语音信息,根据所述初始语音信息生成至少两条初始声纹特征;
所述匹配单元,还用于将所述至少两条初始声纹特征输入概率计算模型,得到所述至少两条初始声纹特征对应的至少两个后验概率值;
所述匹配单元,还用于基于预设规则对所述至少两个后验概率值进行分类筛选处理,得到所述初始语音信息的身份标识;
所述匹配单元,还用于将所述身份标识存储于所述身份存储器中。
优选地,所述匹配单元,还包括:
所述匹配单元,还用于将所述至少两条控制声纹特征与所述至少两条初始声纹特征进行匹配;
所述匹配单元,还用于将匹配度最高的所述初始声纹特征对应的身份标识,确定为与所述语音控制信息匹配的身份标识。
优选地,所述匹配单元,还包括:
所述匹配单元,还用于对所述至少两个后验概率值进行独热编码,每个所述后验概率值得到一个独热值,得到至少两个独热值;
所述匹配单元,还用于将所述至少两个独热值中具有相同独热值的所述初始声纹特征标记为相同的类型标识;
所述匹配单元,还用于根据所述类型标识和所述预设规则确定所述初始语音信息的身份标识。
优选地,所述执行单元,还包括:
所述执行单元,还用于基于所述身份标识生成与之对应的设置权限;
所述执行单元,还用于获取所述设置权限下的所述设置信息;
所述执行单元,还用于将所述设置信息存储于所述设置存储器中。
优选地,所述执行单元,还包括:
所述执行单元,还用于获取所述身份标识具有所述设置权限的设置类型;
所述执行单元,还用于对所述语音控制信息进行语音识别得到期待设置信息;
所述执行单元,还用于判断所述期待设置信息是否属于所述设置类型;若是,则
所述执行单元,还用于将所述期待设置信息保存为设置信息。
此外,为实现上述目的,本发明还提供一种智能电视自动设置装置,所述装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的智能电视自动设置程序,所述智能电视自动设置程序被所述处理器执行时实现上文所述的智能电视自动设置方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有智能电视自动设置程序,所述智能电视自动设置程序被处理器执行时实现上文所述的智能电视自动设置方法的步骤。
本发明实施例提供了一种智能电视自动设置方法,包括:获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征;根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识;获取设置存储器中与身份标识对应的设置信息;基于设置信息进行设置。智能电视在开启时即获取当前用户产生的语音控制信息,通过对语音控制信息进行特征提取得到反映当前用户身份信息的控制声纹特征,并与实现存储的身份标识对应的语音控制信息进行匹配,确认当前用户的身份,确认之后获取存储器中与身份标识对应的设置信息并执行,完成自动设置,根据不同身份的用户进行不同设置,将智能电视的不同用户区分开来,针对性的展示设置信息,解决了现有技术中的智能电视不区分用户身份,针对不同用户群体实行相同系统设置,导致用户体验差的技术问题,达到了智能区分不同用户,根据不同用户群体的不同需求个性设置,提升用户体验的技术效果。
附图说明
图1为本发明智能电视自动设置方法一实施例的流程示意图;
图2为本发明智能电视自动设置方法另一实施例的流程示意图;
图3为本发明智能电视自动设置方法又一实施例的流程示意图;
图4为本发明实施例方案涉及的智能电视的结构示意图;
图5为本发明实施例方案涉及的智能电视的另一结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明智能电视自动设置方法一实施例的流程示意图。
在本实施例中,提供了智能电视自动设置方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,智能电视自动设置方法包括:
步骤S101、获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征。
本申请实施例中的智能电视中集成了声音采集装置,例如麦克风。智能电视在开机之后开始检测是否有语音控制信息输入,如果检测到有语音控制信息输入,则获取该语音控制信息。其中,智能电视也可以是在需要时才检测是否有语音控制信息输入,比如在智能电视接收到需要设置信息命令的时候。智能电视也可以将检测程序一直在后台运行,持续检测是否有语音控制信息输入。由于不同用户的语音控制信息具有不同的特点,在接收到语音控制信息后,智能电视对语音控制信息进行特征提取得到至少两条控制声纹特征,控制声纹特征可以反映不同用户的语音控制信息的特点,以此实现对用户身份信息的识别。
步骤S102、根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识。
本申请实施例中设置了身份存储器,身份存储器中存储有预先设置的不同声纹特征以及与之对应的身份标识,其中存在至少一对声纹特征和与之对应的身份标识。智能电视根据语音控制信息进行特征提取得到的至少两条控制声纹特征中,至少有一条最能反映输入语音控制信息的当前用户的特点,智能电视得到最能反映当前用户特点的控制声纹特征之后,将其与身份存储器中保存的至少一对声纹特征和与之对应的身份标识进行匹配,得到与当前用户的控制声纹特征吻合的身份标识,以确定当前用户的身份。需要说明的是,如果身份存储器中不存在任何声纹特征和与之对应的身份标识,则说明智能电视刚出厂开机或者是刚清除了身份存储器中的所有信息,则智能电视提示当前用户是否录入声纹信息并跳转至步骤S105。但是,在身份存储器中存在至少一对声纹特征和与之对应的身份标识时,确未能获取到与语音控制信息匹配的身份标识,则说明当前用户企图进行非法设置,则智能电视终止执行后续步骤。
步骤S103、获取设置存储器中与身份标识对应的设置信息。
本申请实施例中还设置了设置存储器,设置存储器中存储有预先设置的不同身份标识以及与之对应的设置信息,其中存在至少一对身份标识和与之对应的设置信息。设置信息表征用户对智能电视的个性化设置,其中,设置信息包括设置类型和设置参数,不同设置类型具有不同的设置参数,而不同身份标识对应的设置信息几乎不同,也有较小的可能相同。设置信息按照其功能包括系统类、应用类和主题类等设置类型,智能电视根据不同类型的设置信息实现系统安全、视听娱乐和个性化界面等用户需求的元素设置。需要说明的是,如果设置存储器中不存在任何设置信息,则说明智能电视刚出厂开机或者是刚清除了设置存储器中的所有信息,则智能电视提示当前用户是否输入设置信息并跳转至步骤S105。
步骤S104、基于设置信息进行设置。
智能电视成功获取到与所述语音控制信息对应的设置信息后,读取设置信息中包含的设置类型和设置参数,根据设置类型和设置参数自动执行设置操作。
本发明实施例提供了一种智能电视自动设置方法,包括:获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征;根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识;获取设置存储器中与身份标识对应的设置信息;基于设置信息进行设置。智能电视在开启时即获取当前用户产生的语音控制信息,通过对语音控制信息进行特征提取得到反映当前用户身份信息的控制声纹特征,并与实现存储的身份标识对应的语音控制信息进行匹配,确认当前用户的身份,确认之后获取存储器中与身份标识对应的设置信息并执行,完成自动设置,根据不同身份的用户进行不同设置,将智能电视的不同用户区分开来,针对性的展示设置信息,解决了现有技术中的智能电视不区分用户身份,针对不同用户群体实行相同系统设置,导致用户体验差的技术问题,达到了智能区分不同用户,根据不同用户群体的不同需求个性设置,提升用户体验的技术效果。
进一步地,参照图2,步骤S101包括:
S1011、对语音控制信息进行分帧处理得到至少两帧控制语音。
由于声纹特征具有特定性,而且具有相对稳定的特点,利用声纹特征可以辨别语音控制信息发出者的身份。本申请实施例中智能电视在获取到语音控制信息后,需要对语音控制信息进行分帧处理得到至少两帧控制语音,进行分帧处理的目的是消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等等因素,对语音信号质量的影响。另一方面,语音信号具有时变特性,但是在一个短时间范围内其特性基本保持不变即相对稳定,因此需要对语音控制信息进行分帧处理。分帧处理得到的每一帧语音都对应于一个频谱,频谱反映了频率与能量的关系,表征不同分类的人群具有的语音特点。
S1012、基于特征参数,对所述至少两帧控制语音进行特征提取,每帧所述控制语音提取到一条控制声纹特征,生成至少两条控制声纹特征。
智能电视对控制语音的特征参数可以为梅尔频率倒谱系数(Mel FrequencyCepstrum Coefficient,MFCC)。可直接提取注册语音信号的特征参数MFCC,由于MFCC在提取过程中会自动进行分帧,并处理得到每一帧对应的MFCC,从而获得注册语音信号中每一帧所对应的帧声纹特征。
进一步地,在步骤S102之前,参照图3,还包括:
S105、获取初始语音信息,根据初始语音信息生成至少两条初始声纹特征。
智能电视根据当前用户的至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识之前,智能电视需要获取初始语音信息进行注册,得到初始声纹特征和与之对应的身份标识。
在智能电视首次开机后,或者刚清除了身份存储器中的所有身份标识信息、声纹特征等,需要获取初始语音信息进行注册。
其中,在智能电视获取初始语音信息之前,智能电视中还设置了预设文本,在用户启动注册程序时,智能电视显示预设文本,之后再获取用户发出的初始语音信息。设置预设文本的目的是,引导用户注册,使用户尽量按照预设文本朗读产生初始语音信息,因为在后续步骤中,对有预设文本的语音进行验证的准确率要大大高于对任意语音进行验证的准确率。其中,智能电视还可以设置预设时长,例如,提示用户在5秒内读出“小T请开启电视”,然后获取接下来5秒内的语音信息作为初始语音信息。设置预设时长的目的是避免用户产生的初始语音信息时长过短而造成后续的验证失败,为验证增加难度,同时还可以通过与对比云端同时长或同时段的样本数据,更加准确实现对初始语音信息的特征提取以及身份判断。
在获取到初始语音信息后,智能电视同样对初始语音信息进行分帧处理得到至少两帧初始语音,再根据至少两帧初始语音和特征参数生成至少两条初始声纹特征。
S106、将至少两条初始声纹特征输入概率计算模型,根据至少两条初始声纹特征的频率、振幅和间隔时长,得到至少两条初始声纹特征对应的至少两个后验概率值。
本申请实施例中,概率计算模型用于根据初始声纹特征的频率、振幅和间隔时长来判断每一帧初始声纹特征的特点。例如,男性的嗓音比较粗,频率比较低,女性嗓音比较尖锐,频率和振幅较大;中年人的嗓音较为低沉和平稳,频率比较低且间隔时长比较均匀,小孩的嗓音比较尖锐,且语气比较跳跃,频率较高且间隔时长比较跳跃。智能电视通过将各帧初始语音对应的初始声纹特征与云端保存的样本语音对应的声纹特征进行对比,或者根据常见的规律对初始声纹特征的频率、振幅和间隔时长进行分析,判断当前用户的每一帧初始声纹特征可能属于某种类型的嗓音。这种可能性用后验概率值来衡量,初始声纹特征与样本语音对应的声纹特征越相似,后验概率值越高,生产初始语音信息的用户属于对应类型嗓音的可能性越大。
S107、基于预设规则对至少两个后验概率值进行分类筛选处理,得到初始语音信息的身份标识。
智能电视根据以上不同嗓音的特点或者样本呈现出的特点,为不同嗓音的群体构建用户画像,用来代表这一类用户群体的身份,例如:男性、女性;儿童、青年、中年、老年等等。同时,智能电视中设置了预设规则来对至少两个后验概率值进行分类筛选,由于初始语音信息被分帧处理后,得到的初始声纹特征至少在两条以上,产生初始语音信息的用户可能就会对应出多个不同类型的嗓音,因此,需要确定出一个最为相似的嗓音来代表该用户身份。预设规则可以是,在至少两个后验概率值中选取数值最大的一个或(相同的)多个作为代表该用户身份;也可以是,设置一个概率区间,一个概率区间对应一种类型的嗓音,统计有最多数量的后验概率值落入的某一概率区间即为代表该用户的嗓音,根据以上对用户群体的划分(也可以是其他划分方式、例如根据常用词汇来划分用户为学生、工人等等),最终得到产生该初始语音信息的用户的身份标识,例如:男性青年。
S108、将身份标识存储于身份存储器中。
智能电视在得到产生该初始语音信息的用户对应的身份标识之后,对该初始语音信息的初始声纹特征和身份标识进行保存。智能电视可以在身份存储器中开辟存储单元来保存身份标识,可以以键值对的形式同时保存初始声纹特征和身份标识。也可以将身份标识保存在身份存储器中,以映射的方式,将身份标识与初始声纹特征进行映射。例如,男性中年的声音标识为1,保存在身份存储器11中;女性中年标识为2,保存在身份存储器22中;男性儿童标识为3,保存在身份存储器33中。
进一步地,步骤S102还包括:
将至少两条控制声纹特征与至少两条初始声纹特征进行匹配;将匹配度最高的初始声纹特征对应的身份标识,确定为与语音控制信息匹配的身份标识。
智能电视在得到用户的多条控制声纹特征后,将每条控制声纹特征与经过分类筛选的初始声纹特征进行匹配,如果多条控制声纹特征中有大量的控制声纹特征同时与某一初始声纹特征匹配,具有极高的相似度,则可以将匹配度最高的初始声纹特征对应的身份标识确定为用户的身份标识,以此确定发出语音控制信息的用户。其中,也可以将用户的多条控制声纹特征基于后验概率进行分类后,确定出的最能代表用户的一条声纹特征。
进一步地,步骤S107还包括:
对至少两个后验概率值进行独热编码,每个后验概率值得到一个独热值,得到至少两个独热值;将至少两个独热值中具有相同独热值的初始声纹特征标记为相同的类型标识;根据类型标识和预设规则确定初始语音信息的身份标识。
智能电视在得到初始语音信息对应的至少两个后验概率值后,可以先对至少两个后验概率值进行独热编码(One-Hot编码)得到两个独热值,其中,独热值相同的两条初始声纹特征标记为相同的类型标识,标记为相同类型标识的初始声纹特征说明它们的特征相同,属于同一类型的嗓音。预设规则可以是,在至少两个后验概率值中选取数值最大的一个或(相同的)多个作为代表该用户身份;也可以是,设置一个概率区间,一个概率区间对应一种类型的嗓音,统计有最多数量的后验概率值落入的某一概率区间即为代表该用户的嗓音。需要说明的是,One-Hot编码能够处理非连续型数值特征,是利用0和1表示一些参数,又称为一位有效编码,主要是采用位状态寄存器来对个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。
进一步地,在步骤S102之前,还包括:
S1091、基于身份标识生成与之对应的设置权限。
智能电视在获取设置存储器中与身份标识对应的设置信息之前,还预先生成了与不同身份标识对应的设置权限,以及不同设置类型和与之对应的设置信息。设置权限包括:完全权限、限制权限和禁止权限等;设置类型包括:系统设置、应用设置和个性化设置等等。
不同的身份标识具有不同的设置权限,限制权限对应的身份标识不被允许进行部分类型的设置,禁止权限最为严格,几乎不被不被允许进行所有类型的设置。
用户在出厂开机或者是刚清除了身份存储器中的设置信息时,需要对基于当前身份标识进行设置,此时智能电视先获取当前身份标识的设置权限,在权限范围内,输入不同设置类型的设置信息。例如,凡是儿童身份标识的当前用户对于系统设置都是限制权限,避免孩子胡乱设置而影响智能电视的稳定性和安全性;又如儿童身份标识的当前用户对于应用设置都是禁止权限,避免孩子在游戏应用中做出不当的设置,或者在视听应用中设置不当的音视频推送等等。
S1092、获取设置权限下的设置信息。
智能电视在接收到当前身份标识的用户的设置信息后,对设置信息进行存储,智能电视可以在设置存储器中开辟存储单元来保存设置信息,可以以键值对的形式同时保存身份标识和设置信息。也可以将设置信息保存在设置存储器中,以映射的方式,将身份标识与设置信息进行映射。需要说明的是,存储时还可以包括与设置信息对应设置类型。
S1093、将设置信息存储于设置存储器中。
其中,可以以上下级存储器的方式对设置信息进行存储,例如,男性中年的声音标识为1,保存在身份存储器11中。系统设置、应用设置和个性化设置的设置类型分别为1、2、3,则系统设置、应用设置和个性化设置对应的设置信息分别保存至设置存储器111、112、113中。系统监测到用户发出开启智能电视的语音控制信息指令后,系统分别打开身份存储器中的声音信息进行匹配,匹配成功则打开对应的下一级设置存储器(如与11匹配成功则打开111、112、113),按照设置存储器中的设置信息对智能电视进行自动设置。
进一步地,步骤S1092还包括:获取身份标识具有设置权限的设置类型;对语音控制信息进行语音识别得到期待设置信息;判断期待设置信息是否属于具有所述设置权限的设置类型;若是,则将期待设置信息保存为设置信息。
智能电视在获取到当前用户的身份标识之后,会获取该身份标识所拥有的设置权限下,可以有权进行设置的设置类型,例如应用种类的设置,排列顺序的设置,息屏影像、欢迎影像、壁纸、节目关注等的设置,可以对不同设置类型设定不同设置类型标识,如:壁纸“Wall=1”,欢迎影像“Welcome=4”,节目关注“Favorite=5”,字体大小“Size=3”等,这些设置类型可以在智能电视获取身份标识之前预设在电视中。当用户发出语音控制信息后,智能电视会对语音控制信息进行语音识别,识别其中包含的期待设置信息,可以通过识别语音控制信息的内容,通过其中的关键字确定期待设置信息,例如,用户发出“换一个壁纸”,智能电视可以通过“换”、“壁纸”这样的关键字确定设置类型为壁纸类。然后,智能电视判断用户发出的期待设置信息是否属于具有设置权限的设置类型,如果拥有设置权限,则将期待设置信息保存为设置信息。如果没有权限,智能电视可以进行权限不足的提醒。
本发明实施例提供了一种智能电视自动设置方法,包括:获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征;根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识;获取设置存储器中与身份标识对应的设置信息;基于设置信息进行设置。智能电视在开启时即获取当前用户产生的语音控制信息,通过对语音控制信息进行特征提取得到反映当前用户身份信息的控制声纹特征,并与实现存储的身份标识对应的语音控制信息进行匹配,确认当前用户的身份,确认之后获取存储器中与身份标识对应的设置信息并执行,完成自动设置,根据不同身份的用户进行不同设置,将智能电视的不同用户区分开来,针对性的展示设置信息,解决了现有技术中的智能电视不区分用户身份,针对不同用户群体实行相同系统设置,导致用户体验差的技术问题,达到了智能区分不同用户,根据不同用户群体的不同需求个性设置,提升用户体验的技术效果。
在本申请的一些实施例中,还提供了一种智能电视自动设置装置2,如图4所示,包括:
第一获取单元21,用于获取语音控制信息,对语音控制信息进行特征提取得到至少两条控制声纹特征;
匹配单元22,用于根据至少两条控制声纹特征获取身份存储器中与语音控制信息匹配的身份标识;
第二获取单元23,用于获取设置存储器中与身份标识对应的设置信息;
执行单元24,用于基于设置信息进行设置。
优选地,第一获取单元21,包括:
第一获取单元21,还用于对语音控制信息进行分帧处理得到至少两帧控制语音;
第一获取单元21,还用于根基于特征参数,对所述至少两帧控制语音进行特征提取,每帧所述控制语音提取到一条控制声纹特征,生成至少两条控制声纹特征。
优选地,匹配单元22,还包括:
匹配单元22,还用于获取初始语音信息,根据初始语音信息生成至少两条初始声纹特征;
匹配单元22,还用于将至少两条初始声纹特征输入概率计算模型,根据至少两条初始声纹特征的频率、振幅和间隔时长,得到至少两条初始声纹特征对应的至少两个后验概率值;
匹配单元22,还用于基于预设规则对至少两个后验概率值进行分类筛选处理,得到初始语音信息的身份标识;
匹配单元22,还用于将身份标识存储于身份存储器中。
优选地,匹配单元22,还包括:
匹配单元22,还用于将所述至少两条控制声纹特征与所述至少两条初始声纹特征进行匹配;
匹配单元22,还用于将匹配度最高的所述初始声纹特征对应的身份标识,确定为与所述语音控制信息匹配的身份标识
优选地,匹配单元22,还包括:
匹配单元22,还用于对所述至少两个后验概率值进行独热编码,每个所述后验概率值得到一个独热值,得到至少两个独热值;
匹配单元22,还用于将所述至少两个独热值中具有相同独热值的所述初始声纹特征标记为相同的类型标识;
匹配单元22,还用于根据类型标识和预设规则确定初始语音信息的身份标识。
优选地,执行单元24,还包括:
执行单元24,还用于基于身份标识生成与之对应的设置权限;
执行单元24,还用于获取设置权限下不同设置类型对应的设置信息;
执行单元24,还用于将设置信息存储于设置存储器中。
优选地,执行单元24,还包括:
执行单元24,还用于获取所述身份标识具有所述设置权限的设置类型;
执行单元24,还用于对所述语音控制信息进行语音识别得到期待设置信息;
执行单元24,还用于判断所述期待设置信息是否属于所述设置类型;若是,则
执行单元24,还用于将所述期待设置信息保存为设置信息。
本申请实施例还提供了一种智能电视3,如图5所示,包括:
存储器301,用于存储可执行指令;
处理器302,用于执行所述存储器301中存储的可执行指令时,实现本申请实施例提供的任一种智能电视自动设置方法。
本申请实施例还提供了一种计算机可读存储介质,包括:存储有可执行指令,用于引起处理器301执行时,实现本申请实施例提供的任一种智能电视自动设置方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种智能电视自动设置方法,其特征在于,所述方法包括:
获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征;
根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识;
获取设置存储器中与所述身份标识对应的设置信息;
基于所述设置信息进行设置。
2.根据权利要求1所述的方法,其特征在于,所述获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征,包括:
对所述语音控制信息进行分帧处理得到至少两帧控制语音;
基于特征参数,对所述至少两帧控制语音进行特征提取,每帧所述控制语音提取到一条控制声纹特征,生成至少两条控制声纹特征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识之前,还包括:
获取初始语音信息,根据所述初始语音信息生成至少两条初始声纹特征;
将所述至少两条初始声纹特征输入概率计算模型,得到所述至少两条初始声纹特征对应的至少两个后验概率值;
基于预设规则对所述至少两个后验概率值进行分类筛选处理,得到所述初始语音信息的身份标识;
将所述身份标识存储于所述身份存储器中。
4.根据权利要求3所述的方法,其特征在于,所述根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识,包括:
将所述至少两条控制声纹特征与所述至少两条初始声纹特征进行匹配;
将匹配度最高的所述初始声纹特征对应的身份标识,确定为与所述语音控制信息匹配的身份标识。
5.根据权利要求3所述的方法,其特征在于,所述基于预设规则对所述至少两个后验概率值进行分类筛选处理,得到所述初始语音信息的身份标识,还包括:
对所述至少两个后验概率值进行独热编码,每个所述后验概率值得到一个独热值,得到至少两个独热值;
将所述至少两个独热值中具有相同独热值的所述初始声纹特征标记为相同的类型标识;
根据所述类型标识和所述预设规则确定所述初始语音信息的身份标识。
6.根据权利要求3所述的方法,其特征在于,所述获取设置存储器中与所述身份标识对应的设置信息之前,还包括:
基于所述身份标识生成与之对应的设置权限;
获取所述设置权限下的所述设置信息;
将所述设置信息存储于所述设置存储器中。
7.根据权利要求6所述的方法,其特征在于,所述获取所述设置权限下不同设置类型对应的所述设置信息,包括:
获取所述身份标识具有所述设置权限的设置类型;
对所述语音控制信息进行语音识别得到期待设置信息;
判断所述期待设置信息是否属于具有所述设置权限的所述设置类型;若是,则
将所述期待设置信息保存为设置信息。
8.一种智能电视自动设置装置,其特征在于,所述装置包括:
第一获取单元,用于获取语音控制信息,对所述语音控制信息进行特征提取得到至少两条控制声纹特征;
匹配单元,用于根据所述至少两条控制声纹特征获取身份存储器中与所述语音控制信息匹配的身份标识;
第二获取单元,用于获取设置存储器中与所述身份标识对应的设置信息;
执行单元,用于基于所述设置信息进行设置。
9.一种智能电视,其特征在于,所述智能电视自动设置装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的智能电视自动设置程序,所述智能电视自动设置程序被所述处理器执行时实现如权利要求1至7中任一项所述的智能电视自动设置方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有智能电视自动设置程序,所述智能电视自动设置程序被处理器执行时实现如权利要求1至7中任一项所述的智能电视自动设置方法的步骤。
CN202011215044.8A 2020-11-03 2020-11-03 一种智能电视自动设置方法、装置及存储介质 Pending CN112423063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011215044.8A CN112423063A (zh) 2020-11-03 2020-11-03 一种智能电视自动设置方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011215044.8A CN112423063A (zh) 2020-11-03 2020-11-03 一种智能电视自动设置方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN112423063A true CN112423063A (zh) 2021-02-26

Family

ID=74827507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011215044.8A Pending CN112423063A (zh) 2020-11-03 2020-11-03 一种智能电视自动设置方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112423063A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017162053A1 (zh) * 2016-03-21 2017-09-28 中兴通讯股份有限公司 一种身份认证的方法和装置
CN107580237A (zh) * 2017-09-05 2018-01-12 深圳Tcl新技术有限公司 电视的操作方法、装置、系统和存储介质
CN108288470A (zh) * 2017-01-10 2018-07-17 富士通株式会社 基于声纹的身份验证方法和装置
US20180288116A1 (en) * 2017-04-04 2018-10-04 Roku, Inc. Interaction-Based User Identification
CN108737872A (zh) * 2018-06-08 2018-11-02 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备
US20190362724A1 (en) * 2017-06-30 2019-11-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for voiceprint creation and registration
US20200020341A1 (en) * 2017-10-26 2020-01-16 Shenzhen Skyworth-Rgb Electronic Co., Ltd. Voice interaction method, voice interaction control device, and storage medium for television
WO2020135241A1 (zh) * 2018-12-29 2020-07-02 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN111553754A (zh) * 2020-07-10 2020-08-18 支付宝(杭州)信息技术有限公司 行为预测系统的更新方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017162053A1 (zh) * 2016-03-21 2017-09-28 中兴通讯股份有限公司 一种身份认证的方法和装置
CN108288470A (zh) * 2017-01-10 2018-07-17 富士通株式会社 基于声纹的身份验证方法和装置
US20180288116A1 (en) * 2017-04-04 2018-10-04 Roku, Inc. Interaction-Based User Identification
US20190362724A1 (en) * 2017-06-30 2019-11-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for voiceprint creation and registration
CN107580237A (zh) * 2017-09-05 2018-01-12 深圳Tcl新技术有限公司 电视的操作方法、装置、系统和存储介质
US20200020341A1 (en) * 2017-10-26 2020-01-16 Shenzhen Skyworth-Rgb Electronic Co., Ltd. Voice interaction method, voice interaction control device, and storage medium for television
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备
CN108737872A (zh) * 2018-06-08 2018-11-02 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
WO2020135241A1 (zh) * 2018-12-29 2020-07-02 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN111553754A (zh) * 2020-07-10 2020-08-18 支付宝(杭州)信息技术有限公司 行为预测系统的更新方法及装置

Similar Documents

Publication Publication Date Title
CN108075892B (zh) 一种语音处理的方法、装置和设备
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
CN107464568B (zh) 基于三维卷积神经网络文本无关的说话人识别方法及系统
KR101908711B1 (ko) 인공 지능을 기반으로 하는 성문 로그인 방법 및 장치
CN109766759A (zh) 情绪识别方法及相关产品
CN107958669B (zh) 一种声纹识别的方法及装置
KR20160098771A (ko) 음성 기능 운용 방법 및 이를 지원하는 전자 장치
KR20170028628A (ko) 음성인식장치, 음성인식장치의 구동방법 및 컴퓨터 판독가능 기록매체
CN111611568A (zh) 一种人脸声纹复核终端及其身份认证方法
CN111863033B (zh) 音频质量识别模型的训练方法、装置、服务器和存储介质
WO2021007856A1 (zh) 一种身份验证方法、终端设备、存储介质
CN110956965A (zh) 一种基于声纹识别的个性化智能家居安全控制系统及方法
CN105117238A (zh) 一种用于智能设备的系统定制方法以及装置
CN112153397B (zh) 视频处理方法、装置、服务器及存储介质
CN109920435A (zh) 一种声纹识别方法及声纹识别装置
CN104217718A (zh) 依据环境参数及群体趋向数据的语音识别方法和系统
CN106531148A (zh) 一种基于语音合成的漫画配音方法和装置
CN110827853A (zh) 语音特征信息提取方法、终端及可读存储介质
KR102334018B1 (ko) 자가 증식된 비윤리 텍스트의 유효성 검증 장치 및 방법
CN114708869A (zh) 语音交互方法、装置及电器
US20140163986A1 (en) Voice-based captcha method and apparatus
CN112423063A (zh) 一种智能电视自动设置方法、装置及存储介质
CN115331670B (zh) 一种家用电器用离线语音遥控器
CN115376522B (zh) 空调器的声纹控制方法、空调器及可读存储介质
CN113763920B (zh) 空调器及其语音生成方法、语音生成装置和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210226

RJ01 Rejection of invention patent application after publication