CN109036395A - 个性化的音箱控制方法、系统、智能音箱及存储介质 - Google Patents
个性化的音箱控制方法、系统、智能音箱及存储介质 Download PDFInfo
- Publication number
- CN109036395A CN109036395A CN201810666916.9A CN201810666916A CN109036395A CN 109036395 A CN109036395 A CN 109036395A CN 201810666916 A CN201810666916 A CN 201810666916A CN 109036395 A CN109036395 A CN 109036395A
- Authority
- CN
- China
- Prior art keywords
- user
- parameter
- feature
- instruction
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000001755 vocal effect Effects 0.000 claims abstract description 86
- 238000000605 extraction Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 15
- 230000036541 health Effects 0.000 description 16
- 239000000284 extract Substances 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 241000208340 Araliaceae Species 0.000 description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- 235000008434 ginseng Nutrition 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003862 health status Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000036316 preload Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种个性化的音箱控制方法、系统、智能音箱及存储介质,所述方法包括:获取用户语音指令;根据用户声纹特征识别所述语音指令,获取用户的特征信息;根据所述用户特征信息为用户匹配一个推荐参数;将所述推荐参数与预执行参数进行对比,得到对比结果;根据所述对比结果进行特定输出。本发明通过在获取用户语音指令时对用户语音指令进行声纹识别,获取用户的特征信息,并匹配推荐参数与预执行参数进行对比,根据所述对比结果进行与用户特征信息相适应的输出进行输出,在增加语音识别的精准度前提下,可以实现个性化的输出。
Description
技术领域
本发明涉及智能语音设备领域,尤其涉及一种个性化的音箱控制方法、系统、智能音箱及存储介质。
背景技术
随着社会与科学技术的高速发展,人机交互技术发展成为一门重要技术,应用于智能机器人及智能手机等智能设备的人机交互,现有智能音箱大多通过应用软件进行控制,很少有语音识别控制,而且智能音箱音量在进行播放时参数是否合适,对于智能音箱而言,用户则需要靠近智能音箱或者需要通过远程设备调节智能音箱的参数,调节的方式过于单调,且无法知道输出的参数是否为合适用户的参数。
发明内容
本发明的目的是针对上述现有技术存在的缺陷,提供一种个性化的音箱控制方法、系统、智能音箱及存储介质。
本发明采用的技术方案是,首先提供一种个性化的音箱控制方法,所述方法包括:
获取用户语音指令;
根据用户声纹特征识别所述语音指令,获取用户的特征信息及用户语音指令的语义信息;
根据所述用户特征信息为用户匹配一个推荐参数;
根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果;
根据所述对比结果与用户特征信息进行一个映射输出。
优选的,所述根据用户声纹特征识别所述语音指令,获取用户特征信息及用户语音指令的语义信息包括:
提取所述语音指令中的特征词,获取包括特定语义的特征词;
通过语义识别识别所述特征词,获取所述语音指令的特征语义;
提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;
通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。
声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。借助声纹特征,可使语音识别平台更容易捕捉用户的语音波段,从而提高语音识别的精度。通过声纹特征可以提高对用户的年龄情况及性别的识别精度。
优选的,所述根据所述用户特征信息为用户匹配一个推荐参数包括:
根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;
根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数。
不同年龄的用户对于声音的感知能力不同,通常情况下,人对高频声音的感知会随年龄的增长而下降,因此配置推荐参数表可以为用户提供一个推荐参数作用参考,方便用户的使用。
优选的,所述根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果包括:
检测所述音箱的运行情况,获取所述音箱的正在执行的执行参数;
根据语音指令中的特征语义对执行参数进行预处理,获取预执行参数;
对比所述预执行参数与所述推荐参数,判断所述预执行参数是否符合所述推荐参数。
通过对比所述预执行参数与所述推荐参数,从而可以提醒用户其语音指令是否为适合用户当前年龄所述能接受的程度。
优选的,所述根据所述对比结果与用户特征信息进行一个映射输出包括:
根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;
将对比结果映射到输出指令表中,匹配输出指令。
用户根据自己的需要在所述指令表中添加特定输出指令,可以满足用户的个性化需求。
其次,还提供一种个性化的音箱控制系统,所述系统包括:
输入模块,用于获取用户语音指令;
识别获取模块,用于根据用户声纹特征识别所述语音指令,获取用户的特征信息;
匹配模块,用于根据所述用户特征信息为用户匹配一个推荐参数;
对比模块,用于根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果;
输出模块,用于根据所述对比结果与用户特征信息进行一个映射输出。
优选的,所述识别获取模块包括:
语义提取子模块,用于提取所述语音指令中的特征词,获取包括特定语义的特征词;
语义识别子模块,用于通过语义识别识别所述特征词,获取所述语音指令的特征语义;
声纹提取子模块,用于提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;
声纹识别子模块,用于通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。
通过语义提取子模块将特征词提取出来,只需要对特征词进行识别并赋予指令,增加了语音识别的精确度。所述声纹提取子模块,提取特定的声纹波段做为特征声纹进行识别,降低了声纹识别的难度。
优选的,所述匹配模块包括:
存储子模块,用于根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;还用于根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;
匹配子模块,用于根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数;还用于将对比结果映射到输出指令表中,匹配输出指令。
所述推荐参数表做为一个对照表,其中的推荐参数作为所述预执行参数的对比对象。
另外,还提供一种智能音箱,所述智能音箱包括处理器及存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如前述任一项所述的个性化的音箱控制方法。
最后,还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如前述任一项所述的个性化的音箱控制方法。
与现有技术相比,本发明至少具有以下有益效果:本发明通过在获取用户语音指令时对用户语音指令进行声纹识别,获取用户的特征信息,并匹配推荐参数与预执行参数进行对比,根据所述对比结果进行与用户特征信息相适应的输出进行输出,在增加语音识别的精准度前提下,可以实现个性化的输出。
附图说明
图1为本发明实施例的控制方法流程图;
图2为本发明实施例的语义识别方法流程图;
图3为本发明实施例的声纹识别方法流程图;
图4为本发明实施例的匹配推荐参数方法流程图;
图5为本发明实施例的对比方法流程图;
图6为本发明实施例的匹配输出指令流程图;
图7为本发明实施例的系统模块图。
具体实施方式
下面结合附图和实施例对本发明做进一步说明。
如图1所示,本发明首先提出了一种个性化的音箱控制方法,所述方法的实施环境包括:终端,所述终端为内置有音频采集装置、音频播放装置和音频识别系统的智能设备,包括但不限于是智能音箱、智能手机、平板电脑、智能机器人等。本发明优选的实施智能设备为智能音箱,所述智能音箱内置有语音采集装置,音频播放装置和语音识别系统。
所述方法包括:
11、用户语音输入,获取用户语音指令;通过内置在所述终端中的麦克风对用户语音进行采集,采集到的语音信号被转化为电流模拟信号。
12、语音特征识别,根据用户声纹特征识别所述语音指令,获取用户的特征信息及用户语音指令的语义信息;
进一步的,将采集到的电流模拟信号通过语图仪制作为声纹图,优选为宽带声纹图,宽带声纹图是用带宽为300HZ的带通滤波器分析出来的声纹。宽带声纹图是显示语声的频率与强度随时间推移的变化特征;在宽带声纹图中对共振峰进行分析。所述用户特征信息可以是用户的年龄、性别或者是用户个性化的自定义信息;
声纹图的横坐标为时间,纵坐标为频率,浓淡表示音强(见附图)。每一字的声纹前部(乱纹)是清辅音的频谱,后部是元音频谱;元音频谱中由加强的纵线条构成的水平方向的黑带为共振峰。共振峰的数量、走向及其频率是声纹分析的重要特征。
13、匹配推荐参数,根据所述用户特征信息为用户匹配一个推荐参数;在识别出用户特征信息后,通过终端内的处理芯片为用户匹配推荐参数;所述推荐参数的意义在于,为用户提供参考,同时,减少用户对终端的调节操作。
进一步的,所述终端的存储器中配置有推荐参数表,所述推荐参数表为根据用户年龄或性别等特征进行配置,比如,根据年龄特征进行配置的所述推荐参数表中设置有10-60岁的对应推荐参数,获取到的用户特征信息为用户为56岁用户,则在所述推荐参数表中匹配56岁用户的推荐参数;对于年龄范围外的用户在所述推荐参数表中做归集处理,即对于不在10-60岁范围的用户,小于10岁的用户归于一个集合,或归于10岁的集合中,大于60岁的用户归于另一个集合,或归于60岁的集合中。
14、对比判断,根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果;所述预执行参数为所述终端正在执行的参数预加载用户指令后形成的,也就是说,终端接受用户的语音指令后,将语音指令识别为一个可执行的指令,通过处理芯片的模拟计算,将这个可执行的指令加载到正在执行的参数上,得到一个模拟执行参数,也就是预执行参数。所述预执行参数为用户发出语音指令后,所述终端将要执行的参数,与推荐参数进行对比得到三种结果,其一为所述推荐参数与所述预执行参数一致,其二为所述预执行参数低于所述推荐参数,最后为所述预执行参数高于所述推荐参数。
15、输出结果,根据所述对比结果与用户特征信息进行一个映射输出。
进一步的,根据不同的特征配置不同的输出结果表,所述输出结果表中每个特征值所对应的输出结果应包括对三种对比结果的输出,比如用户为45岁中年人时,若其预执行参数低于45岁推荐参数,输出“当前音量过低,影响体验”的结果;若其预执行参数高于45岁推荐参数,输出“当前音量较高,注意休息的人”的结果;若其预执行参数与45岁推荐参数相同,输出“祝您愉快”的结果;用户为23岁青年人时,若其预执行参数低于23岁推荐参数,输出“当前音量过低,可以更嗨点”的结果;若其预执行参数高于23岁推荐参数,输出“当前音量较高,年轻人要低调”的结果;若其预执行参数与23岁推荐参数相同,输出“就是这个调调”的结果;当然,上述举例的输出结果用户是可以通过交互面板进行编辑调整的。
做为一种实施例,所述进行映射输出之前,可以先检测环境特征,结合环境特征再进行输出,所述环境特征包括:环境的温度、湿度及时间等,比如检测到环境温度较低时,可以在输出结果中加上“当前温度较低,怀疑到了南极,注意身体”;比如检测到时间太晚时,可以在输出结果中加上“夜黑风高,注意休息”;等等。
做为一种可能的实施例,所述智能音箱可以通过网络接驳用户的健康系统,对用户的健康状况进行一个判断,从而结合用户的健康状况进行映射输出。需要说明的是,所述健康系统可以是用户在医院的个人存档信息。结合用户的健康状况再进行输出,比如从智能音箱从所述健康系统中获取到用户身体不好的信息,可以在输出结果中加上“医生要你注意休息”。
当然,所述健康系统也可以是设置在所述智能音箱内,通过用户自行添加用户健康状况,为了获取更客观的健康信息,所述健康系统对于用户健康状况的添加,可以设置医生认证,以保证用户健康信息的可信度。
另外,所述健康系统内的用户健康状况可以根据用户最近一次在医院的个人存档信息进行更新。为了保证用户健康状况的有效性,所述智能音箱在检测到健康系统长时间没有进行更新,可以发出健康检查提醒。
如图2-3所示,在本发明实施例中,所述根据用户声纹特征识别所述语音指令,获取用户特征信息包括:
21、语义提取,提取所述语音指令中的特征词,获取包括特定语义的特征词;进一步的,通过语义提取将包含有特定语义的特征词提取出来,所述特征词应该包含指令词,所述特定语义的指令词可以被识别为所述终端将要执行的指令,提取出特定语义的指令词可以使语义识别的难度降低。
22、语义识别,通过语义识别识别所述特征词,获取所述语音指令的特征语义;所述特征语义即为所述终端将要执行的指令。
23、声纹提取,提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;进一步的,对特征声纹进行提取,获取包括用户特定信息的特征声纹,所述用户特定信息主要包括用户语音指令中的包含有共振峰的频段,减少对其他声纹频段的分析,可以更快的得到分析结果。
特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。与语音识别不同,声纹识别的特征必须是“个性化”特征,而说话人识别的特征对说话人来讲必须是“共性特征”。虽然目前大部分声纹识别系统用的都是声学层面的特征,但是表征一个人特点的特征应该是多层面的,包括:(1)与人类的发音机制的解剖学结构有关的声学特征(如频谱、倒频谱、共振峰、基音、反射系数等等)、鼻音、带深呼吸音、沙哑音、笑声等;(2)受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等;(3)个人特点或受父母影响的韵律、节奏、速度、语调、音量等特征。从利用数学方法可以建模的角度出发,声纹自动识别模型目前可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道);等等。
24、声纹识别,通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。通过声纹图对特征声纹进行分析,分析出用户的年龄、性别等特征。
声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。借助声纹特征,可使语音识别平台更容易捕捉用户的语音波段,从而提高语音识别的精度。通过声纹特征进行识别可以提高对用户的年龄情况及性别的识别精度。
如图4所示,在本发明实施例中,所述根据所述用户特征信息为用户匹配一个推荐参数包括:
31、配置推荐参数表,根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;在本发明实施例中,所述终端为智能音箱,主要是通过用户的听觉感知能力进行信息的传递,而在各个年龄表现出不同的听觉感知能力,因此,以年龄做为信息的特征值在本发明实施例中是个不错的选择。
32、匹配推荐参数,根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数。
进一步的,所述终端的存储器中配置有推荐参数表,所述推荐参数表为根据用户年龄特征进行配置,根据识别到的用户的年龄特征映射到的推荐参数表中进行匹配。
不同年龄的用户对于声音的感知能力不同,通常情况下,人对高频声音的感知会随年龄的增长而下降,因此配置推荐参数表可以为用户提供一个推荐参数作用参考,方便用户的使用。
做为一种可能的实施例,为了提高在语音识别中对年龄判断的精准度,可以在所述声纹库中为不同用户的声纹特征分别配置一时间轴,并根据所述时间轴对所述声纹库中的用户声纹特征进行更新或添加。具体的,在每一次的语音指令输入后,记录下时间,并将此次语音指令中的声纹特征写入声纹库的时间轴中,以达到对所述声纹库的实时更新。当然,为了减少声纹库的存储量,可以选择定时将声纹特征写入声纹库的时间轴中。为了进一步的减少声纹库的存储量,降低所述声纹库的存储压力,可以将时间轴上的用户声纹特征进行纵向对比,剔除部分相近的声纹特征,剔除时间较久的声纹特征。
进一步的,在剔除所述声纹库中的声纹特征时,还可以在一定的时间段内,根据声纹特征的频段相似度进行比对,选择声纹特征较为稳定的频段进行保留。
如图5所示,在本发明实施例中,根据所述用户语音指令的语义信息获取一个预执行参数,所述将所述推荐参数与预执行参数进行对比,得到对比结果包括:
41、获取执行参数,检测所述音箱的运行情况,获取所述音箱的正在执行的执行参数;
进一步的,通过音箱内置有检测器检测所述音箱的运行情况,所述执行参数为所述音箱正在使用的参数,当然,所述音箱在非运行状态时,给定所述执行参数为最初值,所述音箱在最大功率运行时,给定所述执行参数为最高值,所述推荐参数表的设置在所述最初值与所述最高值的区间内。
42、获取预执行参数,根据语音指令中的特征语义对执行参数进行预处理,获取预执行参数;
进一步的,所述预处理为:获取执行参数与要执行的指令后,通过处理芯片的模拟计算,将这个可执行的指令加载到正在执行的参数上,得到一个模拟执行参数,也就是说,所述预执行参数是一个将要执行而未执行的参数,是一个还未发出的指令。
43、对比判断,对比所述预执行参数与所述推荐参数,判断所述预执行参数是否符合所述推荐参数。具体的,所述预执行参数为用户发出语音指令后,所述终端将要执行的参数,与推荐参数进行对比得到三种结果,其一为所述推荐参数与所述预执行参数一致,其二为所述预执行参数低于所述推荐参数,最后为所述预执行参数高于所述推荐参数。
通过对比所述预执行参数与所述推荐参数,从而可以提醒用户其语音指令导向的结果是否为适合用户当前年龄所述能接受的程度。
如图6所示,在本发明实施例中,根据所述对比结果与用户特征信息进行一个映射输出包括:
51、配置输出指令表,根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;
所述根据所述对比结果与用户特征信息进行一个映射输出进一步的包括,根据不同的特征配置不同的输出结果表,所述输出结果表中每个特征值所对应的输出结果应包括对三种对比结果的输出,更进一步包括,根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令。
52、匹配输出指令,将对比结果映射到输出指令表中,匹配输出指令。
进一步的,所述输出结果表与所述输出指令表间设置一映射表,通过所述映射表,将所述输出结果表中的输出结果映射为输出指令表中成为一个可被执行的指令。
用户根据自己的需要在所述指令表中添加特定输出指令,可以满足用户的个性化需求。
其次,如图7所示,还提供一种个性化的音箱控制系统,所述系统搭载于一智能终端,所述终端为内置有音频采集装置、音频播放装置和音频识别系统的智能设备,包括但不限于是智能音箱、智能手机、平板电脑、智能机器人等。本发明优选的实施智能设备为智能音箱,所述智能音箱内置有语音采集装置,音频播放装置和语音识别系统。
所述系统包括:
输入模块61,用于获取用户语音指令;所述输入模块61可以是内置麦克风,通过内置在所述终端中的麦克风对用户语音进行采集,采集到的语音信号被转化为电流模拟信号。
识别获取模块62,用于根据用户声纹特征识别所述语音指令,获取用户的特征信息及用户语音指令的语义信息;所述识别获取模块62可以是内置语音识别装置和声纹识别装置。
进一步的,所述识别获取模块62将所述输入模块61采集到的电流模拟信号通过语图仪制作为声纹图,优选为宽带声纹图,宽带声纹图是用带宽为300HZ的带通滤波器分析出来的声纹。宽带声纹图是显示语声的频率与强度随时间推移的变化特征;在宽带声纹图中对共振峰进行分析。所述用户特征信息可以是用户的年龄、性别或者是用户个性化的自定义信息;
匹配模块63,用于根据所述用户特征信息为用户匹配一个推荐参数;所述匹配模块63可以是内置在终端的处理芯片,在识别出用户特征信息后,通过终端内的处理芯片为用户匹配推荐参数;所述推荐参数的意义在于,为用户提供参考,同时,减少用户对终端的调节操作。
进一步的,所述终端的存储器中配置有推荐参数表,所述推荐参数表为根据用户年龄或性别等特征进行配置。
对比模块64,用于根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果;所述对比模块64可以是内置在终端的处理芯片,所述预执行参数为所述终端正在执行的参数预加载用户指令后形成的,也就是说,终端接受用户的语音指令后,将语音指令识别为一个可执行的指令,通过处理芯片的模拟计算,将这个可执行的指令加载到正在执行的参数上,得到一个模拟执行参数,也就是预执行参数。所述预执行参数为用户发出语音指令后,所述终端将要执行的参数,与推荐参数进行对比得到三种结果,其一为所述推荐参数与所述预执行参数一致,其二为所述预执行参数低于所述推荐参数,最后为所述预执行参数高于所述推荐参数。
输出模块65,用于根据所述对比结果与用户特征信息进行一个映射输出。进一步的,终端内置在存储中将不同的特征配置为不同的输出结果表,所述输出结果表中每个特征值所对应的输出结果应包括对三种对比结果的输出。
做为一种实施例,本系统还包括一环境检测模块,所述环境检测模块在所述特定输出之前,用于检测环境特征,结合环境特征再进行输出,所述环境特征包括:环境的温度、湿度及时间等,比如检测到环境温度较低时,使所述输出模块65输出结果如“当前温度较低,怀疑到了南极,注意身体”;比如检测到时间太晚时,可以使所述输出模块65输出结果如“夜黑风高,注意休息”;等等。
优选的,所述识别获取模块62包括:
语义提取子模块,用于提取所述语音指令中的特征词,获取包括特定语义的特征词;通过所述语义提取子模块提取将包含有特定语义的特征词提取出来,所述特征词应该包含指令词,所述特定语义的指令词可以被识别为所述终端将要执行的指令,提取出特定语义的指令词可以使语义识别的难度降低。
语义识别子模块,用于通过语义识别识别所述特征词,获取所述语音指令的特征语义;通过所述语义识别子模块将所述特征语义识别为所述终端将要执行的指令。
声纹提取子模块,用于提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;通过所述声纹提取子模块对特征声纹进行提取,获取包括用户特定信息的特征声纹,所述用户特定信息主要包括用户语音指令中的包含有共振峰的频段,减少对其他声纹频段的分析,可以更快的得到分析结果。
声纹识别子模块,用于通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。通过所述声纹识别子模块对特征声纹进行分析,分析出用户的年龄、性别等特征。
所述严格语义提取子模块将特征词提取出来,只需要对特征词进行识别并赋予指令,增加了语音识别的精确度。所述声纹提取子模块,提取特定的声纹波段做为特征声纹进行识别,降低了声纹识别的难度。
优选的,所述匹配模块63包括:
存储子模块,用于根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;还用于根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;所述存储子模块为终端内置的存储器,所述终端的存储器中配置有推荐参数表,所述推荐参数表为根据用户年龄特征进行配置,根据识别到的用户的年龄特征映射到的推荐参数表中进行匹配。
匹配子模块,用于根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数;还用于将对比结果映射到输出指令表中,匹配输出指令。
所述用于根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数;还用于将对比结果映射到输出指令表中,匹配输出指令进一步的包括,根据不同的特征配置不同的输出结果表,所述输出结果表中每个特征值所对应的输出结果应包括对三种对比结果的输出,更进一步包括,根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令。再进一步的,所述输出结果表与所述输出指令表间设置一映射表,通过所述映射表,将所述输出结果表中的输出结果映射为输出指令表中成为一个可被执行的指令。
所述推荐参数表做为一个对照表,其中的推荐参数作为所述预执行参数的对比对象。
另外,还提供一种智能音箱,所述智能音箱包括处理器及存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如前述任一项所述的个性化的音箱控制方法。
最后,还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如前述任一项所述的个性化的音箱控制方法。
上述实施例仅用于说明本发明的具体实施方式。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和变化,这些变形和变化都应属于本发明的保护范围。
Claims (10)
1.一种个性化的音箱控制方法,所述音箱为智能音箱,其特征在于,所述方法包括:
智能音箱获取用户语音指令;
根据用户声纹特征识别所述语音指令,获取用户的特征信息及用户语音指令的语义信息;
根据所述用户特征信息为用户匹配一个推荐参数;
根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果;
根据所述对比结果与用户特征信息进行一个映射输出。
2.如权利要求1所述的个性化的音箱控制方法,其特征在于,所述根据用户声纹特征识别所述语音指令,获取用户特征信息包括及用户语音指令的语义信息:
提取所述语音指令中的特征词,获取包括特定语义的特征词;
通过语义识别识别所述特征词,获取所述语音指令的特征语义;
提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;
通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。
3.如权利要求1或2所述的个性化的音箱控制方法,其特征在于,所述根据所述用户特征信息为用户匹配一个推荐参数包括:
根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;
根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数。
4.如权利要求1或2所述的个性化的音箱控制方法,其特征在于,所述根据所述用户语音指令的语义信息获取一个预执行参数,将所述推荐参数与预执行参数进行对比,得到对比结果包括:
检测所述音箱的运行情况,获取所述音箱的正在执行的执行参数;
根据语音指令中的特征语义对执行参数进行预处理,获取预执行参数;
对比所述预执行参数与所述推荐参数,判断所述预执行参数是否符合所述推荐参数。
5.如权利要求1所述的个性化的音箱控制方法,其特征在于,所述根据所述对比结果与用户特征信息进行一个映射输出包括:
根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;
将对比结果映射到输出指令表中,匹配输出指令。
6.一种个性化的音箱控制系统,其特征在于,包括:
输入模块,用于获取用户语音指令;
识别获取模块,用于根据用户声纹特征识别所述语音指令,获取用户的特征信息及用户语音指令的语义信息;
匹配模块,用于根据所述用户特征信息为用户匹配一个推荐参数;
对比模块,用于将所述推荐参数与预执行参数进行对比,得到对比结果;
输出模块,用于根据所述对比结果与用户特征信息进行一个映射输出。
7.如权利要求6所述的个性化的音箱控制系统,其特征在于,所述识别获取模块包括:
语义提取子模块,用于提取所述语音指令中的特征词,获取包括特定语义的特征词;
语义识别子模块,用于通过语义识别识别所述特征词,获取所述语音指令的特征语义;
声纹提取子模块,用于提取所述语音指令中的特征声纹,获取包括用户特定信息的特征声纹;
声纹识别子模块,用于通过声纹识别识别所述特征声纹,获取用户的年龄特征和性别特征。
8.如权利要求6或7所述的个性化的音箱控制方法,其特征在于,所述匹配模块包括:
存储子模块,用于根据不同的年龄特征配置的推荐参数表,所述推荐参数表中预设多个推荐参数;还用于根据多种对比结果配置输出指令表,所述指令表可被用户添加特定输出指令;
匹配子模块,用于根据用户的年龄特征为用户匹配一个所述推荐参数表中的推荐参数;还用于将对比结果映射到输出指令表中,匹配输出指令。
9.一种智能音箱,其特征在于,所述智能音箱包括处理器及存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至5中任一项所述的个性化的音箱控制方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至5中任一项所述的个性化的音箱控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810666916.9A CN109036395A (zh) | 2018-06-25 | 2018-06-25 | 个性化的音箱控制方法、系统、智能音箱及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810666916.9A CN109036395A (zh) | 2018-06-25 | 2018-06-25 | 个性化的音箱控制方法、系统、智能音箱及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109036395A true CN109036395A (zh) | 2018-12-18 |
Family
ID=64610476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810666916.9A Pending CN109036395A (zh) | 2018-06-25 | 2018-06-25 | 个性化的音箱控制方法、系统、智能音箱及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109036395A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110149618A (zh) * | 2019-05-09 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 基于声纹授权的智能设备接入方法、装置、设备及介质 |
CN110310657A (zh) * | 2019-07-10 | 2019-10-08 | 北京猎户星空科技有限公司 | 一种音频数据处理方法及装置 |
CN110336723A (zh) * | 2019-07-23 | 2019-10-15 | 珠海格力电器股份有限公司 | 智能家电的控制方法及装置、智能家电设备 |
CN111435596A (zh) * | 2019-01-14 | 2020-07-21 | 珠海格力电器股份有限公司 | 调整目标设备运行状态方法、装置、存储介质及电子装置 |
CN111540355A (zh) * | 2020-04-17 | 2020-08-14 | 广州三星通信技术研究有限公司 | 基于语音助手的个性化设置方法和设备 |
CN111613217A (zh) * | 2020-04-02 | 2020-09-01 | 深圳创维-Rgb电子有限公司 | 一种设备推荐方法、装置、电子设备及可读存储介质 |
CN111862947A (zh) * | 2020-06-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 用于控制智能设备的方法、装置、电子设备和计算机存储介质 |
CN112842302A (zh) * | 2019-11-12 | 2021-05-28 | 阿里巴巴集团控股有限公司 | 身体信息的处理方法和系统、存储介质 |
CN113489628A (zh) * | 2020-05-28 | 2021-10-08 | 海信集团有限公司 | 一种智能终端的控制方法、人机交互设备及智能终端 |
CN113553020A (zh) * | 2020-04-23 | 2021-10-26 | 百度在线网络技术(北京)有限公司 | 智能音箱的播报控制方法和装置 |
WO2023040827A1 (zh) * | 2021-09-16 | 2023-03-23 | 华为技术有限公司 | 一种智能家居控制方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103888604A (zh) * | 2014-03-10 | 2014-06-25 | 深圳市金立通信设备有限公司 | 一种终端应用模式的切换方法及终端 |
CN106453058A (zh) * | 2016-11-14 | 2017-02-22 | 北京小米移动软件有限公司 | 推送信息的方法及装置 |
CN106548773A (zh) * | 2016-11-04 | 2017-03-29 | 百度在线网络技术(北京)有限公司 | 基于人工智能的儿童用户搜索方法及装置 |
CN106653016A (zh) * | 2016-10-28 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 智能交互方法和装置 |
CN106886161A (zh) * | 2015-12-16 | 2017-06-23 | 美的集团股份有限公司 | 音箱的控制方法、系统及音箱 |
CN107168677A (zh) * | 2017-03-30 | 2017-09-15 | 联想(北京)有限公司 | 音频处理方法及装置、电子设备、存储介质 |
CN107563759A (zh) * | 2017-08-22 | 2018-01-09 | 维沃移动通信有限公司 | 一种支付鉴权方法及移动终端 |
CN107656461A (zh) * | 2016-07-26 | 2018-02-02 | 青岛海尔洗衣机有限公司 | 一种基于用户年龄调节语音的方法及洗衣机 |
CN107656983A (zh) * | 2017-09-08 | 2018-02-02 | 广州索答信息科技有限公司 | 一种基于声纹识别的智能推荐方法及装置 |
CN107919131A (zh) * | 2017-12-11 | 2018-04-17 | 广东小天才科技有限公司 | 一种通过麦克风设备控制用户终端的方法及系统 |
-
2018
- 2018-06-25 CN CN201810666916.9A patent/CN109036395A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103888604A (zh) * | 2014-03-10 | 2014-06-25 | 深圳市金立通信设备有限公司 | 一种终端应用模式的切换方法及终端 |
CN106886161A (zh) * | 2015-12-16 | 2017-06-23 | 美的集团股份有限公司 | 音箱的控制方法、系统及音箱 |
CN107656461A (zh) * | 2016-07-26 | 2018-02-02 | 青岛海尔洗衣机有限公司 | 一种基于用户年龄调节语音的方法及洗衣机 |
CN106653016A (zh) * | 2016-10-28 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 智能交互方法和装置 |
CN106548773A (zh) * | 2016-11-04 | 2017-03-29 | 百度在线网络技术(北京)有限公司 | 基于人工智能的儿童用户搜索方法及装置 |
CN106453058A (zh) * | 2016-11-14 | 2017-02-22 | 北京小米移动软件有限公司 | 推送信息的方法及装置 |
CN107168677A (zh) * | 2017-03-30 | 2017-09-15 | 联想(北京)有限公司 | 音频处理方法及装置、电子设备、存储介质 |
CN107563759A (zh) * | 2017-08-22 | 2018-01-09 | 维沃移动通信有限公司 | 一种支付鉴权方法及移动终端 |
CN107656983A (zh) * | 2017-09-08 | 2018-02-02 | 广州索答信息科技有限公司 | 一种基于声纹识别的智能推荐方法及装置 |
CN107919131A (zh) * | 2017-12-11 | 2018-04-17 | 广东小天才科技有限公司 | 一种通过麦克风设备控制用户终端的方法及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111435596A (zh) * | 2019-01-14 | 2020-07-21 | 珠海格力电器股份有限公司 | 调整目标设备运行状态方法、装置、存储介质及电子装置 |
CN111435596B (zh) * | 2019-01-14 | 2024-01-30 | 珠海格力电器股份有限公司 | 调整目标设备运行状态方法、装置、存储介质及电子装置 |
CN110149618B (zh) * | 2019-05-09 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 基于声纹授权的智能设备接入方法、装置、设备及介质 |
CN110149618A (zh) * | 2019-05-09 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 基于声纹授权的智能设备接入方法、装置、设备及介质 |
CN110310657A (zh) * | 2019-07-10 | 2019-10-08 | 北京猎户星空科技有限公司 | 一种音频数据处理方法及装置 |
CN110336723A (zh) * | 2019-07-23 | 2019-10-15 | 珠海格力电器股份有限公司 | 智能家电的控制方法及装置、智能家电设备 |
CN112842302A (zh) * | 2019-11-12 | 2021-05-28 | 阿里巴巴集团控股有限公司 | 身体信息的处理方法和系统、存储介质 |
CN111613217A (zh) * | 2020-04-02 | 2020-09-01 | 深圳创维-Rgb电子有限公司 | 一种设备推荐方法、装置、电子设备及可读存储介质 |
CN111540355A (zh) * | 2020-04-17 | 2020-08-14 | 广州三星通信技术研究有限公司 | 基于语音助手的个性化设置方法和设备 |
CN111540355B (zh) * | 2020-04-17 | 2024-05-24 | 广州三星通信技术研究有限公司 | 基于语音助手的个性化设置方法和设备 |
CN113553020A (zh) * | 2020-04-23 | 2021-10-26 | 百度在线网络技术(北京)有限公司 | 智能音箱的播报控制方法和装置 |
CN113489628A (zh) * | 2020-05-28 | 2021-10-08 | 海信集团有限公司 | 一种智能终端的控制方法、人机交互设备及智能终端 |
CN111862947A (zh) * | 2020-06-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 用于控制智能设备的方法、装置、电子设备和计算机存储介质 |
WO2023040827A1 (zh) * | 2021-09-16 | 2023-03-23 | 华为技术有限公司 | 一种智能家居控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109036395A (zh) | 个性化的音箱控制方法、系统、智能音箱及存储介质 | |
CN109741732B (zh) | 命名实体识别方法、命名实体识别装置、设备及介质 | |
Tahon et al. | Towards a small set of robust acoustic features for emotion recognition: challenges | |
CN110310623B (zh) | 样本生成方法、模型训练方法、装置、介质及电子设备 | |
CN108320733B (zh) | 语音数据处理方法及装置、存储介质、电子设备 | |
US11705105B2 (en) | Speech synthesizer for evaluating quality of synthesized speech using artificial intelligence and method of operating the same | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN107972028B (zh) | 人机交互方法、装置及电子设备 | |
CN110534099A (zh) | 语音唤醒处理方法、装置、存储介质及电子设备 | |
CN110473554B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
CN109036381A (zh) | 语音处理方法及装置、计算机装置及可读存储介质 | |
JPH09500223A (ja) | 多言語音声認識システム | |
US11398219B2 (en) | Speech synthesizer using artificial intelligence and method of operating the same | |
Samantaray et al. | A novel approach of speech emotion recognition with prosody, quality and derived features using SVM classifier for a class of North-Eastern Languages | |
Vlasenko et al. | Vowels formants analysis allows straightforward detection of high arousal emotions | |
JPH09230888A (ja) | パターンマッチング方法及び装置 | |
CN109074809B (zh) | 信息处理设备、信息处理方法和计算机可读存储介质 | |
Kumar et al. | Machine learning based speech emotions recognition system | |
CN110853669B (zh) | 音频识别方法、装置及设备 | |
Nedjah et al. | Automatic speech recognition of Portuguese phonemes using neural networks ensemble | |
Hämäläinen et al. | Improving speech recognition through automatic selection of age group–specific acoustic models | |
CN117352000A (zh) | 语音分类方法、装置、电子设备及计算机可读介质 | |
WO2020073839A1 (zh) | 语音唤醒方法、装置、系统及电子设备 | |
KR102113879B1 (ko) | 참조 데이터베이스를 활용한 화자 음성 인식 방법 및 그 장치 | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181218 |
|
WD01 | Invention patent application deemed withdrawn after publication |