CN109754810A - 一种语音控制方法、装置、存储介质及空调 - Google Patents
一种语音控制方法、装置、存储介质及空调 Download PDFInfo
- Publication number
- CN109754810A CN109754810A CN201910130543.8A CN201910130543A CN109754810A CN 109754810 A CN109754810 A CN 109754810A CN 201910130543 A CN201910130543 A CN 201910130543A CN 109754810 A CN109754810 A CN 109754810A
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- mood
- emotional
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000008859 change Effects 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 59
- 230000002996 emotional effect Effects 0.000 claims description 109
- 230000036651 mood Effects 0.000 claims description 89
- 238000004422 calculation algorithm Methods 0.000 claims description 32
- 238000004378 air conditioning Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 3
- 230000008451 emotion Effects 0.000 abstract description 34
- 230000003993 interaction Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 230000002452 interceptive effect Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 12
- 238000012795 verification Methods 0.000 description 10
- 238000005266 casting Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013480 data collection Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 206010034719 Personality change Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音控制方法、装置、存储介质及空调,该方法包括:收集语音数据;基于所述语音数据进行画像处理,得到用户的语音画像;根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。本发明的方案,可以解决语音交互方式单一的问题,达到丰富语音交互方式的效果。
Description
技术领域
本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及一种基于用户语音情绪变化的报告推送方法、装置、存储介质及空调。
背景技术
在移动互联网时代逐渐步入人工智能时代后,不可避免地给企业及用户的行为带来一系列改变与重塑。其中最大的变化莫过于,用户的一切行为在企业面前似乎都将是“可视化”的。
例如:银行会记录用户取款、转账记录,通信运行商会记录用户的上网数据,等等;企业会保留有用户的相关信息用于更好的服务。又如:类似网易音乐年度报告,它是用H5的形式为用户展示一年里用户听了多少首歌,哪一天最特别,那首歌听的最多,最喜欢的歌手等。
但这种方式只是根据历史记录去统计分析,在语音交互方面,使得语音交互方式单一,无个性化定制的用户服务,用户体验性差。
发明内容
本发明的目的在于,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中语音交互方式单一的问题,达到丰富语音交互方式的效果。
本发明提供一种语音控制方法,包括:收集语音数据;基于所述语音数据进行画像处理,得到用户的语音画像;根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。
可选地,收集语音数据,包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;其中,语音采集模块,包括:麦克风阵列。
可选地,基于所述语音数据进行画像处理,包括:对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;对所述情绪信息进行建模处理,以构建得到用户的语音画像。
可选地,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
可选地,根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:识别所述语音画像所包含的情绪特征;将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。
可选地,推送所述情绪变化情况,包括:显示所述情绪报告;和/或,将所述情绪报告发送至设定的客户端;和/或,对所述情绪报告进行语音播报。
与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:收集单元,用于收集语音数据;控制单元,用于基于所述语音数据进行画像处理,得到用户的语音画像;所述控制单元,还用于根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。
可选地,所述收集单元收集语音数据,包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;其中,语音采集模块,包括:麦克风阵列。
可选地,所述控制单元基于所述语音数据进行画像处理,包括:对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;对所述情绪信息进行建模处理,以构建得到用户的语音画像。
可选地,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
可选地,所述控制单元根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:识别所述语音画像所包含的情绪特征;将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。
可选地,所述控制单元推送所述情绪变化情况,包括:显示所述情绪报告;和/或,将所述情绪报告发送至设定的客户端;和/或,对所述情绪报告进行语音播报。
与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。
与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。
本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以丰富语音交互方式。
进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,提升用户的交互体验。
进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以实现不同用户的个性化服务需求。
进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以增强语音交互的趣味性。
进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以帮助用户进行情绪管理。
由此,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,解决现有技术中语音交互方式单一的问题,从而,克服现有技术中语音交互方式单一、不能实现个性化服务和用户体验差的缺陷,实现语音交互方式丰富、能够实现个性化服务和用户体验好的有益效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的语音控制方法的一实施例的流程示意图;
图2为本发明的方法中基于所述语音数据进行画像处理的一实施例的流程示意图;
图3为本发明的方法中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的一实施例的流程示意图;
图4为本发明的语音控制装置的一实施例的结构示意图;
图5为本发明的空调的一实施例的语音画像的构建流程示意图。
结合附图,本发明实施例中附图标记如下:
102-收集单元;104-控制单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤S110至步骤S130。
在步骤S110处,收集语音数据。例如:收集用户在设定时间段内发出的语音数据。
可选地,步骤S110中收集语音数据,可以包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储。
由此,通过获取语音采集模块采集到的语音数据并存储,实现对一段时间内语音数据的收集,使得对语音数据的收集方便且精准。
其中,语音采集模块,可以包括:麦克风阵列。
例如:语音数据收集,如通过麦克风进行语音数据收集。如系统使用麦克风阵列获取用户语音信息。
由此,通过麦克风阵列采集语音数据,采集方式简便且采集结果精准。
在步骤S120处,基于所述语音数据进行画像处理,得到用户的语音画像。
可选地,可以结合图2所示本发明的方法中基于所述语音数据进行画像处理的一实施例流程示意图,进一步说明步骤S120中基于所述语音数据进行画像处理的具体过程,可以包括:步骤S210和步骤S220。
步骤S210,对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息。
例如:分析建模,如对收集的语音数据进行分析建模。
步骤S220,对所述情绪信息进行建模处理,以构建得到用户的语音画像。
例如:构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。
由此,通过对语音数据进行分析处理而得到用户的声音信息,进而对该声音信息进行建模处理得到用户的语音画像,使得基于语音数据构建语音画像精确且可靠。
更可选地,所述建模处理,可以包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
例如:系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。
由此,通过多种算法对声音信息进行建模处理进而构建得到语音画像,处理方式灵活且可靠。
在步骤S130处,根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。
例如:可以通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。如:通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。
由此,通过基于语音数据进行画像处理得到语音画像,进而基于该语音画像可以确定用户在一段时间内的情绪报告,丰富了语音交互方式,提升了用户体验。
可选地,可以结合图3所示本发明的方法中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的一实施例流程示意图,进一步说明步骤S130中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的具体过程,可以包括:步骤S310至步骤S330。
步骤S310,识别所述语音画像所包含的情绪特征。
步骤S320,将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息。所述情绪信息,可以包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一。
例如:语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。如:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。
步骤S330,根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。
例如:系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。
由此,通过识别语音画像中声音信息的声学特征,进而将该声学特征对设定的情绪信息范围进行对比以确定该声学特征对应的情绪信息,从而基于该情绪信息生成用户在该一段时间内的情绪报告,使得基于语音画像生成情绪报告精准而可靠。
可选地,步骤S130中推送所述情绪变化情况,可以包括以下至少一种推送方式。
第一种推送方式:显示所述情绪报告。
第二种推送方式:将所述情绪报告发送至设定的客户端(如用户手机)。
第三种推送方式:对所述情绪报告进行语音播报,例如:可以利用设定的扬声器对所述情绪报告进行语音播报。
例如:系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。
由此,通过多种形式的推送方式,可以满足不同用户的不同推送需求,灵活性好、且人性化好。
经大量的试验验证,采用本实施例的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以丰富语音交互方式。
根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图4所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:收集单元102和控制单元104。
在一个可选例子中,收集单元102,可以用于收集语音数据。例如:收集用户在设定时间段内发出的语音数据。该收集单元102的具体功能及处理参见步骤S110。
可选地,所述收集单元102收集语音数据,可以包括:所述收集单元102,具体还可以用于获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储。
由此,通过获取语音采集模块采集到的语音数据并存储,实现对一段时间内语音数据的收集,使得对语音数据的收集方便且精准。
其中,语音采集模块,可以包括:麦克风阵列。
例如:语音数据收集,如通过麦克风进行语音数据收集。如系统使用麦克风阵列获取用户语音信息。
由此,通过麦克风阵列采集语音数据,采集方式简便且采集结果精准。
在一个可选例子中,控制单元104,可以用于基于所述语音数据进行画像处理,得到用户的语音画像。该控制单元104的具体功能及处理参见步骤S120。
可选地,所述控制单元104基于所述语音数据进行画像处理,可以包括:
所述控制单元104,具体还可以用于对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息。该控制单元104的具体功能及处理还参见步骤S210。
例如:分析建模,如对收集的语音数据进行分析建模。
所述控制单元104,具体还可以用于对所述情绪信息进行建模处理,以构建得到用户的语音画像。该控制单元104的具体功能及处理还参见步骤S220。
例如:构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。
由此,通过对语音数据进行分析处理而得到用户的声音信息,进而对该声音信息进行建模处理得到用户的语音画像,使得基于语音数据构建语音画像精确且可靠。
更可选地,所述建模处理,可以包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
例如:系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。
由此,通过多种算法对声音信息进行建模处理进而构建得到语音画像,处理方式灵活且可靠。
在一个可选例子中,所述控制单元104,还可以用于根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。该控制单元104的具体功能及处理还参见步骤S130。
例如:可以通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。如:通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。
由此,通过基于语音数据进行画像处理得到语音画像,进而基于该语音画像可以确定用户在一段时间内的情绪报告,丰富了语音交互方式,提升了用户体验。
可选地,所述控制单元104根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,可以包括:
所述控制单元104,具体还可以用于识别所述语音画像所包含的情绪特征。该控制单元104的具体功能及处理还参见步骤S310。
所述控制单元104,具体还可以用于将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息。所述情绪信息,可以包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一。该控制单元104的具体功能及处理还参见步骤S320。
例如:语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。如:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。
所述控制单元104,具体还可以用于根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。该控制单元104的具体功能及处理还参见步骤S330。
例如:系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。
由此,通过识别语音画像中声音信息的声学特征,进而将该声学特征对设定的情绪信息范围进行对比以确定该声学特征对应的情绪信息,从而基于该情绪信息生成用户在该一段时间内的情绪报告,使得基于语音画像生成情绪报告精准而可靠。
可选地,所述控制单元104推送所述情绪变化情况,可以包括以下至少一种推送方式。
第一种推送方式:所述控制单元104,具体还可以用于显示所述情绪报告。
第二种推送方式:所述控制单元104,具体还可以用于将所述情绪报告发送至设定的客户端(如用户手机)。
第三种推送方式:所述控制单元104,具体还可以用于对所述情绪报告进行语音播报,例如:可以利用设定的扬声器对所述情绪报告进行语音播报。
例如:系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。
由此,通过多种形式的推送方式,可以满足不同用户的不同推送需求,灵活性好、且人性化好。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,提升用户的交互体验。
根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。
随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值、提供更好的用户服务。于是,“用户画像”的概念也就应运而生。借助人工智能技术,可以从用户的语音信息中提取大量用户画像特征,包括情绪、性别、年龄、地域、健康状况、身高、体重、面部特征等。这项技术被称为用户语音画像。目前情绪识别、性别识别更为成熟。而用户画像是需要采集更多的信息,使用更多的算法去分析建模,得到的信息更为准确,还能预测。推送的方法也不同,传统是H5形式,因这个应用于智能设备,故采用语音播报的形式。
在一个可选实施方式中,本发明的方案,通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。
在一个可选例子中,本发明的方案,通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。
在一个可选具体实施方式中,可以参见图5所示的例子,对本发明的方案的具体实现过程进行示例性说明。
在一个可选具体例子中,本发明的方案,可以提供一种基于用户语音情绪变化的报告推送,该系统主要可以由麦克风阵列、语音情绪识别单元、扬声器、无线通讯模块等组成。
在一个可选具体例子中,本发明的方案,可以提供一种基于用户语音情绪变化的报告推送方法。
参见图5所示的例子,该基于用户语音情绪变化的报告推送方法,主要可以包括:
步骤1、语音数据收集,如通过麦克风进行语音数据收集。
可选地,系统使用麦克风阵列获取用户语音信息。
步骤2、分析建模,如对收集的语音数据进行分析建模。
步骤3、构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。
可选地,系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。
可选地,语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。
例如:使用算法重点关注声音中的“关键声学特征”中的算法可以为情绪识别模型。模型本身就可从声音中侧重提取所需的“关键声学特征”。模型本身由数据训练得出。在训练得出模型的过程中,机器会自动得出相关特征值。模型本身依据训练得出的参数值和网络结构可达到识别用户情绪的目的。
例如:通过深度学习方式建立的情绪识别模型,可以包括:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。
可选地,系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。
可选地,系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。
例如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。类似的推送案例,可以包括:网易云音乐的个人年度音乐总结推送,类似支付宝的消费记录年度推送,等等。
由于本实施例的空调所实现的处理及功能基本相应于前述图4所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以实现不同用户的个性化服务需求。
根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以增强语音交互的趣味性。
根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。
由于本实施例的空调所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以帮助用户进行情绪管理。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (15)
1.一种语音控制方法,其特征在于,包括:
收集语音数据;
基于所述语音数据进行画像处理,得到用户的语音画像;
根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。
2.根据权利要求1所述的方法,其特征在于,收集语音数据,包括:
获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;
其中,语音采集模块,包括:麦克风阵列。
3.根据权利要求1或2所述的方法,其特征在于,基于所述语音数据进行画像处理,包括:
对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;
对所述情绪信息进行建模处理,以构建得到用户的语音画像。
4.根据权利要求3所述的方法,其特征在于,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
5.根据权利要求1-4之一所述的方法,其特征在于,根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:
识别所述语音画像所包含的情绪特征;
将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;
根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。
6.根据权利要求1-5之一所述的方法,其特征在于,推送所述情绪变化情况,包括:
显示所述情绪报告;和/或,
将所述情绪报告发送至设定的客户端;和/或,
对所述情绪报告进行语音播报。
7.一种语音控制装置,其特征在于,包括:
收集单元,用于收集语音数据;
控制单元,用于基于所述语音数据进行画像处理,得到用户的语音画像;
所述控制单元,还用于根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。
8.根据权利要求7所述的装置,其特征在于,所述收集单元收集语音数据,包括:
获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;
其中,语音采集模块,包括:麦克风阵列。
9.根据权利要求7或8所述的装置,其特征在于,所述控制单元基于所述语音数据进行画像处理,包括:
对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;
对所述情绪信息进行建模处理,以构建得到用户的语音画像。
10.根据权利要求9所述的装置,其特征在于,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。
11.根据权利要求7-10之一所述的装置,其特征在于,所述控制单元根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:
识别所述语音画像所包含的情绪特征;
将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;
根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。
12.根据权利要求7-11之一所述的装置,其特征在于,所述控制单元推送所述情绪变化情况,包括:
显示所述情绪报告;和/或,
将所述情绪报告发送至设定的客户端;和/或,
对所述情绪报告进行语音播报。
13.一种空调,其特征在于,包括:如权利要求7-12任一所述的语音控制装置。
14.一种存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-6任一所述的语音控制方法。
15.一种空调,其特征在于,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-6任一所述的语音控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910130543.8A CN109754810A (zh) | 2019-02-21 | 2019-02-21 | 一种语音控制方法、装置、存储介质及空调 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910130543.8A CN109754810A (zh) | 2019-02-21 | 2019-02-21 | 一种语音控制方法、装置、存储介质及空调 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109754810A true CN109754810A (zh) | 2019-05-14 |
Family
ID=66406794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910130543.8A Pending CN109754810A (zh) | 2019-02-21 | 2019-02-21 | 一种语音控制方法、装置、存储介质及空调 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109754810A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110379430A (zh) * | 2019-07-26 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 基于语音的动画显示方法、装置、计算机设备及存储介质 |
CN111078917A (zh) * | 2019-11-14 | 2020-04-28 | 珠海格力电器股份有限公司 | 一种智能推送图画的控制方法、显示装置及家电 |
CN112542180A (zh) * | 2019-09-20 | 2021-03-23 | 中国石油化工股份有限公司 | 接警处理方法和装置、机器可读存储介质及处理器 |
CN112667762A (zh) * | 2020-12-25 | 2021-04-16 | 贵州北斗空间信息技术有限公司 | 一种零编程快速构建gis系统的方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150279347A1 (en) * | 2014-03-27 | 2015-10-01 | International Business Machines Corporation | Text-to-Speech for Digital Literature |
CN106448670A (zh) * | 2016-10-21 | 2017-02-22 | 竹间智能科技(上海)有限公司 | 基于深度学习和强化学习的自动回复对话系统 |
CN107277630A (zh) * | 2017-07-20 | 2017-10-20 | 海信集团有限公司 | 语音提示信息的显示方法及装置 |
CN107293310A (zh) * | 2017-06-28 | 2017-10-24 | 上海航动科技有限公司 | 一种用户情绪分析方法及系统 |
JP2018078402A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社シフトワン | コンテンツ制作装置、及び音声付コンテンツ制作システム |
CN108196862A (zh) * | 2017-12-29 | 2018-06-22 | 北京声智科技有限公司 | 语音设备的升级装置及方法 |
CN108537321A (zh) * | 2018-03-20 | 2018-09-14 | 北京智能管家科技有限公司 | 一种机器人教学方法、装置、服务器和存储介质 |
CN108536802A (zh) * | 2018-03-30 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 基于儿童情绪的交互方法及装置 |
CN108765011A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 建立用户画像和建立状态信息分析模型的方法和装置 |
CN109145204A (zh) * | 2018-07-27 | 2019-01-04 | 苏州思必驰信息科技有限公司 | 画像标签生成和使用方法及系统 |
-
2019
- 2019-02-21 CN CN201910130543.8A patent/CN109754810A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150279347A1 (en) * | 2014-03-27 | 2015-10-01 | International Business Machines Corporation | Text-to-Speech for Digital Literature |
CN106448670A (zh) * | 2016-10-21 | 2017-02-22 | 竹间智能科技(上海)有限公司 | 基于深度学习和强化学习的自动回复对话系统 |
JP2018078402A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社シフトワン | コンテンツ制作装置、及び音声付コンテンツ制作システム |
CN107293310A (zh) * | 2017-06-28 | 2017-10-24 | 上海航动科技有限公司 | 一种用户情绪分析方法及系统 |
CN107277630A (zh) * | 2017-07-20 | 2017-10-20 | 海信集团有限公司 | 语音提示信息的显示方法及装置 |
CN108196862A (zh) * | 2017-12-29 | 2018-06-22 | 北京声智科技有限公司 | 语音设备的升级装置及方法 |
CN108537321A (zh) * | 2018-03-20 | 2018-09-14 | 北京智能管家科技有限公司 | 一种机器人教学方法、装置、服务器和存储介质 |
CN108536802A (zh) * | 2018-03-30 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 基于儿童情绪的交互方法及装置 |
CN108765011A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 建立用户画像和建立状态信息分析模型的方法和装置 |
CN109145204A (zh) * | 2018-07-27 | 2019-01-04 | 苏州思必驰信息科技有限公司 | 画像标签生成和使用方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110379430A (zh) * | 2019-07-26 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 基于语音的动画显示方法、装置、计算机设备及存储介质 |
CN110379430B (zh) * | 2019-07-26 | 2023-09-22 | 腾讯科技(深圳)有限公司 | 基于语音的动画显示方法、装置、计算机设备及存储介质 |
CN112542180A (zh) * | 2019-09-20 | 2021-03-23 | 中国石油化工股份有限公司 | 接警处理方法和装置、机器可读存储介质及处理器 |
CN111078917A (zh) * | 2019-11-14 | 2020-04-28 | 珠海格力电器股份有限公司 | 一种智能推送图画的控制方法、显示装置及家电 |
CN112667762A (zh) * | 2020-12-25 | 2021-04-16 | 贵州北斗空间信息技术有限公司 | 一种零编程快速构建gis系统的方法 |
CN112667762B (zh) * | 2020-12-25 | 2023-04-25 | 贵州北斗空间信息技术有限公司 | 一种零编程快速构建gis系统的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754810A (zh) | 一种语音控制方法、装置、存储介质及空调 | |
CN109147804A (zh) | 一种基于深度学习的音质特性处理方法及系统 | |
CN102236639B (zh) | 更新语言模型的系统和方法 | |
CN103700370A (zh) | 一种广播电视语音识别系统方法及系统 | |
CN110364146A (zh) | 语音识别方法、装置、语音识别设备及存储介质 | |
CN109065051B (zh) | 一种语音识别处理方法及装置 | |
CN106022708A (zh) | 一种预测员工离职的方法 | |
CN106302987A (zh) | 一种音频推荐方法及设备 | |
CN111475714A (zh) | 一种信息推荐的方法、装置、设备和介质 | |
CN110175012A (zh) | 技能推荐方法、装置、设备及计算机可读存储介质 | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
CN101867742A (zh) | 一种基于声控控制下的电视系统 | |
CN109859032A (zh) | 基于智能语音的账款催收方法、装置、设备和存储介质 | |
CN107480766A (zh) | 多模态虚拟机器人的内容生成的方法和系统 | |
CN111787168A (zh) | 一种基于人工智能技术的语音识别质检分配方法 | |
CN110428835A (zh) | 一种语音设备的调节方法、装置、存储介质及语音设备 | |
CN111669608B (zh) | 支持用户多媒体反馈的化妆品展示装置及方法 | |
Hu et al. | MeDJ: multidimensional emotion-aware music delivery for adolescent | |
CN115374305A (zh) | 智能音箱的音效调整方法及装置 | |
CN111724769A (zh) | 一种智能家居语音识别模型的生产方法 | |
CN110309470A (zh) | 一种基于空气成像的虚拟新闻主播系统及其实现方法 | |
CN114065720A (zh) | 会议纪要生成方法、装置、存储介质及电子设备 | |
CN108765011A (zh) | 建立用户画像和建立状态信息分析模型的方法和装置 | |
CN112201227A (zh) | 语音样本生成方法及装置、存储介质、电子装置 | |
CN113516963A (zh) | 音频数据的生成方法、装置、服务器和智能音箱 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190514 |
|
RJ01 | Rejection of invention patent application after publication |