CN106251871A - 一种语音控制音乐本地播放装置 - Google Patents
一种语音控制音乐本地播放装置 Download PDFInfo
- Publication number
- CN106251871A CN106251871A CN201610644108.3A CN201610644108A CN106251871A CN 106251871 A CN106251871 A CN 106251871A CN 201610644108 A CN201610644108 A CN 201610644108A CN 106251871 A CN106251871 A CN 106251871A
- Authority
- CN
- China
- Prior art keywords
- music
- emotion recognition
- information
- unit
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008909 emotion recognition Effects 0.000 claims abstract description 56
- 230000005236 sound signal Effects 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 5
- 230000001815 facial effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Child & Adolescent Psychology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Engineering & Computer Science (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明涉及一种语音控制音乐本地播放装置,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,音频信号采集单元,用于采集外部语音信息;语音识别判断单元,用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元,用于解析音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;执行单元,用于根据音乐曲目编号和音量大小信息播放相应的音乐;音乐存储单元,用于存储本地音乐数据。本发明通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
Description
技术领域
本发明涉及智能家居技术领域,更具体地说,涉及一种语音控制音乐本地播放装置。
背景技术
智能家居是在互联网的影响之下物联化的体现。智能家居通过物联网技术将家中的各种设备连接到一起,提供家电控制、照明控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
随着智能家居的越来越普及,单一的家居识别控制模式已经不能满足人们的需要。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音控制音乐本地播放装置。
本发明解决其技术问题所采用的技术方案是:
构造一种语音控制音乐本地播放装置,其中,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,
所述音频信号采集单元,用于采集外部语音信息;
语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;
执行单元,用于根据所述音乐曲目编号和所述音量大小信息播放相应的音乐;
音乐存储单元,用于存储本地音乐数据。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
本发明所述的语音控制音乐本地播放装置,其中,所述执行单元包括:
查表子单元,用于查询音乐存储表。
本发明所述的语音控制音乐本地播放装置,其中,所述情感识别包括褒义情感识别和贬义情感识别。
本发明的有益效果在于:通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图:
图1是本发明较佳实施例的语音控制音乐本地播放装置原理框图;
图2是本发明较佳实施例的语音控制音乐本地播放装置的语音识别判断单元原理框图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明较佳实施例的语音控制音乐本地播放装置原理框图如图1所示,包括:音频信号采集单元1、语音识别判断单元2、信息解析单元3、执行单元4、音乐存储单元5;音频信号采集单元1,用于采集外部语音信息;语音识别判断单元2,用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元3,用于解析音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;执行单元4,用于根据音乐曲目编号和音量大小信息播放相应的音乐;音乐存储单元5,用于存储本地音乐数据。本实施例通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
上述语音控制音乐本地播放装置中,如图2所示,语音识别判断单元2包括:第一情感识别子单元21,用于对外部语音信息进行语音音调情感识别,生成第一情感识别结果;第二情感识别子单元22,用于将外部语音信息转换为文字信息后,对文字信息进行语义情感识别生成第二情感识别结果;情感识别结果输出子单元23,用于基于第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果;根据用户情感识别结果确定需要播放的音乐曲目。其中,情感识别包括褒义情感识别和贬义情感识别。
进一步地,语音识别判断单元2还包括:第三情感识别子单元,用于对视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果;基于第一情感识别结果、第二情感识别结果和第三情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果;根据用户情感识别结果确定需要播放的音乐曲目。
上述语音识别判断单元进一步包括:语义生成单元,用于将外部语音信息转换为文字信息,并将文字信息转换成控制指令。
上述语音控制音乐本地播放装置中,执行单元包括:查表子单元,用于查询音乐存储表。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (6)
1.一种语音控制音乐本地播放装置,其特征在于,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,
所述音频信号采集单元,用于采集外部语音信息;
语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;
执行单元,用于根据所述音乐曲目编号和所述音量大小信息播放相应的音乐;
音乐存储单元,用于存储本地音乐数据。
2.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果,根据所述用户情感识别结果确定需要播放的音乐曲目。
3.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
4.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
5.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述执行单元包括:
查表子单元,用于查询音乐存储表。
6.根据权利要求2所述的语音控制音乐本地播放装置,其特征在于,所述情感识别包括褒义情感识别和贬义情感识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610644108.3A CN106251871A (zh) | 2016-08-05 | 2016-08-05 | 一种语音控制音乐本地播放装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610644108.3A CN106251871A (zh) | 2016-08-05 | 2016-08-05 | 一种语音控制音乐本地播放装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106251871A true CN106251871A (zh) | 2016-12-21 |
Family
ID=58077933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610644108.3A Pending CN106251871A (zh) | 2016-08-05 | 2016-08-05 | 一种语音控制音乐本地播放装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106251871A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3557577A1 (en) | 2018-04-20 | 2019-10-23 | Spotify AB | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US10566010B2 (en) | 2018-04-20 | 2020-02-18 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
CN110970019A (zh) * | 2018-09-28 | 2020-04-07 | 珠海格力电器股份有限公司 | 智能家居系统的控制方法和装置 |
US10622007B2 (en) | 2018-04-20 | 2020-04-14 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US10621983B2 (en) | 2018-04-20 | 2020-04-14 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202076003U (zh) * | 2010-12-22 | 2011-12-14 | 东莞市美之尊电子科技有限公司 | 一种智能语音控制便携式音响 |
CN103456314A (zh) * | 2013-09-03 | 2013-12-18 | 广州创维平面显示科技有限公司 | 一种情感识别方法以及装置 |
CN103581308A (zh) * | 2013-10-18 | 2014-02-12 | 上海山景集成电路股份有限公司 | 音乐播放系统及方法 |
-
2016
- 2016-08-05 CN CN201610644108.3A patent/CN106251871A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202076003U (zh) * | 2010-12-22 | 2011-12-14 | 东莞市美之尊电子科技有限公司 | 一种智能语音控制便携式音响 |
CN103456314A (zh) * | 2013-09-03 | 2013-12-18 | 广州创维平面显示科技有限公司 | 一种情感识别方法以及装置 |
CN103581308A (zh) * | 2013-10-18 | 2014-02-12 | 上海山景集成电路股份有限公司 | 音乐播放系统及方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3557577A1 (en) | 2018-04-20 | 2019-10-23 | Spotify AB | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US10566010B2 (en) | 2018-04-20 | 2020-02-18 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US10622007B2 (en) | 2018-04-20 | 2020-04-14 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US10621983B2 (en) | 2018-04-20 | 2020-04-14 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US11081111B2 (en) | 2018-04-20 | 2021-08-03 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
US11621001B2 (en) | 2018-04-20 | 2023-04-04 | Spotify Ab | Systems and methods for enhancing responsiveness to utterances having detectable emotion |
CN110970019A (zh) * | 2018-09-28 | 2020-04-07 | 珠海格力电器股份有限公司 | 智能家居系统的控制方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6475386B2 (ja) | 機器の制御方法、機器、及びプログラム | |
CN106251871A (zh) | 一种语音控制音乐本地播放装置 | |
CN108899023B (zh) | 控制方法和装置 | |
CN103093755B (zh) | 基于终端及互联网语音交互的网络家电控制方法及系统 | |
CN108986826A (zh) | 自动生成会议记录的方法、电子装置及可读存储介质 | |
CN104102181B (zh) | 智能家居控制方法、装置及系统 | |
WO2017059815A1 (zh) | 一种快速识别方法及家庭智能机器人 | |
TW201719333A (zh) | 語音控制系統及方法 | |
CN106249614A (zh) | 智能终端、智能家居系统、语音识别方法及下单方法 | |
CN105388772A (zh) | 一种基于语音识别的室内智能控制系统及方法 | |
CN105185378A (zh) | 声控方法、声控系统及能够进行声控的空调 | |
CN102855874A (zh) | 基于互联网语音交互的家电控制方法及系统 | |
CN109377995B (zh) | 一种控制设备的方法与装置 | |
CN105446146A (zh) | 基于语义分析的智能终端控制方法、系统及智能终端 | |
CN110415694A (zh) | 一种多台智能音箱协同工作的方法 | |
CN106251866A (zh) | 一种语音控制音乐网络播放装置 | |
CN113012694A (zh) | 一种轻生活语音识别控制系统 | |
CN114582318B (zh) | 一种基于语音识别的智能家居控制方法及系统 | |
CN106254186A (zh) | 一种语音交互识别控制系统 | |
WO2018023514A1 (zh) | 一种家居背景音乐控制系统 | |
CN106297783A (zh) | 一种语音交互识别智能终端 | |
WO2018023523A1 (zh) | 一种运动及情感识别家居控制系统 | |
WO2018023518A1 (zh) | 一种语音交互识别智能终端 | |
CN113470642A (zh) | 基于智能家居app的语音控制场景的实现方法及系统 | |
WO2018023513A1 (zh) | 一种基于运动识别的家居控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161221 |