CN106251871A - 一种语音控制音乐本地播放装置 - Google Patents

一种语音控制音乐本地播放装置 Download PDF

Info

Publication number
CN106251871A
CN106251871A CN201610644108.3A CN201610644108A CN106251871A CN 106251871 A CN106251871 A CN 106251871A CN 201610644108 A CN201610644108 A CN 201610644108A CN 106251871 A CN106251871 A CN 106251871A
Authority
CN
China
Prior art keywords
music
emotion recognition
unit
locality
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610644108.3A
Other languages
English (en)
Inventor
易晓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610644108.3A priority Critical patent/CN106251871A/zh
Publication of CN106251871A publication Critical patent/CN106251871A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Child & Adolescent Psychology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明涉及一种语音控制音乐本地播放装置,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,音频信号采集单元,用于采集外部语音信息;语音识别判断单元,用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元,用于解析音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;执行单元,用于根据音乐曲目编号和音量大小信息播放相应的音乐;音乐存储单元,用于存储本地音乐数据。本发明通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。

Description

一种语音控制音乐本地播放装置
技术领域
本发明涉及智能家居技术领域,更具体地说,涉及一种语音控制音乐本地播放装置。
背景技术
智能家居是在互联网的影响之下物联化的体现。智能家居通过物联网技术将家中的各种设备连接到一起,提供家电控制、照明控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
随着智能家居的越来越普及,单一的家居识别控制模式已经不能满足人们的需要。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音控制音乐本地播放装置。
本发明解决其技术问题所采用的技术方案是:
构造一种语音控制音乐本地播放装置,其中,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,
所述音频信号采集单元,用于采集外部语音信息;
语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;
执行单元,用于根据所述音乐曲目编号和所述音量大小信息播放相应的音乐;
音乐存储单元,用于存储本地音乐数据。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
本发明所述的语音控制音乐本地播放装置,其中,所述语音识别判断单元包括:
语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
本发明所述的语音控制音乐本地播放装置,其中,所述执行单元包括:
查表子单元,用于查询音乐存储表。
本发明所述的语音控制音乐本地播放装置,其中,所述情感识别包括褒义情感识别和贬义情感识别。
本发明的有益效果在于:通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图:
图1是本发明较佳实施例的语音控制音乐本地播放装置原理框图;
图2是本发明较佳实施例的语音控制音乐本地播放装置的语音识别判断单元原理框图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明较佳实施例的语音控制音乐本地播放装置原理框图如图1所示,包括:音频信号采集单元1、语音识别判断单元2、信息解析单元3、执行单元4、音乐存储单元5;音频信号采集单元1,用于采集外部语音信息;语音识别判断单元2,用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元3,用于解析音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;执行单元4,用于根据音乐曲目编号和音量大小信息播放相应的音乐;音乐存储单元5,用于存储本地音乐数据。本实施例通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
上述语音控制音乐本地播放装置中,如图2所示,语音识别判断单元2包括:第一情感识别子单元21,用于对外部语音信息进行语音音调情感识别,生成第一情感识别结果;第二情感识别子单元22,用于将外部语音信息转换为文字信息后,对文字信息进行语义情感识别生成第二情感识别结果;情感识别结果输出子单元23,用于基于第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果;根据用户情感识别结果确定需要播放的音乐曲目。其中,情感识别包括褒义情感识别和贬义情感识别。
进一步地,语音识别判断单元2还包括:第三情感识别子单元,用于对视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果;基于第一情感识别结果、第二情感识别结果和第三情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果;根据用户情感识别结果确定需要播放的音乐曲目。
上述语音识别判断单元进一步包括:语义生成单元,用于将外部语音信息转换为文字信息,并将文字信息转换成控制指令。
上述语音控制音乐本地播放装置中,执行单元包括:查表子单元,用于查询音乐存储表。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (6)

1.一种语音控制音乐本地播放装置,其特征在于,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、音乐存储单元;其中,
所述音频信号采集单元,用于采集外部语音信息;
语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目编号、音量大小信息;
执行单元,用于根据所述音乐曲目编号和所述音量大小信息播放相应的音乐;
音乐存储单元,用于存储本地音乐数据。
2.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果,根据所述用户情感识别结果确定需要播放的音乐曲目。
3.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
4.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述语音识别判断单元包括:
语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
5.根据权利要求1所述的语音控制音乐本地播放装置,其特征在于,所述执行单元包括:
查表子单元,用于查询音乐存储表。
6.根据权利要求2所述的语音控制音乐本地播放装置,其特征在于,所述情感识别包括褒义情感识别和贬义情感识别。
CN201610644108.3A 2016-08-05 2016-08-05 一种语音控制音乐本地播放装置 Pending CN106251871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610644108.3A CN106251871A (zh) 2016-08-05 2016-08-05 一种语音控制音乐本地播放装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610644108.3A CN106251871A (zh) 2016-08-05 2016-08-05 一种语音控制音乐本地播放装置

Publications (1)

Publication Number Publication Date
CN106251871A true CN106251871A (zh) 2016-12-21

Family

ID=58077933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610644108.3A Pending CN106251871A (zh) 2016-08-05 2016-08-05 一种语音控制音乐本地播放装置

Country Status (1)

Country Link
CN (1) CN106251871A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3557577A1 (en) 2018-04-20 2019-10-23 Spotify AB Systems and methods for enhancing responsiveness to utterances having detectable emotion
US10566010B2 (en) 2018-04-20 2020-02-18 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
CN110970019A (zh) * 2018-09-28 2020-04-07 珠海格力电器股份有限公司 智能家居系统的控制方法和装置
US10621983B2 (en) 2018-04-20 2020-04-14 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
US10622007B2 (en) 2018-04-20 2020-04-14 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202076003U (zh) * 2010-12-22 2011-12-14 东莞市美之尊电子科技有限公司 一种智能语音控制便携式音响
CN103456314A (zh) * 2013-09-03 2013-12-18 广州创维平面显示科技有限公司 一种情感识别方法以及装置
CN103581308A (zh) * 2013-10-18 2014-02-12 上海山景集成电路股份有限公司 音乐播放系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202076003U (zh) * 2010-12-22 2011-12-14 东莞市美之尊电子科技有限公司 一种智能语音控制便携式音响
CN103456314A (zh) * 2013-09-03 2013-12-18 广州创维平面显示科技有限公司 一种情感识别方法以及装置
CN103581308A (zh) * 2013-10-18 2014-02-12 上海山景集成电路股份有限公司 音乐播放系统及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3557577A1 (en) 2018-04-20 2019-10-23 Spotify AB Systems and methods for enhancing responsiveness to utterances having detectable emotion
US10566010B2 (en) 2018-04-20 2020-02-18 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
US10621983B2 (en) 2018-04-20 2020-04-14 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
US10622007B2 (en) 2018-04-20 2020-04-14 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
US11081111B2 (en) 2018-04-20 2021-08-03 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
US11621001B2 (en) 2018-04-20 2023-04-04 Spotify Ab Systems and methods for enhancing responsiveness to utterances having detectable emotion
CN110970019A (zh) * 2018-09-28 2020-04-07 珠海格力电器股份有限公司 智能家居系统的控制方法和装置

Similar Documents

Publication Publication Date Title
CN106251871A (zh) 一种语音控制音乐本地播放装置
CN106205648A (zh) 一种语音控制音乐网络播放方法
CN105446146B (zh) 基于语义分析的智能终端控制方法、系统及智能终端
CN103730116B (zh) 在智能手表上实现智能家居设备控制的系统及其方法
KR101992424B1 (ko) 증강현실용 인공지능 캐릭터의 제작 장치 및 이를 이용한 서비스 시스템
CN106228989A (zh) 一种语音交互识别控制方法
CN106647311B (zh) 智能中控系统、设备、服务器及智能设备控制方法
CN109493849A (zh) 语音唤醒方法、装置及电子设备
CN108737933A (zh) 一种基于智能音箱的对话方法、装置及电子设备
WO2017059815A1 (zh) 一种快速识别方法及家庭智能机器人
WO2020253064A1 (zh) 语音的识别方法及装置、计算机设备、存储介质
CN206117701U (zh) 家用电器及其控制系统
CN109450745A (zh) 信息处理方法、装置、智能控制系统以及智能网关
CN106125566A (zh) 一种家居背景音乐控制系统
TW201928804A (zh) 資料處理的方法、裝置及設備
CN109584874A (zh) 电器设备控制方法、装置、电器设备及存储介质
CN106251866A (zh) 一种语音控制音乐网络播放装置
CN106934067A (zh) 信息处理方法及电子设备
CN108156705A (zh) 一种智能语音灯光控制系统
CN106254186A (zh) 一种语音交互识别控制系统
CN109324515A (zh) 一种控制智能电器的方法及控制终端
CN103645690A (zh) 一种语音控制数字家庭智能盒的方法
WO2018023515A1 (zh) 一种手势及情感识别家居控制系统
CN106297837A (zh) 一种语音控制音乐本地播放方法
CN107577677A (zh) 一种统一语音播放的翻译装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161221