WO2018023522A1 - 一种语音控制音乐网络播放装置 - Google Patents

一种语音控制音乐网络播放装置 Download PDF

Info

Publication number
WO2018023522A1
WO2018023522A1 PCT/CN2016/093168 CN2016093168W WO2018023522A1 WO 2018023522 A1 WO2018023522 A1 WO 2018023522A1 CN 2016093168 W CN2016093168 W CN 2016093168W WO 2018023522 A1 WO2018023522 A1 WO 2018023522A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
music
emotion recognition
information
unit
Prior art date
Application number
PCT/CN2016/093168
Other languages
English (en)
French (fr)
Inventor
易晓阳
Original Assignee
易晓阳
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 易晓阳 filed Critical 易晓阳
Priority to PCT/CN2016/093168 priority Critical patent/WO2018023522A1/zh
Publication of WO2018023522A1 publication Critical patent/WO2018023522A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Definitions

  • the present invention relates to the field of smart home technology, and more particularly to a voice controlled music network playing device.
  • Smart home is the embodiment of materialization under the influence of the Internet. Smart Home connects various devices in the home through IoT technology, providing home appliance control, lighting control, telephone remote control, indoor and outdoor remote control, burglar alarm, environmental monitoring, HVAC control, infrared forwarding and programmable timing control. Functions and means. Compared with ordinary homes, smart homes not only have traditional living functions, but also combine construction, network communication, information appliances, equipment automation, and integrate efficient systems, structures, services and management into a highly efficient, comfortable, safe, convenient and environmentally friendly living environment. Provide a full range of information interaction functions to help families and the outside to maintain information exchange, optimize people's lifestyles, help people to effectively arrange time, enhance the safety of home life, and even save money for various energy costs.
  • the technical problem to be solved by the present invention is to provide a voice control music network playing device for the above-mentioned drawbacks of the prior art.
  • a voice control music network playing device comprising: an audio signal collecting unit, a voice recognition determining unit, an information analyzing unit, an executing unit, and a network searching unit;
  • the audio signal collecting unit is configured to collect external voice information
  • a voice recognition determining unit configured to perform voice recognition on the external voice information, to obtain a music playing control instruction
  • An information parsing unit configured to parse music track name and volume size information included in the music play control instruction
  • a network search unit configured to connect to a wireless network, and search for music to be played according to the music track name
  • an execution unit configured to play the corresponding music according to the music track name and the volume size information.
  • the voice control music network playing device of the present invention wherein the voice recognition determining unit comprises:
  • a first emotion recognition subunit configured to perform voice tonal emotion recognition on the external voice information, to generate a first emotion recognition result
  • a second emotion recognition subunit configured to convert the external voice information into text information, and perform semantic emotion recognition on the text information to generate a second emotion recognition result
  • the emotion recognition result output subunit is configured to generate a user emotion recognition result according to the predetermined emotion recognition result judgment method based on the first emotion recognition result and the second emotion recognition result.
  • the voice control music network playing device of the present invention wherein the voice recognition determining unit comprises:
  • the third emotion recognition subunit is configured to perform image recognition judgment on the facial image information acquired by the video signal acquisition module to generate a third emotion recognition result.
  • the voice control music network playing device of the present invention wherein the voice recognition determining unit comprises:
  • a semantic generating unit configured to convert the external voice information into text information, and convert the text information into a control instruction.
  • the voice control music network playing device of the present invention wherein the execution unit comprises:
  • the voice control music network playing device of the present invention wherein the emotion recognition comprises a sinister emotion recognition and a swearing emotion recognition.
  • the invention has the beneficial effects of: performing smart home music playing control by adopting a combination of emotion recognition and voice recognition mode to enhance the home atmosphere.
  • FIG. 1 is a block diagram showing the principle of a voice controlled music network playing device according to a preferred embodiment of the present invention
  • FIG. 2 is a block diagram showing the principle of a voice recognition judging unit of a voice control music network playing device according to a preferred embodiment of the present invention.
  • FIG. 1 is a block diagram of a voice control music network playing device according to a preferred embodiment of the present invention, including: an audio signal collecting unit 1, a voice recognition determining unit 2, an information analyzing unit 3, an executing unit 4, and a network searching unit 5;
  • the signal acquisition unit 1 is configured to collect external voice information;
  • the voice recognition determination unit 2 is configured to perform voice recognition on the external voice information to obtain a music playback control instruction;
  • the information analysis unit 3 is configured to analyze the music playback control command.
  • the network search unit 5 is configured to connect to the wireless network, and search for music to be played according to the music track name;
  • the executing unit 4 is configured to play the corresponding music according to the music track name and the volume size information.
  • the smart home music playing control is performed by adopting a combination of the emotion recognition and the voice recognition mode to enhance the home atmosphere.
  • the voice recognition determining unit 2 includes: a first emotion recognition sub-unit 21, configured to perform voice tone emotion recognition on the external voice information, and generate a first emotion recognition result;
  • the second emotion recognition sub-unit 22 is configured to convert the external voice information into the text information, and perform semantic emotion recognition on the text information to generate a second emotion recognition result;
  • the emotion recognition result output sub-unit 23 is configured to use the first emotion recognition result and
  • the second emotion recognition result generates a user emotion recognition result according to the predetermined emotion recognition result judgment method.
  • emotion recognition includes derogatory emotion recognition and derogatory emotion recognition.
  • the speech recognition judging unit 2 further includes: a third emotion recognition subunit, configured to perform image recognition judgment on the facial image information acquired by the video signal acquisition module to generate a third emotion recognition result.
  • the above speech recognition judging unit 2 further includes: a semantic generating unit for external voice message
  • the information is converted into text information, and the text information is converted into a control instruction.
  • the executing unit includes: a table lookup subunit for querying the music storage table.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种语音控制音乐网络播放装置,包括:音频信号采集单元(1)、语音识别判断单元(2)、信息解析单元(3)、网络查找单元(4)、执行单元(5);其中,音频信号采集单元(1),用于采集外部语音信息;语音识别判断单元(2),用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元(3),用于解析音乐播放控制指令中所包含的音乐曲目名称、音量大小信息;网络查找单元(4),用于连接无线网络,并根据音乐曲目名称查找需要播放的音乐;执行单元(5),用于根据音乐曲目名称和音量大小信息播放相应的音乐。本装置通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。

Description

一种语音控制音乐网络播放装置 技术领域
本发明涉及智能家居技术领域,更具体地说,涉及一种语音控制音乐网络播放装置。
背景技术
智能家居是在互联网的影响之下物联化的体现。智能家居通过物联网技术将家中的各种设备连接到一起,提供家电控制、照明控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
随着智能家居的越来越普及,单一的家居识别控制模式已经不能满足人们的需要。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音控制音乐网络播放装置。
本发明解决其技术问题所采用的技术方案是:
构造一种语音控制音乐网络播放装置,其中,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、网络查找单元;其中,
所述音频信号采集单元,用于采集外部语音信息;
语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目名称、音量大小信息;
网络查找单元,用于连接无线网络,并根据所述音乐曲目名称查找需要播放的音乐;
执行单元,用于根据所述音乐曲目名称和所述音量大小信息播放相应的音乐。
本发明所述的语音控制音乐网络播放装置,其中,所述语音识别判断单元包括:
第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果。
本发明所述的语音控制音乐网络播放装置,其中,所述语音识别判断单元包括:
第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
本发明所述的语音控制音乐网络播放装置,其中,所述语音识别判断单元包括:
语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
本发明所述的语音控制音乐网络播放装置,其中,所述执行单元包括:
查表子单元,用于查询音乐存储表。
本发明所述的语音控制音乐网络播放装置,其中,所述情感识别包括褒义情感识别和贬义情感识别。
本发明的有益效果在于:通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图:
图1是本发明较佳实施例的语音控制音乐网络播放装置原理框图;
图2是本发明较佳实施例的语音控制音乐网络播放装置的语音识别判断单元原理框图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发 明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明较佳实施例的语音控制音乐网络播放装置原理框图如图1所示,包括:音频信号采集单元1、语音识别判断单元2、信息解析单元3、执行单元4、网络查找单元5;音频信号采集单元1,用于采集外部语音信息;语音识别判断单元2,用于对外部语音信息进行语音识别,得出音乐播放控制指令;信息解析单元3,用于解析音乐播放控制指令中所包含的音乐曲目名称、音量大小信息;网络查找单元5,用于连接无线网络,并根据音乐曲目名称查找需要播放的音乐;执行单元4,用于根据音乐曲目名称和音量大小信息播放相应的音乐。本实施例通过采用情感识别和语音识别模式相结合的识别方式进行智能家居音乐播放控制,提升家居氛围。
上述语音控制音乐网络播放装置中,如图2所示,语音识别判断单元2包括:第一情感识别子单元21,用于对外部语音信息进行语音音调情感识别,生成第一情感识别结果;第二情感识别子单元22,用于将外部语音信息转换为文字信息后,对文字信息进行语义情感识别生成第二情感识别结果;情感识别结果输出子单元23,用于基于第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果。其中,情感识别包括褒义情感识别和贬义情感识别。
进一步地,语音识别判断单元2还包括:第三情感识别子单元,用于对视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
上述语音识别判断单元2进一步包括:语义生成单元,用于将外部语音信 息转换为文字信息,并将文字信息转换成控制指令。
上述语音控制音乐网络播放装置中,执行单元包括:查表子单元,用于查询音乐存储表。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (6)

  1. 一种语音控制音乐网络播放装置,其特征在于,包括:音频信号采集单元、语音识别判断单元、信息解析单元、执行单元、网络查找单元;其中,
    所述音频信号采集单元,用于采集外部语音信息;
    语音识别判断单元,用于对所述外部语音信息进行语音识别,得出音乐播放控制指令;
    信息解析单元,用于解析所述音乐播放控制指令中所包含的音乐曲目名称、音量大小信息;
    网络查找单元,用于连接无线网络,并根据所述音乐曲目名称查找需要播放的音乐;
    执行单元,用于根据所述音乐曲目名称和所述音量大小信息播放相应的音乐。
  2. 根据权利要求1所述的语音控制音乐网络播放装置,其特征在于,所述语音识别判断单元包括:
    第一情感识别子单元,用于对所述外部语音信息进行语音音调情感识别,生成第一情感识别结果;
    第二情感识别子单元,用于将所述外部语音信息转换为文字信息后,对所述文字信息进行语义情感识别生成第二情感识别结果;
    情感识别结果输出子单元,用于基于所述第一情感识别结果和第二情感识别结果,根据预定的情感识别结果判断方法生成用户情感识别结果。
  3. 根据权利要求1所述的语音控制音乐网络播放装置,其特征在于,所述语音识别判断单元包括:
    第三情感识别子单元,用于对所述视频信号采集模块获取的面部图像信息进行图像识别判断,生成第三情感识别结果。
  4. 根据权利要求1所述的语音控制音乐网络播放装置,其特征在于,所述语音识别判断单元包括:
    语义生成单元,用于将所述外部语音信息转换为文字信息,并将所述文字信息转换成控制指令。
  5. 根据权利要求1所述的语音控制音乐网络播放装置,其特征在于,所述执行单元包括:
    查表子单元,用于查询音乐存储表。
  6. 根据权利要求2所述的语音控制音乐网络播放装置,其特征在于,所述情感识别包括褒义情感识别和贬义情感识别。
PCT/CN2016/093168 2016-08-04 2016-08-04 一种语音控制音乐网络播放装置 WO2018023522A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/093168 WO2018023522A1 (zh) 2016-08-04 2016-08-04 一种语音控制音乐网络播放装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/093168 WO2018023522A1 (zh) 2016-08-04 2016-08-04 一种语音控制音乐网络播放装置

Publications (1)

Publication Number Publication Date
WO2018023522A1 true WO2018023522A1 (zh) 2018-02-08

Family

ID=61072351

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/093168 WO2018023522A1 (zh) 2016-08-04 2016-08-04 一种语音控制音乐网络播放装置

Country Status (1)

Country Link
WO (1) WO2018023522A1 (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1983253A (zh) * 2005-12-15 2007-06-20 北京中科信利技术有限公司 一种提供音乐搜索服务的方法、设备和系统
CN201532764U (zh) * 2009-11-20 2010-07-21 余超 车载声控无线宽带网络音频播放器
CN103078915A (zh) * 2012-12-28 2013-05-01 深圳职业技术学院 一种基于云计算车联网的车载语音点歌系统及其方法
CN104866612A (zh) * 2015-06-06 2015-08-26 朱秀娈 一种从互联网处获取音乐文件的搜索方法
CN104951520A (zh) * 2015-06-06 2015-09-30 朱秀娈 从互联网处获取音乐文件的搜索平台
CN204928959U (zh) * 2015-09-16 2015-12-30 天翼爱音乐文化科技有限公司 一种移动终端的音乐播放系统
CN105719646A (zh) * 2016-01-22 2016-06-29 史唯廷 语音控制音乐播放方法及语音控制音乐播放装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1983253A (zh) * 2005-12-15 2007-06-20 北京中科信利技术有限公司 一种提供音乐搜索服务的方法、设备和系统
CN201532764U (zh) * 2009-11-20 2010-07-21 余超 车载声控无线宽带网络音频播放器
CN103078915A (zh) * 2012-12-28 2013-05-01 深圳职业技术学院 一种基于云计算车联网的车载语音点歌系统及其方法
CN104866612A (zh) * 2015-06-06 2015-08-26 朱秀娈 一种从互联网处获取音乐文件的搜索方法
CN104951520A (zh) * 2015-06-06 2015-09-30 朱秀娈 从互联网处获取音乐文件的搜索平台
CN204928959U (zh) * 2015-09-16 2015-12-30 天翼爱音乐文化科技有限公司 一种移动终端的音乐播放系统
CN105719646A (zh) * 2016-01-22 2016-06-29 史唯廷 语音控制音乐播放方法及语音控制音乐播放装置

Similar Documents

Publication Publication Date Title
JP6475386B2 (ja) 機器の制御方法、機器、及びプログラム
CN106154860B (zh) 一种智能开关及应用该智能开关的智能家居系统
JP6053097B2 (ja) 機器操作システム、機器操作装置、サーバ、機器操作方法およびプログラム
TWI557599B (zh) 語音控制方法及語音控制系統
CN103093755B (zh) 基于终端及互联网语音交互的网络家电控制方法及系统
WO2017012511A1 (zh) 语音控制方法、装置及投影仪设备
WO2017059815A1 (zh) 一种快速识别方法及家庭智能机器人
JP2019057297A (ja) 情報処理装置、情報処理方法およびプログラム
CN108831448A (zh) 语音控制智能设备的方法、装置及存储介质
CN106205648A (zh) 一种语音控制音乐网络播放方法
CN106251871A (zh) 一种语音控制音乐本地播放装置
JP2017144521A (ja) 情報処理装置、情報処理方法、及びプログラム
CN103428293A (zh) 交互式3d语音服务系统
TW201519172A (zh) 具有丟失提醒功能的可攜式電子裝置及其使用方法
CN109410931A (zh) 以电视为中心的移动终端物联网语音控制系统及方法
WO2018023514A1 (zh) 一种家居背景音乐控制系统
WO2018023515A1 (zh) 一种手势及情感识别家居控制系统
CN103645690A (zh) 一种语音控制数字家庭智能盒的方法
WO2018023523A1 (zh) 一种运动及情感识别家居控制系统
CN106251866A (zh) 一种语音控制音乐网络播放装置
WO2018023521A1 (zh) 一种语音控制音乐网络播放方法
WO2018023518A1 (zh) 一种语音交互识别智能终端
WO2018023519A1 (zh) 一种语音控制音乐本地播放方法
WO2018023522A1 (zh) 一种语音控制音乐网络播放装置
WO2018023513A1 (zh) 一种基于运动识别的家居控制方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16911119

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 08/07/2019)

122 Ep: pct application non-entry in european phase

Ref document number: 16911119

Country of ref document: EP

Kind code of ref document: A1