CN106686427A - 媒体播放设备 - Google Patents

媒体播放设备 Download PDF

Info

Publication number
CN106686427A
CN106686427A CN201710149674.1A CN201710149674A CN106686427A CN 106686427 A CN106686427 A CN 106686427A CN 201710149674 A CN201710149674 A CN 201710149674A CN 106686427 A CN106686427 A CN 106686427A
Authority
CN
China
Prior art keywords
module
voice
audio
instruction
clouds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710149674.1A
Other languages
English (en)
Inventor
黄华军
张正虎
严小龙
黄敏双
余凡
邵四喜
胡宁波
陈冬平
陈罗明
袁为揆
丁辉
杨沾
李育国
朱法景
彭定桃
李天�
唐文亮
刘瑛
唐文林
唐珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ganzhou Dehuida Technology Co ltd
Original Assignee
KEDY TECH (GANZHOU) ELECTRONICS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KEDY TECH (GANZHOU) ELECTRONICS Co Ltd filed Critical KEDY TECH (GANZHOU) ELECTRONICS Co Ltd
Priority to CN201710149674.1A priority Critical patent/CN106686427A/zh
Publication of CN106686427A publication Critical patent/CN106686427A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43637Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wireless protocol, e.g. Bluetooth, RF or wireless LAN [IEEE 802.11]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/12Picture reproducers
    • H04N9/31Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
    • H04N9/3179Video signal processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种媒体播放设备。所述设备包括:语音模块,用于输入用户的指令语音,并对所述指令语音进行语音识别;音频模块,用于对由云端下载的音频信号进行放大及输出;激光投影模块,用于驱动激光投影仪,以显示由所述云端下载的播放视频;无线模块,分别与所述语音模块、所述音频模块,以及所述激光投影模块连接,用于将所述指令语音的语音识别结果上传至所述云端,接收由所述云端根据所述语音识别结果下发的操作指令、所述音频信号,及所述播放视频。本发明实施例提供的媒体播放设备相较于现有设备更加智能,功能更加多样化。

Description

媒体播放设备
技术领域
本发明实施例涉及智能家居技术领域,尤其涉及一种媒体播放设备。
背景技术
传统类媒体产品只是基于媒体播放方面,对于其他功能方面融合甚少。这使得在智能家居日新月异发展的今天,这种传统类产品无法为用户带来更新的一流体验。
发明内容
针对上述技术问题,本发明实施例提供了一种媒体播放设备,以实现媒体播放设备的功能多样化。
本发明实施例提供了一种媒体播放设备,所述设备包括:
语音模块,用于输入用户的指令语音;
音频模块,用于对由云端下载的音频信号进行放大及输出;
激光投影模块,用于驱动激光投影仪,以显示由所述云端下载的播放视频;
无线模块,分别与所述语音模块、所述音频模块,以及所述激光投影模块连接,用于将用户输入的指令语音上传至所述云端,接收由所述云端根据所述指令语音下发的操作指令、所述音频信号,及所述播放视频。
优选的,所述语音模块通过麦克风获取用户输入的所述指令语音。
优选的,所述音频模块通过音频输出设备输出放大后的所述音频信号。
优选的,所述激光投影模块包括:数字光处理DLP模组。
优选的,所述无线模块通过WiFi接入点接入至所述云端。
本发明实施例提供的媒体播放设备,通过设置用于输入指令语音的语音模块,用于对音频信号进行放大和输出的音频模块,以及用于与云端保持无线连接的无线模块,使得媒体播放设备更加智能,功能更加多样化。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例提供的媒体播放设备的硬件结构图;
图2是本发明实施例提供的媒体播放系统的系统架构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明实施例提供了媒体播放设备的一种技术方案。参见图1,本发明实施例提供的媒体播放设备包括:语音模块11、音频模块12、激光投影模块13、无线模块14,以及手势检测模块15。
语音模块11通过麦克风获取用户输入的指令语音。在获取到用户输入的指令语音之后,语音模块11对输入的指令语音进行语音识别。可以理解的是,语音模块11对指令语音的识别结果是指令语音对应的文本。
音频模块12通过与之连接的音频输出设备将从云端设备21下载而来的音频信号进行播放。为了能够对上述音频信号进行有效的播放,音频模块12在将下载到的音频信号进行播放之前,首先需要对音频信号进行放大处理。另外,由于从云端设备21上下载得到的音频信号一般是数字形式的音频信号,在对该音频信号进行放大之前,还需要进行模数转换。
音频输出设备可以是各种形式的耳机或者音箱。
激光投影模块13用于将从云端设备下载得到的播放视频进行激光投影,以实现对播放视频的播放操作。
无线模块14分别与所述语音模块11、所述音频模块12,以及所述激光投影模块连接。并且,无线模块14还通过自身的无线通讯功能保持与云端设备21之间的通讯连接。
无线模块14将语音模块11对用户输入的指令语音上传至云端设备21。云端设备21在接收到上述指令语音之后,对上述指令语音进行语音识别,再对语音识别的识别结果进行模式匹配,来确定该语音识别结果对应的具体操作。然后,根据该具体操作,向无线模块14下发对媒体播放设备进行操作的操作指令。这些操作指令可以是播放指令、暂停指令、快进指令、快退指令、播放跳转指令、播放模式选择指令、音效选择指令、音效切换指令、媒体文件搜索指令、媒体文件点选指令等等。
在接收到云端设备21下发的具体的操作指令之后,无线模块14通过与其他模块之间的连接,指令相应的模块完成相应的动作。例如,在接收到播放指令之后,如果当前播放的媒体文件仅是音频文件,则无线模块14指令音频模块12对当前的音频文件进行播放。如果当前播放的媒体文件是视频文件,则无线模块14除了指令激光投影模块13播放该视频文件的影像,还需要指令音频模块12播放相应的音轨。如果当前播放的媒体文件是网页文件或者静态图片文件,则无线模块14仅需要指令激光投影模块13显示相应的图像。
手势检测模块15与全息投影模块13连接,用于检测用户输入的用于操控流媒体播放设备的指令手势。手势检测模块15可以通过检测手指在触控屏上的点击操作,进而完成手势识别操作,也可以通过检测触控笔在触控屏上的点击操作,从而完成手势的识别动作。
图2示出了本发明实施例提供的媒体播放系统。参见图2,在该媒体播放系统中,包括本发明实施例提供的媒体播放设备23。媒体播放设备23通过WiFi连接被连接至WiFi接入点22,并通过WiFi接入点22与云端设备21之间保持通讯。
在本发明实施例中,云端设备21是语音服务云端设备,其能够完成对语音指令的语音识别。具体的,云端设备21可以包括Amazone公司的Alexa语音服务云端,或者是科大讯飞语音服务云端。
另外,云端设备21还提供媒体文件的推送服务。这种推送服务可以通过内容分发网络(Content delivery network,CDN)技术实现。为了实现媒体文件的推送,云端设备21可以包括:爱奇艺视频、腾讯视频、京东购物的云端服务。
在媒体文件的推送时,云端设备21可以提供的媒体文件的分类检索。例如,可以将所有电影的媒体文件放置在“电影”的目录下,将所有教学视频的媒体文件放置在“教育”的目录下,根据不同的目录向用户提供媒体文件服务。而且,云端设备21能够自动记忆媒体文件的播放位置,用户下次访问相同的媒体文件时,自动跳转至前次的播放位置进行播放。
需要说明的是,媒体播放设备23上播放的所有媒体均是由云端实时下载进行播放的。媒体播放设备23本地并不存储相应的媒体文件。另外,用户对媒体播放设备23所有播放指令均通过语音输入。除语音以外,用户对媒体播放设备23没有其他的播放控制方式。因此,实现了对媒体播放设备23的智能控制,以及媒体播放的功能多样化。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种媒体播放设备,其特征在于,包括:
语音模块,用于输入用户的指令语音,并对所述指令语音进行语音识别;
音频模块,用于对由云端下载的音频信号进行放大及输出;
激光投影模块,用于驱动激光投影仪,以显示由所述云端下载的播放视频;
无线模块,分别与所述语音模块、所述音频模块,以及所述激光投影模块连接,用于将所述指令语音的语音识别结果上传至所述云端,接收由所述云端根据所述语音识别结果下发的操作指令、所述音频信号,及所述播放视频。
2.根据权利要求1所述的设备,其特征在于,还包括:
手势检测模块,与所述全息投影模块连接,用于检测用户输入的操作手势。
3.根据权利要求2所述的设备,其特征在于,所述语音模块通过麦克风获取用户输入的所述指令语音。
4.根据权利要求2所述的设备,其特征在于,所述音频模块通过音频输出设备输出放大后的所述音频信号。
5.根据权利要求2所述的设备,其特征在于,所述激光投影模块包括:数字光处理DLP模组。
6.根据权利要求2所述的设备,其特征在于,所述无线模块通过WiFi接入点接入至所述云端。
CN201710149674.1A 2017-03-14 2017-03-14 媒体播放设备 Pending CN106686427A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710149674.1A CN106686427A (zh) 2017-03-14 2017-03-14 媒体播放设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710149674.1A CN106686427A (zh) 2017-03-14 2017-03-14 媒体播放设备

Publications (1)

Publication Number Publication Date
CN106686427A true CN106686427A (zh) 2017-05-17

Family

ID=58828811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710149674.1A Pending CN106686427A (zh) 2017-03-14 2017-03-14 媒体播放设备

Country Status (1)

Country Link
CN (1) CN106686427A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109375460A (zh) * 2018-12-27 2019-02-22 成都市极米科技有限公司 智能投影仪的控制方法及智能投影仪

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202939967U (zh) * 2012-11-29 2013-05-15 广东欧珀移动通信有限公司 智能蓝光播放机
CN203775389U (zh) * 2014-01-10 2014-08-13 杭州微纳科技有限公司 语音控制的无线互联网音箱
CN104754261A (zh) * 2013-12-26 2015-07-01 深圳市快播科技有限公司 一种投影设备及投影方法
CN205282093U (zh) * 2015-12-15 2016-06-01 广州酷狗计算机科技有限公司 音频播放设备
CN105898256A (zh) * 2016-05-30 2016-08-24 佛山市章扬科技有限公司 一种动作识别无屏电视
CN106297839A (zh) * 2016-09-30 2017-01-04 四川九洲电器集团有限责任公司 一种音频播放设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202939967U (zh) * 2012-11-29 2013-05-15 广东欧珀移动通信有限公司 智能蓝光播放机
CN104754261A (zh) * 2013-12-26 2015-07-01 深圳市快播科技有限公司 一种投影设备及投影方法
CN203775389U (zh) * 2014-01-10 2014-08-13 杭州微纳科技有限公司 语音控制的无线互联网音箱
CN205282093U (zh) * 2015-12-15 2016-06-01 广州酷狗计算机科技有限公司 音频播放设备
CN105898256A (zh) * 2016-05-30 2016-08-24 佛山市章扬科技有限公司 一种动作识别无屏电视
CN106297839A (zh) * 2016-09-30 2017-01-04 四川九洲电器集团有限责任公司 一种音频播放设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109375460A (zh) * 2018-12-27 2019-02-22 成都市极米科技有限公司 智能投影仪的控制方法及智能投影仪
CN109375460B (zh) * 2018-12-27 2021-03-23 成都极米科技股份有限公司 智能投影仪的控制方法及智能投影仪

Similar Documents

Publication Publication Date Title
KR101664754B1 (ko) 정보 취득 방법, 장치, 프로그램 및 기록매체
US9516081B2 (en) Reduced latency electronic content system
US20240152560A1 (en) Scene aware searching
KR102545837B1 (ko) 디스플레이 장치, 디스플레이 장치의 배경음악 제공방법 및 배경음악 제공 시스템
US20140279889A1 (en) Intelligent device connection for wireless media ecosystem
CN106796496A (zh) 显示设备及其操作方法
CN103460128A (zh) 借助智能电话和音频水印的多种语言同步电影配音
CN207882853U (zh) 一种智能信息发布系统
CN105117102A (zh) 音频界面显示方法和装置
CN107509092A (zh) 机顶盒实时播放音频的方法、机顶盒、终端以及存储介质
US11736766B2 (en) Systems and methods for determining usage information
CN103905925A (zh) 一种节目重复播放的方法和终端
CN103856826A (zh) 视频信号播放方法与装置
US11837250B2 (en) Audio playout report for ride-sharing session
US11812099B2 (en) System and method for dynamic playback switching of live and previously recorded audio content
US10964316B2 (en) Performing action on active media content
KR20190100630A (ko) 디스플레이 장치 및 그의 동작 방법
US20130117464A1 (en) Personalized media filtering based on content
CN105162839B (zh) 数据处理方法、装置及系统
CN110139164A (zh) 一种语音评论播放方法、装置,终端设备及存储介质
CN106686427A (zh) 媒体播放设备
CN103200451A (zh) 电子设备和音频输出方法
CN108574860A (zh) 多媒体资源播放方法及装置
Tidal Podcasting: A practical guide for librarians
CN105812857A (zh) 动态交互讲座系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171130

Address after: Jiangxi Province, Ganzhou city fire 342100 Anyuan county road get Huida science and Technology Park

Applicant after: GANZHOU DEHUIDA TECHNOLOGY Co.,Ltd.

Address before: 342100 Anyuan County of Jiangxi Province, Ganzhou City Industrial Park, Kowloon District Cody Avenue

Applicant before: KEDY TECH (GANZHOU) ELECTRONICS Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517