CN103794215A - 基于语音控制的手持终端、系统及其基于语音的控制方法 - Google Patents

基于语音控制的手持终端、系统及其基于语音的控制方法 Download PDF

Info

Publication number
CN103794215A
CN103794215A CN201210421700.9A CN201210421700A CN103794215A CN 103794215 A CN103794215 A CN 103794215A CN 201210421700 A CN201210421700 A CN 201210421700A CN 103794215 A CN103794215 A CN 103794215A
Authority
CN
China
Prior art keywords
handheld terminal
voice
speech data
cloud server
operational order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210421700.9A
Other languages
English (en)
Inventor
张洪星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Feixun Data Communication Technology Co Ltd
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201210421700.9A priority Critical patent/CN103794215A/zh
Publication of CN103794215A publication Critical patent/CN103794215A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本实发明提供了基于语音控制的手持终端、系统及其基于语音的控制方法,所述手持终端包括声音收集模块、无线通讯模块、基带芯片、摄像头以及存储器,所述基带芯片分别与声音收集模块、无线通讯模块、摄像头和存储器连接;所述声音手机模块,通过话筒收集语音信息并传输到无线通讯模块;所述无线通讯模块,用于将接收到的语音信息发送到云端服务器进行解析,同时接收云端服务器发送的控制命令数据并传输给基带芯片;所述基带芯片与无线通讯模块、摄像头和存储器连接,用于将无线通讯模块传输的控制命令信息传送给摄像头,执行相应的操作,同时,控制照片和摄像的存储。

Description

基于语音控制的手持终端、系统及其基于语音的控制方法
技术领域
本发明涉及控制领域,具体是基于语音控制的手持终端、系统及其基于语音的控制方法。
背景技术
近年来,随着数码拍照技术的不断提高,数码摄像头的基本属性功能已接近完善。目前的数码摄像头有两种操作方式:手动操作和自动操作。手动操作使得用户在平时的使用中给自己拍照时,必须依赖于别人的帮助,完成拍照;自动操作则利用三角支架,将数码相机等手持终端固定好,设定需要延迟的拍照时间,用户返回拍摄区域进行拍照。
由于操作的局限性,上述两种操作方式在一定程度上不能够满足用户的拍摄需求。
发明内容
为了克服上述现有技术中的不足,本发明提供了基于语音控制的手持终端、系统及其基于语音的控制方法,以提供给用户更为方便操作的手持终端设备。
本发明主要采用以下技术方案实现:
基于语音控制的手持终端,包括,声音收集模块、无线通讯模块、基带芯片、摄像头和存储器,所述基带芯片分别与声音收集模块、无线通讯模块、摄像头和存储器连接,所述声音收集模块,通过话筒收集语音信息,发送给基带芯片进行压缩,通过无线通讯模块将压缩后的语音数据发送到云端服务器进行解析,并接收云端服务器发回的操作命令信息,所述基带芯片根据所述操作命令信息,生成控制指令并发送给摄像头。 
进一步的,所述声音收集模块的话筒包括内置话筒。
进一步的,所述声音收集模块的话筒包括普通线控耳机。
进一步的,所述声音收集模块的话筒包括蓝牙耳机。
基于语音控制的系统,包括:
手持终端、云端服务器,所述手持终端通过无线网络与云端服务器连接;
所述手持终端,用于收集语音信息并压缩打包,通过无线网络将压缩后的语音数据发送到云端服务器;
所述云端服务器,用于接收所述语音数据并进行解压缩,解析所述语音数据并生成操作命令信息,向所述手持终端返回所述操作命令信息;
所述手持终端接收到所述操作命令信息后,根据所述操作命令信息生成控制指令,并发送给摄像头。
进一步地,所述云端服务器具体包括:
接收模块,用于接收所述手持终端发送的语音数据;
解压缩模块,用于对所述语音数据进行解压缩;
解析模块,用于将解压缩后的语音数据与存储的语音操作样本数据进行比对,若比对成功,则生成操作命令信息;
发送模块,用于向所述手持终端返回所述操作命令信息。
基于语音的手持终端控制方法,所述方法包括:
若用户选择了语音控制模式,则自动进行无线网络接入,并与服务器进行连接;
连接成功后,手持终端将收集的语音进行压缩,并向云端服务器发送压缩后的语音数据;
云端服务器接收所述语音数据进行解压缩,并解析所述语音数据生成操作命令信息,向所述手持终端返回所述操作命令信息;
手持终端接收到所述操作命令信息后,根据所述操作命令信息生成控制指令,并发送给摄像头。
进一步的,所述云端服务器接收所述语音数据进行解压缩,并解析所述语音数据生成操作命令信息,并向所述手持终端返回所述操作命令信息具体包括:
云端服务器接收到所述语音数据进行解压缩,并将解压缩后的语音数据与存储的语音操作样本数据进行比对,若比对成功,则生成操作命令信息,并返回所述操作命令信息,其中,所述操作命令信息包含比对具体操作内容。
进一步地,所述手持终端接收到所述操作命令信息后,根据所述操作命令信息生成控制指令具体包括:
手持终端接收到所述操作命令信息进行解析,解析的内容包括识别到的具体操作命令,并生成摄像头控制指令。
进一步,所述方法还包括:
若样本对比失败,则发送提示信息以提示用户重新进行语音操作。
本发明实施例的优点是:
1. 服务器端对语音数据处理,不需要在每台设备上投入语音识别芯片,节省成本; 2. 突破传统的接触式操作方式,用户可在双手不方便或极端环境下进行拍照。
附图说明
图1为本发明基于语音控制手持终端的模块结构示意图;
图2为本法明基于语音控制的系统图;
图3为本法明基于语音的手持终端控制方法的流程图。
具体实施方式
为了使本发明实施例的目的,技术方案和优点更加清楚,下面将通过本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地、完整的描述,显然,所描述实施例是本发明实施例的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,为本发明实施例基于语音控制的手持终端。
基于语音控制的手持终端,所述手持终端包括:声音收集模块、无线通讯模块、基带芯片、摄像头和存储器,所述基带芯片分别与声音收集模块、无线通讯模块、摄像头和存储器连接;
声音收集模块,用于通过话筒收集语音信息;
在需要通过语音控制的场景下,用户将手持终端设备放置在固定位置,用户可以在内置话筒收集声音的范围内,或者用户使用蓝牙耳机并在蓝牙耳机可用范围内讲“拍照”、“启动闪光灯”等语音信息,通过声音收集模块完成对语音信息的收集。
基带芯片,用于将收集的语音信息进行压缩,并通过无线通讯模块发送到云端服务器,同时将接收的控制命令信息,解析为控制指令,发送到摄像头;
在声音收集模块完成收集语音信息的功能后,基带芯片将收集的语音信息,按照预定的解压缩方式,进行压缩打包成语音数据,通过无线通讯模块发送到云端服务器,同时将无线通讯模块接收的云端服务器返回的控制命令信息,进行解析,转换成为控制指令,发送到摄像头,执行相应的操作。
无线通讯模块,用于通过无线网络与云端服务器连接;
所述声音收集模块的话筒,可以是内置话筒、普通线控耳机和蓝牙耳机。
如图2所示,为本发明实施例基于语音控制的系统。
基于语音控制的系统,所述系统包括:手持终端、云端服务器,所述手持终端通过无线网络与云端服务器连接;
所述手持终端,用于收集语音信息并压缩打包,通过无线网络将压缩后的语音数据发送到云端服务器;
在进行语音控制时,手持终端通过内置话筒或者蓝牙耳机收集语音信息,手持终端的基带芯片对语音信息进行压缩打包,并通过无线通讯模块发送到云端服务器,手持终端完成语音信息的收集和发送。
所述云端服务器,用于接收所述语音数据并进行解压缩,解析所述语音数据并生成操作命令信息,向所述手持终端返回所述操作命令信息;
云端服务器接收到语音数据后,按照预定的解压缩方式对语音数据进行解压,通过与存储的语音操作样本数据进行比对,比对成功后,将与语音信息对应的控制命令信息,通过无线网络发送到手持终端;如果比对不成功,则发送提示信息到手持终端,至此云端服务器完成语音信息的比对,并返回相应的控制命令信息。
所述手持终端接收所述操作命令信息,根据所述操作命令信息生成控制指令,并发送给摄像头。
手持终端接收到云端服务器返回的控制命令信息后,基带芯片对上述控制命令信息进行解析,生成对应的控制指令,发送到摄像头,手持终端完成语音操作功能。
为了实现本发明的发明目的,本发明实施例还提供了基于语音的控制方法,所述方法包括:
若用户选择了语音控制模式,则自动进行无线网络接入,并与云端服务器连接;
连接成功后,手持终端将收集的语音信息进行压缩,并向云端服务器发送压缩后的语音数据;
云端服务器接收所述语音数据进行解压缩,并解析所述语音数据生成操作命令信息,向所述手持终端返回所述操作命令信息,具体包括:
云端服务器接收到所述语音数据进行解压缩,并解析压缩后的语音数据与存储的语音操作样本数据进行比对,若比对成功,则生成操作命令信息,并返回所述操作命令信息,其中,所述操作命令信息包含比对具体操作内容;
手持终端接收到所述操作命令信息进行解析,解析的内容包括识别到的具体操作命令,并生成摄像头控制指令;
若样本比对失败,则发送提示信息以提示用户重新进行语音操作。
手持终端接收到所述操作命令信息后,根据操作命令信息生成控制指令,并发送给摄像头。
在具体实施方法下,假设所述手持终端是数码相机,所述数码相机包括声音手机模块,无线通讯模块,基带芯片,摄像头和存储器,下面具体说明本发明的基于语音的控制方法。
结合附图1,2,3,对其具体实施步骤说明如下:
S101、打开数码相机,选择语音控制模式,自动通过无线网络与云端服务器连接;
S102、通过话筒对数码相机发出“拍照”、“启用闪光灯”等语音信息;
S103、数码相机通过声音收集模块,收集语音信息,发送到基带芯片;
S104、基带芯片将收集的语音信息进行压缩语音数据,通过无线通讯模块发送到云端服务器;
S105、云端服务器接收到语音数据进行解压缩,并解析语音数据生成操作命令信息,向数码相机返回操作命令信息;
S106、如果云端服务器进行样本比对失败,则发送提示信息到数码相机,提示用户重新进行语音操作;
S107、数码相机接收到操作命令信息进行解析,并生成相应的控制指令;
S108、数码相机通过基带芯片将控制指令,发送到摄像头。
一个示例的实际操作场景下,用户将手持终端设备打开选择语音控制模式放置在固定位置,用户可以在内置话筒收集声音的范围内,或者用户使用蓝牙耳机并在蓝牙耳机可用范围内讲“拍照”,相机终端设备将会自动拍照并存储照片在存储器中。
另一个示例的实际操作场景下,用户将手持终端打开选择语音控制模式放置在固定位置,用户可以在内置话筒收集声音的范围内,或者用户使用蓝牙耳机并在蓝牙耳机可用范围内讲“启用闪光灯”,相机终端设备将会自动将闪光灯模式设置为开启。
本发明实施例通过上述基于语音控制的手持终端、系统及其基于语音的控制方法,通过服务器端对语音数据处理,不需要在每台设备上投入语音识别芯片,节省成本,同时突破传统的手持终端操作方法,用户可在双手不方便或极端环境下进行拍照。
本领域技术人员应该认识到,上述的具体实施方式只是示例性的,是为了使本领域技术人员能够更好的理解本专利内容,不应理解为是对本专利保护范围的限制,只要是根据本专利所揭示精神所作的任何等同变更或修饰,均落入本专利保护范围。

Claims (10)

1.基于语音控制的手持终端,其特征在于,所述手持终端包括:声音收集模块、无线通讯模块、基带芯片、摄像头和存储器,所述基带芯片分别与声音收集模块、无线通讯模块、摄像头和存储器连接;所述声音收集模块,通过话筒收集语音信息,发给基带芯片进行压缩,并通过无线通讯模块将压缩后的语音数据发送到云端服务器进行解析,并接受云端服务器发回的操作命令信息,所述基带芯片根据操作命令信息,生成控制指令并发送给摄像头。
2.根据权利要求1所述的基于语音控制的手持终端,其特征在于,所述声音收集模块的话筒,包括内置话筒。
3.根据权利要求2所述的基于语音控制的手持终端,其特征在于,所述声音收集模块的话筒,包括普通线控耳机。
4.根据权利要求2所述的基于语音控制的手持终端,其特征在于,所述声音收集模块的话筒,包括蓝牙耳机。
5.基于语音控制的系统,其特征在于,所述系统包括:手持终端、云端服务器,所述手持终端通过无线网络与云端服务器连接;
所述手持终端,用于收集语音信息并压缩打包,通过无线网络将压缩后的语音数据发送到云端服务器;
所述云端服务器,用于接收所述语音数据并进行解压缩,解析所述语音数据并生成操作命令信息,向所述手持终端返回所述操作命令信息;
所述手持终端接收到所述操作命令信息后,根据所述操作命令信息生成控制指令,并发送给摄像头。
6.根据权利要求5所述基于语音控制的系统,其特征在于,所述云端服务器具体包括:
接收模块,用于接收所述手持终端发送的语音数据;
解压缩模块,用于对所述语音数据进行解压缩;
解析模块,用于将解压缩后的语音数据与存储的语音操作样本数据进行比对,若比对成功,则生成操作命令信息;
发送模块,用于向所述手持终端返回所述操作命令信息。
7.基于语音的手持终端控制方法,其特征在于,包括如下步骤:
若用户选择了语音控制模式,则自动进行无线网络接入,并与云端服务器进行连接;
连接成功后,手持终端将收集的语音信息进行压缩,并向云端服务器发送压缩后的语音数据;
云端服务器接收所述语音数据进行解压缩,并解析所述语音数据生成操作命令信息,并向所述手持终端返回所述操作命令信息;
手持终端接收到所述操作命令信息后,根据所述操作命令信息生成控制指令,并发送给摄像头。
8. 根据权利要求7所述的基于语音的手持终端控制方法,其特征在于,所述云端服务器接收语音数据进行解压缩,并解析所述语音数据生成操作命令信息,并向所述手持终端返回操作命令信息具体包括:
云端服务器接收到所述语音数据进行解压缩,并将解压缩的语音数据与存储的语音操作样本数据进行比对,若比对成功,则生成操作命令信息,并返回所述操作命令信息,其中,所述操作命令信息包含比对具体操作内容。
9.根据权利要求7所述的基于语音的手持终端控制方法,其特征在于,所述云端服务器接收语音数据进行解压缩,并解析所述语音数据生成操作命令信息,并向所述手持终端返回操作命令信息具体包括:
手持终端接收到所述操作命令信息进行解析,解析的内容包括识别到的具体操作命令,并生成摄像头控制指令。
10. 根据权利要求7所述的基于语音的手持终端控制方法,其特征在于,所述方法还包括:
    若样本比对失败,则发送提示信息以提示用户重新进行语音操作。
CN201210421700.9A 2012-10-30 2012-10-30 基于语音控制的手持终端、系统及其基于语音的控制方法 Pending CN103794215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210421700.9A CN103794215A (zh) 2012-10-30 2012-10-30 基于语音控制的手持终端、系统及其基于语音的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210421700.9A CN103794215A (zh) 2012-10-30 2012-10-30 基于语音控制的手持终端、系统及其基于语音的控制方法

Publications (1)

Publication Number Publication Date
CN103794215A true CN103794215A (zh) 2014-05-14

Family

ID=50669802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210421700.9A Pending CN103794215A (zh) 2012-10-30 2012-10-30 基于语音控制的手持终端、系统及其基于语音的控制方法

Country Status (1)

Country Link
CN (1) CN103794215A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104394491A (zh) * 2014-12-09 2015-03-04 北京奇虎科技有限公司 一种智能耳机、云服务器以及音量调节方法和系统
CN105516605A (zh) * 2016-01-20 2016-04-20 广东欧珀移动通信有限公司 一种拍摄方法和装置
CN106683674A (zh) * 2017-01-16 2017-05-17 西安电子科技大学 利用语音控制智能家居的系统及方法
CN107004416A (zh) * 2014-11-20 2017-08-01 雅马哈株式会社 信息发送装置、信息发送方法、引导系统和通信系统
CN108234881A (zh) * 2018-02-07 2018-06-29 深圳市高斯贝尔家居智能电子有限公司 一种语音控制的网络摄像机、视频监控系统以及控制方法
WO2019169684A1 (zh) * 2018-03-06 2019-09-12 深圳市沃特沃德股份有限公司 基于蓝牙实现语音遥控的方法、装置和终端设备
CN111899730A (zh) * 2019-05-06 2020-11-06 深圳市冠旭电子股份有限公司 语音控制方法、装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201133999Y (zh) * 2007-12-27 2008-10-15 天津三星电子有限公司 照相机用语音控制器
CN101414112A (zh) * 2007-10-16 2009-04-22 康佳集团股份有限公司 一种照相防抖的方法及其装置
CN201830294U (zh) * 2010-08-18 2011-05-11 深圳市子栋科技有限公司 基于语音命令的导航系统及导航服务器
CN201830335U (zh) * 2010-08-18 2011-05-11 深圳市子栋科技有限公司 基于语音命令的视音频播放系统及视音频播放服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414112A (zh) * 2007-10-16 2009-04-22 康佳集团股份有限公司 一种照相防抖的方法及其装置
CN201133999Y (zh) * 2007-12-27 2008-10-15 天津三星电子有限公司 照相机用语音控制器
CN201830294U (zh) * 2010-08-18 2011-05-11 深圳市子栋科技有限公司 基于语音命令的导航系统及导航服务器
CN201830335U (zh) * 2010-08-18 2011-05-11 深圳市子栋科技有限公司 基于语音命令的视音频播放系统及视音频播放服务器

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107004416A (zh) * 2014-11-20 2017-08-01 雅马哈株式会社 信息发送装置、信息发送方法、引导系统和通信系统
CN104394491A (zh) * 2014-12-09 2015-03-04 北京奇虎科技有限公司 一种智能耳机、云服务器以及音量调节方法和系统
CN105516605A (zh) * 2016-01-20 2016-04-20 广东欧珀移动通信有限公司 一种拍摄方法和装置
CN106683674A (zh) * 2017-01-16 2017-05-17 西安电子科技大学 利用语音控制智能家居的系统及方法
CN108234881A (zh) * 2018-02-07 2018-06-29 深圳市高斯贝尔家居智能电子有限公司 一种语音控制的网络摄像机、视频监控系统以及控制方法
CN108234881B (zh) * 2018-02-07 2020-04-28 深圳市高斯贝尔家居智能电子有限公司 一种语音控制的网络摄像机、视频监控系统以及控制方法
WO2019169684A1 (zh) * 2018-03-06 2019-09-12 深圳市沃特沃德股份有限公司 基于蓝牙实现语音遥控的方法、装置和终端设备
CN111899730A (zh) * 2019-05-06 2020-11-06 深圳市冠旭电子股份有限公司 语音控制方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN103794215A (zh) 基于语音控制的手持终端、系统及其基于语音的控制方法
KR100690243B1 (ko) 휴대 단말기의 카메라 제어 장치 및 방법
WO2014079382A1 (zh) 语音传输方法、终端、语音服务器及语音传输系统
CN104301399A (zh) 一种语音远程控制音箱的系统及方法
CN102196207A (zh) 语音控制电视机的方法、装置和系统
CN201629037U (zh) 遥控器
CN103227907A (zh) 遥控图像采集装置的方法、装置及系统
EP1758356A3 (en) Mobile phone, communication terminal, phone call method and phone call program
CN102546953A (zh) 一种全语音操控移动终端的系统及方法
CN111276135B (zh) 网络语音识别方法、网络业务交互方法及智能耳机
CN103916978A (zh) 一种建立无线连接的方法及电子设备
CN109637534A (zh) 语音遥控方法、系统、受控装置及计算机可读存储介质
JP2021150946A (ja) ワイヤレスイヤホンデバイスとその使用方法
CN101827196A (zh) 一种视频通信方法、系统及设备
CN202190331U (zh) 语音控制电视机的系统和装置
CN105281811A (zh) 一种语音数据传输处理的方法和终端
CN104656905A (zh) 语音遥控器的语音启动方法和装置
CN111885412B (zh) Hdmi信号传屏方法及无线传屏器
EP3059731A1 (en) Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium
CN100563334C (zh) 在无线终端的视频电话模式中发送图像数据的方法
KR100678034B1 (ko) 휴대단말기에서 블루투스 통신을 이용한 파일 공유 방법
CN110034858B (zh) 数据包重传方法、装置、移动终端及存储介质
CN109756933B (zh) 一种实现低功耗通信的方法及装置
CN108280189B (zh) 一种基于智能笔的语音搜题方法及系统
CN105227741A (zh) 一种智能设备进行音量提醒的方法以及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140514

RJ01 Rejection of invention patent application after publication