CN113407023A - 一种蓝牙音箱控制方法、系统及设备 - Google Patents
一种蓝牙音箱控制方法、系统及设备 Download PDFInfo
- Publication number
- CN113407023A CN113407023A CN202110569954.4A CN202110569954A CN113407023A CN 113407023 A CN113407023 A CN 113407023A CN 202110569954 A CN202110569954 A CN 202110569954A CN 113407023 A CN113407023 A CN 113407023A
- Authority
- CN
- China
- Prior art keywords
- instruction
- coordinate
- gesture
- value
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 36
- 230000006870 function Effects 0.000 claims description 35
- 210000000746 body region Anatomy 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 230000009471 action Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Abstract
本申请涉及一种蓝牙音箱控制方法、系统及设备,属于音箱的技术领域,其方法包括开启摄像头,并利用摄像头获取手势开始指令,根据手势开始指令采集第一图像;将第一图像输入到分类器中,并利用分类器确定第一图像中是否存在开始手势;若是,则获取开始手势检测框的坐标,并将该坐标记作第一坐标,并利用摄像头获取手势停止指令,根据手势停止指令采集第二图像;将第二图像输入到分类器中,并利用分类器确定第二图像中是否存在停止手势;若是,则获取停止手势检测框的坐标,并将该坐标记作第二坐标;根据第一坐标和第二坐标获取功能指令;将功能指令发送至蓝牙控制终端,获取并播放蓝牙控制终端返回的音频信息。本申请具有远程控制蓝牙音箱的效果。
Description
技术领域
本申请涉及音箱的技术领域,尤其是涉及一种蓝牙音箱控制方法、系统及设备。
背景技术
蓝牙音箱是一种内置蓝牙芯片、以蓝牙连接取代传统线材连接的音响设备,通过与手机、平板电脑、或笔记本电脑等蓝牙播放设备连接。
公开号CN105575094A的中国专利公开了多功能蓝牙音箱的控制方法及系统,其方法包括移动终端通过蓝牙与蓝牙音箱建立通信连接;移动终端通过通信连接向蓝牙音箱发送功能改变指令;根据功能改变指令,切换至功能改变指令的目的转换功能所对应的工作模式;获取通过蓝牙音箱上的控制按钮输入的控制信息;根据目的转换功能将控制信息通过蓝牙发送至目的转换功能所对应的控制对象。如此,通过功能改变指令实现蓝牙音箱功能的改变。
针对上述中的相关技术,发明人认为当用户与蓝牙音箱的距离较远时,难以通过蓝牙音箱上的控制按钮输入的控制信息,从而导致对蓝牙音箱的控制失败。
发明内容
为了远程控制蓝牙音箱,本申请提供一种蓝牙音箱控制方法。
第一方面,本申请提供一种蓝牙音箱控制方法,采用如下的技术方案:
一种蓝牙音箱控制方法,包括:
开启摄像头,并利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像;
将所述第一图像输入到分类器中,并利用所述分类器确定所述第一图像中是否存在开始手势;
若是,则获取开始手势检测框的坐标,并将该坐标记作第一坐标,并利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像;
将所述第二图像输入到分类器中,并利用所述分类器确定所述第二图像中是否存在停止手势;
若是,则获取停止手势检测框的坐标,并将该坐标记作第二坐标;
根据所述第一坐标和所述第二坐标获取功能指令;
将所述功能指令发送至蓝牙控制终端,获取并播放所述蓝牙控制终端返回的音频信息。
通过采用上述技术方案,根据人体挥动手的动作生成功能指令,手开始挥动时的手势为开始手势,手结束挥动时的手势为停止手势,根据第一坐标和第二坐标判断手的挥动动作以生成相应的功能指令,从而通过人体的手势动作实现对蓝牙音箱的远程控制。
优选的,所述利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像包括:
利用所述摄像头获取第一视频流,将所述第一视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述开始手势;
若是,则开启计时器,获取第一计时值;
判断所述第一计时值是否不小于第一阈值;
若是,则判定为已获取所述手势开始指令,开始采集所述第一图像,并关闭所述计时器。
通过采用上述技术方案,若第一计时值不小于第一阈值,则表示开始手势维持有一段时间,进而表示人体有意通过手势控制蓝牙音箱,从而提高生成的功能指令的准确性。
优选的,所述利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像包括:
利用所述摄像头获取第二视频流,将所述第二视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述停止手势;
若是,则开启所述计时器,获取第二计时值;
判断所述第二计时值是否不小于第二阈值;
若是,则判定为已获取所述手势停止指令,开始采集所述第二图像,并关闭所述计时器。
通过采用上述技术方案,若第二计时值不小于第二阈值,则表示停止手势维持有一段时间,进而表示人体有意结束挥动动作,从而进一步提高生成的功能指令的准确性。
优选的,所述根据所述第一坐标和所述第二坐标获取功能指令包括:
根据所述第一坐标计算得到所述开始手势检测框的第一中心坐标;
根据所述第二坐标计算得到所述停止手势检测框的第二中心坐标;
计算所述第二中心坐标的横坐标值与所述第一中心坐标的横坐标值的差值,并将该差值记作第一差值;
计算所述第二中心坐标的纵坐标值与所述第一中心坐标的纵坐标值的差值,并将该差值记作第二差值;
若所述第一差值的绝对值不小于第一预设值,且所述第二差值的绝对值不大于第二预设值,则生成播放指令,其中,所述第一预设值大于所述第二预设值;
若所述第二差值的绝对值不小于第三预设值,且所述第一差值的绝对值不大于第四预设值,则生成音量指令,其中,所述第三预设值大于所述第四预设值。
通过采用上述技术方案,人体挥动手时容易产生方位上的偏差,第一差值的绝对值不小于第一预设值,且第二差值的绝对值不大于第二预设值表示允许手在进行左右移动的同时产生上下方位上错误,第二差值的绝对值不小于第三预设值,且第一差值的绝对值不大于第四预设值表示允许手在进行上下移动的同时产生左右方位上错误。
优选的,所述功能指令包括播放上一首指令和播放下一首指令;在所述生成所述播放指令之后还包括:
判断所述第一差值是否小于零,若是,则生成所述播放上一首指令;若否,则生成所述播放下一首指令。
优选的,所述功能指令包括音量调低指令和音量调高指令;在所述生成音量指令之后还包括:
判断所述第二差值是否小于零,若是,则生成所述音量调低指令;若否,则生成所述音量调高指令。
优选的,在所述生成音量指令之后还包括:
利用所述分类器对所述第一图像中的人体区域进行检测或者利用所述分类器对所述第二图像中的人体区域进行检测,确定人体检测框的坐标;
计算所述人体检测框的坐标中的最大纵坐标值与最小纵坐标值的差值,并将该差值记作第三差值;
根据所述第二差值、所述第三差值以及音量总值计算音量调节数值;
将所述音量调节数值发送至所述蓝牙控制终端。
通过采用上述技术方案,若第二差值与第三差值的绝对值之比较大,则表示手上下挥动的幅度较大,相应的音量调节数值也较大,若第二差值与第三差值的绝对值之比较小,则表示手上下挥动的幅度较小,相应的音量调节数值也较小,因此利用第二差值和第三差值可以较为准确地计算出音量调节数值。
优选的,所述功能指令包括开始播放指令和停止播放指令;还包括:
开机并初始化计数器;
若所述第一差值的绝对值不大于第五预设值,且所述第二差值的绝对值不大于第六预设值,则计数值加一;
判断所述计数值是否为单数,若是,则生成所述开始播放指令,若否,则生成所述停止播放指令;
在将所述开始播放指令或者所述停止播放指令发送至蓝牙控制终端之后,返回利用所述摄像头获取第一视频流,将所述第一视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述开始手势的步骤。
第二方面,本申请提供一种蓝牙音箱控制系统,采用如下的技术方案:
一种蓝牙音箱控制系统,包括,
第一图像采集模块,用于开启摄像头,并利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像;
开始手势确定模块,用于将所述第一图像输入到分类器中,并利用所述分类器确定所述第一图像中是否存在开始手势,若是,则转入第一坐标获取模块和第二图像采集模块;
所述第一坐标获取模块,用于获取开始手势检测框的坐标,并将该坐标记作第一坐标;
所述第二图像采集模块,用于利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像;
停止手势确定模块,用于将所述第二图像输入到分类器中,并利用所述分类器确定所述第二图像中是否存在停止手势,若是,则转入第二坐标获取模块;
所述第二坐标获取模块,用于获取停止手势检测框的坐标,并将该坐标记作第二坐标;
功能指令获取模块,用于根据所述第一坐标和所述第二坐标获取功能指令;以及,
音频信息播放模块,用于将所述功能指令发送至蓝牙控制终端,获取并播放所述蓝牙控制终端返回的音频信息。
通过采用上述技术方案,根据人体挥动手的动作生成功能指令,手开始挥动时的手势为开始手势,手结束挥动时的手势为停止手势,根据第一坐标和第二坐标判断手的挥动动作以生成相应的功能指令,从而通过人体的手势动作实现对蓝牙音箱的远程控制。
第三方面,本申请提供一种蓝牙音箱设备,采用如下的技术方案:
一种蓝牙音箱设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行第一方面任一项所述的蓝牙音箱控制方法的计算机程序。
通过采用上述技术方案,根据人体挥动手的动作生成功能指令,手开始挥动时的手势为开始手势,手结束挥动时的手势为停止手势,根据第一坐标和第二坐标判断手的挥动动作以生成相应的功能指令,从而通过人体的手势动作实现对蓝牙音箱的远程控制。
综上所述,本申请包括以下至少一种有益技术效果:
1.通过人体的手势动作实现对蓝牙音箱的远程控制;
2.提高生成的功能指令的准确性;
3.允许手在进行左右移动的同时产生上下方位上错误;允许手在进行上下移动的同时产生左右方位上错误。
附图说明
图1是本申请实施例的蓝牙音箱控制方法的流程示意图。
图2是本申请实施例的蓝牙音箱控制方法的另一流程示意图。
图3是本申请实施例的蓝牙音箱控制系统的结构框图。
图4是本申请实施例的蓝牙音箱控制系统的另一结构框图。
图5是本申请实施例的蓝牙音箱设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种蓝牙音箱控制方法,如图1所示,所述方法的主要流程描述如下(步骤S101~S109):
步骤S101:开启摄像头。
步骤S102:利用摄像头获取手势开始指令,根据手势开始指令采集第一图像。
步骤S103:将第一图像输入到分类器中,并利用分类器确定第一图像中是否存在开始手势,若是,则转入步骤S104和步骤S105;若否,则返回步骤S102。
步骤S104:获取开始手势检测框的坐标,并将该坐标记作第一坐标。
步骤S105:利用摄像头获取手势停止指令,根据手势停止指令采集第二图像。
步骤S106:将第二图像输入到分类器中,并利用分类器确定第二图像中是否存在停止手势,若是,则转入步骤S107;若否,则返回步骤S102。
步骤S107:获取停止手势检测框的坐标,并将该坐标记作第二坐标。
步骤S108:根据第一坐标和第二坐标获取功能指令。
步骤S109:将功能指令发送至蓝牙控制终端,获取并播放蓝牙控制终端返回的音频信息。
上述中,在接收到摄像头开启指令后,开启摄像头,摄像头开启指令可以是由按下蓝牙音箱上的实体按键或者麦克风采集语音等操作之后生成的;分类器是OpenCV计算机视觉库中的已经训练好的分类器,可以识别图像中的各种手势;功能指令包括播放上一首指令、播放下一首指令、音量调低指令、音量调高指令、开始播放指令和停止播放指令;蓝牙控制终端可以为手机、平板电脑和笔记本电脑等。
下面对上述步骤的实现方式进行具体描述和补充。
本实施例中,本申请根据人体的手势动作判断相应的功能指令,从而实现对蓝牙音箱的远程控制,例如,手势动作“往左一挥”对应“播放上一首指令”,手势动作“往右一挥”对应“播放下一首指令”,手势动作“往上一挥”对应“音量调高指令”,手势动作“往下一挥”对应“音量调低指令”。
如果人体随意挥动手就生成功能指令,则生成的功能指令极易是错误的,因此将手开始挥动的手势定义为开始手势,结束挥动的手势定义为停止手势,且开始手势和停止手势均需要人体维持一段时间才能被蓝牙音箱检测成功。
当停止手势与开始手势处于同一位置时,功能指令为开始播放指令或停止播放指令,例如,开关手势为“手掌”,停止手势为“拳头”,蓝牙音箱开机之后,处于未播放状态,当第一次检测到停止手势与开始手势处于同一位置时,判定为开始播放指令,当第二次检测到停止手势与开始手势处于同一位置时,判定为停止播放指令。
如图2所示,在蓝牙音箱开机的同时初始化计数器,计数器的初始值为零,启动摄像头,摄像头可转动,在摄像头开启之后,自动捕捉人体,获取第一视频流,将摄像头采集的第一视频流的帧图像输入到分类器中,利用分类器检测第一视频流的帧图像中是否存在开始手势,若是,则开启计时器,获取第一计时值。
判断第一计时值是否不小于第一阈值,本申请将第一阈值设置为3秒,当第一计时值不小于3秒时,判定为已获取手势开始指令,此时采集人体的当前图像,将该图像作为第一图像,并关闭计时器。
将第一图像输入到分类器中,利用分类器对第一图像进行检测识别,若检测出第一图像中存在开始手势,则获取开始手势检测框的坐标,并将该坐标记作第一坐标。根据第一坐标计算得到开始手势检测框的中心坐标,将该坐标记作第一中心坐标A(x1,y1)。
值得注意的是,本申请涉及到的检测框均为矩形框,摄像头采集的原图均为矩形图像框,检测框的坐标均以摄像头采集的原图的左下角为坐标原点计算得到。
在检测出第一图像中存在开始手势之后,继续利用摄像头对人体进行实时采集,并获取第二视频流,将第二视频流的帧图像输入到分类器中,利用分类器检测第二视频流的帧图像中是否存在停止手势,若是,则开启计时器,获取第二计时值。
判断第二计时值是否不小于第二阈值,本申请将第二阈值也设置为3秒,当第二计时值不小于3秒时,判定为已获取手势停止指令,采集人体的当前图像,将该图像作为第二图像,并关闭计时器。
将第二图像输入到分类器中,利用分类器对第二图像进行检测识别,若检测出第二图像中存在停止手势,则获取停止手势检测框的坐标,并将该坐标记作第二坐标。根据第二坐标计算得到停止手势检测框的中心坐标,将该坐标记作第二中心坐标B(x2,y2)。
计算第二中心坐标的横坐标值与第一中心坐标的横坐标值的差值,并将该差值记作第一差值X,其中X=x2-x1;计算第二中心坐标的纵坐标值与第一中心坐标的纵坐标值的差值,并将该差值记作第二差值Y1,其中Y1=y2-y1。
(1)若第一差值的绝对值不小于第一预设值,且第二差值的绝对值不大于第二预设值,则生成播放指令,其中,第一预设值大于第二预设值。例如,将第一预设值设置为5,第二预设值为3,当|X|≥5,且|Y1|≤3时,生成播放指令。
在生成播放指令之后,判断第一差值是否小于零,若是,则表示人体的手由右向左移动即手势动作为“往左一挥”,生成播放上一首指令;若否,则表示人体的手由左向右移动即手势动作为“往右一挥”,生成播放下一首指令。
若生成的是播放上一首指令,则将播放上一首指令发送至蓝牙控制终端,蓝牙控制终端根据该指令转至上一首音频,音频可以为音乐、相声和新闻等,蓝牙控制终端将上一首音频的音频信息发送至蓝牙音箱,蓝牙音箱接收蓝牙控制终端返回的音频信息,并根据音频信息进行播放;同理,若生成的是播放下一首指令,蓝牙音箱根据接收到的下一首音频的音频信息进行播放。
(2)若第二差值的绝对值不小于第三预设值,且第一差值的绝对值不大于第四预设值,则生成音量指令,其中,第三预设值大于第四预设值。例如,将第三预设值设置为5,第四预设值为3,当|Y1|≥5,且|X|≤3时,生成音量指令。
在生成音量指令之后,判断第二差值是否小于零,若是,则表示人体的手由上至下移动即手势动作为“往下一挥”,生成音量调低指令;若否,则表示人体的手由下至上移动即手势动作为“往上一挥”,生成音量调高指令。
在生成音量指令之后,还利用分类器对第一图像中的人体区域进行检测或者利用分类器对第二图像中的人体区域进行检测,确定人体检测框的坐标,其中,人体检测框指的是框出完整人体的最小检测框。
计算人体检测框的坐标中的最大纵坐标值ymax与最小纵坐标值ymin的差值,并将该差值记作第三差值Y2,其中第三差值为Y2=ymax-ymin。
若生成的是音量调低指令,则将音量调低指令和音量调节数值h发送至蓝牙控制终端,蓝牙控制终端将音频的音量调低h个数值,相应的,蓝牙音箱的音量降低;若生成的是音量调高指令,则将音量调高指令和音量调节数值h发送至蓝牙控制终端,蓝牙控制终端将音频的音量调高h个数值,相应的,蓝牙音箱的音量升高。
(3)若第一差值的绝对值不大于第五预设值,且第二差值的绝对值不大于第六预设值,则计数器的计数值加一。例如,将第五预设值和第六预设值均设置为3,当|X|≤3,且|Y1|≤3时,计数值加一。
判断计数值是否为单数,若是,则生成开始播放指令,若否,则生成停止播放指令。
值得注意的是,计数值加一的方式还可以是按下蓝牙音箱上的实体按键或者麦克风采集语音等操作。
若生成的是开始播放指令,则将开始播放指令发送至蓝牙控制终端,蓝牙控制终端开始播放音频,相应的,蓝牙音箱同步播放该音频;若生成的是停止播放指令,则将停止播放指令发送至蓝牙控制终端,蓝牙控制终端停止播放音频,相应的,蓝牙音箱也停止播放该音频。
在将开始播放指令或者停止播放指令发送至蓝牙控制终端之后,返回获取第一视频流,将摄像头采集的第一视频流的帧图像输入到分类器中的步骤。
本实施例还包括语音控制方法,具体的,启动语音模式,语音模式启动指令可以是由按下蓝牙音箱上的实体按键操作之后生成的,语音模式开启之后,实时接收唤醒指令,唤醒指令可以是人体的呼叫声音,然后接收用户的语音信息,根据语音信息生成功能指令。
对上述语音控制方法进行举例说明:人体发出声音:“蓝牙音箱,播放下一首”,蓝牙音箱接收到“蓝牙音箱”的唤醒指令之后,接收用户的语音信息“播放下一首”。将该语音信息与蓝牙音箱的功能指令数据库中预存的语音信息进行对比,若接收的语音信息与预存的语音信息相同,则表示匹配成功,功能指令数据库包括播放上一首指令数据库、播放下一首指令数据库、音量调低指令数据库、音量调高指令数据库、开始播放指令数据库和停止播放指令数据库,“播放下一首”与播放下一首指令数据库中预存的语音信息匹配,则生成播放下一首指令,并将该指令发送至蓝牙控制终端,蓝牙控制终端进行播放下一首的操作。
当人体的手不方便按下蓝牙音箱上的实体按键时(例如人体的手上有水),通过语音控制方法和手势控制方法便于人体控制蓝牙音箱。其中,当人体距离蓝牙音箱较近时,可以使用语音控制方法,当人体距离蓝牙音箱较远时,用户的唤醒指令和语音信息难以识别,易导致语音控制失败,此时可以使用手势控制方法实现对蓝牙音箱的远程控制。
为了更好地实施以上方法,本申请实施例还提供了一种蓝牙音箱控制系统,该系统具体可以集成在蓝牙音箱设备中。
图3为本申请实施例提供的一种蓝牙音箱控制系统的结构框图,如图3所示,该系统主要包括:
第一图像采集模块201,用于开启摄像头,并利用摄像头获取手势开始指令,根据手势开始指令采集第一图像;
开始手势确定模块202,用于将第一图像输入到分类器中,并利用分类器确定第一图像中是否存在开始手势,若是,则转入第一坐标获取模块203和第二图像采集模块204;
第一坐标获取模块203,用于获取开始手势检测框的坐标,并将该坐标记作第一坐标;
第二图像采集模块204,用于利用摄像头获取手势停止指令,根据手势停止指令采集第二图像;
停止手势确定模块205,用于将第二图像输入到分类器中,并利用分类器确定第二图像中是否存在停止手势,若是,则转入第二坐标获取模块206;
第二坐标获取模块206,用于获取停止手势检测框的坐标,并将该坐标记作第二坐标;
功能指令获取模块207,用于根据第一坐标和第二坐标获取功能指令;以及
音频信息播放模块208,用于将功能指令发送至蓝牙控制终端,获取并播放蓝牙控制终端返回的音频信息。
作为本实施例的一种可选实施方式,第一图像采集模块201,具体用于利用摄像头获取第一视频流,将第一视频流的帧图像输入到分类器中,利用分类器确定是否检测到开始手势;若是,则开启计时器,获取第一计时值;判断第一计时值是否不小于第一阈值;若是,则判定为已获取手势开始指令,开始采集第一图像,并关闭计时器。
作为本实施例的一种可选实施方式,第二图像采集模块204,具体用于利用摄像头获取第二视频流,将第二视频流的帧图像输入到分类器中,利用分类器确定是否检测到停止手势;若是,则开启计时器,获取第二计时值;判断第二计时值是否不小于第二阈值;若是,则判定为已获取手势停止指令,开始采集第二图像,并关闭计时器。
作为本实施例的一种可选实施方式,功能指令获取模块207,具体用于根据第一坐标计算得到开始手势检测框的第一中心坐标;根据第二坐标计算得到停止手势检测框的第二中心坐标;计算第二中心坐标的横坐标值与第一中心坐标的横坐标值的差值,并将该差值记作第一差值;计算第二中心坐标的纵坐标值与第一中心坐标的纵坐标值的差值,并将该差值记作第二差值;若第一差值的绝对值不小于第一预设值,且第二差值的绝对值不大于第二预设值,则生成播放指令,其中,第一预设值大于第二预设值;若第二差值的绝对值不小于第三预设值,且第一差值的绝对值不大于第四预设值,则生成音量指令,其中,第三预设值大于第四预设值。
作为本实施例的一种可选实施方式,功能指令获取模块207,还具体用于判断第一差值是否小于零,若是,则生成播放上一首指令;若否,则生成播放下一首指令。
作为本实施例的一种可选实施方式,功能指令获取模块207,还具体用于判断第二差值是否小于零,若是,则生成音量调低指令;若否,则生成音量调高指令。
作为本实施例的一种可选实施方式,如图4所示,该系统还包括音量调节数值计算模块209,用于在生成音量指令之后,利用分类器对第一图像中的人体区域进行检测或者利用分类器对第二图像中的人体区域进行检测,确定人体检测框的坐标;计算人体检测框的坐标中的最大纵坐标值与最小纵坐标值的差值,并将该差值记作第三差值;根据第二差值、第三差值以及音量总值计算音量调节数值;将音量调节数值发送至蓝牙控制终端。
作为本实施例的一种可选实施方式,如图4所示,该系统还包括播放指令生成模块210,用于开机并初始化计数器;若第一差值的绝对值不大于第五预设值,且第二差值的绝对值不大于第六预设值,则计数值加一;判断计数值是否为单数,若是,则生成开始播放指令,若否,则生成停止播放指令;在将开始播放指令或者停止播放指令发送至蓝牙控制终端之后,返回利用摄像头获取第一视频流,将第一视频流的帧图像输入到分类器中,利用分类器确定是否检测到开始手势的步骤。
上述实施例提供的方法中的各种变化方式和具体实例同样适用于本实施例的蓝牙音箱控制系统,通过前述对蓝牙音箱控制方法的详细描述,本领域技术人员可以清楚的知道本实施例中的蓝牙音箱控制系统的实施方法,为了说明书的简洁,在此不再详述。
为了更好地执行上述方法的程序,本申请实施例还提供一种蓝牙音箱设备,如图5所示,蓝牙音箱设备300包括存储器301和处理器302。
其中,存储器301可用于存储指令、程序、代码、代码集或指令集。存储器301可以包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如计算第一中心坐标等)以及用于实现上述实施例提供的蓝牙音箱控制方法的指令等;存储数据区可存储上述实施例提供的蓝牙音箱控制方法中涉及到的数据等。
处理器302可以包括一个或者多个处理核心。处理器302通过运行或执行存储在存储器301内的指令、程序、代码集或指令集,调用存储在存储器301内的数据,执行本申请的各种功能和处理数据。处理器302可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器302功能的电子器件还可以为其它,本申请实施例不作具体限定。
本申请实施例提供一种计算机可读存储介质,例如包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该计算机可读存储介质存储有能够被处理器加载并执行上述实施例的蓝牙音箱控制方法的计算机程序。
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。
Claims (10)
1.一种蓝牙音箱控制方法,其特征在于,包括:
开启摄像头,并利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像;
将所述第一图像输入到分类器中,并利用所述分类器确定所述第一图像中是否存在开始手势;
若是,则获取开始手势检测框的坐标,并将该坐标记作第一坐标,并利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像;
将所述第二图像输入到分类器中,并利用所述分类器确定所述第二图像中是否存在停止手势;
若是,则获取停止手势检测框的坐标,并将该坐标记作第二坐标;
根据所述第一坐标和所述第二坐标获取功能指令;
将所述功能指令发送至蓝牙控制终端,获取并播放所述蓝牙控制终端返回的音频信息。
2.根据权利要求1所述的方法,其特征在于,所述利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像包括:
利用所述摄像头获取第一视频流,将所述第一视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述开始手势;
若是,则开启计时器,获取第一计时值;
判断所述第一计时值是否不小于第一阈值;
若是,则判定为已获取所述手势开始指令,开始采集所述第一图像,并关闭所述计时器。
3.根据权利要求2所述的方法,其特征在于,所述利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像包括:
利用所述摄像头获取第二视频流,将所述第二视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述停止手势;
若是,则开启所述计时器,获取第二计时值;
判断所述第二计时值是否不小于第二阈值;
若是,则判定为已获取所述手势停止指令,开始采集所述第二图像,并关闭所述计时器。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一坐标和所述第二坐标获取功能指令包括:
根据所述第一坐标计算得到所述开始手势检测框的第一中心坐标;
根据所述第二坐标计算得到所述停止手势检测框的第二中心坐标;
计算所述第二中心坐标的横坐标值与所述第一中心坐标的横坐标值的差值,并将该差值记作第一差值;
计算所述第二中心坐标的纵坐标值与所述第一中心坐标的纵坐标值的差值,并将该差值记作第二差值;
若所述第一差值的绝对值不小于第一预设值,且所述第二差值的绝对值不大于第二预设值,则生成播放指令,其中,所述第一预设值大于所述第二预设值;
若所述第二差值的绝对值不小于第三预设值,且所述第一差值的绝对值不大于第四预设值,则生成音量指令,其中,所述第三预设值大于所述第四预设值。
5.根据权利要求4所述的方法,其特征在于,所述功能指令包括播放上一首指令和播放下一首指令;在所述生成所述播放指令之后还包括:
判断所述第一差值是否小于零,若是,则生成所述播放上一首指令;若否,则生成所述播放下一首指令。
6.根据权利要求4所述的方法,其特征在于,所述功能指令包括音量调低指令和音量调高指令;在所述生成音量指令之后还包括:
判断所述第二差值是否小于零,若是,则生成所述音量调低指令;若否,则生成所述音量调高指令。
7.根据权利要求6所述的方法,其特征在于,在所述生成音量指令之后还包括:
利用所述分类器对所述第一图像中的人体区域进行检测或者利用所述分类器对所述第二图像中的人体区域进行检测,确定人体检测框的坐标;
计算所述人体检测框的坐标中的最大纵坐标值与最小纵坐标值的差值,并将该差值记作第三差值;
根据所述第二差值、所述第三差值以及音量总值计算音量调节数值;
将所述音量调节数值发送至所述蓝牙控制终端。
8.根据权利要求4所述的方法,其特征在于,所述功能指令包括开始播放指令和停止播放指令;还包括:
开机并初始化计数器;
若所述第一差值的绝对值不大于第五预设值,且所述第二差值的绝对值不大于第六预设值,则计数值加一;
判断所述计数值是否为单数,若是,则生成所述开始播放指令,若否,则生成所述停止播放指令;
在将所述开始播放指令或者所述停止播放指令发送至蓝牙控制终端之后,返回利用所述摄像头获取第一视频流,将所述第一视频流的帧图像输入到所述分类器中,利用所述分类器确定是否检测到所述开始手势的步骤。
9.一种蓝牙音箱控制系统,其特征在于,包括,
第一图像采集模块,用于开启摄像头,并利用摄像头获取手势开始指令,根据所述手势开始指令采集第一图像;
开始手势确定模块,用于将所述第一图像输入到分类器中,并利用所述分类器确定所述第一图像中是否存在开始手势,若是,则转入第一坐标获取模块和第二图像采集模块;
所述第一坐标获取模块,用于获取开始手势检测框的坐标,并将该坐标记作第一坐标;
所述第二图像采集模块,用于利用所述摄像头获取手势停止指令,根据所述手势停止指令采集第二图像;
停止手势确定模块,用于将所述第二图像输入到分类器中,并利用所述分类器确定所述第二图像中是否存在停止手势,若是,则转入第二坐标获取模块;
所述第二坐标获取模块,用于获取停止手势检测框的坐标,并将该坐标记作第二坐标;
功能指令获取模块,用于根据所述第一坐标和所述第二坐标获取功能指令;以及,
音频信息播放模块,用于将所述功能指令发送至蓝牙控制终端,获取并播放所述蓝牙控制终端返回的音频信息。
10.一种蓝牙音箱设备,其特征在于,包括存储器和处理器,所述存储器上存储有能够被所述处理器加载并执行如权利要求1至8中任一种方法的计算机程序。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110246299 | 2021-03-05 | ||
CN2021102462999 | 2021-03-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113407023A true CN113407023A (zh) | 2021-09-17 |
Family
ID=77674719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110569954.4A Pending CN113407023A (zh) | 2021-03-05 | 2021-05-25 | 一种蓝牙音箱控制方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113407023A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117130469A (zh) * | 2023-02-27 | 2023-11-28 | 荣耀终端有限公司 | 一种隔空手势识别方法、电子设备及芯片系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193626A (zh) * | 2010-03-15 | 2011-09-21 | 欧姆龙株式会社 | 手势识认装置、手势识认装置的控制方法、以及控制程序 |
CN102236409A (zh) * | 2010-04-30 | 2011-11-09 | 宏碁股份有限公司 | 基于影像的动作手势辨识方法及系统 |
CN103914126A (zh) * | 2012-12-31 | 2014-07-09 | 腾讯科技(深圳)有限公司 | 一种多媒体播放器控制方法和装置 |
CN106557243A (zh) * | 2016-11-30 | 2017-04-05 | 依偎科技(南昌)有限公司 | 智能终端调节音量的方法、装置和智能终端 |
CN109598198A (zh) * | 2018-10-31 | 2019-04-09 | 深圳市商汤科技有限公司 | 用于识别手势移动方向的方法、装置、介质、程序及设备 |
CN110119209A (zh) * | 2019-06-13 | 2019-08-13 | 漫谷科技股份公司 | 音频设备控制方法和装置 |
CN110850966A (zh) * | 2019-10-22 | 2020-02-28 | 深圳市云顶信息技术有限公司 | 电动牙刷控制方法、装置、计算机设备和存储介质 |
CN111459262A (zh) * | 2019-01-22 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 智能音箱、手势处理方法、装置及电子设备 |
-
2021
- 2021-05-25 CN CN202110569954.4A patent/CN113407023A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193626A (zh) * | 2010-03-15 | 2011-09-21 | 欧姆龙株式会社 | 手势识认装置、手势识认装置的控制方法、以及控制程序 |
CN102236409A (zh) * | 2010-04-30 | 2011-11-09 | 宏碁股份有限公司 | 基于影像的动作手势辨识方法及系统 |
CN103914126A (zh) * | 2012-12-31 | 2014-07-09 | 腾讯科技(深圳)有限公司 | 一种多媒体播放器控制方法和装置 |
CN106557243A (zh) * | 2016-11-30 | 2017-04-05 | 依偎科技(南昌)有限公司 | 智能终端调节音量的方法、装置和智能终端 |
CN109598198A (zh) * | 2018-10-31 | 2019-04-09 | 深圳市商汤科技有限公司 | 用于识别手势移动方向的方法、装置、介质、程序及设备 |
CN111459262A (zh) * | 2019-01-22 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 智能音箱、手势处理方法、装置及电子设备 |
CN110119209A (zh) * | 2019-06-13 | 2019-08-13 | 漫谷科技股份公司 | 音频设备控制方法和装置 |
CN110850966A (zh) * | 2019-10-22 | 2020-02-28 | 深圳市云顶信息技术有限公司 | 电动牙刷控制方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117130469A (zh) * | 2023-02-27 | 2023-11-28 | 荣耀终端有限公司 | 一种隔空手势识别方法、电子设备及芯片系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
JP6230726B2 (ja) | 音声認識装置および音声認識方法 | |
CN104618580B (zh) | 一种拍照实现方法及终端 | |
CN109637518A (zh) | 虚拟主播实现方法及装置 | |
CN104598111B (zh) | 切换显示模式的方法及装置 | |
JP5323770B2 (ja) | ユーザ指示取得装置、ユーザ指示取得プログラムおよびテレビ受像機 | |
US8635066B2 (en) | Camera-assisted noise cancellation and speech recognition | |
WO2020103526A1 (zh) | 拍照方法、装置、存储介质及终端设备 | |
CN106572299A (zh) | 摄像头开启方法及装置 | |
CN108668080A (zh) | 提示镜头脏污程度的方法及装置、电子设备 | |
US9520131B2 (en) | Apparatus and method for voice processing | |
WO2015154419A1 (zh) | 一种人机交互装置及方法 | |
CN106600530B (zh) | 照片合成方法及装置 | |
CN106355549A (zh) | 拍照方法及设备 | |
CN105528078B (zh) | 控制电子设备的方法及装置 | |
CN110097890A (zh) | 一种语音处理方法、装置和用于语音处理的装置 | |
CN108319363A (zh) | 基于vr的产品展示方法、装置及电子设备 | |
CN113407023A (zh) | 一种蓝牙音箱控制方法、系统及设备 | |
CN112382277A (zh) | 智能设备唤醒方法、智能设备和计算机可读存储介质 | |
CN112286364A (zh) | 人机交互方法和装置 | |
CN109256145A (zh) | 基于终端的音频处理方法、装置、终端和可读存储介质 | |
WO2021244058A1 (zh) | 一种处理执行方法、装置和可读介质 | |
CN104573642B (zh) | 人脸识别方法及装置 | |
US20220284738A1 (en) | Target user locking method and electronic device | |
CN110337030B (zh) | 视频播放方法、装置、终端和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210917 |
|
RJ01 | Rejection of invention patent application after publication |