CN110971744A - 一种蓝牙音箱语音播放控制的方法及装置 - Google Patents
一种蓝牙音箱语音播放控制的方法及装置 Download PDFInfo
- Publication number
- CN110971744A CN110971744A CN201811141089.8A CN201811141089A CN110971744A CN 110971744 A CN110971744 A CN 110971744A CN 201811141089 A CN201811141089 A CN 201811141089A CN 110971744 A CN110971744 A CN 110971744A
- Authority
- CN
- China
- Prior art keywords
- voice
- mobile terminal
- sound box
- bluetooth sound
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000003993 interaction Effects 0.000 abstract description 20
- 230000008569 process Effects 0.000 abstract description 16
- 230000004044 response Effects 0.000 abstract description 9
- 230000001360 synchronised effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72415—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories for remote control of appliances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/725—Cordless telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明适用于蓝牙音箱控制技术领域,提供了一种蓝牙音箱播放控制的方法及装置,所诉方法包括:采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别;接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路;接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。通过本发明可以在语音识别的过程建立与移动终端语音播放通路,在接收到反馈的语音识别结果后,不用再建立连接,直接进行语音的播放,降低了蓝牙音箱语音交互的延时,提高了响应速度。
Description
技术领域
本发明属于蓝牙音箱控制技术领域,尤其涉及一种蓝牙音箱语音播放控制的方法及装置。
背景技术
目前无线音箱越来越普及,带有语音唤醒功能,既能支持录音又能支持播放的蓝牙音箱被广泛应用。手机与蓝牙音箱建立连接,将蓝牙音箱录入的语音数据传输到手机,并经过手机应用程序App与服务器交互,服务器进行语音识别并返回结果至手机端,经过手机应用程序App传输至蓝牙音箱进行播放。蓝牙音箱在播放过程中,需要建立A2DP(AdvancedAudio Distribution Profile,蓝牙音频传输协议)连接,并且在手机端接收到服务器的反馈结果,需要将反馈结果通过A2DP播放到蓝牙音箱时,才建立A2DP连接;从而在进行蓝牙音箱语音播放时,存在从获取服务器反馈结果后到由蓝牙音箱播放语音时,建立蓝牙A2DP连接的延时,语音交互过程音箱的响应速度慢,降低了用户的体验效果。
发明内容
有鉴于此,本发明实施例提供了一种蓝牙音箱语音播放控制的方法及装置,以解决现有技术中语音交互过程中存在连接延时、音箱响应速度慢的问题。
本发明实施例的第一方面提供了一种蓝牙音箱语音播放控制的方法,包括:
采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别;
接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路;
接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
本发明实施例的第二方面提供了一种蓝牙音箱语音播放控制的方法,包括:
接收由蓝牙音箱发送的语音数据,并将所述语音数据上传至服务器进行语音识别;
将语音数据上传结束的消息发送至蓝牙音箱,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路;
接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱进行语音播放。
本发明实施例的第三方面提供了一种蓝牙音箱语音播放控制的方法,包括:
蓝牙音箱向移动终端发送语音数据;
移动终端将所述语音数据上传至服务器;
蓝牙音箱接收移动终端发送的语音数据上传结束的消息;
蓝牙音箱与移动终端建立第一语音通路,同时服务器进行语音识别;
移动终端接收语音识别结果;
移动终端将所述语音识别结果经由第一语音通路发送至蓝牙音箱,由蓝牙音箱进行语音播放。
本发明实施例的第四方面提供了一种蓝牙音箱语音播放控制装置,包括:
第一语音数据处理模块,用于采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别;
第一连接建立模块,用于接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路;
语音播放模块,用于接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
本发明实施例的第五方面提供了一种移动终端,包括:
第二语音数据处理模块,用于接收由蓝牙音箱端发送的语音数据,并将所述语音数据上传至服务器进行语音识别;
第二连接建立模块,用于将语音数据上传结束的消息发送至蓝牙音箱,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路;
语音识别结果处理模块,用于接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱进行语音播放。
本发明实施例的第六方面提供了一种蓝牙音箱语音播放控制系统,包括蓝牙音箱、移动终端和服务器,
蓝牙音箱用于采集语音数据并通过第二语音通路向移动终端发送语音数据;
移动终端用于接收所述语音数据并将所述语音数据上传至服务器,以及反馈语音数据上传结束的消息至蓝牙音箱;
服务器用于接收和识别所述语音数据并反馈与所述语音数据对应的语音识别结果;
蓝牙音箱与移动终端还分别用于在服务器反馈语音识别结果之前,建立第一语音通路;
移动终端还用于接收服务器反馈的语音识别结果,并经过所述第一语音通路将所述语音识别结果发送至蓝牙音箱。
蓝牙音箱还用于接收移动终端发送的语音识别结果,并进行语音播放。
本发明实施例的第七方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例可以在服务器反馈语音识别结果之前,由蓝牙音箱与移动终端建立语音播放通路,在接收到由服务器反馈至移动终端的语音识别结果时,不需要在进行通路的连接,直接进行语音的播放,降低了蓝牙音箱语音交互的延时,提高了语音交互的响应速度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的蓝牙音箱语音播放控制方法所适用的系统场景示意图;
图2是本发明实施例二提供的蓝牙音箱语音播放控制方法实现流程示意图;
图3是本发明实施例三提供的移动终端控制蓝牙音箱语音播放方法的实现流程示意图;
图4是本发明实施例四提供的蓝牙音箱语音播放控制方法的交互流程示意图;
图5是本发明实施例五提供的蓝牙音箱语音播放控制装置的示例图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
图1示出了本发明实施例提供的蓝牙音箱语音播放控制方法所适用的系统场景示意图,为了便于说明,仅示出了与本实施例相关的部分。
参照图1,该系统由蓝牙音箱11采集语音数据,并传输至移动终端12,由移动终端12将语音数据上传至服务器13,由服务器13进行语音识别;在服务器13反馈语音识别结果至移动终端12之前,由蓝牙音箱11与移动终端12建立语音播放通路,蓝牙音箱11在接收到由服务器13反馈至移动终端12的语音识别结果时,不需要再进行通路的连接,直接进行语音的播放,降低了蓝牙音箱语音交互的延时,提高了语音交互的响应速度。
下面对图1所示的系统场景下的蓝牙音箱语音播放控制方法进行详细阐述。
实施例二
图2示出了本发明实施例提供的蓝牙音箱语音播放控制方法的实现流程示意图。在本实施例中,该流程的执行主体为图1所示的蓝牙音箱11,详述如下:
步骤S201,采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别。
在本发明实施例中,蓝牙音箱内置麦克风阵列,还可进行远距离拾音;所述的蓝牙音箱包括但不仅限于:普通单筒蓝牙音箱、户外单筒蓝牙音箱、家居型双筒蓝牙音箱、户外运动型蓝牙音箱或大型多筒家居蓝牙音箱,均可进行语音数据的采集,并将语音数据通过建立的蓝牙协议传输至移动终端。
其中,所述的语音数据由移动终端通过网络传输至服务器或云端进行语音识别,所述的语音识别为通过语音识别将非结构化的语音数据信息转化为结构化的索引,实现对音频或录音数据的信息挖掘与检索;包括对语音信息的信号处理和特征提取,进行声学模型以及语言模型的解码,最终生成语音识别结果。
进一步的,所述采集语音数据,并将所述语音数据传输至移动终端,所述语音数据用于经移动终端上传至服务器进行语音识别的步骤,包括:
A1、生成唤醒事件,并将唤醒事件发送至移动终端。
在本实施例中,所述唤醒事件可以是语音唤醒事件;蓝牙音箱内置了麦克风阵列,可以实时采集语音数据,所述语音数据既可以作为与唤醒关键词的匹配,也可以作为进行语音识别的语音数据来源。当蓝牙音箱的麦克风阵列一直处于低功耗运行状态,只采集数据并进行唤醒词的匹配,可以一直录取语音数据;当录取的语音数据经过唤醒算法匹配到唤醒关键词后,蓝牙音箱触发中断,并通过协议栈通知移动终端语音唤醒事件。
A2、在所述唤醒事件发送完成后,与移动终端建立第二语音通路。
在本实施例中,所述的第二语音通路可以是语音数据通路,还可以是同步面向SCO连接通路;音箱端将唤醒事件发送至移动终端完成后,则与移动终端建立同步面向SCO连接,由于与移动终端保持同步面向SCO连接,蓝牙音箱端的麦克风阵列优先打开接收语音数据。
A3、所述语音数据经由所述第二语音通路发送至移动终端。
在本实施例中,建立第二语音通路连接后,蓝牙音箱接收录入语音数据,将所述的语音数据经过第二语音通路连发送至移动终端,从而进行语音交互过程的语音数据的传输。
步骤S202,接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路。
在本发明实施例中,所述第一语音通路为语音播放通路,可以是蓝牙音箱与移动终端建立的蓝牙音频传输协议连接;在服务器返回语音识别结果之前或者在语音数据信息上传至服务器结束,接收到由移动终端传输的语音数据上传结束的消息之后,由蓝牙音箱端建立与移动终端的语音播放通路。由于语音识别需要时间,语音反馈通过网络传输到达移动终端,在语音数据上传至服务器结束后,进行语音识别并等待语音反馈之前,先建立好语音播放通路;将建立语音播放通路连接和进行语音识别过程在不同的子线程同时进行。
进一步,在接收移动终端传输的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路,包括:
在服务器进行语音识别开始时,与移动终端建立蓝牙音频传输协议连接。
在本实施例中,蓝牙音箱与移动终端建立的蓝牙音频传输协议可以是蓝牙音频传输协议A2DP连接,还可以是同步面向SCO连接;所述的同步面向SCO连接是双向的,可以采集语音数据,也可以播放语音数据;所述的蓝牙音频传输协议A2DP连接可以支持单声道或立体声高质量音频数据的传输,具有较高的采样率。
步骤S203,接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
在本发明实施例中,所述的第一语音通路为语音播放通路;由于已经建立好蓝牙音箱与移动终端的语音播放通路,当接收到服务器反馈的语音识别结果后,蓝牙音箱直接以空中包的形式接收移动终端发送的语音识别结果,并在接收到空中包数据后进行语音播放,实现语音交互过程的快速响应,降低蓝牙音箱语音交互的延时。
通过本发明实施例,在进行蓝牙音箱语音交互时,在进行语音数据的录入与上传至服务器结束后,启动与移动终端的语音播放通路的建立,使得语音播放通路的建立与语音识别、语音反馈在不同的子线程同步执行,在语音反馈结束后,由于语音播放通路已经建立,则直接进行语音的播放,提高了响应速度,降低了交互延时。
实施例三
图3示出了本发明实施例提供的蓝牙音箱语音播放控制方法的实现流程示意图。在本实施例中,该流程的执行主体为图1所示的移动终端12,所述的移动终端可以是具有蓝牙连接功能的手机、电脑或平板等,在此不做具体限定,详述如下:
步骤S301,接收由蓝牙音箱发送的语音数据,并将所述语音数据上传至服务器进行语音识别。
在本发明实施例中,移动终端通过蓝牙音箱端进行语音拾音,接收到输入的语音数据后,建立与独立服务器或云端的连接,将接收的语音数据上传至独立服务器或云端,由独立服务器或云端对语音数据进行语音识别。
进一步的,所述接收由蓝牙音箱端传输的语音数据,并将所述语音数据上传至服务器进行语音识别的步骤,包括:
B1、接收由蓝牙音箱发送的唤醒事件。
在本实施例中,所述的唤醒事件可以是语音唤醒事件;当蓝牙音箱端录入的语音数据经过唤醒算法匹配到唤醒关键词后,蓝牙音箱则触发中断,移动终端通过协议线接收到蓝牙音箱的语音唤醒事件,移动终端接收到语音唤醒事件后,则响应该唤醒事件,进行从蓝牙音箱端的语音拾音过程。
B2、根据所述唤醒事件,与蓝牙音箱建立第二语音通路。
在本实施例中,所述的第二语音通路可以是语音数据通路,用于传输语音数据;所述的语音数据通路还可以是同步面向SCO连接通路;移动终端接收到语音唤醒事件后,则立即建立与蓝牙音箱的语音数据传输通路的连接,具体建立同步面向SCO连接,所述的同步面向SCO连接接是双向的,主要用于同步语音的传送,并且利用保留时隙传送数据包,既可以传送话音也可以传送数据。
B3、通过所述第二语音通路接收蓝牙音箱的语音数据;其中,所述第一语音通路在所述第二语音通路建立完成后建立。
在本实施例中,所述的第二语音通路可以是语音数据通路,具体可以为同步面向SCO连接通路;由于移动终端与蓝牙音箱端保持面向同步连接,在建立语音数据通路时,会优先打开蓝牙音箱端的麦克风阵列,移动终端通过语音数据通路从蓝牙音箱端进行语音拾音,通过语音数据通路获取语音数据。
步骤S302,将语音数据上传结束的消息发送至蓝牙音箱,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路。
在本发明实施例中,所述第一语音通路可以是语音播放通路;可以是蓝牙音箱与移动终端建立的蓝牙音频传输协议;具体可以是蓝牙音频传输协议A2DP连接,还可以是同步面向SCO连接。移动终端将语音数据上传至云端或独立服务器后,发送上传结束的消息至蓝牙音箱,并在接收服务器反馈语音识别结果之前,或者发送上传结束的消息之后,建立与蓝牙音箱的语音播放通路。
需要说明的是,在建立与蓝牙音箱的语音播放通路的同时,云端或独立服务器对语音数据进行语音识别,并将语音识别结果反馈至移动终端,即语音播放通路的建立与语音识别、语音反馈在不同的线程同时执行,在移动终端接收到语音识别结果时,语音播放通路已建立完成。
步骤S303,接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱进行语音播放。
在本发明实施例中,所述的第一语音通路可以是语音播放通路;由于已经与蓝牙音箱建立好语音播放通路,当接收到服务器反馈的语音识别结果后,直接以空中包的形式发送语音识别结果至蓝牙音箱端,进行空中包数据的语音播放,实现语音交互过程的快速响应,降低蓝牙音箱语音交互的延时。
通过本发明实施例,移动终端通过蓝牙音箱进行语音拾音,并将语音数据上传至服务器进行语音识别,在上传结束、语音识别之前完成与蓝牙音箱的语音播放通路的建立,接收到服务器反馈的语音识别结果后,直接将语音识别结果通过已建立的语音播放通路传输至蓝牙音箱,进行语音播放,降低了蓝牙连接的延时,提高了语音交互的响应速率。
实施例四
图4示出了本发明实施例提供的蓝牙音箱语音播放控制方法的交互流程示意图,参与该交互流程的执行主体包括蓝牙音箱、移动终端,该交互流程的实现原理与图2至图3所述的每个执行主体侧的实现原理相一致,因此仅简要地描述该交互流程,不赘述:
1、蓝牙音箱向移动终端发送语音数据;
2、移动终端将所述语音数据上传至服务器;
3、蓝牙音箱接收移动终端发送的语音数据上传结束的消息;
4、蓝牙音箱与移动终端建立第一语音通路,同时服务器进行语音识别;
5、移动终端接收所述语音识别结果;
6、移动终端将所述语音识别结果经由第一语音通路发送至蓝牙音箱,由蓝牙音箱进行语音播放。
进一步的,所述的蓝牙音箱语音播放控制的方法,还包括:
蓝牙音箱将唤醒事件发送移动终端;
根据唤醒事件,蓝牙音箱与移动终端建立第二语音通路;
蓝牙音箱将语音数据经由第二语音通路发送至移动终端;其中,所述第一语音通路在所述第二语音通路建立完成后建立。
进一步的,蓝牙音箱与移动终端建立第一语音通路,同时服务器进行语音识别,包括:
在服务器进行语音识别时,蓝牙音箱与移动终端建立蓝牙音频传输协议连接。
需要说明的是,本领域技术人员在本发明揭露的技术范围内,可容易想到的其他排序方案也应在本发明的保护范围之内,在此不一一赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例五
图5示出了本发明实施例提供的蓝牙音箱语音播放控制装置的示例图,为了便于说明,仅示出了与本发明实施例相关的部分。
所述蓝牙音箱语音播放控制装置,包括:
第一语音数据处理模块51,用于采集语音数据,并将所述语音数据发送至移动终端,所述语音数据用于经移动终端上传至服务器进行语音识别;
第一连接建立模块52,用于接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,建立与移动终端的语音播放通路;
语音播放模块53,用于接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
进一步的,所述的蓝牙音箱语音播放控制装置,还包括:
唤醒模块,用于生成唤醒事件,并将唤醒事件发送至移动终端;
第二语音通路建立模块,用于在所述唤醒事件发送完成后,与移动终端建立第二语音通路。
进一步,本发明实施例还提供了一种移动终端,包括:
第二语音数据处理模块,用于接收由蓝牙音箱端发送的语音数据,并将所述语音数据上传至服务器进行语音识别;
第二连接建立模块,用于将语音数据上传结束的消息发送至蓝牙音箱端,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路;
语音识别结果处理模块,用于接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱端进行语音播放。
进一步的,本发明实施例还提供了一种蓝牙音箱语音播放控制系统,包括蓝牙音箱、移动终端和服务器;
蓝牙音箱用于采集语音数据并通过第二语音通路向移动终端发送语音数据;
移动终端用于接收所述语音数据并将所述语音数据上传至服务器,以及反馈语音数据上传结束的消息至蓝牙音箱;
服务器用于接收和识别所述语音数据并反馈与所述语音数据对应的语音识别结果;
蓝牙音箱与移动终端还分别用于在服务器反馈语音识别结果之前,建立第一语音通路;
移动终端还用于接收服务器反馈的语音识别结果,并经过所述第一语音通路将所述语音识别结果发送至蓝牙音箱;
蓝牙音箱还用于接收移动终端发送的语音识别结果,并进行语音播放。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现蓝牙音箱语音播放控制方法的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (13)
1.一种蓝牙音箱语音播放控制的方法,其特征在于,包括:
采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别;
接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路;
接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
2.如权利要求1所述的蓝牙音箱语音播放控制的方法,其特征在于,采集语音数据,并将所述语音数据传输至移动终端,所述语音数据用于经移动终端上传至服务器进行语音识别之前,包括:
生成唤醒事件,并将唤醒事件发送至移动终端;
在所述唤醒事件发送完成后,与移动终端建立第二语音通路;
所述语音数据经由所述第二语音通路发送至移动终端。
3.如权利要求1所述的蓝牙音箱语音播放控制的方法,其特征在于,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路,包括:
在服务器进行语音识别时,与移动终端建立蓝牙音频传输协议连接。
4.一种蓝牙音箱语音播放控制的方法,其特征在于,包括:
接收由蓝牙音箱发送的语音数据,并将所述语音数据上传至服务器进行语音识别;
将语音数据上传结束的消息发送至蓝牙音箱,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路;
接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱进行语音播放。
5.如权利要求4所述的蓝牙音箱语音播放控制的方法,其特征在于,接收由蓝牙音箱发送的语音数据,并将所述语音数据上传至服务器进行语音识别之前,包括:
接收由蓝牙音箱发送的唤醒事件;
根据所述唤醒事件,与蓝牙音箱建立第二语音通路;
通过所述第二语音通路接收蓝牙音箱的语音数据;其中,所述第一语音通路在所述第二语音通路建立完成后建立。
6.一种蓝牙音箱语音播放控制的方法,其特征在于,包括:
蓝牙音箱向移动终端发送语音数据;
移动终端将所述语音数据上传至服务器;
蓝牙音箱接收移动终端发送的语音数据上传结束的消息;
蓝牙音箱与移动终端建立第一语音通路,同时服务器进行语音识别;
移动终端接收语音识别结果;
移动终端将所述语音识别结果经由第一语音通路发送至蓝牙音箱,由蓝牙音箱进行语音播放。
7.如权利要求6所述的蓝牙音箱语音播放控制的方法,其特征在于,还包括:
蓝牙音箱将唤醒事件发送移动终端;
根据唤醒事件,蓝牙音箱与移动终端建立第二语音通路;
蓝牙音箱将语音数据经由第二语音通路发送至移动终端;其中,所述第一语音通路在所述第二语音通路建立完成后建立。
8.如权利要求6所述的蓝牙音箱语音播放控制的方法,其特征在于,蓝牙音箱与移动终端建立第一语音通路,同时服务器进行语音识别,包括:
在服务器进行语音识别时,蓝牙音箱与移动终端建立蓝牙音频传输协议连接。
9.一种蓝牙音箱语音播放控制装置,其特征在于,包括:
第一语音数据处理模块,用于采集语音数据,并将所述语音数据发送至移动终端,所述语音数据经移动终端上传至服务器进行语音识别;
第一连接建立模块,用于接收移动终端发送的语音数据上传结束的消息,在所述服务器向所述移动终端反馈语音识别结果之前,与移动终端建立第一语音通路;
语音播放模块,接收移动终端经由所述第一语音通路发送的语音识别结果,并播放所述语音识别结果;其中,所述语音识别结果为由服务器反馈至移动终端的结果。
10.如权利要求9所述的蓝牙音箱语音播放控制装置,其特征在于,还包括:
唤醒模块,用于生成唤醒事件,并将唤醒事件发送至移动终端;
第二语音通路建立模块,用于在所述唤醒事件发送完成后,与移动终端建立第二语音通路。
11.一种移动终端,其特征在于,包括:
第二语音数据处理模块,用于接收由蓝牙音箱端发送的语音数据,并将所述语音数据上传至服务器进行语音识别;
第二连接建立模块,用于将语音数据上传结束的消息发送至蓝牙音箱,在接收服务器反馈的语音识别结果之前,与蓝牙音箱建立第一语音通路;
语音识别结果处理模块,用于接收服务器反馈的语音识别结果,并将所述语音识别结果经由所述第一语音通路发送至蓝牙音箱进行语音播放。
12.一种蓝牙音箱语音播放控制系统,其特征在于,包括蓝牙音箱、移动终端和服务器,
蓝牙音箱用于采集语音数据并通过第二语音通路向移动终端发送语音数据;
移动终端用于接收所述语音数据并将所述语音数据上传至服务器,以及反馈语音数据上传结束的消息至蓝牙音箱;
服务器用于接收和识别所述语音数据并反馈与所述语音数据对应的语音识别结果;
蓝牙音箱与移动终端还分别用于在服务器反馈语音识别结果之前,建立第一语音通路;
移动终端还用于接收服务器反馈的语音识别结果,并经过所述第一语音通路将所述语音识别结果发送至蓝牙音箱;
蓝牙音箱还用于接收移动终端发送的语音识别结果,并进行语音播放。
13.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811141089.8A CN110971744B (zh) | 2018-09-28 | 2018-09-28 | 一种蓝牙音箱语音播放控制的方法及装置 |
PCT/CN2019/084833 WO2020062861A1 (zh) | 2018-09-28 | 2019-04-28 | 一种蓝牙音箱语音播放控制的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811141089.8A CN110971744B (zh) | 2018-09-28 | 2018-09-28 | 一种蓝牙音箱语音播放控制的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110971744A true CN110971744A (zh) | 2020-04-07 |
CN110971744B CN110971744B (zh) | 2022-09-23 |
Family
ID=69952820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811141089.8A Active CN110971744B (zh) | 2018-09-28 | 2018-09-28 | 一种蓝牙音箱语音播放控制的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110971744B (zh) |
WO (1) | WO2020062861A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114253148A (zh) * | 2021-12-09 | 2022-03-29 | 英华达(上海)科技有限公司 | 一种智能设备控制方法、网关设备和智能设备控制系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100598622B1 (ko) * | 2003-12-12 | 2006-07-07 | 주식회사 현대오토넷 | 음성인식기능을 가지는 디지털 카오디오 |
US20130080056A1 (en) * | 2011-09-22 | 2013-03-28 | Clarion Co., Ltd. | Information Terminal, Server Device, Searching System, and Searching Method Thereof |
US20140141723A1 (en) * | 2012-11-16 | 2014-05-22 | Huawei Device Co., Ltd. | Method for Establishing Bluetooth Connection, Mobile Terminal, Bluetooth Device, and System |
CN105050034A (zh) * | 2015-08-25 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 基于蓝牙连接的语音服务实现方法和装置及系统 |
CN105161111A (zh) * | 2015-08-25 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 基于蓝牙连接的语音识别方法和装置 |
CN106372246A (zh) * | 2016-09-20 | 2017-02-01 | 深圳市同行者科技有限公司 | 音频播放方法及其装置 |
CN107277272A (zh) * | 2017-07-25 | 2017-10-20 | 深圳市芯中芯科技有限公司 | 一种基于软件app的蓝牙设备语音交互方法及系统 |
CN107277754A (zh) * | 2017-07-12 | 2017-10-20 | 深圳市冠旭电子股份有限公司 | 一种蓝牙连接的方法及蓝牙外围设备 |
CN108074566A (zh) * | 2017-12-07 | 2018-05-25 | 珠海横琴万智联科技有限公司 | 财务管理智能语音播报系统及播报方法 |
CN108172242A (zh) * | 2018-01-08 | 2018-06-15 | 深圳市芯中芯科技有限公司 | 一种改进的蓝牙智能云音箱语音交互端点检测方法 |
CN207638865U (zh) * | 2017-12-14 | 2018-07-20 | 桂林广岳科技有限公司 | 一种蓝牙播放装置 |
CN108563468A (zh) * | 2018-03-30 | 2018-09-21 | 深圳市冠旭电子股份有限公司 | 一种蓝牙音箱数据处理的方法、装置及蓝牙音箱 |
CN108566634A (zh) * | 2018-03-30 | 2018-09-21 | 深圳市冠旭电子股份有限公司 | 降低蓝牙音箱连续唤醒延时的方法、装置及蓝牙音箱 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9443520B2 (en) * | 2014-10-02 | 2016-09-13 | International Business Machines Corporation | Management of voice commands for devices in a cloud computing environment |
CN105163236A (zh) * | 2015-09-11 | 2015-12-16 | 青岛歌尔声学科技有限公司 | 一种具有网关控制功能的智能音响系统 |
CN206865727U (zh) * | 2017-06-29 | 2018-01-09 | 北京纽曼腾飞科技有限公司 | 一种基于移动终端的组群蓝牙音箱扩展系统 |
CN108159687B (zh) * | 2017-12-19 | 2021-06-04 | 芋头科技(杭州)有限公司 | 一种基于多人交互过程的自动引导系统及智能音箱设备 |
CN108551629A (zh) * | 2018-06-22 | 2018-09-18 | 四川斐讯信息技术有限公司 | 一种分离式智能音箱的控制方法及系统 |
-
2018
- 2018-09-28 CN CN201811141089.8A patent/CN110971744B/zh active Active
-
2019
- 2019-04-28 WO PCT/CN2019/084833 patent/WO2020062861A1/zh active Application Filing
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100598622B1 (ko) * | 2003-12-12 | 2006-07-07 | 주식회사 현대오토넷 | 음성인식기능을 가지는 디지털 카오디오 |
US20130080056A1 (en) * | 2011-09-22 | 2013-03-28 | Clarion Co., Ltd. | Information Terminal, Server Device, Searching System, and Searching Method Thereof |
US20140141723A1 (en) * | 2012-11-16 | 2014-05-22 | Huawei Device Co., Ltd. | Method for Establishing Bluetooth Connection, Mobile Terminal, Bluetooth Device, and System |
CN105050034A (zh) * | 2015-08-25 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 基于蓝牙连接的语音服务实现方法和装置及系统 |
CN105161111A (zh) * | 2015-08-25 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 基于蓝牙连接的语音识别方法和装置 |
CN106372246A (zh) * | 2016-09-20 | 2017-02-01 | 深圳市同行者科技有限公司 | 音频播放方法及其装置 |
CN107277754A (zh) * | 2017-07-12 | 2017-10-20 | 深圳市冠旭电子股份有限公司 | 一种蓝牙连接的方法及蓝牙外围设备 |
CN107277272A (zh) * | 2017-07-25 | 2017-10-20 | 深圳市芯中芯科技有限公司 | 一种基于软件app的蓝牙设备语音交互方法及系统 |
CN108074566A (zh) * | 2017-12-07 | 2018-05-25 | 珠海横琴万智联科技有限公司 | 财务管理智能语音播报系统及播报方法 |
CN207638865U (zh) * | 2017-12-14 | 2018-07-20 | 桂林广岳科技有限公司 | 一种蓝牙播放装置 |
CN108172242A (zh) * | 2018-01-08 | 2018-06-15 | 深圳市芯中芯科技有限公司 | 一种改进的蓝牙智能云音箱语音交互端点检测方法 |
CN108563468A (zh) * | 2018-03-30 | 2018-09-21 | 深圳市冠旭电子股份有限公司 | 一种蓝牙音箱数据处理的方法、装置及蓝牙音箱 |
CN108566634A (zh) * | 2018-03-30 | 2018-09-21 | 深圳市冠旭电子股份有限公司 | 降低蓝牙音箱连续唤醒延时的方法、装置及蓝牙音箱 |
Non-Patent Citations (1)
Title |
---|
刘建峰等: "一种蓝牙微微网视频流媒体MAC层调度算法", 《系统仿真学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110971744B (zh) | 2022-09-23 |
WO2020062861A1 (zh) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109246671B (zh) | 数据传输方法、装置及系统 | |
CN109246672B (zh) | 数据传输方法、装置、系统及蓝牙耳机 | |
CN107005800B (zh) | 音频文件的传输、接收方法及装置、设备及其系统 | |
CN102340730A (zh) | 多台手机配合播放多声道立体声的方法 | |
CN104426832A (zh) | 一种多终端多声道独立播放方法及装置 | |
CN105208189B (zh) | 音频处理方法及移动终端 | |
CN105163233A (zh) | 一种智能云音箱与智能终端交互方法及系统 | |
CN104869505B (zh) | 一种音量控制方法、播放设备、移动终端及系统 | |
CN111081238B (zh) | 一种蓝牙音箱语音交互控制方法、装置及系统 | |
CN104010226A (zh) | 基于音频的多终端互动播放的方法和系统 | |
CN108712704A (zh) | 音箱、音频数据的播放方法、装置、存储介质及电子装置 | |
CN105847566A (zh) | 移动终端音频的音量调节方法及装置 | |
CN105744022A (zh) | 移动终端、语音播放方法及系统 | |
CN103686540A (zh) | 一种主动式无线网络音响设备及其使用方法 | |
CN111314814A (zh) | 基于tws蓝牙耳机的翻译方法、移动终端、tws蓝牙耳机及存储介质 | |
CN110971744B (zh) | 一种蓝牙音箱语音播放控制的方法及装置 | |
CN204013976U (zh) | 一种通过3g或4g技术联网的独立智能耳机 | |
CN202145660U (zh) | 一种具有语音通话转移处理功能的蓝牙音箱 | |
WO2020062862A1 (zh) | 一种音箱语音交互控制的方法及装置 | |
CN111556406B (zh) | 音频处理方法、音频处理装置及耳机 | |
CN204013977U (zh) | 一种通过磁铁吸附实现主机可分离式结构的独立智能耳机 | |
CN112333594B (zh) | 一种蓝牙耳机与蓝牙音箱的音频切换方法 | |
CN113992965A (zh) | 一种低延迟传输方法及系统 | |
CN204377136U (zh) | 一种全息音频采集回放装置 | |
CN110351690B (zh) | 一种智能语音系统及其语音处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |