CN112216279A - 语音传输方法、智能终端及计算机可读存储介质 - Google Patents

语音传输方法、智能终端及计算机可读存储介质 Download PDF

Info

Publication number
CN112216279A
CN112216279A CN202011048012.3A CN202011048012A CN112216279A CN 112216279 A CN112216279 A CN 112216279A CN 202011048012 A CN202011048012 A CN 202011048012A CN 112216279 A CN112216279 A CN 112216279A
Authority
CN
China
Prior art keywords
voice
pickup
intelligent terminal
target
ble
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011048012.3A
Other languages
English (en)
Inventor
黄标鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xingluo Home Yunwulian Technology Co ltd
Original Assignee
Xingluo Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xingluo Intelligent Technology Co Ltd filed Critical Xingluo Intelligent Technology Co Ltd
Priority to CN202011048012.3A priority Critical patent/CN112216279A/zh
Publication of CN112216279A publication Critical patent/CN112216279A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/10Connection setup
    • H04W76/14Direct-mode setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/005Discovery of network devices, e.g. terminals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种语音传输方法,应用于智能终端,所述智能终端与至少一拾音设备低功耗蓝牙(BLE)连接,包括:监测是否接收到拾音器唤醒信号;若是,则接收被唤醒的拾音器所反馈的BLE数据;根据所述BLE数据确认目标拾音器;切换所述智能终端与所述目标拾音器的连接为经典蓝牙连接,以及通过所述经典蓝牙连接,接收所述目标拾音器所采集的语音信号。

Description

语音传输方法、智能终端及计算机可读存储介质
技术领域
本发明涉及智能家居,具体而言,主要涉及一种针对语音传输的方法、智能终端及计算机可读存储介质。
背景技术
在智能家居领域,智能音箱一般作为语音控制的输入端存在。然而,随着智能音箱的不断普及,应用场景也随之扩展。如果是多个房间或者大的办公场所,距离智能音箱较远,那么拾音效果很差,导致语音识别功能效果不佳,使用场景较为有限。
发明内容
有鉴于此,本发明提出一种语音传输方法、装置及计算机可读存储介质,能够在大场所、多房间的场景下,更为精确地实现语音采集和识别。
首先,为实现上述目的,本发明提出一种语音传输方法,应用于智能终端,所述智能终端与至少一拾音设备低功耗蓝牙(BLE)连接,包括:
监测是否接收到拾音设备唤醒信号;
若是,则接收被唤醒的拾音设备所反馈的BLE数据;
根据所述BLE数据确认目标拾音设备;
切换所述智能终端与所述目标拾音设备的连接为经典蓝牙连接,以及
通过所述经典蓝牙连接,接收所述目标拾音设备所采集的语音信号。
优选地,所述BLE数据至少包括所述拾音设备的MAC地址、UUID中的一种或多种。
优选地,所述根据所述BLE数据信息确认目标拾音设备的步骤,具体包括:
查询所述BLE数据的接收时间;
根据所述接收时间确定目标BLE数据;
解析所述目标BLE数据,获取对应的MAC地址和/或UUID;以及
确定与所获取的MAC地址和/或UUID对应的拾音设备为所述目标拾音设备。
优选地,所述根据所述BLE数据信息确认目标拾音设备的步骤,具体包括:
解析所述BLE数据,获取所述拾音设备的MAC地址和/或UUID;
根据MAC地址和/或UUID确定对应的拾音设备和用户预先设定的所述拾音设备的优先级;以及
确认其中优先级最高的拾音设备为所述目标拾音设备。
优选地,还包括:
在智能终端连接上拾音设备时,检测所述拾音设备是否第一次与所述智能终端连接;以及
若是,则提示用户为所述拾音设备设定优先级。
优选地,所述拾音设备唤醒信号包括预设语音信号,和/或预设按键触发信号。
优选地,在所述接收所述目标拾音设备所采集的语音信号的步骤之后,还包括:
发送所述语音信号至语音识别服务器;
接收所述语音识别服务器返回的标准语音指令;
根据所述标准语音指令执行对应的智能家居操作;以及
获取所述智能家居的执行结果,并反馈至所述目标拾音设备,以使其输出所述执行结果。
优选地,还包括:
预先在每一个拾音设备与智能终端之间建立经典蓝牙连接;以及
存储每一个拾音设备与智能终端之间的经典蓝牙连接配对信息。
此外,为实现上述目的,本发明还提供一种智能终端,所述智能终端包括存储器、处理器、以及存储在所述存储器上并可被所述处理器运行的语音传输系统,所述语音传输系统被所述处理器执行时,可实现如上文所述的语音传输方法。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有语音传输系统,所述语音传输系统可被至少一个处理器执行,以使所述至少一个处理器执行如上文所述的语音传输方法的步骤。
相较于现有技术,本发明所提供的语音传输方法、智能终端及计算机可读存储介质,利用低功耗蓝牙和经典蓝牙技术,使一台智能音箱能够与多个设置于不同位置的拾音设备保持BLE连接,实时监测和采集用户在不同位置的语音信号,识别和响应对应的语音控制指令,为用户提供覆盖范围更广、功耗更少、成本更低的智能化的服务。
附图说明
图1是本发明各实施例可选的运行环境示意图;
图2是本发明各实施例可选的智能终端的硬件架构示意图;
图3是本发明所述的语音传输系统一实施例的程序模块图;
图4是本发明所述的语音传输方法第一实施例的流程示意图;
图5是本发明步骤S130的第一细化流程示意图;
图6是本发明步骤S130的第二细化流程示意图;
图7是本发明步骤S233之前的补充流程示意图;
图8是本发明所述的语音传输方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
现在,将参考附图1和附图2,描述实现本发明各个实施例的运行环境和服务器1的硬件架构。
参图1所示,是实现本发明各个实施例一可选的运行环境示意图。如图所示,本发明可应用于包括,但不仅限于,语音识别服务器1、智能终端2、拾音设备3的运行环境中。
其中,所述语音识别服务器1可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该语音识别服务器1可以是独立的服务器,也可以是多个服务器所组成的服务器集群。该语音识别服务器1通过网络与智能终端2通信连接,用于接收和识别所述智能终端2所发送的语音数据,并返回语音识别结果至该智能终端2。
所述智能终端2可以是智能音箱、移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等的移动设备,也可以是诸如智能音箱、智能电视、数字屏幕、台式计算机、笔记本等的固定终端。该智能终端2分别与拾音设备3和所述语音识别服务器1通信连接,用于从所述拾音设备3接收其所采集的语音信号,并发送所接收的语音信号至所述语音识别服务器。
所述拾音设备3可以是拾音器、麦克风、话筒、录音机、录音笔、电话机、移动通信设备、语音面板等,该拾音设备3与所述智能终端2通信连接,用于在唤醒时,采集用户输入的语音信号,并通过所述通信连接传输所述语音信号至所述智能终端2。
本实施例中,所述服务器1通过网络与所述智能终端2通信连接,所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System ofMobile communication,GSM)、宽带码分多址(Wideband Code Division MultipleAccess,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。所述智能终端2通过近场通信网络与一个或多个所述拾音设备3通信连接,所述近场通信网络包括,但不限于,Wi-Fi、蓝牙、红外线、Zigbee等无线通信方式。其中所述一个或多个拾音设备3可分别设置于用户经常出入场所的不同位置,与所述智能终端2一起构成覆盖所述场所的智能化控制网络,随时随地采集用户语音信号,识别和响应对应的语音控制指令,实现语音控制。
参图2所示,是实现本发明的各个实施例一可选的智能终端2的硬件架构示意图。如图所示,所述智能终端2可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、通信接口13以及蓝牙模块14。需要指出的是,图1仅示出了具有组件11-14的智能终端2,但应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述智能终端2的内部存储单元,例如该智能终端2的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述智能终端2的外部存储设备,例如该智能终端2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述智能终端2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述智能终端2的操作系统和各类应用软件,例如语音传输系统10的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述智能终端2的总体操作。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述语音传输系统10的程序代码等。
所述通信接口13可包括无线网络接口或有线网络接口,例如,所述通信接口13可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System ofMobile communication,GSM)、宽带码分多址(Wideband Code Division MultipleAccess,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等网络通信接口。本实施例中,所述通信接口13通常用于在所述服务器1与所述智能终端2之间建立通信连接和传输数据。
所述蓝牙模块14至少包括经典蓝牙模块和低功耗蓝牙(BLE)模块。其中,所述经典蓝牙模块用于在所述智能设备2与一拾音设备3之间建立经典蓝牙连接和通信。所述BLE模块用于在所述智能设备2与一个或多个拾音设备3之间建立BLE连接并进行数据通信。本实施例中,一般情况下,所述拾音设备3与所述智能终端2之间只进行BLE连接,以降低通信连接的功耗。而当需要传输语音数据时,则将传输语音数据的拾音设备3与所述智能终端2之间的BLE连接切换为经典蓝牙连接,以便于语音数据的快速传输。
至此,己经详细描述了实现本发明各实施例可选的运行环境和服务器1硬件架构。以下,将基于上述运行环境和硬件架构,提出本发明的各个实施例。
首先,本发明提出一种语音传输系统10。
如图3所示,为本发明所述的语音传输系统10第一实施例的程序模块示意图。本实施例中,所述的语音传输系统10可以被分割成一个或多个模块,所述一个或多个模块可被存储于存储设备(本实施例中为存储器11)中,并由一个或多个控制器(本实施例中为所述处理器12)所执行,以完成本发明。例如,在图3中,所述语音传输系统10可以被分割成监测模块201、接收模块202、确认划模块203、连接模块204、以及发送模块205。本发明所称的程序模块是指一种能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述软件在所述智能终端2中的执行过程。以下将就上述各程序模块201-205的具体功能进行详细描述。
所述监测模块201,用于监测是否接收到拾音器唤醒信号。
本实施例中,所述智能终端2优选为智能音箱,所述拾音设备3优选为拾音器(下文将以智能音箱和拾音器为例进行说明)。其中,所述智能音箱和所述拾音器均集成有蓝牙模块14,所述蓝牙模块14包括经典蓝牙模块和低功耗蓝牙(BLE:Bluetooth Low Energy)模块。工作时,所述智能音箱通过BLE模块分别与一台或多台拾音器通信连接,所述拾音器分别设置于用户经常出入场所的不同位置,用于采集不同位置用户输入的语音信号。
一般地,所述拾音器可在不工作时处于休眠状态以节约能耗,当且仅当监测到预设的拾音器唤醒信号时,才从所述休眠状态转入工作状态。其中,所述预设拾音器唤醒信号可包括,但不限于,语音信号、预设按键所触发信号等。例如,所述预设拾音器唤醒信号可以是语音信号:“小度、小度”,或者是设置于所述拾音器上的物理按键被触发所产生的电平信号等。本实施例中,所述监测模块201实时监测所述拾音器是否产生到信号;若监测到信号,则将所述信号与预设的拾音器唤醒信号进行比较,以判断所述信号是否为所述预设的拾音器唤醒信号。
所述接收模块202,用于在接收到所述拾音器唤醒信号时,接收被唤醒的拾音器所反馈的BLE数据。
本实施例中,所述拾音器与所述智能音箱可预先设定一数据传输协议。所述数据传输协议可约定,当所述信号为所述预设的拾音器唤醒信号时,被唤醒的拾音器自动生成预设的BLE数据,所述BLE数据的数据格式可以是“报头+类型+具体数据+校验”的格式,数据内容至少包括所述拾音器的MAC(Media Access Control Address,硬件地址)地址、UUID(Universally Unique Identifier,通用唯一识别码)中的任意一个或多个。所述BLE数据生成后,可通过所述拾音器与所述智能音箱之间的BLE通信连接,被发送至所述智能音箱,以使所述接收模块202接收所述BLE数据。需要说明的是,在其他实施例中,当多个拾音器均被唤醒时,所述多个被唤醒的拾音器自动生成所述BLE数据,所述接收模块202分别接收被发送至所述智能音箱的所述BLE数据,并记录所述BLE数据被接收的时间。
所述确认模块203,用于根据所述BLE数据确认目标拾音器。
本实施例中,当所述BLE数据被发送至所述智能音箱时,所述确认模块203对所述BLE数据进行解析,即按预设的协议约定数据格式解析所述BLE数据,获取该BLE数据的具体内容。例如,获取包含于该BLE数据中的对应拾音器的MAC地址、UUID。通过所述MAC地址和/或UUID,所述确认模块203可以确认发送所述BLE数据的拾音器,即被唤醒的拾音器、可能被用户用于语音信号输入的拾音器。
具体而言,当所接收的BLE数据为一个(即被唤醒的拾音器仅1个)时,所述确认模块203对所述BLE数据进行解析,获取该BLE数据中包含的MAC地址和/或UUID,直接确认与该MAC地址和/或UUID对应的拾音器为所述目标拾音器。当所接收的BLE数据为多个(即被唤醒的拾音器不止1个)时,所述确认模块203需要根据不同的情况确定所述目标拾音器。其中:
在一个实施例中,当所接收的BLE数据为多个时,所述确认模块203首先查询所述多个BLE数据的接收时间;然后,根据所述接收时间确定目标BLE数据,例如确定接收时间最早的BLE数据为所述目标BLE数据等;最后,解析所述目标BLE数据,获取对应的MAC地址和/或UUID,进而确定与所获取的MAC地址和/或UUID对应的拾音器为所述目标拾音器。
在另一个实施例中,当所接收的BLE数据为多个时,所述确认模块203还可以首先对所述多个BLE数据进行解析,获取该多个BLE数据中包含的多个MAC地址和/或UUID;然后,根据该多个MAC地址和/或UUID确认对应的多个拾音器;最后,根据用户预先设定的拾音器的优先级,确定其中优先级最高的拾音器为所述目标拾音器。此外,需要补充的是,所述拾音器的优先级设定,可以是在所述拾音器第一次连接所述智能音箱时,提示用户为所述拾音器设定优先级。例如,可根据用户在不同位置停留的时间,设定不同的优先级:设定客厅的拾音器优先级为高,卧室为中,其他位置为低等。
所述连接模块204,用于切换所述智能音箱与所述目标拾音器的连接方式为经典蓝牙连接。
本实施例中,所述拾音器与所述智能音箱通信连接,用于在唤醒时采集用户输入的语音信号,并通过所述通信连接传输所述语音信号至所述智能音箱。其中,一般情况下,所述拾音器与所述智能音箱之间只进行BLE连接,以便在保持通信链路的同时,降低通信连接的功耗。然而,当所述拾音器被唤醒,用户将要进行语音信号输入时,由于BLE连接对数据传输的支持较弱,故需要进行通信连接的切换。具体而言,当所述目标拾音器确认后,所述连接模块204将所述拾音器与所述智能音箱之间的BLE连接切换为经典蓝牙连接,以便于后续将该目标拾音器所采集的语音数据快速传输至所述智能音箱。其中,需要说明的是,本实施例中,所述智能音箱预先与每一个拾音器之间建立经典蓝牙连接,并存储每一个拾音器与智能终端之间的经典蓝牙连接配对信息于所述存储器11。通过所述经典蓝牙连接配对信息,所述连接模块204可以将迅速所述拾音器与所述智能音箱之间的BLE连接切换为经典蓝牙连接。
所述接收模块202,还用于通过所述经典蓝牙连接,接收所述目标拾音器所发送的语音信号。
如上文所述,当所述目标拾音器与所述蓝牙音箱的连接方式切换为经典蓝牙连接后,所述目标拾音器实时采集用户输入的语音信号,所述接收模块202接收所述目标拾音器发送至所述智能音箱的所述语音信号。
所述发送模块205,用于发送所述语音信号至语音识别服务器,以及接收所述语音识别服务器返回的标准语音指令,并根据所述标准语音指令执行对应的智能家居操作。
本实施例中,所述智能音箱和拾音器均应用于智能家居系统,所述智能音箱相当于中控设备,该中控设备还与一个或多个智能家居设备连接,用于控制对应的智能家居设备工作。具体地,所述智能音箱首先接收用户输入的语音信号,发送该语音信号至云端的语音识别服务器,用以在该语音识别服务器内进行语音识别。然后,当所述语音识别服务器返回识别结果时,该智能音箱获取所述识别结果中的标准语音指令,并根据所述标准语音指令控制对应的智能家居设备执行对应的操作。例如,控制空调开启、电视机开关机、门窗开启关闭等。
所述发送模块205,还用于获取所述智能家居的执行结果,并反馈至所述目标拾音器,以使其输出所述执行结果。
一般地,所述智能家居的执行结果包括执行成功和执行失败,所述发送模块205可根据所述执行结果,在所述智能音箱中生成对应的语音输入信号,例如生成“空调已开启”、“空调开启失败”的语音信号等,并反馈给与之经典蓝牙连接的所述目标拾音器,在该目标拾音器中进行播放。当然,在其他实施例中,所述智能音箱还可以直接播放所述执行结果。
通过上述程序模块201-205,本发明所提供的语音传输系统10,利用低功耗蓝牙和经典蓝牙技术,使一台智能终端2能够与多个设置于不同位置的拾音设备3长期保持BLE连接,进而通过实时监测和采集不同位置用户的语音信号,识别和响应对应的语音控制指令,为用户提供覆盖范围更广、功耗更少、成本更低的智能化的服务。
其次,本发明还提出一种语音传输方法。
参图4所示,是本发明所述的语音传输方法第一实施例的流程示意图。本实施例中,根据不同的需求,图4所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。所述语音传输方法包括:
步骤S110,监测是否接收到拾音器唤醒信号。
本实施例中,所述智能终端2优选为智能音箱,所述拾音设备3优选为拾音器(下文将以智能音箱和拾音器为例进行说明)。其中,所述智能音箱和所述拾音器均集成有蓝牙模块14,所述蓝牙模块14包括经典蓝牙模块和低功耗蓝牙(BLE:Bluetooth Low Energy)模块。工作时,所述智能音箱通过BLE模块分别与一台或多台拾音器通信连接,所述拾音器分别设置于用户经常出入场所的不同位置,用于采集不同位置用户输入的语音信号。
一般地,所述拾音器可在不工作时处于休眠状态以节约能耗,当且仅当监测到预设的拾音器唤醒信号时,才从所述休眠状态转入工作状态。其中,所述预设拾音器唤醒信号可包括,但不限于,语音信号、预设按键所触发信号等。例如,所述预设拾音器唤醒信号可以是语音信号:“小度、小度”,或者是设置于所述拾音器上的物理按键被触发所产生的电平信号等。本实施例实时监测所述拾音器是否产生到信号;若监测到信号,则将所述信号与预设的拾音器唤醒信号进行比较,以判断所述信号是否为所述预设的拾音器唤醒信号。
步骤S120,在接收到所述拾音器唤醒信号时,接收被唤醒的拾音器所反馈的BLE数据。
本实施例中,所述拾音器与所述智能音箱可预先设定一数据传输协议。所述数据传输协议可约定,当所述信号为所述预设的拾音器唤醒信号时,被唤醒的拾音器自动生成预设的BLE数据,所述BLE数据的数据格式可以是“报头+类型+具体数据+校验”的格式,数据内容至少包括所述拾音器的MAC(Media Access Control Address,硬件地址)地址、UUID(Universally Unique Identifier,通用唯一识别码)中的任意一个或多个。所述BLE数据生成后,可通过所述拾音器与所述智能音箱之间的BLE通信连接,被发送至所述智能音箱。需要说明的是,在其他实施例中,当多个拾音器均被唤醒时,所述多个被唤醒的拾音器自动生成所述BLE数据,分别接收被发送至所述智能音箱的所述BLE数据,并记录所述BLE数据被接收的时间。
步骤S130,根据所述BLE数据确认目标拾音器。
本实施例中,当所述BLE数据被发送至所述智能音箱时,对所述BLE数据进行解析,即按预设的协议约定数据格式解析所述BLE数据,获取该BLE数据的具体内容。例如,获取包含于该BLE数据中的对应拾音器的MAC地址、UUID。通过所述MAC地址和/或UUID,可以确认发送所述BLE数据的拾音器,即被唤醒的拾音器、可能被用户用于语音信号输入的拾音器。
具体而言,当所接收的BLE数据为一个(即被唤醒的拾音器仅1个)时,对所述BLE数据进行解析,获取该BLE数据中包含的MAC地址和/或UUID,直接确认与该MAC地址和/或UUID对应的拾音器为所述目标拾音器。当所接收的BLE数据为多个(即被唤醒的拾音器不止1个)时,需要根据不同的情况确定所述目标拾音器。例如,在一个实施例中,如图5所示,所述步骤S130,具体可包括:
步骤S131,查询所述多个BLE数据的接收时间;
步骤S132,根据所述接收时间确定目标BLE数据。例如,确定接收时间最早的BLE数据为所述目标BLE数据等;
步骤S133,解析所述目标BLE数据,获取对应的MAC地址和/或UUID;
步骤S134,确定与所获取的MAC地址和/或UUID对应的拾音器为所述目标拾音器。
例如,在另一个实施例中,如图6所示,所述步骤S130,具体还可包括:
步骤S233,对所述多个BLE数据进行解析,获取该多个BLE数据中包含的多个MAC地址和/或UUID;
步骤S234,根据该多个MAC地址和/或UUID确认对应的多个拾音器,以及用户预先设定的所述多个拾音器的优先级;
步骤S235,确定其中优先级最高的拾音器为所述目标拾音器。
在该实施例中,需要补充的是,所述拾音器的优先级设定,可以是在所述拾音器第一次连接所述智能音箱时,提示用户为所述拾音器设定优先级。具体地,如图7所示,在上述步骤S233之前,还可包括:
步骤S231,在所述智能音箱连接上所述拾音器时,检测所述拾音器是否第一次与所述智能音箱连接;
步骤S232,若是,则提示用户为所述拾音器设定优先级。其中,优先级可根据用户在不同位置停留的时间,设定为不同的优先级:设定客厅的拾音器优先级为高,卧室为中,其他位置为低等。
步骤S140,切换所述智能音箱与所述目标拾音器的连接方式为经典蓝牙连接。
本实施例中,所述拾音器与所述智能音箱通信连接,用于在唤醒时采集用户输入的语音信号,并通过所述通信连接传输所述语音信号至所述智能音箱。其中,一般情况下,所述拾音器与所述智能音箱之间只进行BLE连接,以便在保持通信链路的同时,降低通信连接的功耗。然而,当所述拾音器被唤醒,用户将要进行语音信号输入时,由于BLE连接对数据传输的支持较弱,故需要进行通信连接的切换。具体而言,当所述目标拾音器确认后,将所述拾音器与所述智能音箱之间的BLE连接切换为经典蓝牙连接,以便于后续将该目标拾音器所采集的语音数据快速传输至所述智能音箱。其中,需要说明的是,本实施例中,所述智能音箱预先与每一个拾音器之间建立经典蓝牙连接,并存储每一个拾音器与智能终端之间的经典蓝牙连接配对信息于所述存储器11。通过所述经典蓝牙连接配对信息,可以将迅速所述拾音器与所述智能音箱之间的BLE连接切换为经典蓝牙连接。
步骤S150,通过所述经典蓝牙连接接收所述目标拾音器发送的语音信号。
如上文所述,当所述目标拾音器与所述蓝牙音箱的连接方式切换为经典蓝牙连接后,所述目标拾音器实时采集用户输入的语音信号,接收所述目标拾音器发送至所述智能音箱的所述语音信号。
通过上述步骤S110-S150,本发明所提供的语音传输方法,利用低功耗蓝牙和经典蓝牙技术,使一台智能终端2能够与多个设置于不同位置的拾音设备3长期保持BLE连接,构成覆盖用户所处场所的实时监测网络,随时随地监测和采集用户在不同位置的语音信号,提高语音信号采集的覆盖范围,并在需要进行语音信号传输时,灵活切换连接模式,提高数据信号传输速率。
进一步地,基于上述本发明所述的语音传输方法的第一实施例,提出本发明的第二实施例。本实施例中,如图8所示,所述方法还包括:
步骤S160,发送所述语音信号至语音识别服务器。
步骤S170,接收所述语音识别服务器返回的标准语音指令。
步骤S180,根据所述标准语音指令执行对应的智能家居操作。
本实施例中,所述智能音箱和拾音器均应用于智能家居系统,所述智能音箱相当于中控设备,该中控设备还与一个或多个智能家居设备连接,用于控制对应的智能家居设备工作。具体地,所述智能音箱首先接收用户输入的语音信号,发送该语音信号至云端的语音识别服务器,用以在该语音识别服务器内进行语音识别。然后,当所述语音识别服务器返回识别结果时,该智能音箱获取所述识别结果中的标准语音指令,并根据所述标准语音指令控制对应的智能家居设备执行对应的操作。例如,控制空调开启、电视机开关机、门窗开启关闭等。
步骤S190,获取所述智能家居的执行结果,并反馈至所述目标拾音器,以使其输出所述执行结果。
一般地,所述智能家居的执行结果包括执行成功和执行失败,所述发送模块205可根据所述执行结果,在所述智能音箱中生成对应的语音输入信号,例如生成“空调已开启”、“空调开启失败”的语音信号等,并反馈给与之经典蓝牙连接的所述目标拾音器,在该目标拾音器中进行播放。当然,在其他实施例中,所述智能音箱还可以直接播放所述执行结果。
通过上述流程步骤S160-S190,本发明所提供的语音传输方法,进一步通过将所采集的用户语音信号发生至云端服务器,识别和响应对应的语音控制指令,为用户提供覆盖范围更广、功耗更少、成本更低的智能化的服务。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音传输方法,应用于智能终端,所述智能终端与至少一拾音设备低功耗蓝牙(BLE)连接,其特征在于,包括:
监测是否接收到拾音设备唤醒信号;
若是,则接收被唤醒的拾音设备所反馈的BLE数据;
根据所述BLE数据确认目标拾音设备;
切换所述智能终端与所述目标拾音设备的连接为经典蓝牙连接,以及
通过所述经典蓝牙连接,接收所述目标拾音设备所采集的语音信号。
2.根据权利要求1所述的语音传输方法,其特征在于,所述BLE数据至少包括所述拾音设备的MAC地址、UUID中的一种或多种。
3.根据权利要求2所述的语音传输方法,其特征在于,所述根据所述BLE数据信息确认目标拾音设备的步骤,具体包括:
查询所述BLE数据的接收时间;
根据所述接收时间确定目标BLE数据;
解析所述目标BLE数据,获取对应的MAC地址和/或UUID;以及
确定与所获取的MAC地址和/或UUID对应的拾音设备为所述目标拾音设备。
4.根据权利要求2所述的语音传输方法,其特征在于,所述根据所述BLE数据信息确认目标拾音设备的步骤,具体包括:
解析所述BLE数据,获取所述拾音设备的MAC地址和/或UUID;
根据MAC地址和/或UUID确定对应的拾音设备和用户预先设定的所述拾音设备的优先级;以及
确认其中优先级最高的拾音设备为所述目标拾音设备。
5.根据权利要求4所述的语音传输方法,其特征在于,还包括:
在智能终端连接上拾音设备时,检测所述拾音设备是否第一次与所述智能终端连接;以及
若是,则提示用户为所述拾音设备设定优先级。
6.根据权利要求1-5任一项所述的语音传输方法,其特征在于,所述拾音设备唤醒信号包括预设语音信号,和/或预设按键触发信号。
7.根据权利要求1-5任一项所述的语音传输方法,其特征在于,在所述接收所述目标拾音设备所采集的语音信号的步骤之后,还包括:
发送所述语音信号至语音识别服务器;
接收所述语音识别服务器返回的标准语音指令;
根据所述标准语音指令执行对应的智能家居操作;以及
获取所述智能家居的执行结果,并反馈至所述目标拾音设备,以使其输出所述执行结果。
8.根据权利要求1-5任一项所述的语音传输方法,其特征在于,还包括:
预先在每一个拾音设备与智能终端之间建立经典蓝牙连接;以及
存储每一个拾音设备与智能终端之间的经典蓝牙连接配对信息。
9.一种智能终端,其特征在于,所述智能终端包括存储器、处理器、以及存储在所述存储器上并可被所述处理器运行的语音传输系统,所述语音传输系统被所述处理器执行时,可实现如权利要求1-8中任一项所述的语音传输方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音传输系统,所述语音传输系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1至8中任一项所述的语音传输方法的步骤。
CN202011048012.3A 2020-09-29 2020-09-29 语音传输方法、智能终端及计算机可读存储介质 Pending CN112216279A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011048012.3A CN112216279A (zh) 2020-09-29 2020-09-29 语音传输方法、智能终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011048012.3A CN112216279A (zh) 2020-09-29 2020-09-29 语音传输方法、智能终端及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112216279A true CN112216279A (zh) 2021-01-12

Family

ID=74051967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011048012.3A Pending CN112216279A (zh) 2020-09-29 2020-09-29 语音传输方法、智能终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112216279A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157240A (zh) * 2021-04-27 2021-07-23 百度在线网络技术(北京)有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108667697A (zh) * 2018-04-28 2018-10-16 新华三技术有限公司 语音控制冲突解决方法、装置及语音控制系统
US10367540B1 (en) * 2018-02-20 2019-07-30 Cypress Semiconductor Corporation System and methods for low power consumption by a wireless sensor device
CN110223691A (zh) * 2019-06-11 2019-09-10 苏州思必驰信息科技有限公司 语音唤醒识别的切换控制方法和装置
CN110312235A (zh) * 2019-05-16 2019-10-08 深圳市豪恩声学股份有限公司 实时语音唤醒的音频设备、运行方法、装置及存储介质
CN110675873A (zh) * 2019-09-29 2020-01-10 百度在线网络技术(北京)有限公司 智能设备的数据处理方法、装置、设备及存储介质
CN111369988A (zh) * 2018-12-26 2020-07-03 华为终端有限公司 一种语音唤醒方法及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10367540B1 (en) * 2018-02-20 2019-07-30 Cypress Semiconductor Corporation System and methods for low power consumption by a wireless sensor device
CN108667697A (zh) * 2018-04-28 2018-10-16 新华三技术有限公司 语音控制冲突解决方法、装置及语音控制系统
CN111369988A (zh) * 2018-12-26 2020-07-03 华为终端有限公司 一种语音唤醒方法及电子设备
CN110312235A (zh) * 2019-05-16 2019-10-08 深圳市豪恩声学股份有限公司 实时语音唤醒的音频设备、运行方法、装置及存储介质
CN110223691A (zh) * 2019-06-11 2019-09-10 苏州思必驰信息科技有限公司 语音唤醒识别的切换控制方法和装置
CN110675873A (zh) * 2019-09-29 2020-01-10 百度在线网络技术(北京)有限公司 智能设备的数据处理方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157240A (zh) * 2021-04-27 2021-07-23 百度在线网络技术(北京)有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品

Similar Documents

Publication Publication Date Title
US11223497B2 (en) Method and apparatus for providing notification by interworking plurality of electronic devices
CN110767225B (zh) 一种语音交互方法、装置及系统
CN111724784A (zh) 设备控制方法及装置
CN104837157B (zh) 音箱添加方法、装置、移动终端和智能音箱
CN110687815B (zh) 设备控制方法、装置、终端设备及存储介质
CN111583928A (zh) 设备控制方法及相关装置
CN111667825A (zh) 语音控制方法、云平台及语音设备
CN107742520B (zh) 语音控制方法、装置及系统
CN112838967B (zh) 主控设备、智能家居及其控制装置、控制系统及控制方法
CN111981632A (zh) 信息通知方法、装置及空调系统
CN113506568A (zh) 中控及智能设备控制方法
CN112216279A (zh) 语音传输方法、智能终端及计算机可读存储介质
CN112634922A (zh) 语音信号处理方法、设备及计算机可读存储介质
WO2024002298A1 (zh) 一种语音指令处理方法、装置、系统以及存储介质
CN112712683B (zh) 家电设备的控制方法、系统、遥控器和服务器
WO2023231894A1 (zh) 基于协同纠错的唤醒方法、装置及系统、介质、设备
US20220122600A1 (en) Information processing device and information processing method
CN108399918B (zh) 智能设备连接方法、智能设备及终端
CN108663942A (zh) 一种语音识别设备控制方法、语音识别设备和中控服务器
CN113840164A (zh) 语音控制方法、装置、终端设备及存储介质
CN112217698A (zh) 数据传输方法、系统及计算机可读存储介质
CN112435670A (zh) 语音识别方法、语音识别设备和计算机可读存储介质
US20240312462A1 (en) Voice control method and apparatus for device, storage medium, and electronic apparatus
CN113765753B (zh) 家电设备的即时通信方法、家电设备及存储介质
CN112599143A (zh) 降噪方法、语音采集设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231010

Address after: No. 15, Jiannan Road, Nanyou Community, Yuehai Street, Nanshan District, Shenzhen, Guangdong 518000 Hengda Tianjing B2801

Applicant after: Xingluo home yunwulian Technology Co.,Ltd.

Address before: 31a01, block a, aerospace science and Technology Plaza, no.1698, Haizhu community, Yuehai street, Nanshan District, Shenzhen, Guangdong 518000

Applicant before: Star Network Intelligent Technology Co.,Ltd.

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210112