CN111681675A - 数据动态传输方法、装置、设备和存储介质 - Google Patents

数据动态传输方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111681675A
CN111681675A CN202010498095.XA CN202010498095A CN111681675A CN 111681675 A CN111681675 A CN 111681675A CN 202010498095 A CN202010498095 A CN 202010498095A CN 111681675 A CN111681675 A CN 111681675A
Authority
CN
China
Prior art keywords
data
sound
transmission
sound data
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010498095.XA
Other languages
English (en)
Inventor
赵星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian TCL Software Development Co Ltd
Original Assignee
Xian TCL Software Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian TCL Software Development Co Ltd filed Critical Xian TCL Software Development Co Ltd
Priority to CN202010498095.XA priority Critical patent/CN111681675A/zh
Publication of CN111681675A publication Critical patent/CN111681675A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种数据动态传输方法,包括以下步骤:获取预设麦克风阵列采集的声音数据;分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。此外,本发明还公开了一种数据动态传输装置、设备和存储介质。通过将麦克风阵列采集声音数据分时采用不同的传输策略,使得智能语音设备的响应速度获得明显提升。

Description

数据动态传输方法、装置、设备和存储介质
技术领域
本发明涉及数据传输领域,尤其涉及数据动态传输方法、装置、设备和存储介质。
背景技术
AI大潮方兴未艾,市场上出现越来越多的人工智能产品,而其中发展最迅猛的就是智能语音设备。自2014年11月Amazon推出首款基于语音交互的智能音箱Amazon Echo以来,智能语音设备进入了一个快速发展时期。到目前为止,亚马逊、谷歌、科大讯飞、阿里巴巴、腾讯、京东等科技巨头都推出了自己的智能音响。可以预见的是,未来将会有许许多多设备搭载智能语音控制,形成智能语音设备的洪流。
这些产品的共同特点就是能够识别人的语言,领会人的意图,做出相应的反应。也就是说,它们能够根据人发出的指令工作。但在用户使用过程中可以发现,这些语音设备的响应速度似乎不够理想,如何提高这些语音设备的响应速度成了亟待解决的问题。
发明内容
本发明的主要目的在于提供一种数据动态传输方法、装置、设备和存储介质,旨在解决当前智能语音设备响应速度慢的技术问题。
为实现上述目的,本发明提供数据动态传输方法,所述数据动态传输方法包括以下步骤:
获取预设麦克风阵列采集的声音数据;
分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;
若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;
确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
在一实施例中,所述并行传输所述纯噪声数据和所述语音数据的步骤,包括:
获取传输通道数量;
在存在至少两条传输通道时,分别为所述纯噪声数据和所述用户语音数据选择目标传输通道,并行传输所述纯噪声数据和所述用户语音数据;
在存在一条传输通道时,将所述纯噪声数据的传输速率设置为第一传输速率,将所述用户语音数据的传输速率设置为第二传输速率,并按照所述第一传输速率传输所述纯噪声数据,按照所述第二传输速率传输所述用户语音数据。
在一实施例中,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤,包括:
获取所述声音数据的声音强度;
判断所述声音数据中是否存在声音强度大于预设强度阈值的目标声音数据;
若所述声音数据中存在声音强度大于所述预设强度阈值的目标声音数据,则判定所述声音数据中存在唤醒时间点,其中,所述声音数据中第一个目标声音数据出现的时间点为唤醒时间点;
若所述声音数据中不存在声音强度大于预设强度阈值的目标声音数据,则所述声音数据中不存在唤醒时间点。
在一实施例中,所述若所述声音数据中不存在声音强度大于预设强度阈值的目标声音数据,则所述声音数据中不存在唤醒时间点的步骤之后,包括:
根据预设周期内的声音数据,对预设强度阀值进行调整,得到调整后的强度阀值;
将调整后的强度阀值作为预设强度阀值。
在一实施例中,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤,包括:
对所述声音数据进行语音识别,生成文字标识;
判断预设文字标识库中是否存在所述文字标识;
若所述文字标识库中存在所述文字标识,则获取所述声音数据中所述文字标识出现的起始时间,将所述起始时间作为所述唤醒时间点。
在一实施例中,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤之后,包括:
若声音数据中不存在所述唤醒时间点;
串行传输所述声音数据,或获取预设麦克风阵列采集速率,将所述声音数据以所述预设麦克风阵列采集速率进行传输。
在一实施例中,所述获取预设麦克风阵列采集的声音数据的步骤之后,包括:
对环境声音数据进行预处理,所述预处理包含语音增强、噪声消除、语音数据压缩中至少一项。
此外,为实现上述目的,本发明还提供一种数据动态传输装置,所述数据动态传输装置包括:
数据获取模块:用于获取预设麦克风阵列采集的声音数据;
分析判断模块:用于分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;
数据分类模块:用于若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;
数据传输模块:用于确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
此外,为实现上述目的,本发明还提供一种数据动态传输设备,所述数据动态传输设备包括:麦克风阵列、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述麦克风阵列,用于采集环境声音数据;
所述计算机程序被所述处理器执行时实现如上述方法中任一项所述的数据动态传输方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中任一项所述的数据动态传输方法的步骤。
本发明实施例提出的一种数据动态传输方法、装置、设备和存储介质,数据动态传输设备通过分析预设麦克风阵列采集的环境声音数据中的声音强度,或是进行语音识别确定唤醒时间点,并将声音数据根据唤醒时间点区分为纯噪声数据的用户语音数据,并采取不同的传输策略进行对唤醒时间点前后的数据的进行传输,实现了通过降低纯噪声数据的传输延迟从而达到了提升数据动态传输设备的响应速度的效果。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明数据动态传输方法第一实施例的流程示意图;
图3为本发明数据动态传输方法第三实施例的流程示意图;
图4为一段典型的语音数据示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于现有技术中设备的声音数据传输只使用串行和固定传输速率的方式,造成当设备需要根据声音数据作出响应时的响应速度较长,用户体验较差。
本发明提供一种解决方案,数据动态传输设备通过分析预设麦克风阵列采集的环境声音数据中的声音强度,确定纯噪声数据改变至第二环境声音的时间节点,并将所述时间节点前的纯噪声数据和所述时间点后的用户语音数据通过并行传输或是提升传输速率进行传输,此外,在环境声音数据只包含纯噪声数据时使用串行传输或默认速度进行传输,在提升语音设备响应速度的同时兼顾了低功耗的优点。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫数据动态传输设备,其中,数据动态传输设备可以是由单独的数据动态传输装置构成,也可以是由其他装置与数据动态传输装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的智能音箱、智能空调、自动驾驶汽车、PC(personal computer)个人计算机、智能手机、平板电脑、电子书阅读器、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器Central ProcessingUnit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,移动终端还可配置气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的数据动态传输方法中的步骤。
参照图2,本发明一种数据动态传输方法的第一实施例中,所述数据动态传输方法包括:
步骤S10,获取预设麦克风阵列采集的声音数据;
如图4所示,在数据动态传输设备采集到用户语音数据之前,所述纯噪音数据已经存在,可以理解的是,纯噪音数据作为持续存在的声音数据对后续用户语音数据采集造成一定影响,若将用户发出的声音数据称为纯用户语音数据,动态传输设备的预设麦克风阵列进行用户语音数据采集时,实际采集内容是纯用户语音数据与纯噪音数据的叠加数据,为了在后续用户语音数据处理时进行降噪处理,一并将所述纯噪声数据进行采集并发送,以使服务器端或数据动态传输设备根据所述纯噪声数据对用户语音数据进行降噪处理,进而获得更加准确的语音识别结果。
此外,为快速捕获用户的语音指令,数据动态传输设备在工作状态下实时对环境声音进行采集和传输,因此,在用户未发出语音指令前的纯噪音也被一并采集和发送,由于用户语音指令识别操作在数据动态设备的语音识别模块完成或是发送至服务器端完成,因此数据动态传输存在将预设麦克风阵列采集的声音数据进行内部传输(麦克风阵列到语音识别模块或麦克风阵列到通信模块)的过程,该过程中,不区分声音数据是纯噪音数据或是用户语音数据,因此采集的声音数据不论是纯噪音数据或是用户语音数据都将一并进行传输,当用户发出语音指令时,由于前序采集的纯噪音数据仍在进行传输,因此采集的用户语音数据需要等待纯噪音数据传输完毕后才开始到达传输目标处(语音识别模块或通信模块),如图4所示,在用户未发出语音指令前,数据动态传输设备采集的声音数据为纯噪音部分,在用户开始发出语音指令的时刻起,后续为用户语音数据部分,以智能音箱为例,当用户发出语音指令,如“Hi,小亮,唱支歌吧!”,智能音响采集的环境声音数据为用户语音数据部分,当智能音箱采集到用户语音数据时,处于用户语音数据前的纯噪音数据仍在进行前序传输,即用户语音数据前包含1000ms的纯噪音数据,则在等待纯噪音数据传输的1000ms内,智能音响无法对用户语音作出响应。
数据动态传输设备获取预设麦克风阵列采集的声音数据,所述数据动态传输设备包含智能音响、手机、pad等具有声音数据采集功能和根据所述声音数据作出反馈的设备,在此不作具体限定,所述数据动态传输设备内置预设麦克风阵列,用于实时采集声音数据,所述声音数据环境声音数据至少包含纯噪音数据和用户语音数据,通过如声音强度判断和语音识别匹配在不同时间点进行声音数据划分,具体实现方法将在后续实施例中进行说明,可以理解的是,预设麦克风阵列进行用户语音数据采集时,实际上采集到的是纯用户语音数据与纯噪音数据的叠加,本实施例与后续实施例将所述纯用户语音数据与纯噪音数据的叠加视为用户语音数据进行说明。
步骤S20,分析所述声音数据,判断所述声音数据中是否存在唤醒时间点。
数据动态传输设备分析所述声音数据,判断所述声音数据中是否存在唤醒时间点。由于本实施例对声音数据分时采取不同的传输策略,因此所述分时的时间点确定格外重要,数据动态传输设备通过对采集额声音数据进行分析,以确定采集的声音数据中是否包含用户的指令部分,可以理解的是,当用户发出语音指令时,相比于用户发出语音指令前仅采集较为稳定的纯噪声数据,预设麦克风阵列采集的环境声音数据会发生明显波动,因此通过分析当前时刻采集的环境声音的声音强度可判断用户是否发出语音指令并以用户发出语音指令的时刻为临界采取不同的声音数据传输策略,还可以通过如语音识别方法对声音数据进行分析,以判断声音数据中包含用户指令,此外,还可以通过预置如人体红外传感器、距离传感器等获取用户接近的信息,即根据上述的分析,将采集的声音数据的声音强度超过一定阈值的时刻或是语音识别的结果为用户唤醒指令的时刻或是用户接近到达一定距离的时刻作为唤醒时间点。
步骤S30,若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据。
数据动态传输设备判定述声音数据中存在唤醒时间点,所述唤醒时间点之前的声音数据作为纯噪声数据,将所述唤醒时间之后的声音数据作为用户语音数据。如前述内容描述可确定语音数据是否存在唤醒时间点,在确定数据动态传输设备的唤醒时间点后,可以理解的是,数据动态传输设备在未唤醒的状态下会持续的采集声音信息,以对用户发出的指令及时响应,因此,在唤醒时间点前,数据动态传输设备采集的声音数据只有纯噪声数据,而在唤醒时间点后,为用户语音数据,设备以唤醒时间点为时间界限,将声音数据进行区分,分为纯噪声数据和用户语音数据以在后续针对不同的数据采用不同的传输策略。
步骤S40,确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
数据动态传输设备确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。在数据动态传输设备尚未唤醒时即唤醒时间点前,数据动态传输设备采集的声音数据为纯噪声数据,在唤醒时刻后,切换为多通道传输,唤醒时间点前的纯噪声数据仍在原通道内进行传输,同时将唤醒时间点后的用户语音数据使用另一通道进行传输,即无需如单通道传输方式一般,等待纯噪声数据完成传输后再进行用户语音数据的传输,而是同时在两个通道内进行并行传输,在并行传输时,也可以将用户语音使用的通道传输速率提升,或是多通道传输速率同时提升,以更快完成重要数据的传输。除以上并行方法外,还可以采用保持单通道传输的方法,但在唤醒时刻后,立即提升通道传输速率至预设传输速率,所述预设传输速率为大于默认传输速率的预设值,而所述默认传输速率一般为预设麦克风阵列的采集速率,通过提升通道传输速率至预设传输速率,加速纯噪声数据和用户语音数据的传输,或是在传输纯噪声数据加速传输完成后,恢复至默认传输速率进行用户语音的传输,减少系统资源使用达到控制功耗的目的。
在本实施例中,数据动态传输设备通过分时变更环境声音的传输策略,降低了由于纯噪声传输引发的延迟,提高了数据动态传输设备反应速度,改善了用户体验。
进一步的,在本发明第一实施例的基础上,进一步提出了本发明数据动态传输方法的第二实施例,本实施例为第一实施例中步骤S40的细化步骤,所述数据动态传输方法包括:
步骤a1,获取传输通道数量。
步骤a2,在存在至少两条传输通道时,分别为所述纯噪声数据和所述用户语音数据选择目标传输通道,并行传输所述纯噪声数据和所述用户语音数据。
步骤a3,在存在一条传输通道时,将所述纯噪声数据的传输速率设置为第一传输速率,将所述用户语音数据的传输速率设置为第二传输速率,并按照所述第一传输速率传输所述纯噪声数据,按照所述第二传输速率传输所述用户语音数据。
数据动态传输设备获取传输通道数量,所述传输通道为数据动态传输设备内部的数据总线,所述数据总线包括但不限于I2S总线,本实施例以I2S为例进行解释,在数据动态传输设备存在至少两条传输通道时,分别位所述纯噪声数据和所述用户语音数据选择传输通道,并行传输所述纯噪声数据和所述用户语音数据。具体的,所述传输纯噪声的目标通道一般为一固定通道,即唤醒时间点前传输声音数据所使用的通道,而所述传输用户语音数据的传输通道则为区别于多通道中不用于传输纯噪声数据的一条,通过分通道传输,用户语音数据无需如同单通道情况下等待前序纯噪声传输完成后才开始传输,可有效降低因为传输纯噪声数据而产生的延迟。
以上为一种具体声音数据传输策略,此外,还可以数据动态传输设备只包含一条传输通道时,将将所述纯噪声数据的传输速率设置为第一传输速率,将所述用户语音数据的传输速率设置为第二传输速率,并按照所述第一传输速率传输所述纯噪声数据,按照所述第二传输速率传输所述用户语音数据。所述第二传输速率一般为预设麦克风采集速率,而所述第一预设传输速率则为大于第二传输速率的速率值,为保证声音数据正常传输,设备内部的传输速率的最小值不会小于声音数据的采集速率。在数据动态传输设备只包含单通道的请款下,未唤醒时,声音数据是以第二传输速率即最低传输速率进行传输,而在唤醒时刻出现时,立即提升传输速率至第一传输速率,加速传完前序的纯噪声数据,并以第二传输速率对后续的用户语音数据进行传输。
本实施例中,通过将纯噪声数据和用户语音数据分通道同时进行传输,或是通过提升纯噪声的传输速率,降低了数据动态传输设备因为传输纯噪声数据而产生的传输延迟,提高了设备的响应响度。
进一步的,参照图3,在本发明第一实施例的基础上,进一步提出了本发明数据动态传输方法的第三实施例,本实施例为第一实施例中步骤S20的细化步骤,所述数据动态传输方法包括:
步骤S21,获取所述声音数据的声音强度。
步骤S22,判断所述声音数据中是否存在声音强度大于预设强度阈值的目标声音数据。
步骤S23,若所述声音数据中存在声音强度大于所述预设强度阈值的目标声音数据,则判定所述声音数据中存在唤醒时间点,其中,所述声音数据中第一个目标声音数据出现的时间点为唤醒时间点。
步骤S24,若所述声音数据中不存在声音强度大于预设强度阈值的目标声音数据,则所述声音数据中不存在唤醒时间点。
数据动态传输设备获取所述声音数据的声音强度。为保证数据动态传输设备能够对用户的语音指令及时作出反馈,数据动态传输设备在工作状态下预设麦克风阵列持续处于采集状态,实时采集声音数据,数据动态传输设备判断当前时刻环境声音数据的声音强度是否大于与预设强度阈值。为准确捕捉用户语音指令,数据动态传输设备通过分析当前时刻采集的声音数据中是否存在声音强度是否大于预设强度阈值的目标声音数据,即当用户发出语音指令时,相比于用户发出语音指令前仅采集较为稳定的纯噪声数据,预设麦克风阵列采集的环境声音数据会发生明显波动,因此通过分析当前时刻采集声音数据的声音强度可判断用户是否发出语音指令并以用户发出语音指令的时刻为临界采取不同的声音数据传输策略,由于用户持续发出语音时声音数据存在多个大于预设强度阈值的目标声音数据,因此需要选择第一个目标声音数据常出现的时间点来作为唤醒时间点,即尽可能地还原用户刚发出语音指令的时间点,并作为唤醒时间点,所述预设强度阈值为显著高于纯噪声声音强度的预设值,用户可自行调节所述预设强度阈值以适用不同的使用场景,此外,所述预设强度阈值也可以通过由数据动态传输设备定期采集声音数据进行调节,如每间隔7天计算一次环境声音数据无明显波动的部分的声音强度均值,并在此均值基础上对声音强度阈值进行动态调整,以避免不同环境下纯噪音强度不同导致的误将纯噪音判定为用户语音而误将设备进行唤醒的情况。当数据动态传输设备判定所述声音强度大于等于预设强度阈值,则将所述声音强度大于等于预设强度阈值的时刻即为唤醒时间点,并以该时间点区分纯噪声数据和用于语音数据,以进一步的采取不同的传输策略。
此外,还可以通过在声音动态传输设备预设如红外传感器、接近传感器等捕捉用户靠近情形,据此并做出相应的传输策略的调整。具体的,当声音动态传输设备通通过预设传感器捕捉到用户靠近到达临界值时,则将到达临界值的时刻作为唤醒时间点,以进一步的采取不同的传输策略;若所述声音数据中不存在声音强度大于预设强度阈值的目标声音数据,数据动态传输设备则判定所述声音数据中不存在唤醒时间点。数据动态传输设备对预设麦克风阵列采集的声音数据的声音强度与预设强度阈值进行比对,可以理解的是,当用户未发出语音指令时,声音数据的声音强度将维持在一个较为稳定的低位,即声音数据中只包含稳定的纯噪音数据,因此判定不存在用户唤醒行为,自然也不存在唤醒时间点。
在本实施例中,数据动态传输设备通过判断声音数据的声音强度是否大于预设强度阈值,并在所述声音数据的声音强度大于预设强度阈值是确定唤醒时间点,以唤醒时间点将声音数据区分为纯噪声和用户语音以执行不同传输策略,实现了区分声音数据以选择传输策略从而达到提升设备相应速度的目的。
进一步的,在本发明第三实施例的基础上,进一步提出了本发明数据动态传输方法的第四实施例,本实施例为第三实施例中步骤S24的细化步骤,所述数据动态传输方法包括:
步骤b1,根据预设周期内的声音数据,对预设强度阀值进行调整,得到调整后的强度阀值。
数据动态传输设备根据预设周期内的声音数据调整预设强度阈值。根据前述实施例的描述,不存在唤醒时间点的声音数据可视为纯噪声数据,数据动态传输设备根据预设周期内不存在唤醒时间点的声音数据的声音强度对预设强度阈值进行调整,所述预设周期为预先设定的一个调整周期,如根据3小时内不存在唤醒时间点的声音数据的声音强度进行均值计算,并根据该均值叠加一个固定的数值形成调整后的预设强度阈值,该操作可以在数据动态传输设备工作环境发生变更即环境的噪声强度发生变更时调整预设强度阈值以在不同环境下仍能精确的确定唤醒时间点。
步骤b2,将调整后的强度阀值作为预设强度阀值。
数据动态传输设备将调整后的强度阀值作为预设强度阀值,后续的判断操作将基于该替换后的强度阈值进行,实现了预设强度的动态调整。
在本实施例中,通过周期动态调整预设强度阈值,使得数据动态传输设备在各种噪音条件下都可以准确确定唤醒时间点,以进行传输策略选择,拓宽了使数据动态传输设备的适用环境。
进一步的,在本发明第一实施例的基础上,进一步提出了本发明数据动态传输方法的第五实施例,本实施例为第一实施例中步骤S20的细化步骤,所述数据动态传输方法包括:
步骤c1,对所述声音数据进行语音识别,生成文字标识;
数据动态传输设备对所述声音数据进行语音识别生成文字标识。为判断声音数据是否包含唤醒时间点,对语音数据进行语音识别以获取其中可能存在的用户指令,进而捕捉用户的唤醒操作。
步骤c2,判断预设文字标识库中是否存在所述文字标识;
数据动态传输设备判断预设文字标识库中是否存在所述文字标识,所述预设文字标识库为预置于设备包含如“你好”、“hello”和“hi”常用唤醒文字标识的库,通过将前述生成的文字标识与预设文字标识库中的信息进行匹配,若预设文字标识库中存在与所述文字标识相同的信息,则可确定用户存在唤醒操作,而非将全部语音识别操作置于云端服务器,减少数据的往复传送操作。
步骤c3,若所述文字标识库中存在所述文字标识,则获取所述声音数据中所述文字标识出现的起始时间,将所述起始时间作为所述唤醒时间点。
若预设文字标识库中存在与文字标识匹配的信息,数据动态传输设备则预设文字标识库中与所述文字标识与对应的信息匹配的时刻即为唤醒时间点,具体的,如数据动态传输设备在通过语音识别后确定“你好”这一文字标识,与预设文字标识库中的信息“你好”匹配时,则获取所述声音数据中所述目标文字标识出现的起始时间点作为唤醒时间点,根据该唤醒时间点对传输策略进行调整。
本实施例中,通过语音识别并匹配的方式确定唤醒时间点,将标志性的唤醒词识别匹配在本地执行,可减少与云端往复通讯的时间,并确定唤醒时间点,及时对传输策略进行调整,实现了提升数据动态传输设备的响应速度。
进一步的,在本发明第一实施例至第四实施例中任一实施例的基础上,进一步提出了本发明数据动态传输方法的第六实施例,所述数据动态传输方法包括:
步骤d1,若声音数据中不存在所述唤醒时间点;
步骤d2,串行传输所述声音数据,或获取预设麦克风阵列采集速率,将所述声音数据以所述预设麦克风阵列采集速率进行传输。
若声音数据中不存在所述唤醒时间点,则数据动态传输设备串行传输所述声音数据,或获取预设麦克风阵列采集速率,将所述声音数据以所述预设麦克风阵列采集速率进行传输。若声音数据中不存在所述唤醒时间点,则不存在用户的唤醒操作,因此,此时的声音数据均为无用的环境噪声,使用串行传输的方式对所述声音数据进行传输,所述串行传输方式指使用单传输通道的方式。此外,还可以以麦克风阵列的采集速率进行传输,为保证数据的正常传输,所述预设麦克风阵列的采集速率为声音数据传输速率的最小值。
在本实施例中,通过将无用户唤醒操作的声音数据进行串行传输或以预设麦克风阵列的采集速率进行传输,使得数据传输设备在未唤醒状态下以较小的系统资源消耗进行数据传输,可实现降低数据传输设备在未唤醒状态下的功耗。
进一步的,在本发明以上实施例的基础上,进一步提出了本发明数据动态传输方法的第七实施例,所述数据动态传输方法包括:
步骤e1,对声音数据进行预处理,所述预处理包含语音增强、噪声消除、语音数据压缩中至少一项。
数据动态传输设备对预设麦克风阵列采集的声音数据进行预处理,所述预处理包括但不限于语音增强、噪声消除、语音数据压缩等,由于数据动态传输设备需要将采集的声音数据进行本地识别或发送至云端识别,通过语音增强、噪声消除、语音数据压缩等优化处理,可提高后续的识别成功率和保证环境声音质量的前提下压缩数据量以加快传输作出响应。
在本实施例中,通过将预设麦克风阵列采集的环境数据进行优化处理,实现了提高后续的识别成功率和保证声音质量的前提下压缩数据量以加快传输提升响应速度的有益效果。
此外,本发明实施例还提出一种数据动态传输装置,所述数据动态传输装置包括:
数据获取模块:获取预设麦克风阵列采集的声音数据;
分析判断模块:分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;
数据分类模块:若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;
数据传输模块:确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
其中,数据动态传输装置的各个功能模块实现的步骤可参照本发明数据动态传输方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的数据动态传输方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数据动态传输方法,其特征在于,所述数据动态传输方法包括以下步骤:
获取预设麦克风阵列采集的声音数据;
分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;
若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;
确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
2.如权利要求1所述的数据动态传输方法,其特征在于,所述确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据的步骤,包括:
获取传输通道数量;
在存在至少两条传输通道时,分别为所述纯噪声数据和所述用户语音数据选择目标传输通道,并行传输所述纯噪声数据和所述用户语音数据;
在存在一条传输通道时,将所述纯噪声数据的传输速率设置为第一传输速率,将所述用户语音数据的传输速率设置为第二传输速率,并按照所述第一传输速率传输所述纯噪声数据,按照所述第二传输速率传输所述用户语音数据。
3.如权利要求1所述的数据动态传输方法,其特征在于,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤,包括:
获取所述声音数据的声音强度;
判断所述声音数据中是否存在声音强度大于预设强度阈值的目标声音数据;
若所述声音数据中存在声音强度大于所述预设强度阈值的目标声音数据,则判定所述声音数据中存在唤醒时间点,其中,所述声音数据中第一个目标声音数据出现的时间点为唤醒时间点;
若所述声音数据中不存在声音强度大于预设强度阈值的目标声音数据,则所述声音数据中不存在唤醒时间点。
4.如权利要求3所述的数据动态传输方法,其特征在于,所述所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤,还包括:
根据预设周期内的声音数据,对预设强度阀值进行调整,得到调整后的强度阀值;
将调整后的强度阀值作为预设强度阀值。
5.如权利要求1所述的数据动态传输方法,其特征在于,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤,包括:
对所述声音数据进行语音识别,生成文字标识;
判断预设文字标识库中是否存在所述文字标识;
若所述文字标识库中存在所述文字标识,则获取所述声音数据中所述文字标识出现的起始时间,将所述起始时间作为所述唤醒时间点。
6.如权利要求1所述的数据动态传输方法,其特征在于,所述分析所述声音数据,判断所述声音数据中是否存在唤醒时间点的步骤之后,包括:
若声音数据中不存在所述唤醒时间点;
串行传输所述声音数据,或获取预设麦克风阵列采集速率,将所述声音数据以所述预设麦克风阵列采集速率进行传输。
7.如权利要求1至6中任意一项所述的数据动态传输方法,其特征在于,所述获取预设麦克风阵列采集的声音数据的步骤之后,包括:
对环境声音数据进行预处理,所述预处理包含语音增强、噪声消除、语音数据压缩中至少一项。
8.一种数据动态传输装置,其特征在于,所述数据动态传输装置包括:
数据获取模块:用于获取预设麦克风阵列采集的声音数据;
分析判断模块:用于分析所述声音数据,判断所述声音数据中是否存在唤醒时间点;
数据分类模块:用于若所述声音数据中存在唤醒时间点,将所述声音数据划分为纯噪声数据和用户语音数据,其中,所述唤醒时间点之前的声音数据为纯噪声数据,所述唤醒时间点之后的声音数据为用户语音数据;
数据传输模块:用于确定所述纯噪声数据的第一传输方式和所述用户语音数据的第二传输方式,并分别按照各自的传输方式发送所述纯噪声数据和所述用户语音数据。
9.一种数据动态传输设备,其特征在于,所述数据动态传输设备包括:麦克风阵列、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述麦克风阵列,用于采集声音数据;
所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据动态传输方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的数据动态传输方法的步骤。
CN202010498095.XA 2020-06-03 2020-06-03 数据动态传输方法、装置、设备和存储介质 Pending CN111681675A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010498095.XA CN111681675A (zh) 2020-06-03 2020-06-03 数据动态传输方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010498095.XA CN111681675A (zh) 2020-06-03 2020-06-03 数据动态传输方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN111681675A true CN111681675A (zh) 2020-09-18

Family

ID=72434815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010498095.XA Pending CN111681675A (zh) 2020-06-03 2020-06-03 数据动态传输方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111681675A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112201271A (zh) * 2020-11-30 2021-01-08 全时云商务服务股份有限公司 一种基于vad的语音状态统计方法、系统和可读存储介质
CN112350958A (zh) * 2020-10-30 2021-02-09 深圳Tcl新技术有限公司 语音数据动态上传方法、物联网设备及存储介质
CN114816026A (zh) * 2021-01-21 2022-07-29 华为技术有限公司 一种低功耗待机方法、电子设备及计算机可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1117641A (ja) * 1997-06-25 1999-01-22 Mitsubishi Electric Corp 多重化装置及び通信システム
KR100263296B1 (ko) * 1997-11-12 2000-08-01 정선종 G.729 음성 부호화기를 위한 음성 활성도 측정 방법
KR20000056529A (ko) * 1999-02-23 2000-09-15 조정남 전송율을 이용한 음성 구간 검출 방법
CN1551516A (zh) * 2003-05-07 2004-12-01 三星电子株式会社 控制移动通信终端中噪声的装置和方法
CN101046958A (zh) * 2006-03-29 2007-10-03 株式会社东芝 语音处理的装置和方法
CN108922524A (zh) * 2018-06-06 2018-11-30 西安Tcl软件开发有限公司 智能语音设备的控制方法、系统、装置、云服务器及介质
CN108986833A (zh) * 2018-08-21 2018-12-11 广州市保伦电子有限公司 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
CN109413442A (zh) * 2018-10-12 2019-03-01 南京机器岛智能科技有限公司 一种音箱自适应码率调节方法
US20190207777A1 (en) * 2017-12-29 2019-07-04 Synaptics Incorporated Voice command processing in low power devices
CN110047470A (zh) * 2019-04-11 2019-07-23 深圳市壹鸽科技有限公司 一种语音端点检测方法
CN110931048A (zh) * 2019-12-12 2020-03-27 广州酷狗计算机科技有限公司 语音端点检测方法、装置、计算机设备及存储介质
CN110992953A (zh) * 2019-12-16 2020-04-10 苏州思必驰信息科技有限公司 一种语音数据处理方法、装置、系统及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1117641A (ja) * 1997-06-25 1999-01-22 Mitsubishi Electric Corp 多重化装置及び通信システム
KR100263296B1 (ko) * 1997-11-12 2000-08-01 정선종 G.729 음성 부호화기를 위한 음성 활성도 측정 방법
KR20000056529A (ko) * 1999-02-23 2000-09-15 조정남 전송율을 이용한 음성 구간 검출 방법
CN1551516A (zh) * 2003-05-07 2004-12-01 三星电子株式会社 控制移动通信终端中噪声的装置和方法
CN101046958A (zh) * 2006-03-29 2007-10-03 株式会社东芝 语音处理的装置和方法
US20190207777A1 (en) * 2017-12-29 2019-07-04 Synaptics Incorporated Voice command processing in low power devices
CN108922524A (zh) * 2018-06-06 2018-11-30 西安Tcl软件开发有限公司 智能语音设备的控制方法、系统、装置、云服务器及介质
CN108986833A (zh) * 2018-08-21 2018-12-11 广州市保伦电子有限公司 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
CN109413442A (zh) * 2018-10-12 2019-03-01 南京机器岛智能科技有限公司 一种音箱自适应码率调节方法
CN110047470A (zh) * 2019-04-11 2019-07-23 深圳市壹鸽科技有限公司 一种语音端点检测方法
CN110931048A (zh) * 2019-12-12 2020-03-27 广州酷狗计算机科技有限公司 语音端点检测方法、装置、计算机设备及存储介质
CN110992953A (zh) * 2019-12-16 2020-04-10 苏州思必驰信息科技有限公司 一种语音数据处理方法、装置、系统及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350958A (zh) * 2020-10-30 2021-02-09 深圳Tcl新技术有限公司 语音数据动态上传方法、物联网设备及存储介质
CN112350958B (zh) * 2020-10-30 2024-01-23 深圳Tcl新技术有限公司 语音数据动态上传方法、物联网设备及存储介质
CN112201271A (zh) * 2020-11-30 2021-01-08 全时云商务服务股份有限公司 一种基于vad的语音状态统计方法、系统和可读存储介质
CN112201271B (zh) * 2020-11-30 2021-02-26 全时云商务服务股份有限公司 一种基于vad的语音状态统计方法、系统和可读存储介质
CN114816026A (zh) * 2021-01-21 2022-07-29 华为技术有限公司 一种低功耗待机方法、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111681675A (zh) 数据动态传输方法、装置、设备和存储介质
CN111260665B (zh) 图像分割模型训练方法和装置
CN106098063B (zh) 一种语音控制方法、终端设备和服务器
WO2019120029A1 (zh) 智能调节屏幕亮度的方法、装置、存储介质及移动终端
CN109473092B (zh) 一种语音端点检测方法及装置
CN107544272B (zh) 终端控制方法、装置及存储介质
CN111161714B (zh) 一种语音信息处理方法、电子设备及存储介质
CN107729889B (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
CN113341743B (zh) 智能家居设备控制方法、装置、电子设备及存储介质
CN110992937B (zh) 语言离线识别方法、终端及可读存储介质
CN110875045A (zh) 一种语音识别方法、智能设备和智能电视
CN113671846B (zh) 智能设备控制方法、装置、可穿戴设备及存储介质
WO2019015418A1 (zh) 解锁控制方法及相关产品
CN109859774A (zh) 语音设备及其端点检测灵敏度调节方法、装置和存储介质
CN113031452B (zh) 一种批量处理智能家居设备控制指令的方法和系统
CN113963695A (zh) 一种智能设备的唤醒方法、装置、设备及存储介质
CN113611306A (zh) 基于用户习惯的智能家居语音控制方法、系统及存储介质
CN113765945A (zh) 文件动态分片传输方法、装置、设备和存储介质
CN109346102B (zh) 音频开头爆音的检测方法、装置及存储介质
CN113053369A (zh) 智能家电的语音控制方法及装置、智能家电
CN113709629A (zh) 频响参数调节方法、装置、设备及存储介质
CN114898755B (zh) 语音处理方法及相关装置、电子设备、存储介质
CN110831114A (zh) 与无线设备的连接方法、终端及可读存储介质
CN115691494A (zh) 语音控制方法、电子设备及计算机可读存储介质
CN106210002B (zh) 控制方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 710065 Yinghua five Rd floor, 50 Jinye Road, Xi'an High-tech Zone, Shaanxi

Applicant after: Xi'an Tongli Software Development Co.,Ltd.

Address before: 710065 Yinghua five Rd floor, 50 Jinye Road, Xi'an High-tech Zone, Shaanxi

Applicant before: XI'AN TCL SOFTWARE DEVELOPMENT Co.,Ltd.

Country or region before: China