CN109346080B - 语音控制方法、装置、设备和存储介质 - Google Patents

语音控制方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109346080B
CN109346080B CN201811507537.1A CN201811507537A CN109346080B CN 109346080 B CN109346080 B CN 109346080B CN 201811507537 A CN201811507537 A CN 201811507537A CN 109346080 B CN109346080 B CN 109346080B
Authority
CN
China
Prior art keywords
voice data
target
server
voice
target voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811507537.1A
Other languages
English (en)
Other versions
CN109346080A (zh
Inventor
郭良志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Skyworth Institute Of Information Technology Co ltd
Original Assignee
Nanjing Skyworth Institute Of Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Skyworth Institute Of Information Technology Co ltd filed Critical Nanjing Skyworth Institute Of Information Technology Co ltd
Priority to CN201811507537.1A priority Critical patent/CN109346080B/zh
Publication of CN109346080A publication Critical patent/CN109346080A/zh
Application granted granted Critical
Publication of CN109346080B publication Critical patent/CN109346080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

本发明实施例公开了一种语音控制方法、装置、设备和存储介质。该方法应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,包括:通过麦克风阵列获取待处理语音数据;基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;接收所述主服务器基于所述目标语音数据返回的控制指令。通过采用上述技术方案,解决了现有技术的语音控制方法存在控制结果准确性较低的技术问题,以达到提高语音控制准确性和避免隐私语音数据泄露的技术效果。

Description

语音控制方法、装置、设备和存储介质
技术领域
本发明实施例涉及控制技术领域,尤其涉及一种语音控制方法、装置、设备和存储介质。
背景技术
随着科学技术的发展,电器设备智能化和人性化已经是人们普遍关注的问题,尤其是将语音识别技术应用于电器设备中,为电器设备的智能化和人性化为人们的操作提供了极大的便利。
语音控制方式包括手动控制、遥控器控制以及语音控制,其中,语音控制分为近场和远场两种场景,而无论是在近场或是远场,在语音控制过程中,每组麦克风阵列提取到同一用户或多个用户的语音数据都会上报给服务器,服务器通过数学模型确定语音控制意图,并生成控制指令,但服务器由于获取的语音数据较多,有时会出现重复控制或控制目标错误的问题,其中,控制目标错误主要发生在同时存在多个控制目标时。
综上所述,现有技术的语音控制方法存在控制结果准确性较低的技术问题。
发明内容
本发明实施例提供一种语音控制方法、装置、设备和存储介质,以解决现有技术的语音控制方法的准确性较低的技术问题,以提高语音控制的准确性。
第一方面,本发明实施例提供了一种语音控制方法,应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,包括:
通过麦克风阵列获取待处理语音数据;
基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;
接收所述主服务器基于所述目标语音数据返回的控制指令。
第二方面,本发明实施例还提供了一种语音控制装置,配置于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,包括:
待处理语音数据获取模块,用于通过麦克风阵列获取待处理语音数据;
目标语音数据确定模块,用于基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;
接收模块,用于接收所述主服务器基于所述目标语音数据返回的控制指令。
第三方面,本发明实施例还提供了一种语音控制方法,应用于由麦克风阵列、门户链服务器和主服务器所形成的语音控制系统的主服务器,包括:
从所述门户链服务器接收目标语音数据;
确定所述目标语音数据的最佳语音分析模型,以及基于所述最佳语音分析模型确定所述目标语音数据对应的控制指令;
将所述控制指令发送至所述目标语音数据所来自的门户链服务器。
第四方面,本发明实施例还提供了一种语音控制装置,与第二方面所述的语音控制装置配合使用,设置于由麦克风阵列、门户链服务器和主服务器所形成的语音控制系统的主服务器,包括:
目标语音数据接收模块,用于从所述门户链服务器接收目标语音数据;
控制指令确定模块,用于确定所述目标语音数据的最佳语音分析模型,以及基于所述最佳语音分析模型确定所述目标语音数据对应的控制指令;
控制指令发送模块,用于将所述控制指令发送至所述目标语音数据所来自的门户链服务器。
第五方面,本发明实施例还提供了一种电器设备,所述电器设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明第一方面所述的语音控制方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面所述的语音控制方法。
本发明实施例提供的语音控制方法的技术方案,应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,门户链服务器连接麦克风阵列,包括:通过麦克风阵列获取待处理语音数据;基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将目标语音数据发送至主服务器;接收主服务器基于目标语音数据返回的控制指令。通过共识机制从多组待处理语音数据中确定目标语音数据,以保证同一时间段内多个阵列语音数据的一致性、有效性和唯一性,从而提高语音控制的准确性。
附图说明
图1为本发明实施例一提供的语音控制方法的流程图;
图2为本发明实施例一提供的语音控制系统的流程图;
图3为本发明实施例二提供的语音控制方法的流程图;
图4为本发明实施例三提供的语音控制装置的结构框图;
图5为本发明实施例四提供的语音控制方法的流程图;
图6为本发明实施例五提供的语音控制装置的结构框图;
图7为本发明实施例六提供的电器设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的语音控制方法的流程图,该方法优选但不限于应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,且门户链服务器通常连接多组麦克风阵列,该方法可由本发明实施例提供的语音控制装置来执行,该装置可以通过软件和/或硬件的方式实现,以控制电器设备的状态,其中,电器设备可以为智能电视、空调或是空气净化器等。参见图1,本实施例的方法具体包括:
S102、通过麦克风阵列获取待处理语音数据。
如图2所示的语音控制系统,主服务器1连接多个门户链服务器2,同一门户链服务器2可以连接一组或多组麦克风阵列3。多组麦克风阵列位于同一空间或不同空间,不同的麦克风阵列通过阵列ID进行标识。而且麦克风阵列通常配置有数据处理模块,比如DSP,以及数据传输模块,比如WiFi模块或USB模块,从而可以通过数据处理模块对待处理语音数据进行预处理以更新待处理语音数据,然后通过无线传输模块将更新后的待处理语音数据发送至门户链服务器。
优选地,为了提高待处理语音数据的传输效率,数据处理模块,比如DSP,根据既定协议,对获取的待处理语音数据进行碎片化处理,然后通过WiFi分时上报,实现小数据、高频次的实时传输,从而避免出现网络不佳时大数据上传失败。可以理解的是,数据处理模块可以根据网络状况选择数据上传方式,比如,在网络情况较好的情况下,将获取的待处理语音数据直接上传,在网络情况不佳的情况下,以小数据、高频次的方式上传待处理语音数据。
为了提高语音控制的安全性以及提高待处理语音数据的处理速度,本实施例的门户链服务器还配置有预设声纹模型,并基于预设声纹模型对当前的待处理语音数据进行声纹分析,以确定当前的待处理语音数据的用户身份信息,如果用户身份信息不是授权用户的用户身份信息,则放弃当前的待处理语音数据,如果用户身份信息为授权用户的用户身份信息,则保留当前的待处理语音数据。
S104、基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将目标语音数据发送至主服务器。
如果某一时间段,一个门户链服务器只收到一组麦克风阵列发送的待处理语音数据,则该时间段内的语音特征值是唯一的。只需将待处理语音数据或待处理语音数据的语音特征值发送至主服务器即可。可以理解的是,为了提高数据传输效率,本实施例优选将待处理语音数据的语音特征值发送至主服务器。
如果麦克风阵列同时或者在很短的时间内,向门户链服务器上传多组待处理语音数据,而且这些待处理语音数据可能来自同一麦克风阵列,也可能来自不同的麦克风阵列,此时,为了提高语音控制的准确性,本实施例基于区块链的共识机制确定待处理语音数据的目标语音数据。具体为:基于预设算法提取待处理语音数据的语音特征值,比如MFCC算法,然后通过共识机制,以多个阵列节点对语音特征值投票的方式确定目标语音特征值,以更新目标语音数据,以保证同一时间段来自多组麦克风阵列的待处理语音数据的一致性、有效性和唯一性。目标语音数据确定后,将目标语音数据上传至主服务器。
为了提高数据传输的安全性,目标语音数据确定后,先基于预设加密算法,比如非对称加密算法、ECC椭圆曲线算法等,对目标语音数据进行加密以更新目标语音数据,然后将更新后的目标语音数据发送至主服务器,有利于提高数据传输的安全性,以防止用户隐私数据的泄漏。
为了提高基于共识机制确定目标语音数据的速度,本实施例在此之前,先获取每组待处理语音数据的评价参数;然后基于评价参数删除部分组别的待处理语音数据,以更新所获取的待处理语音数据,从而筛选出可信度较高的数据,以降低运算量。其中,评价参数可以是信噪比、指向性系数等。
为了提高语音控制系统的稳定性,本实施例的门户链服务器可以接收其门户区块链内的麦克风阵列的待处理语音数据,以及已经授权的其他门户链服务器所在区块链内的麦克风阵列的待处理语音数据,从而当某门户链服务器所在区块链中的某个或某几个麦克风阵列存在数据传输故障时,这些麦克风阵列可以将所采集的待处理语音数据发送至其他的门户链服务器,由其他的门户链服务器对待处理语音数据进行处理。
可以理解的是,主服务器通常连接一个或多个门户链服务器,为了保证正常通信,每个门户链服务器均设置有唯一的ID标识。
S106、接收主服务器基于目标语音数据返回的控制指令。
主服务器接收到目标语音数据后,通过其预先存储的语音分析模型对所述目标语音数据进行分析以生成控制指令,然后将控制指令返回至目标语音数据所来自的门户链服务器,门户链服务器接收该控制指令,并根据该控制指令控制电器设备动作。
为了降低主服务器的负荷,本实施例的主服务器1包括多个主链服务器11,每个主链服务器11连接多个门户链服务器2,而且每个门户链服务器2仅连接一个主链服务器11,通过设置多个主链服务器11来优化语音控制系统的网络架构,以通过去中心化降低服务器的负荷。
其中,每个主链服务器均设置有语音识别模型,且语音识别模型在使用过程中会通过学习来优化,比如神经网络类的语音识别模型。因此随着时间的推移,不同主链服务器的语音识别模型会由于所处理的历史目标语音数据的不同而演变成不同的模型。因此,在门户链服务器将目标语音数据发送至其直接连接的主链服务器,即直连主链服务器之后,直连主链服务器会对目标语音数据做初步分析以确定是否为当前目标语音数据的最佳语音分析模型,若是,则由该语音分析模块对目标语音数据进行分析,以确定控制指令,若不是,则基于预设顺序遍历搜索其他主链服务器,即非直连主链服务器,直至确定出最佳语音分析模型,然后基于该最佳语音分析模型对目标语音数据进行分析,以确定目标语音数据所对应的控制指令。
优选地,为了能够使语音控制系统在网络不佳或是断网时仍能工作,本实施例的麦克风阵列的数据处理模块设置有语音分析模型,能够直接对所采集的待处理语音数据进行处理并得到控制指令。
本发明实施例提供的语音控制方法的技术方案,应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,门户链服务器连接麦克风阵列,包括:通过麦克风阵列获取待处理语音数据;基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将目标语音数据发送至主服务器;接收主服务器基于目标语音数据返回的控制指令。通过共识机制从多组待处理语音数据中确定目标语音数据,以保证同一时间段内多个阵列语音数据的一致性、有效性和唯一性,从而提高语音控制的准确性。
实施例二
图3为本发明实施例二提供的一种语音控制方法的流程图,本实施例在上述实施例的基础上进行了优化,增加了用户身份信息识别的步骤,其中与上述实施例相同或相应的术语的解释在此不再赘述。参见图3,本实施例提供的方法包括:
S102、通过麦克风阵列获取待处理语音数据。
S1031、基于预设声纹模型确定待处理语音数据所对应的用户身份信息。
在通过语音控制电器设备时,用户在说出一条控制语音后,发现刚说出的控制语音错误,此时会迅速补充一条准确的控制语音,基于此,本实施例通过用户身份信息辨识同一用户发出的控制语音,以便于放弃无效的待处理语音数据。其中,用户身份信息由设置于门户链服务器的预设声纹模型确定。
S1032、如果预设时间内,多组待处理语音数据所对应的用户身份信息相同,则将最后时刻的目标语音数据作为更新后的待处理语音数据。
由于在电器控制领域,用户在发出多条控制语音时,往往是以后面说出的语音指令为准,为此,如果在预设时间内,多组待处理语音数据所对应的用户身份信息相同,则放弃前面的待处理语音数据,而将将最后时刻的待处理语音数据作为更新后的待处理语音数据。
S104、基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器。
S106、接收主服务器基于所述目标语音数据返回的控制指令。
通过用户身份信息与时间结合,放弃语音控制过程中的无效待处理语音数据,以减少门户链服务器和主服务器的数据运算量,同时提高语音控制意图确定的准确性,进而提高语音控制的准确性。
实施例三
图4为本发明实施例三提供的语音控制装置的结构框图,该配置于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,其中,门户链服务器连接麦克风阵列,可由软件或硬件实现,包括:
待处理语音数据获取模块41,用于通过麦克风阵列获取待处理语音数据;
目标语音数据确定模块42,用于基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将目标语音数据发送至主服务器;
接收模块43,用于接收主服务器基于目标语音数据返回的控制指令。
本发明实施例提供的语音控制装置的技术方案,应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,门户链服务器连接麦克风阵列,通过待处理语音数据获取模块基于麦克风阵列获取待处理语音数据;通过目标语音数据确定模块基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将目标语音数据发送至主服务器;通过接收模块接收主服务器基于目标语音数据返回的控制指令。通过共识机制从多组待处理语音数据中确定目标语音数据,以保证同一时间段内多个阵列语音数据的一致性、有效性和唯一性,从而提高语音控制的准确性。
本发明实施例所提供的语音控制装置可执行本发明任意实施例所提供的语音控制方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的语音控制方法。
实施例四
图5为本发明实施例四提供的语音控制方法的流程图,该方法优选但不限于应用于由麦克风阵列、门户链服务器和主服务器所形成的语音控制系统的主服务器,该方法可由本发明实施例提供的语音控制装置来执行,该装置可以通过软件和/或硬件的方式实现,以控制电器设备的状态,其中,电器设备可以为智能电视、空调或是空气净化器等。参见图5和图2所示,本实施例的方法具体包括:
S202、从门户链服务器接收目标语音数据。
如果目标语音数据没有加密,则主服务器1可以直接对其进行处理,如果目标语音数据为加密语音数据,则主服务器1需要先对其进行解密。
S204、确定目标语音数据的最佳语音分析模型,以及基于最佳语音分析模型确定目标语音数据对应的控制指令。
主服务器1设置有一个或多个语音分析模型,当存在多个语音分析模型时,需要先确定对应于当前的目标语音数据的最佳语音分析模型,然后基于该最佳语音分析模型确定目标语音数据对应的控制指令。
为了提高主服务器的负荷,本实施例的主服务器1包括直接连接目标门户链服务器的直连主链服务器,以及通过直连主链服务器连接门户链服务器的非直连主链服务器,且直连主链服务器和非直连主链服务器均设置有语音分析模型。
门户链服务器2将目标语音数据发送至其直连主链服务器后,该直连主链服务器对目标语音数据做初步分析以确定是否为当前目标语音数据的最佳语音分析模型,若是,则由该语音分析模块对目标语音数据进行分析,以确定控制指令,若不是,则基于预设顺序遍历搜索其他非直连主链服务器直至确定出最佳语音分析模型,然后基于该最佳语音分析模型对目标语音数据进行分析,以确定目标语音数据所对应的控制指令,然后将所确定的控制指令返回至指令主链服务器。优选地,如果标号为a的非直连主链服务器的语音分析模型为当前的目标语音数据的最佳语音分析模型,则记录当前语音分析模型与当前目标语音数据之间的对应关系,当该直连主链服务器再次接收到与当前目标语音数据相同的语音数据时,直接将其发送至标号为a的非直连主链服务器。
S206、将控制指令发送至目标语音数据所来自的门户链服务器。
直连主链服务器将目标语音数据所对应的控制指令发送至目标语音数据所来自的门户链服务器,以使门户链服务器根据所接收的控制指令控制电器设备的状态。
当存在多组不同的目标语音数据时,现有技术通过一个语音分析模型对所接收的目标语音数据进行分析,本实施例通过多个语音分析模型中的最佳语音分析模型对目标语音数据分析,可以同多个语音分析模型对目标语音数据进行并行分析,以提高目标语音数据的分析速度以及准确性。
实施例五
图6为本发明实施例五提供的语音控制装置的结构框图,该配置于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,其中,门户链服务器连接麦克风阵列。该装置可由软件或硬件实现,包括:
目标语音数据接收模块51,用于从门户链服务器接收目标语音数据;
控制指令确定模块52,用于确定目标语音数据的最佳语音分析模型,以及基于最佳语音分析模型确定目标语音数据对应的控制指令;
控制指令发送模块53,用于将控制指令发送至目标语音数据所来自的门户链服务器。
实施例六
图7是本发明实施例六提供的设备的结构示意图,如图7所示,该设备包括处理器601、存储器602、输入装置603以及输出装置604;设备中处理器601的数量可以是一个或多个,图7中以一个处理器601为例;设备中的处理器601、存储器602、输入装置603以及输出装置604可以通过总线或其他方式连接,图7中以通过总线连接为例。
存储器602作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的图像对比度增强方法对应的程序指令/模块(例如,待处理语音数据获取模块41、目标语音数据确定模块42以及接收模块43)。处理器601通过运行存储在存储器602中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的图像对比度增强方法。
存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器602可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置603可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。
输出装置604可包括显示屏等显示设备,例如,用户终端的显示屏。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的语音控制方法,该应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,包括:
通过麦克风阵列获取待处理语音数据;
基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;
接收所述主服务器基于所述目标语音数据返回的控制指令。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的图像对比度增强方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的图像对比度增强方法。
值得注意的是,上述图像对比度增强装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种语音控制方法,应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,其特征在于,包括:
通过麦克风阵列获取待处理语音数据;
基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;
所述基于共识机制确定所获取的待处理语音数据中的目标语音数据,包括:
基于预设算法提取待处理语音数据的语音特征值,然后通过共识机制,以多个阵列节点对语音特征值投票的方式确定目标语音特征值,以更新目标语音数据;
接收所述主服务器基于所述目标语音数据返回的控制指令。
2.根据权利要求1所述的方法,其特征在于,所述基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器之前/同时,还包括:
基于预设声纹模型确定所述待处理语音数据所对应的用户身份信息;
如果预设时间内,多组待处理语音数据所对应的用户身份信息相同,则将最后时刻的待处理语音数据作为更新后的待处理语音数据。
3.根据权利要求1所述的方法,其特征在于,所述基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器,包括:
基于预设算法提取待处理语音数据的语音特征值,然后通过共识机制,以多个阵列节点对语音特征值投票的方式确定目标语音特征值,以更新目标语音数据;
基于预设加密算法对所述目标语音数据进行加密以更新所述目标语音数据,并将所述目标语音数据发送至主服务器。
4.根据权利要求1-3任一所述的方法,其特征在于,对于目标门户链服务器,所述主服务器包括连接所述目标门户链服务器的直连主链服务器,以及通过所述直连主链服务器连接所述目标门户链服务器的非直连主链服务器,相应的,所述将所述目标语音数据发送至主服务器,包括:
将所述目标语音数据发送至所述直连主链服务器;
相应的,所述接收所述主服务器基于所述目标语音数据返回的控制指令,包括:
接收所述直连主链服务器返回的控制指令,所述控制指令由所述直连主链服务器基于所述目标语音数据确定或由所述非直连主链服务器基于所述目标语音数据确定。
5.一种语音控制装置,配置于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的门户链服务器,所述门户链服务器连接麦克风阵列,其特征在于,包括:
待处理语音数据获取模块,用于通过麦克风阵列获取待处理语音数据;
目标语音数据确定模块,用于基于共识机制确定所获取的待处理语音数据中的目标语音数据,并将所述目标语音数据发送至主服务器;
所述基于共识机制确定所获取的待处理语音数据中的目标语音数据,包括:
基于预设算法提取待处理语音数据的语音特征值,然后通过共识机制,以多个阵列节点对语音特征值投票的方式确定目标语音特征值,以更新目标语音数据;
接收模块,用于接收所述主服务器基于所述目标语音数据返回的控制指令。
6.根据权利要求1-4任一所述的语音控制方法,所述语音控制方法还应用于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的主服务器,其特征在于,包括:
从所述门户链服务器接收目标语音数据;
确定所述目标语音数据的最佳语音分析模型,以及基于所述最佳语音分析模型确定所述目标语音数据对应的控制指令;
将所述控制指令发送至所述目标语音数据所来自的门户链服务器。
7.根据权利要求6所述的方法,其特征在于,所述主服务器包括直接连接目标门户链服务器的直连主链服务器,以及通过所述直连主链服务器连接所述目标门户链服务器的非直连主链服务器,相应的,确定所述目标语音数据的最佳语音分析模型,以及基于所述最佳语音分析模型确定所述目标语音数据对应的控制指令,包括:
如果直连主链服务器的语音分析模型为所述目标语音数据的最佳语音分析模型,则基于该语音分析模型确定所述目标语音数据的控制指令;
如果直连主链服务器的语音分析模型不是所述目标语音数据的最佳语音分析模型,则搜索非直连主链服务器的语音分析模型以确定所述目标语音数据的最佳语音分析模型,并基于该最佳语音分析模型确定所述目标语音数据的控制指令,以及记录所述目标语音数据与该最佳语音分析模型的对应关系。
8.根据权利要求5所述的语音控制装置,所述语音控制装置还配置于由主服务器、门户链服务器和多组麦克风阵列组成的语音控制系统的主服务器,其特征在于,包括:
目标语音数据接收模块,用于从所述门户链服务器接收目标语音数据;
控制指令确定模块,用于确定所述目标语音数据的最佳语音分析模型,以及基于所述最佳语音分析模型确定所述目标语音数据对应的控制指令;
控制指令发送模块,用于将所述控制指令发送至所述目标语音数据所来自的门户链服务器。
9.一种电器设备,其特征在于,所述电器设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的语音控制方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的语音控制方法。
CN201811507537.1A 2018-12-10 2018-12-10 语音控制方法、装置、设备和存储介质 Active CN109346080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811507537.1A CN109346080B (zh) 2018-12-10 2018-12-10 语音控制方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811507537.1A CN109346080B (zh) 2018-12-10 2018-12-10 语音控制方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN109346080A CN109346080A (zh) 2019-02-15
CN109346080B true CN109346080B (zh) 2021-11-30

Family

ID=65303657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811507537.1A Active CN109346080B (zh) 2018-12-10 2018-12-10 语音控制方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109346080B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110687821B (zh) * 2019-11-14 2021-10-29 腾讯科技(深圳)有限公司 基于区块链的智能家居控制系统及方法
CN111081224B (zh) * 2019-12-31 2022-12-23 中国石油天然气集团有限公司 一种面向石油安全事件的数据采集方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9553982B2 (en) * 2013-07-06 2017-01-24 Newvoicemedia, Ltd. System and methods for tamper proof interaction recording and timestamping
CN107464111A (zh) * 2017-07-10 2017-12-12 北京云知科技有限公司 基于音频的区块链钱包地址生成方法、支付方法、装置以及电子设备
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN108305623A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 电器控制方法及装置
CN108810187A (zh) * 2018-03-01 2018-11-13 赵建文 一种通过区块链对接语音服务的网络系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9553982B2 (en) * 2013-07-06 2017-01-24 Newvoicemedia, Ltd. System and methods for tamper proof interaction recording and timestamping
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
CN107464111A (zh) * 2017-07-10 2017-12-12 北京云知科技有限公司 基于音频的区块链钱包地址生成方法、支付方法、装置以及电子设备
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN108305623A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 电器控制方法及装置
CN108810187A (zh) * 2018-03-01 2018-11-13 赵建文 一种通过区块链对接语音服务的网络系统

Also Published As

Publication number Publication date
CN109346080A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
JP2019513246A (ja) ランダムフォレストモデルの訓練方法、電子装置及び記憶媒体
WO2020014899A1 (zh) 语音控制方法、中控设备和存储介质
US9774642B2 (en) Method and device for pushing multimedia resource and display terminal
CN109639692B (zh) 离线登录的方法、装置、设备、系统和存储介质
CN108959634B (zh) 视频推荐方法、装置、设备及存储介质
CN109346080B (zh) 语音控制方法、装置、设备和存储介质
CN110932953A (zh) 智能家居控制方法、装置、计算机设备及存储介质
US20180005624A1 (en) Method and device for information processing
CN108986807B (zh) 设备的控制方法和装置、存储介质、电子装置
CN108471343B (zh) 通讯校验码的确定方法及装置、通讯校验方法及系统
US9684711B2 (en) System and method for providing agent service to user terminal
CN105405442A (zh) 语音的识别方法、装置和设备
CN110414429A (zh) 人脸聚类方法、装置、设备和存储介质
CN114128255A (zh) 使用混合边缘/云推理连同机器学习系统的视频会议
CN107181825B (zh) 终端设备数据的在线处理方法
CN111861390A (zh) 网点业务智能办理方法及系统
CN114360554A (zh) 一种车辆远程控制方法、装置、设备及存储介质
CN110955390A (zh) 数据处理方法、装置和电子设备
CN116708065A (zh) 智能家居环境下低功耗蓝牙语音控制方法及系统
CN110392083B (zh) 文件秒传的控制方法、装置及终端设备
CN114513380B (zh) 用于控制家电设备的方法及装置、家电设备、存储介质
CN112201248B (zh) 基于长连接的流式语音识别方法和系统
CN112491508B (zh) 基于传输进程自适应的数据传输方法及装置
CN112311755A (zh) 一种工控协议逆向分析方法及装置
CN111866274A (zh) 数据传输方法、装置、移动设备、智能终端和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant