CN110675873B - 智能设备的数据处理方法、装置、设备及存储介质 - Google Patents
智能设备的数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110675873B CN110675873B CN201910935399.5A CN201910935399A CN110675873B CN 110675873 B CN110675873 B CN 110675873B CN 201910935399 A CN201910935399 A CN 201910935399A CN 110675873 B CN110675873 B CN 110675873B
- Authority
- CN
- China
- Prior art keywords
- voice information
- key
- mobile terminal
- user
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000003993 interaction Effects 0.000 claims abstract description 42
- 230000008569 process Effects 0.000 claims abstract description 38
- 230000005540 biological transmission Effects 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 7
- 230000002618 waking effect Effects 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 230000008901 benefit Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 12
- 230000002452 interceptive effect Effects 0.000 description 12
- 230000009467 reduction Effects 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006855 networking Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/02—Terminal devices
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Mobile Radio Communication Systems (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种智能设备的数据处理方法、装置、设备及存储介质,涉及人工智能技术领域。具体实现方案为:从采集的用户语音信息中提取关键语音信息;在处于非无线保真WiFi网络环境中,将所述关键语音信息传输至移动终端,以使所述移动终端将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;从所述移动终端获取并展示所述处理结果。本申请的技术方案,能够在周围环境中没有WiFi网络时,智能设备可借助移动终端的网络,实现与服务器的交互,进而为用户提供智能交互服务。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及人工智能技术领域,尤其涉及一种智能设备的数据处理方法、装置、设备及存储介质。
背景技术
随着智能语音交互技术的快速发展,可进行人机交互的智能设备已广泛应用于人们的生活中。目前,现有的智能设备通常是采用WiFi网络与服务器进行交互,来为用户提供智能交互服务。
但是,在实际使用场景中,智能设备会经常处于没有WiFi网络的环境中,此时智能设备就无法与服务器建立网络连接,进而也就无法为用户提供语音等智能交互服务,亟需改进。
发明内容
本申请实施例提供了一种智能设备的数据处理方法、装置、设备及存储介质,在周围环境中没有WiFi网络时,智能设备可借助移动终端的网络,实现与服务器的交互,进而为用户提供智能交互服务。
第一方面,本申请实施例公开了一种智能设备的数据处理方法,该方法包括:
从采集的用户语音信息中提取关键语音信息;
在处于非无线保真WiFi网络环境中,将所述关键语音信息传输至移动终端,以使所述移动终端将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;
从所述移动终端获取并展示所述处理结果。
上述申请中的一个实施例具有如下优点或有益效果:在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
可选的,从采集的用户语音信息中提取关键语音信息,包括:
若识别到采集的用户语音信息中存在唤醒词,则从所述采集的用户语音信息中提取关键语音信息。
上述可选方式具有如下优点或有益效果:本实施例只对包含唤醒词的用户语音信息进行关键词提取,避免了智能设备因误对环境中的非交互语音信息进行关键语音信息的提取处理,而造成的误提供智能交互服务的情况出现,同时也极大的节省了智能设备的功耗。
可选的,从采集的用户语音信息中提取关键语音信息,包括:
从采集的用户语音信息中截取所述唤醒词后的语音信息作为关键语音信息。
上述可选方式具有如下优点或有益效果:在从用户语音信息中提取关键信息时,将唤醒词后的语音信息作为关键语音信息,以实现快速准确的从用户语音信息中提取关键信息。
可选的,从采集的用户语音信息中提取关键语音信息,包括:
对采集的用户语音信息进行降噪处理和/或语音文本转换处理,得到关键语音信息。
上述可选方式具有如下优点或有益效果:对采集到的用户语音信息进行降噪处理,得到的关键语音信息中去除了噪声干扰,从而便于后续服务器更精准的从中分析出用户本次的语音交互意图,进而为用户提供更为精准的智能交互服务;对采集到的用户语音信息进行语音文本转换处理,得到的关键语音信息为文本信息,从而使得后续服务器无需再对语音信息进行文本转换,降低了服务器对用户语音信息进行分析处理的功耗,且无论是采用降噪处理,还是语音文本转换都可以降低用户语音信息的传输量,降低智能设备的传输功耗。
可选的,将所述关键语音信息传输至移动终端,包括:
采用本地蓝牙模块的第一通道控制所述本地蓝牙模块的第二通道从关闭状态切换至启动状态;
将所述关键语音信息通过所述第二通道传输至移动终端;
其中,所述第一通道的功耗低于所述第二通道,且所述第一通道在所述本地蓝牙模块启动后处于常开启状态。
上述可选方式具有如下优点或有益效果:采用蓝牙网络将关键语音信息传输至移动终端,且蓝牙模块中包括两个功耗不同的传输通道,低功耗的第一通道处于常开启状态,在需要传输关键语音信息时,由第一通道控制高功耗的第二通道启动,由第二通道将关键语音信息传输至移动终端。本实施例可以在智能设备无需向移动终端传输语音数据时,将高功耗的第二通道关闭,仅启动低功耗的第一通道检测是否需要进行语音数据的传输,极大的降低了智能设备中蓝牙模块的功耗,进而降低了智能设备的功耗。
可选的,从采集的用户语音信息中提取关键语音信息之后,还包括:
在处于WiFi网络环境中,基于所述WiFi网络将所述关键语音信息传输至服务器,以使所述服务器对所述关键语音信息处理后反馈的处理结果;
基于所述WiFi网络从所述服务器获取并展示所述处理结果。
上述可选方式具有如下优点或有益效果:在处于WiFi网络环境时,智能设备可直接基于WiFi网络与服务器进行交互,实现为用户提供智能交互服务,在处于非WiFi网络环境时,智能设备通过借助移动终端的网络将关键语音信息传输至服务器,来实现与服务器的交互,为用户提供智能交互服务,本实施例中智能设备可根据其所处环境是否存在WiFi网络,自动适配与服务器进行交互的网络,实现与用户之间无障碍的进行语音交互。
第二方面,本申请实施例还提供了一种智能设备的数据处理装置,该装置包括:
关键语音提取模块,用于从采集的用户语音信息中提取关键语音信息;
无WiFi传输模块,用于在处于非无线保真WiFi网络环境中,将所述关键语音信息传输至移动终端,以使所述移动终端将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;
处理结果展示模块,用于从所述移动终端获取并展示所述处理结果。
上述申请中的一个实施例具有如下优点或有益效果:在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
第三方面,本申请实施例还公开了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请任一实施例所述的智能设备的数据处理方法。
第四方面,本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请任一实施例所述的智能设备的数据处理方法。
上述申请中的一个实施例具有如下优点或有益效果:在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例提供的一种智能设备的数据处理方法的流程图;
图2是根据本申请第二实施例提供的另一种智能设备的数据处理方法的流程图;
图3A是根据本申请第三实施例提供的另一种智能设备的数据处理方法的流程图;
图3B是根据本申请第三实施例提供的智能设备的数据处理过程示意图;
图4是根据本申请第四实施例提供的一种智能设备的数据处理装置的结构框图;
图5是用来实现本申请实施例提供的智能设备的数据处理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
图1是根据本申请第一实施例提供的一种智能设备的数据处理方法的流程图,本实施例适用于智能设备为用户提供智能交互服务的过程中,对用户的语音信息进行数据处理的情况。尤其适用于对用户的语音信息进行处理的过程中涉及智能设备与服务器进行交互的情况。该方法可以由本申请实施例提供的智能设备的数据处理装置或智能设备来执行,该装置可以采用软件和/或硬件的方式实现。其中,本申请实施例中的智能设备可以是任何可以提供智能交互服务的电子设备,例如,可以是智能音箱、智能电视、智能手表等。如图1所示,本实施例提供的智能设备的数据处理方法可以包括:
S101,从采集的用户语音信息中提取关键语音信息。
其中,用户的语音信息可以是用户需要智能设备提供智能交互服务时,通过语音的形式表述其本次需求的音频数据。关键语音信息可以是从用户语音信息中提取出来的能够表明用户本次需求的关键词或关键语句对应的音频数据,例如,若智能设备为智能音箱,用户想要智能音箱播放一首歌曲《我和我的祖国》,则此时的用户语音信息可以是“启动智能音箱播放歌曲《我和我的祖国》”对应的音频数据。从该用户语音数据中提取的关键语音信息为“播放歌曲《我和我的祖国》”。
可选的,本实施例中的智能设备上配置有语音采集装置(如可以是麦克风),该语音采集装置可以是实时监测环境中是否存在声音信号,若存在,则采集当前环境中的声音信号作为用户语音信息。该语音装置还可以是在接收到智能设备发送的语音采集指令后,采集当前环境中的声音信号作为用户语音信息。其中,该语音采集指令可以是用户通过电子智能设备上的物理按键触发的,还可以是用户通过语音触发的(如可以是语音说出智能设备的唤醒词)。可选的,为了防止非用户声音的干扰,本实施例可以是智能设备本地存储有的待服务的用户的声纹信息,在采集当前环境中的声音信号时,先判断该声音信号的声纹信息是否与本地存储的待服务的用户的声纹信息一致,若一致,则执行采集当前环境中的声音信号作为用户语音信息,否则,不执行本次用户语音信息采集操作。
可选的,智能设备在采集了用户语音信息后,由于采集的用户语音信息中可能存在环境噪声、空白语音或非需求语句等等一些非重要的信息。此时,如果直接将采集的用户语音信息发送至服务器进行分析,由于用户语音信息中包含了非重要的信息,不但需要耗费较高的数据传输量,还会给服务器解析用户语音信息造成干扰。所以为了解决该问题,本实施例可以是从采集的用户语音信息中提取关键语音信息进行传输,具体的提取关键语音信息的方法有很多,对此本实施例不进行限定。
第一种可实施方式可以是:对采集的用户语音信息进行降噪处理和/或语音文本转换处理,得到关键语音信息。
具体的,对用户语音信息进行降噪处理可以是采用预先设定的滤波算法对采集到的用户语音信息进行滤波操作,滤除噪声信号的干扰,提高用户语音信息的纯净度,从而便于后续服务器更精准的从中分析出用户本次的语音交互意图。例如,通过对用户语音信息进行降噪处理,可以滤除用户语音信息中的环境噪声、录制过程中的信号干扰噪声和空白音频等。对用户语音信息进行语音文本转换处理可以是通过语音识别算法或预先训练好的语音识别模型来对用户语音信息进行语音到文本的转换。其中,语音识别模型可以是预先通过大量样本数据对初始神经网络模型进行训练后得到的能够将音频数据转换成文本数据的神经网络模型。样本数据可以是大量的音频数据,以及各音频数据对应的文本数据。对采集到的用户语音信息进行语音文本转换处理的好处是,后续服务器无需再对语音信息进行文本转换,降低了服务器对用户语音信息进行分析处理的功耗,由于服务器需要为大量的智能设备提供语音信息处理的服务,减少服务器语音文本转换的操作,可以极大的提高服务处理语音信息的效率,进而提高智能设备为用户提供智能交互服务的效率。
第二种可实施方式可以是:识别采集到的用户语音信息中是否存在匹配标准指令模板的词汇或语句,如存在,则将所述匹配的词汇或语句作为关键语音信息。例如,可以设置点歌服务对应的标准指令模板为“播放歌曲”,若检测到用户语音信息“启动智能音箱播放歌曲《我和我的祖国》”中存在匹配标准指令模板的语句,则可以将匹配标准指令模板的语句“播放歌曲《我和我的祖国》”作为关键语音信息。
第三种可实施方式还可以是:从采集的用户语音信息中截取唤醒词后的语音信息作为关键语音信息。其中,该可实施方式的具体执行方法将在后续实施例进行详细介绍。
需要说明的是,本实施例可以根据智能设备的语音采集触发方式、智能交互方式以及智能设备的当前所处环境等,选择上述至少一个可实施方式来执行从采集的用户语音信息中提取关键语音信息的操作。具体的,若语音采集触发方式为检测到环境中存在声音信号,就采集当前用户语音信息,则此时采集到的语音信息中可能存在唤醒词,则可以是采用第三种可实施方式来提取关键语音信息;若智能设备的智能交互方式为按照预设的标准指令与智能设备进行交互,则此时可以是采用第二种可实施方式来提取关键语音信息;若智能设备的当前所处环境嘈杂,干扰大,则此时可以是采用第一种可实施方式中进行降噪处理的方式提取关键语音信息;还可以是采用上述三种可实施方式中的至少两种方式进行组合叠加提取关键语音信息等。
S102,在处于非无线保真WiFi网络环境中,将关键语音信息传输至移动终端,以使移动终端将关键语音信息传输至服务器,并接收服务器对关键语音信息处理后反馈的处理结果。
其中,本申请的移动终端可以是在非WiFi网络环境中,仍然可通过自身网络模块与服务器进行信息交互的电子设备,例如,本申请的移动终端可以是安装有SIM卡的电子设备,即时在非WiFi网络环境中其也可以通过内部的蜂窝移动网(如3G/4G网络)与服务器进行信息交互。
可选的,本实施例在处于非WiFi网络环境中,智能终端可以通过非WiFi网络与移动终端建立可传输数据的网络连接。可选的,现有的移动终端和智能终端中都设置有蓝牙模块,所以本实施例智能终端可以在当前环境中没有可连接的WiFi网络时,从附近的可连接蓝牙设备中搜索本地历史连接过的移动终端,并与该移动终端建立蓝牙网络连接,然后基于蓝牙网络将S101提取到的关键语音信息传输至移动终端,移动终端在接收到该关键语音信息后,采用移动终端自身的蜂窝移动网将关键语音信息发送给智能终端待进行交互的服务器;可选的,移动终端上可以安装有智能终端待进行交互的服务器的应用程序,移动终端在接收到智能设备通过蓝牙网络传输的关键语音信息后,通过服务器的应用程序基于蜂窝移动网将该关键语音信息传输至服务器。服务器在接收到关键语音信息后,会对接收到的关键语音信息进行分析处理,确定用户的交互需求,并针对用户的交互需求,生成对应的服务信息作为处理结果,然后再将该处理结果反馈给移动终端(如可以是反馈给移动终端上安装的服务器的应用程序)。例如,若关键语音信息为“播放歌曲《我和我的祖国》”,服务器对该关键语句信息进行分析可以确定用户的交互需求为“歌曲《我和我的祖国》”,然后搜索并下载歌曲《我和我的祖国》作为处理结果,并将下载的歌曲《我和我的祖国》反馈给移动终端。
可选的,蓝牙模块通常有多个可进行信息传输的通道,本实施例可以是在智能设备需要向移动终端发送关键语音信息时,采用本地蓝牙模块的第一通道控制本地蓝牙模块的第二通道从关闭状态切换至启动状态;将关键语音信息通过第二通道传输至移动终端;其中,第一通道的功耗低于第二通道,且第一通道在本地蓝牙模块启动后处于常开启状态。其中,进行语音信息传输的通道通常为高功耗的通道,而接收传输指令的通道为低功耗的通道,为了降低移动终端内部的蓝牙模块的功耗,本实施例中蓝牙模块的低功耗通道可以设置为常启动通道,而高功耗的通道在工作时开启,不工作时处于关闭。智能设备可以在需要向移动终端发送关键语音信息时,向本地蓝牙模块低功耗的第一通道发送语音信息传输指令,第一通道在接收到该语音信息传输指令后,控制用于传输语音信息的高功耗第二通道从关闭状态切换至开启状态,此时智能设备可以将关键语音信息通过第二通道传输至移动终端。相应的,移动终端中也同样是蓝牙模块中的第一通道检测到有语音信息传入时,将第二通道的状态从关闭状态切换为开启状态后,由第二通道接收智能设备传输的关键语音信息,然后将接收到的关键语音信息传输至服务器的应用程序,该应用程序基于移动设备的内部的蜂窝移动网,将关键语音信息传输服务器。
需要说明的是,本实施例在处于非WiFi网络环境下,智能设备除了可以通过上述介绍的蓝牙网络与移动终端建立网络连接,还可以采用其他非WiFi网络建立网络连接,例如,可以是msh网络、ZigBee网络等,对此本实施例不进行限定。此外,移动终端在接收到关键语音信息后,无需对关键语音信息进行其他处理操作,只需要借助移动终端的网络将该关键语音信息传输至服务器,所以不会占用移动终端过多的功耗。
S103,从移动终端获取并展示处理结果。
可选的,移动终端在接收到服务器反馈的处理结果后,可以是采用移动终端与智能终端之间的网络连接,例如,可以是蓝牙网络,将服务器反馈的处理结果转发至智能设备。具体的传输过程与S102中介绍的智能终端向移动终端传输关键语音信息的过程类似,对此不进行赘述。
可选的,在智能终端获取到移动终端传输的处理结果后,智能终端会对该处理结果进行展示,具体的,如果该处理结果包括音频数据,则可以是通过语音播放装置播放该音频数据,如果该处理结果包括文字或图像,则可以是通过显示屏展示该文字或图像。例如,若智能设备接收到的处理结果为歌曲《我和我的祖国》,则智能设备可以是通过喇叭播放用户点播的该歌曲,从而实现为用户提供智能交互服务。
本申请实施例提供的智能设备的数据处理方法,在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
第二实施例
图2是根据本申请第二实施例提供的一种智能设备的数据处理方法的流程图,本实施例在上述实施例的基础上,进行了进一步的优化,具体给出了如何从采集的用户语音信息中提取关键语音信息的详细情况介绍。具体的,如图2所示,本实施例提供的智能设备的数据处理方法可以包括:
S201,若识别到采集的用户语音信息中存在唤醒词,则从采集的用户语音信息中提取关键语音信息。
其中,唤醒词可以是用来唤醒智能设备与用户进行智能交互的词汇、短句或某种特殊的声音(如拍手的声音)。该唤醒词可以用户自己设置并保存在智能设备中的,还可以是智能设备系统默认的。例如,智能音箱的唤醒词可以是“智能音箱”。
智能设备为了降低其功耗,在无需为用户提供智能服务时,通常是进入低功耗的休眠状态,在该状态下,智能设备中的高功耗进程或模块都处于停止运行的状态,只有少数低功耗的检测模块处于工作状态。例如,在智能设备处于休眠状态时,可以将智能设备内的数据处理模块、语音播放模块、图像显示屏等高功耗模块停止运行,保留语音采集模块的工作状态,以使该语音采集模块采集并检测采集到的用户语音信息中是否存在唤醒词,如果存在唤醒词,则说明该用户语音信息是用户发出的需要启动智能设备为其提供智能交互服务的语句。此时智能设备可以执行从用户语音信息中提取关键语音信息。如果不存在唤醒词,则说明该用户语音信息可以是周围用户聊天的声音或周围的环境声音(如电视播放的声音),无需对其进行关键语音信息的提取。
可选的,本实施例中,由于用户语音信息中包含唤醒词,所以本实施例从采集的用户语音信息中提取关键语音信息时,可以是从采集的用户语音信息中截取唤醒词后的语音信息作为关键语音信息。具体的,可以是从采集的用户语音信息中识别唤醒词,然后确定该唤醒词出现的时刻作为开始截取时刻,将该用户语音信息的结束时刻作为终止截取时刻,从用户语音信息中截取该开始截取时刻和终止截取时刻之间的语音信息作为关键语音信息。可选的,为了减少关键语音信息中的干扰信息,本实施例还可以在从用户语音信息中截取该开始截取时刻和终止截取时刻之间的语音信息后,对截取后的语音信息进行降噪处理,得到最终的关键语音信息。可选的,为了降低了服务器对用户语音信息进行分析处理的功耗,提高智能设备为用户提供智能交互服务的效率,本实施例还可以是对降噪处理后的语音信息进行文本转换操作,将得到的文本信息作为最终的关键语音信息。
S202,在处于非无线保真WiFi网络环境中,将关键语音信息传输至移动终端,以使移动终端将关键语音信息传输至服务器,并接收服务器对关键语音信息处理后反馈的处理结果。
S203,从移动终端获取并展示处理结果。
本申请实施例提供的智能设备的数据处理方法,智能设备在采集到用户语音信息后,只对包含唤醒词的用户语音信息进行关键词提取,避免了智能设备因误对环境中的非交互语音信息进行关键语音信息的提取处理,而造成的误提供智能交互服务的情况出现,同时也极大的节省了智能设备的功耗。在从用户语音信息中提取关键信息时,将唤醒词后的语音信息作为关键语音信息,以实现快速准确的从用户语音信息中提取关键信息。在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,从而保证智能设备在有无WiFi网络的场景下都可以正常为用户提供智能交互服务。
第三实施例
图3A是根据本申请第三实施例提供的一种智能设备的数据处理方法的流程图,图3B根据本申请第三实施例提供的智能设备的数据处理过程示意图。本实施例在上述实施例的基础上,进行了进一步的优化,提供了一种智能设备处于不同的网络环境时,进行数据处理方法的优选实施例。具体的,如图3A-3B所示,本实施例提供的智能设备的数据处理方法可以包括:
S301,从采集的用户语音信息中提取关键语音信息。
S302,判断是否处于非WiFi网络环境中,若是,则执行S303,若否,则执行S305。
可选的,如图3B所示,本实施例中的智能设备有两种联网方式,一种联网方式为:在所处环境为可连接的WiFi网络环境,此时智能设备可切换至WiFi模式,通过路由设备连接上环境中的WiFi网络,进而可以通过WiFi网络与服务器进行数据交互。另一种联网方式为:在所处环境为非可连接的WiFi网络环境,此时智能设备可以切换至蓝牙模式,通过蓝牙模块与移动终端建立蓝牙网络连接,其中,蓝牙网络只可以进行数据的传输操作。
可选的,当智能设备从采集的用户语音信息中提取关键语音信息后,需要将该关键语音信息传输至服务器时,需要查看自身当前所处环境是否为非WiFi网络环境,如果是,则执行S303-S304的操作完成与服务器的交互过程,如果否,则执行S305-S306的操作完成与服务器的交互过程。
S303,在处于非无线保真WiFi网络环境中,将关键语音信息传输至移动终端,以使移动终端将关键语音信息传输至服务器,并接收服务器对关键语音信息处理后反馈的处理结果。
示例性的,在智能设备处于非WiFi网络环境中时,智能设备自动切换为蓝牙模式,对应的联网方式是与移动终端建立蓝牙网络连接,此时智能设备可以是通过蓝牙网络将关键语音信息传输至移动终端,移动终端在接收到智能设备传输的关键语音信息后,采用其本地的蜂窝移动网将关键语音信息转发至服务器,服务器在接收到移动终端发送的关键语音信息后,对该关键语音信息进行分析处理,并将处理结果反馈给移动终端,移动终端在采用蜂窝移动网接收到服务器反馈的处理结果后,再采用蓝牙网络将该处理结果转发至智能设备。
S304,从移动终端获取处理结果。
示例性的,智能设备通过蓝牙网络接收移动终端传输的处理结果。
S305,在处于WiFi网络环境中,基于WiFi网络将关键语音信息传输至服务器,以使服务器对关键语音信息处理后反馈的处理结果。
示例性的,在智能设备处于WiFi网络环境中时,智能设备自动切换至WiFi模式,对应的联网方式是通过路由设备连接WiFi网络,此时智能设备可以直接采用WiFi网络将关键语音信息发送至服务器,服务器在接收到智能设备发送的关键语音信息后,对该关键语音信息进行分析处理。
S306,基于WiFi网络从服务器获取处理结果。
示例性的,智能设备在处于WiFi网络环境中时,智能设备可以直接通过WiFi网络与服务器进行交互,所以此时服务器在将处理结果反馈给智能设备时,智能设备也可以是采用WiFi网络接收服务器反馈的处理结果。
S307,展示处理结果。
本申请实施例提供的智能设备的数据处理,智能设备在从采集的用户语音信息中提取关键语音信息后,若处于WiFi网络环境中,可直接基于WiFi网络向服务其发送关键语音信息,以及接收服务器反馈的对关键语音信息的处理结果,来实现为用户提供智能交互服务,若处于非WiFi网络环境中,可以通过借助移动终端网络的转发,将关键语音信息传输至服务器,来获取服务器反馈的处理结果,为用户提供智能交互服务。本实施例中智能设备可根据其所处环境是否存在WiFi网络,自动适配与服务器进行交互的网络,实现与用户之间无障碍的进行语音交互。
第四实施例
图4是根据本申请第四实施例提供的一种智能设备的数据处理装置的结构示意图,该装置可执行本申请任意实施例所提供的智能设备的数据处理方法,具备执行方法相应的功能模块和有益效果。可选的,该装置可以采用软件和/或硬件的方式实现,并可集成在智能设备中。如图4所示,该智能设备的数据处理装置400可以包括:
关键语音提取模块401,用于从采集的用户语音信息中提取关键语音信息;
无WiFi传输模块402,用于在处于非无线保真WiFi网络环境中,将所述关键语音信息传输至移动终端,以使所述移动终端将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;
处理结果展示模块403,用于从所述移动终端获取并展示所述处理结果。
本申请实施例提供的智能设备的数据处理装置,在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
进一步的,所述关键语音提取模块401具体用于:
若识别到采集的用户语音信息中存在唤醒词,则从所述采集的用户语音信息中提取关键语音信息。
进一步的,所述关键语音提取模块401在执行从采集的用户语音信息中提取关键语音信息时具体用于:
从采集的用户语音信息中截取所述唤醒词后的语音信息作为关键语音信息。
进一步的,所述关键语音提取模块401具体用于:
对采集的用户语音信息进行降噪处理和/或语音文本转换处理,得到关键语音信息。
进一步的,所述无WiFi传输模块402具体用于:
采用本地蓝牙模块的第一通道控制所述本地蓝牙模块的第二通道从关闭状态切换至启动状态;
将所述关键语音信息通过所述第二通道传输至移动终端;
其中,所述第一通道的功耗低于所述第二通道,且所述第一通道在所述本地蓝牙模块启动后处于常开启状态。
进一步的,所述装置还包括:
有WiFi传输模块,用于基于所述WiFi网络将所述关键语音信息传输至服务器,以使所述服务器对所述关键语音信息处理后反馈的处理结果;
所述处理结果展示模块403具体用于:基于所述WiFi网络从所述服务器获取并展示所述处理结果。
第五实施例
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是用于实现本申请实施例的智能设备的数据处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的智能设备的数据处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的智能设备的数据处理方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的智能设备的数据处理方法对应的程序指令/模块(例如,附图4所示的关键语音提取模块401、无WiFi传输模块402和处理结果展示模块403)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的智能设备的数据处理方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于实现智能设备的数据处理方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至用于实现智能设备的数据处理方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于实现智能设备的数据处理方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与用于实现智能设备的数据处理方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,在对采集到的用户语音信息进行关键语音信息提取后,若智能设备处于非WiFi网络环境,则建立与移动终端的网络连接,将提取到的关键语音信息传输至移动终端,借助移动终端的网络将关键语音信息传输至服务器进行处理,在服务器对关键语音信息处理完成后,同样借助移动终端的网络将处理结果反馈至智能设备进行展示。本实施例在智能设备向服务器传输语音信息前,先在本地对采集到的用户语音信息进行关键语音信息提取,以降低语音信息传输量,节省智能设备功耗的同时提高了后续服务器的数据处理效率。此外,智能设备在周围环境中没有WiFi网络时,通过借助移动终端的网络,实现与服务器的交互,为用户提供智能交互服务,且该过程无需移动终端对待传输的关键语音信息进行其他处理操作,无需占用移动终端较多的功耗。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (5)
1.一种智能设备的数据处理方法,其特征在于,包括:
预先在智能设备本地存储待服务的用户的声纹信息;
在采集当前环境中的声音信号时,先判断所述声音信号的声纹信息是否与所述本地预先存储的待服务的用户的声纹信息一致;
若一致,则采集当前环境中的声音信号作为用户语音信息,若不一致,不执行本次用户语音信息采集操作;
从采集的用户语音信息中提取关键语音信息;
在处于非无线保真WiFi网络环境中,采用本地蓝牙模块的第一通道控制所述本地蓝牙模块的第二通道从关闭状态切换至启动状态,将所述关键语音信息通过所述第二通道传输至移动终端,以使所述移动终端通过自身网络模块将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;其中,所述第一通道的功耗低于所述第二通道,且所述第一通道在所述本地蓝牙模块启动后处于常开启状态;
从所述移动终端获取并展示所述处理结果;
其中,从采集的用户语音信息中提取关键语音信息,包括:
若识别到采集的用户语音信息中存在唤醒词,则从所述采集的用户语音信息中截取所述唤醒词后的语音信息作为关键语音信息;其中,所述唤醒词包括:用来唤醒所述智能设备与用户进行智能交互的词汇、短句或声音。
2.根据权利要求1所述的方法,其特征在于,从采集的用户语音信息中提取关键语音信息之后,还包括:
在处于WiFi网络环境中,基于所述WiFi网络将所述关键语音信息传输至服务器,以使所述服务器对所述关键语音信息处理后反馈的处理结果;
基于所述WiFi网络从所述服务器获取并展示所述处理结果。
3.一种智能设备的数据处理装置,其特征在于,包括:
关键语音提取模块,用于预先在智能设备本地存储待服务的用户的声纹信息;在采集当前环境中的声音信号时,先判断所述声音信号的声纹信息是否与所述本地预先存储的待服务的用户的声纹信息一致;若一致,则采集当前环境中的声音信号作为用户语音信息,若不一致,不执行本次用户语音信息采集操作;从采集的用户语音信息中提取关键语音信息;
无WiFi传输模块,用于在处于非无线保真WiFi网络环境中,将所述关键语音信息传输至移动终端,以使所述移动终端通过自身网络模块将所述关键语音信息传输至服务器,并接收所述服务器对所述关键语音信息处理后反馈的处理结果;
处理结果展示模块,用于从所述移动终端获取并展示所述处理结果;
所述关键语音提取模块具体用于:
若识别到采集的用户语音信息中存在唤醒词,则从所述采集的用户语音信息中截取所述唤醒词后的语音信息作为关键语音信息;其中,所述唤醒词包括:用来唤醒所述智能设备与用户进行智能交互的词汇、短句或声音;
所述无WiFi传输模块具体用于:
采用本地蓝牙模块的第一通道控制所述本地蓝牙模块的第二通道从关闭状态切换至启动状态;
将所述关键语音信息通过所述第二通道传输至移动终端;
其中,所述第一通道的功耗低于所述第二通道,且所述第一通道在所述本地蓝牙模块启动后处于常开启状态。
4.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的智能设备的数据处理方法。
5.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的智能设备的数据处理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910935399.5A CN110675873B (zh) | 2019-09-29 | 2019-09-29 | 智能设备的数据处理方法、装置、设备及存储介质 |
JP2020069790A JP7017598B2 (ja) | 2019-09-29 | 2020-04-08 | スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 |
US16/907,269 US11348583B2 (en) | 2019-09-29 | 2020-06-21 | Data processing method and apparatus for intelligent device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910935399.5A CN110675873B (zh) | 2019-09-29 | 2019-09-29 | 智能设备的数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110675873A CN110675873A (zh) | 2020-01-10 |
CN110675873B true CN110675873B (zh) | 2023-02-07 |
Family
ID=69080185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910935399.5A Active CN110675873B (zh) | 2019-09-29 | 2019-09-29 | 智能设备的数据处理方法、装置、设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11348583B2 (zh) |
JP (1) | JP7017598B2 (zh) |
CN (1) | CN110675873B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113495489A (zh) * | 2020-04-07 | 2021-10-12 | 深圳爱根斯通科技有限公司 | 自动化配置方法、装置、电子设备及存储介质 |
US11302327B2 (en) * | 2020-06-22 | 2022-04-12 | Bank Of America Corporation | Priori knowledge, canonical data forms, and preliminary entrentropy reduction for IVR |
CN111880854B (zh) * | 2020-07-29 | 2024-04-30 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
CN112216279A (zh) * | 2020-09-29 | 2021-01-12 | 星络智能科技有限公司 | 语音传输方法、智能终端及计算机可读存储介质 |
CN114527711A (zh) * | 2021-11-08 | 2022-05-24 | 厦门阳光恩耐照明有限公司 | 一种基于本地语音的智能设备控制的方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108833236A (zh) * | 2018-07-05 | 2018-11-16 | 西安蜂语信息科技有限公司 | 数据传输方法及装置 |
CN109451338A (zh) * | 2018-12-12 | 2019-03-08 | 央广视讯传媒股份有限公司 | 一种语音遥控电视的方法、装置、电子设备及可读介质 |
CN110223691A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 语音唤醒识别的切换控制方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10390217B2 (en) * | 2016-12-27 | 2019-08-20 | Neutrino8, Inc. | Wireless configuration of wireless distribution system (WDS) Wi-Fi range extenders using non-Wi-Fi-wireless communication channels |
US10900800B2 (en) * | 2017-04-18 | 2021-01-26 | Garmin Switzerland Gmbh | Mobile application interface device for vehicle navigation assistance |
US20190114358A1 (en) * | 2017-10-12 | 2019-04-18 | J. J. Keller & Associates, Inc. | Method and system for retrieving regulatory information |
US10367540B1 (en) | 2018-02-20 | 2019-07-30 | Cypress Semiconductor Corporation | System and methods for low power consumption by a wireless sensor device |
CN108428452B (zh) | 2018-03-14 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 终端支架和远场语音交互系统 |
CN110312235A (zh) | 2019-05-16 | 2019-10-08 | 深圳市豪恩声学股份有限公司 | 实时语音唤醒的音频设备、运行方法、装置及存储介质 |
CN110278205B (zh) | 2019-06-19 | 2021-05-28 | 百度在线网络技术(北京)有限公司 | 蓝牙音箱底座及其控制方法和系统 |
-
2019
- 2019-09-29 CN CN201910935399.5A patent/CN110675873B/zh active Active
-
2020
- 2020-04-08 JP JP2020069790A patent/JP7017598B2/ja active Active
- 2020-06-21 US US16/907,269 patent/US11348583B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108833236A (zh) * | 2018-07-05 | 2018-11-16 | 西安蜂语信息科技有限公司 | 数据传输方法及装置 |
CN109451338A (zh) * | 2018-12-12 | 2019-03-08 | 央广视讯传媒股份有限公司 | 一种语音遥控电视的方法、装置、电子设备及可读介质 |
CN110223691A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 语音唤醒识别的切换控制方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210097994A1 (en) | 2021-04-01 |
US11348583B2 (en) | 2022-05-31 |
JP2021057878A (ja) | 2021-04-08 |
JP7017598B2 (ja) | 2022-02-08 |
CN110675873A (zh) | 2020-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110675873B (zh) | 智能设备的数据处理方法、装置、设备及存储介质 | |
CN110381388B (zh) | 一种基于人工智能的字幕生成方法和装置 | |
EP3392877B1 (en) | Device for performing task corresponding to user utterance | |
CN111192591B (zh) | 智能设备的唤醒方法、装置、智能音箱及存储介质 | |
EP3531416A1 (en) | System for processing user utterance and controlling method thereof | |
CN109429522A (zh) | 语音交互方法、装置及系统 | |
CN111862940A (zh) | 基于耳机实现的翻译方法、装置、系统、设备和存储介质 | |
US11720814B2 (en) | Method and system for classifying time-series data | |
KR20200074260A (ko) | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN112382285A (zh) | 语音控制方法、装置、电子设备和存储介质 | |
KR102369083B1 (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
CN111755002B (zh) | 语音识别装置、电子设备和语音识别方法 | |
CN106272481A (zh) | 一种机器人服务的唤醒方法及装置 | |
KR20210033873A (ko) | 음성 인식 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
CN112466296A (zh) | 语音交互的处理方法、装置、电子设备及存储介质 | |
CN113393838A (zh) | 语音处理方法、装置、计算机可读存储介质及计算机设备 | |
CN111128201A (zh) | 交互方法、装置、系统、电子设备及存储介质 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
CN112270918A (zh) | 信息处理方法、装置、系统、电子设备及存储介质 | |
CN109389977B (zh) | 一种语音交互方法及装置 | |
CN112652304B (zh) | 智能设备的语音交互方法、装置和电子设备 | |
CN112382292A (zh) | 基于语音的控制方法和装置 | |
CN111638787A (zh) | 用于展示信息的方法和装置 | |
CN112509569B (zh) | 语音数据的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210511 Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. Applicant after: Shanghai Xiaodu Technology Co.,Ltd. Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |