CN108665900A - 云端唤醒方法及系统、终端以及计算机可读存储介质 - Google Patents
云端唤醒方法及系统、终端以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108665900A CN108665900A CN201810367637.2A CN201810367637A CN108665900A CN 108665900 A CN108665900 A CN 108665900A CN 201810367637 A CN201810367637 A CN 201810367637A CN 108665900 A CN108665900 A CN 108665900A
- Authority
- CN
- China
- Prior art keywords
- wake
- clouds
- word
- voice
- waken
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012546 transfer Methods 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 230000002618 waking effect Effects 0.000 description 23
- 238000004378 air conditioning Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001071864 Lethrinus laticaudis Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Telephone Function (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提出一种云端唤醒方法及系统、终端以及计算机可读存储介质。该云端唤醒方法包括:接收用户输入的唤醒语音,并将所述唤醒语音传送至云端;对所述唤醒语音进行云端解码,生成被唤醒文本;识别出所述被唤醒文本中的唤醒文字;以及根据识别结果,给出唤醒指示。通过本发明的云端唤醒方法,能够在云端完成对语音的识别,并根据识别出的语音,在云端实现对智能设备的唤醒。从而,在保证唤醒质量的情况下,减少了终端设备的资源耗用,也降低了电能损耗。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种云端唤醒方法及系统、终端以及计算机可读存储介质。
背景技术
随着科技的发展,在家电等智能设备中,用户可以通过语音实现对其操纵。也就是,需要通过语音对智能设备进行唤醒。
目前,现有的唤醒方案都是采用本地唤醒。基于本地的唤醒,实际上对于终端设备的耗电和资源占用都有很大的要求。并且,由于终端设备的内存有限,需要对唤醒模型进行压缩。但是,唤醒模型一旦被压缩,会影响唤醒的效果,也会产生唤醒的误报,从而影响唤醒的质量。
因此,如何减少唤醒模型的资源耗用和电能损耗,并且不影响保证唤醒质量,是大家十分关注的问题。
发明内容
本发明实施例提供一种云端唤醒控制方法及系统、终端以及计算机可读存储介质,以解决现有技术中的以上的一个或多个技术问题,或至少提供一种有益的选择。
第一方面,本发明实施例提供了一种云端唤醒方法,所述方法包括:
接收用户输入的唤醒语音,并将所述唤醒语音传送至云端;
对所述唤醒语音进行云端解码,生成被唤醒文本;
识别出所述被唤醒文本中的唤醒文字;以及
根据识别结果,给出唤醒指示。
结合第一方面,本发明在第一方面的第一种实施方式中,所述方法还包括:
用户预设所述唤醒文字;以及
将所述唤醒文字传送至所述云端。
结合第一方面、第一方面的第一种实施方式,本发明在第一方面的第二种实施方式中,所述将所述唤醒文字传送至所述云端,包括:
当将所述唤醒语音传送至云端的同时,将预设的所述唤醒文字传送至所述云端。
结合第一方面、第一方面的第一种实施方式、第一方面的第二种实施方式本发明在第一方面的第三种实施方式中,对所述唤醒语音进行云端解码,生成被唤醒文本,包括:
在所述云端,通过声学模型、语言模型及发音字典,对所述唤醒语音进行解码,以生成被唤醒文本。
结合第一方面、第一方面的第一种实施方式、第一方面的第二种实施方式、第一方面的第三种实施方式,本发明在第一方面的第四种实施方式中,所述识别出所述被唤醒文本中的唤醒文字,包括:
在所述被唤醒文本中,识别出与所述唤醒文字相匹配的匹配文字;以及
根据所述匹配文字,进行调整和组合,生成唤醒词。
结合第一方面及上述任何一种实施方式,本发明在第一方面的第五种实施方式中,所述根据识别结果,给出唤醒指示,包括:
根据所述唤醒词,给出唤醒指示。
第二方面,本发明实施例提供了一种云端唤醒系统,所述系统包括:
语音接收单元,配置用于接收用户输入的唤醒语音,并将所述唤醒语音传送至云端;
语音解码单元,配置用于对所述唤醒语音进行云端解码,生成被唤醒文本;
语音识别单元,配置用于识别出所述被唤醒文本中的唤醒文字;以及
唤醒指示单元,配置用于根据识别结果,给出唤醒指示。
结合第二方面,本发明在第二方面的第一种实施方式中,所述系统还包括:
唤醒文字设定单元,配置用于用户预设所述唤醒文字;以及
唤醒文字传送单元,配置用于将所述唤醒文字传送至所述云端。
结合第二方面、第二方面的第一种实施方式和第二方面的第二种实施方式,本发明在第二方面的第二种实施方式中,唤醒文字传送单元,还配置用于当将所述唤醒语音传送至云端的同时,将预设的所述唤醒文字传送至所述云端。
结合第二方面、第二方面的第一种实施方式、第二方面的第二种实施方式,本发明在第二方面的第三种实施方式中,所述语音解码单元,配置用于在所述云端,通过声学模型、语言模型及发音字典,对所述唤醒语音进行解码,以生成被唤醒文本。
结合第二方面、第二方面的第一种实施方式、第二方面的第二种实施方式、第二方面的第三种实施方式,本发明在第二方面的第四种实施方式中,所述语音识别单元包括:
文字匹配单元,配置用于在所述被唤醒文本中,识别出与所述唤醒文字相匹配的匹配文字;以及
唤醒形成单元,配置用于根据所述匹配文字,进行调整和组合,生成唤醒词。
结合第二方面及上述任何一种实施方式,本发明在第二方面的第五种实施方式中,所述唤醒指示单元,还配置用于根据所述唤醒词,给出唤醒指示。
第三方面,本发明实施例提供了一种云端唤醒终端,所述终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任一所述云端唤醒方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一种所述云端唤醒方法。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
上述技术方案中的一个技术方案具有如下优点或有益效果:通过本发明的云端唤醒方法,能够在云端完成对语音的识别,并根据识别出的语音,在云端实现对智能设备的唤醒。从而,在保证唤醒质量的情况下,减少了终端设备的资源耗用,也降低了电能损耗。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出了根据本发明一个实施例的云端唤醒方法100的流程图;
图2示出了根据本发明另一个实施例的云端唤醒方法200的流程图;
图3示出了根据本发明另一个实施例的云端唤醒方法300的流程图;
图4示出了根据本发明一个实施例的云端唤醒系统400的结构框图;
图5示出了根据本发明另一个实施例的云端唤醒系统500的结构框图;
图6示出了根据本发明另一个实施例的云端唤醒系统600的结构框图;以及
图7示出了根据本发明的云端唤醒终端的示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
下面结合图1至图7所示,对本发明的云端唤醒方法、系统和终端进行描述。
参见图1所示,本发明的云端唤醒方法100,包括步骤S101至步骤S104。
首先,通过语音接收步骤S101,接收用户输入的唤醒语音。
其中,可以通过终端设备的内置麦克风,对唤醒语音进行接收。也可以设置与终端设备连接的麦克风阵列,采用波束成形技术,根据声音的来源设置波束成形的角度,从而,能够指向性地对来自不同方向上的用户的远场语音进行接收。
唤醒语音基于用户当前的唤醒需要,例如:当用户想要打开冰箱时,可以输入唤醒语音“打开冰箱”;当然,用户的唤醒语音可以并不精确,也可以是一段表达唤醒需要的语音,例如:天气太热了,开会儿空调吧。
在接收到用户的唤醒语音后,将唤醒语音传送至云端。
接着,进入语音解码步骤S102,在云端,对传送来的唤醒语音进行解码。
在一种实施例中,解码操作可以通过声学模型、语言模型及发音字典等相互结合来实现,但并不仅限于此。唤醒语音进行解码后,可以将语音信号转换成文字信号,从而生成被唤醒文本。
其中,解码所使用的声学模型、语言模型及发音字典等都建立在云端,由于云端空间大,不必对声学模型、语言模型及发音字典等进行压缩,保证了解码质量。
在生成被唤醒文本之后,可以在语音识别步骤S103中,识别出被唤醒文本中的唤醒文字。从而,确定被唤醒文本中是否包含唤醒文字,以及包含哪些唤醒文字。
其中,唤醒文字可以预先设定在云端,也可以预先传送至云端。具体操作方式,将在下文进行描述。
在一种实施例中,唤醒文字可以包括智能设备的名称、昵称等,以及与开启、关闭、暂停、休眠等相关的动词;但并不仅限于此,可以根据用户的个人需要而设定相关的唤醒文字。
以被唤醒文本“打开空调”为例,语音识别步骤S103中,可以识别出“打开空调”中存在哪些唤醒文字,如,智能设备的名称“空调”,与开启相关的动词“开”。接着,可以将“空调”与“开”发送至唤醒指示步骤S104。
最后,在唤醒指示步骤S104中,可以根据识别结果,即,“空调”与“开”,给出唤醒指示。此时,可以根据识别结果,即,“空调”与“开”,给出使用空调的唤醒提示,并打开空调设备。
语音识别步骤S103和唤醒指示步骤S104也可以在云端完成,不再占据本地资源,减少了资源耗用,也降低了本地终端设备的电能损耗。
通过本发明的云端唤醒方法100,能够在云端完成对语音的解码和识别,并根据识别出的语音,在云端实现对智能设备的唤醒,从而,减少了终端设备的资源耗用,也降低了电能损耗。
参见图2所示,本发明一个实施例的云端唤醒方法200,在方法100的基础上,方法200还包括唤醒文字设定步骤S105和唤醒文字传送步骤S106。
在唤醒文字设定步骤S105中,用户可以根据需要,预设唤醒文字。
其中,唤醒文字可以只简单包括智能设备的名称,例如:冰箱、电视、空调等;还可以根据用户的喜爱程度对智能设备设置昵称,例如:小猪冰箱,小冷空调等;进一步地,唤醒文字还可以包括与操作相关的动词,例如:开启、关闭、暂停、休眠等相关的动词。
进一步地,在唤醒文字设定步骤S105中,用户还可以搜索到智能设备的出厂名称,即,厂家所设定的默认名称,也可以直接将这些出厂名称作为唤醒文字来使用。
在设定好唤醒文字之后,进入到唤醒文字传送步骤S106,将唤醒文字传送至云端。
在一种实施例中,用户可以在本地设定好唤醒文字,并且,设定后传送至云端保存,以便后续的语音识别。
优选地,在唤醒文字传送步骤S106中,在传送唤醒语音至云端的同时,将预设的唤醒文字也一起传送至云端。这样,唤醒文字随唤醒语音一同传送,便于在云端对唤醒语音解码后,即可对被唤醒文本做识别,并根据识别结果,指示唤醒。
通过本发明的云端唤醒方法200,将唤醒文字传送至云端,云端空间大,可以存储大规模的数据群,无需对唤醒文字进行压缩,从而,可以保证唤醒文字的覆盖面,增加唤醒文字与被唤醒文本的识别和匹配程度,提高唤醒效果,也减少了唤醒中误报的发生。
参见图3所示,本发明一个实施例的云端唤醒方法300,在方法200的基础上,语音识别步骤S103可以包括文字匹配步骤S1031和唤醒形成步骤S1032。
在一种实施例中,参见图3所示,在文字匹配步骤S1031中,可以在被唤醒文本中,识别出与唤醒文字相匹配的匹配文字。
以被唤醒文本“天气太热了,开会儿空调吧”为例,此时,被唤醒文本的语义比较模糊。而当预设的唤醒文字包括“电视”、“空调”、“打开”、“开启”时,在文字匹配步骤S1031中,可以识别出“天气太热了,开会儿空调吧”中与预设的唤醒文字(“电视”、“空调”、“打开”、“开启”)相匹配的文字是“空调”和“开”,即,匹配文字。
接着,在唤醒形成步骤S1032中,可以根据识别出的匹配文字,对其进行调整和组合,生成唤醒词。例如:将匹配文字“空调”和“开”,进行位置关系和逻辑关系上的调整和组合,形成唤醒词“开空调”。
在一种实施例中,在进入到唤醒指示步骤S104,可以根据唤醒词,给出唤醒指示。例如:根据唤醒词“开空调”,给出打开空调的唤醒指示,从而实现对空调的唤醒。
通过本发明的云端唤醒方法300,当被唤醒文本的语义比较模糊时,在识别出匹配文字之后,可以对匹配文字进行调整和组合,从而生成唤醒词。在方法300中,通过调整和组合就可以生成唤醒词,无需更改唤醒文字的构建模型,节省了技术资源,并且还能降低误报的发生。
参见图4所示,一种云端唤醒系统400,包括:语音接收单元401、语音解码单元402、语音识别单元403和唤醒指示单元404。
语音接收单元401,配置用于接收用户输入的唤醒语音,并将唤醒语音传送至云端。
其中,可以通过终端设备的内置麦克风,对唤醒语音进行接收。也可以设置与终端设备连接的麦克风阵列,采用波束成形技术,根据声音的来源设置波束成形的角度,从而,能够指向性地对来自不同方向上的用户的远场语音进行接收。
唤醒语音基于用户当前的唤醒需要,例如:当用户想要打开冰箱时,可以输入唤醒语音“打开冰箱”;当然,用户的唤醒语音可以并不精确,也可以是一段表达唤醒需要的语音,例如:天气太热了,开会儿空调吧。
语音解码单元402,配置用于对唤醒语音进行云端解码,生成被唤醒文本。
在一种实施例中,解码操作可以通过声学模型、语言模型及发音字典等相互结合来实现,但并不仅限于此。唤醒语音进行解码后,可以将语音信号转换成文字信号,从而生成被唤醒文本。
其中,解码所使用的声学模型、语言模型及发音字典等都建立在云端,由于云端空间大,不必对声学模型、语言模型及发音字典等进行压缩,保证了解码质量。
语音识别单元403,配置用于识别出被唤醒文本中的唤醒文字。
在一种实施例中,通过对被唤醒文本的识别,确定被唤醒文本中是否包含唤醒文字,以及包含哪些唤醒文字。
其中,唤醒文字可以预先设定在云端,也可以预先传送至云端。具体操作单元,将在下文进行描述。
唤醒指示单元404,配置用于根据识别结果,给出唤醒指示。
语音识别单元403和唤醒指示单元404也可以设置在云端,不再占据本地资源,减少了资源耗用,也降低了本地终端设备的电能损耗。
通过本发明的云端唤醒系统400,能够在云端完成对语音的解码和识别,并根据识别出的语音,在云端实现对智能设备的唤醒,从而,减少了终端设备的资源耗用,也降低了电能损耗。
具体地,图4所示的云端唤醒系统400与图1所示的云端唤醒方法100相对应。图4所示的系统的具体实现方式参照图1所示的方法的实施例中的描述。
参见图5所示,一种云端唤醒系统500,在系统400的基础上,系统500还包括唤醒文字设定单元405和唤醒文字传送单元406。
唤醒文字设定单元405,配置用于用户预设唤醒文字。
唤醒文字传送单元406,配置用于将唤醒文字传送至云端。
在一种实施例中,用户可以在本地设定好唤醒文字,并且,设定后传送至云端保存,以便后续的语音识别。
优选地,可以唤醒文字传送单元406在传送唤醒语音至云端的同时,将预设的唤醒文字也一起传送至云端。这样,唤醒文字随唤醒语音一同传送,便于在云端对唤醒语音解码后,即可对被唤醒文本做识别,并根据识别结果,指示唤醒。
具体地,图5所示的云端唤醒系统500与图2所示的云端唤醒方法200相对应。图5所示的系统的具体实现方式参照图2所示的方法的实施例中的描述。
参见图6所示,一种云端唤醒系统600,在系统500的基础上,语音识别单元403可以包括文字匹配单元4031和唤醒形成单元4032。
文字匹配单元4031,配置用于在被唤醒文本中,识别出与唤醒文字相匹配的匹配文字。
唤醒形成单元4032,配置用于根据匹配文字,进行调整和组合,生成唤醒词。
在一种实施例中,唤醒指示单元404,可以配置用于根据唤醒词,给出唤醒指示。
具体地,图6所示的云端唤醒系统600与图3所示的云端唤醒方法300相对应。图6所示的系统的具体实现方式参照图3所示的方法的实施例中的描述。
参见图7所示,一种云端唤醒控制终端包括存储器710和处理器720。存储器710内存储有可在处理器720上运行的计算机程序。处理器720执行计算机程序时实现上述实施例中的云端唤醒方法。存储器710和处理器720的数量可以为一个或多个。
该服务器还包括:
通信接口730,用于与外界设备进行通信,进行数据交互传输。
存储器710可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器710、处理器720和通信接口730独立实现,则存储器710、处理器720和通信接口730可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器710、处理器720及通信接口730集成在一块芯片上,则存储器710、处理器720及通信接口730可以通过内部接口完成相互间的通信。
在一种实施例中,本发明还提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一种所述云端唤醒方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种云端唤醒方法,其特征在于,所述方法包括:
接收用户输入的唤醒语音,并将所述唤醒语音传送至云端;
对所述唤醒语音进行云端解码,生成被唤醒文本;
识别出所述被唤醒文本中的唤醒文字;以及
根据识别结果,给出唤醒指示。
2.根据权利要求1所述的方法,其特征在于,还包括:
用户预设所述唤醒文字;以及
将所述唤醒文字传送至所述云端。
3.根据权利要求2所述的方法,其特征在于,所述将所述唤醒文字传送至所述云端,包括:
当将所述唤醒语音传送至云端的同时,将预设的所述唤醒文字传送至所述云端。
4.根据权利要求3所述的方法,其特征在于,对所述唤醒语音进行云端解码,生成被唤醒文本,包括:
在所述云端,通过声学模型、语言模型及发音字典,对所述唤醒语音进行解码,以生成被唤醒文本。
5.根据权利要求4所述的方法,其特征在于,所述识别出所述被唤醒文本中的唤醒文字,包括:
在所述被唤醒文本中,识别出与所述唤醒文字相匹配的匹配文字;以及
根据所述匹配文字,进行调整和组合,生成唤醒词。
6.根据权利要求5所述的方法,其特征在于,所述根据识别结果,给出唤醒指示,包括:
根据所述唤醒词,给出唤醒指示。
7.一种云端唤醒系统,其特征在于,所述系统包括:
语音接收单元,配置用于接收用户输入的唤醒语音,并将所述唤醒语音传送至云端;
语音解码单元,配置用于对所述唤醒语音进行云端解码,生成被唤醒文本;
语音识别单元,配置用于识别出所述被唤醒文本中的唤醒文字;以及
唤醒指示单元,配置用于根据识别结果,给出唤醒指示。
8.根据权利要求7所述的系统,其特征在于,还包括:
唤醒文字设定单元,配置用于用户预设所述唤醒文字;以及
唤醒文字传送单元,配置用于将所述唤醒文字传送至所述云端。
9.根据权利要求8所述的系统,其特征在于,所述唤醒文字传送单元,还配置用于当将所述唤醒语音传送至云端的同时,将预设的所述唤醒文字传送至所述云端。
10.根据权利要求9所述的系统,其特征在于,所述语音解码单元,配置用于在所述云端,通过声学模型、语言模型及发音字典,对所述唤醒语音进行解码,以生成被唤醒文本。
11.根据权利要求10所述的系统,其特征在于,所述语音识别单元包括:
文字匹配单元,配置用于在所述被唤醒文本中,识别出与所述唤醒文字相匹配的匹配文字;以及
唤醒形成单元,配置用于根据所述匹配文字,进行调整和组合,生成唤醒词。
12.根据权利要求11所述的系统,其特征在于,所述唤醒指示单元,还配置用于根据所述唤醒词,给出唤醒指示。
13.一种云端唤醒终端,其特征在于,所述终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810367637.2A CN108665900B (zh) | 2018-04-23 | 2018-04-23 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
US16/214,508 US11574632B2 (en) | 2018-04-23 | 2018-12-10 | In-cloud wake-up method and system, terminal and computer-readable storage medium |
JP2018232121A JP6866046B2 (ja) | 2018-04-23 | 2018-12-12 | クラウドウェイクアップ方法、システム、端末、コンピュータ可読記憶媒体、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810367637.2A CN108665900B (zh) | 2018-04-23 | 2018-04-23 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108665900A true CN108665900A (zh) | 2018-10-16 |
CN108665900B CN108665900B (zh) | 2020-03-03 |
Family
ID=63780261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810367637.2A Active CN108665900B (zh) | 2018-04-23 | 2018-04-23 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11574632B2 (zh) |
JP (1) | JP6866046B2 (zh) |
CN (1) | CN108665900B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033775A (zh) * | 2019-05-07 | 2019-07-19 | 百度在线网络技术(北京)有限公司 | 多音区唤醒交互方法、装置及存储介质 |
CN111627439A (zh) * | 2020-05-21 | 2020-09-04 | 腾讯科技(深圳)有限公司 | 音频数据的处理方法和装置、存储介质和电子设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117594046A (zh) * | 2023-10-19 | 2024-02-23 | 摩尔线程智能科技(北京)有限责任公司 | 一种模型训练方法、唤醒方法、装置及存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
US8041012B2 (en) * | 2007-03-06 | 2011-10-18 | Embarq Holdings Company, Llc | System and method for voice-activated dialing over implicit and explicit NFA trunks |
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
CN103095911A (zh) * | 2012-12-18 | 2013-05-08 | 苏州思必驰信息科技有限公司 | 一种通过语音唤醒寻找手机的方法及系统 |
WO2014020588A1 (en) * | 2012-07-31 | 2014-02-06 | Novospeech Ltd. | Method and apparatus for speech recognition |
CN103714815A (zh) * | 2013-12-09 | 2014-04-09 | 何永 | 语音控制方法及其设备 |
EP2784774A1 (en) * | 2013-03-29 | 2014-10-01 | Orange | Telephone voice personnal assistant |
CN204440902U (zh) * | 2014-12-22 | 2015-07-01 | 南京声准科技有限公司 | 终端智能语音测试系统 |
CN106448664A (zh) * | 2016-10-28 | 2017-02-22 | 魏朝正 | 一种通过语音控制智能家居设备的系统及方法 |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107230475A (zh) * | 2017-05-27 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107564517A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN107610702A (zh) * | 2017-09-22 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN107704275A (zh) * | 2017-09-04 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000089789A (ja) | 1998-09-08 | 2000-03-31 | Fujitsu Ltd | 音声認識装置及び記録媒体 |
US6658377B1 (en) * | 2000-06-13 | 2003-12-02 | Perspectus, Inc. | Method and system for text analysis based on the tagging, processing, and/or reformatting of the input text |
US7058575B2 (en) | 2001-06-27 | 2006-06-06 | Intel Corporation | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition |
JP3632679B2 (ja) | 2002-06-21 | 2005-03-23 | ブラザー工業株式会社 | 通信システム及び通信機器 |
JP2004096520A (ja) | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
US8154227B1 (en) | 2003-11-26 | 2012-04-10 | Liontech Trains Llc | Model train control system |
KR100621593B1 (ko) | 2004-09-24 | 2006-09-19 | 삼성전자주식회사 | 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법 |
US20080147652A1 (en) | 2006-12-14 | 2008-06-19 | Bellsouth Intellectual Property Corporation | Physical address verification within electronic documents |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US20110054899A1 (en) | 2007-03-07 | 2011-03-03 | Phillips Michael S | Command and control utilizing content information in a mobile voice-to-speech application |
US8224641B2 (en) | 2008-11-19 | 2012-07-17 | Stratify, Inc. | Language identification for documents containing multiple languages |
US8090750B2 (en) | 2008-12-30 | 2012-01-03 | International Business Machines Corporation | Prompting of an end user with commands |
US9421475B2 (en) | 2009-11-25 | 2016-08-23 | Hallmark Cards Incorporated | Context-based interactive plush toy |
US20140372114A1 (en) | 2010-08-06 | 2014-12-18 | Google Inc. | Self-Directed Machine-Generated Transcripts |
WO2012025784A1 (en) | 2010-08-23 | 2012-03-01 | Nokia Corporation | An audio user interface apparatus and method |
US9099087B2 (en) | 2010-09-03 | 2015-08-04 | Canyon IP Holdings, LLC | Methods and systems for obtaining language models for transcribing communications |
KR20130133629A (ko) | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
EP2904608B1 (en) | 2012-10-04 | 2017-05-03 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US10304465B2 (en) | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
JP6420769B2 (ja) | 2013-01-04 | 2018-11-07 | コピン コーポレーション | 二分岐音声認識 |
JP6416752B2 (ja) | 2013-04-19 | 2018-10-31 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 家電機器の制御方法、家電機器制御システム、及びゲートウェイ |
CN103280217B (zh) | 2013-05-02 | 2016-05-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US9786296B2 (en) | 2013-07-08 | 2017-10-10 | Qualcomm Incorporated | Method and apparatus for assigning keyword model to voice operated function |
US20150039316A1 (en) | 2013-07-31 | 2015-02-05 | GM Global Technology Operations LLC | Systems and methods for managing dialog context in speech systems |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US10223445B2 (en) | 2013-09-19 | 2019-03-05 | Maluuba Inc. | Hybrid natural language processor |
US9443522B2 (en) * | 2013-11-18 | 2016-09-13 | Beijing Lenovo Software Ltd. | Voice recognition method, voice controlling method, information processing method, and electronic apparatus |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
CN103956168A (zh) | 2014-03-29 | 2014-07-30 | 深圳创维数字技术股份有限公司 | 一种语音识别方法、装置及终端 |
EP2930716B1 (en) | 2014-04-07 | 2018-10-31 | Samsung Electronics Co., Ltd | Speech recognition using electronic device and server |
US9953632B2 (en) | 2014-04-17 | 2018-04-24 | Qualcomm Incorporated | Keyword model generation for detecting user-defined keyword |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
CN104183237B (zh) | 2014-09-04 | 2017-10-31 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音处理方法及装置 |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US9911415B2 (en) | 2014-12-19 | 2018-03-06 | Lenovo (Singapore) Pte. Ltd. | Executing a voice command during voice input |
EP3067884B1 (en) | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
CN107408027B (zh) | 2015-03-31 | 2020-07-28 | 索尼公司 | 信息处理设备、控制方法及程序 |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US20190189019A1 (en) | 2015-06-08 | 2019-06-20 | Novel Effect, Inc. | System and Method for Integrating Special Effects with a Text Source |
US10777205B2 (en) | 2015-09-30 | 2020-09-15 | Huawei Technologies Co., Ltd. | Voice control processing method and apparatus |
CN106814639A (zh) | 2015-11-27 | 2017-06-09 | 富泰华工业(深圳)有限公司 | 语音控制系统及方法 |
CN105895103B (zh) | 2015-12-03 | 2020-01-17 | 乐融致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
US9940929B2 (en) | 2015-12-09 | 2018-04-10 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
US10636414B2 (en) | 2016-03-10 | 2020-04-28 | Sony Corporation | Speech processing apparatus and speech processing method with three recognizers, operation modes and thresholds |
US10365887B1 (en) * | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
CN105931644B (zh) | 2016-04-15 | 2019-10-25 | Oppo广东移动通信有限公司 | 一种语音识别方法及移动终端 |
CN105869637B (zh) | 2016-05-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
CN106157950A (zh) | 2016-09-29 | 2016-11-23 | 合肥华凌股份有限公司 | 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器 |
US10217453B2 (en) | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN106611597B (zh) | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US10580405B1 (en) * | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
CN106653022B (zh) | 2016-12-29 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US10311876B2 (en) * | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US10057125B1 (en) | 2017-04-17 | 2018-08-21 | Essential Products, Inc. | Voice-enabled home setup |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
-
2018
- 2018-04-23 CN CN201810367637.2A patent/CN108665900B/zh active Active
- 2018-12-10 US US16/214,508 patent/US11574632B2/en active Active
- 2018-12-12 JP JP2018232121A patent/JP6866046B2/ja active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8041012B2 (en) * | 2007-03-06 | 2011-10-18 | Embarq Holdings Company, Llc | System and method for voice-activated dialing over implicit and explicit NFA trunks |
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
WO2014020588A1 (en) * | 2012-07-31 | 2014-02-06 | Novospeech Ltd. | Method and apparatus for speech recognition |
CN103095911A (zh) * | 2012-12-18 | 2013-05-08 | 苏州思必驰信息科技有限公司 | 一种通过语音唤醒寻找手机的方法及系统 |
EP2784774A1 (en) * | 2013-03-29 | 2014-10-01 | Orange | Telephone voice personnal assistant |
CN103714815A (zh) * | 2013-12-09 | 2014-04-09 | 何永 | 语音控制方法及其设备 |
CN204440902U (zh) * | 2014-12-22 | 2015-07-01 | 南京声准科技有限公司 | 终端智能语音测试系统 |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN106448664A (zh) * | 2016-10-28 | 2017-02-22 | 魏朝正 | 一种通过语音控制智能家居设备的系统及方法 |
CN107230475A (zh) * | 2017-05-27 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107564517A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107704275A (zh) * | 2017-09-04 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN107610702A (zh) * | 2017-09-22 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
Non-Patent Citations (1)
Title |
---|
张伟: ""面向智能家居的嵌入式语音控制系统的研究"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033775A (zh) * | 2019-05-07 | 2019-07-19 | 百度在线网络技术(北京)有限公司 | 多音区唤醒交互方法、装置及存储介质 |
CN111627439A (zh) * | 2020-05-21 | 2020-09-04 | 腾讯科技(深圳)有限公司 | 音频数据的处理方法和装置、存储介质和电子设备 |
CN111627439B (zh) * | 2020-05-21 | 2022-07-22 | 腾讯科技(深圳)有限公司 | 音频数据的处理方法和装置、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108665900B (zh) | 2020-03-03 |
JP6866046B2 (ja) | 2021-04-28 |
US20190325871A1 (en) | 2019-10-24 |
JP2019191552A (ja) | 2019-10-31 |
US11574632B2 (en) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108538305A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN107704275B (zh) | 智能设备唤醒方法、装置、服务器及智能设备 | |
CN108306797A (zh) | 声控智能家居设备方法、系统、终端以及存储介质 | |
CN103093755B (zh) | 基于终端及互联网语音交互的网络家电控制方法及系统 | |
US11587560B2 (en) | Voice interaction method, device, apparatus and server | |
CN107564518A (zh) | 智能设备控制方法、装置及计算机设备 | |
CN108154140A (zh) | 基于唇语的语音唤醒方法、装置、设备及计算机可读介质 | |
CN107919119A (zh) | 多设备交互协同的方法、装置、设备及计算机可读介质 | |
CN108665900A (zh) | 云端唤醒方法及系统、终端以及计算机可读存储介质 | |
US20200265843A1 (en) | Speech broadcast method, device and terminal | |
CN110459222A (zh) | 语音控制方法、语音控制装置及终端设备 | |
CN102855874A (zh) | 基于互联网语音交互的家电控制方法及系统 | |
CN109192208A (zh) | 一种电器设备的控制方法、系统、装置、设备及介质 | |
CN107437413A (zh) | 语音播报方法及装置 | |
CN110277092A (zh) | 一种语音播报方法、装置、电子设备及可读存储介质 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN201499139U (zh) | 一种音量自动调节系统及停车场出入口控制设备 | |
US11366688B2 (en) | Do-not-disturb processing method and apparatus, and storage medium | |
CN209030351U (zh) | 一种具有翻译功能的电视终端 | |
CN104062910A (zh) | 命令生成装置、设备的智能控制方法和系统 | |
CN1835107B (zh) | 具有自动停止音乐功能的移动通信终端及停止音乐方法 | |
CN102880392B (zh) | 一种浏览图片的方法、装置及移动终端 | |
Kohn | Is the era of artificial speech translation upon us | |
CN113076397A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN1828723B (zh) | 分散式语言处理系统及其所使用的输出中介信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |