CN111292742A - 数据处理方法、装置、电子设备和计算机存储介质 - Google Patents
数据处理方法、装置、电子设备和计算机存储介质 Download PDFInfo
- Publication number
- CN111292742A CN111292742A CN202010037310.6A CN202010037310A CN111292742A CN 111292742 A CN111292742 A CN 111292742A CN 202010037310 A CN202010037310 A CN 202010037310A CN 111292742 A CN111292742 A CN 111292742A
- Authority
- CN
- China
- Prior art keywords
- application
- voice
- instruction
- voice information
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000007405 data analysis Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 230000003993 interaction Effects 0.000 claims description 33
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 description 19
- 238000013528 artificial neural network Methods 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例提出了一种数据处理方法、装置、电子设备和计算机存储介质,该方法包括:在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;根据所述推荐指令对所述应用进行处理。本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性;另外,可以提高语音识别的准确率,进而可以准确地得出推荐指令,以进行合理可靠地应用处理。
Description
技术领域
本发明涉及计算机技术,尤其涉及一种数据处理方法、装置、电子设备和计算机存储介质。
背景技术
在相关技术中,在运行应用的过程中,可以采用按键进行人机交互,但是这种交互方式的操作复杂性较高;另外,还可以采用基于关键词唤醒的语音交互方式实现人机交互,但是,这种方式需要用户不断地呼叫唤醒词,以激活语音识别功能,操作复杂性依然比较高,且会对应用运行的连贯性造成影响。
发明内容
本发明实施例期望提供数据处理的技术方案。
本发明实施例提供了一种数据处理方法,所述方法包括:
在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;
根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;
根据所述推荐指令对所述应用进行处理。
可选地,所述获取语音信息包括:
接收到语音监听触发信号时,接收语音信息。
可选地,所述背景噪音包括所述应用的其他参与者的语音信息。
可选地,所述在所述语音信息满足预设条件时,对所述语音信息进行语音识别,包括:
在所述语音信息的声纹特征与预先存储的声纹特征匹配时,对所述语音信息进行语音识别。
可选地,所述方法还包括:
将所述语音信息发送至所述应用的其他参与者的电子设备,所述电子设备用于运行所述应用。
可选地,所述根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令,包括:
在所述语音识别结果与所述应用的操作逻辑匹配成功时,生成所述推荐指令,所述推荐指令表示符合所述应用的操作逻辑的指令。
可选地,所述根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令,包括:
在所述语音识别结果与所述应用的操作逻辑匹配失败时,根据预先确定的指令生成方式,生成所述推荐指令。
可选地,所述应用的操作逻辑包括所述应用的页面交互逻辑和/或所述应用的内容操作逻辑。
可选地,所述根据所述推荐指令对所述应用进行处理,包括:
根据所述推荐指令生成提示信息,所述提示信息用于提示执行推荐指令;
或者,针对所述应用执行推荐指令。
本发明实施例还提供了一种数据处理装置,所述装置包括:第一处理模块、分析模块和第二处理模块,其中,
第一处理模块,用于在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;
分析模块,用于根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;
第二处理模块,用于根据所述推荐指令对所述应用进行处理。
本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一种数据处理方法。
本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种数据处理方法。本发明实施例提出的数据处理方法、装置、电子设备和计算机存储介质中,在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;根据所述推荐指令对所述应用进行处理。本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性。另外,通过在降低背景噪音的基础上,获取语音信息,并且在语音信息满足预设条件时,再对语音信息进行语音识别,这样,可以提高语音识别的准确率,进而可以准确地得出推荐指令,以进行合理可靠地应用处理。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本发明的实施例,并与说明书一起用于说明本发明的技术方案。
图1为本发明实施例的数据处理方法的流程图;
图2为本发明实施例中采用人机模式进行游戏类应用的交互的方法流程图;
图3为本发明实施例中涉及的子流程的示意图;
图4为本发明实施例中采用对讲模式进行游戏类应用的交互的方法流程图;
图5为本发明实施例中采用实时会话模式进行游戏类应用的交互的方法流程图;
图6为本发明实施例的数据处理装置的组成结构示意图;
图7为本发明实施例的电子设备的结构示意图。
具体实施方式
以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本发明,并不用于限定本发明。另外,以下所提供的实施例是用于实施本发明的部分实施例,而非提供实施本发明的全部实施例,在不冲突的情况下,本发明实施例记载的技术方案可以任意组合的方式实施。
需要说明的是,在本发明实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
例如,本发明实施例提供的数据处理方法包含了一系列的步骤,但是本发明实施例提供的数据处理方法不限于所记载的步骤,同样地,本发明实施例提供的数据处理装置包括了一系列模块,但是本发明实施例提供的数据处理装置不限于包括所明确记载的模块,还可以包括为获取相关信息、或基于信息进行处理时所需要设置的模块。
本发明实施例可以基于终端和/或服务器实现,这里,终端可以是瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统,等等。服务器可以是小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等;。
服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
基于上述记载的应用场景,提出以下各实施例。
第一实施例
本发明第一实施例提出了一种数据处理方法,可以应用于终端等电子设备中。
图1为本发明实施例的数据处理方法的流程图,如图1所示,该流程可以包括:
步骤101:在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果。
本发明实施例中,语音信息表示用户的语音,在实际应用中,可以利用电子设备的麦克风等声音采集设备采集用于的语音,得到语音信息。在一实施方式中,在获取语音信息后,可以将语音信息存储在电子设备中,本发明实施例中,并不对存储的语音信息的格式进行限定。
在实际应用中,可以采用预先确定的语音识别算法对语音信息进行语音识别,得到语音结果;这里,并不对语音识别算法的种类进行限定。
在一实施方式中,语音识别结果可以是文字或其它类型的语音识别结果。
本发明实施例中,可以在通过声音采集设备获取原始语音信号的基础上,针对原始语音信号进行降噪处理,实现语音信号的接收。可以理解地,通过在降低背景噪音的基础上接收语音信息,有利于提高对语音信息进行语音识别的准确率。
本发明实施例中,预设条件可以根据实际需求预先设置,这里并不对预设条件的具体实现方式进行限定,例如,可以从提高语音识别准确性和可靠性的角度,确定预设条件;在具体的示例中,可以从语音信息的声纹特征等方面确定预设条件。
步骤102:根据预先确定的数据分析方式,对语音识别结果进行分析,得到应用的推荐指令。
本发明实施例中,应用可以是电子设备上预先安装的应用,这里,并不对应用的种类和来源进行限定;示例性地,应用可以是游戏类应用、多媒体播放应用或其它应用。
本发明实施例中,应用的推荐指令表示对应用进行处理的指令,例如,应用的推荐指令可以是应用的界面按钮的触发指令、应用的界面的跳转指令、应用的界面的关闭指令、应用的内容处理指令或其它指令。预先确定的数据分析方式可以是对语音识别结果进行分析,以得到应用的推荐指令的算法;在实际应用中,可以预先将对语音识别结果进行分析的算法存储在电子设备中,进而,在获取到语音识别结果后,可以采用该算法对语音识别结果进行分析,得到应用的推荐指令。
示例性地,上述对语音识别结果进行分析的算法可以基于神经网络实现,在实际实施时,可以预先训练对语音识别结果进行分析的神经网络,这样,训练完成的神经网络可以对语音识别结果进行分析。
在实际应用中,对于预先训练对语音识别结果进行分析的神经网络的过程,示例性地,可以获取样本语音识别结果(例如可以是文字),将样本语音识别结果输入至神经网络,利用神经网络对样本语音识别结果进行识别,得到应用的推荐指令;根据应用的推荐指令和针对样本语音识别结果的标注的推荐指令,调整神经网络的网络参数值;重复执行上述步骤,直至网络参数值调整后的神经网络满足预设的训练结束条件,得到训练完成的神经网络。
步骤103:根据推荐指令对应用进行处理。
在实际应用中,推荐指令用于指示对上述应用的处理方式,因而,根据推荐指令可以对应用进行处理。
在实际应用中,步骤101至步骤103可以基于电子设备的处理器实现,上述处理器可以为特定用途集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital SignalProcessing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central ProcessingUnit,CPU)、控制器、微控制器、微处理器中的至少一种。
可以理解地,本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性。
对于获取语音信息的实现方式,在一实施方式中,可以在接收到语音监听触发信号时,接收语音信息。
这里,语音监听触发信号可以是按键触发信号或语音触发信号,本发明实施例对此不进行限定。
本发明实施例中,只需要一次触发到语音监听触发信号,便可以对后续接收的语音信息实现进行语音信息进行语音识别,进而通过后续分析得到推荐指令,无需在每次在进行语音识别前均通过唤醒词进行语音识别功能的唤醒,因而,降低了操作复杂性。
在一实施方式中,上述背景噪音包括应用的其他参与者的语音信息;这里,应用的其他参与者表示运行应用的其它电子设备的持有者,示例性地,在上述应用的多人交互应用如游戏类应用时,应用的其他参与者表示其他基于同一应用进行交互的用户;在实际应用中,运行应用的每个电子设备可以获取相应的参与者的语音信息,并将该语音信息发送至应用的其他参与者的电子设备。
本发明实施例中,可以通过降低扬声器音量等方式降低背景噪音;降低背景噪音的程度可以有电子设备按照预设方式进行推荐,也可以由电子设备的用户进行设置。
在一个应用场景中,上述应用为多人参与的游戏类应用,参与游戏类应用的每个用户可以通过话筒等设备向电子设备输入语音信息,这些语音信号可以是游戏类应用的操作指令,也可以是与其他用户的语音交互内容;基于各个用户之间的电子设备的数据交互,参与游戏类应用的每个用户的电子设备也可以将语音交互内容发送至其他用户的电子设备,其他用户的电子设备的扬声器可以将接收到的语音交互内容进行播放;这样,通过电子设备的话筒采集的语音信号可以包括本用户输入的游戏类应用的操作指令、本用户的电子设备向其他用户的电子设备发送的语音交互内容、其他用户的电子设备向本用户的电子设备发送的语音交互内容、以及环境噪音信号等。在这种情况下,可以对通过话筒收集到的声音信号进行降低背景噪音的处理,以比较准确地得出本用户向电子设备输入的语音信息。
在对通过话筒收集到的声音信号进行降低背景噪音的处理时,在第一个示例中,可以通过音量控制软件或用户按压音量控制按钮等方式,来降低扬声器音量,进而降低其他用户的电子设备向本用户的电子设备发送的语音交互内容的音量,实现部分背景噪音的降噪处理;在第二个示例中,当本用户的电子设备接收到其他用户的电子设备发送的待播出语音信号后,对该待播出语音信号进行解码后,可以得到待播出语音信号A;在本用户的电子设备的话筒接收到的待播出声音信号B是混合声音信号,即,待播出声音信号B是本用户输入的游戏类应用的操作指令对应的声音信号、以及待播出语音信号A的混合;如此,可以在待播出声音信号B播出前,在待播出声音信号B的波形上减去待播出语音信号A的波形,得到最终播出的声音信号波形,这样达到主动降噪的目的;当然,在一些变形的实施例中,也可以在得到最终播出的声音信号波形前,对待播出语音信号A进行降噪处理,以降低待播出语音信号A的环境背景噪音或待播出语音信号A在传播过程中带来的损耗;然后,可以在待播出声音信号B的波形上减去经过降噪处理后的待播出语音信号A的波形,得到最终播出的声音信号波形。这里,对待播出语音信号A进行降噪处理的原理可以是:基于神经网络学习待播出语音信号A的环境背景噪音或待播出语音信号A在传播过程中带来的损耗的特征,从而,实现对待播出语音信号A的降噪处理。在第三个示例中,可以通过音频降噪软件等方式,以对话筒收集到的环境噪音信号进行降噪处理,在实际实施时,音频降噪软件的原理可以是:基于神经网络学习环境噪音信号的特征,从而,实现对环境噪音信号的降噪处理。
可以看出,通过对应用的其他参与者的语音信息进行降噪处理,有利于降低应用的其他参与者的语音对后续语音识别过程的影响,可以提升对语音信息进行语音识别的准确率。
对于在语音信息满足预设条件时,对语音信息进行语音识别的实现方式,在一个实例中,可以在语音信息的声纹特征与预先存储的声纹特征匹配时,对语音信息进行语音识别。
这里,预先存储的声纹特征可以存储在运行应用的本地电子设备中,在实际应用中,运行应用的本地电子设备可以通过人机交互方式(例如通过人机交互界面)接收相应的用户的声纹特征的录入,例如,运行应用的本地电子设备为用户A的电子设备,则可以预先将用户A的声纹特征录入至运行应用的本地电子设备,这里用户A的声纹特征为预先存储的声纹特征;在另一实施例中,运行应用的本地电子设备还可以接收相应的用户的声语音信号的录入,然后通过对录入的语音信号的声纹识别,得到声纹特征并存储该声纹特征;例如,运行应用的本地电子设备为用户A的电子设备,则可以预先将用户A的语音信号录入至运行应用的本地电子设备,运行应用的本地电子设备可以对用户A的语音信号进行语音信号进行声纹识别,得到声纹特征,然后可以存储该声纹特征。
在一实施方式中,可以判断获取的语音信息的声纹特征与预先存储的声纹特征是否匹配,如果语音信息的声纹特征与预先存储的声纹特征的相似度大于或等于设定相似度阈值,则可以认为语音信息的声纹特征与预先存储的声纹特征匹配;如果语音信息的声纹特征与预先存储的声纹特征的相似度小于设定相似度阈值,则可以认为语音信息的声纹特征与预先存储的声纹特征不匹配,此时,可以直接结束流程。在实际应用中,相似度阈值可以根据实际情况进行设置,例如,相似度阈值在80%以上。
需要说明的是,在语音信息的声纹特征与预先存储的声纹特征匹配时,对语音信息进行语音识别,可以忽略获取的语音信息。
可以看出,本发明实施例,通过在语音信息的声纹特征与预先存储的声纹特征匹配时,对语音信息进行语音识别,有利于保证对运行应用的本地电子设备的授权使用者进行语音识别,可以符合实际需求;另外,如果运行应用的每个电子设备在语音信息的声纹特征与预先存储的声纹特征匹配时,对所述语音信息进行语音识别,则有利于实现运行应用的各个参与者的实时语音交互。
在一实施方式中,可以将上述语音信息发送至应用的其他参与者的电子设备,该电子设备用于运行上述应用。具体地,可以将上述语音信息通过广播等方式发送至应用的其他参与者的电子设备。
可以看出,通过将上述语音信息发送至应用的其他参与者的电子设备,有利于应用的各个参与者在参与应用的同时进行语音交互,例如,在应用为游戏类应用时,有利于应用的各个参与者在参与游戏的同时进行语音交互。
对于根据预先确定的数据分析方式,对语音识别结果进行分析,得到所述应用的推荐指令的实现方式,示例性地,可以判断语音识别结果与应用的操作逻辑是否匹配成功,在语音识别结果与应用的操作逻辑匹配成功时,生成推荐指令,该推荐指令表示符合所述应用的操作逻辑的指令;在语音识别结果与应用的操作逻辑匹配失败时,根据预先确定的指令生成方式,生成所述推荐指令。
本公开实施例中,应用的操作逻辑表示与应用相关的用户操作逻辑,应用的操作逻辑可以包括:应用的页面交互逻辑和/或应用的内容操作逻辑;应用的页面交互逻辑表示与应用的页面交互相关的操作逻辑,示例性地,应用的页面交互逻辑可以包括页面跳转、页面关闭、切换页面等操作逻辑;应用的内容操作逻辑表示与应用的内容处理相关的操作逻辑,示例性地,对于游戏类应用,应用的内容操作逻辑可以表示游戏操作逻辑,对于购物类应用,应用的内容操作逻辑可以表示购物操作相关的逻辑。
对于符合所述应用的操作逻辑的指令的实现方式,具体地,在应用的操作逻辑包括应用的页面交互逻辑时,符合应用的操作逻辑的指令可以表示针对应用的页面交互的指令,例如,符合应用的操作逻辑的指令可以指示进行页面跳转、页面关闭、切换页面等操作;在应用的操作逻辑包括应用的内容操作逻辑时,符合应用的操作逻辑的指令可以表示针对应用的内容处理的指令,例如,符合应用的操作逻辑的指令可以指示进行游戏操作或其它与应用的内容相关的操作。
本发明实施例中,并不限制如何预先确定指令生成方式;在一个示例中,预先确定的指令生成方式是默认的指令生成方式,在实际应用中,可以预先将默认的指令生成方式存储到电子设备中;在另一个示例中,可以根据上述训练完成的神经网络,确定出语音识别结果对应的指令生成方式,将该指令生成方式即为预先确定的指令生成方式;相应地,上述预先训练对语音识别结果进行分析的神经网络的过程可以包括:可以获取样本语音识别结果(例如可以是文字),将样本语音识别结果输入至神经网络,利用神经网络执行以下步骤:判断语音识别结果与应用的操作逻辑是否匹配成功,在语音识别结果与应用的操作逻辑匹配成功时,生成推荐指令,该推荐指令表示符合所述应用的操作逻辑的指令;在语音识别结果与应用的操作逻辑匹配失败时,根据预先确定的指令生成方式,生成所述推荐指令。根据所述推荐指令和针对样本语音识别结果的标注的推荐指令,调整神经网络的网络参数值;重复执行上述步骤,直至网络参数值调整后的神经网络满足预设的训练结束条件,得到训练完成的神经网络。
对于根据上述推荐指令对应用进行处理的实现方式,在一个示例中,可以根据上述推荐指令生成提示信息,该提示信息用于提示执行推荐指令;在实际应用中,可以将提示信息展示在电子设备中,提示信息可以是文字提示信息、语音提示信息或其它提示信息,本发明实施例对此并不进行限定;可以看出,本发明实施例中,在提示信息的提示下,便于增强人机交互性,有利于用户根据提示信息执行后续针对应用的处理。
对于根据上述推荐指令对应用进行处理的实现方式,在另一个示例中,可以针对所述应用执行推荐指令;可以看出,本发明实施例可以在得到推荐指令,直接执行推荐指令,有利于降低操作复杂度,提升用户体验。
第二实施例
为了能够更加体现本发明的目的,在本发明第一实施例的基础上,进行进一步的说明。
本发明第二实施例中,以游戏类应用为例进行说明,图2为本发明实施例中采用人机模式进行游戏类应用的交互的方法流程图,如图2所示,该流程包括:
步骤201:用户主动触发语音监听。
这里,在电子设备接收到语音监听触发信号时,可以认为用户主动触发语音监听。
步骤202:通过语音识别得到语音识别结果。
对于本步骤的实现方式,具体地说,可以接收语音信息,对语音信息进行降噪处理,对降噪处理后的语音信息进行语音识别,得到语音识别结果;这里的语音识别结果可以是文字。
步骤203:基于语音识别结果执行子流程,得到游戏类应用的推荐指令。
步骤204:根据推荐指令对游戏类应用进行处理。
本步骤的实现方式已经在前述记载的内容中作出说明,这里不再赘述。
图3为本发明实施例中涉及的子流程的示意图,如图3所示,该子流程可以包括:
步骤A1:判断语音识别结果是否与应用的页面交互逻辑匹配,如果是,执行步骤A4,如果否,则执行步骤A2。
步骤A2:判断游戏是否正在进行,如果否,执行步骤A4,如果是,则执行步骤A3。
步骤A3:判断语音识别结果是否与应用的内容操作逻辑匹配,如果否,执行步骤A4,如果是,则执行步骤A4。
步骤A4:得到推荐指令。
本步骤的实现方式已经在前述记载的实施例中作出说明,这里不再赘述。
可以看出,基于图2至图3所示的流程,用户可以单向对电子设备发出语音指令,即,用户发出语音信息时,通过执行图2至图3所示的流程,电子设备可以得到对应的推荐指令。
可以理解地,本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,并且,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性。
第三实施例
为了能够更加体现本发明的目的,在本发明前述实施例的基础上,进行进一步的说明。
本发明第三实施例中,以游戏类应用为例进行说明,图4为本发明实施例中采用对讲模式进行游戏类应用的交互的方法流程图,如图4所示,该流程包括:
步骤401:用户主动触发语音监听。
这里,在电子设备接收到语音监听触发信号时,可以认为用户主动触发语音监听。
步骤402:在降低游戏类应用的其他参与者的语音的基础上,通过语音识别得到语音识别结果。
对于本步骤的实现方式,具体地说,可以在降低背景噪音的基础上接收语音信息,这里,背景噪音至少包括游戏类应用的其他参与者的语音;然后,对降噪处理后的语音信息进行语音识别,得到语音识别结果;这里的语音识别结果可以是文字。
步骤403:基于语音识别结果执行子流程,得到游戏类应用的推荐指令。
本步骤可以基于图3所示的子流程实现。
步骤404:根据推荐指令对游戏类应用进行处理,并将上述语音信息发送至游戏类应用的其他参与者的电子设备。
这里,根据推荐指令对游戏类应用进行处理的实现方式已经在前述记载的内容中作出说明,这里不再赘述。
可以看出,基于图3至图4所示的流程,用户可以向对电子设备发出语音指令,即,用户发出语音信息时,通过执行图3至图4所示的流程,电子设备可以得到对应的推荐指令;同时,用户可以将自身的语音信息发送至游戏类应用的其他参与者的电子设备,使游戏类应用的其他参与者听到相应的语音。
可以理解地,本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,并且,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性。
第四实施例
为了能够更加体现本发明的目的,在本发明前述实施例的基础上,进行进一步的说明。
本发明第四实施例中,以游戏类应用为例进行说明,图5为本发明实施例中采用实时会话模式进行游戏类应用的交互的方法流程图,如图5所示,该流程包括:
步骤501:实时监听语音信息,并对语音信息进行声纹识别,得到语音信息的声纹特征。
在实际应用中,可以在降低背景噪音的基础上接收语音信息,这里,背景噪音至少包括游戏类应用的其他参与者的语音;然后,对降噪处理后的语音信息进行声纹识别,得到语音信息的声纹特征。
步骤502:判断语音信息的声纹特征与预先存储的声纹特征是否匹配,如果是,则执行步骤503;如果否,则执行步骤506。
本步骤中,判断语音信息的声纹特征与预先存储的声纹特征是否匹配的实现方式已经在前述实施例中作出说明,这里不再赘述。
步骤503:通过语音识别得到语音识别结果。
具体地,对降噪处理后的语音信息进行语音识别,得到语音识别结果;这里的语音识别结果可以是文字。
步骤504:基于语音识别结果执行子流程,得到游戏类应用的推荐指令。
本步骤可以基于图3所示的子流程实现。
步骤505:根据推荐指令对游戏类应用进行处理,并将上述语音信息发送至游戏类应用的其他参与者的电子设备,然后,可以执行步骤506。
这里,根据推荐指令对游戏类应用进行处理的实现方式已经在前述记载的内容中作出说明,这里不再赘述。
步骤506:结束流程。
需要说明的是,基于步骤501至步骤506,可以针对一次监听的语音信号,进行语音识别并得出推荐指令;在每次得出推荐指令后,可以重新监听语音信号,在监听到语音信息时,重复执行步骤501至步骤506。
可以看出,基于图3和图5所示的流程,用户可以向对电子设备发出语音指令,即,用户发出语音信息时,通过执行图3和图5所示的流程,电子设备可以得到对应的推荐指令;同时,用户可以将自身的语音信息发送至游戏类应用的其他参与者的电子设备,使游戏类应用的其他参与者听到相应的语音。
可以理解地,本发明实施例中,可以在获取语音信息时,直接通过对语音信息的识别和后续分析,得到推荐指令,并且,无需通过呼叫唤醒词激活语音识别功能,可以降低操作复杂性,在一定程度上可以保证应用运行的连贯性。
第五实施例
在前述实施例提出的数据处理方法的基础上,本发明实施例还提出了一种数据处理装置。
图6为本发明实施例的数据处理装置的组成结构示意图,如图6所示,该装置可以包括:第一处理模块601、分析模块602和第二处理模块603,其中,
第一处理模块601,用于在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;
分析模块602,用于根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;
第二处理模块603,用于根据所述推荐指令对所述应用进行处理。
可选地,所述第一处理模块601,用于在接收到语音监听触发信号时,接收语音信息。
可选地,所述背景噪音包括所述应用的其他参与者的语音信息。
可选地,所述第一处理模块601,用于在所述语音信息的声纹特征与预先存储的声纹特征匹配时,对所述语音信息进行语音识别。
可选地,所述第一处理模块601,还用于将所述语音信息发送至所述应用的其他参与者的电子设备,所述电子设备用于运行所述应用。
可选地,所述分析模块602,用于在所述语音识别结果与所述应用的操作逻辑匹配成功时,生成所述推荐指令,所述推荐指令表示符合所述应用的操作逻辑的指令。
可选地,所述分析模块602,用于在所述语音识别结果与所述应用的操作逻辑匹配失败时,根据预先确定的指令生成方式,生成所述推荐指令。
可选地,所述应用的操作逻辑包括所述应用的页面交互逻辑和/或所述应用的内容操作逻辑。
可选地,所述第二处理模块603,用于根据所述推荐指令生成提示信息,所述提示信息用于提示执行推荐指令;或者,针对所述应用执行推荐指令。
上述第一处理模块601、分析模块602和第二处理模块603均可由位于电子设备中的处理器实现,上述处理器为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
另外,在本实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
具体来讲,本实施例中的一种数据处理方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与一种数据处理方法对应的计算机程序指令被一电子设备读取或被执行时,实现前述实施例的任意一种数据处理方法。
基于前述实施例相同的技术构思,参见图7,其示出了本发明实施例提供的一种电子设备70,可以包括:存储器71、处理器72及存储在存储器71上并可在处理器72上运行的计算机程序;其中,
存储器71,用于存储计算机程序和数据;
处理器72,用于执行所述存储器中存储的计算机程序,以实现前述实施例的任意一种数据处理方法。
在实际应用中,上述存储器71可以是易失性存储器(volatile memory),例如RAM;或者非易失性存储器(non-volatile memory),例如ROM,快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器72提供指令和数据。
上述处理器72可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
在一些实施例中,本发明实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (12)
1.一种数据处理方法,其特征在于,所述方法包括:
在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;
根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;
根据所述推荐指令对所述应用进行处理。
2.根据权利要求1所述的方法,其特征在于,所述获取语音信息包括:
接收到语音监听触发信号时,接收语音信息。
3.根据权利要求1所述的方法,其特征在于,所述背景噪音包括所述应用的其他参与者的语音信息。
4.根据权利要求1所述的方法,其特征在于,所述在所述语音信息满足预设条件时,对所述语音信息进行语音识别,包括:
在所述语音信息的声纹特征与预先存储的声纹特征匹配时,对所述语音信息进行语音识别。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:
将所述语音信息发送至所述应用的其他参与者的电子设备,所述电子设备用于运行所述应用。
6.根据权利要求1所述的方法,其特征在于,所述根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令,包括:
在所述语音识别结果与所述应用的操作逻辑匹配成功时,生成所述推荐指令,所述推荐指令表示符合所述应用的操作逻辑的指令。
7.根据权利要求1所述的方法,其特征在于,所述根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令,包括:
在所述语音识别结果与所述应用的操作逻辑匹配失败时,根据预先确定的指令生成方式,生成所述推荐指令。
8.根据权利要求6或7所述的方法,其特征在于,所述应用的操作逻辑包括所述应用的页面交互逻辑和/或所述应用的内容操作逻辑。
9.根据权利要求1所述的方法,其特征在于,所述根据所述推荐指令对所述应用进行处理,包括:
根据所述推荐指令生成提示信息,所述提示信息用于提示执行推荐指令;
或者,针对所述应用执行推荐指令。
10.一种数据处理装置,其特征在于,所述装置包括:第一处理模块、分析模块和第二处理模块,其中,
第一处理模块,用于在降低背景噪音的基础上,获取语音信息;在所述语音信息满足预设条件时,对所述语音信息进行语音识别,得到语音识别结果;
分析模块,用于根据预先确定的数据分析方式,对所述语音识别结果进行分析,得到应用的推荐指令;
第二处理模块,用于根据所述推荐指令对所述应用进行处理。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至9任一项所述的方法。
12.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010037310.6A CN111292742A (zh) | 2020-01-14 | 2020-01-14 | 数据处理方法、装置、电子设备和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010037310.6A CN111292742A (zh) | 2020-01-14 | 2020-01-14 | 数据处理方法、装置、电子设备和计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111292742A true CN111292742A (zh) | 2020-06-16 |
Family
ID=71028325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010037310.6A Pending CN111292742A (zh) | 2020-01-14 | 2020-01-14 | 数据处理方法、装置、电子设备和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292742A (zh) |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101648077A (zh) * | 2008-08-11 | 2010-02-17 | 巍世科技有限公司 | 语音指令游戏控制装置及其方法 |
CN103442138A (zh) * | 2013-08-26 | 2013-12-11 | 华为终端有限公司 | 语音控制方法、装置及终端 |
CN103442130A (zh) * | 2013-04-10 | 2013-12-11 | 威盛电子股份有限公司 | 语音操控方法、移动终端装置及语音操控系统 |
CN106681683A (zh) * | 2016-12-26 | 2017-05-17 | 汎达科技(深圳)有限公司 | 一种基于语音控制游戏操作的方法及装置 |
US20170212590A1 (en) * | 2016-01-26 | 2017-07-27 | Lenovo (Singapore) Pte. Ltd. | User action activated voice recognition |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
CN107783932A (zh) * | 2017-11-21 | 2018-03-09 | 广东欧珀移动通信有限公司 | 计算器的信息处理方法、移动终端及计算机可读存储介质 |
CN107773982A (zh) * | 2017-10-20 | 2018-03-09 | 科大讯飞股份有限公司 | 游戏语音交互方法及装置 |
CN107945796A (zh) * | 2017-11-13 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读介质 |
CN108074565A (zh) * | 2016-11-11 | 2018-05-25 | 上海诺悦智能科技有限公司 | 语音指令跳转与详细指令执行的方法和系统 |
CN108108142A (zh) * | 2017-12-14 | 2018-06-01 | 广东欧珀移动通信有限公司 | 语音信息处理方法、装置、终端设备及存储介质 |
CN108320744A (zh) * | 2018-02-07 | 2018-07-24 | 广东欧珀移动通信有限公司 | 语音处理方法和装置、电子设备、计算机可读存储介质 |
CN108962245A (zh) * | 2018-07-06 | 2018-12-07 | 奇瑞汽车股份有限公司 | 车载系统的控制方法、装置及计算机可读存储介质 |
CN109257503A (zh) * | 2018-10-24 | 2019-01-22 | 珠海格力电器股份有限公司 | 一种语音控制应用程序的方法、装置及终端设备 |
CN109495651A (zh) * | 2018-12-21 | 2019-03-19 | 天津视游科技有限公司 | 一种基于移动终端的电视游戏控制方法 |
CN109545209A (zh) * | 2018-11-26 | 2019-03-29 | 北京小米智能科技有限公司 | 操作执行方法、装置及存储介质 |
CN109584865A (zh) * | 2018-10-17 | 2019-04-05 | 平安科技(深圳)有限公司 | 一种应用程序控制方法、装置、可读存储介质及终端设备 |
CN109741738A (zh) * | 2018-12-10 | 2019-05-10 | 平安科技(深圳)有限公司 | 语音控制方法、装置、计算机设备及存储介质 |
CN110362290A (zh) * | 2019-06-29 | 2019-10-22 | 华为技术有限公司 | 一种语音控制方法及相关装置 |
CN110517685A (zh) * | 2019-09-25 | 2019-11-29 | 深圳追一科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
-
2020
- 2020-01-14 CN CN202010037310.6A patent/CN111292742A/zh active Pending
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101648077A (zh) * | 2008-08-11 | 2010-02-17 | 巍世科技有限公司 | 语音指令游戏控制装置及其方法 |
CN103442130A (zh) * | 2013-04-10 | 2013-12-11 | 威盛电子股份有限公司 | 语音操控方法、移动终端装置及语音操控系统 |
CN103442138A (zh) * | 2013-08-26 | 2013-12-11 | 华为终端有限公司 | 语音控制方法、装置及终端 |
US20170212590A1 (en) * | 2016-01-26 | 2017-07-27 | Lenovo (Singapore) Pte. Ltd. | User action activated voice recognition |
CN108074565A (zh) * | 2016-11-11 | 2018-05-25 | 上海诺悦智能科技有限公司 | 语音指令跳转与详细指令执行的方法和系统 |
CN106681683A (zh) * | 2016-12-26 | 2017-05-17 | 汎达科技(深圳)有限公司 | 一种基于语音控制游戏操作的方法及装置 |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
CN107773982A (zh) * | 2017-10-20 | 2018-03-09 | 科大讯飞股份有限公司 | 游戏语音交互方法及装置 |
CN107945796A (zh) * | 2017-11-13 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读介质 |
CN107783932A (zh) * | 2017-11-21 | 2018-03-09 | 广东欧珀移动通信有限公司 | 计算器的信息处理方法、移动终端及计算机可读存储介质 |
CN108108142A (zh) * | 2017-12-14 | 2018-06-01 | 广东欧珀移动通信有限公司 | 语音信息处理方法、装置、终端设备及存储介质 |
CN108320744A (zh) * | 2018-02-07 | 2018-07-24 | 广东欧珀移动通信有限公司 | 语音处理方法和装置、电子设备、计算机可读存储介质 |
CN108962245A (zh) * | 2018-07-06 | 2018-12-07 | 奇瑞汽车股份有限公司 | 车载系统的控制方法、装置及计算机可读存储介质 |
CN109584865A (zh) * | 2018-10-17 | 2019-04-05 | 平安科技(深圳)有限公司 | 一种应用程序控制方法、装置、可读存储介质及终端设备 |
CN109257503A (zh) * | 2018-10-24 | 2019-01-22 | 珠海格力电器股份有限公司 | 一种语音控制应用程序的方法、装置及终端设备 |
CN109545209A (zh) * | 2018-11-26 | 2019-03-29 | 北京小米智能科技有限公司 | 操作执行方法、装置及存储介质 |
CN109741738A (zh) * | 2018-12-10 | 2019-05-10 | 平安科技(深圳)有限公司 | 语音控制方法、装置、计算机设备及存储介质 |
CN109495651A (zh) * | 2018-12-21 | 2019-03-19 | 天津视游科技有限公司 | 一种基于移动终端的电视游戏控制方法 |
CN110362290A (zh) * | 2019-06-29 | 2019-10-22 | 华为技术有限公司 | 一种语音控制方法及相关装置 |
CN110517685A (zh) * | 2019-09-25 | 2019-11-29 | 深圳追一科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3611895B1 (en) | Method and device for user registration, and electronic device | |
CN109584876B (zh) | 语音数据的处理方法、装置和语音空调 | |
CN107995360B (zh) | 通话处理方法及相关产品 | |
US11870942B2 (en) | Systems and methods to automatically join conference | |
CN111540349B (zh) | 一种语音的打断方法和装置 | |
US11502863B2 (en) | Automatic correction of erroneous audio setting | |
CN109951743A (zh) | 弹幕信息处理方法、系统及计算机设备 | |
CN112423081B (zh) | 一种视频数据处理方法、装置、设备及可读存储介质 | |
US20220020373A1 (en) | METHODS FOR PROCESSING DATA OF LIVE STREAMING APPLICATION, and ELECTRONIC DEVICE | |
US8868419B2 (en) | Generalizing text content summary from speech content | |
CN113779208A (zh) | 用于人机对话的方法和装置 | |
WO2017172655A1 (en) | Analysis of a facial image to extract physical and emotional characteristics of a user | |
CN110418181B (zh) | 对智能电视的业务处理方法、装置、智能设备及存储介质 | |
CN106782498B (zh) | 语音信息播放方法、装置及终端 | |
CN113284500B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN108881766B (zh) | 视频处理方法、装置、终端和存储介质 | |
CN110197663B (zh) | 一种控制方法、装置及电子设备 | |
CN109065018B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN111292742A (zh) | 数据处理方法、装置、电子设备和计算机存储介质 | |
CN116756285A (zh) | 虚拟机器人的互动方法、设备和存储介质 | |
CN112700767A (zh) | 人机对话打断方法及装置 | |
CN110516043B (zh) | 用于问答系统的答案生成方法和装置 | |
CN108491183B (zh) | 一种信息处理方法和电子设备 | |
CN112786031A (zh) | 人机对话方法及系统 | |
JP6248677B2 (ja) | 会話補助プログラム、会話補助方法、及び会話システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 221, 2nd floor, Block C, 18 Kechuang 11th Street, Daxing Economic and Technological Development Zone, Beijing, 100176 Applicant after: Jingdong Technology Holding Co.,Ltd. Address before: Room 221, 2nd floor, Block C, 18 Kechuang 11th Street, Daxing Economic and Technological Development Zone, Beijing, 100176 Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200616 |
|
RJ01 | Rejection of invention patent application after publication |