CN104700830A - 一种语音端点检测方法及装置 - Google Patents

一种语音端点检测方法及装置 Download PDF

Info

Publication number
CN104700830A
CN104700830A CN201310656959.6A CN201310656959A CN104700830A CN 104700830 A CN104700830 A CN 104700830A CN 201310656959 A CN201310656959 A CN 201310656959A CN 104700830 A CN104700830 A CN 104700830A
Authority
CN
China
Prior art keywords
phonetic entry
network transmission
voice
transmission speed
time delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310656959.6A
Other languages
English (en)
Other versions
CN104700830B (zh
Inventor
郭勐
杨蕾
张俭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201310656959.6A priority Critical patent/CN104700830B/zh
Publication of CN104700830A publication Critical patent/CN104700830A/zh
Application granted granted Critical
Publication of CN104700830B publication Critical patent/CN104700830B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种语音端点检测方法及装置,该方法包括:在确定出有语音输入时,确定当前的网络传输速率;根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;根据确定出的语音延时,得到语音输入的终止点。能够较好地解决在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低的问题。

Description

一种语音端点检测方法及装置
技术领域
本发明涉及移动多媒体技术领域,尤其是涉及一种语音端点检测方法及装置。
背景技术
随着人机信息交互技术的发展,语音识别技术显示出其重要性,语音识别需要确定语音短短。语音端点包括语音录入的起始点,以及语音录入的终止点。从语音录入的起始点开始计时,延时一段时长后得到语音录入的终止点。语音端点检测是语音识别是否正确的关键技术之一,可以在语音识别中提高识别精度及减少识别时间。
通常情况下,语音端点检测的具体流程如下述:
步骤一:接收用户输入的触发语音输入的触发指令。
用户可以通过点击语音输入按钮,触发启动终端中的语音输入程序,开启语音录入模式。
步骤二:接收用户录入的语音。
步骤三:终端进入语音录入状态,接收用户录入的语音的起始点。
步骤四:在检测到语音录入的起始点时,开始计时。
步骤五:计时结束后,得到语音录入的终止点。
步骤六:根据得到的语音起始点和语音终止点,完成语音端点检测。
但是,上述语音端点检测过程,语音录入时需要通过网络传输,因此在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低。
发明内容
本发明提供了一种语音端点检测方法及装置,能够较好地解决在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低的问题。
一种语音端点检测方法,包括:在确定出有语音输入时,确定当前的网络传输速率;根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;根据确定出的语音延时,得到语音输入的终止点。
在语音端点确定的过程中,引入网络传输速率,最终根据当前的网络传输速率来确定语音延时,在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
按照下述公式确定当前的网络传输速率:
V = 1 - P c T VA * R c
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
在确定网络传输速率时,综合考虑语音编码队列的当前占用率,以及语音输入的时长,以及语音的编码速率,能够较好地提高确定出当前网络传输速率的准确性。
按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
最终根据当前的网络传输速率来确定语音延时在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
在确定出当前的网络传输速率之后,确定用于表征语音输入的时长的语音延时之前,还包括:确定语音输入过程中,在确定出有和语音输入的识别错误率反馈的信息时,确定所述识别错误率;以及在确定出没有和语音输入的识别错误率反馈的信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs
其中,其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
在确定语音延时的时候,综合考虑网络传输速率、场景因子、以及识别错误率的因素,进一步提高确定语音端点的准确性。
一种语音端点检测装置,包括:语音确定模块,用于确定是否有语音输入;网络传输速率确定模块,用于在确定出有语音输入时,确定当前的网络传输速率;语音延时确定模块,用于根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;端点确定模块,用于根据确定出的语音延时,得到语音输入的终止点。
在语音端点确定的过程中,引入网络传输速率,最终根据当前的网络传输速率来确定语音延时,在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
所述网络传输速率确定模块,具体用于按照下述公式确定当前的网络传输速率:
V = 1 - P c T VA * R c
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
在确定网络传输速率时,综合考虑语音编码队列的当前占用率,以及语音输入的时长,以及语音的编码速率,能够较好地提高确定出当前网络传输速率的准确性。
所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
最终根据当前的网络传输速率来确定语音延时,在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
还包括:识别错误率确定模块,用于确定语音输入过程中,在确定出有和语音输入的识别错误率反馈的信息时,确定所述识别错误率;以及在确定出没有和语音输入的识别错误率反馈的信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs
其中,其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
在确定语音延时的时候,综合考虑网络传输速率、场景因子、以及识别错误率的因素,进一步提高确定语音端点的准确性。
附图说明
图1为本发明实施例提出的语音端点检测方法流程图;
图2为本发明实施例提出的语音端点检测装置结构组成示意图。
具体实施方式
针对一般情况下,语音端点检测过程中,语音录入时需要通过网络传输,因此在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低的问题,本发明实施例提出的技术方案中,在确定出有语音输入时,计入网络传输速率,根据网络传输速率,确定语音延时,从而得到语音输入的端点,以实现提高语音端点检测的准确度,提高识别准确度。
下面将结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
本发明实施例提出一种语音端点检测方法,如图1所示,其具体处理流程如下述:
步骤11,终端录制背景音。
其中,终端录制背景音的录制时长为N秒,如5秒等。
一种较佳地实施方式,本发明实施例这里取值为2秒。
步骤12,接收用户输入的触发语音输入的触发指令,并接收用户输入的语音。
用户可以通过点击终端上的按钮,开启录制语音。
步骤13,确定用户输入语音时的语音录入端点。在确定出有语音输入时,确定当前的网络传输速率。
具体地,可以按照下述公式1确定当前的网络传输速率:
V = 1 - P c T VA * R c     公式1
其中,V是当前的网络传输速率,Pc是语音输入过程中语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
步骤14,根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时。
具体地,可以按照下述公式2确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
一种较佳地实现方式,本发明实施例提出的技术方案中,SD的取值为2秒,α的取值在0~1之间。
步骤15,根据确定出的语音延时,得到语音输入的终止点。
在上述步骤11~步骤15所阐述的技术方案中,在语音端点确定的过程中,引入网络传输速率,最终根据当前的网络传输速率来确定语音延时,在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
可选地,在上述步骤13确定出当前的网络传输速率之后,在步骤14确定用于表征语音输入的时长的语音延时之前,还可以包括:
步骤16,判断是否有和语音输入的识别错误率反馈信息,如果判断结果为是,则执行步骤17,反之执行步骤18。
步骤17,确定语音输入过程中,在确定出有和语音输入的识别错误率反馈信息时,确定识别错误率。
其中,识别错误率可以根据网络传输速率来确定。
步骤18,在确定出没有和语音输入的识别错误率反馈信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
根据上述步骤17和步骤18,进一步地,对于步骤15,还可以按照下述公式3确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs*β   公式3
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
一种较佳地实现方式,本发明实施例提出的技术方案中,SD的取值为2秒,α的取值在0~1之间。β的取值在0~1之间。
本发明实施例上述提出的技术方案中,在步骤11~步骤15的基础上,引入步骤17~步骤18的技术方案,也就是说,在确定语音延时的时候,综合考虑网络传输速率、场景因子、以及识别错误率的因素,进一步提高确定语音端点的准确性。
相应地,本发明实施例还提出一种语音端点检测装置,其结构组成具体如图2所示,包括:
语音确定模块201,用于确定是否有语音输入。
网络传输速率确定模块202,用于在确定出有语音输入时,确定当前的网络传输速率。
具体地,上述网络传输速率确定模块202,具体用于按照下述公式确定当前的网络传输速率:
V = 1 - P c T VA * R c
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
语音延时确定模块203,用于根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时。
具体地,上述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
端点确定模块204,用于根据确定出的语音延时,得到语音输入的终止点。
可选地,上述装置还包括:
识别错误率确定模块,用于确定语音输入过程中,在确定出有和语音输入的识别错误率反馈的信息时,确定所述识别错误率;以及在确定出没有和语音输入的识别错误率反馈的信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。可选地,上述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs
其中,其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
本发明实施例上述提出的技术方案中,针对语音应用中语音端点检测问题,不能兼顾识别准确率及网络传输的问题,提出了将网络传输速率、识别错误率、背景音和活动语音功率比值,纳入语音端点检测方法中,对原有语音端点检测方法进行改进,以实现和提高语音端点检测准确度、降低网络传输要求、提高识别准确度。进而提高业务质量,提升用户体验。本申请所提出的方法和系统在现有应用中能够实现平滑升级,系统改进成本低,能够大大促进相关业务发展,增加业务营收。
本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音端点检测方法,其特征在于,包括:
在确定出有语音输入时,确定当前的网络传输速率;
根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;
根据确定出的语音延时,得到语音输入的终止点。
2.如权利要求1所述的方法,其特征在于,按照下述公式确定当前的网络传输速率:
V = 1 - P c T VA * R c
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
3.如权利要求1或2所述的方法,其特征在于,按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
4.如权利要求1或2所述的方法,其特征在于,在确定出当前的网络传输速率之后,确定用于表征语音输入的时长的语音延时之前,还包括:
确定语音输入过程中,在确定出有和语音输入的识别错误率反馈信息时,确定所述识别错误率;以及
在确定出没有和语音输入的识别错误率反馈信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
5.如权利要求4所述的方法,其特征在于,按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs
其中,其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
6.一种语音端点检测装置,其特征在于,包括:
语音确定模块,用于确定是否有语音输入;
网络传输速率确定模块,用于在确定出有语音输入时,确定当前的网络传输速率;
语音延时确定模块,用于根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;
端点确定模块,用于根据确定出的语音延时,得到语音输入的终止点。
7.如权利要求6所述的装置,其特征在于,所述网络传输速率确定模块,具体用于按照下述公式确定当前的网络传输速率:
V = 1 - P c T VA * R c
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA,是语音输入的时长,Rc语音输入输入过程中,输入的语音的编码速率。
8.如权利要求6或7所述的装置,其特征在于,所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
9.如权利要求6或7所述的装置,其特征在于,还包括:
识别错误率确定模块,用于确定语音输入过程中,在确定出有和语音输入的识别错误率反馈信息时,确定所述识别错误率;以及在确定出没有和语音输入的识别错误率反馈信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
10.如权利要求9所述的装置,其特征在于,所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs
其中,其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
CN201310656959.6A 2013-12-06 2013-12-06 一种语音端点检测方法及装置 Active CN104700830B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310656959.6A CN104700830B (zh) 2013-12-06 2013-12-06 一种语音端点检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310656959.6A CN104700830B (zh) 2013-12-06 2013-12-06 一种语音端点检测方法及装置

Publications (2)

Publication Number Publication Date
CN104700830A true CN104700830A (zh) 2015-06-10
CN104700830B CN104700830B (zh) 2018-07-24

Family

ID=53347889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310656959.6A Active CN104700830B (zh) 2013-12-06 2013-12-06 一种语音端点检测方法及装置

Country Status (1)

Country Link
CN (1) CN104700830B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107068147A (zh) * 2015-10-19 2017-08-18 谷歌公司 语音端点确定
CN108470571A (zh) * 2018-03-08 2018-08-31 腾讯音乐娱乐科技(深圳)有限公司 一种音频检测方法、装置及存储介质
CN109119070A (zh) * 2018-10-19 2019-01-01 科大讯飞股份有限公司 一种语音端点检测方法、装置、设备及存储介质
CN110415710A (zh) * 2019-08-06 2019-11-05 大众问问(北京)信息科技有限公司 车载语音交互系统的参数调整方法、装置、设备及介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101722A1 (en) * 2001-06-12 2002-12-19 Globespan Virata Incorporated Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20050055201A1 (en) * 2003-09-10 2005-03-10 Microsoft Corporation, Corporation In The State Of Washington System and method for real-time detection and preservation of speech onset in a signal
US20050216261A1 (en) * 2004-03-26 2005-09-29 Canon Kabushiki Kaisha Signal processing apparatus and method
CN101206858A (zh) * 2007-12-12 2008-06-25 北京中星微电子有限公司 一种孤立词语音端点检测的方法及系统
CN101572090A (zh) * 2008-04-30 2009-11-04 向为 一种自适应多速率窄带编码方法及编码器
CN101820310A (zh) * 2010-02-08 2010-09-01 北京邮电大学 基于端点检测的无线音频传感器网络音频媒体的同步方法
CN101834964A (zh) * 2010-03-31 2010-09-15 耿直 语音数据传输处理方法及语音数据传输处理器
JP2010286677A (ja) * 2009-06-11 2010-12-24 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム
CN201750475U (zh) * 2010-03-31 2011-02-16 耿直 语音数据传输处理器
CN103109285A (zh) * 2010-08-31 2013-05-15 佳能株式会社 用于自动调节从发送器通过并行连接到接收器的大量数据传送的机制
CN103366739A (zh) * 2012-03-28 2013-10-23 郑州市科学技术情报研究所 面向孤立词语音识别的自适应端点检测方法及其系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101722A1 (en) * 2001-06-12 2002-12-19 Globespan Virata Incorporated Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20050055201A1 (en) * 2003-09-10 2005-03-10 Microsoft Corporation, Corporation In The State Of Washington System and method for real-time detection and preservation of speech onset in a signal
US20050216261A1 (en) * 2004-03-26 2005-09-29 Canon Kabushiki Kaisha Signal processing apparatus and method
CN101206858A (zh) * 2007-12-12 2008-06-25 北京中星微电子有限公司 一种孤立词语音端点检测的方法及系统
CN101572090A (zh) * 2008-04-30 2009-11-04 向为 一种自适应多速率窄带编码方法及编码器
JP2010286677A (ja) * 2009-06-11 2010-12-24 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム
CN101820310A (zh) * 2010-02-08 2010-09-01 北京邮电大学 基于端点检测的无线音频传感器网络音频媒体的同步方法
CN101834964A (zh) * 2010-03-31 2010-09-15 耿直 语音数据传输处理方法及语音数据传输处理器
CN201750475U (zh) * 2010-03-31 2011-02-16 耿直 语音数据传输处理器
CN103109285A (zh) * 2010-08-31 2013-05-15 佳能株式会社 用于自动调节从发送器通过并行连接到接收器的大量数据传送的机制
CN103366739A (zh) * 2012-03-28 2013-10-23 郑州市科学技术情报研究所 面向孤立词语音识别的自适应端点检测方法及其系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107068147A (zh) * 2015-10-19 2017-08-18 谷歌公司 语音端点确定
CN108470571A (zh) * 2018-03-08 2018-08-31 腾讯音乐娱乐科技(深圳)有限公司 一种音频检测方法、装置及存储介质
CN108470571B (zh) * 2018-03-08 2020-09-08 腾讯音乐娱乐科技(深圳)有限公司 一种音频检测方法、装置及存储介质
CN109119070A (zh) * 2018-10-19 2019-01-01 科大讯飞股份有限公司 一种语音端点检测方法、装置、设备及存储介质
CN110415710A (zh) * 2019-08-06 2019-11-05 大众问问(北京)信息科技有限公司 车载语音交互系统的参数调整方法、装置、设备及介质
CN110415710B (zh) * 2019-08-06 2022-05-31 大众问问(北京)信息科技有限公司 车载语音交互系统的参数调整方法、装置、设备及介质

Also Published As

Publication number Publication date
CN104700830B (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN111526312B (zh) 屏幕录像的录制、播放方法、录屏终端及播放终端
JP6025821B2 (ja) 推定されたQoEをアプリケーションごとに端末上に出力する方法
CN110417641B (zh) 一种发送会话消息的方法与设备
CN107610695A (zh) 驾驶人语音唤醒指令词权重的动态调整方法
CN107256707B (zh) 一种语音识别方法、系统及终端设备
CN104461238B (zh) 一种应用图标处理方法及终端
KR101820291B1 (ko) 차량용 음성 인식 제어 장치 및 그 방법
CN105323529A (zh) 一种音频通话与视频通话之间的切换方法和电子设备
CN104700830A (zh) 一种语音端点检测方法及装置
US10238333B2 (en) Daily cognitive monitoring of early signs of hearing loss
CN105262878B (zh) 通话自动录音的处理方法及移动终端
CN103973547A (zh) 图片显示方法和装置
CN110311858B (zh) 一种发送会话消息的方法与设备
WO2014177023A1 (zh) 业务类型确定方法和装置
CN104580721A (zh) 一种终端闹钟实现方法
CN107872555A (zh) 通话录音方法、装置、终端设备及计算机可读存储介质
CN110290280A (zh) 一种终端状态的识别方法、装置及存储介质
CN105022687A (zh) 自动化测试方案中滑动操作的实现方法及装置
KR101584887B1 (ko) 통신 단말기에서 음성 인식 서비스의 멀티태스킹을 지원하는 방법 및 시스템
CN113672748A (zh) 多媒体信息播放方法及装置
CN106777099A (zh) 业务语音数据的处理方法、装置及终端设备
JP2022091933A (ja) 音声応答速度確定方法、装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
CN108881766A (zh) 视频处理方法、装置、终端和存储介质
WO2021184732A1 (zh) 基于神经网络的音频丢包修复方法、设备和系统
CN100440819C (zh) 基于通话模型的网络语音通话测试流量生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant