CN101116304A - 在语音识别系统中传送语音结束标记的方法 - Google Patents
在语音识别系统中传送语音结束标记的方法 Download PDFInfo
- Publication number
- CN101116304A CN101116304A CNA2005800477931A CN200580047793A CN101116304A CN 101116304 A CN101116304 A CN 101116304A CN A2005800477931 A CNA2005800477931 A CN A2005800477931A CN 200580047793 A CN200580047793 A CN 200580047793A CN 101116304 A CN101116304 A CN 101116304A
- Authority
- CN
- China
- Prior art keywords
- speech
- marks
- voice segment
- speech marks
- duration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000012790 confirmation Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 230000011218 segmentation Effects 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Mobile Radio Communication Systems (AREA)
- Time-Division Multiplex Systems (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
本发明涉及一种在以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法,在其中传送语音分段(30、40),无声时间段(34)随后,每个语音分段(30、40)以语音结束标记(31、41)终止。根据本发明,在所述的语音分段(30)之后的无声时间段(34)持续时间内连续地(31a、31b、31c、31d)重传语音结束标记(31)。本发明适合于分布式语音识别。
Description
技术领域
本发明涉及一种在以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法。
本发明发现在语音识别的一般领域中存在特别有利的应用。
更具体地,本发明的背景是如在ETSI标准ES 201 108、ES 202 212和IETF文件RFC 3557中定义的分布式语音识别(DSR)。
背景技术
作为一般规则,语音识别方法涉及从由说话者所说的语音分段中提取声学参数的第一阶段,其中该说话者能够是终端(尤其移动电话)的用户。在第二阶段中,由专用语音识别系统处理所获得的声学参数以恢复所说的语音分段的语音内容。既然已经恢复,然后合并该语音识别系统的服务器能够对该说话者所说的做出反应。例如,该服务器是在移动电话系统中的话音服务器。
分布式语音识别(DSR)在该终端本身实现语音识别的第一阶段,即提取声学参数,并且仅向该服务器传送该结果。当选择这些参数来优化语音识别性能时,在等价于用于在人类间会话的标准编码器/解码器(编解码器)的比特率处获得在语音识别中的明确改进。
上面提及的文件RFC 3557描述传送作为文件RFC 3550的实时协议(RTP)的有效负荷的声学参数。在文件RFC 3557中提出的DSR的一个版本涉及不连续传送(DTX),其中该终端非连续地仅在语音分段期间向该服务器发送数据。为此,当该用户按“按键讲话”装置的按键或在话音激活检测器(VAD)的控制下时才发送数据。不连续传送的好处无疑是其节约在无声时间段期间的带宽。
当然,如果使用DTX模式,则对于该话音服务器有必要知道该语音分段何时结束,例如,为了能够向该语音识别系统指示已经接收所有声学参数数据并且其可以立刻实现该识别操作以及完成其结果。文件RFC 3557为此目的提出包含空帧和充当语音结束标记的特殊数据分组。
DTX模式的缺点是:如果在数据传送期间空帧的分组在网络中丢失,则该服务器不再被告知该语音结束分段,并且无法向该语音识别系统给出任何执行指令。作为结果,该服务器无法响应该用户所说的,以及该用户于是遭受长且不可接受的等待时间段。
为补救该缺点,已经提出如果到给定的时间周期结束前没有接收语音结束分段则导致该服务器起反应的超时机制。但是,这种盲目型的机制不可避免地慢,因为在正常会话中其与间或长时延的语音分段相关联。
发明内容
因此由本发明的主题解决的技术问题是提出一种在以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法,在其中发送由无声时间段跟随的语音分段,每个语音分段以语音结束标记终止,当面临传送丢失时,此方法应当使由语音结束标记组成的信令信道比超时机制更加鲁棒(robust),由此保证时延仅与网络条件关联并且在不可避免地长的超时时间段中不被任意设置。
本发明对所述技术问题的解决方案是贯穿跟随所述语音分段的无声时间段内连续地重传所述语音结束标记。
因此即便在语音分段的末端处发生传送丢失,导致在截尾分段中包含的语音结束标记丢失,一旦网络再次运行分段结束信息就仍然能够被传达至该服务器,因为然后该服务器能够接收在传送恢复后马上重传的语音结束标记。因此当被通知分段结束时该服务器能够非常有效地响应,或者指示该识别操作的执行或者拒绝由于线路损失被截尾的分段。
该语音结束标记的重传时间,即在两个连续的重传标记之间的时间段的持续时间,必须允许以下折衷:
●如果其太慢,该用户可以察觉长的等待时间,即如以上提及的超时机制相同的缺点;
●如果其太快,在无声时间段期间消耗的带宽能够达到语音时间段的带宽,由此抵消不连续传送DTX模式的好处。而且,由于该用户的时间限度和分组丢失的时间相关性,借此重传两个太接近的语音结束标记具有在相同时间被丢失的极大可能,故该速度可能会没有用。
可能有两种选择:在第一种选择中,在相同持续时间的时间间隔中重传所述语音结束标记,而在第二种选择中在持续时间增加的时间间隔中重传所述语音结束标记。该第二种选择依照带宽是有利的,但是具有重新引入长等待时间的风险。
根据本发明,满意的折衷是所述的持续时间将达到一秒的数量级。
在本发明的一个特定实施例中,当接收确认重传的语音结束标记的消息时,中断所述语音结束标记的重传。
此特征具有节约带宽的优点且因此优选于可用带宽受限制的条件。否则,即便第一个语音结束标记到达该服务器而消耗的带宽被认为可容忍,尽管然后重传额外的语音结束标记是无用的,从该服务器的确认也是没必要的。
为了进一步限制带宽消耗,本发明提供将以小于在所述语音分段中的帧对的额定长度的分组的长度传送该语音结束标记。
最后,必须强调本发明的另一个优点,在发生高传送损失的情况下尤其重要的一个。如果在网络中存在相当大的干扰和噪声,则可能发生语音分段的全部丢失。例如,如果在跟随该丢失的分段的无声时间段期间恢复传送,则由于依照本发明的语音结束标记的连续传送,该话音服务器仍然能够接收语音结束标记。传输这些标记的分组通常包含考虑的分段的语音结束标记的日子的指示时间,从而通过比较最后两个相继接收的语音结束标记的日子的时间,该服务器能够检测该语音分段的丢失并且相应的对用户响应,例如要求该用户重复该消息。
本发明也涉及一种用于以不连续模式工作的分布式语音识别的系统,其包括适合于发送由无声时间段跟随的语音分段,利用语音结束标记终止每个语音分段的终端,此系统值得注意的是使所述终端在跟随所述语音分段的无声时间段的持续时间内连续地重传所述语音结束标记。
本发明的系统此外值得注意的是其也包含适合于发送确认重传的语音结束标记的消息的话音服务器。
附图说明
参考附图的以下描述解释本发明的组成以及其如何能够变为实际,其中附图作为非限制示例提供。
图1a是展示在使用本发明的方法的终端中实现的操作的图。
图1b是展示在与图1a的终端相关联的话音识别服务器中实现的操作的图。
具体实施方式
图1a展示在分布式语音识别系统的一般背景中在例如移动电话的终端中实现的各种连续的操作,在该系统中必须通过在图1b中示出的话音服务器鉴别由用户向终端所说的消息。
根据图1a,依照该分布式语音识别(DSR)程序在该终端自身中处理由该用户发送的话音消息。因此该处理在终端的单元20中实现,该单元20包括用于从话音信号10中提取为该服务器的话音识别系统所需的、重建由该用户所说的消息的声学参数。用于提取声学参数的方法是众所周知的且在本发明的范围之外。可以参考相应的ETSI标准ES 201 108、ES 202 050、ES 202212。
如图1a指出,为了将向服务器的数据发送限制到仅为语音分段,通过由处理器单元20的模块22使用不连续传送(DTX)模式补充提取声学参数的操作。为此,模块22从指示器23接收语音开始信号。所述指示器23能够是用户在开始说话时按下按键的“按键讲话”装置或话音激活检测器(VAD)。
因此由该终端的处理器单元20提供的信号由语音分段30、40构成,其包含在它们的有效负荷中传输由模块21提取的声学参数的分组。每个语音分段以语音结束标记31、41终止。由无声时间段34分开两个连续的语音分段30和40。
从图1a能够看出,贯穿跟随所述分段的无声时间段34的持续时间内连续地重传与分段30相关联的语音标记31。重传的语音结束标记被表示为31a、31b等。
这样的好处在展示话音服务器的语音识别系统50的图1b中变得清楚。
经过网络传送包含该用户的声学参数的信号到系统50,其从在语音分段30、40中接收的数据中重建由该用户所说的话音消息。语音结束标记31向系统50指出分段30的末端已经到达从而其可以立刻为该分段实现该识别操作。
如果在时间段T中中断经过该网络的传送,如在图1b中指出的,由此截去分段30的尾部,以及例如语音结束标记31和31a,在传送恢复后将马上通过系统50检测到标记31b。然后能较早地实现该识别操作,其中所引入的时延取决于网络丢失的持续时间的量级,由此肯定比经常使用的超时机制取得的要短。
在图1a和1b中,在相同的持续时间Δt的时间间隔(例如达到一秒的量级(the order of one second))内重传所述语音结束标记31。但是,可以同等地设想,使在两个连续的重传之间的时间间隔的持续时间增加,例如按1.5或2的因子。
如上面已经指出的,当由该终端接收确认语音结束标记被服务器接收的消息时能够中断语音结束标记31、31a等的发送。因此,在图1a和1b的例子中,在接收标记31b后,该服务器能够向终端发送确认接收该标记的消息。被告知这个,该终端能够中断新语音结束标记31c、31d等的发送,现在它们是没用的。
最后,能够通过将传输语音结束标记31a、31b等的分组限制为必要的最小值而节省带宽,从而其长度显著地小于在语音分段中的帧对的额定长度。
Claims (9)
1.一种在适合于以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法,在其中传送由无声时间段(34)跟随的语音分段(30、40)以及每个语音分段(30、40)以语音结束标记(31、41)终止,其特征在于在跟随所述语音分段(30)的无声时间段(34)的持续时间内连续地(31a、31b、31c、31d)重传所述语音结束标记(31)。
2.如权利要求1所述的方法,其特征在于在相同的持续时间(Δt)的时间间隔内重传所述语音结束标记(31)。
3.如权利要求1所述的方法,其特征在于在递增的持续时间(Δt)的时间间隔内重传所述语音结束标记(31)。
4.如权利要求2或3所述的方法,其特征在于所述持续时间(Δt)达到一秒的量级。
5.如权利要求1到4中任何一个所述的方法,其特征在于当接收确认重传的语音结束标记(31b)的消息时中断所述语音结束标记(31)的重传。
6.如权利要求1到5中任何一个所述的方法,其特征在于在比在所述语音分段(30、40)中的帧对的额定长度短的分组中传送该语音结束标记(31a、31b、31c、31d)。
7.一种适合于以不连续模式工作且包括终端的分布式语音识别系统,其中该终端适合于发送由无声时间段(34)跟随的语音分段(30、40),每个语音分段(30、40)以语音结束标记(31)终止,其特征在于使所述终端适合于在跟随所述语音分段(30)的无声时间段(34)的持续时间内连续地(31a、31b、31c、31d)重传所述语音结束标记(31)。
8.如权利要求7所述的系统,其特征在于其进一步包括适合于发送确认重传的语音结束标记(31b)的消息的话音服务器。
9.一种适合于以不连续传送模式工作的分布式语音识别系统的终端,所述终端适合于发送由无声时间段(34)跟随的语音分段(30、40),每个语音分段(30、40)以语音结束标记(31)终止,其特征在于使所述终端适合于在跟随所述语音分段(30)的无声时间段(34)的持续时间内连续地(31a、31b、31c、31d)重传所述语音结束标记(31)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0550322A FR2881867A1 (fr) | 2005-02-04 | 2005-02-04 | Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole |
FR0550322 | 2005-02-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101116304A true CN101116304A (zh) | 2008-01-30 |
Family
ID=34954042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800477931A Pending CN101116304A (zh) | 2005-02-04 | 2005-12-28 | 在语音识别系统中传送语音结束标记的方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20080120104A1 (zh) |
EP (1) | EP1847088B1 (zh) |
JP (1) | JP2008529096A (zh) |
KR (1) | KR20070099678A (zh) |
CN (1) | CN101116304A (zh) |
AT (1) | ATE415773T1 (zh) |
DE (1) | DE602005011340D1 (zh) |
ES (1) | ES2318589T3 (zh) |
FR (1) | FR2881867A1 (zh) |
WO (1) | WO2006082288A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
CN112735422A (zh) * | 2015-09-03 | 2021-04-30 | 谷歌有限责任公司 | 增强型语音端点确定 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008158328A (ja) * | 2006-12-25 | 2008-07-10 | Ntt Docomo Inc | 端末装置及び判別方法 |
CN106710606B (zh) * | 2016-12-29 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音处理方法及装置 |
US10069976B1 (en) * | 2017-06-13 | 2018-09-04 | Harman International Industries, Incorporated | Voice agent forwarding |
TWI672690B (zh) * | 2018-03-21 | 2019-09-21 | 塞席爾商元鼎音訊股份有限公司 | 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES201108A1 (es) | 1950-12-23 | 1952-02-16 | Simmersbach Edmund | UN PROCEDIMIENTO DE OBTENCIoN DE SUSTANCIAS ACTIVAS ACUOSOLUBLES DE UTILIDAD TERAPÉUTICA |
ES202050A3 (es) | 1952-02-20 | 1952-03-16 | Ind Gama Sl | Perfeccionamientos introducidos en los pupitres escolares. |
ES202212Y (es) | 1974-04-11 | 1976-02-16 | Falgas Cardona | Maquina recreativa para medir la fuerza. |
US4032711A (en) * | 1975-12-31 | 1977-06-28 | Bell Telephone Laboratories, Incorporated | Speaker recognition arrangement |
US4092493A (en) * | 1976-11-30 | 1978-05-30 | Bell Telephone Laboratories, Incorporated | Speech recognition system |
JPS57136700A (en) * | 1981-02-18 | 1982-08-23 | Nippon Electric Co | Voice recognizer with control tone detection |
US4868879A (en) * | 1984-03-27 | 1989-09-19 | Oki Electric Industry Co., Ltd. | Apparatus and method for recognizing speech |
US4829578A (en) * | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
US5299198A (en) * | 1990-12-06 | 1994-03-29 | Hughes Aircraft Company | Method and apparatus for exploitation of voice inactivity to increase the capacity of a time division multiple access radio communications system |
US5623609A (en) * | 1993-06-14 | 1997-04-22 | Hal Trust, L.L.C. | Computer system and computer-implemented process for phonology-based automatic speech recognition |
JPH0730982A (ja) * | 1993-07-14 | 1995-01-31 | Sanyo Electric Co Ltd | リモートコントロール装置 |
JP3182032B2 (ja) * | 1993-12-10 | 2001-07-03 | 株式会社日立国際電気 | 音声符号化通信方式及びその装置 |
FI101439B (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
US5754537A (en) * | 1996-03-08 | 1998-05-19 | Telefonaktiebolaget L M Ericsson (Publ) | Method and system for transmitting background noise data |
US5799065A (en) * | 1996-05-06 | 1998-08-25 | Matsushita Electric Industrial Co., Ltd. | Call routing device employing continuous speech |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US5960399A (en) * | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
US5825855A (en) * | 1997-01-30 | 1998-10-20 | Toshiba America Information Systems, Inc. | Method of recognizing pre-recorded announcements |
US5933475A (en) * | 1997-06-04 | 1999-08-03 | Interactive Quality Services, Inc. | System and method for testing a telecommunications apparatus |
WO1999013608A2 (en) * | 1997-09-10 | 1999-03-18 | Koninklijke Philips Electronics N.V. | A communication system and a terminal having speech encoding and decoding means |
US20010014857A1 (en) * | 1998-08-14 | 2001-08-16 | Zifei Peter Wang | A voice activity detector for packet voice network |
JP3720595B2 (ja) * | 1998-09-17 | 2005-11-30 | キヤノン株式会社 | 音声認識装置及びその方法、コンピュータ可読メモリ |
US6711536B2 (en) * | 1998-10-20 | 2004-03-23 | Canon Kabushiki Kaisha | Speech processing apparatus and method |
US7124079B1 (en) * | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
WO2000058949A1 (en) * | 1999-03-25 | 2000-10-05 | Kent Ridge Digital Labs | Low data transmission rate and intelligible speech communication |
US6671292B1 (en) * | 1999-06-25 | 2003-12-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and system for adaptive voice buffering |
US6574213B1 (en) * | 1999-08-10 | 2003-06-03 | Texas Instruments Incorporated | Wireless base station systems for packet communications |
US6728671B1 (en) * | 2000-03-29 | 2004-04-27 | Lucent Technologies Inc. | Automatic speech recognition caller input rate control |
EP1150462B1 (en) * | 2000-04-28 | 2003-05-28 | Alcatel | Method, mobile terminal and base station for assigning resources in a shared channel |
US6785653B1 (en) * | 2000-05-01 | 2004-08-31 | Nuance Communications | Distributed voice web architecture and associated components and methods |
EP1667383B1 (en) * | 2000-05-17 | 2008-07-16 | Symstream Technology Holdings No. 2 PTY LTD | Method and apparatus for transmitting a data communication in voice frames with the use of an Octave Pulse Data encoder/decoder |
US6934756B2 (en) * | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US6757384B1 (en) * | 2000-11-28 | 2004-06-29 | Lucent Technologies Inc. | Robust double-talk detection and recovery in a system for echo cancelation |
US7941313B2 (en) * | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US20030046711A1 (en) * | 2001-06-15 | 2003-03-06 | Chenglin Cui | Formatting a file for encoded frames and the formatter |
DE60204827T2 (de) * | 2001-08-08 | 2006-04-27 | Nippon Telegraph And Telephone Corp. | Anhebungsdetektion zur automatischen Sprachzusammenfassung |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
US7139704B2 (en) * | 2001-11-30 | 2006-11-21 | Intel Corporation | Method and apparatus to perform speech recognition over a voice channel |
GB2396271B (en) * | 2002-12-10 | 2005-08-10 | Motorola Inc | A user terminal and method for voice communication |
US20040121812A1 (en) * | 2002-12-20 | 2004-06-24 | Doran Patrick J. | Method of performing speech recognition in a mobile title line communication device |
US7412376B2 (en) * | 2003-09-10 | 2008-08-12 | Microsoft Corporation | System and method for real-time detection and preservation of speech onset in a signal |
KR20050059766A (ko) * | 2003-12-15 | 2005-06-21 | 엘지전자 주식회사 | 동적 시간 워핑을 이용한 음성 인식 방법 |
US20050209858A1 (en) * | 2004-03-16 | 2005-09-22 | Robert Zak | Apparatus and method for voice activated communication |
JP4483428B2 (ja) * | 2004-06-25 | 2010-06-16 | 日本電気株式会社 | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
US20060122837A1 (en) * | 2004-12-08 | 2006-06-08 | Electronics And Telecommunications Research Institute | Voice interface system and speech recognition method |
US8170875B2 (en) * | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
-
2005
- 2005-02-04 FR FR0550322A patent/FR2881867A1/fr active Pending
- 2005-12-28 KR KR1020077019934A patent/KR20070099678A/ko not_active Application Discontinuation
- 2005-12-28 AT AT05850633T patent/ATE415773T1/de not_active IP Right Cessation
- 2005-12-28 US US11/883,970 patent/US20080120104A1/en not_active Abandoned
- 2005-12-28 EP EP05850633A patent/EP1847088B1/fr not_active Not-in-force
- 2005-12-28 JP JP2007553636A patent/JP2008529096A/ja not_active Ceased
- 2005-12-28 CN CNA2005800477931A patent/CN101116304A/zh active Pending
- 2005-12-28 DE DE602005011340T patent/DE602005011340D1/de active Active
- 2005-12-28 ES ES05850633T patent/ES2318589T3/es active Active
- 2005-12-28 WO PCT/FR2005/003309 patent/WO2006082288A1/fr active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112735422A (zh) * | 2015-09-03 | 2021-04-30 | 谷歌有限责任公司 | 增强型语音端点确定 |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20070099678A (ko) | 2007-10-09 |
ES2318589T3 (es) | 2009-05-01 |
DE602005011340D1 (de) | 2009-01-08 |
JP2008529096A (ja) | 2008-07-31 |
FR2881867A1 (fr) | 2006-08-11 |
WO2006082288A1 (fr) | 2006-08-10 |
ATE415773T1 (de) | 2008-12-15 |
US20080120104A1 (en) | 2008-05-22 |
EP1847088B1 (fr) | 2008-11-26 |
EP1847088A1 (fr) | 2007-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1053608B1 (en) | Device and method for communicating packet voice data in mobile communication system | |
CN101305417B (zh) | 移动电信网络中的方法和装置 | |
CN1943189B (zh) | 增加通信系统中所感知交互性的方法及设备 | |
CN101116304A (zh) | 在语音识别系统中传送语音结束标记的方法 | |
BRPI0514566A (pt) | sistema e método para otimizar transmissão de dados de áudio e de vìdeo em um sistema sem fio | |
CN103841002A (zh) | 语音传输方法、终端、语音服务器及语音传输系统 | |
WO2008030292A3 (en) | System and method for adjusting codec speed in a transmission path during call set-up | |
WO2007117626A3 (en) | Hosted voice recognition system for wireless devices | |
CN104917671A (zh) | 基于移动终端的音频处理方法和装置 | |
CN100502571C (zh) | 通信方法及系统 | |
CN102025963B (zh) | 一种视频电话通话控制方法及其装置 | |
WO2004100586A3 (en) | System and method of wireless device activity messaging | |
WO2007001964A3 (en) | Method and apparatus for providing reliable communications over an unreliable communications channel | |
WO2008043002A3 (en) | Method and system for optimizing a jitter buffer | |
RU2004130051A (ru) | Последовательный мультимодальный ввод | |
EP2566128A1 (en) | Method, device and system for obtaining key information during fast channel switching | |
CN101790754B (zh) | 用于提供amr-wb dtx同步的系统和方法 | |
JP2010512105A (ja) | 効率的なメディアの扱いのための受信機の動作及び実装 | |
EP1406424A3 (en) | Terminal device, method for processing communication data inside the terminal device, and program for implementing the method | |
US6446042B1 (en) | Method and apparatus for encoding speech in a communications network | |
WO2005074462A3 (en) | Voice over internet protocol (voip) telephone apparatus and communication systems for carrying voip traffic | |
US6961424B1 (en) | Protected mechanism for DTMF relay | |
CN101426189B (zh) | 一种传输附加信息的方法及系统 | |
CN107046673B (zh) | 无线呼叫的方法和系统 | |
JPH10242946A (ja) | データフレーム伝送方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20080130 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |