KR20040028784A - 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치 - Google Patents
분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치 Download PDFInfo
- Publication number
- KR20040028784A KR20040028784A KR10-2003-7016365A KR20037016365A KR20040028784A KR 20040028784 A KR20040028784 A KR 20040028784A KR 20037016365 A KR20037016365 A KR 20037016365A KR 20040028784 A KR20040028784 A KR 20040028784A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- speech
- activity
- feature
- module
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Abstract
Description
Claims (32)
- 음성 신호와 관련하여 검출된 음성 활성 정보를 원격 장치에 제공하는 방법으로서,상기 음성 신호와 관련하여 검출된 음성 활성 정보를 어셈블링하는 단계;상기 음성 신호에 관련하여 특징 추출 정보를 식별하는 단계;상기 검출된 음성 활성 정보와 상기 특징 추출 정보를 선택적으로 이용하여 고수준 전단 데이터를 형성하는 단계; 및상기 검출된 음성 활성 정보를 구비하는 상기 고수준 전단 데이터를 상기 원격 장치에 제공하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 1 항에 있어서,상기 특징 추출 정보를 식별하는 단계는, 상기 음성 신호의 세그먼트들에 대응하는 한 세트의 특징들을 추출하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 1 항에 있어서,상기 어셈블링하는 단계, 식별하는 단계, 및 선택적으로 이용하는 단계는 가입자 장치에서 수행되는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 3 항에 있어서,상기 제공하는 단계는, 상기 가입자 장치가 침묵 세그먼트들을 제거하는 단계 및 침묵이 제거된 음성 세그먼트들을 상기 원격 장치에 제공하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 3 항에 있어서,상기 제공하는 단계는,상기 가입자 장치가 침묵을 포함하는 모든 음성을 상기 원격 장치에 송신하는 단계;상기 가입자 장치가 침묵 영역이 존재하는 곳에 대한 하나 이상의 지시자를 송신하는 단계; 및상기 원격 장치가 침묵으로부터 음성 세그먼트들을 분리하여 그 음성 세그먼트들을 이용하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 5 항에 있어서,상기 하나 이상의 지시자는 음성 송신 채널과는 별개의 채널을 통해 송신되는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 1 항에 있어서,상기 검출된 음성 활성 정보를 상기 특징 추출 식별과 실질적으로 병렬로 어셈블링하는 단계를 더 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 7 항에 있어서,상기 특징 추출 식별이 침묵 영역을 지시할 경우, 음성 검출 활성은 낮은 레이트에서 양자화되는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 7 항에 있어서,상기 검출된 음성 활성 정보를 어셈블링하는 단계는 음성 활성 벡터를 결정하는 단계를 포함하고,세그먼트를 추출하는 단계는 특징 벡터를 결정하는 단계를 포함하며,상기 방법은,상기 음성 활성 벡터와 상기 특징 벡터를 연관시켜 고수준 전단 특징들을 프로세싱하고 결정하는 단계를 더 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 1 항에 있어서,상기 특징 추출을 식별하는 단계는 특징 벡터를 결정하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 제 10 항에 있어서,상기 결정하는 단계는,음성 활성을 검출하고, 음성 활성의 검출시에, 누락된 프레임에 대응하는 평균 특징 벡터를 계산하는 단계; 및음성 프레임을 송신하기 전에, 누락된 프레임의 총 수를 송신하는 단계를 포함하는, 음성 활성 정보를 원격 장치에 제공하는 방법.
- 음성 활성 검출기;상기 음성 활성 검출기와 실질적으로 병렬로 동작하는 특징 추출기;송신기; 및수신 장치를 구비하고,상기 특징 추출기와 상기 음성 활성 검출기는 음성으로부터 특징을 추출하고 음성으로부터 음성 활성 정보를 검출하며 추출된 특징과 검출된 음성 활성 정보를 선택적으로 이용하여 고수준 전단 데이터를 형성하도록 동작하는, 음성 활성의 송신 장치
- 제 12 항에 있어서,상기 음성 활성 검출기, 상기 특징 추출기, 및 상기 송신기는 가입자 유닛상에 상주하는, 음성 활성의 송신 장치.
- 제 13 항에 있어서,상기 가입자 유닛은 침묵 세그먼트들을 제거하며 침묵이 제거된 음성 세그먼트들을 원격 장치에 제공하는, 음성 활성의 송신 장치.
- 제 13 항에 있어서,상기 가입자 장치는 침묵을 포함하는 모든 음성을 상기 원격 장치에 송신하고,상기 가입자 장치는 하나 이상의 침묵 영역에 대한 하나 이상의 지시자를 송신하며,상기 원격 장치는 침묵으로부터 음성 세그먼트들을 분리하여 그 음성 세그먼트들을 이용하는, 음성 활성의 송신 장치.
- 제 15 항에 있어서,상기 하나 이상의 지시자는 상기 송신기에 의해 음성 송신 채널과는 별개의 채널을 통해 송신되는, 음성 활성의 송신 장치.
- 제 12 항에 있어서,특징 추출이 침묵 영역을 지시할 경우, 상기 장치는, 상기 음성 검출기로부터의 음성 검출 활성을 낮은 레이트에서 양자화하는, 음성 활성의 송신 장치.
- 제 12 항에 있어서,상기 음성 활성 검출기는 음성 활성 벡터를 결정하고,상기 특징 추출기는 특징 벡터를 결정하는, 음성 활성의 송신 장치.
- 제 18 항에 있어서,상기 장치는 상기 음성 활성 벡터와 상기 특징 벡터를 연관시켜 고수준 전단 데이터를 프로세싱하고 결정하는, 음성 활성의 송신 장치.
- 제 12 항에 있어서,상기 특징 추출기는 특징 벡터를 결정하는, 음성 활성의 송신 장치.
- 제 20 항에 있어서,상기 장치는 음성 활성의 검출시에 누락된 프레임에 해당하는 특징 벡터의 평균을 계산하고, 음성 프레임을 송신하기 전에, 누락된 프레임의 총 수를 송신하는, 음성 활성의 송신 장치.
- 음성 데이터로부터 음성 활성 데이터를 추출하는 단계;상기 음성 데이터로부터 특징 추출 데이터를 식별하는 단계; 및상기 음성 활성 데이터에 관련되는 정보와 상기 특징 추출 데이터를, 고수준 전단 데이터의 형태로 원격 장치에 선택적으로 송신하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 22 항에 있어서,상기 특징 추출 데이터를 식별하는 단계는 상기 음성 신호의 세그먼트들에 대응하는 한 세트의 특징들을 추출하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 22 항에 있어서,상기 추출하는 단계 및 상기 식별하는 단계는 가입자 장치에서 수행되는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 24 항에 있어서,상기 선택적으로 정보를 송신하는 단계는, 상기 가입자 장치가 침묵 세그먼트를 제거하는 단계 및 침묵이 제거된 음성 세그먼트를 상기 원격 장치에 제공하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 24 항에 있어서,상기 선택적으로 정보를 송신하는 단계는,상기 가입자 장치가 침묵을 포함하는 모든 음성을 상기 원격 장치에 송신하는 단계;상기 가입자 장치가 하나 이상의 침묵 영역이 존재하는 곳에 대한 하나 이상의 지시자를 송신하는 단계; 및상기 원격 장치가 침묵으로부터 음성 세그먼트들을 분리하여 그 음성 세그먼트들을 이용하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 26 항에 있어서,상기 하나 이상의 지시자는 음성 송신 채널과는 별개의 채널을 통해 송신되는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 22 항에 있어서,상기 특징 추출 데이터의 식별과 실질적으로 병렬로 음성 활성 데이터를 추출하는 단계를 더 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 28 항에 있어서,상기 추출하는 단계와 식별하는 단계가 침묵 영역을 지시할 경우, 음성 활성 데이터는 낮은 레이트에서 고수준 전단 데이터로 양자화되는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 28 항에 있어서,상기 음성 활성을 검출하는 단계는 음성 활성 벡터를 결정하는 단계를 포함하고,상기 특징을 추출하는 단계는 특징 벡터를 결정하는 단계를 포함하며,상기 방법은,상기 음성 활성 벡터와 상기 특징 벡터를 연관시켜 확장된 특징들을 프로세싱하고 결정하는 단계를 더 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 22 항에 있어서,특징 세그먼트를 추출하는 단계는 특징 벡터를 결정하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
- 제 31 항에 있어서,상기 결정하는 단계는,음성 활성을 검출하고, 음성 활성의 검출시에, 누락된 프레임에 대응하는 평균 특징 벡터를 계산하는 단계; 및음성 프레임을 송신하기 전에, 누락된 프레임의 총 수를 송신하는 단계를 포함하는, 음성 데이터를 원격 장치에 송신하는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29850201P | 2001-06-14 | 2001-06-14 | |
US60/298,502 | 2001-06-14 | ||
US10/157,629 US7203643B2 (en) | 2001-06-14 | 2002-05-28 | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
US10/157,629 | 2002-05-28 | ||
PCT/US2002/018964 WO2002103679A1 (en) | 2001-06-14 | 2002-06-13 | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040028784A true KR20040028784A (ko) | 2004-04-03 |
KR100923896B1 KR100923896B1 (ko) | 2009-10-28 |
Family
ID=26854323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037016365A KR100923896B1 (ko) | 2001-06-14 | 2002-06-13 | 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치 |
Country Status (8)
Country | Link |
---|---|
US (2) | US7203643B2 (ko) |
EP (1) | EP1428204A1 (ko) |
KR (1) | KR100923896B1 (ko) |
CN (1) | CN1543640A (ko) |
IL (1) | IL159277A0 (ko) |
MX (1) | MXPA03011559A (ko) |
TW (1) | TW561453B (ko) |
WO (1) | WO2002103679A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100791349B1 (ko) * | 2005-12-08 | 2008-01-07 | 한국전자통신연구원 | 분산 음성 인식 시스템에서 음성 신호의 코딩 방법 및 그장치 |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US20030004720A1 (en) * | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
US6885735B2 (en) * | 2001-03-29 | 2005-04-26 | Intellisist, Llc | System and method for transmitting voice input from a remote location over a wireless data channel |
US7941313B2 (en) * | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US7203643B2 (en) * | 2001-06-14 | 2007-04-10 | Qualcomm Incorporated | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
US7020257B2 (en) * | 2002-04-17 | 2006-03-28 | Texas Instruments Incorporated | Voice activity identiftication for speaker tracking in a packet based conferencing system with distributed processing |
US7089178B2 (en) * | 2002-04-30 | 2006-08-08 | Qualcomm Inc. | Multistream network feature processing for a distributed speech recognition system |
US20040024586A1 (en) * | 2002-07-31 | 2004-02-05 | Andersen David B. | Methods and apparatuses for capturing and wirelessly relaying voice information for speech recognition |
US7024353B2 (en) * | 2002-08-09 | 2006-04-04 | Motorola, Inc. | Distributed speech recognition with back-end voice activity detection apparatus and method |
JP4035113B2 (ja) * | 2004-03-11 | 2008-01-16 | リオン株式会社 | ボケ防止装置 |
US8874438B2 (en) * | 2004-03-12 | 2014-10-28 | Siemens Aktiengesellschaft | User and vocabulary-adaptive determination of confidence and rejecting thresholds |
US7620546B2 (en) * | 2004-03-23 | 2009-11-17 | Qnx Software Systems (Wavemakers), Inc. | Isolating speech signals utilizing neural networks |
US7925510B2 (en) * | 2004-04-28 | 2011-04-12 | Nuance Communications, Inc. | Componentized voice server with selectable internal and external speech detectors |
KR100640893B1 (ko) * | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기 |
JP2006148816A (ja) * | 2004-11-24 | 2006-06-08 | Nec Corp | 中継制御装置、多地点間会議システム及び多地点間会議方法 |
ATE409937T1 (de) | 2005-06-20 | 2008-10-15 | Telecom Italia Spa | Verfahren und vorrichtung zum senden von sprachdaten zu einer fernen einrichtung in einem verteilten spracherkennungssystem |
US7962340B2 (en) * | 2005-08-22 | 2011-06-14 | Nuance Communications, Inc. | Methods and apparatus for buffering data for use in accordance with a speech recognition system |
US9330668B2 (en) * | 2005-12-20 | 2016-05-03 | International Business Machines Corporation | Sharing voice application processing via markup |
US9331887B2 (en) * | 2006-03-29 | 2016-05-03 | Microsoft Technology Licensing, Llc | Peer-aware ranking of voice streams |
US7877255B2 (en) * | 2006-03-31 | 2011-01-25 | Voice Signal Technologies, Inc. | Speech recognition using channel verification |
US20080152157A1 (en) * | 2006-12-21 | 2008-06-26 | Vimicro Corporation | Method and system for eliminating noises in voice signals |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8219407B1 (en) * | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US10544677B2 (en) * | 2017-09-01 | 2020-01-28 | United Technologies Corporation | Turbine disk |
WO2010019831A1 (en) * | 2008-08-14 | 2010-02-18 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
US8606735B2 (en) * | 2009-04-30 | 2013-12-10 | Samsung Electronics Co., Ltd. | Apparatus and method for predicting user's intention based on multimodal information |
KR101581883B1 (ko) * | 2009-04-30 | 2016-01-11 | 삼성전자주식회사 | 모션 정보를 이용하는 음성 검출 장치 및 방법 |
US9002713B2 (en) | 2009-06-09 | 2015-04-07 | At&T Intellectual Property I, L.P. | System and method for speech personalization by need |
US20110166862A1 (en) * | 2010-01-04 | 2011-07-07 | Eyal Eshed | System and method for variable automated response to remote verbal input at a mobile device |
US8626498B2 (en) * | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
WO2011133924A1 (en) * | 2010-04-22 | 2011-10-27 | Qualcomm Incorporated | Voice activity detection |
US8762150B2 (en) * | 2010-09-16 | 2014-06-24 | Nuance Communications, Inc. | Using codec parameters for endpoint detection in speech recognition |
US8898058B2 (en) | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
US8639508B2 (en) * | 2011-02-14 | 2014-01-28 | General Motors Llc | User-specific confidence thresholds for speech recognition |
AU2013245215A1 (en) * | 2012-04-02 | 2014-11-20 | Dixilang Ltd. | A client-server architecture for automatic speech recognition applications |
CN104469255A (zh) | 2013-09-16 | 2015-03-25 | 杜比实验室特许公司 | 改进的音频或视频会议 |
US9886947B2 (en) * | 2013-02-25 | 2018-02-06 | Seiko Epson Corporation | Speech recognition device and method, and semiconductor integrated circuit device |
US9196262B2 (en) * | 2013-03-14 | 2015-11-24 | Qualcomm Incorporated | User sensing system and method for low power voice command activation in wireless communication systems |
EP2819013B1 (en) * | 2013-06-24 | 2019-11-27 | Alcatel Lucent | Automated adaption of a Codec |
US9280968B2 (en) | 2013-10-04 | 2016-03-08 | At&T Intellectual Property I, L.P. | System and method of using neural transforms of robust audio features for speech processing |
CN104700836B (zh) | 2013-12-10 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 一种语音识别方法和系统 |
CN107086043B (zh) | 2014-03-12 | 2020-09-08 | 华为技术有限公司 | 检测音频信号的方法和装置 |
US10360926B2 (en) * | 2014-07-10 | 2019-07-23 | Analog Devices Global Unlimited Company | Low-complexity voice activity detection |
JP6118838B2 (ja) * | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
US9467569B2 (en) | 2015-03-05 | 2016-10-11 | Raytheon Company | Methods and apparatus for reducing audio conference noise using voice quality measures |
CN105391873A (zh) * | 2015-11-25 | 2016-03-09 | 上海新储集成电路有限公司 | 一种在移动设备中实现本地语音识别的方法 |
CN106940998B (zh) * | 2015-12-31 | 2021-04-16 | 阿里巴巴集团控股有限公司 | 一种设定操作的执行方法及装置 |
US10235994B2 (en) * | 2016-03-04 | 2019-03-19 | Microsoft Technology Licensing, Llc | Modular deep learning model |
KR20190045038A (ko) | 2017-10-23 | 2019-05-02 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
US10636421B2 (en) * | 2017-12-27 | 2020-04-28 | Soundhound, Inc. | Parse prefix-detection in a human-machine interface |
US11488615B2 (en) * | 2018-05-21 | 2022-11-01 | International Business Machines Corporation | Real-time assessment of call quality |
US11222276B2 (en) | 2019-05-24 | 2022-01-11 | International Business Machines Corporation | Response collaboration among multiple artificial intelligence (AI) systems |
US11227224B2 (en) | 2019-05-24 | 2022-01-18 | International Business Machines Corporation | Information and data collaboration among multiple artificial intelligence (AI) systems |
WO2021102193A1 (en) * | 2019-11-19 | 2021-05-27 | Apptek, Llc | Method and apparatus for forced duration in neural speech synthesis |
KR20210062838A (ko) * | 2019-11-22 | 2021-06-01 | 엘지전자 주식회사 | 인공지능 기반의 음성처리 방법 |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0067721B1 (en) * | 1981-06-17 | 1989-04-26 | Hitachi, Ltd. | Heterojunction semiconductor device |
DE3370423D1 (en) | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
US4905234A (en) | 1987-06-03 | 1990-02-27 | General Electric Company | Apparatus and method for transmitting digital data over a radio communications channel |
FR2629295B1 (fr) | 1988-03-22 | 1994-04-15 | Thomson Csf | Dispositif pour l'etablissement et l'acheminement de communications telephoniques entre abonnes d'un reseau radio et/ou d'un reseau telephonique filaire |
US5633873A (en) | 1990-12-06 | 1997-05-27 | Hughes Electronics | Combined fixed and mobile radio communication system and method |
US5703881A (en) | 1990-12-06 | 1997-12-30 | Hughes Electronics | Multi-subscriber unit for radio communication system and method |
US5450522A (en) | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
JP3167385B2 (ja) | 1991-10-28 | 2001-05-21 | 日本電信電話株式会社 | 音声信号伝送方法 |
US6408180B1 (en) | 1992-03-06 | 2002-06-18 | Aircell, Inc. | Ubiquitous mobile subscriber station |
US6108539A (en) | 1992-03-06 | 2000-08-22 | Aircell, Incorporated | Non-terrestrial cellular mobile telecommunication station |
US5737358A (en) | 1992-03-11 | 1998-04-07 | Geotek Communications, Inc. | Multiplexed radio communication system |
IL103620A0 (en) | 1992-11-03 | 1993-04-04 | Rafael Armament Dev Authority | Spread-spectrum,frequency-hopping radiotelephone system |
FR2697101B1 (fr) | 1992-10-21 | 1994-11-25 | Sextant Avionique | Procédé de détection de la parole. |
JPH0736497A (ja) | 1993-07-20 | 1995-02-07 | Matsushita Electric Ind Co Ltd | 音声復号装置 |
CA2179194A1 (en) * | 1993-12-16 | 1995-06-29 | Andrew Wilson Howitt | System and method for performing voice compression |
ZA948426B (en) * | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
AU684872B2 (en) | 1994-03-10 | 1998-01-08 | Cable And Wireless Plc | Communication system |
US5642519A (en) | 1994-04-29 | 1997-06-24 | Sun Microsystems, Inc. | Speech interpreter with a unified grammer compiler |
IL111634A0 (en) | 1994-11-14 | 1995-01-24 | Mohr Asaf | Computerized telephone apparatus |
US5758256A (en) | 1995-06-07 | 1998-05-26 | Hughes Electronics Corporation | Method of transporting speech information in a wireless cellular system |
US6370135B1 (en) | 1995-06-07 | 2002-04-09 | Cirrus Logic, Inc. | Continuous CDPD base station and method of facilitating efficient data transfer |
US6334062B1 (en) | 1995-06-07 | 2001-12-25 | Cirrus Logic, Inc. | Portable communications and data terminal operating to optimize receipt of both incoming CDPD and AMPS messages |
JPH09218694A (ja) | 1996-02-08 | 1997-08-19 | Olympus Optical Co Ltd | 音声記録再生装置および音声記録再生システム |
JP4307557B2 (ja) | 1996-07-03 | 2009-08-05 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 音声活性度検出器 |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
US6259916B1 (en) | 1996-08-06 | 2001-07-10 | Conexant Systems, Inc. | Method and apparatus for minimizing perceptible impact on an interrupted call prior to hand-off |
US5855003A (en) | 1996-10-11 | 1998-12-29 | Motorola, Inc. | Method and apparatus for establishing a link in a wireless communication system |
US5960399A (en) * | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
JPH10257583A (ja) | 1997-03-06 | 1998-09-25 | Asahi Chem Ind Co Ltd | 音声処理装置およびその音声処理方法 |
US6803964B1 (en) * | 1997-03-21 | 2004-10-12 | International Business Machines Corporation | Method and apparatus for processing digital data |
US6078886A (en) * | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6243739B1 (en) * | 1997-07-11 | 2001-06-05 | Phone.Com, Inc. | Reducing perceived latency in servicing user requests on low-bandwidth communication channels |
FR2766604B1 (fr) | 1997-07-22 | 1999-10-01 | France Telecom | Procede et dispositif d'egalisation aveugle des effets d'un canal de transmission sur un signal de parole numerique |
CN1134904C (zh) | 1997-09-10 | 2004-01-14 | 塞尔隆法国股份有限公司 | 通信系统和终端 |
US6092039A (en) * | 1997-10-31 | 2000-07-18 | International Business Machines Corporation | Symbiotic automatic speech recognition and vocoder |
US6415253B1 (en) | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6076058A (en) | 1998-03-02 | 2000-06-13 | Lucent Technologies Inc. | Linear trajectory models incorporating preprocessing parameters for speech recognition |
CA2278904A1 (en) * | 1998-09-02 | 2000-03-02 | Lucent Technologies Inc. | Mobile terminal and base station in a packet radio services network |
US6161133A (en) * | 1998-10-19 | 2000-12-12 | Lexton Systems, Inc. | Method and apparatus for configuration of an internet appliance |
US6466906B2 (en) * | 1999-01-06 | 2002-10-15 | Dspc Technologies Ltd. | Noise padding and normalization in dynamic time warping |
US6195636B1 (en) * | 1999-02-19 | 2001-02-27 | Texas Instruments Incorporated | Speech recognition over packet networks |
US6275800B1 (en) * | 1999-02-23 | 2001-08-14 | Motorola, Inc. | Voice recognition system and method |
US6519260B1 (en) | 1999-03-17 | 2003-02-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Reduced delay priority for comfort noise |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US6868385B1 (en) * | 1999-10-05 | 2005-03-15 | Yomobile, Inc. | Method and apparatus for the provision of information signals based upon speech recognition |
GB9925297D0 (en) | 1999-10-27 | 1999-12-29 | Ibm | Voice processing system |
FI19992350A (fi) | 1999-10-29 | 2001-04-30 | Nokia Mobile Phones Ltd | Parannettu puheentunnistus |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US20030182113A1 (en) * | 1999-11-22 | 2003-09-25 | Xuedong Huang | Distributed speech recognition for mobile communication devices |
US6442155B1 (en) | 1999-12-03 | 2002-08-27 | Samsung Electronics, Co., Ltd. | Device and method for controlling transmission power of a mobile station in a multi-carrier CDMA mobile communication system |
US6577862B1 (en) * | 1999-12-23 | 2003-06-10 | Ericsson Inc. | System and method for providing comfort noise in a mobile communication network |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
JP3728177B2 (ja) * | 2000-05-24 | 2005-12-21 | キヤノン株式会社 | 音声処理システム、装置、方法及び記憶媒体 |
US6707821B1 (en) | 2000-07-11 | 2004-03-16 | Cisco Technology, Inc. | Time-sensitive-packet jitter and latency minimization on a shared data link |
US6671669B1 (en) | 2000-07-18 | 2003-12-30 | Qualcomm Incorporated | combined engine system and method for voice recognition |
US6697776B1 (en) * | 2000-07-31 | 2004-02-24 | Mindspeed Technologies, Inc. | Dynamic signal detector system and method |
US6754629B1 (en) | 2000-09-08 | 2004-06-22 | Qualcomm Incorporated | System and method for automatic voice recognition using mapping |
US20020116186A1 (en) | 2000-09-09 | 2002-08-22 | Adam Strauss | Voice activity detector for integrated telecommunications processing |
US6694294B1 (en) | 2000-10-31 | 2004-02-17 | Qualcomm Incorporated | System and method of mu-law or A-law compression of bark amplitudes for speech recognition |
US7016833B2 (en) * | 2000-11-21 | 2006-03-21 | The Regents Of The University Of California | Speaker verification system using acoustic data and non-acoustic data |
US6823306B2 (en) * | 2000-11-30 | 2004-11-23 | Telesector Resources Group, Inc. | Methods and apparatus for generating, updating and distributing speech recognition models |
US20020091515A1 (en) | 2001-01-05 | 2002-07-11 | Harinath Garudadri | System and method for voice recognition in a distributed voice recognition system |
US6681207B2 (en) | 2001-01-12 | 2004-01-20 | Qualcomm Incorporated | System and method for lossy compression of voice recognition models |
US20030004720A1 (en) | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
US6633839B2 (en) * | 2001-02-02 | 2003-10-14 | Motorola, Inc. | Method and apparatus for speech reconstruction in a distributed speech recognition system |
US6885735B2 (en) * | 2001-03-29 | 2005-04-26 | Intellisist, Llc | System and method for transmitting voice input from a remote location over a wireless data channel |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US7203643B2 (en) | 2001-06-14 | 2007-04-10 | Qualcomm Incorporated | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
US20030046711A1 (en) * | 2001-06-15 | 2003-03-06 | Chenglin Cui | Formatting a file for encoded frames and the formatter |
US7013275B2 (en) * | 2001-12-28 | 2006-03-14 | Sri International | Method and apparatus for providing a dynamic speech-driven control and remote service access system |
US7062444B2 (en) * | 2002-01-24 | 2006-06-13 | Intel Corporation | Architecture for DSR client and server development platform |
-
2002
- 2002-05-28 US US10/157,629 patent/US7203643B2/en not_active Expired - Lifetime
- 2002-06-13 WO PCT/US2002/018964 patent/WO2002103679A1/en not_active Application Discontinuation
- 2002-06-13 KR KR1020037016365A patent/KR100923896B1/ko active IP Right Grant
- 2002-06-13 CN CNA028159519A patent/CN1543640A/zh active Pending
- 2002-06-13 EP EP02746540A patent/EP1428204A1/en not_active Withdrawn
- 2002-06-13 MX MXPA03011559A patent/MXPA03011559A/es unknown
- 2002-06-13 IL IL15927702A patent/IL159277A0/xx unknown
- 2002-06-14 TW TW091113043A patent/TW561453B/zh active
-
2007
- 2007-03-01 US US11/680,740 patent/US8050911B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100791349B1 (ko) * | 2005-12-08 | 2008-01-07 | 한국전자통신연구원 | 분산 음성 인식 시스템에서 음성 신호의 코딩 방법 및 그장치 |
Also Published As
Publication number | Publication date |
---|---|
US20070192094A1 (en) | 2007-08-16 |
US20030061042A1 (en) | 2003-03-27 |
US7203643B2 (en) | 2007-04-10 |
KR100923896B1 (ko) | 2009-10-28 |
MXPA03011559A (es) | 2004-03-26 |
EP1428204A1 (en) | 2004-06-16 |
CN1543640A (zh) | 2004-11-03 |
WO2002103679A1 (en) | 2002-12-27 |
TW561453B (en) | 2003-11-11 |
US8050911B2 (en) | 2011-11-01 |
IL159277A0 (en) | 2004-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100923896B1 (ko) | 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치 | |
US20030004720A1 (en) | System and method for computing and transmitting parameters in a distributed voice recognition system | |
US7941313B2 (en) | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system | |
CA2179759C (en) | Distributed voice recognition system | |
US7089178B2 (en) | Multistream network feature processing for a distributed speech recognition system | |
US6411926B1 (en) | Distributed voice recognition system | |
US6594628B1 (en) | Distributed voice recognition system | |
US20020091515A1 (en) | System and method for voice recognition in a distributed voice recognition system | |
EP1159735B1 (en) | Voice recognition rejection scheme | |
JP2004523788A (ja) | 音声認識モデルの効率的な記憶のためのシステムおよび方法 | |
Cheng et al. | A robust front-end algorithm for distributed speech recognition | |
JPH08171400A (ja) | 音声符号化装置 | |
Yoon et al. | Efficient distribution of feature parameters for speech recognition in network environments | |
WO2001031636A2 (en) | Speech recognition on gsm encoded data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120927 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20130927 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140929 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150930 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160929 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170929 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180928 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190924 Year of fee payment: 11 |