KR100556365B1 - 음성 인식장치 및 방법 - Google Patents
음성 인식장치 및 방법 Download PDFInfo
- Publication number
- KR100556365B1 KR100556365B1 KR1020030045765A KR20030045765A KR100556365B1 KR 100556365 B1 KR100556365 B1 KR 100556365B1 KR 1020030045765 A KR1020030045765 A KR 1020030045765A KR 20030045765 A KR20030045765 A KR 20030045765A KR 100556365 B1 KR100556365 B1 KR 100556365B1
- Authority
- KR
- South Korea
- Prior art keywords
- command
- echo
- user command
- user
- noise
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000003044 adaptive effect Effects 0.000 claims abstract description 10
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 239000000945 filler Substances 0.000 claims abstract description 5
- 230000006978 adaptation Effects 0.000 claims description 4
- 230000007257 malfunction Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Selective Calling Equipment (AREA)
- Details Of Television Systems (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
Claims (8)
- 적응 필터링 방식으로 모든 입력음에서 반향음과 잡음을 제거하고, 사용자 음성만을 검출하거나, 시작점 및 끝점 검출부로부터 제공받은 시작점 및 끝점 정보를 이용한 적응 필터링 방식으로 모든 입력음에서 반향음과 잡음을 제거하고 사용자 음성만을 검출하기 위한 반향 및 잡음 제거부;상기 반향 및 잡음 제거부에서 출력되는 연속적인 사용자 음성에서 명령어를 검출하고 그 시작점 및 끝점 정보를 상기 반향 및 잡음 제거부와 음성 인식부에 제공하는 시작점 및 끝점 검출부; 그리고상기 시작점 및 끝점 검출부에서 출력된 사용자 명령어의 핵심어 확률과 비핵심어 확률의 비율을 산출하고, 상기 산출된 비율과 제 1 문턱값 및 제 2 문턱값의 비교 결과에 따라 해당 명령이 수행되도록 상기 사용자 명령어를 피제어기기로 전송하는 음성 인식부를 포함하여 이루어 지는 것을 특징으로 하는 음성 인식 장치.
- 제1 항에 있어서,상기 반향 및 잡음 제거부는 IIR 필터 뱅크를 사용한 서브 밴드(Sub band) 적응 필터를 포함함을 특징으로 하는 음성 인식 장치.
- 제1 항에 있어서,상기 음성 인식부는 명령어 판단을 위해 필러(Filler) 모델이 적용됨을 특징으로 하는 음성 인식 장치.
- 사용자 명령을 포함한 연속적인 입력에서 반향음 및 잡음을 적응 필터링 방식을 이용하여 제거하고, 상기 사용자 명령을 검출하는 단계;상기 검출된 사용자 명령어의 핵심어 확률과 비핵심어 확률의 비율을 산출하는 단계; 그리고상기 산출된 비율과 제 1 문턱값 및 제 2 문턱값의 비교 결과에 따라 해당 명령이 수행되도록 상기 사용자 명령어를 피제어기기로 전송하는 단계를 포함하여 이루어 지는 것을 특징으로 하는 음성 인식 방법.
- 제4 항에 있어서,상기 사용자 명령을 포함한 연속적인 입력에서 반향 및 잡음을 적응 필터링 방식을 이용하여 제거하고 사용자 명령을 검출하는 단계는상기 연속적인 입력에서 사용자 명령어의 시작점부터 필터 적응을 멈추고 사용자 명령어의 끝점에서 필터 적응을 시작하여 이루어짐을 특징으로 하는 음성 인식 방법.
- 제4 항에 있어서,상기 비핵심어 확률은 사용자 명령을 필러(Filler) 모델 각각에 통과시켜 각 확률을 구하고 그중 최고값을 인식결과로 선택하여 산출됨을 특징으로 하는 음성 인식 방법.
- 제4 항에 있어서,산출된 비율과 제1 문턱값 및 제2 문턱값의 비교 결과에 따라 해당 명령이 수행되도록 상기 사용자 명령어를 피제어기기로 전송하는 단계는산출된 비율이 제1 문턱값 이상일 경우 상기 사용자 명령어를 피제어기기로 전송하는 단계와,산출된 비율이 제1 문턱값 미만이고 제2 문턱값 이상일 경우 피제어기기를 통해 사용자 확인을 수행하고, 사용자 확인시 상기 사용자 명령어를 피제어기기로 전송하는 단계와,산출된 비율이 제2 문턱값 미만일 경우 사용자 명령어를 무시하는 단계를 포함함을 특징으로 하는 음성 인식 방법.
- 제7 항에 있어서,상기 제1 문턱값은 제2 문턱값에 비해 음성인식 오동작 확률이 낮도록 설정된 값임을 특징으로 하는 음성 인식 방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030045765A KR100556365B1 (ko) | 2003-07-07 | 2003-07-07 | 음성 인식장치 및 방법 |
US10/883,775 US8046223B2 (en) | 2003-07-07 | 2004-07-06 | Apparatus and method of voice recognition system for AV system |
EP04015881A EP1496499A3 (en) | 2003-07-07 | 2004-07-06 | Apparatus and method of voice recognition in an audio-video system |
CNB2004100637266A CN100345184C (zh) | 2003-07-07 | 2004-07-07 | 用于音频-视频系统的语音识别系统的设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030045765A KR100556365B1 (ko) | 2003-07-07 | 2003-07-07 | 음성 인식장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050005868A KR20050005868A (ko) | 2005-01-15 |
KR100556365B1 true KR100556365B1 (ko) | 2006-03-03 |
Family
ID=33448354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030045765A KR100556365B1 (ko) | 2003-07-07 | 2003-07-07 | 음성 인식장치 및 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8046223B2 (ko) |
EP (1) | EP1496499A3 (ko) |
KR (1) | KR100556365B1 (ko) |
CN (1) | CN100345184C (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9953654B2 (en) | 2014-05-20 | 2018-04-24 | Samsung Electronics Co., Ltd. | Voice command recognition apparatus and method |
KR20200017160A (ko) | 2018-08-08 | 2020-02-18 | 주식회사 케이티 | 음성을 인식하는 장치, 방법 및 컴퓨터 판독 가능 매체 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100556365B1 (ko) | 2003-07-07 | 2006-03-03 | 엘지전자 주식회사 | 음성 인식장치 및 방법 |
KR20080061901A (ko) * | 2006-12-28 | 2008-07-03 | 주식회사 유진로봇 | 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템 |
KR101086304B1 (ko) | 2009-11-30 | 2011-11-23 | 한국과학기술연구원 | 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법 |
AU2013298956B2 (en) | 2012-07-31 | 2016-06-16 | Geistlich Pharma Ag | Hydrophilic phosphate group containing dehydrated partially purified bone replacement material |
US9508343B2 (en) * | 2014-05-27 | 2016-11-29 | International Business Machines Corporation | Voice focus enabled by predetermined triggers |
CN105988049B (zh) * | 2015-02-28 | 2019-02-19 | 惠州市德赛西威汽车电子股份有限公司 | 一种噪声抑制的调试方法 |
WO2017039575A1 (en) * | 2015-08-28 | 2017-03-09 | Hewlett-Packard Development Company, L.P. | Remote sensor voice recognition |
CN105554609A (zh) * | 2015-12-26 | 2016-05-04 | 北海鸿旺电子科技有限公司 | 通过语音输入进行功能切换的方法及耳机 |
US10958747B2 (en) * | 2017-08-24 | 2021-03-23 | Google Llc | Digital component transmission |
USD915360S1 (en) * | 2018-08-27 | 2021-04-06 | Lg Electronics Inc. | Voice recognition device for television |
US11521604B2 (en) | 2020-09-03 | 2022-12-06 | Google Llc | User mediation for hotword/keyword detection |
US11849291B2 (en) * | 2021-05-17 | 2023-12-19 | Apple Inc. | Spatially informed acoustic echo cancelation |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5512939A (en) * | 1994-04-06 | 1996-04-30 | At&T Corp. | Low bit rate audio-visual communication system having integrated perceptual speech and video coding |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
US6292778B1 (en) * | 1998-10-30 | 2001-09-18 | Lucent Technologies Inc. | Task-independent utterance verification with subword-based minimum verification error training |
US6571210B2 (en) * | 1998-11-13 | 2003-05-27 | Microsoft Corporation | Confidence measure system using a near-miss pattern |
KR100587260B1 (ko) | 1998-11-13 | 2006-09-22 | 엘지전자 주식회사 | 음향 기기의 음성인식장치 |
WO2001001571A1 (en) * | 1999-06-24 | 2001-01-04 | Koninklijke Philips Electronics N.V. | Acoustic echo and noise cancellation |
DE10002321C2 (de) * | 2000-01-20 | 2002-11-14 | Micronas Munich Gmbh | Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung |
US20020039425A1 (en) | 2000-07-19 | 2002-04-04 | Burnett Gregory C. | Method and apparatus for removing noise from electronic signals |
EP1312078A1 (en) * | 2000-08-15 | 2003-05-21 | Koninklijke Philips Electronics N.V. | Multi-device audio-video with common echo canceling |
US6968064B1 (en) * | 2000-09-29 | 2005-11-22 | Forgent Networks, Inc. | Adaptive thresholds in acoustic echo canceller for use during double talk |
ATE474377T1 (de) * | 2001-01-23 | 2010-07-15 | Koninkl Philips Electronics Nv | Asymmetrisches mehrkanalfilter |
KR100368289B1 (ko) * | 2001-02-20 | 2003-01-24 | (주)성우테크노 | 음성인식장치를 위한 음성명령식별기 |
US6985859B2 (en) * | 2001-03-28 | 2006-01-10 | Matsushita Electric Industrial Co., Ltd. | Robust word-spotting system using an intelligibility criterion for reliable keyword detection under adverse and unknown noisy environments |
JP2003308091A (ja) * | 2002-04-17 | 2003-10-31 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
KR100556365B1 (ko) | 2003-07-07 | 2006-03-03 | 엘지전자 주식회사 | 음성 인식장치 및 방법 |
-
2003
- 2003-07-07 KR KR1020030045765A patent/KR100556365B1/ko active IP Right Grant
-
2004
- 2004-07-06 US US10/883,775 patent/US8046223B2/en not_active Expired - Fee Related
- 2004-07-06 EP EP04015881A patent/EP1496499A3/en not_active Ceased
- 2004-07-07 CN CNB2004100637266A patent/CN100345184C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9953654B2 (en) | 2014-05-20 | 2018-04-24 | Samsung Electronics Co., Ltd. | Voice command recognition apparatus and method |
KR20200017160A (ko) | 2018-08-08 | 2020-02-18 | 주식회사 케이티 | 음성을 인식하는 장치, 방법 및 컴퓨터 판독 가능 매체 |
Also Published As
Publication number | Publication date |
---|---|
CN100345184C (zh) | 2007-10-24 |
EP1496499A2 (en) | 2005-01-12 |
EP1496499A3 (en) | 2005-02-02 |
CN1591566A (zh) | 2005-03-09 |
US20050033572A1 (en) | 2005-02-10 |
KR20050005868A (ko) | 2005-01-15 |
US8046223B2 (en) | 2011-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100556365B1 (ko) | 음성 인식장치 및 방법 | |
US10515640B2 (en) | Generating dialogue based on verification scores | |
US20030138118A1 (en) | Method for control of a unit comprising an acoustic output device | |
US6018711A (en) | Communication system user interface with animated representation of time remaining for input to recognizer | |
US7006974B2 (en) | Voice controller and voice-controller system having a voice-controller apparatus | |
EP2587481B1 (en) | Controlling an apparatus based on speech | |
JP2020525850A (ja) | 方法、電子装置、家庭用機器ネットワークおよび記憶媒体 | |
US8666750B2 (en) | Voice control system | |
EP1933303B1 (en) | Speech dialog control based on signal pre-processing | |
CN108346425B (zh) | 一种语音活动检测的方法和装置、语音识别的方法和装置 | |
EP3602241B1 (en) | Method and apparatus for interaction with an intelligent personal assistant | |
JP2017117371A (ja) | 制御方法、制御装置およびプログラム | |
JP2007501420A (ja) | ダイアログシステムの駆動方法 | |
JP4520596B2 (ja) | 音声認識方法および音声認識装置 | |
CN107274895B (zh) | 一种语音识别设备及方法 | |
TW200809768A (en) | Method of driving a speech recognition system | |
WO2019142418A1 (ja) | 情報処理装置および情報処理方法 | |
WO2003107327A1 (en) | Controlling an apparatus based on speech | |
US20180332340A1 (en) | Set-Top Box with Enhanced Functionality and System and Method for Use of Same | |
KR100567828B1 (ko) | 향상된 음성인식 장치 및 방법 | |
CN110839169B (zh) | 一种智能设备遥控装置及基于其的控制方法 | |
KR100651940B1 (ko) | 음성 인식 장치 및 방법 | |
KR20150009757A (ko) | 영상처리장치 및 그 제어방법 | |
JP2009109536A (ja) | 音声認識システム及び音声認識装置 | |
US20070118381A1 (en) | Voice control methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130128 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140124 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150213 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160122 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170124 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180124 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190123 Year of fee payment: 14 |