KR100905586B1 - 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 - Google Patents
로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 Download PDFInfo
- Publication number
- KR100905586B1 KR100905586B1 KR1020070051740A KR20070051740A KR100905586B1 KR 100905586 B1 KR100905586 B1 KR 100905586B1 KR 1020070051740 A KR1020070051740 A KR 1020070051740A KR 20070051740 A KR20070051740 A KR 20070051740A KR 100905586 B1 KR100905586 B1 KR 100905586B1
- Authority
- KR
- South Korea
- Prior art keywords
- microphone
- voice
- speech
- attenuation
- robot
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000011156 evaluation Methods 0.000 claims abstract description 52
- 238000005259 measurement Methods 0.000 claims abstract description 33
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 claims description 11
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 abstract description 5
- 238000001228 spectrum Methods 0.000 description 8
- 238000012854 evaluation process Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
Claims (15)
- 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템에 있어서,적어도 두 개 이상의 마이크의 성능 평가에 필요한 음성 신호를 저장하는 기준 음성 데이터베이스와,상기 마이크들 중 기준 마이크와 대상 마이크로 상기 기준 음성 데이터베이스로부터의 상기 음성 신호가 입력되면, 성능 평가 기준의 선택에 대응하여 상기 입력되는 음성 신호의 감쇠 및 왜곡 중 적어도 어느 하나를 측정하여 수치화하는 측정치 산출부와,상기 측정치 산출부에 의해 수치화된 측정 결과를 기준값과 비교하는 비교부와,상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 마이크 선정부를 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 1항에 있어서, 상기 측정치 산출부는,상기 마이크로 입력되는 전체 음성 신호의 평균 신호대잡음비(Averaged SNR) 및 상기 음성 신호의 세그먼트별 신호대잡음비(Segmental SNR) 중 어느 하나를 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 것을 특징으로 하는 로봇에 서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 1항에 있어서, 상기 측정치 산출부는,상기 기준 마이크 및 상기 대상 마이크 간의 음성 감쇠 비율을 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 1항에 있어서, 상기 측정치 산출부는,로그 면적 비율(log area ratio), 로그 우도비 척도(Log-likelihood ratio measure) 및 켑스트랄 거리(Cepstral distance) 중 어느 하나를 이용하여 상기 음성 신호의 왜곡을 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 1항에 있어서, 상기 측정치 산출부는,이타구라-사이토 척도(Itakura-saito distortion measure), 가중 스펙트럼 슬로프 척도(Weighted spectral slope measure) 및 음성의 인지적 성능 평가(Perceptual Evaluation of Speech Quality) 중 어느 하나를 이용하여 상기 음성 신호의 왜곡을 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템에 있어서,적어도 두 개 이상의 마이크의 성능 평가에 필요한 음성 신호를 저장하는 기준 음성 데이터베이스와,상기 마이크들 중 기준 마이크와 대상 마이크로 상기 기준 음성 데이터베이스로부터의 상기 음성 신호가 입력되면, 상기 입력되는 음성 신호의 감쇠를 측정하기 위해 상기 마이크 간의 음성 감쇠 비율을 산출하는 측정치 산출부와,상기 측정치 산출부에 의해 산출된 결과를 기준값과 비교한 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 마이크 선정부를 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 7항에 있어서, 상기 측정치 산출부는,상기 기준 마이크와 대상 마이크 각각의 음성 구간의 에너지와 잡음 구간의 에너지를 산출하고, 상기 기준 마이크에서의 음성 구간의 에너지와 잡음 구간의 에너지 간의 차이를 상기 대상 마이크에서의 음성 구간의 에너지와 잡음 구간의 에너지 간의 차이로 나눈 후, 프리앰프의 이득 차이를 보정하기 위해 상기 대상 마이크에서의 잡음 구간의 에너지를 상기 기준 마이크에서의 잡음 구간의 에너지로 나눈 값을 곱한 후 로그를 취함으로써 상기 마이크 간의 음성 감쇠 비율을 산출함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 제 7항에 있어서, 상기 마이크 선정부는,상기 측정치 산출부에 의해 산출된 결과가 상기 기준값보다 작을 경우 상기 대상 마이크의 선정을 확정함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.
- 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법에 있어서,적어도 두 개 이상의 마이크들 중 기준 마이크와 대상 마이크로 성능 평가에 필요한 음성 신호를 입력하는 과정과,상기 음성 신호가 입력되면, 상기 입력되는 음성 신호의 감쇠를 측정하기 위해 상기 마이크 간의 음성 감쇠 비율을 산출하는 과정과,상기 산출된 마이크 간의 음성 감쇠 비율을 기준값과 비교하는 과정과,상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 과정을 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.
- 제 10항에 있어서, 상기 대상 마이크의 선정 여부를 결정하는 과정은,상기 산출된 마이크 간의 음성 감쇠 비율이 상기 기준값보다 작을 경우 상기 대상 마이크의 선정을 확정하는 과정임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.
- 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법에 있어서,적어도 두 개 이상의 마이크들 중 기준 마이크와 대상 마이크로 성능 평가에 필요한 음성 신호를 입력하는 과정과,상기 음성 신호가 입력되면, 성능 평가 기준의 선택에 대응하여 상기 입력되 는 음성 신호의 감쇠 및 왜곡 중 적어도 어느 하나를 측정하여 수치화하는 과정과,상기 수치화된 측정 결과를 기준값과 비교하는 과정과,상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 과정을 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.
- 제 13항에 있어서, 상기 수치화하는 과정은,상기 기준 마이크 및 상기 대상 마이크 간의 음성 감쇠 비율을 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 과정임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070051740A KR100905586B1 (ko) | 2007-05-28 | 2007-05-28 | 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 |
US12/127,867 US8149728B2 (en) | 2007-05-28 | 2008-05-28 | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
EP08009716A EP1998320B1 (en) | 2007-05-28 | 2008-05-28 | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
DE602008003257T DE602008003257D1 (de) | 2007-05-28 | 2008-05-28 | System und Verfahren zur Einschätzung der Leistung eines Mikrofons für die Spracherkennung in einem Roboter über lange Distanzen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070051740A KR100905586B1 (ko) | 2007-05-28 | 2007-05-28 | 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080104667A KR20080104667A (ko) | 2008-12-03 |
KR100905586B1 true KR100905586B1 (ko) | 2009-07-02 |
Family
ID=39619175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070051740A KR100905586B1 (ko) | 2007-05-28 | 2007-05-28 | 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8149728B2 (ko) |
EP (1) | EP1998320B1 (ko) |
KR (1) | KR100905586B1 (ko) |
DE (1) | DE602008003257D1 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8738367B2 (en) * | 2009-03-18 | 2014-05-27 | Nec Corporation | Speech signal processing device |
KR101053242B1 (ko) * | 2009-09-24 | 2011-08-01 | 삼성전기주식회사 | 카메라 모듈 검사 시스템 및 카메라 모듈 검사 방법 |
US10026407B1 (en) | 2010-12-17 | 2018-07-17 | Arrowhead Center, Inc. | Low bit-rate speech coding through quantization of mel-frequency cepstral coefficients |
CN102800323B (zh) | 2012-06-25 | 2014-04-02 | 华为终端有限公司 | 移动终端语音降噪的方法及装置 |
US20150228274A1 (en) * | 2012-10-26 | 2015-08-13 | Nokia Technologies Oy | Multi-Device Speech Recognition |
US9310800B1 (en) * | 2013-07-30 | 2016-04-12 | The Boeing Company | Robotic platform evaluation system |
CN103928025B (zh) * | 2014-04-08 | 2017-06-27 | 华为技术有限公司 | 一种语音识别的方法及移动终端 |
CN105489219A (zh) * | 2016-01-06 | 2016-04-13 | 广州零号软件科技有限公司 | 室内空间服务机器人分布式语音识别系统与产品 |
EP3223279B1 (en) * | 2016-03-21 | 2019-01-09 | Nxp B.V. | A speech signal processing circuit |
US20170366897A1 (en) * | 2016-06-15 | 2017-12-21 | Robert Azarewicz | Microphone board for far field automatic speech recognition |
CN107403629B (zh) * | 2017-08-16 | 2020-10-09 | 歌尔股份有限公司 | 远场拾音性能评价方法和系统、电子设备 |
CN111294704B (zh) * | 2020-01-22 | 2021-08-31 | 北京小米松果电子有限公司 | 音频处理方法、装置及存储介质 |
CN111951833B (zh) * | 2020-08-04 | 2024-08-23 | 科大讯飞股份有限公司 | 语音测试方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5919821A (ja) | 1982-07-26 | 1984-02-01 | Matsushita Electric Ind Co Ltd | 音響評価方法 |
JP2002369296A (ja) | 2001-06-05 | 2002-12-20 | Nippon Hoso Kyokai <Nhk> | マイクロホン回線検査機能を有するミクシングシステム |
KR20050022952A (ko) * | 2004-08-11 | 2005-03-09 | 장진우 | 음향입력제품 선별장치 |
US20060069557A1 (en) | 2004-09-10 | 2006-03-30 | Simon Barker | Microphone setup and testing in voice recognition software |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4449238A (en) * | 1982-03-25 | 1984-05-15 | Bell Telephone Laboratories, Incorporated | Voice-actuated switching system |
US4741038A (en) * | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
US5625607A (en) * | 1992-02-13 | 1997-04-29 | Canon Kabushiki Kaisha | Magneto-optical disk apparatus including two magnetic field applying devices, one of which has a substantial ring-shaped core member with a gap in a portion thereof |
US5561737A (en) | 1994-05-09 | 1996-10-01 | Lucent Technologies Inc. | Voice actuated switching system |
US5715372A (en) * | 1995-01-10 | 1998-02-03 | Lucent Technologies Inc. | Method and apparatus for characterizing an input signal |
JP3280825B2 (ja) * | 1995-04-26 | 2002-05-13 | 富士通株式会社 | 音声特徴分析装置 |
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
JP2001296881A (ja) * | 2000-04-14 | 2001-10-26 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
US6505161B1 (en) * | 2000-05-01 | 2003-01-07 | Sprint Communications Company L.P. | Speech recognition that adjusts automatically to input devices |
GB2398913B (en) * | 2003-02-27 | 2005-08-17 | Motorola Inc | Noise estimation in speech recognition |
DE10320274A1 (de) * | 2003-05-07 | 2004-12-09 | Sennheiser Electronic Gmbh & Co. Kg | System zur ortssensitiven Wiedergabe von Audiosignalen |
DE10339973A1 (de) * | 2003-08-29 | 2005-03-17 | Daimlerchrysler Ag | Intelligentes akustisches Mikrofon-Frontend mit Spracherkenner-Feedback |
JP4167286B2 (ja) * | 2004-07-05 | 2008-10-15 | パイオニア株式会社 | 残響調整装置、残響補正方法、および、音響再生システム |
US7472041B2 (en) * | 2005-08-26 | 2008-12-30 | Step Communications Corporation | Method and apparatus for accommodating device and/or signal mismatch in a sensor array |
EP1931169A4 (en) * | 2005-09-02 | 2009-12-16 | Japan Adv Inst Science & Tech | POST-FILTER FOR A MICROPHONE MATRIX |
US8533630B2 (en) * | 2006-09-05 | 2013-09-10 | Intel Corporation | Method and apparatus for controlling an array of input/output devices |
US7924655B2 (en) * | 2007-01-16 | 2011-04-12 | Microsoft Corp. | Energy-based sound source localization and gain normalization |
-
2007
- 2007-05-28 KR KR1020070051740A patent/KR100905586B1/ko active IP Right Grant
-
2008
- 2008-05-28 EP EP08009716A patent/EP1998320B1/en not_active Ceased
- 2008-05-28 US US12/127,867 patent/US8149728B2/en not_active Expired - Fee Related
- 2008-05-28 DE DE602008003257T patent/DE602008003257D1/de active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5919821A (ja) | 1982-07-26 | 1984-02-01 | Matsushita Electric Ind Co Ltd | 音響評価方法 |
JP2002369296A (ja) | 2001-06-05 | 2002-12-20 | Nippon Hoso Kyokai <Nhk> | マイクロホン回線検査機能を有するミクシングシステム |
KR20050022952A (ko) * | 2004-08-11 | 2005-03-09 | 장진우 | 음향입력제품 선별장치 |
US20060069557A1 (en) | 2004-09-10 | 2006-03-30 | Simon Barker | Microphone setup and testing in voice recognition software |
Also Published As
Publication number | Publication date |
---|---|
DE602008003257D1 (de) | 2010-12-16 |
US20080298599A1 (en) | 2008-12-04 |
EP1998320A1 (en) | 2008-12-03 |
KR20080104667A (ko) | 2008-12-03 |
US8149728B2 (en) | 2012-04-03 |
EP1998320B1 (en) | 2010-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100905586B1 (ko) | 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법 | |
KR20080111290A (ko) | 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법 | |
RU2642353C2 (ru) | Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи | |
CN105308681B (zh) | 用于生成语音信号的方法和装置 | |
JP6454916B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP5751110B2 (ja) | 残響抑制装置および残響抑制方法並びに残響抑制プログラム | |
US9959886B2 (en) | Spectral comb voice activity detection | |
CN108464015A (zh) | 麦克风阵列信号处理系统 | |
KR20130042649A (ko) | 오디오 신호에서의 잡음 추정을 위한 방법 및 장치 | |
WO2020013296A1 (ja) | 精神・神経系疾患を推定する装置 | |
US9183846B2 (en) | Method and device for adaptively adjusting sound effect | |
US20220254332A1 (en) | Method and apparatus for normalizing features extracted from audio data for signal recognition or modification | |
US11501758B2 (en) | Environment aware voice-assistant devices, and related systems and methods | |
JP2012168296A (ja) | 音声による抑圧状態検出装置およびプログラム | |
Huber et al. | Single-ended speech quality prediction based on automatic speech recognition | |
US12087284B1 (en) | Environment aware voice-assistant devices, and related systems and methods | |
KR101863098B1 (ko) | 음성 인식 장치 및 방법 | |
Raikar et al. | Effect of Microphone Position Measurement Error on RIR and its Impact on Speech Intelligibility and Quality. | |
EP4360087A1 (en) | Multi-encoder end-to-end automatic speech recognition (asr) for joint modeling of multiple input devices | |
CN112133320A (zh) | 语音处理装置及语音处理方法 | |
JP6633579B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP4632831B2 (ja) | 音声認識方法および音声認識装置 | |
JP2020018015A (ja) | 音響信号処理装置、方法及びプログラム | |
CN116996801B (zh) | 一种具备有线无线接入ai智能调试会议发言系统 | |
CN117612566B (zh) | 音频质量评估方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130530 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140529 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150528 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160530 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170529 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180530 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190530 Year of fee payment: 11 |