KR101791907B1 - 위치 기반의 음향 처리 장치 및 방법 - Google Patents
위치 기반의 음향 처리 장치 및 방법 Download PDFInfo
- Publication number
- KR101791907B1 KR101791907B1 KR1020110000576A KR20110000576A KR101791907B1 KR 101791907 B1 KR101791907 B1 KR 101791907B1 KR 1020110000576 A KR1020110000576 A KR 1020110000576A KR 20110000576 A KR20110000576 A KR 20110000576A KR 101791907 B1 KR101791907 B1 KR 101791907B1
- Authority
- KR
- South Korea
- Prior art keywords
- acoustic model
- acoustic
- user
- matched
- positions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따른 도 1의 음향 처리 장치가 음향 모델을 생성하는 과정을 설명하기 위한 도면이다.
도 3은 본 발명의 또 다른 일실시예에 따른 도 1의 음향 처리 장치가 음향 모델을 생성하는 과정을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 음향 처리 방법을 설명하기 위한 흐름도이다.
Claims (10)
- 음성 인식 대상 영역에 설정된 위치들 중 제 1 위치에 매칭된 제 1 음향 모델을 추출하는 제 1 추출부;
상기 제 1 위치의 주변에 존재하는 적어도 하나의 제 2 위치에 매칭된 제 2 음향 모델을 추출하는 제 2 추출부; 및
상기 제 1 음향 모델의 상기 제1 위치 및 상기 제 2 음향 모델의 조합에 기초하여 제 3 음향 모델을 생성하는 음향 모델 생성부를 포함하는 위치 기반의 음향 처리 장치.
- 제 1 항에 있어서,
상기 음향 모델 생성부는,
상기 제 1 음향 모델 및 상기 제 2 음향 모델 중 적어도 하나에 가중치를 주고 선형 조합하여 상기 제 3 음향 모델을 생성하는 위치 기반의 음향 처리 장치.
- 제 1 항에 있어서,
상기 음향 모델 생성부는,
상기 각각의 설정된 위치들에서 얻어진 실험 데이터들에 기초하여 상기 각각의 설정된 위치들에 매칭되는 음향 모델들을 생성하는 위치 기반의 음향 처리 장치.
- 제 1 항에 있어서,
사용자의 위치 정보를 검출하고, 상기 검출된 사용자의 위치 정보에 기초하여 상기 제 1 위치를 검출하는 위치 검출부를 더 포함하는 위치 기반의 음향 처리 장치.
- 제 1 항에 있어서,
상기 제 1 위치로부터 수신되는 음향 신호를 상기 제 3 음향 모델을 이용하여 인식하는 음성 인식부를 더 포함하는 위치 기반의 음향 처리 장치.
- 위치 기반의 음향 처리 장치의 음향 처리 방법에 있어서,
음성 인식 대상 영역에 설정된 위치들 중 제 1 위치에 매칭된 제 1 음향 모델을 추출하는 단계;
상기 제 1 위치의 주변에 존재하는 적어도 하나의 제 2 위치에 매칭된 제 2 음향 모델을 추출하는 단계; 및
상기 제 1 음향 모델의 상기 제1 위치 및 상기 제 2 음향 모델의 조합에 기초하여 제 3 음향 모델을 생성하는 단계를 포함하는 위치 기반의 음향 처리 방법.
- 제 6 항에 있어서,
상기 제 3 음향 모델을 생성하는 단계는,
상기 제 1 음향 모델 및 상기 제 2 음향 모델 중 적어도 하나에 가중치를 주고 선형 조합하여 상기 제 3 음향 모델을 생성하는 단계를 포함하는 위치 기반의 음향 처리 방법.
- 제 6 항에 있어서,
상기 각각의 설정된 위치들에서 얻어진 실험 데이터들에 기초하여 상기 각각의 설정된 위치들에 매칭되는 음향 모델들을 생성하는 단계를 더 포함하는 위치 기반의 음향 처리 방법.
- 제 6 항에 있어서,
사용자의 위치 정보를 검출하는 단계; 및
상기 검출된 사용자의 위치 정보에 기초하여 상기 제 1 위치를 검출하는 단계를 더 포함하는 위치 기반의 음향 처리 방법.
- 제 6 항에 있어서,
상기 제 1 위치로부터 수신되는 음향 신호를 상기 제 3 음향 모델을 이용하여 인식하는 단계를 더 포함하는 위치 기반의 음향 처리 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110000576A KR101791907B1 (ko) | 2011-01-04 | 2011-01-04 | 위치 기반의 음향 처리 장치 및 방법 |
US13/192,902 US8942979B2 (en) | 2011-01-04 | 2011-07-28 | Acoustic processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110000576A KR101791907B1 (ko) | 2011-01-04 | 2011-01-04 | 위치 기반의 음향 처리 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120079342A KR20120079342A (ko) | 2012-07-12 |
KR101791907B1 true KR101791907B1 (ko) | 2017-11-02 |
Family
ID=46381534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110000576A Active KR101791907B1 (ko) | 2011-01-04 | 2011-01-04 | 위치 기반의 음향 처리 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8942979B2 (ko) |
KR (1) | KR101791907B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9881616B2 (en) * | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US9530407B2 (en) * | 2014-06-11 | 2016-12-27 | Honeywell International Inc. | Spatial audio database based noise discrimination |
KR102292546B1 (ko) | 2014-07-21 | 2021-08-23 | 삼성전자주식회사 | 컨텍스트 정보를 이용하는 음성 인식 방법 및 장치 |
US11676062B2 (en) | 2018-03-06 | 2023-06-13 | Samsung Electronics Co., Ltd. | Dynamically evolving hybrid personalized artificial intelligence system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4516527B2 (ja) * | 2003-11-12 | 2010-08-04 | 本田技研工業株式会社 | 音声認識装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6230138B1 (en) * | 2000-06-28 | 2001-05-08 | Visteon Global Technologies, Inc. | Method and apparatus for controlling multiple speech engines in an in-vehicle speech recognition system |
DE10122828A1 (de) * | 2001-05-11 | 2002-11-14 | Philips Corp Intellectual Pty | Verfahren zum Training oder zur Adaption eines Spracherkenners |
JP2003131683A (ja) | 2001-10-22 | 2003-05-09 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
US7224981B2 (en) * | 2002-06-20 | 2007-05-29 | Intel Corporation | Speech recognition of mobile devices |
JP4352790B2 (ja) * | 2002-10-31 | 2009-10-28 | セイコーエプソン株式会社 | 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物 |
US7099822B2 (en) * | 2002-12-10 | 2006-08-29 | Liberato Technologies, Inc. | System and method for noise reduction having first and second adaptive filters responsive to a stored vector |
KR100814143B1 (ko) * | 2003-10-03 | 2008-03-14 | 아사히 가세이 가부시키가이샤 | 데이터 처리 장치 및 데이터 처리 장치 제어 프로그램 |
US7475014B2 (en) * | 2005-07-25 | 2009-01-06 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for tracking signal sources with wrapped-phase hidden markov models |
US8938392B2 (en) * | 2007-02-27 | 2015-01-20 | Nuance Communications, Inc. | Configuring a speech engine for a multimodal application based on location |
JP5326892B2 (ja) * | 2008-12-26 | 2013-10-30 | 富士通株式会社 | 情報処理装置、プログラム、および音響モデルを生成する方法 |
US8468012B2 (en) * | 2010-05-26 | 2013-06-18 | Google Inc. | Acoustic model adaptation using geographic information |
-
2011
- 2011-01-04 KR KR1020110000576A patent/KR101791907B1/ko active Active
- 2011-07-28 US US13/192,902 patent/US8942979B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4516527B2 (ja) * | 2003-11-12 | 2010-08-04 | 本田技研工業株式会社 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20120173232A1 (en) | 2012-07-05 |
KR20120079342A (ko) | 2012-07-12 |
US8942979B2 (en) | 2015-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3707716B1 (en) | Multi-channel speech separation | |
KR102339594B1 (ko) | 객체 인식 방법, 컴퓨터 디바이스 및 컴퓨터 판독 가능 저장 매체 | |
CN110832580B (zh) | 重放攻击的检测 | |
US9536523B2 (en) | Method and system for identification of speech segments | |
US9286897B2 (en) | Speech recognizer with multi-directional decoding | |
Nakadai et al. | Design and Implementation of Robot Audition System'HARK'—Open Source Software for Listening to Three Simultaneous Speakers | |
JP6140579B2 (ja) | 音響処理装置、音響処理方法、及び音響処理プログラム | |
JP5328744B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6077957B2 (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP4964204B2 (ja) | 複数信号区間推定装置、複数信号区間推定方法、そのプログラムおよび記録媒体 | |
CN103124165A (zh) | 自动增益控制 | |
CN109410956A (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
JP2015070321A (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
Saffari et al. | Ava (a social robot): Design and performance of a robotic hearing apparatus | |
KR101791907B1 (ko) | 위치 기반의 음향 처리 장치 및 방법 | |
JP5385876B2 (ja) | 音声区間検出方法、音声認識方法、音声区間検出装置、音声認識装置、そのプログラム及び記録媒体 | |
JP2021162685A (ja) | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム | |
JP6480124B2 (ja) | 生体検知装置、生体検知方法及びプログラム | |
JP5961530B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
Cirillo et al. | Sound mapping in reverberant rooms by a robust direct method | |
JP6106618B2 (ja) | 音声区間検出装置、音声認識装置、その方法、及びプログラム | |
KR101737083B1 (ko) | 음성 활동 감지 방법 및 장치 | |
Lee et al. | Space-time voice activity detection | |
Han et al. | Switching linear dynamic transducer for stereo data based speech feature mapping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20110104 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20160104 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20110104 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170125 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20170725 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20171025 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20171026 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200819 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210504 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220913 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20231016 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240923 Start annual number: 8 End annual number: 8 |