KR100754384B1 - 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 - Google Patents
잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 Download PDFInfo
- Publication number
- KR100754384B1 KR100754384B1 KR1020030070981A KR20030070981A KR100754384B1 KR 100754384 B1 KR100754384 B1 KR 100754384B1 KR 1020030070981 A KR1020030070981 A KR 1020030070981A KR 20030070981 A KR20030070981 A KR 20030070981A KR 100754384 B1 KR100754384 B1 KR 100754384B1
- Authority
- KR
- South Korea
- Prior art keywords
- peak value
- speaker
- speech
- pseudo power
- voice
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B29/00—Combinations of cameras, projectors or photographic printing apparatus with non-photographic non-optical apparatus, e.g. clocks or weapons; Cameras having the shape of other objects
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8006—Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B15/00—Special procedures for taking photographs; Apparatus therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/22—Source localisation; Inverse modelling
Abstract
Description
Claims (30)
- 마이크로폰 어레이로부터 출력되는 음성신호로부터 검출되는 음성발성구간과 음성비발성구간에 대한 제1 및 제2 의사전력 스펙트럼의 차이스펙트럼을 획득하는 차이스펙트럼 획득수단; 및상기 차이스펙트럼 획득수단으로부터 제공되는 상기 차이스펙트럼과 상기 제1 의사전력 스펙트럼 중 어느 하나에서 피크치를 검출하고, 상기 검출된 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 화자방향 추정수단을 포함하는 것을 특징으로 하는 화자방향 추정장치.
- 제1 항에 있어서, 상기 차이스펙트럼 획득수단은상기 마이크로폰 어레이로부터 출력되는 음성신호로부터 음성발성구간을 검출하고, 상기 음성발성구간을 이용하여 음성비발성구간을 검출하는 음성발성/비발성구간 검출부;실제 음원과 상기 마이크로폰 어레이간의 전달함수를 이용하여 구해진 위치벡터를 데이터베이스화한 위치벡터 데이터베이스;상기 음성발성구간에 대하여 얻어진 잡음 부분공간에서의 기저벡터에 상기 위치벡터를 프로젝션시켜 제1 의사전력 스펙트럼을 구하는 제1 스펙트럼 획득부;상기 음성비발성구간에 대하여 얻어진 잡음 부분공간에서의 기저벡터에 상기 위치벡터를 프로젝션시켜 제2 의사전력 스펙트럼을 구하는 제2 스펙트럼 획득부; 및상기 제1 및 제2 의사전력 스펙트럼간의 차이 스펙트럼을 구하는 감산부를 구비하는 것을 특징으로 하는 화자방향 추정장치.
- 제2 항에 있어서, 상기 음성발성/비발성구간 검출부는 먼저 음성발성구간을 검출한 다음, 상기 음성발성구간의 이전 부분에 T1 개의 샘플을 건너 뛴 다음 그 이전 T2 개의 샘플을 선택하여 음성비발성구간으로 검출하는 것을 특징으로 하는 화자방향 추정장치.
- 제2 항에 있어서, 상기 음성발성/비발성구간 검출부는 단일프레임 음성존재확률로부터 나온 확률값인 제1 파라미터, 연속해서 음성이라고 판정된 프레임 수인 제2 파라미터, 연속해서 음성이 아니라고 판정된 프레임 수인 제3 파라미터, 판단된 음성발성구간에서 음성이라고 판단된 프레임 수와 음성이 아니라고 판단된 프레임 수의 비율인 제4 파라미터, 및 판단된 음성발성구간 내의 총 프레임 수인 제5 파라미터를 이용하여 상기 음성발성구간을 검출하는 것을 특징으로 하는 화자방향 추정장치.
- 제4 항에 있어서, 상기 제1 내지 제5 파라미터의 문턱값은 신호대잡음비에 따라서 적응적으로 조정되는 것을 특징으로 하는 화자방향 추정장치.
- 제5 항에 있어서, 상기 제1 내지 제5 파라미터의 문턱값은 미리 클린환경과 상기 신호대잡음비가 소정 상한값인 환경에서 각각 튜닝한 다음, 상기 신호대잡음비가 중간인 범위에 대해서는 선형보간을 수행하여 사용하는 것을 특징으로 하는 화자방향 추정장치.
- 제2 항에 있어서, 상기 위치벡터를 구하는 전달함수는 상기 마이크로폰 어레이가 설치된 이동로봇에서 소정 거리 떨어진 지점에서 일정 각도 간격으로 측정하는 것을 특징으로 하는 화자방향 추정장치.
- 제1 항에 있어서, 상기 화자방향 추정수단은 상기 차이스펙트럼 획득수단으로부터 제공되는 차이스펙트럼에서 최대 피크치를 검출하고, 검출된 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 화자방향 추정장치.
- 제1 항에 있어서, 상기 화자방향 추정수단은 상기 차이스펙트럼 획득수단으로부터 제공되는 차이스펙트럼에서 최대 피크치를 검출하고, 상기 차이스펙트럼의 최대 피크치에 해당하는 방향각을 이용하여 결정되는 후보영역에 해당하는 상기 제1 의사전력 스펙트럼에서 최대 피크치를 검출하고, 상기 제1 의사전력 스펙트럼의 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 화자방향 추정장치.
- 제1 항에 있어서, 상기 화자방향 추정수단은 상기 차이스펙트럼 획득수단으로부터 제공되는 차이스펙트럼에서 첫번째 및 두번째 피크치를 검출하고, 상기 첫번째 및 두번째 피크치의 크기비와 소정의 문턱값와의 비교결과 및 소정의 후보영역에 해당하는 상기 제1 의사전력 스펙트럼에서 피크치의 존재여부에 따라서, 상기 제1 의사전력 스펙트럼의 전체영역과 후보영역 중 어느 하나의 영역에서 최대 피크치를 검출하고, 전체영역과 후보영역 중 어느 하나의 영역에서 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 화자방향 추정장치.
- 제10 항에 있어서, 상기 화자방향 추정수단은 상기 첫번째 및 두번째 피크치의 크기비가 소정의 문턱값보다 큰 경우, 상기 제1 의사전력 스펙트럼의 전체 영역에서 상기 최대 피크치를 검출하는 것을 특징으로 하는 화자방향 추정장치.
- 제10 항에 있어서, 상기 화자방향 추정수단은 상기 첫번째 및 두번째 피크치의 크기비가 소정의 문턱값보다 같거나 작고, 상기 제1 의사전력 스펙트럼에서 후보영역에 최대 피크치가 존재하지 않는 경우, 상기 제1 의사전력 스펙트럼의 전체 영역에서 상기 최대 피크치를 검출하는 것을 특징으로 하는 화자방향 추정장치.
- 제10 항에 있어서, 상기 화자방향 추정수단은 상기 첫번째 및 두번째 피크치의 크기비가 소정의 문턱값보다 같거나 작고, 상기 제1 의사전력 스펙트럼에서 후보영역에 최대 피크치가 존재하는 경우, 상기 제1 의사전력 스펙트럼의 후보영역에서 상기 최대 피크치를 검출하는 것을 특징으로 하는 화자방향 추정장치.
- (a) 마이크로폰 어레이로부터 출력되는 음성신호로부터 검출되는 음성발성구간과 음성비발성구간에 대한 제1 및 제2 의사전력 스펙트럼의 차이스펙트럼을 획득하는 단계; 및(b) 상기 (a) 단계에서 얻어진 상기 차이스펙트럼과 상기 제1 의사전력 스펙트럼 중 어느 하나에서 피크치를 검출하고, 상기 검출된 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 단계를 포함하는 것을 특징으로 하는 화자방향 추정방법.
- 제14 항에 있어서, 상기 (a) 단계는(a1) 상기 마이크로폰 어레이로부터 출력되는 음성신호로부터 음성발성구간을 검출하고, 상기 음성발성구간을 이용하여 음성비발성구간을 검출하는 단계;(a2) 실제 음원과 상기 마이크로폰 어레이간의 전달함수를 이용하여 구해진 위치벡터를 데이터베이스화하는 단계;(a3) 상기 음성발성구간 및 상기 음성비발성구간에 대하여 얻어진 잡음 부분공간에서의 기저벡터에 상기 위치벡터를 프로젝션시켜 제1 의사전력 스펙트럼과 제2 의사전력 스펙트럼을 각각 구하는 단계; 및(a4) 상기 제1 및 제2 의사전력 스펙트럼간의 차이 스펙트럼을 구하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제15 항에 있어서, 상기 (a1) 단계에서는 먼저 음성발성구간을 검출한 다음, 상기 음성발성구간의 이전으로 T1 개의 샘플을 건너 뛴 다음 그 이전 T2 개의 샘플을 선택하여 음성비발성구간으로 검출하는 것을 특징으로 하는 화자방향 추정방법.
- 제15 항에 있어서, 상기 (a1) 단계에서는 단일프레임 음성존재확률로부터 나온 확률값인 제1 파라미터, 연속해서 음성이라고 판정된 프레임 수인 제2 파라미터, 연속해서 음성이 아니라고 판정된 프레임 수인 제3 파라미터, 판단된 음성발성구간에서 음성이라고 판단된 프레임 수와 음성이 아니라고 판단된 프레임 수의 비율인 제4 파라미터, 및 판단된 음성발성구간 내의 총 프레임 수인 제5 파라미터를 이용하여 상기 음성발성구간을 검출하는 것을 특징으로 하는 화자방향 추정방법.
- 제17 항에 있어서, 상기 제1 내지 제5 파라미터의 문턱값은 신호대잡음비에 따라서 적응적으로 조정되는 것을 특징으로 하는 화자방향 추정방법.
- 제18 항에 있어서, 상기 제1 내지 제5 파라미터의 문턱값은 미리 클린환경과 상기 신호대잡음비가 소정 상한값인 환경에서 각각 튜닝한 다음, 상기 신호대잡음비가 중간인 범위에 대해서는 선형보간을 수행하여 사용하는 것을 특징으로 하는 화자방향 추정방법.
- 제15 항에 있어서, 상기 위치벡터를 구하는 전달함수는 상기 마이크로폰 어레이가 설치된 이동로봇에서 소정 거리 떨어진 지점에서 일정 각도 간격으로 측정하는 것을 특징으로 하는 화자방향 추정방법.
- 제14 항에 있어서, 상기 (b) 단계는(b1) 상기 차이스펙트럼에서 최대 피크치를 검출하고, 검출된 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제14 항에 있어서, 상기 (b) 단계는(b1) 상기 차이스펙트럼에서 피크치를 검출하는 단계;(b2) 상기 (b1) 단계에서 검출된 피크치에 해당하는 방향각을 이용하여 후보영역을 결정하는 단계;(b3) 상기 제1 의사전력 스펙트럼의 상기 후보영역에서 피크치를 검출하는 단계; 및(b4) 상기 (b3) 단계에서 검출된 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제14 항에 있어서, 상기 (b) 단계는(b1) 상기 차이스펙트럼에서 첫번째로 피크치와 두번째 피크치를 검출하는 단계;(b2) 상기 첫번째 피크치와 두번째 피크치의 크기비와 소정의 문턱값을 비교하는 단계; 및(b3) 상기 첫번째 피크치와 두번째 피크치의 크기비와 소정의 문턱값의 비교결과 및 상기 제1 의사전력 스펙트럼에서 소정의 후보영역에 피크치의 존재여부에 따라서, 상기 제1 의사전력 스펙트럼의 전체영역과 후보영역 중 어느 하나의 영역에서 피크치를 검출하고, 검출된 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제23 항에 있어서, 상기 (b3) 단계는(b31) 상기 제1 및 제2 피크치의 크기비가 소정의 문턱값보다 큰 경우, 상기 제1 의사전력 스펙트럼의 전체 영역에서 상기 피크치를 검출하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제23 항에 있어서, 상기 (b3) 단계는(b31) 상기 첫번째 피크치 및 두번째 피크치의 크기비가 소정의 문턱값보다 같거나 작은 경우, 상기 첫번째 피크치를 이용하여 후보영역을 결정하는 단계;(b32) 상기 제1 의사전력 스펙트럼에서 상기 후보영역에 피크치가 존재하는지 판단하는 단계;(b33) 상기 후보영역에 피크치가 존재하지 않는 경우, 상기 제1 의사전력 스펙트럼의 전체 영역에서 피크치를 검출하는 단계; 및(b34) 상기 후보영역에 피크치가 존재하는 경우, 상기 제1 의사전력 스펙트럼의 후보영역에서 피크치를 검출하는 단계를 구비하는 것을 특징으로 하는 화자방향 추정방법.
- 제14 항 내지 제25 항 중 어느 한 항에 기재된 방법을 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 마이크로폰 어레이로부터 출력되는 음성신호로부터 검출되는 음성발성구간과 음성비발성구간에 대한 제1 및 제2 의사전력 스펙트럼의 차이스펙트럼과 상기 제1 의사전력 스펙트럼 중 어느 하나에서 피크치를 검출하고, 상기 검출된 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 화자방향 추정부; 및상기 화자방향 추정부에 추정된 화자의 방향에 따라서 카메라 구동모터를 제어하는 구동모터 제어부를 포함하는 것을 특징으로 하는 카메라 제어시스템.
- 제27 항에 있어서, 상기 화자방향 추정부는 상기 차이스펙트럼에서 최대 피크치를 검출하고, 검출된 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 카메라 제어시스템.
- 제27 항에 있어서, 상기 화자방향 추정부는 상기 차이스펙트럼에서 최대 피크치를 검출하고, 상기 차이스펙트럼의 최대 피크치에 해당하는 방향각을 이용하여 결정되는 후보영역에 해당하는 상기 제1 의사전력 스펙트럼에서 최대 피크치를 검출하고, 상기 제1 의사전력 스펙트럼의 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 카메라 제어시스템.
- 제27 항에 있어서, 상기 화자방향 추정부는 상기 차이스펙트럼에서 첫번째 및 두번째 피크치를 검출하고, 상기 첫번째 및 두번째 피크치의 크기비와 소정의 문턱값과의 비교결과 및 소정의 후보영역에 해당하는 상기 제1 의사전력 스펙트럼에서 피크치의 존재여부에 따라서, 상기 제1 의사전력 스펙트럼의 전체영역과 후보영역 중 어느 하나의 영역에서 최대 피크치를 검출하고, 전체영역과 후보영역 중 어느 하나의 영역의 최대 피크치에 해당하는 방향각을 화자의 방향으로 추정하는 것을 특징으로 하는 카메라 제어 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030070981A KR100754384B1 (ko) | 2003-10-13 | 2003-10-13 | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 |
US10/962,516 US7835908B2 (en) | 2003-10-13 | 2004-10-13 | Method and apparatus for robust speaker localization and automatic camera steering system employing the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030070981A KR100754384B1 (ko) | 2003-10-13 | 2003-10-13 | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050035562A KR20050035562A (ko) | 2005-04-19 |
KR100754384B1 true KR100754384B1 (ko) | 2007-08-31 |
Family
ID=34420626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030070981A KR100754384B1 (ko) | 2003-10-13 | 2003-10-13 | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7835908B2 (ko) |
KR (1) | KR100754384B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101002028B1 (ko) | 2008-09-04 | 2010-12-16 | 고려대학교 산학협력단 | 마이크로폰 및 시공간 정보를 이용한 음원 구간 탐지 시스템, 그 방법 및 이를 기록한 기록매체 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100586893B1 (ko) | 2004-06-28 | 2006-06-08 | 삼성전자주식회사 | 시변 잡음 환경에서의 화자 위치 추정 시스템 및 방법 |
US8244542B2 (en) * | 2004-07-01 | 2012-08-14 | Emc Corporation | Video surveillance |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
CN101523775B (zh) * | 2006-10-06 | 2012-04-11 | 艾利森电话股份有限公司 | 用于改进的噪声基底估计的方法和设备 |
EP1933303B1 (en) * | 2006-12-14 | 2008-08-06 | Harman/Becker Automotive Systems GmbH | Speech dialog control based on signal pre-processing |
JP4728982B2 (ja) * | 2007-03-05 | 2011-07-20 | 株式会社東芝 | 利用者と対話する装置、方法およびプログラム |
KR100895430B1 (ko) * | 2007-03-30 | 2009-05-07 | 중앙대학교 산학협력단 | 소리의 세기차를 이용한 음원추적 방법 및 그 장치 |
US8532989B2 (en) * | 2009-09-03 | 2013-09-10 | Honda Motor Co., Ltd. | Command recognition device, command recognition method, and command recognition robot |
JP5622744B2 (ja) * | 2009-11-06 | 2014-11-12 | 株式会社東芝 | 音声認識装置 |
WO2012105386A1 (ja) * | 2011-02-01 | 2012-08-09 | 日本電気株式会社 | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム |
WO2012146757A1 (en) * | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
US9111542B1 (en) * | 2012-03-26 | 2015-08-18 | Amazon Technologies, Inc. | Audio signal transmission techniques |
KR101354960B1 (ko) * | 2012-04-26 | 2014-01-23 | 한국과학기술원 | 영역 개념을 이용한 음파 입사 방향 추정 방법 |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
KR101534781B1 (ko) * | 2014-01-02 | 2015-07-08 | 경상대학교산학협력단 | 음원 방향 추정 장치 |
US9613624B1 (en) * | 2014-06-25 | 2017-04-04 | Amazon Technologies, Inc. | Dynamic pruning in speech recognition |
US9626001B2 (en) | 2014-11-13 | 2017-04-18 | International Business Machines Corporation | Speech recognition candidate selection based on non-acoustic input |
US9881610B2 (en) | 2014-11-13 | 2018-01-30 | International Business Machines Corporation | Speech recognition system adaptation based on non-acoustic attributes and face selection based on mouth motion using pixel intensities |
CN105094136B (zh) * | 2015-09-14 | 2017-09-01 | 桂林电子科技大学 | 自适应麦克风阵列的声音定位救援机器人及其使用方法 |
CN105812995B (zh) * | 2016-03-09 | 2018-11-09 | 西安航空学院 | 一种噪音滤除方法和装置 |
US10199037B1 (en) | 2016-06-29 | 2019-02-05 | Amazon Technologies, Inc. | Adaptive beam pruning for automatic speech recognition |
JP6677614B2 (ja) * | 2016-09-16 | 2020-04-08 | 株式会社東芝 | 会議支援システム、会議支援方法及びプログラム |
US10219098B2 (en) * | 2017-03-03 | 2019-02-26 | GM Global Technology Operations LLC | Location estimation of active speaker |
CN108922553B (zh) * | 2018-07-19 | 2020-10-09 | 苏州思必驰信息科技有限公司 | 用于音箱设备的波达方向估计方法及系统 |
CN109089087B (zh) * | 2018-10-18 | 2020-09-29 | 广州市盛光微电子有限公司 | 多通道影音联动装置 |
CN111402900B (zh) * | 2018-12-29 | 2024-04-23 | 华为技术有限公司 | 一种语音交互方法,设备和系统 |
CN111182209A (zh) * | 2019-12-31 | 2020-05-19 | 维沃移动通信有限公司 | 拍照提示的方法及电子设备 |
US11740327B2 (en) * | 2020-05-27 | 2023-08-29 | Qualcomm Incorporated | High resolution and computationally efficient radar techniques |
US20220148575A1 (en) * | 2020-11-12 | 2022-05-12 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN112951273B (zh) * | 2021-02-02 | 2024-03-29 | 郑州大学 | 基于麦克风阵列和机器视觉的数控机床刀具磨损监控装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05111020A (ja) * | 1991-10-17 | 1993-04-30 | Matsushita Electric Ind Co Ltd | テレビ会議用画面切替制御装置 |
JPH05244587A (ja) * | 1992-02-26 | 1993-09-21 | Mitsubishi Electric Corp | テレビ会議用カメラ制御装置 |
JPH11331827A (ja) | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | テレビカメラ装置 |
KR20000037652A (ko) * | 1998-12-01 | 2000-07-05 | 전주범 | 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법 |
KR20020010952A (ko) * | 2000-07-31 | 2002-02-07 | 김승범 | 마이크로폰 배치를 이용한 화자 위치 추적 시스템 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6157403A (en) * | 1996-08-05 | 2000-12-05 | Kabushiki Kaisha Toshiba | Apparatus for detecting position of object capable of simultaneously detecting plural objects and detection method therefor |
US6469732B1 (en) * | 1998-11-06 | 2002-10-22 | Vtel Corporation | Acoustic source location using a microphone array |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
JP4858663B2 (ja) * | 2001-06-08 | 2012-01-18 | 日本電気株式会社 | 音声認識方法及び音声認識装置 |
GB0120450D0 (en) * | 2001-08-22 | 2001-10-17 | Mitel Knowledge Corp | Robust talker localization in reverberant environment |
US6653973B2 (en) * | 2001-09-07 | 2003-11-25 | Lockheed Martin Corporation | Adaptive digital beamforming radar method and system for maintaining multiple source angle super-resolution capability in jamming |
US7039199B2 (en) * | 2002-08-26 | 2006-05-02 | Microsoft Corporation | System and process for locating a speaker using 360 degree sound source localization |
-
2003
- 2003-10-13 KR KR1020030070981A patent/KR100754384B1/ko active IP Right Grant
-
2004
- 2004-10-13 US US10/962,516 patent/US7835908B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05111020A (ja) * | 1991-10-17 | 1993-04-30 | Matsushita Electric Ind Co Ltd | テレビ会議用画面切替制御装置 |
JPH05244587A (ja) * | 1992-02-26 | 1993-09-21 | Mitsubishi Electric Corp | テレビ会議用カメラ制御装置 |
JPH11331827A (ja) | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | テレビカメラ装置 |
KR20000037652A (ko) * | 1998-12-01 | 2000-07-05 | 전주범 | 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법 |
KR20020010952A (ko) * | 2000-07-31 | 2002-02-07 | 김승범 | 마이크로폰 배치를 이용한 화자 위치 추적 시스템 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101002028B1 (ko) | 2008-09-04 | 2010-12-16 | 고려대학교 산학협력단 | 마이크로폰 및 시공간 정보를 이용한 음원 구간 탐지 시스템, 그 방법 및 이를 기록한 기록매체 |
Also Published As
Publication number | Publication date |
---|---|
US7835908B2 (en) | 2010-11-16 |
KR20050035562A (ko) | 2005-04-19 |
US20050080619A1 (en) | 2005-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100754384B1 (ko) | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 | |
JP4986433B2 (ja) | 物体を認識および追跡する装置及び方法 | |
US11158333B2 (en) | Multi-stream target-speech detection and channel fusion | |
US7277853B1 (en) | System and method for a endpoint detection of speech for improved speech recognition in noisy environments | |
US8775173B2 (en) | Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program | |
JP5328744B2 (ja) | 音声認識装置及び音声認識方法 | |
US20110224980A1 (en) | Speech recognition system and speech recognizing method | |
EP1643769A1 (en) | Apparatus and method performing audio-video sensor fusion for object localization, tracking and separation | |
US10748544B2 (en) | Voice processing device, voice processing method, and program | |
JP2011191423A (ja) | 発話認識装置、発話認識方法 | |
US9786295B2 (en) | Voice processing apparatus and voice processing method | |
KR100822880B1 (ko) | 지능형 로봇 환경에서 오디오-비디오 기반 음원추적을 통한화자 인식 시스템 및 방법 | |
KR101892733B1 (ko) | 켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법 | |
US11264017B2 (en) | Robust speaker localization in presence of strong noise interference systems and methods | |
KR100639968B1 (ko) | 음성 인식 장치 및 그 방법 | |
Valin | Auditory system for a mobile robot | |
Oh et al. | A name recognition based call-and-come service for home robots | |
US8548802B2 (en) | Acoustic data processor and acoustic data processing method for reduction of noise based on motion status | |
Giannoulis et al. | The Athena-RC system for speech activity detection and speaker localization in the DIRHA smart home | |
Lee et al. | Space-time voice activity detection | |
JP2022544065A (ja) | 信号認識または修正のために音声データから抽出した特徴を正規化するための方法および装置 | |
JP7279710B2 (ja) | 信号処理装置および方法、並びにプログラム | |
Hu et al. | Wake-up-word detection for robots using spatial eigenspace consistency and resonant curve similarity | |
Potamitis et al. | Speech activity detection and enhancement of a moving speaker based on the wideband generalized likelihood ratio and microphone arrays | |
Choi et al. | Real-time audio-visual localization of user using microphone array and vision camera |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
B601 | Maintenance of original decision after re-examination before a trial | ||
E801 | Decision on dismissal of amendment | ||
J301 | Trial decision |
Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20060327 Effective date: 20070529 |
|
S901 | Examination by remand of revocation | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120716 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130724 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140721 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150716 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160718 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170719 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180717 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190717 Year of fee payment: 13 |