KR20060041853A

KR20060041853A - 음성 집음 장치와 방법

Info

Publication number: KR20060041853A
Application number: KR1020050011456A
Authority: KR
Inventors: 가즈히로 오키; 히로유키 스즈키
Original assignee: 소니 가부시끼 가이샤
Priority date: 2004-02-13
Filing date: 2005-02-07
Publication date: 2006-05-12
Also published as: EP1564980A1; JP4192800B2; US20050207566A1; TWI298984B; JP2005229433A; TW200601865A; CN1655646A

Abstract

본 발명은 하나의 에코 제거기로 복수개의 마이크로폰의 에코 제거 처리를 수행하는 집음 장치에 관한 것이다. 본 발명의 집음 장치는 마이크로폰 전환시에, 소정 시간 동안 에코 제거기 하나의 학습 처리를 정지하고, 전환되는 마이크로폰과 전환하는 마이크로폰과의 음성 신호를 크로스페이드시키면서, 학습 데이터를 새로운 마이크로폰용의 학습 데이터로 전환, 크로스페이딩 후, 전환 학습 데이터로 에코 제거 처리를 재개한다.

마이크로폰, 집음 장치, 에코 제거 처리, 에코 제거기, 디지털 신호 처리기

Description

음성 집음 장치와 방법{SOUND PICKUP APPARATUS AND METHOD OF THE SAME}

도 1a는 본 발명의 음성 집음 장치가 적용되는 일례로서 회의 시스템을 개략적으로 나타내는 도면이며, 도 1b는 도 1a에 있어서의 음성 집음 장치가 탑재되는 상태를 도면이고, 도 1c는 테이블에 탑재된 음성 집음 장치와 회의 참석자와의 배치를 나타낸 도면이다.

도 2는 본 발명의 실시예의 음성 집음 장치의 사시도이다.

도 3은 도 2에 도시한 음성 집음 장치의 내부 단면도이다.

도 4는 도 3에 도시한 음성 집음 장치의 상부 커버를 제거한 마이크로폰 전자 회로 수용부의 평면도이다.

도 5는 제1 실시예의 마이크로폰 전자 회로 수용부의 주요 회로의 구성 및 접속 상태를 도면으로서, 제1 디지털 신호 처리기(DSP1) 및 제2 디지털 신호 처리기(DSP2)의 접속 상태를 나타내고 있다.

도 6은 도 4에 도시한 마이크로폰의 특성도이다.

도 7a~7d는 도 6에 도시한 특성을 가지는 마이크로폰의 지향성을 분석한 결과를 나타낸 그래프이다.

도 8은 본 발명의 음성 집음 장치의 변형예 부분 구성도이다.

도 9는 제1 디지털 신호 처리기(DSP1)에 있어서의 전체 처리 내용의 개요를 나타낸 그래프이다.

도 10은 본 발명의 실시예의 음성 집음 장치 내의 필터링 처리를 나타낸 도면이다.

도 11은 도 10의 처리 결과를 나타낸 주파수 특성도이다.

도 12는 본 발명의 실시예의 대역 통과 필터링 처리와 레벨 변환 처리를 나타낸 블록도이다.

도 13은 도 12의 처리를 나타낸 흐름도이다.

도 14는 본 발명의 실시예의 음성 집음 장치에 있어서의 발언 개시 및 종료를 판정하는 처리를 나타낸 그래프이다.

도 15는 본 발명의 실시예의 음성 집음 장치에 있어서의 통상 처리의 흐름을 나타낸 그래프이다.

도 16은 본 발명의 실시예의 음성 집음 장치에 있어서의 통상 처리의 흐름을 나타낸 흐름도이다.

도 17은 본 발명의 실시예의 음성 집음 장치에 있어서의 마이크로폰 전환 처리를 도시한 블록도이다.

도 18은 본 발명의 제2 실시예의 음성 집음 장치에 있어서의 마이크로폰 전환 처리의 방법을 도시한 블록도이다.

도 19는 본 발명의 제2 실시예의 음성 집음 장치로서, 도 5에 도시한 음성 집음 장치의 구성 중 제2 DSP(EC)의 구성을 도시한 음성 집음 장치의 부분 도면이다.

도 20은 도 19에 도시한 음성 집음 장치에 있어서의 에코 제거 처리를 나타낸 흐름도이다.

도 21은 제2 실시예의 동작 타이밍의 예를 도시한 도면이다.

< 도면의 주요 부분에 대한 부호의 설명 >

10A, 10B : 음성 집음 장치 11 : 상부 커버

12 : 음 반사판 13 : 연결 부재

14 : 스피커 수용부 15 : 조작부

16 : 수화 재생 스피커 17 : 구속 부재

18 : 댐퍼 2 : 마이크로폰 전자 회로 수용부

MC1~MC : 마이크로폰 21 : 인쇄 회로 기판

22 : 마이크로폰 지지부재

23 : 전체 제어용 마이크로 프로세서(전체 제어부)

24 : 코덱 25 : 제1 DSP

26 : 제2 DSP(에코 제거기) 261 : 에코 제거(EC) 처리부

SW1, SW2 : 스위치 2611, 2612 : 전달 특성 처리부

2614 : 가감산부 2615 : 학습 처리부

263 : 메모리부 264 : EC내 제어 처리부

27 : A/D 변환기 블록 271~274 : A/D 변환기

28 : D/A 변환기 블록 29 : 증폭기 블록

30 : 마이크로폰 선택 결과 표시 수단 301~306 : 가변 이득형 증폭기

본 발명은 예를 들어 2개의 원격 회의실에 있는 다수의 회의 참석자끼리 복수개의 마이크로폰을 사용하여 음성 회의 또는 영상을 부가하여 음성과 함께 텔레비전 회의를 행할 때 바람직하게 이용할 수 있는 바람직한 음성 집음 장치와 그 방법에 관한 것이다.

특히, 본 발명은 복수개의 마이크로폰을 위한 1대의 에코 제거기(echo canceller)로 에코 제거(echo cancellation) 처리를 행하는 음성 집음 장치에 있어서, 마이크로폰을 전환할 때 에코 제거기의 내부 처리를 새로운 마이크로폰에 대한 내부 처리로 즉시 전환하는 것에 의해 발생하는 에코 제거 처리의 문제점을 개선하는 음성 집음 장치와 그 방법에 관한 것이다.

이격된 위치에 있는 2개의 회의실에 있는 회의 참석자끼리 회의를 행하기 위하여, 음성 집음 장치 또는 음성 집음 장치에 촬상 화상(picture image)을 부가한 텔레비전 회의 시스템(TV conference system)이 이용되고 있다.

음성 집음 장치에 있어서는, 복수개의 마이크로폰을 사용하여 말하는 사람 중 상대측 회의실에 송신해야 하는 말하는 사람이 사용하고 있는 마이크로폰을 선택한다.

이와 같은 음성 집음 장치에는, 복수개의 마이크로폰에 대하여 1개의 에코 제거기가 설치되어 있다. 그 이유는 에코 제거기는 통상 고속의 연산 처리가 가능 하지만, 높은 가격의 디지털 신호 처리기서(DSP)로 구현되기 때문에, 1대의 에코 제거기로 복수개의 마이크로폰의 에코 제거 처리를 행하고 있는 것이다.

에코 제거기는 선택된 마이크로폰으로부터의 음성에 대하여 학습 처리를 수행하면서 에코 제거 처리를 행한다. 그러므로, 에코 제거기에는 각 마이크로폰의 에코 제거용 학습 데이터가 유지되어 있다.

1개의 에코 제거기로 복수개의 마이크로폰의 에코 제거 처리를 행하고 있는 경우, 제1 마이크로폰으로부터 제2 마이크로폰으로 전환하는 때, 에코 제거기 내의 학습 데이터가 제2 마이크로폰용의 학습 데이터로 즉시 전환되면, 제2 마이크로폰의 음성을 제1 마이크로폰용의 학습 데이터로 에코 제거의 처리가 이루어지는 상황이 발생한다.

즉, 에코 제거기 내의 학습 처리에 의해 얻어진 각 마이크로폰용 학습 데이터는 소정 시간 계속해서 얻어진 음성 데이터에 기초하고 있기 때문이다.

본 발명의 목적은 복수개의 마이크로폰을 1개의 에코 제거기로 에코 제거 처리를 행하는 음성 집음 장치에 있어서, 제1 마이크로폰으로부터 제2 마이크로폰으로 전환하고자 할 때, 바람직하지 못한 에코 제거의 처리가 생기지 않도록 하는 음성 집음 장치와 방법을 제공하는 것에 있다.

[참고문헌 1] 일본 특허공개 2003-87887호 공보

[참고문헌 2] 일본 특허공개 2003-87890호 공보

본 발명의 제1 특징에 의하면 소정 배치 조건에 따라 배치된 복수개의 마이크로폰과, 상기 복수개의 마이크로폰의 집음 신호를 검출하고 상기 검출한 집음 신호 중 유효한 집음 신호를 검출한 마이크로폰을 선택하는 마이크로폰 선택 수단과, 상기 선택된 마이크로폰의 음 신호(sound signal)에 대하여 에코 제거 처리를 행하는 에코 제거 처리 수단과, 상기 마이크로폰의 음 신호 전환을 할 때 소정 시간 동안 상기 에코 제거 처리를 정지시키는 에코 제거 처리 제어 수단을 구비하는 음성 집음 장치가 제공된다.

바람직하게는, 상기 마이크로폰 선택 수단은 새로운 마이크로폰의 집음 신호를 선택하여 출력할 때, 이전에 선택한 마이크로폰의 집음 신호와 새로운 마이크로폰의 집음 신호를 크로스페이드(cross-fade)시키고, 상기 에코 제거 처리 제어 수단은 상기 크로스페이드의 기간에 상기 에코 제거 처리를 정지시킨다.

본 발명의 제2 특징에 의하면, 소정 배치 조건에 따라 배치된 복수개의 마이크로폰의 집음 신호를 검출하고 상기 검출한 집음 신호 중 유효한 집음 신호를 검출한 마이크로폰을 선택하는 마이크로폰 선택 단계와, 상기 선택된 마이크로폰의 음 신호에 대하여 에코 제거 처리를 행하는 에코 제거 처리 단계와, 마이크로폰 선택 단계에서 상기 마이크로폰의 음 신호 전환시에 소정 시간 동안 상기 에코 제거 처리를 정지시키는 에코 제거 처리 제어 단계를 포함하는 음성 집음 방법이 제공된다.

본 발명에 의하면, 마이크로폰을 선택(변경)함에 있어서 에코 제거 처리를 정지시킴으로써 에코 제거 처리가 부자연스럽게 되는 것을 방지할 수 있게 된다.

본 발명의 이들 목적 및 다른 목적들과 특징들은 첨부 도면을 참조하여 바람직한 실시예의 이하 설명으로부터 더 명확하게 될 것이다.

제1 실시예

이하, 본 발명의 실시예의 음성 집음 장치에 대하여 설명한다.

도 1a~1c는 본 발명의 실시예의 음성 집음 장치가 적용되는 일례를 나타낸 구성도이다.

도 1a에 도시한 것처럼, 2개의 회의실(901, 902) 각각에 제1 및 제2 음성 집음 장치(10A, 10B)가 설치되어 있고, 이들 음성 집음 장치(10A, 10B)가 통신 회선(920), 예를 들어 전화 회선으로 접속되어 있다.

[음성 집음 장치의 개요]

통상적으로, 통신 회선(920)을 통한 대화는 한 명의 말하는 사람과 다른 말하는 사람 끼리, 즉 1대 1로 통화를 행하지만, 본 발명의 실시예에 의한 통화 장치에 의하면 1개의 통신 회선(920)을 사용하여 회의실(901, 902) 내의 복수개의 회의 참석자끼리 통화가 가능하게 된다. 다만, 본 실시예에 있어서는 음성의 혼잡을 회피하기 위하여, 동일 시간대(같은 시간대)에서 말하는 사람은 한쪽에 한 명으로 한정된다.

이와 같이, 음성 집음 장치는 통화자를 선택(특정)하고 선택한 통화자의 음성을 집음한다.

집음 한 음성과 촬상한 영상은 상대측 회의실에 전송되고, 상대측의 음성 집음 장치에서 재생된다.

통화 장치의 상세한 설명

도 2 내지 도 4를 참조하여 본 발명의 실시예에 따른 음성 집음 장치에 있어서의 통화 장치의 구성에 대하여 설명한다. 제1 음성 집음 장치(10A)나 제2 음성 집음 장치(10B)는 유사한 구성을 갖는다.

도 2는 본 발명의 일실시예에 따른 음성 집음 장치의 사시도이다.

도 3은 도 2에 도시한 음성 집음 장치의 단면도이다.

도 4는 도 2 및 도 3에 도시한 음성 집음 장치의 마이크로폰 전자 회로 수용부의 평면도이며, 도 3의 선 X－X을 따라 취한 평면도이다.

도 2에 도시한 것처럼, 음성 집음 장치는 상부 커버(11), 음 반사판(12), 연결 부재(13), 스피커 수용부(14) 및 조작부(15)를 가진다.

도 3에 도시한 것처럼, 스피커 수용부(14)는 음 반사면(14a), 바닥면(14b) 및 상부 음 출력 개구부(14c)를 가진다. 음 반사면(14a)과 바닥면(14b)으로 포위된 공간, 즉 내부 캐비티(14d)에 수화 재생 스피커(16)가 수용되어 있다. 스피커 수용부(14)의 상부에 음 반사판(12)이 위치한다. 스피커 수용부(14)와 음 반사판(12)은 연결 부재(13)에 의해 연결되어 있다.

연결 부재(13) 내에는 구속 부재(restraint member)(17)가 관통하고 있다. 이 구속 부재(17)는 스피커 수용부(14)의 바닥면(14b)의 구속 부재 하부 고정부(14e)와 음 반사판(12)의 구속 부재 고정부(12b) 사이의 공간을 구속하고 있다. 다만, 구속 부재(17)는 스피커 수용부(14)의 구속 부재 관통부(14f)를 관통하고 있을 뿐이다. 구속 부재(17)가 구속 부재 관통부(14f)를 관통하면서 구속하지는 않 는 것은, 스피커(16)의 동작에 의해 스피커 수용부(14)가 진동하지만, 그 진동을 상부음 출력 개구부(14c)의 주위에 있어서는 구속시키지 않기 때문이다.

상대 회의실의 말하는 사람이 이야기한 음성은 수화 재생 스피커(receiving and reproduction speaker: 16)를 통하여 상부음 출력 개구부(14c)로부터 빠져나와, 음 반사판(12)의 음 반사면(12a)과 스피커 수용부(14)의 음 반사면(14a)으로 규정된 공간을 따라 축 C－C를 중심으로 하여 360도에 걸쳐 확산된다. 음 반사판(12)에 있는 음 반사면(12a)의 단면은 도시한 것처럼 완만한 나팔모양의 호를 형성하고 있다. 음 반사면(12a)의 단면은 축 C－C를 중심으로 하여 360도에 걸쳐(전방위에 걸쳐), 도시한 단면 형상을 하고 있다. 마찬가지로 스피커 수용부(14)의 음 반사면(14a)의 단면도 도시한 것처럼 완만한 볼록면을 형성하고 있다. 음 반사면(14a)의 단면도 축 C－C를 중심으로 하여 360도에 걸쳐(전방위에 걸쳐), 도시한 단면 형상을 하고 있다.

수화 재생 스피커(16)로부터 출력된 음 S는 상부음 출력 개구부(14c)를 빠져나와, 음 반사면(12a)과 음 반사면(14a)으로 규정되고 단면이 나팔모양인 음 출력 공간을 거쳐, 음성 집음 장치가 탑재되어 있는 테이블(911)의 면을 따라, 축 C－C를 중심으로 하여 360도의 전방위로 확산됨으로써, 모든 회의 참석자(A1~A6)가 동일한 음량으로 들을 수 있게 된다. 본 실시예에 있어서는 테이블(911)의 면도 음 전파 수단의 일부로서 이용하고 있다.

수화 재생 스피커(16)로부터 출력된 음 S의 확산 상태를 화살표로 나타내고 있다.

음 반사판(12)은 인쇄 회로 기판(21)을 지지하고 있다.

인쇄 회로 기판(21)에는 도 4의 평면에서 도시한 것처럼, 마이크로폰 전자 회로 수용부(2)의 마이크로폰(MC1~MC6), 발광 다이오드(LED1~LED6), 마이크로 프로세서(23), 코덱(CODEC)(24), 제1 디지털 신호 처리기(DSP)(25), 제2 디지털 신호 처리기(DSP)(26), A/D 변환기 블록(27), D/A 변환기 블록(28), 증폭기 블록(29) 등의 각종 전자 회로가 탑재되어 있고, 음 반사판(12)은 마이크로폰 전자 회로 수용부(2)를 지지하는 부재로서도 기능하고 있다.

인쇄 회로 기판(21)에는 수화 재생 스피커(16)로부터의 진동이 음 반사판(12)을 통해 전달되고 마이크로폰(MC1~MC6) 등으로 진입하여 소음이 되지 않도록 하기 위하여, 수화 재생 스피커(16)로부터의 진동을 흡수하는 댐퍼(18)가 장착되어 있다. 댐퍼(18)는 나사와, 이 나사 및 인쇄 회로 기판(21) 사이에 삽입된 방진 고무(vibration-absorbing rubber) 등의 완충재로 이루어진다. 완충재는 인쇄 회로 기판(21)에 나사 고정된다. 즉, 완충재에 의해 수화 재생 스피커(16)로부터 인쇄 회로 기판(21)에 전달되는 진동이 흡수되는 것이다. 이에 의하여, 마이크로폰(MC1~MC6)은 스피커(16)로부터의 음의 영향을 받지 않게 된다.

마이크로폰의 배치

도 4에 도시한 것처럼, 인쇄 회로 기판(21)의 중심축 C로부터 등 각도(equal angle)로 방사상으로 또한 등 간격(60도의 간격)으로 6개의 마이크로폰(MC1~MC6)이 위치하고 있다. 각 마이크로폰은 단일 지향성을 가지는 마이크로폰이다. 그 특성 에 대해서는 후술한다.

각 마이크로폰(MC1~MC6)은 유연성 또는 탄력성이 있는 제1 마이크 지지부재(22a)와 제2 마이크 지지부재(22b)에 의해 요동 가능하게 지지되어 있고(도면 표시를 간단하게 하기 위하여, 마이크로폰(MC1)의 일부인 제1 마이크 지지부재(22a)와 제2 마이크 지지부재(22b)에 대해서만 도시되어 있다). 전술한 완충재를 사용한 댐퍼(18)에 의한 수화 재생 스피커(16)로부터의 진동의 영향을 받지 않는 대책에 추가로, 유연성 또는 탄력성이 있는 제1 마이크 지지부재(22a)와 제2 마이크 지지부재(22b)에 의해 수화 재생 스피커(16)로부터의 진동으로 진동하는 인쇄 회로 기판(21)의 진동을 흡수함으로써 수화 재생 스피커(16)의 진동의 영향을 받지 않게 하는 것으로 수화 재생 스피커(16)의 소음을 회피하고 있다.

도 3에 도시한 것처럼, 수화 재생 스피커(16)는 마이크로폰(MC1~MC6)이 위치하는 평면의 중심축 C－C에 대하여 수직으로 지향하고 있다(본 실시예에 있어서는 상측 방향으로 향하고(지향하고) 있다). 이와 같은 수화 재생 스피커(16)와 6개의 마이크로폰(MC1~MC6)의 배치에 의하여, 수화 재생 스피커(16)와 각 마이크로폰(MC1~MC6)의 거리는 등 거리가 되고, 수화 재생 스피커(16)로부터의 음성은 각 마이크로폰(MC1~MC6)에 대해 대략 동일한 음량 및 동일한 위상으로 도달하게 된다. 다만, 전술한 음 반사판(12)의 음 반사면(12a) 및 스피커 수용부(14)의 음 반사면(14a)의 구성에 의하여, 수화 재생 스피커(16)의 음이 마이크로폰(MC1~MC6)에는 직접 입력되지 않도록 하고 있다. 또한, 전술한 바와 같이 완충재를 사용한 댐퍼(18)와 유연성 또는 탄력성이 있는 제1 마이크 지지부재(22a) 및 제2 마이크 지지부재(22b)를 사용함으로써, 수화 재생 스피커(16)의 진동의 영향을 저감시키고 있 다.

회의 참석자(A1~A6)는 통상적으로, 예를 들어 도 1c에 예시한 것처럼 통화 장치의 주위 360도 방향에서 60도 간격으로 설치되어 있는 마이크로폰(MC1~MC6)의 부근에 대략 등 간격으로 위치하고 있다.

말하는 사람이 누구인지 결정한 것을 통보하는 수단(마이크로폰 선택 결과 표시 수단)으로서, 발광 다이오드(LED1~6)가 마이크로폰(MC1~MC6)의 부근에 배치되어 있다. 발광 다이오드(LED1~6)는 상부 커버(11)를 장착한 상태에서도, 모든 회의 참석자(A1~A6)가 볼 수 있도록 형성되어 있다. 따라서, 상부 커버(11)에는 발광 다이오드(LED1~6)의 발광 상태를 볼 수 있도록 투명창이 형성되어 있다. 물론, 상부 커버(11)에 있어서 발광 다이오드(LED1~6)의 부분에 개구가 설치되어 있어도 되지만, 마이크로폰 전자 회로 수용부(2)에의 방진(防塵)을 위한 것이라면 투광창이 바람직하다.

인쇄 회로 기판(21)에는 후술하는 각종의 신호 처리를 행하기 위하여, 제1 디지털 신호 처리기(DSP1)(25), 제2 디지털 신호 처리기(DSP2)(26) 및 각종 전자 회로(27~29)가 마이크로폰(MC1~MC6)이 위치하는 부분 이외의 공간에 배치되어 있다.

본 실시예에 있어서는, DSP(25)를 각종 전자 회로(27~29)와 함께 필터 처리, 마이크로폰 선택 처리 등의 처리를 행하는 신호 처리 수단으로서 사용하고, DSP(26)를 에코 제거기로서 사용하고 있다.

도 5는 마이크로 프로세서(23), 코덱(24), DSP(25), DSP(26), A/D 변환기 블 록(27), D/A 변환기 블록(28), 증폭기 블록(29), 및 기타 다른 각종의 전자 회로를 개략적으로 나타내는 구성도이다.

마이크로 프로세서(23)는 마이크로폰 전자 회로 수용부(2)의 전체 제어 처리를 행한다.

코덱(24)은 상대방 회의실에 송신하는 음성을 압축 부호화한다.

DSP(25)는 아래에 설명하는 것과 같이, 각종의 신호 처리, 예를 들어 필터 처리, 마이크로폰 선택 처리 등을 행한다.

DSP(26)는 에코 제거기로서 기능한다.

도 5에 있어서는, A/D 변환기 블록(27)의 일례로서 4개의 A/D 변환기(271~274)를 예시하고 있으며, D/A 변환기 블록(28)의 일례로서 2개의 D/A 변환기(281, 282)를 예시하고 있고, 증폭기 블록(29)의 일례로서 2개의 증폭기(291, 292)를 예시하고 있다.

그 외에, 마이크로폰 전자 회로 수용부(2)로서 전원 회로 등 각종의 회로가 인쇄 회로 기판(21)에 탑재되어 있다.

도 4에 있어서, 인쇄 회로 기판(21)의 중심축 C에 대하여 각각 대칭(또는 대향) 위치의 일직선 상에 설치된 한 쌍의 마이크로폰(MC1－MC4, MC2－MC5, MC3－M6)이 각각 2채널의 아날로그 신호를 디지털 신호로 변환하는 A/D 변환기(271~273)에 입력되어 있다. 본 실시예에 있어서는, 1개의 A/D 변환기가 2채널의 아날로그 입력 신호를 디지털 신호로 변환한다. 그래서, 중심축 C를 중간에 두고 일직선 상에 위치하는 2개(1쌍)의 마이크로폰, 예를 들어 마이크로폰 MC1과 MC4의 검출 신호를 1개의 A/D 변환기에 입력하여 디지털 신호로 변환하고 있다.

또, 본 실시예에 있어서는, 상대의 회의실에 송출하는 음성의 말하는 사람을 특정하기 위하여, 일직선 상에 위치하는 2개의 마이크로폰의 음성의 차, 음성의 크기 등을 참조하기 때문에, 일직선 상에 위치하는 2개의 마이크로폰의 신호를 같은 A/D 변환기에 입력하면, 변환 타이밍도 대략 동일하게 된다. 이에 따라, 2개의 마이크로폰의 음성 출력의 차를 취할 때 타이밍 오차가 작게 되어 신호 처리가 용이하게 되는 등의 이점이 있다.

그리고, A/D 변환기(271~274)는 가변 이득형 증폭 기능을 가지는 A/D 변환기(271~274)로 구성하는 것도 가능하다.

A/D 변환기(271~273)에서 변환된 마이크로폰(MC1~MC6)의 집음 신호는 DSP(25)에 입력되어, 후술하는 각종의 신호 처리가 행해진다.

DSP(25)의 처리 결과의 하나로서, 마이크로폰(MC1~MC6) 중의 하나를 선택한 결과가, 마이크로폰 선택 결과 표시 수단의 일례인 발광 다이오드(LED1~6)에 출력된다.

DSP(25)의 처리 결과는 DSP(26)에 출력되어 에코 제거 처리가 행해진다. DSP(26)는 예를 들어 에코 제거 송화 처리부와 에코 제거 수화부를 가진다.

DSP(26)의 처리 결과가 D/A 변환기(281, 282)에서 아날로그 신호로 변환된다. D/A 변환기(281)로부터의 출력이 필요에 따라 코덱(24)에서 부호화되어, 증폭기(291)를 통하여 통신 회선(920)(도 1a)의 라인아웃(LINE OUT) 단자에서 출력되고, 상대방 회의실에 설치된 통화 장치의 수화 재생 스피커(16)를 통하여 음으로서 출력된다.

상대방의 회의실에 설치된 통화 장치로부터의 음성이 통신 회선(920)(도 1a)의 라인인(LINE IN) 단자를 통하여 입력되고, A/D 변환기(274)에서 디지털 신호로 변환되며, DSP(26)에 입력되어 에코 제거 처리에 사용된다. 또, 상대방의 회의실에 설치된 통화 장치로부터의 음성은 도시하지 않은 경로로 스피커(16)에 인가되어 음으로서 출력된다.

D/A 변환기(282)로부터의 출력이 증폭기(292)를 통하여 통화 장치의 수화 재생 스피커(16)로부터 음으로서 출력된다. 즉, 회의 참석자(A1~A6)는 전술한 수화 재생 스피커(16)로부터 상대 회의실의 선택된 말하는 사람의 음성에 더하여, 그 회의실에 있는 발언자가 말한 음성도 수화 재생 스피커(16)를 통하여 청취할 수 있게 된다.

마이크로폰 MC1~MC6

도 6은 각 마이크로폰(MC1~MC6)의 지향성을 나타낸 그래프이다.

단일 지향 특성을 갖는 각 마이크로폰은 발언자로부터 마이크로폰으로의 음성의 도달 각도에 의해, 도 6에 도시된 바와 같이 주파수 특성 및 레벨 특성이 변화한다. 복수개의 곡선은 집음 신호의 주파수가 100Hz, 150Hz, 200Hz, 300Hz, 400Hz, 500Hz, 700Hz, 1000Hz, 1500Hz, 2000Hz, 3000Hz, 4000Hz, 5000Hz, 7000Hz 일 때의 지향성을 나타내고 있다. 다만, 도시를 간단하게 하기 위하여, 도 7은 대표적으로 150Hz, 500Hz, 1500Hz, 3000Hz, 7000Hz에 대한 지향성을 나타내고 있다.

도 7a~7d는 음원(sound source)의 위치와 마이크로폰의 집음 레벨의 분석 결 과를 나타낸 그래프이며, 통화 장치와 소정 거리, 예를 들어 1.5 미터의 거리에 스피커를 두어 각 마이크로폰이 집음한 음성을 일정 시간 간격으로 고속 푸리에 변환(FFT: Fast Fourier Transforms)한 결과를 나타내고 있다. X축이 주파수를, Y축이 신호 레벨을, Z축이 시간을 나타내고 있다.

도 6에 도시된 지향성을 가지는 마이크로폰을 사용하는 경우, 마이크로폰의 정면에 강한 지향성이 나타나 있다. 본 실시예에 있어서는, 이와 같은 특성을 활용하여 DSP(25)에서 마이크로폰의 선택 처리를 행한다.

본 발명의 실시예와 같이 지향성을 가지는 마이크로폰이 아닌 무지향성의 마이크로폰을 사용할 경우, 마이크로폰 주변의 모든 음을 집음하게 되므로 발언자의 음성과 주변 노이즈와의 S/N이 혼합되어, 양호하지 않은 음이 집음될 수 있다. 이것을 피하기 위하여, 본 발명에 있어서는 지향성 마이크로폰 1개로 집음함으로써 주변의 노이즈와의 S/N을 개선하고 있다.

또한, 마이크로폰의 지향성을 얻는 방법으로서, 복수개의 무지향성 마이크로폰을 사용한 마이크로폰 어레이를 사용할 수 있다. 이와 같은 방법에서는 복수개의 신호의 시간축(위상)의 일치를 위해 복잡한 처리가 요구되기 때문에, 시간이 많이 걸리고 응답성이 낮으며 장치 구성이 복잡하게 된다. 즉, DSP의 신호 처리 시스템에도 복잡한 신호 처리가 필요하게 된다. 본 발명은 도 5에 예시한 지향성이 있는 마이크로폰을 사용하여 그와 같은 문제를 해결하고 있다.

또, 마이크로폰 어레이 신호를 합성하여 지향성 집음 마이크로폰으로서 이용하기 위해서는, 외형 형상이 통과 주파수(pass frequency) 특성에 의해 규제되고 외형 형상이 커지게 되는 단점이 있다. 본 발명은 이 문제도 해결하고 있다.

전술한 구성의 음성 집음 장치는 아래와 같은 이점을 갖는다.

(1) 등 각도로 방사상으로 또한 등 간격으로 설치된 짝수개의 마이크로폰(MC1~MC6)과 수화 재생 스피커(16)의 위치 관계가 일정하고, 또 그 거리가 매우 가깝기 때문에, 수화 재생 스피커(16)로부터 출력되는 음이 회의실(방) 환경을 거쳐 마이크로폰(MC1~MC6)으로 되돌아오는 레벨보다 직접 되돌아오는 레벨이 압도적으로 크고 또한 지배적이다. 그러므로, 스피커(16)로부터 마이크로폰(MC1~MC6)에 음이 도달하는 특성(신호 레벨(강도), 주파수 특성(f 특성) 및 위상)이 항상 동일하다. 즉, 본 발명의 실시예에 따른 음성 집음 장치에 있어서는 전달 함수(transmission function)가 항상 동일하다는 이점을 갖는다.

(2) 그러므로, 말하는 사람이 상이한 시간에 상대방 회의실에 송출하는 마이크로폰의 출력을 전환할 때의 전달 함수의 변화가 없고, 마이크로폰을 전환할 때마다 마이크로폰 시스템의 이득을 조정할 필요가 없다는 이점을 가진다. 즉, 통화 장치의 제조시에 한 번 조정하는 것으로 다시 조정할 필요가 없다는 이점이 있다.

(3) 상기와 같은 이유로, 말하는 사람이 상이한 시간에 마이크로폰을 전환해도, 에코 제거기(DSP)(26)는 하나로 충분하다. 각종의 부재가 탑재되어 빈 공간이 적은 인쇄 회로 기판(21)에 고가의 DSP를 복수개 배치할 필요가 없고, 인쇄 회로 기판(21)에서의 DSP 배치 공간도 작아지게 된다. 그 결과, 인쇄 회로 기판(21), 또한 본 발명의 음성 집음 장치를 소형으로 할 수 있다.

(4) 전술한 바와 같이, 수화 재생 스피커(16)와 마이크로폰(MC1~MC6)간의 전 달 함수가 일정하므로, 예를 들어 ±3 dB의 마이크로폰 자체의 감도 차(sensitivity difference) 조정을 통화 장치의 마이크로폰 장치 단독으로 할 수 있다는 이점이 있다. 감도 차 조정에 대한 자세한 설명은 후술한다.

(5) 음성 집음 장치가 탑재되는 테이블은 통상적으로 원형 테이블(원형 탁자) 또는 다각형 테이블을 사용함으로써, 음성 집음 장치 내의 하나의 수화 재생 스피커(16)로 균일한 품질의 음성을 축 C를 중심으로 하여 360도 전방위에 걸쳐 균등하게 분산(확산)하는 스피커 시스템이 가능하게 된다.

(6) 수화 재생 스피커(16)로부터 나온 음은 원형 탁자의 테이블 면으로 전달되어(바운더리 효과), 회의 참석자까지 유효하며 효율적이고 균등하게 상질의 음이 도달하게 되며, 회의실의 천장 방향에 대하여 대향측의 음과 위상이 제거되어 작은 음으로 되고, 회의 참석자에 대하여 천장 방향으로부터의 반사 음이 적어지게 됨으로써, 참가자에게 명료한 음이 제공된다는 이점이 있다.

(7) 수화 재생 스피커(16)로부터 나온 음은 등 각도로 방사상으로 또한 등 간격으로 설치된 모든 마이크로폰(MC1~MC6)에 동시에 동일한 음량으로 도달하므로 발언자의 음성인지 수화자의 음성인지의 판단이 용이하게 된다. 그 결과, 마이크로폰 선택 처리의 잘못된 판별이 줄어들게 된다. 이에 대하여 자세한 것은 후술한다.

(8) 짝수개, 예를 들어 6개의 마이크로폰을 등 각도로 방사상으로 또한 등 간격으로 대향하고 있는 한 쌍의 마이크로폰을 일직선 상에 배치한 것으로 방향 검출을 위한 레벨 비교가 용이하게 할 수 있다.

(9) 댐퍼(18), 마이크로폰 지지부재(22) 등에 의하여, 수화 재생 스피커(16)의 음에 의한 진동이 마이크로폰(MC1~MC6)의 집음에 미치는 영향을 저감할 수 있다.

(10) 도 3에 도시한 것처럼, 구조적으로 수화 재생 스피커(16)의 음이 직접 마이크로폰(MC1~MC6)에 전달되지 않는다. 따라서, 이 음성 집음 장치에 있어서는 수화 재생 스피커(16)로부터의 노이즈의 영향이 적다.

변형예

도 2 및 도 3을 참조하여 설명한 음성 집음 장치는 하부에 수화 재생 스피커(16)를 배치하고 상부에 마이크로폰(MC1~MC6)(및 관련된 전자 회로)을 배치하고 있지만, 수화 재생 스피커(16)와 마이크로폰(MC1~MC6)(및 관련된 전자 회로)의 위치를 도 8에 도시한 것처럼 상하 반대로 할 수도 있다. 이와 같은 경우라도 전술한 효과를 갖는다.

마이크로폰의 개수는 6개로 한정되지 않고, 4개, 8개 등과 같이 임의의 짝수 개의 마이크로폰을 등 각도로 방사상으로 또한 등 간격으로 축 C를 중심으로 복수개 각각을 일직선으로(동일 방향으로), 예를 들어 마이크로폰 MC1 및 MC4를 일직선으로 배치할 수 있다. 바람직한 형태로서, 2개의 마이크로폰 MC1 및 MC4를 대향시켜 일직선으로 배치하는 이유는, 마이크로폰을 선택하여 말하는 사람을 특정하기 위해서이다.

신호 처리의 내용

이하에서는, 주로 제1 디지털 신호 처리기(DSP)(25)에서 행하는 처리 내용에 대하여 설명한다.

도 9는 DSP(25)가 행하는 음성 집음 장치에 있어서의 처리의 개요를 도시한 도면이다. 이하, 이에 대하여 간단히 설명한다.

(1) 주위 노이즈의 측정

초기 동작으로서, 바람직하게는 설치된 음성 집음 장치(10A) 주위의 노이즈를 측정한다.

음성 집음 장치는 각종의 환경(회의실)에서 사용될 수 있다. 마이크로폰의 선택을 정확하게 하여 음성 집음 장치의 성능을 높이기 위해서, 본 발명에 있어서는 초기 단계에서 음성 집음 장치가 설치되는 주위 환경의 노이즈를 측정하고, 그 노이즈의 영향을 마이크로폰으로 집음한 신호로부터 배제하는 것을 가능하게 한다.

물론, 음성 집음 장치를 같은 회의실에서 반복하여 사용하는 같은 경우, 사전에 노이즈 측정을 하고 있어 노이즈 상태가 변화하지 않는 것과 같은 경우에는 이 처리를 생략할 수 있다. 그리고, 노이즈 측정은 통상적인 상태에서도 행할 수 있다.

(2) 의장(chairman)의 선정

예를 들어, 음성 집음 장치를 양방향 회의에 사용하는 경우, 각각의 회의실에 의사 운영을 정리하는 의장이 있는 것이 좋다. 따라서, 본 발명의 하나의 특징으로서, 음성 집음 장치를 사용하는 초기 단계에서 음성 집음 장치의 조작부(15)에 의해 의장을 설정한다. 의장의 설정 방법법으로서는, 예를 들어 조작부(15)의 부근에 위치하는 제1 마이크로폰(MC1)을 의장용 마이크로폰으로 한다. 물론, 의장용 마이크로폰을 임의의 것으로 할 수도 있다.

그리고, 음성 집음 장치를 반복하여 사용하는 의장이 동일한 경우는 이 처리를 생략할 수 있다. 또는, 사전에 의장이 앉는 위치에 마이크로폰을 미리 결정해 두어도 된다. 이 경우는, 그 때마다 의장의 선정 동작은 불필요하다.

물론, 의장의 선정은 초기 상태에 한정되지 않고 임의의 타이밍에 행할 수 있다.

(3) 마이크로폰의 감도 차 조정

초기 동작으로서, 바람직하게는 수화 재생 스피커(16)와 마이크로폰(MC1~MC6)의 음향 결합이 동일하게 되도록, 마이크로폰(MC1~MC6)의 신호를 증폭하는 증폭부의 이득 또는 감쇠부의 감쇠값을 자동적으로 조정한다.

통상적인 처리로 아래와 같이 예시하는 각종의 처리를 행한다.

(1) 마이크로폰의 선택 및 전환 처리

1개의 회의실에 동시에 복수개의 회의 참석자가 통화하면, 음성이 뒤섞여 상대측 회의실 내의 회의 참석자(A1~A6)가 듣기 어렵게 된다. 그래서, 본 발명에 있어서는 원칙적으로 소정의 시간대에 1명씩 통화하도록 한다. 이를 위하여, DSP(25)에서 마이크로폰의 선택 및 전환 처리를 행한다.

그 결과, 선택된 마이크로폰으로부터의 통화만이 통신 회선(920)을 통하여 상대방 회의실의 음성 집음 장치로 전송되어 스피커로부터 출력된다. 물론, 도 5를 참조하여 설명한 바와 같이, 선택된 말하는 사람의 마이크로폰 부근의 LED가 점등하고, 또한 그 방의 음성 집음 장치의 스피커로부터도 선택된 말하는 사람의 음 성을 들을 수 있어, 누가 허가된 말하는 사람인지를 인식할 수 있게 된다.

이 처리는 발언자쪽으로 대향해 있는 단일의 지향성 마이크의 신호를 선택하고, 송화 신호로서 상대방에게 양호한 S/N을 갖는 신호를 보내는 것을 목적으로 하고 있다.

(2) 선택한 마이크로폰의 표시

말하는 사람의 마이크로폰이 선택되어 말하는 것이 허가된 회의 참석자의 마이크로폰이 어떤 것인지를, 회의 참석자(A1~A6) 전원이 용이하게 인식 가능하도록 하기 위하여, 마이크로폰 선택 결과 표시 수단, 예를 들어 발광 다이오드(LED1~6) 중의 해당하는 것을 점등시킨다.

(3) 신호 처리

전술한 마이크로폰 선택 처리의 배경 기술로서 또는 마이크로폰 선택 처리를 정확하게 수행하기 위해, 아래와 같이 예시하는 각종의 신호 처리를 행한다.

(a) 마이크로폰의 집음 신호의 대역 분리와 레벨 변환의 처리

(b) 발언의 개시 및 종료의 판정 처리

발언자 방향으로 대향해 있는 마이크 신호의 선택 판정 개시 트리거로서 사용하기 위한 것임.

(c) 발언자 방향에서의 마이크로폰의 검출 처리

각 마이크로폰의 집음 신호를 분석하고, 발언자가 사용하고 있는 마이크로폰을 판정하기 위한 것임.

(d) 발언자 방향에서의 마이크로폰의 전환 타이밍 판정 처리 및 검출된 발언 자에게 대향하고 있는 마이크 신호의 선택 전환 처리

전술한 처리 결과로부터 선택한 마이크로폰로 전환의 지시를 한다.

(e) 통상적인 동작시의 플로어 노이즈(floor noise)의 측정

플로어(환경) 노이즈의 측정

이 처리는 음성 집음 장치의 전원 투입 직후의 초기 처리와 통상 처리로 나누어진다.

그리고, 이 처리는 아래와 같은 예시적인 전제 조건하에 행해진다.

(1) 조건 : 측정 시간 및 임계 잠정값:

1. 테스트 톤 음압: 마이크로폰 신호 레벨에서 -40 dB

2. 노이즈 측정 단위시간: 10초

3. 통상 상태에서의 노이즈 측정: 10초간의 측정 결과로 평균값을 계산하고, 또 이것을 10회 반복하여 평균값을 필요한 노이즈 레벨로 한다.

(2) 플로어 노이즈와 발언 개시 기준 레벨의 차에 의한 유효 거리의 기준과 임계값

1. 26 dB 이상: 3미터 이상

발언 개시의 검출 레벨 임계값: 플로어 노이즈 레벨 + 9 dB

발언 종료의 검출 레벨 임계값: 플로어 노이즈 레벨 + 6 dB

2. 20~26 dB: 3미터 이내

발언 개시의 검출 레벨 임계값: 플로어 노이즈 레벨 + 9 dB

발언 종료의 검출 레벨 임계값: 플로어 노이즈 레벨 + 6 dB

3. 14~20 dB: 1.5미터 이내

발언 개시의 검출 레벨 임계값: 플로어 노이즈 레벨 + 9 dB

발언 종료의 검출 레벨 임계값: 플로어 노이즈 레벨 + 6 dB

4. 9~14 dB: 1미터 이내

발언 개시의 검출 레벨 임계값: 플로어 노이즈 레벨과 발언 개시 기준 레벨의 차 ÷ 2 + 2 dB

발언 종료의 검출 레벨 임계값: 발언 개시 임계값 - 3 dB

5. 9 dB 이하: 수 십 센티미터

발언 개시의 검출 레벨 임계값: -3 dB

6. 플로어 노이즈 레벨과 발언 개시 기준 레벨의 차 ÷ 2

발언 종료의 검출 레벨 임계값: -3 dB

7. 동일 또는 마이너스: 판정하지 못하고 선택 금지

(3) 통상 처리의 노이즈 측정 개시 임계값은 전원 투입시의 플로어 노이즈 + 3 dB 이하의 레벨이 되었을 때로부터 개시한다.

필터 처리에 의한 각종 주파수 성분 신호의 생성

도 10은 마이크로폰으로 집음한 음 신호를 사전 처리로서, DSP(25)에서 행하는 필터링 처리를 나타낸 구성도이다. 도 10은 하나의 마이크로폰(채널(1 집음 신호))에 해당하는 처리에 대하여 나타낸다.

각 마이크로폰의 집음 신호는, 예를 들어 100Hz의 차단 주파수를 가지는 아날로그 저주파 차단 필터(analog low cut filter)(101)에서 처리되어, 100Hz 이하 의 주파수가 제거되고 필터링 처리된 음성 신호가 A/D 변환기(102)로 출력되며, A/D 변환기(102)에서 디지털 신호로 변환된 집음 신호가 각각 7.5kHz, 4kHz, 1.5kHz, 600Hz, 250Hz의 차단 주파수를 가지는, 디지털 고주파 차단 필터(103a~103e; 총칭하여 103)에서 고주파 성분이 제거(고주파 차단 차단 처리)된다. 디지털 고주파 차단 필터(103a~103e)의 결과는 또한 감산기(104a~104d: 총칭하여 104)에서 인접하는 디지털 고주파 차단 필터(103a~103e)의 필터 신호마다 감산이 행해진다.

본 발명의 실시예에 있어서, 디지털 고주파 차단 필터(103a~103e) 및 감산기(104a~104d)는 실제는 DSP(25)에서 처리하고 있다. A/D 변환기(102)는 A/D 변환기 블록(27)의 일부로서 구현될 수 있다.

도 11은 도 10을 참조하여 설명한 필터 처리 결과를 나타내는 주파수 특성도이다. 이와 같이 1개의 지향성을 가지는 마이크로폰으로 집음한 신호로부터, 각종의 주파수 성분을 갖는 복수개의 신호가 생성된다.

대역 통과 필터 처리 및 마이크 신호 레벨 변환 처리

마이크로폰 선택 처리의 개시의 트리거 중 하나에 의해 발언의 개시 및 종료의 판정이 행해진다. 그러므로, 사용되는 신호는 DSP(25)에서 행해지며 도 12에 도시한 대역 통과 필터 처리 및 레벨 변환 처리에 의해 얻어진다. 도 12는 마이크로폰(MC1~MC6)에서 집음한 6채널(CH)의 입력 신호 처리 중 1채널(CH) 만을 나타내고 있다.

DSP(25)내의 대역 통과 필터 처리 및 레벨 변환 처리부는 각 채널의 마이크 로폰의 집음 신호를 각각 100~600Hz, 200~250Hz, 250~600Hz, 600~1500Hz, 1500~4000Hz, 4000~7500Hz의 대역 통과 특성을 가지는 대역 통과 필터(201a~201f: 총칭하여 '대역 통과 필터 블록(201)'이라 함)와, 원래의 마이크로폰 집음 신호 및 상기 대역 통과 집음 신호를 레벨 변환하는 레벨 변환기(202a~202g: 총칭하여, '레벨 변환 블록(202)'이라 함)를 가진다.

각 레벨 변환기(202a~202g)는 신호 절대값 처리부(203)와 피크 홀드 처리부(204)를 가진다. 따라서, 파형도로 예시한 것처럼, 신호 절대값 처리부(203)는 파선으로 나타낸 마이너스 신호가 입력되었을 때 부호를 반전하여 플러스 신호로 변환한다. 피크 홀드 처리부(204)는 신호 절대값 처리부(203)의 출력 신호의 최대값을 유지한다. 다만, 본 실시예에서는 시간의 경과에 의해 유지되는 최대값은 약간 저하된다. 물론, 피크 홀드 처리부(204)를 개량하여 그 저하분을 적게함으로써 장시간 최대값을 유지하게 할 수도 있다.

대역 통과 필터에 대하여 설명한다. 음성 집음 장치에 사용하는 대역 통과 필터는, 예를 들어 2차 IIR 고주파 차단 필터와 마이크 신호 입력단의 저주파 차단 필터만으로 대역 통과 필터를 구성하고 있다. 본 실시예에 있어서는 플랫 주파수(flat frequency) 특성을 갖는 신호로부터 고주파 차단 필터를 통한 신호를 감산처리하면 나머지는 저주파 차단 필터를 통한 신호와 대략 동등하게 되는 것을 이용한다.

주파수-레벨 특성(frequency-level characteristic)을 정합시키기 위하여, 전체 대역 통과의 대역 통과 필터로서 1개의 여분 대역이 필요하지만, 필요로 하는 대역 통과 필터의 대역 수 + 1의 필터 수와 필터 계수에 의해 필요한 대역 통과를 얻을 수 있다.

이 필요한 대역 통과 필터의 대역 주파수는 마이크로폰 신호의 1채널(CH)당 아래와 같이 6개 대역의 대역 통과 필터로 된다.

BP특성 대역 통과 필터

BPF1=[100Hz-250Hz] 201b

BPF2=[250Hz-600Hz] 201c

BPF3=[600Hz-1.5KHz] 201d

BPF4=[1.5KHz-4KHz] 201e

BPF5=[4KHz-7.5KHz] 201f

BPF6=[100Hz-600Hz] 201a

이 방법으로 DSP(25)에 있어서의 상기의 IIR 필터의 계산 프로그램은 6CH(채널×5(IIR 필터)= 30이다. 이것을 종래의 대역 통과 필터의 구성과 비교한다.

본 발명의 실시예에 있어서는, 100Hz의 저주파 차단 필터는 입력단의 아날로그 필터에 의해 구현된다. 준비된 2차 IIR 고주파 차단 필터의 차단 주파수는 250Hz, 600Hz, 1.5KHz, 4KHz, 7.5KHz의 5종류이다. 이 중 차단 주파수 7.5KHz의 고주파 차단 필터는 실제로 샘플링 주파수가 16KHz이므로 필요하지 않지만, 감산 처리의 과정에서, IIR 필터의 위상 회전의 영향으로 대역 통과 필터의 출력 레벨이 감소하는 현상을 경감하기 위해 의도적으로 피감수(subtracted number)의 위상을 회전시킨다.

도 13은 도 12에 도시한 구성에 의한 처리를 DSP(25)에서 처리했을 때의 흐름도이다.

도 13에 도시한 DSP(25)에 있어서의 필터 처리는 1단째의 처리에서 고역 통과 필터 처리, 2단째의 처리에서 1단째의 고역 통과 필터 처리 결과로부터의 감산 처리를 행한다. 도 11은 그 신호 처리 결과의 이미지 주파수 특성도이다. 이하의 설명에서 [x]는 도 11에 있어서의 각각의 처리를 나타낸다.

제1 단계

[1] 전체 대역 통과 필터용으로서, 입력 신호가 7.5KHz인 고주파 차단 필터를 통과한다. 이 필터 출력 신호는 입력의 아날로그의 저주파 차단에 의해 [100Hz - 7.5KHz]의 대역 통과 필터 출력으로 된다.

〔2〕입력 신호가 4KHz의 고주파 차단 필터를 통과한다. 이 필터 출력 신호는 입력의 아날로그의 저주파 차단 필터와의 조합에 의해 [100Hz - 4KHz]의 대역 통과 필터 출력으로 된다.

〔3〕입력 신호가 1.5KHz의 고주파 차단 필터를 통과한다. 이 필터 출력 신호는 입력의 아날로그의 저주파 차단 필터와의 조합에 의해 [100Hz - 1.5KHz]의 대역 통과 필터 출력으로 된다.

〔4〕입력 신호가 600Hz의 고주파 차단 필터를 통과한다. 이 필터 출력 신호는 입력의 아날로그의 저주파 차단 필터와의 조합에 의해 [100Hz - 600Hz]의 대역 통과 필터 출력으로 된다.

〔5〕입력 신호가 250Hz의 고주파 차단 필터를 통과한다. 이 필터 출력 신 호는 입력의 아날로그의 저주파 차단 필터와의 조합에 의해 [100Hz - 250Hz]의 대역 통과 필터 출력으로 된다.

제2 단계

〔1〕대역 통과 필터(BPF5=[4KHz~7.5KHz])가 필터 출력 [1] - [2]([100Hz~ 7.5KHz] - [100Hz~4KHz])의 처리를 실행하면, 상기 신호 출력[4KHz~7.5KHz]이 얻어진다.

〔2〕대역 통과 필터(BPF4=[1.5KHz~4KHz])가 필터 출력 [2] - [3] ([100Hz~4KHz] - [100Hz~ 1.5KHz])의 처리를 실행하면, 상기 신호 출력[1.5KHz~4KHz]이 얻어진다.

〔3〕대역 통과 필터(BPF3=[600Hz~1.5KHz])가 필터 출력 [3] - [4] ([100Hz~1.5KHz] - [100Hz~600Hz])의 처리를 실행하면, 상기 신호 출력[600Hz~1.5KHz]이 얻어진다.

〔4〕대역 통과 필터(BPF2=[250Hz~600Hz])가 필터 출력 [4] - [5] ([100Hz~600Hz] - [100Hz~250Hz])의 처리를 실행하면, 상기 신호 출력[250Hz~600Hz]이 얻어진다.

〔5〕대역 통과 필터(BPF1=[100Hz~250Hz])가 상기 [5]의 신호를 그대로 출력 신호 [5]로 한다.

〔6〕대역 통과 필터(BPF6=[100Hz~600Hz])가 [4]의 신호를 그대로 상기 [4]의 출력 신호로 한다.

DSP(25)에 있어서의 이상의 처리로 필요한 대역 통과 필터 출력을 얻을 수 있다.

입력된 마이크로폰의 집음 신호(MIC1~MIC6)는 DSP(25)에 있어서 전체 대역의 음압 레벨(sound pressure level), 대역 통과 필터를 통과한 6대역의 음압 레벨로서 표 1과 같이 계속해서 갱신된다.

신호 레벨 변환 결과

	BPF1	BPF2	BPF3	BPF4	BPF5	BPF6	ALL
MIC1	L1-1	L1-2	L1-3	L1-4	L1-5	L1-6	L1-A
MIC2	L2-1	L2-2	L2-3	L2-4	L2-5	L2-6	L2-A
MIC3	L3-1	L3-2	L3-3	L3-4	L3-5	L3-6	L3-A
MIC4	L4-1	L4-2	L4-3	L4-4	L4-5	L4-6	L4-A
MIC5	L5-1	L5-2	L5-3	L5-4	L5-5	L5-6	L5-A
MIC6	L6-1	L6-2	L6-3	L6-4	L6-5	L6-6	L6-A

표 1에 있어서, 예를 들어, L1-1은 마이크로폰 MC1의 집음 신호가 제1 대역 통과 필터(201a)를 통과했을 때의 피크 레벨을 나타낸다. 발언의 개시 및 종료 판정은 도 12에 도시한 100Hz~600Hz의 대역 통과 필터(201a)를 통과하고, 레벨 변환부(202b)에서 음압 레벨 변환된 마이크로폰 집음 신호를 사용한다.

발언의 개시 및 종료 판정 처리

제1 디지털 신호 처리기(DSP1)(25)는 음압 레벨 검출부로부터 출력되는 값을 기초로 도 14에 도시한 것처럼 마이크로폰 집음 신호 레벨이 플로어 노이즈로부터 상승하고, 발언 개시 레벨의 임계값을 넘었을 경우에는 발언 개시라고 판정하고, 그 후 개시 레벨의 임계값보다 높은 레벨이 계속된 경우 발언 중에, 발언이 종료해 집음 신호 레벨이 임계값보다 낮아진 경우를 플로어 노이즈라고 판정하며, 발언 종료 판정 시간, 예를 들어 플로어 노이즈가 0.5초간 계속한 경우 발언 종료로 판정 한다.

발언의 개시는 도 12에 도시한 마이크로폰 신호 변환 처리부(202b)에서 음압 레벨 변환된 100Hz~600Hz의 대역 통과 필터를 통과한 음압 레벨 데이터(마이크로폰 신호 레벨(1))이 도 14에 예시한 임계값 레벨 이상이 되었을 때부터 발언 개시로 판정한다.

DSP(25)는 빈번한 마이크로폰 전환에 수반하는 동작 불량을 피하기 위하여, 발언 개시를 검출하고나서, 발언 종료 판정 시간을 예를 들어 0.5초 경과할 때까지는 다음의 발언 개시를 검출하지 않게 하고 있다.

마이크로폰 선택

DSP(25)는 상호 통화 시스템에 있어서의 발언자 방향 검출 및 발언자쪽으로 향하고 있는 마이크 신호의 자동 선택을, 이른바 "경기 성적표 방식"(score card method)에 따라 행한다.

도 15는 음성 집음 장치의 동작 형태를 도시한 그래프이다.

도 16은 음성 집음 장치의 통상 처리를 나타낸 흐름도이다.

음성 집음 장치는 도 15에 도시한 것처럼, 마이크로폰(MC1~MC6)으로부터의 집음 신호에 따라 음성 신호 감시 처리를 행하고, 발언 개시 및 종료 판정을 행하며, 발언 방향 판정을 행하고, 마이크로폰 선택을 행하며, 그 결과를 마이크로폰 선택 결과 표시 수단, 예를 들어 발광 다이오드(LED1~6)에 표시한다.

이하, 도 16의 흐름도를 참조하여 음성 집음 장치에 있어서의 DSP(25)를 중심으로 하는 동작을 설명한다. 그리고, 마이크로폰 전자 회로 수용부(2)의 전체 제어는 마이크로 프로세서(23)에 의해 행해지지만, DSP(25)의 처리를 중심으로 설명한다.

단계 S1: 레벨 변환 신호의 감시

마이크로폰(MC1~MC6)에서 집음한 신호는 각각 도 11 내지 도 13, 특히 도 12를 참조하여 설명한 대역 통과 필터 블록(201), 레벨 변환 블록(202)에 있어서, 7종류의 레벨 데이터로서 변환되어 있기 때문에, DSP(25)는 각 마이크로폰 집음 신호에 대하여 7종류의 신호를 항상 감시한다.

그 감시 결과에 기초하여, DSP(25)는 발언자 방향 검출 처리, 발언자 방향 검출 처리, 발언 개시 및 종료 판정 처리 중 어느 하나의 처리로 이행한다.

단계 S2: 발언 개시 및 종료 판정 처리

DSP(25)는 도 14를 참조하여, 또한 아래에 상세히 설명하는 방법에 따라, 발언의 개시 및 종료의 판정을 행한다. DSP(25)의 처리에 의해 발언 개시가 검출된 경우, 단계 S4의 발언자 방향의 판정 처리에 발언 개시 검출을 알린다.

그리고, 단계 S2에 있어서의 발언의 개시 및 종료의 판정 처리에 있어서, 발언 레벨이 발언 종료 레벨보다 낮아졌을 때, 발언 종료 판정 시간(예를 들어, 0.5초)의 타이머가 구동된다. 발언 레벨이 발언 종료 판정 동안 발언 종료 레벨보다 작게 되는 경우 발언 종료로 판정한다.

발언 종료 판정 시간 이내에 발언 종료 레벨 보다 크게 되면 다시 발언 종료 레벨보다 작게 될 때까지 기다리는 처리가 행해진다.

단계 S3: 발언자 방향의 검출 처리

DSP(25)에 있어서의 발언자 방향의 검출 처리는 항상 발언자 방향을 검색하여 수행된다. 그 후, 단계 S4의 발언자 방향의 판정 처리에 데이터를 공급한다.

단계 S4: 발언자 방향 마이크로폰의 전환 처리

DSP(25)에서 발언자 방향 마이크로폰의 전환 처리에 있어서의 타이밍 판정 처리는 단계 S2의 처리와 단계 S3의 처리의 결과로부터, 그 때의 발언자 검출 방향과 지금까지 선택한 발언자 방향이 다른 경우에, 새로운 발언자 방향의 마이크로폰 선택을 단계 S4의 마이크로폰 신호 전환 처리에 지시한다.

다만, 의장의 마이크로폰이 조작부(15)로부터 설정되어 있어, 의장의 마이크로폰과 다른 회의 참석자가 동시에 발언하는 경우, 의장의 발언을 우선한다.

이 때, 선택된 마이크로폰 정보를 마이크로폰 선택 결과 표시 수단, 예를 들어 발광 다이오드(LED1~6)에 표시한다.

단계 S5: 마이크로폰 집음 신호의 전송

마이크로폰 신호 전환 처리는 6개의 마이크로폰 신호 중 단계 S4의 처리에 의해 선택된 마이크로폰 신호만을 송화 신호로서, 예를 들어 제1 음성 집음 장치(10A)로부터 통신 회선(920)을 통하여 상대측의 제2 음성 집음 장치(10B)에 전송하기 위하여, 도 5에 도시한 통신 회선(920)의 라인아웃(LINE OUT) 단자에 출력한다.

발언 개시 판정

처리 1: 6개의 마이크로폰에 대응하는 음압 레벨 검출기의 출력 레벨과 발언 개시 레벨의 임계값을 비교하여 발언 개시 레벨의 임계값을 초과했을 경우 발언 개시로 판정한다.

DSP(25)는 모든 마이크로폰에 대응하는 음압 레벨 검출기의 출력 레벨이 발언 개시 레벨의 임계값을 넘었을 경우, 수화 재생 스피커(16)로부터의 신호인 것으로 판정하고 발언 개시라고는 판정하지 않는다. 왜냐하면, 수화 재생 스피커(16)와 모든 마이크로폰(MC1~MC6)의 거리는 동일하므로, 수화 재생 스피커(16)로부터의 음은 모든 마이크로폰(MC1~MC6)에 대략 균등하게 도달하기 때문이다.

처리 2: 도 4에 도시한 6개의 마이크로폰에 대한 60도의 등 각도로 방사상으로 또한 등 간격의 배치로, 지향성 축을 반대 방향으로 180도 천이시킨 2개의 단일 지향성 마이크로폰(마이크로폰 MC1 및 MC4, 마이크로폰 MC2 및 MC5, 마이크로폰 MC3 및 MC6)을 3세트 구성하고 마이크로폰 신호의 레벨 차를 이용한다. 즉, 아래와 같은 연산을 실행한다.

(마이크로폰 1의 신호 레벨 - 마이크로폰 4의 신호 레벨)의 절대값···[1]

(마이크로폰 2의 신호 레벨 - 마이크로폰 5의 신호 레벨)의 절대값···[2]

(마이크로폰 3의 신호 레벨 - 마이크로폰 6의 신호 레벨)의 절대값···[3]

DSP(25)는 상기 절대값 [1], [2], [3]을 발언 개시 레벨의 임계값과 비교하여 발언 개시 레벨의 임계값을 넘었을 경우에 발언 개시로 판정한다.

이 처리의 경우, 처리 1과 같이 모든 절대값이 발언 개시 레벨의 임계값 보다 크게 되는 것은 없기 때문에(수화 재생 스피커(16)로부터의 음이 모든 마이크로폰에 등일하게 도달하기 때문에), 수화 재생 스피커(16)로부터의 음인지 아니면 말하는 사람으로부터의 음성인지의 판정은 불필요하게 된다.

발언자 방향의 검출 처리

발언자 방향의 검출에는 도 6에 예시한 단일 지향성 마이크로폰의 특성을 이용한다. 단일 지향 특성 마이크로폰은 발언자로부터 마이크로폰에의 음성의 도달 각도에 의해 도 6에 예시한 것처럼, 주파수 특성 및 레벨 특성이 변화한다. 그 결과를 도 7a~7c에 예시하고 있다. 도 7a~7c는 음성 집음 장치(10A)로부터 소정 거리, 예를 들어 1.5미터의 거리에 스피커를 두고 각 마이크로폰이 집음한 음성을 일정 시간 간격으로 고속 푸리에 변환(FFT)한 결과를 나타낸다. X축이 주파수를, Y축이 신호 레벨을, Z축이 시간을 나타내고 있다. 가로 선은 대역 통과 필터의 차단 주파수를 나타내고, 이 선 중간에 삽입된 주파수 대역의 레벨이 도 10~도 13을 참조하여 설명한 마이크로폰 신호 레벨 변환된 5대역의 대역 통과 필터를 통한 음 압 레벨로 변환된 데이터가 된다.

본 발명의 실시예에 따른 음성 집음 장치에 있어서의 발언자 방향의 검출을 위해 실제의 처리로 하여 적용한 판정 방법을 설명한다.

각 대역 대역 통과 필터의 출력 레벨에 대해 각각 적절한 가중화 처리(1dB 풀스팬(full span)(1dBFs) 단계라면 0dBFs일 때 0, -3dBFs라면 3으로 하는 것과 같이, 또는 그 반대로)를 행한다. 이 가중화 단계에 의해 처리의 분해능이 결정된다.

1샘플 클록마다 상기 가중화 처리를 실행하고, 각 마이크로폰의 가중화된 득점을 가산하여 일정 샘플수로 평균값으로 하여 합계점이 작은(큰) 마이크로폰 신호를 발언자쪽으로 대향시킨 마이크로폰이라고 판정한다. 이 결과를 이미지화한 것이 아래의 표 2이다.

신호 레벨을 점수화한 경우

	BPF1	BPF2	BPF3	BPF4	BPF5	Sum
MIC1	20	20	20	20	20	100
MIC2	25	25	25	25	25	125
MIC3	30	30	30	30	30	150
MIC4	40	40	40	40	40	200
MIC5	30	30	30	30	30	150
MIC6	25	25	25	25	25	125

표 2에 예시한 이 예에서는 합계점수가 제일 작은 것은 제1 마이크로폰 MC1이므로, DSP(25)는 제1 마이크로폰 MC1의 방향으로 음원이 있다(말하는 사람이 있다)고 판정한다. DSP(25)는 그 결과를 음원 방향 마이크로폰 번호라는 형태로 유지한다.

전술한 바와 같이, DSP(25)는 각 마이크로폰마다의 주파수 대역의 대역 통과 필터의 출력 레벨에 가중화를 실행하고, 각 대역 대역 통과 필터의 출력에 대해 득점이 작은(또는 큰) 마이크로폰 신호의 순서로 순위를 붙여 1위의 순위가 3개의 대역 이상에 있는 마이크로폰 신호를 발언자쪽으로 대향하고 있는 마이크로폰이라고 판정한다. 그리고, DSP(25)는 제1 마이크로폰 MC1의 방향으로 음원이 있는(말하는 사람이 있다) 것으로 아래와 같이 표 3과 같은 성적표를 작성한다.

레벨 순서로 순위를 매긴 통과 필터

	BPF1	BPF2	BPF3	BPF4	BPF5	Sum
MIC1	1	1	1	1	1	5
MIC2	2	2	2	2	2	10
MIC3	3	3	3	3	3	15
MIC4	4	4	4	4	4	20
MIC5	3	3	3	3	3	15
MIC6	2	2	2	2	2	10

실제로는 방의 특성에 의해 음의 반사나 정재파(standing wave)의 영향으로, 반드시 제1 마이크로폰 MC1의 성적이 모든 대역 통과 필터의 출력으로 1번이 된다고는 할 수 없지만, 5개의 대역 중 과반수가 1위이면 제1 마이크로폰 MC1의 방향으로 음원이 있다(말하는 사람이 있다)고 판정할 수 있다. DSP(25)는 그 결과를 음원 방향 마이크 번호라는 형태로 유지한다.

DSP(25)는 각 마이크로폰의 각 대역 대역 통과 필터의 출력 레벨 데이터를 아래와 같이 나타낸 형태로 합계하고, 레벨이 큰 마이크로폰 신호를 발언자에게 대향하고 있는 마이크로폰이라고 판정하고, 그 결과를 음원 방향 마이크로폰 번호라는 형태로 유지한다.

MIC1 Level = L1-1 + L1-2 + L1-3 + L1-4 + L1-5

MIC2 Level = L2-1 + L2-2 + L2-3 + L2-4 + L2-5

MIC3 Level = L3-1 + L3-2 + L3-3 + L3-4 + L3-5

MIC4 Level = L4-1 + L4-2 + L4-3 + L4-4 + L4-5

MIC5 Level = L5-1 + L5-2 + L5-3 + L5-4 + L5-5

MIC6 Level = L6-1 + L6-2 + L6-3 + L6-4 + L6-5

발언자 방향 마이크로폰의 전환 타이밍 판정 처리

도 16의 단계 S2의 발언 개시 판정 결과에 의해 기동하고, 단계 S3의 발언자 방향의 검출 처리 결과와 과거의 선택 정보로부터 새로운 발언자의 마이크로폰이 검출되었을 때, DSP(25)는 단계 S5의 마이크로폰 신호의 선택 전환 처리에 마이크로폰 신호의 전환 커맨드를 발효하는 동시에, 마이크로폰 선택 결과 표시 수단(발 광 다이오드 LED1~6)에 발언자 마이크로폰가 바뀐 것을 통지하고, 발언자에게 자신의 발언에 대해 음성 집음 장치가 응답한 것을 알린다.

에코가 큰 방에서 반사음이나 정재파의 영향을 제외하기 위하여, DSP(25)는 마이크로폰을 전환하고 나서 발언 종료 판정 시간(예를 들어, 0.5초)이 경과하지 않으면 새로운 마이크로폰 선택 커맨드의 발행은 금지한다.

도 16의 단계 S1의 마이크 신호 레벨 변환 처리 결과 및 단계 S3의 발언자 방향의 검출 처리 결과로부터, 본 실시예에 있어서는 2가지의 마이크로폰 선택 전환 타이밍을 준비한다.

제1 방법: 발언 개시가 분명하게 판정할 수 있을 때

선택되어 있던 마이크로폰의 방향으로부터의 발언이 종료하고 새롭게 다른 방향으로부터 발언이 있었을 경우.

이 경우에, DSP(25)는 모든 마이크로폰 신호 레벨 (1)과 마이크로폰 신호 레벨 (2)가 발언 종료 임계값 레벨 이하로 되고나서 발언 종료 판정 시간(예를 들어, 0.5초) 이상 경과하고 나서 발언이 개시되고, 어느 쪽의 마이크 신호 레벨 (1)이 발언 개시 임계값 레벨 이상이 되었을 때 발언이 개시되었다고 판단하며, 음원 방향 마이크로폰 번호의 정보를 원래로 발언자 방향으로 대향하고 있는 마이크로폰을 정당한 집음 마이크로폰이라고 결정하며, 단계 S5의 마이크 신호 선택 전환 처리를 개시한다.

제2 방법: 발언 계속 중에 새롭게 다른 방향으로부터 보다 큰 소리의 발언이 있었을 경우

이 경우, DSP(25)는 발언 개시(마이크로폰 신호 레벨 (1)이 임계값 레벨 이상이 되었을 때)로부터 발언 종료 판정 시간(예를 들어, 0.5초) 이상 경과하고나서 판정 처리를 개시한다.

발언 종료 검출전에, 단계 S3의 처리로부터의 음원 방향 마이크로폰 번호가 변경되어 안정적인 것으로 판정된 경우, DSP(25)는 음원 방향 마이크로폰 번호에 상당하는 마이크로폰에 현재 선택되어 있는 발언자보다 큰 소리로 발언하고 있는 사람이 있는 것으로 판단하고, 그 음원 방향 마이크로폰을 정당한 집음 마이크로폰이라고 결정하고, 단계 S5의 마이크로폰 신호 선택 전환 처리를 구동한다.

검출된 발언자에게 대향하고 있는 마이크로폰 신호의 선택 전환 처리

DSP(25)는 도 16의 단계 S4의 발언자 방향 마이크로폰의 전환 타이밍 판정 처리로부터의 커맨드에 의해 선택 판정된 커맨드에 의해 구동한다.

DSP(25)의 마이크로폰 신호의 선택 전환 처리는 도 17에 도시한 것처럼 6개 회로의 승산기와 6개 입력의 가산기로 구현된다. 마이크로폰 신호를 선택하기 위해서, DSP(25)는 선택하고 싶은 마이크로폰 신호가 접속되어 있는 승산기의 채널 이득(CH Gain)을〔1〕로, 그 외의 승산기의 CH Gain을〔0〕으로 함으로써, 가산기에는 선택된 (마이크로폰 신호×[1])의 신호와 (마이크로폰 신호×[0])의 처리 결과가 가산되어, 원하는 마이크로폰 선택 신호가 출력으로 얻어진다.

상기와 같이 채널 이득을 [1]이나 [0]으로 전환할 때, 전환하는 마이크로폰 신호의 레벨 차에 의해 클릭 음(clicking sound)이 발생할 가능성이 있다. 그래서, 음성 집음 장치(10A)에서는 도 18에 도시한 것처럼 채널 이득(CH Gain)의 변화 를 [1]에서 [0]으로, [0]에서 [1]로 변화하는데 전환 천이 시간, 예를 들어 10 밀리초(msec)의 시간에 연속적으로 변화시켜 교차되도록 하여, 마이크로폰 신호의 레벨 차에 의한 클릭음의 발생을 피하고 있다.

또, 최대의 채널 이득을 [1] 이외에, 예를 들어 [0.5]로 설정함으로써, 후단의 DSP(25)에 있어서의 에코 제거 처리 동작의 조정을 행하는 것도 가능하다.

전술한 바와 같이, 본 발명의 제1 실시예의 음성 집음 장치는 노이즈의 영향을 받지 않으면서 회의 등의 통화 처리에 유효하게 적용할 수 있다.

본 발명의 제1 실시예에 따른 통화 장치는 구조면에서 아래와 같은 이점을 가진다.

(1) 복수개의 단일 지향성을 가지는 마이크로폰과 수화 재생 스피커의 위치 관계가 일정하고, 또한 그 거리가 매우 인접하기 때문에, 수화 재생 스피커로부터 출력되는 음이 회의실(방) 환경을 거쳐 복수개의 마이크로폰으로 되돌아오는 레벨로부터 직접 돌아오는 레벨이 압도적으로 크고 지배적이다. 그러므로, 수화 재생 스피커로부터 복수개의 마이크로폰에 음이 도달하는 특성(신호 레벨(강도)), 주파수 특성(f 특성, 위상)이 항상 동일하다. 즉, 음성 집음 장치에 있어서는 언제나 전달 함수가 동일하다는 이점이 있다.

(2) 그러므로, 마이크로폰을 전환할 때의 전달 함수의 변화가 없고, 마이크로폰을 전환할 때마다, 마이크로폰 시스템의 이득을 조정할 필요가 없다고 하는 이점을 가진다. 다시 말해서, 음성 집음 장치의 제조시에 한 번 조정을 하면 다시 조정할 필요가 없다고 하는 이점이 있다.

(3) 상기와 같은 이유로, 마이크로폰을 전환해도 디지털 신호 처리기(DSP)로 구성되는 에코 제거기가 하나로 충분하다. 각종의 부재가 탑재되어 빈 공간이 적은 인쇄 회로 기판에 고가의 DSP를 배치하는 공간도 작아지게 된다.

(4) 수화 재생 스피커와 복수개의 마이크로폰간의 전달 함수가 일정하게 되므로, ±3dB의 마이크로폰 자체의 감도 차 조정을 장치 단독으로 할 수 있다는 이점이 있다.

(5) 음성 집음 장치가 탑재되는 테이블은 집음 장치 내의 하나의 수화 재생 스피커로 균일한 품질의 음성을 전방위에 걸쳐 균등하게 분산(확산)하는 스피커 시스템이 가능하게 된다.

(6) 수화 재생 스피커로부터 출력되는 음은 테이블 면을 전달하여(바운더리 효과) 회의 참석자까지 유효하고 효과적으로 균등하게 상질의 음이 도달하며, 회의실의 천장 방향에 대하여 대향측의 음과 위상 제거되어 작은 음으로 되어, 회의 참석자에 대하여 천장 방향으로부터의 반사 음이 작아지고, 그 결과 참가자에게 명료한 음이 제공된다고 하는 이점이 있다.

(7) 수화 재생 스피커로부터 출력되는 음은 복수개의 모든 마이크로폰에 동시에 같은 음량으로 도달하므로 발언자의 음성인지 아니면 수화 음성인지의 판단이 용이하게 된다. 그 결과, 마이크로폰 선택 처리의 잘못된 판별이 감소된다.

(8) 짝수개의 마이크로폰을 등 간격으로 배치함으로써 방향 검출을 위한 레벨 비교를 용이하게 할 수 있다.

(9) 완충재를 사용한 댐퍼, 유연성 또는 탄력성을 가지는 마이크로폰 지지부 재 등에 의하여, 마이크로폰이 탑재되어 있는 인쇄 회로 기판을 통하여 전달될 수 있는 수화 재생 스피커의 음에 의한 진동이 마이크로폰의 집음에 미치는 영향을 저감할 수 있다.

(10) 수화 재생 스피커의 음이 마이크로폰에는 직접 진입하지 않는다. 따라서, 이 음성 집음 장치에 있어서는 수화 재생 스피커로부터의 노이즈의 영향이 적다.

본 발명의 제1 실시예의 음성 집음 장치는 신호 처리면에서 보았을 때 아래와 같은 이점을 가진다.

(a) 복수개의 단일 지향성 마이크를 등 간격으로 방사상으로 배치하여 음원 방향을 검지 가능하게 하고, 마이크로폰 신호를 전환하여 S/N이 양호한 음과 선명한 음을 집음하여 상대방에게 송신할 수 있다.

(b) 주변의 발언자로부터의 음성을 양호한 S/N으로 집음하여 발언자에게 향하고 있는 마이크를 자동 선택할 수 있다.

(c) 마이크로폰 선택 처리의 방법으로서 통과 음성 주파수 대역을 분할하고, 각각의 분할된 주파수 대역마다의 레벨을 비교함으로써, 신호 분석을 간략화하고 있다.

(d) 본 발명의 마이크로폰 신호 전환 처리를 DSP의 신호 처리로 하여 실현하고, 복수개의 신호를 모두에 크로스페이드 처리함으로써 전환할 때의 클릭음이 생기지 않도록 하고 있다.

(e) 마이크로폰 선택 결과를 발광 다이오드 등의 마이크로폰 선택 결과 표시 수단 또는 외부에 통지하는 처리가 가능하다.

제2 실시예

본 발명의 음성 집음 장치의 제2 실시예로서 에코 제거기 처리의 상세한 설명을 도 19 내지 도 21을 참조하여 설명한다.

통신 경로를 경유하여 입력된 상대측 음성 집음 장치로부터의 음성은 도 2 및 도 3을 참조하여 설명한 한쪽의 음성 집음 장치의 스피커(16)로부터 전방위(360도)로 균등하게 출력되어, 회의실에 있는 회의 참석자가 균일하게 청취할 수 있게 된다.

한편, 스피커(16)로부터의 음은 한쪽편의 회의실 내의 벽 등에서 반사되어, 그 반사 음이 에코로서 복수개, 예를 들어 6개의 마이크로폰(MC1~MC6)에서 해당 회의실의 회의자의 음성에 중첩되어 검출된다.

또, 스피커(16)로부터의 음은 직접 마이크로폰(MC1~MC6)에 입사하고 에코되어, 해당 회의실의 회의자의 음성에 중첩되어 마이크로폰(MC1~MC6)에서 검출되는 경우도 있다.

이와 같이, 마이크로폰(MC1~MC6)에서 검출한 음은 해당 회의실 내의 회의 참석자의 음성 뿐만이 아니고, 상대측의 음성 집음 장치로부터의 음을 포함하는 경우가 있다.

따라서, 해당 회의실의 음성 집음 장치로 선택한 마이크로폰으로 검출한 음 신호로부터 그와 같은 에코 신호를 제거하지 않으면, 상대측의 음성 집음 장치에 그 음성 집음 장치로 선택한 음성을 에코으로서 포함하는 음을 상대측의 음성 집음 장치에 송출하게 되어, 상대측의 음성 집음 장치의 스피커로부터 출력되고 자신이 송출한 음을 에코으로서 포함하는 소리를 듣게 된다. 그러므로, 이와 같은 에코를 제거할 필요가 있다.

도 19는 본 발명의 제2 실시예의 음성 집음 장치로서, 도 5에 도시한 음성 집음 장치의 구성 중에서, 제2 DSP(26)의 구성을 도시한 음성 집음 장치의 부분 도면이다.

제2 DSP(26)는 전술한 에코 제거 처리를 행하는 에코 제거기로서 동작한다. 에코으로 되는 그와 같은 상대측으로부터의 음은 마이크로폰의 위치, 벽, 천장 등으로의 반사 조건의 차이에 의해 복수개의 마이크로폰에서 동일하게 검출되지 않게 된다. 따라서, 에코 제거 처리를 행하는 제2 DSP(26)는 각 마이크로폰마다 에코 제거 처리를 행한다. 그래서, 제2 DSP(26)를 에코 제거기 EC(26)라고 부른다.

본 실시예에 있어서는, 특히 1개의 EC(26)로 복수개, 예를 들어 6개의 마이크로폰을 위한 에코 제거 처리를 행한다.

EC(26)는 메모리를 내장한 1개의 DSP로 실현하고 있기 때문에, 실제로 DSP 내에서 프로그램 처리되지만, 도 19에 있어서는 그 내부 구성을 편의적으로 또는 기능적으로 에코 제거(EC) 처리부(261), 메모리부(263), EC내 제어 처리부(264)로 구성되어 있는 것으로 나타내고 있다.

EC 처리부(261)는 마이크로폰 선택 처리 등을 행하는 제1 DSP(25)에 있어서 선택되어 EC(26)에 입력된 마이크로폰의 음성 신호에 대하여 에코 제거 처리하고, 그 처리 후의 신호를 D/A 변환기(281) 및 라인아웃(LINE OUT) 단자를 통하여 상대 측 음성 집음 장치에 송출한다.

메모리부(263)는 EC 처리부(261)에서 사용하는 데이터를 기억한다.

EC내 제어 처리부(264)는 제1 DSP(25)와 연계하여, EC(26)내의 제어 처리, 특히 EC 처리부(261)의 제어 처리의 타이밍 제어 등을 행한다.

도 20은 도 19에 도시한 음성 집음 장치에서 제1 DSP(25)에 있어서의 마이크로폰 선택 처리와, EC(26)에 있어서의 에코 제거 처리의 개요를 나타낸 구성도이다.

도 20에 도시한 예시는 간단화하여 제1 DSP(25)에 있어서, 도 4에 도시한 6개의 마이크로폰 중 2개의 마이크로폰(MCa 및 MCb)에서 어느 하나를 선택하는 경우를 예시하고 있다. 이하, 제1 DSP(25)에 있어서의 처리의 개요를 설명한다.

2개의 마이크로폰 MCa 및 MCb의 출력은 도 5에 도시한 A/D 변환기(27) 중 2개의 A/D 변환기(27a, 27b)를 통하여 제1 DSP(25)에 입력되고, 제1 DSP(25) 내의 피크 검출부(PDa 및 PDb)에서 피크가 검출된다. 제1 DSP(25) 내의 마이크로폰 선택 처리부(25MS)가, 예를 들어 피크값이 높은 쪽을 선택한다. 마이크로폰 선택 처리부(25MS)의 한쪽의 마이크로폰으로부터 다른 쪽의 마이크로폰으로의 전환 방법으로서는, 바람직하게는, 도 18에 도시된 것과 같이 크로스페이딩(cross-fading)시켜 전환한다. 그러므로, 마이크로폰 선택 처리부(25MS)는 A/D 변환기(27a, 27b)의 출력 측에 설치된 페이더(fader)(FDa 및 FDb)의 값을 도 18에 도시된 것과 같이, 음성 신호를 서로 교차 상태(crossed state)로 변화시킨다.

페이더(FDa, FDb)를 경유하여 크로스페이드된 2개의 마이크로폰(MCa 및 MC) 의 마이너스 출력은 가산부(ADR)에서 가산되어 EC(26)에 출력된다.

이상, 제1 DSP(25)에서 크로스페이딩시키면서, 2개의 마이크로폰(MCa 및 MCb)의 한쪽으로부터 다른 쪽으로의 전환 방법의 개요를 기술하였으나, 마이크로폰의 선택 방법 및 전환 방법의 자세한 것은 전술한 제1 실시예 방법에 기초한다.

EC 처리부(261)의 처리의 개요를 도 20에 나타낸다.

EC 처리부(261)는 제1 스위치(SW1), 제2 스위치(SW2), 제1 및 제2 전달 특성 처리부(2611, 2612), 가감산부(2614), 및 학습 처리부(2615)를 포함한다.

제1 스위치(SW1)는 EC내 제어 처리부(264)에 의하여, 오프 상태, 제1 또는 제2 전달 특성 처리부(2611, 2612) 중 어느 하나와 A/D 변환기(274)의 출력 신호 S1를 접속한다.

전달 특성 처리부(2611, 2612)는 각각 마이크로폰 MCa 및 MCb의 신호에 대한 에코 제거 성분을 생성하는 부분이며, 동일한 전달 특성 함수를 가지고, 마이크로폰 MCa 및 MCb에 따라 상이한 시간 지연 요소 및 필터 계수를 가진다. 전달 특성 함수, 시간 지연 요소 및 필터 계수에 대하여는 후술한다.

제2 스위치(SW2)도 EC내 제어 처리부(264)에 의하여, 오프 상태, 제1 또는 제2 전달 특성 처리부(2611, 2612) 중 어느 하나를 가감산부(2614)에 접속한다.

접속된 전달 특성 처리부(2611, 2612) 중 어느 하나의 출력이 에코 제거 성분으로서, 가감산부(2614)에서 제1 DSP(25)의 가산부(ADR)로부터의 신호 S25로부터 감산 처리된다.

학습 처리부(2615)에 있어서는 에코 성분을 추정하고, 추정한 에코 성분에 따른 시간 지연 요소와 필터 계수가 메모리부(263)에 기억(갱신)되며, 마이크로폰 MCa 및 MCb 중 어느 하나에 상당하는 전달 특성 처리부(2611, 2612) 중 어느 하나로 설정된다.

EC 처리부(261)에 있어서의 에코 제거 처리는 기본적으로 시간 지연 요소를 고려한 등화 필터 처리이다. 시간 지연 요소는 상대측 음성 집음 장치로부터 전송된 마이크로폰 신호가 이 쪽편의 음성 집음 장치의 스피커(16)로부터 출력되어 방의 벽이나 천장 등에서 반사되어 이 쪽편의 마이크로폰에서 검출되고, 또한 EC(26)에 도달할 때까지의 평균 지연 시간으로서 규정된다. 그리고, 제거해야 할 진폭의 에코 신호 성분이 등화 필터의 필터 계수로 규정된다.

전달 특성 처리부(2611, 2612)는 동일 구성의 전달 함수로 규정되는 등화 필터로서 규정되지만, 그 시간 지연 요소와 필터 계수가 마이크로폰 MCa 및 MCb에 따라 상이하며, 시간 지연 요소와 필터 계수가 학습 처리부(2615)에 의해 메모리부(263)에 기억되어 있다.

학습 처리부(2615)는 전달 특성 처리부(2611, 2612)와 동일한 전달 특성 함수를 가지며, 상대측 음성 집음 장치의 마이크로폰 선택 신호를 나타낸 A/D 변환기(274)의 출력 신호 S1, 제1 DSP(25) 내의 가산기(ADR)의 출력 신호 S25, 및 가감산부(2614)의 에코 제거 처리 결과 신호 S27를 계속적으로 입력하여, 상대측 음성 집음 장치의 마이크로폰 선택 신호에 따른 에코 신호(스피커 16의 반사 신호 등)를 제거하도록 한 특성을 학습 처리하여 추정함으로써, 시간 보내 요소와 필터 계수를 추정한다.

학습 처리부(2615)에서 추정하여 얻은 시간 지연 요소와 필터 계수는 메모리부(263)에 기억되는 동시에, 스위치(SW1, SW2)에 의해 가감산부(2614)에 접속되어 있는 전달 특성 처리부(2611, 2612) 중 어느 하나로 설정되고, 전달 특성 처리부(2611, 2612) 중 어느 하나에서 A/D 변환기(274)의 출력 신호 S1을 등화시킨다.

등화 신호가 가감산부(2614)에 인가되고, 가감산부(2614)에 있어서 신호 S25로부터 감소되며, 상대측 음성 집음 장치의 마이크로폰 선택 신호에 따른 에코 신호(스피커 16의 반사 신호 등)가 소거된 에코 제거 처리 신호 S26이 D/A 변환기(281)에 출력된다.

본 실시예에 있어서는, 1개의 EC(26)에 의하여, 즉 1개의 EC 처리부(261)에 의해 복수개, 예를 들어 도 20에 도시된 예시에서는, 제1 DSP(25)에 2개의 마이크로폰(MCa, MCb) 중 선택된 1개의 마이크로폰으로부터의 음성 신호에 대하여 에코 제거 처리를 행한다.

2개의 마이크로폰(MCa, MCb) 중 한쪽으로부터 다른 쪽으로의 전환을 행하였을 때, 그 전환 신호는 제1 DSP(25)내의 제어부(25MS)로부터 통보되거나 EC(264) 내 제어부에 제어부(25MS)를 통하여 전체 제어부(23)로부터 통보된다. 그러나, EC내 제어 처리부(264)가 즉시 스위치(SW1, SW2)를 선택된 마이크로폰에 대응하는 전달 특성 처리부(2611, 2612)가 가감산부(2614)에 접속되도록 구동하고, 학습 처리부(2615)가 메모리부(263)에 기억되어 있는 시간 지연 요소와 필터 계수를 전환 마이크로폰으로 전환하게 되면, 에코 제거 처리가 잘못될 수 있다.

왜냐하면, A/D 변환기(274)로부터 출력된 신호 S1과 스피커(16)로부터 출력 되어 마이크로폰(MCa, MCb)에서 검출된 반사음 등의 에코는 시간 차가 있기 때문에, 즉시 에코 제거 처리의 대상을 전환해버리면, 전에 선택되어 있던 마이크로폰(MCa, MCb)에 대한 에코 제거 처리 신호로 새롭게 전환된 마이크로폰(MCa, MCb)의 신호에 대하여 에코 제거 처리를 하게 된다.

그래서, 본 발명의 제2 실시예에서는 도 21에 예시한 방법으로 에코 제거 처리의 전환을 행한다.

도 21은 에코 제거 처리의 동작 타이밍을 도시한 도면이다.

이하, 제1 마이크로폰(MCa)으로부터 제2 마이크로폰(MCb)으로 전환(선택 변경)을 하는 경우를 예시한다.

시점 t1에서, 제1 DSP(25)가 제1 마이크로폰(MCa)으로부터 제2 마이크로폰(MCb)으로 전환하는 것을 검출했을 때, 그 검출 신호가 제1 DSP(25)의 제어부(25MS)로부터 전체 제어용 마이크로 프로세서(23)를 경유하거나, 또는 제1 DSP(25) 내의 제어부(25MS)로부터 직접 EC(26)의 EC내 제어 처리부(264)에 통보된다. 이하, 제어부(25MS)로부터 직접 EC내 제어 처리부(264)에 통보되는 경우에 대하여 설명한다.

시점 t1로부터 대략 동시에 또는 다소 늦은 시점 t2에 있어서, EC내 제어 처리부(264)는 EC 처리부(261)의 학습 처리부(2615)에 대하여 그 동작을 정지하는 것을 지시한다. 이와 동시에, EC내 제어 처리부(264)는 스위치 SW1 및 스위치 SW2를 오프 상태로 하고, 전달 특성 처리부(2611, 2612)와 가감산부(2614) 사이를 비접속 상태로 한다. 이에 의하여, 에코 제거 처리가 오프 상태로 되어, 즉 가감산부 (2614)에서 에코 제거 처리가 행해지지 않는다.

시점 t3에 있어서, 제1 DSP(25)내의 제어부(25MS)가 도 18을 참조하여 설명한 바와 같이 마이크로폰(MCa, MCb)을 크로스페이딩이 개시되도록 한다.

시점 t4로부터 실제로 크로스페이딩이 개시된다.

크로스페이딩 시간 τcf는, 통상 수십 ms, 예를 들어 10 ~ 80ms정도이다.

시점 t3 또는 시점 t4에서 제어부(25MS)로부터 크로스페이딩의 개시가 통보된 EC내 제어 처리부(264)는, 시점 t5에 있어서 학습 처리부(2615)에 메모리부(263)로부터 마이크로폰(MCb)에 대하여 시간 지연 요소와 필터 계수를 판독하여 전환된 전달 특성 처리부(2612)에서 설정하는 것을 지령한다. 학습 처리부(2615)는 새로운 에코 제거 처리의 대상으로 되는 마이크로폰(MCb)을 인지하고, 그 마이크로폰(MCb)을 위한 시간 지연 요소와 필터 계수를 메모리부(263)로부터 판독하여 대응하는 전달 특성 처리부(2612)로 설정한다.

시점 t6에 있어서, 제어부(25MS)로부터 크로스페이딩이 종료한 것이 통보된 EC내 제어 처리부(264)는 선택된 마이크로폰(MCb)에 대응하는 전달 특성 처리부(2612)가 A/D 변환기(274)의 출력 신호 S1이 입력되도록, 스위치 SW1을 구동한다. 이에 의하여, 선택된 전달 특성 처리부(2612)에서, 사전에 얻어진, 메모리부(263)에 기억되어 있는 시간 지연 요소와 필터 계수를 사용하여, 에코 제거 성분이 산출된다. 그러나, 이 상태에서, 스위치 SW2는 계속해서 오프 상태이기 때문에, 전달 특성 처리부(2612)의 출력은 가감산부(2614)에는 인가되지 않는다.

학습 처리부(2615)는 선택된 전달 특성 처리부(2612)의 출력 신호를 입력하 고, 그 출력 신호가 가감산부(2614)에 인가되어 에코 제거 처리했다고 가정한 때, 충분히 에코 제거 처리되는 상태에 도달했는지 여부를 체크한다.

학습 처리부(2615)는 상기 체크를 계속하여 행하고, 시점 t7에 있어서, 충분히 또는 어느 정도, 선택된 마이크로폰(MCb)에 대하여 에코 제거 처리 가능한 상태에 도달했다고 판단되는 경우, 스위치 SW2를 선택된 마이크로폰(MCb)에 대응하는 전달 특성 처리부(2612)의 출력 신호를 가감산부(2614)에 인가시켜 에코 제거 처리를 개시시킨다.

또는, 전술한 학습 처리부(2615)에 의한 체크를 실시하지 않고, 시점 t6과 시점 t7 사이는 에코 시간으로서 사전에 설정된 시간이므로, 시점 t6의 이후 소정 시간 경과후 시점 t7에서 상기 에코 제거 처리를 재개시켜도 된다.

이후, 마이크로폰(MCb)에 대하여, 가감산부(2614)에 있어서 전달 특성 처리부(2612)에서 산출된 에코 제거 성분을 감소시킬 수 있다.

학습 처리부(2615)는 가감산부(2614)의 출력에 상대측 음성 집음 장치로부터의 음 신호를 제거시킨 에코 제거 성분을 추정하고, 이를 위한 시간 지연 요소와 필터 계수를 학습하여, 메모리부(263)에 기억시키는 동시에 전달 특성 처리부(2612)로 설정한다.

이에 의하여, 제1 마이크로폰(MCa)으로부터 제2 마이크로폰(MCb)으로의 전환이 수행된 경우라도, 에코 제거 처리에 부자연스럽게 되는 것을 방지할 수 있다.

EC 처리부(261)에 있어서의 에코 제거 처리, 예를 들어 전달 특성 처리부(2611, 2612)에 있어서의 전달 특성 함수, 학습 처리부(2615)에 있어서의 학습 처 리 등은 예시이며, 다른 에코 제거 처리를 행하는 것도 가능하다.

본 실시예에 있어서는, 시상수(time constant) 또는 시간 지연 요소를 가지는 에코 성분에 대하여, 소정의 시간 동안 에코 제거 처리를 오프 상태로 함으로써, 부자연스러운 에코 제거 처리를 회피할 수 있다.

전술한 실시예는 크로스페이딩을 행한 경우이지만, 크로스페이딩를 행하지 않은 때는, 크로스페이딩 기간을 고려하지 않는 것으로 행하면 된다.

전술한 제2 DSP(에코 제거기)(26)에 있어서의 처리는 도 20에 예시한 구성의 EC(26)로서 행하는 경우를 예시하고 있지만, 본 발명의 실시예에 의해서 DSP(26)내의 구성을 특히 한정되지 않으며, 전술한 에코 제거 처리가 EC(26)내에서 실시할 수 있으면 된다.

본 실시예는 특히 복수개의 마이크로폰의 음성 신호에 대하여 1개의 EC(26) (EC 처리부 261)를 사용하여 에코 제거 처리를 행하는 경우에 유효하다.

또한, 전술한 실시예에 있어서는, 학습 처리부(2615)를 사용하여 항상 에코 제거 처리 성분을 추정하여, 전달 특성 처리부(2611, 2612)에 시간 지연 요소와 필터 계수를 설정하는 경우에 대하여 기술하였으나, 학습 처리부(2615)를 사용하지 않는 방법도 가능하다.

예를 들어, 음성 집음 장치를 설치할 때, 사전에 각 마이크로폰마다 전달 특성 함수를 구하고 각 마이크로폰마다 시간 지연 요소와 필터 계수를 구하여 메모리부(263)에 기억시켜 두고, 그것을 고정값으로서 사용한다. 즉, 마이크로폰의 전환시에 전술한 타이밍으로, 예를 들어 EC내 제어 처리부(264)가 전달 특성 처리부 (2611, 2612)로 설정한다. 이와 같은 방법에 의하면, 학습 처리부(2615)는 불필요하게 되고, 학습 처리부(2615)에서 연속하여 학습 처리하여 에코 제거 처리 성분을 추정할 필요가 없기 때문에, 제2 DSP(에코 제거기)(26)의 처리가 경감된다.

본 발명을 실시하는 경우 전술한 복수개의 실시예를 적당히 조합하는 것도 가능하다.

본 발명에 의하면, 마이크로폰 선택(전환)시에 에코 제거 처리를 정지시킴으로써 부자연스러운 에코 제거 처리가 회피될 수 있다.

Claims

소정의 배치 조건에 기초하여 배치된 복수개의 마이크로폰과;

상기 복수개의 마이크로폰의 집음 신호를 검출하고, 상기 검출한 집음 신호 중에서 유효한 집음 신호를 검출한 마이크로폰을 선택하는 마이크로폰 선택 수단과;

상기 선택된 마이크로폰의 음 신호에 대하여 에코 제거 처리를 행하는 에코 제거 처리 수단과;

상기 마이크로폰의 음 신호 전환시에, 소정 시간 동안 상기 에코 제거 처리를 정지시키는 에코 제거 처리 제어 수단

을 구비하는 것을 특징으로 하는 음성 집음 장치.
제1항에 있어서,

상기 마이크로폰 선택 수단은 새로운 마이크로폰의 집음 신호를 선택하여 출력할 때, 이전에 선택한 마이크로폰의 집음 신호와 새로운 마이크로폰의 집음 신호를 크로스페이딩시키며,

상기 에코 제거 처리 제어 수단은 상기 크로스페이딩의 기간에 상기 에코 제거 처리를 정지시키는 것을 특징으로 하는 음성 집음 장치.
소정의 배치 조건에 따라 배치된 복수개의 마이크로폰의 집음 신호를 검출하 고, 상기 검출한 집음 신호 중에서 유효한 집음 신호를 검출한 마이크로폰을 선택하는 마이크로폰 선택 단계와;

상기 선택된 마이크로폰의 음 신호에 대하여 에코 제거 처리를 행하는 에코 제거 처리 단계와;

상기 마이크로폰 선택 단계에서 상기 마이크로폰의 음 신호 전환시에, 소정 시간 동안 상기 에코 제거 처리를 정지시키는 에코 제거 처리 제어 단계

를 포함하는 것을 특징으로 하는 음성 집음 방법.
제3항에 있어서,

상기 마이크로폰 선택 단계에서 새로운 마이크로폰의 집음 신호를 선택하여 출력할 때, 이전에 선택한 마이크로폰의 집음 신호와 새로운 마이크로폰의 집음 신호를 크로스페이딩시키며,

상기 에코 제거 처리 제어 단계에서, 상기 크로스페이딩의 기간 동안 상기 에코 제거 처리를 정지시키는 것을 특징으로 하는 음성 집음 방법.