KR20160083904A - 마이크로폰 및 대응하는 디지털 인터페이스 - Google Patents
마이크로폰 및 대응하는 디지털 인터페이스 Download PDFInfo
- Publication number
- KR20160083904A KR20160083904A KR1020167014819A KR20167014819A KR20160083904A KR 20160083904 A KR20160083904 A KR 20160083904A KR 1020167014819 A KR1020167014819 A KR 1020167014819A KR 20167014819 A KR20167014819 A KR 20167014819A KR 20160083904 A KR20160083904 A KR 20160083904A
- Authority
- KR
- South Korea
- Prior art keywords
- microphone
- data
- clock
- frequency
- signal
- Prior art date
Links
- 230000000694 effects Effects 0.000 claims abstract description 79
- 238000001514 detection method Methods 0.000 claims abstract description 43
- 239000000872 buffer Substances 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 57
- 230000001360 synchronised effect Effects 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 17
- 230000001413 cellular effect Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000000630 rising effect Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- ROXBGBWUWZTYLZ-UHFFFAOYSA-N [6-[[10-formyl-5,14-dihydroxy-13-methyl-17-(5-oxo-2h-furan-3-yl)-2,3,4,6,7,8,9,11,12,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl]oxy]-4-methoxy-2-methyloxan-3-yl] 4-[2-(4-azido-3-iodophenyl)ethylamino]-4-oxobutanoate Chemical compound O1C(C)C(OC(=O)CCC(=O)NCCC=2C=C(I)C(N=[N+]=[N-])=CC=2)C(OC)CC1OC(CC1(O)CCC2C3(O)CC4)CCC1(C=O)C2CCC3(C)C4C1=CC(=O)OC1 ROXBGBWUWZTYLZ-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
아날로그 신호들이 사운드 트랜스듀서로부터 수신된다. 상기 아날로그 신호들은 디지털화된 데이터로 변환된다. 그 디지털화된 데이터 내에 음성 활성이 존재하는가의 여부에 대한 판별이 이루어진다. 음성 활성을 검출하면, 음성 활성의 표시가 프로세싱 디바이스에게 송신된다. 그 표시는 표준 인터페이스를 건너서 송신되며, 그리고 그 표준 인터페이스는 잠재적으로 상이한 제조자들로부터의 복수의 디바이스들에 연결되도록 호환성이 있도록 구성된 것이다.
Description
관련된 출원들에 대한 상호 참조
본 특허는 2013년 11월 8일에 출원된 "Microphone and Corresponding Digital Interface" 제목의 미국 임시 출원 No. 61/901,832에 대해 35 U.S.C. ㄷ119 (e)의 이익을 향유하며, 상기 출원의 내용은 그 전체가 본원에 참조로서 편입된다. 본 특허는 2013년 5월 23일에 출원된 "VAD Detection Microphone and Method of Operating the Same" 제목의 미국 임시 출원 No. 61/826,587에 대한 우선권을 향유하는 2014년 5월 20일에 출원된 "VAD Detection Microphone and Method of Operating the Same" 제목의 미국 출원 No. 14/282,101의 일부 계속 출원이며, 상기 두 출원 모두는 그 전체가 본원에 참조로서 편입된다.
기술분야
본원은 음향 활성 검출 (acoustic activity detection (AAD)) 접근방식들 및 음성 활성 검출 (voice activity detection (VAD)) 접근방식들, 그리고 그것들의 다른 유형의 전자 디바이스와의 정합에 관련된 것이다.
음성 활성 검출 (voice activity detection (VAD)) 접근방식들은 음성 인식 소프트웨어 및 하드웨어의 중요한 컴포넌트들이다. 예를 들면, 인식 소프트웨어는 보통은 MIPS 집약적 알고리즘으로 마이크로폰의 오디오 신호를 계속해서 스캔하여 음성 활성을 찾는다. 상기 알고리즘은 계속해서 동작하기 때문에, 이 음성 검출에서 사용되는 전력은 막대하다.
셀룰러 폰들과 같은 모바일 디바이스 제품들에 마이크로폰이 또한 배치된다. 이 소비자 디바이스는 표준화된 인터페이스를 가진다. 상기 마이크로폰이 이 인터페이스와 호환되지 않는다면, 그것은 모바일 디바이스 제품과 함께 사용될 수 없다.
많은 모바일 디바이스 제품들은 그 모바일 디바이스 내에 포함된 음성 인식을 구비한다. 그러나, 상기 알고리즘들을의 전력 사용은 상기 배터리에 충분하게 부담을 주며 그래서 사용자가 버튼을 누르거나 상기 디바이스를 깨운 이후에만 상기 특징은 종종 활성화된다. 이 특징을 항상 가능하게 하기 위해서, 전체적인 해결책의 전력 소비는 상기 디바이스의 전체적인 배터리 수명에 최소의 영향을 주기에 충분하게 작아야만 한다. 언급된 것처럼, 이것은 현존하는 디바이스들에서는 발생하지 않는다.
상기 언급된 문제점들로 인해서, 이전의 해결책들에 대해 몇몇의 사용자들의 불만족이 발생했다.
본 발명은 상기의 문제점들 중 적어도 일부를 해결하기 위한 마이크로폰 및 대응하는 디지털 인터페이스를 제공하려고 한다.
다음의 발명을 실시하기 위한 구체적인 내용 부분에서 명시한다.
본 발명의 효과는 본 명세서의 해당되는 부분들에 개별적으로 명시되어 있다.
본 발명 개시에 대한 완전한 이해를 위해서, 다음의 상세한 설명 및 첨부된 도면들에 대해 참조해야 한다.
도 1a는 본 발명의 다양한 실시예들에 따른 음향 활성 검출 (AAD)을 구비한 음향 시스템의 블록도를 포함한다.
도 1b는 본 발명의 다양한 실시예들에 따른 음향 활성 검출 (AAD)을 구비한 다른 음향 시스템의 블록도를 포함한다.
도 2는 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 한 모습을 보여주는 타이밍도를 포함한다.
도 3은 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 다른 모습을 보여주는 타이밍도를 포함한다.
도 4는 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 상태들을 보여주는 상태 천이도를 포함한다.
도 5는 본 발명의 다양한 실시예들에 따른 도 4의 상태 도면에서 보이는 상태들 사이에서의 천이들을 위한 상태들을 보여주는 테이블을 포함한다.
도 6은 본 발명의 다양한 실시예들에 따른 멀티-마이크로폰 배치의 블록도를 포함한다.
도 7은 본 발명의 다양한 실시예들에 따른 클록 검출기의 한 예의 블록도를 포함한다.
본 발명이 속한 기술 분야에서의 통상의 지식을 가진 자들은 상기 도면들에서의 요소들이 간략함 및 명료함을 위해 도시된 것이라는 것을 인정할 것이다. 특정 행동들 및/또는 단계들은 발생한 특별한 순서대로 기술되거나 도시될 수 있을 것이며, 본 발명이 속한 기술 분야에서의 통상의 지식을 가진 자들은 순서에 관한 그런 특이성이 실제로는 필요하지 않다는 것을 이해할 것이라는 것이 또한 인정될 것이다. 본원에서 사용된 용어들 및 표현들은 그 용어들 및 표현들의 대응하는 각자의 질의 및 연구의 영역들에 관한 그런 용어들 및 표현들과 일치한다면, 특정한 의미들이 본원에 다르게 제시되는 경우를 제외하고는, 일반적인 의미를 가진다는 것이 또한 이해될 것이다.
도 1a는 본 발명의 다양한 실시예들에 따른 음향 활성 검출 (AAD)을 구비한 음향 시스템의 블록도를 포함한다.
도 1b는 본 발명의 다양한 실시예들에 따른 음향 활성 검출 (AAD)을 구비한 다른 음향 시스템의 블록도를 포함한다.
도 2는 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 한 모습을 보여주는 타이밍도를 포함한다.
도 3은 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 다른 모습을 보여주는 타이밍도를 포함한다.
도 4는 본 발명의 다양한 실시예들에 따른 도 1의 시스템의 동작의 상태들을 보여주는 상태 천이도를 포함한다.
도 5는 본 발명의 다양한 실시예들에 따른 도 4의 상태 도면에서 보이는 상태들 사이에서의 천이들을 위한 상태들을 보여주는 테이블을 포함한다.
도 6은 본 발명의 다양한 실시예들에 따른 멀티-마이크로폰 배치의 블록도를 포함한다.
도 7은 본 발명의 다양한 실시예들에 따른 클록 검출기의 한 예의 블록도를 포함한다.
본 발명이 속한 기술 분야에서의 통상의 지식을 가진 자들은 상기 도면들에서의 요소들이 간략함 및 명료함을 위해 도시된 것이라는 것을 인정할 것이다. 특정 행동들 및/또는 단계들은 발생한 특별한 순서대로 기술되거나 도시될 수 있을 것이며, 본 발명이 속한 기술 분야에서의 통상의 지식을 가진 자들은 순서에 관한 그런 특이성이 실제로는 필요하지 않다는 것을 이해할 것이라는 것이 또한 인정될 것이다. 본원에서 사용된 용어들 및 표현들은 그 용어들 및 표현들의 대응하는 각자의 질의 및 연구의 영역들에 관한 그런 용어들 및 표현들과 일치한다면, 특정한 의미들이 본원에 다르게 제시되는 경우를 제외하고는, 일반적인 의미를 가진다는 것이 또한 이해될 것이다.
여기에서 설명되는 접근 방식들은 음성 활성 검출 (voice activity detection (VAD)) 또는 음향 활성 검출 (acoustic activity detection (AAD)) 접근 방식들을 마이크로폰들로 통합한다. 마이크로폰 컴포넌트들 (예를 들면, VAD 또는 AAD 모듈들) 중 적어도 몇몇은 주문형 반도체 (ASIC) 또는 다른 집적 디바이스에 배치된다. VAD 또는 AAD 모듈들과 같은 컴포넌트들을 통합하는 것은 상기 시스템의 전력 요구사항들을 크게 줄어들게 하며, 그럼으로써 그 시스템에 대한 사용자의 만족을 증가시킨다. 상기 마이크로폰 및 그 마이크로폰이 배치되는 전자 디바이스 (예를 들면, 셀룰러폰이나 개인용 컴퓨터) 내 회로 사이에 인터페이스가 또한 제공된다. 그 인터페이스는 표준화되어, 모든 전자 디바이스들 (예를 들면, 셀룰러폰)은 아니더라도 대부분의 경우에 그 인터페이스 구성이 그 마이크로폰의 배치를 가능하게 하도록 한다. 상기 마이크로폰은 음성 신호들과 같은 음향 이벤트들을 계속 검출하는 저전력 모드를 포함하는 동작의 다중 모드들에서 동작한다.
이런 실시예들 중 많은 실시예들에서, 마이크로폰에서 아날로그 신호들이 사운드 트랜스듀서로부터 수신된다. 그 아날로그 신호들은 디지털화된 데이터로 변환된다. 그 디지털화된 신호 내에서 음성 활성이 존재하는가의 여부에 관하여 판별이 내려진다. 음성 활성을 검출하는 즉시, 음성 활성의 표시가 프로세싱 디바이스로 송신된다 .그 표시는 표준 인터페이스를 건너서 송신되며, 그리고 그 표준 인터페이스는 잠재적으로 상이한 제조자들로부터의 복수의 디바이스들에 연결되도록 호환성이 있도록 구성된다.
다른 모습들에서, 상기 마이크로폰은 다중 동작 모드들에서 동작하며, 그래서 외부 클록이 프로세싱 디바이스로부터 수신되고 있는가의 여부, 또는 상기 마이크로폰에 전력이 공급되고 있는가의 여부 중 하나 이상을 기초로 하여 상기 마이크로폰이 제1 마이크로폰 감지 모드 및 제2 마이크로폰 감지 모드에서 선택적으로 동작하고 그 사이에서 이동하도록 한다. 상기 제1 마이크로폰 감지 모드 내에서, 상기 마이크로폰은 내부 클록을 활용하며, 사운드 트랜스듀서로부터 제1 아날로그 신호들을 수신하고, 그 제1 아날로그 신호들을 제1 디지털화된 데이터로 변환하며, 그 제1 디지털화된 데이터 내에 음성 활성이 존재하는가의 여부를 판별하며, 그리고 음성 활성을 검출하면, 음성 활성의 표시를 상기 프로세싱 디바이스에게 송신하며, 상기 내부 클록을 이용하는 것으로부터 그 후에 스위치하며 그리고 외부 클록을 수신한다. 상기 제2 마이크로폰 감지 모드 내에서, 상기 마이크로폰은 사운드 트랜스듀서로부터 제2 아날로그 신호들을 수신하고, 그 제2 아날로그 신호들을 제2 디지털화된 데이터로 변환하며, 그 제2 디지털화된 데이터 내에 음성 활성이 존재하는가의 여부를 판별하며, 그리고 음성 활성을 검출하면, 음성 활성의 표시를 상기 프로세싱 디바이스에게 송신하며, 그리고 상기 프로세싱 디바이스에 의해 공급된 외부 클록을 사용한다.
몇몇의 예들에서, 상기 표시는 음성 활성이 검출되었다는 것을 표시하는 신호 또는 디지털화된 신호를 포함한다. 다른 예들에서, 상기 트랜스듀서는 미세전자기계 시스템 (microelectromechanical system (MEMS)) 디바이스, 압전 디바이스, 또는 스피커 중 하나를 포함한다.
몇몇의 모습들에서, 상기 수신하고, 변환하고, 판별하고, 그리고 송신하는 것은 집적 회로에서 수행된다. 다른 모습들에서, 상기 집적 회로는 셀룰러폰, 스마트폰, 개인용 컴퓨터, 웨어러블 전자 디바이스, 또는 태블릿 중 하나에 배치된다. 몇몇의 예들에서, 상기 수신하고, 변환하고, 판별하고, 그리고 송신하는 것은 단일 모드 동작에서 동작할 때에 수행된다.
몇몇의 예들에서, 상기 단일 모드는 전력 절약 모드이다. 다른 예들에서, 상기 디지털화된 데이터는 PDM (pulse density modulation) 데이터 또는 PCM (pulse code modulated) 데이터를 포함한다. 몇몇의 다른 예들에서, 상기 표시는 클록 신호를 포함한다. 또 다른 예들에서, 상기 표시는 하나 이상의 DC 전압 레벨들을 포함한다.
몇몇의 예들에서, 상기 표시를 송신한 이후에, 클록 신호가 상기 마이크로폰에서 수신된다. 몇몇의 모습들에서, 상기 클록 신호는 상기 마이크로폰과 외부 프로세서 사이에서의 데이터 이동을 동기화하기 위해 활용된다. 다른 예들에서, 상기 수신된 클록의 제1 주파수는 상기 마이크로폰에 배치된 내부 클록의 제2 주파수와 동일하다. 또 다른 예들에서, 상기 수신된 클록의 제1 주파수는 상기 마이크로폰에 배치된 내부 클록의 제2 주파수와 상이하다.
몇몇의 예들에서, 클록을 수신하기 이전에, 상기 마이크로폰은 제1 모드의 동작에 있으며, 그리고 상기 클록을 수신한 것은 상기 마이크로폰이 제2 모드의 동작으로 진입하도록 하기에 효과적이다. 다른 예들에서, 상기 표준 인터페이스는 PDM 프로토콜, I2S 프로토콜, 또는 I2C 프로토콜의 임의 조합과 호환된다.
이 실시예들 중의 다른 실시예들에서, 장치는 아날로그-디지털 변환 회로를 포함하며, 그 아날로그-디지털 변환 회로는 사운드 트랜스듀서로부터 아날로그 신호들을 수신하며 그리고 그 아날로그 신호를 디지털화된 데이터로 변환하도록 구성된다. 상기 장치는 표준 인터페이스 및 프로세싱 디바이스를 또한 포함한다. 상기 프로세싱 디바이스는 상기 아날로그-디지털 변환 회로 및 상기 표준 인터페이스에 연결된다. 상기 프로세싱 디바이스는 상기 디지털화된 신호 내에 음성 활성이 존재하는가의 여부를 판별하며 그리고 음성 활성이 검출되면 음성 활성의 표시를 외부 프로세싱 디바이스로 송신하도록 구성된다. 상기 표시는 상기 표준 인터페이스를 건너서 송신되며, 그리고 상기 표준 인터페이스는 잠재적으로 상이한 제조자들로부터의 복수의 디바이스들에 연결되도록 호환성이 있도록 구성된다.
이 실시예들 중 많은 실시예들에서, 제1 마이크로폰으로부터 제1 아날로그 신호들이 수신되며, 그 제1 아날로그 신호들은 제1 디지털 데이터로 변환되며 그리고 그 제1 디지털 데이터는 제1 내부 클록을 이용하여 제1 버퍼에 저장된다. 제2 내부 클록에 따라 제2 마이크로폰으로부터 제2 아날로그 신호들이 수신되고, 그 제2 아날로그 신호는 제2 디지털 데이터로 변환되고 그리고 그 제2 디지털 데이터는 제2 버퍼에 저장된다. 상기 제1 버퍼 내 상기 제1 디지털 데이터는 상기 제2 버퍼 내 상기 제2 디지털 데이터와 반드시 실시간으로 동기되지는 않는다. 상기 제1 디지털 데이터를 기초로 하여 음성 활성이 제1 음향 활성 검출 (acoustic activity detect (AAD)) 모듈에서 발생했는가의 여부에 대한 판별이 내려진다. 음성 활성이 판별될 때에, 음성 활성 검출 신호가 외부 프로세서에게 전송되며, 그리고 그 외부 프로세서는 상기 음성 활성 검출 신호를 수신하면 외부 클록 신호를 응답하여 제공한다. 상기 제1 버퍼로부터의 상기 제1 디지털 데이터 그리고 상기 제2 버퍼로부터의 상기 제2 디지털 데이터는 상기 외부 클록을 이용하여 줄어들어, 줄어든 (decimated) 출력 데이터를 제공하며, 그리고 상기 줄어든 출력 데이터는 실시간으로 정렬된 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 구비한다.
다른 모습들에서, 상기 제1 마이크로폰 및 상기 제2 마이크로폰에서 상기 외부 클록이 수신되며, 그리고 상기 제1 마이크로폰 및 상기 제2 마이크로폰의 동작은 상기 외부 클록에 동기된다. 몇몇의 다른 모습들에서, 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰 및 상기 제2 마이크로폰으로부터의 상기 줄어든 출력 데이터를 이용하여 두 개의 채널 음성 신호 향상이 수행된다.
몇몇의 예들에서, 상기 제1 아날로그 신호를 제1 디지털 신호로 변환하는 것은 상기 제1 아날로그 신호를 PDM 데이터로 그리고 그 후에 PCM 데이터로 변환하는 것을 포함한다. 다른 예들에서, 외부 클록이 상기 외부 프로세서에 인가될 때까지 상기 제2 마이크로폰은 저 전력 또는 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않다.
몇몇의 모습들에서, 상기 외부 프로세서는 데시메이터 (decimator)를 포함하며 그리고 그 데시메이터는 동일한 클록, 및 동일한 샘플 동기화 신호 또는 워드 스트로브 (Word Strobe (WS))를 이용하여 둘 이상의 채널들을 줄어들게 하도록 구성된다. 몇몇의 다른 예들에서, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들은 공통 클록 라인 및 다중의 시리얼 PDM 데이터 라인들을 경유하여 상기 외부 프로세서에 연결된다.
몇몇의 모습들에서, 상기 제1 마이크로폰은 제1 버퍼를 포함하며 그리고 상기 제1 마이크로폰은 제1 AAD 모듈 및 활성인 제1 버퍼로 감지 모드에서 유지된다. 다른 모습들에서, 상기 제2 마이크로폰 및 추가 마이크로폰들은 상기 외부 프로세서에 의해 외부 클록이 인가될 때까지 저 전력 또는 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않다. 다른 예들에서, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들로부터의 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 상기 제3 마이크르폰으로부터의 상기 줄어든 출력 데이터로 다중 채널 음성 신호 향상을 수행된다.
이 실시예들 중 다른 실시예들에서, 장치는 외부 프로세서; 상기 외부 프로세서에 연결된 제1 버퍼; 상기 외부 프로세서에 연결된 제2 버퍼; 그리고 상기 제1 버퍼에 연결된 제1 아날로그-디지털 컨버터를 포함한다. 상기 제1 아날로그-디지털 컨버터는 제1 마이크로폰으로부터 제1 아날로그 신호들을 수신하고, 그 제1 아날로그 신호들을 제1 디지털 데이터로 변환하고 그리고 그 제1 디지털 데이터를 제1 버퍼에 저장하도록 구성된다. 상기 장치는 상기 제1 아날로그-디지털 컨버터에 연결된 제1 음향 활성 검출 (AAD) 모듈을 또한 포함한다. 상기 제1 음향 활성 검출 모듈은 음성 활성이 발생했는가의 여부를 상기 제1 디지털 데이터를 기초로 하여 판별하고, 그리고 음성 활성이 검출될 때에, 음성 활성 검출 신호를 상기 외부 프로세서로 전송하도록 구성된다. 상기 외부 프로세서는 상기 음성 활성 검출 신호를 수신하면 외부 클록 신호를 응답으로 제공한다. 상기 장치는 상기 제2 버퍼에 연결된 제2 아날로그-디지털 컨버터를 또한 포함한다. 상기 제2 아날로그-디지털 컨버터는 상기 외부 클록에 따라 제2 마이크로폰으로부터 제2 아날로그 신호들을 수신하고, 그 제2 아날로그 신호들을 제2 디지털 데이터로 변환하고 그리고 그 제2 디지털 데이터를 제2 버퍼에 저장하도록 구성된다. 상기 제1 버퍼 내 상기 제1 디지털 데이터는 상기 제2 버퍼 내 상기 제2 디지털 데이터와 반드시 실시간으로 동기되지는 않는다. 상기 제1 버퍼, 상기 제1 아날로그-디지털 컨버터, 및 상기 제1 음향 활성 검출 모듈은 제1 마이크로폰에 배치되며, 그리고 이 경우 상기 제2 버퍼 및 상기 제2 아날로그-디지털 컨버터는 제2 마이크로폰에 배치된다. 상기 외부 프로세서는 줄어든 출력 데이터를 제공하기 위해 상기 외부 클록을 이용하여 상기 제1 버퍼로부터 상기 제1 디지털 데이터를 그리고 상기 제2 버퍼로부터 상기 제2 디지털 데이터를 줄이도록 구성된다. 상기 줄어든 출력 데이터는 실시간으로 정렬된 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 가진다.
몇몇의 예들에서, 상기 외부 클록은 상기 제1 마이크로폰 및 상기 제2 마이크로폰에서 수신되며, 그리고 상기 제1 마이크로폰 및 상기 제2 마이크로폰의 동작은 상기 외부 클록에 동기된다. 다른 예들에서, 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰 및 상기 제2 마이크로폰으로부터의 상기 줄어든 출력 데이터를 이용하여 두 개의 채널 음성 신호 향상이 수행된다.
몇몇의 예들에서, 상기 제1 아날로그 신호는 PDM 데이터로 그리고 그 후에 PCM 데이터로 변환된다. 다른 예들에서, 외부 클록이 상기 외부 프로세서에 인가될 때까지 상기 제2 마이크로폰은 저 전력 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않다.
다른 예들에서, 상기 외부 프로세서는 데시메이터 (decimator)를 포함하며 그리고 그 데시메이터는 동일한 클록, 및 동일한 샘플 동기화 신호 또는 워드 스트로브 (Word Strobe (WS))를 이용하여 둘 이상의 채널들을 줄어들게 하도록 구성된다.
다른 모습들에서, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들은 공통 클록 라인 및 다중의 시리얼 PDM 데이터 라인들을 경유하여 상기 외부 프로세서에 연결된다. 다른 예들에서, 상기 제1 마이크로폰은 제1 AAD 모듈 및 활성인 제1 버퍼로 감지 모드에서 유지된다. 또 다른 예들에서, 상기 제2 마이크로폰 및 추가 마이크로폰들은 상기 외부 프로세서에 의해 외부 클록이 인가될 때까지 저 전력 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않다. 다른 모습들에서, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들로부터의 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 상기 제3 마이크르폰으로부터의 상기 줄어든 출력 데이터로 다중 채널 음성 신호 향상이 수행된다.
이 실시예들 중 많은 실시예들에서, 제1 주파수를 가진 외부 클록 신호이 수신된다. 내부 클록의 제2 주파수를 적어도 부분적으로 기초로 하여 분할 비율을 자동적으로 결정하는 것이 수행되며, 상기 제2 주파수는 상기 제1 주파수보다 더 크다. 상기 외부 클록 신호의 상기 제1 주파수, 상기 내부 클록 신호의 상기 제2 주파수, 및 미리 정해진 원하는 샘플링 주파수를 적어도 부분적으로 기초로 하여 데시메이션 (decimation) 팩터가 자동적으로 결정된다. 상기 분할 비율이 상기 내부 클록 신호에 적용되어, 상기 제1 주파수를 축소된 제3 주파수로 축소시킨다. 상기 데시메이션 팩터는 상기 축소된 제3 주파수에 적용되어, 상기 미리 정해진 원하는 샘플링 주파수를 제공한다. 상기 미리 정해진 원하는 샘플링 주파수를 이용하여 데이터가 버퍼로 클록킹된다.
다른 모습들에서, 상기 외부 클록 신호는 나중에 제거된다. 다른 예들에서, 상기 미리 정해진 원하는 샘플링 주파수는 약 16 kHz의 주파수 레이트를 포함한다.
이 실시예들 중 다른 실시예들에서, 장치는 입력단 및 출력단을 구비한 인터페이스 회로를 포함하며, 그리고 상기 입력단은 제1 주파수를 가진 외부 클록 신호를 수신하도록 구성된다. 상기 장치는 프로세싱 회로를 또한 포함하며, 그리고 그 프로세싱 회로는 상기 인터페이스 회로에 연결되며 그리고 내부 클록의 제2 주파수를 적어도 부분적으로 기초로 하여 분할 비율을 자동적으로 결정하도록 구성되며, 상기 제2 주파수는 상기 제1 주파수보다 더 크다. 상기 프로세싱 회로는 상기 외부 클록 신호의 상기 제1 주파수, 상기 내부 클록 신호의 상기 제2 주파수, 및 미리 정해진 원하는 샘플링 주파수를 적어도 부분적으로 기초로 하여 데시메이션 팩터를 자동적으로 결정하도록 더 구성된다. 상기 프로세싱 회로는 상기 분할 비율을 상기 내부 클록 신호에 적용하여 상기 제1 주파수를 축소된 제3 주파수로 축소시키고 그리고 상기 데시메이션 팩터를 상기 축소된 제3 주파수에 적용하여 상기 미리 정해진 원하는 샘플링 주파수를 제공하도록 더 구성된다. 상기 프로세싱 회로는 상기 미리 정해진 원하는 샘플링 주파수를 이용하여 상기 출력단을 경유하여 데이터를 버퍼로 클록킹하도록 더 구성된다.
이제 도 1a를 참조하면, 마이크로폰 장치 (100)는 전하 펌프 (101), 용량성 미세전자기계 시스템 (microelectromechanical system (MEMS)) 센서 (102), 클록 검출기 (104), 시그마-델타 변조기 (106), 음향 활성 검출 (ADD) 모듈 (108), 버퍼 (110), 그리고 제어 모듈 (112)을 포함한다. 이 요소들은 하드웨어 및 프로그램된 소프트웨어의 다양한 조합들로서 구현될 수 있을 것이며 그리고 이 컴포넌트들 중 적어도 몇몇은 ASIC 상에 배치될 수 있다는 것이 인정될 것이다.
상기 전하 펌프 (101)는 상기 용량성 MEME 센서 (102)의 진동판을 활성화시키고 바이어스를 걸기 위해 전압을 제공한다. (예를 들면, 센서로서 압전 디바이스를 사용할 때에) 몇몇의 애플리케이션들을 위해서, 상기 전하 펌프는 상기 마이크로폰 외부에 있을 수 잇는 파워 서플라이와 교체될 수 있을 것이다. 음성 또는 다른 음향 신호가 상기 진동판을 흔들고, 상기 용량성 MEMS 센서 (102)의 커패시턴스가 변하며, 그리고 전압들이 생성되어 전기 신호가 된다. 한 모습에서, 상기 전하 펌프 (101) 및 상기 MEMS 센서 (102)는 AISC 상에 배치되지 않는다 (그러나, 다른 모습에서는, 그것들은 그 ASIC 상에 배치될 수 있다). 상기 MEMS 센서 (102)는 대안으로 압전 센서, 스피커, 또는 다른 유형의 감지 디바이스 또는 설비일 수 있을것이다.
클록 검출기 (104)는 어느 클록이 시그마-델타 변조기 (106)로 가고 그리고 상기 ASIC의 디지털 부분을 동기화하는가를 제어한다. 외부 클록이 존재한다면, 상기 클록 검출기 (104)는 그 클록을 사용한다; 외부 클록이 존재하지 않는다면, 상기 클록 검출기 (104)는 데이터 타이밍/클록킹 목적들을 위해 내부 발진기 (103)를 사용한다.
상기 시그마-델타 변조기 (106)는 상기 아날로그 신호를 디지털 신호로 변환한다. 한 모습에서 상기 시그마-델타 변조기 (106)의 출력은 일-비트 시리얼 스트림이다. 대안으로, 상기 시그마-델타 변조기 (106)는 임의 유형의 아날로그-디지털 컨버터일 수 있다.
상기 버퍼 (110)는 데이터를 저장하고 과거 데이터의 연속적인 저장부를 구성한다. 음향 활성이 탐지되는 때까지, 이 과거의 추가적 데이터가 상기 버퍼 (110) 내에 저장된다. 다른 말로 하면, 상기 버퍼 (110)는 과거의 오디오 활성의 이력을 저장한다. 오디오 이벤트가 발생할 때에 (예를 들면, 트리거 워드가 검출될 때에), 상기 제어 모듈 (112)은 상기 버퍼 (110)에게 그 버퍼 (110)로부터 데이터를 스풀 아웃 (spool out)하도록 지시한다. 일 예에서, 상기 버퍼 (110)는 활성 검출 이전에 생성된 데이터의 이전의 약 180 ms를 저장한다. 일단 활성이 검출되면, 상기 마이크로폰 (100)은 그 버퍼링된 데이터를 호스트 (예를 들면, 셀룰러폰과 같은 소비자 디바이스 내 전자 회로)로 전송한다.
상기 음향 활성 검출 (acoustic activity detection (AAD)) 모듈 (108)은 음향 활성을 검출한다. 트리거 워드, 트리거 구절 (phrase), 특정 잡음 또는 사운드 등의 발생과 같은 이벤트들을 검출하기 위해 다양한 접근 방식들이 사용될 수 있다. 한 모습에서, 상기 모듈 (108)은 음성-유사한 서명을 찾기 위해 인입하는 음향 신호들을 모니터한다 (또는 다른 적합한 특성들 또는 기준들을 찾기 위해 모니터한다). 트리거 요구사항들을 충족시키는 음향 활성을 검출하면, 상기 마이크로폰 (100)은 완전한 음성 인식 프로세스를 완료하기 위해서 시스템 체인의 나머지를 깨우기 위해 펄스 밀도 변조 (pulse density modulation (PDM)) 스트림을 전송한다. 다른 유형의 데이터가 또한 사용될 수 있을 것이다.
상기 제어 모듈 (112)은 상기 데이터가 상기 버퍼로부터 전송될 때를 제어한다. 본원의 다른 곳에 설명된 것처럼, AAD 모듈 (108)에 의해 활성이 검출되었을 때에, 상기 데이터는 VDD 핀 (120), 클록 핀 (122), 셀렉트 (select) 핀 (124), 데이터 핀 (126) 및 그라운드 핀 (128)을 포함하는 인터페이스를 걸쳐서 클록 아웃된다 (clock out). 상기 핀들 (120 - 128)은 다양한 유형의 전자 회로들, 예를 들면, 셀룰러폰들에서 사용된 그런 유형의 회로들과 함께 인식 가능하고 동작하는 것에 호환되는 인터페이스 (119)를 형성한다. 한 모습에서, 상기 마이크로폰 (100)은 셀룰러폰 내부의 회로와 통신하기 위해 상기 인터페이스 (119)를 사용한다. 상기 인터페이스 (119)가 셀룰러폰들 사이에서 표준화되기 때문에, 상기 마이크로폰 (100)은 상기 표준 인터페이스를 활용하는 어떤 전화기에도 위치하거나 배치될 수 있다. 상기 인터페이스 (119)는 상기 셀룰러폰 내 호환 회로에 심리스하게 (seamlessly) 연결된다. 다른 인터페이스들이 다른 핀 출력들과 함께 하는 것이 가능하다. 상이한 핀들이 인터럽트들을 위해 또한 사용될 수 있을 것이다.
동작 시에, 상기 마이크로폰 (100)은 다양한 상이한 모드들 그리고 이 모드들을 커버하는 여러 상태들에서 동작한다. 예를 들면, (미리 정해진 범위 내에 속한 주파수를 가진) 클록 신호가 마이크로폰 (100)에 공급될 때에, 그 마이크로폰 (100)은 표준 동작 모드에서 동작한다. 상기 주파수가 그 범위 내에 있지 않을 때에, 상기 마이크로폰 (100)은 감지 모드 내에서 동작한다. 그 감지 모드에서, 상기 마이크로폰 (100)의 내부 발진기 (130)가 사용되고 있으며, 그리고 음향 이벤트의 검출 시에, 데이터 전송은 상승 클록 에지와 정렬되며, 이 경우 상기 클록은 상기 내부 클록이다.
이제 도 1b를 참조하면, 마이크로폰 (100)의 다른 예가 설명된다. 이 예는 도 1a에서 보인 것들과 동일한 요소들을 포함하며 그리고 이 요소들은 도 1a에서 보이는 것들과 동일한 라벨들을 이용하여 번호가 매겨진다.
추가로, 도 1b의 마이크로폰 (100)은 저역 필터 (140), 레퍼런스 (142), 데시메이션 (decimation)/압축 모듈 (144), 압축해제 PDM 모듈 (146), 그리고 전치-증폭기 (pre-amplifier) (148)를 포함한다.
저역 필터 (140)의 기능은 상기 전하 펌프로부터의 고주파수를 제거한다. 레퍼런스 (142)의 기능은 상기 시스템 내 컴포넌트들에 의해 간편 레퍼런스 값 (convenient reference value)으로서 사용된 전압 또는 다른 레퍼런스이다. 데시메이션/압축 모듈 (144)의 기능은 상기 버퍼 크기를 최소화하고 상기 데이터를 취하거나 압축하고 저장하기 위한 것이다. 상기 압축해제 PDM 모듈 (146)의 기능은 데이터를 상기 제어 모듈로부터 당겨 떨어뜨리는 것이다. 상기 전치-증폭기 (148)의 기능은 상기 센서 출력 신호를 사용가능한 전압 레벨로 가져가는 것이다.
도 1a 및 도 1b에서 참조번호 100의 라벨로 식별된 컴포넌트들은 단일의 주문형 반도체 (application specific integrated circuit (ASIC)) 또는 다른 집적 디바이스 상에 배치될 수 있다. 그러나, 상기 전하 펌프 (101)는 도 1a에서 상기 ASCI (160) 상에 배치되지 않으며 도 1b의 시스템 내 ASIC 상에 배치된다. 이 요소들은 특별한 구현에서 상기 ASIC 상에 배치될 수 있고 또는 배치되지 않을 수도 있을 것이다. 상기 ASIC은 신호 처리 기능들과 같은 다른 기능들을 가질 수 있을 것이라는 것이 인정될 것이다.
이제 도 2, 도 3, 도 4 및 도 5를 참조하면, 마이크로폰 (예를 들면, 도 1의 마이크로폰 (100))은 표준 성능 모드 및 감지 모드에서 동작하며, 그리고 이것들은 상기 클록 주파수에 의해 결정된다. 표준 성능 모드에서, 상기 마이크로폰은 표준의 마이크로폰으로서 행동하여, 수신한 데이터를 클록 아웃한다. 상기 마이크로폰이 표준 모드에서 동작하도록 하기 위해 필요한 주파수 범위는 문제의 부품을 위한 데이터시트에 정의되거나 규정될 수 있으며 또는 그렇지 않고 마이크로폰의 제조자에 의해 제공될 수 있을 것이다.
감지 모드에서, 상기 마이크로폰의 출력은 3상태 (tri-state)이며 그리고 내부 클록이 감지 회로에 인가된다. 일단 상기 AAD 모듈이 트리거하면 (예를 들면, 음향 이벤트가 발생했다는 것을 표시하는 트리거 신호를 송신한다), 상기 마이크로폰은 버퍼링된 PDM 데이터를 상기 내부 클록 (예를 들면, 512 kHz 클록)에 동기된 상기 마이크로폰 데이터 핀 (예를 들면, 참조번호 126의 data 핀) 상으로 전송한다. 이 내부 클록은 이 모드 동안의 출력으로서 select 핀 (예를 들면, 참조번호 124의 select 핀)으로 공급될 것이다. 이 모드에서, 상기 데이터는 처음에 생성된 클록 (select 핀 상의 출력)의 상승 에지 (rising edge) 상에서 유효할 것이다. 이 동작은 현존하는 I2S-호환 하드웨어 블록과의 호환성을 보장한다. 상기 클록 핀 (예를 들면, 참조번호 122의 clock 핀) 및 상기 데이터 핀 (예를 들면, 참조번호 126의 data 핀)은 활성이 더 이상 검출되지 않은 이후에 세트 타임동안 데이터를 출력하는 것을 중단할 것이다. 이 모드의 주파수는 문제의 부품을 위한 데이터시트에서 정의된다. 다른 예에서, 상기 인터페이스는 PDM 프로토콜 또는 상기 I2C 프로토콜과 호환된다. 다른 예들이 가능하다.
위에서 설명된 마이크로폰의 동작은 도 2에서 보인다. 상기 select 핀 (예를 들면, 참조번호 124의 select 핀)은 제일 위 라인이며, data 핀 (예를 들면, 참조번호 126의 data 핀)은 제일 위에서부터 두 번째 라인이며, 그리고 clock 핀 (예를 들면, 참조번호 122의 clock 핀)은 그래프 상의 제일 밑의 라인이다. 일단 음향 활성이 검출되면, 내부 클록의 상승 에지 상에서 데이터가 전송된다는 것을 볼 수 있다. 언급된 것처럼, 이 동작은 현존하는 I2S-호환 하드웨어 블록들과의 호환성을 보장한다.
감지 모드에서 DMIC-순응 인터페이스들에 대한 호환성을 위해서, 상기 clock 핀 (예를 들면, 참조번호 122의 clock 핀)은 상기 마이크로폰 데이터를 클록 아웃하기 위해 구동될 수 있다. 상기 클록은 주파수 (예를 들면, 512kHz)를 위한 감지 모드 요구사항들을 충족시켜야만 한다. 외부 클록 신호가 상기 clock 핀 (예를 들면, 참조번호 122의 clock 핀) 상에 검출될 때에, 한 예에서, 상기 data 핀 (예를 들면, 참조번호 126의 data 핀) 상에서 구동된 데이터는 두 사이클들 내에서 상기 외부 클록과 동기된다. 다른 예들이 가능하다. 이 모드에서, 상기 외부 클록은 활성이 더 이상 검출되지 않을 때에 제거되어, 상기 마이크로폰이 가장 낮은 전력 모드로 돌아가도록 한다. 이 모드에서 활성 검출은 활성이 더 이상 감지되지 않는가를 판별하기 위해 상기 select 핀 (예를 들면, 참조번호 124의 select 핀)을 이용할 수 있을 것이다. 다른 핀들 또한 사용될 수 있다.
이 동작은 도 3에서 보인다. 상기 select 핀 (예를 들면, 참조번호 124의 select 핀)은 제일 위 라인이며, data 핀 (예를 들면, 참조번호 126의 data 핀)은 제일 위에서부터 두 번째 라인이며, 그리고 clock 핀 (예를 들면, 참조번호 122의 clock 핀)은 그래프 상의 밑의 라인이다. 일단 음향 활성이 검출되면, 한 예에서, 상기 data 핀 (예를 들면, 참조번호 126의 data 핀) 상에 구동된 데이터는 두 사이클 내에 상기 외부 클록의 상승 에지에 동기된다는 것을 볼 수 있다. 다른 예들도 가능하다. 데이터는 상기 외부 클록의 하강 에지 (falling edge) 상에 동기된다. 또한, 상기 외부 클록은 활성이 더 이상 검출되지 않을 때에 제거되어, 상기 마이크로폰이 가장 낮은 전력 모드로 돌아가도록 한다.
이제 도 4 및 도 5를 참조하여, 상태 천이도 (400) (도 4) 및 천이 상태 테이블 (500) (도 5)가 설명된다. 도 4에서 열거된 다양한 천이 (transition)들은 도 5의 테이블에서 열거된 상태들 하에서 발생한다. 예를 들면, 천이 A1은 Vdd가 인가되고 어떤 클록도 클록 입력 핀 상에 존재하지 않을 때에 발생한다. 도 5의 테이블은 주파수 값들 (이는 대략적인 값들이다)을 주며 그리고 다른 주파수 값들이 가능하다는 것이 이해될 것이다. 용어 "OTP"는 한 차례 프로그래밍 (one time programming)을 의미한다.
도 4의 상태 천이도는 마이크로폰 오프 상태 (402), 정상 모드 상태 (404), 외부 클록을 구비한 마이크로폰 감지 모드 상태 (406), 마이크로폰 감지 모드 내부 클록 상태 (408) 및 출력 구비한 감지 모드 상태 (410)를 포함한다.
상기 마이크로폰 오프 상태 (402)는 상기 마이크로폰 (400)이 비활성화된 경우이다. 정상 모드 상태 (404)는 외부 클록이 인가되고 있을 때의 정상 동작 모드 동안의 상태이다 (이 경우 상기 외부 클록은 미리 정해진 범위 내에 있다). 외부 클록을 구비한 마이크로폰 감지 모드 (406)는 상기 모드가 도 3에서 보이는 것처럼 외부 클록으로 스위칭하고 있을 때이다. 마이크로폰 감지 모드 내부 클록 상태 (408)는 도 2에서 보이는 것처럼 어떤 외부 클록도 사용되고 있지 않을 때이다. 출력을 구비한 감지 모드 상태 (410)는 어떤 외부 클록도 사용되고 있지 않을 때에 그리고 데이터가 도 2에서 보이는 것처럼 또한 출력되고 있는 경우이다.
언급된 것처럼, 이 상태들 사이에서의 천이들은 이벤트에 기초하며 그리고 그 이벤트들에 의해 트리거된다. 일 예를 들면, 마이크로폰이 정상 동작 모드 상태 (404)에서 (예를 들면, 512 kHz보다 더 높은 클록 레이트에서) 동작하며 그리고 상기 클록 핀이 약 512 kHz이라는 것을 상기 제어 모듈이 검출한다면, 상기 제어는 외부 클록을 구비한 마이크로폰 감지 모드 상태 (406)로 진행한다. 외부 클록 상태 (406)에서, 상기 제어 모듈이 그 후에 상기 클록 핀 상에 어떤 클록도 검출하지 않을 때에, 마이크로폰 감지 모드 내부 클록 상태 (408)로 제어가 진행된다. 마이크로폰 감지 모드 내부 클록 상태 (408)에서, 그리고 음향 이벤트가 검출될 때에, 제어는 출력을 구비한 감지 모드 상태 (410)로 진행된다. 출력을 구비한 감지 모드 상태 (410)일 때에, 약 1 MHz 보다 더 큰 클록은 참조번호 404의 상태로 제어가 돌아오도록 할 수 있다. 그 클록은 1 MHz 미만일 수 있으며 (예를 들면, 내부 발진기와 동일한 주파수) 그리고 상기 마이크로폰으로부터 출력되고 있는 데이터를 외부 프로세서에 동기하기 위해 사용된다. 반면에, OTP 프로그램된 시간 동안 어떤 음향 활성도 없는 것은 제어가 참조번호 406의 상태로 돌아가도록 한다.
도 5에 규정된 다른 이벤트들이 도 4의 상태 천이도에서 보이는 상태들 사이에서의 천이들을 일으키게 할 것이라는 것이 인정될 것이다.
이제 도 6을 참조하면, 음향 회로 또는 시스템 (600)는 제1 마이크로폰 (615), 제2 마이크로폰 (625), 및 외부 시스템 칩 (또는 디바이스) (640)을 포함한다.
제1 마이크로폰 (615)은 제1 트랜스듀서 소자 (601), 제1 전하 펌프 (603), 제1 다운 컨버터 (602), 제1 버퍼 (또는 랜덤 액세스 메모리 (RAM)) (604), (출력 SD01을 구비한) 제1 업 컨버터 (606), 제1 시그마 텔타 컨버터 (608), 제1 음향 활성 검출기 (610), 제1 제어기 (612), 제1 내부 클록 (613), 그리고 제1 클록 검출 모듈 (614)을 포함한다. 이 소자들은 제1 마이크로폰 (615)을 포함한다. 상기 제1 마이크로폰 (615)은 SELECT 핀 (650)을 출력으로서 시스템 칩 (또는 다른 외부 디바이스) (640) - 이것은 이 핀 상에 인디케이터 신호를 검출할 수 있다 - 에 연결시킴으로써, 그리고 외부 클록 또는 저전력 모드를 위해 설계된 외부 클록을 비활성화함으로써, 감지 마이크로폰으로서 설정될 수 있을 것이다.
제2 마이크로폰 (625)은 제2 트랜스듀서 소자 (621), 제2 전하 펌프 (623), 제2 다운 컨버터 (622), 제2 버퍼 (또는 랜덤 액세스 메모리 (RAM)) (624), (출력 SD02를 구비한) 제2 업 컨버터 (626), 제2 시그마 텔타 컨버터 (628), 제2 음향 활성 검출기 (630), 제2 제어기 (632), 제2 내부 클록 (633), 그리고 제2 클록 검출 모듈 (634)을 포함한다. 이 소자들은 제2 마이크로폰 (625)을 포함한다. 상기 제2 마이크로폰 (625)의 SELECT 라인 (653)은 Vdd 또는 그라운드에 연결될 수 있다. 이 라인은 상기 외부 클록이 비활성화된 한은 상기 오디오 버퍼 및 내부 클록 (633)을 이용하여 상기 마이크로폰 (625)이 저전력 마이크로폰에 있도록 설정하기 위해 사용된다. 상기 ADD 회로 (630)는 상기 SELECT 핀 (653)의 설정에 의해 비활성화된다.
상기 두 개의 내부 클록 모듈들 (614 및 634)은 두 개의 독립적인 디바이스들로서 또는 두 개의 독립적인 디바이스들 내에 배치되며 그리고 한 모습에서는 동기화되기 위한 수단을 가지지 않는다. 상기 제1 트랜스듀서 (601) 및 제2 트랜스듀서 (621)는 MEM 센서들, 압전 센서들, 스피커들, 또는 어떤 다른 유형의 감지 디바이스들일 수 있다. 제1 전하 펌프 (603) 및 제2 전하 펌프 (623)는 상기 트랜스듀서 소자들 (601 및 621)의 진동판들을 활성화시키고 바이어스를 걸기 위해 전압을 제공한다.
제1 시그마 델타 변조기 (608)는 제1 트랜스듀서 소자 (601)의 아날로그 출력을 제1 디지털 펄스 밀도 변조 (pulse density modulated (PDM)) 신호들로 변환하기 위해 사용된다. 제2 시그마 델타 변조기 (628)는 상기 트랜스듀서 소자 (621)의 아날로그 출력을 제2 디지털 펄스 밀도 변조 (PDM) 신호들로 변환하기 위해 사용된다.
제1 다운 컨버터 (602)는 상기 제1 PDM 신호들을 제1 펄스 부호 변조 (pulse code modulated (PCM)) 신호로 변환하기 위해 사용되며 그리고 제2 다운 컨버터 (622)는 상기 제2 PDM 신호를 제2 PCM 신호로 변환하기 위해 사용된다. 상기 변환들은 각 마이크로폰 (615 및 625) 내 비동기 클록들을 기반으로 한다. 제1의 근사에서, 상기 두 내부 클록들은 동일한 레이트에서 동작하는 것으로 가정될 수 있다. 추가로, 몇몇의 모습들에서, 상기 내부 클록 레이트에서 상기 PDM 신호의 알려진 개수의 비트들이 매 고정된 개수의 클록들에서 PCM 샘플로 변환된다. 다른 모습들에서, 상기 변환은 변환되고 있는 PDM 비트들의 개수를 제한하지 않는 수단을 이용하여 실행되지만, 상기 PCM 샘플들은 매 고정된 개수의 클록들에서 생성된다. 다중의 채널 오디오 데이터에 대해, 이것은 보통은 워드 스트로브 (word strobe (WS)) 신호에 의해 동기된다. 그러나, PCM 샘플 변환의 시작 및 끝 클록 비트는 동기될 수 없으며, 이는 상기 두 개의 컨버터들이 공통의 시작 클록 비트 또는 WS를 정의하기 위한 수단을 공유하지 않기 때문이다. 여기에서 사용되듯이, 두 개의 PCM 샘플들에 대응하는 두 그룹의 데이터 비트들은 각 데이터 그룹의 첫 번째 비트가 동일한 클록 사이클의 동일한 클록 에지에 시간 상 정렬될 때에 "동기된다 (synchronized)".
상기 제1 버퍼 (604) 및 제2 버퍼 (624)는 다운 컨버터들 (602 및 622)로부터 수신된 데이터를 각각 저장한다. 이 PCM 오디오 샘플들은 비동기식이며 그리고 데시메이션 레이트 D 및 내부 클록 주파수 fclk에 의해 정의된 시간차 불확실성을 가진다.
-D /(2 ㅧ fclk) < Δt < D/(2 ㅧ fclk)
상기 제1 다운 컨버터 (602)로부터의 PCM 신호는 음향 활성을 검출하기 위해 상기 AAD 회로 (610)로 제공된다. 트리거 워드, 트리거 구절, 특정 잡음, 또는 특정 사운드들의 발생과 같은 활성 (activity)을 검출하기 위해 다양한 접근방식들이 사용될 수 있다. 검출하면, 상기 AAD 모듈 (610)은 상기 SELECT 라인 (650)을 경유하여 상기 시스템 칩 (640)에게 음성 활성이 존재한다는 통신을 송신할 것을 상기 제어 모듈 (612)에게 지시한다 (예를 들면, 인터럽트가 송신된다).
언급된 것처럼 그리고 일 예에서, 상기 SELECT 라인 (650)은 음성 활성의 검출을 표시하기 위해 사용될 수 있다. 상기 제1 업 컨버터 (606)는 오디오 버퍼 내 PCM 신호를 상기 내부 클록 레이트 fclk에서 클록 아웃되는 PDM 신호로 변환하기 위해 그 후에 사용될 수 있다.
상기 외부 시스템 칩 (또는 다른 디바이스) (640)은 스테레오 데시메이터 (decimator) (642), 시스템 제어 모듈 (641), 그리고 프로세싱 유닛 (6430을 포함할 수 있다. 상기 시스템 칩 (640)은 외부 클록 (651)을 마이크로폰들 (615 및 625)로 개시하기 위해 상기 SELECT 라인 (650)으로부터의 인디케이터 신호를 사용할 수 있다. 시스템 칩 (640)으로부터 외부 클록 (651)을 수신하면, 상기 제1 마이크로폰 (615) 내 제어 블록 (612) 그리고 상기 제1 마이크로폰 (625) 내 제어 블록 (632)은 상기 시스템 제어 모듈 (641)에 의해 제공된 동일한 외부 클록 fext_clk에 동기한다.
상기 제1 제어기 (612) 및 제2 제어기 (632)는 상기 제1 업 컨버터 (606) 및 제2 업 컨버터 (626)를 이용하여 적절한 시각들에서 데이터를 스풀 아웃 (spool out)하도록 상기 버퍼들 (604 및 624)에게 지시한다. 상기 제1 업 컨버터 (606) 및 제2 업 컨버터 (626)는 상기 버퍼들 (604 및 624)로부터의 PCM 신호들을 PDM 신호들 SD01 및 SD02으로 각각 변환한다. 한 모습에서, 참조번호 604 및 624 내에 저장된 PCM 오디오는 동기되지 않는다. 그러나, 업-변환 프로세스는 각 PCM 신호 샘플 상의 신호 샘플 클록 경계들을 제거하며 그래서 상기 두 버퍼들 (604 및 624) 내에 저장된 PCM 신호들의 묵시적인 시간 불확실성을 제거한다.
참조번호 600의 회로의 동작의 다른 모습에서, 상기 제1 마이크로폰 (615)은 사운드 에너지를 수신하기 위해 활성화된다. 상기 시그마 델타 컨버터 (608)에 의해 그리고 상기 다운 컨버터 (602)에 의해 아날로그 신호로부터의 신호를 디지털 신호로 변환한 이후에, 데이터는 버퍼 (604)에 저장된다. 음성 활성이 제1 AAD (610)에 의해 검출된 인후에, 이 음성 활성의 검출을 표시하기 위해 상기 SELECT 라인 (650)이 사용된다. 상기 시스템 칩 (640)은 그 표시를 수신하며 그리고 마이크로폰들 (615 및 625)로 외부 클록 (651)을 개시하기 위해 상기 SELECT 라인 (650)으로부터의 이 인디케이터 신호를 사용할 수 있을 것이다. 상기 클록 (651)은 사운드 에너지를 수신하기 위해 활성화된 제2 마이크로폰 (625)으로 피드된다. 상기 클록은 클록 검출 모듈 (634)을 활성화한다. 상기 클록 검출 모듈 (634)의 활성화는 상기 제어기 (632), 제2 전하 펌프 (623), 시그마 델타 변조기 (628) 그리고 다운 컨버터 (622)를 활성화하며, 그리고 제2 버퍼 (624)를 클록킹하는 것을 활성화한다. 이것은 상기 제2 마이크로폰 (625)이 활성화되는 것을 허용하며 그리고 제2 버퍼 (624)에게 데이터를 송신하여 PCM 포맷으로 저장되도록 한다. 이 모습에서 또한, 참조번호 604 및 624에 저장된 상기 PCM 오디오는 동기되지 않는다.
이 예들 둘 모두에서, 상기 신호들 SD01 및 SD02는 동일한 물리적 시리얼 데이터 라인 상에서 참조번호 615의 마이크로폰에서는 상기 상승 에지 또는 하강 에지 중 어느 하나를 이용하여 그리고 참조번호 625의 마이크로폰에서는 상기 하강 에지 또는 상승 에지 중 어느 하나를 이용하여 다중화되어, 데이터를 클록킹한다. 다른 모습들에서, 상기 클록 신호 (651) 그리고 상기 신호들 SD01 및 SD02는 분리된 라인들일 수 있다.
상기 제1 버퍼 (604) 및 상기 제2 버퍼 (624)로부터의 결과 출력들은 참조번호 606을 통해 PDM 신호 SD01로 그리고 참조번호 626을 통해 SD02으로 다시 업 변환된다. 이 업-변환 프로세스는 각 PCM 신호 샘플 상의 신호 샘플 클록 경계들을 제거하며 그래서 상기 두 버퍼들 (604 및 624) 내에 저장된 PCM 신호들의 묵시적인 시간 불확실성을 제거한다.
상기 시스템 칩 (640)은 PDM 데이터 스트림을 수신하며 그리고 이 데이터를 상기 스테레오 데시메이터 (642)로 클록킹할 수 있다. 이 데시메이터 (642)는 상기 시스템 제어 모듈 (641)에 의해 생성된 클록에 의해 작동되며 그리고 상기 PDM 데이터를 두 스트림들로 역-다중화한다. 또한, 상기 스테레오 데시메이터 (642)는 각 스트림을 위한 공통의 워드 스트로브 신호에 의해 작동되며 그리고 두 개의 PCM 신호 샘플들의 스트림을 생성하며, 이는 동일한 비트 클록 에지에서 시작하고 끝나며, 그래서, 동기된다.
상기 두 동기화된 스트림들은 배경 잡음을 줄이고 음성 인식을 향상시키기 위한 두 마이크로폰 신호 향상 알고리즘을 위해 이제 적합하다. 두 마이크로폰 신호 향상을 위한 추가의 프로세싱은 로세싱 유닛 (6430에 의해 수행될 수 있을 것이며, 이는 중요 단락 (key phrase) 인식에 이어진다.
유사한 구조 및 기능성을 가진 둘 보다 많은 마이크로폰들이 유사한 모드에서 작동될 수 있을 것이며, 이 경우 공통 워드 스트로브를 가질 수 없기 때문에 상기 내부 PCM 데이터는 묵시적으로 비동기식 방식으로 각 마이크로폰의 내부 버퍼들 내에 저장될 수 있을 것이라는 것이 인정될 것이다. 외부 클록을 제공함으로써, 상기 PCM 데이터는 업 컨버트되고 그리고 상기 시스템 칩 (640)으로의 다수의 PDM 시리얼 데이터 라인들 상에 제공될 수 있을 것이다. 동일한 클록 및 워드 스트로브 상에서 동작하는 시스템 칩 (640)에서의 데시메이터들의 뱅크 (bank)는 이 마이크로폰들 각각으로부터 상기 PDM 데이터를 제거하고 (decimate) 그리고 디지털 신호 처리를 위해 프로세싱 유닛에서 음성 및 오디오 향상을 위해 동기식 PDM 데이터의 다중 채널들을 획득하기 위해 사용될 수 있을 것이다.
음성 인식을 위해 음성 품질을 개선하기 위한 그런 신호 향상은 프로세싱 체인 내 어떤 인식 과정 이전에도 만들어질 수 있다는 것이 인정될 것이다. 이런 알고리즘들이나 접근방식들 둘 모두는 상기 프로세싱 유닛 (643)에서 수행되거나 실행될 수 있을 것이다.
한 모습에서, 과도하게 전력을 끌어오는 것을 방지하기 위해, 상기 제1 마이크로폰 (615)로부터의 데이터만을 사용하여 상기 프로세싱 유닛 (643) 내에서 강건한 인식 알고리즘들을 이용하여 주요 트리거 구절을 탐지하는 것이 또한 가능하다. 그런 접근 방식에서, 상기 상기 주요 트리거 구절으로서의 그런 시간이 인식될 때까지 상기 제2 마이크로폰 (625)은 비활성화로 유지된다. 상기 트리거 구절이 인식되면, 상기 제2 마이크로폰 (625)은 상기 외부 클록 (651)을 시작시킴으로써 위에서 설명된 것처럼 활성화된다. 이어서 둘 또는 그 이상의 마이크로폰들로부터 수신된 오디오는 상기 프로세싱 유닛 (643) 내에서 그런 알고리즘들을 활성화시킴으로써 향상될 수 있다. 이것은 전력 소비를 줄어들게 할 것이며, 이는 상기 주요 구절이 인식된 후에만 다중의 마이크로폰 데이터 상에서의 신호 향상이 수행되고 그리고 잠재적으로 잡음인 환경들에서 일반적인 자연 언어 이해를 필요로 하기 때문이다.
도 6의 다양한 소자들은 하드웨어 및 소프트웨어의 다양한 조합들을 이용하여 구현될 수 있을 것이라는 것이 인정될 것이다. 예를 들면, 상기 소자들 중 몇몇은 마이크로프로세서와 같은 프로세싱 디바이스 상에서 실행되는 컴퓨터 명령어들을 이용하여 구현될 수 있을 것이다.
이제 도 7을 참조하면, 클록킹 모듈 (700)은 클록 검출 블록 (702), 내부 클록 (704), 프로그래머블 분할기 (706), 그리고 데시메이터 (708)를 포함한다. 외부 클록 (710)은 상기 클록 검출 블록 (702)에 연결된다. 전하 펌프 (714)는 마이크로폰 (713)에 연결되며, 그 마이크로폰은 시그마 델타 컨버터 (712)에 연결되며, 그 시그마 델타 컨버터 (712)는 데시메이터 (708)에 연결된다. 상기 데시메이터 (708)는 버퍼 (716)에 연결된다.
상기 클록킹 모듈 (700)은 일 예에서 도 1a 또는 도 1b의 클록 검출기 모듈 (104)일 수 있다는 것이 인정될 것이다. 상기 클록킹 모듈의 소자들은 하드웨어 요스들 및/또는 소프트웨어 요소들의 조합을 이용하여 구현될 수 있을 것이라는 것이 또한 인정될 것이다. 일 예에서, 상기 요소들은 임의 유형의 프로세싱 디바이스 (예를 들면, 마이크로프로세서) 상에서 구현된 컴퓨터 명령어들을 이용하여 구현될 수 있을 것이다.
상기 클록 검출 블록 (702)은 상기 외부 클록을 수신하며 그리고 아래에서 설명되는 분할 비율 (720) 및 데시메이션 팩터 (722)를 계산한다. 상기 내부 클록 (704)은 고주파수 신호를 제공하며, 반면에 상기 외부 클록 (710)은 저주파수 신호를 제공한다. 상기 프로그래머블 분할기 (706)는 상기 내부 클록 (704)의 주파수를 축소시킨다. 상기 데시메이터 (708)는 1 비트 PDM 데이터를 상기 데시메이션 팩터에 의해 결정된 주파수를 구비한 PCM 데이터로 변환한다. 상기 데시메이터 (708)는 하나 또는 그 이상의 필터들을 포함할 수 있다.
상기 전하 펌프 (714)는 상기 마이크로폰 (713)을 위한 전압을 제공한다. 마이크로폰 (713)은 MEMS 센서들, 압전 센서, 또는 어떤 다른 유형의 감지 디바이스일 수 있다. 상기 시그마 델타 컨버터 (712)는 상기 마이크로폰 (714)으로부터의 아날로그 신호를 상기 데시메이터 (706)에 의해 사용될 용도의 디지털 신호로 변환한다.
상기 클록킹 모듈 (700)의 동작의 일 예에서, 상기 내부 클록 (704)은 12.288 MHz 내부 클록 신호를 제공한다. 한 모습에서 상기 클록 검출 블록 (702)은 내부 클록 펄스들을 카운트하는 카운터를 포함한다. 상기 외부 클록 (710)으로부터의 신호가 클록 검출 블록 (702)에 인가될 때에, 상기 카운터는 외부 클록 펄스 내에 얼마나 많은 내부 클록 펄스들이 존재했는가를 카운트할 것이다. 상기 내부 클록 (704)은 상기 외부 클록 (710)보다 더 높은 주파수이어야만 한다. 이 예에서, 상기 외부 클록 (710)은 512kHz 클록이며 그리고 상기 클록킹 모듈 (700)의 외부 클록 핀에 인가된다.
상기 클록 검출 블록 (702)은 하나의 외부 클록 사이클 내에 얼마나 많은 내부 클록 펄스들이 존재하는가를 이제 카운트한다. 이 경우에, 12,288,000 / 512,000 = 24개 클록들이다. 상기 분할 다운 비율이 실제로 24이라고 일단 확인되면, 상기 프로그래머블 분할기 (706)는 숫자 24로 프로그램된다. 이 포인트에서, 상기 내부 클록 신호는 이제 512,000 Hz이다. 상기 프로그래머블 분할기 (706)에 의해 수정된 이 내부 클록 신호는 상기 데시메이터 (708)를 클록킹할 것이다.
원하는 출력 데이터 레이트 (미리 정해진 원하는 샘플링 주파수)를 기반으로 하여, 그리고 하나의 예를 취하면, 상기 버퍼 (716)에서 상기 시스템의 다음 스테이지에 피드하기 위해 16 비트에서 16kHz 데이터가 필요하다 (그러나, 이것은 어떤 다른 주파수 및 비트 길이일 수 있다는 것이 인정될 것이다).
상기 클록 검출기 블록 (702)은 상기 데시메이터 (708)의 데시메이션 팩터 (비율) (722)를 결정하기 위해 상기 내부 클록 신호 및 상기 미리 정해진 원하는 샘플링 주파수를 취한다. 일 예에서, 16,000 Hz 샘플 레이트가 필요하며, 그리고 상기 클록 검출 블록 (702)은 32의 데시메이션 팩터를 얻기 위해 512,000 / 16,000의 나눗셈을 할 것이다.
상기 클록 검출 블록 (702)은 상기 데시메이터 (708)를 32x 데시메이션 팩터 (비율) (722)로 프로그램하며 그리고 16 kHz 레이트에서 데이터를 제공하기 위해 상기 데시메이터 (708) 내 필터들을 조절한다.
본 발명을 실생하기 위해 본 발명자들에게 알려진 최선 모드를 포함하는 본 발명의 바람직한 실시예들이 여기에서 설명되었다. 예시된 실시예들은 예시적인 것일 뿐이며, 그리고 본 발명의 범위를 제한하는 것으로 여겨져서는 안된다는 것이 이해되어야 한다.
Claims (55)
- 마이크로폰에서:
사운드 트랜스듀서로부터 아날로그 신호들을 수신하는 단계;
상기 아날로그 신호들을 디지털화된 데이터로 변환하는 단계;
그 디지털화된 데이터 내에 음성 활성 (voice activity)이 존재하는가의 여부를 판별하는 단계;
음성 활성을 검출하면, 음성 활성의 표시를 프로세싱 디바이스에게 송신하는 단계를 포함하며,
그 표시는 표준 인터페이스를 건너서 송신되며,
그 표준 인터페이스는 잠재적으로 상이한 제조자들로부터의 복수의 디바이스들에 연결되도록 호환성이 있도록 구성된 것인, 방법. - 제1항에 있어서,
상기 마이크로폰은 다중 동작 모드들에서 동작하며, 그래서 외부 클록이 프로세싱 디바이스로부터 수신되고 있는가의 여부, 또는 상기 마이크로폰에 전력이 공급되고 있는가의 여부 중 하나 이상을 기초로 하여 상기 마이크로폰이 제1 마이크로폰 감지 모드 및 제2 마이크로폰 감지 모드에서 선택적으로 동작하고 그 사이에서 이동하도록 하며;
상기 제1 마이크로폰 감지 모드 내에서, 상기 마이크로폰은 내부 클록을 활용하며, 사운드 트랜스듀서로부터 제1 아날로그 신호들을 수신하고, 그 제1 아날로그 신호들을 제1 디지털화된 데이터로 변환하며, 그 제1 디지털화된 데이터 내에 음성 활성이 존재하는가의 여부를 판별하며, 음성 활성을 검출하면, 음성 활성의 표시를 상기 프로세싱 디바이스에게 송신하며, 상기 내부 클록을 이용하는 것으로부터 그 후에 스위치하며 그리고 외부 클록을 수신하며;
상기 제2 마이크로폰 감지 모드 내에서, 상기 마이크로폰은 사운드 트랜스듀서로부터 제2 아날로그 신호들을 수신하고, 그 제2 아날로그 신호들을 제2 디지털화된 데이터로 변환하며, 그 제2 디지털화된 데이터 내에 음성 활성이 존재하는가의 여부를 판별하며, 음성 활성을 검출하면, 음성 활성의 표시를 상기 프로세싱 디바이스에게 송신하며, 그리고 상기 프로세싱 디바이스에 의해 공급된 외부 클록을 사용하는, 방법. - 제1항에 있어서,
상기 표시는 음성 활성이 검출되었다는 것을 표시하는 신호 또는 디지털화된 신호를 포함하는, 방법. - 제1항에 있어서,
상기 트랜스듀서는 미세전자기계 시스템 (microelectromechanical system (MEMS)) 디바이스, 압전 디바이스, 또는 스피커 중 하나를 포함하는, 방법. - 제1항에 있어서,
상기 수신하고, 변환하고, 판별하고, 그리고 송신하는 것은 집적 회로에서 수행되는, 방법. - 제1항에 있어서,
상기 집적 회로는 셀룰러폰, 스마트폰, 개인용 컴퓨터, 웨어러블 전자 디바이스, 또는 태블릿 중 하나에 배치된 것인, 방법. - 제1항에 있어서,
상기 수신하고, 변환하고, 판별하고, 그리고 송신하는 것은 단일 모드 동작에서 동작할 때에 수행되는, 방법. - 제1항에 있어서,
상기 단일 모드는 전력 절약 모드인, 방법. - 제1항에 있어서,
상기 디지털화된 데이터는 PDM (pulse density modulation) 데이터 또는 PCM (pulse code modulated) 데이터를 포함하는, 방법. - 제1항에 있어서,
상기 표시는 클록 신호를 포함하는, 방법. - 제1항에 있어서,
상기 표시는 하나 이상의 DC 전압 레벨들을 포함하는, 방법. - 제1항에 있어서,
상기 표시를 송신한 이후에, 클록 신호가 상기 마이크로폰에서 수신되는, 방법. - 제12항에 있어서,
상기 클록 신호는 상기 마이크로폰과 외부 프로세서 사이에서의 데이터 이동을 동기화하기 위해 활용되는, 방법. - 제12항에 있어서,
상기 수신된 클록의 제1 주파수는 상기 마이크로폰에 배치된 내부 클록의 제2 주파수와 동일한, 방법. - 제12항에 있어서,
상기 수신된 클록의 제1 주파수는 상기 마이크로폰에 배치된 내부 클록의 제2 주파수와 상이한, 방법. - 제12항에 있어서,
클록을 수신하기 이전에, 상기 마이크로폰은 제1 모드의 동작에 있으며, 그리고 상기 클록을 수신한 것은 상기 마이크로폰이 제2 모드의 동작으로 진입하도록 하기에 효과적인, 방법. - 제1항에 있어서,
상기 표준 인터페이스는 PDM 프로토콜, I2S 프로토콜, 또는 I2C 프로토콜의 임의 조합과 호환되는, 방법. - 사운드 트랜스듀서로부터 아날로그 신호들을 수신하며 그리고 그 아날로그 신호를 디지털화된 데이터로 변환하도록 구성된 아날로그-디지털 변환 회로;
표준 인터페이스;
상기 아날로그-디지털 변환 회로 및 상기 표준 인터페이스에 연결된 프로세싱 디바이스를 포함하며,
상기 프로세싱 디바이스는 상기 디지털화된 신호 내에 음성 활성이 존재하는가의 여부를 판별하며 그리고 음성 활성이 검출되면 음성 활성의 표시를 외부 프로세싱 디바이스로 송신하도록 구성되며,
상기 표시는 상기 표준 인터페이스를 건너서 송신되며,
상기 표준 인터페이스는 잠재적으로 상이한 제조자들로부터의 복수의 디바이스들에 연결되도록 호환성이 있도록 구성된, 장치. - 제18항에 있어서,
상기 표시는 음성 활성이 검출되었다는 것을 표시하는 신호 또는 디지털화된 신호를 포함하는, 장치. - 제18항에 있어서,
상기 트랜스듀서는 미세전자기계 시스템 (microelectromechanical system (MEMS)) 디바이스, 압전 디바이스, 또는 스피커 중 하나를 포함하는, 장치. - 제18항에 있어서,
상기 장치는 집적 회로를 포함하는, 장치. - 제18항에 있어서,
상기 집적 회로는 셀룰러폰, 스마트폰, 개인용 컴퓨터, 웨어러블 전자 디바이스, 또는 태블릿 중 하나에 배치된 것인, 장치. - 제18항에 있어서,
상기 디지털화된 데이터는 PDM 데이터 또는 PCM 데이터를 포함하는, 방법. - 제18항에 있어서,
상기 표시는 클록 신호를 포함하는, 장치. - 제18항에 있어서,
상기 표시는 하나 이상의 DC 전압 레벨들을 포함하는, 장치. - 제18항에 있어서,
상기 표시를 송신한 이후에, 클록 신호가 상기 표준 인터페이스에서 수신되는, 장치. - 제26항에 있어서,
상기 프로세싱 디바이스는 상기 마이크로폰과 상기 외부 프로세싱 디바이스 사이에서의 데이터 이동을 동기화하기 위해 상기 클록 신호를 활용하는, 장치. - 제26항에 있어서,
클록을 수신하기 이전에, 상기 장치는 제1 모드의 동작에 있으며, 그리고 상기 클록을 수신한 것은 상기 장치가 제2 모드의 동작으로 진입하도록 하기에 효과적인, - 제18항에 있어서,
상기 표준 인터페이스는 PDM 프로토콜, I2S 프로토콜, 또는 I2C 프로토콜의 임의 조합과 호환되는, 장치. - 제1 마이크로폰으로부터 제1 아날로그 신호들을 수신하고, 그 제1 아날로그 신호들을 제1 디지털 데이터로 변환하고 그리고 그 제1 디지털 데이터를 제1 내부 클록을 이용하여 제1 버퍼에 저장하는 단계;
제2 내부 클록에 따라 제2 마이크로폰으로부터 제2 아날로그 신호들을 수신하고, 그 제2 아날로그 신호를 제2 디지털 데이터로 변환하고 그리고 그 제2 디지털 데이터를 제2 버퍼에 저장하는 단계;
상기 제1 디지털 데이터를 기초로 하여 음성 활성이 제1 음향 활성 검출 (acoustic activity detect (AAD)) 모듈에서 발생했는가의 여부를 판별하며, 그리고 음성 활성이 판별될 때에, 음성 활성 검출 신호를 외부 프로세서에게 전송하며, 그 외부 프로세서는 상기 음성 활성 검출 신호를 수신하면 외부 클록 신호를 응답하여 제공하는 단계;
줄어든 (decimated) 출력 데이터를 제공하기 위해 상기 외부 클록을 이용하여 상기 제1 버퍼로부터 상기 제1 디지털 데이터를 그리고 상기 제2 버퍼로부터 상기 제2 디지털 데이터를 줄이는 (decimating) 단계를 포함하며,
상기 제1 버퍼 내 상기 제1 디지털 데이터는 상기 제2 버퍼 내 상기 제2 디지털 데이터와 반드시 실시간으로 동기되지는 않으며;
상기 줄어든 출력 데이터는 실시간으로 정렬된 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 구비한, 방법. - 제30항에 있어서,
상기 제1 마이크로폰 및 상기 제2 마이크로폰에서 상기 외부 클록을 수신하고, 그리고 상기 제1 마이크로폰 및 상기 제2 마이크로폰의 동작을 상기 외부 클록에 동기시키는 단계를 더 포함하는, 방법. - 제30항에 있어서,
상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰 및 상기 제2 마이크로폰으로부터의 상기 줄어든 출력 데이터를 이용하여 두 개의 채널 음성 신호 향상을 수행하는 단계를 더 포함하는, 방법. - 제30항에 있어서,
상기 제1 아날로그 신호를 제1 디지털 신호로 변환하는 것은 상기 제1 아날로그 신호를 PDM 데이터로 그리고 그 후에 PCM 데이터로 변환하는 것을 포함하는, 방법. - 제30항에 있어서,
외부 클록이 상기 외부 프로세서에 인가될 때까지 상기 제2 마이크로폰은 저 전력 또는 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않은, 방법. - 제30항에 있어서,
상기 외부 프로세서는 데시메이터 (decimator)를 포함하며 그리고 그 데시메이터는 동일한 클록, 및 동일한 샘플 동기화 신호 또는 워드 스트로브 (Word Strobe (WS))를 이용하여 둘 이상의 채널들을 줄어들게 하도록 구성된, 방법. - 제30항에 있어서,
상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들은 공통 클록 라인 및 다중의 시리얼 PDM 데이터 라인들을 경유하여 상기 외부 프로세서에 연결된, 방법. - 제30항에 있어서,
상기 제1 마이크로폰은 제1 버퍼를 포함하며 그리고 상기 제1 마이크로폰은 제1 AAD 모듈 및 활성인 제1 버퍼로 감지 모드에서 유지되는, 방법. - 제30항에 있어서,
상기 제2 마이크로폰 및 추가 마이크로폰들은 상기 외부 프로세서에 의해 외부 클록이 인가될 때까지 저 전력 또는 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않은, 방법. - 제30항에 있어서,
상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들로부터의 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 상기 제3 마이크르폰으로부터의 상기 줄어든 출력 데이터로 다중 채널 음성 신호 향상을 수행하는 단계를 더 포함하는, 방법. - 외부 프로세서;
상기 외부 프로세서에 연결된 제1 버퍼;
상기 외부 프로세서에 연결된 제2 버퍼;
상기 제1 버퍼에 연결되며, 제1 마이크로폰으로부터 제1 아날로그 신호들을 수신하고, 그 제1 아날로그 신호들을 제1 디지털 데이터로 변환하고 그리고 그 제1 디지털 데이터를 제1 버퍼에 저장하도록 구성된 제1 아날로그-디지털 컨버터;
상기 제1 아날로그-디지털 컨버터에 연결되며, 음성 활성이 발생했는가의 여부를 상기 제1 디지털 데이터를 기초로 하여 판별하고, 그리고 음성 활성이 검출될 때에, 음성 활성 검출 신호를 상기 외부 프로세서로 전송하도록 구성되는 제1 음향 활성 검출 (AAD) 모듈로, 상기 외부 프로세서는 상기 음성 활성 검출 신호를 수신하면 외부 클록 신호를 응답으로 제공하는, 제1 음향 활성 검출 (AAD) 모듈;
상기 제2 버퍼에 연결되며, 상기 외부 클록에 따라 제2 마이크로폰으로부터 제2 아날로그 신호들을 수신하고, 그 제2 아날로그 신호들을 제2 디지털 데이터로 변환하고 그리고 그 제2 디지털 데이터를 제2 버퍼에 저장하도록 구성된 제2 아날로그-디지털 컨버터를 포함하며,
상기 제1 버퍼 내 상기 제1 디지털 데이터는 상기 제2 버퍼 내 상기 제2 디지털 데이터와 반드시 실시간으로 동기되지는 않으며;
상기 제1 버퍼, 상기 제1 아날로그-디지털 컨버터, 및 상기 제1 음향 활성 검출 모듈은 제1 마이크로폰에 배치되며, 그리고 상기 제2 버퍼 및 상기 제2 아날로그-디지털 컨버터는 제2 마이크로폰에 배치되며;
상기 외부 프로세서는 줄어든 출력 데이터를 제공하기 위해 상기 외부 클록을 이용하여 상기 제1 버퍼로부터 상기 제1 디지털 데이터를 그리고 상기 제2 버퍼로부터 상기 제2 디지털 데이터를 줄이도록 구성되며, 상기 줄어든 출력 데이터는 실시간으로 정렬된 상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 가지는, 장치. - 제40항에 있어서,
상기 외부 클록은 상기 제1 마이크로폰 및 상기 제2 마이크로폰에서 수신되며, 그리고 상기 제1 마이크로폰 및 상기 제2 마이크로폰의 동작은 상기 외부 클록에 동기되는, 장치. - 제40항에 있어서,
상기 제1 디지털 데이터 및 상기 제2 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰 및 상기 제2 마이크로폰으로부터의 상기 줄어든 출력 데이터를 이용하여 두 개의 채널 음성 신호 향상을 수행하는 것을 더 포함하는, 장치. - 제40항에 있어서,
상기 제1 아날로그 신호는 PDM 데이터로 그리고 그 후에 PCM 데이터로 변환되는, 장치. - 제40항에 있어서,
외부 클록이 상기 외부 프로세서에 인가될 때까지 상기 제2 마이크로폰은 저 전력 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않은, 장치. - 제40항에 있어서,
상기 외부 프로세서는 데시메이터 (decimator)를 포함하며 그리고 그 데시메이터는 동일한 클록, 및 동일한 샘플 동기화 신호 또는 워드 스트로브 (Word Strobe (WS))를 이용하여 둘 이상의 채널들을 줄어들게 하도록 구성된, 장치. - 제40항에 있어서,
상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들은 공통 클록 라인 및 다중의 시리얼 PDM 데이터 라인들을 경유하여 상기 외부 프로세서에 연결된, 장치. - 제40항에 있어서,
상기 제1 마이크로폰은 제1 AAD 모듈 및 활성인 제1 버퍼로 감지 모드에서 유지되는, 장치. - 제40항에 있어서,
상기 제2 마이크로폰 및 추가 마이크로폰들은 상기 외부 프로세서에 의해 외부 클록이 인가될 때까지 저 전력 슬립 모드에서 유지되지만 상기 제1 마이크로폰은 그렇지 않은, 장치. - 제40항에 있어서,
상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 다수의 추가 마이크로폰들로부터의 디지털 데이터를 줄인 뒤에, 상기 제1 마이크로폰, 상기 제2 마이크로폰, 및 상기 제3 마이크르폰으로부터의 상기 줄어든 출력 데이터로 다중 채널 음성 신호 향상을 수행하는 것을 더 포함하는, 장치. - 제1 주파수를 가진 외부 클록 신호를 수신하는 단계;
내부 클록의 제2 주파수를 적어도 부분적으로 기초로 하여 분할 비율을 자동적으로 결정하는 단계로, 상기 제2 주파수는 상기 제1 주파수보다 더 큰, 결정 단계;
상기 외부 클록 신호의 상기 제1 주파수, 상기 내부 클록 신호의 상기 제2 주파수, 및 미리 정해진 원하는 샘플링 주파수를 적어도 부분적으로 기초로 하여 데시메이션 (decimation) 팩터를 자동적으로 결정하는 단계;
상기 분할 비율을 상기 내부 클록 신호에 적용하여 상기 제1 주파수를 축소된 제3 주파수로 축소시키는 단계;
상기 데시메이션 팩터를 상기 축소된 제3 주파수에 적용하여 상기 미리 정해진 원하는 샘플링 주파수를 제공하는 단계;
상기 미리 정해진 원하는 샘플링 주파수를 이용하여 데이터를 버퍼로 클록킹하는 단계를 포함하는 방법. - 제50항에 있어서,
상기 외부 클록 신호를 나중에 제거하는 단계를 더 포함하는, 방법. - 제50항에 있어서,
상기 미리 정해진 원하는 샘플링 주파수는 약 16 kHz의 주파수 레이트를 포함하는, 방법. - 입력단 및 출력단을 구비한 인터페이스 회로로, 상기 입력단은 제1 주파수를 가진 외부 클록 신호를 수신하도록 구성된, 인터페이스 회로;
상기 인터페이스 회로에 연결된 프로세싱 회로를 포함하며,
상기 프로세싱 회로는 내부 클록의 제2 주파수를 적어도 부분적으로 기초로 하여 분할 비율을 자동적으로 결정하도록 구성되며, 상기 제2 주파수는 상기 제1 주파수보다 더 크며,
상기 프로세싱 회로는 상기 외부 클록 신호의 상기 제1 주파수, 상기 내부 클록 신호의 상기 제2 주파수, 및 미리 정해진 원하는 샘플링 주파수를 적어도 부분적으로 기초로 하여 데시메이션 팩터를 자동적으로 결정하도록 더 구성되며,
상기 프로세싱 회로는 상기 분할 비율을 상기 내부 클록 신호에 적용하여 상기 제1 주파수를 축소된 제3 주파수로 축소시키고 그리고 상기 데시메이션 팩터를 상기 축소된 제3 주파수에 적용하여 상기 미리 정해진 원하는 샘플링 주파수를 제공하도록 더 구성되며,
상기 프로세싱 회로는 상기 미리 정해진 원하는 샘플링 주파수를 이용하여 상기 출력단을 경유하여 데이터를 버퍼로 클록킹하도록 더 구성된, 장치. - 제53항에 있어서,
상기 외부 클록은 그 후에 제거되는, 장치. - 제53항에 있어서,
상기 미리 정해진 원하는 샘플링 주파수는 약 16 kHz의 주파수 레이트를 포함하는, 장치.
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361901832P | 2013-11-08 | 2013-11-08 | |
US61/901,832 | 2013-11-08 | ||
US14/282,101 | 2014-05-20 | ||
US14/282,101 US9712923B2 (en) | 2013-05-23 | 2014-05-20 | VAD detection microphone and method of operating the same |
US14/533,652 | 2014-11-05 | ||
US14/533,690 | 2014-11-05 | ||
US14/533,674 US9111548B2 (en) | 2013-05-23 | 2014-11-05 | Synchronization of buffered data in multiple microphones |
US14/533,652 US10020008B2 (en) | 2013-05-23 | 2014-11-05 | Microphone and corresponding digital interface |
US14/533,674 | 2014-11-05 | ||
US14/533,690 US9711166B2 (en) | 2013-05-23 | 2014-11-05 | Decimation synchronization in a microphone |
PCT/US2014/064324 WO2015069878A1 (en) | 2013-11-08 | 2014-11-06 | Microphone and corresponding digital interface |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20160083904A true KR20160083904A (ko) | 2016-07-12 |
Family
ID=53042070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167014819A KR20160083904A (ko) | 2013-11-08 | 2014-11-06 | 마이크로폰 및 대응하는 디지털 인터페이스 |
Country Status (4)
Country | Link |
---|---|
KR (1) | KR20160083904A (ko) |
CN (1) | CN106104686B (ko) |
DE (1) | DE112014005087B4 (ko) |
WO (1) | WO2015069878A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210056278A (ko) | 2019-11-08 | 2021-05-18 | 한국전기연구원 | 음성-음향 신호 감지 장치 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101718214B1 (ko) * | 2015-06-09 | 2017-03-20 | 한국과학기술원 | 사물인터넷용 초저전력 유연압전 음성인식 센서 |
US11862189B2 (en) * | 2020-04-01 | 2024-01-02 | Qualcomm Incorporated | Method and apparatus for target sound detection |
TWI804163B (zh) * | 2022-01-18 | 2023-06-01 | 新唐科技股份有限公司 | 麥克風陣列 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8910981D0 (en) * | 1989-05-12 | 1989-06-28 | Hi Med Instr Limited | Digital waveform encoder and generator |
GB2296170A (en) * | 1994-12-16 | 1996-06-19 | Ibm | Audio communication apparatus |
DE19546168C1 (de) * | 1995-12-11 | 1997-02-20 | Siemens Ag | Digitale Signalprozessor-Anordnung zum Vergleich von Merkmalsvektoren und deren Verwendung sowie zugehöriges Betriebsverfahren |
US20030004720A1 (en) * | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
US6934682B2 (en) * | 2001-03-01 | 2005-08-23 | International Business Machines Corporation | Processing speech recognition errors in an embedded speech recognition system |
US7941313B2 (en) * | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US20050078841A1 (en) * | 2003-10-14 | 2005-04-14 | Boor Steven E. | Method and apparatus for resetting a buffer amplifier |
US8407044B2 (en) * | 2008-10-30 | 2013-03-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Telephony content signal discrimination |
US8626498B2 (en) * | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
CN102568480A (zh) * | 2010-12-27 | 2012-07-11 | 深圳富泰宏精密工业有限公司 | 双模手机语音传输系统 |
JP5289517B2 (ja) * | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
CN102983868B (zh) * | 2012-11-02 | 2015-01-28 | 小米科技有限责任公司 | 信号处理方法、装置及系统 |
CN103117065B (zh) * | 2013-01-09 | 2015-09-30 | 上海大唐移动通信设备有限公司 | 平均意见评分语音测试装置及其控制方法、语音测试方法 |
CN105379308B (zh) * | 2013-05-23 | 2019-06-25 | 美商楼氏电子有限公司 | 麦克风、麦克风系统及操作麦克风的方法 |
-
2014
- 2014-11-06 CN CN201480072463.7A patent/CN106104686B/zh active Active
- 2014-11-06 KR KR1020167014819A patent/KR20160083904A/ko not_active Application Discontinuation
- 2014-11-06 DE DE112014005087.3T patent/DE112014005087B4/de active Active
- 2014-11-06 WO PCT/US2014/064324 patent/WO2015069878A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210056278A (ko) | 2019-11-08 | 2021-05-18 | 한국전기연구원 | 음성-음향 신호 감지 장치 |
Also Published As
Publication number | Publication date |
---|---|
CN106104686B (zh) | 2019-12-31 |
WO2015069878A1 (en) | 2015-05-14 |
CN106104686A (zh) | 2016-11-09 |
DE112014005087B4 (de) | 2021-04-22 |
DE112014005087T5 (de) | 2016-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9111548B2 (en) | Synchronization of buffered data in multiple microphones | |
US10332544B2 (en) | Microphone and corresponding digital interface | |
US9711166B2 (en) | Decimation synchronization in a microphone | |
US10313796B2 (en) | VAD detection microphone and method of operating the same | |
US11335338B2 (en) | Speech recognition | |
US9478234B1 (en) | Microphone apparatus and method with catch-up buffer | |
US9445173B2 (en) | System and method for a transducer system with wakeup detection | |
US9830080B2 (en) | Low power voice trigger for acoustic apparatus and method | |
US11172312B2 (en) | Acoustic activity detecting microphone | |
CN106104686B (zh) | 麦克风中的方法、麦克风组件、麦克风设备 | |
GB2541079A (en) | Analog-to-digital converter | |
US10306348B2 (en) | Mute pattern injection for a pulse-density modulation microphone | |
CN110310635B (zh) | 语音处理电路及电子设备 | |
GB2542268A (en) | Speech recognition | |
GB2531964A (en) | Speech recognition | |
GB2551459A (en) | Analog-to-digital converter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |