KR20240082741A - 멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법 - Google Patents

멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법 Download PDF

Info

Publication number
KR20240082741A
KR20240082741A KR1020220166681A KR20220166681A KR20240082741A KR 20240082741 A KR20240082741 A KR 20240082741A KR 1020220166681 A KR1020220166681 A KR 1020220166681A KR 20220166681 A KR20220166681 A KR 20220166681A KR 20240082741 A KR20240082741 A KR 20240082741A
Authority
KR
South Korea
Prior art keywords
voice
resonance
acoustic sensor
extension
parts
Prior art date
Application number
KR1020220166681A
Other languages
English (en)
Inventor
허신
김영수
무하마드
Original Assignee
한국기계연구원
Filing date
Publication date
Application filed by 한국기계연구원 filed Critical 한국기계연구원
Publication of KR20240082741A publication Critical patent/KR20240082741A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H13/00Measuring resonant frequency
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B81MICROSTRUCTURAL TECHNOLOGY
    • B81BMICROSTRUCTURAL DEVICES OR SYSTEMS, e.g. MICROMECHANICAL DEVICES
    • B81B3/00Devices comprising flexible or deformable elements, e.g. comprising elastic tongues or membranes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H11/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties
    • G01H11/06Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties by electric means
    • G01H11/08Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties by electric means using piezoelectric devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B81MICROSTRUCTURAL TECHNOLOGY
    • B81BMICROSTRUCTURAL DEVICES OR SYSTEMS, e.g. MICROMECHANICAL DEVICES
    • B81B2201/00Specific applications of microelectromechanical systems
    • B81B2201/02Sensors
    • B81B2201/0257Microphones or microspeakers

Abstract

멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법에서, 상기 멀티 공진형 음향센서는 베이스 기판 및 상기 베이스 기판 상에 형성되는 복수의 공진유닛들을 포함한다. 상기 공진유닛들 각각은, 압전층으로 형성되는 연장부 및 상기 연장부의 시작 단에 형성되는 전극부를 포함하는 공진부를 한 쌍씩 포함하고, 상기 한 쌍의 공진부들은 서로 마주하도록 배치된다.

Description

멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법{MULTI-RESONANT ACOUSTIC SENSOR, VOICE RECOGNITION OR SPEAKER RECOGNITION SYSTEM AND METHOD USING THE SAME}
본 발명은 멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법에 관한 것으로, 더욱 상세하게는 서로 다른 공진 주파수를 가지는 복수의 공진부들이 배열되어 입력 음성에 대한 주파수 분리를 통해 음성 인식률을 향상시키는 멀티 공진형 음향센서와, 상기 주파수 분리에 따른 전기신호를 머신러닝 또는 딥러닝 알고리즘에 의한 학습을 통해 음성인식 또는 화자인식 성능을 향상시키는 상기 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 시스템 및 방법에 관한 것이다.
종래 마이크로폰과 같은 비공진형 음향센서는 주파수에 대응하는 일정한 감도를 갖는 영역을 사용하여 소리 신호를 전기 신호로 변환하고, 이를 바탕으로 음성을 인식하는 것을 특징으로 하며, 대한민국 등록특허 제10-1984369호 등을 통해 개시되고 있다.
그러나, 이러한 비공진형 음향센서의 경우, 음성을 인식함에 있어 음향센서의 가청 주파수 범위와 대비하여 일정한 감도를 가지는 성능을 이용하여 음성신호를 전기신호를 변환하는 것으로, 음성 인식률을 향상시키기에는 한계가 있다.
이에, 서로 다른 공진주파수를 가지는 복수의 캔틸레버(cantilever)들을 배열하여, 소리 신호에 따라 서로 다른 캔틸레버가 공진하는 특성을 바탕으로 음성을 인식하는 기술이 일본국 등록특허 제3886483호 등을 통해 개발되고 있다.
그러나, 이러한 캔틸레버가 배열되는 형태의 음향 센서의 경우, 다양한 소리 신호를 서로 구별하여 감지하기 위해서는 서로 다른 길이의 캔틸레버들이 다수개 나열되어야 하며, 이에 따라 음향 센서의 부피가 증가하거나 제작이 복잡해지는 문제가 있다.
대한민국 등록특허 제10-1984369호 일본국 등록특허 제3886483호
이에, 본 발명의 기술적 과제는 이러한 점에서 착안된 것으로 본 발명의 목적은 서로 다른 공진 주파수를 가지는 복수의 압전 캔틸레버들이 배열되어 입력 음성에 대한 기계적 주파수 분리를 통해 음성 또는 화자 인식률을 향상시키는 멀티 공진형 음향센서를 제공하는 것이다.
또한, 본 발명의 다른 목적은 상기 주파수 분리에 따른 전기신호를 머신러닝 또는 딥러닝 알고리즘에 의한 학습을 통해 음성인식 또는 화자인식 성능을 향상시키는 상기 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 시스템 및 방법을 제공하는 것이다.
상기한 본 발명의 목적을 실현하기 위한 일 실시예에 의한 멀티 공진형 음향센서는 베이스 기판 및 상기 베이스 기판 상에 형성되는 복수의 공진유닛들을 포함한다. 상기 공진유닛들 각각은, 압전층으로 형성되는 연장부 및 상기 연장부의 시작 단에 형성되는 전극부를 포함하는 공진부를 한 쌍씩 포함하고, 상기 한 쌍의 공진부들은 서로 마주하도록 배치된다.
일 실시예에서, 상기 한 쌍의 공진부들은, 상기 압전층으로 형성되는 연장부들의 길이가 서로 다를 수 있다.
일 실시예에서, 상기 한 쌍의 공진부들의 연장부들의 끝단은 서로 이격되어 갭부를 형성할 수 있다.
일 실시예에서, 상기 공진유닛들 각각에 형성되는 갭부는, 상기 공진유닛들 각각에 대하여 서로 다른 위치 및 서로 다른 크기로 형성될 수 있다.
일 실시예에서, 상기 복수의 공진유닛들이 포함하는 공진부들은, 상기 연장부가 압전 외팔보(piezoelectric cantilever) 형상으로 연장되며, 상기 연장부의 길이는 서로 다를 수 있다.
일 실시예에서, 상기 전극부는, 전기적으로 서로 절연되며, 깍지형(interdigitate)으로 연장되는 한 쌍의 일측 및 타측 전극들을 포함할 수 있다.
일 실시예에서, 상기 베이스 기판은 실리콘(Si) 웨이퍼 기판이고, 상기 압전층은 압전 단결정(PMN-PT 단결정) 또는 압전 특성의 소재를 포함할 수 있다.
상기한 본 발명의 다른 목적을 실현하기 위한 일 실시예에 의한 음성인식 또는 화자인식 시스템은 음성 신호 발생부, 멀티 공진형 음향센서, 신호처리부, 인공지능 학습부 및 결과 출력부를 포함한다. 상기 음성 신호 발생부는 음성 인식 또는 화자 인식 테스트용 음성을 발생시킨다. 상기 멀티 공진형 음향센서는 상기 발생된 음성에 따라, 복수의 공진유닛들을 통해 주파수 분리 전기신호가 획득된다. 상기 신호처리부는 상기 주파수 분리 전기신호를 신호처리한다. 상기 인공지능 학습부는 상기 발생된 음성별로 신호처리된 전기신호를 인공지능 알고리즘으로 학습한다. 상기 결과 출력부는 상기 학습의 결과를 바탕으로, 입력된 음성에 대한 음성 인식 또는 화자 인식 결과를 출력한다.
일 실시예에서, 상기 복수의 공진유닛들이 포함하는 공진부들은, 압전 외팔보(piezoelectric cantilever) 형상으로 연장되는 연장부를 포함하며, 상기 연장부의 길이가 서로 달라 서로 다른 주파수에서 공진이 발생될 수 있다.
일 실시예에서, 상기 주파수 분리 전기신호는, 상기 발생된 음성에 대한 상기 공진부들 각각의 주파수 신호를 포함할 수 있다.
일 실시예에서, 상기 신호처리된 전기신호는, 상기 공진부들 각각의 주파수 신호를 스펙트럼(spectrum)으로 시각화한 스펙트로그램(spectrogram) 이미지일 수 있다.
일 실시예에서, 상기 인공지능 학습부는, 상기 공진부들 각각에 대한 스펙트로그램 이미지와, 기 음향센서의 기준(reference) 스펙트로그램 이미지를 동시에 입력받아, 상기 발생된 음성에 대하여 머신러닝(machine learning) 또는 딥러닝(deep learning) 알고리즘으로 학습할 수 있다.
상기한 본 발명의 또 다른 목적을 실현하기 위한 일 실시예에 의한 음성인식 또는 화자인식 방법은, 음성 인식 또는 화자 인식 테스트용 음성을 발생시키는 단계, 상기 발생된 음성에 따라, 복수의 공진유닛들을 통해 주파수 분리 전기신호를 획득하는 단계, 상기 주파수 분리 전기신호를 신호처리하는 단계, 상기 발생된 음성별로 신호처리된 전기신호를 학습하는 단계, 및 상기 학습의 결과를 바탕으로, 입력된 음성에 대한 음성 인식 또는 화자 인식 결과를 출력하는 단계를 포함한다.
본 발명의 실시예들에 의하면, 한 쌍의 공진부들이 서로 마주하도록 배치되어 하나의 공진유닛을 구성하고, 상기 공진유닛이 복수개가 서로 나열되어 멀티 공진형 음향센서를 형성함으로써, 압전 외팔보가 배열되는 음향센서의 전체 부피 및 크기를 최소화할 수 있어, 소형화가 가능하다.
즉, 공진유닛들 각각의 길이는 전체적으로 동일하게 유지하면서도, 상기 공진유닛들 각각에 포함되는 공진부들의 길이를 순차적으로 증가 또는 감소하도록 형성함으로써, 설계 최적화를 통해 음향센서의 소형화가 가능하며 제작의 용이성도 향상된다.
특히, 상기 구조의 음향센서의 제작에 있어, 하나의 공진유닛에 포함되는 한 쌍의 공진부들 사이의 갭부의 위치를 가변시키는 것으로 복수의 공진유닛들에 포함되는 공진부들의 압전 외팔보의 길이를 서로 다르게 제작할 수 있으므로, 제작의 용이성이 향상된다.
또한, 압전 외팔보 형상의 공진부의 제작시, 상기 갭부를 통한 베이스 기판의 식각을 통해 제작이 가능하므로, 미세 구조로 소형화된 음향센서의 제작이 매우 용이하다.
또한, 압전 외팔보로 연장되는 연장부는 압전층으로 형성되고, 상기 연장부의 시작 단에는 전극부가 깍지형(interdigitate)으로 형성되므로, 상기 연장부의 진동에 따른 주파수 신호를 전기 신호화하여 용이하게 획득할 수 있다.
특히, 복수의 공진부들이 서로 다른 길이의 연장부를 포함하여 서로 다른 공진 주파수를 가지므로, 상기 획득되는 전기 신호는 주파수 분리된 전기신호이며, 이에, 주파수 분리된 전기신호에 대한 신호처리를 통한 인공지능 알고리즘 학습이 효과적으로 수행될 수 있다.
즉, 특정한 단어에 대한 다양한 사람의 음성 신호에 대하여, 서로 다른 공진 주파수를 가지는 복수의 공진부들에서 발생하는 주파수 신호를 전기 신호화한 주파수 분리 전기신호에 대한 인공지능 학습을 수행하므로, 입력되는 음성 신호에 대한 음성 인식 또는 화자 인식 결과의 정확성을 보다 향상시킬 수 있다.
도 1은 본 발명의 일 실시예에 의한 멀티 공진형 음향센서를 도시한 평면도이다.
도 2는 도 1의 제1 내지 제5 공진유닛들을 상세히 도시한 평면도이다.
도 3은 도 2의 제1 공진부를 상세히 도시한 평면도이다.
도 4a 내지 도 4f는 도 1의 멀티 공진형 음향센서를 제조하는 단계를 도시한 공정도들이다.
도 5는 도 1의 멀티 공진형 음향센서를 이용하여 주파수 분리 특성을 실험한 결과를 나타낸 그래프이다.
도 6은 도 1의 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 시스템을 도시한 블록도이다.
도 7은 도 6의 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 방법을 도시한 흐름도이다.
도 8a는 도 7의 멀티 공진형 음향센서의 각 공진부들에서 획득된 전기신호를 스펙트로그램으로 처리한 결과의 예이며, 도 8b는 상용 음향센서에서 획득된 전기 신호를 스펙트로그램으로 처리한 결과의 예이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 실시예들을 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다. 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다.
상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함하다" 또는 "이루어진다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다.
도 1은 본 발명의 일 실시예에 의한 멀티 공진형 음향센서를 도시한 평면도이다. 도 2는 도 1의 제1 내지 제5 공진유닛들을 상세히 도시한 평면도이다. 도 3은 도 2의 제1 공진부를 상세히 도시한 평면도이다.
도 1 내지 도 3을 참조하면, 본 실시예에 의한 상기 멀티 공진형 음향센서(10)는, 베이스 기판(20) 및 복수의 공진유닛들을 포함한다.
이 때, 본 실시예의 경우, 상기 공진유닛들은 제1 내지 제5 공진유닛들(100, 200, 300, 400, 500)로 총 5개의 공진유닛들을 포함하는 것을 예시하였으나, 상기 공진유닛들의 개수는 다양하게 가변될 수 있음은 자명하다. 다만, 이하에서는 설명의 편의상 5개의 공진유닛들이 구비되는 것을 예시로 설명한다.
우선, 상기 베이스 기판(20)은 상기 멀티 공진형 음향센서(10)의 베이스를 형성하는 것으로, 예를 들어 실리콘(Si) 웨이퍼 기판일 수 있다.
상기 복수의 공진유닛들은 상기 베이스 기판(20) 상에 형성되는 것으로, 상기 공진유닛들의 형성에 대한 구체적인 공정은 후술한다.
상기 제1 내지 제5 공진유닛들(100, 200, 300, 400, 500)은 순차적으로 제1 방향(X)으로 인접하도록 배열되어, 상기 제1 방향(X)을 따라서는 서로 평행하게 배열된다.
또한, 각각의 제1 내지 제5 공진유닛들은 상기 제1 방향(X)에 수직인 제2 방향(Y)을 따라 전체적으로 동일한 길이만큼 연장된다.
이 때, 상기 제1 내지 제5 공진유닛들(100, 200, 300, 400, 500) 각각은 한 쌍의 공진부들을 포함하는데, 이 때, 한 쌍의 공진부들은 서로 마주보도록 배치된다.
예를 들어, 상기 제1 공진유닛(100)은 서로 마주보도록 배치되는 제1 및 제10 공진부들(101, 102)을 포함하고, 상기 제2 공진유닛(200)은 서로 마주보도록 배치되는 제2 및 제9 공진부들(201, 202)을 포함하고, 상기 제3 공진유닛(300)은 서로 마주보도록 배치되는 제3 및 제8 공진부들(301, 302)을 포함하고, 상기 제4 공진유닛(400)은 서로 마주보도록 배치되는 제4 및 제7 공진부들(401, 402)을 포함하고, 상기 제5 공진유닛(500)은 서로 마주보도록 배치되는 제5 및 제6 공진부들(501, 502)을 포함한다.
이 때, 상기 제1 내지 제10 공진부들(101, 201, 301, 401, 501, 502, 402, 302, 202, 102) 각각은 제1 내지 제10 단자부들(110, 210, 310, 410, 510, 540, 440, 340, 240, 140), 제1 내지 제10 전극부들(120, 220, 320, 420, 520, 550, 450, 350, 250, 150), 및 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160)을 포함한다.
상기 제1 단자부(110)는 상기 제1 공진유닛(100)의 일 측에 형성되며, 도시된 바와 같이, 양(+)극 단자와 음(-)극 단자가 서로 이격되도록 형성된다. 또한, 상기 제10 단자부(140)는 상기 제1 공진유닛(100)의 타 측에 형성되며, 양(+)극 단자와 음(-)극 단자가 서로 이격되도록 형성된다.
상기 제1 연장부(130)는 상기 제1 단자부(110)로부터 상기 제10 연장부(160)를 향하여 연장되며, 마찬가지로 상기 제10 연장부(160)는 상기 제2 단자부(140)로부터 상기 제1 연장부(130)를 향하여 연장되어, 상기 제1 및 제10 연장부들(130, 160)은 끝단이 서로 마주하도록 위치한다. 이 때, 상기 제1 및 제10 연장부들(130, 160) 사이는 소정 거리 이격되며 제1 갭부(105)를 형성한다.
이 때, 상기 제1 전극부(120)는 상기 제1 단자부(110)와 전기적으로 연결되며, 상기 제1 연장부(130)의 시작 단에 일정한 길이만큼만 형성되며, 상기 제1 전극부(120)의 형성 길이는 상기 제1 연장부(130)의 형성 길이보다는 작다. 그리하여, 상기 제1 연장부(130)는 소정 길이 연장되는 형태의 압전 외팔보(piezoelectric cantilever) 형상을 가진다.
한편, 상기 제1 전극부(120)는 도 3에서와 같이, 상기 제1 단자부(110)의 양(+)극 단자로부터 연장되는 제1 일측 전극(121)과, 상기 제1 단자부(110)의 음(-)극 단자로부터 연장되는 제1 타측 전극(122)을 포함하는데, 상기 제1 일측 전극(121) 및 상기 제1 타측 전극(122)은 도시된 바와 같이, 서로 깍지형(interdigitate)으로 연장된다.
즉, 상기 제1 일측 전극(121)은 상기 제1 단자부(110)의 양(+)극 단자로부터 제2 방향(Y)을 따라 일정길이 연장되고, 상기 제2 방향(Y)을 따라 연장되는 전극으로부터 일정한 간격으로 상기 제1 방향(X)을 따라 연장되는 복수의 분기부들을 포함한다.
마찬가지로, 상기 제1 타측 전극(122)은 상기 제1 단자부(110)의 음(-)극 단자로부터 제2 방향(Y)을 따라 일정길이 연장되고, 상기 제2 방향(Y)을 따라 연장되는 전극으로부터 일정한 간격으로 상기 제1 방향(X)을 따라 연장되는 복수의 분기부들을 포함한다. 그리하여, 상기 제1 일측 전극(121)의 분기부들과 상기 제1 타측 전극(122)의 분기부들은 서로 이격되며 평행하게 배열되고, 이를 통해 상기 제1 일측 전극(121) 및 상기 제1 타측 전극(122)은 서로 깍지형(interdigitate)으로 형성된다.
마찬가지로, 상기 제10 전극부(150)는 상기 제10 단자부(140)와 전기적으로 연결되며, 상기 제10 연장부(160)의 시작 단에 일정한 길이만큼만 형성되며, 상기 제10 전극부(150)의 형성 길이는 상기 제10 연장부(160)의 형성 길이보다는 작고, 상기 제1 전극부(120)와 동일한 길이로 형성될 수 있다. 그리하여, 상기 제10 연장부(160)도 소정 길이 연장되는 형태의 압전 외팔보(piezoelectric cantilever) 형상을 가진다.
이 때, 상기 제10 전극부(150)와 상기 제10 단자부(140)와의 연결 상태는 앞서 설명한 상기 제1 전극부(120)와 상기 제1 단자부(110)와의 연결 상태와 동일한 구조의 깍지형(interdigitate) 연결구조를 가지며, 이에 대한 중복되는 설명은 생략한다.
이상과 같이, 상기 제1 공진유닛(100)은 서로 마주하도록 배치되는 한 쌍의 제1 및 제10 공진부들(101, 102)을 포함하고, 상기 제1 및 제10 공진부들(101, 102)은 상기 제1 및 제10 연장부들(130, 160)의 끝단이 서로 마주하도록 대칭인 구조로 형성되되, 상기 제1 및 제10 연장부들(130, 160)의 끝단의 사이에는 상기 제1 갭부(105)가 형성된다.
한편, 상기 제1 및 제10 연장부들(130, 160) 각각의 길이는 서로 다르게 형성되는데, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160) 중, 상기 제1 연장부(130)의 길이가 가장 길고, 상기 제10 연장부(160)의 길이가 가장 짧게 형성될 수 있다.
한편, 도 1 및 도 2에 도시된 바와 같이, 상기 제2 공진유닛(200)을 구성하는 상기 제2 공진부(201) 및 상기 제9 공진부(202)의 경우, 상기 제2 연장부(230) 및 상기 제9 연장부(260)의 길이를 제외하고는, 상기 제2 및 제9 단자부들(210, 240) 및 상기 제2 및 제9 전극부들(220, 250)은 앞서 설명한 상기 제1 및 제10 단자부들(110, 140) 및 상기 제1 및 제10 전극부들(120, 150)과 그 구조 및 형상은 실질적으로 동일하다. 따라서, 중복되는 설명은 생략한다.
다만, 상기 제2 및 제9 연장부들(230, 260) 각각의 길이는 서로 다르게 형성되는데, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160) 중, 상기 제2 연장부(230)의 길이는 상기 제1 연장부(130)의 길이 다음으로 두번째로 가장 길고, 상기 제9 연장부(260)의 길이는 상기 제10 연장부(160)의 길이 다음으로 두번째로 가장 짧게 형성될 수 있다.
또한, 도 1 및 도 2에 도시된 바와 같이, 상기 제3 공진유닛(300)을 구성하는 상기 제3 공진부(301) 및 상기 제8 공진부(302)의 경우, 상기 제3 연장부(330) 및 상기 제8 연장부(360)의 길이를 제외하고는, 상기 제3 및 제8 단자부들(310, 340) 및 상기 제3 및 제8 전극부들(320, 350)은 앞서 설명한 상기 제1 및 제10 단자부들(110, 140) 및 상기 제1 및 제10 전극부들(120, 150)과 그 구조 및 형상은 실질적으로 동일하다. 따라서, 중복되는 설명은 생략한다.
다만, 상기 제3 및 제8 연장부들(330, 360) 각각의 길이는 서로 다르게 형성되는데, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160) 중, 상기 제3 연장부(330)의 길이는 세번째로 가장 길고, 상기 제8 연장부(360)의 길이는 세번째로 가장 짧게 형성될 수 있다.
마찬가지로, 상기 제4 공진유닛(400)을 구성하는 상기 제4 공진부(401) 및 상기 제7 공진부(402)의 경우, 상기 제4 연장부(430) 및 상기 제7 연장부(460)의 길이를 제외하고는, 상기 제4 및 제7 단자부들(410, 440) 및 상기 제4 및 제7 전극부들(420, 450)은 앞서 설명한 상기 제1 및 제10 단자부들(110, 140) 및 상기 제1 및 제10 전극부들(120, 150)과 그 구조 및 형상은 실질적으로 동일하다. 따라서, 중복되는 설명은 생략한다.
다만, 상기 제4 및 제7 연장부들(430, 460) 각각의 길이는 서로 다르게 형성되는데, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160) 중, 상기 제4 연장부(430)의 길이는 네번째로 가장 길고, 상기 제7 연장부(460)의 길이는 네번째로 가장 짧게 형성될 수 있다.
나아가, 상기 제5 공진유닛(500)을 구성하는 상기 제5 공진부(501) 및 상기 제6 공진부(502)의 경우, 상기 제5 연장부(530) 및 상기 제6 연장부(560)의 길이를 제외하고는, 상기 제5 및 제6 단자부들(510, 540) 및 상기 제5 및 제6 전극부들(520, 550)은 앞서 설명한 상기 제1 및 제10 단자부들(110, 140) 및 상기 제1 및 제10 전극부들(120, 150)과 그 구조 및 형상은 실질적으로 동일하다. 따라서, 중복되는 설명은 생략한다.
다만, 상기 제5 및 제6 연장부들(530, 560) 각각의 길이는 서로 다르게 형성되는데, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160) 중, 상기 제5 연장부(530)의 길이는 다섯번째로 가장 길고, 상기 제6 연장부(560)의 길이는 다섯번째로 가장 짧게 형성될 수 있다.
이상과 같이, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160)의 길이는 서로 다르게 형성되는데, 도시된 것과 앞서 설명한 바와 같이, 제1 연장부(130)의 길이>제2 연장부(230)의 길이>제3 연장부(330)의 길이>제4 연장부(430)의 길이>제5 연장부(530)의 길이>제6 연장부(560)의 길이>제7 연장부(460)의 길이>제8 연장부(360)의 길이>제9 연장부(260)의 길이>제10 연장부(160)의 길이를 만족시킨다.
앞서 설명한 바와 같이, 상기 압전 외팔보 형상으로 연장되는 10개의 연장부들은 서로 다른 길이로 형성되면서도, 한 쌍이 서로 마주하도록 형성되고, 서로 마주하는 연장부들의 길이의 합이 유사하도록 한 쌍의 조합이 구성된다. 그리하여, 5개의 공진유닛을 형성하는 것으로, 총 10개의 서로 다른 연장길이를 가지는 연장부를 형성할 수 있다.
이상과 같이, 5개의 공진유닛을 통해 10개의 서로 다른 연장길이를 가짐으로써 10개의 서로 다른 공진 주파수를 가지는 압전 외팔보를 구성할 수 있으므로, 종래 10개의 압전 외팔보를 일렬로 배열하는 구조보다 부피를 감소하면서도 제작의 용이성을 향상시킬 수 있다.
즉, 하나로 길게 연장되는 연장부에서 갭부를 형성하는 위치를 서로 다르게 선택하는 것으로, 서로 마주하는 한 쌍의 연장부는 물론, 서로 다른 10개의 연장길이를 가지는 연장부들을 형성할 수 있으므로, 제작의 용이성을 향상시킬 수 있고, 이러한 제작 공정에 대하여는 후술한다.
한편, 상기 제1 연장부(130)의 길이>제2 연장부(230)의 길이>제3 연장부(330)의 길이>제4 연장부(430)의 길이>제5 연장부(530)의 길이>제6 연장부(560)의 길이>제7 연장부(460)의 길이>제8 연장부(360)의 길이>제9 연장부(260)의 길이>제10 연장부(160)의 길이를 만족시키기 위해, 상기 제1 내지 제5 갭부들(105, 205, 305, 405, 505)은 그 위치 및 그 길이가 서로 다르게 형성될 수 있다.
즉, 도 1 및 도 2에 도시된 바와 같이, 상기 제1 및 제10 연장부들(130, 160)의 사이에 형성되는 제1 갭부(105)가 상기 양의 제2 방향(+Y)으로 가장 상부에 형성되고, 상기 제2 및 제9 연장부들(230, 260)의 사이에 형성되는 제2 갭부(205), 상기 제3 및 제8 연장부들(330, 360)의 사이에 형성되는 제3 갭부(305), 상기 제4 및 제7 연장부들(430, 460)의 사이에 형성되는 제4 갭부(405), 상기 제5 및 제6 연장부들(530, 560)의 사이에 형성되는 제5 갭부(505)의 순서로, 상기 양의 제2 방향(+Y)으로의 위치가 하부로 이동하게 된다.
또한, 상기 제1 갭부(105)에서 상기 제5 갭부(505)로 갈수록, 갭부의 길이가 증가하게 된다. 그리하여, 상기 제1 내지 제10 연장부들(130, 230, 330, 430, 530, 560, 460, 360, 260, 160)의 길이를 서로 다르게 형성할 수 있다.
이하에서는, 상기 멀티 공진형 음향센서(10)를 제조하는 단계를 상세히 설명한다.
도 4a 내지 도 4f는 도 1의 멀티 공진형 음향센서를 제조하는 단계를 도시한 공정도들이다. 도 4a 내지 도 4f는 상기 제1 공진유닛(100)을 형성하는 것을 예시하였으나, 앞서 설명한 바와 같이, 상기 제1 내지 제5 공진유닛들(100, 200, 300, 400, 500)은 일체로 하기 예시된 공정을 통해 한 번의 공정으로 동시에 형성될 수 있다.
도 4a를 참조하면, 상기 멀티 공진형 음향센서(10)를 제조하는 단계에서는, 우선 상기 베이스 기판(20) 상에 압전층(30)을 도포 또는 접착한다. 이 때, 상기 베이스 기판(20)은 실리콘(Si) 웨이퍼 기판일 수 있으며, 상기 압전층(30)은 압전 단결정(PMN-PT 단결정) 또는 압전 특성을 갖는 다양한 소재를 포함할 수 있다.
이 후, 도 4b를 참조하면, 상기 압전층(30)을 유도결합 플라즈마(inductively coupled plasma, ICP) 식각공정을 통해 상기 압전층(30)의 두께를 상대적으로 얇게 형성한다.
이 후, 도 4c를 참조하면, 상기 압전층(30) 상에 전극층(40)을 형성한다. 상기 전극층(40)은 다양한 증착 방법으로 증착될 수 있으며, 이 때, 상기 전극층(40)이 금속 재료를 포함하는 것은 자명하다.
이 후, 도 4d를 참조하면, 상기 전극층(40)을 일부 제거하여, 상기 압전층(30)의 양 끝단에만 잔류시킴으로써, 한 쌍의 제1 및 제10 전극층들(41, 42)을 형성한다. 이 때, 상기 전극층(40)의 제거 공정은 식각 공정을 포함한 다양한 금속층 일부 제거 공정이 적용될 수 있다.
이 후, 도 4e를 참조하면, 상기 제1 및 제10 전극층들(41, 42) 각각을 패터닝하여, 도 3에서 설명한 바와 같이, 깍지형(interdigitate) 구조를 가지는 제1 및 제10 전극부들(120, 150)을 각각 형성한다. 이 때, 상기 전극층의 패터닝은 e-beam 스퍼터링 공정 등을 이용하여 수행될 수 있으나, 그 공정이 제한되지는 않는다.
이 후, 도 4f를 참조하면, 상기 압전층(30)의 특정 위치에 제1 갭부(105)를 형성하면서, 상기 제1 갭부(105)를 통해 식각액을 제공하여 상기 압전층(30)의 하부에 위치하는 상기 베이스 기판(20)을 제거한다. 이 경우, 이러한 상기 베이스 기판(20)의 제거는, Deep RIE(reactive ion etching) 공정을 적용하여 수행될 수 있다.
그리하여, 상기 베이스 기판(20)은 제거되어, 상기 제1 전극부(120)의 하부에 위치하는 제1 베이스부(21), 및 상기 제10 전극부(150)의 하부에 위치하는 제2 베이스부(22)만 잔류하고, 이에 따라, 상기 제1 및 제10 연장부들(130, 160)은 소위 압전 외팔보(piezoelectric cantilever) 형상으로 연장되도록 형성된다.
도 5는 도 1의 멀티 공진형 음향센서를 이용하여 주파수 분리 특성을 실험한 결과를 나타낸 그래프이다.
도 5를 통해서, 도 1의 멀티 공진형 음향센서(10)를 이용하여 주파수 분리 전기신호를 측정한 결과가 도시된다. 앞서 설명한 바와 같이 상기 멀티 공진형 음향센서(10)는 총 10개의 공진부들을 포함하므로, 서로 다른 공진 주파수를 가지는 총 10개의 채널을 포함한다. 이에, 이러한 멀티 공진형 음향센서(10)의 주파수 분리의 특성을 측정하기 위해, white noise에 대한 주파수 응답을 측정하고 분석한 결과, 도 5에서와 같이 총 10개의 주파수 분리(0.4~13.5kHz) 전기 신호가 측정되었다.
이상과 같이, 서로 다른 공진 주파수를 가지는 공진부들을 포함하도록 상기 멀티 공진형 음향센서(10)를 제작하여, 입력 음성에 대하여 각각의 공진부들의 주파수 특성을 분리하여 획득함으로써, 입력 음성이 가지는 주파수 특성을 파악할 수 있다.
이러한 상기 멀티 공진형 음향센서(10)가 가지는 주파수 분리의 특성을 이용하여 입력 음성에 대한 음성인식 또는 화자인식이 가능하며, 이에 이하에서는, 상기 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 시스템 및 음성인식 또는 화자인식 방법에 대하여 설명한다.
이하에서는, 상기 음성인식 또는 화자인식 시스템(1) 및 음성인식 또는 화자인식 방법에 대하여 설명의 편의상 동시에 설명한다.
도 6은 도 1의 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 시스템을 도시한 블록도이다. 도 7은 도 6의 멀티 공진형 음향센서를 이용한 음성인식 또는 화자인식 방법을 도시한 흐름도이다. 도 8a는 도 7의 멀티 공진형 음향센서의 각 공진부들에서 획득된 전기신호를 스펙트로그램으로 처리한 결과의 예이며, 도 8b는 상용 음향센서에서 획득된 전기 신호를 스펙트로그램으로 처리한 결과의 예이다.
우선, 도 6을 참조하면, 상기 음성인식 또는 화자인식 시스템(1)은 앞서 설명한 상기 멀티 공진형 음향센서(10) 외에, 음성 신호 발생부(2), 신호처리부(3), 인공지능 학습부(4) 및 결과 출력부(5)를 포함한다.
이에, 상기 음성인식 또는 화자인식 방법에서는, 우선, 도 6 및 도 7을 참조하면, 상기 음성 신호 발생부(2)는 음성 인식 또는 화자 인식 테스트를 위한 음성을 발생시킨다(단계 S10).
상기 음성 신호 발생부(2)는 상용 스피커일 수 있으며, 상기 음성 신호 발생부(2)를 통해 발생되는 음성 소스(source)는 제한되지는 않으며 다양한 음성 데이터베이스를 활용할 수 있다. 또한, 상기 음성 신호 발생부(2)를 통해 발생되는 음성 소스는 다양하게 구성될 수 있는데, 예를 들어, 충분히 많은 개수의 단어들 각각에 대하여 복수의 화자를 통해 생성된 음성 데이터가 적용될 수 있다.
이 때, 상기 음성 신호 발생부(2)를 통해 발생되는 음성 소스는 후술되는 상기 인공지능 학습부(4)를 통한 학습을 수행하기에 충분한 개수로 구성되면 충분하다.
이 후, 도 6 및 도 7을 참조하면, 상기 멀티 공진형 음향 센서(10)에서 상기 음성 신호 발생부(2)에서 발생된 음성 신호들에 대하여 주파수 분리 전기신호를 획득한다(단계 S20).
즉, 앞서 도 5를 통해 예시된 바와 같이, 상기 멀티 공진형 음향 센서(10)는 예를 들어 10개의 서로 다른 채널을 통해 특정 음성 신호에 대한 주파수 분리 전기신호를 획득하게 된다. 한편, 본 실시예의 경우, 상기 멀티 공진형 음향 센서(10) 외에, 일반 상용 마이크로폰을 통해서도 동일한 음성 신호들에 대한 전기신호를 획득한다. 그리하여, 상기 멀티 공진형 음향 센서(10)를 통해 획득된 신호와 상용 마이크로폰을 통해 획득된 전기신호 모두에 대하여 후술되는 학습을 통해 음성 신호의 특성을 구별하여 학습하게 된다.
이 때, 상기 상용 마이크로폰을 통해 획득된 전기신호는 기준 전기신호로 간주될 수 있다.
이 후, 도 6 및 도 7을 참조하면, 상기 신호처리부(3)에서는 상기 멀티 공진형 음향 센서(10) 및 상기 상용 마이크로폰을 통해 획득된 음성 신호들에 대한 전기신호를 신호처리 한다(단계 S30).
이러한 상기 신호처리부(3)에서의 신호처리한 전기신호는, 상기 획득된 주파수 신호를 스펙트럼(spectrum)으로 시각화한 스펙트로그램(spectrogram) 이미지로서, 그 예는 도 8a 및 도 8b에서와 같다.
즉, 도 8a에서와 같이, 상기 멀티 공진형 음향 센서(10)의 10개의 채널, 즉 10개의 공진부들을 통해서 획득되는 주파수 신호를 신호처리하여, 10개의 스펙트로그램을 획득하고, 도 8b에서와 같이 상기 마이크로폰을 통해 획득된 주파수 신호를 신호처리하여 스펙트로램을 획득한다. 마찬가지로, 상기 마이크로폰을 통해 획득된 주파수 신호에 대한 스펙트로그램은 신뢰할 수 있는 기 음향센서의 기준 스펙트로그램으로 간주될 수 있다.
이 후, 도 6 및 도 7을 참조하면, 상기 인공지능 학습부(4)에서는, 상기 이미화된 스펙트로그램들에 대하여 학습을 수행한다(단계 S40).
이 때, 상기 인공지능 학습부(4)에서는 상기 스펙트로그램 이미지를 입력받아 소위, 머신러닝(machine learning) 또는 딥러닝(deep learning) 학습을 수행하는 것으로, 이러한 학습의 결과, 각각의 음성에 대하여 상기 스펙트로그램을 기초로 그 특성을 식별하게 된다.
그리하여, 도 6 및 도 7을 참조하면, 새로운 음성이 상기 음성 신호 발생부(2)를 통해 입력되면, 상기 인공지능 학습부(4)의 학습의 결과를 바탕으로 상기 결과 출력부(5)에서는 해당 음성을 식별하여 그 결과를 출력하게 된다(단계 S50).
상기와 같은 본 발명의 실시예들에 의하면, 한 쌍의 공진부들이 서로 마주하도록 배치되어 하나의 공진유닛을 구성하고, 상기 공진유닛이 복수개가 서로 나열되어 멀티 공진형 음향센서를 형성함으로써, 압전 외팔보가 배열되는 음향센서의 전체 부피 및 크기를 최소화할 수 있어, 소형화가 가능하다.
즉, 공진유닛들 각각의 길이는 전체적으로 동일하게 유지하면서도, 상기 공진유닛들 각각에 포함되는 공진부들의 길이를 순차적으로 증가 또는 감소하도록 형성함으로써, 설계 최적화를 통해 음향센서의 소형화가 가능하며 제작의 용이성도 향상된다.
특히, 상기 구조의 음향센서의 제작에 있어, 하나의 공진유닛에 포함되는 한 쌍의 공진부들 사이의 갭부의 위치를 가변시키는 것으로 복수의 공진유닛들에 포함되는 공진부들의 압전 외팔보의 길이를 서로 다르게 제작할 수 있으므로, 제작의 용이성이 향상된다.
또한, 압전 외팔보 형상의 공진부의 제작시, 상기 갭부를 통한 베이스 기판의 식각을 통해 제작이 가능하므로, 미세 구조로 소형화된 음향센서의 제작이 매우 용이하다.
또한, 압전 외팔보로 연장되는 연장부는 압전층으로 형성되고, 상기 연장부의 시작 단에는 전극부가 깍지형(interdigitate)으로 형성되므로, 상기 연장부의 진동에 따른 주파수 신호를 전기 신호화하여 용이하게 획득할 수 있다.
특히, 복수의 공진부들이 서로 다른 길이의 연장부를 포함하여 서로 다른 공진 주파수를 가지므로, 상기 획득되는 전기 신호는 주파수 분리된 전기신호이며, 이에, 주파수 분리된 전기신호에 대한 신호처리를 통한 인공지능 알고리즘 학습이 효과적으로 수행될 수 있다.
즉, 특정한 단어에 대한 다양한 사람의 음성 신호에 대하여, 서로 다른 공진 주파수를 가지는 복수의 공진부들에서 발생하는 주파수 신호를 전기 신호화한 주파수 분리 전기신호에 대한 인공지능 학습을 수행하므로, 입력되는 음성 신호에 대한 음성 인식 또는 화자 인식 결과의 정확성을 보다 향상시킬 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
1 : 음성인식 또는 화자인식 시스템
2 : 음성 신호 발생부 3 : 신호처리부
4 : 인공지능 학습부 5 : 결과 출력부
10 : 멀티 공진형 음향센서 20 : 베이스 기판
30 : 압전층 40 : 전극층
100, 200, 300, 400, 500 : 공진유닛
101, 102, 201, 202, 301, 302, 401, 402, 501, 502 : 공진부
110, 140, 210, 240, 310, 340, 410, 440, 510, 540 : 단자부
120, 150, 220, 250, 320, 350, 420, 450, 520, 550 : 전극부
130, 160, 230, 260, 330, 360, 430, 460, 530, 560 : 연장부
105, 205, 305, 405, 505 : 갭부
306, 406, 506 : 갭 연장부

Claims (13)

  1. 베이스 기판; 및
    상기 베이스 기판 상에 형성되는 복수의 공진유닛들을 포함하고,
    상기 공진유닛들 각각은, 압전층으로 형성되는 연장부 및 상기 연장부의 시작 단에 형성되는 전극부를 포함하는 공진부를 한 쌍씩 포함하고,
    상기 한 쌍의 공진부들은 서로 마주하도록 배치되는 것을 특징으로 하는 멀티 공진형 음향센서.
  2. 제1항에 있어서, 상기 한 쌍의 공진부들은,
    상기 압전층으로 형성되는 연장부들의 길이가 서로 다른 것을 특징으로 하는 멀티 공진형 음향센서.
  3. 제2항에 있어서,
    상기 한 쌍의 공진부들의 연장부들의 끝단은 서로 이격되어 갭부를 형성하는 것을 특징으로 하는 멀티 공진형 음향센서.
  4. 제3항에 있어서, 상기 공진유닛들 각각에 형성되는 갭부는,
    상기 공진유닛들 각각에 대하여 서로 다른 위치 및 서로 다른 크기로 형성되는 것을 특징으로 하는 멀티 공진형 음향센서.
  5. 제1항에 있어서, 상기 복수의 공진유닛들이 포함하는 공진부들은,
    상기 연장부가 압전 외팔보(piezoelectric cantilever) 형상으로 연장되며,
    상기 연장부의 길이는 서로 다른 것을 특징으로 하는 멀티 공진형 음향센서.
  6. 제1항에 있어서, 상기 전극부는,
    전기적으로 서로 절연되며, 깍지형(interdigitate)으로 연장되는 한 쌍의 일측 및 타측 전극들을 포함하는 것을 특징으로 하는 멀티 공진형 음향 센서.
  7. 제1항에 있어서,
    상기 베이스 기판은 실리콘(Si) 웨이퍼 기판이고,
    상기 압전층은 압전 단결정(PMN-PT 단결정) 또는 압전 특성의 소재를 포함하는 것을 특징으로 하는 멀티 공진형 음향센서.
  8. 음성 인식 또는 화자 인식 테스트용 음성을 발생시키는 음성 신호 발생부;
    상기 발생된 음성에 따라, 복수의 공진유닛들을 통해 주파수가 분리되고 전기신호가 획득되는 멀티 공진형 음향센서;
    상기 주파수 분리 전기신호를 신호처리하는 신호처리부;
    상기 발생된 음성별로 신호처리된 전기신호를 인공지능 알고리즘으로 학습하는 인공지능 학습부; 및
    상기 학습의 결과를 바탕으로, 입력된 음성에 대한 음성 인식 또는 화자 인식 결과를 출력하는 결과 출력부를 포함하는 음성인식 또는 화자인식 시스템.
  9. 제8항에 있어서, 상기 복수의 공진유닛들이 포함하는 공진부들은,
    압전 외팔보(piezoelectric cantilever) 형상으로 연장되는 연장부를 포함하며,
    상기 연장부의 길이가 서로 달라 서로 다른 주파수에서 공진이 발생되는 것을 특징으로 하는 음성인식 또는 화자인식 시스템.
  10. 제9항에 있어서, 상기 주파수 분리 전기신호는,
    상기 발생된 음성에 대한 상기 공진부들 각각의 주파수 신호를 포함하는 것을 특징으로 하는 음성인식 또는 화자인식 시스템.
  11. 제10항에 있어서, 상기 신호처리된 전기신호는,
    상기 공진부들 각각의 주파수 신호를 스펙트럼(spectrum)으로 시각화한 스펙트로그램(spectrogram) 이미지인 것을 특징으로 하는 음성인식 또는 화자인식 시스템.
  12. 제11항에 있어서, 상기 인공지능 학습부는,
    상기 공진부들 각각에 대한 스펙트로그램 이미지와, 기 음향센서의 기준(reference) 스펙트로그램 이미지를 동시에 입력받아, 상기 발생된 음성에 대하여 머신러닝(machine learning) 또는 딥러닝(deep learning) 알고리즘으로 학습하는 것을 특징으로 하는 음성인식 또는 화자인식 시스템.
  13. 음성 인식 또는 화자 인식 테스트용 음성을 발생시키는 단계;
    상기 발생된 음성에 따라, 복수의 공진유닛들을 통해 주파수 분리 전기신호를 획득하는 단계;
    상기 주파수 분리 전기신호를 신호처리하는 단계;
    상기 발생된 음성별로 신호처리된 전기신호를 학습하는 단계; 및
    상기 학습의 결과를 바탕으로, 입력된 음성에 대한 음성 인식 또는 화자 인식 결과를 출력하는 단계를 포함하는 음성인식 또는 화자인식 방법.
KR1020220166681A 2022-12-02 멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법 KR20240082741A (ko)

Publications (1)

Publication Number Publication Date
KR20240082741A true KR20240082741A (ko) 2024-06-11

Family

ID=

Similar Documents

Publication Publication Date Title
US10506345B2 (en) System and method for a microphone
US20220248145A1 (en) Acoustic Transducer with Gap-Controlling Geometry and Method of Manufacturing an Acoustic Transducer
US9809444B2 (en) System and method for a differential comb drive MEMS
US20070125176A1 (en) Energy harvesting device and methods
US20220270615A1 (en) Method and apparatus for recognizing speaker by using a resonator
CN107809717B (zh) 高灵敏度麦克风及其制造方法
KR101550636B1 (ko) 마이크로폰 및 그 제조 방법
US11902740B2 (en) High-sensitivity piezoelectric microphone
CN108391216A (zh) 麦克风及其制造方法
JP5088950B2 (ja) 集積回路装置及び音声入力装置、並びに、情報処理システム
CN109661825A (zh) 悬臂式剪切谐振麦克风
WO2010096020A1 (en) Miniaturized piezoelectric accelerometers
JP2007228345A (ja) コンデンサマイクロホン
JP2008028513A (ja) コンデンサマイクロホン及びその製造方法
KR20240082741A (ko) 멀티 공진형 음향센서, 이를 이용한 음성인식 또는 화자인식 시스템 및 방법
JP2007243757A (ja) コンデンサマイクロホン
US10448168B2 (en) MEMS microphone having reduced leakage current and method of manufacturing the same
KR101807062B1 (ko) 마이크로폰 및 이의 제조방법
JPS6361920A (ja) 音響振動解析装置およびその製造方法
KR102205414B1 (ko) 음향장치 및 음향 처리 방법
US10856085B2 (en) Microphone and manufacture thereof
JP4737720B2 (ja) ダイヤフラム及びその製造方法並びにそのダイヤフラムを有するコンデンサマイクロホン及びその製造方法
US20230312334A1 (en) Mems sensor with a thin region
JP3802014B2 (ja) 音響解析装置
JP5097511B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム