KR20180082231A

KR20180082231A - 사용자맞춤형음향 센싱 장치 및 방법

Info

Publication number: KR20180082231A
Application number: KR1020170003668A
Authority: KR
Inventors: 김병길; 최인정
Original assignee: 주식회사 사운드잇
Priority date: 2017-01-10
Filing date: 2017-01-10
Publication date: 2018-07-18

Abstract

본 발명의 바람직한 일 실시예로서 개시된 사용자맞춤형 음향센싱장치는 사용자가 검출하고자 하는 음향을 등록하고 해당 음향이 센싱되는 경우 사용자에게 알림을 제공한다. 또한, 사용자가 검출하고자 하는 음향과 유사하거나 혼동이 발생하는 음향에 대한 판단기준을 기초로 사용자가 검출하고자 하는 음향을 검출하는 신뢰도를 개선한다.

Description

사용자맞춤형음향 센싱 장치 및 방법{Method and Device for sensing user designated audio signals}

본 발명은 음향 센싱 방법 및 장치에 관한 것이다. 보다 상세히, 사용자가 검출하고자 하는 음향신호를 등록하여 검출하는 사용자맞춤형 음향센싱 방법 및 장치에 관한 것이다.

현재 음향을 감지하는 방법에 관한 기술은 예컨대, 범죄 또는 사고 등과 같은 이벤트가 발생함으로써 생성될 수 있는 비명소리, 유리가 깨지는 소리, 폭발음, 충돌음 등과 같은 대상 음향이 존재하는 경우 감지하여 사용자에게 알리도록 구현되어 있다.

최근의 음향 이벤트 감지 기술은 전화벨 소리나 개 짖는 소리, 비명 등과 같이 이미 정형화된 종류의 음향이벤트들만 감지할 수 있으며, 가까운 거리의 이웃집 전화벨 소리나 개 짖는 소리 등과 같은 유사 음향이벤트에도 반응하여 사용자에게 잘못된 알림을 제공할 수 있어, 신뢰성을 떨어트리는 문제가 있다.

특히, 홈네트워크와 연동하여 음향센싱을 수행하고자 하는 경우, 사용자가 원하는 관심 음향이벤트를 추가할 수 없는 한계점이 있다.

KR1020140033262 KR1020130097490

본 발명의 바람직한 일 실시예에서는 음향 감지시 미리 등록된 한정된 음향이벤트 신호만을 감지할 수 있는 것이 아니라, 사용자가 검출하기 원하는 음향신호를 직접 추가하여 센싱할 수 있는 사용자맞춤형음향센싱장치를 구현하고자 한다.

본 발명의 또 다른 바람직한 일 실시예에서는, 사용자가 검출하기 원하는 음향신호와 혼동이 가능한 신호와의 혼동가능성을 낮출 수 있는 사용자맞춤형음향센싱장치를 구현하고자 한다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치는 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 음향속성입력인터페이스; 사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 녹음파일입력인터페이스; 상기 적어도 하나 이상의 녹음파일에서 음향의 유효구간을 분리하고, 기계학습을 통해 상기 분리한 유효구간 내에서 음향의 고유특성을 검출하는 유효구간검출부; 상기 녹음파일에서 분리한 음향의 유효구간, 상기 음향의 고유특성, 상기 입력받은 음향의 종류 및 속성 중 적어도 하나를 기초로 상기 사용자가 검출하고자 하는 음향과 가장 매칭되는 매칭음향을 선택하는 매칭음향선택부; 상기 매칭음향과 혼동이 발생할 수 있는 혼동음향들에 대해 기계학습을 수행하고, 혼동음향들에 대한 기준을 선정하는 혼동음향학습부;및 상기 선택된 매칭음향 또는 상기 적어도 하나 이상의 녹음파일을 기초로 기계학습을 수행하며, 상기 선택된 매칭음향을 초기모델로 선정한 후, 사용자가 검출하고자 하는 음향의 특징벡터들을 사용하여 기계학습을 수행하여 상기 사용자가 검출하고자 하는 사용자맞춤형음향을 학습하는 사용자맞춤형음향학습부;를 포함하는 것을 특징으로 한다.

바람직하게, 상기 학습된 사용자맞춤형음향이 센싱되면 사용자에게 알림메시지를 전송하는 알림부;를 더 포함하는 것을 특징으로 한다.

바람직하게, 상기 알림부는 상기 사용자에게 전송된 알림메시지에 대한 사용자의 피드백을 수신하는 피드백수신부;를 더 포함하고, 상기 사용자의 피드백은 센싱된 사용자맞춤형음향이 사용자가 검출하고자 하는 음향이 맞는지 또는 틀리는지에 관한 내용을 포함하는 것을 특징으로 한다.

바람직하게, 상기 피드백수신부는 상기 사용자의 피드백을 상기 혼동음향학습부 및 상기 사용자맞춤형음향학습부에 전송하고, 이 경우 상기 혼동음향학습부 및 상기 사용자맞춤형음향학습부는 수신한 사용자의 피드백을 추가로 기계학습하여, 상기 사용자맞춤형음향을 업데이트하는 것을 특징으로 한다.

바람직하게, 상기 알림메시지는 상기 센싱된 사용자맞춤형음향의 유효한 음향신호 구간인 것을 특징으로 한다.

본 발명의 또 다른 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치는 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 음향속성입력인터페이스; 사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 녹음파일입력인터페이스;및 상기 음향속성입력인터페이스 또는 상기 녹음파일입력인터페이스로부터 입력받은 사용자가 검출하고자 하는 음향의 종류, 속성 및 녹음파일 중 적어도 하나 이상을 기초로 상기 사용자가 검출하고자 하는 음향과 매칭되는 음향이 센싱되는 경우 사용자에게 알림메시지를 전송하는 알림부;를 포함하는 것을 특징으로 한다.

본 발명의 또 다른 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치에서 사용자맞춤형음향을 센싱하는 방법은 음향속성입력인터페이스에서 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 단계; 녹음파일입력인터페이스에서 사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 단계; 유효구간검출부에서 상기 적어도 하나 이상의 녹음파일에서 음향의 유효구간을 분리하고, 기계학습을 통해 상기 분리한 유효구간 내에서 음향의 고유특성을 검출하는 단계; 매칭음향선택부에서 상기 녹음파일에서 분리한 음향의 유효구간, 상기 음향의 고유특성, 상기 입력받은 음향의 종류 및 속성 중 적어도 하나를 기초로 상기 사용자가 검출하고자 하는 음향과 가장 매칭되는 매칭음향을 선택하는 단계; 혼동음향학습부에서 상기 매칭음향과 혼동이 발생할 수 있는 혼동음향들에 대해 기계학습을 수행하고, 혼동음향들에 대한 기준을 선정하는 단계;및 사용자맞춤형음향학습부에서 상기 선택된 매칭음향 또는 상기 적어도 하나 이상의 녹음파일을 기초로 기계학습을 수행하며, 상기 선택된 매칭음향을 초기모델로 선정한 후, 사용자가 검출하고자 하는 음향의 특징벡터들을 사용하여 기계학습을 수행하여 상기 사용자가 검출하고자 하는 사용자맞춤형음향을 학습하는 단계;를 포함하는 것을 특징으로 한다.

본 발명의 바람직한 일 실시예로서 개시된 사용자맞춤형음향센싱장치는 사용자가 검출하고자 하는 음향을 등록할 수 있다. 사용자는 자신이 원하는 음향이 센싱되는 경우, 알림을 받을 수 있는 효과가 있다.

본 발명의 바람직한 일 실시예로서 개시된 사용자맞춤형음향센싱장치는 특히, 홈네트워크와 연동하여 음향센싱을 수행할 수 있는 효과가 있다.

본 발명의 바람직한 일 실시예로서 개시된 사용자맞춤형음향센싱장치는 또한 유사한 혼동음향이 다수 존재하는 경우에도 기계학습을 통해 사용자가 검출하고자 하는 음향을 검출하는 신뢰도를 개선할 수 있는 효과가 있다.

도 1 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치가 동작하는 시스템도를 도시한다.
도 2 는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치의 내부 구성도를 도시한다.
도 3 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치에서 사용자가 검출하고자 하는 음향을 등록하는 일 예를 도시한다.
도 4 는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)에서 이용하는 데이터베이스의 내부 구조의 일 예를 도시한다.
도 5는 본 발명의 바람직한 일 실시예로서 알림히스토리에 사용자의 피드백 결과를 함께 제공하는 일 예를 도시한다.
도 6 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치의 내부 간략 구성도를 도시한다.
도 7 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치와 서버간에 사용자맞춤형 음향센싱을 수행하는 과정의 일 예를 도시한다.
도 8 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치와 음향센싱부에서 인증을 수행하는 과정의 일 예를 도시한다.
도 9는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향 목록 리스트를 도시한다.
도 10은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향이 센싱된 경우 사용자 단말기에 알림메시지가 전달된 일 예를 도시한다.

이하에서는 도면을 참고하여 설명한다.

도 1 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치가 동작하는 시스템도를 도시한다.

본 발명의 바람직한 일 실시예로서, 도 1 의 사용자맞춤형음향센싱장치가 동작하는 시스템도는 사용자맞춤형음향센싱장치(100), 음향센싱 기능이 구비된 장치(110) 및 유무선 통신이 가능한 서버(120)를 포함한다.

사용자맞춤형음향센싱장치(100) 또는 서버(120)에서 사용자가 검출하고자 하는 사용자맞춤형 음향을 등록하면, 음향센싱 기능이 구비된 장치(110)에서 등록된 사용자맞춤형 음향을 검출하여 사용자맞춤형음향센싱장치(100)에 알리고, 검출된 음향에 대한 정보를 서버(120)에서 업데이트 하도록 구현될 수 있다.

본 발명의 바람직한 일 실시예에서는 음향센싱 기능이 구비된 장치(110) 대신 사용자맞춤형음향센싱장치(100)를 이용하여 사용자맞춤형 음향을 검출하도록 구현될 수 있다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(100)는 스마트폰, 스마트 TV, 스마트 와치,네트워크 카메라, 테블릿, 노트북, 핸드헬드 장치, 셋탑박스 및 그 외 오디오를 센싱하고, 통신이 가능한 단말기의 형태로 구현이 가능하다. 본 발명의 또 다른 바람직한 일 실시예로서, 사용자맞춤형 음향 센싱 방법은 어플리케이션 형태로 구현되어 사용자맞춤형음향센싱장치(100)에 설치될 수 있다.

도 2 는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치의 내부 구성도를 도시한다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)는 사용자가 검출하고자 하는 음향을 추가한 후, 해당 음향 신호가 센싱되면 사용자에게 사용자맞춤형 음향모델이 센싱되었음을 알릴 수 있다.

바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)에서 3살, 3.5kg, 푸들 강아지의 짖는 소리를 검출하고자 등록한 경우, 사용자맞춤형음향센싱장치(200)는 3살, 3.5kg, 푸들 강아지의 짖는 소리를 학습하여 사용자맞춤형 음향모델로 설정하고, 해당 음향모델의 특징이 있는 음향 신호가 센싱되면 사용자에게 알림 메시지를 전송한다.

본 발명의 또 다른 바람직한 일 실시예로, 가정에서 아기의 울음소리 내지 목소리를 센싱하고자 사용자맞춤형음향센싱장치(600)에 등록한 경우, 청각장애가 있는 부모가 자신의 사용자맞춤형음향센싱장치(600)를 통해 아기의 울음소리 내지 목소리가 센싱되었다는 알림메시지를 수신하도록 구현될 수 있다. 이 경우, 알림 메시지는 진동 등의 형태를 택할 수 있다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)는 음향속성입력인터페이스(210), 녹음파일입력인터페이스(220) 및 알림부(270) 를 포함한다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)는 고유특성검출부(230), 매칭음향선택부(240), 사용자맞춤형음향 학습부(250) 및 혼동음향학습부(260)를 더 포함할 수 있다.

본 발명의 또 다른 바람직한 일 실시예로서, 고유특성검출부(230), 매칭음향선택부(240), 사용자맞춤형음향 학습부(250) 및 혼동음향학습부(260)는 서버(도 1, 120)에서 구현될 수도 있다.

본 발명의 바람직한 일 실시예에서, 매칭음향은 사용자가 검출하고자 하는 음향의 속성 내지 정보 등을 기초로 데이터베이스에서 선택된 가장 매칭되는 음향을 지칭한다. 혼동음향은 선택된 매칭음향과 혼동가능성이 있는 음향을 지칭한다. 사용자맞춤형음향은 매칭음향을 초기음향으로 혼동음향과의 차이를 식별하며, 사용자가 검출하고자 하는 음향의 특징벡터들, 사용자가 입력한 녹음파일에서 추출한 유효구간의 특징을 사용하여 기계학습을 수행한 음향을 지칭한다.

각 구성별 특징은 아래와 같다.

음향속성입력인터페이스(210)는 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는다. 음향속성입력인터페이스는 도 4의 데이터베이스에서 채택한 예시와 유사한 계층구조 인터페이스 또는 나열형구조 인터페이스를 지원할 수 있다. 사용자는 음향속성입력인터페이스(210)를 통해 디스플레이에 표시된 다양한 음향의 종류 중 자신이 추가하고자 하는 음향을 선택할 수도 있고, 디스플레이에 표시된 음향의 종류 중 자신이 추가하고자 하는 음향이 없는 경우 스스로 추가할 수 있다.

도 3을 참고하면, 음향속성입력인터페이스(210)는 도 3의 일 실시예와 같이 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는다. 음향의 종류의 예로는 유리창 깨지는 소리, 비명 소리, 개짖는 소리, 고양이 울음 소리, 애기 우는 소리, 전화벨 소리, 도어벨 소리, 물 끊는 소리 등이 있다. 등록하고자 하는 음향이 없는 경우에는 원하는 음향을 수동으로 추가하도록 구현할 수 있다. 이상은 이해를 돕기 위한 실시예일 뿐, 다양한 음향이 모두 포함될 수 있음을 유의하여야 한다.

도 3 을 참고하면, 사용자맞춤형음향센싱장치(300)는 음향속성입력인터페이스의 일 실시예로 예로 사용자가 검출하고자 하는 음향의 종류(310) '개 짖는 소리'(311)를 입력하는 인터페이스(310, 311), 해당 음향의 구체적 속성(320), 강아지 종류 '푸들'(321), 강아지 몸무게 3.5kg(322), 강아지 연령 3살(323)을 입력하는 인터페이스(320, 321, 322, 323)을 제공한다.

녹음파일입력인터페이스(220)는 사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는다. 예를 들어, 도 3 을 참고하면, 음향속성입력인터페이스(310, 311, 320, 321, 322, 323)를 통해 자기 집에서 키우는 3살, 3.5kg의 푸들 강아지의 짖는 소리 음향을 검출하도록 등록한 경우, 사용자는 자기 집에 있는 3살 푸들 강아지의 짖는 소리 음향을 예를 들어 아침, 점심, 저녁 각각 녹음하여 녹음파일입력인터페이스(324)를 통해 입력할 수 있다.

사용자는 더 나아가 강아지가 화 났을 때 짖는 소리, 배고플 때 짖는 소리, 아플 때 짖는 소리 등으로 구분하여 녹음한 후에 녹음파일입력인터페이스(324)를 통해 입력할 수 있다. 이 경우, 도 3에 음향속성입력인터페이스의 일 형태로 "감정" 또는 "상태"를 더 추가하여, 강아지의 상태에 관한 속성을 더 추가할 수 있다.

마찬가지로, 사용자는 6개월된 여자 아기의 옹알이, 울음소리를 검출하도록 등록한 경우, 사용자는 여자 아기의 옹알이, 울음소리가 녹음된 다양한 파일을 녹음파일입력인터페이스(324)를 통해 입력할 수 있다. 더 나아가 사용자는 여자 아기가 대소변을 봤을 때의 울음소리, 배고플 때의 울음소리, 아플 때의 울음소리 등을 구분하여 녹음 및 분류한 후에 녹음파일입력인터페이스(324)를 통해 입력할 수 있다.

도 2 로 돌아와서, 유효구간검출부(230)는 녹음파일입력인터페이스(220)에서 수신한 적어도 하나 이상의 녹음파일에서 음향의 유효구간을 분리하고, 분리한 유효구간 내에서 음향의 고유특성을 검출한다.

매칭음향선택부(240)는 음향속성입력인터페이스(210) 또는 녹음파일입력인터페이스(220)를 통해 입력받은 음향에 관한 정보를 기초로 사용자가 검출하고자 하는 음향과 매칭되는 매칭음향을 데이터베이스에서 선택한다. 데이터베이스는 사용자맞춤형음향센싱장치(200) 내부의 구성이거나 또는 유무선통신이 가능한 외부 기기일 수 있다. 데이터베이스는 도 4의 일 실시예와 같이 다양한 음향을 계층 구조 형태 또는 나열형 구조 형태로 저장할 수 있다.

도 3 및 4를 참고하면, 매칭음향선택부(240)에서는 사용자가 입력한 음향 속성 '개 짖는 소리', 강아지 종류 '푸들', 강아지 연령 '3세', 강아지 체중 '3.5kg' 및 강아지 짖는 소리 녹음파일을 기초로 그에 매칭하는 매칭음향을 검출한다.

도 4 를 참고하면, 매칭음향선택부(도 2, 240)는 데이터베이스에서 월드 모델(410) 중 생명체음향이벤트 모델(420)을 선택하고, 이 후 사람 관련 음향이벤트 모델과 동물 관련 음향이벤트 모델 중 동물 관련음향이벤트 모델(430)을 선택한다. 그리고 동물 관련음향이벤트 모델(430) 중 개 짖는 소리(440)를 선택한 후, 해당되는 개 종류와 개 연령에 맞는 매칭음향(441)을 선택한다.

이 경우, 매칭음향선택부(도 2, 240)는 매칭음향을 선택할 때, 유효구간 검출부(도 2, 230)에서 검출한 녹음파일의 유효구간의 고유 특성 정보를 이용할 수 있다. 고유 특성 정보의 일 예로는 주파수, 음압 레벨, 고유 음향 임피던스, 고유 진동수 등이 있다.

매칭음향선택부(도 2,240)는 또한 혼동음향학습부(도 2, 260)에서 학습된 혼동음향에 대한 결과값(S262)을 매칭음향을 선택할 때 이용할 수 있다.

사용자맞춤형음향 학습부(250)는 매칭음향선택부(240)에서 선택한 매칭음향을 초기모델로 선정한 후, 사용자가 검출하고자 하는 음향의 특징벡터들을 사용하여 기계학습을 수행할 수 있다. 이 경우, 사용자가 제공한 녹음파일의 유효구간을 이용하여 기계학습을 수행할 수 있다.

사용자맞춤형음향 학습부(250)는 GMM(Gaussian mixture model), HMM(hidden Markov model), BoF(Bag-of-Feature) 방식, SVM(support vector machine), 신경회로망 등의 음향모델 유형들, 분별학습법, MAP(maximum a posteriori), 그리고 MLLR(maximum likelihood linear regression) 등의 기계학습 방식을 이용할 수 있다.

도 4 를 참고하면, 사용자맞춤형음향 학습부(도 2, 250)는 매칭음향선택부(도 2, 240)에서 데이터베이스에서 선택한 매칭음향(441)을 초기모델로 선정한다. 그 후, 사용자가 제공한 3.5kg, 3살 푸들 강아지의 녹음파일을 분석하여 기계학습을 수행한다. 또한, 사용자맞춤형음향 학습부(도 2, 250)는 매칭음향(441) 또는 사용자가 제공한 녹음파일을 기초로 기계학습을 통해 사용자맞춤형 음향모델을 학습한 이후에도, 사용자로부터 추가적으로 수신하는 피드백(도2, S270), 혼동음향학습부(도 2, 260)로부터 수신하는 데이터를 기초로 사용자맞춤형 음향모델의 정확도를 업데이트하도록 구현된다.

도 2에서 혼동음향학습부(260)는 사용자가 검출하고자 하는 음향과 혼동이 발생할 가능성이 높은 음향들에 대해 기계학습을 수행한다. 이 경우, 혼동모델(cohort model)을 기초로 기계학습이 가능하다. 또한, GMM(Gaussian mixture model), HMM(hidden Markov model), BoF(Bag-of-Feature) 방식, SVM(support vector machine), 신경회로망 등의 음향모델 유형들, 분별학습법, MAP(maximum a posteriori), 그리고 MLLR(maximum likelihood linear regression) 등의 기계학습 방식을 이용할 수 있다.

혼동음향학습부(260)는 사용자맞춤형음향학습부(250)에서 학습된 사용자맞춤형 음향모델과 혼동이 발생할 가능성이 높은 음향들에 대한 기준을 생성한다. 이를 위해, 혼동음향학습부(260)는 확정된 매칭음향을 기준으로 유사하거나 혼동이 가능한 음향들을 비교하여 혼동음향의 기준을 설정하고, 혼동음향마다 혼동의 정도를 표시하는 점수를 설정할 수 있다.

바람직한 일 실시예로서, 사용자가 1살, 여자 아기의 소리를 검출하고자 등록한 경우, 혼동음향학습부(260)에서는 2살, 옆집 여자 아기의 소리, 1살 아랫집 남자 아기의 소리 등을 혼동음향으로 학습할 수 있다. 또한 6개월된 여자 아기의 옹알이, 울음소리와 옆집의 1살된 여자 아기의 울음소리 등에 대해 기계 학습을 수행하여 혼동음향에 대한 기준을 선정할 수 있다. 혼동음향을 학습하는 방법으로는 다양한 모델 적응 기법과 기계학습 방법들을 이용할 수 있다.

또 다른 바람직한 일 실시예로서, 혼동음향학습부(260)는 사용자가 등록한 3살 푸들 강아지의 짖는 소리와 혼동이 발생할 수 있는 옆집 1살 푸들 강아지의 짖는 소리를 학습함으로써 옆집 강아지 소리에는 반응하지 않도록 기계학습을 수행할 수 있다.

혼동음향학습부(260)는 사용자가 검출하고자 하는 음향과 동일 또는 유사한 음향이 감지될 때, 감지된 음향이 사용자가 검출하고자 하는 음향이 맞는지 아닌지에 대한 승인/거절 판정을 위한 혼동점수를 설정하기 위한 혼동모델을 학습할 수 있다.

혼동음향학습부(260)는 사용자맞춤형음향 학습부(250)에서 학습한 사용자맞춤형 음향모델과 혼동이 가능한 다양한 음향모델에 대해 각각 혼동모델 점수를 설정할 수 있다.

혼동음향학습부(260)는 또한 사용자의 피드백(S270)을 수신하여 정확도를 개선하도록 업데이트가 가능하다.

사용자맞춤형음향센싱장치(200)에서 사용자학습부(250)에서 학습된 사용자맞춤형 음향모델과 동일 또는 유사한 신호를 센싱한 경우, 혼동음향학습부(260)를 통해 센싱한 신호가 혼동음향인지를 판단한 후, 혼동음향이 아닌 것으로 판단되면, 알림부(270)에서는 사용자가 검출하고자 하는 신호가 검출되었음을 사용자에게 알릴 수 있다.

본 발명의 바람직한 일 실시예에서, 알림부(270)는 사용자가 검출하고자 하는 음향을 등록하는 초기에는 사용자가 검출하고자 하는 음향의 속성, 녹음파일등을 입력한 후 사용자맞춤형음향센싱장치(200) 또는 서버에서 사용자가 검출하고자 하는 음향에 대한 학습 과정이 완료되었음을 알릴 수 있다.

이 과정이 모두 종료된 이후, 알림부(270)는 사용자가 검출하고자 하는 음향과 동일한 특성을 가진 음향 신호가 검출되는 경우 사용자에게 이를 알릴 수 있다.

알림부(270)에서 알림메시지를 제공하는 방식은 도 3에 도시된 실시예들과 같이 음향효과(도 3, 330), 알림 메시지 팝업(도 3, 332), 관제센터통지(도 3, 333), 그 외에도 진동 등의 다양한 형태를 이용할 수 있다. 알림메시지를 전송하는 알림 규칙 등은 다양하게 변형이 가능함을 유의하여야 한다.

바람직한 일 실시예로서, 사용자가 검출하고자 하는 음향이 개 짖는 소리인 경우 알람부(270)는 센싱된 개 짖는 소리를 알림메시지로 설정할 수 있다.

또 다른 일 실시예로서, 사용자가 검출하고자 하는 음향이 아기 우는 소리인 경우 알람부(270)는 센싱된 아기 울음 소리를 알림메시지로 설정할 수 있다. 즉, 사용자가 검출하고자 하는 음향을 알림메시지로 설정할 수 있다.

알림부(270)는 사용자에게 제공한 알림에 대해 피드백을 수신하도록 구현될 수 있다. 사용자가 검출하고자 하는 음향이 검출되었음을 알렸으나, 잘못된 알림인 경우 알림부(270)는 사용자로부터 수신한 피드백(S270)을 사용자맞춤형음향학습부(250) 및 혼동음향학습부(260)로 제공할 수 있다.

알림부(270)는 또한 사용자에게 알림히스토리를 제공할 수 있다.

알림부(270)는 또한 알림히스토리에 사용자의 피드백 결과를 함께 제공할 수 있다. 일반적으로는 사용자가 제공하는 녹음파일이 적으므로 초기에는 사용자의 피드백이 검출하고자 하는 음향이 아니다는 내용이 많을 수 있다. 그러나, 센싱된 음향신호 및 센싱된 음향신호에 대한 사용자의 피드백이 누적될수록 사용자의 피드백이 개선될 수 있다. 그리고, 일정횟수 이상의 피드백이 누적되는 경우 사용자가 검출하고자 하는 음향신호의 검출 정확도가 매우 개선될 수 있다.

초반에는 알림히스토리에 반영된 사용자의 피드백이 '오류'를 포함한 횟수가 높을 수 있으나, 사용자의 피드백과 센싱된 음향신호의 데이터가 누적될수록 알림히스토리에 반영된 사용자의 피드백이 '오류'를 포함한 횟수가 현저히 낮아질 수 있다. 또한, 새로운 혼동음향이 출현한 경우에도 사용자로부터 수신하는 피드백을 통해 혼동음향에 대해 학습이 가능하다.

도 5를 참고하면, 도 5는 특정 일자에 사용자가 검출하고자 하는 1살 여자 아이의 울음 소리가 센싱되어 사용자에게 알림메시지를 전송한 히스토리 및 그에 대한 사용자로부터 수신한 피드백의 히스토리를 표시한 일 예이다. 4시에서 5시 사이의 알림메시지(S510), 그리고 12시 40분 경에서 13시 사이의 알림메시지(S520)는 사용자가 검출하고자 하는 1살 여자 아이의 울음 소리가 아닌 것을 알 수 있다.

사용자맞춤형음향센싱장치의 사용자맞춤형음향 학습부 및 혼동음향학습부는 사용자의 피드백(S510, S520)을 추가로 반영하여 학습을 수행할 수 있다. 일 예로서, 혼동음향학습부는 4시에서 5시 사이의 알림메시지(S510)는 고양이의 울음소리로 학습할 수 있고, 또한 12시 40분 경에서 13시 사이의 알림메시지(S520)는 옆집 여자 아이의 울음소리로 학습하여 업데이트를 수행할 수 있다.

본 발명의 바람직한 일 실시예에서는 알림히스토리에 사용자의 피드백 결과를 함께 제공함으로써, 새로운 혼동음향이 출현한 시기 등에 대한 검출이 가능할 수 있다.

도 4 는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(200)에서 이용하는 데이터베이스의 내부 구조의 일 예를 도시한다. 데이터베이스는 사용자맞춤형음향센싱장치(200) 내에 구비되거나 또는 사용자맞춤형음향센싱장치(200)와 유무선 통신이 가능한 형태의 기기일 수 있다.

데이터베이스는 다양한 종류와 속성의 음향 데이터를 기저장하고 있으며, 사용자가 제공한 녹음파일의 유효구간을 분석하여 계층 구조 형태 또는 나열형 구조 형태로 추가로 저장할 수 있다.

도 6 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치의 내부 간략 구성도를 도시한다. 도 6에 개시된 구성요소 중 도 2에 개시된 구성요소와 동일하거나 유사한 구성요소는 도 2의 관련 설명을 참고한다.

사용자맞춤형음향센싱장치(600)는 제어부(610), 화면출력부(612), 키입력부(614), 음향출력부(616), 음향센싱부(618), 통신부(620), 녹음파일입력인터페이스(622), 음향속성입력인터페이스(624), 사용자맞춤형음향 업데이트부(626), 알림부(628), 저장부(630)를 포함한다. 알림부(628)는 피드백수신부(629)를 더 포함할 수 있다. 저장부(630)는 녹음파일수신부(632), 매칭음향선택부(634), 사용자맞춤형음향 학습부(636), 혼동음향 학습부(638) 및 알림히스토리DB(239)를 포함한다.

본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치(600)의 저장부(630)는 별도의 외부 기기, 유무선 통신이 가능한 서버의 형태로도 구현이 가능하다.

음향센싱부(618)는 마이크, 음향 센서 등을 통해 외부 음향을 센싱하고, 사용자가 검출하고자 등록한 음향과 동일하거나 동일한 객체에서 발생한 것으로 판단되는 음향을 검출한다.

녹음파일입력인터페이스(622)는 사용자가 검출하고자 하는 음향을 녹음하여, 하나 이상의 녹음 파일을 저장부(230)에 저장하는 인터페이스를 제공한다. 음향속성입력인터페이스(624)는 사용자가 검출하고자 등록한 음향의 종류, 속성등을 입력하는 인터페이스를 제공한다.

사용자맞춤형음향 업데이트부(626)는 사용자맞춤형음향 학습부(636) 또는 혼동음향 학습부(638)에서 제공하는 기계학습이 수행된 사용자맞춤형음향 또는 사용자맞춤형음향과 혼동이 발생할 수 있는 혼동음향을 분리하는 기준 등을 수신하여, 사용자맞춤형음향을 업데이트할 수 있다. 또한, 음향센싱부(618)는 사용자맞춤형음향 업데이트부(626)에 업데이트된 사용자맞춤형음향을 기초로 대응하는 음향을 셍싱한다.

피드백수신부(629)는 알림부(628)에서 사용자에게 사용자맞춤형음향이 센싱되었음을 알린 경우, 사용자의 피드백을 수신하여, 알림히스토리데이터베이스(639)에 추가로 반영할 수 있다.

피드백수신부(629)는 또한 수신한 사용자 피드백을 사용자맞춤형음향학습부(636) 및 혼동음향학습부(638)에 전송한다. 사용자맞춤형음향학습부(636) 및 혼동음향학습부(638)에서는 수신한 사용자 피드백을 추가로 기계학습하여 사용자맞춤형음향을 업데이트하여 사용자맞춤형음향업데이트부(626)에 전송할 수 있다. 도 5를 참고하면, 사용자가 자신이 검출하고자 하는 음향이 아닌 음향을 수신했다는 피드백을 제공한 경우(S510, S520), 사용자맞춤형음향학습부(636) 및 혼동음향학습부(638)는 해당 음향을 추가로 기계학습을 수행할 수 있다.

도 10을 참고하면, 알림부는 사용자가 검출하고자 하는 음향으로 추가한 3살, 3.5kg, 푸들의 개 짖는 소리가 센싱되는 경우 알림메시지(1010)를 제공할 수 있다. 알림메시지(1010)는 다양한 형태로 구현이 가능하면, 센싱된 푸들의 개 짖는 소리에서 유효한 구간을 알림메시지로 이용할 수도 있다.

사용자는 수신한 센싱된 푸들의 개 짖는 소리가 자신이 검출하고자 하는 음향인 경우 'YES'(1020)라는 피드백 메시지를, 자신이 검출하고자 하는 음향이 아닌 경우 'NO'(1030)라는 피드백 메시지를 전송할 수 있다. 또한, 사용자는 센싱된 푸들의 개 짖는 소리의 알림메시지를 중단시키는 '중단'(1011)버튼을 이용하여 알림메시지의 알람을 멈출 수 있다.

도 7 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치와 서버간에 사용자맞춤형 음향센싱을 수행하는 과정의 일 예를 도시한다.

도 7 내지 8에서 단말기(720, 820)는 도 6의 사용자맞춤형음향센싱장치의 내부 구성 중 음향센싱부를 제외한 나머지 구성의 일부 또는 전부로 구성되는 것으로 한다. 또한, 도 7 내지 8에서 음향센싱부(710, 810)는 사용자맞춤형음향센싱장치에 내장된 형태이거나 또는 사용자맞춤형음향센싱장치와 별도로 유무선 통신 내지 연동하여 구동이 가능한 오디오, CCTV, 네트워크 카메라, 아동 학습용 로봇, 음향 센서, 스마트 TV 등이 될 수 있다.

단말기(720)에서는 자신이 검출하고자 하는 음향신호를 녹음할 수 있다(S720). 단말기(720)는 검출하고자 하는 음향 신호의 속성 내지 종류에 대한 정보 또는 녹음샘플을 입력한 뒤(S721), 서버에 접속을 요청한다(S722).

서버(730)에서는 단말기(720)의 접속 요청이 권한이 있는지를 사용자 ID, 패스워드, 단말기(720)의 ID 정보 등을 판단하여(S730) 접근을 승인하거나 거절한다(S731). 단말기(720)는 접근이 승인되면, 사용자로부터 입력받은 음향신호 속성, 음향신호 종류 정보 및/또는 녹음 샘플을 서버(730)에 업로드할 수 있다(S723). 서버(730)에서는 음향신호 속성 내지 종류 정보에 기초하여 매칭음향을 선택(S732)한다. 서버(730)는 사용자가 업로드한 하나 이상의 녹음 샘플이 있는 경우 매칭음향을 초기음향으로 설정한 후, 녹음 샘플에 대한 기계학습을 수행한다(S733). 매칭음향에 대한 기계학습 및 혼동음향에 대한 기계학습을 통해 사용자맞춤형음향에 대한 학습이 완료되면(S733), 사용자맞춤형음향센싱장치(700)로 전송한다(S734).

단말기(720)에서는 사용자맞춤형음향을 수신하면, 음향센싱부(710)에 접속을 요청(S724)하고, 음향센싱부(710)는 단말기(720)의 ID 정보를 이용하여 접근 가능여부를 판정한 후(S710), 접근에 대한 승인 내지 거절(S711)을 수행한다.

접근이 승인된 경우 단말기(720)는 사용자가 검출하고자 하는 사용자맞춤형음향을 음향센싱부(710)에 전송하고(S725), 음향센싱부(710)에서는 사용자맞춤형음향을 도 9의 일 실시예와 같은 사용자맞춤형음향 목록에 추가하고, 해당 매칭음향을 감지하기 시작한다(S912). 그리고, 사용자맞춤형음향 목록 업데이트가 성공하였으며, 해당 사용자맞춤형음향에 대한 센싱을 시작하였다는 ACK 메시지를 단말기(720)에 전송한다(S713). 단말기(720)에서는 ACK메시지를 기초로 음향센싱 장치의 상태를 확인한다(S726). 이 후, 음향센싱부(710)는 매칭음향과 동일 또는 유사한 음향이 검출되면 단말기(720)로 알림메시지를 전송할 수 있다.

도 8 은 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향센싱장치와 음향센싱부에서 인증을 수행하는 과정의 일 예를 도시한다.

사용자 맞춤음향 센싱장치(820)는 인증 서버(830)로 권한 인증을 요청하고(S820), 음향센싱부(810)에 공개키를 설정하면(S810), 음향센싱부(810)에서 공개키를 등록한다. 사용자 맞춤음향 센싱장치(820)에서 암호화된 UUID로 기기등록을 요청하면(S822), 음향센싱부(810)는 사용자를 등록한다(S812). 그 후, 사용자 맞춤음향 센싱장치(820)는 음향센싱부(810)에 암호화된 UUID로 연결을 요청하고(S823), 음향센싱부(810)에서는 등록된 UUID인지를 확인하여(S813) 사용자 맞춤음향 센싱장치에 연결 승인 여부를 통보한다(S824).

도 9 는 본 발명의 바람직한 일 실시예로서, 사용자맞춤형음향 목록 리스트를 도시한다. 사용자는 검출하고자 하는 음향이 있는 경우, 도 6의 일 실시예와 같음 음향의 종류 및 속성 등을 입력하는 인터페이스를 통해 입력한 후, 도 9의 일 실시예와 같은 형태의 사용자맞춤형음향 목록 리스트(910)를 생성할 수 있다.

도 9에는 "1살, 이름: 새롬이, 여자 아기의 소리", "3살, 3.5kg, 푸들, 개 짖는 소리", 그리고 "현관문, 개폐소리"라는 사용자맞춤형음향을 추가한 일 예를 도시한다.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims

사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 음향속성입력인터페이스;
사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 녹음파일입력인터페이스;
상기 적어도 하나 이상의 녹음파일에서 음향의 유효구간을 분리하고, 기계학습을 통해 상기 분리한 유효구간 내에서 음향의 고유특성을 검출하는 유효구간검출부;
상기 녹음파일에서 분리한 음향의 유효구간, 상기 음향의 고유특성, 상기 입력받은 음향의 종류 및 속성 중 적어도 하나를 기초로 상기 사용자가 검출하고자 하는 음향과 가장 매칭되는 매칭음향을 선택하는 매칭음향선택부;
상기 매칭음향과 혼동이 발생할 수 있는 혼동음향들에 대해 기계학습을 수행하고, 혼동음향들에 대한 기준을 선정하는 혼동음향학습부;및
상기 선택된 매칭음향 또는 상기 적어도 하나 이상의 녹음파일을 기초로 기계학습을 수행하며, 상기 선택된 매칭음향을 초기모델로 선정한 후, 사용자가 검출하고자 하는 음향의 특징벡터들을 사용하여 기계학습을 수행하여 상기 사용자가 검출하고자 하는 사용자맞춤형음향을 학습하는 사용자맞춤형음향학습부;를 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 1 항에 있어서,
상기 학습된 사용자맞춤형음향이 센싱되면 사용자에게 알림메시지를 전송하는 알림부;를 더 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 2 항에 있어서, 상기 알림부는
상기 사용자에게 전송된 알림메시지에 대한 사용자의 피드백을 수신하는 피드백수신부;를 더 포함하고, 상기 사용자의 피드백은 센싱된 사용자맞춤형음향이 사용자가 검출하고자 하는 음향이 맞는지 또는 틀리는지에 관한 내용을 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 3 항에 있어서, 상기 피드백수신부는
상기 사용자의 피드백을 상기 혼동음향학습부 및 상기 사용자맞춤형음향학습부에 전송하고, 이 경우 상기 혼동음향학습부 및 상기 사용자맞춤형음향학습부는 수신한 사용자의 피드백을 추가로 기계학습하여, 상기 사용자맞춤형음향을 업데이트하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 2 항에 있어서, 상기 알림메시지는
상기 센싱된 사용자맞춤형음향의 유효한 음향신호 구간인 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 3 항에 있어서, 상기 알림부는
사용자에게 제공한 알림메시지에 대한 히스토리를 더 제공하며, 상기 알림메시지에 대한 히스토리는 상기 사용자에게 제공한 알림메시지 각각에 대한 상기 사용자의 피드백 정보를 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 1 항에 있어서,
사용자가 검출하고자 하는 음향들을 표시하는 사용자맞춤형음향 목록 리스트를 제공하는 디스플레이부;를 더 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
제 1 항에 있어서, 상기 음향속성입력인터페이스는
계층구조 인터페이스 또는 나열형구조 인터페이스를 지원하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 음향속성입력인터페이스;
사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 녹음파일입력인터페이스;및
상기 음향속성입력인터페이스 또는 상기 녹음파일입력인터페이스로부터 입력받은 사용자가 검출하고자 하는 음향의 종류, 속성 및 녹음파일 중 적어도 하나 이상을 기초로 상기 사용자가 검출하고자 하는 음향과 매칭되는 음향이 센싱되는 경우 사용자에게 알림메시지를 전송하는 알림부;를 포함하는 것을 특징으로 하는 사용자맞춤형음향센싱장치.
사용자맞춤형음향센싱장치에서 사용자맞춤형음향을 센싱하는 방법으로서,
음향속성입력인터페이스에서 사용자가 검출하고자 하는 음향의 종류 또는 속성을 입력받는 단계;
녹음파일입력인터페이스에서 사용자가 검출하고자 하는 음향의 일부를 녹음한 녹음파일을 적어도 하나 이상 입력받는 단계;
유효구간검출부에서 상기 적어도 하나 이상의 녹음파일에서 음향의 유효구간을 분리하고, 기계학습을 통해 상기 분리한 유효구간 내에서 음향의 고유특성을 검출하는 단계;
매칭음향선택부에서 상기 녹음파일에서 분리한 음향의 유효구간, 상기 음향의 고유특성, 상기 입력받은 음향의 종류 및 속성 중 적어도 하나를 기초로 상기 사용자가 검출하고자 하는 음향과 가장 매칭되는 매칭음향을 선택하는 단계;
혼동음향학습부에서 상기 매칭음향과 혼동이 발생할 수 있는 혼동음향들에 대해 기계학습을 수행하고, 혼동음향들에 대한 기준을 선정하는 단계;및
사용자맞춤형음향학습부에서 상기 선택된 매칭음향 또는 상기 적어도 하나 이상의 녹음파일을 기초로 기계학습을 수행하며, 상기 선택된 매칭음향을 초기모델로 선정한 후, 사용자가 검출하고자 하는 음향의 특징벡터들을 사용하여 기계학습을 수행하여 상기 사용자가 검출하고자 하는 사용자맞춤형음향을 학습하는 단계;를 포함하는 것을 특징으로 하는 방법.