KR102338041B1 - 음성 인식 장치 및 방법 - Google Patents

음성 인식 장치 및 방법 Download PDF

Info

Publication number
KR102338041B1
KR102338041B1 KR1020140130064A KR20140130064A KR102338041B1 KR 102338041 B1 KR102338041 B1 KR 102338041B1 KR 1020140130064 A KR1020140130064 A KR 1020140130064A KR 20140130064 A KR20140130064 A KR 20140130064A KR 102338041 B1 KR102338041 B1 KR 102338041B1
Authority
KR
South Korea
Prior art keywords
noise
voice
user
pattern
voice recognition
Prior art date
Application number
KR1020140130064A
Other languages
English (en)
Other versions
KR20160037484A (ko
Inventor
황영식
Original Assignee
현대모비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대모비스 주식회사 filed Critical 현대모비스 주식회사
Priority to KR1020140130064A priority Critical patent/KR102338041B1/ko
Priority to CN201510616076.1A priority patent/CN105469804B/zh
Publication of KR20160037484A publication Critical patent/KR20160037484A/ko
Application granted granted Critical
Publication of KR102338041B1 publication Critical patent/KR102338041B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성 인식 장치 및 방법에 관한 것으로, 상기 장치는, 사용자의 모바일 단말기와 통신하는 통신부, 음성인식 버튼이 입력된 후 기 지정된 시간동안 노이즈를 취득한 후 사용자의 음성을 취득하고, 상기 노이즈를 상쇄시킬 수 있는 반 노이즈 패턴 신호를 생성하여 상기 음성에서 패턴성 노이즈를 제거하는 노이즈 필터부, 및 상기 통신부와 노이즈 필터부를 제어하여 사용자별로 패턴성 노이즈가 제거된 음성을 취득하여 음성인식엔진에 전달함으로써 상기 음성인식엔진에서 사용자별로 음성정보의 학습과 음성인식을 수행하게 하는 제어부를 포함한다.

Description

음성 인식 장치 및 방법{VOICE RECOGNITION APPARATUS AND METHOD}
본 발명은 음성 인식 장치 및 방법에 관한 것으로, 보다 상세하게는 음성 인식을 위한 음성 취득 시 사용자를 구별하여 사용자별 음성 정보의 누적과 학습을 수행하고, 음성 취득 시 먼저 노이즈 발생원의 동작을 정지시킨 후 주변의 패턴성 노이즈를 검출하여 제거함으로써 음성의 취득률과 인식률을 향상시킬 수 있도록 하는 음성 인식 장치 및 방법에 관한 것이다.
최근, 차량 운전 중 멀티미디어 기기(예 : AVN 기기)에 대한 사용이 제한되면서, 차량에서의 음성인식기능에 대한 중요성이 부각되고 있다. 즉, 음성인식기술을 차량에 적용하여 음성인식을 통해 차량에서 구현 가능한 일부 기능들이 수행되도록 하고 있다.
하지만, 차량이 주행하는 동안에 음성 인식을 수행하는 경우 오디오 출력 및 음성 안내, 예를 들어, 내비게이션의 경로 안내 등이 함께 수행됨에 따라 음성 인식률이 저하될 수 있다. 또한, 음성 인식 시 공조장치에 의해 발생하는 바람에 의해 발생하는 소음이 사용자의 음성과 함께 음성인식장치로 입력됨에 따라 음성 인식률이 저하될 수 있다.
따라서 차량 주행 중의 음성 인식률을 높이기 위해서는 오디오장치의 볼륨 또는 내비게이션의 볼륨을 낮추거나 음을 소거해야 한다. 하지만, 이 경우 운전 중 사용자가 볼륨을 줄이기 위해 운전자의 주의가 분산되는 문제가 발생한다. 따라서 운전 중 사용자의 안전과 편의를 도모하면서 차량에서의 음성 인식률을 향상시킬 수 있는 장치와 방법이 요구되고 있다.
본 발명의 배경기술은 대한민국 등록특허 10-1428245호(2014.08.01.등록, 음성 인식 장치 및 방법)에 개시되어 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, 음성 인식을 위한 음성 취득 시 사용자를 구별하여 사용자별 음성 정보의 누적과 학습을 수행하고, 음성 취득 시 먼저 노이즈 발생원의 동작을 정지시킨 후 주변의 패턴성 노이즈를 검출하여 제거함으로써 음성의 취득률과 인식률을 향상시킬 수 있도록 하는 음성 인식 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명의 일 측면에 따른 음성 인식 장치는, 사용자의 모바일 단말기와 통신하는 통신부; 음성인식 버튼이 입력된 후 기 지정된 시간동안 노이즈를 취득한 후 사용자의 음성을 취득하고, 상기 노이즈를 상쇄시킬 수 있는 반 노이즈 패턴 신호를 생성하여 상기 음성에서 패턴성 노이즈를 제거하는 노이즈 필터부; 및 상기 통신부와 노이즈 필터부를 제어하여 사용자별로 패턴성 노이즈가 제거된 음성을 취득하여 음성인식엔진에 전달함으로써 상기 음성인식엔진에서 사용자별로 음성정보의 학습과 음성인식을 수행하게 하는 제어부;를 포함하는 것을 특징으로 한다.
본 발명에 있어서, 상기 음성 인식 장치는, 사용자와 그 사용자에 대응하는 모바일 단말기의 정보가 고유 ID로서 등록되어 있는 사용자 정보 DB;를 더 포함하고, 상기 제어부는 상기 통신부를 통해 통신 연결된 모바일 단말기 정보를 이용하여 그에 대응하는 사용자를 검출하고, 그에 따라 상기 음성인식엔진을 제어하여 사용자별 음성정보의 학습과 음성인식을 수행하게 하는 것을 특징으로 한다.
본 발명에 있어서, 상기 사용자 정보는 사용자별로 우선순위 정보가 포함되어 등록되며, 두 명 이상의 사용자가 검출된 경우, 상기 제어부는 우선순위가 높은 모바일 단말기의 사용자를 운전자로 판단하여 통신을 연결하는 것을 특징으로 한다.
본 발명에 있어서, 상기 제어부는, 음성인식 버튼이 입력된 후, 음성 취득을 위하여 차량내의 멀티미디어 기기의 동작을 기 지정된 시간동안 오프 시키거나 사운드 볼륨을 최소화시키는 것을 특징으로 한다.
본 발명에 있어서, 상기 노이즈 필터부는, 음성인식 버튼이 입력된 후 기 설정된 시간동안 차량 내에서 발생되는 노이즈를 취득하는 노이즈 취득부; 상기 취득한 노이즈가 일정 패턴을 가지는 패턴성 노이즈인지를 판별하는 노이즈 패턴 판별부; 상기 취득한 노이즈가 패턴성 노이즈인 경우, 상기 노이즈를 상쇄할 수 있는 반대 위상을 갖는 반 노이즈 패턴 신호를 생성하는 반 노이즈 패턴 생성부; 상기 노이즈를 취득한 후 사용자의 음성을 취득하는 음성명령 취득부; 및 상기 반 노이즈 패턴 신호를 상기 음성명령 취득부에서 취득한 음성에 합성하여 상기 패턴성 노이즈를 캔슬링 하는 패턴성 노이즈 제거부;를 포함하는 것을 특징으로 한다.
본 발명에 있어서, 상기 노이즈 취득을 위해 기 설정된 시간이 경과된 후, 제어부는, 음성인식 시작 신호 또는 음성 입력 신호를 차량 내의 멀티미디어 기기의 디스플레이 수단이나 사운드 수단을 통해 출력하는 것을 특징으로 한다.
본 발명의 다른 측면에 따른 음성 인식 방법은, 통신부가 사용자의 모바일 단말기와 통신하는 단계; 음성인식 버튼이 입력된 후, 노이즈 필터부가 기 지정된 시간동안 노이즈를 취득한 후 사용자의 음성을 취득하고, 상기 노이즈를 상쇄시킬 수 있는 반 노이즈 패턴 신호를 생성하여 상기 음성에서 패턴성 노이즈를 제거하는 단계; 및 제어부가 상기 통신부와 노이즈 필터부를 제어하여 사용자별로 패턴성 노이즈가 제거된 음성을 취득한 후 음성인식엔진에 전달하여 상기 음성인식엔진에서 사용자별로 음성정보의 학습과 음성인식을 수행하게 하는 단계;를 포함하는 것을 특징으로 한다.
본 발명에 있어서, 상기 사용자별로 패턴성 노이즈가 제거된 음성을 취득하는 단계에서, 사용자 정보 DB에 사용자와 그 사용자에 대응하는 모바일 단말기의 정보를 고유 ID로서 미리 등록해 두고, 상기 제어부가 상기 통신부를 통해 통신 연결된 모바일 단말기 정보를 상기 사용자 정보 DB를 참조하여 그 단말기 정보에 대응하는 사용자를 검출하고, 그에 따라 상기 음성인식엔진을 제어하여 사용자별 음성정보의 학습과 음성인식을 수행하게 하는 것을 특징으로 한다.
본 발명에 있어서, 상기 사용자 정보는 사용자별로 우선순위 정보가 포함되어 등록되며, 두 명 이상의 사용자가 검출된 경우, 상기 제어부는 우선순위가 높은 모바일 단말기의 사용자를 운전자로 판단하여 통신을 연결하는 것을 특징으로 한다.
본 발명은, 상기 음성인식 버튼이 입력된 후, 상기 제어부는, 음성 취득을 위하여 차량내의 멀티미디어 기기의 동작을 기 지정된 시간동안 오프 시키거나 사운드 볼륨을 최소화시키는 단계;를 더 포함하는 것을 특징으로 한다.
본 발명에 있어서, 상기 노이즈 필터부가 상기 음성에서 패턴성 노이즈를 제거하는 단계는, 상기 음성인식 버튼이 입력된 후, 기 설정된 시간동안 차량 내에서 발생되는 노이즈를 노이즈 취득부를 통해 취득하는 단계; 상기 취득한 노이즈가 일정 패턴을 가지는 패턴성 노이즈인지를 노이즈 패턴 판별부를 통해 판별하는 단계; 상기 노이즈가 패턴성 노이즈인 경우, 상기 노이즈를 상쇄할 수 있는 반대 위상을 갖는 반 노이즈 패턴 신호를 반 노이즈 패턴 생성부를 통해 생성하는 단계; 상기 노이즈를 취득한 후 음성명령 취득부를 통해 사용자의 음성을 취득하는 단계; 및 패턴성 노이즈 제거부를 통해 상기 반 노이즈 패턴 신호를 상기 음성명령 취득부에서 취득한 음성에 합성하여 상기 패턴성 노이즈를 캔슬링 하는 단계;를 포함하는 것을 특징으로 한다.
본 발명에 있어서, 상기 음성명령 취득부를 통해 사용자의 음성을 취득하는 단계 이전에, 상기 제어부는, 상기 노이즈 취득을 위해 기 설정된 시간이 경과된 후, 음성인식 시작 신호 또는 음성 입력 신호를 차량 내의 멀티미디어 기기의 디스플레이 수단이나 사운드 수단을 통해 출력하는 단계;를 더 포함하는 것을 특징으로 한다.
본 발명은 음성 인식을 위한 음성 취득 시 사용자를 구별하여 사용자별 음성 정보의 누적과 학습을 수행하고, 음성 취득 시 먼저 노이즈 발생원의 동작을 정지시킨 후 주변의 패턴성 노이즈를 검출하여 제거함으로써 운전 중 사용자의 안전과 편의를 도모하면서 음성의 취득률과 인식률을 향상시킬 수 있도록 한다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 장치의 개략적인 구성을 보인 예시도.
도 2는 상기 도 1에 있어서, 노이즈 필터부의 보다 구체적인 구성을 보인 예시도.
도 3은 상기 도 1에 있어서, 노이즈와 음성을 별도로 취득하여 상기 음성에 포함된 노이즈를 제거하는 과정을 설명하기 위하여 보인 예시도.
도 4는 상기 도 1에서 있어서, 사용자를 검출하여 사용자별로 음성의 취득과 학습을 수행하는 방법을 설명하기 위한 흐름도.
도 5는 상기 도 1에서 있어서, 노이즈 필터부를 제어하여 음성 신호에 포함된 노이즈를 제거하는 방법을 설명하기 위한 흐름도.
이하, 첨부된 도면을 참조하여 본 발명에 따른 음성 인식 장치 및 방법의 일 실시예를 설명한다.
이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 장치의 개략적인 구성을 보인 예시도이다.
도 1에 도시된 바와 같이, 본 실시예에 따른 음성 인식 장치는, 통신부(110), 노이즈 필터부(120), 제어부(130), 사용자 정보 DB(140), 및 음성인식엔진(150)을 포함한다.
상기 통신부(110)는 미리 등록된 사용자의 모바일 단말기와 통신한다.
예컨대 상기 모바일 단말기는 휴대폰, 스마트폰, 스마트패드, 및 태블릿PC 중 적어도 하나 이상을 포함한다.
상기 통신부(110)는 유/무선 통신이 모두 가능하며, 통신 연결의 편의를 위하여 근거리 무선통신(예 : 와이파이, 블루투스, NFC 등) 모듈을 포함할 수 있다.
상기 노이즈 필터부(120)는 음성인식 버튼이 입력된 후 기 지정된 시간동안(예 : 2초) 노이즈 성분을 취득한 이후 음성(즉, 음성명령)을 취득한 후, 상기 노이즈 성분이 패턴성 노이즈인 경우, 상기 취득한 음성에서 패턴성 노이즈 성분을 제거한다. 이에 따라 상기 노이즈 필터부(120)는 음성(즉, 음성명령)에서 패턴성 노이즈 성분이 제거된 음성(즉, 음성명령)을 출력한다(도 2 참조).
도 2는 상기 도 1에 있어서, 노이즈 필터부(120)의 보다 구체적인 구성을 보인 예시도로서, 이에 도시된 바와 같이 노이즈 취득부(121), 노이즈 패턴 판별부(122), 반 노이즈 패턴 생성부(123), 음성명령 취득부(124), 및 패턴성 노이즈 제거부(125)를 포함한다.
상기 노이즈 취득부(121)는 음성인식 버튼이 입력된 후 기 설정된 시간동안(예 : 2초) 차량 내에서 발생되는 노이즈를 사운드 입력수단(미도시)(예 : 마이크)을 이용해 취득한다. 이때 상기 노이즈에는 패턴성 노이즈(반복되는 노이즈)와 비패턴성 노이즈가 있다.
상기 노이즈 패턴 판별부(122)는 상기 취득된 노이즈가 일정 패턴을 가지는 패턴성 노이즈인지를 판별한다.
상기 반 노이즈 패턴 생성부(123)는 상기 취득된 노이즈가 패턴성 노이즈인 경우, 상기 취득된 노이즈를 상쇄할 수 있는 반대 위상을 갖는 노이즈(즉, 반 노이즈) 패턴 신호를 생성한다.
상기 음성명령 취득부(124)는 상기 노이즈 취득을 위해 설정된 시간(예 : 2초)이 경과된 후 입력되는 사용자의 음성(즉, 음성명령) 신호를 취득한다. 이때 상기 사운드 입력수단(미도시)(예 : 마이크)을 통해 입력되는 사용자의 음성 신호에는 음성(즉, 음성명령) 신호뿐만 아니라, 상기 노이즈 취득부(121)에서 취득했던 형상의 노이즈가 포함되어 있다(도 3 참조).
이때 상기 사용자의 음성을 입력받기 위하여, 상기 노이즈 취득을 위해 설정된 시간(예 : 2초)이 경과된 후, 상기 제어부(130)는 음성인식 시작 신호(또는 음성 입력 신호)를 멀티미디어 기기의 디스플레이 수단(미도시)이나 사운드 수단(미도시)를 통해 출력할 수 있다.
상기 패턴성 노이즈 제거부(125)는 상기 반 노이즈 패턴 생성부(123)에서 생성한 반 노이즈 패턴 신호를 상기 음성명령 취득부(124)에서 취득한 음성 신호에 합성한다(도 3 참조). 이에 따라 상기 패턴성 노이즈 신호와 상기 반 노이즈 패턴성 노이즈 신호가 서로 상쇄되어 상기 선 취득한 패턴성 노이즈 신호가 캔슬링 된다. 즉, 상기 패턴성 노이즈 신호가 제거된 음성 신호만 출력된다.
이에 따라 상기 음성인식엔진(150)은 노이즈가 제거된 음성을 인식하므로 음성 인식률이 높아진다.
다시 도 1에서, 상기 사용자 정보 DB(140)에는 사용자(운전자)와 해당 사용자에 대응하는 모바일 단말기의 정보(즉, 고유 ID)가 등록된다. 상기 사용자는 우선순위 정보를 포함하여 등록될 수 있다.
상기 제어부(130)는 상기 통신부(110)를 통해 통신 연결된 모바일 단말기 정보(즉, 고유 ID)를 이용하여 그에 대응하는 사용자(운전자)를 검출한다. 만약 두 명 이상의 사용자가 검출된 경우, 상기 제어부(130)는 우선순위가 높은 모바일 단말기의 사용자를 운전자로 판단하여 통신 연결한다. 또한 상기 사용자(운전자)는 매뉴얼 방식으로 사용자가 직접 선택해 줄 수도 있다.
상기 제어부(130)는 음성 인식률을 향상시키기 위하여 음성 취득 시 차량내의 멀티미디어 기기(예 : AVN 기기)의 동작을 제어할 수 있다. 가령, 상기 제어부(130)는 기 지정된 시간동안(즉, 음성인식 버튼이 입력된 후 일정시간) 상기 멀티미디어 기기를 오프(Turn Off)시키거나 사운드 볼륨을 최소화시킬 수 있다.
상기 제어부(130)는 상기 노이즈 필터부(120)를 통해 패턴성 노이즈가 제거된 음성을 상기 음성인식엔진(150)에 출력하여 음성인식 및 사용자별 음성정보를 누적 및 학습하도록 한다.
상기 음성인식엔진(150)은 화자 독립형 및 화자 종속형의 장점을 조합하여 음성을 인식할 수 있다. 이에 따라 사용자의 편의성 및 음성 인식률을 더욱 향상시킬 수 있다.
예컨대 통상적으로 자동차의 운전자는 가족으로 한정되어 있다. 따라서 운전자가 바뀌는 경우는 거의 없고, 바뀌더라도 그 사용자(운전자)의 수는 매우 한정적이다. 따라서 화자 종속형으로 음성인식을 수행하되, 사용자가 바뀌는 경우에는 해당 사용자에 맞춰 음성인식을 수행하게 한다.
상기 음성인식엔진(150)은 음성인식뿐만 아니라, 사용자별 음성 정보를 지속적으로 누적하고 학습한다.
상기 사용자별 음성 정보의 누적과 학습을 통해 디폴트로 튜닝된 음성 인식률에 비해 음성 인식률을 더욱 향상시킬 수 있다. 즉, 사용자별로 누적되는 음성 정보가 많아질수록 사용자의 음성 패턴 정보가 더욱 정확하게 되어 음성 인식율을 높일 수 있게 된다.
도 4는 상기 도 1에서 있어서, 사용자를 검출하여 사용자별로 음성의 취득과 학습을 수행하는 방법을 설명하기 위한 흐름도이다.
이하 도 4를 참조하여, 상기 음성인식엔진(150)에서 사용자별로 음성인식 정보를 누적하고 학습하는 방법을 설명한다.
도 4에 도시된 바와 같이, 사용자의 모바일 단말기(예 : 휴대폰, 스마트폰, 스마트패드, 태블릿PC 등)와 본 실시예에 따른 음성 인식 장치가 연결되면(S101), 제어부(130)는 상기 사용자의 모바일 단말기 정보(즉, 고유 ID)를 취득한다(S102).
이때 상기 제어부(130)는 상기 취득한 모바일 단말기 정보(즉, 고유 ID)를 바탕으로 상기 고유 ID에 대응하는 사용자가 상기 사용자 정보 DB(140)에 기 등록되어 있는 사용자인지 아니면 신규 사용자인지 판단한다(S103).
상기 판단 결과에 따라, 상기 사용자가 기 등록되어 있는 사용자가 아니면(S103의 예), 즉, 신규 사용자이면, 상기 제어부(130)는 상기 사용자 정보 DB에 신규 사용자 ID를 생성한 후, 사용자별 음성 정보를 누적 및 갱신한다(S104).
상기 판단 결과에 따라, 상기 사용자가 상기 사용자 정보 DB(140)에 기 등록되어 있는 사용자이면(S103의 아니오), 즉, 기존 사용자이면, 상기 제어부(130)는 기존 사용자 정보에 음성 정보를 누적 및 갱신한다(S105).
상기와 같이 사용자를 구별하고 사용자별로 누적 및 갱신된 음성 정보를 상기 음성인식엔진(150)에 전달한다(S106). 이에 따라 상기 음성인식엔진(150)에서 상기 사용자별 음성 정보를 학습 및 음성인식을 수행하게 한다.
도 5는 상기 도 1에서 있어서, 노이즈 필터부를 제어하여 음성 신호에 포함된 노이즈를 제거하는 방법을 설명하기 위한 흐름도이다.
도 5에 도시된 바와 같이, 사용자가 음성(즉, 음성명령)을 입력하기 위해서 음성인식 동작 버튼(미도시)을 입력하면(S201), 상기 제어부(130)는 멀티미디어 기기(예 : AVN 기기)(미도시)의 사운드 음량을 최소화시킨 후 기 설정된 시간동안(예 : 2초) 차량 내부 사운드(즉, 사용자 음성이 포함되지 않은 노이즈 신호)를 취득한다(S202).
그리고 상기 제어부(130)는 상기 취득한 차량 내부 사운드가 일정한 패턴을 갖는 패턴성 노이즈인지 판단한다(S203).
상기 판단에 따라, 만약 상기 취득한 차량 내부 사운드가 패턴성 노이즈가 아니면(S203의 아니오), 상기 취득한 차량 내부 사운드를 폐기한다(S204).
그러나 상기 취득한 차량 내부 사운드가 패턴성 노이즈이면(S203의 예), 상기 패턴성 노이즈를 캔슬링 시킬 수 있는 반대 위상을 갖는 반 노이즈 패턴을 갖는 노이즈 신호를 생성한다(S205).
이후 상기 제어부(130)는 음성인식 시작을 알리는 신호(또는 음성명령의 입력을 지시하는 신호)(예 : 비프음 또는 화면표시)를 출력하고, 그에 따라 사용자가 음성(즉, 음성명령)을 입력하면, 상기 생성된 반 노이즈 패턴을 갖는 노이즈 신호를 합성하여 상기 사용자의 음성(즉, 음성명령)과 함께 입력된 패턴성 노이즈 신호를 제거한다(S206).
그리고 상기 제어부(130)는 상기 사용자의 음성에서 패턴성 노이즈가 제거된 음성(즉, 사용자의 음원)을 음성인식엔진(150)에 전달한다(S207).
상기와 같이 본 실시예는 사용자가 음성인식 버튼(미도시)을 입력하면, 상기 제어부(130)는 기 설정된 일정 시간동안 차량 내에서 검출되는 사운드(예 : 노면의 소음, 풍절음 등과 같이 반복되는 패턴성 노이즈)를 취득하고, 상기 패턴성 노이즈를 상쇄시킬 수 있는 반대 위상을 갖는 노이즈(즉, 반 노이즈 패턴을 갖는 노이즈 신호)를 생성한다. 아울러 음성명령의 입력을 지시하는 신호(예 : 비프음 또는 화면표시)를 출력하여 사용자가 음성(즉, 음성명령)을 입력할 수 있게 한다.
이후 사용자가 음성을 입력하면(즉, 음성명령을 발화하면), 상기 반 노이즈 패턴을 갖는 노이즈 신호를 합성함으로써 상기 음성에 포함된 노이즈를 상쇄시켜 제거한다. 즉, 상기 음성에서 패턴성 노이즈가 제거된 음성을 취득하여 상기 음성인식엔진(150)에 전달함으로써 음성인식과 학습을 수행할 수 있도록 한다.
이상으로 본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
110 : 통신부
120 : 노이즈 필터부
130 : 제어부
140 : 사용자 정보 DB
150 : 음성인식엔진

Claims (12)

  1. 사용자의 모바일 단말기와 통신하는 통신부;
    음성인식 버튼이 입력된 후 기 지정된 시간동안 노이즈를 취득한 후 사용자의 음성을 취득하고, 상기 노이즈를 상쇄시킬 수 있는 반 노이즈 패턴 신호를 생성하여 상기 음성에서 패턴성 노이즈를 제거하는 노이즈 필터부; 및
    상기 통신부와 노이즈 필터부를 제어하여 사용자별로 패턴성 노이즈가 제거된 음성을 취득하여 음성인식엔진에 전달함으로써 상기 음성인식엔진에서 사용자별로 음성정보의 학습과 음성인식을 수행하게 하는 제어부;를 포함하되,
    상기 노이즈 필터부는,
    음성인식 버튼이 입력된 후 기 설정된 시간동안 차량 내에서 발생되는 노이즈를 취득하는 노이즈 취득부;
    상기 취득한 노이즈가 일정 패턴을 가지는 패턴성 노이즈인지를 판별하는 노이즈 패턴 판별부;
    상기 취득한 노이즈가 패턴성 노이즈인 경우, 상기 노이즈를 상쇄할 수 있는 반대 위상을 갖는 반 노이즈 패턴 신호를 생성하는 반 노이즈 패턴 생성부;
    상기 노이즈를 취득한 후 사용자의 음성을 취득하는 음성명령 취득부; 및
    상기 반 노이즈 패턴 신호를 상기 음성명령 취득부에서 취득한 음성에 합성하여 상기 패턴성 노이즈를 캔슬링 하는 패턴성 노이즈 제거부;를 포함하는 것을 특징으로 하는 음성 인식 장치.
  2. 제 1항에 있어서, 상기 음성 인식 장치는,
    사용자와 그 사용자에 대응하는 모바일 단말기의 정보가 고유 ID로서 등록되어 있는 사용자 정보 DB;를 더 포함하고,
    상기 제어부는 상기 통신부를 통해 통신 연결된 모바일 단말기 정보를 이용하여 그에 대응하는 사용자를 검출하고, 그에 따라 상기 음성인식엔진을 제어하여 사용자별 음성정보의 학습과 음성인식을 수행하게 하는 것을 특징으로 하는 음성 인식 장치.
  3. 제 2항에 있어서,
    상기 사용자 정보는 사용자별로 우선순위 정보가 포함되어 등록되며,
    두 명 이상의 사용자가 검출된 경우, 상기 제어부는 우선순위가 높은 모바일 단말기의 사용자를 운전자로 판단하여 통신을 연결하는 것을 특징으로 하는 음성 인식 장치.
  4. 제 1항에 있어서, 상기 제어부는,
    음성인식 버튼이 입력된 후, 음성 취득을 위하여 차량내의 멀티미디어 기기의 동작을 기 지정된 시간동안 오프 시키거나 사운드 볼륨을 최소화시키는 것을 특징으로 하는 음성 인식 장치.
  5. 삭제
  6. 제 1항에 있어서, 상기 노이즈 취득을 위해 기 설정된 시간이 경과된 후,
    제어부는, 음성인식 시작 신호 또는 음성 입력 신호를 차량 내의 멀티미디어 기기의 디스플레이 수단이나 사운드 수단을 통해 출력하는 것을 특징으로 하는 음성 인식 장치.
  7. 통신부가 사용자의 모바일 단말기와 통신하는 단계;
    음성인식 버튼이 입력된 후, 노이즈 필터부가 기 지정된 시간동안 노이즈를 취득한 후 사용자의 음성을 취득하고, 상기 노이즈를 상쇄시킬 수 있는 반 노이즈 패턴 신호를 생성하여 상기 음성에서 패턴성 노이즈를 제거하는 단계; 및
    제어부가 상기 통신부와 노이즈 필터부를 제어하여 사용자별로 패턴성 노이즈가 제거된 음성을 취득한 후 음성인식엔진에 전달하여 상기 음성인식엔진에서 사용자별로 음성정보의 학습과 음성인식을 수행하게 하는 단계;를 포함하되,
    상기 노이즈 필터부가 상기 음성에서 패턴성 노이즈를 제거하는 단계는,
    상기 음성인식 버튼이 입력된 후, 기 설정된 시간동안 차량 내에서 발생되는 노이즈를 노이즈 취득부를 통해 취득하는 단계;
    상기 취득한 노이즈가 일정 패턴을 가지는 패턴성 노이즈인지를 노이즈 패턴 판별부를 통해 판별하는 단계;
    상기 노이즈가 패턴성 노이즈인 경우, 상기 노이즈를 상쇄할 수 있는 반대 위상을 갖는 반 노이즈 패턴 신호를 반 노이즈 패턴 생성부를 통해 생성하는 단계;
    상기 노이즈를 취득한 후 음성명령 취득부를 통해 사용자의 음성을 취득하는 단계; 및
    패턴성 노이즈 제거부를 통해 상기 반 노이즈 패턴 신호를 상기 음성명령 취득부에서 취득한 음성에 합성하여 상기 패턴성 노이즈를 캔슬링 하는 단계;를 포함하는 것을 특징으로 하는 음성 인식 방법.
  8. 제 7항에 있어서,
    상기 사용자별로 패턴성 노이즈가 제거된 음성을 취득하는 단계에서,
    사용자 정보 DB에 사용자와 그 사용자에 대응하는 모바일 단말기의 정보를 고유 ID로서 미리 등록해 두고,
    상기 제어부가 상기 통신부를 통해 통신 연결된 모바일 단말기 정보를 상기 사용자 정보 DB를 참조하여 그 단말기 정보에 대응하는 사용자를 검출하고, 그에 따라 상기 음성인식엔진을 제어하여 사용자별 음성정보의 학습과 음성인식을 수행하게 하는 것을 특징으로 하는 음성 인식 방법.
  9. 제 8항에 있어서,
    상기 사용자 정보는 사용자별로 우선순위 정보가 포함되어 등록되며,
    두 명 이상의 사용자가 검출된 경우, 상기 제어부는 우선순위가 높은 모바일 단말기의 사용자를 운전자로 판단하여 통신을 연결하는 것을 특징으로 하는 음성 인식 방법.
  10. 제 7항에 있어서, 상기 음성인식 버튼이 입력된 후,
    상기 제어부는, 음성 취득을 위하여 차량내의 멀티미디어 기기의 동작을 기 지정된 시간동안 오프 시키거나 사운드 볼륨을 최소화시키는 단계;를 더 포함하는 것을 특징으로 하는 음성 인식 방법.
  11. 삭제
  12. 제 7항에 있어서,
    상기 음성명령 취득부를 통해 사용자의 음성을 취득하는 단계 이전에,
    상기 제어부는, 상기 노이즈 취득을 위해 기 설정된 시간이 경과된 후, 음성인식 시작 신호 또는 음성 입력 신호를 차량 내의 멀티미디어 기기의 디스플레이 수단이나 사운드 수단을 통해 출력하는 단계;를 더 포함하는 것을 특징으로 하는 음성 인식 방법.
KR1020140130064A 2014-09-29 2014-09-29 음성 인식 장치 및 방법 KR102338041B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140130064A KR102338041B1 (ko) 2014-09-29 2014-09-29 음성 인식 장치 및 방법
CN201510616076.1A CN105469804B (zh) 2014-09-29 2015-09-24 语音识别装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140130064A KR102338041B1 (ko) 2014-09-29 2014-09-29 음성 인식 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160037484A KR20160037484A (ko) 2016-04-06
KR102338041B1 true KR102338041B1 (ko) 2021-12-10

Family

ID=55607430

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140130064A KR102338041B1 (ko) 2014-09-29 2014-09-29 음성 인식 장치 및 방법

Country Status (2)

Country Link
KR (1) KR102338041B1 (ko)
CN (1) CN105469804B (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102394832B1 (ko) * 2017-07-11 2022-05-06 현대자동차주식회사 커넥티비티 통합관리 방법 및 커넥티드 카
KR101864388B1 (ko) * 2018-03-29 2018-06-04 주식회사 경림이앤지 Cctv 카메라 시스템에서 어레이 마이크를 사용한 소음의 노이즈가 상쇄된 이상 음원 탐지 시스템 및 방법
CN109410938A (zh) * 2018-11-28 2019-03-01 途客电力科技(天津)有限公司 车辆控制方法、装置及车载终端
CN111540359A (zh) * 2020-05-07 2020-08-14 上海语识信息技术有限公司 一种语音识别方法、装置和存储介质
CN113976300A (zh) * 2021-10-26 2022-01-28 芜湖职业技术学院 一种粉碎机智能系统控制方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004198810A (ja) 2002-12-19 2004-07-15 Denso Corp 音声認識装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10058786A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
JP2002267529A (ja) * 2001-03-09 2002-09-18 Matsushita Electric Ind Co Ltd 音響解析方法及び音響解析装置
US7881929B2 (en) * 2007-07-25 2011-02-01 General Motors Llc Ambient noise injection for use in speech recognition
US9418674B2 (en) * 2012-01-17 2016-08-16 GM Global Technology Operations LLC Method and system for using vehicle sound information to enhance audio prompting
KR20140052661A (ko) * 2012-10-25 2014-05-07 현대모비스 주식회사 신호처리를 이용한 차량용 마이크로 폰 시스템
CN103065630B (zh) * 2012-12-28 2015-01-07 科大讯飞股份有限公司 用户个性化信息语音识别方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004198810A (ja) 2002-12-19 2004-07-15 Denso Corp 音声認識装置

Also Published As

Publication number Publication date
KR20160037484A (ko) 2016-04-06
CN105469804B (zh) 2019-11-19
CN105469804A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
KR102338041B1 (ko) 음성 인식 장치 및 방법
JP6011584B2 (ja) 音声認識装置及び音声認識システム
EP2866466B1 (en) Apparatus and method for controlling beamforming microphone considering location of driver seat
US20180096684A1 (en) Vehicle-based remote control system and method
US9566906B2 (en) Apparatus and method for controlling virtual engine sound in response to auto-cruise speed settings
CN106218557B (zh) 一种带语音识别控制的车载麦克风
US10026414B2 (en) Speech processing system, vehicle, speech processing unit, steering wheel unit, speech processing method, and speech processing program
JP2015074315A (ja) 車載中継装置及び車載通信システム
JP2001255890A (ja) 音声制御するための装置および方法
CN102906811B (zh) 用于调节包括扬声器和麦克风的语音识别系统的方法及语音识别系统
KR101428245B1 (ko) 음성 인식 장치 및 방법
KR101640055B1 (ko) 단말기, 그와 통신하는 오디오 장치 및 차량
CN114387963A (zh) 车辆及其控制方法
KR20160050135A (ko) 차량용 오디오 볼륨 제어 방법 및 제어 장치
KR20180005828A (ko) 사운드 크기를 직관적으로 조정하기 위한 방법 및 차량 제어기
US20180135998A1 (en) Method for improved user experience during driver distraction lockout modes
JP2010263401A (ja) ハンズフリー通話装置、及び該装置の音声補正方法
JP5556529B2 (ja) 車載音声認識装置
KR20180076464A (ko) 운전자 졸음 경고 시스템
KR102406115B1 (ko) 차량 오디오 자동 제어 시스템 및 방법
KR101710695B1 (ko) 차량용 음성 인식을 위한 마이크로폰 제어 시스템 및 그 제어 방법
JP2015004703A (ja) 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム
KR20140050469A (ko) 차량용 avn시스템의 제어 방법
JP6567985B2 (ja) 車載装置
KR20230097857A (ko) 차량 및 차량의 제어방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant