KR20160132574A - 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 - Google Patents

자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 Download PDF

Info

Publication number
KR20160132574A
KR20160132574A KR1020150065258A KR20150065258A KR20160132574A KR 20160132574 A KR20160132574 A KR 20160132574A KR 1020150065258 A KR1020150065258 A KR 1020150065258A KR 20150065258 A KR20150065258 A KR 20150065258A KR 20160132574 A KR20160132574 A KR 20160132574A
Authority
KR
South Korea
Prior art keywords
gain
speech signal
voice
gain value
energy
Prior art date
Application number
KR1020150065258A
Other languages
English (en)
Inventor
이윤재
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020150065258A priority Critical patent/KR20160132574A/ko
Priority to US14/942,492 priority patent/US9503041B1/en
Publication of KR20160132574A publication Critical patent/KR20160132574A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/06Volume compression or expansion in amplifiers having semiconductor devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

음성인식에 최적화된 세기를 갖도록 음성신호를 증폭하는데 이용되는 이득값을 실시간으로 결정하는 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법을 제공한다.
일 실시예에 따른 자동이득제어모듈은, 외부에서 입력된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부; 상기 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부; 및 상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 음성 증폭부; 를 포함할 수 있다.

Description

자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법{AUTO GAIN CONTROL MODULE, CONTROL METHOD FOR THE SAME, VEHICLE INCLUDING THE SAME, CONTROL METHOD FOR THE SAME}
음성신호의 증폭에 이용되는 이득값을 결정하는 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법에 관한 발명이다.
차량에 대한 기술이 발전함에 따라, 차량이 수행하는 기본적인 기능인 주행 이외에도 사용자의 편의를 위한 다양한 기능이 제공되고 있다.
이처럼 차량이 수행할 수 있는 기능이 다양해지면서, 운전자의 차량에 대한 조작 부하가 증가할 수 있다. 조작 부하의 증가는 운전자의 운전에 대한 집중도를 저하시켜 안전 운전을 방해하는 요인이 된다. 또한, 기능의 수가 증가할수록 조작의 곤란성이 증가할 수 있어, 차량의 조작이 미숙한 운전자는 차량이 수행할 수 있는 기능을 제대로 활용하지 못하게 된다.
최근, 운전자의 조작 부하 및 조작의 곤란성을 감소시키기 위한 차량용 인터페이스의 연구 및 개발이 활발히 진행 중이다. 특히, 별도의 조작 없이, 운전자의 음성을 인식하여 해당 음성에 대응되는 기능을 수행하는 음성 인식 기술을 차량에 적용하는 시도가 계속되고 있다.
개시된 발명의 일 실시예에 따르면, 음성인식에 최적화된 세기를 갖도록 음성신호를 증폭하는데 이용되는 이득값을 실시간으로 결정하는 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법을 제공한다.
일 실시예에 따른 자동이득제어모듈은, 외부에서 입력된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부; 상기 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부; 및 상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 음성 증폭부; 를 포함할 수 있다.
또한, 상기 제 1 연산부는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하고, 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정할 수 있다.
또한, 세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블이 저장되는 저장부; 를 더 포함할 수 있다.
또한, 상기 제 1 연산부는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하고, 상기 확인된 세기 레벨에 대응되는 이득값을 상기 저장부로부터 확인하고, 상기 확인된 이득값을 상기 제 1 이득값으로 결정할 수 있다.
또한, 상기 제 2 연산부는, 상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하고, 상기 저장부로부터 상기 확인된 피크 레벨에 대응되는 이득값을 확인하고, 상기 확인된 이득값을 상기 제 2 이득값으로 결정할 수 있다.
또한, 상기 음성 증폭부는, 상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않을 수 있다.
일 실시예에 따른 차량은, 음성을 입력 받아 음성신호를 생성하는 음성 입력부; 상기 생성된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값, 및 상기 생성된 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 자동이득제어모듈; 및 상기 증폭된 음성신호를 이용하여 음성인식을 수행하는 음성 인식부; 를 포함할 수 있다.
또한, 상기 자동이득제어모듈은, 상기 음성신호의 에너지가 상기 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부; 상기 음성신호의 피크값이 상기 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부; 및 상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 음성 증폭부; 를 포함할 수 있다.
또한, 상기 제 1 연산부는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하고, 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정할 수 있다.
또한, 상기 자동이득제어모듈은, 세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나가 저장되는 저장부; 를 더 포함할 수 있다.
또한, 상기 제 1 연산부는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하고, 상기 확인된 세기 레벨에 대응되는 이득값을 상기 저장부로부터 확인하고, 상기 확인된 이득값을 상기 제 1 이득값으로 결정할 수 있다.
또한, 상기 제 2 연산부는, 상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하고, 상기 저장부로부터 상기 확인된 피크 레벨에 대응되는 이득값을 확인하고, 상기 확인된 이득값을 상기 제 2 이득값으로 결정할 수 있다.
또한, 상기 자동이득제어모듈은, 상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않고 상기 음성 인식부에 제공할 수 있다.
일 실시예에 따른 자동이득제어모듈의 제어방법은, 외부로부터 입력된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 단계; 상기 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 단계; 및 상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 를 포함할 수 있다.
또한, 상기 제 1 이득값을 결정하는 단계는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하는 단계; 및 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 단계; 를 포함할 수 있다.
또한, 세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블을 미리 저장하는 단계; 를 더 포함할 수 있다.
또한, 상기 제 1 이득값을 결정하는 단계는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하는 단계; 상기 확인된 세기 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및 상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 단계; 를 포함할 수 있다.
또한, 상기 제 2 이득값을 결정하는 단계는, 상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하는 단계; 상기 확인된 피크 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및 상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 단계; 를 포함할 수 있다.
또한, 상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않는 단계; 를 더 포함할 수 있다.
일 실시예에 따른 차량의 제어방법은, 음성을 입력 받아 음성신호를 생성하는 단계; 상기 생성된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값, 및 상기 생성된 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 및 상기 증폭된 음성신호를 이용하여 음성인식을 수행하는 단계; 를 포함할 수 있다.
또한, 상기 음성신호를 증폭시키는 단계는, 상기 음성신호의 에너지가 상기 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 단계; 상기 음성신호의 피크값이 상기 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 단계; 및 상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 를 포함할 수 있다.
또한, 상기 제 1 이득값을 결정하는 단계는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하는 단계; 및 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 단계; 를 포함할 수 있다.
또한, 세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블을 미리 저장하는 단계; 를 더 포함할 수 있다.
또한, 상기 제 1 이득값을 결정하는 단계는, 상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하는 단계; 상기 확인된 세기 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및 상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 단계; 를 포함할 수 있다.
또한, 상기 제 2 이득값을 결정하는 단계는, 상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하는 단계; 상기 확인된 피크 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및 상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 단계; 를 포함할 수 있다.
또한, 상기 음성신호를 증폭시키는 단계는, 상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않는 단계; 를 더 포함할 수 있다.
개시된 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법의 일 실시에 따르면, 입력되는 음성신호의 증폭을 위해 실시간으로 이득값을 결정함으로써, 음성인식의 오인식과 그에 따른 재인식의 횟수를 저감시킬 수 있다.
또한, 음성신호의 증폭 시 피크값을 고려함으로써, 음성신호의 증폭에 따른 정보 손실을 최소화할 수 있다.
도 1은 일 실시예에 따른 차량의 외관을 도시한 도면이다.
도 2는 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.
도 3은 일 실시예에 따른 차량의 제어 블록도이다.
도 4a는 음성신호의 세기에 대응되는 이득값을 나타내는 종래의 테이블을 예시하고 있고, 도 4b는 음성신호의 세기에 대응되는 이득값을 나타내는 개시된 발명의 테이블을 예시한다.
도 5는 일 실시예에 따른 자동이득제어모듈의 제 2 연산부의 동작을 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 차량 제어방법의 흐름도이다.
도 7은 다른 실시예에 따른 차량 제어방법의 흐름도이다.
도 8은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
도 9는 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
이하 첨부된 도면을 참조하여 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법을 상세하게 설명하도록 한다.
도 1은 일 실시예에 따른 차량의 외관을 도시한 도면이다.
도 1과 같이, 차량의 일 실시예는 차량(100)의 외관을 형성하는 본체(10), 차량(100)을 이동시키는 차륜(21, 22), 차량(100) 내부를 외부로부터 차폐시키는 도어(14), 차량(100) 내부의 운전자에게 차량(100) 전방의 시야를 제공하는 전면 유리(17), 운전자에게 차량(100) 후방의 시야를 제공하는 사이드 미러(18, 19)를 포함한다.
차륜(21, 22)은 차량의 전방에 마련되는 전륜(21), 차량의 후방에 마련되는 후륜(22)을 포함하며, 전륜(21) 또는 후륜(22)은 후술할 구동장치로부터 회전력을 제공받아 본체(10)를 전방 또는 후방으로 이동시킬 수 있다.
도어(14)는 본체(10)의 좌측 및 우측에 회동 가능하게 마련되어 개방 시에 운전자가 차량(100)의 내부에 탑승할 수 있도록 하며, 폐쇄 시에 차량(100)의 내부를 외부로부터 차폐시킨다.
전면 유리(17)는 본체(10)의 전방 상측에 마련되어 차량(100) 내부의 운전자가 차량(100) 전방의 시각 정보를 획득할 수 있도록 하는 것으로서, 윈드쉴드 글라스(Windshield Glass)라고도 한다.
또한, 사이드 미러(18, 19)는 본체(1)의 좌측에 마련되는 좌측 사이드 미러(18) 및 우측에 마련되는 우측 사이드 미러(19)를 포함하며, 차량(100) 내부의 운전자가 차량(100) 측면 및 후방의 시각 정보를 획득할 수 있도록 한다.
도 2는 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.
도 2에 도시된 바와 같이, 차량(100)은 운전자 등이 탑승하는 시트(110)와, 기어 박스(120), 센터페시아(130) 및 스티어링 휠(140) 등이 마련된 대시보드(150)(dashboard), 및 스피커(160)를 포함할 수 있다.
기어 박스(120)에는 차량(100) 변속을 위한 변속 레버(121)와, 차량(100)의 기능 수행을 제어하기 위한 다이얼 조작부(122)가 설치될 수 있다.
대시보드(150)에 마련된 스티어링 휠(140)은 차량(100)의 주행 방향을 조절하기 위한 장치로, 운전자에 의해 파지되는 림(141) 및 후술할 차량(100)의 조향 장치와 연결되고 림(141)과 조향을 위한 회전축의 허브를 연결하는 스포크(142)를 포함할 수 있다. 실시 예에 따라서 스포크(142)에는 차량(100) 내의 각종 장치, 일례로 오디오 장치 등을 제어하기 위한 조작 장치(142a, 142b)가 형성될 수 있다.
대시보드(150)에 마련된 센터페시아(130)에는 공조 장치(131), 시계(132), 오디오 장치(133) 및 디스플레이 등이 설치될 수 있다.
공조 장치(131)는 차량(100) 내부의 온도, 습도, 공기의 청정도, 공기의 흐름을 조절하여 차량(100)의 내부를 쾌적하게 유지한다. 공조 장치(131)는 센터페시아(130)에 설치되고 공기를 토출하는 적어도 하나의 토출구(131a)를 포함할 수 있다. 센터페시아(130)에는 공조 장치(131) 등을 제어하기 위한 버튼이나 다이얼 등이 설치될 수 있다. 운전자 등의 탑승자는 센터페시아(130)에 배치된 버튼을 이용하여 공조 장치(131)를 제어할 수 있다.
시계(132)는 공조 장치(131)를 제어하기 위한 버튼이나 다이얼 주위에 마련될 수 있다.
오디오 장치(133)는 오디오 장치(133)의 기능 수행을 위한 다수의 버튼들이 마련된 조작패널을 포함할 수 있다. 오디오 장치(133)는 라디오 기능을 제공하는 라디오 모드와 오디오 파일이 담긴 다양한 저장매체의 오디오 파일을 재생하는 미디어 모드를 제공할 수 있다.
디스플레이(134)는 차량(100)과 관련된 정보를 이미지, 또는 텍스트의 형태로 출력할 수 있다. 예를 들어, 차량(100)이 권장 주행방법을 출력하도록 제어하는 출력신호를 수신하면, 디스플레이(134)는 해당 출력신호에 대응되는 권장 주행방법을 이미지, 또는 텍스트를 통해 출력하여 탑승자에게 알릴 수 있다.
이를 위해, 디스플레이(134)는 센터페시아(130)에 매립되어 형성될 수 있다. 다만, 디스플레이의 설치 예가 이에 한정되는 것은 아니며, 디스플레이는 차량(100)의 센터페시아(130)와 분리 가능하도록 마련될 수도 있다.
이 때, 디스플레이(134)는 LCD(Liquid Crystal Display), LED(Light Emitting Diode), PDP(Plasma Display Panel), OLED(Organic Light Emitting Diode), CRT(Cathode Ray Tube) 등으로 구현될 수 있으나, 이에 한정되지는 않는다.
또한, 대시보드(150)는 차량(100)의 주행 속도, 엔진 회전 수 또는 연료 잔량 등을 표시할 수 있는 각종 계기판 및 각종 물건을 수납할 수 있는 글로브 박스(globe box) 등을 더 포함할 수도 있다.
차량(100)의 내부에는 음향을 출력할 수 있는 스피커(160)가 마련될 수 있다. 스피커는 차량(100)과 관련된 정보를 음향으로 출력할 수 있다. 예를 들어, 차량(100)이 권장 주행방법을 출력하도록 제어하는 출력신호를 수신하면, 스피커(160)는 해당 출력신호에 대응되는 권장 주행방법을 음향을 통해 출력하여 탑승자에게 알릴 수 있다.
한편, 차량은 운전자를 포함하는 탑승자로부터 제어명령을 입력 받고, 입력 받은 제어명령에 따라 동작할 수 있다. 예를 들어, 운전자는 센터페시아(130)에 배치된 버튼을 통해 공조 장치(131), 시계(132), 오디오 장치(133) 및 디스플레이(134) 등을 제어할 수 있다.
뿐만 아니라, 차량은 운전자를 포함하는 탑승자의 음성을 인식하고, 인식한 음성에 대응되는 제어명령에 따라 동작할 수도 있다. 이처럼 음성인식이 가능한 차량은 입력 받은 음성을 음성인식이 용이하도록 증폭시키기 위한 자동이득조절모듈을 구비할 수 있다.
이하에서는, 자동이득조절모듈을 구비한 차량에 대하여 상세히 설명한다.
도 3은 일 실시예에 따른 차량의 제어 블록도이고, 도 4a는 음성신호의 세기에 대응되는 이득값을 나타내는 종래의 테이블을 예시하고 있고, 도 4b는 음성신호의 세기에 대응되는 이득값을 나타내는 개시된 발명의 테이블을 예시한다.
도 3을 참조하면, 차량은 음성을 입력 받아 음성신호를 생성하는 음성 입력부(200); 음성 입력부를 통해 생성된 음성신호를 음성인식의 최적화된 세기로 증폭시키는 자동이득제어모듈(300); 증폭된 음성신호를 디지털 신호로 변환하는 A/D 컨버터(400); 및 디지털 신호로 변환된 음성신호를 이용하여 음성인식을 수행하는 음성 인식부(500); 를 포함할 수 있다.
음성 입력부(200)는 운전자를 포함한 탑승자의 음성을 입력 받기 위한 장치로, 마이크로폰(Microphone)을 포함할 수 있다. 음성 입력부(200)는 입력 받은 음성을 전기적인 아날로그 음성신호로 변환할 수 있다.
음성 입력부(200)는 운전자를 포함한 탑승자의 음성을 입력 받기 용이한 위치에 마련될 수 있다. 예를 들어, 운전자의 음성을 입력 받을 수 있도록, 운전자의 좌석 상단에 마련될 수 있다.
자동이득제어모듈(300)은 음성신호를 음성인식에 최적화된 세기로 증폭시킬 수 있다. 이를 위해, 자동이득제어모듈(300)은 음성신호의 에너지가 목표 에너지에 도달하도록 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부(310); 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부(320); 음성신호의 에너지에 대응되는 이득값에 대한 제 1 테이블 및 음성신호의 피크값에 대응되는 이득값에 대한 제 2 테이블 중 적어도 하나가 저장되는 저장부(330); 및 제 1 이득값 및 제 2 이득값 중 최소값에 따라 음성신호를 증폭시키는 음성 증폭부(340); 를 포함할 수 있다.
제 1 연산부(310)는 음성신호의 에너지를 기초로 음성신호를 증폭시키는데 이용되는 제 1 이득값을 결정할 수 있다. 구체적으로, 제 1 연산부(310)는 음성신호의 에너지가 미리 정해진 목표 에너지에 도달하도록 음성신호를 증폭시키는 제 1 이득값을 결정할 수 있다. 여기서 목표 에너지란 음성인식을 수행하기에 충분한 음성신호의 에너지를 의미할 수 있다.
또는, 제 1 연산부(310)는 음성신호의 에너지를 기초로 음성신호의 세기를 획득하고, 음성신호의 세기를 이용하여 제 1 이득값을 결정할 수 있다. 이 때, 제 1 연산부(310)는 수학식 1에 따라 음성신호의 세기 I1을 획득할 수 있다.
[수학식 1]
Figure pat00001

여기서, E1은 입력된 음성신호의 에너지를 의미하고, E0(E0=1X10-12W/m2)는 가청 문턱값으로 사람이 들을 수 있는 가장 작은 소리의 에너지를 의미한다.
음성신호의 세기를 획득한 후, 제 1 연산부(310)는 음성신호의 세기가 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 음성신호를 증폭시키는 제 1 이득값을 결정할 수 있다. 이 때, 목표 세기는 음성인식에 최적화된 세기로 미리 설정될 수 있고, 예를 들어 -18dB로 설정될 수 있다.
제 1 연산부(310)는 저장부(330)에 저장된 제 1 테이블을 참조하여 제 1 이득값을 결정할 수 있다. 이 때, 제 1 테이블은 음성신호의 세기, 세기 레벨, 및 이득값의 관계를 나타낼 수 있다.
도 4a는 종래의 제 1 테이블을 예시하고 있다. 종래의 제 1 테이블은 직전 음성신호의 세기와 직전 음성신호의 세기레벨, 및 이득값의 관계를 나타낸다. 즉, 종래의 음성신호 증폭 방법은 현재 입력되는 음성신호의 증폭을 위한 제 1 이득값을 직전에 입력된 음성신호의 세기를 기초로 결정한다. 예를 들어, 직전에 입력된 음성신호의 세기가 -40dB인 경우, 현재 입력된 음성신호의 증폭을 위한 제 1 이득값은 +6dB로 결정될 수 있다.
그 결과, 종래의 음성신호 증폭 방법은 최초 입력 음성신호에 대하여는 최적의 세기로 증폭하는데 실패할 확률이 높다. 그 결과, 최초 입력 음성신호는 미인식 또는 오인식되어, 탑승자는 동일한 음성을 다시 입력하도록 재 요청 받을 수 있다.
또한, 종래의 음성신호 증폭 방법에 따르면, 세기가 작은 음성을 발화하는 탑승자는 동일한 음성을 복수회 재 입력하도록 요청받을 수 있다. 표 1은 목표 세기 레벨이 4Lv이고, 탑승자 중 발화자가 -40dB의 세기의 음성을 발화하는 경우의 제 1 이득값 결정과정을 예시하고 있다.
횟수 직전음성신호세기 이득값 증폭 후 음성신호세기
1 -40dB +6dB -34dB
2 -34dB +3dB -31dB
3 -31dB +3dB -27dB
4 -27dB 0dB -27dB
표 1에 따르면, 1회 음성신호가 입력될 때 이득값이 +6dB이므로 증폭 후 신호세기는 -34dB가 된다. 증폭 후 신호세기가 -34dB이므로, 발화자는 음성을 다시 입력할 것이 요청된다. 이에 따라 2회 음성신호가 입력될 때 이득값이 +3dB이므로 증폭 후 신호세기는 -31dB가 된다. 이와 같은 방식으로, 발화자는 반복하여 음성신호를 입력하여야 하고, 최종적으로 4회 음성신호가 입력되어야 비로소 증폭 후 신호가 목표 세기 레벨에 진입하여 음성인식이 수행될 수 있다.
이처럼, 종래의 음성신호 증폭 방법은 목표 신호 레벨에 진입하는 이득값을 결정하기 위해, 발화자에게 음성 입력을 복수 회 요청하게 된다. 그 결과, 음성인식에 소요되는 시간이 지나치게 길어지고, 입력된 음성신호가 목표 신호 레벨에 진입하기 이전에 발화자는 음성인식을 포기하는 경우도 발생할 수 있다.
이와 같은 문제를 해결하기 위해, 개시된 자동이득제어모듈(300)의 제 1 연산부(310)는 현재 입력된 음성신호의 세기와 현재 입력된 음성신호의 세기레벨 및 이득값의 관계를 나타내는 제 1 테이블을 이용할 수 있다.
도 4b에 개시된 제 1 테이블은 현재 입력된 음성신호의 세기와 현재 입력된 음성신호의 세기레벨, 및 이득값의 관계를 나타낸다. 도4b의 제 1 테이블을 이용하여, 제 1 연산부(310)는 현재 입력되는 음성신호의 증폭을 위한 제 1 이득값을 현재 입력된 음성신호의 세기를 기초로 결정할 수 있다.
예를 들어, 목표 세기 레벨이 4Lv이고, 현재 입력된 음성신호의 세기가 -40dB인 경우, 이득값이 +22dB가 되어 증폭된 음성신호는 -18dB의 세기를 갖는다. 그 결과, 증폭된 음성신호는 목표 세기 레벨에 진입하여, 즉시 음성인식에 이용될 수 있다.
이처럼, 개시된 발명의 자동이득제어모듈(300)은 현재 입력된 음성신호에 대응되는 이득값을 실시간으로 결정하고, 이를 이용하여 음성신호를 증폭시킴으로써, 음성인식의 정확도를 높일 수 있고, 음성인식에 소요되는 시간을 단축할 수 있다.
지금까지는, 제 1 연산부(310)가 미리 정해진 제 1 테이블에 따라 제 1 이득값을 결정하는 경우를 설명하였다. 이와는 달리, 제 1 연산부(310)는 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 직접 연산할 수도 있다. 또는, 제 1 연산부(310)는 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 직접 연산할 수도 있다.
다시 도 3을 참조하면, 제 2 연산부는 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 음성신호를 증폭시키는 제 2 이득값을 결정할 수 있다. 제 2 연산부(320)의 동작에 대해서는 도 5를 참조하여 자세히 설명한다.
도 5는 일 실시예에 따른 자동이득제어모듈의 제 2 연산부의 동작을 설명하기 위한 도면이다. (a)는 입력된 음성신호를 시간축에 대하여 도시한 그래프이고, (b)는 (a)의 음성신호를 증폭시켜 클리핑(Clipping)이 발생하는 경우를 시간축에 대하여 도시한 그래프이고, (c)는 (a)의 음성신호를 제 2 이득값에 따라 증폭시킨 경우를 시간축에 대하여 도시한 그래프이다. 이 때, (a), (b), 및 (c)의 그래프에서 M은 증폭 가능 최대값을 의미한다.
후술할 음성 증폭부(340)의 성능에 따라 증폭 가능 최대값이 결정되면, 증폭 가능 최대값 이상의 값은 증폭 가능 최대값으로 출력될 수 있다. 그래프 (a)를 참조하면, 현재 입력된 음성신호는 시간 Px에서 피크값 Py를 가진다. 만약 그래프 (b)와 같이 그래프 (a)를 증폭시키는 경우, 증폭된 음성신호는 시간 Px 부근에서 증폭 가능 최대값 M을 가진다. 즉, 증폭된 음성신호는 피크값이 M을 초과하여 클리핑이 발생할 수 있다. 클리핑이 발생한다는 것은 음성신호의 손실을 의미하므로, 음성인식의 정확도가 낮아질 수 있다.
따라서, 음성신호의 증폭 시 증폭 가능 최대값을 고려할 필요가 있다. 구체적으로, 제 2 연산부(320)는 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 음성신호를 증폭시키는 제 2 이득값을 결정할 수 있다.
그래프 (c)를 참조하면, 증폭된 음성신호는 시간 Px에서 피크값 M을 가진다. 이처럼, 증폭 가능 최대값을 고려하여 음성신호를 증폭하면, 손실이 없이 증폭된 음성신호를 획득할 수 있다.
제 2 연산부(320)는 음성신호의 피크값이 증폭 가능 최대값과 일치시키는 제 2 이득값을 직접 연산할 수 있다.
이와는 달리, 저장부(330)에 음성신호의 피크값, 음성신호의 피크 레벨, 및 이득값의 관계에 대한 제 2 테이블이 미리 저장될 수 있다. 제 2 연산부(320)는 제 2 테이블을 참조하여 음성신호의 피크값에 대응되는 제 2 이득값을 획득할 수 있다.
제 1 이득값 및 제 2 이득값이 결정되면, 음성 증폭부(340)는 제 1 이득값 및 제 2 이득값 중 최소값에 따라 입력된 음성신호를 증폭시킬 수 있다. 제 1 이득값이 제 2 이득값보다 큰 경우 제 1 이득값에 따라 음성신호를 증폭시키면, 증폭된 음성신호는 클리핑이 발생할 수 있다. 따라서, 음성 증폭부(340)는 제 1 이득값이 제 2 이득값보다 작은 경우에만 제 1 이득값에 따라 음성신호를 증폭시킬 수 있다.
반면, 음성 증폭부(340)는 제 1 이득값이 제 2 이득값보다 큰 경우, 제 2 이득값에 따라 음성신호를 증폭시킴으로써 음성신호의 손실을 차단할 수 있다.
또한, 음성 증폭부(340)는 제 1 연산부(310)에서 획득한 음성신호의 에너지가 증폭 불요 에너지 이상이면 음성신호를 증폭하지 않고 출력할 수도 있다. 이 때, 증폭 불요 에너지는 음성인식에 이용되어도 충분하다고 판단되는 음성신호의 최저 에너지를 의미하며, 제조시 또는 사용자의 입력에 따라 미리 결정될 수 있다.
음성신호의 에너지가 증폭 불요 에너지 이상이라는 것은 현재의 음성신호를 증폭없이 음성인식에 이용할 수 있음을 의미하므로, 자동이득제어모듈(300)은 불필요한 연산을 거치지 않고 신속하게 음성인식을 위한 음성신호를 출력할 수 있다.
다시 도 3을 참조하면, A/D 컨버터(400)는 자동이득제어모듈(300)로부터 출력된 음성신호를 디지털 신호로 변환할 수 있다. 후술할 음성 인식부(500)는 디지털 신호를 입력받아 이를 이용하여 음성을 인식하므로, 아날로그 음성신호를 디지털 음성신호로 변환할 수 있다.
음성신호를 디지털 신호로 변환한 후, 음성 인식부(500)는 음성신호에 음성인식 알고리즘(Speech Recognition Algorithm) 또는 음성인식 엔진(Speech Recognition Engine)을 적용하여 운전자를 포함하는 탑승자의 음성을 인식할 수 있다.
이 때, 음성신호는 음성인식을 위한 더 유용한 형태로 변환될 수 있는바, 음성 인식부(500)는 음성의 시작과 끝 지점을 검출하여 음성신호에 포함된 실제 음성 구간을 검출한다. 이를 EPD(End Point Detection)이라 한다.
그리고, 검출된 구간 내에서 켑스트럼(Cepstrum), 선형 예측 코딩(Linear Predictive Coefficient: LPC), 멜프리퀀시켑스트럼(Mel Frequency Cepstral Coefficient: MFCC) 또는 필터 뱅크 에너지(Filter Bank Energy) 등의 특징 벡터 추출 기술을 적용하여 음성 데이터(VD)의 특징 벡터를 추출할 수 있다.
이렇게 추출된 특징 벡터와 훈련된 기준 패턴과의 비교를 통하여 인식 결과를 얻을 수 있다. 이를 위해, 음성의 신호적인 특성을 모델링하여 비교하는 음향 모델(Acoustic Model) 과 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델(Language Model)이 사용될 수 있다.
음성 인식부(500)는 소프트웨어, 하드웨어 또는 이들의 조합을 이용하여 컴퓨터로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서(processor), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(micro-processor) 등의 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다.
소프트웨어적인 구현에 의하면, 음성 인식부(500)는 적어도 하나의 기능 또는 동작을 수행하는 별개의 소프트웨어 모듈과 함께 구현될 수 있고, 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다.
음성 인식부(500)에서 음성 인식 결과를 획득하면, 제어부(600)는 음성 인식 결과에 기초하는 제어명령을 생성할 수 있다. 최종적으로, 제어부(600)는 생성된 제어명령을 대응되는 구성으로 전송하여 해당 구성의 동작을 제어할 수 있다.
도 6은 일 실시예에 따른 차량 제어방법의 흐름도이다.
먼저, 차량은 음성 입력부를 통해 음성이 입력되었는지 확인한다. (700) 만약, 음성이 입력되지 않았다면, 차량은 반복하여 음성의 입력여부를 확인한다.
음성이 입력된 것으로 확인되면, 음성 입력부는 입력된 음성을 기초로 음성신호를 생성할 수 있다. (710) 이렇게 생성된 음성신호는 전기적 신호로서 추후 음성인식을 수행하는데 이용될 수 있다.
음성신호가 생성되면, 자동이득제어모듈의 제 1 연산부는 음성신호의 에너지 E1을 획득할 수 있다. (720) 음성신호의 에너지가 작을수록 음성인식의 정확도가 낮아지므로, 제 1 연산부(310)는 제 1 이득값을 결정하기에 앞서 음성신호의 에너지 E1을 획득할 수 있다.
다음으로, 제 1 연산부는 음성신호의 에너지 E1이 목표 에너지 EG에 도달하기 위한 제 1 이득값 G1을 연산할 수 있다. (730) 여기서 목표 에너지란 음성인식을 수행하기에 충분한 음성신호의 에너지를 의미할 수 있다.
이와 동시에, 제 2 연산부는 음성신호의 피크값 Py를 획득할 수 있다. (740) 그 다음, 제 2 연산부는 음성신호의 피크값 Py가 최대 증폭값 M에 도달하기 위한 제 2 이득값 G2를 연산할 수 있다. (750) 여기서 최대 증폭값이란 자동이득제어모듈(300)의 음성 증폭부(340)에서 증폭할 수 있는 최대값을 의미할 수 있다.
제 1 이득값 G1 및 제 2 이득값 G2를 획득한 후, 음성 증폭부는 제 1 이득값 G1이 제 2 이득값 G2 이상인지 확인한다. (760) 만약, 제 1 이득값 G1이 제 2 이득값 G2 이상이라면, 제 1 이득값 G1에 따라 음성신호를 증폭시킬 경우 클리핑(Clipping)이 발생하여 음성 정보의 손실이 발생할 수 있다.
따라서, 제 1 이득값 G1이 제 2 이득값 G2 이상이면, 음성 증폭부는 제 2 이득값 G2에 따라 음성신호를 증폭시킬 수 있다. (770)
반면에, 제 1 이득값 G1이 제 2 이득값 G2보다 작다면, 음성 증폭부는 제 1 이득값 G1에 따라 음성신호를 증폭시킬 수 있다. (780) 이 경우, 제 1 이득값 G1에 따라 증폭된 음성신호는 클리핑이 발생하지 않는다.
최종적으로, 음성 증폭부는 증폭된 음성신호를 이용하여 음성인식을 수행할 수 있다. (790)
도 7은 다른 실시예에 따른 차량 제어방법의 흐름도이다.
먼저, 차량은 음성 입력부를 통해 음성이 입력되었는지 확인한다. (800) 만약, 음성이 입력되지 않았다면, 차량은 반복하여 음성의 입력여부를 확인한다.
음성이 입력된 것으로 확인되면, 음성 입력부는 입력된 음성을 기초로 음성신호를 생성할 수 있다. (810) 이렇게 생성된 음성신호는 전기적 신호로서 추후 음성인식을 수행하는데 이용될 수 있다.
음성신호가 생성되면, 자동이득제어모듈의 제 1 연산부는 음성신호의 에너지 E1을 획득할 수 있다. (820) 음성신호의 에너지가 작을수록 음성인식의 정확도가 낮아지므로, 제 1 연산부(310)는 제 1 이득값을 결정하기에 앞서 음성신호의 에너지 E1을 획득할 수 있다.
다음으로, 제 1 연산부는 음성신호의 에너지 E1을 기초로 음성신호의 세기 I1을 획득할 수 있다. (830) 이 때, 제 1 연산부(310)는 상술한 수학식 1에 따라 음성신호의 세기 I1을 획득할 수 있다.
음성신호의 세기 I1을 획득한 후, 제 1 연산부는 음성신호의 세기 I1이 목표 에너지를 기초로 결정되는 목표 세기 IG에 도달하기 위한 제 1 이득값 G1을 연산할 수 있다. (840) 여기서 목표 에너지란 음성인식을 수행하기에 충분한 음성신호의 에너지를 의미할 수 있고, 목표 세기는 상술한 수학식 1에 목표 에너지를 대입하여 얻어지는 세기를 의미할 수 있다.
이와 동시에, 자동이득제어모듈의 제 2 연산부는 음성신호의 피크값 Py를 획득할 수 있다. (825) 그 다음, 제 2 연산부는 음성신호의 피크값 Py가 최대 증폭값 M에 도달하기 위한 제 2 이득값 G2를 연산할 수 있다. (845) 여기서 최대 증폭값이란 자동이득제어모듈(300)의 음성 증폭부(340)에서 증폭할 수 있는 최대값을 의미할 수 있다.
제 1 이득값 G1 및 제 2 이득값 G2를 획득한 후, 자동이득제어모듈의 음성 증폭부는 제 1 이득값 G1이 제 2 이득값 G2 이상인지 확인한다. (850) 만약, 제 1 이득값 G1이 제 2 이득값 G2 이상이라면, 제 1 이득값 G1에 따라 음성신호를 증폭시킬 경우 클리핑(Clipping)이 발생하여 음성 정보의 손실이 발생할 수 있다.
따라서, 제 1 이득값 G1이 제 2 이득값 G2 이상이면, 음성 증폭부는 제 2 이득값 G2에 따라 음성신호를 증폭시킬 수 있다. (860)
반면에, 제 1 이득값 G1이 제 2 이득값 G2보다 작다면, 음성 증폭부는 제 1 이득값 G1에 따라 음성신호를 증폭시킬 수 있다. (865) 이 경우, 제 1 이득값 G1에 따라 증폭된 음성신호는 클리핑이 발생하지 않는다.
최종적으로, 음성 증폭부는 증폭된 음성신호를 이용하여 음성인식을 수행할 수 있다. (870)
도 8은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
먼저, 차량은 음성 입력부를 통해 음성이 입력되었는지 확인한다. (900) 만약, 음성이 입력되지 않았다면, 차량은 반복하여 음성의 입력여부를 확인한다.
음성이 입력된 것으로 확인되면, 음성 입력부는 입력된 음성을 기초로 음성신호를 생성할 수 있다. (910) 이렇게 생성된 음성신호는 전기적 신호로서 추후 음성인식을 수행하는데 이용될 수 있다.
음성신호가 생성되면, 자동이득제어모듈의 제 1 연산부는 음성신호의 에너지 E1을 획득할 수 있다. (920) 음성신호의 에너지가 작을수록 음성인식의 정확도가 낮아지므로, 제 1 연산부(310)는 제 1 이득값을 결정하기에 앞서 음성신호의 에너지 E1을 획득할 수 있다.
다음으로, 제 1 연산부는 음성신호의 에너지 E1을 기초로 음성신호의 세기 I1을 획득할 수 있다. (930) 이 때, 제 1 연산부(310)는 상술한 수학식 1에 따라 음성신호의 세기 I1을 획득할 수 있다.
음성신호의 세기 I1을 획득한 후, 제 1 연산부는 음성신호의 세기 I1이 속하는 세기 레벨 K1Lv를 확인할 수 있다. (940) 여기서, 세기 레벨이란 음성신호의 세기를 구간별로 나누어, 복수의 구간을 순차적으로 배열한 것을 의미한다.
음성신호의 세기 레벨이 확인되면, 제 1 연산부는 미리 정해진 제 1 테이블에서 K1Lv에 대응되는 제 1 이득값 G1을 확인할 수 있다. (950) 여기서 제 1 테이블이란 세기 레벨 및 이득값의 관계에 대한 테이블을 의미할 수 있다.
이와 동시에, 자동이득제어모듈의 제 2 연산부는 음성신호의 피크값 Py를 획득할 수 있다. (925) 그 다음, 제 2 연산부는 음성신호의 피크값 Py가 속하는 피크레벨 K2Lv을 확인할 수 있다. (945) 여기서, 피크 레벨이란 음성신호의 피크값을 구간별로 나누어, 복수의 구간을 순차적으로 배열한 것을 의미한다.
음성신호의 피크 레벨이 확인되면, 제 2 연산부는 미리 정해진 제 2 테이블에서 K2Lv에 대응되는 제 2 이득값 G2를 연산할 수 있다. (955) 여기서 제 2 테이블이란 피크 레벨 및 이득값의 관계에 대한 테이블을 의미할 수 있다.
제 1 이득값 G1 및 제 2 이득값 G2를 획득한 후, 자동이득제어모듈의 음성 증폭부는 제 1 이득값 G1이 제 2 이득값 G2 이상인지 확인한다. (960) 만약, 제 1 이득값 G1이 제 2 이득값 G2 이상이라면, 제 1 이득값 G1에 따라 음성신호를 증폭시킬 경우 클리핑(Clipping)이 발생하여 음성 정보의 손실이 발생할 수 있다.
따라서, 제 1 이득값 G1이 제 2 이득값 G2 이상이면, 음성 증폭부는 제 2 이득값 G2에 따라 음성신호를 증폭시킬 수 있다. (970)
반면에, 제 1 이득값 G1이 제 2 이득값 G2보다 작다면, 음성 증폭부는 제 1 이득값 G1에 따라 음성신호를 증폭시킬 수 있다. (975) 이 경우, 제 1 이득값 G1에 따라 증폭된 음성신호는 클리핑이 발생하지 않는다.
최종적으로, 음성 증폭부는 증폭된 음성신호를 이용하여 음성인식을 수행할 수 있다. (980)
도 9는 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
먼저, 차량은 음성 입력부를 통해 음성이 입력되었는지 확인한다. (1000) 만약, 음성이 입력되지 않았다면, 차량은 반복하여 음성의 입력여부를 확인한다.
음성이 입력된 것으로 확인되면, 음성 입력부는 입력된 음성을 기초로 음성신호를 생성할 수 있다. (1010) 이렇게 생성된 음성신호는 전기적 신호로서 추후 음성인식을 수행하는데 이용될 수 있다.
음성신호가 생성되면, 자동이득제어모듈의 제 1 연산부는 음성신호의 에너지 E1을 획득할 수 있다. (1020) 음성신호의 에너지가 작을수록 음성인식의 정확도가 낮아지므로, 제 1 연산부(310)는 제 1 이득값을 결정하기에 앞서 음성신호의 에너지 E1을 획득할 수 있다.
다음으로, 제 1 연산부는 음성신호의 에너지 E1이 미리 정해진 증폭 불요 에너지 EN 이상인지 확인한다. (1030) 여기서, 증폭 불요 에너지란 음성인식에 이용되어도 충분하다고 판단되는 음성신호의 최저 에너지를 의미하며, 제조시 또는 사용자의 입력에 따라 미리 결정될 수 있다.
만약, 음성신호의 에너지 E1이 미리 정해진 증폭 불요 에너지 EN 이상이라면, 음성 증폭부(340)는 음성신호를 증폭시키지 않고, 음성신호를 음성 인식부(500)에 제공할 수 있다.
반면, 음성신호의 에너지 E1이 미리 정해진 증폭 불요 에너지 EN 보다 작다면, 제 1 연산부는 음성신호의 에너지 E1이 목표 에너지 EG에 도달하기 위한 제 1 이득값 G1을 연산할 수 있다. (1040) 여기서 목표 에너지란 음성인식을 수행하기에 충분한 음성신호의 에너지를 의미할 수 있다.
이와 동시에, 자동이득제어모듈의 제 2 연산부는 음성신호의 피크값 Py를 획득할 수 있다. (1050) 그 다음, 제 2 연산부는 음성신호의 피크값 Py가 최대 증폭값 M에 도달하기 위한 제 2 이득값 G2를 연산할 수 있다. (1060) 여기서 최대 증폭값이란 자동이득제어모듈(300)의 음성 증폭부(340)에서 증폭할 수 있는 최대값을 의미할 수 있다.
제 1 이득값 G1 및 제 2 이득값 G2를 획득한 후, 자동이득제어모듈의 음성 증폭부는 제 1 이득값 G1이 제 2 이득값 G2 이상인지 확인한다. (1070) 만약, 제 1 이득값 G1이 제 2 이득값 G2 이상이라면, 제 1 이득값 G1에 따라 음성신호를 증폭시킬 경우 클리핑(Clipping)이 발생하여 음성 정보의 손실이 발생할 수 있다.
따라서, 제 1 이득값 G1이 제 2 이득값 G2 이상이면, 음성 증폭부는 제 2 이득값 G2에 따라 음성신호를 증폭시킬 수 있다. (1080)
반면에, 제 1 이득값 G1이 제 2 이득값 G2보다 작다면, 음성 증폭부는 제 1 이득값 G1에 따라 음성신호를 증폭시킬 수 있다. (1085) 이 경우, 제 1 이득값 G1에 따라 증폭된 음성신호는 클리핑이 발생하지 않는다.
최종적으로, 음성 증폭부는 음성신호를 이용하여 음성인식을 수행할 수 있다. (1090)
100: 차량
200: 음성 입력부
300: 자동이득제어모듈
310: 제 1 연산부
320: 제 2 연산부
340: 음성 증폭부
400: A/D 컨버터
500: 음성 인식부
600: 제어부

Claims (26)

  1. 외부에서 입력된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부;
    상기 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부; 및
    상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 음성 증폭부; 를 포함하는 자동이득제어모듈.
  2. 제 1 항에 있어서,
    상기 제 1 연산부는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하고, 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 자동이득제어모듈.
  3. 제 1 항에 있어서,
    세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블이 저장되는 저장부; 를 더 포함하는 자동이득제어모듈.
  4. 제 3 항에 있어서,
    상기 제 1 연산부는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하고, 상기 확인된 세기 레벨에 대응되는 이득값을 상기 저장부로부터 확인하고, 상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 자동이득제어모듈.
  5. 제 3 항에 있어서,
    상기 제 2 연산부는,
    상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하고, 상기 저장부로부터 상기 확인된 피크 레벨에 대응되는 이득값을 확인하고, 상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 자동이득제어모듈.
  6. 제 1 항에 있어서,
    상기 음성 증폭부는,
    상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않는 자동이득제어모듈.
  7. 음성을 입력 받아 음성신호를 생성하는 음성 입력부;
    상기 생성된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값, 및 상기 생성된 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 자동이득제어모듈; 및
    상기 증폭된 음성신호를 이용하여 음성인식을 수행하는 음성 인식부; 를 포함하는 차량.
  8. 제 7 항에 있어서,
    상기 자동이득제어모듈은,
    상기 음성신호의 에너지가 상기 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 제 1 연산부;
    상기 음성신호의 피크값이 상기 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 제 2 연산부; 및
    상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 음성 증폭부; 를 포함하는 차량.
  9. 제 8 항에 있어서,
    상기 제 1 연산부는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하고, 상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 차량.
  10. 제 8 항에 있어서,
    상기 자동이득제어모듈은,
    세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나가 저장되는 저장부; 를 더 포함하는 차량.
  11. 제 10 항에 있어서,
    상기 제 1 연산부는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하고, 상기 확인된 세기 레벨에 대응되는 이득값을 상기 저장부로부터 확인하고, 상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 차량.
  12. 제 10 항에 있어서,
    상기 제 2 연산부는,
    상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하고, 상기 저장부로부터 상기 확인된 피크 레벨에 대응되는 이득값을 확인하고, 상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 차량.
  13. 제 7 항에 있어서,
    상기 자동이득제어모듈은,
    상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않고 상기 음성 인식부에 제공하는 차량.
  14. 외부로부터 입력된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 단계;
    상기 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 단계; 및
    상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 를 포함하는 자동이득제어모듈의 제어방법.
  15. 제 14 항에 있어서,
    상기 제 1 이득값을 결정하는 단계는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하는 단계; 및
    상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 단계; 를 포함하는 자동이득제어모듈의 제어방법.
  16. 제 14 항에 있어서,
    세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블을 미리 저장하는 단계; 를 더 포함하는 자동이득제어모듈의 제어방법.
  17. 제 16 항에 있어서,
    상기 제 1 이득값을 결정하는 단계는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하는 단계;
    상기 확인된 세기 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및
    상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 단계; 를 포함하는 자동이득제어모듈 의 제어방법.
  18. 제 16 항에 있어서,
    상기 제 2 이득값을 결정하는 단계는,
    상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하는 단계;
    상기 확인된 피크 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및
    상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 단계; 를 포함하는 자동이득제어모듈의 제어방법.
  19. 제 14 항에 있어서,
    상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않는 단계; 를 더 포함하는 자동이득제어모듈의 제어방법.
  20. 음성을 입력 받아 음성신호를 생성하는 단계;
    상기 생성된 음성신호의 에너지가 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값, 및 상기 생성된 음성신호의 피크값이 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 및
    상기 증폭된 음성신호를 이용하여 음성인식을 수행하는 단계; 를 포함하는 차량의 제어방법.
  21. 제 20 항에 있어서,
    상기 음성신호를 증폭시키는 단계는,
    상기 음성신호의 에너지가 상기 목표 에너지에 도달하도록 상기 음성신호를 증폭시키는 제 1 이득값을 결정하는 단계;
    상기 음성신호의 피크값이 상기 증폭 가능한 최대값에 도달하도록 상기 음성신호를 증폭시키는 제 2 이득값을 결정하는 단계; 및
    상기 제 1 이득값 및 상기 제 2 이득값 중 최소값에 따라 상기 음성신호를 증폭시키는 단계; 를 포함하는 차량의 제어방법.
  22. 제 21 항에 있어서,
    상기 제 1 이득값을 결정하는 단계는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기를 획득하는 단계; 및
    상기 음성신호의 세기가 상기 목표 에너지를 기초로 결정되는 목표 세기에 도달하도록 상기 음성신호를 증폭시키는 상기 제 1 이득값을 결정하는 단계; 를 포함하는 차량의 제어방법.
  23. 제 21 항에 있어서,
    세기 레벨에 대응되는 이득값, 및 피크 레벨에 대응되는 이득값 중 적어도 하나를 포함하는 테이블을 미리 저장하는 단계; 를 더 포함하는 차량의 제어방법.
  24. 제 23 항에 있어서,
    상기 제 1 이득값을 결정하는 단계는,
    상기 음성신호의 에너지를 기초로 상기 음성신호의 세기 레벨을 확인하는 단계;
    상기 확인된 세기 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및
    상기 확인된 이득값을 상기 제 1 이득값으로 결정하는 단계; 를 포함하는 차량의 제어방법.
  25. 제 23 항에 있어서,
    상기 제 2 이득값을 결정하는 단계는,
    상기 음성신호의 피크값을 기초로 상기 음성신호의 피크 레벨을 확인하는 단계;
    상기 확인된 피크 레벨에 대응되는 이득값을 상기 테이블로부터 확인하는 단계; 및
    상기 확인된 이득값을 상기 제 2 이득값으로 결정하는 단계; 를 포함하는 차량의 제어방법.
  26. 제 21 항에 있어서,
    상기 음성신호를 증폭시키는 단계는,
    상기 음성신호의 에너지가 증폭 불요 에너지 이상이면 상기 음성신호를 증폭하지 않는 단계; 를 더 포함하는 차량의 제어방법.
KR1020150065258A 2015-05-11 2015-05-11 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 KR20160132574A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150065258A KR20160132574A (ko) 2015-05-11 2015-05-11 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법
US14/942,492 US9503041B1 (en) 2015-05-11 2015-11-16 Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150065258A KR20160132574A (ko) 2015-05-11 2015-05-11 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법

Publications (1)

Publication Number Publication Date
KR20160132574A true KR20160132574A (ko) 2016-11-21

Family

ID=57276863

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150065258A KR20160132574A (ko) 2015-05-11 2015-05-11 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법

Country Status (2)

Country Link
US (1) US9503041B1 (ko)
KR (1) KR20160132574A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112564655A (zh) * 2019-09-26 2021-03-26 大众问问(北京)信息科技有限公司 一种音频信号增益控制方法、装置、设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691016B (zh) * 2019-09-29 2021-08-31 歌尔股份有限公司 一种基于音频设备实现的交互方法及音频设备
CN114915275A (zh) * 2021-02-08 2022-08-16 祖玛视频通讯公司 两级数字自动增益控制

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870292A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 車両用音声認識装置
JPS6082700U (ja) 1983-11-10 1985-06-07 東京サウンド株式会社 ピツクアツプ取り付け装置
US5303308A (en) * 1992-07-07 1994-04-12 Gn Netcom A/S Audio frequency signal compressing system
JP2500761Y2 (ja) 1994-03-30 1996-06-12 株式会社アルファ 音声認識装置
JPH08278796A (ja) 1995-04-10 1996-10-22 Fujitsu Ten Ltd 音声処理装置
JP4880136B2 (ja) 2000-07-10 2012-02-22 パナソニック株式会社 音声認識装置および音声認識方法
JP4321049B2 (ja) 2002-07-29 2009-08-26 パナソニック電工株式会社 自動利得制御装置
CN102203854B (zh) * 2008-10-29 2013-01-02 杜比国际公司 使用预先存在的音频增益元数据的信号削波保护
JP5157944B2 (ja) * 2009-02-06 2013-03-06 富士通セミコンダクター株式会社 高周波送信機の出力回路
JP5614767B2 (ja) 2009-04-14 2014-10-29 アルパイン株式会社 音声処理装置
JP5457293B2 (ja) 2010-07-14 2014-04-02 アルパイン株式会社 音声認識装置
US8582786B2 (en) * 2011-06-15 2013-11-12 Alpine Electronics, Inc. Automatic gain control of amplifier by dynamic suppressing and output control at multiple stages
JP2013153307A (ja) * 2012-01-25 2013-08-08 Sony Corp 音声処理装置および方法、並びにプログラム
US8638249B2 (en) * 2012-04-16 2014-01-28 Infineon Technologies Ag System and method for high input capacitive signal amplifier

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112564655A (zh) * 2019-09-26 2021-03-26 大众问问(北京)信息科技有限公司 一种音频信号增益控制方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US20160336912A1 (en) 2016-11-17
US9503041B1 (en) 2016-11-22

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
US9812125B2 (en) Speech recognition device, vehicle having the same, and speech recognition method
US11003414B2 (en) Acoustic control system, apparatus and method
US10170111B2 (en) Adaptive infotainment system based on vehicle surrounding and driver mood and/or behavior
WO2017081960A1 (ja) 音声認識制御システム
US6587824B1 (en) Selective speaker adaptation for an in-vehicle speech recognition system
US8005681B2 (en) Speech dialog control module
KR101579533B1 (ko) 차량 및 그 제어 방법
CN106469556B (zh) 语音识别装置、具有语音识别装置的车辆、控制车辆方法
GB2565627A (en) System and method for selective volume adjustment in a vehicle
JP2006227499A (ja) 音声認識装置
KR20160132574A (ko) 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법
JP2016167645A (ja) 音声処理装置及び制御装置
US20110301954A1 (en) Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system
US20190379777A1 (en) Voice recognition apparatus, vehicle including the same, and control method thereof
JP5326843B2 (ja) 感情推定装置及び感情推定方法
KR20220073513A (ko) 대화 시스템, 차량 및 대화 시스템의 제어 방법
JP2009073417A (ja) 騒音制御装置および方法
JP2000322074A (ja) 音声入力区間判定装置,音声データ抽出装置,音声認識装置,車両用ナビゲーション装置及び入力用マイク
KR101875440B1 (ko) 차량 및 그 제어방법
KR101630159B1 (ko) 차량 및 그 제어방법
KR20170089670A (ko) 차량 및 그 제어방법
KR101561098B1 (ko) 차량 및 그 제어 방법
KR101710695B1 (ko) 차량용 음성 인식을 위한 마이크로폰 제어 시스템 및 그 제어 방법
JP4765394B2 (ja) 音声対話装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment