KR101804765B1 - 차량 및 그 제어방법 - Google Patents

차량 및 그 제어방법 Download PDF

Info

Publication number
KR101804765B1
KR101804765B1 KR1020160002637A KR20160002637A KR101804765B1 KR 101804765 B1 KR101804765 B1 KR 101804765B1 KR 1020160002637 A KR1020160002637 A KR 1020160002637A KR 20160002637 A KR20160002637 A KR 20160002637A KR 101804765 B1 KR101804765 B1 KR 101804765B1
Authority
KR
South Korea
Prior art keywords
voice
speech recognition
speech
confidence value
signal
Prior art date
Application number
KR1020160002637A
Other languages
English (en)
Other versions
KR20170083320A (ko
Inventor
이창헌
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020160002637A priority Critical patent/KR101804765B1/ko
Publication of KR20170083320A publication Critical patent/KR20170083320A/ko
Application granted granted Critical
Publication of KR101804765B1 publication Critical patent/KR101804765B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

음성 인식 결과의 신뢰값이 임계값 이하인 경우에 시작 지점을 지연시켜 음성 구간을 재검출함으로써 음성 신호의 앞단에 존재하는 노이즈를 효과적으로 제거하고, 음성 구간 검출의 정확도를 향상시킬 수 있는 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법을 제공한다.
음성 인식 장치는, 음성 신호로부터 제1음성 구간을 검출하고, 상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진; 및 상기 계산된 신뢰값이 임계값 이하인지 여부를 판단하는 결과 처리부;를 포함하고, 상기 음성 인식 엔진은, 상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출한다.

Description

차량 및 그 제어방법{VEHICLE AND CONTROL METHOD FOR THE SAME}
개시된 발명은 사용자의 음성을 인식하고, 인식된 음성에 따라 특정 기능을 수행하는 차량 및 그 제어방법에 관한 것이다.
차량에 대한 기술이 발전함에 따라, 차량이 수행하는 기본적인 기능인 주행 이외에도 사용자의 편의를 위한 다양한 기능이 제공되고 있다.
이처럼 차량이 수행할 수 있는 기능이 다양해지면서 사용자의 조작 부하가 증가되고, 조작 부하의 증가는 운전에 대한 집중도를 저하시켜 안전 운전을 방해하는 요인이 된다. 또한, 기기의 조작이 미숙한 사용자는 차량이 수행할 수 있는 기능을 제대로 활용하지 못하게 된다.
따라서, 사용자의 조작 부하를 감소시키기 위한 사용자 인터페이스에 대한 연구 및 개발이 요구되는바, 특히, 사용자의 음성을 인식하여 해당 음성에 대응되는 기능을 수행하는 음성 인식 기술이 차량에 적용되면, 사용자의 조작 부하를 효과적으로 감소시킬 수 있을 것으로 기대된다.
음성 인식 결과의 신뢰값이 임계값 이하인 경우에 시작 지점을 지연시켜 음성 구간을 재검출함으로써 음성 신호의 앞단에 존재하는 노이즈를 효과적으로 제거하고, 음성 구간 검출의 정확도를 향상시킬 수 있는 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법을 제공한다.
음성 인식 장치는, 음성 신호로부터 제1음성 구간을 검출하고, 상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진; 및 상기 계산된 신뢰값이 임계값 이하인지 여부를 판단하는 결과 처리부;를 포함하고, 상기 음성 인식 엔진은, 상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출한다.
상기 음성 인식 엔진은, 상기 제2음성 구간에 대해 음성 인식을 수행하여 제2음성 인식 결과를 생성하고, 상기 제2음성 인식 결과의 신뢰값을 계산하고, 상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 입력 신호로부터 상기 제2음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제3음성 구간을 검출할 수 있다.
입력 신호로부터 에코 신호를 제거하는 에코 제거기; 및 상기 에코 신호가 제거된 입력 신호를 저장하는 메모리;를 더 포함하고, 상기 음성 인식 엔진은, 상기 메모리로부터 상기 입력 신호를 제공 받을 수 있다.
다른 음성 인식 장치는, 음성 신호로부터 시작 지점을 검출하고, 상기 검출된 시작 지점에 기초하여 제1음성 구간을 검출하는 음성 검출부; 및 상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진;을 포함하고, 상기 음성 검출부는, 상기 입력 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출한다.
상기 음성 검출부는, 상기 제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출할 수 있다.
상기 음성 검출부는, 미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출할 수 있다.
상기 음성 인식 엔진이 계산하는 신뢰값을 상기 임계값과 비교하고, 미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고 신호를 생성하는 결과 처리부;를 더 포함할 수 있다.
차량은, 사용자로부터 음성 신호를 입력 받는 음성 입력부; 상기 음성 신호로부터 시작 지점을 검출하고, 상기 검출된 시작 지점에 기초하여 제1음성 구간을 검출하는 음성 검출부; 및 상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진; 을 포함하고, 상기 음성 검출부는, 상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출한다.
상기 음성 검출부는, 상기 제1음성 인식 결과에 대한 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출할 수 있다.
상기 음성 검출부는, 미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출할 수 있다.
상기 신뢰값이 임계값을 초과하면, 상기 음성 인식 결과에 대응되는 제어 신호를 생성하는 제어부;를 더 포함할 수 있다.
상기 음성 인식 엔진은, 제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에, 상기 제2음성 구간에 대해 음성 인식을 수행하는 차량.
상기 음성 인식 엔진이 계산하는 신뢰값을 임계값과 비교하고, 미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고 신호를 생성하는 결과 처리부;를 더 포함할 수 있다.
음성 인식 방법은, 음성 신호로부터 제1음성 구간을 검출하고; 상기 제1음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고; 상기 제1음성 인식 결과의 신뢰값을 계산하고; 상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간에 대해 음성 인식을 수행하여 제2음성 인식 결과를 생성하는 것을 포함한다.
상기 제2음성 인식 결과를 생성하는 것은, 상기 제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출하는 것을 포함할 수 있다.
상기 제2음성 인식 결과를 생성하는 것은, 미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출하는 것을 포함할 수 있다.
미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고를 출력하는 것;을 더 포함할 수 있다.
일 측면에 따른 음성 인식 장치, 이를 포함하는 차량, 및 음성 인식 방법에 의하면, 음성 인식 결과의 신뢰값이 임계값 이하인 경우에 시작 지점을 지연시켜 음성 구간을 재검출함으로써 음성 신호의 앞단에 존재하는 노이즈를 효과적으로 제거하고, 음성 구간 검출의 정확도를 향상시킬 수 있다.
도 1은 일 실시예에 따른 차량의 제어 블록도이다.
도 2는 일 실시예에 따른 차량을 외부에서 바라본 외관도이고, 도 3은 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.
도 4는 일 실시예에 따른 차량에 있어서, 음성 인식 장치의 구성에 관한 일 예시를 나타낸 제어 블록도이다.
도 5는 일 실시예에 따른 차량에 있어서, 음성 인식 엔진을 복수 개 구비하는 음성 인식 장치의 예시를 나타내는 제어 블록도이다.
도 6은 일 실시예에 따른 차량에 있어서, 음성 검출 모듈을 별도로 포함하는 음성 인식 장치의 예시를 나타낸 제어 블록도이다.
도 7은 일 실시예에 따른 차량에 있어서, 음성 검출 모듈을 별도로 포함하고, 음성 인식 엔진이 복수 개 구비되는 음성 인식 장치의 예시를 나타낸 제어 블록도이다.
도 8은 일 실시예에 따른 음성 인식 방법의 순서도이다.
도 9는 일 실시예에 따른 음성 인식 방법에 있어서, 음성 인식을 병렬적으로 수행할 수 있는 경우에 관한 순서도이다.
이하 첨부된 도면을 참조하여 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법에 관한 실시예를 상세하게 설명하도록 한다.
도 1은 일 실시예에 따른 차량의 제어 블록도이다.
도 1을 참조하면, 차량(100)은 사용자의 음성을 입력 받는 음성 입력부(110), 입력된 사용자의 음성을 인식하는 음성 인식 장치(120) 및 인식된 음성에 대응되는 이벤트가 실행되도록 제어하는 제어부(131)를 포함한다. 개시된 발명의 실시예에서, 사용자는 차량(100)에 탑승한 운전자 및 동승자를 모두 포함하는 것으로 한다.
음성 입력부(110)는 마이크로폰(microphone)을 포함할 수 있고, 사용자의 발화(utterance)된 음성이 입력되면 이를 전기적 신호로 변환하여 음성 인식 장치(120)로 출력한다.
음성 인식 장치(120)는 음성 인식 엔진(speech recognition engine)을 포함하고, 음성 인식 엔진은 입력된 음성 신호에 음성 인식(speech recognition) 알고리즘을 적용하여 사용자가 발화한 음성을 인식하고, 인식 결과를 생성할 수 있다.
이 때, 음성 신호는 음성 인식을 위한 더 유용한 형태로 변환될 수 있는바, 음성 신호로부터 시작 지점과 끝 지점을 검출하여 음성 신호에 포함된 실제 음성 구간을 검출한다. 이를 EPD(End Point Detection)이라 한다.
그리고, 검출된 구간 내에서 켑스트럼(Cepstrum), 선형 예측 코딩(Linear Predictive Coefficient: LPC), 멜프리퀀시켑스트럼(Mel Frequency Cepstral Coefficient: MFCC) 또는 필터 뱅크 에너지(Filter Bank Energy) 등의 특징 벡터 추출 기술을 적용하여 음성 신호의 특징 벡터를 추출할 수 있다.
그리고, 추출된 특징 벡터와 훈련된 기준 패턴과의 비교를 통하여 인식 결과를 얻을 수 있다. 이를 위해, 음성의 신호적인 특성을 모델링하여 비교하는 음향 모델(Acoustic Model) 과 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델(Language Model)이 사용될 수 있다.
음향 모델은 다시 인식 대상을 특징 벡터 모델로 설정하고 이를 음성 데이터의 특징 벡터와 비교하는 직접 비교 방법과 인식 대상의 특징 벡터를 통계적으로 처리하여 이용하는 통계 방법을 나뉠 수 있다.
직접 비교 방법은 인식 대상이 되는 단어, 음소 등의 단위를 특징 벡터 모델로 설정하고 입력 음성이 이와 얼마나 유사한지를 비교하는 방법으로서, 대표적으로 벡터 양자화(Vector Quantization) 방법이 있다. 벡터 양자화 방법에 의하면 입력된 음성 데이터의 특징 벡터를 기준 모델인 코드북(codebook)과 매핑시켜 대표 값으로 부호화함으로써 이 부호 값들을 서로 비교하는 방법이다.
통계적 모델 방법은 인식 대상에 대한 단위를 상태 열(State Sequence)로 구성하고 상태 열 간의 관계를 이용하는 방법이다. 상태 열은 복수의 노드(node)로 구성될 수 있다. 상태 열 간의 관계를 이용하는 방법은 다시 동적 시간 와핑(Dynamic Time Warping: DTW), 히든 마르코프 모델(Hidden Markov Model: HMM), 신경 회로망을 이용한 방식 등이 있다.
동적 시간 와핑은 같은 사람이 같은 발음을 해도 신호의 길이가 시간에 따라 달라지는 음성의 동적 특성을 고려하여 기준 모델과 비교할 때 시간 축에서의 차이를 보상하는 방법이고, 히든 마르코프 모델은 음성을 상태 천이 확률 및 각 상태에서의 노드(출력 심볼)의 관찰 확률을 갖는 마르코프 프로세스로 가정한 후에 학습 데이터를 통해 상태 천이 확률 및 노드의 관찰 확률을 추정하고, 추정된 모델에서 입력된 음성이 발생할 확률을 계산하는 인식 기술이다.
한편, 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델은 언어를 구성하는 단위들 간의 순서 관계를 음성 인식에서 얻어진 단위들에 적용함으로써 음향적인 모호성을 줄이고 인식의 오류를 줄일 수 있다. 언어 모델에는 통계적 언어 모델과 유한 상태 네트워크(Finite State Automata: FSA)에 기반한 모델이 있고, 통계적 언어 모델에는 Unigram, Bigram, Trigram 등 단어의 연쇄 확률이 이용된다.
음성 인식 장치(120)는 음성을 인식함에 있어 상술한 방식 중 어느 방식을 사용해도 무방하다. 예를 들어, 히든 마르코프 모델이 적용된 음향 모델을 사용할 수도 있고, 음향 모델과 음성 모델을 통합한 N-best 탐색법을 사용할 수 있다. N-best 탐색법은 음향 모델과 언어 모델을 이용하여 N개까지의 인식 결과 후보를 선택한 후, 이들 후보의 순위를 재평가함으로써 인식 성능을 향상시킬 수 있다.
음성 인식 장치(120)는 인식 결과의 신뢰성을 확보하기 위해 신뢰값(confidence value)을 계산할 수 있다. 신뢰값은 음성 인식 결과에 대해서 그 결과를 얼마나 믿을 만한 것인가를 나타내는 척도이다. 일 예로, 인식된 결과인 음소나 단어에 대해서, 그 외의 다른 음소나 단어로부터 그 말이 발화되었을 확률에 대한 상대값으로 정의할 수 있다. 따라서, 신뢰값은 0 에서 1 사이의 값으로 표현할 수도 있고, 0 에서 100 사이의 값으로 표현할 수도 있다.
신뢰값이 미리 설정된 임계값(threshold)을 초과하는 경우에는 인식 결과를 출력할 수 있고, 신뢰값이 임계값 이하인 경우에는 인식 결과를 거절(rejection)할 수 있다.
신뢰값이 임계값 이하가 되는 원인 중 하나로 사용자가 발화한 음성이 아닌 노이즈 또는 사용자가 의도한 명령어가 아닌 노이즈 등이 음성 신호에 포함된 경우를 들 수 있다. 특히, 사용자가 의도한 명령어가 시작되기 이전부터 음성 인식을 수행하게 되면, 음성 인식의 결과의 신뢰성이 떨어질 수 있다.
따라서, 음성 인식 장치(120)는 음성 인식 결과에 대한 신뢰값이 미리 설정된 임계값 이하이면, 시작 지점을 지연시켜 음성 구간을 새롭게 검출하여 음성 인식을 다시 수행할 수 있다.
그리고, 신뢰값이 임계값을 초과하는 인식 결과가 생성될 때까지 상기 동작을 반복함으로써, 음성 신호의 앞단에 존재하는 노이즈를 효과적으로 감소시킬 수 있다.
음성 인식 장치(120)에서 음성 구간을 재검출하는 구체적인 동작에 대해서는 후술하도록 한다.
음성 인식 장치(120)는 소프트웨어, 하드웨어 또는 이들의 조합을 이용하여 컴퓨터로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서(processor), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(micro-processor) 등의 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다.
소프트웨어적인 구현에 의하면, 적어도 하나의 기능 또는 동작을 수행하는 별개의 소프트웨어 모듈과 함께 구현될 수 있고, 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다.
사용자의 발화된 음성에는 차량의 제어를 위한 명령어가 포함될 수 있는바, 제어부(131)는 음성 인식 장치(120)에서 음성 인식 결과로서 출력되는 명령어에 따라 차량(100)에 대한 제어를 수행할 수 있다.
도 2는 일 실시예에 따른 차량을 외부에서 바라본 외관도이고, 도 3은 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.
도 2는 참조하면, 일 실시예에 따른 차량(100)은 차량(100)의 외관을 형성하는 본체(1), 차량(100)을 이동시키는 차륜(51, 52), 차륜(51, 52)을 회전시키는 구동 장치(60), 차량(100) 내부를 외부로부터 차폐시키는 도어(71, 72(도 2 참조)), 차량(100) 내부의 운전자에게 차량(100) 전방의 시야를 제공하는 전면 유리(30), 운전자에게 차량(100) 후방의 시야를 제공하는 사이드 미러(81, 82)를 포함한다.
차륜(51, 52)은 차량의 전방에 마련되는 전륜(51), 차량의 후방에 마련되는 후륜(52)을 포함하며, 구동 장치(60)는 본체(1)가 전방 또는 후방으로 이동하도록 전륜(51) 또는 후륜(52)에 회전력을 제공한다. 이와 같은 구동 장치(60)는 화석 연료를 연소시켜 회전력을 생성하는 엔진(engine) 또는 축전기(미도시)로부터 전원을 공급받아 회전력을 생성하는 모터(motor)를 채용할 수 있다.
도어(71, 72)는 본체(1)의 좌측 및 우측에 회동 가능하게 마련되어 개방 시에 운전자가 차량(100)의 내부에 탑승할 수 있도록 하며, 폐쇄 시에 차량(100)의 내부를 외부로부터 차폐시킨다.
전면 유리(30)는 본체(100)의 전방 상측에 마련되어 차량(100) 내부의 운전자가 차량(100) 전방의 시각 정보를 획득할 수 있도록 하는 것으로서, 윈드쉴드 글래스(windshield glass)라고도 한다.
또한, 사이드 미러(81, 82)는 본체(1)의 좌측에 마련되는 좌측 사이드 미러(81) 및 우측에 마련되는 우측 사이드 미러(82)를 포함하며, 차량(100) 내부의 운전자가 차량(100) 측면 및 후방의 시각 정보를 획득할 수 있도록 한다.
이외에도 차량(100)은 후면 또는 측면의 장애물 내지 다른 차량을 감지하는 근접 센서, 강수 여부 및 강수량을 감지하는 레인 센서 등의 감지 장치를 포함할 수 있다.
도 3을 참조하여 차량(100)의 내부 구조를 설명한다.
대시보드(10)의 중앙 영역인 센터페시아(11)에는 AVN(Audio Video Navigation) 디스플레이(141)와 AVN 입력부(142)가 마련될 수 있다. AVN 장치(140)는 오디오, 비디오 및 내비게이션 기능을 통합적으로 수행할 수 있는 장치로서, AVN 디스플레이(141)는 오디오 화면, 비디오 화면 및 내비게이션 화면 중 적어도 하나를 선택적으로 표시할 수 있고, 뿐만 아니라 차량(100)의 제어와 관련된 각종 제어 화면 또는 AVN 장치(140)에서 실행할 수 있는 부가 기능과 관련된 화면을 표시할 수 있다.
AVN 디스플레이(141)는 LCD(Liquid Crystal Display), LED(Light Emitting Diode), PDP(Plasma Display Panel), OLED(Organic Light Emitting Diode), CRT(Cathode Ray Tube) 등으로 구현될 수 있다.
사용자는 AVN 입력부(142)를 조작하여 AVN(140)을 제어하기 위한 명령을 입력할 수 있다. AVN 입력부(142)는 도 3에 도시된 바와 같이 AVN 디스플레이(141)와 인접한 영역에 하드 키 타입으로 마련될 수도 있고, AVN 디스플레이(141)가 터치 스크린 타입으로 구현되는 경우에는 AVN 디스플레이(141)가 AVN 입력부(142)의 기능도 함께 수행할 수 있다.
차량(100)의 내부에는 음향을 출력할 수 있는 스피커(143)가 마련되는바, 오디오 기능, 비디오 기능, 내비게이션 기능 및 기타 부가 기능을 수행함에 있어 필요한 음향이 스피커(143)를 통해 출력될 수 있다.
운전석(21) 쪽의 대시보드(10)에는 스티어링 휠(12)이 마련되며, 스티어링 휠(12)에는 휠 입력부(162)가 마련되어 운전 중인 운전자가 스티어링 휠(12)에서 손을 떼지 않은 상태에서도 차량(100)의 제어와 관련된 명령을 입력할 수 있도록 한다
한편, 센터 콘솔(40)에는 죠그 셔틀(jog shuttle) 타입 또는 하드 키 타입의 센터 입력부(43)가 마련될 수 있다. 센터 콘솔(40)은 운전석(21)과 조수석(22) 사이에 위치하여 기어조작 레버(41)와 트레이(42)가 형성된 부분을 의미한다. 센터 입력부(43)는 AVN 입력부(142)의 전부 또는 일부 기능을 수행하거나, 휠 입력부(162)의 전부 또는 일부 기능을 수행할 수 있다.
차량(100)에는 공조 장치가 구비되어 난방 및 냉방을 모두 수행할 수 있으며, 가열되거나 냉각된 공기를 통풍구(153)를 통해 배출하여 차량(100) 내부의 온도를 제어할 수 있다. 온도 제어를 위한 사용자의 명령은 공조 입력부(151)를 통해 입력될 수 있다.
일 실시예에 따른 차량(100)은 사용자가 AVN 입력부(142), 휠 입력부(162) 또는 센터 입력부(43) 등을 조작하여 입력하는 제어 명령을 음성 입력부(110)를 통해 사용자의 음성으로 입력 받을 수도 있다.
효과적인 음성의 입력을 위하여 음성 입력부(110)는 도 3에 도시된 바와 같이 헤드라이닝(13)에 장착될 수 있으나, 차량(100)의 실시예가 이에 한정되는 것은 아니며, 대시보드(10) 위에 장착되거나 스티어링 휠(12)에 장착되는 것도 가능하다. 이 외에도 운전 중인 사용자의 음성을 입력 받기에 적합한 위치이면 어디든 제한이 없다.
도 4는 일 실시예에 따른 차량에 있어서, 음성 인식 장치의 구성에 관한 일 예시를 나타낸 제어 블록도이다.
도 4를 참조하면, 음성 인식 장치(120)는 입력된 음성 신호로부터 음성 구간을 검출하고, 검출된 음성 구간에 대해 음성 인식을 수행하고, 음성 인식 결과에 대한 신뢰값을 계산하는 음성 인식 엔진(121) 및 신뢰값과 미리 설정된 임계값을 비교하여 음성 구간의 재검출 여부를 판단하는 결과 처리부(122)를 포함할 수 있다.
한편, 음성 입력부(110)에는 음성 신호뿐만 아니라 에코 신호도 입력될 수 있다. 차량(100)에 마련된 스피커(143)로부터 출력된 음향 신호가 음성 입력부(110)에 입력되면, 이를 에코 신호라 한다.
에코 신호는 차량(100)으로부터 출력되는 것이므로, 차량(100)은 에코 신호에 대한 정보를 미리 알 수 있다. 따라서, 차량(100)은 에코 신호를 음성 신호로부터 제거하기 위한 에코 제거기(132) 및 에코 신호가 제거된 음성 신호를 저장하는 메모리(133)를 더 포함할 수 있다. 메모리(133)는 에코 신호가 제거된 음성 신호가 음성 인식 장치(120)에 입력되기 전에 일시적으로 저장되는 버퍼일 수 있다.
음성 신호에서 에코 신호가 제거되었더라도 전술한 바와 같은 노이즈는 여전히 음성 신호에 포함될 수 있다. 따라서, 에코 신호가 제거된 음성 신호가 메모리(133)를 거쳐 음성 인식 장치(120)로 입력되면, 음성 인식 장치(120)는 음성 인식 결과의 신뢰값에 따라 음성 구간의 재검출을 수행할 수 있다. 이하, 음성 구간의 재검출에 관한 동작을 구체적으로 설명한다.
음성 인식 엔진(121)은 입력된 음성 신호로부터 제1음성 구간을 검출하고, 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성할 수 있다. 그리고, 제1음성 인식 결과에 대해 신뢰값을 계산한다.
결과 처리부(122)는 신뢰값을 미리 설정된 임계값과 비교하고, 신뢰값이 미리 설정된 임계값 이하이면 음성 인식 엔진(121)에 음성구간 재검출 신호를 전달할 수 있다.
결과 처리부(122)로부터 음성구간 재검출 신호가 전달되면, 음성 인식 엔진(121)은 입력된 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 시간적으로 뒤에 위치하는 시작 지점을 갖는 제2음성 구간을 검출할 수 있다. 예를 들어, 제1음성 구간의 시작 지점이 t1인 경우에, 제2음성 구간의 시작 지점은 t1보다 시간적으로 뒤에 위치하는 t2이 될 수 있다. 즉, 시작 지점을 지연시켜 음성 구간을 재검출할 수 있다.
이 때, 시작 지점의 지연 시간은 실험, 시뮬레이션, 통계 등에 따라 미리 설정될 수도 있고, 임의의 값을 가질 수도 있으며, 입력되는 음성 신호의 특성에 따라 결과 처리부(122)에서 실시간으로 설정하는 것도 가능하다.
음성 인식 엔진(121)은 제2음성 구간에 대해서 다시 음성 인식을 수행하여 제2음성 인식 결과를 생성할 수 있고, 제2음성 인식 결과에 대해 신뢰값을 계산한다.
결과 처리부(122)는 제2음성 인식 결과에 대한 신뢰값을 임계값과 비교하고, 제2음성 인식 결과에 대한 신뢰값도 임계값 이하인 경우에는 다시 음성구간 재검출 신호를 음성 인식 엔진(121)에 전달할 수 있다.
결과 처리부(122)로부터 음성구간 재검출 신호가 전달되면, 음성 인식 엔진(121)은 입력된 음성 신호로부터 상기 제2음성 구간의 시작 지점보다 시간적으로 뒤에 위치하는 시작 지점을 갖는 제3음성 구간을 검출할 수 있다. 예를 들어, 제2음성 구간의 시작 지점이 t2인 경우에, 제3음성 구간의 시작 지점은 t2보다 지연된 t3이 될 수 있다.
상기 과정을 제n음성 구간(n은 2 이상의 정수)을 검출할 때까지 할 수 있다. 따라서, n이 2로 설정된 경우에는 전술한 예시에서 제3음성 구간은 검출되지 않는다. 다만, 제n음성 구간까지 검출하지 않더라도 미리 설정된 기준 시간이 경과할 때까지 신뢰값이 임계값을 초과하는 인식 결과가 생성되지 않으면, 결과 출력부(122)는 사용자의 재발화를 유도하기 위한 경고 신호를 생성할 수 있다. 즉, 제n음성 구간까지 검출되거나, 미리 설정된 기준 시간이 경과할 때까지 신뢰값이 임계값을 초과하는 인식 결과가 생성되지 않으면, 경고가 출력된다.
결과 출력부(122)의 경고 신호는 제어부(131)로 전달될 수 있고, 제어부(131)는 전달된 경고 신호에 따라 차량(100)에 마련된 디스플레이부 또는 음향 출력부를 제어하여 사용자에게 경고를 출력할 수 있다.
신뢰값이 임계값을 초과하는 경우, 결과 처리부(122)는 제어부(131)에 해당 인식 결과를 전달하고, 제어부(131)는 인식 결과에 대응되는 명령어에 따라 차량(100)을 제어할 수 있다.
제어부(131)는 음성 인식 장치(120)에서 인식한 명령어에 대응되는 이벤트를 발생시키기 위한 제어를 실행할 수 있다. 예를 들어, 인식된 명령어에 따라 특정인에게 전화를 발신할 수도 있고, 내비게이션 기능을 제어할 수도 있으며, 오디오 기능을 제어할 수도 있다. 또는, 차량 공조 장치를 이용하여 차량(100) 내부의 온도를 제어하는 것도 가능하다.
또한, 제어부(131)는 음성 인식 장치(120)에서의 음성 인식 결과를 AVN 디스플레이(141) 또는 음향 출력부(143)를 통해 사용자에게 제공함으로써, 음성 인식 결과를 최종적으로 확인받는 것도 가능하다.
도 5는 일 실시예에 따른 차량에 있어서, 음성 인식 엔진을 복수 개 구비하는 음성 인식 장치의 예시를 나타내는 제어 블록도이다.
전술한 도 4의 예시에서는 음성 인식 장치(120)에 음성 인식 엔진(121)이 한 개 구비되어, 하나의 음성 구간에 대한 음성 인식이 완료되면, 그 다음 음성 구간에 대한 음성 인식을 순차적으로 수행하였다.
다른 예시에 따르면, 도 5에 도시된 바와 같이, 음성 인식 장치(100)가 복수의 음성 인식 엔진(121-1,??,121-n)(n은 2 이상의 정수)을 포함하여 음성 인식을 병렬적으로 수행하는 것도 가능하다.
구체적으로, 제1음성 인식 엔진(121-1)에서는 t1을 시작 지점으로 하는 제1음성 구간을 검출하여, 이에 대해 음성 인식을 수행하고, 제n음성 인식 엔진(121-n)에서는 tn을 시작 지점으로 하는 제n음성 구간을 검출하여, 이에 대해 음성 인식을 수행할 수 있다. 여기서, t1보다 tn이 시간적으로 뒤에 위치함은 물론이다.
또한, n이 3 이상인 경우에는 1과 n 사이의 음성 인식 엔진들도 각각 서로 다른 시작 지점을 갖는 음성 구간을 검출하여 음성 인식을 수행할 수 있다.
각각의 음성 인식 엔진에서 출력되는 신뢰값은 결과 처리부(122)에 전달되고, 결과 처리부(122)는 각각의 신뢰값을 미리 설정된 임계값과 비교한다. 임계값을 초과하는 인식 결과가 복수인 경우에는, 이들 중 하나의 인식 결과를 채택할 수 있다. 예를 들어, 신뢰값이 가장 높은 인식 결과를 채택하여 제어부(131)에 전달할 수 있다.
임계값을 초과하는 신뢰값을 갖는 인식 결과가 존재하지 않는 경우에는, 제어부(131)에 경고 신호를 전달할 수 있고, 제어부(131)는 디스플레이부나 음향 출력부를 통해 사용자의 재발화를 유도하기 위한 경고를 출력할 수 있다.
한편, 전술한 도 4 및 도 5의 예시에서는 음성 구간의 검출이 음성 인식 엔진(121)에 내장된 EPD 모듈에서 이루어질 수 있다. 차량(100)의 실시예가 이에 한정되는 것은 아닌바, 다른 예시에 따르면, 음성 인식 엔진(121) 외부에 음성 인식 결과의 신뢰값에 따라 음성 구간을 재검출하기 위한 별도의 음성 검출 모듈을 더 포함하는 것도 가능하다. 이하, 구체적인 예시를 설명한다.
도 6은 일 실시예에 따른 차량에 있어서, 음성 검출 모듈을 별도로 포함하는 음성 인식 장치의 예시를 나타낸 제어 블록도이다.
도 6을 참조하면, 음성 인식 장치(120)는 입력된 음성 신호로부터 음성 신호로부터 시작 지점을 검출하고, 상기 검출된 시작 지점에 기초하여 음성 구간을 검출하는 음성 검출부(123)를 더 포함할 수 있다.
음성 검출부(123)가 검출한 음성 구간은 음성 인식 엔진(121)으로 전달될 수 있고, 음성 인식 엔진(121)은 음성 구간에 대해 음성 인식을 수행한다. 여기서, 음성 인식은 시작 지점과 끝 지점의 검출, 즉 EPD를 포함할 수 있다. 즉, 음성 검출부(123)가 1차적으로 음성 신호 앞단의 노이즈를 제거하여 음성 인식 엔진(121)으로 전달하면, 음성 인식 엔진(121)은 전달된 음성 신호에 EPD를 적용하여 2차적으로 노이즈를 제거할 수 있다.
당해 예시에 따르면, 기존의 음성 인식 엔진을 그대로 사용하면서, 음성 인식 엔진에 내장된 EPD 모듈보다 우수한 성능을 갖는 음성 검출 모듈을 추가함으로써 음성 인식 결과의 신뢰성을 간편하게 향상시킬 수 있다.
한편, 음성 검출부(123)는 시작 지점만 검출하여 음성 구간을 정의하는 것도 가능하고, 음성 인식 엔진(121)에 포함된 EPD 모듈과 같이 시작 지점과 끝 지점을 모두 검출하여 음성 구간을 정의하는 것도 가능하다.
구체적으로, 음성 검출부(123)는 음성 신호로부터 시작 지점 t1을 검출하고, 검출된 시작 지점에 기초하여 제1음성 구간을 검출한다. 검출된 제1음성 구간은 음성 인식 엔진(121)에 전달되고, 음성 인식 엔진(121)은 제1음성 구간에 대해 음성 인식을 수행하여 신뢰값을 계산한다. 전술한 바와 같이, 음성 인식에는 EPD가 포함될 수 있다.
결과 처리부(122)는 제1음성 구간에 대한 음성 인식 결과의 신뢰값과 미리 설정된 임계값을 비교한다. 신뢰값이 임계값 이하인 경우에는 음성 검출부(123)에 음성구간 재검출 신호를 전달하고, 음성 검출부(123)는 t1보다 지연된 t2를 시작 지점으로 갖는 제2음성 구간을 검출한다.
제2음성 구간은 음성 인식 엔진(121)에 전달되고, 음성 인식 엔진(121)은 제2음성 구간에 대해 음성 인식을 수행하여 신뢰값을 계산한다. 결과 처리부(122)는 제2음성 구간에 대한 음성 인식 결과의 신뢰값을 미리 설정된 임계값고 비교하고 신뢰값이 임계값 이하인 경우에는 다시 음성 검출부(123)에 음성 구간 재검출 신호를 전달한다.
전술한 바와 마찬가지로, 제n음성 구간까지 검출되거나, 미리 설정된 기준 시간이 경과할 때까지 신뢰값이 임계값을 초과하는 인식 결과가 생성되지 않으면, 경고가 출력된다.
또는, 음성 검출부(123)가 음성구간 재검출 신호의 전달 여부와 무관하게 순차적으로 지연시켜 제1음성 구간, 제2음성 구간,??, 제n음성 구간을 미리 검출하는 것도 가능하다. 이 때, 지연되는 시간은 미리 설정될 수 있다. 또한, 검출된 음성 구간은 음성 검출부(123)에 마련된 메모리 또는 에코 신호가 제거된 음성 신호를 저장하는 메모리(133)에 저장될 수 있다.
이 경우, 결과 처리부(122)가 음성구간 재검출 신호를 출력하면, 다음 시간 지연된 음성 구간이 음성 인식 엔진(121)에 입력될 수 있다. 예를 들어, 제1음성 구간에 대한 음성 인식 결과의 신뢰값이 임계값 이하이면, 제2음성 구간이 음성 인식 엔진(121)에 입력될 수 있다.
도 7은 일 실시예에 따른 차량에 있어서, 음성 검출 모듈을 별도로 포함하고, 음성 인식 엔진이 복수 개 구비되는 음성 인식 장치의 예시를 나타낸 제어 블록도이다.
도 7을 참조하면 음성 인식 장치(120)는 음성 인식 엔진(121)과 별개로 음성 검출부(123)를 포함하는 동시에 복수의 음성 인식 엔진(121-1,??,121-n)(n은 2 이상의 정수)을 포함하여 음성 인식을 병렬적으로 수행하는 것도 가능하다.
음성 검출부(123)는 시작 지점을 지연시켜 제1음성 구간,??, 제n음성 구간을 순차적으로 검출하고, 각각의 음성 구간을 제1음성 인식 엔진(121-1),??,제n음성 인식 엔진(121-n)에 입력할 수 있다.
각각의 음성 인식 엔진에서 출력되는 신뢰값은 결과 처리부(122)에 전달되고, 결과 처리부(122)는 각각의 신뢰값을 미리 설정된 임계값과 비교한다. 임계값을 초과하는 인식 결과가 복수인 경우에는, 이들 중 하나의 인식 결과를 채택할 수 있다. 예를 들어, 신뢰값이 가장 높은 인식 결과를 채택하여 제어부(131)에 전달할 수 있다.
임계값을 초과하는 신뢰값을 갖는 인식 결과가 존재하지 않는 경우에는, 제어부(131)에 경고 신호를 전달할 수 있고, 제어부(131)는 디스플레이부나 음향 출력부를 통해 사용자의 재발화를 유도하기 위한 경고를 출력할 수 있다.
이하, 음성 인식 방법의 실시예를 설명한다. 음성 인식 방법의 실시예를 수행하기 위해 전술한 음성 인식 장치(120) 또는 차량(100)이 사용될 수 있는바, 전술한 도 1 내지 도 7의 설명은 음성 인식 방법의 실시예에도 동일하게 적용될 수 있다.
도 8은 일 실시예에 따른 음성 인식 방법의 순서도이다.
도 8을 참조하면, 음성 입력부(110)를 통해 음성 신호를 입력 받는다(310).
음성 신호에서 에코 신호를 제거하고(311), 에코 신호가 제거된 음성 신호를 저장한다(312).
에코 신호가 제거된 음성 신호로부터 음성 구간을 검출한다(313). 여기서, 검출되는 음성 구간은 제1음성 구간이라 할 수 있고, 음성 구간의 검출은 음성 인식 엔진(121)에 내장된 EPD 모듈 또는 별도의 음성 검출부(123)에서 이루어질 수 있다.
검출된 음성 구간에 대해 음성 인식을 수행한다(314). 음성 구간의 검출이 별도의 음성 검출부(123)에서 이루어진 경우에는, 당해 단계의 음성 인식이 EPD를 포함하는 것도 가능하다.
인식 결과에 대한 신뢰값을 계산하고(315), 계산된 신뢰값이 임계값(Th)를 초과하는 경우(316의 예)에는 인식 결과에 따른 제어를 수행한다(318). 이를 위해, 결과 처리부(122)가 제어부(131)에 인식 결과를 전달하면, 제어부(131)는 인식 결과인 명령어에 대응되는 이벤트를 실행할 수 있다.
계산된 신뢰값이 임계값(Th) 이하인 경우(316의 아니오)에는 음성구간을 재검출한다(317). 구체적으로, 제1음성 구간의 시작 지점보다 시간적으로 뒤에 위치하는 시작 지점을 갖는 제2음성 구간을 검출할 수 있다. 예를 들어, 제1음성 구간의 시작 지점이 t1인 경우에, 제2음성 구간의 시작 지점은 t1보다 시간적으로 뒤에 위치하는 t2이 될 수 있다. 즉, 시작 지점을 지연시켜 음성 구간을 재검출할 수 있다.
그리고, 재검출된 음성 구간에 대해 음성 인식을 수행하고(314), 신뢰값을 계산하고(315), 신뢰값과 임계값(Th)을 비교(316)하는 과정을 반복한다.
상기 과정을 제n음성 구간(n은 2 이상의 정수)을 검출할 때까지 할 수 있다. 다만, 제n음성 구간까지 검출하지 않더라도 미리 설정된 기준 시간이 경과할 때까지 신뢰값이 임계값을 초과하는 인식 결과가 생성되지 않으면, 사용자의 재발화를 유도하기 위한 경고 신호를 생성할 수 있다. 즉, 제n음성 구간까지 검출되거나, 미리 설정된 기준 시간이 경과할 때까지 신뢰값이 임계값을 초과하는 인식 결과가 생성되지 않으면, 경고가 출력된다.
한편, 당해 예시에서는 계산된 신뢰값이 임계값(Th) 이하인 경우에 음성 구간을 재검출하는 것으로 설명하였으나, 음성 인식 방법의 실시예가 이에 한정되는 것은 아닌바, 신뢰값이 임계값 이하인지 여부와 무관하게 순차적으로 시작 지점을 지연시켜 제1음성 구간, 제2음성 구간,??, 제n음성 구간을 미리 검출하는 것도 가능하다. 이 경우, 검출된 음성 구간은 음성 검출부(123)에 마련된 메모리 또는 에코 신호가 제거된 음성 신호를 저장하는 메모리(133)에 저장될 수 있다.
도 9는 일 실시예에 따른 음성 인식 방법에 있어서, 음성 인식을 병렬적으로 수행할 수 있는 경우에 관한 순서도이다. 당해 예시에 따른 음성 인식 방법을 수행하기 위해, 전술한 도 5의 예시와 같이, 복수의 음성 인식 엔진(121-1,??,121-n)(n은 2 이상의 정수)을 포함하는 음성 인식 장치(120)를 사용할 수 있다.
도 9를 참조하면, 음성 입력부(110)를 통해 음성 신호를 입력 받는다(320).
음성 신호에서 에코 신호를 제거하고(321), 에코 신호가 제거된 음성 신호를 저장한다(322).
제1음성 인식 엔진(121-1)에서는 t1을 시작 지점으로 하는 제1음성 구간을 검출하여(323-1), 이에 대해 음성 인식을 수행하고(324-1), 인식 결과에 대한 신뢰값을 계산할 수 있다(325-1).
제n음성 인식 엔진(121-n)에서는 tn을 시작 지점으로 하는 제n음성 구간을 검출하여(323-n), 이에 대해 음성 인식을 수행하고(324-n), 인식 결과에 대한 신뢰값을 계산할 수 있다(325-n). 여기서, t1보다 tn이 시간적으로 뒤에 위치함은 물론이다.
또한, n이 3 이상인 경우에는 1과 n 사이의 음성 인식 엔진들도 각각 서로 다른 시작 지점을 갖는 음성 구간을 검출하여 음성 인식을 수행할 수 있다.
당해 예시에서도 마찬가지로, 음성 구간의 검출은 별도의 음성 검출부(123)에서 이루어질 수도 있고, 음성 인식 엔진에 내장된 EPD 모듈에서 이루어질 수도 있다. 전자의 경우, 음성 인식 단계에 EPD도 포함될 수 있다.
각각의 음성 인식 엔진에서 출력되는 신뢰값은 결과 처리부(122)에 전달되고, 결과 처리부(122)는 각각의 신뢰값을 미리 설정된 임계값과 비교한다. 예를 들어, 제1음성 구간에 대한 신뢰값이 임계값(Th)을 초과하고(326-1의 예), 제n음성 구간에 대한 신뢰값 역시 임계값(Th)을 초과하는 경우에는, 신뢰값이 가장 높은 인식 결과를 채택하여(327) 제어부(131)에 전달함으로써 인식 결과에 따른 제어를 수행할 수 있다(328).
전술한 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법에 따르면, 음성 인식 결과의 신뢰값이 임계값 이하인 경우에 시작 지점을 지연시켜 음성 구간을 재검출함으로써 음성 신호의 앞단에 존재하는 노이즈를 효과적으로 제거하고, 음성 구간 검출의 정확도를 향상시킬 수 있다.
100 : 차량 110 : 음성 입력부
120 : 음성 인식 장치 121 : 음성 인식 엔진
122 : 결과 출력부 131 : 제어부
132: 에코 제거기 133: 메모리

Claims (17)

  1. 음성 신호로부터 제1음성 구간을 검출하고, 상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진; 및
    상기 계산된 신뢰값이 임계값 이하인지 여부를 판단하는 결과 처리부;를 포함하고,
    상기 음성 인식 엔진은,
    상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출하고,
    상기 지연된 시작 지점은 입력되는 상기 음성 신호의 특성에 따라 상기 결과 처리부에서 실시간으로 설정하는 음성 인식 장치.
  2. 제 1 항에 있어서
    상기 음성 인식 엔진은,
    상기 제2음성 구간에 대해 음성 인식을 수행하여 제2음성 인식 결과를 생성하고, 상기 제2음성 인식 결과의 신뢰값을 계산하고, 상기 계산된 신뢰값이 임계값 이하인 경우에, 입력 신호로부터 상기 제2음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제3음성 구간을 검출하는 음성 인식 장치.
  3. 제 2 항에 있어서,
    상기 음성 신호로부터 에코 신호를 제거하는 에코 제거기; 및
    상기 에코 신호가 제거된 상기 음성 신호를 저장하는 메모리;를 더 포함하고,
    상기 음성 인식 엔진은,
    상기 메모리로부터 상기 음성 신호를 제공 받는 음성 인식 장치.
  4. 음성 신호로부터 시작 지점을 검출하고, 상기 검출된 시작 지점에 기초하여 제1음성 구간을 검출하는 음성 검출부; 및
    상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진;을 포함하고,
    상기 음성 검출부는,
    상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출하고,
    상기 지연된 시작 지점은 입력되는 상기 음성 신호의 특성에 따라 결과 처리부에서 실시간으로 설정하는 음성 인식 장치.
  5. 제 4 항에 있어서,
    상기 음성 검출부는,
    상기 제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출하는 음성 인식 장치.
  6. 제 4 항에 있어서,
    상기 음성 검출부는,
    미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출하는 음성 인식 장치.
  7. 제 5항에 있어서,
    상기 음성 인식 엔진이 계산하는 신뢰값을 상기 임계값과 비교하고, 미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고 신호를 생성하는 결과 처리부;를 더 포함하는 음성 인식 장치.
  8. 사용자로부터 음성 신호를 입력 받는 음성 입력부;
    상기 음성 신호로부터 시작 지점을 검출하고, 상기 검출된 시작 지점에 기초하여 제1음성 구간을 검출하는 음성 검출부; 및
    상기 제1 음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고, 상기 제1음성 인식 결과의 신뢰값을 계산하는 음성 인식 엔진; 을 포함하고,
    상기 음성 검출부는,
    상기 음성 신호로부터 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간을 검출하고,
    상기 지연된 시작 지점은 입력되는 상기 음성 신호의 특성에 따라 결과 처리부에서 실시간으로 설정하는 차량.
  9. 제 8 항에 있어서
    상기 음성 검출부는,
    상기 제1음성 인식 결과에 대한 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출하는 차량.
  10. 제 8 항에 있어서,
    상기 음성 검출부는,
    미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출하는 차량.
  11. 제 8 항에 있어서,
    상기 신뢰값이 임계값을 초과하면, 음성 인식 결과에 대응되는 제어 신호를 생성하는 제어부;를 더 포함하는 차량.
  12. 제 9 항 또는 제 10 항에 있어서,
    상기 음성 인식 엔진은,
    제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에, 상기 제2음성 구간에 대해 음성 인식을 수행하는 차량.
  13. 제 8 항에 있어서,
    상기 음성 인식 엔진이 계산하는 신뢰값을 임계값과 비교하고, 미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고 신호를 생성하는 결과 처리부;를 더 포함하는 차량.
  14. 음성 신호로부터 제1음성 구간을 검출하고;
    상기 제1음성 구간에 대해 음성 인식을 수행하여 제1음성 인식 결과를 생성하고;
    상기 제1음성 인식 결과의 신뢰값을 계산하고;
    상기 계산된 신뢰값이 임계값 이하인 경우에, 상기 제1음성 구간의 시작 지점보다 지연된 시작 지점을 갖는 제2음성 구간에 대해 음성 인식을 수행하여 제2음성 인식 결과를 생성하는 것을 포함하고,
    상기 지연된 시작 지점은 입력되는 상기 음성 신호의 특성에 따라 설정되는음성 인식 방법.
  15. 제 14 항에 있어서,
    상기 제2음성 인식 결과를 생성하는 것은,
    상기 제1음성 인식 결과의 신뢰값이 임계값 이하인 경우에 상기 제2음성 구간을 검출하는 것을 포함하는 음성 인식 방법.
  16. 제 14 항에 있어서,
    상기 제2음성 인식 결과를 생성하는 것은,
    미리 설정된 지연 시간에 따라 상기 제1음성 구간과 상기 제2음성 구간을 검출하는 것을 포함하는 음성 인식 방법.
  17. 제 14 항에 있어서,
    미리 설정된 시간 동안 상기 임계값을 초과하는 신뢰값을 갖는 음성 인식 결과가 생성되지 않으면 경고를 출력하는 것;을 더 포함하는 음성 인식 방법.
KR1020160002637A 2016-01-08 2016-01-08 차량 및 그 제어방법 KR101804765B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160002637A KR101804765B1 (ko) 2016-01-08 2016-01-08 차량 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160002637A KR101804765B1 (ko) 2016-01-08 2016-01-08 차량 및 그 제어방법

Publications (2)

Publication Number Publication Date
KR20170083320A KR20170083320A (ko) 2017-07-18
KR101804765B1 true KR101804765B1 (ko) 2018-01-10

Family

ID=59430665

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160002637A KR101804765B1 (ko) 2016-01-08 2016-01-08 차량 및 그 제어방법

Country Status (1)

Country Link
KR (1) KR101804765B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236087A (ja) * 2000-02-21 2001-08-31 Seiko Epson Corp 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP3526911B2 (ja) * 1993-04-20 2004-05-17 クラリオン株式会社 音声認識装置及び音声認識方法
JP2010055044A (ja) * 2008-04-22 2010-03-11 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3526911B2 (ja) * 1993-04-20 2004-05-17 クラリオン株式会社 音声認識装置及び音声認識方法
JP2001236087A (ja) * 2000-02-21 2001-08-31 Seiko Epson Corp 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP2010055044A (ja) * 2008-04-22 2010-03-11 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム

Also Published As

Publication number Publication date
KR20170083320A (ko) 2017-07-18

Similar Documents

Publication Publication Date Title
KR101598948B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법
US10854195B2 (en) Dialogue processing apparatus, a vehicle having same, and a dialogue processing method
KR101579533B1 (ko) 차량 및 그 제어 방법
US9756161B2 (en) Voice recognition apparatus, vehicle having the same, and method of controlling the vehicle
JP6977004B2 (ja) 車載装置、発声を処理する方法およびプログラム
JP2017090612A (ja) 音声認識制御システム
US10770070B2 (en) Voice recognition apparatus, vehicle including the same, and control method thereof
KR102339443B1 (ko) 상황 기반 동작 결정 장치, 상황 기반 동작 결정이 가능한 차량, 상황 기반 동작 결정 방법 및 상기 차량의 제어 방법
US11783806B2 (en) Dialogue system and dialogue processing method
KR101804765B1 (ko) 차량 및 그 제어방법
US10158745B2 (en) Vehicle and communication control method for determining communication data connection for the vehicle
KR101681988B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법
US20230315997A9 (en) Dialogue system, a vehicle having the same, and a method of controlling a dialogue system
KR101875440B1 (ko) 차량 및 그 제어방법
US9503041B1 (en) Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle
KR20220073513A (ko) 대화 시스템, 차량 및 대화 시스템의 제어 방법
KR101630159B1 (ko) 차량 및 그 제어방법
KR101741661B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
KR101804766B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
KR102527346B1 (ko) 차량용 음성 인식 장치, 이를 이용한 차량의 주행상태를 고려한 응답 제공 방법 및 컴퓨터 프로그램
US20210303263A1 (en) Dialogue system and vehicle having the same, and method of controlling dialogue system
KR20180075031A (ko) 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)