KR101630159B1 - 차량 및 그 제어방법 - Google Patents

차량 및 그 제어방법 Download PDF

Info

Publication number
KR101630159B1
KR101630159B1 KR1020140177423A KR20140177423A KR101630159B1 KR 101630159 B1 KR101630159 B1 KR 101630159B1 KR 1020140177423 A KR1020140177423 A KR 1020140177423A KR 20140177423 A KR20140177423 A KR 20140177423A KR 101630159 B1 KR101630159 B1 KR 101630159B1
Authority
KR
South Korea
Prior art keywords
interface
voice
control command
occupant
interrupt
Prior art date
Application number
KR1020140177423A
Other languages
English (en)
Inventor
허동필
조성동
이승호
임규형
이윤재
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020140177423A priority Critical patent/KR101630159B1/ko
Application granted granted Critical
Publication of KR101630159B1 publication Critical patent/KR101630159B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K28/00Safety devices for propulsion-unit control, specially adapted for, or arranged in, vehicles, e.g. preventing fuel supply or ignition in the event of potentially dangerous conditions
    • B60K28/02Safety devices for propulsion-unit control, specially adapted for, or arranged in, vehicles, e.g. preventing fuel supply or ignition in the event of potentially dangerous conditions responsive to conditions relating to the driver
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Transportation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

음성 인식 진행 중 탑승자의 특징정보를 기초로 음성 인식을 중단하는 인터럽트를 발생하는 차량 및 그 제어방법을 제공한다.
일 실시예에 따른 차량은, 음성 인식 인터페이스를 제공하는 출력부; 음성 인식 인터페이스를 통해 탑승자의 음성을 획득하는 마이크로폰; 획득한 음성을 인식하는 음성 인식부; 인식된 음성에 대응되는 제어명령을 생성하는 제어부; 탑승자의 영상을 획득하는 카메라; 및 획득된 영상을 기초로 탑승자의 특징 정보를 획득하고, 탑승자의 특징 정보에 따라 제어명령의 생성을 중단시키는 인터럽트를 제어부로 전송하는 인터럽트 발생 모듈; 을 포함할 수 있다.

Description

차량 및 그 제어방법{VEHICLE AND CONTROLLING METHOD THEREOF}
음성 인식이 가능한 차량 및 그 제어방법에 관한 발명이다.
차량에 대한 기술이 발전함에 따라, 차량이 수행하는 기본적인 기능인 주행 이외에도 운전자의 편의를 위한 다양한 기능이 제공되고 있다.
이처럼 차량이 수행할 수 있는 기능이 다양해지면서 운전자의 조작 부하가 증가되고, 조작 부하의 증가는 운전에 대한 집중도를 저하시켜 안전 운전을 방해하는 요인이 된다. 또한, 기기의 조작이 미숙한 운전자는 차량이 수행할 수 있는 기능을 제대로 활용하지 못하게 된다.
따라서, 운전자의 조작 부하를 감소시키기 위한 시스템의 연구 및 개발이 요구되는바, 특히, 운전자의 음성을 인식하여 해당 음성에 대응되는 기능을 수행하는 음성 인식 기술이 차량에 적용되면, 운전자의 조작 부하를 효과적으로 감소시킬 수 있을 것으로 기대된다.
개시된 발명의 일 실시예에 따르면, 음성 인식 진행 중 탑승자의 특징정보를 기초로 음성 인식을 중단하는 인터럽트를 발생하는 차량 및 그 제어방법을 제공한다.
일 실시예에 따른 차량은, 음성 인식 인터페이스를 제공하는 출력부; 음성 인식 인터페이스를 통해 탑승자의 음성을 획득하는 마이크로폰; 획득한 음성을 인식하는 음성 인식부; 인식된 음성에 대응되는 제어명령을 생성하는 제어부; 탑승자의 영상을 획득하는 카메라; 및 획득된 영상을 기초로 탑승자의 특징 정보를 획득하고, 탑승자의 특징 정보에 따라 제어명령의 생성을 중단시키는 인터럽트를 제어부로 전송하는 인터럽트 발생 모듈; 을 포함할 수 있다.
또한, 인터럽트 발생 모듈은, 획득된 영상을 이용하여, 탑승자의 동공 크기를 포함하는 특징 정보를 획득할 수 있다.
또한, 인터럽트 발생 모듈은, 탑승자의 동공이 제 1 임계값 이상으로 확대되면, 제 1 인터럽트를 제어부로 전송할 수 있다.
또한, 제어부는, 제 1 인터럽트를 수신하면 제어명령의 생성을 중단하고, 음성 인식 인터페이스의 사용방법을 설명하는 도움말 인터페이스를 제공하도록 출력부를 제어할 수 있다.
또한, 출력부는, 제어부의 제어에 따라, 명령어 정보를 포함하는 도움말 인터페이스를 제공하는 것을 포함할 수 있다.
또한, 출력부는, 적어도 하나의 하위 인터페이스, 및 하위 인터페이스의 선택명령을 입력 받는 상위 인터페이스를 포함하는 음성 인식 인터페이스를 제공할 수 있다.
또한, 제어부는, 출력부가 하위 인터페이스를 제공할 때, 제 1 인터럽트를 수신하면 제어명령의 생성을 중단하고, 상위 인터페이스를 제공하도록 출력부를 제어할 수 있다.
또한, 출력부는, 제 1 길이의 안내 음성을 포함하는 제 1 음성 인터페이스, 및 제 1 길이보다 짧은 제 2 길이의 안내 음성을 포함하는 제 2 음성인터페이스를 포함하는 음성인터페이스를 제공할 수 있다.
또한, 제어부는, 출력부가 제 2 음성 인터페이스를 제공할 때, 제 1 인터럽트를 수신하면 제어명령의 생성을 중단하고, 제 1 인터페이스를 제공하도록 출력부를 제어할 수 있다.
또한, 인터럽트 발생 모듈은, 탑승자의 동공이 제 2 임계값 이하로 축소되면, 제 2 인터럽트를 제어부로 전송할 수 있다.
또한, 출력부는, 제 2 길이의 안내 음성을 포함하는 제 2 음성 인터페이스, 및 제 2 길이보다 짧은 제 3 길이의 안내 음성을 포함하는 제 3 음성인터페이스를 포함하는 음성인터페이스를 제공할 수 있다.
또한, 제어부는, 출력부가 제 2 음성 인터페이스를 제공할 때, 제 2 인터럽트를 수신하면 제어명령의 생성을 중단하고, 제 3 인터페이스를 제공하도록 출력부를 제어할 수 있다.
또한, 탑승자의 특징 정보에 따라 제어명령의 생성을 중단여부를 결정하는 명령을 입력 받는 입력부; 를 더 포함할 수 있다.
일 실시예에 따른 음성 인식 인터페이스를 제공하여 탑승자의 음성을 입력 받고, 입력 받은 음성을 기초로 제어명령을 생성하는 차량의 제어방법에 있어서, 탑승자의 영상을 획득하는 단계; 획득된 영상을 기초로 탑승자의 특징 정보를 획득하는 단계; 및 탑승자의 특징 정보에 따라 제어명령의 생성을 중단하는 단계; 를 포함할 수 있다.
또한, 탑승자의 특징 정보를 획득하는 단계는, 획득된 영상을 이용하여, 탑승자의 동공 크기를 획득하는 것을 포함할 수 있다.
또한, 제어명령의 생성을 중단하는 단계는, 탑승자의 동공이 제 1 임계값 이상으로 확대되면, 제어명령의 생성을 중단할 수 있다.
또한, 제어명령의 생성을 중단한 후, 음성 인식 인터페이스의 사용방법을 설명하는 도움말 인터페이스를 제공하는 단계; 를 더 포함할 수 있다.
또한, 도움말 인터페이스를 제공하는 단계는, 명령어 정보를 포함하는 도움말 인터페이스를 제공할 수 있다.
또한, 음성 인식 인터페이스는, 적어도 하나의 하위 인터페이스, 및 하위 인터페이스의 선택명령을 입력 받는 상위 인터페이스를 포함할 수 있다.
또한, 하위 인터페이스를 제공 중 제어명령의 생성을 중단한 경우, 상위 인터페이스를 제공하는 단계; 를 더 포함할 수 있다.
또한, 음성 인식 인터페이스는, 제 1 길이의 안내 음성을 포함하는 제 1 음성 인터페이스, 및 제 1 길이보다 짧은 제 2 길이의 안내 음성을 포함하는 제 2 음성인터페이스를 포함할 수 있다.
또한, 제 2 음성 인터페이스를 제공 중 제어명령의 생성을 중단한 경우, 제 1 인터페이스를 제공하는 단계; 를 더 포함할 수 있다.
또한, 제어명령의 생성을 중단하는 단계는, 탑승자의 동공이 제 2 임계값 이하로 축소되면, 제어명령의 생성을 중단할 수 있다.
또한, 음성 인식 인터페이스는, 제 2 길이의 안내 음성을 포함하는 제 2 음성 인터페이스, 및 제 2 길이보다 짧은 제 3 길이의 안내 음성을 포함하는 제 3 음성인터페이스를 포함할 수 있다.
또한, 제 2 음성 인터페이스를 제공 중 제어명령의 생성을 중단한 경우, 제 3 인터페이스를 제공하는 단계; 를 더 포함할 수 있다.
또한, 탑승자의 특징 정보에 따라 제어명령의 생성을 중단여부를 결정하는 명령을 입력 받는 단계; 를 더 포함할 수 있다.
개시된 차량 및 그 제어방법에 따르면, 음성 인식에 익숙지 않은 탑승자가 용이하게 음성 인식을 진행하도록 돕는 인터페이스를 제공할 수 있다. 그 결과, 탑승자의 음성에 대한 인식률을 높이고, 궁극적으로 탑승자의 의도에 맞는 제어명령을 생성할 수 있다.
도 1은 일 실시예에 따른 차량의 외관을 도시한 도면이다.
도 2는 차량의 일 실시예에 따른 내부 구성을 나타낸 도면이다.
도 3은 일 실시예에 따른 차량의 제어 블록도이다.
도 4는 일 실시예에 따른 인터럽트 발생 모듈의 제어 블록도이다.
도 5는 일 실시예에 따른 차량 제어방법의 흐름도이다.
도 6은 다른 실시예에 따른 차량 제어방법의 흐름도이다.
도 7은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
도 8은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
도 9는 또 다른 실시예에 따른 차량 제어방법의 흐름도이다.
이하 첨부된 도면을 참조하여 차량용 디스플레이 장치, 및 그 제어방법을 상세하게 설명하도록 한다.
도 1은 일 실시예에 따른 차량의 외관을 도시한 도면이다.
도 1과 같이, 차량의 일 실시예는 차량(1)의 외관을 형성하는 본체(10), 차량(1)을 이동시키는 차륜(21, 22), 차륜(21, 22)을 회전시키는 구동 장치(미도시), 차량(1) 내부를 외부로부터 차폐시키는 도어(14), 차량(1) 내부의 운전자에게 차량(1) 전방의 시야를 제공하는 전면 유리(17), 운전자에게 차량(1) 후방의 시야를 제공하는 사이드 미러(18, 19)를 포함한다.
차륜(21, 22)은 차량의 전방에 마련되는 전륜(21), 차량의 후방에 마련되는 후륜(22)을 포함하며, 구동 장치(미도시)는 본체(10)가 전방 또는 후방으로 이동하도록 전륜(21) 또는 후륜(22)에 회전력을 제공한다. 이와 같은 구동 장치(미도시)는 화석 연료를 연소시켜 회전력을 생성하는 엔진(engine) 또는 축전기(미도시)로부터 전원을 공급받아 회전력을 생성하는 모터(motor)를 채용할 수 있다.
도어(14)는 본체(10)의 좌측 및 우측에 회동 가능하게 마련되어 개방 시에 운전자가 차량(1)의 내부에 탑승할 수 있도록 하며, 폐쇄 시에 차량(1)의 내부를 외부로부터 차폐시킨다.
전면 유리(17)는 본체(10)의 전방 상측에 마련되어 차량(1) 내부의 운전자가 차량(1) 전방의 시각 정보를 획득할 수 있도록 하는 것으로서, 윈드쉴드 글라스(Windshield Glass)라고도 한다.
또한, 사이드 미러(18, 19)는 본체(1)의 좌측에 마련되는 좌측 사이드 미러(18) 및 우측에 마련되는 우측 사이드 미러(19)를 포함하며, 차량(1) 내부의 운전자가 차량(1) 측면 및 후방의 시각 정보를 획득할 수 있도록 한다.
도 2는 차량의 일 실시예에 따른 내부 구성을 나타낸 도면이다.
도 2에 도시된 바와 같이, 차량(100)은 운전자 등이 탑승하는 시트(110)와, 기어 박스(120), 센터페시아(130) 및 스티어링 휠(140) 등이 마련된 대시보드(150)(dashboard)를 포함할 수 있다.
기어 박스(120)에는 차량(100) 변속을 위한 변속 레버(121)와, 차량(100)의 기능 수행을 제어하기 위한 다이얼 조작부(122)가 설치될 수 있다.
스티어링 휠(140)은 차량(100)의 주행 방향을 조절하기 위한 장치로, 운전자에 의해 파지되는 림(141) 및 차량(100)의 조향 장치와 연결되고 림(141)과 조향을 위한 회전축의 허브를 연결하는 스포크(142)를 포함할 수 있다. 실시 예에 따라서 스포크(142)에는 차량(100) 내의 각종 장치, 일례로 오디오 장치 등을 제어하기 위한 조작 장치(142a, 142b)가 형성될 수 있다.
뿐만 아니라, 스티어링 휠(140)에는 음성 인식을 시작하는 명령을 입력 받는 음성 인식 시작 버튼이 마련될 수 있다. 이에 대하여는 후술하도록 한다.
한편, 대시보드(150)는 차량(100)의 주행 속도, 엔진 회전 수 또는 연료 잔량 등을 표시할 수 있는 각종 계기판 및 각종 물건을 수납할 수 있는 글로브 박스(globe box) 등을 더 포함할 수도 있다. 아울러, 차량(100)의 내부 패널 등에는 차량용 스피커(162)가 설치될 수 있으며, 차량용 스피커(162)는 차량(100) 내부에 음향을 제공할 수 있다.
센터페시아(130)에는 공조 장치(131), 시계(132), 오디오 장치(133) 및 디스플레이 장치(200) 등이 설치될 수 있다.
공조 장치(131)는 차량(100) 내부의 온도, 습도, 공기의 청정도, 공기의 흐름을 조절하여 차량(100)의 내부를 쾌적하게 유지한다. 공조 장치(131)는 센터페시아(130)에 설치되고 공기를 토출하는 적어도 하나의 토출구(131a)를 포함할 수 있다. 센터페시아(130)에는 공조 장치(131) 등을 제어하기 위한 버튼이나 다이얼 등이 설치될 수 있다. 운전자 등의 탑승자는 센터페시아(130)에 배치된 버튼을 이용하여 공조 장치(131)를 제어할 수 있다.
시계(132)는 공조 장치(131)를 제어하기 위한 버튼이나 다이얼 주위에 마련될 수 있다.
오디오 장치(133)는 오디오 장치(133)의 기능 수행을 위한 다수의 버튼들이 마련된 조작패널을 포함할 수 있다. 오디오 장치(133)는 라디오 기능을 제공하는 라디오 모드와 오디오 파일이 담긴 다양한 저장매체의 오디오 파일을 재생하는 미디어 모드를 제공할 수 있다.
디스플레이는 차량과 관련된 정보, 및 제어 명령을 입력 받기 위한 다양한 인터페이스를 운전자에게 제공할 수 있다. 예를 들어, 디스플레이는 주행과 관련된 정보를 표시하는 인터페이스, 오디오 장치와 관련된 정보를 포함하는 인터페이스, 비디오 장치와 관련된 정보를 포함하는 인터페이스, 내비게이션 관련 정보를 포함하는 인터페이스, 외부에서 연결된 외부기기의 정보를 포함하는 인터페이스를 표시할 수 있다.
이를 위해, 디스플레이는 센터페시아(130)에 매립되어 형성될 수 있다. 다만, 디스플레이의 설치 예가 이에 한정되는 것은 아니며, 디스플레이는 차량(100)의 센터페시아(130)와 분리 가능하도록 마련될 수도 있다.
이 때, 디스플레이는 LCD(Liquid Crystal Display), LED(Light Emitting Diode), PDP(Plasma Display Panel), OLED(Organic Light Emitting Diode), CRT(Cathode Ray Tube) 등으로 구현될 수 있으나, 이에 한정되지는 않는다.
한편, 일 실시예에 따른 차량은 운전자를 포함하는 탑승자의 음성을 인식하고, 인식된 음성에 따라 차량을 제어하는 음성 인식 기술이 적용될 수 있다. 이하에서는, 음성 인식이 가능한 차량에 대하여 상세히 설명한다.
도 3은 일 실시예에 따른 차량의 제어 블록도이고, 도 4는 일 실시예에 따른 인터럽트 발생 모듈의 제어 블록도이다.
음성 인식 시작 버튼(143)은 탑승자로부터 음성 인식 시작 명령을 입력 받을 수 있다. 예를 들어, 운전자가 주행 중에 음성 인식을 통해 차량을 제어하고자 할 때, 운전자는 음성 인식 시작 버튼(143)을 통해 음성 인식 시작 명령을 입력할 수 있다.
음성 인식 시작 버튼(143)은, 도 2와 같이, 스티어링 휠에 마련될 수 있다. 그러나 이는 음성 인식 시작 버튼(143)이 마련되는 위치의 일 실시예에 불과하므로, 차량의 탑승자가 음성 인식 시작 명령을 입력할 수 있는 기술적 사상 안에서 다양하게 구현될 수 있다.
음성 인식 시작 버튼(143)은 탑승자가 인가하는 압력을 감지하는 감압식 버튼, 및 탑승자의 접촉에 따른 전류 변화를 감지하는 정전식 버튼을 포함할 수 있다.
탑승자로부터 음성 인식 시작 명령이 입력되면, 출력부(160)는 탑승자에게 음성 인식 인터페이스를 제공할 수 있다. 이 때, 출력부(160)는 디스플레이(161) 및 스피커(162)를 포함할 수 있고, 음성 인식 인터페이스는 디스플레이(161)에 의해 제공되는 영상 인터페이스와 스피커(162)에 의해 제공되는 음성 인터페이스를 포함할 수 있다.
음성 인식 인터페이스 중 영상 인터페이스는 음성 인식과 관련된 정보를 영상을 통해 제공할 수 있다. 예를 들어, 영상 인터페이스는 탑승자가 선택 가능한 항목을 영상으로 제공할 수 있다. 이 때, 선택 가능한 항목이란, 이동하고자 하는 하위의 인터페이스, 및 생성하고자 하는 차량의 제어명령을 포함할 수 있다.
음성 인식 인터페이스 중 음성 인터페이스는 음성 인식과 관련된 정보를 음성을 통해 제공할 수 있다. 예를 들어, 음성 인터페이스는 탑승자가 선택 가능한 항목을 안내 음성을 출력하여 제공할 수 있다.
음성 인식 인터페이스가 제공되면, 탑승자는 음성을 발화할 수 있다. 마이크로폰은 이렇게 발화된 탑승자의 음성을 획득하여 음성 인식부(300)로 전달할 수 있다. 구체적으로, 마이크로폰은 탑승자의 음성을 전기적 신호인 음성 신호로 변환하여 획득할 수 있다.
마이크로폰으로부터 음성 신호가 전달되면, 음성 인식부(300)는 음성 신호에 음성 인식(speech recognition) 알고리즘 또는 음성 인식 엔진(speech recognition engine)을 적용하여 탑승자의 음성을 인식할 수 있다.
이 때, 음성 신호는 음성 인식을 위한 더 유용한 형태로 변환될 수 있는바, 음성 인식부(300)는 입력된 음성 신호를 아날로그 신호에서 디지털 신호로 변환하고, 음성의 시작과 끝 지점을 검출하여 음성 신호에 포함된 실제 음성 구간을 검출한다. 이를 EPD(End Point Detection)이라 한다.
그리고, 검출된 구간 내에서 켑스트럼(Cepstrum), 선형 예측 코딩(Linear Predictive Coefficient: LPC), 멜프리퀀시켑스트럼(Mel Frequency Cepstral Coefficient: MFCC) 또는 필터 뱅크 에너지(Filter Bank Energy) 등의 특징 벡터 추출 기술을 적용하여 음성 데이터(VD)의 특징 벡터를 추출할 수 있다.
이렇게 추출된 특징 벡터와 훈련된 기준 패턴과의 비교를 통하여 인식 결과를 얻을 수 있다. 이를 위해, 음성의 신호적인 특성을 모델링하여 비교하는 음향 모델(Acoustic Model) 과 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델(Language Model)이 사용될 수 있다.
음향 모델은 다시 인식 대상을 특징 벡터 모델로 설정하고 이를 음성 신호의 특징 벡터와 비교하는 직접 비교 방법과 인식 대상의 특징 벡터를 통계적으로 처리하여 이용하는 통계 방법을 나뉠 수 있다.
직접 비교 방법은 인식 대상이 되는 단어, 음소 등의 단위를 특징 벡터 모델로 설정하고 입력 음성이 이와 얼마나 유사한지를 비교하는 방법으로서, 대표적으로 벡터 양자화(Vector Quantization) 방법이 있다. 벡터 양자화 방법에 의하면 입력된 음성 신호의 특징 벡터를 기준 모델인 코드북(codebook)과 매핑시켜 대표 값으로 부호화함으로써 이 부호 값들을 서로 비교하는 방법이다.
통계적 모델 방법은 인식 대상에 대한 단위를 상태 열(State Sequence)로 구성하고 상태 열 간의 관계를 이용하는 방법이다. 상태 열은 복수의 노드(node)로 구성될 수 있다. 상태 열 간의 관계를 이용하는 방법은 다시 동적 시간 와핑(Dynamic Time Warping: DTW), 히든 마르코프 모델(Hidden Markov Model: HMM), 신경 회로망을 이용한 방식 등이 있다.
음성 인식 장치(120)는 소프트웨어, 하드웨어 또는 이들의 조합을 이용하여 컴퓨터로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서(processor), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(micro-processor) 등의 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다.
소프트웨어적인 구현에 의하면, 적어도 하나의 기능 또는 동작을 수행하는 별개의 소프트웨어 모듈과 함께 구현될 수 있고, 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다.
음성 인식부(300)에 의해 음성이 인식되면, 제어부(400)는 인식된 음성에 따라 차량 전반을 제어할 수 있다. 구체적으로, 제어부(400)는 인식된 음성에 대응되는 제어명령을 제어하고자 하는 차량과 연계된 적어도 하나의 구성으로 전달할 수 있다.
제어명령을 생성하기에 앞서, 제어부(400)는 인식된 음성에 대응되는 제어명령을 저장부(500)에서 확인할 수 있다. 저장부(500)는 명령어와 제어명령의 관계가 미리 저장될 수 있다.
구체적으로, 제어부(400)는 인식된 음성에 대응되는 명령어를 결정할 수 있다. 만약, 인식된 음성에 대응되는 명령어가 결정되지 않으면, 제어부(400)는 음성 재입력을 알리는 인터페이스를 제공하도록 출력부(160)를 제어할 수 있다.
그 다음으로, 제어부(400)는 결정된 명령어에 대응되는 제어명령을 저장부(500)에서 검색할 수 있다. 예를 들어, 인식된 음성이 "play" 라는 명령어로 결정되면, "play" 라는 명령어에 대응되는 제어명령이 비디오 장치 재생 명령임을 확인할 수 있다.
인식된 음성에 대응되는 제어명령을 확인한 후, 제어부(400)는 확인된 제어명령을 생성할 수 있다. 제어명령은 차량과 연계된 장치를 제어하는 전기적인 신호일 수 있다.
예를 들어, 제어명령은 오디오 장치, 비디오 장치, 및 내비게이션과 같은 차량의 일 구성, 또는 차량과 연결된 외부장치 등의 동작을 제어는 신호일 수 있다. 제어부(400)는 제어명령을 대응되는 장치로 전송할 수 있고, 제어명령을 수신한 장치는 제어명령에 따라 동작을 수행할 수 있다.
이와는 달리, 제어명령은 음성 인식 인터페이스를 제공하는 출력부(160)를 제어하는 것도 가능하다. 예를 들어, 음성 인식 인터페이스가 적어도 하나의 하위 인터페이스와, 하위 인터페이스에 대한 선택 명령을 입력 받는 상위 인터페이스를 포함하는 경우, 제어부(400)는 선택된 하위 인터페이스를 제공하도록 출력부(160)를 제어할 수 있다.
한편, 상술한 음성 인식 시스템을 구비한 차량은 동일한 음성이 인식되면, 항상 동일한 제어명령을 생성한다. 만약, 탑승자가 명령어가 아닌 음성을 발화하면, 제어부(400)는 음성 재입력을 알리는 인터페이스를 제공하는 제어명령을 출력부(160)로 전송할 수 있다. 이 때, 음성 인식이 익숙지 않은 탑승자가 반복하여 명령어가 아닌 음성을 발화할 경우에도, 제어부(400)는 반복하여 음성 재입력을 알리는 인터페이스를 제공하는 제어명령을 생성한다.
이처럼, 탑승자가 음성 인식에 대한 숙련도가 낮은 경우, 음성 인식이 더 이상 진행되지 않는 교착상태에 빠질 수 있다. 따라서, 탑승자의 음성 인식에 대한 숙련도에 따른 음성 인식 인터페이스를 제공할 필요가 있다.
이를 위해, 차량은 탑승자의 영상을 획득하는 카메라(170); 및 획득된 영상을 기초로 탑승자의 특징 정보를 획득하고, 탑승자의 특징 정보에 따라 제어명령의 생성을 중단시키는 인터럽트를 제어부(400)로 전송하는 인터럽트 발생 모듈(200); 을 더 포함할 수 있다.
카메라(170)는 탑승자의 영상을 획득할 수 있다. 구체적으로, 카메라(170)는 음성을 발화하는 탑승자의 특징 정보를 포함하는 영상을 획득할 수 있는 위치에 마련될 수 있다.
이 때, 특징 정보는 탑승자의 음성 인식 숙련 정도를 결정하는데 기초가 되는 정보일 수 있다. 예를 들어, 특징 정보가 탑승자의 동공 크기인 경우, 카메라(170)는 탑승자의 동공을 포함하는 영상을 획득할 수 있다.
인터럽트 발생 모듈(200)은 카메라(170)에 의해 획득된 영상에 포함된 탑승자의 특징 정보를 기초로 제어명령의 생성을 중단시키는 인터럽트를 생성할 수 있다. 이를 위해, 도 4와 같이, 일 실시예에 따른 인터럽트 발생 모듈(200)은 카메라(170)에 의해 획득된 영상에서 관심영역을 추출하는 관심영역 추출부(210); 관심영역의 특징 정보를 분석하여 인터럽트 생성 여부를 결정하는 관심영역 분석부(220); 결정된 인터럽트 생성 여부에 따라 인터럽트를 발생시키는 인터럽트 발생부(230); 를 포함할 수 있다.
관심영역 추출부(210)는 카메라(170)에 의해 획득된 영상 중 특징 정보만으로 구성된 관심영역을 추출할 수 있다. 관심영역이 동공인 경우, 관심영역 추출부(210)는 탑승자 영상 중 동공영역을 추출할 수 있다.
동공영역을 추출하기 위해, 관심영역 추출부(210)는, 먼저, 획득된 영상을 필터링하여 노이즈를 제거할 수 있다. 구체적으로, 관심영역 추출부(210)는 중간값 필터(Median Filter)를 이용하여 임펄스 노이즈와 가우시안 노이즈를 제거할 수 있다.
다음으로, 관심영역 추출부(210)는 라벨링(Labeling)을 통해 영상을 복수의 블록으로 분리할 수 있다. 이를 위해, 관심영역 추출부(210)는 연속성이 있는 픽셀을 하나의 블록으로 인식할 수 있다.
라벨링이 완료되면, 관심영역 추출부(210)는 라벨링된 영상에 모폴로지(Morpholigy)연산을 적용할 수 있다. 여기서, 모폴로지 연산은 영상 내에 존재하는 특정 객체의 형태를 변형시키는 용도로 사용되는 영상 처리 기법을 의미한다.
마지막으로, 관심영역 추출부(210)는 능동 외곽선 모델을 이용하여 동공영역을 추출할 수 있다. 능동 외곽선 모델은 하기의 수학식 1을 따른다.
[수학식 1]
Figure 112014120069018-pat00001

여기서 vi는 각 노드 포인트(Node Point)를 의미하고, α, β, γ는 각 에너지의 가중치를 의미할 수 있다. 또한, Econt는 각 노드의 연속 에너지로서 노드 간의 거리를 일정하게 유지시켜 주는 기능을 하고, Ecurv는 곡률 에너지를 의미할 수 있으며, Eimage는 주변 지점과의 밝기의 기울기를 의미할 수 있다.
관심영역 분석부(220)는 추출된 관심영역을 분석하여 인터럽트의 생성 여부를 결정할 수 있다. 상술한 예와 같이, 관심영역을 동공영역으로 하는 경우, 관심영역 분석부(220)는 추출된 동공영역을 분석하여 인터럽트 생성 여부를 결정할 수 있다.
연구에 따르면, 사람의 동공의 크기는 전반적인 각성 수준에 영향을 받는다. 예를 들어, 당황한 사람의 동공은 급격하게 확대되는 반면, 안정적인 상태에 놓인 사람의 동공은 축소하는 경향을 보인다.
이를 기초로, 음성 인식 진행 중 추출된 동공영역이 확대되는 경우, 관심영역 분석부(220)는 탑승자의 음성 인식 숙련도가 낮아 당황한 상태라고 가정할 수 있다. 따라서, 관심영역 분석부(220)는 동공영역이 확대되었음을 이유로 제 1 인터럽트의 생성 결정을 할 수 있다.
구체적으로, 관심영역 분석부(220)는 제 1 인터럽트의 생성 여부를 결정하기 위해, 추출된 동공영역을 제 1 임계값과 비교할 수 있다. 이 때, 제 1 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 확대한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 확대한 값일 수도 있다. 이와는 달리, 제 1 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
추출된 동공영역이 제 1 임계값 이상이면, 관심영역 분석부(220)는, 탑승자가 당황한 것으로 판단하고, 제 1 인터럽트를 생성하는 결정을 할 수 있다.
반면, 음성 인식 진행 중 추출된 동공영역이 축소되는 경우, 관심영역 분석부(220)는 탑승자의 음성 인식 숙련도가 높아 안정적인 상태라고 가정할 수 있다. 따라서, 관심영역 분석부(220)는 동공영역이 축소되었음을 이유로 제 2 인터럽트의 생성 결정을 할 수 있다.
구체적으로, 관심영역 분석부(220)는 제 2 인터럽트의 생성 여부를 결정하기 위해, 추출된 동공영역을 제 2 임계값과 비교할 수 있다. 이 때, 제 2 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 축소한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 축소한 값일 수도 있다. 이와는 달리, 제 2 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
추출된 동공영역이 제 2 임계값 이하이면, 관심영역 분서부는, 탑승자가 안정적인 상태인 것으로 판단하고, 제 2 인터럽트를 생성하는 결정을 할 수 있다.
인터럽트 발생부(230)는 관심영역 분석부(220)의 결정에 따라 인터럽트를 생성할 수 있다. 구체적으로, 추출된 동공영역이 제 1 임계값 이상으로 확대되면 인터럽트 발생부(230)는 제 1 인터럽트를 생성하고, 추출된 동공영역이 제 2 임계값 이하로 축소되면 인터럽트 발생부(230)는 제 2 인터럽트를 생성할 수 있다.
제어부(400)는 인터럽트 발생부(230)로부터 인터럽트를 수신하면, 제어명령을 생성하는 것을 중단하고 탑승자의 음성 인식 숙련도에 대응되는 음성인식 인터페이스를 제공하도록 출력부(160)를 제어할 수 있다.
이하에서는, 도 5 내지 9를 참조하여, 탑승자의 음성 인식 숙련도에 대응되는 음성인식 인터페이스를 제공하는 방법을 설명한다.
도 5는 일 실시예에 따른 차량 제어방법의 흐름도이다.
먼저, 제어부는 음성 인식 시작 명령이 입력되었는지 확인한다.(600) 구체적으로, 제어부(400)는 음성 인식 시작 버튼(143)으로부터 음성 인식 시작 명령이 전달되었는지 확인할 수 있다.
음성 인식 시작 명령이 입력되지 않았다면, 제어부(400)는 반복하여 이를 확인할 수 있다.
반면, 음성 인식 시작 명령이 입력되면, 출력부는 음성 인식 인터페이스를 제공할 수 있다.(610) 이 때, 제공되는 음성 인식 인터페이스는 출력부(160) 중 디스플레이(161)에 의해 제공되는 영상 인터페이스와 출력부(160) 중 스피커(162)에 의해 제공되는 음성 인터페이스를 포함할 수 있다.
다음으로, 인터럽트 발생 모듈은 탑승자의 특징 정보를 감지할 수 있다.(620) 이 때, 탑승자의 특징 정보란 탑승자의 음성 인식 숙련 정도를 결정하는데 기초가 되는 정보일 수 있고, 분석이 용이하도록 수치화된 값일 수 있다.
탑승자의 특징 정보를 감지하기 위해, 카메라(170)는 탑승자의 영상을 획득할 수 있다. 이렇게 획득한 탑승자 영상을 통해, 인터럽트 발생 모듈(200)은 탑승자 영상 중 관심영역을 추출함으로써 특징 정보를 감지할 수 있다.
특징정보가 감지되면, 인터럽트 발생 모듈은 감지된 특징 정보가 제 1 임계값 이상인지 확인할 수 있다.(630) 이 때, 제 1 임계값이란, 탑승자의 음성 인식 숙련도가 낮은 것으로 결정할 수 있는 최저 특징 정보 값일 수 있다. 제 1 임계값은 외부로부터 입력되거나, 차량 내부 연산에 의해 결정될 수 있다.
만약 특징 정보가 제 1 임계값보다 작다면, 인터럽트 발생 모듈은 제어명령의 생성이 완료되었는지 확인한다.(640) 제어부(400)가 제어명령을 생성하였다면 음성 인식 과정을 종료하고, 제어명령 생성 전이라면 다시 탑승자의 특징 정보를 감지한다.
반면, 특징 정보가 제 1 임계값 이상이라면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 1 인터럽트를 발생시킬 수 있다.(650) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
도 6은 다른 실시예에 따른 차량 제어방법의 흐름도이다. 도 6은 도 5의 제어방법을 따르되, 탑승자의 특징 정보를 동공의 크기로 하는 경우를 예시한다.
먼저, 제어부는 음성 인식 시작 명령이 입력되었는지 확인한다.(700) 구체적으로, 제어부(400)는 음성 인식 시작 버튼(143)으로부터 음성 인식 시작 명령이 전달되었는지 확인할 수 있다.
음성 인식 시작 명령이 입력되지 않았다면, 제어부(400)는 반복하여 이를 확인할 수 있다.
반면, 음성 인식 시작 명령이 입력되면, 출력부는 음성 인식 인터페이스를 제공할 수 있다.(710) 이 때, 제공되는 음성 인식 인터페이스는 출력부(160) 중 디스플레이(161)에 의해 제공되는 영상 인터페이스와 출력부(160) 중 스피커(162)에 의해 제공되는 음성 인터페이스를 포함할 수 있다.
다음으로, 인터럽트 발생 모듈은 탑승자의 동공을 감지할 수 있다.(720) 탑승자의 동공을 감지하기 위해, 카메라(170)는 탑승자의 영상을 획득할 수 있다. 이렇게 획득한 탑승자 영상을 통해, 인터럽트 발생 모듈(200)은 탑승자 영상 중 동공영역을 추출할 수 있다.
동공이 감지되면, 인터럽트 발생 모듈은 감지된 동공이 제 1 임계값 이상으로 확대되었는지 확인할 수 있다.(730) 이 때, 제 1 임계값이란, 탑승자의 음성 인식 숙련도가 낮은 것으로 결정할 수 있는 최저 동공 확대 값일 수 있다.
이 때, 제 1 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 확대한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 확대한 값일 수도 있다. 이와는 달리, 제 1 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
만약 동공이 제 1 임계값보다 작게 확대되면, 인터럽트 발생 모듈은 제어명령의 생성이 완료되었는지 확인한다.(740) 제어부(400)가 제어명령을 생성하였다면 음성 인식 과정을 종료하고, 제어명령 생성 전이라면 다시 탑승자의 동공을 감지한다.
반면, 동공이 제 1 임계값 이상으로 확대되면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 1 인터럽트를 발생시킬 수 있다.(750) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
도 7은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다. 도 7은 도 6의 제어방법을 따르되, 음성 인식을 중단한 후 최종적으로 도움말 인터페이스를 제공하는 경우를 예시한다.
먼저, 제어부는 음성 인식 시작 명령이 입력되었는지 확인한다.(800) 구체적으로, 제어부(400)는 음성 인식 시작 버튼(143)으로부터 음성 인식 시작 명령이 전달되었는지 확인할 수 있다.
음성 인식 시작 명령이 입력되지 않았다면, 제어부(400)는 반복하여 이를 확인할 수 있다.
반면, 음성 인식 시작 명령이 입력되면, 출력부는 음성 인식 인터페이스를 제공할 수 있다.(810) 이 때, 제공되는 음성 인식 인터페이스는 출력부(160) 중 디스플레이(161)에 의해 제공되는 영상 인터페이스와 출력부(160) 중 스피커(162)에 의해 제공되는 음성 인터페이스를 포함할 수 있다.
다음으로, 인터럽트 발생 모듈은 탑승자의 동공을 감지할 수 있다.(820) 탑승자의 동공을 감지하기 위해, 카메라(170)는 탑승자의 영상을 획득할 수 있다. 이렇게 획득한 탑승자 영상을 통해, 인터럽트 발생 모듈(200)은 탑승자 영상 중 동공영역을 추출할 수 있다.
동공이 감지되면, 인터럽트 발생 모듈은 감지된 동공이 제 1 임계값 이상으로 확대되었는지 확인할 수 있다.(830) 이 때, 제 1 임계값이란, 탑승자의 음성 인식 숙련도가 낮은 것으로 결정할 수 있는 최저 동공 확대 값일 수 있다.
이 때, 제 1 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 확대한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 확대한 값일 수도 있다. 이와는 달리, 제 1 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
만약 동공이 제 1 임계값보다 작게 확대되면, 인터럽트 발생 모듈은 제어명령의 생성이 완료되었는지 확인한다.(840) 제어부(400)가 제어명령을 생성하였다면 음성 인식 과정을 종료하고, 제어명령 생성 전이라면 다시 탑승자의 동공을 감지한다.
반면, 동공이 제 1 임계값 이상으로 확대되면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 1 인터럽트를 발생시킬 수 있다.(850) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
마지막으로, 출력부는 도움말 인터페이스를 탑승자에게 제공할 수 있다.(860) 이 때, 도움말 인터페이스란 음성 인식 인터페이스의 사용방법을 설명하는 인터페이스로, 명령어 정보를 포함할 수 있다. 이는 명령어를 인지하지 못한 탑승자에게 명령어 정보를 전달함으로써 음성 인식을 재개하기 위함이다.
도 8은 또 다른 실시예에 따른 차량 제어방법의 흐름도이다. 도 8은 음성 인식 인터페이스가 적어도 하나의 하위 인터페이스, 및 상기 하위 인터페이스의 선택명령을 입력 받는 상위 인터페이스를 포함하는 경우를 전제로 설명한다.
먼저, 출력부는 음성 인식 인터페이스 중 상위 인터페이스를 제공할 수 있다.(900)
상위 인터페이스가 제공되는 중, 제어부는 하위 인터페이스 선택 명령이 입력되었는지 확인할 수 있다.(910) 여기서, 하위 인터페이스 선택 명령은 탑승자의 음성을 인식함으로써 입력될 수 있다.
하위 인터페이스 선택 명령이 입력되지 않았다면, 제어부(400)는 반복하여 이를 확인할 수 있다.
반면, 하위 인터페이스 선택 명령이 입력되면, 출력부는 선택된 하위 인터페이스를 제공할 수 있다.(920)
다음으로, 인터럽트 발생 모듈은 탑승자의 동공을 감지할 수 있다.(930) 탑승자의 동공을 감지하기 위해, 카메라(170)는 탑승자의 영상을 획득할 수 있다. 이렇게 획득한 탑승자 영상을 통해, 인터럽트 발생 모듈(200)은 탑승자 영상 중 동공영역을 추출할 수 있다.
동공이 감지되면, 인터럽트 발생 모듈은 감지된 동공이 제 1 임계값 이상으로 확대되었는지 확인할 수 있다.(940) 이 때, 제 1 임계값이란, 탑승자의 음성 인식 숙련도가 낮은 것으로 결정할 수 있는 최저 동공 확대 값일 수 있다.
이 때, 제 1 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 확대한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 확대한 값일 수도 있다. 이와는 달리, 제 1 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
만약 동공이 제 1 임계값보다 작게 확대되면, 인터럽트 발생 모듈은 제어명령의 생성이 완료되었는지 확인한다.(950) 제어부(400)가 제어명령을 생성하였다면 음성 인식 과정을 종료하고, 제어명령 생성 전이라면 다시 탑승자의 동공을 감지한다.
반면, 동공이 제 1 임계값 이상으로 확대되면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 1 인터럽트를 발생시킬 수 있다.(960) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
마지막으로, 출력부는 다시 상위 인터페이스를 탑승자에게 제공할 수 있다.(970) 이는 하위 인터페이스에 익숙지 않은 탑승자에게 직전의 상위 인터페이스를 제공함으로써 음성 인식 단계를 다시 상기시키기 위함이다.
도 9는 또 다른 실시예에 따른 차량 제어방법의 흐름도이다. 도 9는 도 6의 제어방법을 따르되, 동공의 확대와 동공의 축소에 따라 서로 다른 음성 인식 인터페이스를 제공하는 경우를 예시한다.
도 9에서 음성 인식 인터페이스는 제 1 길이 t1의 안내음성을 포함하는 제 1 음성 인터페이스, 제 2 길이 t2의 안내음성을 포함하는 제 2 음성 인터페이스, 및 제 3 길이 t3의 안내음성을 포함하는 제 3 음성 인터페이스를 포함하는 경우를 전제로 설명한다. (t1>t2>t3)
먼저, 제어부는 음성 인식 시작 명령이 입력되었는지 확인한다.(1000) 구체적으로, 제어부(400)는 음성 인식 시작 버튼(143)으로부터 음성 인식 시작 명령이 전달되었는지 확인할 수 있다.
음성 인식 시작 명령이 입력되지 않았다면, 제어부(400)는 반복하여 이를 확인할 수 있다.
반면, 음성 인식 시작 명령이 입력되면, 출력부는 음성 인식 인터페이스 중 제 2 음성 인터페이스를 제공할 수 있다.(1010) 제 2 음성 인터페이스는 음성 인식 숙련도가 보통인 탑승자를 대상으로 하는 중급 음성 인식 인터페이스를 의미한다.
다음으로, 인터럽트 발생 모듈은 탑승자의 동공을 감지할 수 있다.(1020) 탑승자의 동공을 감지하기 위해, 카메라(170)는 탑승자의 영상을 획득할 수 있다. 이렇게 획득한 탑승자 영상을 통해, 인터럽트 발생 모듈(200)은 탑승자 영상 중 동공영역을 추출할 수 있다.
동공이 감지되면, 인터럽트 발생 모듈은 감지된 동공이 제 1 임계값 이상으로 확대되었는지 확인할 수 있다.(1030) 이 때, 제 1 임계값이란, 탑승자의 음성 인식 숙련도가 낮은 것으로 결정할 수 있는 최저 동공 확대 값일 수 있다.
이 때, 제 1 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 확대한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 확대한 값일 수도 있다. 이와는 달리, 제 1 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
만약, 동공이 제 1 임계값 이상으로 확대되면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 1 인터럽트를 발생시킬 수 있다.(1040) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
그 다음, 출력부는 음성 인식 인터페이스 중 제 1 음성 인터페이스를 탑승자에게 제공할 수 있다.(1050) 이 때, 제 1 음성 인터페이스는 음성 인식 숙련도가 낮은 탑승자를 대상으로 하는 초급 음성 인식 인터페이스를 의미한다. 이는 음성 인식이 익숙지 않은 탑승자에게 음성 인식이 용이한 음성 인식 인터페이스를 제공하기 위함이다.
한편, 동공이 제 1 임계값 이상으로 확대되지 않았다면, 동공이 제 2 임계값 이하로 축소되었는지 확인한다.(1060) 이 때, 제 2 임계값은 외부로부터 입력되거나, 최초 추출된 동공영역을 미리 정해진 비율로 축소한 값일 수 있고, 평균적으로 추출되는 동공영역을 미리 정해진 비율로 축소한 값일 수도 있다. 이와는 달리, 제 2 임계값은 차량 내부 연산에 의해 결정되는 것도 가능할 수 있다.
만약, 동공이 제 2 임계값 이하로 축소되지 않았다면, 인터럽트 발생 모듈은 제어명령의 생성이 완료되었는지 확인한다.(1070) 제어부(400)가 제어명령을 생성하였다면 음성 인식 과정을 종료하고, 제어명령 생성 전이라면 다시 탑승자의 동공을 감지한다.
만약, 동공이 제 2 임계값 이상으로 축소되면, 인터럽트 발생 모듈은 제어명령 생성을 중단하는 제 2 인터럽트를 발생시킬 수 있다.(1080) 그 결과, 제어부(400)가 제어명령의 생성을 중단함으로써, 음성 인식 과정이 중단될 수 있다.
그 다음, 출력부는 음성 인식 인터페이스 중 제 3 음성 인터페이스를 탑승자에게 제공할 수 있다.(1090) 이 때, 제 3 음성 인터페이스는 음성 인식 숙련도가 높은 탑승자를 대상으로 하는 고급 음성 인식 인터페이스를 의미한다. 이는 음성 인식이 익숙한 탑승자에게 신속하게 음성 인식을 진행할 수 있는 인터페이스를 제공하기 위함이다.
1: 차량
10: 본체
143: 음성 인식 시작 버튼
160: 출력부
161: 디스플레이
162: 스피커
170: 카메라
200: 인터럽트 발생 모듈
210: 관심영역 추출부
220: 관심영역 분석부
230: 인터럽트 발생부
300: 음성 인식부
400: 제어부

Claims (26)

  1. 음성 인식 인터페이스를 제공하는 출력부;
    상기 음성 인식 인터페이스를 통해 탑승자의 음성을 획득하는 마이크로폰;
    상기 획득한 음성을 인식하는 음성 인식부;
    상기 인식된 음성에 대응되는 제어명령을 생성하는 제어부;
    상기 탑승자의 영상을 획득하는 카메라; 및
    상기 획득된 영상을 기초로 상기 탑승자의 특징 정보를 획득하고, 상기 탑승자의 특징 정보에 따라 상기 제어명령의 생성을 중단시키는 인터럽트를 상기 제어부로 전송하는 인터럽트 발생 모듈; 을 포함하는 차량.
  2. 제 1 항에 있어서,
    상기 인터럽트 발생 모듈은,
    상기 획득된 영상을 이용하여, 상기 탑승자의 동공 크기를 포함하는 상기 특징 정보를 획득하는 차량.
  3. 제 2 항에 있어서,
    상기 인터럽트 발생 모듈은,
    상기 탑승자의 동공이 제 1 임계값 이상으로 확대되면, 제 1 인터럽트를 상기 제어부로 전송하는 차량.
  4. 제 3 항에 있어서,
    상기 제어부는,
    상기 제 1 인터럽트를 수신하면 상기 제어명령의 생성을 중단하고, 상기 음성 인식 인터페이스의 사용방법을 설명하는 도움말 인터페이스를 제공하도록 출력부를 제어하는 차량.
  5. 제 4 항에 있어서,
    상기 출력부는,
    상기 제어부의 제어에 따라, 명령어 정보를 포함하는 상기 도움말 인터페이스를 제공하는 것을 포함하는 차량.
  6. 제 3 항에 있어서,
    상기 출력부는,
    적어도 하나의 하위 인터페이스, 및 상기 하위 인터페이스의 선택명령을 입력 받는 상위 인터페이스를 포함하는 음성 인식 인터페이스를 제공하는 차량.
  7. 제 6 항에 있어서,
    상기 제어부는,
    상기 출력부가 상기 하위 인터페이스를 제공할 때, 상기 제 1 인터럽트를 수신하면 상기 제어명령의 생성을 중단하고, 상기 상위 인터페이스를 제공하도록 상기 출력부를 제어하는 차량.
  8. 제 3 항에 있어서,
    상기 출력부는,
    제 1 길이의 안내 음성을 포함하는 제 1 음성 인터페이스, 및 제 1 길이보다 짧은 제 2 길이의 안내 음성을 포함하는 제 2 음성인터페이스를 포함하는 음성인터페이스를 제공하는 차량.
  9. 제 8 항에 있어서,
    상기 제어부는,
    상기 출력부가 상기 제 2 음성 인터페이스를 제공할 때, 상기 제 1 인터럽트를 수신하면 상기 제어명령의 생성을 중단하고, 상기 제 1 인터페이스를 제공하도록 상기 출력부를 제어하는 차량.
  10. 제 2 항에 있어서,
    상기 인터럽트 발생 모듈은,
    상기 탑승자의 동공이 제 2 임계값 이하로 축소되면, 제 2 인터럽트를 상기 제어부로 전송하는 차량.
  11. 제 10 항에 있어서,
    상기 출력부는,
    제 2 길이의 안내 음성을 포함하는 제 2 음성 인터페이스, 및 제 2 길이보다 짧은 제 3 길이의 안내 음성을 포함하는 제 3 음성인터페이스를 포함하는 음성인터페이스를 제공하는 차량.
  12. 제 11 항에 있어서,
    상기 제어부는,
    상기 출력부가 상기 제 2 음성 인터페이스를 제공할 때, 상기 제 2 인터럽트를 수신하면 상기 제어명령의 생성을 중단하고, 상기 제 3 인터페이스를 제공하도록 상기 출력부를 제어하는 차량.
  13. 삭제
  14. 음성 인식 인터페이스를 제공하여 탑승자의 음성을 입력 받고, 상기 입력 받은 음성을 기초로 제어명령을 생성하는 차량의 제어방법에 있어서,
    상기 탑승자의 영상을 획득하는 단계;
    상기 획득된 영상을 기초로 상기 탑승자의 특징 정보를 획득하는 단계; 및
    상기 탑승자의 특징 정보에 따라 상기 제어명령의 생성을 중단하는 단계; 를 포함하는 차량의 제어방법.
  15. 제 14 항에 있어서,
    상기 탑승자의 특징 정보를 획득하는 단계는,
    상기 획득된 영상을 이용하여, 상기 탑승자의 동공을 획득하는 것을 포함하는 차량의 제어방법.
  16. 제 15 항에 있어서,
    상기 제어명령의 생성을 중단하는 단계는,
    상기 탑승자의 동공이 제 1 임계값 이상으로 확대되면, 상기 제어명령의 생성을 중단하는 차량의 제어방법.
  17. 제 16 항에 있어서,
    상기 제어명령의 생성을 중단한 후, 상기 음성 인식 인터페이스의 사용방법을 설명하는 도움말 인터페이스를 제공하는 단계; 를 더 포함하는 차량의 제어방법.
  18. 제 17 항에 있어서,
    상기 도움말 인터페이스를 제공하는 단계는,
    명령어 정보를 포함하는 상기 도움말 인터페이스를 제공하는 차량의 제어방법.
  19. 제 16 항에 있어서,
    상기 음성 인식 인터페이스는,
    적어도 하나의 하위 인터페이스, 및 상기 하위 인터페이스의 선택명령을 입력 받는 상위 인터페이스를 포함하는 차량의 제어방법.
  20. 제 19 항에 있어서,
    상기 하위 인터페이스를 제공 중 상기 제어명령의 생성을 중단한 경우, 상기 상위 인터페이스를 제공하는 단계; 를 더 포함하는 차량의 제어방법.
  21. 제 16 항에 있어서,
    상기 음성 인식 인터페이스는,
    제 1 길이의 안내 음성을 포함하는 제 1 음성 인터페이스, 및 제 1 길이보다 짧은 제 2 길이의 안내 음성을 포함하는 제 2 음성인터페이스를 포함하는 차량의 제어방법.
  22. 제 21 항에 있어서,
    상기 제 2 음성 인터페이스를 제공 중 상기 제어명령의 생성을 중단한 경우, 상기 제 1 인터페이스를 제공하는 단계; 를 더 포함하는 차량의 제어방법.
  23. 제 15 항에 있어서,
    상기 제어명령의 생성을 중단하는 단계는,
    상기 탑승자의 동공이 제 2 임계값 이하로 축소되면, 상기 제어명령의 생성을 중단하는 차량의 제어방법.
  24. 제 23 항에 있어서,
    상기 음성 인식 인터페이스는,
    제 2 길이의 안내 음성을 포함하는 제 2 음성 인터페이스, 및 제 2 길이보다 짧은 제 3 길이의 안내 음성을 포함하는 제 3 음성인터페이스를 포함하는 차량의 제어방법.
  25. 제 24 항에 있어서,
    상기 제 2 음성 인터페이스를 제공 중 상기 제어명령의 생성을 중단한 경우, 상기 제 3 인터페이스를 제공하는 단계; 를 더 포함하는 차량의 제어방법.
  26. 삭제
KR1020140177423A 2014-12-10 2014-12-10 차량 및 그 제어방법 KR101630159B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140177423A KR101630159B1 (ko) 2014-12-10 2014-12-10 차량 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140177423A KR101630159B1 (ko) 2014-12-10 2014-12-10 차량 및 그 제어방법

Publications (1)

Publication Number Publication Date
KR101630159B1 true KR101630159B1 (ko) 2016-06-15

Family

ID=56135331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140177423A KR101630159B1 (ko) 2014-12-10 2014-12-10 차량 및 그 제어방법

Country Status (1)

Country Link
KR (1) KR101630159B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000083240A (ja) * 1998-09-04 2000-03-21 Matsushita Electric Ind Co Ltd カメラ制御装置及び方法
JP2000322078A (ja) * 1999-05-14 2000-11-24 Sumitomo Electric Ind Ltd 車載型音声認識装置
JP2004354930A (ja) * 2003-05-30 2004-12-16 Calsonic Kansei Corp 音声認識システム
KR101350892B1 (ko) * 2012-12-20 2014-01-13 현대오트론 주식회사 차량의 터미널 천이 제어방법 및 제어장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000083240A (ja) * 1998-09-04 2000-03-21 Matsushita Electric Ind Co Ltd カメラ制御装置及び方法
JP2000322078A (ja) * 1999-05-14 2000-11-24 Sumitomo Electric Ind Ltd 車載型音声認識装置
JP2004354930A (ja) * 2003-05-30 2004-12-16 Calsonic Kansei Corp 音声認識システム
KR101350892B1 (ko) * 2012-12-20 2014-01-13 현대오트론 주식회사 차량의 터미널 천이 제어방법 및 제어장치

Similar Documents

Publication Publication Date Title
US10854195B2 (en) Dialogue processing apparatus, a vehicle having same, and a dialogue processing method
KR101598948B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법
US9756161B2 (en) Voice recognition apparatus, vehicle having the same, and method of controlling the vehicle
US20180350366A1 (en) Situation-based conversation initiating apparatus, system, vehicle and method
WO2017081960A1 (ja) 音声認識制御システム
JP2008058409A (ja) 音声認識方法及び音声認識装置
US9685157B2 (en) Vehicle and control method thereof
JP2017090613A (ja) 音声認識制御システム
JP2017090612A (ja) 音声認識制御システム
JP2003114696A (ja) 音声認識装置、プログラム及びナビゲーションシステム
KR102339443B1 (ko) 상황 기반 동작 결정 장치, 상황 기반 동작 결정이 가능한 차량, 상황 기반 동작 결정 방법 및 상기 차량의 제어 방법
US10770070B2 (en) Voice recognition apparatus, vehicle including the same, and control method thereof
US10158745B2 (en) Vehicle and communication control method for determining communication data connection for the vehicle
KR101630159B1 (ko) 차량 및 그 제어방법
US9503041B1 (en) Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle
US20230315997A9 (en) Dialogue system, a vehicle having the same, and a method of controlling a dialogue system
KR101875440B1 (ko) 차량 및 그 제어방법
US11488580B2 (en) Dialogue system and dialogue processing method
KR20220073513A (ko) 대화 시스템, 차량 및 대화 시스템의 제어 방법
KR101804765B1 (ko) 차량 및 그 제어방법
KR101741661B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
US20230206917A1 (en) Vehicle and control method thereof
US20210303263A1 (en) Dialogue system and vehicle having the same, and method of controlling dialogue system
KR20170120365A (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
KR20180075031A (ko) 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190528

Year of fee payment: 4