KR20070121104A - 화자 종속 음성 인식 자동차용 미디어 재생 장치 - Google Patents

화자 종속 음성 인식 자동차용 미디어 재생 장치 Download PDF

Info

Publication number
KR20070121104A
KR20070121104A KR1020060055731A KR20060055731A KR20070121104A KR 20070121104 A KR20070121104 A KR 20070121104A KR 1020060055731 A KR1020060055731 A KR 1020060055731A KR 20060055731 A KR20060055731 A KR 20060055731A KR 20070121104 A KR20070121104 A KR 20070121104A
Authority
KR
South Korea
Prior art keywords
voice
unit
speech recognition
recognition
electrical signal
Prior art date
Application number
KR1020060055731A
Other languages
English (en)
Inventor
박철의
Original Assignee
주식회사 대우아이에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 대우아이에스 filed Critical 주식회사 대우아이에스
Priority to KR1020060055731A priority Critical patent/KR20070121104A/ko
Publication of KR20070121104A publication Critical patent/KR20070121104A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/3822Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving specially adapted for use in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것이다.
본 발명에 따르면, 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화할 수 있다.
자동차용 미디어 재생 장치, 음성 인식, 화자 종속, 가중치, 사용자 음성 설 정

Description

화자 종속 음성 인식 자동차용 미디어 재생 장치{CAR MEDIA PLAYER WITH VOICE RECOGNITION DEPENDENT WITH SPECIFIC SPEAKER}
도 1은 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치의 예시적인 블록도.
도 2는 종래의 자동차용 미디어 재생 장치에서의 음성 인식 과정의 흐름도.
도 3은 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
도 4는 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
도 5는 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
<도면의 주요부분에 대한 부호의 설명>
110: 음성 입력부 120: 음성 데이터 저장부
130: 음성 인식부 140: 제어부
150: CD 재생부 160: 라디오 수신부
170: 음향 출력부 210: 음성 입력부
220: 가중치 부여부 230: 음성 데이터 저장부
240: 음성 인식부 250: 제어부
260: 음성 데이터 갱신부
본 발명은 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것으로, 더욱 구체적으로는 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화하는 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것이다.
일반적으로 자동차에 설치되어 있는 자동차용 미디어 재생 장치에 전원을 공급하여 CD에 저장된 오디오 파일을 재생하거나 카세트 데크를 동작시켜 마그네틱 테이프에 기록된 음을 재생시켜 음악을 청취하거나 또는 라디오 방송의 채널을 선국하여 음악이나 뉴스, 스포츠 중계 방송 등을 선택하는 등의 재생을 수행할 수 있다. 이 경우 재생 도중에 다른 채널을 선택하기 위하여 주파수를 변경하거나 또는 다른 트랙에 있는 음악을 듣거나 또는 고속 전진 또는 고속 후진 등의 검색을 수행하는 등 자동차용 미디어 재생 장치의 기능을 수행하기 위해서는 운전 중에 운전자가 왼 손으로 자동차 핸들을 잡은 상태에서 오른손으로 자동차용 미디어 재생 장치의 각 버튼 등을 이용하여 원하는 기능을 선택하게 된다.
예컨대 채널 선택의 경우 라디오 방송 채널이 번호 순으로 저장되어 있는 경우에는 그래도 운전자가 원하는 채널을 선택하기 용이하나 각 방송 채널이 저장되어 있지 않은 경우에는 운전자가 원하는 방송 채널을 찾기 위하여 조작 버튼을 여러 번 눌러야만 원하는 방송 채널을 선택할 수 있도록 되어 있어 자동차가 고속 주행시에 전방 관측이 제대로 되지 않아 교통 사고의 위험성이 증가하는 단점이 있다.
이러한 단점을 개선하기 위해서 자동차용 미디어 재생 장치의 각 동작에 대해서 운전자의 음성을 통하여 제어를 수행할 수 있는 음성 인식 자동차용 미디어 재생 장치가 개발되었다.
도 1은 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치의 예시적인 블록도이다.
도시되듯이 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(110)와, 음성 데이터 저장부(120)와, 음성 인식부(130)와, 제어부(140)를 포함하며, 기타 CD 재생부(150)와, 라디오 수신부(160)와, 음향 출력부(170) 등의 미디어 재생을 위한 구성을 포함한다.
음성 입력부(110)는 운전자의 음성을 수집하여 전기적 신호로 변환하며, 예컨대 마이크 장치 등을 통하여 구현된다.
음성 데이터 저장부(120)는 음성 인식에 필요한 기본 데이터를 저장하며, 특히 자동차용 미디어 재생 장치의 각 동작에 대응하는 음성 데이터의 인식을 위한 기본 데이터를 저장한다.
음성 인식부(130)는 음성 입력부(110)를 통하여 입력된 음성 신호와 음성 데이터 저장부(120)에 저장된 기본 데이터를 비교하여 자동차용 미디어 재생 장치의 어느 동작에 대응하는 신호 입력인지를 판단한다.
제어부(140)는 음성 인식부(130)의 인식 결과에 따라서 CD 재생부(150) 또는 라디오 수신부(160) 등의 제어를 위한 명령을 생성하여 전송하며 또한 예컨대 볼륨 조절 등의 제어 명령을 생성하여 음향 출력부(170)에 전송한다.
CD 재생부(150) 또는 라디오 수신부(160)는 CD의 재생 또는 라디오의 수신과 관련된 모든 구성을 간략화하여 표시한 것이며, 이하 본 발명의 명세서에서 자동차용 미디어 재생 장치는 이러한 도 1의 구성 이외에 기타 다른 구성, 예컨대 카세트 테이프 또는 DVD의 재생을 위한 구성 요소 또는 영상 데이터의 디스플레이를 위한 디스플레이 장치 등을 더 포함할 수 있다.
도 2는 종래의 자동차용 미디어 재생 장치에서의 음성 인식 과정의 흐름도이다.
도시되듯이 우선 음성 데이터 저장부(120)에 저장할 기본 데이터를 생성하기 위하여 다수의 음성 데이터를 수집한다(S110). 이후 수집된 음성 데이터의 특징을 추출하고(S120), 이를 기초로 자동차용 미디어 재생 장치의 각 제어 명령에 대응하여 데이터베이스를 구축하고 이를 음성 데이터 저장부(120)에 저장한다(S130).
이러한 단계 S110 내지 S130은 자동차용 미디어 재생 장치의 제조 시에 수행되어 미리 음성 데이터 저장부(120)에 저장될 수 있다.
이후 운전자로부터 음성 입력부(110)를 통하여 음성 데이터를 입력받는다 (S140). 즉 자동차 운전자가 자동차용 미디어 재생 장치의 동작의 제어를 위한 명령을 음성을 이용하여 입력하는 것이다.
이후 음성 인식부(130)에서는 단계 S140에서 입력된 음성 데이터의 특징과 단계 S130에서 저장된 데이터베이스의 특징을 패턴 매칭을 통하여 비교하여 인식한다(S150). 이러한 음성 인식에 따라서 대응되는 제어 명령이 수행된다. 예컨대 자동차용 미디어 재생 장치의 동작 제어는 대략 30개 내외의 단어를 이용하여 수행될 수 있으므로 특히 이러한 단어의 인식을 중점으로 하여 음성 인식이 수행된다.
일반적인 운전자의 경우 단계 S130을 통하여 사전에 구축된 데이터베이스의 특징을 통하여 음성 인식이 가능하다. 그러나 특정한 운전자의 경우는 이러한 데이터베이스의 특징을 통하여 인식이 불가능한 경우가 발생할 수 있다. 즉 대다수 운전자에게 적용하여 음성 인식이 수행되도록 구성되었으므로 최소한의 특징을 만족하면 이를 기초로 인식을 수행하나 실제 사용 시에는 이러한 특징에 의해서 일의적으로 음성 인식을 수행하는 경우 오류가 발생할 수 있으며, 특히 이러한 특정 운전자의 경우에 있어서는 자신의 음성으로는 제어가 불가능하므로 비록 음성 인식 기능이 있는 자동차용 미디어 재생 장치를 구매하였더라도 사용할 수 없게 된다.
따라서 일반적인 특징이 아니라 특정 운전자의 음성 특징을 이용하여 자동차용 미디어 재생 장치의 동작을 제어하여 음성 인식 오동작의 가능성을 줄일 필요가 있다.
본 발명의 목적은 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행 하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공하는 데 있다.
상기 기술적 과제를 달성하기 위하여, 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
또한 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 상기 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장하는 음성 데이터 저장부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
또한 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 가중치를 기초로 상기 음성 데이터 저장부에 저장된 기본 데이터를 갱신하여 저장하도록 제어하는 음성 데이터 갱신부와, 상기 음성 입력부의 전기적 신호와 상기 음성 데이터 갱신부에 의해서 갱신된 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 있어서, 상기 음성 입력부는 마이크인 것이 바람직하다.
또한 본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 있어서, 상기 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자 음성 설정부와, 상기 음성 설정부의 음성에 따라서 상기 기본 데이터를 갱신하는 사용자 설정 음성 데이터 갱신부를 더 포함할 수 있다.
이하 첨부된 도면을 참조로 본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 대해서 보다 구체적으로 설명한다.
도 3은 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재 생 장치의 블록도이다.
도시되듯이 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 가중치 부여부(220)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)를 포함한다.
음성 입력부(210)는 운전자의 음성을 입력받아 전기적 신호로 변환한다.
음성 데이터 저장부(230)는 종래의 경우와 마찬가지로 다수의 사용자에 대해서 공통적인 특징을 추출하여 음성 인식에 필요한 기본 데이터를 저장한다.
가중치 부여부(220)는 음성 입력부(210)를 통하여 입력된 전기적 신호에 미리 지정된 가중치를 부여하여 전기적 신호를 변환한다. 이러한 신호 변환은 특히 음성 인식에 실패하는 경우 변환된 전기적 신호를 기초로 음성 인식을 수행하기 위함이다.
음성 인식부(240)는 음성 입력부(210)의 전기적 신호와 기본 데이터를 비교하여 음성 인식을 수행한다. 이 경우 음성 인식이 성공하면 그대로 이를 제어부(250)에 전송하여 제어 명령을 생성하도록 구성하지만. 음성 인식이 실패하는 경우라면, 가중치가 부여된 전기적 신호와 기본 데이터를 기초로 음성 인식을 수행하게 된다.
이러한 음성 인식을 통하여 자동차용 미디어 재생 장치의 어느 제어 동작에 대응하는 신호의 입력인지를 판단한다.
제어부(250)는 음성 인식부(240)의 음성 인식 결과를 기초로 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성한다.
도 3에 도시된 제 1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 종래의 음성 인식이 실패하는 경우에만 화자 종속 음성 인식이 수행되는 경우를 나타낸다.
도 4는 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도이다.
도시되듯이 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)를 포함한다.
이 중에서 음성 입력부(210)와, 제어부(250)는 본 발명의 제1 측면에서와 동일하므로 설명을 생략한다.
음성 데이터 저장부(230)는 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장한다. 이 경우 기본 데이터는 운전자에게 특화된 데이터로서, 종래의 기본 데이터가 다수의 사용자의 공통적인 특징을 포함하는 것에 비해서 특정 운전자의 음성 인식에 필요한 데이터만을 포함한다.
음성 인식부(240)는 음성 데이터 저장부(230)는 음성 입력부(210)의 전기적 신호와 음성 데이터 저장부(230)에 저장된 기본 데이터를 비교하여 음성 인식을 수행한다.
도 4에 도시된 제 2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 종래의 다수의 사용자를 대상으로 하는 음성 인식과는 다르게 특정 사 용자에 국한된 음성 인식을 수행하는 경우이며, 다수의 운전자에 대해서 보편적으로 적용은 불가능하지만 특히 한 사람의 운전자가 운전을 하는 경우에는 유용하게 적용될 수 있다.
도 5는 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도이다.
도시되듯이 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 가중치 부여부(220)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)와, 음성 데이터 갱신부(260)를 포함한다.
이 중에서 음성 입력부(210)와, 가중치 부여부(220)와, 제어부(250)는 본 발명의 제1 측면에서와 동일하므로 설명을 생략한다.
음성 데이터 갱신부(260)는 가중치 부여부(220)의 가중치를 기초로 음성 데이터 저장부(230)에 저장된 기본 데이터를 갱신하여 저장하도록 제어한다.
음성 데이터 저장부(230)는 음성 인식에 필요한 기본 데이터를 저장하지만 동시에 음성 데이터 갱신부(260)에 의해서 갱신된 기본 데이터를 저장할 수 있다.
즉 종래의 음성 데이터 저장부(230)는 다수 사용자에 대해서 공통적인 특징만을 기본 데이터로 저장하지만, 음성 데이터 갱신부(230)의 제어에 의해서 다수 사용자에 대한 공통 특징뿐만 아니라 특정 운전자의 음성의 특징 데이터까지 포함하도록 갱신되는 것이다.
음성 인식부(240)는 음성 입력부(210)의 전기적 신호와 음성 데이터 갱신부 (260)에 의해서 갱신되어 음성 데이터 저장부(230)에 저장된 기본 데이터를 비교하여 음성 인식을 수행한다.
도 5에 도시된 제 3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 도 4에 도시된 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치가 특정 사용자에 국한하여 음성 인식이 가능하도록 구현되는 단점을 개선하여 다수의 사용자를 대상으로 하는 음성 인식의 기본 데이터를 특정 사용자에게도 적용 가능하도록 저장함으로써 더욱 음성 인식의 범위를 넓힌 구성이다.
이러한 도 3 내지 도 5를 참조로 한 구성에서 음성 입력부(210)는 마이크인 것이 바람직하다.
또한 도 3 내지 도 5를 참조로 한 구성에서 도시되지는 않았지만, 사용자 음성 설정부와 사용자 설정 음성 데이터 갱신부를 더 포함할 수 있다.
즉 제어 명령에 대응되는 음성은 기본적으로는 자동차용 미디어 재생 장치의 제조사에서 설정하여 이에 대응하는 음성이 음성 입력부(210)를 통하여 입력되면 음성 인식을 통하여 해당 제어 명령을 수행하도록 구성된다.
그러나 운전자에 따라서 자신이 원하는 대로 제어 명령에 대응하는 음성을 설정하려고 할 수 있다.
이러한 경우에 대해서, 사용자 음성 설정부는 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자가 자신이 원하는 대로 설정할 수 있다.
예컨대 "좋은 아침"이라는 음성을 특정 라디오 채널에 설정한다면 해당 음성을 입력받아 인식하면 해당 채널을 자동적으로 선국하여 미리 지정된 음량 레벨로 설정하는 것이다. 이러한 음성에 따른 기능 설정은 복합적으로, 즉 예컨대 라디오 채널과 음량 등을 동시에 설정하는 것이 가능하며, 사용자 설정에 따라서 가변적으로 구성될 수 있다.
이러한 사용자의 제어 명령에 대응하는 음성 설정이 종료되면, 사용자 설정 음성 데이터 갱신부는 기본 데이터를 이러한 사용자 설정 음성에 대응하여 갱신한다.
비록 본 발명의 구성이 구체적으로 설명되었지만 이는 단지 본 발명을 예시하기 위한 것이며, 본 발명의 보호 범위가 이들에 의해 제한되는 것은 아니며, 본 발명의 보호 범위는 청구범위의 기재를 통하여 정하여진다.
이상 설명한 바와 같이, 본 발명에 따르면 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화할 수 있다.

Claims (5)

  1. 음성 인식 자동차용 미디어 재생 장치에 있어서,
    운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,
    음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와,
    상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와,
    상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,
    상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부
    를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
  2. 음성 인식 자동차용 미디어 재생 장치에 있어서,
    운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,
    상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 상기 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장하는 음성 데이터 저장부와,
    상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,
    상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부
    를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
  3. 음성 인식 자동차용 미디어 재생 장치에 있어서,
    운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,
    음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와,
    상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와,
    상기 가중치를 기초로 상기 음성 데이터 저장부에 저장된 기본 데이터를 갱신하여 저장하도록 제어하는 음성 데이터 갱신부와,
    상기 음성 입력부의 전기적 신호와 상기 음성 데이터 갱신부에 의해서 갱신된 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,
    상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부
    를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 음성 입력부는 마이크인 것인 화자 종속 음성 인식 자동차용 미디어 재생 장치.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자 음성 설정부와,
    상기 음성 설정부의 음성에 따라서 상기 기본 데이터를 갱신하는 사용자 설정 음성 데이터 갱신부
    를 더 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
KR1020060055731A 2006-06-21 2006-06-21 화자 종속 음성 인식 자동차용 미디어 재생 장치 KR20070121104A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060055731A KR20070121104A (ko) 2006-06-21 2006-06-21 화자 종속 음성 인식 자동차용 미디어 재생 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060055731A KR20070121104A (ko) 2006-06-21 2006-06-21 화자 종속 음성 인식 자동차용 미디어 재생 장치

Publications (1)

Publication Number Publication Date
KR20070121104A true KR20070121104A (ko) 2007-12-27

Family

ID=39138549

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060055731A KR20070121104A (ko) 2006-06-21 2006-06-21 화자 종속 음성 인식 자동차용 미디어 재생 장치

Country Status (1)

Country Link
KR (1) KR20070121104A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504373B2 (en) 2009-07-02 2013-08-06 Nuance Communications, Inc. Processing verbal feedback and updating digital video recorder (DVR) recording patterns

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504373B2 (en) 2009-07-02 2013-08-06 Nuance Communications, Inc. Processing verbal feedback and updating digital video recorder (DVR) recording patterns
KR101298823B1 (ko) * 2009-07-02 2013-08-23 인터내셔널 비지네스 머신즈 코포레이션 구두 피드백을 프로세싱하고 디지탈 비디오 레코더(dvr) 기록 패턴을 업데이트하기 위한 설비

Similar Documents

Publication Publication Date Title
CA2498392C (en) Audio system with balance setting based on information addresses
EP2045140B1 (en) Adjustment of vehicular elements by speech control
US7457755B2 (en) Key activation system for controlling activation of a speech dialog system and operation of electronic devices in a vehicle
US20060235701A1 (en) Activity-based control of a set of electronic devices
JP4155383B2 (ja) 音声認識機器操作装置
US20050159945A1 (en) Noise cancellation system, speech recognition system, and car navigation system
JP5014662B2 (ja) 車載用音声認識装置及び音声認識方法
US20050251273A1 (en) Dynamic audio control circuit and method
CN110648663A (zh) 车载音频管理方法、装置、设备、汽车及可读存储介质
US20060235698A1 (en) Apparatus for controlling a home theater system by speech commands
US5950166A (en) Speech actuated control system for use with consumer product
US20050286384A1 (en) Music selection apparatus, music selection system and music selection method
US20140349599A1 (en) System And Method for Searching Stored Audio Data Based on a Search Pattern
KR20070121104A (ko) 화자 종속 음성 인식 자동차용 미디어 재생 장치
JP4829184B2 (ja) 車載装置および音声認識方法
EP1065652B1 (en) Voice-based manipulation method and apparatus
JP3913884B2 (ja) 音声認識による選局装置及び方法並びに音声認識による選局用プログラムを記録した記録媒体
US11449167B2 (en) Systems using dual touch and sound control, and methods thereof
JP4201869B2 (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JP2004532560A (ja) 受信プログラムコンテンツに応答して作動する娯楽機器用受信機及びこれを動作させる方法
US20100062848A1 (en) Vehicle entertainment system operable by a remote device and method for remotely operating a vehicle entertainment system
KR102388150B1 (ko) 차량의 avn 볼륨 조절 시스템 및 그를 이용한 볼륨 조절 방법
JP4913120B2 (ja) 情報アドレスに基づくバランス設定を有するオーディオシステム
KR20060070266A (ko) 감성 인식 차량용 오디오 시스템 및 그 제어 방법
CN112578989A (zh) 车载触屏的操作方法

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E601 Decision to refuse application