KR20070121104A - 화자 종속 음성 인식 자동차용 미디어 재생 장치 - Google Patents
화자 종속 음성 인식 자동차용 미디어 재생 장치 Download PDFInfo
- Publication number
- KR20070121104A KR20070121104A KR1020060055731A KR20060055731A KR20070121104A KR 20070121104 A KR20070121104 A KR 20070121104A KR 1020060055731 A KR1020060055731 A KR 1020060055731A KR 20060055731 A KR20060055731 A KR 20060055731A KR 20070121104 A KR20070121104 A KR 20070121104A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- unit
- speech recognition
- recognition
- electrical signal
- Prior art date
Links
- 230000001419 dependent effect Effects 0.000 title claims abstract description 32
- 238000013500 data storage Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 6
- 238000010586 diagram Methods 0.000 description 8
- 230000007257 malfunction Effects 0.000 description 7
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/3822—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving specially adapted for use in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것이다.
본 발명에 따르면, 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화할 수 있다.
자동차용 미디어 재생 장치, 음성 인식, 화자 종속, 가중치, 사용자 음성 설 정
Description
도 1은 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치의 예시적인 블록도.
도 2는 종래의 자동차용 미디어 재생 장치에서의 음성 인식 과정의 흐름도.
도 3은 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
도 4는 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
도 5는 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도.
<도면의 주요부분에 대한 부호의 설명>
110: 음성 입력부 120: 음성 데이터 저장부
130: 음성 인식부 140: 제어부
150: CD 재생부 160: 라디오 수신부
170: 음향 출력부 210: 음성 입력부
220: 가중치 부여부 230: 음성 데이터 저장부
240: 음성 인식부 250: 제어부
260: 음성 데이터 갱신부
본 발명은 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것으로, 더욱 구체적으로는 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화하는 화자 종속 음성 인식 자동차용 미디어 재생 장치에 관한 것이다.
일반적으로 자동차에 설치되어 있는 자동차용 미디어 재생 장치에 전원을 공급하여 CD에 저장된 오디오 파일을 재생하거나 카세트 데크를 동작시켜 마그네틱 테이프에 기록된 음을 재생시켜 음악을 청취하거나 또는 라디오 방송의 채널을 선국하여 음악이나 뉴스, 스포츠 중계 방송 등을 선택하는 등의 재생을 수행할 수 있다. 이 경우 재생 도중에 다른 채널을 선택하기 위하여 주파수를 변경하거나 또는 다른 트랙에 있는 음악을 듣거나 또는 고속 전진 또는 고속 후진 등의 검색을 수행하는 등 자동차용 미디어 재생 장치의 기능을 수행하기 위해서는 운전 중에 운전자가 왼 손으로 자동차 핸들을 잡은 상태에서 오른손으로 자동차용 미디어 재생 장치의 각 버튼 등을 이용하여 원하는 기능을 선택하게 된다.
예컨대 채널 선택의 경우 라디오 방송 채널이 번호 순으로 저장되어 있는 경우에는 그래도 운전자가 원하는 채널을 선택하기 용이하나 각 방송 채널이 저장되어 있지 않은 경우에는 운전자가 원하는 방송 채널을 찾기 위하여 조작 버튼을 여러 번 눌러야만 원하는 방송 채널을 선택할 수 있도록 되어 있어 자동차가 고속 주행시에 전방 관측이 제대로 되지 않아 교통 사고의 위험성이 증가하는 단점이 있다.
이러한 단점을 개선하기 위해서 자동차용 미디어 재생 장치의 각 동작에 대해서 운전자의 음성을 통하여 제어를 수행할 수 있는 음성 인식 자동차용 미디어 재생 장치가 개발되었다.
도 1은 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치의 예시적인 블록도이다.
도시되듯이 종래 기술에 따른 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(110)와, 음성 데이터 저장부(120)와, 음성 인식부(130)와, 제어부(140)를 포함하며, 기타 CD 재생부(150)와, 라디오 수신부(160)와, 음향 출력부(170) 등의 미디어 재생을 위한 구성을 포함한다.
음성 입력부(110)는 운전자의 음성을 수집하여 전기적 신호로 변환하며, 예컨대 마이크 장치 등을 통하여 구현된다.
음성 데이터 저장부(120)는 음성 인식에 필요한 기본 데이터를 저장하며, 특히 자동차용 미디어 재생 장치의 각 동작에 대응하는 음성 데이터의 인식을 위한 기본 데이터를 저장한다.
음성 인식부(130)는 음성 입력부(110)를 통하여 입력된 음성 신호와 음성 데이터 저장부(120)에 저장된 기본 데이터를 비교하여 자동차용 미디어 재생 장치의 어느 동작에 대응하는 신호 입력인지를 판단한다.
제어부(140)는 음성 인식부(130)의 인식 결과에 따라서 CD 재생부(150) 또는 라디오 수신부(160) 등의 제어를 위한 명령을 생성하여 전송하며 또한 예컨대 볼륨 조절 등의 제어 명령을 생성하여 음향 출력부(170)에 전송한다.
CD 재생부(150) 또는 라디오 수신부(160)는 CD의 재생 또는 라디오의 수신과 관련된 모든 구성을 간략화하여 표시한 것이며, 이하 본 발명의 명세서에서 자동차용 미디어 재생 장치는 이러한 도 1의 구성 이외에 기타 다른 구성, 예컨대 카세트 테이프 또는 DVD의 재생을 위한 구성 요소 또는 영상 데이터의 디스플레이를 위한 디스플레이 장치 등을 더 포함할 수 있다.
도 2는 종래의 자동차용 미디어 재생 장치에서의 음성 인식 과정의 흐름도이다.
도시되듯이 우선 음성 데이터 저장부(120)에 저장할 기본 데이터를 생성하기 위하여 다수의 음성 데이터를 수집한다(S110). 이후 수집된 음성 데이터의 특징을 추출하고(S120), 이를 기초로 자동차용 미디어 재생 장치의 각 제어 명령에 대응하여 데이터베이스를 구축하고 이를 음성 데이터 저장부(120)에 저장한다(S130).
이러한 단계 S110 내지 S130은 자동차용 미디어 재생 장치의 제조 시에 수행되어 미리 음성 데이터 저장부(120)에 저장될 수 있다.
이후 운전자로부터 음성 입력부(110)를 통하여 음성 데이터를 입력받는다 (S140). 즉 자동차 운전자가 자동차용 미디어 재생 장치의 동작의 제어를 위한 명령을 음성을 이용하여 입력하는 것이다.
이후 음성 인식부(130)에서는 단계 S140에서 입력된 음성 데이터의 특징과 단계 S130에서 저장된 데이터베이스의 특징을 패턴 매칭을 통하여 비교하여 인식한다(S150). 이러한 음성 인식에 따라서 대응되는 제어 명령이 수행된다. 예컨대 자동차용 미디어 재생 장치의 동작 제어는 대략 30개 내외의 단어를 이용하여 수행될 수 있으므로 특히 이러한 단어의 인식을 중점으로 하여 음성 인식이 수행된다.
일반적인 운전자의 경우 단계 S130을 통하여 사전에 구축된 데이터베이스의 특징을 통하여 음성 인식이 가능하다. 그러나 특정한 운전자의 경우는 이러한 데이터베이스의 특징을 통하여 인식이 불가능한 경우가 발생할 수 있다. 즉 대다수 운전자에게 적용하여 음성 인식이 수행되도록 구성되었으므로 최소한의 특징을 만족하면 이를 기초로 인식을 수행하나 실제 사용 시에는 이러한 특징에 의해서 일의적으로 음성 인식을 수행하는 경우 오류가 발생할 수 있으며, 특히 이러한 특정 운전자의 경우에 있어서는 자신의 음성으로는 제어가 불가능하므로 비록 음성 인식 기능이 있는 자동차용 미디어 재생 장치를 구매하였더라도 사용할 수 없게 된다.
따라서 일반적인 특징이 아니라 특정 운전자의 음성 특징을 이용하여 자동차용 미디어 재생 장치의 동작을 제어하여 음성 인식 오동작의 가능성을 줄일 필요가 있다.
본 발명의 목적은 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행 하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공하는 데 있다.
상기 기술적 과제를 달성하기 위하여, 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
또한 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 상기 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장하는 음성 데이터 저장부와, 상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
또한 본 발명은 음성 인식 자동차용 미디어 재생 장치에 있어서, 운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와, 음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와, 상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와, 상기 가중치를 기초로 상기 음성 데이터 저장부에 저장된 기본 데이터를 갱신하여 저장하도록 제어하는 음성 데이터 갱신부와, 상기 음성 입력부의 전기적 신호와 상기 음성 데이터 갱신부에 의해서 갱신된 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와, 상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치를 제공한다.
본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 있어서, 상기 음성 입력부는 마이크인 것이 바람직하다.
또한 본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 있어서, 상기 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자 음성 설정부와, 상기 음성 설정부의 음성에 따라서 상기 기본 데이터를 갱신하는 사용자 설정 음성 데이터 갱신부를 더 포함할 수 있다.
이하 첨부된 도면을 참조로 본 발명에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치에 대해서 보다 구체적으로 설명한다.
도 3은 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재 생 장치의 블록도이다.
도시되듯이 본 발명의 제1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 가중치 부여부(220)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)를 포함한다.
음성 입력부(210)는 운전자의 음성을 입력받아 전기적 신호로 변환한다.
음성 데이터 저장부(230)는 종래의 경우와 마찬가지로 다수의 사용자에 대해서 공통적인 특징을 추출하여 음성 인식에 필요한 기본 데이터를 저장한다.
가중치 부여부(220)는 음성 입력부(210)를 통하여 입력된 전기적 신호에 미리 지정된 가중치를 부여하여 전기적 신호를 변환한다. 이러한 신호 변환은 특히 음성 인식에 실패하는 경우 변환된 전기적 신호를 기초로 음성 인식을 수행하기 위함이다.
음성 인식부(240)는 음성 입력부(210)의 전기적 신호와 기본 데이터를 비교하여 음성 인식을 수행한다. 이 경우 음성 인식이 성공하면 그대로 이를 제어부(250)에 전송하여 제어 명령을 생성하도록 구성하지만. 음성 인식이 실패하는 경우라면, 가중치가 부여된 전기적 신호와 기본 데이터를 기초로 음성 인식을 수행하게 된다.
이러한 음성 인식을 통하여 자동차용 미디어 재생 장치의 어느 제어 동작에 대응하는 신호의 입력인지를 판단한다.
제어부(250)는 음성 인식부(240)의 음성 인식 결과를 기초로 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성한다.
도 3에 도시된 제 1 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 종래의 음성 인식이 실패하는 경우에만 화자 종속 음성 인식이 수행되는 경우를 나타낸다.
도 4는 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도이다.
도시되듯이 본 발명의 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)를 포함한다.
이 중에서 음성 입력부(210)와, 제어부(250)는 본 발명의 제1 측면에서와 동일하므로 설명을 생략한다.
음성 데이터 저장부(230)는 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장한다. 이 경우 기본 데이터는 운전자에게 특화된 데이터로서, 종래의 기본 데이터가 다수의 사용자의 공통적인 특징을 포함하는 것에 비해서 특정 운전자의 음성 인식에 필요한 데이터만을 포함한다.
음성 인식부(240)는 음성 데이터 저장부(230)는 음성 입력부(210)의 전기적 신호와 음성 데이터 저장부(230)에 저장된 기본 데이터를 비교하여 음성 인식을 수행한다.
도 4에 도시된 제 2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 종래의 다수의 사용자를 대상으로 하는 음성 인식과는 다르게 특정 사 용자에 국한된 음성 인식을 수행하는 경우이며, 다수의 운전자에 대해서 보편적으로 적용은 불가능하지만 특히 한 사람의 운전자가 운전을 하는 경우에는 유용하게 적용될 수 있다.
도 5는 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치의 블록도이다.
도시되듯이 본 발명의 제3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는, 음성 입력부(210)와, 가중치 부여부(220)와, 음성 데이터 저장부(230)와, 음성 인식부(240)와, 제어부(250)와, 음성 데이터 갱신부(260)를 포함한다.
이 중에서 음성 입력부(210)와, 가중치 부여부(220)와, 제어부(250)는 본 발명의 제1 측면에서와 동일하므로 설명을 생략한다.
음성 데이터 갱신부(260)는 가중치 부여부(220)의 가중치를 기초로 음성 데이터 저장부(230)에 저장된 기본 데이터를 갱신하여 저장하도록 제어한다.
음성 데이터 저장부(230)는 음성 인식에 필요한 기본 데이터를 저장하지만 동시에 음성 데이터 갱신부(260)에 의해서 갱신된 기본 데이터를 저장할 수 있다.
즉 종래의 음성 데이터 저장부(230)는 다수 사용자에 대해서 공통적인 특징만을 기본 데이터로 저장하지만, 음성 데이터 갱신부(230)의 제어에 의해서 다수 사용자에 대한 공통 특징뿐만 아니라 특정 운전자의 음성의 특징 데이터까지 포함하도록 갱신되는 것이다.
음성 인식부(240)는 음성 입력부(210)의 전기적 신호와 음성 데이터 갱신부 (260)에 의해서 갱신되어 음성 데이터 저장부(230)에 저장된 기본 데이터를 비교하여 음성 인식을 수행한다.
도 5에 도시된 제 3 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치는 특히 도 4에 도시된 제2 측면에 따른 화자 종속 음성 인식 자동차용 미디어 재생 장치가 특정 사용자에 국한하여 음성 인식이 가능하도록 구현되는 단점을 개선하여 다수의 사용자를 대상으로 하는 음성 인식의 기본 데이터를 특정 사용자에게도 적용 가능하도록 저장함으로써 더욱 음성 인식의 범위를 넓힌 구성이다.
이러한 도 3 내지 도 5를 참조로 한 구성에서 음성 입력부(210)는 마이크인 것이 바람직하다.
또한 도 3 내지 도 5를 참조로 한 구성에서 도시되지는 않았지만, 사용자 음성 설정부와 사용자 설정 음성 데이터 갱신부를 더 포함할 수 있다.
즉 제어 명령에 대응되는 음성은 기본적으로는 자동차용 미디어 재생 장치의 제조사에서 설정하여 이에 대응하는 음성이 음성 입력부(210)를 통하여 입력되면 음성 인식을 통하여 해당 제어 명령을 수행하도록 구성된다.
그러나 운전자에 따라서 자신이 원하는 대로 제어 명령에 대응하는 음성을 설정하려고 할 수 있다.
이러한 경우에 대해서, 사용자 음성 설정부는 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자가 자신이 원하는 대로 설정할 수 있다.
예컨대 "좋은 아침"이라는 음성을 특정 라디오 채널에 설정한다면 해당 음성을 입력받아 인식하면 해당 채널을 자동적으로 선국하여 미리 지정된 음량 레벨로 설정하는 것이다. 이러한 음성에 따른 기능 설정은 복합적으로, 즉 예컨대 라디오 채널과 음량 등을 동시에 설정하는 것이 가능하며, 사용자 설정에 따라서 가변적으로 구성될 수 있다.
이러한 사용자의 제어 명령에 대응하는 음성 설정이 종료되면, 사용자 설정 음성 데이터 갱신부는 기본 데이터를 이러한 사용자 설정 음성에 대응하여 갱신한다.
비록 본 발명의 구성이 구체적으로 설명되었지만 이는 단지 본 발명을 예시하기 위한 것이며, 본 발명의 보호 범위가 이들에 의해 제한되는 것은 아니며, 본 발명의 보호 범위는 청구범위의 기재를 통하여 정하여진다.
이상 설명한 바와 같이, 본 발명에 따르면 종래의 화자 독립형 음성 인식을 통하여 음성 인식을 수행하여 발생할 수 있는 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작을 개선하기 위하여 화자 종속형 음성 인식을 부가적으로 사용하여 음성 인식 오류 및 이에 따른 자동차용 미디어 재생 장치의 오동작 가능성을 최소화할 수 있다.
Claims (5)
- 음성 인식 자동차용 미디어 재생 장치에 있어서,운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와,상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와,상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하며, 상기 음성 인식이 실패하는 경우 상기 가중치가 부여된 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
- 음성 인식 자동차용 미디어 재생 장치에 있어서,운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령에 대응하는 상기 운전자의 음성을 미리 입력받아 음성 인식에 기본 데이터를 생성하여 저장하는 음성 데이터 저장부와,상기 음성 입력부의 전기적 신호와 상기 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
- 음성 인식 자동차용 미디어 재생 장치에 있어서,운전자의 음성을 입력받아 전기적 신호로 변환하는 음성 입력부와,음성 인식에 필요한 기본 데이터를 저장하는 음성 데이터 저장부와,상기 전기적 신호를 기초로 가중치를 부여하는 가중치 부여부와,상기 가중치를 기초로 상기 음성 데이터 저장부에 저장된 기본 데이터를 갱신하여 저장하도록 제어하는 음성 데이터 갱신부와,상기 음성 입력부의 전기적 신호와 상기 음성 데이터 갱신부에 의해서 갱신된 기본 데이터를 비교하여 음성 인식을 수행하는 음성 인식부와,상기 음성 인식부의 인식 결과를 기초로 상기 자동차용 미디어 재생 장치의 제어에 필요한 제어 명령을 생성하는 제어부를 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서,상기 음성 입력부는 마이크인 것인 화자 종속 음성 인식 자동차용 미디어 재생 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서,상기 제어 명령에 대응되는 음성을 사용자가 설정하는 사용자 음성 설정부와,상기 음성 설정부의 음성에 따라서 상기 기본 데이터를 갱신하는 사용자 설정 음성 데이터 갱신부를 더 포함하는 화자 종속 음성 인식 자동차용 미디어 재생 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060055731A KR20070121104A (ko) | 2006-06-21 | 2006-06-21 | 화자 종속 음성 인식 자동차용 미디어 재생 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060055731A KR20070121104A (ko) | 2006-06-21 | 2006-06-21 | 화자 종속 음성 인식 자동차용 미디어 재생 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070121104A true KR20070121104A (ko) | 2007-12-27 |
Family
ID=39138549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060055731A KR20070121104A (ko) | 2006-06-21 | 2006-06-21 | 화자 종속 음성 인식 자동차용 미디어 재생 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20070121104A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504373B2 (en) | 2009-07-02 | 2013-08-06 | Nuance Communications, Inc. | Processing verbal feedback and updating digital video recorder (DVR) recording patterns |
-
2006
- 2006-06-21 KR KR1020060055731A patent/KR20070121104A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504373B2 (en) | 2009-07-02 | 2013-08-06 | Nuance Communications, Inc. | Processing verbal feedback and updating digital video recorder (DVR) recording patterns |
KR101298823B1 (ko) * | 2009-07-02 | 2013-08-23 | 인터내셔널 비지네스 머신즈 코포레이션 | 구두 피드백을 프로세싱하고 디지탈 비디오 레코더(dvr) 기록 패턴을 업데이트하기 위한 설비 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2498392C (en) | Audio system with balance setting based on information addresses | |
EP2045140B1 (en) | Adjustment of vehicular elements by speech control | |
US7457755B2 (en) | Key activation system for controlling activation of a speech dialog system and operation of electronic devices in a vehicle | |
US20060235701A1 (en) | Activity-based control of a set of electronic devices | |
JP4155383B2 (ja) | 音声認識機器操作装置 | |
US20050159945A1 (en) | Noise cancellation system, speech recognition system, and car navigation system | |
JP5014662B2 (ja) | 車載用音声認識装置及び音声認識方法 | |
US20050251273A1 (en) | Dynamic audio control circuit and method | |
CN110648663A (zh) | 车载音频管理方法、装置、设备、汽车及可读存储介质 | |
US20060235698A1 (en) | Apparatus for controlling a home theater system by speech commands | |
US5950166A (en) | Speech actuated control system for use with consumer product | |
US20050286384A1 (en) | Music selection apparatus, music selection system and music selection method | |
US20140349599A1 (en) | System And Method for Searching Stored Audio Data Based on a Search Pattern | |
KR20070121104A (ko) | 화자 종속 음성 인식 자동차용 미디어 재생 장치 | |
JP4829184B2 (ja) | 車載装置および音声認識方法 | |
EP1065652B1 (en) | Voice-based manipulation method and apparatus | |
JP3913884B2 (ja) | 音声認識による選局装置及び方法並びに音声認識による選局用プログラムを記録した記録媒体 | |
US11449167B2 (en) | Systems using dual touch and sound control, and methods thereof | |
JP4201869B2 (ja) | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 | |
JP2004532560A (ja) | 受信プログラムコンテンツに応答して作動する娯楽機器用受信機及びこれを動作させる方法 | |
US20100062848A1 (en) | Vehicle entertainment system operable by a remote device and method for remotely operating a vehicle entertainment system | |
KR102388150B1 (ko) | 차량의 avn 볼륨 조절 시스템 및 그를 이용한 볼륨 조절 방법 | |
JP4913120B2 (ja) | 情報アドレスに基づくバランス設定を有するオーディオシステム | |
KR20060070266A (ko) | 감성 인식 차량용 오디오 시스템 및 그 제어 방법 | |
CN112578989A (zh) | 车载触屏的操作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E601 | Decision to refuse application |