KR20030090863A - 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템 - Google Patents

음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템 Download PDF

Info

Publication number
KR20030090863A
KR20030090863A KR1020020028459A KR20020028459A KR20030090863A KR 20030090863 A KR20030090863 A KR 20030090863A KR 1020020028459 A KR1020020028459 A KR 1020020028459A KR 20020028459 A KR20020028459 A KR 20020028459A KR 20030090863 A KR20030090863 A KR 20030090863A
Authority
KR
South Korea
Prior art keywords
voice
hands
word model
module
speech recognition
Prior art date
Application number
KR1020020028459A
Other languages
English (en)
Inventor
정인구
Original Assignee
(주)표정밝은세상
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)표정밝은세상 filed Critical (주)표정밝은세상
Priority to KR1020020028459A priority Critical patent/KR20030090863A/ko
Publication of KR20030090863A publication Critical patent/KR20030090863A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 특정화자와 무관한 화자독립 방식과 음소 단위의 가변어 인식 방식의 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템에 관한 것이다. 본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템은, a) 추가 확장된 음성인식 기능에 대응하는 인터페이스를 갖도록 설계된 핸즈프리; 및 b) 입출력 인터페이스를 통해 핸즈프리와 연결되는 음성인식 모듈-여기서 음성인식 모듈은, ⅰ) 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부; ⅱ) 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부; ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB; ⅳ) 단어모델 DB로부터 정보를 읽어 들이고, 인식할 음성 대상에 대한 어휘 목록과 제어 신호를 수신하여 단어모델을 생성하는 단어모델 생성부; 및 ⅴ) 단어 모델의 음소 단위의 처리를 위한 고속처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부를 구비함-을 포함하며, 본 발명에 따르면 특정 화자와 무관하며, 음소 단위의 가변어 인식에 의해 음성등록이 필요 없고, 단말기에 기등록된 전화번호부를 실시간으로 자동 등록하여 음성다이얼링을 할 수 있다.

Description

음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템 {A hands-free system using a speech recognition module or a bluetooth module}
본 발명은 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템에 관한 것으로서, 보다 상세하게는 특정 화자와 무관한 화자독립(speaker independent) 방식과 음소 단위의 가변어 인식 방식의 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템에 관한 것이다.
음성인식(ASR: Automatic Speech Recognition) 기술이란 기계, 즉 컴퓨터를 사용하여 인간의 음성 신호를 인식하고 내재된 언어 정보를 파악하여 필요한 작업을 실행시키는 기술을 말한다. 구체적으로, 음성인식이란 전화, 핸드폰 또는 마이크를 통하여 컴퓨터에 전달된 사람의 음성의 특징을 추출하고 분석하여 미리 입력된 인식 목록에서 가장 근접한 결과를 찾아내는 기술로서, 음성인식 기술은 사람과 기계의 대화형 인터페이스 기술로 컴퓨터, 통신, 가전제품 등의 사용을 도와주는 고품위의 차세대 사용자 인터페이스로서 산업 및 정보화 기술에 적용되고 있다.
이러한 음성인식은 그 사용자에 따라 1) 화자종속 방식(Speaker Dependent System), 2) 화자독립 방식(Speaker Independent System) 및 3) 화자적응 방식(Speaker Adaptive System)으로 분류되며, 그 발음 방식에 따라 1) 핵심어를인식하는 고립단어 인식, 2) 연속 음성을 인식하는 연결단어 인식 및 3) 대화음성 인식으로 분류된다. 또한, 그 인식 대상 어휘 수에 따라, 1) 소용량, 2) 중용량 및 3) 대용량으로 분류되며, 그 인식 단위에 따라 1) 단어 단위로 인식하는 단어 인식 기술 및 2) 음소 단위로 인식하는 가변어 인식 기술로 분류될 수 있다.
또한, 현재 개발되고 있는 음성인식 기술을 보다 구체적으로 설명하면 다음과 같다. 첫째로, 발화 방법에 따라 고립단어 인식과 연결단어 인식, 그리고 연속음성인식으로 나누어진다. 고립단어 인식은 한 단어씩 또박또박 띄어 발음한 음성을 대상으로 하며 각 단어 사이에 충분한 휴지기간이 포함되어 단어 경계가 분명하다. 연결단어 인식은 전화번호를 발음하는 연속 숫자 음과 같이 단어들이 연결되어 발음된 것을 인식하는 것이다. 그리고, 기설정된 문법 정보를 고려하여 연속적으로 발음된 문장을 인식하는 것을 연속 음성인식이라고 하며 낭독체 및 대화체 연속 음성인식으로 다시 세분화될 수 있다.
둘째로, 발성화자에 따라 특정 화자(또는 화자종속) 음성인식, 불특정 화자(또는 화자독립) 음성인식 및 화자적응 음성인식으로 나눌 수 있다. 특정 화자 음성인식은 훈련에 참여한 특정 화자의 음성을 인식하는 것이고, 불특정 화자 음성인식은 훈련에 참여하지 않은 임의의 화자의 음성을 인식하는 것이다. 또한, 인식대상 화자의 일부 음성만으로 미리 준비된 불특정 화자 음성인식 시스템의 모델을 적응시키는 화자적응 방식이 사용될 수도 있다.
셋째로, 인식대상 어휘 수에 따라 소규모, 중규모 및 대규모 어휘 음성인식으로 나누어진다. 이 둘 사이의 구분에 명확한 경계가 있는 것은 아니지만 통상적으로 수백 단어 이하는 소규모 어휘, 수만 단어 이상은 대규모 어휘라 불린다.
도 1은 음성인식 시스템의 일반적인 구성도로서, 전체적인 음성인식 동작을 개략적으로 설명하면 다음과 같다.
먼저, 마이크를 통해 입력된 음성은 디지털 신호로 변환되어 음성인식시스템으로 들어오게 되며, 음성인식의 첫단계인 음성 특징 분석(1)을 통해 단구간(short-time)별로 음성학적 특징을 잘 표현해 줄 수 있는 음성 특징계수들을 추출하게 된다.
이와 같이 추출된 음성 특징계수들은 패턴 인식 과정(2)으로 넘겨져서 미리 저장된 단어 또는 음소들의 음향학적 모델(4)과 비교하게 되며, 그 결과는 일련의 후보단어 또는 후보음소들의 형태로 언어 처리 과정(3)에 전달된다.
언어 처리 과정(3)에서는 후보단어 또는 후보음소들의 정보를 토대로 하여, 언어학적 모델(5)의 인식대상 어휘 및 문법 구조, 그리고 특정 주제에의 부합 여부를 판단하여 최종 인식된 문장을 출력시키게 된다. 경우에 따라서는 상기 언어 처리 과정(3)에서 새로운 후보단어나 후보음소를 추정하여 패턴인식 과정(2)에 전달하여 이를 확인해보도록 지시할 수도 있다.
그런데, 종래의 음성인식 모듈을 이용하는 핸즈프리 시스템은 음성인식 기술의 초보적 기술을 응용하고 있다. 즉, 1) 화자종속 방식이며, 2) 고정어 인식이므로 음성 등록 시, 예를 들어, 2~3회 반복 녹음을 통하여 등록하기 때문에 사용 편이성이 떨어지고, 또한, 3) 최대 30~50 단어 정도만 인식이 가능하므로, 즉, 50명 이상은 전화번호부에 등록이 불가능하다.
다시 말하면, 종래의 음성인식 모듈을 이용하는 핸즈프리 시스템은 화자종속 방식으로 등록자 외에는 사용이 불가능하며, 고정어 인식 방식으로 전화번호부에 이미 등록이 되어있는 정보 외에는 사용이 불가능하다는 문제점이 있다.
한편, 최근에 근거리에 놓여 있는 컴퓨터와 주변기기, 이동단말기와 컴퓨터, 가전제품 등을 상호 무선 네트워크로 연결하여, 각각의 기기간을 연결하는 복잡한 전선이 없이도 양방향 실시간 통신이 가능하게 하는 근거리 무선통신 표준으로 블루투스(Bluetooth)가 채택되고, 이를 구현한 모듈이 칩 형태로 보급되면서, 블루투스는 컴퓨터나 가전제품뿐만 아니라 IMT-2000으로 대표되는 제3 세대 디지털 이동통신의 중요한 한 구성요소로 부상하고 있다. 이 블루투스는 근거리 무선통신에 있어서, 종래의 적외선 통신(IrDA)을 대체하는 수준에 이르고 있다.
또한, 최근 이동식 단말기와 컴퓨터 등 다른 음성 혹은 데이터 처리장치 간의 단거리 통신을 돕기 위해서 이동식 단말기에 미리 블루투스 모듈을 내장하여 출시되고 있으며, 블루투스 모듈의 부품 수도 줄어들어 주요 칩 제조회사에서는 블루투스의 무선주파수(Radio Frequency: RF)부와 베이스밴드(Baseband)부를 각각 하나의 칩으로 묶고, 제어부를 하나의 칩으로 하는 투칩(two-chip) 형태로 하거나, RF부, 베이스밴드부 및 호스트와의 연결을 관장하는 제어부까지 하나의 칩으로 묶은 단일 칩 구조를 개발하여 공급하고 있는 실정이다.
또한, 이동식 단말기에 블루투스 모듈이 내장될 경우, 이러한 블루투스 내장형 이동식 단말기와 인터페이스되어 데이터나 음성을 주고받을 수 있는 제품이 보급되고 있다.
그런데, 이러한 종래의 블루투스 모듈이 장착된 핸즈프리의 경우에도 음성인식 기술을 전혀 사용하고 있지 않거나, 또는 음성인식 기술을 사용한다해도 화자종속 방식으로 등록자 외에는 사용이 불가능하며, 고정어 인식 방식으로 전화번호부에 이미 등록이 되어있는 정보 외에는 사용이 불가능하다는 문제점이 있다.
상술한 문제점을 해결하기 위한 본 발명의 목적은 특정 화자와 무관한 화자독립 방식 및 음소 단위의 가변어를 인식함으로써, 음성등록이 필요 없고, 단말기에 이미 등록이 된 전화번호부를 실시간으로 자동 등록하여 음성다이얼링이 가능한 음성인식 모듈을 이용하는 핸즈프리 시스템을 제공하기 위한 것이다.
또한, 본 발명의 다른 목적은 단말기에 등록이 된 전화번호부의 변경이 필요할 경우에, 음성다이얼링을 위한 추가 변경 없이 실시간으로 자동으로 변경시키는 음성인식 모듈을 이용하는 핸즈프리 시스템을 제공하기 위한 것이다.
또한, 본 발명의 또 다른 목적은 특정 화자와 무관한 화자독립 방식 및 음소 단위의 가변어를 인식할 수 있는 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템을 제공하기 위한 것이다.
도 1은 일반적인 음성인식 시스템의 기본적인 구성도이다.
도 2는 본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템을 개략적으로 설명하기 위한 도면이다.
도 3은 본 발명에 따른 디지털 신호처리기 음성인식 모듈의 개략적인 구성도이다.
도 4는 본 발명의 실시예에 따른 디지털 신호처리기 음성인식 모듈을 이용하는 핸즈프리 시스템의 개략적인 구성도이다.
도 5a 내지 도 5b는 본 발명에 따른 디지털 신호처리기 음성인식 모듈을 이용하는 핸즈프리 시스템의 동작 방법을 나타내는 순서도이다.
도 6은 본 발명에 따른 이동식 단말기의 입출력 단자와의 접속 규격을 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템의 구성도이다.
도 8은 본 발명의 실시예에 따른 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템의 세부 구성도이다.
상기 목적을 달성하기 위한 수단으로서, 본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템은, 음성인식 모듈 및 핸즈프리를 구비하며 이동식 단말기와 연결되는 유/무선 핸즈프리 시스템에 있어서, a) 추가 확장된 음성인식 기능에 대응하는 인터페이스를 갖도록 설계된 핸즈프리; 및 b) 입출력 인터페이스를 통해 상기 핸즈프리와 연결되는 음성인식 모듈-여기서 음성인식 모듈은, ⅰ) 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부; ⅱ) 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부; ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB(45); ⅳ) 상기 단어모델 DB로부터 정보를 읽어 들이고, 인식할 음성 대상에 대한 어휘 목록과 제어 신호를 수신하여 상기 단어모델을 생성하는 단어모델 생성부(44); 및 ⅴ) 상기 단어 모델의 음소 단위의 처리를 위한 고속 처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부를 포함함-을 포함하여 구성되는 특징이 있다.
또한, 본 발명에 따르면, 상기 음성인식 모듈은 인식할 이동식 단말기의 정보와 음성인식 처리 결과를 상기 입출력 처리부를 통해 실시간으로 주고받는 것을 특징으로 한다.
또한, 본 발명에 따르면, 상기 음성 파라미터 추출부는 오디오 코덱(Audio CODEC)인 것이 바람직하다.
또한, 본 발명에 따르면, 상기 단어모델 DB로는 상기 음성인식 모듈 내에 내장되는 플래시 메모리, 또는 외부 메모리가 사용될 수 있다.
또한, 본 발명에 따르면, 상기 음성 처리부는 디지털 신호처리기(DSP)인 것이 바람직하다.
한편, 본 발명에 따른 블루투스 모듈 및 핸즈프리를 구비하며, 이동식 단말기와 연결되는 블루투스 모듈 또는 음성인식 모듈을 이용하는 핸즈프리 시스템은, a) 상기 이동식 단말기의 음성 출력단자를 통해 출력된 음성신호를 블루투스 프로토콜 데이터로 변환하는 제1 블루투스 모듈을 구비하며, 추가 확장된 음성인식 기능에 대응하는 인터페이스를 갖도록 설계되는 핸즈프리; b) 입출력 인터페이스를 통해 상기 핸즈프리와 연결되는 음성인식 모듈-여기서 음성인식 모듈은, ⅰ) 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부; ⅱ) 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부; ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB; ⅳ) 상기 단어모델 DB로부터 정보를 읽어 들이고, 인식할 음성대상에 대한 어휘 목록과 제어 신호를 수신하여 상기 단어모델을 생성하는 단어 모델 생성부; 및 ⅴ) 상기 단어 모델의 음소 단위의 처리를 위한 고속 처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부를 구비함-; 및 c) 상기 제1 블루투스 모듈로부터 출력된 블루투스 무선신호를 수신 및 음성신호로 변환하여 음성출력하는 음성인식 블루투스 모듈을 포함하여 이루어지는 특징이 있다.
따라서, 본 발명에 따른 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템은 상기 DSP 음성 처리 수단(43)의 고속 연산 처리 및, 소정의 알고리듬을 통해 화자독립 방식 및 음소 단위의 가변어 인식 방식에 의해 음성을 인식하여 처리하게 된다.
이하, 첨부된 도면을 참조하여, 본 발명의 바람직한 실시예에 따른 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리 시스템을 상세하게 설명하지만, 본 발명이 하기 실시예들에 의해 제한되거나 한정되는 것은 아니다.
도 2는 본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템을 개략적으로 설명하기 위한 도면으로서, 본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템(20)은 이동식 단말기 또는 핸드폰(10)과 인터페이스를 통해 연결되는 핸즈프리 시스템(30), 및 이 핸즈프리 시스템(30)과 인터페이스를 통해 연결되는 음성인식 모듈(40)로 이루어진다. 여기에서, 상기 음성인식 모듈(20)은 화자독립 방식 및 음소 단위의 가변어 인식 방식을 적용하기 위해서 고속 연산 처리가 가능한 DSP를 사용하여 음성모델을 생성하게 된다.
한편, 도 3은 본 발명에 따른 디지털 신호처리기 음성인식 모듈의 개략적인 구성도이다.
도 3에 도시된 바와 같이, 본 발명은, 입출력 인터페이스를 통해 핸즈프리와 연결되는 음성인식 모듈(40)은 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부(41); 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부(42); ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB(45); ⅳ) 상기 단어모델 DB(45)로부터 정보를 읽어 들이고, 인식할 음성 대상에 대한 어휘 목록과 제어 신호를 수신하여 상기 단어모델을 생성하는 단어모델 생성부(44); 및 ⅴ) 상기 단어 모델의 음소 단위의 처리를 위한 고속처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부(43)로 이루어진다.
도 4는 본 발명의 실시예에 따른 디지털 신호처리기 음성인식 모듈을 이용하는 핸즈프리 시스템의 개략적인 구성도로서, 이동식 단말기(10)의 입출력 단자를 이용하는 음성인식 핸즈프리 시스템과 이동식 단말기(10)의 인터페이스 구조는 다음과 같다.
상기 음성인식 모듈(40)은 다양한지 인터페이스 방법을 통해서 핸즈프리(30)와 정보를 주고받게 된다. 상기 음성인식 모듈(40)의 구성은 크게 오디오 코덱(Audio CODEC)인 음성 파라미터 추출부(42), 단어 모델 생성부(44), DSP로 이루어지는 음성처리부(43), 인터페이스 칩을 사용하는 입출력 처리부(41), 및 플래시 메모리(45) 등으로 나누어지게 된다.
상기 음성인식 모듈(40)은 입출력 처리부(41) 및 I/O 인터페이스를 통해 인식할 이동식 단말기(10)의 정보와 인식처리 결과를 실시간으로 주고받게 된다.
한편, 상기 음성인식 핸즈프리 시스템(20)의 모듈별 기능을 살펴보면 다음과 같다.
먼저, 핸즈프리(30)는 음성인식 등 추가 확장 기능에 대응 가능하도록 설계된다. 또한, 입출력 처리부(41)는 이동식 단말기(10)로부터 인식할 대상 단어의 어휘 목록을 받아들이게 된다.
그리고, 상기 음성 파라미터 추출부(42)는 오디오 코덱으로 입력된 음성을 샘플링(8KHz, 16bit)하여 파라미터를 추출한다. 상기 음성 파라미터를 추출하기 위한 오디오 코덱(42)은 입력 이득은 0~22.5 dB, 8kHz에 13bit 정도로 샘플링할 수 있는 필터가 사용되는 것이 바람직하다.
또한, 단어 모델 생성부(44)는 인식할 대상에 대한 어휘 목록과 제어 신호를 이동식 단말기로부터 받아들이고, 결과 정보와 상태 정보를 전송하며, 단어모델 DB(45)로부터 데이터를 읽어 들여 단어모델을 생성한다.
또한, DSP인 음성 처리부(43)는 DSP의 고속 처리 기능을 이용하여 음성인식 연산을 수행하여 인식 결과를 산출하게 된다. 상기 DSP(43)는 100MHz/100MIPS 급 정도가 사용된다.
또한, 상기 단어 모델 저장 DB(45)는 32Mbit의 외부 메모리를 사용할 수 있으며, 16/8bit 버스 선택 기능을 갖고, 액세스 타임이 100㎱ 정도의 것을 사용한다.
한편, 도 5a 내지 도 5b는 본 발명에 따른 디지털 신호처리기 음성인식 모듈을 이용하는 핸즈프리 시스템의 동작 방법을 나타내는 순서도이다. 도 5a는 음성 인식 모듈(20)에서 동작되는 것을 나타내며, 도 5b는 이동식 단말기(10)에서 이루어지는 동작을 나타낸다.
도 5a 내지 도 5b를 참조하면, 도 5b의 이동식 단말기(10) 내의 모듈이 초기화되고(S21), 또한, 도 5a의 음성인식 모듈(20)의 오디오 코덱(42), I/O 인터럽트 벡터 등이 초기화되면(S11), 음성인식 모듈(20)은 상기 이동식 단말기(10)로부터 전송되는 어휘 목록의 수신이 완료되었는지 판단하고(S12), 어휘 목록의 수신이 완료되는 경우, 수신된 정보에 포함된 다운로드 완료 플래그를 "1"로 세팅(setting)하여 이동식 단말기(10) 측으로 전송하게 된다(S13).
이후, DSP의 초고속 연산 처리에 의해 화자독립 방식 및 음소 단위의 가변어 인식 방식의 음성 모델을 생성하여(S14), 플래시 메모리 내에 저장하거나(S15), 또는 플래시 메모리 내에 기저장된 음성 모델을 토대로 하여 음성 모델을 생성하게 된다. 다음에, 오디오 코덱(42)을 이용하여 음성 파라미터를 추출하고 음성을 인식하게 된다(S16).
이후, 상기 음성인식이 완료되는지 판단하여(S17), 음성인식이 완료되는 경우, 다시 수신된 정보에 포함된 다운로드 완료 플래그를 "1"로 setting 하여 이동식 단말기(10) 측으로 전송하게 된다(S17).
도 5b를 다시 참조하면, 이동식 단말기(10) 내의 모듈 초기화 단계(S21)에서는 I/O 인터페이스, 음성모델 생성 모듈에 필요한 어휘 목록 등이 초기화된다. 이후, 상기 음성인식 모듈(20)로 상기 어휘 목록을 전송한다(S22).
상기 어휘 목록 전송이 완료되고, 또한 상기 음성인식 모듈(20)로부터 수신 완료 정보, 즉 다운로드 완료 플래그가 "1"로 세팅된 정보가 수신되는지 판단하여(S23), 수신이 완료되는 경우, 이에 대한 안내 멘트를 내보내게 된다(S24).
이후, 도 5a에 도시된 인식 완료 단계(S17)가 완료되었다는 정보가 이동식 단말기 측으로 전송되면, 음성인식 결과를 판단하게 된다(S25). 즉, 상기 인식 결과에 따라 해당 명령을 수행하게 된다(S26).
상기 음성인식 핸즈프리는 기존의 음성인식 기능을 갖고 있는 단말기 및 핸즈프리와 달리, 화자독립 방식 및 가변어 인식 방식이며, 음성등록이 필요 없고, 단말기에 이미 등록이 된 전화번호부를 실시간으로 자동 등록하여 음성다이얼링을 할 수 있다. 여기서, 음성다이얼링(VAD: Voice Activated Dialing)이란 전술한 음성인식 기술을 응용하여 사람의 음성 명령으로 전화 걸기 기능을 구현한 기술을 말하며, 최근 자동차용 또는 이동식 단말기 등에 적용되고 있다.
또한, 단말기에 등록이 된 전화번호부가 변경이 있을 시에 실시간으로 자동으로 변경되어 음성 다이얼링을 위하여 추가 변경이 필요 없으며, 최대 500단어까지 인식이 가능하게 된다.
한편, 도 6은 본 발명의 실시예에 따른 이동식 단말기의 입출력 단자와의 접속 규격을 나타내는 도면이다.
도 6에 도시된 바와 같이, 이동식 단말기(10)와 접속되는 입출력 단자는 24핀 방식으로서, 각 핀번호에 대한 기능별 신호명이 주어지는데, 핀번호, 신호명 및 그 기능에 대해서는 도면을 참조하기로 하고, 세부적인 설명은 생략한다.
이하, 도 7과 도 8을 참조하여, 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템의 구성과 동작을 설명한다.
도 7은 본 발명의 실시예에 따른 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템의 구성도이며, 도 8은 본 발명의 실시예에 따른 음성인식이 가능한 블루투스 모듈을 이용하는 핸즈프리 시스템의 세부 구성도이다.
도 7과 도 8을 참조하면, 핸즈프리 기능을 구비한 핸드폰 핸즈프리와 음성인식이 가능한 블루투스 모듈에 각각 블루투스 모듈을 내장하여 사용하는 음성인식 블루투스 핸즈프리 시스템(200)은, 상기 핸드폰(100)의 음성출력 단자를 통해 출력된 음성신호를 블루투스 프로토콜 데이터로 변환하는 제1 블루투스 모듈(310)을 내장한 핸즈프리(300), 상기 핸드폰 핸즈프리(300)의 제1 블루투스 모듈(310)을 통해 송출된 무선신호를 수신하여 음성신호로 변환하여 음성 출력하고, 사용자의 음성을 입력하여 블루투스 데이터로 변환하는 음성인식이 가능한 블루투스 모듈(400)을 포함한다.
도 8을 참조하면, 상기 핸드폰 핸즈프리(300)에서, 제1 음성 송/수신부(301)는 핸드폰(100)의 이어폰 단자를 통해 송/수신되는 음성신호를 필터링 및 증폭하는 등 전송된 음성신호를 처리하고, 제1 블루투스 모듈(310)은 상기 제1 음성 송/수신부(301)로부터 전송된 음성신호를 블루투스 포맷의 무선 음성신호로 변환한다. 그리고, 제1 무선 송/수신부(311)는 제1 블루투스 모듈(310)로부터 출력된 음성신호를 설정된 주파수로 무선 송출하고, 제1 음성신호 처리부(320)는 제1 음성 송/수신부(301)로부터 출력된 음성신호를 처리하여 스피커(SPK)를 통해 음성 출력함과 아울러, 마이크(MIC)를 통해 입력된 음성신호를 처리하여 상기 제1 음성 송/수신부로 전송하며, 이때 제어부(302)가 상기 각 부를 제어하게 된다.
또한, 음성인식이 가능한 블루투스 모듈(400)에서, 제2 무선 송/수신부(401)는 핸즈프리(300)의 제1 무선 송/수신부(311)를 통해 무선 송출된 블루투스 무선 음성신호를 수신하고, 제2 블루투스 모듈(402)은 제2 무선 송/수신부(401)를 통해 전송된 블루투스 포맷의 음성신호를 재생 가능한 음성신호로 복원하며, 제2 음성신호 처리부(403)는 상기 제2 블루투스 모듈(402)에서 출력된 음성신호를 이어스피커(404)를 통해 음성 출력함과 아울러 마이크로폰(405)을 통해 입력된 음성신호를 처리하여 상기 제2 블루투스 모듈(402)로 전송하게 된다.
이때, 상기 핸즈프리(300)는 앞의 실시예에서 설명한 바와 같이 음성인식 모듈과 결합될 수 있고, 음성 파라미터 추출부, 단어 모델 생성부, 음성처리부, 입출력 처리부, 및 플래시 메모리 등이 전술한 바와 같은 동작에 의해 고속 연산 처리 및, 소정의 알고리듬을 통해 화자독립 방식 및 음소 단위의 가변어 인식 방식에 의해 음성을 인식하여 처리하게 된다.
본 발명을 상기 실시예에 의해 구체적으로 설명하였지만, 본 발명은 이에 의해 제한되는 것은 아니고, 당업자의 통상적인 지식의 범위 내에서 그 변형이나 개량이 가능하다.
본 발명에 따른 음성인식 모듈을 이용하는 핸즈프리 시스템은 특정 화자와 무관한 화자독립 방식 및 음소 단위의 가변어 인식에 의해 음성등록이 필요 없고, 단말기에 이미 등록이 된 전화번호부를 실시간으로 자동 등록하여 음성다이얼링을 할 수 있다.
또한, 본 발명에 따르면 단말기에 등록이 된 전화번호부가 변경이 필요할 경우에, 음성다이얼링을 위한 추가 변경 없이 실시간으로 자동으로 변경시킬 수 있다.

Claims (6)

  1. 음성인식 모듈 및 핸즈프리를 구비하며, 이동식 단말기와 연결되는 유/무선핸즈프리 시스템에 있어서,
    a) 추가 확장된 음성인식 기능에 대응하는 인터페이스를 갖도록 설계된 핸즈프리; 및
    b) 입출력 인터페이스를 통해 상기 핸즈프리와 연결되는 음성인식 모듈-여기서 음성인식 모듈은,
    ⅰ) 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부;
    ⅱ) 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부;
    ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB;
    ⅳ) 상기 단어모델 DB로부터 정보를 읽어 들이고, 인식할 음성 대상에 대한 어휘 목록과 제어 신호를 수신하여 상기 단어모델을 생성하는 단어 모델 생성부; 및
    ⅴ) 상기 단어 모델의 음소 단위의 처리를 위한 고속 처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부
    를 구비함-
    을 포함하여 구성되는 음성인식 모듈을 이용하는 핸즈프리 시스템.
  2. 제1항에 있어서,
    상기 음성인식 모듈은 인식할 이동식 단말기의 정보와 인식처리 결과를 상기 입출력 처리부를 통해 실시간으로 주고받는 것을 특징으로 하는 음성인식 모듈을 이용하는 핸즈프리 시스템.
  3. 제1항에 있어서,
    상기 음성 파라미터 추출부는 오디오 코덱(Audio CODEC)인 것을 특징으로 하는 음성인식 모듈을 이용하는 핸즈프리 시스템.
  4. 제1항에 있어서,
    상기 단어모델 DB로는 상기 음성인식 모듈 내에 내장되는 플래시 메모리, 또는 외부 메모리가 사용되는 것을 특징으로 하는 음성인식 모듈을 이용하는 핸즈프리 시스템.
  5. 제1항에 있어서,
    상기 음성 처리부는 디지털 신호처리기(DSP)인 것을 특징으로 하는 음성인식 모듈을 이용하는 핸즈프리 시스템.
  6. 블루투스 모듈 및 핸즈프리를 구비하며, 이동식 단말기와 연결되는 무선핸즈프리 시스템에 있어서,
    a) 상기 이동식 단말기의 음성 출력단자를 통해 출력된 음성신호를 블루투스 프로토콜 데이터로 변환하는 제1 블루투스 모듈을 구비하며, 추가 확장된 음성인식 기능에 대응하는 인터페이스를 갖도록 설계되는 핸즈프리;
    b) 입출력 인터페이스를 통해 상기 핸즈프리와 연결되는 음성인식 모듈-여기서 음성인식 모듈은,
    ⅰ) 이동식 단말기로부터 인식할 대상 단어의 어휘 목록을 받아들이는 입출력 처리부;
    ⅱ) 입력된 음성을 샘플링하여 특징 파라미터를 추출하는 음성 파라미터 추출부;
    ⅲ) 음성인식을 위한 단어모델의 결과 및 상태 정보를 저장하는 단어모델 DB;
    ⅳ) 상기 단어모델 DB로부터 정보를 읽어 들이고, 인식할 음성 대상에 대한 어휘 목록과 제어 신호를 수신하여 상기 단어모델을 생성하는 단어 모델 생성부; 및
    ⅴ) 상기 단어 모델의 음소 단위의 처리를 위한 고속 처리 기능을 가지며, 음성인식 연산을 수행하여 인식 결과를 산출하는 음성 처리부
    를 구비함-; 및
    c) 상기 제1 블루투스 모듈로부터 출력된 블루투스 무선신호를 수신 및 음성신호로 변환하여 음성출력하는 음성인식 블루투스 모듈
    을 포함하여 구성되는 블루투스 모듈 또는 음성인식 모듈을 이용하는 핸즈프리 시스템.
KR1020020028459A 2002-05-22 2002-05-22 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템 KR20030090863A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020028459A KR20030090863A (ko) 2002-05-22 2002-05-22 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020028459A KR20030090863A (ko) 2002-05-22 2002-05-22 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템

Publications (1)

Publication Number Publication Date
KR20030090863A true KR20030090863A (ko) 2003-12-01

Family

ID=32383989

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020028459A KR20030090863A (ko) 2002-05-22 2002-05-22 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템

Country Status (1)

Country Link
KR (1) KR20030090863A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040023331A (ko) * 2002-09-11 2004-03-18 현대모비스 주식회사 차량용 핸즈프리 장치
KR20060089294A (ko) * 2005-02-03 2006-08-09 주식회사 현대오토넷 무선 핸즈프리 디지털 카오디오
US9628617B2 (en) 2014-07-11 2017-04-18 Hyundai Motor Company Method and apparatus for controlling outgoing call in vehicle equipped with voice recognition function
CN110111779A (zh) * 2018-01-29 2019-08-09 阿里巴巴集团控股有限公司 语法模型生成方法及装置、语音识别方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040023331A (ko) * 2002-09-11 2004-03-18 현대모비스 주식회사 차량용 핸즈프리 장치
KR20060089294A (ko) * 2005-02-03 2006-08-09 주식회사 현대오토넷 무선 핸즈프리 디지털 카오디오
US9628617B2 (en) 2014-07-11 2017-04-18 Hyundai Motor Company Method and apparatus for controlling outgoing call in vehicle equipped with voice recognition function
US9774719B2 (en) 2014-07-11 2017-09-26 Hyundai Motor Company Method and apparatus for controlling outgoing call in vehicle equipped with voice recognition function
CN110111779A (zh) * 2018-01-29 2019-08-09 阿里巴巴集团控股有限公司 语法模型生成方法及装置、语音识别方法及装置
CN110111779B (zh) * 2018-01-29 2023-12-26 阿里巴巴集团控股有限公司 语法模型生成方法及装置、语音识别方法及装置

Similar Documents

Publication Publication Date Title
US7957972B2 (en) Voice recognition system and method thereof
EP1348212B1 (en) Mobile terminal controllable by spoken utterances
US7689417B2 (en) Method, system and apparatus for improved voice recognition
US6393403B1 (en) Mobile communication devices having speech recognition functionality
EP1047046B1 (en) Distributed architecture for training a speech recognition system
CN103095911A (zh) 一种通过语音唤醒寻找手机的方法及系统
US20020091515A1 (en) System and method for voice recognition in a distributed voice recognition system
US20040148172A1 (en) Prosodic mimic method and apparatus
WO2002097590A3 (en) Language independent and voice operated information management system
WO2001099096A1 (fr) Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
CN101345819A (zh) 一种用于机顶盒的语音控制系统
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US20220254369A1 (en) Electronic device supporting improved voice activity detection
EP1215660A1 (en) Mobile terminal controllable by spoken utterances
KR20210148057A (ko) 음성 인식 방법 및 이에 사용되는 장치
US20010056345A1 (en) Method and system for speech recognition of the alphabet
EP1110207B1 (en) A method and a system for voice dialling
KR20030090863A (ko) 음성인식 모듈 또는 블루투스 모듈을 이용하는 핸즈프리시스템
JP5510069B2 (ja) 翻訳装置
WO2000022609A1 (en) Speech recognition and control system and telephone
KR100414064B1 (ko) 음성인식에 의한 이동통신 단말기 제어시스템 및 방법
JP2000101705A (ja) 無線電話機
US20020183049A1 (en) On-vehicle communication device and a method for communicating on-vehicle
KR100347790B1 (ko) 명령어 갱신이 가능한 음성인식 방법 및 그 시스템
CN201266374Y (zh) 一种实现单位换算的装置

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination