KR100827074B1

KR100827074B1 - 이동 통신 단말기의 자동 다이얼링 장치 및 방법

Info

Publication number: KR100827074B1
Application number: KR1020040023355A
Authority: KR
Inventors: 김강열; 강상기
Original assignee: 삼성전자주식회사
Priority date: 2004-04-06
Filing date: 2004-04-06
Publication date: 2008-05-02
Also published as: KR20050098349A

Abstract

본 발명은 이동 통신 단말기에서, 특정 구조를 가지는 단어로부터 미리 설정된 설정 개수의 음절들인 핵심어들의 음성 특징 패턴들과 숫자를 나타내는 숫자 인덱스들의 음성 특징 패턴들 및 다수의 상대방 정보들을 상기 숫자 인덱스들과 매핑하여 저장하고, 최초로 입력되는 음성의 특징 패턴이 상기 핵심어들 중 어느 한 핵심어의 음성 특징 패턴과 일치할 경우 상기 입력 음성을 핵심어로 판단한다. 상기 상대방 정보들 중 상기 판단된 핵심어를 가지는 상대방 정보들 및 그에 매핑되어 있는 숫자 인덱스들을 디스플레이한 후, 상기 상대방 정보들 및 그 숫자 인덱스들을 디스플레이한 후 입력되는 음성의 음성 특징 패턴이 상기 숫자 인덱스들 중 어느 한 숫자 인덱스의 음성 특징 패턴과 일치할 경우 상기 일치하는 숫자 인덱스에 매핑되어 있는 상대방 정보에 상응하게 자동 다이얼링한다.

음성인식, 전화번호검색, 핵심어, 숫자음 인식, 자동 다이얼링, TTS

Description

이동 통신 단말기의 자동 다이얼링 장치 및 방법{APPARATUS AND METHOD FOR AUTOMATIC DIALLING IN A MOBILE PORTABLE TELEPHONE}

도 1은 본 발명의 실시예에 따른 음성인식을 이용한 이동통신 단말기의 구성을 도시한 도면

도 2는 본 발명의 실시예에 따른 음성인식을 위한 핵심어 데이터베이스 구성과정을 보여주는 도면

도 3은 본 본 발명의 실시예에 따른 자동 다이얼링을 위한 제어 흐름을 보여주는 구성도면

본 발명은 이동 통신 단말기에서 자동 다이얼링 장치 및 방법에 관한 것으로서, 특히 핵심어 음성 인식을 사용하는 자동 다이얼링 장치 및 방법에 관한 것이다.

일반적으로 음성인식 기술은 학습시킨 특정인의 음성만을 인식하는 화자 종 속형 음성 인식 기술과 모든 사람들의 음성을 인식하는 화자 독립형 음성 인식 기술로 분류된다. 상기 화자 종속형 음성 인식 기술을 사용하는 이동 통신 단말기의 음성 인식 모드에서는 상기 이동 통신 단말기의 사용자가 미리 설정한 다이얼링 음성에 해당하는 다이얼링 음성만을 인식하여 자동 다이얼링을 수행하는 것이 가능하다. 그래서, 상기 화자 종속형 음성인식 기술은 음성 인식률이 상당히 저조하고 사용이 복잡하여 불편하고, 전화번호 등록 시 상기 등록하는 전화번호와 매핑될 음성도 별도로 저장을 해야 하기 때문에 상기 이동통신 단말기의 메모리 사용량이 늘어나게 된다는 문제점이 있었다.

상기 화자 종속형 음성인식 기술의 문제점을 해결하기 위해 화자 독립형 음성 인식 기술을 사용하여 자동 다이얼링하는, 즉 음소 단위 화자 독립 인식기를 이용하여 전화번호를 검색한 후 자동 다이얼링하는 방법이 최근에 많이 사용되고 있다. 상기 음소 단위 화자 독립 인식기는 이동 통신 단말기를 불특정 다수의 사용자들이 사용할 수 있도록 제작된다. 상기 음소 단위 화자 독립 인식기는 언어학적으로 구성된 단어나 어구에 해당하는 음성을 가능한 많은 사람들의 경우에 대해 확보하여 구성된다. 이렇게 많은 사람들의 음성을 확보해야 하는 이유는 사람마다 단어를 발성하는 방식이 다르고 지역에 따라서 같은 단어를 발음하더라도 억양과 강세가 다르기 때문이며, 이러한 다양한 발성들을 이용한 단어들로 이루어진 음성 인식용 데이터베이스를 구축하여 상기 음소 단위 화자 독립기에 적용해야 하기 때문이다. 따라서, 상기 화자 독립형 음성 인식 기술을 사용하기 위해서는 단어를 음절 단위로 나누고 또 다시 음소 단위로 나누어서 분석을 하게 되고, 그 후에 음소 별 로 최적화된 단어 네트워크를 구성해야 한다. 상기 화자 독립형 음성 인식 기술은 상기에서 설명한 바와 같은 방식으로 음성을 인식하기 때문에 새로운 단어가 입력되면 상기 이동 통신 단말기 메모리 사용이 현저히 증가하게 된다.

또한, 상기 화자 독립형 음성 인식 기술을 사용할 경우 음성 인식 결과가 여러 가지이면 사용자가 일일이 상기 이동 통신 단말기에 구비되어 있는 키를 이용하여 상기 여러 가지의 결과들 중 어느 한 결과를 선택하여 다이얼링을 해야 한다. 또한, 상기 음성 인식된 결과가 상기 이동 통신 단말기의 화면상에 표시되기 때문에 상기 이동 통신 단말기 사용자가 운전 중일 경우에는 상기 음성 인식 자동 다이얼링을 위해 화면을 봐야만 하기 때문에 사용의 불편함과 동시에 위험성이 증가된다는 문제점이 있다.

따라서, 본 발명의 목적은 이동 통신 단말기에서 핵심어 인식을 사용하는 자동 다이얼링 장치 및 방법을 제공함에 있다.

상기한 목적을 달성하기 위한 본 발명의 실시예에 따른 장치는, 특정 구조를 가지는 단어에서 미리 설정된 설정 개수의 음절들인 핵심어들의 음성 특징 패턴들과, 숫자를 나타내는 숫자 인덱스들의 음성 특징 패턴들과, 다수의 상대방 정보들을, 상기 숫자 인덱스들과 매핑하여 저장하는 메모리와, 입력되는 음성의 특징 패턴을 분석하는 오디오 처리부와, 소정 제어에 따라 상기 상대방 정보들과 상기 숫자 인덱스들을 디스플레이 하는 표시부와, 최초로 입력되는 음성의 특징 패턴이 상기 핵심어들 중 어느 한 핵심어 음성 특징 패턴과 일치할 경우 상기 입력된 음성을 핵심어로 판단하고, 상기 상대방 정보들 중 상기 판단된 핵심어를 가지는 상대방 정보들 및 상기 상대방 정보들에 매핑되는 숫자 인덱스들을 상기 표시부에 디스플레이하도록 제어하고, 이후 입력되는 음성의 특징 패턴이 상기 숫자 인덱스들 중 어느 한 숫자 인덱스의 음성 특징 패턴과 일치할 경우 상기 일치하는 숫자 인덱스에 매핑되는 상대방 정보에 상응하게 자동 다이얼링 하도록 제어하는 제어부를 포함함을 특징으로 한다.

상기한 목적을 달성하기 위한 본 발명의 실시예에 따른 방법은, 특정 구조를 가지는 단어에서 미리 설정된 개수의 음절들인 핵심어들의 음성 특징 패턴들과, 숫자를 나타내는 숫자 인덱스들의 음성 특징 패턴들과, 다수의 상대방 정보들을 상기 숫자 인덱스들과 매핑하여 저장하는 과정과, 최초로 입력되는 음성의 특징 패턴이 상기 핵심어들중 어느 한 핵심어의 음성 특징 패턴과 일치할 경우 상기 입력된 음성을 핵심어로 판단하는 과정과, 상기 상대방 정보들 중 상기 판단된 핵심어를 가지는 상대방 정보들 및 상기 상대방 정보들에 매핑되는 숫자 인덱스들을 디스플레이하는 과정과, 상기 상대방 정보들 및 숫자 인덱스들을 디스플레이한 후 입력되는 음성의 음성 특징 패턴이 상기 숫자 인덱스들 중 어느 한 숫자 인덱스의 음성 특징 패턴과 일치할 경우, 상기 일치하는 숫자 인덱스에 매핑되는 상대방 정보에 상응하게 자동 다이얼링하는 과정을 포함함을 특징으로 한다.

이하, 본 발명에 따른 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 흩트리지 않도록 생략될 것이라는 것을 유의하여야 한다.

도 1은 본 발명의 실시예에 따른 음성인식을 이용한 이동통신 단말기의 구성을 도시한 도면이다.

상기 도 1을 참조하면, RF(102)부는 무선주파수 대역으로 송수신되는 데이터를 처리한다. 상기 RF(102)부는 송신되는 신호의 주파수를 상승변환 및 증폭하는 RF송신기와, 수신되는 신호를 저 잡음 증폭하고 주파수를 하강 변환하는 RF수신기 등을 포함한다.

데이터 처리부(104)는 상기 송신되는 신호를 부호화 및 변조하는 송신기와, 상기 수신되는 신호를 복조 및 복호화하는 수신기 등을 구비한다. 즉, 상기 데이터 처리부(104)는 모뎀(MODEM) 및 코덱(CODEC)으로 구성될 수 있다.

오디오 처리부(106)는 상기 데이터 처리부에서 출력되는 수신 음성을 재생하거나 마이크로부터 발생되는 송신 오디오신호를 상기 데이터 처리부(104)에 전송하는 기능을 수행한다. 또한 상기 오디오 처리부(106)는 본 발명의 실시예에 따라 상기 이동 통신 단말기에 저장되어 있는 사용자의 인덱스, 사용자의 이름, 대표 전화번호(핸드폰, 사무실, 집, 기타) 등을 상기 데이터 처리부(104)를 통해 입력받아 스피커로 출력한다.

키패드(108)는 숫자 및 문자 정보를 입력하기 위한 키들 및 각종 기능들을 설정하기 위한 기능 키들을 구비한다.

메모리(110)는 프로그램 메모리 및 데이터 메모리들로 구성될 수 있다. 상기 프로그램 메모리에는 휴대용 단말기의 일반적인 동작을 제어하기 위한 프로그램들이 저장된다. 또한, 상기 메모리(110)에는 본 발명의 실시예에 따라 음성 인식 자동 다이얼링을 위한 핵심어 데이터베이스와 전화번호 데이터베이스가 저장된다. 상기 전화번호 데이터베이스는 상대방 정보, 즉 상대방 이름과, 전화 번호 항목, 즉 집 전화 번호, 회사 전화 번호, 이동 통신 단말기 전화 번호 등과 같은 전화 번호 항목이 매핑되어 저장된다. 본 발명의 실시예에서는 상대방 이름이 핵심어를 포함하는 것으로 가정한다. 여기서, 상기 핵심어라 함은 특정한 구조를 가지는 단어에서 미리 설정된 설정 개수의 음절들을 나타낸다. 일 예로, 상기 특정한 구조를 가지는 단어를 상대방 이름(name)이라고 가정할 때 핵심어는 성(family name)이 될 수 있다. 그리고 본 발명의 실시예에서는 상기 특정 구조를 가지는 단어를 일 예로 하여 설명하였으나, 특정 구조를 가지는 문장 역시 상기 핵심어에 따른 음성 인식 자동 다이얼링이 가능함은 물론이다.

또한, 본 발명의 실시예에서 상기 메모리(110)에는 숫자 인덱스(index)에 해당하는 숫자 인덱스 데이터베이스도 저장된다. 여기서, 상기 숫자 인덱스라 함은 상기 핵심어에 따라 검색된 상대방 정보에 순차적으로 부가되는 번호로서, 상대방들의 정보와 함께 상기 이동통신 단말기에 저장된다.

또한 상기 데이터 메모리는 상기 단말기의 동작 수행에 있어 발생하는 데이터들을 일시 저장하는 기능을 수행한다.

제어부(100)는 휴대용 단말기의 전반적인 동작을 제어하는 기능을 수행한다. 또한 상기 제어부(100)는 상기 데이터 처리부(104)를 포함할 수도 있다. 또한 상기 제어부(100)는 본 발명의 실시예에 따라 입력받은 음성을 분석하고, 특징 벡터를 추출하여 메모리(110)에 저장되어 있는 상기 핵심어 데이터베이스로부터의 핵심어와 비교를 통해 패턴을 인식한다. 그리고 상기 제어부(100)는 상기 인식 결과가 핵심어로 인식될 경우, 즉 상기 인식결과가 성을 나타낼 경우, 상기 메모리(110)에 저장되어 있는 전화번호 데이터베이스에서 상기 핵심어를 사용하는 상대방 이름들을 검색한다. 그리고 나서 상기 제어부(100)는 상기 검색된 상대방 이름들과 이에 매핑된 숫자 인덱스들을 표시부(118)에 표시하도록 제어한다. 일 예로, 상기 검색된 상대방의 이름들이 10개일 경우 상기 숫자 인덱스는 10개가 되는 것이다. 물론 상기 검색된 상대방 이름들과 숫자 인덱스들은 스피커를 통해 송출될 수도 있다.

카메라(112)는 영상 데이터를 촬영하고 신호 처리부(114)는 상기 카메라(112)로부터 출력되는 영상신호를 이미지신호로 변환한다. 영상 처리부(116)는 상기 신호 처리부(114)에서 출력되는 영상 신호를 표시하기 위한 화면 데이터를 발생하는 기능을 수행한다. 즉, 영상 처리부(116)는 제어부(100)의 제어 하에 수신되는 영상신호 및 데이터를 상기 표시부(118)의 규격에 맞춰 전송한다.

상기 도 1을 참조하여 상기 이동 통신 단말기의 동작을 설명하면, 마이크를 통해 입력받은 음성은 오디오 처리부(106)로 전달된다. 상기 오디오 처리부(106)는 상기 전달받은 음성에 섞인 잡음을 제거하고 사용하고자 하는 음성이 존재하는 영역만을 검출한다. 여기서, 상기 오디오 처리부(106)는 끝점 검출 방식에 의해 상기 전달받은 음성으로부터 사용하고자 하는 음성만을 검출한다. 상기 끝점 검출 방식은 입력된 음성의 시작점과 끝점을 추출하여 음성인식에 필요한 정보만을 추출해 내는 방식이다. 한편, 사람의 음성은 일정한 주기적 특성을 가지는 아날로그 파형인데 주로 음성인식에서는 벡터 양자화 방식을 사용한다. 여기서, 상기 벡터 양자화 방식은 입력 샘플들의 벡터를 부호화 하는 방식이다. 음성신호의 경우 시간 축 상의 신호는 변별력이 적으므로, 음성을 단 구간 신호인 프레임 단위로 바꾸고 이것을 변별력이 큰 특성 벡터로 변환한다. 상기 벡터 양자화 방식을 통해 얻어진 상기 특성 벡터를 가지고 개별적으로 구분이 가능한 패턴을 형성한다. 또한 상기 패턴은 상기 이동통신 단말기의 제어부(100)로 입력된다. 상기 제어부(100)는 상기 오디오 처리부(106)에서 출력한 패턴을 상기 메모리(110)에 저장되어 있는 핵심어 데이터베이스상의 패턴과 비교하여 상기 오디오 처리부(106)에서 출력한 패턴이 상기 핵심어 데이터베이스 상의 어떤 패턴과 일치하는지를 인식하게 된다. 여기서, 상기 핵심어 데이터베이스의 구성에 관한 것은 하기에 설명하기로 한다.

상기 음성인식 과정에서 패턴 분석의 기본 단위로는 단어, 음절, 음소 등이 사용될 수 있으며, 특히 음소 단위는 단어 및 음절 단위보다 그 종류가 작고 음향적인 특성을 인식기에 고르게 반영할 수 있는 장점을 가진다. 그래서 상기 이동통신 단말기에는 음소 단위 화자 독립 인식기를 채택하여 사용자의 음성을 음소단위 벡터로 분석하도록 한다.

상기 입력받은 음성을 분석하여 추출된 특징벡터를 통해 상기와 같은 패턴인식을 수행하여 얻어진 결과 값을 가지고 상기 이동통신 단말기에 저장되어 있는 숫자 인덱스, 상대방의 이름, 대표 전화번호(핸드폰, 사무실, 집, 기타)를 표시부(118)에 출력한다. 상기 표시부(118)를 통해 디스플레이 되는 데이터는 문자를 음성으로 변환하여 주는 음성합성기(TTS: Text-To-Speech, 이하 TTS라 칭하기로 한다)를 이용해 음성 데이터로 변환되어 스피커를 통해 사용자에게 전달될 수도 있다. 상기 스피커를 통해 숫자 인덱스를 포함하는 정보를 전달 받은 사용자는 통화를 원하는 상대방 정보의 숫자 인덱스를 발성한다. 이 숫자음은 이동통신 단말기의 음소단위 화자독립 인식기로 인식이 된 후 사용자가 원하는 상대방에게 자동 다이얼링을 한다. 또한 사용자는 상기 표시부(118)를 통해 디스플레이 되는 데이터를 보고 키패드(108)의 입력을 통하여 사용자가 원하는 상대방에게 자동 다이얼링 할 수 있다.

도 2는 본 발명의 실시예에 따른 음성인식을 위한 핵심어 데이터베이스 구성과정을 보여주는 도면이다.

상기 도 2를 참조하면 본 발명에서는 핵심어를 사용한 화자 독립 음성인식 방법을 제안하였으므로 우선 불특정 다수에 대한 핵심어 발성 수집이 이루어져야 한다. 불특정 다수의 핵심어 발성을 통하여 상기 입력 받은 음성의 벡터 값들을 사용하여 음성 특징을 추출한다(200). 또한, 상기 수집된 음성에 대해 나타나는 음성들을 조사하고 분석하여 음절 단위보다 하위의 음소들에 대한 분석을 통해 목록을 작성하는 음소 분석 과정을 거친다(206). 그리고 작성된 목록의 음성의 각 부분에 대응하는 음절 혹은 음소 기호를 할당하는 레이블링을 수행한다(208). 레이블링의 단위는 단어, 문장 등도 가능하며, 음소보다 더 작은 단위를 이용할 수도 있다. 하지만 본 발명에서는 음소들을 통한 음소 레이블링을 통해 입력받은 음성을 처리한다. 상기 불특정 다수의 핵심어 음성들로부터 추출된 특징 값과 음소로 레이블링 된 음성 데이터들을 가지고, 그 분포들에 대한 반복을 통해서 확률 통계적인 훈련을 한다(202). 다음으로 훈련된 정보를 가지고, 확률 통계를 바탕으로 하는 패턴을 매칭시켜 접근해 나가는 방식의 하나인 핵심어 은닉 마콥 모델(HMM: Hidden Markov Model, 이하 HMM이라 칭하기로 한다)을 만든다(204). HMM은 관측이 불가능한 프로세스를 관측이 가능한 심볼(symbol)로 발생시키는 프로세스를 가지는 확률 프로세스이다. 때문에 음성과 같이 다변성이 많고 발생 과정을 알 수 없는 프로세스를 표현하는데 적절한 모델링 방법 중의 하나이다. 또한, 상기 핵심어로 수집된 음성들에 대한 음소 레이블링 과정을 거친 레이블링된 음성들은 핵심어 음소 네트워크를 구성한다(210). 이 네트워크의 구성은 음성인식 전에 미리 단어간 음운 변화 현상들을 적용하여 단어의 앞뒤에 음소 문맥을 적용하고 레이블링 과정을 거친 음성정보들과 결합하여 구성된다.

그리고 상기 핵심어 HMM 모델과 상기 핵심어 음소 네트워크를 결합하여 음소 단위 핵심어 데이터베이스를 구성한 다음 단말기에 저장한다. 상기 음소 단위 핵심어 데이터베이스는 음소 단위로 구성된 방법이므로 음소 단위 이상의 조합이 가능하다.

본 발명에 있어서, 예를 들면 한국인의 성씨 같은 핵심어는 성씨를 구성하는 가지 수가 약 400여 가지 존재한다. 그래서 핵심어 데이터베이스를 구성하는데 있어서, 기존의 화자 독립 음성인식 시스템에 비해 구성하는 소요 시간을 줄일 수 있고, 인식에 필요한 검색과정에 대한 부담을 완화시킬 수 있다. 그래서 상기 음성인식을 이용한 이동통신 단말기에서는 그 단어의 가지 수와 종류가 제한되는 핵심어를 사용함으로써 핵심어 데이터베이스 구성에 효율을 높일 수 있다.

도 3은 본 발명의 실시예에 따른 자동 다이얼링을 위한 제어 흐름을 보여주는 도면이다.

상기 도 3을 참조하면, 상기 이동 통신 단말기는 사용자의 음성을 입력받는다. 상기 입력되는 음성은 사용자가 통화를 원하는 상대방 이름 또는 검색 결과에 따라 사용자가 발성하는 숫자음 등이 될 수 있다. 상기 입력받은 사용자의 음성에 포함되어 있는 잡음을 제거하고 음성 인식에 사용될 실 음성 구간의 끝점을 검출하는 음성 검출 과정을 거친다(302). 그리고 검출된 음성으로부터 각각의 음성들에 대한 특징 벡터들을 추출한다(304). 여기서 상기 특징 벡터 추출할 때 음소 단위 화자 독립 인식기가 적용되어 음소 단위의 특징이 추출된다. 사용자 음성의 입력 후에 상기의 음성을 검출하고 특징 벡터를 추출하는 과정을 음성인식의 전 처리 과정이라고 한다. 상기 전 처리 과정을 거친 사용자의 음성을 상기 이동통신 단말기의 메모리(314)에 저장된 패턴과 비교하여 입력된 음성에 대한 패턴을 인식한다(306). 또는 사용자로부터 입력받아 전 처리 과정을 거친 숫자음을 상기 이동통신 단말기의 메모리(314)에 저장된 패턴과 비교하여 패턴을 인식 한다(306).

상기 인식되는 패턴 값들은 벡터들의 확률분포를 통해 인식되므로 0과 1사이의 값을 갖게 된다. 이 값을 로그를 취해서 보다 넓은 영역으로 수의 범위를 확산시킨다. 상기의 단계를 거쳐서 패턴 인식된 출력 값(P_out)들은 인식거절 문턱 값(R_th)과 비교된다(308). 상기의 비교 과정은 <수학식 1>에 나타나 있다.

만일 상기 이동통신 단말기에서 요구하는 인식거절 문턱 값(R_th)보다 상기 출력된 값(P_out)들이 작으면 재입력 메시지를 사용자에게 송출한다(316). 그러나 상기 이동통신 단말기에서 요구하는 인식 거절 문턱 값(R_th)보다 상기 출력된 값(P_out)들이 크면 인식된 결과 값을 가지고 상기 이동통신 단말기의 메모리에 저장된 사용자가 원하는 전화번호 목록을 검색한다(310). 상기 검색된 목록들은 핵심어와 맵핑된 숫자 인덱스와 이름, 대표 전화번호 등의 정보들이며, 액정에 디스플레이 되거나 TTS와 같은 출력장치를 이용하여 사용자에게 전달된다(312). 사용자는 상기 정보들이 액정에 디스플레이 되었을 경우 키패드나 터치패드 등의 입력장치를 통해 통화를 원하는 상대방을 선택한다. 또한, 상기 정보들이 TTS를 통해 출력되면 숫자 인덱스를 발성하여 통화를 원하는 상대방을 선택한다.

예를 들어 한국인의 성씨를 핵심어로 사용한 경우를 고려하면, 사용자가 '김동수'의 이동 통신 단말기로 자동 다이얼링하기를 원한다고 가정한다. 사용자는 자동 다이얼링하기를 원하는'김동수'이라는 이름을 발성한다. 이에, 상기 이동통신 단말기는 '김동수'이라는 이름의 음성을 입력받고, 상기 입력받은 '김동수'이라는 음성에서 핵심어에 해당하는 특징 벡터들을 추출한다. 상기 추출한 특징 벡터들, 즉 '김'에 해당하는 특징 벡터들을 한국인의 성씨로 구성된 데이터베이스에서 '김'이라는 성씨에 대한 특징 벡터들의 패턴과 비교하여 패턴을 인식한다. 그리고 상기 이동통신 단말기는 상기 인식된 패턴을 통해 미리 설정된 인식 거절 문턱 값과 비교하는 과정을 거친다. 설정된 인식 거절 문턱치보다 상기 출력된 패턴 값이 작다면 사용자 음성에 대한 재입력 요구 메시지를 송출하고 패턴 값이 상기 인식 거절 문턱치보다 크다면 인식된 '김'이라는 성씨를 가진 사용자들의 숫자 인덱스, 이름, 대표 전화번호(핸드폰, 사무실, 집, 기타) 등을 검색한다. 그리고 상기 이동통신 단말기는'김'씨 성을 가진 상대방들에 대한 검색 결과를 출력한다. 상기 검색 결과가 일 예로, '10:김동수:011-2222-1234:핸드폰', '11:김동수:02-222-1234:집', '12:김영희:016-222-3456:핸드폰', '13:김영희:02-222-3456:집', '14:김철수:031-333-5678:집', '15:김철수:031-444-5678:사무실'등의 결과라고 하면, 상기 검색 결과들은 액정을 통해 디스플레이 되거나 TTS를 통해 사용자에게 출력된다. 상기 검색 결과를 확인한 사용자는 김동수의 핸드폰과 통화하기를 원할 때, 숫자음'10'을 발성한다. 상기 이동통신 단말기는 숫자음 음성 인식 과정을 거친 뒤 '김동수'의 이동통신 단말기로 자동 다이얼링 되거나 키패드 등의 입력 장치를 통해 사용자의 입력을 받아 자동다이얼링을 수행한다. 만일 검색된 상대방이 한명이라면 별도의 선택절차 없이 자동 다이얼링 되거나 다이얼링 여부에 대한 확인 후 자동다이얼링 한다.

한편 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

상술한 바와 같은 본 발명은, 음성인식을 사용하는 이동통신 단말기, 특히 핵심어 음성인식을 통한 다이얼링 방법은 종래의 음성인식 다이얼링 방법과 비교할 때 기존 음성인식 데이터베이스를 구성할 때 그 구현 자체가 용이하고 특정 핵심어를 통해서 인식하므로 데이터 용량의 이용효율 면에서 우수한 성능을 가진다. 또한 이를 단말기에 저장할 때에도 단말기 자체의 메모리 사용효율 향상의 성능을 갖게 하며 검색 과정에서도 사용 성능이 향상된다. 상기 이동통신 단말기의 음성인식은 음소 단위 화자 독립 인식기를 사용하는데 음소 단위의 적용에 있어 언어학적인 면에 있어서 음소는 그 종류가 적고 필요한 훈련 데이터를 쉽게 얻을 수 있다. 또한 이를 단말기에 저장할 때에도 단말기 자체의 메모리의 사용효율 향상의 성능을 갖게 하며 검색 과정에서도 사용 효율이 향상된다. 또한 이 결과를 액정에 디스플레이 하거나 TTS방법을 사용하여 사용자에게 전달한다. 그리고 다시 이동 통신 단말기에 저장된 인덱스 숫자음을 통해서 자동으로 다이얼링하는 효과를 갖는다.

Claims

이동통신 단말기의 자동 다이얼링 장치에 있어서,

특정 구조를 가지는 단어에서 미리 설정된 개수의 음절들인 핵심어들의 음성 특징 패턴들과, 숫자를 나타내는 숫자 인덱스들의 음성 특징 패턴들과, 다수의 상대방 정보들을, 상기 숫자 인덱스들과 매핑하여 저장하는 메모리와,

입력되는 음성의 특징 패턴을 분석하는 오디오 처리부와,

소정 제어에 따라 상기 상대방 정보들과 상기 숫자 인덱스들을 디스플레이 하는 표시부와,

최초로 입력된 음성의 특징 패턴이 상기 핵심어들 중 어느 한 핵심어 음성 특징 패턴과 일치할 경우 상기 최초로 입력된 음성을 핵심어로 판단하고, 상기 상대방 정보들 중 상기 판단된 핵심어를 가지는 상대방 정보들 및 상기 판단된 핵심어를 가지는 상대방 정보들에 매핑되는 숫자 인덱스들을 상기 표시부에 디스플레이하도록 제어하고, 이후 입력되는 음성의 특징 패턴이 상기 판단된 핵심어를 가지는 상대방 정보들에 매핑되는 숫자 인덱스들 중 어느 한 숫자 인덱스의 음성 특징 패턴과 일치할 경우 상기 일치하는 숫자 인덱스에 매핑되는 상대방 정보에 상응하게 자동 다이얼링 하도록 제어하는 제어부를 포함함을 특징으로 하는 이동통신 단말기의 자동 다이얼링 장치.
제 1항에 있어서,

상기 제어부는, 음소 단위의 화자 독립 인식 방식을 사용하여 상기 최초로 입력된 음성의 특징 패턴과 상기 메모리에 저장되어 있는 핵심어들의 음성 특징 패턴들을 비교하여 상기 최초로 입력된 음성의 특징 패턴을 인식함을 특징으로 하는 이동통신 단말기의 자동 다이얼링 장치.
이동통신 단말기의 자동 다이얼링 방법에 있어서,

특정 구조를 가지는 단어에서 미리 설정된 개수의 음절들인 핵심어들의 음성 특징 패턴들과, 숫자를 나타내는 숫자 인덱스들의 음성 특징 패턴들과, 다수의 상대방 정보들을 상기 숫자 인덱스들과 매핑하여 저장하는 과정과,

최초로 입력된 음성의 특징 패턴이 상기 핵심어들중 어느 한 핵심어의 음성 특징 패턴과 일치할 경우 상기 최초로 입력된 음성을 핵심어로 판단하는 과정과,

상기 상대방 정보들 중 상기 판단된 핵심어를 가지는 상대방 정보들 및 상기 판단된 핵심어를 가지는 상대방 정보들에 매핑되는 숫자 인덱스들을 디스플레이하는 과정과,

상기 디스플레이 하는 과정 이후에 입력되는 음성의 특징 패턴이 상기 판단된 핵심어를 가지는 상대방 정보들에 매핑되는 숫자 인덱스들 중 어느 한 숫자 인덱스의 음성 특징 패턴과 일치할 경우, 상기 일치하는 숫자 인덱스에 매핑되는 상대방 정보에 상응하게 자동 다이얼링하는 과정을 포함함을 특징으로 하는 이동통신 단말기의 자동 다이얼링 방법.
제 3항에 있어서,

상기 최초로 입력된 음성의 특징 패턴과 상기 핵심어들의 음성 특징 패턴들은 음소 단위의 화자 독립 인식 방식을 사용하여 일치 여부를 판단하는 것임을 특징으로 하는 이동통신 단말기의 자동 다이얼링 방법.
이동통신 단말기의 자동 다이얼링 방법에 있어서,

음성을 입력받으면, 상기 입력받은 음성에서 미리 설정된 개수의 음절들인 핵심어를 추출하는 과정과,

미리 저장되어 있는 상대방 정보들 중 상기 핵심어에 해당하는 상대방 정보를 검출하고, 상기 검출한 상대방 정보를 출력하는 과정과,

상기 검출한 상대방 정보에 상응하게 자동 다이얼링하는 과정을 포함함을 특징으로 하는 이동통신 단말기의 자동 다이얼링 방법.
삭제
이동통신 단말기의 자동 다이얼링 방법에 있어서,

음성을 입력받으면, 상기 입력받은 음성에서 미리 설정된 개수의 음절들인 핵심어를 추출하는 과정과,

미리 저장되어 있는 상대방 정보들 중 상기 핵심어에 해당하는 다수의 상대방 정보들을 검출하고, 상기 검출한 다수의 상대방 정보들을 출력하는 과정과,

상기 검출한 다수의 상대방 정보들 중 자동 다이얼링 하기를 원하는 상대방 정보를 선택받는 과정과,

상기 선택받은 상대방 정보에 상응하게 자동 다이얼링하는 과정을 포함함을 특징으로 하는 이동통신 단말기의 자동 다이얼링 방법.
삭제
제 7항에 있어서,

상기 검출한 다수의 상대방 정보들을 출력하는 과정은,

상기 검출한 다수의 상대방 정보들을 화면상에 디스플레이 하거나, 혹은 상기 검출한 다수의 상대방 정보들을 음성으로 합성하여 송출하는 것임을 특징으로 하는 이동 통신 단말기의 자동 다이얼링 방법.
제7항에 있어서,

상기 상대방 정보를 선택받는 과정은,

상기 검출한 다수의 상대방 정보들 중 어느 한 상대방 정보를 음성 형태로 선택받는 것임을 특징으로 하는 이동 통신 단말기의 자동 다이얼링 방법.