KR100250496B1

KR100250496B1 - 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.

Info

Publication number: KR100250496B1
Application number: KR1019970072041A
Authority: KR
Inventors: 이점도
Original assignee: 정선종; 한국전자통신연구원
Priority date: 1997-12-22
Filing date: 1997-12-22
Publication date: 2000-04-01
Also published as: KR19990052548A

Abstract

본발명은 디지틀 휴대폰이 화자 독립 및 화자 종속 음성 인식방법을 모두 채용하여 음성 다이알링를 서비스하는 경우에 있어서, 사용자가 전화를 걸 때마다 휴대폰 외부에 위치한 버튼을 통해 화자 독립 또는 화자 종속 음성다이알링을 선택하여 전화를 거는 방법에 대한 것이다.

사용자가 전화를 걸때 마다 버튼으로 음성인식모드를 선택하는 방법은 사전에 화자 종속 또는 화자 독립으로 설정하는 방법에 비해 상대적으로 편리할 뿐만아니라 음성 신호를 화자 종속 및 화자 독립 처리 모두를 처리하는 것에 비해 프로세싱타임 즉 응답시간이 단축되며 오류도 크게 줄일수 있다.

Description

사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.

본 발명은 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 관한 것으로서, 특히 화자 종속 과 화자 독립 음성인식 모두를 채용한 디지틀 휴대폰에서 음성인식 처리 속도를 증가 시킬뿐만 아니라, 음성인식 효율도 증가시킬 있음은 물론, 간편하게 두 모드중 한가지를 선택하여 전화를 할 수있어 사용상 편리한 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 관한 것이다.

일반적으로 음성인식기술은 컴퓨터와 음성을 통해 정보를 주고받는 음성기술의 한 형태이다. 음석인식은 선천적으로 다른 다양한 사람들의 음성을 인식하는 새로운 기술이다. 음성인식에는 두가지 종류의 인식 방법이 있는데, 이는 화자 종속 과 화자 독립 음성인식이다.

화자 종속음성인식은 특정인의 음성을 인식하는 방법으로 사전에 컴퓨터에 특정인의 음성을 훈련시켜 인식하는 방법이다. 음성인식 훈련은 특정인의 음성을 아날로그 음성으로 입력받아, 신호데이터로 변환하고, 이를 적당한 컴퓨터 명령에 대입시킨다. 실제로는 입력데이터와 저장된 사용자의 음성정보를 비교하여 가장 유사한 음성데이터를 찾아 해당 응답을 수행한다.

예를 들면, 최근에 디지틀 휴대폰에 채용된 화자인식방법을 말한다. 사용자가 "우리집" 또는 "엄마" , "아버지" 등 상대방 전화번호를 대표하는 명칭을 발성하면, 사전에 교육시켜 입력된 데이터와 비교하여 가장 유사한 데이터를 추출하여 해당 전화번호로 통화를 시도하는 방법이다.

화자독립음성인식 방법은 여러 사람의 음성중에 공통적으로 포함된 음성을 표현하는 복합 표준신호를 저장한 컴퓨터를 사용하여 수행하는 방법이다. 여기서 표준신호란 넓은 영역의 발음을 표현하는 신호 데이터의 여러 샘플로 부터 추출된 것이다. 실제 응용에선, 훈련되지 않은 음성과, 다양한 액센트등으로 음성인식을 처리하느데 화자종속에 비해 어렵다.

예를 들면, 실제 전화를 걸때, 입력하는 아라비아 숫자 자체를 음성인식하는 기술로 전화번호 860-5417이라하면 "팔육공 오사일칠"로 발음된 음성을 인식하는 방법으로 음성인식률은 화자종속에 비해 낮으나, 이용가치 측면에서는 유리하다.

음성인식의 응용분야로 기존 유선전화가 있다. 음성인식을 이용하면, 전화번호를 기억할 필요없고, 찾을 필요도 없고, 114에 문의할 필요도 없이 전화를 걸수 있다. 물론 손가락을 사용할 이유도 없다.

본 발명은 상술한 문제점을 해결하기 위한 것으로서, 화자독립음성인식 기술과 화자종속독립음성인식 기술을 사용하여 필요에 따라 사용자가 이를 전환하여 사용함으로서, 프로그램 처리속도를 상당히 높여주는 역할을 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법 제공한 데 그 목적이 있다.

상술한 목적을 달성하기 위한 본 발명은 음성인식모드 시작신호로부터 화자독립버튼이 온 상태인지 여부를 확인하는 제 1단계와, 상기 확인결과, 버튼이 오프 상태이면 화자종속모드로 전환하여 음성의 끝점을 검출 하고, 음성 특징을 추출하는 제 2단계와, 상기 제 1단계의 확인결과 화자독립 버튼이 온 상태이면 화자독립모드로 전환하여 음성의 끝점검출을 하고, 음성특징을 추출 하는 제 3단계와, 상기 제 2단계로부터 추출된 음성을 화자종속모드의 기준 음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 4단계와, 상기 제 3단계로부터 추출된 음성을 화자독립모드의 기준음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 5단계와, 상기 제 4단계 및 상기 제5 단계로부터 계산된 결과에 따라 인식단어를 결정한 후 종료하는 제 7단계를 포함하여 이루어진 것을 특징으로 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 의하여 달성된다.

또한 종래의 기술은 화자독립 또는 화자종속음성인식중 하나만을 선택하여 인식할 수있었으나, 본발명에서는 두가지 모두들 사용할 경우에 있어서, 사용자가 키를 누르거나, 누르지않음에 따라, 화자종속음성인식이냐, 화자독립음성인식인가를 선택가능하게하여, 화자인식속도를 증가하는데 있다.

그리고 화자독립과 화자종속음성인식 모드 둘 다를 음성다이얼링으로 응용 할 경우, 화자 독립 또는 화자종속모드 두 모드를 연속적으로 처리하여야 한다. 따라서 본발명은 사용자가 화자인식모드를 간단히 버튼 입력에 의해 선택하여 서비스하는 방법으로, 이렇게 함으러서, 음성인식처리 속도를 증가시킬수 있고, 한가지 방법만을 사용해서 음성인식처리를 하므로, 인식효율을 증가시킬수 있다.

한편, 기술의 발전과 함께, 디지틀 휴대폰에 화자 종속 음성인식 기술뿐만 아니라, 화자 독립음성인식 기술이 도입되어 가고 있다. 따라서 본발명은 디지틀 휴대폰의 화자독립 및 화자종속 음성인식 방법의 절체를 간단한 방법으로 수행하여 화자독립인 경우와 화자 종속인 경우의 프로그램 경로를 분리하여 디지틀 휴대폰의 음성인식 속도를 배가하는 데 목적이 있다.

도 1은 기존 화자 독립 및 화자 종속을 모두 서비스하는 음성인식 CDMA휴대

폰의 블록 다이아그램.

도 2는 본발명의 화자독립음성인식버튼이 달린 휴대전화를 도시한 도면.

도 3은 본 발명에 의한 사용자 선택에 의한 음성인식 흐름도.

이하 첨부된 도면을 참조하여 본 발명을 설명하면 다음과 같다.

최근의 디지틀 휴대폰에 채용된 음성인식 방법은 화자종속 음성인식방법으로, 음성을 인식하기 위해서는 기본적으로 훈련이란 과정이 필요하다. 반면에 화자독립음성인식 방법은 훈련과정없이 음성을 인식하는 방법이다.

화자독립방식은 마이크를 통해입력된 음성신호가 입력되면, 디지탈화하여, 끝점을 검출한다. 그런후, 음성특징추출부에서 특징을 추출하여 거리및 유사도 계산부에서 미리저장되어 있는 기준음성신호부의 기준음성특징신호들과의 유사도를 계산한다.

도 1은 화자독립및 화자종속음성인식 처리에 대한 흐름도이다. 기존의 방법은 사용자의 음성을 우선 화자 독립 음식인식을 처리(2)한 후, 인식단어가 추출(4)되지 않으면, 화자 종속 음성인식처를 하거나, 순서를 바꾸어, 화자 종속음성 인식을 처리한후 화자 독립음성인식을 수행하여 인식단어를 검출한다.

도 2는 본발명의 화자독립음성인식버튼(20)이 달린 휴대전화를 도시한 도면으로서, 기존의 방식과는 달리 휴대폰의 측면에 화자독립선택버튼을 두어 사용자가 선택하도록 하였다.

도 3은 본 발명에 의한 사용자 선택에 의한 음성인식 흐름도로서, 음성인식모드루틴을 시작 (101)하면, 우선 화자독립버튼이 눌러졌는가 여부를 체크(102)한후, 버튼이 Off상태이면, 화자종속모드(103) 처리를 수행한다. 입력된 음성에서 끝점검출(104)과 음성특징 추출(105) 한 후, 화자종속모드 기준음성신호(107)와 비교하여 거리계산 및 유사도 계산(106)을 수행하여 가장 근접한 인식단어를 결정한다. 만약 화자독립버튼이 On상태이면 화자독립모드로 전환(109)한 후에 화자종속모드와 동일하게 끝점검출(110), 음성특징추출(111)의 순서로 처리한후 화자독립모드기준음성신호(113)와 비교하여 거리계산 및 유사도 계산(112)을 수행하여 인식단어(108)를 결정한다.

상술한 바와같이 본발명에 의한 사용자의 선택에 의해 화자독립 또는 화자종속 음성다이얼링을 할수 있는 방법에 의하여 다음과 같은 우수한 효과가 있다.

첫째,기존의 방법보다, 프로세싱시간을 절약할 수있어 음성인식 시간이 단축되는 효과가 있어, 사용자의 불편을 줄일수 있다.

둘째, 화자종속및 화자 독립모드로 2분화된 루틴을 거쳐 인식되므로 인식단어의 오류를 상당히 줄일수 있다.

셋째, 화자 종속 과 화자 독립 음성인식 모두를 채용한 디지틀 휴대폰에서 음성인식 처리 속도를 증가 시킬 수 있다.

넷째, 음성인식 효율도 증가시킬 수 있는 탁월한 효과가 있음은 물론, 사용자는 간편하게 두 모드중 한가지를 선택하여 전화를 할 수있어 사용상 편리하다.

Claims

음성인식모드 시작신호로부터 화자독립버튼이 온 상태인지 여부를 확인하는 제 1단계와,

상기 확인결과, 버튼이 오프 상태이면 화자종속모드로 전환하여 음성의 끝점을 검출하고, 음성 특징을 추출하는 제 2단계와,

상기 제 1단계의 확인결과 화자독립 버튼이 온 상태이면 화자독립모드로 전환하여 음성의 끝점검출을 하고, 음성특징을 추출 하는 제 3단계와,

상기 제 2단계로부터 추출된 음성을 화자종속모드의 기준 음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 4단계와,

상기 제 3단계로부터 추출된 음성을 화자독립모드의 기준음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 5단계와,

상기 제 4단계 및 상기 제5 단계로부터 계산된 결과에 따라 인식단어를 결정한 후 종료하는 제 7단계를 포함하여 이루어진 것을 특징으로 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.