KR100307028B1 - 음성인식전화기에서의화자종속형음성데이타관리방법 - Google Patents

음성인식전화기에서의화자종속형음성데이타관리방법 Download PDF

Info

Publication number
KR100307028B1
KR100307028B1 KR1019940013951A KR19940013951A KR100307028B1 KR 100307028 B1 KR100307028 B1 KR 100307028B1 KR 1019940013951 A KR1019940013951 A KR 1019940013951A KR 19940013951 A KR19940013951 A KR 19940013951A KR 100307028 B1 KR100307028 B1 KR 100307028B1
Authority
KR
South Korea
Prior art keywords
voice
speaker
dependent
voice data
telephone
Prior art date
Application number
KR1019940013951A
Other languages
English (en)
Other versions
KR960003232A (ko
Inventor
이세웅
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019940013951A priority Critical patent/KR100307028B1/ko
Publication of KR960003232A publication Critical patent/KR960003232A/ko
Application granted granted Critical
Publication of KR100307028B1 publication Critical patent/KR100307028B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • H04M2201/405Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 관한 것이다. 본 발명은 화자 종속모드로 통화할 때마다 화자 종속형 음성 데이타 베이스의 내용을 갱신하므로 사용자의 회근 음성으로 이루어진 데이타 베이스를 구축하게되어 화자 종속형 음성의 인식율을 증가시킬 수 있고, 화자 종속형 음성데이타를 별도로 갱신시켜야 하는 번거로움도 해소할 수 있어 음성인식 전화기의 사용편리성을 향상시킬 수 있다.

Description

음성인식 전화기에서의 화자 종속형 음성데이타 관리방법
제1도는 본 발명에 적용된 음성인식 전화기의 구성도.
제2도는 본 발명에 따른 화자 종속형 음성 데이타 관리 과정을 도시한 흐름도.
제3도는 제2도에 도시된 화자 종속형 음성데이타 구축과정의 상세 흐름도.
제4도는 제2도에 도시된 화자 종속형 음성데이타 갱신과정의 상세 흐름도.
* 도면의 주요부분에 대한 부호의 설명
10: 송수화부 11: 음성 인식부
12: 전화번호 데이타 베이스 13: 음성데이타 베이스
14: 제어부 15: 키패드부
[발명의 상세한 설명]
본 발명은 음성인식 전화기에 관한 것으로, 특히 화자 종속형 음성의 인식율을 향상시키도록 한 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 관한 것이다.
일반적으로, 음성을 인식하는 경우 화자 독립형과 화자 종속형의 음성을 인식한다. 화자 독립형 음성인식 기술은 불특정 화자의 음성을 인식 가능케하며, 화자 종속형 음성인식 기술은 특정 화자의 음성을 인식가능케 한다. 화자 독립형 음성을 인식하는 경우에는 여러 사람의 음성을 인식해야 하므로 대용량의 음성데이타 베이스를 구축해야 되고, 개인마다 음성의 특징이 상이함으로 인하여 저조한 인식률을 보인다. 반면에, 화자 종속형 음성을 인식하는 경우에는 특정 개인의 음성을 인식해야 하므로 소용량의 음성데이타 베이스를 구축하여도 되며, 특정 개인의 음성 특징이 비교적 균일함으로 인하여 높은 인식율을 보인다.
음성인식 전화기에서는 화자 독립형 및 화자 종속형 음성 모두를 인식가능한데, 숫자나 공공기관 등의 이름은 화자 독립으로 하여 사용자 누구에게나 적용될 수 있도록 하고, 사용자의 친구나 개인전 연락처 등의 단축 다이얼에는 화자 종속으로 하여 개인이 사용하도록 하고 있다.
종래의 음성인식 전화기에서는 화자 종속으로 음성인식하는 경우 구축한 화자 종속형 음성데이타 베이스를 이용하여 화자 종속형 음성을 인식하는데, 음성데아타 구축후 장기간이 지난 경우 또는 사용자의 음성이 변한 경우에는 사용자의 음성 특징이 변화됨으로 인하여 구축한 음성데이타 베이스의 음성데이타와 실제 입력된 음성데이타가 일치하지 않으므로 화자 종속형 음성의 인식율을 저하시키게 되는 문제점이 있었다.
본 발명은 전술한 바와 같은 문제점을 해결하기 위하여 안출될 것으로, 화자 종속모드로 통화할 때마다 화자 종속형 음성데이타 베이스의 내용을 갱신함으로써 화자 종속형 음성의 인식율을 향상시키도록 한 음성인식 전화기에서의 화자 종속형 음성 데이타 관리 방법을 제공하는데 목적이 있다.
이와 같은 목적을 달성하기 위한 본 발명의 특징은, 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 송수화수단을 통해 소정 전화번호에 대응하는 단축명을 음성으로 입력받되, 상기 송수화수단을 통해 입력되는 상기 단축명에 대한 음성의 특징을 추출하고, 상기 추출된 음성의 특징을 음성 데이타베이스에 각각 저장하는 과정을 적어도 2회 이상 반복 수행하여 상기 전화번호와의 전화통화에 필요한 화자 종속형 음성 데이타를 구축하는 데이타 구축 과정과; 상기 전화번호와의 통화시에 입력되는 음성의 화자 종속형 음성 데이타로 상기 데이타 구축 과정에서 가장 먼저 구축했던 화자 종속형 음성데이타를 대체하여 기록 갱신하는 데이타 갱신 과정을 포함하는 데 있다.
본 발명의 다른 특징은, 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 전화통화에 필요한 전호번호와 화자 종속형 음성 데이타를 저장하는 과정과; 송수화수단을 통해 입력되는 화자 종속형 음성 데이타에 따라 상기 전화번호를 다이얼링하여 통화로를 연결하는 과정과; 통화 종료하면, 가장 먼저 저장했던 화자 종속형 음성데이타에 대신하여, 상기 다이얼링시에 입력된 화자 종속형 음성 데이타를 저장하는 과정을 포함하는데 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다.
제1도는 본 발명에 적용된 음성인식 전화기의 구성도이고, 제2도는 본 발명에 따른 화자 종속형 음성데이타 관리과정을 도시한 흐름도이고, 제3도는 제2도에 도시된 화자 종속형 음성데이타 구축과정의 상세 흐름도이며, 제4도는 제2도에 도시된 화자 종속형 음성데이타 갱신과정의 상세 흐름도이다.
본 발명에 적용된 음성인식 전화기는 제1도에 도시된 바와 같이 송수화부(10), 음성인식부(11), 전화번호 데이타 베이스(12), 음성데이타 베이스(13), 제어부(14) 및 키패드부(15)를 구비한다. 송수화부(10)는 음성신호를 입출력하며, 키패드부(15)는 제어부(14) 측에 제어정보를 입력한다. 음성인식부(11)는 송수화부(10)로부터 입력되는 음성의 특징을 추출하여 만든 화자 종속형 음성데이타와 가장 유사도가 큰 음성데이타를 음성데이타 베이스(13)에서 찾아냄으로써 화자 종속형 음성을 인식한다. 전화번호 데이타베이스(12)에는 단축번호와 전화번호를 저장하며, 음성인식부(11)로부터 인가되는 어드레스에 따라 해당 전화번호를 제어부(14) 측에 출력한다. 제어부(14)는 음성인식 전화기의 전반적인 동작을 관할하는 데, 다이얼링동작과 음성신호 송수신 동작을 제어하고 화자 종속모드로 단축 다이얼링하여 통화종료한 후 음성 데이타 베이스(13)을 제어하여 화자 종속형 음성 데이타를 갱신시킨다.
이와 같은 음성인식 전화기는 제2도에 도시된 순서로 화자 종속형 음성 데이타를 관리한다. 음성인식부(11)가 음성데이타 베이스(13)에 화자 종속형 음성데이타를 구축하고(과정20), 화자 종속모드로 통화하는 경우 음성인식부(11)가 새로이 입력된 화자 종속형 음성데이타를 가장 먼저 저장된 음성데이타 베이스(13)의 화자 종속형 음성데이타와 교체하여 저장함으로써 화자 종속형 음성데이타를 갱신한다(과정40).
화자 종속형 음성데이타를 구축하는 경우 제3도에 도시된 순서로 동작한다. 먼저, 키패드부(15)를 통해 데이타 베이스 저장버튼을 입력하고(스텝21), 캐패드부(15)를 통해 단축 번호를 입력하며(스텝22), 이후 키패드부(15)를 통해 전화번호를 입력하고(스텝23), 다시 키패드부(15)를 통해 단축번호를 입력하면(스텝24), 제어부(14)는 단축번호 및 전화번호를 전화번호 데이타 베이스(12)에 저장한 후 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 지시한다(스텝25). 그후, 사용자가 송수화부(10)를 통해 음성으로 단축명을 입력하면(스텝26), 음성인식부(11)는 입력된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타를 음성데이타 베이스(13)에 저장함으로써 단축명을 저장하고 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 다시 지시한다(스텝27). 이때, 사용자가 송수화부(10)를 통해 음성으로 단툭명을 입력하면(스텝28), 음성인식부(11)는 입력된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타를 음성데이타 베이스(13)에 저장함으로써 단축명을 저장하고, 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 재차 지시한다(스텝29). 다시, 사용자가 송수화부(10)를 통해 음성으로 단축명을 입력하면(스텝30), 음성인식부(11)는 전술한 바와 마찬가지로 단축명을 저장하고, 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력이 완료되었음을 통보한다(스텝31). 그후, 키패드부(15)를 통해 데이타 베이스 저장버튼이 입력되면(스텝32) 제어부(14)는 데이타 저장 동작을 종료한다.
제3도에서 단축번호를 저장하는 이유는 단축명을 음성으로 입력하지 않고 직접 단축 다이얼 버튼을 입력하더라도 통화 가능하게 하기 위한 것이다. 또한, 제3도에서 단축명을 3번 저장하는 이유는 개인의 음성특징이 발음할 때마다 약간씩 다르기 때문에 여러번 저장하면 좋겠지만 저장 영역이 많이 필요하고 인식시 비교횟수가 많아 인식시간이 길어지기 때문이다.
화자 종속형 음성데이타를 구축한 후 통화시 화자 종속형 음성데이타를 갱신하는 경우 제4도에 도시된 순서로 동작한다. 먼저, 키패드부(15)에 의해 화자 종속모드를 설정하여 화자 종속모드로 통화하는 경우(스텝41), 제어부(14)는 송수화부(10)를 통해 음성을 출력하여 단축명 입력을 지시하며(스텝42), 사용자가 송수화부(10)를 통해 음성으로 원하는 단축명을 입력한다(스텝43). 이때, 음성 인식부(11)는 송수화부(10)로부터 인가된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타와 음성데이타 베이스(13)의 화자 종속형 음성데이타를 비교하여 유사도가 가장 큰 음성데이타를 찾아냄으로써 단축명을 인식하고 음성데이타 베이스(13)에 저장된 해당 단축명의 어드레스를 전화번호 데이타 베이스(12) 측에 출력하면 전화번호 데이타 베이스(12)는 제어부(14) 측에 해당 단축명의 전화번호를 출력하며, 제어부(14)는 송수화부(10)측에 음성을 출력하여 해당 단축명의 전화번호를 사용자에게 알려주고 전화연결 지시를 요청한다(스텝44). 그후, 사용자가 송수화부(10)를 통해 음성입력하여 전화 연결할 것을 지시하면(스텝45), 음식인식부(11)가 해당 음성을 인지하여 제어부(14)측에 전화연결지시 신호를 주고 이때 제어부(14)는 스텝44에서 검색해 놓았던 해당 단축명의 전화번호를 다이얼링하여 전화 연결한다.(스텝46). 그후, 제어부(14)는 통화종료되면(스텝47), 음성 데이타 베이스(13)측에 제어신호를 출력하여 음성인식부(13)가 상기 스텝44에서 음성인식하여 만들었던 단축명의 화자 종속형 음성 데이타를 음성데이타 베이스(13)에 저장하고 음성데이타 베이스(13)에 가장 먼저 저장된 해당 단축명의 화자 종속형 음성데이타를 소거함으로써 화자 종속형 음성 데이타를 갱신한다(스텝48).
이상의 설명에서는 음성데이타 베이스(13)에 저장된 단축명의 화자 종속형 음성데이타를 통화시에 갱신하는 것으로 설명하였으나, 이에 한정되는 것은 아니고 다른 내용의 화자 종속형 음성 데이타에 대해서도 적용 가능하다.
전술한 바와 같이, 본 발명은 화자 종속모드로 통화할 때마다 화자 종속형 음성데이타 베이스의 내용을 갱신하므로 사용자의 최근 음성으로 이루어진 데이타 베이스를 구축하게되어 화자 종속형 음성의 인식율을 증가시킬수 있고 화자 종속형 음성데이타를 별도로 갱신시켜야 하는 번거로움도 해소할 수 있어 음성인식 전화기의 사용편리성을 향상시킬 수 있다.

Claims (3)

  1. 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 송수화수단을 통해 소정 전화번호에 대응하는 단축명을 음성으로 입력받되, 상기 송수화수단을 통해 입력되는 상기 단축명에 대한 음성의 특징을 추출하고, 상기 추출된 음성의 특징을 음성 데이타베이스에 각각 저장하는 과정을 적어도 2회 이상 반복 수행하여 상기 전화번호와의 전화통화에 필요한 화자 종속형 음성 데이타를 구축하는 데이타 구축 과정과; 상기 전화번호와의 통화시에 입력되는 음성의 화자 종속형 음성 데이타로 상기 데이타 구축 과정에서 가장 먼저 구축했던 화자 종속형 음성데이타를 대체하여 기록 갱신하는 데이타 갱신 과정을 포함하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
  2. 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 전화통화에 필요한 전화번호와 화자 종속형 음성 데이타를 저장하는 과정과; 송수화수단을 통해 입력되는 화자 종속형 음성 데이타에 따라 상기 전화번호를 다이얼링하여 통화로를 연결하는 과정과; 통화 종료하면, 가장 먼저 저장했던 화자 종속형 음성데이타에 대신하여, 상기 다이얼링시에 입력된 화자 종속형 음성 데이타를 저장하는 과정을 포함하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
  3. 제3항에 있어서, 전화통화에 필요한 상기 전화번호와 화자 종속형 음성 데이타를 저장하는 경우, 키입력수단을 통해 입력되는 전화번호를 저장하는 단계와, 음성 데이타의 입력을 지시하는 안내음성을 사용자에게 출력하여 반복적으로 송수화수단을 통해 화자 종속형 음성 데이타를 입력받아 저장하는 단계로 수행하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
KR1019940013951A 1994-06-20 1994-06-20 음성인식전화기에서의화자종속형음성데이타관리방법 KR100307028B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940013951A KR100307028B1 (ko) 1994-06-20 1994-06-20 음성인식전화기에서의화자종속형음성데이타관리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940013951A KR100307028B1 (ko) 1994-06-20 1994-06-20 음성인식전화기에서의화자종속형음성데이타관리방법

Publications (2)

Publication Number Publication Date
KR960003232A KR960003232A (ko) 1996-01-26
KR100307028B1 true KR100307028B1 (ko) 2001-11-30

Family

ID=37530375

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940013951A KR100307028B1 (ko) 1994-06-20 1994-06-20 음성인식전화기에서의화자종속형음성데이타관리방법

Country Status (1)

Country Link
KR (1) KR100307028B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100539913B1 (ko) * 1998-12-30 2006-02-28 삼성전자주식회사 휴대용 무선 전화기에서 가입자확인모듈 카드의 교체에 따른음성 다이얼 데이터 관리 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940010630A (ko) * 1992-10-30 1994-05-26 백중영 셀룰라폰의 음성다이얼링 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940010630A (ko) * 1992-10-30 1994-05-26 백중영 셀룰라폰의 음성다이얼링 방법

Also Published As

Publication number Publication date
KR960003232A (ko) 1996-01-26

Similar Documents

Publication Publication Date Title
US5452340A (en) Method of voice activated telephone dialing
US5651056A (en) Apparatus and methods for conveying telephone numbers and other information via communication devices
WO1994026054A1 (en) Apparatus and method for transparent telephony
KR20010102001A (ko) 전화 핸드셋용 음성 인식 사용자 인터페이스
US20020097845A1 (en) Telephone application programming interface-based, speech enabled automatic telephone dialer using names
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
US20020118803A1 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs, for telephones without private branch exchanges
EP0909499B1 (en) Telephone identification calling apparatus and procedures
JP3260324B2 (ja) メッセージ応答型携帯電話機
JPH1117796A (ja) 音声認識電話装置
JPH08163252A (ja) Pbx−コンピュータ連動システム
KR100307028B1 (ko) 음성인식전화기에서의화자종속형음성데이타관리방법
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
US20070286395A1 (en) Intelligent Multimedia Dial Tone
JPH11275651A (ja) 携帯電話機
KR0158315B1 (ko) 간이교환전화시스템
JPH10164210A (ja) 携帯電話機
JPH08204811A (ja) 携帯電話装置及びその制御方法
JPH03123250A (ja) 音声ダイヤル装置
JPH1146238A (ja) 電話機
JP3039576U (ja) 無線電話音声ダイヤル装置
JPH098894A (ja) 音声認識コードレス電話機
JP3975343B2 (ja) 電話番号登録システム、電話機、および電話番号登録方法
JPH11341164A (ja) 電話帳システム
KR20000045808A (ko) 음성인식에 의한 다단계 단축 다이얼링 방법

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080618

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee