KR100307028B1 - 음성인식전화기에서의화자종속형음성데이타관리방법 - Google Patents
음성인식전화기에서의화자종속형음성데이타관리방법 Download PDFInfo
- Publication number
- KR100307028B1 KR100307028B1 KR1019940013951A KR19940013951A KR100307028B1 KR 100307028 B1 KR100307028 B1 KR 100307028B1 KR 1019940013951 A KR1019940013951 A KR 1019940013951A KR 19940013951 A KR19940013951 A KR 19940013951A KR 100307028 B1 KR100307028 B1 KR 100307028B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- speaker
- dependent
- voice data
- telephone
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
- H04M2201/405—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 관한 것이다. 본 발명은 화자 종속모드로 통화할 때마다 화자 종속형 음성 데이타 베이스의 내용을 갱신하므로 사용자의 회근 음성으로 이루어진 데이타 베이스를 구축하게되어 화자 종속형 음성의 인식율을 증가시킬 수 있고, 화자 종속형 음성데이타를 별도로 갱신시켜야 하는 번거로움도 해소할 수 있어 음성인식 전화기의 사용편리성을 향상시킬 수 있다.
Description
제1도는 본 발명에 적용된 음성인식 전화기의 구성도.
제2도는 본 발명에 따른 화자 종속형 음성 데이타 관리 과정을 도시한 흐름도.
제3도는 제2도에 도시된 화자 종속형 음성데이타 구축과정의 상세 흐름도.
제4도는 제2도에 도시된 화자 종속형 음성데이타 갱신과정의 상세 흐름도.
* 도면의 주요부분에 대한 부호의 설명
10: 송수화부 11: 음성 인식부
12: 전화번호 데이타 베이스 13: 음성데이타 베이스
14: 제어부 15: 키패드부
[발명의 상세한 설명]
본 발명은 음성인식 전화기에 관한 것으로, 특히 화자 종속형 음성의 인식율을 향상시키도록 한 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 관한 것이다.
일반적으로, 음성을 인식하는 경우 화자 독립형과 화자 종속형의 음성을 인식한다. 화자 독립형 음성인식 기술은 불특정 화자의 음성을 인식 가능케하며, 화자 종속형 음성인식 기술은 특정 화자의 음성을 인식가능케 한다. 화자 독립형 음성을 인식하는 경우에는 여러 사람의 음성을 인식해야 하므로 대용량의 음성데이타 베이스를 구축해야 되고, 개인마다 음성의 특징이 상이함으로 인하여 저조한 인식률을 보인다. 반면에, 화자 종속형 음성을 인식하는 경우에는 특정 개인의 음성을 인식해야 하므로 소용량의 음성데이타 베이스를 구축하여도 되며, 특정 개인의 음성 특징이 비교적 균일함으로 인하여 높은 인식율을 보인다.
음성인식 전화기에서는 화자 독립형 및 화자 종속형 음성 모두를 인식가능한데, 숫자나 공공기관 등의 이름은 화자 독립으로 하여 사용자 누구에게나 적용될 수 있도록 하고, 사용자의 친구나 개인전 연락처 등의 단축 다이얼에는 화자 종속으로 하여 개인이 사용하도록 하고 있다.
종래의 음성인식 전화기에서는 화자 종속으로 음성인식하는 경우 구축한 화자 종속형 음성데이타 베이스를 이용하여 화자 종속형 음성을 인식하는데, 음성데아타 구축후 장기간이 지난 경우 또는 사용자의 음성이 변한 경우에는 사용자의 음성 특징이 변화됨으로 인하여 구축한 음성데이타 베이스의 음성데이타와 실제 입력된 음성데이타가 일치하지 않으므로 화자 종속형 음성의 인식율을 저하시키게 되는 문제점이 있었다.
본 발명은 전술한 바와 같은 문제점을 해결하기 위하여 안출될 것으로, 화자 종속모드로 통화할 때마다 화자 종속형 음성데이타 베이스의 내용을 갱신함으로써 화자 종속형 음성의 인식율을 향상시키도록 한 음성인식 전화기에서의 화자 종속형 음성 데이타 관리 방법을 제공하는데 목적이 있다.
이와 같은 목적을 달성하기 위한 본 발명의 특징은, 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 송수화수단을 통해 소정 전화번호에 대응하는 단축명을 음성으로 입력받되, 상기 송수화수단을 통해 입력되는 상기 단축명에 대한 음성의 특징을 추출하고, 상기 추출된 음성의 특징을 음성 데이타베이스에 각각 저장하는 과정을 적어도 2회 이상 반복 수행하여 상기 전화번호와의 전화통화에 필요한 화자 종속형 음성 데이타를 구축하는 데이타 구축 과정과; 상기 전화번호와의 통화시에 입력되는 음성의 화자 종속형 음성 데이타로 상기 데이타 구축 과정에서 가장 먼저 구축했던 화자 종속형 음성데이타를 대체하여 기록 갱신하는 데이타 갱신 과정을 포함하는 데 있다.
본 발명의 다른 특징은, 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 전화통화에 필요한 전호번호와 화자 종속형 음성 데이타를 저장하는 과정과; 송수화수단을 통해 입력되는 화자 종속형 음성 데이타에 따라 상기 전화번호를 다이얼링하여 통화로를 연결하는 과정과; 통화 종료하면, 가장 먼저 저장했던 화자 종속형 음성데이타에 대신하여, 상기 다이얼링시에 입력된 화자 종속형 음성 데이타를 저장하는 과정을 포함하는데 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다.
제1도는 본 발명에 적용된 음성인식 전화기의 구성도이고, 제2도는 본 발명에 따른 화자 종속형 음성데이타 관리과정을 도시한 흐름도이고, 제3도는 제2도에 도시된 화자 종속형 음성데이타 구축과정의 상세 흐름도이며, 제4도는 제2도에 도시된 화자 종속형 음성데이타 갱신과정의 상세 흐름도이다.
본 발명에 적용된 음성인식 전화기는 제1도에 도시된 바와 같이 송수화부(10), 음성인식부(11), 전화번호 데이타 베이스(12), 음성데이타 베이스(13), 제어부(14) 및 키패드부(15)를 구비한다. 송수화부(10)는 음성신호를 입출력하며, 키패드부(15)는 제어부(14) 측에 제어정보를 입력한다. 음성인식부(11)는 송수화부(10)로부터 입력되는 음성의 특징을 추출하여 만든 화자 종속형 음성데이타와 가장 유사도가 큰 음성데이타를 음성데이타 베이스(13)에서 찾아냄으로써 화자 종속형 음성을 인식한다. 전화번호 데이타베이스(12)에는 단축번호와 전화번호를 저장하며, 음성인식부(11)로부터 인가되는 어드레스에 따라 해당 전화번호를 제어부(14) 측에 출력한다. 제어부(14)는 음성인식 전화기의 전반적인 동작을 관할하는 데, 다이얼링동작과 음성신호 송수신 동작을 제어하고 화자 종속모드로 단축 다이얼링하여 통화종료한 후 음성 데이타 베이스(13)을 제어하여 화자 종속형 음성 데이타를 갱신시킨다.
이와 같은 음성인식 전화기는 제2도에 도시된 순서로 화자 종속형 음성 데이타를 관리한다. 음성인식부(11)가 음성데이타 베이스(13)에 화자 종속형 음성데이타를 구축하고(과정20), 화자 종속모드로 통화하는 경우 음성인식부(11)가 새로이 입력된 화자 종속형 음성데이타를 가장 먼저 저장된 음성데이타 베이스(13)의 화자 종속형 음성데이타와 교체하여 저장함으로써 화자 종속형 음성데이타를 갱신한다(과정40).
화자 종속형 음성데이타를 구축하는 경우 제3도에 도시된 순서로 동작한다. 먼저, 키패드부(15)를 통해 데이타 베이스 저장버튼을 입력하고(스텝21), 캐패드부(15)를 통해 단축 번호를 입력하며(스텝22), 이후 키패드부(15)를 통해 전화번호를 입력하고(스텝23), 다시 키패드부(15)를 통해 단축번호를 입력하면(스텝24), 제어부(14)는 단축번호 및 전화번호를 전화번호 데이타 베이스(12)에 저장한 후 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 지시한다(스텝25). 그후, 사용자가 송수화부(10)를 통해 음성으로 단축명을 입력하면(스텝26), 음성인식부(11)는 입력된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타를 음성데이타 베이스(13)에 저장함으로써 단축명을 저장하고 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 다시 지시한다(스텝27). 이때, 사용자가 송수화부(10)를 통해 음성으로 단툭명을 입력하면(스텝28), 음성인식부(11)는 입력된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타를 음성데이타 베이스(13)에 저장함으로써 단축명을 저장하고, 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력을 재차 지시한다(스텝29). 다시, 사용자가 송수화부(10)를 통해 음성으로 단축명을 입력하면(스텝30), 음성인식부(11)는 전술한 바와 마찬가지로 단축명을 저장하고, 이와 동시에 제어부(14)가 송수화부(10)를 통해 사용자에게 음성메세지를 출력하여 단축명 입력이 완료되었음을 통보한다(스텝31). 그후, 키패드부(15)를 통해 데이타 베이스 저장버튼이 입력되면(스텝32) 제어부(14)는 데이타 저장 동작을 종료한다.
제3도에서 단축번호를 저장하는 이유는 단축명을 음성으로 입력하지 않고 직접 단축 다이얼 버튼을 입력하더라도 통화 가능하게 하기 위한 것이다. 또한, 제3도에서 단축명을 3번 저장하는 이유는 개인의 음성특징이 발음할 때마다 약간씩 다르기 때문에 여러번 저장하면 좋겠지만 저장 영역이 많이 필요하고 인식시 비교횟수가 많아 인식시간이 길어지기 때문이다.
화자 종속형 음성데이타를 구축한 후 통화시 화자 종속형 음성데이타를 갱신하는 경우 제4도에 도시된 순서로 동작한다. 먼저, 키패드부(15)에 의해 화자 종속모드를 설정하여 화자 종속모드로 통화하는 경우(스텝41), 제어부(14)는 송수화부(10)를 통해 음성을 출력하여 단축명 입력을 지시하며(스텝42), 사용자가 송수화부(10)를 통해 음성으로 원하는 단축명을 입력한다(스텝43). 이때, 음성 인식부(11)는 송수화부(10)로부터 인가된 음성의 특징을 추출하여 만든 화자 종속형 음성데이타와 음성데이타 베이스(13)의 화자 종속형 음성데이타를 비교하여 유사도가 가장 큰 음성데이타를 찾아냄으로써 단축명을 인식하고 음성데이타 베이스(13)에 저장된 해당 단축명의 어드레스를 전화번호 데이타 베이스(12) 측에 출력하면 전화번호 데이타 베이스(12)는 제어부(14) 측에 해당 단축명의 전화번호를 출력하며, 제어부(14)는 송수화부(10)측에 음성을 출력하여 해당 단축명의 전화번호를 사용자에게 알려주고 전화연결 지시를 요청한다(스텝44). 그후, 사용자가 송수화부(10)를 통해 음성입력하여 전화 연결할 것을 지시하면(스텝45), 음식인식부(11)가 해당 음성을 인지하여 제어부(14)측에 전화연결지시 신호를 주고 이때 제어부(14)는 스텝44에서 검색해 놓았던 해당 단축명의 전화번호를 다이얼링하여 전화 연결한다.(스텝46). 그후, 제어부(14)는 통화종료되면(스텝47), 음성 데이타 베이스(13)측에 제어신호를 출력하여 음성인식부(13)가 상기 스텝44에서 음성인식하여 만들었던 단축명의 화자 종속형 음성 데이타를 음성데이타 베이스(13)에 저장하고 음성데이타 베이스(13)에 가장 먼저 저장된 해당 단축명의 화자 종속형 음성데이타를 소거함으로써 화자 종속형 음성 데이타를 갱신한다(스텝48).
이상의 설명에서는 음성데이타 베이스(13)에 저장된 단축명의 화자 종속형 음성데이타를 통화시에 갱신하는 것으로 설명하였으나, 이에 한정되는 것은 아니고 다른 내용의 화자 종속형 음성 데이타에 대해서도 적용 가능하다.
전술한 바와 같이, 본 발명은 화자 종속모드로 통화할 때마다 화자 종속형 음성데이타 베이스의 내용을 갱신하므로 사용자의 최근 음성으로 이루어진 데이타 베이스를 구축하게되어 화자 종속형 음성의 인식율을 증가시킬수 있고 화자 종속형 음성데이타를 별도로 갱신시켜야 하는 번거로움도 해소할 수 있어 음성인식 전화기의 사용편리성을 향상시킬 수 있다.
Claims (3)
- 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 송수화수단을 통해 소정 전화번호에 대응하는 단축명을 음성으로 입력받되, 상기 송수화수단을 통해 입력되는 상기 단축명에 대한 음성의 특징을 추출하고, 상기 추출된 음성의 특징을 음성 데이타베이스에 각각 저장하는 과정을 적어도 2회 이상 반복 수행하여 상기 전화번호와의 전화통화에 필요한 화자 종속형 음성 데이타를 구축하는 데이타 구축 과정과; 상기 전화번호와의 통화시에 입력되는 음성의 화자 종속형 음성 데이타로 상기 데이타 구축 과정에서 가장 먼저 구축했던 화자 종속형 음성데이타를 대체하여 기록 갱신하는 데이타 갱신 과정을 포함하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
- 음성인식 전화기에서의 화자 종속형 음성데이타 관리방법에 있어서, 전화통화에 필요한 전화번호와 화자 종속형 음성 데이타를 저장하는 과정과; 송수화수단을 통해 입력되는 화자 종속형 음성 데이타에 따라 상기 전화번호를 다이얼링하여 통화로를 연결하는 과정과; 통화 종료하면, 가장 먼저 저장했던 화자 종속형 음성데이타에 대신하여, 상기 다이얼링시에 입력된 화자 종속형 음성 데이타를 저장하는 과정을 포함하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
- 제3항에 있어서, 전화통화에 필요한 상기 전화번호와 화자 종속형 음성 데이타를 저장하는 경우, 키입력수단을 통해 입력되는 전화번호를 저장하는 단계와, 음성 데이타의 입력을 지시하는 안내음성을 사용자에게 출력하여 반복적으로 송수화수단을 통해 화자 종속형 음성 데이타를 입력받아 저장하는 단계로 수행하는 것을 특징으로 하는 음성인식 전화기에서의 화자 종속형 음성 데이타 관리방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940013951A KR100307028B1 (ko) | 1994-06-20 | 1994-06-20 | 음성인식전화기에서의화자종속형음성데이타관리방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940013951A KR100307028B1 (ko) | 1994-06-20 | 1994-06-20 | 음성인식전화기에서의화자종속형음성데이타관리방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960003232A KR960003232A (ko) | 1996-01-26 |
KR100307028B1 true KR100307028B1 (ko) | 2001-11-30 |
Family
ID=37530375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940013951A KR100307028B1 (ko) | 1994-06-20 | 1994-06-20 | 음성인식전화기에서의화자종속형음성데이타관리방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100307028B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100539913B1 (ko) * | 1998-12-30 | 2006-02-28 | 삼성전자주식회사 | 휴대용 무선 전화기에서 가입자확인모듈 카드의 교체에 따른음성 다이얼 데이터 관리 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940010630A (ko) * | 1992-10-30 | 1994-05-26 | 백중영 | 셀룰라폰의 음성다이얼링 방법 |
-
1994
- 1994-06-20 KR KR1019940013951A patent/KR100307028B1/ko not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940010630A (ko) * | 1992-10-30 | 1994-05-26 | 백중영 | 셀룰라폰의 음성다이얼링 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR960003232A (ko) | 1996-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5594784A (en) | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls | |
US5452340A (en) | Method of voice activated telephone dialing | |
US5651056A (en) | Apparatus and methods for conveying telephone numbers and other information via communication devices | |
KR20010102001A (ko) | 전화 핸드셋용 음성 인식 사용자 인터페이스 | |
US20020097845A1 (en) | Telephone application programming interface-based, speech enabled automatic telephone dialer using names | |
US20020097844A1 (en) | Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs | |
US6449359B1 (en) | Telephone identification calling apparatus and procedures | |
EP0909499B1 (en) | Telephone identification calling apparatus and procedures | |
US6223161B1 (en) | Method for setting terminal specific parameters of a communication terminal | |
JP3260324B2 (ja) | メッセージ応答型携帯電話機 | |
JPH1117796A (ja) | 音声認識電話装置 | |
JPH08163252A (ja) | Pbx−コンピュータ連動システム | |
KR100307028B1 (ko) | 음성인식전화기에서의화자종속형음성데이타관리방법 | |
US20070286395A1 (en) | Intelligent Multimedia Dial Tone | |
KR0158315B1 (ko) | 간이교환전화시스템 | |
JPH10164210A (ja) | 携帯電話機 | |
JPH08204811A (ja) | 携帯電話装置及びその制御方法 | |
JPH03123250A (ja) | 音声ダイヤル装置 | |
JPH1146238A (ja) | 電話機 | |
JP3039576U (ja) | 無線電話音声ダイヤル装置 | |
JPH098894A (ja) | 音声認識コードレス電話機 | |
JP3975343B2 (ja) | 電話番号登録システム、電話機、および電話番号登録方法 | |
JPH1127364A (ja) | 音声認識電話装置 | |
JPH11341164A (ja) | 電話帳システム | |
JPH11205423A (ja) | 通話履歴表示方法及び通信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080618 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |