KR100595610B1 - 전화번호 안내 방법 및 장치 - Google Patents
전화번호 안내 방법 및 장치 Download PDFInfo
- Publication number
- KR100595610B1 KR100595610B1 KR1020030076089A KR20030076089A KR100595610B1 KR 100595610 B1 KR100595610 B1 KR 100595610B1 KR 1020030076089 A KR1020030076089 A KR 1020030076089A KR 20030076089 A KR20030076089 A KR 20030076089A KR 100595610 B1 KR100595610 B1 KR 100595610B1
- Authority
- KR
- South Korea
- Prior art keywords
- telephone number
- guide
- pattern
- data
- telephone
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000004044 response Effects 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/2753—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/68—Details of telephonic subscriber devices with means for recording information, e.g. telephone number during a conversation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Exchange Systems With Centralized Control (AREA)
Abstract
본 발명은 전화번호 안내 방법 및 장치에 관한 것으로 특히, 단말기에서 키워드 발견(keyword spotting)과 음성 인식(speech recognition) 기능을 사용함으로써 안내 전화번호를 표시(display) 또는 저장하고 이를 참조하여 사용자가 선택적으로 전화 연결을 시도하도록 함에 목적이 있다. 이러한 목적의 본 발명은 음성 인식을 이용한 전화번호 안내 방법에 있어서, 전화번호 안내 서비스를 요청하고 응답 음성신호를 수신하는 단계와, 특징 추출(feature extractin) 방식으로 응답 음성신호에서 특정 패턴을 추출하는 단계와, 키워드 발견 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 추출하여 저장하는 단계와, 숫자 인식 기능을 이용하여 상기 안내 전화번호 데이터에서 숫자 데이터(전화번호)를 인식하는 단계와, 상기 인식된 숫자 데이터를 메모리에 저장함과 아울러 화면에 디스플레이하는 단계를 수행하도록 구성함을 특징으로 한다.
Description
도1은 종래의 제2 실시예에서 전화번호 안내 과정을 보인 동작 순서도.
도2는 종래의 제3 실시예에서 전화번호 검색 및 다이얼링을 위한 장치의 블록도.
도3은 종래의 제4 실시예에서 전화번호 인식 과정을 보인 동작 순서도.
도4는 본 발명의 실시예에서 전화번호 안내 과정을 보인 동작 순서도.
본 발명은 전화 서비스 기술에 관한 것으로 특히, 음성 인식 방법을 이용하는 전화번호 안내 방법 및 장치에 관한 것이다.
통상적으로 전화번호 안내는 사용자가 전화번호 '114'로 전화를 걸어 상담원에게 원하는 전화번호의 검색을 요청하고 상담원은 해당 전화번호를 검색하여 ARS 방식으로 자동 응답한다.
ARS 응답은 전화번호 '123-4567'을 예로 들면 아래와 같다.
"문의하신 번호는 일(1)이(2)삼(3)국에 사(4)오(5)육(6)칠(7)번입니다." 또 는 "문의하신 번호는 백이십삼(123)국에 사천오백육십칠(4567)번입니다."
이어서, 아래와 같은 음성 안내를 하게 된다.
"안내 받으신 번호로 직접 연결을 원하시면 일(1) 번을 눌러주시기 바라며 이용 시 100원의 요금이 부과됩니다."
이에 따라, 사용자는 안내되는 전화번호를 받아 적은 후 전화를 걸거나 1번 버튼을 눌러 직접 전화 연결을 시도한다.
그러나, 통상의 114 전화 서비스는 잡음이 심하거나 필기구 등을 준비를 하지 못한 경우 전화 연결하여 해당 전화번호를 안내받은 경우에도 그 번호를 정확하게 파악하지 못할 수 있으며, 이 경우 사용자가 다시 114에 연결하여야 하는 문제가 발생한다.
따라서, 상기의 문제점을 개선하기 위하여 현재 114 전화 서비스를 자동으로 안내하기 위한 여러 방법이 제시되어 있다.
종래의 제1 실시예로서 대한민국 등록특허 01-0228204호(공개번호 1999-53612, 명칭 : 자동음성안내장치)가 제시되어 있다.
이 등록특허는 일반 사용자가 114 안내 전화 번호로 전화를 걸어 전화번호 문의를 요청했을 때 서비스 제공업체 측에서 사용자의 음성을 인식하여 사용자가 원하는 전화번호를 자동으로 통보해 주고, 만약 통보된 전화 번호가 원하는 것과 일치하지 않을 경우에는 안내원과 직접 통화를 하도록 하는 기술이다. 즉, 특허등록된 상기 자동음성안내장치는 단말기나 전화기 측이 아닌 서비스 제공 측에서 사용자의 음성을 인식하는 방법으로, 교환원들이 사용자가 요구하는 전화 번호 문의 사항을 듣고서 전화번호부 데이터 베이스에 연결된 컴퓨터를 통해 알려 주는 것이 아닌 교환원이 할 일을 음성 인식 시스템이 대신하는 것이다.
또한, 종래의 제2 실시예로서 대한민국 공개특허 1996 - 27969호(명칭 : 음성인식에 의한 재다이얼링 방법)이 제시되어 있다.
이 공개특허는 도1의 동작 순서도와 동일한 과정을 수행함으로써 사용자가 문의한 전화번호를 수신하여 음성 인식부에서 인식이 제대로 되었으면 재다이얼링하는 동작을 수행하는 것이다.
그리고, 종래의 제3 실시예로서 대한민국 공개특허 2001-0069409호(명칭 : 기계음 인식 기능을 갖는 디지털 휴대용 전화기의 전화번호 검색 및 다이얼링 방법)이 제시되어 있다.
이 공개특허는 도2의 블록도와 같이 구성함으로써 단말기 내부에 음성인식 기능을 추가로 해서 114 서비스 센터에서 기계음을 이용하여 고객에게 제공하면 이것을 숫자로 자동 전환해서 전화 번호 검색과 저장 장치로써 전화를 자동으로 걸어주는 동작을 수행하는 것이다. 즉, 이 공개특허의 방법은 기계음이 전화접속 상태에 관계없이 일정한 패턴을 유지하며 제한적인 개수의 음성만으로 구성된다는 특징을 이용하여 신경망 알고리즘으로 학습하고, 사용자가 114 서비스 센터에 연결하여 전화번호 안내 과정을 진행시키면 패턴 매칭(pattern matching)에 의해 연속적인 기계음을 해당 숫자로 변환하여 엘씨디(LCD) 창에 표시하고 그 번호로 자동 다이얼링하는 것이다.
또한, 종래의 제4 실시예로서 대한민국 공개특허 2001-64810호(명칭 : 화자 종속 고립단어 음성인식을 통한 안내전화번호 자동 다이얼링 방법)이 제시되어 있다.
이 공개특허는 도3의 동작 순서도와 같은 과정을 수행함으로써 DSP 신호를 데이터 베이스화해서 고립 단어 화자 종속 인식 및 끝점 인식으로 화자 종속 고립단어 인식을 통해 안내 전화번호를 인식하고 이 인식된 안내 전화번호를 자동 다이얼링을 하는 동작을 수행하는 것이다. 즉, 이 공개특허는 단말기의 번호기억부에 '0~9'까지 고립단어 음성 및 끝점 인식을 위해서 데이터 베이스를 만든 다음, 안내시스템으로부터 전달된 고립단어를 화자 종속적으로 안내음성 인식하고, 이후 끝점을 검출한 다음종료 멘트가 나오면 종결해서 자동으로 연결을 하는 것이다.
그러나, 종래의 제1 실시예는 서비스 제공 측에서의 음성 인식 방식으로, 한정된 대역폭 음성 (유선전화의 경우 3.4 kHz, 무선 4kHz)에서의 인식률이 매우 나쁘며 특히, 잡음이 섞일 경우 인식률이 더욱 저하되는 문제점이 있다. 또한, 종래의 제1 실시예는 높은 신뢰도의 대용량 CSR(Continuous Speech Recognition)이 필요로 하며, 이는 가까운 시일 내에 실현 불가능하다는 문제점이 있다. 예를 들어, 현재 16 kHz에서 가장 clean한 환경에서 최고급 마이크와 방음이 완벽한 곳에서도 대용량 어휘(Large Vocabulrary) CSR은 아직도 요원한 과제이다. 또한 유선의 경우 전화 채널을 통한 채널 찌그러짐(distortion) 등의 문제가 있기 때문에 단기간 내 실현이 어렵다.
그리고, 종래의 제2 실시예는 자동 재다이얼링을 위한 음성 인식으로서, 전 화번호의 시작 및 끝 부분에 대한 인식 방법의 언급이 없어 그 실현 여부가 모호하다는 문제점이 있다.
또한, 종래의 제3 실시예는 안내원들과 대화를 마친 다음에 기계음으로 넘어가기 시작하는데 그것을 정확히 판별해 낼 수 없다는 문제점이 있다.
그리고, 종래의 제4 실시예는 음성 인식을 통해서 자동 다이얼링을 하는 방식으로 기계음 수신시부터 번호 인식 동작이 시작된다고 하지만, 현재의 114의 경우 상담자의 통화한 다음 ARS로 넘어 갈 때 정형화된 기계음을 발생하지 않으므로 이에 대한 처리 정보가 없어 오류가 발생할 수 있는 문제점이 있다.
한편, 현재 자동으로 직접 연결을 하는 기능이 지원되는 경우에도 사용자가 어떤 경우에는 당장 연결을 원하는 것이 아니라 번호를 저장하고 있다가 나중에 연결을 하고싶을 수도 있지만, 이런 경우에 대한 대응 방안이 제시되어 있지 않다.
이에 따라, 전화번호 안내와 함께 문자 메시지를 전송하는 기술이 제시되어 있으나, 기존의 서비스 사업자의 시스템을 변경하여야 함은 물론 사용자가 별도의 비용을 지불하여야 하는 문제점이 있다.
따라서, 본 발명은 종래의 문제점을 개선하기 위하여 통신 단말기에서 키워드 발견(keyword spotting)과 음성 인식(speech recognition) 기능을 사용함으로써 안내 전화번호를 표시(display) 또는 저장하고 이를 참조하여 사용자가 선택적으로 전화 연결을 시도하도록 창안한 전화번호 안내 방법 및 장치를 제공함에 목적이 있다.
즉, 본 발명은 114 전화 서비스로 전화 번호를 문의했을 때 상담원에게 전화 번호를 알고자 하는 곳의 상호 등을 이야기 한 뒤, 휴대용 전화기나 일반 전화기 내부에서 ARS로 답변해 주는 신호에서 키워드 발견(Keyword Spotting) 방법과 동적 시간 정합(DTW : Dynamic Time Warping)에 기반한 연속 단어 인식기(Connected Word Speech Recognizer)를 이용하여 안내 전화번호를 인식하고 그 결과를 내장된 전화 번호부에 자동 저장하거나 엘시디(LCD)에 디스플레이 하는 함으로써 사용자의 편리성을 도모하도록 함에 목적이 있는 것이다.
본 발명은 상기의 목적을 달성하기 위하여 음성 인식을 이용한 전화번호 안내 방법에 있어서, 전화번호 안내 서비스를 요청하고 그에 따른 응답 음성 신호를 수신하는 단계와, 특징 추출(feature extractin) 방식으로 응답 음성신호에서 특정 패턴을 추출하는 단계와, 키워드 발견 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 추출하여 저장하는 단계와, 숫자 인식 기능을 이용하여 상기 안내 전화번호 데이터에서 숫자 데이터(전화번호)를 인식하는 단계와, 상기 인식된 숫자 데이터를 메모리에 저장하고 아울러 화면에 디스플레이하는 단계를 수행함을 특징으로 한다.
상기 키워드 발견 방식으로 안내 전화번호 데이터를 추출하여 저장하는 단계는 특정 패턴에서 안내 전화번호 이전의 문자 부분을 검출하는 과정과, 특정 패턴에서 안내 전화번호 이후의 문자 부분을 검출하는 과정과, 상기 검출된 문자 사이의 숫자 데이터를 저장하는 과정으로 이루어짐을 특징으로 한다.
상기 숫자 데이터를 인식하는 단계는 숫자 인식 기능을 이용하여 연속적인 숫자음 패턴을 검출하는 과정과, 상기 숫자음 패턴을 데이터베이스의 참조 패턴과 비교하여 해당 숫자를 인식하는 과정으로 이루어짐을 특징으로 한다.
또한, 본 발명은 상기의 목적을 달성하기 위하여 통신 단말기에 있어서, 요청된 전화번호 안내 서비스에 따른 응답 음성신호를 수신하여 특징 추출(feature extraction) 방식으로 상기 응답 음성신호에서 특정 패턴을 추출하는 수단과, 키워드 발견(keyword spotting) 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 검출하는 수단과, 상기 검출된 안내 전화번호 데이터로부터 숫자 데이터를 인식하여 저장하는 수단과, 상기 인식된 숫자 데이터(전화번호)를 디스플레이하는 수단을 포함하여 구성함을 특징으로 한다.
또한, 본 발명은 상기의 목적을 달성하기 위하여 통신 단말기에 있어서, 요청된 전화번호 안내 서비스에 따른 응답 음성신호를 수신하여 특징 추출(feature extraction) 방식으로 상기 응답 음성신호에서 특정 패턴을 추출하는 수단과, 키워드 발견(keyword spotting) 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 검출하는 수단과, 상기 검출된 안내 전화번호 데이터로부터 숫자 데이터를 인식하여 저장하는 수단과, 상기 인식된 숫자 데이터(전화번호)를 디스플레이하는 수단을 포함하여 구성함을 특징으로 한다.
이하, 본 발명을 도면에 의거 상세히 설명하면 다음과 같다.
본 발명의 실시예에서는 디스플레이 기능의 전화기 예로, 휴대폰을 가정하여 설명하기로 한다.
도4는 본 발명의 실시예에서 음성 인식 과정을 보인 동작 순서도로서 이에 도시한 바와 같이, 전화번호 안내 서비스 센터에서 응답된 안내 음성 신호를 수신하는 단계와, 특징 추출(feature extractin) 방식으로 상기 응답 음성 신호에서 특정 패턴을 추출하는 단계와, 키워드 발견 방식으로 상기 특정 패턴에서 전화전호 안내 데이터만을 추출하여 저장하는 단계와, 숫자 인식 기능을 이용하여 상기 전화번호 안내 데이터에서 숫자 데이터를 인식하는 단계와, 상기 인식된 숫자 데이터를 메모리에 저장하고 아울러 화면에 디스플레이하는 단계를 수행하도록 구성한다.
이와같이 구성한 본 발명의 실시예에 대한 동작 및 작용 효과를 설명하면 다음과 같다.
우선, 본 발명의 실시예는 키워드 발견(keyword spotting) 방식 및 동적 시간 정합(DTW) 방식으로 연결 단어를 인식하기 위하여 "0~9"의 음성 기준 패턴(reference pattern)과 "번호는" 및 "번입니다"라는 음성 기준 패턴을 휴대폰의 내장 메모리에 저장한다. 상기 기준 패턴 데이터베이스는 유무선 통신망을 통해 해당 서비스 업체로부터 다운로드하여 기존의 데이터베이스를 갱신할 수 있다. 여 기서, "0~9"의 음성 기준 패턴은 MFCC(Mel-Frequency Cepstrum Coefficients), LPCC(Linear Prediction Ceptstrum Coefficients), PLP 등을 이용하여 수열로 정리된 것이다.
그리고, 본 발명의 실시예에서 사용자가 알기를 원하는 전화번호가 예를 들어 '123-4567'이라고 가정하면 ARS 응답은 아래의 예시도와 같다.
"문의하신 번호는 일(1)이(2)삼(3)국에 사(4)오(5)육(6)칠(7)번입니다." 또는 "문의하신 번호는 백이십삼(123)국에 사천오백육십칠(4567)번입니다."
이어서, 아래와 같은 음성 안내를 하게 된다.
"안내 받으신 번호로 직접 연결을 원하시면 일(1) 번을 눌러주시기 바라며 이용 시 100원의 요금이 부과됩니다."
상기의 음성 멘트는 상담원과의 통화 후에 응답되는 음성을 예시한 것이다.
이때, 단말기에 응답 음성신호가 수신되는 동안 특징 추출(feature extraction) 방식으로 응답 신호에서 음성 기준 패턴에 부합되는 특정 패턴을 검출한다.
그리고, 특징 추출 방식으로 검출된 특정 패턴 중 "번호는"이란 음성 패턴과 "번 입니다"라는 음성 패턴을 키워드 발견(Keyword spotting) 알고리즘으로 찾아낸다. 키워드 발견 방식은 동일 화자의 완전 동일 음성일 경우 거의 완벽한 정밀도를 갖는다.
이때, 키워드 발견 방식으로 "번호는"과 "번입니다"라는 음성 패턴을 찾은 후 그 음성 패턴 사이에 있는 음성신호를 버퍼에 저장한다.
이에 따라, 버퍼에 저장되는 음성 신호는 숫자 정보와 숫자 정보 사이에 "국 에"라는 문자 부분만을 가지고 있을 것이므로 상기 버퍼에 저장된 음성 신호에 대해 동적 시간 정합(DTW) 방식을 이용하여 연결 단어 인식(Connected Word Recognition)을 수행한다.
여기서, 동적 시간 정합(DTW) 방식에 의한 연결 단어 인식을 수행하는 경우를 예로 들었으나, HMM(Hidden Markov Model : 통계적 처리 모델), VQ(Vector Quantization : 벡터 양자화), NN(Neural Network : 신경회로망) 등을 적용하여 해당 전화번호를 인식할 수 있다.
이후, 동적 시간 정합(DTW) 방식으로 인식된 전화번호를 내장된 전화번호부에 자동으로 저장하며 아울러 엘씨디(LCD) 화면에 디스플레이한다.
이에 따라, 사용자는 엘씨디 화면에 디스플레이된 전화번호로 통화 연결을 시도하거나 전화번호부를 탐색하여 해당 전화번호를 찾은 후 통화 연결을 시도하게 된다.
한편, 상기에서 본 발명을 달성하기 위한 방법에 대해서 설명하였으나, 이를 기반으로 설계된 장치를 휴대폰에 탑재할 수 있다.
즉 본 발명의 실시 예를 위한 장치는 요청된 전화번호 안내 서비스에 따른 응답 음성신호를 수신하여 특징 추출(feature extraction) 방식으로 상기 응답 음성신호에서 특정 패턴을 추출하는 수단과, 키워드 발견(keyword spotting) 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 검출하는 수단과, 상기 검출된 안내 전화번호 데이터로부터 숫자 데이터를 인식하여 메모리 수단에 저장하는 수단과, 상기 인식된 숫자 데이터(전화번호)를 디스플레이하는 수단을 포함하여 구성한다.
상기 구성의 장치는 도4의 과정과 동일한 동작을 수행하게 된다.
또한, 상기 특정 패턴 추출 및 안내 전화번호 데이터 추출은 데이터베이스에 저장된 음성 기준 패턴과의 비교를 통해 수행할 수 있으며, 상기 데이터베이스의 음성 기준 패턴은 서비스 업체로부터 다운로드하여 갱신할 수 있다.
한편, 상기에서 본 발명을 달성하기 위한 방법에 대해서 설명하였으나, 이를 기반으로 설계된 장치를 휴대폰에 탑재할 수 있다.
즉 본 발명의 실시 예를 위한 장치는 요청된 전화번호 안내 서비스에 따른 응답 음성신호를 수신하여 특징 추출(feature extraction) 방식으로 상기 응답 음성신호에서 특정 패턴을 추출하는 수단과, 키워드 발견(keyword spotting) 방식으로 상기 특정 패턴에서 안내 전화번호 데이터만을 검출하는 수단과, 상기 검출된 안내 전화번호 데이터로부터 숫자 데이터를 인식하여 메모리 수단에 저장하는 수단과, 상기 인식된 숫자 데이터(전화번호)를 디스플레이하는 수단을 포함하여 구성한다.
상기 구성의 장치는 도4의 과정과 동일한 동작을 수행하게 된다.
또한, 상기 특정 패턴 추출 및 안내 전화번호 데이터 추출은 데이터베이스에 저장된 음성 기준 패턴과의 비교를 통해 수행할 수 있으며, 상기 데이터베이스의 음성 기준 패턴은 서비스 업체로부터 다운로드하여 갱신할 수 있다.
상기에서 상세히 설명한 바와 같이 본 발명은 키워드 발견 방식으로 기계음에서 숫자에 해당되는 부분만을 분리한 후 동적 시간 정합(DTW) 방식으로 해당 전화번호를 인식하고 이를 메모리에 저장함은 물론 엘씨디 화면에 표시함으로써 사용자에게 편리함을 제공하는 효과가 있다.
이러한 효과를 발휘하는 본 발명은 VoIP 방식의 음성 전화 또는 임의의 가전 제품 내장의 전화기를 이용하는 경우에도 적용하여 동일한 효과를 발휘할 수 있다.
Claims (11)
- 요청된 전화번호 안내 서비스에 대한 응답 음성신호를 수신하는 단계와,상기 응답 음성신호에서 특정패턴을 추출하는 단계와,상기 특정패턴에서 안내 전화번호 데이터를 추출하는 단계와,상기 안내 전화번호 데이터에서 숫자 데이터를 인식하는 단계와,상기 숫자 데이터(전화번호)를 디스플레이하는 단계를 수행하도록 구성함을 특징으로 하는 전화번호 안내 방법.
- 제1항에 있어서, 안내 전화번호 데이터를 추출하는 단계는안내 전화번호 데이터 이전의 문자 부분을 검출하는 과정과,안내 전화번호 데이터 이후의 문자 부분을 검출하는 과정과,상기 검출된 문자 사이의 숫자 데이터를 검출하여 저장하는 과정으로 이루어짐을 특징으로 하는 전화번호 안내 방법.
- 제1항에 있어서, 숫자 데이터를 인식하는 단계는숫자 인식 기능을 이용하여 연속적인 숫자음 패턴을 검출하는 과정과,상기 숫자음 패턴을 데이터베이스의 참조 패턴과 비교하여 해당 숫자를 인식하는 과정으로 이루어짐을 특징으로 하는 전화번호 안내 방법.
- 제3항에 있어서, 연속적인 숫자음 패턴 검출은동적 시간 정합(DTW : Dynamic Time Warping) 방식을 적용하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 제3항에 있어서, 연속적인 숫자음 패턴 검출은통계적 처리 모델(HMM : Hidden Markov Model)을 이용하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 제3항에 있어서, 연속적인 숫자음 패턴 검출은벡터 양자화(VQ : Vector Quantization)를 이용하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 제3항에 있어서, 연속적인 숫자음 패턴 검출은신경 회로망(NN : Neural Network)를 이용하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 제1항에 있어서, 인식된 숫자 데이터를 메모리에 저장하는 단계를 포함하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 제1항 또는 제3항에 있어서, 참조 패턴을 해당 서비스 업체로부터 다운로드하여 갱신하는 단계를 더 포함하여 구성함을 특징으로 하는 전화번호 안내 방법.
- 통신 단말기의 전화번호 안내 장치에 있어서,전화번호 안내 서비스에 따른 응답 음성신호를 수신하여 특징 추출(feature extraction) 방식으로 상기 응답 음성신호에서 특정 패턴을 추출하는 수단과,키워드 발견(keyword spotting) 방식으로 상기 특정 패턴에서 안내 전화번호 데이터를 검출하는 수단과,상기 안내 전화번호 데이터에서 숫자(전화번호)를 인식하는 수단과,상기 인식된 숫자(전화번호)를 디스플레이하는 수단을 포함하여 구성함을 특징으로 하는 전화번호 안내 장치.
- 제10항에 있어서, 검출된 전화번호를 저장하는 메모리 수단을 더 포함하여 구성함을 특징으로 하는 전화번호 안내 장치.
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030076089A KR100595610B1 (ko) | 2003-10-29 | 2003-10-29 | 전화번호 안내 방법 및 장치 |
ES04025687T ES2268564T3 (es) | 2003-10-29 | 2004-10-28 | Sistema y metodo de recuperacion de numeros de telefono. |
PT04025687T PT1528773E (pt) | 2003-10-29 | 2004-10-28 | Sistema e metodo de recuperacao de numero de telefone |
DE602004001563T DE602004001563T2 (de) | 2003-10-29 | 2004-10-28 | Telefonnummerwiederfindungssystem und Verfahren |
EP04025687A EP1528773B1 (en) | 2003-10-29 | 2004-10-28 | Telephone number retrieval system and method |
AT04025687T ATE333750T1 (de) | 2003-10-29 | 2004-10-28 | Telefonnummerwiederfindungssystem und verfahren |
US10/976,520 US7356356B2 (en) | 2003-10-29 | 2004-10-29 | Telephone number retrieval system and method |
CNB2004101047887A CN100514985C (zh) | 2003-10-29 | 2004-10-29 | 电话号码检索系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030076089A KR100595610B1 (ko) | 2003-10-29 | 2003-10-29 | 전화번호 안내 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050040628A KR20050040628A (ko) | 2005-05-03 |
KR100595610B1 true KR100595610B1 (ko) | 2006-06-30 |
Family
ID=36782389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030076089A KR100595610B1 (ko) | 2003-10-29 | 2003-10-29 | 전화번호 안내 방법 및 장치 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7356356B2 (ko) |
EP (1) | EP1528773B1 (ko) |
KR (1) | KR100595610B1 (ko) |
CN (1) | CN100514985C (ko) |
AT (1) | ATE333750T1 (ko) |
DE (1) | DE602004001563T2 (ko) |
ES (1) | ES2268564T3 (ko) |
PT (1) | PT1528773E (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160003504A (ko) | 2014-07-01 | 2016-01-11 | 김윤희 | 사용자의 음성 분석을 이용하는 전화 번호 안내 시스템 및 전화 번호 안내 방법 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2513018A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | Method for training a proxy server for content delivery based on communication of state information from a mobile device browser |
CA2513019A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method for communicating state information between a server and a mobile device browser with version handling |
CA2513016A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A secure method of synchronizing cache contents of a mobile browser with a proxy server |
CA2513010A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method for detecting state changes between data stored in a first computing device and data retrieved from a second computing device |
CA2513014A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method of controlling delivery of multi-part content from an origin server to a mobile device browser via a proxy server |
CA2513022A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | System and method for communicating state management between a browser user-agent and a mobile data server |
KR100705580B1 (ko) * | 2005-08-04 | 2007-04-10 | 삼성전자주식회사 | 브이오아이피 단말 및 그 단말의 정보관리방법 |
US20080208594A1 (en) * | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
US8761815B2 (en) | 2007-03-21 | 2014-06-24 | Motorola Mobility Llc | Method, device and system for accessing mobile device user information |
US8130275B2 (en) * | 2008-06-13 | 2012-03-06 | Nintendo Co., Ltd. | Information-processing apparatus, and storage medium storing a photographing application launch program executed by information-processing apparatus |
CN101651730B (zh) * | 2009-06-30 | 2012-02-29 | 重庆重邮信科通信技术有限公司 | 一种电话簿条目快速读取方法 |
US20110014952A1 (en) * | 2009-07-15 | 2011-01-20 | Sony Ericsson Mobile Communications Ab | Audio recognition during voice sessions to provide enhanced user interface functionality |
US9137342B2 (en) | 2012-08-22 | 2015-09-15 | Mitel Networks Corporation | Automatic contact population |
KR101380430B1 (ko) * | 2012-12-20 | 2014-04-01 | 주식회사 팬택 | 통화 중 편의정보를 제공하는 휴대 단말 및 휴대 단말 상에서 통화 중 편의정보를 제공하는 방법 |
US10223066B2 (en) * | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
KR20190138915A (ko) * | 2018-06-07 | 2019-12-17 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297183A (en) * | 1992-04-13 | 1994-03-22 | Vcs Industries, Inc. | Speech recognition system for electronic switches in a cellular telephone or personal communication network |
JPH1084419A (ja) * | 1996-09-06 | 1998-03-31 | Brother Ind Ltd | 電話番号検索システム |
JP3055514B2 (ja) * | 1997-12-05 | 2000-06-26 | 日本電気株式会社 | 電話回線用音声認識装置 |
JPH11252283A (ja) | 1998-03-06 | 1999-09-17 | Canon Inc | 携帯情報端末、携帯情報端末の制御方法および記憶媒体 |
KR100273642B1 (ko) | 1998-06-22 | 2000-12-15 | 윤종용 | 안내 음성 디스플레이 기능을 갖는 전화 단말 장치 및 그 제어방법 |
KR20000003371A (ko) | 1998-06-27 | 2000-01-15 | 윤종용 | 휴대통신단말기에서 전화번호 안내 서비스 시 전화번호 표시장치 및 방법 |
US6570964B1 (en) * | 1999-04-16 | 2003-05-27 | Nuance Communications | Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system |
CN1166155C (zh) | 1999-07-28 | 2004-09-08 | 三菱电机株式会社 | 便携电话机 |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
KR20010008179A (ko) | 2000-11-14 | 2001-02-05 | 이근철 | 음성 인식을 이용한 전화 안내 서비스 표시 방법 및시스템 |
US6868267B1 (en) * | 2000-11-17 | 2005-03-15 | Qualcomm Inc. | Apparatus, method, and article of manufacture used to invoice for services consumed in a communications network |
US6915262B2 (en) * | 2000-11-30 | 2005-07-05 | Telesector Resources Group, Inc. | Methods and apparatus for performing speech recognition and using speech recognition results |
US6731724B2 (en) * | 2001-01-22 | 2004-05-04 | Pumatech, Inc. | Voice-enabled user interface for voicemail systems |
KR20020065229A (ko) | 2001-02-06 | 2002-08-13 | (주)유니와이드 테크놀러지 | 지능형 전화서비스 시스템 |
JP2002300306A (ja) * | 2001-03-30 | 2002-10-11 | Tsubasa System Co Ltd | 電話番号情報配信方法、電話番号情報配信プログラム、電話番号情報配信システム |
JP2003152856A (ja) * | 2001-11-15 | 2003-05-23 | Nec Corp | 通信端末装置、通信方法、およびそのプログラム |
US7174191B2 (en) * | 2002-09-10 | 2007-02-06 | Motorola, Inc. | Processing of telephone numbers in audio streams |
-
2003
- 2003-10-29 KR KR1020030076089A patent/KR100595610B1/ko not_active IP Right Cessation
-
2004
- 2004-10-28 PT PT04025687T patent/PT1528773E/pt unknown
- 2004-10-28 ES ES04025687T patent/ES2268564T3/es not_active Expired - Lifetime
- 2004-10-28 EP EP04025687A patent/EP1528773B1/en not_active Expired - Lifetime
- 2004-10-28 DE DE602004001563T patent/DE602004001563T2/de not_active Expired - Lifetime
- 2004-10-28 AT AT04025687T patent/ATE333750T1/de active
- 2004-10-29 CN CNB2004101047887A patent/CN100514985C/zh not_active Expired - Fee Related
- 2004-10-29 US US10/976,520 patent/US7356356B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160003504A (ko) | 2014-07-01 | 2016-01-11 | 김윤희 | 사용자의 음성 분석을 이용하는 전화 번호 안내 시스템 및 전화 번호 안내 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN100514985C (zh) | 2009-07-15 |
EP1528773A1 (en) | 2005-05-04 |
PT1528773E (pt) | 2006-09-29 |
US7356356B2 (en) | 2008-04-08 |
ATE333750T1 (de) | 2006-08-15 |
DE602004001563D1 (de) | 2006-08-31 |
KR20050040628A (ko) | 2005-05-03 |
DE602004001563T2 (de) | 2006-11-16 |
CN1620083A (zh) | 2005-05-25 |
EP1528773B1 (en) | 2006-07-19 |
ES2268564T3 (es) | 2007-03-16 |
US20050094782A1 (en) | 2005-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100595610B1 (ko) | 전화번호 안내 방법 및 장치 | |
KR102223017B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US5905773A (en) | Apparatus and method for reducing speech recognition vocabulary perplexity and dynamically selecting acoustic models | |
KR100616787B1 (ko) | 전화 핸드셋용 음성 인식 사용자 인터페이스 | |
Rabiner | Applications of speech recognition in the area of telecommunications | |
US6882973B1 (en) | Speech recognition system with barge-in capability | |
US5930336A (en) | Voice dialing server for branch exchange telephone systems | |
US20030191639A1 (en) | Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition | |
EP1170932B1 (en) | Audible identification of caller and callee for mobile communication device | |
US6788767B2 (en) | Apparatus and method for providing call return service | |
KR100467593B1 (ko) | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 | |
JP2003152856A (ja) | 通信端末装置、通信方法、およびそのプログラム | |
JP3597398B2 (ja) | 音声認識装置 | |
KR20080043035A (ko) | 음성 인식 기능을 갖는 이동 통신 단말 및 이를 이용한검색 방법 | |
US20040037399A1 (en) | System and method for transferring phone numbers during a voice call | |
JP2000137496A (ja) | 音声認識による電話番号検索方式およびシステム | |
JP2002252705A (ja) | 話者id検出方法及び装置 | |
KR100349675B1 (ko) | 음성인식시스템에서 인식시간을 이용한 부가정보 안내 방법 | |
KR200321190Y1 (ko) | 발신자 정보 음성 출력 장치 | |
CA2256781A1 (en) | Method and apparatus for automatically dialling a desired telephone number using speech commands | |
JPH10190842A (ja) | 音声対話システム | |
KR100251714B1 (ko) | 음성인식기능을갖는디지털휴대용전화기의등록음성재생및다이얼링방법 | |
KR100230972B1 (ko) | 전전자교환기의 화자종속 음성인식서비스 장치 및 방법 | |
KR20000018942A (ko) | 음성인식 디지털 휴대용 전화기에서 폰북 검색 방법 | |
Vysotsky | Progress in deployment and further development of the NYNEX VoiceDialing/sup SM/service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130514 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140523 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150522 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |