KR100264852B1 - Apparatus for recognizing a voice in a digital cellular telephone and method thereof - Google Patents

Apparatus for recognizing a voice in a digital cellular telephone and method thereof Download PDF

Info

Publication number
KR100264852B1
KR100264852B1 KR1019970030979A KR19970030979A KR100264852B1 KR 100264852 B1 KR100264852 B1 KR 100264852B1 KR 1019970030979 A KR1019970030979 A KR 1019970030979A KR 19970030979 A KR19970030979 A KR 19970030979A KR 100264852 B1 KR100264852 B1 KR 100264852B1
Authority
KR
South Korea
Prior art keywords
data
recognition
speech
voice
packet data
Prior art date
Application number
KR1019970030979A
Other languages
Korean (ko)
Other versions
KR19990008840A (en
Inventor
진서용
신장기
박정규
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970030979A priority Critical patent/KR100264852B1/en
Publication of KR19990008840A publication Critical patent/KR19990008840A/en
Application granted granted Critical
Publication of KR100264852B1 publication Critical patent/KR100264852B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges
    • H04M1/26Devices for signalling identity of wanted subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges
    • H04M1/60Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

PURPOSE: A method and a device for recognizing voice of a digital portable phone are provided to perform voice recognition using packet data outputted in a vocoder, so that an operation necessary for voice recognition can be simplified and loads on processors can be reduced. CONSTITUTION: Whether conversion into a voice recognition mode is detected is checked. After conversion into the voice recognition mode is performed, whether one of registration and recognition is selected is checked. If registration is checked, a vocoder(45) turns input voice for registration to packet data. A microprocessor(50) delivers the packet data to a voice recognition unit(65) and stores the packet data in a non-volatile memory(60) as playback voice data. And the microprocessor(50) receives specific data corresponding to the packet data from the voice recognition unit(65), and registers the received data in the non-volatile memory(60). If recognition is selected, the vocoder(45) turns input voice for recognition to packet data. The microprocessor(50) delivers the packet data to the voice recognition unit(65), and receives pre-registered specific data similar to the packet data from the voice recognition unit(65) and a difference value between the data, to alarm the success of the recognition according to the difference value.

Description

디지털 휴대용 전화기의 음성인식장치 및 방법 { APPARATUS FOR RECOGNIZING A VOICE IN A DIGITAL CELLULAR TELEPHONE AND METHOD THEREOF } Speech recognition apparatus and method for a digital portable telephone {APPARATUS FOR RECOGNIZING A VOICE IN A DIGITAL CELLULAR TELEPHONE AND METHOD THEREOF}

본 발명은 디지털 휴대용 전화기에 있어서 음성을 인식하는 장치 및 방법에 관한 것이다. The present invention relates to an apparatus and method for recognizing a voice in the digital portable telephone.

통상적으로 음성인식기능을 수행하기 위해서는 음성 자체를 입력하고, 그 입력된 음성신호로부터 주파수 특성과 같은 여러 가지 특징(feature)을 추출하는 신호처리를 수행한다. In order to normally perform the speech recognition input voice itself, and performs signal processing for extracting a number of features (feature), such as a frequency characteristic from the input speech signal. 이 경우 많은 양의 신호를 처리하여야 하므로 계산장치에 부하가 많이 주어진다. Since the case must handle a large amount of signal is given a lot of the computation load device. 그러므로 단말기에 사용하기는 부적합하다. Therefore, it is not suitable for use in the terminal. 단말기에서 음성인식기능을 수행하기 위하여 사용하는 방법의 한 예로서, 핸즈프리킷(hands-free kit)에서 음성인식기능을 수행하는 것이 있다. As an example of how to use in order to perform speech recognition on the device, and to perform the speech recognition function in a hands free kit (hands-free kit). 상기 핸즈프리킷에는 디지털신호처리기(Digital Signal Processor: 이하 DSP라 함.), 비휘발성 메모리[예: 플래쉬 메모리(flash memory), 이이피롬(EEPROM)]가 포함되어 있다. The hands-free kit includes a digital signal processor includes a (Digital Signal Processor:: DSP hereinafter referred to.), Non-volatile memory [a flash memory (flash memory), this pirom (EEPROM) for example]. 상기 DSP는 음성신호를 압축시킨 신호 혹은 원래의 음성신호를 처리하여 인식한 결과를 핸드폰에 넘겨준다. The DSP will hand over the results of the recognition process in which the original signal and a voice signal compressed voice signal to the mobile phone. 이렇게 되면 전화번호를 말하는 사용자의 음성이 핸즈프리킷에서 인식되고 그 인식된 내용을 전달받은 핸드??에서 해당 전화번호를 다이얼하게 된다. So when will dial the phone number on hand who speaks the user's voice in hands-free kit recognizes the telephone number and forwards the information recognized ??

도 1은 종래의 음성인식장치의 구성을 나타낸 것이다. 1 illustrates a configuration of a conventional voice recognition device. 도시된 바에 따르면, 마이크 30을 통해 입력된 아날로그 형태의 음성신호는 아날로그/디지털(analog to digital: 이하 A/D라 함.)변환부 20을 거쳐 디지털 형태의 펄스코드변조(Pulse Code Modulation: 이하 PCM이라 함.)신호로 변환된다. According to the illustrated bar, the audio signal of the analog input from the microphone 30 is analog / digital (analog to digital:. Hereinafter referred to as A / D D) conversion unit for through digital form of a pulse code modulation 20 (Pulse Code Modulation: less The term PCM.) is converted into a signal. 상기 PCM신호는 음성인식기능을 수행하는 프로세서 10에 전달된다. The PCM signal is then transmitted to the processor 10 to perform speech recognition. 상기 프로세서 10은 소정의 절차에 따라 음성인식을 위한 동작을 수행하는데, 예를 들어 80186 혹은 DSP 계열의 하드웨어가 있다. The processor 10 is for carrying out an operation for speech recognition according to a predetermined procedure, for example, a 80186 or DSP-based hardware.

그러나 상기와 같은 종래의 음성인식장치는 다음과 같은 문제점들을 가지고 있었다. However, the conventional speech recognition apparatus as described above had the following problems. 첫째, 전술한 바와 같이, 처리해야 할 데이터량이 방대하여 휴대용 전화기에 적용하기에는 어려움이 있다. First, it is difficult to, the amount of data to be processed is too great for portable telephones as described above. 둘째, 적절한 수행처리 속도가 보장되지 않으면 단말기의 동작을 방해하는 결점이 있다. Second, if appropriate perform the processing speed is not guaranteed and there is a defect that prevents the operation of the terminal. 셋째, 추가적인 메모리의 확보가 필수적이다. Thirdly, it is essential to ensure that the additional memory. 핸즈프리킷에 음성인식기술을 적용하기 위해서는 그 핸즈프리킷에 프로그래머블롬을 추가해야 한다. In order to apply speech recognition technology for hands-free kit, you need to add a programmable ROM in the hands-free kit. 넷째, 추가적인 프로세서, 즉 음성인식을 구현하기 위한 DSP의 추가가 불가피하다. Fourthly, the addition of the DSP is inevitable for implementing the additional processor, that the speech recognition. 다섯째, 음성인식장치를 핸즈프리킷에 실장할 경우 반드시 상기 핸즈프리킷을 통해야만 음성인식이 가능한 바, 단말기 단독으로는 음성 인식이 불가능하다는 단점이 있었다. Fifth, in the case of mounting the voice recognition device in the hands-free kit to be capable of bars, a terminal voice recognition go through the hands-free kit alone had the disadvantage that it is impossible, the speech recognition.

따라서 본 발명의 목적은 디지털 휴대용 전화기 고유의 하드웨어를 이용하여 구현한 디지털 휴대용 전화기의 음성인식장치 및 방법을 제공함에 있다. It is therefore an object of the present invention to provide a speech recognition apparatus and method for a digital portable telephone implemented using hardware specific to provide a digital portable telephone.

상기한 목적을 달성하기 위한 본 디지털 휴대용 전화기의 음성인식장치는 공지의 디지털 휴대용 전화기에 구비된 음성부호화기(vocoder)에서 출력되는 패킷(packet) 데이터를 이용하여 음성 인식을 하도록 구성함을 특징으로 한다. Speech recognition apparatus of the digital portable telephone for achieving the above object is characterized in that arranged to the speech recognition using a packet (packet) data output from the speech coder (vocoder) provided in the digital portable telephone of the known .

도 1은 종래의 음성인식장치의 구성을 나타낸 도면 1 is a diagram showing the configuration of a conventional voice recognition device

도 2는 본 발명의 실시 예에 따른, 음성인식장치를 갖는 디지털 휴대용 전화기의 구성을 나타낸 도면 Figure 2 is a diagram showing the configuration of a digital portable telephone having a voice recognition device, according to an embodiment of the present invention

도 3은 본 발명의 실시 예에 따른 메모리의 구성도 3 is a configuration of a memory according to an embodiment of the present invention;

도 4는 본 발명의 실시 예에 따른, 음성인식장치를 갖는 디지털 휴대용 전화기의 음성 인식 방법을 나타낸 흐름도 Figure 4 is a flow diagram illustrating a voice recognition method for a digital portable telephone having a voice recognition device, according to an embodiment of the present invention

이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. With reference to the accompanying drawings a preferred embodiment of the present invention will be described in detail. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. First, in addition as the reference numerals to components of each drawing, the same components hanhaeseoneun although shown in different drawings even if it should be noted that the so as to have the same reference numerals as much as possible. 또한 하기 설명에서는 구체적인 회로의 구성 소자 등과 같은 많은 특정(特定) 사항들이 나타나고 있는데, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들 없이도 본 발명이 실시될 수 있음은 이 기술 분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다. Further explaining there appears that details many specific (特定), such as components of a specific circuit, it that the present invention be only without these specific details provided can be carried out to assist the overall understanding of the present invention is the art in will be apparent to those skilled in the art. 그리고 본 발명을 설명함에 있어, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. And in the following description of the present invention, a detailed description of known functions and configurations that are determined to unnecessarily obscure the subject matter of the present invention, a detailed description thereof will be omitted.

도 2는 본 발명의 실시 예에 따른 디지털 휴대용 전화기의 음성인식장치의 구성을 나타낸 것으로, RF(radio frequency)부와 DTMF(dual tone multu frequency)부 등 본 발명의 요지와 직접적인 관련이 없는 부분에 대해서는 도시 및 설명을 생략한다. Figure 2 is a part does not have to be showing the configuration of a voice recognition device of a digital portable telephone according to an embodiment of the present invention, RF (radio frequency) directly related to the part and the DTMF (dual tone multu frequency) unit, such as the aspects of the present invention for illustration and description thereof will be omitted. 참조부호 100은 디지털 휴대용 전화기 부분을 나타낸다. Reference numeral 100 denotes a digital portable telephone section.

마이크 30을 통해 입력된 아날로그 형태의 음성신호는 A/D변환부 20을 거쳐 디지털 형태의 PCM신호로 변환된다. Audio signal of the analog input from the microphone 30 is through the A / D conversion section 20 convert PCM signals in digital form. 상기 PCM신호는 음성부호화기 45에 전달되고, 상기 음성부호화기 45는 상기 PCM신호를 압축하여 소정의 패킷데이터를 출력한다. The PCM signal is then passed to the speech encoder 45, the audio encoder 45 and outputs a predetermined packet data compresses the PCM signal. 상기 음성부호화기 45로는 예를 들어 CDMA방식 디지털 휴대용 전화기인 경우 8Kbps QCELP(Qualcomm Code Excited Linear Predictive coding), 13Kbps QCELP, 8Kbps EVRC(Enhanced Variable Rate Coding), GSM방식 디지털 휴대용 전화기인 경우 RPE-LTP(Regular Pulse Excitation with Long Term Prediction)방식의 것을 사용할 수 있다. The speech coder 45 roneun For example, if the CDMA scheme, the digital portable telephone 8Kbps QCELP (Qualcomm Code Excited Linear Predictive coding), 13Kbps QCELP, 8Kbps EVRC (Enhanced Variable Rate Coding), the case of GSM-type digital portable cellular phone RPE-LTP (Regular Pulse Excitation with Long Term Prediction) may be used in the method.

상기 음성부호화기 45에서 출력되는 패킷데이터는 디지털 휴대용 전화기의 전반적인 동작을 총괄적으로 제어하는 마이크로프로세서 50로 전달된다. The packet data output from the speech coder 45 is passed to a microprocessor 50 which collectively controls the overall operation of the digital portable telephone. 제1메모리 60은 비휘발성메모리로서, 디지털 휴대용 전화기의 전반적인 동작을 총괄적으로 제어하는 프로그램 및 초기 서비스 데이터를 저장한다. The first memory 60 is a nonvolatile memory, and stores a program and initial service data for controlling general operations of the digital portable telephone as a whole. 제2메모리 65는 램(RAM)으로서, 등록 혹은 인식을 위해 입력된 음성에 대한 패킷데이터를 일시적으로 저장하는 등 디지털 휴대용 전화기의 동작에 따른 각종 데이터를 일시적으로 저장한다. The second memory 65 stores the various data and the like according to the operation of the digital portable telephone to store the packet data for the input voice for registration or recognition as a random access memory (RAM) temporarily intermittently. 음성인식부 85는 임의의 음성에 대한 패킷데이터로부터 음성 인식시 사용되어지는 특성 데이터를 추출하여 출력한다. Speech recognition unit 85 and outputs the extracted characteristic data to be used for voice recognition from the data packet for any sound. 초(second)당 음성에 대한 특성데이터는 수 십 ∼ 수 백 바이트(byte)로 이루어지며, 주파수 특성, 신호의 크기, 크기 변화의 함수 등이다. Made of a second characteristic data is several tens to several hundred bytes (byte) of the voice per (second), the frequency characteristic, the signal, a function of the size change and the like. 상기 음성인식부 85는 하드웨어적 혹은 소프트웨어적으로 구현할 수 있다. The speech recognition unit 85 may be implemented in hardware or software. 상기 음성인식부 85가 소프트웨어적으로 구현된 것이면, 도시된 바와 같이 별도로 부가되지 않고 디지털 휴대용 전화기가 이미 구비하고 있던 상기 제1메모리 60에 저장될 수도 있다. The speech recognizer 85 may be stored in the first memory 60 is not as long as the software, added separately as shown implemented in a digital portable telephone that was already provided. 상기 마이크로프로세서 50은 공지의 디지털 휴대용 전화기의 동작을 제어함과 아울러 다음과 같은 음성인식제어 동작을 한다. The microprocessor 50 will control the speech recognition operation, such as addition and then controls the operation of the digital portable cellular phone known in the art. 우선, 음성부호화기 45에서 출력되는 패킷데이터를 상기 음성인식부 85로 전달한다. First, a transmission packet data output from the vocoder 45 to the voice recognition unit 85. 또한 상기 음성인식부 85에서 출력되는 특성 데이터 및 그 차이값에 따른 동작(예: 다이얼링)이 이루어지도록 제어한다. In addition, operation (such as dialing) in accordance with the characteristic data and the difference value output from the speech recognizer 85 is controlled to take place. 상기 차이는 미리 등록된 어떤 특성데이터와 인식을 위해 입력된 음성의 패킷데이터로부터 추출한 특성데이터 사이의 차이를 말하며, 상관함수로써 정의된다. The difference refers to the difference between the extracted characteristic data from which characteristic data and the packet data of the audio input for the pre-registered recognition, is defined as the correlation function. 또한 상기 마이크로프로세서 50은 사용자의 음성이 상기 음성부호화기 45에서 패킷데이터화 하면 이를 제1메모리 60의 특정 영역에 저장되게 함으로써 음성 인식을 완료한 후 그 완료 사실을 사용자에게 알릴 때 읽어내어 사용한다. In addition, the microprocessor 50 uses read out when the user's voice to notify the completion of the fact After completion of the speech recognition by the packet if it ingested by the speech encoder 45 to be stored in a specified area of ​​the first memory 60 to the user. 이렇게 읽혀진 음성데이터를 이해 및 설명의 편의상, 이하 재생(playback)음성데이터라 한다. For purposes of illustration, the following reproduction (playback) of the understanding and describe the thus read voice data is called sound data. 상기 음성부호화기 45는 상기 재생데이터를 PCM신호로 변환하여 디지털/아날로그(digital to analog: 이하 D/A라 함.)변환부 75로 전달한다. The speech encoder 45 is a digital / analog converts the reproduction data into the PCM signal (digital to analog:. Hereinafter referred to as D / A) is transmitted to the conversion unit 75. 상기 D/A변환부 75로 입력된 PCM신호는 아날로그 형태로 변환된 다음, 스피커 80을 통해 증폭되어 가청음으로 출력된다. The PCM signal input to the D / A converter 75 is amplified by the conversion to analog form, and then, the speaker 80 is output as audible sound. 상기와 같이 재생음성데이터를 사용하지 않고, 음성 인식 완료를 알리는 안내메시지를 별도로 만들어 저장해놓을 수도 있다. Without using the reproduced audio data as described above, it may be released to save the information message notifying a completion of speech recognition made separately. 핸즈프리킷 연결부 70은 공지의 핸즈프리킷과 단말기의 연결 및 그때 핸즈프리킷 마이크를 통해서 입력된 음성을 상기 A/D변환부 20을 통해 디지털화하여 음성부호화기 45로 전달하는 역할을 한다. A hands-free kit connector 70 serves to deliver to the speech coder 45 digitizes the voice input through the hands-free kit is connected and then a microphone of a known hands-free kit and the handset via the A / D converter 20.

도 3은 본 발명의 실시 예에 따른 제1메모리의 구성을 개략적으로 나타낸 도면이다. 3 is a view schematically showing the construction of the first memory according to an embodiment of the invention. 제어프로그램, 특성 데이터, 재생음성데이터, 전화번호, 안내메시지를 저장하는 영역 및 예비영역으로 구성된다. And a control program, characteristic data, reproduction audio data, telephone number, area and the spare area for storing the information message. 참조부호 ADD는 마이크로프로세서 50에서 각 경우에 적절하게 발생하는 어드레스를 나타낸다. Reference numeral ADD represents the address to properly generated in each case from the microprocessor 50.

도 4는 본 발명의 실시 예에 따른, 음성인식장치를 갖는 디지털 휴대용 전화기의 음성 등록 및 인식 처리 방법을 나타낸 흐름도 이다. Figure 4 is a flow chart illustrating a speech enrollment and recognition processing method for a digital portable telephone having a voice recognition device, according to an embodiment of the invention. 사용자가 음성의 등록 혹은 전화를 걸기(이는 인식처리에 해당함.)위해 예를 들어 어떤 이름을 말한다고 가정한다. User to make a call or register in the voice assumed speak a name, for example, in order (which corresponds to the recognition process.).

사용자가 어떤 이름을 말하기에 앞서 대기상태인 디지털 휴대용 전화기의 특정 키를 입력하면 마이크로프로세서 50은 a단계에서 이를 감지하고, 음성인식모드로 진입한다. When a user enters a particular key on the digital portable phone it is idle before speaking any names microprocessor 50 detects it in step a, and then enters the voice recognition mode. 그리고 b단계에서 소정 키의 입력을 체크하거나 기타 다른 상태 변화를 체크함으로써 사용자가 등록 혹은 인식중 어느 것을 원하는지 체크한다. And by checking the input of a predetermined key, or check for other state changes in step b, the user wants to check which of the registration or recognition. 상기 체크결과 등록을 원하는 것으로 판단되면 c단계에서 상기 사용자의 음성에 대응하여 음성부호화기 45에서 출력하는 유효한 패킷데이터가 입력되는지 체크한다. If it is determined that the desired result of the check register in step c corresponding to the voice of the user and checks whether the input is a valid packet data output from the vocoder 45. 상기 체크결과 입력되는 유효한 패킷데이터가 있으면, d단계에서 이를 음성인식부 85로 전달한다. If a valid packet data input to the check result, and transmits it to the speech recognition unit in step d 85. 그리고 e단계에서 상기 패킷데이터를 제1메모리 60의 해당 영역에 재생음성데이터로서 저장한다. And it stores the packet data as a reproduced audio data in the corresponding area of ​​the first memory 60 in step e. 이후 f단계로 진행하여 상기 음성인식부 85로부터 해당 음성에 대한 특성데이터가 입력되는지 체크하여, 입력되면 그 특성데이터를 제1메모리 60의 해당 영역에 저장한다. After the check that the characteristic data is input to the audio proceeds to step f from the speech recognition unit 85, when the input and stores the characteristic data in the area of ​​the first memory 60. 상기 e단계와 f단계는 순서가 바뀔 수도 있고 병행하여 처리 가능하다. Wherein step e and step f may be treated to be reversed, the order and combination.

상기 b단계에서의 체크결과 인식을 원하는 것으로 판단되면 h단계에서 상기 사용자의 음성에 대응하여 음성부호화기 45에서 출력하는 유효한 패킷데이터가 입력되는지 체크한다. If it is determined that the desired result of the check recognition in the step b is checked whether the step h in response to the user's voice input is a valid packet data output from the vocoder 45. 상기 체크결과 입력되는 유효한 패킷데이터가 있으면, i단계에서 이를 음성인식부 85로 전달한다. If a valid packet data input to the check result, and transmits in step i it to the speech recognition unit 85. 이후 j단계에서 상기 음성인식부 85로부터 특성데이터가 입력되는지를 체크하여 제2메모리 65에 저장한다. Since in the step j it is stored in the second memory 65 to check whether the characteristic data has been received from the voice recognition unit 85. 유사한 특성데이터 인덱스와 차이값이 입력되는지 체크한다. It is checked whether the difference value between the input data and similar characteristics index. 상기 유사한 특성데이터 인덱스는 이미 등록되어 있는 특성데이터중 현재의 입력 음성과 유사한 특성데이터가 가지는 메모리내에서의 인덱스를 의미하며, 상기 차이값은 그 두 특성데이터의 차이에 해당하는 값이다. The data indexes are similar properties characteristic of the data that is already registered in the memory means the index of the current characteristic data similar to the input speech in the with and the difference value is a value corresponding to the difference between the two characteristic data. 상기 j단계에서 유사한 특성데이터 인덱스와 차이값이 입력되면 k단계에서 상기 차이값이 미리 정한 임계치보다 작은지 여부를 판단한다. If the difference between the input value and the similar properties in the index data j step determines whether the difference value is less than a threshold determined in advance in the step k. 상기 판단결과 임계치보다 작으면 해당 인식이 올바른 것으로 판단하고 l단계로 진행하여 해당 특성데이터 인덱스에 대응하는 재생음성데이터를 송출하고, 옳지 않은 것이면 m단계로 진행하여 미등록 음성임을 알리는 메시지를 제1메모리 60으로부터 읽어 음성부호화기 45로 전달한다. The determination result is less than a threshold value a message corresponding recognition indicating that the judgment to be correct, and the process proceeds to l step goes to as long as m steps and transmits the reproduced audio data corresponding to the attribute data index, not true unregistered voice first memory reading from 60 and passed to the speech encoder 45. 이렇게 되면 상기 음성부호화기 45는 상기 제1메모리 60으로부터 읽어낸 메시지를 처리하여 D/A변환부 75로 전달하게 되고, 상기 메시지는 아날로그 형태로 변환되어 스피커 80을 통해 가청 상태로 출력된다. So if the speech encoder 45 is passed to the D / A conversion unit 75 to process the message has been read out from the first memory 60, the message is converted to analog form and output to the speaker 80 through the audio state.

아울러, 등록시 입력 음성에 대응하는 전화번호를 제1메모리 60에 등록시켜 놓음으로써 인식의 성공시 상기 등록되어 있는 전화번호를 읽어내 DTMF발생부(도시하지 않음.)에 전달해 다이알링되도록 할 수 있다. In addition, delivering the phone number corresponding to the registration input speech in the first entry in the memory 60 by placing them read the phone number, which is the registration of the recognition success DTMF generating unit (not shown) may be such that dial ring .

전술한 j단계에서 특성데이터 인덱스 및 차이값의 쌍은 하나 이상 제공될 수 있는데, 이는 신뢰도 측면을 고려한 것이고 최종적인 선택은 그들중 차이값이 가장 작은 것으로 한다. There pair of attribute data and the index difference in the above step j can be more than one service, which will consider the reliability aspects final selection should be the smallest value of the difference of them.

한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도내에서 여러가지 변형이 가능함은 물론이다. While the invention has been shown and described with reference to certain preferred embodiments thereof, various modifications are possible within the limits that do not depart from the scope of the invention. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 않되며 후술하는 특허청구의 범위뿐 만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다. While the invention has been limited to the described embodiments it is not jeonghaejyeoseo and should as well as the claims, which will be described later defined by the scope of the appended claims and their equivalents.

상술한 바와 같은 본 발명은 음성부호화기에서 이미 처리된 신호를 이용하므로 간단한 연산만으로도 음성 인식이 가능하다. The present invention as described above is capable of speech recognition with a simple operation, so use of the already processed signals from the speech encoder. 다시 말해서, 고유의 디지털 휴대용 전화기가 구비하고 있는 음성부호화기, 메모리 등을 이용하여 음성 인식을 하므로 그로 인한 가격 상승이나 단말기 크기의 증가 등을 야기시키지 않는 장점이 있다. In other words, there is by using a unique digital portable telephone with voice encoder that includes a memory, so the speech recognition does not cause such an increase in prices and terminal size consequent advantages.

Claims (13)

  1. 통화 음성의 압축을 위해 음성부호화기를 구비하고 있는 디지털 휴대용 전화기에 있어서, A digital portable telephone which includes a speech coder for compression of the voice call,
    상기 음성부호화기에서 출력되는 패킷데이터로부터 소정의 특성데이터를 추출하는 수단과, It means for extracting a predetermined feature data from the packet data output from the speech coder and,
    등록모드에서는 상기 추출된 특성데이터를 등록하고, 인식모드에서는 상기 추출된 특성데이터를 미리 등록된 특성데이터와 비교하여 유사한 특성데이터가 존재하면 인식에 성공한 것으로 판단하는 수단으로 구성됨을 특징으로 하는 음성인식장치. Registration mode, registering the characteristic data, the extraction and recognition mode, the speech recognition as if similar properties as compared to the extracted registered in advance the attribute data attribute data file is present, the consists of means for determining a successful recognition feature Device.
  2. 마이크로부터 입력되는 소정의 음성에 대한 패킷데이터를 출력하는 음성부호화기와, 디지털 휴대용 전화기 고유의 동작을 제어하는 마이크로프로세서를 구비한 디지털 휴대용 전화기에 있어서, In a digital portable telephone comprising a microprocessor for controlling a speech encoder and a digital portable telephone unique operations of outputting a data packet for a predetermined audio input from the microphone,
    패킷데이터 및 그에 대응하는 특성데이터를 저장하는 비휘발성메모리와, And nonvolatile memory for storing the packet data and feature data corresponding thereto,
    등록 혹은 인식모드를 선택하기 위한 사용자인터페이스 수단과, User interface means for selecting the registration or recognition mode;
    등록 및 인식모드에서는 상기 음성부호화기에서 출력되는 패킷데이터를 전달받아 소정의 계산을 통하여 음성 인식에 필요한 특성데이터를 검출하고, 인식모드에서는 상기 검출된 특성데이터를 상기 비휘발성메모리에 저장된 특성데이터들과 비교하여 유사한 특성데이터와 그 차이값을 찾는 음성인식부와, Registration and recognition mode by receiving the packet data output from the speech coder detects the characteristic data required for the speech recognition through a predetermined calculation, the recognition mode, and the characteristic data stored in the detected characteristic data in said non-volatile memory and a speech recognition unit to find the similar feature data and a difference value by comparing,
    등록모드에서는 상기 음성부호화기에서 출력되는 패킷데이터와 상기 음성인식부에서 검출된 상기 패킷데이터에 대응되는 특성데이터를 상기 비휘발성메모리에 함께 저장하며, 인식모드에서는 상기 음성인식부로부터 특성데이터의 인덱스와 차이값을 입력하여 그 차이값에 따라 인식의 성공 여부를 판단하는 상기 마이크로프로세서로 구성됨을 특징으로 하는 음성인식장치. In the registration mode, the index of the said packet data and an attribute data corresponding to the packet data detected by the speech recognition unit to be output from the speech coder stored together in the non-volatile memory and, in the recognition mode properties from the speech recognition unit data and the voice recognition device characterized by consisting of a microprocessor to the input a difference value for determining the success or failure of recognition in accordance with the difference value.
  3. 제2항에 있어서, 3. The method of claim 2,
    핸즈프리킷의 마이크로부터 입력되는 음성을 상기 음성부호화기로 전달하기 위한 핸즈프리킷 연결부를 더 구비하며, 핸즈프리킷 연결시 상기 전화기의 마이크를 통한 음성 입력 경로를 차단함을 특징으로 하는 음성인식장치. Further comprising a hands-free kit connector for transferring a voice inputted from the microphone of the hands-free kit to the vocoder, a hands-free kit is connected to a speech recognition apparatus characterized in that it blocks the voice input path through the microphone of the telephone.
  4. 제3항에 있어서, 4. The method of claim 3,
    디지털 휴대용 전화기의 마이크 혹은 핸즈프리킷의 마이크로부터 입력되는 아날로그 음성을 디지털화하여 상기 음성부호화기로 전달하기 위한 아나로그/디지털변환부와, And a digital portable telephone or the microphone and digitizes the analog audio input from the microphone of the hands-free kit, the analog / digital converter to deliver to the speech coder unit,
    상기 음성부호화기에서 출력되는 디지털 데이터를 아날로그화하여 스피커로 전달하기 위한 디지털/아날로그변환부를 더 가짐을 특징으로 하는 음성인식장치. Speech recognition apparatus characterized by further having parts of the digital / analog converter for delivering the speakers to screen analog to digital data output from the speech coder.
  5. 제2항에 있어서, 3. The method of claim 2,
    이중음다중주파수발생부를 더 구비하고, Further comprising a dual-tone multi-frequency occurs,
    상기 비휘발성메모리는 소정 음성의 패킷데이터에 대응되는 전화번호데이터를 저장하며, 상기 마이크로프로세서는 음성 인식 성공을 감지하면 상기 전화번호데이터를 상기 이중음다중주파수발생부에 전달하여 다이알링을 하도록 제어함을 특징으로 하는 음성인식장치. The non-volatile memory is predetermined, and stores the voice telephone number data corresponding to the packet data, the microprocessor is controlled to the dial ring to transfer the telephone number data when it detects a successful speech recognition to said dual-tone multi-frequency generator a voice recognition device, characterized in that the.
  6. 제2항에 있어서, 상기 마이크로프로세서가, The method of claim 2, wherein the microprocessor,
    상기 특성데이터의 인덱스에 대응하는, 상기 비휘발성메모리에 저장된 재생음성용 패킷데이터를 읽어 상기 음성부호화기로 전달함으로써 스피커를 통해 입력 음성이 다시 재생되도록 제어함을 특징으로 하는 음성인식장치. A voice recognition device, characterized in that the control such that for the index of the property data, to read the reproduced data packet for an audio stored in the nonvolatile memory, the input speech is played back through a speaker by transmitting to the voice encoder.
  7. 제2항에 있어서, 상기 마이크로프로세서가, The method of claim 2, wherein the microprocessor,
    상기 비휘발성메모리에 미리 저장된 음성인식 성공 혹은 실패 안내메시지 데이터를 읽어 상기 음성부호화기로 전달하여 상기 스피커를 통해 음성인식 성공 혹은 실패 안내메시지가 출력되도록 제어함을 특징으로 하는 음성인식장치. A voice recognition device, characterized by reading the speech recognition success or failure information message data stored in the nonvolatile memory to transfer to the speech coder output is also controlled so that the speech recognition success or failure information message through the speaker.
  8. 통화 음성의 압축을 위해 음성부호화기를 내장하고 있는 디지털 휴대용 전화기의 음성 인식 방법에 있어서, In the speech recognition method of the digital portable telephone with a built-in speech encoder for the compression of voice calls,
    음성인식모드로의 전환이 감지되는지 체크하는 제1과정과, And the first step of checking whether the transition is detected in the voice recognition mode,
    상기 음성인식모드로의 전환후 등록 혹은 인식중 하나가 선택되는지 체크하는 제2과정과, A second step of checking whether one of the registration or recognition is selected after switching to the speech recognition mode;
    상기 제2과정에서 등록 선택시, 등록을 위한 입력 음성을 상기 음성부호화기가 패킷데이터화 하여 음성인식부로 전달하고 비휘발성메모리에 재생음성데이터로서 저장한 다음, 상기 음성인식부로부터 상기 패킷데이터에 대응하는 특성데이터를 수신하여 상기 비휘발성메모리에 등록시키는 제3과정과, Wherein the input speech to register selected, the registration at the second step, a speech coder in a packet ingestion that delivered to the voice recognition and corresponding to the packet data from the next, the speech recognition unit stored as the reproduction audio data in non-volatile memory receiving the characteristic data and the third process of registration in the non-volatile memory,
    상기 제2과정에서 인식 선택시, 인식을 위한 입력 음성을 상기 음성부호화기가 패킷데이터화 하여 음성인식부로 전달한 다음, 상기 음성인식부로부터 상기 패킷데이터와 유사한 미리 등록된 특성데이터 및 그 차이값을 수신하고, 상기 차이값에 따라 인식의 성공 여부를 경보하는 제4과정으로 이루어짐을 특징으로 하는 방법. And wherein upon recognition selected from the second process, the input voice for recognition speech encoder packet ingestion receives from the pass portion speech recognition, and then, the speech recognition unit the previously registered feature data and a difference value that is similar to the packet data , characterized in a fourth constituted by any process of the success or failure of alarm recognition in accordance with the difference value.
  9. 제8항에 있어서, The method of claim 8,
    상기 제3과정에서 상기 입력 음성에 대응하는 전화번호를 상기 비휘발성메모리에 등록시키는 제3-1과정과, In the third process and the process of claim 3-1 registered in the nonvolatile memory the telephone number corresponding to the input speech,
    상기 제4과정에서 인식의 성공시 상기 비휘발성메모리에 등록되어 있는 전화번호를 다이알링하는 제5과정을 더 포함함을 특징으로 하는 방법. Characterized in further comprising a fifth step of the ring dial a telephone number registered in the nonvolatile memory when the success of the recognition in the fourth step.
  10. 제8항에 있어서, The method of claim 8,
    상기 제4과정에서 인식에 실패하면 전화기 고유의 대기모드로 전환하는 제6과정을 더 포함함을 특징으로 하는 방법. If the recognition process in the fourth failure characterized in further comprising a sixth step of switching to the standby mode, the phone's unique.
  11. 제3항에 있어서, 4. The method of claim 3,
    이중음다중주파수발생부를 더 구비하고, Further comprising a dual-tone multi-frequency occurs,
    상기 비휘발성메모리는 소정 음성의 패킷데이터에 대응되는 전화번호데이터를 저장하며, 상기 마이크로프로세서는 음성 인식 성공을 감지하면 상기 전화번호데이터를 상기 이중음다중주파수발생부에 전달하여 다이알링을 하도록 제어함을 특징으로 하는 음성인식장치. The non-volatile memory is predetermined, and stores the voice telephone number data corresponding to the packet data, the microprocessor is controlled to the dial ring to transfer the telephone number data when it detects a successful speech recognition to said dual-tone multi-frequency generator a voice recognition device, characterized in that the.
  12. 제3항에 있어서, 상기 마이크로프로세서가, The method of claim 3, wherein the microprocessor,
    상기 특성데이터의 인덱스에 대응하는, 상기 비휘발성메모리에 저장된 재생음성용 패킷데이터를 읽어 상기 음성부호화기로 전달함으로써 스피커를 통해 입력 음성이 다시 재생되도록 제어함을 특징으로 하는 음성인식장치. A voice recognition device, characterized in that the control such that for the index of the property data, to read the reproduced data packet for an audio stored in the nonvolatile memory, the input speech is played back through a speaker by transmitting to the voice encoder.
  13. 마이크를 통해 입력되는 소정의 음성에 대한 패킷데이터를 출력하는 음성부호화기를 구비한 디지털 휴대용 전화기에 있어서, In a digital portable telephone having a voice encoder that outputs the packet data to the predetermined audio input through a microphone,
    패킷데이터 및 그에 대응하는 특성데이터를 저장하는 비휘발성메모리와, And nonvolatile memory for storing the packet data and feature data corresponding thereto,
    등록 혹은 인식모드를 선택하기 위한 사용자인터페이스 수단과, User interface means for selecting the registration or recognition mode;
    등록 및 인식모드에서는 상기 음성부호화기에서 출력되는 패킷데이터를 전달받아 소정의 계산을 통하여 음성 인식에 필요한 특성데이터를 검출하고, 인식모드에서는 상기 검출된 특성데이터를 상기 비휘발성메모리에 저장된 특성데이터들과 비교하여 유사한 특성데이터를 찾는 음성인식부와, Registration and recognition mode by receiving the packet data output from the speech coder detects the characteristic data required for the speech recognition through a predetermined calculation, the recognition mode, and the characteristic data stored in the detected characteristic data in said non-volatile memory and a speech recognizer to find similar data characteristics as compared,
    등록모드에서는 상기 음성부호화기에서 출력되는 패킷데이터와 상기 음성인식부에서 검출된 상기 패킷데이터에 대응되는 특성데이터를 상기 비휘발성메모리에 함께 저장하고, 인식모드에서는 상기 음성인식부에서 찾은 유사한 특성데이터가 소정 오차 범위 내에 속하는지 여부에 따라 그 인식의 성공 여부를 판단하는 수단으로 구성됨을 특징으로 하는 음성인식장치. In the registration mode stored with the attribute data corresponding to the packet data and the packet data detected by the speech recognizer output from the vocoder in the non-volatile memory and, in the recognition mode similar characteristics data found in the speech recognition unit is a voice recognition device, characterized by a means adapted to determine the success of recognition according to whether or not fall within the predetermined error range.
KR1019970030979A 1997-07-04 1997-07-04 Apparatus for recognizing a voice in a digital cellular telephone and method thereof KR100264852B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970030979A KR100264852B1 (en) 1997-07-04 1997-07-04 Apparatus for recognizing a voice in a digital cellular telephone and method thereof

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
KR1019970030979A KR100264852B1 (en) 1997-07-04 1997-07-04 Apparatus for recognizing a voice in a digital cellular telephone and method thereof
PE00059698A PE102499A1 (en) 1997-07-04 1998-07-03 Digital cell phone with voice recognition function and method for controlling the function
EP19980932605 EP0993673A1 (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling the same
CNB988068443A CN1175397C (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling same
AU82446/98A AU733849B2 (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling the same
JP50693599A JP2002507292A (en) 1997-07-04 1998-07-04 Digital portable phone and a control method thereof provided with a speech recognition function
PCT/KR1998/000195 WO1999001865A1 (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling the same
CA 2295727 CA2295727A1 (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling the same
RU99128050A RU2199822C2 (en) 1997-07-04 1998-07-04 Cellular digital telephone set incorporating voice identifying function and method for its control
BR9810670A BR9810670A (en) 1997-07-04 1998-07-04 Digital cellular phone having a voice coficador, and voice recognition processes in a digital mobile phone having a memory and a vocoder and to control a cell phone with a voice recognition function.
IL13384298A IL133842A (en) 1997-07-04 1998-07-04 Digital cellular phone with voice recognition function and method for controlling the same

Publications (2)

Publication Number Publication Date
KR19990008840A KR19990008840A (en) 1999-02-05
KR100264852B1 true KR100264852B1 (en) 2000-09-01

Family

ID=19513374

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970030979A KR100264852B1 (en) 1997-07-04 1997-07-04 Apparatus for recognizing a voice in a digital cellular telephone and method thereof

Country Status (11)

Country Link
EP (1) EP0993673A1 (en)
JP (1) JP2002507292A (en)
KR (1) KR100264852B1 (en)
CN (1) CN1175397C (en)
AU (1) AU733849B2 (en)
BR (1) BR9810670A (en)
CA (1) CA2295727A1 (en)
IL (1) IL133842A (en)
PE (1) PE102499A1 (en)
RU (1) RU2199822C2 (en)
WO (1) WO1999001865A1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1119158A1 (en) * 1999-07-28 2001-07-25 Mitsubishi Denki Kabushiki Kaisha Cellular phone
US6339706B1 (en) 1999-11-12 2002-01-15 Telefonaktiebolaget L M Ericsson (Publ) Wireless voice-activated remote control device
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
JP2004287674A (en) 2003-03-20 2004-10-14 Nec Corp Information processing apparatus, unauthorized use prevention method, and program
KR100547858B1 (en) 2003-07-07 2006-01-31 삼성전자주식회사 A mobile communication terminal and method capable of character input using the voice recognition function
CN100555412C (en) 2004-09-09 2009-10-28 上海优浪信息科技股份有限公司 Speech key of mobile
CN100547655C (en) 2004-09-09 2009-10-07 上海优浪信息科技股份有限公司 Speech lock
CN105391873A (en) * 2015-11-25 2016-03-09 上海新储集成电路有限公司 Method for realizing local voice recognition in mobile device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450525A (en) * 1992-11-12 1995-09-12 Russell; Donald P. Vehicle accessory control with manual and voice response
DE69625793T2 (en) * 1995-09-29 2003-10-02 At & T Corp Telephone network service for converting language in elected tones

Also Published As

Publication number Publication date
EP0993673A1 (en) 2000-04-19
AU8244698A (en) 1999-01-25
KR19990008840A (en) 1999-02-05
JP2002507292A (en) 2002-03-05
IL133842A (en) 2004-07-25
CN1175397C (en) 2004-11-10
BR9810670A (en) 2000-09-26
AU733849B2 (en) 2001-05-31
RU2199822C2 (en) 2003-02-27
IL133842D0 (en) 2001-04-30
CN1272198A (en) 2000-11-01
PE102499A1 (en) 1999-12-29
WO1999001865A1 (en) 1999-01-14
CA2295727A1 (en) 1999-01-14

Similar Documents

Publication Publication Date Title
KR0135777B1 (en) Selecting calling phone
US7551900B2 (en) Apparatus and method for transmitting call holding message in mobile communication terminal
US5054053A (en) Speech recognition system for telephony
CN1170452C (en) Mobile communication terminal device and method for identifying input call thereof
AU760601B2 (en) Voice activated mobile telephone call answerer
US20050125235A1 (en) Method and apparatus for using earcons in mobile communication devices
US5651056A (en) Apparatus and methods for conveying telephone numbers and other information via communication devices
CA2362053C (en) Voice recognition user interface for telephone handsets
CA2019319C (en) Voice recognition dialing unit
US20070112571A1 (en) Speech recognition at a mobile terminal
JP5701916B2 (en) Method and system for writing a telephone conversation into text
EP0319210A2 (en) Radio telephone apparatus
US6519479B1 (en) Spoken user interface for speech-enabled devices
US20070225049A1 (en) Voice controlled push to talk system
KR20010101814A (en) Communication protocol between a communication device and an external accessory
KR920001542B1 (en) Automatic answering method for a vehicle radio-telephone and device therefor
JP2003511914A (en) Method and apparatus for supplying information signals based on speech recognition
US6493670B1 (en) Method and apparatus for transmitting DTMF signals employing local speech recognition
JP2007529916A (en) Voice communication with a computer
JP2003198713A (en) Hands-free system for vehicle
RU2200369C2 (en) Telephone set incorporating voice-activated dialing function for cellular communications
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
EP0739121A2 (en) Voice activated telephone
CN1345510A (en) System and method for creating digit string for use by portable phone
JP3225918B2 (en) The mobile terminal device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130530

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20150528

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee