KR20010000595A - Mobile phone controlled by interactive speech and control method thereof - Google Patents

Mobile phone controlled by interactive speech and control method thereof Download PDF

Info

Publication number
KR20010000595A
KR20010000595A KR1020000059131A KR20000059131A KR20010000595A KR 20010000595 A KR20010000595 A KR 20010000595A KR 1020000059131 A KR1020000059131 A KR 1020000059131A KR 20000059131 A KR20000059131 A KR 20000059131A KR 20010000595 A KR20010000595 A KR 20010000595A
Authority
KR
South Korea
Prior art keywords
voice
user
name
input
terminal
Prior art date
Application number
KR1020000059131A
Other languages
Korean (ko)
Inventor
김진영
엄기완
신문옥
Original Assignee
신문옥
주식회사 엑트밸리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신문옥, 주식회사 엑트밸리 filed Critical 신문옥
Priority to KR1020000059131A priority Critical patent/KR20010000595A/en
Publication of KR20010000595A publication Critical patent/KR20010000595A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Abstract

PURPOSE: A method for controlling a mobile telephone terminal capable of interactive voice control, is provided to select and control each menu of the mobile telephone terminal through interaction between a user and the terminal without searching the menu through key input each time. CONSTITUTION: Whether to select a registration mode or a dialing mode is asked to a user. If the user selects the registration mode for registering the name of a receiver and a telephone number, a voice announcement is performed to request a voice input of the name of a telephone number registration object. If the name of the object is inputted in a voice, voice data compressed and encoded in a codec and a vocoder are stored in a memory for play in voice dialing. A terminal voice-announces a request for inputting the name of the telephone number registration object with text. The user inputs the name of the telephone number registration object with text. A controller generates a voice recognition model by using the inputted text data, and voice-announces the input of the telephone number for the object in a voice. If the user inputs the telephone number of the registration object in a voice, the inputted telephone number is voice-recognized with numerical tones and stored in the memory for voice dialing. Whether to end the registration is asked. If the user selects ending, the registration is ended. If the user selects continuous registration, the step requesting a voice input of the name of a telephone number registration object is returned.

Description

대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법{MOBILE PHONE CONTROLLED BY INTERACTIVE SPEECH AND CONTROL METHOD THEREOF}Mobile phone terminal with interactive voice control and control method {MOBILE PHONE CONTROLLED BY INTERACTIVE SPEECH AND CONTROL METHOD THEREOF}

본 발명은 화자독립 가변어휘 음성인식기와 음성합성기를 이용한 대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법에 관한 것으로, 더 상세하게는 메뉴선택 등의 각 기능을 사용자와 단말기간의 음성 입, 출력으로 선택하고 제어할 수 있는 이동전화단말기 및 그 제어 방법에 관한 것이다.The present invention relates to a mobile phone terminal capable of interactive voice control using a speaker-independent variable vocabulary speech recognizer and a voice synthesizer and a control method thereof, and more specifically, to each function such as menu selection by voice input and output between a user and a terminal. The present invention relates to a mobile telephone terminal capable of selecting and controlling the same and a control method thereof.

도1은 일반적인 이동전화단말기에서 사용자가 메뉴 방식으로 제어하도록 되어 있는 이동전화단말기의 제어 항목을 예시적으로 도시한 것이다.FIG. 1 exemplarily illustrates a control item of a mobile phone terminal in which a user controls the menu method in a general mobile phone terminal.

종래 보급 되어온 이동전화단말기는 사용자가 필요에 따라 선택하여 사용할 수 있도록 다양한 기능을 제공하고 있는데, 이러한 기능을 선택, 제어하기 위해 키패드(keypad) 입력방식을 사용하고 있다. 예를 들어, 사용자가 전화번호를 검색하기 위해서는 개인정보관리와 관련된 키패드를 클릭하고 그 다음 전화부 등록 키패드를 클릭 그리고 최종적으로 전화부검색과 관련된 키패드를 클릭함으로써 가능하게된다. 그러나 이러한 키패드 입력방식은 상위메뉴에서 하부메뉴로 거치는 탑-다운(Top-Down)방식을 채택함으로 해서, 한가지 기능을 선택하기 위해서도 몇 번의 키패드 입력을 거쳐야 하는 경우가 있으므로 사용자로 하여금 매우 불편함을 주는 실정이다.Conventionally, mobile phone terminals have been provided with various functions for users to select and use according to their needs. In order to select and control these functions, a keypad input method is used. For example, a user can search for a phone number by clicking on a keypad associated with personal information management, then clicking on a phone book registration keypad and finally clicking on a keypad related to phone book search. However, the keypad input method adopts the Top-Down method, which goes from the upper menu to the lower menu, so that it is very inconvenient for the user because there are times when several keypad inputs are required to select one function. The state is real.

특히, 운전이나 보행에 의한 이동중에 키패드 입력을 할 경우 단말기의 사용이 용이하지 못하고, 단말기를 제어하기 위하여 전방에서 눈을 뗄 경우 안전사고를 유발할 수 있는 점도 종래 키패드 입력방식의 단말기가 갖는 큰 문제점이다.In particular, the keypad is not easy to use when the keypad is input while driving or walking, and it may cause a safety accident when you take your eyes off the front to control the terminal. to be.

뿐만아니라, 종래 이동전화단말기가 특정 기능을 선택, 제어하기 위해서 액정표시(LCD; Liquid Crystal Display, 이하 엘씨디라 칭함)창에 메뉴를 표시(display)해 주고 사용자가 해당 메뉴를 선택하도록 하는 방식을 취하고 있다. 그러므로, 최종적으로 선택하고자 하는 기능이 어떤 메뉴에 있는지 알고 있어야 하므로 사용자가 단말기의 사용설명서를 숙지하고 있지 않는 이상 매우 번거롭고 불편함을 느끼게 된다. 더구나 이러한 메뉴들이 오직 엘씨디 창에서만 텍스트로 표시됨으로 인해, 저 시력자 또는 단말기를 근 거리에서 볼 수 없는 상황에서는 실질적으로 제어가 불가능하다고 할 수 있다.In addition, in order to select and control a specific function, a conventional mobile phone terminal displays a menu on a liquid crystal display (LCD) window and allows a user to select the menu. Getting drunk. Therefore, it is necessary to know in which menu the function to be finally selected, so the user feels very troublesome and inconvenient unless the user is familiar with the user's manual. In addition, since these menus are displayed as text only in the LCD window, it is practically impossible to control in a situation where a low vision person or a terminal cannot be seen at a close range.

종래, 일부 이동전화단말기에는 음성인식 방법이 일부 적용되어 왔으나, 여기에 적용되어온 음성인식 방법은 다이나믹 타임 워핑(DTW:Dynamic Time warping)방식으로 이는 단말기내에서 학습과정이 필요한 것이다. 즉, 인식하고자 하는 대상 단어 또는 어휘를 사용자가 직접 음성녹음을 해야하는 번거로움이 있었으며, 이렇게 녹음된 음성 데이타를 가지고 인식 파라메터를 추출하게된다. 이와 같은 이유로 인해 음성인식기는 단지 음성다이얼링 기능에만 국한되어 사용되었다.Conventionally, some mobile phone terminals have been applied to the voice recognition method, but the voice recognition method applied here is a dynamic time warping (DTW) method, which requires a learning process in the terminal. In other words, there is a hassle that a user needs to directly record a target word or vocabulary to be recognized, and the recognition parameter is extracted using the recorded voice data. For this reason, the voice recognizer was used only for the voice dialing function.

상기와 같은 문제점들로 인해 현재 이동전화단말기에서 제공하는 다양한 기능들은 사용자 측면에서 볼 때 극히 일부만을 이용하게 되는 요인으로 작용하고 있다.Due to the above problems, various functions currently provided by the mobile phone terminal are acting as a factor of using only a small part from the user's perspective.

본 발명은 종래 이동전화단말기가 갖는 상술한 사용자 제어의 문제점을 해결하고자 안출된 것으로, 그 목적은 키조작을 통하여 일일이 각 단계의 메뉴를 찾아 가지 않고도, 단말기와 사용자가 상호간에 음성을 주고 받으면서 사용자 제어가 가능한 이동전화단말기 및 그 제어 방법을 제공하는데 있다.The present invention has been made to solve the above-described problems of the user control has a conventional mobile phone terminal, the purpose of the user and the user to communicate with each other between the terminal and the user, without having to go through the menu of each step through the key operation The present invention provides a controllable mobile phone terminal and a control method thereof.

도1은 종래의 이동전화단말기에서 사용자가 메뉴 방식으로 제어하도록 되어어 있는 이동전화단말기의 제어 항목을 예시적으로 도시한 것이다.1 exemplarily illustrates a control item of a mobile phone terminal, which is controlled to be controlled by a user in a menu method in a conventional mobile phone terminal.

도2는 본 발명에 따른 대화식 음성 제어가 가능한 이동전화단말기의 대화식 음성 다이얼링 제어 시스템 구성 요소을 개략적으로 도시한 블럭도이다.2 is a block diagram schematically illustrating the components of an interactive voice dialing control system of a mobile phone terminal capable of interactive voice control according to the present invention.

도3 및 도4는 본 발명에 따른 이동전화단말기의 대화식 음성 제어 방법중 대화식 음성 다이얼링 방법의 알고리즘을 도시한 흐름도이다.3 and 4 are flowcharts illustrating an algorithm of an interactive voice dialing method in an interactive voice control method of a mobile phone terminal according to the present invention.

*도면의 주요부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *

10:마이크로폰 20 : 코덱 30 :보코더10: microphone 20: codec 30: vocoder

40:이동전화단말기 키패드 50 : 제어부 60 :사용자 음성 저장 메모리40: mobile phone terminal keypad 50: control unit 60: user voice storage memory

70:안내 음성 저장 메모리 80 : 액정표시장치 90 :스피커70: guide voice storage memory 80: liquid crystal display 90: speaker

본 발명에 따른 대화식 음성 제어가 가능한 이동전화단말기는 사용자의 제어명령을 인식하여 이동전화단말기의 제어에 필요한 코드를 출력하는 음성인식기,상기 음성인식기에 사용자가 음성을 입력할 수 있는 사용자 음성 입력 수단, 상기 음성인식기를 통하여 입력된 사용자 제어 명령을 수행하는데 필요한 각종 안내를 사용자에게 음성으로 들려주기 위한 음성합성기, 상기 음성합성기에서 합성된 음성을 출력하기 위한 단말기 음성 출력 수단, 수신자의 이름등과 맵핑된 전화번호목록등 사용자의 음성 데이터를 저장하기 위한 사용자 음성 저장 메모리, 상기 음성합성기에 의하여 출력될 음성데이터를 저장하기 위한 안내 음성 저장 메모리를 포함하여 구성되는 것을 특징으로 한다.The mobile phone terminal capable of interactive voice control according to the present invention recognizes a user's control command and outputs a code necessary for controlling the mobile phone terminal, and a user voice input means for allowing a user to input voice to the voice recognizer. And a voice synthesizer for sounding the user's various instructions required to perform a user control command input through the voice recognizer, a terminal voice output means for outputting the synthesized voice from the voice synthesizer, a name of the receiver, and the like. And a guide voice storage memory for storing voice data to be output by the voice synthesizer.

상기 음성인식기는 일정한 범주의 어휘를 동일한 의미로 인식하여 동일한 명령을 수행할 수 있는 가변어휘 음성인식기인 것이 바람직하다.The speech recognizer may be a variable vocabulary speech recognizer capable of performing the same command by recognizing a certain category of vocabulary with the same meaning.

상기 음성합성기는 녹음편집방식 음성합성를 사용하는 것이 바람직하다. 이렇게 함으로, 음성합성기로부터 안내되는 음성을 사용자의 요구에 따라 다양한 음성(타 화자의 목소리)으로 바꿀 수 있다.It is preferable that the speech synthesizer uses a recording editing type speech synthesis. In this way, the voice guided by the voice synthesizer can be changed into various voices (voices of other speakers) according to the user's request.

본 발명에 따른 이동전화단말기의 대화식 음성 제어 방법은 (a) 사용자에게 음성 명령을 할 것을 요구하는 안내를 음성으로 출력하는 단계, (b) 사용자 음성 입력 수단을 통하여 이동전화기의 제어를 위한 음성 명령을 입력 받는 단계, (c)상기 입력된 음성을 인식하여 이동전화단말기의 제어에 필요한 코드를 출력하는 단계, (d)상기 입력된 음성 명령에 추가적인 세부 음성 명령이 더 필요한 경우, 그 세부 음성 명령을 요구하는 안내를 음성으로 출력하는 단계를 포함하여 구성된다.The interactive voice control method of a mobile phone terminal according to the present invention comprises the steps of: (a) outputting a voice request for a voice command to a user; (b) a voice command for controlling the mobile phone through a user voice input means; Receiving the input, (c) recognizing the input voice and outputting a code for controlling the mobile telephone terminal; (d) if the additional voice command requires additional detailed voice commands, the detailed voice commands It is configured to include the step of outputting a voice requesting the guidance.

상기 대화식 음성 제어 방법은 다음과 같이 구현될 수 있다.The interactive voice control method may be implemented as follows.

아래에서 [단말기 #] 이하 문장은 단말기에서 안내되는 합성음성 안내메시지이고, [사용자 #] 이하 문장은 사용자가 발성하는 내용이다.The sentence below [terminal #] is a synthesized voice guidance message guided by the terminal, the sentence below [user #] is the content spoken by the user.

[단말기 #1] 원하시는 서비스를 말씀해 주십시오.[Terminal # 1] What is your desired service?

[사용자 #1] 예약통화[User # 1] Reserved Call

[단말기 #2] 통화를 원하시는 전화번호를 말씀해 주십시오.[Terminal # 2] Please state the telephone number you wish to call.

[사용자 #2] 영 이 삼 칠 칠 오 삼 삼 삼 영(02-3775-3330)[User # 2] Young, Lee, Seven, Seven, Seven, Three, Three Spirits (02-3775-3330)

[단말기 #3] 통화를 원하시는 시간을 말씀해 주십시오.[Terminal # 3] What time do you want to call?

[사용자 #3] 구 삼 십(09:30)[User # 3] Nine Thirty (09:30)

[단말기 #4] 오전 아홉시 삼십분에 삼천칠백칠십오 국에 삼천삼백삼십 번으로 통화예약 되었습니다.[Terminal # 4] At nine thirty, thirty three thirty seven seventy five five thirty three thirty three hundred thirty calls.

본 발명에 따른 이동전화단말기의 대화식 음성 제어 방법 가운데 특히 다이얼링(voice dialing) 제어 방법은 (e)수신자 이름 및 해당 전화번호를 음성으로 입력 받아 수신자 이름에 해당 전화번호를 맵핑하여 사용자 음성 저장 메모리에 미리 저장하는 단계, (f) 상기 (e)단계에서 입력된 수신자 이름 및 해당전화 번호의 발성 내용을 키입력을 통하여 문자 입력 받아 음성인식 모델을 만들고, 그 문자를 해당 수신자 이름에 맵핑시켜 사용자 음성 저장 메모리에 미리 저장하는 단계, (g)사용자 음성 입력 수단을 통하여 수신자의 이름을 입력 받는 단계, (h) 상기 입력된 이름을 인식한 후, 해당 이름데이터를 상기 사용자 음성 저장 메모리를 조회하여 검색하는 단계, (i) 검색된 이름 및 전화번호를 최초에 사용자가 입력한 음성으로 단말기 음성 출력 수단을 통하여 출력하는 단계 및 (j)사용자의 수신자 확인 및다이얼링 단계를 포함한다.Among the interactive voice control methods of the mobile phone terminal according to the present invention, in particular, a dialing control method (e) receives a recipient name and a corresponding phone number by voice and maps the corresponding phone number to a recipient name to a user voice storage memory. Step of storing in advance, (f) receiving a voice input of the name of the recipient and the phone number input in the step (e) through a key input to create a voice recognition model, mapping the characters to the corresponding recipient name to the user voice Storing in the storage memory in advance, (g) receiving a name of the receiver through a user voice input means, (h) recognizing the input name, and searching the user voice storage memory for corresponding name data (I) using the terminal voice output means as a voice inputted by the user at the beginning of the searched name and telephone number; And (j) confirming and dialing the recipient of the user.

상기 (i)단계에서 검색 및 음성 출력된 이름 및 전화번호가 2이상인 경우,상기 (j)단계에서는 사용자의 수신자 선택을 음성으로 입력 받게된다.If the name and phone number searched and outputted in step (i) are two or more, in step (j), the user's receiver selection is input by voice.

상기 다이얼링(voice dialing) 제어 방법을 채택함으로 해서 잘못된 번호로의 다이얼링 가능성을 차단할 수 있고, 퀵 음성다이얼링 기능을 구현할 수 있다.By adopting the voice dialing control method, the possibility of dialing a wrong number can be blocked, and a quick voice dialing function can be implemented.

즉, 수신자의 이름을 음성인식기의 초기 인식 대상 어휘에 포함 시킴으로써 후크 온 상태에서 수신자 이름이 입력되면 곧 바로 다이얼링 할 수 있게 되는 것이다.That is, by including the receiver's name in the initial recognition target vocabulary of the voice recognizer, the receiver can be dialed as soon as the receiver's name is input in the hook-on state.

이하, 본 발명에 따른 대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법의 일실시례를 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, with reference to the accompanying drawings an embodiment of a mobile phone terminal and a control method capable of interactive voice control according to the present invention will be described in detail.

편의상, 다양한 이동전화단말기의 사용자 제어 가운데, 특히 다이얼링 제어를 예시적으로 설명한다.For convenience, among the user control of various mobile telephone terminals, in particular, dialing control will be exemplarily described.

도2는 본 발명에 따른 대화식 음성 제어가 가능한 이동전화단말기의 대화식 음성 다이얼링 제어 시스템 구성 요소을 개략적으로 도시한 블럭도이다.2 is a block diagram schematically illustrating the components of an interactive voice dialing control system of a mobile phone terminal capable of interactive voice control according to the present invention.

사용자가 음성다이얼링을 위해 전화번호를 등록할 때, 먼저 수신자의 이름 또는 상호명 등을 마이크로폰(10)을 통해 발성하게 되면 입력된 음성 데이터는 코덱(20)부에서 PCM(Pulse Code Modulation)신호로 바뀐 다음 보코더(30)를 통해 음성부호화기(QCELP)신호로 압축된 다음 제어부(40)로 출력된다. 상기 제어부는 음성인식 프로그램 및 음성합성 프로그램을 실행 시키면서 음성인식기 및 음성합성기의 역할을 수행한다. 입력된 음성데이터는 음성다이얼링 모드에서 인식결과를 음성으로 출력하기 위해 메모리(60)에 저장한다. 그리고 발성내용과 같은 문자를 키패드(40)를 이용하여 입력하면 이는 상기 제어부(40)에서 이에 대한 음성인식을 위한 모델을 만들고 문자내용은 발성 내용과 함께 메모리(60)에 함께 저장된다. 그리고 등록할 전화번호는 사용자가 발성하게 되면, 숫자음 음성인식을 통해 그 결과를 메모리에 저장한다. 여기에서 제어부(10)는 전반적인 동작을 제어하고 음성인식과 녹음편집방식의 음성합성 프로그램을 수행하는 마이크로프로세서로 구현된다.When a user registers a phone number for voice dialing, first, the name or business name of the receiver is uttered through the microphone 10, and the input voice data is changed into a PCM (Pulse Code Modulation) signal by the codec 20. Next, it is compressed into a voice coder (QCELP) signal through the vocoder 30 and then output to the controller 40. The controller performs a role of a voice recognizer and a voice synthesizer while executing a voice recognition program and a voice synthesis program. The input voice data is stored in the memory 60 to output the recognition result as voice in the voice dialing mode. And when a character such as speech content is input using the keypad 40, the controller 40 creates a model for speech recognition thereof, and the text content is stored together with the speech content in the memory 60. When the user registers the phone number to be registered, the result is stored in the memory through digital voice recognition. The control unit 10 is implemented as a microprocessor that controls the overall operation and performs a voice synthesis program of the voice recognition and recording editing.

다음은 상술한 수신자 전화번호등록 모드에서 사용될 수 있는 수신자와 단말기간의 대화를 예시적으로 나타낸 것이다.The following exemplarily illustrates a conversation between a receiver and a terminal that can be used in the above-described receiver phone number registration mode.

[단말기 #1] 원하시는 서비스를 말씀해 주십시오.[Terminal # 1] What is your desired service?

[사용자 #1] 전화번호 등록.[User # 1] Phone Number Registration.

[단말기 #2] 전화번호 등록 서비스입니다. 수신자 이름 또는 상호명을 말씀해 주십시오.[Terminal # 2] phone number registration service. Please state the recipient's name or business name.

[사용자 #2] 엑트밸리[User # 2] Act Valley

[단말기 #3] 말씀하신 엑트밸리를 텍스트로 입력하여 주십시오.[Terminal # 3] Please enter the valid text of the VALLEY as mentioned.

[사용자 #3] (엑트밸리를 텍스트로 입력한다.)[User # 3] (Enter ActValley as text.)

[단말기 #4] 전화번호를 말씀해 주십시오.[Terminal # 4] Please tell me your phone number.

[사용자 #4] 영 이 삼 칠 칠 오 삼 삼 삼 영(02-3775-3330)[User # 4] Young, Lee, Seven, Seven, Seven, Three, Three Spirits (02-3775-3330)

위의 일 예에서 [단말기 #]은 제어부(40) 동작에 따라 음성안내를 위한 메모리(70) 저장된 음성을 편집조합 음성합성하여 스피커(70)을 통해 안내되는 음성이다. 이것은 사용자의 요구에 따라 안내되는 음성을 다른 화자의 음성으로 바꿀 수 있도록 해당 음성 데이터를 기록함으로서 가능하게 한다.In the above example, [terminal #] is a voice that is guided through the speaker 70 by synthesizing the voice of the voice stored in the memory 70 for voice guidance according to the operation of the controller 40. This is made possible by recording the corresponding voice data so that the voice guided by the user's request can be changed into the voice of another speaker.

그리고 음성다이얼링 모드에서 사용자가 통화하고자 하는 사람 이름이나 상호명을 발성하면 코덱(20)과 보코더(30)부를 거친 음성신호를 제어부(50)에서 음성구간을 검출하고 특징 파라메터를 추출하여, 전화번호부 메모리(60)에 기록된 인식모델과 비교하여 음성인식을 수행한다. 그리고 인식결과는 전화번호 등록시에 사용자가 발성한 음성 즉, 수신자 이름 또는 상호명을 스피커(90)를 통해 재생하고 이와 동시에 입력한 그에 대한 문자를 액정표시(80)창에 표시해 준다.In the voice dialing mode, when a user speaks a person's name or a business name, the controller 50 detects a voice section and extracts feature parameters from the voice signal passing through the codec 20 and the vocoder 30, and extracts a feature parameter. Speech recognition is performed by comparison with the recognition model recorded in (60). The recognition result reproduces the voice spoken by the user at the time of registering the phone number, that is, the receiver name or the business name through the speaker 90, and simultaneously displays the text corresponding to the inputted text on the liquid crystal display 80 window.

그리고 인식결과가 2개 이상인 경우에는 그 내용을 스피커(90)와 액정표시(80)창에 모두 나타내고, 숫자음 음성인식을 통해 다시 재 인식하여 음성다이얼링을 시도한다.If the recognition result is two or more, the contents are displayed on both the speaker 90 and the liquid crystal display 80, and the voice dialing is attempted by re-recognizing again through the voice recognition.

그렇게 함으로서 사용자는 음성다이얼링시 통화하고자 하는 수신자가 올바르게 인식되었는지 음성출력으로도 확인이 가능하게된다.By doing so, the user can check whether the receiver to be called is correctly recognized by voice output during voice dialing.

다음은 음성다이얼링 모드에서 사용될 수 있는 사용자와 단말기간의 대화를 예시적으로 보인 것이다.The following is an example of a conversation between a user and a terminal that can be used in the voice dialing mode.

[단말기 #1] 원하시는 서비스를 말씀해 주십시오.[Terminal # 1] What is your desired service?

[사용자 #1] 전화걸기[단말기 #2] 전화걸기를 선택하셨습니다. 통화하고자 하는 분의 이름 또는 상호명을 말씀해 주십시오.You have selected [user # 1] Make a call [terminal # 2]. Please state the name or business name of the person you wish to call.

[사용자 #2] 엑트밸리[User # 2] Act Valley

[단말기 #3] 인식한 결과가 2개 있습니다. 첫 번째 엑트밸리는 영이에 삼칠칠오 국에 삼삼삼영 입니다. 두 번째 액트벨리는 영이에 삼삼삼 국에 칠칠오삼입니다. 통화를 원하는 곳을 말씀해 주십시오.[Terminal # 3] There are 2 results. The first act valley is Samsamsamyoung in Samchilchio Guk. The second actbelly is seventy-three on Yeongi. Please tell me where you want to call.

[사용자 #3] 1 번(또는 첫번째)[USER # 3] NO.1 (OR FIRST)

[단말기 #4] 삼칠칠오 국에 삼삼삼영 으로 전화를 걸고 있습니다.[Terminal # 4] I am calling Samshil Chil-guk at Samsamsamyoung.

위의 일 예에서 보인 것처럼, 음성인식결과 2개 이상인 경우에는 [사용자 #3]과 같이 숫자음 음성인식을 다시 수행함으로서 최종적으로 사용자가 통화하고자 하는 번호로 음성다이얼링 되도록 한다.As shown in the above example, in the case of two or more voice recognition results, as shown in [user # 3], the voice dialing is performed again to finally dial the number to be called by the user.

현재 이동전화단말기에서는 전화번호등록시 특정번호에 수신자의 관련 내용을 저장하고 다이얼링시 저장되어있는 숫자번호를 클릭하면 즉시 통화가 가능하다.In the current mobile phone terminal, when a phone number is registered, a specific number is stored in the recipient's related contents, and when dialing, the stored number is clicked to make a call immediately.

본 발명에서는 이와 같은 기능을 음성으로 가능하게 하는 퀵 음성다이얼링 기능을 구현할 수 있다. 즉, 위의 음성다이얼링의 예시로 보인 과정에서 "[사용자 #2] 엑트밸리"처럼 사용자가 전화통화를 하고자 하는 수신자를 발성하면 바로 통화 연결되도록 전화번호에 등록 되어있는 수신자의 이름 또는 상호명을 상기 음성인성기의 초기 인식 대상 어휘에 포함킴으로써 가능해 지는 것이다.In the present invention, it is possible to implement a quick voice dialing function that enables such a function by voice. In other words, in the process shown as an example of voice dialing, when the user utters a receiver who wants to make a telephone call, such as "[User # 2] Act Valley", the name or business name of the receiver registered in the telephone number is immediately connected. This is possible by including the voice recognition in the initial recognition target vocabulary.

그리고 사용자와 단말기간의 대화 과정에서 사용자가 발성하는 동일한 의미의 다양한 응답에 대해서 동일한 어휘로서 인식 후 하나의 동작을 할 수 있게 한다. 즉, 사용자가 "예", "응", "그래"와 같은 응답을 할 경우에도 각각을 인식하여 이 모두에 대해서 같은 동작을 취 할 수 있게 이동전화단말기를 구현하다. 이것은 본 발명에 따른 대화식 음성 제어가 가능한 이동전화단말기의 음식인식기로 가변어휘 음성인식기를 채택함으로써 가능한 것이다.In addition, the user may perform one operation after recognizing the same vocabulary with respect to various responses having the same meaning spoken by the user in the dialogue process between the user and the terminal. In other words, even if the user responds with "Yes", "Yes", "Yes", the mobile phone terminal is implemented to recognize each and take the same action for all of them. This is possible by adopting the variable vocabulary voice recognizer as the food recognizer of the mobile phone terminal capable of interactive voice control according to the present invention.

도3 및 도4는 본 발명에 따른 이동전화단말기의 대화식 음성 제어 방법중 대화식 음성 다이얼링 방법의 알고리즘을 도시한 흐름도이다.3 and 4 are flowcharts illustrating an algorithm of an interactive voice dialing method in an interactive voice control method of a mobile phone terminal according to the present invention.

도3에는 상기 (e) 및 (f)단계의 알고리즘을 좀 더 구체적으로 나타내고 있다.3 shows the algorithm of steps (e) and (f) in more detail.

사용자에게 등록모드를 선택할 것인지 다이얼링모드를 선택할 것인지를 물어(200), 사용자가 수신자 이름 및 전화번호 등록을 위하여 등록모드를 선택하면 전화번호 등록 대상자 이름 음성입력을 요구하는 음성안내를 한다(202). 전화번호 등록 대상자의 이름을 음성입력하면(203), 상기 코덱 및 보코더에서 압축코딩된 음성데이터는 음성 다이얼링시 재생을 위해 메모리에 저장한다.The user is asked whether to select a registration mode or a dialing mode (200), and when the user selects a registration mode for registering a recipient name and a phone number, a voice guidance requesting a voice number registration target name voice input is performed (202). . When voice input of the name of the telephone number registration target (203), the voice data compressed by the codec and vocoder are stored in the memory for playback during voice dialing.

다시, 단말기는 전화번호등록 대상장 이름을 텍스트로 입력할 것을 요구하는 음성안내를 하고(205), 사용자로 부터 전화번호 등록 대상자의 이름 텍스트를 입력받는다(206). 상기 제어부(50)는 입력되 텍스트 데이터를 이용하여 음성인식 모델 생성을 하고(208), 다시 대상자의 전화번호를 음성입력하도록 음성안내한다(208).Again, the terminal provides a voice guidance requesting the name of the phone number registration target book as text (205), and receives the name text of the phone number registration target user from the user (206). The control unit 50 generates a voice recognition model using the input text data (208), and voice guides the user to voice input the phone number of the subject (208).

사용자가 등록 대상자 전화번호를 음성입력하면(209), 이를 숫자음 음성인식 후 음성다이얼링을 위한 메모리에 저장한다(210). 등록을 종료할 것인가를 묻고(211) 종료를 선택하면 등록을 종료하고, 등록을 계속하기를 원하면 상기 202단계이하를 다시 수행한다.When the user inputs the phone number of the person to be registered (209), it stores it in a memory for voice dialing after voice recognition of the numeric voice (210). If the user is asked whether to end the registration (211) and selects the end of the registration, the registration is terminated. If the registration is to be continued, the step 202 is performed again.

도4에는 상기 (g) 내지 (j)단계를 구현한 알고리즘의 일실시례를 나타내고 있다.Figure 4 shows an embodiment of an algorithm implementing the steps (g) to (j).

상기 200단계에서 사용자가 다이얼링 모드를 선택하면 음성안내(301)에 따라 통화를 시도 하고자 하는 수신자 이름을 음성으로 입력한다.In step 200, when the user selects the dialing mode, the voice receiver 301 inputs a name of a receiver to be called according to the voice guidance 301.

상기 음성인식기는 음성인식 파라메터를 추출하여(303) 음성을 인식하고(304) 인식결과와 매칭되는 이름을 상기 사용자 음성 저장 메모리에서 조회하여 출력하고(305), 사용자의 응답을 요구하는 음성안내(306)를 한다.The voice recognizer extracts a voice recognition parameter (303), recognizes a voice (304), retrieves and outputs a name matching the recognition result from the user voice storage memory (305), and provides a voice guidance requesting a user's response ( 306).

상술한 바와 같이 인식결과가 2개 이상이면 출력된 순서에 따라 부여되는 숫자음, 즉 첫번째 출력된 이름으로 통화하고자 하는 경우는 1 또는 첫번째, 두번째 출력된 이름으로 통화하고자 하는 경우는 2 또는 두번째을 1개 선택하게 하여(309), 전화 통화를 시도하게 된다(308).As described above, if there are two or more recognition results, the number is given according to the output order, that is, 1 for the first output name, or 2 or 2 for the first output name. Dog selection (309), a telephone call is attempted (308).

본 발명 의하면 다음과 같은 효과를 얻을 수 있다.According to the present invention, the following effects can be obtained.

첫째, 각종 메뉴를 사용자와 단말기간의 대화를 통해 선택, 제어함으로서, 사용에 따른 편리성과 이동시 안정성확보를 기할 수 있다.First, by selecting and controlling various menus through a dialogue between the user and the terminal, it is possible to secure convenience and stability when moving.

둘째, 전화번호등록모드에서 수신자의 이름을 발성한 음성을 저장해 두고, 음성 다이얼링시 인식결과를 스피커를 통해 메모리에 저장되어있던 수신자의 이름을 재생해 줌으로서, 인식결과를 음성으로 확인할 수 있을 뿐만 아니라 오인식에 따른 다른 번호로의 통화를 방지할 수 있다. 그리고 운전이나 보행에 의한 이동 중 에 이동전화기 사용으로 발생하는 안전사고가 대부분의 전화통화를 시도하는데에서 발생함을 고려할 때, 본 발명은 이러한 안전 사고를 미연에 방지 할 수 있는 효과가 있다.Second, in the phone number registration mode, the voice of the receiver's name is stored, and the voice recognition results in recognizing the receiver's name stored in memory through the speaker. In addition, it is possible to prevent a call to another number due to misrecognition. And considering that the safety accidents caused by the use of a mobile phone during driving or walking due to the most attempts to make a phone call, the present invention has the effect of preventing such a safety accident in advance.

셋째, 본 발명의 대화형 이동전화단말기에서 음성 안내되는 목소리를 사용자가 필요시 다양한 목소리로 바꿀 수 있게 함으로서, 지속적인 사용에 따른 안내음의 식상함을 없앨 수 있다.Third, the voice guided voice in the interactive mobile phone terminal of the present invention can be changed to a variety of voices if necessary by the user, thereby eliminating the nausea of the guide sound due to continuous use.

넷째, 음성다이얼링에서 여러 단계로 진행되는 대화형 방식을 사용자의 필요에 따라 통화를 원하는 수신자의 이름 또는 상호명을 발성하면 바로 통화로 연결되는 퀵 음성다이얼링 기능을 가능하게 함으로서, 사용자의 시간과 편의를 줄 수 있다.Fourth, in the interactive method of multi-step voice dialing, the voice caller's name or company name can be connected to a call immediately when the user's name or business name is called. Can give

다섯째, 일상적으로 동일한 의미로 사용되는 복수의 사용자의 음성 답변을 단말기가 동일한 의미의 어휘로 인식하여 편리성을 더한다.Fifth, the terminal recognizes the voice answers of a plurality of users commonly used in the same meaning as a vocabulary having the same meaning, thereby adding convenience.

Claims (5)

사용자의 제어명령을 인식하여 이동전화단말기의 제어에 필요한 코드를 출력하는 음성인식기;A voice recognizer for recognizing a control command of a user and outputting a code necessary for controlling the mobile telephone terminal; 상기 음성인식기에 사용자가 음성을 입력할 수 있는 사용자 음성 입력 수단;User voice input means for allowing a user to input voice to the voice recognizer; 상기 음성인식기를 통하여 입력된 사용자 제어 명령을 수행하는데 필요한 각종 안내를 사용자에게 음성으로 들려주기 위한 음성합성기;A voice synthesizer for providing a voice to the user with various guides necessary to perform a user control command input through the voice recognizer; 상기 음성합성기에서 합성된 음성을 출력하기 위한 단말기 음성 출력 수단; 수신자의 이름등과 맵핑된 전화번호목록등 사용자의 음성 데이터를 저장하기 위한 사용자 음성 저장 메모리;및Terminal speech output means for outputting speech synthesized by the speech synthesizer; A user voice storage memory for storing voice data of a user, such as a name of a recipient and a list of telephone numbers mapped; 상기 음성합성기에 의하여 출력될 음성데이터를 저장하기 위한 안내 음성 저장 메모리;A guide voice storage memory for storing voice data to be output by the voice synthesizer; 를 포함하여 구성되는 것을 특징으로 하는 대화식 음성 제어가 가능한 이동전화단말기.Mobile phone terminal capable of interactive voice control, characterized in that configured to include. 제1항에 있어서, 상기 음성인식기는 일정한 범주의 어휘를 동일한 의미로 인식하여 동일한 명령을 수행할 수 있는 가변어휘 음성인식기인 것을 특징으로 하는 대화식 음성 제어가 가능한 이동전화단말기.The mobile phone terminal of claim 1, wherein the voice recognizer is a variable vocabulary voice recognizer capable of performing a same command by recognizing a certain category of vocabulary with the same meaning. 제 1항에 있어서, 상기 음성합성기는 안내되는 음성을 사용자의 요구에 따라 다양한 음성으로 바꿀 수 있는 녹음편집방식의 음성합성기인 것을 특징으로 하는 대화식 음성 제어가 가능한 이동전화단말기.The mobile phone terminal according to claim 1, wherein the voice synthesizer is a voice synthesizer of a recording editing method which can change the guided voice into various voices according to a user's request. (a) 사용자에게 음성 명령을 할 것을 요구하는 안내를 음성으로 출력하는 단계;(a) outputting a voice prompt for requesting a user to make a voice command; (b)사용자 음성 입력 수단을 통하여 이동전화기의 제어를 위한 사용자의 음성 명령을 입력 받는 단계;(b) receiving a voice command of a user for controlling the mobile phone through a user voice input means; (c)상기 입력된 음성을 인식하여 이동전화단말기의 제어에 필요한 코드를 출력하는 단계;(c) recognizing the input voice and outputting a code necessary for controlling the mobile telephone terminal; (d)상기 입력된 음성 명령에 추가적인 세부 음성 명령이 더 필요한 경우, 그 세부 음성 명령을 요구하는 안내를 음성으로 출력하는 단계;(d) if an additional detailed voice command is required for the input voice command, outputting a voice request for the detailed voice command; 를 포함하여 구성되는 것을 특징으로 하는 이동전화단말기의 대화식 음성 제어 방법.Interactive voice control method of a mobile phone terminal, characterized in that comprising a. (e)수신자 이름 및 해당 전화번호를 음성으로 입력 받아 수신자 이름에 해당 전화번호를 맵핑하여 사용자 음성 저장 메모리에 미리 저장하는 단계;(e) receiving a receiver name and a corresponding telephone number by voice and mapping the telephone number to the receiver name and storing the telephone number in advance in a user voice storage memory; (f) 상기 (e)단계에서 입력된 수신자 이름 및 해당전화 번호의 발성 내용을 키입력을 통하여 문자 입력 받아 음성인식 모델을 만들고, 그 문자를 해당 수신자 이름에 맵핑시켜 사용자 음성 저장 메모리에 미리 저장하는 단계;(f) Create a voice recognition model by receiving text input from the name of the receiver and the phone number input in step (e) through key input, and mapping the text to the corresponding receiver name to store it in the user's voice storage memory in advance. Doing; (g)사용자 음성 입력 수단을 통하여 수신자의 이름을 입력 받는 단계;(g) receiving a name of a receiver through a user voice input means; (h) 상기 입력된 이름을 인식한 후, 해당 이름데이터를 상기 사용자 음성 저장 메모리를 조회하여 검색하는 단계;(h) recognizing the input name and retrieving corresponding name data by searching the user voice storage memory; (i) 검색된 이름 및 전화번호를 최초에 사용자가 입력한 음성으로 단말기 음성 출력 수단을 통하여 출력하는 단계; 및(i) outputting the retrieved name and telephone number through the terminal voice output means as voice input by the user initially; And (j)사용자의 수신자 확인 및 다이얼링 단계;(j) confirming and dialing the recipient of the user; 를 포함하여 구성되는 것을 특징으로 하는 이동전화단말기의 대화식 다이얼링 제어 방법.Interactive dialing control method of a mobile phone terminal, characterized in that comprising a.
KR1020000059131A 2000-10-09 2000-10-09 Mobile phone controlled by interactive speech and control method thereof KR20010000595A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000059131A KR20010000595A (en) 2000-10-09 2000-10-09 Mobile phone controlled by interactive speech and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000059131A KR20010000595A (en) 2000-10-09 2000-10-09 Mobile phone controlled by interactive speech and control method thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR2020000028033U Division KR200219909Y1 (en) 2000-10-09 2000-10-09 Mobile phone controlled by interactive speech

Publications (1)

Publication Number Publication Date
KR20010000595A true KR20010000595A (en) 2001-01-05

Family

ID=19692437

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000059131A KR20010000595A (en) 2000-10-09 2000-10-09 Mobile phone controlled by interactive speech and control method thereof

Country Status (1)

Country Link
KR (1) KR20010000595A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040001318A (en) * 2002-06-27 2004-01-07 엘지전자 주식회사 Remote control method using voice recognition of mobile telecommunication terminal equipment
KR100701434B1 (en) * 2005-11-17 2007-03-30 삼성전자주식회사 Method of voice control in portable terminal
KR100986443B1 (en) * 2004-01-28 2010-10-08 주식회사 케이티 Speech recognizing and recording method without speech recognition grammar in VoiceXML
WO2010124478A1 (en) * 2009-04-30 2010-11-04 Sheng Yongxiang Device and method for managing users using voice in user identification system
US8958848B2 (en) 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040001318A (en) * 2002-06-27 2004-01-07 엘지전자 주식회사 Remote control method using voice recognition of mobile telecommunication terminal equipment
KR100986443B1 (en) * 2004-01-28 2010-10-08 주식회사 케이티 Speech recognizing and recording method without speech recognition grammar in VoiceXML
KR100701434B1 (en) * 2005-11-17 2007-03-30 삼성전자주식회사 Method of voice control in portable terminal
US8958848B2 (en) 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
US9497305B2 (en) 2008-04-08 2016-11-15 Lg Electronics Inc. Mobile terminal and menu control method thereof
US9692865B2 (en) 2008-04-08 2017-06-27 Lg Electronics Inc. Mobile terminal and menu control method thereof
US9900414B2 (en) 2008-04-08 2018-02-20 Lg Electronics Inc. Mobile terminal and menu control method thereof
WO2010124478A1 (en) * 2009-04-30 2010-11-04 Sheng Yongxiang Device and method for managing users using voice in user identification system

Similar Documents

Publication Publication Date Title
EP1348212B1 (en) Mobile terminal controllable by spoken utterances
US6813341B1 (en) Voice activated/voice responsive item locator
KR100616787B1 (en) Voice recognition user interface for telephone handsets
US7826945B2 (en) Automobile speech-recognition interface
US6873951B1 (en) Speech recognition system and method permitting user customization
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
TWI281146B (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
KR100383353B1 (en) Speech recognition apparatus and method of generating vocabulary for the same
EP1171870B1 (en) Spoken user interface for speech-enabled devices
US20050043948A1 (en) Speech recognition method remote controller, information terminal, telephone communication terminal and speech recognizer
JP2007525897A (en) Method and apparatus for interchangeable customization of a multimodal embedded interface
KR20080107376A (en) Communication device having speaker independent speech recognition
US20060190260A1 (en) Selecting an order of elements for a speech synthesis
EP1215660B1 (en) Mobile terminal controllable by spoken utterances
US20010056345A1 (en) Method and system for speech recognition of the alphabet
KR20010000595A (en) Mobile phone controlled by interactive speech and control method thereof
KR100467593B1 (en) Voice recognition key input wireless terminal, method for using voice in place of key input in wireless terminal, and recording medium therefore
CN109616116B (en) Communication system and communication method thereof
KR200219909Y1 (en) Mobile phone controlled by interactive speech
WO2000022609A1 (en) Speech recognition and control system and telephone
JP2003177788A (en) Audio interactive system and its method
JPS61144157A (en) Sound dial device
JP3519259B2 (en) Voice recognition actuator
KR20060130897A (en) Silent call communication appartus and method for mobile terminal
KR20090045878A (en) Mobile comunication phone having the mobile-agent and method for driving the mobile-agent using the mobile comunication phone

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application