WO2013015463A1 - 이동 단말기 및 그 제어방법 - Google Patents

이동 단말기 및 그 제어방법 Download PDF

Info

Publication number
WO2013015463A1
WO2013015463A1 PCT/KR2011/005453 KR2011005453W WO2013015463A1 WO 2013015463 A1 WO2013015463 A1 WO 2013015463A1 KR 2011005453 W KR2011005453 W KR 2011005453W WO 2013015463 A1 WO2013015463 A1 WO 2013015463A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
output
text
mobile terminal
control unit
Prior art date
Application number
PCT/KR2011/005453
Other languages
English (en)
French (fr)
Inventor
김재민
한승호
박용철
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to PCT/KR2011/005453 priority Critical patent/WO2013015463A1/ko
Priority to US13/239,558 priority patent/US20130024189A1/en
Publication of WO2013015463A1 publication Critical patent/WO2013015463A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/22Details of telephonic subscriber devices including a touch pad, a touch sensor or a touch detector

Definitions

  • the present invention relates to a mobile terminal and a control method thereof, and more particularly, when a voice output signal for a portion output as voice is obtained, the voice is output based on the stored voice data, thereby reducing the time required for outputting the voice.
  • Terminals such as personal computers, laptops, mobile phones, etc.
  • multimedia devices having complex functions such as taking pictures or videos, playing music or video files, playing games, and receiving broadcasts. It is implemented in the form of (Multimedia player).
  • Terminal can move It may be divided into a mobile terminal and a stationary terminal, depending on whether it is present.
  • the mobile terminal may be further classified into a handheld terminal and a vehicle mount terminal according to whether a user can directly carry it.
  • the present invention relates to a mobile terminal capable of shortening the time required for outputting a voice by outputting a voice based on the stored voice data when a voice output signal for a portion output as voice is obtained, and a control method thereof.
  • the sound output module for realizing the above object, the sound output module; Memory in which text is stored; And a controller for converting at least a portion of the text into a voice and outputting the voice through the sound output module, wherein the controller is configured to store at least a part of the voice data converted into the voice and output the voice data in the memory.
  • the method may further include outputting a voice based on the stored voice data to the sound output module when the voice output signal for the text of the voice is obtained.
  • the memory includes at least one phone, at least one diphone, at least one syllable, at least one morpheme, at least one word, at least one phrase. And a database including at least one recorded speech of at least one of at least one clause and at least one sentence, wherein the controller is further configured to store the recorded speech.
  • the voice data may be generated by combining voices corresponding to at least some of text.
  • the controller may store the voice data generated by the combination in the memory, and output the voice based on the stored voice data without combining the voice data when repeatedly outputting the at least some text.
  • the controller may change a reproduction attribute of the voice when the touch signal is acquired.
  • the reproduction attribute may include a position at which the voice is output in the text, a range in which the voice is output in the additional text, whether or not the voice is repeatedly output, whether or not the voice is output, the volume of the voice, the output speed of the voice, At least one of the pitch (pitch) of the voice.
  • the controller may change the reproduction attribute according to at least one of a direction, a distance, and a duration of the touch signal.
  • the controller may display an indicator indicating a position where the voice is output in the text.
  • the controller may output text corresponding to the changed position of the indicator as the voice.
  • the controller may differently display a portion of the text that is output as the voice and a portion which is not output as the voice.
  • the controller may adjust an output speed of the voice so that at least a part of the text is output as a voice within a set time.
  • the controller When the controller acquires a touch signal, the controller starts the voice conversion of the text, and the touch signal for starting the voice conversion may be a touchdown signal for generating a touch signal.
  • the controller may initiate the voice conversion for at least two areas spaced apart from each other in the text.
  • the controller may start the voice conversion on at least a portion of the text that is not output as the voice.
  • the mobile terminal for realizing the above object, the sound output module; Memory in which text is stored; And a controller for converting at least a portion of the text into a voice and outputting the voice through the sound output module, wherein the controller is stored in the memory when a signal for re-outputting at least a portion of the output voice is obtained.
  • the audio data of the voice may be used to re-output at least a part of the voice.
  • the memory includes at least one phone, at least one diphone, at least one syllable, at least one morpheme, at least one word, at least one phrase. And a database including at least one recorded speech of at least one of at least one clause and at least one sentence, wherein the controller is further configured to store the text in the recorded speech.
  • the voice data may be generated by combining voices corresponding to at least some of the voice data.
  • the controller may change a reproduction attribute of the voice when the touch signal is acquired.
  • the controller may change the reproduction attribute according to at least one of a direction, a distance, and a duration of the touch signal.
  • the controller may display an indicator indicating a position where the voice is output in the text.
  • the controller may differently display a portion of the text that is output as the voice and a portion which is not output as the voice.
  • the controller When the controller acquires a touch signal, the controller starts the voice conversion of the text, and the touch signal for starting the voice conversion may be a touchdown signal for generating a touch signal.
  • the converting of the voice data and outputting the voice data may include at least one phone, at least one diphone, at least one syllable, at least one morpheme, and at least one stored in a database.
  • Combining a voice corresponding to at least a portion of the text among the recorded voices of at least one of a word, at least one phrase, at least one clause, and at least one sentence of It may include the step of converting to the voice data.
  • the method may further include displaying an indicator indicating a position where the voice is output in the text.
  • the method may further include differently displaying a portion of the text that is output as the voice and a portion which is not output as the voice.
  • the conversion of the voice data may be initiated when a touchdown signal for generating a touch signal is obtained.
  • the mobile terminal and the control method according to the present invention by obtaining a voice output signal for the portion output as the voice outputs the voice based on the stored voice data, it is possible to shorten the time required for the output of the voice There is.
  • FIG. 1 is a block diagram of a mobile terminal according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating a TTS system of a mobile terminal according to an embodiment of the present invention.
  • FIG. 3 and 4 are diagrams illustrating a unit-selection process in the FIG. 2 TTS system.
  • FIG. 5 is a flowchart illustrating an operation process of a mobile terminal according to an embodiment of the present invention.
  • FIG. 6 is a diagram illustrating a state in which text is displayed on the mobile terminal of FIG. 5.
  • FIG. 7 is a diagram illustrating a state in which a TTS operation is performed in the mobile terminal of FIG. 5.
  • FIG. 8 to 10 are diagrams illustrating a process of re-outputting a voice output from the mobile terminal of FIG. 5.
  • FIG. 11 is a graph illustrating an effect according to the mobile terminal of FIG. 5.
  • 23 and 24 illustrate an operation for setting of the mobile terminal of FIG. 5.
  • 25 to 27 are diagrams illustrating operations of the mobile terminal of FIG. 5.
  • FIG. 28 is a diagram illustrating a battery-related operation of the mobile terminal of FIG. 5.
  • the mobile terminal described herein may include a mobile phone, a smart phone, a laptop computer, a digital broadcasting terminal, a personal digital assistant (PDA), a portable multimedia player (PMP), navigation, and the like.
  • PDA personal digital assistant
  • PMP portable multimedia player
  • the configuration according to the embodiments described herein may also be applied to fixed terminals such as digital TVs, desktop computers, etc., except when applicable only to mobile terminals.
  • FIG. 1 is a block diagram of a mobile terminal according to an embodiment of the present invention.
  • the mobile terminal 100 may include a wireless communication unit 110, an A / V input unit 120, a user input unit 130, a sensing unit 140, an output unit 150, a memory unit 160,
  • the interface unit 170 may include a controller 180, a power supply unit 190, and the like.
  • the components shown in FIG. 1 are not essential, so that a mobile terminal having more or fewer components may be implemented.
  • the wireless communication unit 110 may include one or more modules that enable wireless communication between the mobile terminal 100 and the wireless communication system or between the mobile terminal 100 and a network in which the mobile terminal 100 is located.
  • the wireless communication unit 110 may include a broadcast receiving module 111, a mobile communication module 112, a wireless internet module 113, a short range communication module 114, a location information module 115, and the like. .
  • the broadcast receiving module 111 receives a broadcast signal and / or broadcast related information from an external broadcast management server through a broadcast channel.
  • the broadcast channel may include a satellite channel and a terrestrial channel.
  • the broadcast management server may mean a server that generates and transmits a broadcast signal and / or broadcast related information or a server that receives a previously generated broadcast signal and / or broadcast related information and transmits the same to a terminal.
  • the broadcast signal may include not only a TV broadcast signal, a radio broadcast signal, and a data broadcast signal, but also a broadcast signal having a data broadcast signal combined with a TV broadcast signal or a radio broadcast signal.
  • the broadcast related information may mean information related to a broadcast channel, a broadcast program, or a broadcast service provider.
  • the broadcast related information may also be provided through a mobile communication network. In this case, it may be received by the mobile communication module 112.
  • the broadcast related information may exist in various forms. For example, it may exist in the form of Electronic Program Guide (EPG) of Digital Multimedia Broadcasting (DMB) or Electronic Service Guide (ESG) of Digital Video BroadcastHandheld (DVBH).
  • EPG Electronic Program Guide
  • DMB Digital Multimedia Broadcasting
  • ESG Electronic Service Guide
  • DVBH Digital Video BroadcastHandheld
  • the broadcast receiving module 111 receives a broadcast signal using various broadcasting systems, and in particular, Digital Multimedia Broadcasting Terrestrial (DMBT), Digital Multimedia Broadcasting Satellite (DMBS), Media Forward Link Only (MediaFLO), and Digital Video BroadcastHandheld (DVBH). ), A digital broadcast signal can be received using a digital broadcast system such as Integrated Services Digital Broadcast Terrestrial (ISDBT).
  • ISDBT Integrated Services Digital Broadcast Terrestrial
  • the broadcast receiving module 111 may be configured to be suitable for not only the above-described digital broadcast system but also other broadcast system for providing a broadcast signal.
  • the broadcast signal and / or broadcast related information received through the broadcast receiving module 111 may be stored in the memory unit 160.
  • the mobile communication module 112 transmits and receives a wireless signal with at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include various types of data according to transmission and reception of a voice call signal, a video call call signal, or a text / multimedia message.
  • the short range communication module 114 refers to a module for short range communication.
  • Bluetooth Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, and the like may be used.
  • RFID Radio Frequency Identification
  • IrDA Infrared Data Association
  • UWB Ultra Wideband
  • ZigBee ZigBee
  • the location information module 115 is a module for checking or obtaining the location of the mobile terminal.
  • a representative example of the location information module is a GPS (Global Position System) module.
  • the GPS module 115 calculates information about a distance of one point (object) away from three or more satellites, and information on a time at which the distance information is measured, and then calculates the calculated distance information.
  • the trigonometric method By applying the trigonometric method to, three-dimensional positional information according to latitude, longitude, and altitude of one point (object) at one time can be calculated.
  • a method of calculating position and time information using three satellites and correcting the error of the calculated position and time information using another satellite is also used.
  • the GPS module 115 may continuously calculate the current position in real time and use the same to calculate speed information.
  • the A / V input unit 120 is for inputting an audio signal or a video signal, and may include a camera 121 and a microphone 122.
  • the camera 121 processes image frames such as still images or moving images obtained by the image sensor in the video call mode or the photographing mode.
  • the processed image frame may be displayed on the display unit 151.
  • the image frame processed by the camera 121 may be stored in the memory unit 160 or transmitted to the outside through the wireless communication unit 110. Two or more cameras 121 may be provided according to the configuration aspect of the terminal.
  • the microphone 122 receives an external sound signal by a microphone in a call mode, a recording mode, a voice recognition mode, etc., and processes the external sound signal into electrical voice data.
  • the processed voice data may be converted into a form transmittable to the mobile communication base station through the mobile communication module 112 and output in the call mode.
  • the microphone 122 may implement various noise removing algorithms for removing noise generated in the process of receiving an external sound signal.
  • the user input unit 130 generates input data for the user to control the operation of the terminal.
  • the user input unit 130 may include a key pad dome switch, a touch pad (static pressure / capacitance), a jog wheel, a jog switch, and the like.
  • the sensing unit 140 detects a current state of the mobile terminal 100 such as an open / closed state of the mobile terminal 100, a location of the mobile terminal 100, presence or absence of a user contact, orientation of the mobile terminal, acceleration / deceleration of the mobile terminal, and the like. To generate a sensing signal for controlling the operation of the mobile terminal 100. For example, when the mobile terminal 100 is in the form of a slide phone, it may sense whether the slide phone is opened or closed. In addition, it may be responsible for sensing functions related to whether the power supply unit 190 is supplied with power, whether the interface unit 170 is coupled to an external device, and the like. Meanwhile, the sensing unit 140 may include a proximity sensor.
  • the output unit 150 is used to generate an output related to sight, hearing, or tactile sense, and includes a display unit 151, an audio output module 152, an alarm unit 153, and a haptic module 154. Can be.
  • the display unit 151 displays and outputs information processed by the mobile terminal 100. For example, when the mobile terminal is in a call mode, the mobile terminal displays a user interface (UI) or a graphic user interface (GUI) related to the call. When the mobile terminal 100 is in a video call mode or a photographing mode, the mobile terminal 100 displays photographed and / or received images, a UI, and a GUI.
  • UI user interface
  • GUI graphic user interface
  • the display unit 151 may be a liquid crystal display, a thin film transistor liquid crystal display, an organic light emitting diode, a flexible display, or a 3D display. It may include at least one.
  • Some of these displays can be configured to be transparent or light transmissive so that they can be seen from the outside. This may be referred to as a transparent display.
  • a representative example of the transparent display is a transparent LCD.
  • the rear structure of the display unit 151 may also be configured as a light transmissive structure. With this structure, the user can see the object located behind the terminal body through the area occupied by the display unit 151 of the terminal body.
  • a plurality of display units may be spaced apart or integrally disposed on one surface of the mobile terminal 100, or may be disposed on different surfaces, respectively.
  • the display unit 151 and a sensor for detecting a touch operation form a mutual layer structure (hereinafter, abbreviated as “touch screen”)
  • the display unit 151 is an output device. It can also be used as an input device.
  • the touch sensor may have, for example, a form of a touch film, a touch sheet, a touch pad, or the like.
  • the touch sensor may be configured to convert a change in pressure applied to a specific portion of the display unit 151 or capacitance generated in a specific portion of the display unit 151 into an electrical input signal.
  • the touch sensor may be configured to detect not only the position and area of the touch but also the pressure at the touch.
  • the touch controller processes the signal (s) and then transmits the corresponding data to the controller 180. As a result, the controller 180 can know which area of the display unit 151 is touched.
  • a proximity sensor may be disposed in an inner region of a mobile terminal surrounded by the touch screen or near the touch screen.
  • the proximity sensor refers to a sensor that detects the presence or absence of an object approaching a predetermined detection surface or an object present in the vicinity without using mechanical force by using electromagnetic force or infrared rays.
  • Proximity sensors have a longer life and higher utilization than touch sensors.
  • the proximity sensor examples include a transmission photoelectric sensor, a direct reflection photoelectric sensor, a mirror reflection photoelectric sensor, a high frequency oscillation proximity sensor, a capacitive proximity sensor, a magnetic proximity sensor, and an infrared proximity sensor.
  • the touch screen When the touch screen is capacitive, the touch screen is configured to detect the proximity of the pointer by the change of the electric field according to the proximity of the pointer.
  • the touch screen touch sensor
  • the touch screen may be classified as a proximity sensor.
  • the act of allowing the pointer to be recognized without being in contact with the touch screen so that the pointer is located on the touch screen is referred to as a "proximity touch", and the touch
  • the act of actually touching the pointer on the screen is called “contact touch.”
  • the position where the proximity touch is performed by the pointer on the touch screen refers to a position where the pointer is perpendicular to the touch screen when the pointer is in proximity proximity.
  • the proximity sensor detects a proximity touch and a proximity touch pattern (eg, a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, and a proximity touch movement state).
  • a proximity touch and a proximity touch pattern eg, a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, and a proximity touch movement state.
  • Information corresponding to the sensed proximity touch operation and proximity touch pattern may be output on the touch screen.
  • the sound output module 152 may output audio data received from the wireless communication unit 110 or stored in the memory unit 160 in a call signal reception, a call mode or a recording mode, a voice recognition mode, a broadcast reception mode, and the like.
  • the sound output module 152 outputs a sound signal related to a function (for example, a call signal reception sound and a message reception sound) performed in the mobile terminal 100.
  • the sound output module 152 may include a receiver, a speaker, a buzzer, and the like.
  • the alarm unit 153 outputs a signal for notifying occurrence of an event of the mobile terminal 100. Examples of events occurring in the mobile terminal include call signal reception, message reception, key signal input, and touch input.
  • the alarm unit 153 may output a signal for notifying occurrence of an event in a form other than a video signal or an audio signal, for example, vibration.
  • the video signal or the audio signal may also be output through the display unit 151 or the audio output module 152.
  • the haptic module 154 generates various haptic effects that a user can feel. Vibration is a representative example of the haptic effect generated by the haptic module 154.
  • the intensity and pattern of vibration generated by the haptic module 154 can be controlled. For example, different vibrations may be synthesized and output or may be sequentially output.
  • the haptic module 154 may be used for the effects of stimulation by the arrangement of pins vertically moving with respect to the contact skin surface, the effect of the jetting force of the air through the injection or inlet or the stimulation through the suction force, and the stimulation that strikes the skin surface.
  • Various tactile effects may be generated, such as effects by stimulation through contact of electrodes, effects by stimulation using electrostatic force, and effects of reproducing a sense of warmth and heat using an endothermic or heat generating element.
  • the haptic module 154 may not only deliver the haptic effect through direct contact, but also implement the haptic effect through the muscle sense of the user's finger or arm. Two or more haptic modules 154 may be provided according to a configuration aspect of the mobile terminal 100.
  • the memory unit 160 may store a program for the operation of the controller 180 and may temporarily store input / output data (for example, a phone book, a message, a still image, a video, etc.).
  • the memory unit 160 may store data regarding vibration and sound of various patterns output when a touch input on the touch screen is performed.
  • the memory unit 160 may include a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (for example, SD or XD memory), At least one of Random Access Memory (RAM), Static Random Access Memory (SRAM), ReadOnly Memory (ROM), Electrically Erasable Programmable ReadOnly Memory (EEPROM), Programmable ReadOnly Memory (PROM) magnetic memory, magnetic disk, and optical disk It may include a storage medium of the type.
  • the mobile terminal 100 may operate in association with a web storage that performs a storage function of the memory unit 160 on the Internet.
  • the interface unit 170 serves as a path with all external devices connected to the mobile terminal 100.
  • the interface unit 170 receives data from an external device or receives power and transmits the data to each component inside the mobile terminal 100 or transmits the data inside the mobile terminal 100 to an external device.
  • wired / wireless headset ports, external charger ports, wired / wireless data ports, memory card ports, ports for connecting devices with identification modules, audio input / output (I / O) ports, The video input / output (I / O) port, the earphone port, and the like may be included in the interface unit 170.
  • the identification module is a chip that stores various types of information for authenticating the usage rights of the mobile terminal 100, and includes a user identification module (UIM), a subscriber identify module (SIM), and a universal user authentication module ( Universal Subscriber Identity Module (USIM), and the like.
  • a device equipped with an identification module (hereinafter referred to as an 'identification device') may be manufactured in the form of a smart card. Therefore, the identification device may be connected to the terminal 100 through a port.
  • the interface unit may be a passage through which power from the cradle is supplied to the mobile terminal 100 when the mobile terminal 100 is connected to an external cradle, or various command signals input from the cradle by a user may be moved. It may be a passage that is delivered to the terminal. Various command signals or power input from the cradle may be operated as signals for recognizing that the mobile terminal is correctly mounted on the cradle.
  • the controller 180 typically controls the overall operation of the mobile terminal. For example, perform related control and processing for voice calls, data communications, video calls, and the like.
  • the controller 180 may include a multimedia module 181 for playing multimedia.
  • the multimedia module 181 may be implemented in the controller 180 or may be implemented separately from the controller 180.
  • the controller 180 may perform a pattern recognition process for recognizing a writing input or a drawing input performed on the touch screen as text and an image, respectively.
  • the power supply unit 190 receives an external power source and an internal power source under the control of the controller 180 to supply power for operation of each component.
  • Various embodiments described herein may be implemented in a recording medium readable by a computer or similar device using, for example, software, hardware or a combination thereof.
  • embodiments described herein include application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays (FPGAs), and the like. It may be implemented using at least one of processors, controllers, microcontrollers, microprocessors, and electrical units for performing the functions. 180).
  • ASICs application specific integrated circuits
  • DSPs digital signal processors
  • DSPDs digital signal processing devices
  • PLDs programmable logic devices
  • FPGAs field programmable gate arrays
  • embodiments such as procedures or functions may be implemented with separate software modules that allow at least one function or operation to be performed.
  • the software code may be implemented by a software application written in a suitable programming language.
  • the software code may be stored in the memory unit 160 and executed by the controller 180.
  • FIG. 2 is a diagram illustrating a TTS system of a mobile terminal according to an embodiment of the present invention.
  • the mobile terminal 100 may output text as a voice through a TTS system.
  • the Text-To-Speech (TTS) system is a system capable of converting selected text into voice and outputting it.
  • the TTS system may be used for a spoken dialog system service, a call center service, a voice enabled web service, an email service, and the like.
  • the text may be changed to voice and output.
  • the TTS system can be used in the following cases. For example, if the TTS system is running with text selected, the text can be read aloud without the user visually checking it. So you can check the text you want while driving or working.
  • the TTS system may include a front-end part 187 and a back-end part 184.
  • the front end part 187 may be a part that receives the text T and outputs a symbolic linguistic representation (R).
  • the front end part 187 may include a normalization module 182 and a processing module 183.
  • the normalization module 182 may perform a morphological analysis of identifying plural forms and past tense, converting monetary units, numeric units, abbreviations, and the like into readable words in the input text T. .
  • the normalization module 182 may perform a syntactic-sematic analysis, check parts of speech (POS) of words, or predict a syntax-mean structure of a sentence. .
  • the processing module 183 may perform a task of differentiating a word into a phrase based on a result of syntax-meaning analysis of the character. In addition, the processing module 183 may predict semantic features including stress accents, focus.
  • the back end part 184 may receive the sign speech expression R that is the result of the front end part 187 and output the voice data S.
  • FIG. The back end part 183 may include a unit selection module 185 and a synthesizing module 186.
  • the unit selection module 185 may select a unit from the database 161 based on the symbolic speech expression R.
  • FIG. The unit segregation module 185 can create a data structure that can arrange the selected units appropriately and output them as speech.
  • the database 161 may be a collection of recorded voice units.
  • the database is divided into phone, diphone, syllable, morpheme, word, phrase, clause, sentence, etc. It may contain a voice.
  • the divided speech unit may be subjected to a correction process by applying a waveform or a spectrogram method.
  • An index may correspond to each voice unit of the database 161. Indexes can be created based on parameters based on pitch, duration, position in syllables, relationship to adjacent notes, and the like. Synthesis of speech using the unit selection method can produce a more natural speech as the database 161 is larger.
  • the synthesizing module 186 may adjust the pitch of the data structure of the unit selected by the unit selection module 185 or the phoneme duration of the sound. Through the synthesizing module 186, the synthesized voice can be processed to be more natural and intelligible.
  • Speech data S may be a result of the backend part 184.
  • the voice data S may be transmitted to the sound output module 151 of FIG. 1 of the mobile terminal 100 and output as voice recognized through hearing.
  • FIG. 3 and 4 are diagrams illustrating a unit-selection process in the FIG. 2 TTS system.
  • the unit selection module 185 of the mobile terminal 100 can select an appropriate voice unit from the database 161.
  • the database 161 may include a plurality of pre-recorded voice units. For example, the text “Do you want some drink?” May be input.
  • the unit selection module 185 may include a phone, a phone, a syllable, and a syllable.
  • An appropriate voice may be selected from among morphemes, words, phrases, and sentences, that is, a voice corresponding to a specific word of want, some, and drink is selected from the database 161.
  • the selection of the unit may take into account the position of the word in the text.
  • the database 161 may include various voices with different intonations. Accents may be different even for the same word. For example, even in the case of drink, the accent is rising at the end of the question, and in the case of the written statement, the accent may be falling. Furthermore, in the case of past tense and past tense, the intonation may be different.
  • the unit selection module 185 selects and combines voices that may be optimal for the sentence from various voices included in the database 161 to create a natural and intelligible data structure. Can be.
  • Formation of the data structure of the voice using the unit selection module 185 may require a relatively long time since the process of selecting and combining a specific voice from the large-capacity database 161 is performed. That is, in the process of generating the voice data S using the TTS, it means that the time and resources required for the process of combining the voice in the unit selection module 185 may be large.
  • a certain delay may occur in outputting text to speech. Delays in the process of outputting text to speech can be divided into several parts as follows. First, there may be a delay occurring in the process of outputting voice using TTS for the first time. Second, there may be a delay that occurs in the process of moving to output the voice of a part other than the part currently being reproduced in the process of outputting the voice.
  • the mobile terminal 100 may store the generated voice data to a certain degree. Therefore, when the same part is to be output again, the previously generated voice data can be used. If the stored voice data is used, the unit selection process and the like can be omitted. Therefore, the delay experienced by the user can be significantly reduced.
  • FIG. 5 is a flowchart illustrating an operation process of a mobile terminal according to an embodiment of the present invention.
  • the controller 180 of the mobile terminal 100 may perform step S10 of entering the voice output mode.
  • the voice output mode may be a mode in which a series of processes of converting the text T into voice data S and outputting the voice data to the sound output module 152 is performed as described above.
  • the voice output mode may be performed by a user selecting a specific menu or by a control signal of the controller 180.
  • step S20 of setting a range of voice output may be performed.
  • the range of the audio output may be all or part of the selected text T.
  • the text T may be stored in the memory 160 of the mobile terminal 100.
  • the memory 160 may be various means for storing data permanently, semi-permanently, and temporarily.
  • the range of the voice output may be determined by a control operation of the controller 180 or a user's selection. For example, the user may select a specific portion of the text by performing a touch operation. This will be described in more detail in the corresponding section.
  • the text in the range may be converted into voice data.
  • the process of converting the text into voice data may be performed through the front end part 187 and the back end part 184 as described above.
  • the method may include outputting a voice (S40) and storing the converted voice data (S50).
  • the controller 180 transmits the voice data to the sound output module 152 so that the user can recognize the voice through hearing.
  • the controller 180 may store the converted voice data in the memory 160.
  • Steps of determining whether to output the voice by repeating the text within the range (S60) and outputting the voice based on the stored voice data when the voice is repeatedly output (S70) may be performed.
  • the text converted into voice may be repeatedly output by a control signal of the controller 180 or by a user's selection.
  • the text may be composed of A, B, C, and D.
  • the A, B, and C portions may be output as voices. In such a situation, the user may want to hear part A again.
  • the controller 180 may output a voice using previously stored voice data. That is, it means that the TTS process including the unit selection may not be performed again. Since the TTS process may not be performed again, the time required to output the voice may be shortened. Therefore, the effect of improving the usability of the mobile terminal 100 can be expected.
  • FIG. 6 is a diagram illustrating a state in which text is displayed on the mobile terminal of FIG. 5.
  • the controller 180 of the mobile terminal 100 may display the text T on the display 151.
  • the text T may include various contents represented by text, such as a specific document, a web page, a text message, and an e-mail stored by a user.
  • the controller 180 can display a voice switching button TM.
  • the voice switching button TM may be selectively displayed when the text T is displayed on the display 151. For example, although not normally displayed, it means that the text may be in the form of a hidden menu displayed when the text T is displayed. When the voice switching button TM is selected, the displayed text T may be output as voice.
  • the voice output of the text T may be performed by a button provided in the mobile terminal 100.
  • a button provided in the mobile terminal 100.
  • the function selection button PB of the mobile terminal 100 it means that the voice switching function can be executed.
  • the voice output is made by using the function selection button PB which can feel physical touch, the voice output function can be executed without looking at the display 151 of the mobile terminal 100.
  • FIG. 7 is a diagram illustrating a state in which a TTS operation is performed in the mobile terminal of FIG. 5.
  • the mobile terminal 100 may perform a voice output function.
  • the voice output function may be executed. That is, the control unit 180 means that the selected text T can be TTS-converted and output as voice.
  • the voice may be output to the sound output module 152 of the mobile terminal 100. Since the text T is output as a voice, the user may recognize the text T while driving or performing other tasks.
  • voice data may be stored in the memory 160.
  • FIG. 8 to 10 are diagrams illustrating a process of re-outputting a voice output from the mobile terminal of FIG. 5.
  • the controller 180 of the mobile terminal 100 may display an indicator (IC) indicating a current position output by voice.
  • the controller 180 may display the output portion ATS, which is output as a voice, separately from the non-output portion BTS.
  • the indicator IC may move along the point where the current voice is output on the text T. That is, when the voice is output, it means that the position of the indicator IC can be continuously moved. By displaying the indicator IC, the user can visually recognize the current output position.
  • the output portion ATS and the non-output portion BTS may be displayed differently in color, brightness, and the like.
  • the controller 180 may display the output portion ATS, which is already output as voice, darkly, and display the non-output portion BTS, which is not yet output, brightly.
  • the mobile terminal 100 may change a position to be reproduced by a user's touch operation.
  • the user may change the position of the indicator IC with the finger F or the like. For example, it means that the user may touch the indicator IC and drag to the specific part of the output part ATS which has been previously reproduced. When the user performs a touch and drag operation, the indicator IC may be moved correspondingly.
  • the controller 180 may output a voice from the position.
  • the portion output by the controller 180 may be a portion that has been output before.
  • the controller 180 can search for voice data stored in the memory 160.
  • voice data converted through a TTS process may be stored.
  • the controller 180 may again output a portion selected by the user from the voice data stored in the memory 160. Since the user does not have to perform the TTS for the portion selected by the user, the time delay for outputting the voice of the portion can be reduced.
  • the reduction of the time delay can be more clearly understood when considering the case of newly converting to voice because there is no voice data for the corresponding part.
  • the mobile terminal 100 according to an embodiment of the present invention, it is possible to contribute to the spread of demand for voice service using the mobile terminal 100 due to the fast response due to the need for a new process of converting to voice.
  • FIG. 11 is a graph illustrating an effect according to the mobile terminal of FIG. 5.
  • the mobile terminal 100 may exhibit an effect of reducing time delay compared to the related art.
  • a user may select a voice output function using the TTS function at a specific time point.
  • the controller 180 may go through a preparation process for outputting a voice until time t1.
  • the voice output SP may be performed.
  • the voice output SP may continue up to a time t2 when the user inputs the output to be output again at a specific time in the past.
  • the controller 180 can output a voice.
  • the mobile terminal 100 has a time delay even when the user selects a previously output portion at a time t2 during which voice is being output. Can be prevented from substantially occurring. In other words, it means that the time delay can be minimized because the previously converted voice data can be used for the voice output without a new TTS process. Accordingly, the user of the mobile terminal 100 may move to a specific time point and re-output the voice without feeling discomfort.
  • the controller 180 of the mobile terminal 100 may control the operation of the mobile terminal 100 in response to various touch operations of the user.
  • the controller 180 of the mobile terminal 100 may convert text T into voice and output the voice.
  • the user may touch the display 151 to perform a touch operation of dragging the first to second drags D1 and D2.
  • the first to second drags D1 and D2 may be circular drags. That is, it means that the drag operation may be performed while rotating clockwise or counterclockwise at the point where the finger F is first touched.
  • the controller 180 may move and display the indicator IC corresponding to the direction. That is, it means that the playback position can be moved forward or backward of the current position.
  • Positions of the first and second indicators IC1 and IC2 that are moved according to lengths, speeds, and the like of the first to second drags D1 and D2 may vary. For example, when the first drag D1 is faster or longer than the reference speed, the first indicator IC1 may move in paragraph units. In contrast, when the first drag D1 is slower or shorter than the reference speed, the first indicator IC1 may move in units of words.
  • the user may touch the display 151 and drag the third to fourth drags D3 and D4 to output the voice.
  • the third to fourth drags D3 and D4 may be drag operations that move from the left touch point to the right touch point with the finger F or the like.
  • the controller 180 may move and display the indicator IC in units of sentences. That is, it means that the voice can be output by moving to the front sentence or the rear sentence of the sentence currently being played.
  • the user may touch the display 151 to perform the fifth to sixth drag operations D5 and D6 during the voice output process.
  • the fifth to sixth drags D5 and D6 may be drags in the vertical direction. That is, it means that the drag operation may be performed upwards or downwards at the point where the finger F is first touched.
  • the controller 180 may change the playback speed of the voice. For example, when the fifth drag D5 is input, the playback speed is increased, and when the sixth drag D6 is input, the playback speed is decreased.
  • the fifth and sixth drags D5 and D6 dragging upward and downward may correspond to a function of adjusting the volume.
  • the user may multi-touch the display 151 to perform a touch operation of dragging the seventh to tenth (D7 to D10).
  • the seventh to tenth drags D7 to D10 may be touch operations in which the distance between the multi-touched first and second fingers F1 and F2 is closer or further away.
  • the controller 180 may change the playback speed of the voice.
  • the reproduction speed of the voice may be changed in different forms according to a preset value.
  • the user may perform an operation of changing the playback speed of the voice at time t1 to t5.
  • the controller 180 may cause the playback speed to change rapidly at that time. That is, when the existing playback speed is v1, it means that it can be rapidly shifted to v2, which is the changed playback speed.
  • the user may perform an operation of changing the playback speed of the voice at time points t1, t3, t5, and t7.
  • the controller 180 may sequentially increase or decrease the playback speed of the voice from that point in time. For example, when the user performs a touch operation to increase the playback speed of the voice at time t1, the controller 180 may allow the playback speed of the voice to be sequentially increased little by little until the time t2.
  • the user may perform a desired touch operation after touching a specific point of the display 151 with the finger F.
  • FIG. For example, it may be dragged clockwise or counterclockwise, dragged up and down, or dragged left and right.
  • the controller 180 may perform a specific function corresponding to the drag direction of the user.
  • the user may perform an operation of touching a specific point of the display 151 with the finger F.
  • FIG. 19 in the voice output process, the user may perform an operation of touching a specific point of the display 151 with the finger F.
  • the controller 180 may stop the output of the voice. In addition, when the display 151 is touched again in the stopped state, the controller 180 may cause the output to be stopped again.
  • the eleventh drag D11 may be a touch operation of touching a point and dragging it to the left.
  • the controller 180 may output a voice from a point where the touch is started.
  • the controller 180 may move and display the indicator IC to the point where the touch is started.
  • the touch operation of touching the display 151 and dragging the twelfth D12 by a predetermined distance may be performed.
  • the twelfth drag D12 may be a touch operation of touching one point and dragging it to an end point desired by the user.
  • the controller 180 may convert text within a range included in the twelfth drag D12 into voice and output the voice. That is, the twelfth drag D12 may be a touch operation for selecting a section to be output as voice.
  • a touch operation for multi-touching the display 151 may be performed.
  • the first and second fingers F1 and F2 performing multi-touch may be operations of touching the start point and the end point of the section to be output as voice.
  • the controller 180 may output text in a corresponding section as voice.
  • 23 and 24 illustrate an operation for setting of the mobile terminal of FIG. 5.
  • the controller 180 of the mobile terminal 100 can change the state in which the voice is output.
  • the display 151 may display a first popup window P1 for selecting a type of voice. For example, you can choose a specific voice from among young men, older men, young women, and older women.
  • the display 151 may display a second pop-up window P2 for selecting a playback speed of voice. For example, it means that you can select a specific speed yourself. Furthermore, among the selection options of the playback speed, there may be a process of completing the audio output for the selected text within a certain time. For example, it means that the output of the voice for the portion can be terminated within 5 minutes.
  • 25 to 27 are diagrams illustrating operations of the mobile terminal of FIG. 5.
  • the controller 180 of the mobile terminal 100 can minimize the time delay by performing the TTS function in advance when the user's touch operation is performed.
  • a touchdown may occur when a user touches the display 151 to execute a specific function at a time t0.
  • the touch operation is a simple touch that is touched up at the location after the touchdown, the touchdown position is continuously moved after the touchdown, and the touch is dragged up at a specific location, and the touchdown is over a certain time after the touchdown. This may be divided into long touch and the like which are touched up after being maintained at the position.
  • the controller 180 may determine whether the touch operation is performed for what function, as described above, after the touch-up signal is input. Therefore, when the touchdown operation is input at the time t0, the conventional TTS system starts the TTS operation after waiting until the time t1 at which the touchup operation is input. When the TTS operation is started at time t1, the output of the voice may be started at time t2 after performing a series of preparation operations. Therefore, a time delay occurs from time t0, at which time the user intends to perform the TTS operation, to time t2 at which the voice is actually output.
  • the TTS system when the touchdown signal is input at the time t0, the TTS system according to an embodiment of the present invention may immediately start the TTS operation. Therefore, when the touch-up signal is input at the time t1, the voice output can be started substantially simultaneously or within a very short time. As a result, there is an effect that the time delay can be reduced by the time between t1 and t2.
  • the controller 180 of the mobile terminal 100 is performing a voice output for the text T or a state in which the voice output is stopped at a specific point. Can be.
  • the user may touch the display 151 with the finger F or the like. That is, it means that the controller 180 can obtain a touchdown signal.
  • the controller 180 may perform a TTS operation on a portion of the portion not yet reproduced.
  • the first to seventh conversion areas PT1 to PT7 may be areas in which the controller 180 performs a TTS operation performed in advance in response to a user's touchdown signal. Since the front part of the specific sentence which has not been reproduced is previously TTS-converted by a predetermined area, a quick voice output may be possible when the user selects one of the first to seventh conversion areas PT1 to PT7.
  • the first to seventh conversion areas PT1 to PT7 may belong to the non-output part BTS in which audio is not output. That is, in the case of the output portion ATS in which voice data output as voice is present, voice can be output quickly at any time when the user selects it. On the contrary, if a specific point is selected from the non-output part BTS due to the absence of voice data, a time delay may occur due to a pre-operation for outputting voice.
  • the mobile terminal 100 may minimize time delay by converting a predetermined area of the non-output portion BTS in advance.
  • the first to seventh conversion areas PT1 to PT7 may be portions that are highly likely to be selected by a user among the non-output parts BTS.
  • the first to seventh conversion areas PT1 to PT7 are the first part of an independent sentence, the first part of a paragraph, a point previously designated by a user as a favorite, or the part that the user repeatedly selects in the past. Can be.
  • the controller 180 of the mobile terminal 100 may perform voice output for the highlight areas H1 to H3.
  • the first to third highlight areas H1 to H3 may be areas selected by a user. Further, the first to third highlight areas H1 to H3 may be information obtained through the wireless communication unit 110.
  • the first to third highlight areas H1 to H3 may be designated by the user as important or tagged by the user as major.
  • the controller 180 may store voice data in advance through the TTS regardless of whether the first to third highlight areas H1 to H3 are pre-played.
  • the first to third highlight areas H1 to H3 are highly likely to be reproduced by the user. Therefore, by storing the voice data of the corresponding portion, it means that the user can enable playback without time delay when the user selects the corresponding portion.
  • FIG. 28 is a diagram illustrating a battery-related operation of the mobile terminal of FIG. 5.
  • the controller 180 of the mobile terminal 100 may control the voice output in relation to the battery remaining amount of the mobile terminal 100.
  • the controller 180 may determine whether the battery charge of the mobile terminal 100 is equal to or less than a predetermined level. If the amount of charge of the battery is less than or equal to a predetermined level, the brightness of the display unit 151 and / or the volume of the sound output module 152 may be adjusted. The controller 180 may sequentially reduce the brightness of the display unit 151 and / or the volume of the sound output module 152 according to the amount of charge of the battery.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

이동 단말기 및 그 제어방법이 개시된다. 본 발명의 이동 단말기 및 그 제어방법은, 음향출력 모듈; 텍스트가 저장된 메모리; 및 텍스트 중 적어도 일부를 음성으로 변환하여 음향출력 모듈을 통하여 출력하는 제어부를 포함하되, 제어부는, 음성으로 변환하여 출력한 음성데이터 중 적어도 일부를 메모리에 저장하고, 적어도 일부의 텍스트에 대한 음성출력 신호를 획득하면 저장한 음성데이터에 기초한 음성을 음향출력 모듈로 출력하는 것을 특징으로 한다. 본 발명에 의하면, 음성으로 출력된 부분에 대한 음성출력 신호를 획득하면 저장한 음성데이터에 기초하여 음성을 출력함으로써, 음성의 출력에 소요되는 시간을 단축할 수 있다.

Description

이동 단말기 및 그 제어방법
본 발명은 이동 단말기 및 그 제어방법에 관한 것으로서, 보다 구체적으로는 음성으로 출력된 부분에 대한 음성출력 신호를 획득하면 저장한 음성데이터에 기초하여 음성을 출력함으로써, 음성의 출력에 소요되는 시간을 단축할 수 있는 이동 단말기 및 그 제어방법에 관한 것이다.
개인용 컴퓨터, 노트북, 휴대폰 등과 같은 단말기(terminal)는 기능이 다양화됨에 따라 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송의 수신 등의 복합적인 기능들을 갖춘 멀티미디어 기기(Multimedia player) 형태로 구현되고 있다.
단말기는 이동 가능 여부에 따라 이동 단말기(mobile terminal) 및 고정 단말기(stationary terminal)로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mount terminal)로 나뉠 수 있다.
단말기의 기능 지지 및 증대를 위해, 단말기의 구조적인 부분 및/또는 소프트웨어적인 부분을 개량하는 것이 고려되고 있다.
최근 이동 단말기를 포함한 다양한 단말기들은 복합적이고 다양한 기능들을 제공함에 따라 메뉴 구조 또한 복잡해지는 추세이다. 또한 이동 단말기로 웹페이지를 포함하는 각종 디지털문서를 디스플레이할 수 있는 기능이 추가되고 있다.
본 발명은 음성으로 출력된 부분에 대한 음성출력 신호를 획득하면 저장한 음성데이터에 기초하여 음성을 출력함으로써, 음성의 출력에 소요되는 시간을 단축할 수 있는 이동 단말기 및 그 제어방법에 관한 것이다.
상기한 과제를 실현하기 위한 본 발명의 일 실시예에 따른 이동 단말기는, 음향출력 모듈; 텍스트가 저장된 메모리; 및 상기 텍스트 중 적어도 일부를 음성으로 변환하여 상기 음향출력 모듈을 통하여 출력하는 제어부를 포함하되, 상기 제어부는, 상기 음성으로 변환하여 출력한 음성데이터 중 적어도 일부를 상기 메모리에 저장하고, 상기 적어도 일부의 텍스트에 대한 음성출력 신호를 획득하면 상기 저장한 음성데이터에 기초한 음성을 상기 음향출력 모듈로 출력하는 것을 특징으로할 수 있다.
상기 메모리에는, 적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성(recorded speech)을 포함하는 데이터베이스가 더 저장되어 있으며, 상기 제어부는, 상기 녹음된 음성 중, 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성데이터를 생성할 수 있다.
상기 제어부는, 상기 조합하여 생성한 음성데이터를 상기 메모리에 저장하여, 상기 적어도 일부의 텍스트에 대한 반복 출력시에, 상기 음성데이터의 조합 없이 상기 저장한 음성데이터에 기초한 음성을 출력할 수 있다.
상기 제어부는, 터치신호를 획득하면, 상기 음성의 재생속성을 변경할 수 있다.
상기 재생속성은, 상기 텍스트 중에서 상기 음성이 출력되는 위치, 상가 텍스트 중에서 상기 음성이 출력되는 범위, 상기 음성의 반복출력여부, 상기 음성의 출력여부, 상기 음성의 볼륨, 상기 음성의 출력속도, 상기 음성의 피치(pitch) 중 적어도 하나일 수 있다.
상기 제어부는, 상기 터치신호의 방향, 거리, 지속시간 중 적어도 하나에 따라 상기 재생속성을 변경할 수 있다.
상기 제어부는, 상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시할 수 있다.
상기 제어부는, 상기 인디케이터의 위치를 변경하는 터치신호를 획득하면, 상기 인디케이터의 변경된 위치에 대응된 텍스트를 상기 음성으로 출력할 수 있다.
상기 제어부는, 상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시할 수 있다.
상기 제어부는, 설정된 시간 내에 상기 텍스트 중 적어도 일부가 음성으로 출력되도록 상기 음성의 출력속도를 조절할 수 있다.
상기 제어부는, 터치신호를 획득하면 상기 텍스트에 대한 음성 변환을 개시하되, 상기 음성 변환이 개시되도록 하는 터치신호는, 터치신호가 발생되는 터치다운 신호일 수 있다.
상기 제어부는, 상기 터치다운 신호가 입력되면, 상기 텍스트 내의 서로 이격된 적어도 두 영역에 대한 상기 음성 변환을 개시할 수 있다.
상기 제어부는, 상기 터치다운 신호가 입력되면, 상기 텍스트 중에서 상기 음성으로 출력되지 않은 부분 중 적어도 일부에 대한 상기 음성 변환을 개시할 수 있다.
또한, 상기한 과제를 실현하기 위한 본 발명의 일 실시예에 따른 이동 단말기는, 음향출력 모듈; 텍스트가 저장된 메모리; 및 상기 텍스트 중 적어도 일부를 음성으로 변환하여 상기 음향출력 모듈을 통하여 출력하는 제어부를 포함하되, 상기 제어부는, 상기 출력한 음성 중 적어도 일부를 재 출력하는 신호를 획득한 경우에, 상기 메모리에 저장된 상기 음성의 음성데이터를 사용하여 상기 음성 중 적어도 일부를 재 출력하는 것을 특징으로 할 수 있다.
상기 메모리에는, 적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성(recorded speech)을 포함하는 데이터베이스가 더 저장되어 있으며, 상기 제어부는, 상기 녹음된 음성 중 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성데이터를 생성할 수 있다.
상기 제어부는, 터치신호를 획득하면, 상기 음성의 재생속성을 변경할 수 있다.
상기 제어부는, 상기 터치신호의 방향, 거리, 지속시간 중 적어도 하나에 따라 상기 재생속성을 변경할 수 있다.
상기 제어부는, 상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시할 수 있다.
상기 제어부는, 상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시할 수 있다.
상기 제어부는, 터치신호를 획득하면 상기 텍스트에 대한 음성 변환을 개시하되, 상기 음성 변환이 개시되도록 하는 터치신호는, 터치신호가 발생되는 터치다운 신호일 수 있다.
또한, 상기한 과제를 실현하기 위한 본 발명의 일 실시예에 따른 이동 단말기의 제어방법은, 음성출력모드에 진입하는 단계; 텍스트 중 적어도 일부를 음성데이터로 변환하여 음성으로 출력하는 단계; 상기 음성데이터 중 적어도 일부를 저장하는 단계; 및 상기 음성으로 출력한 텍스트에 대한 음성출력 신호를 획득하면, 상기 저정한 음성데이터에 기초한 음성을 출력하는 단계를 포함할 수 있다.
상기 음성데이터로 변환하여 음성으로 출력하는 단계는, 데이터베이스에 저장된 적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성 중, 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성테이터로 변환하는 단계를 포함할 수 있다.
터치신호를 획득하는 단계; 및 상기 획득한 터치신호에 기초하여 상기 음성의 출력속성을 변경하는 단계를 더 포함할 수 있다.
상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시하는 단계를 더 포함할 수 있다.
상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시하는 단계를 더 포함할 수 있다.
상기 음성데이터의 변환은, 터치신호가 발생되는 터치다운 신호를 획득하면 개시될 수 있다.
본 발명에 따른 이동 단말기 및 그 제어방법은, 음성으로 출력된 부분에 대한 음성출력 신호를 획득하면 저장한 음성데이터에 기초하여 음성을 출력함으로써, 음성의 출력에 소요되는 시간을 단축할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도(block diagram)이다.
도 2는 본 발명의 일 실시예에 따른 이동 단말기의 TTS 시스템을 도시한 도면이다.
도 3 및 도 4는 도 2 TTS 시스템에서의 unit-selection 과정을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 이동 단말기의 동작과정을 도시한 플로우챠트이다.
도 6은 도 5 이동 단말기에 텍스트가 표시된 상태를 도시한 도면이다.
도 7은 도 5 이동 단말기에서 TTS 동작이 이루어지는 상태를 도시한 도면이다.
도 8 내지 도 10은 도 5 이동 단말기에서 출력되었던 음성을 재출력하는 과정을 도시한 도면이다.
도 11은 도 5 이동 단말기에 따른 효과를 도시한 그래프이다.
도 12 내지 도 22는 도 5 이동 단말기에 대한 조작에 대응한 동작을 도시한 도면이다.
도 23 및 도 24는 도 5 이동 단말기의 설정에 대한 조작을 도시한 도면이다.
도 25 내지 도 27은 도 5 이동 단말기의 동작을 도시한 도면이다.
도 28은 도 5 이동 단말기의 배터리 관련 동작을 도시한 도면이다.
본 발명의 상술한 목적, 특징들 및 장점은 첨부된 도면과 관련된 다음의 상세한 설명을 통해 보다 분명해질 것이다. 다만, 본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예들을 가질 수 있는 바, 이하에서는 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다. 명세서 전체에 걸쳐서 동일한 참조번호들은 원칙적으로 동일한 구성요소들을 나타낸다. 또한, 본 발명과 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다
이하, 본 발명과 관련된 이동 단말기에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 등이 포함될 수 있다. 그러나, 본 명세서에 기재된 실시예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.
도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도(block diagram)이다.
상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리부(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기를 구현될 수도 있다.
이하, 상기 구성요소들에 대해 차례로 살펴본다.
무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 사이 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.
방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다.
상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.
상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.
상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVBH(Digital Video BroadcastHandheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.
상기 방송 수신 모듈(111)은, 각종 방송 시스템을 이용하여 방송 신호를 수신하는데, 특히, DMBT(Digital Multimedia BroadcastingTerrestrial), DMBS(Digital Multimedia BroadcastingSatellite), MediaFLO(Media Forward Link Only), DVBH(Digital Video BroadcastHandheld), ISDBT(Integrated Services Digital BroadcastTerrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 방송 신호를 제공하는 다른 방송 시스템에 적합하도록 구성될 수도 있다.
방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리부(160)에 저장될 수 있다.
이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 무선 인터넷 모듈(113)은 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(WiFi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.
근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.
위치정보 모듈(115)은 이동 단말기의 위치를 확인하거나 얻기 위한 모듈이다. 상기 위치정보 모듈의 대표적인 예로는 GPS(Global Position System) 모듈이 있다. 현재 기술에 의하면, 상기 GPS모듈(115)은, 일 지점(개체)이 3개 이상의 위성으로부터 떨어진 거리에 관한 정보와, 상기 거리 정보가 측정된 시간에 관한 정보를 산출한 다음 상기 산출된 거리 정보에 삼각법을 적용함으로써, 일 시간에 일 지점(개체)에 대한 위도, 경도, 및 고도에 따른 3차원의 위치 정보를 산출할 수 있다. 나아가, 3개의 위성을 이용하여 위치 및 시간 정보를 산출하고, 또 다른 1개의 위성을 이용하여 상기 산출된 위치 및 시간 정보의 오차를 수정하는 방법 또한 사용되고 있다. GPS 모듈(115)은 현 위치를 실시간으로 계속 산출하고 그를 이용하여 속도 정보를 산출하기도 한다.
도 1을 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.
카메라(121)에서 처리된 화상 프레임은 메모리부(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 단말기의 구성 태양에 따라 2개 이상이 구비될 수도 있다.
마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.
센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등과 관련된 센싱 기능을 담당할 수도 있다. 한편, 상기 센싱부(140)는 근접센서를 포함할 수 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(152), 알람부(153), 및 햅틱 모듈(154) 등이 포함될 수 있다.
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시 출력한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.
디스플레이부(151)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistorliquid crystal display), 유기 발광 다이오드(organic lightemitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다.
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 투명 LCD 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디의 후방에 위치한 사물을 볼 수 있다.
이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)이 2개 이상 존재할 수 있다. 예를 들어, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.
디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 약칭함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.
터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.
터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.
도 1을 참조하면, 상기 터치스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접센서가 배치될 수 있다. 상기 근접센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.
상기 근접센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접센서, 정전용량형 근접센서, 자기형 근접센서, 적외선 근접센서 등이 있다.
상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접센서로 분류될 수도 있다.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.
상기 근접센서는, 근접 터치 및 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.
음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리부(160)에 저장된 오디오 데이터를 출력할 수도 있다. 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력한다. 이러한 음향 출력 모듈(152)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 비디오 신호나 오디오 신호는 디스플레이부(151)이나 음성 출력 모듈(152)을 통해서도 출력될 수 있다.
햅틱 모듈(haptic module)(154)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(154)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(154)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.
햅틱 모듈(154)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열에 의한 자극에 의한 효과, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력을 통한 자극에 의한 효과, 피부 표면을 스치는 자극에 의한 효과, 전극(eletrode)의 접촉을 통한 자극에 의한 효과, 정전기력을 이용한 자극에 의한 효과, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.
햅틱 모듈(154)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자의 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(154)은 휴대 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
메모리부(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리부(160)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.
메모리부(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(ReadOnly Memory, ROM), EEPROM(Electrically Erasable Programmable ReadOnly Memory), PROM(Programmable ReadOnly Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리부(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.
인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달하거나 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(170)에 포함될 수 있다.
식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다.
상기 인터페이스부는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동 단말기로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동 단말기가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.
제어부(180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.
상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(microcontrollers), 마이크로 프로세서(microprocessors), 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 그러한 실시예들이 제어부(180)에 의해 구현될 수 있다.
소프트웨어적인 구현에 의하면, 절차나 기능과 같은 실시예들은 적어도 하나의 기능 또는 작동을 수행하게 하는 별개의 소프트웨어 모듈과 함께 구현될 수 있다. 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다. 또한, 소프트웨어 코드는 메모리부(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.
도 2는 본 발명의 일 실시예에 따른 이동 단말기의 TTS 시스템을 도시한 도면이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)는 TTS 시스템을 통하여 텍스트(text)를 음성(voice)으로 출력할 수 있다.
TTS(Text-To-Speech) 시스템은, 선택된 텍스트를 음성으로 바꾸어 출력할 수 있는 시스템이다. TTS 시스템은, 대화형 시스템 서비스(spoken dialog system service), 콜 센터 서비스, 음성 제공 웹서비스(voice enabled web service), 이메일 서비스 등에 사용될 수 있다. 나아가, 본 발명의 일 실시예에 따른 이동 단말기(100)에서와 같이, 텍스트를 음성으로 변경하여 출력할 수도 있다,
이동 단말기(100)에 있어서, TTS 시스템은 다음과 같은 경우에 사용될 수 있다. 예를 들어, 텍스트를 선택한 상태에서 TTS 시스템이 작동되면, 사용자가 눈으로 확인하지 않아도 텍스트의 내용을 음성으로 확인할 수 있다. 따라서 운전이나 작업 중에 원하는 텍스트를 확인할 수 있다.
TTS 시스템은, 프론트앤드파트(front-end part, 187)와 백앤드파트(back-end part, 184)를 포함할 수 있다.
프론트앤드파트(187)는, 텍스트(T)를 입력받아 기호음성표현(symbolic linguistic representation, R)을 출력하는 부분일 수 있다. 프론트앤드파트(187)는 노멀리제이션 모듈(Normailization Module, 182)과 프로세싱 모듈(Processing Module, 183)을 포함할 수 있다.
노멀리제이션 모듈(182)은, 입력된 텍스트(T)에서 복수형 및 과거시제 등의 확인, 화폐단위, 숫자단위, 약어 등을 판독 가능한 단어로 변환하는 형태소 분석(Morphological Analysis)을 수행할 수 있다. 또한 노멀리제이션 모듈(182)은, 구문-의미 분석(Syntactic-Sematic Analysis)을 수행할 수 있으며, 단어들의 품사(Parts Of Speech, POS)를 확인하거나, 문장의 구문-의미 구조를 예측할 수 있다.
프로세싱 모듈(183)은, 문자의 구문-의미 분석 결과에 기초하여 단어를 구(phrase)로 분화하는 작업을 수행할 수 있다. 또한, 프로세싱 모듈(183)은 강세(stress) 악센트(accent), 강조어(focus)를 포함하는 의미론적 특징들을 예측할 수도 있다.
백앤드파트(184)는, 프론트앤드파트(187)의 결과물인 기호음성표현(R)을 수신하여 음성데이터(S)를 출력할 수 있다. 백앤드파트(183)는, 유닛셀렉션 모듈(Unit-selection Module, 185)과, 신서싸이징 모듈(Synthersizing Module, 186)을 포함할 수 있다.
유닛셀렉션 모듈(185)은, 기호음성표현(R)에 기초하여, 데이터베이스(161)로부터 유닛(unit)을 선택할 수 있다. 유닛셀렛션 모듈(185)은, 선택한 유닛을 적절히 배치하여 음성(speech)으로 출력할 수 있는 데이터 구조를 만들 수 있다.
데이터베이스(161)는, 녹음된 음성 유닛의 집합체일 수 있다. 데이터 베이스는, 단음(phone), 단음 간의 연음(diphone), 음절(syllable), 형태소(morpheme), 단어(word), 구(phrase), 절(clause), 문장(sentence) 등으로 구분된 녹음된 음성을 포함하고 있을 수 있다. 구분된 음성 유닛은 웨이브폼(waveform)이나 스팩토그램(spectogram) 방법을 적용하여 보정과정을 거치게 될 수 있다. 데이터베이스(161)의 각 음성 유닛(unit)에는 인덱스(index)가 대응될 수 있다. 인텍스는 음높이(pitch), 지속시간(duration), 음절에서의 위치, 인접한 음과의 관계 등에 기초한 파라미터(parameter)에 기초하여 만들어질 수 있다. 유닛셀렉션 방법을 이용하는 음성의 합성은, 데이터베이스(161)가 클수록 보다 자연스러운(natural) 음성을 만들어낼 수 있다.
신서싸이징 모듈(186)은, 유닛셀렉션 모듈(185)에 의하여 선택된 유닛의 데이터 구조의 음높이(pitch)나 음의 지속시간(phoneme duration) 등을 조절할 수 있다. 신서싸이징 모듈(186)을 거치며, 합성된 음성은 보다 자연스럽고(natural)하고 이해가능하도록(intelligible) 가공될 수 있다.
음성 데이터(speech date, S)는, 백앤드파트(184)의 결과물일 수 있다. 음성 데이터(S)는, 이동 단말기(100)의 음향출력 모듈(도 1의 151)로 송신되어, 청각을 통하여 인식되는 음성으로 출력될 수 있다.
도 3 및 도 4는 도 2 TTS 시스템에서의 unit-selection 과정을 도시한 도면이다.
이들 도면에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 유닛셀렉션모듈(185)은, 데이터베이스(161)로부터 적절한 음성 유닛을 선택할 수 있다.
도 3에 도시한 바와 같이, 데이터베이스(161)는 미리 녹음된 다수의 음성 유닛을 포함하고 있을 수 있다. 예를 들어, “Do you want some drink?"라는 텍스트가 입력될 수 있다. 유닛셀력션모듈(185)은, 텍스트를 구성하는 단음(phone), 단음 간의 연음(diphone), 음절(syllable), 형태소(morpheme), 단어(word), 구(phrase), 문장(sentence) 중 적에서 적절한 음성을 선택할 수 있다. 즉, 특정 단어인 want, some, drink에 대응된 음성을 데이터베이스(161)에서 선택하거나, do you 와 같은 구(phrase)를 선택하여 음성의 데이터 구조를 만들 수 있음을 의미한다.
도 4에 도시한 바와 같이, 유닛의 선택은 텍스트 내에서 그 단어의 위치가 고려될 수 있다.
데이터베이스(161)에는, 억양(intonation)이 다른 다양한 음성이 포함되어 있을 수 있다. 억양은, 동일한 단어의 경우에도 서로 다를 수 있다. 예를 들어, drink 의 경우에도, 의문문의 끝 부분에서는 억양이 상승하는 형태이고, 평서문의 경우엔느 억양이 하강하는 형태일 수 있다. 나아가, 과거형 및 과거분사형의 경우에는 억양이 달라질 수 있다.
유닛셀랙션모듈(185)은, 데이터베이스(161)에 포함되어 있는 다양한 음성에서 그 문장에 최적일 수 있는 음성을 선택하여 조합함으로써 자연스럽고(natural)하고 이해가능한(intelligible) 음성의 데이터 구조를 만들 수 있다.
유닛셀랙션모듈(185)을 이용한 음성의 데이터 구조의 형성은, 대용량의 데이터베이스(161)에서 특정한 음성을 선택하여 결합하여야 하는 과정을 거치므로 상대적으로 긴 시간이 소요될 수 있다. 즉, TTS를 이용한 음성데이터(S)의 생성과정에서, 유닛셀랙션모듈(185)에서 음성을 조합하는 과정에 소요되는 시간 및 리소스(resource)가 클 수 있음을 의미한다.
소요시간 및 리소스의 소요가 커지면, 텍스트를 음성으로 출력하는데 일정한 딜레이(delay)가 발생할 수 있다. 텍스트를 음성으로 출력하는 과정에서 발생하는 딜레이는, 다음과 같이 몇 부분으로 구분할 수 있다. 첫째, TTS를 최초로 사용하여 음성을 출력하는 과정에서 발생하는 딜레이가 있을 수 있다. 둘째, 음성을 출력하는 과정에서 현재 재생 중인 부분이 아닌 다른 부분의 음성을 출력하기 위하여 이동하는 과정에서 발생하는 딜레이가 있을 수 있다. 본 발명의 일 실시예에 따른 이동 단말기(100)는, 생성한 음성데이터를 일정한 정도 저장하여 놓을 수 있다. 따라서 동일한 부분을 재 출력하고자 하는 경우에, 기 생성하여 저장해놓았던 음성데이터를 사용할 수 있다. 저장하였던 음성데이터를 사용하면, 유닛셀렉션 과정 등이 생략될 수 있다. 따라서 사용자가 체감하는 딜레이가 현저하게 감소될 수 있다.
도 5는 본 발명의 일 실시예에 따른 이동 단말기의 동작과정을 도시한 플로우챠트이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 음성출력모드에 진입하는 단계(S10)를 수행할 수 있다.
음성출력모드는, 전술한 바와 같이, 텍스트(T)를 음성데이터(S)로 변환하여 음향출력 모듈(152)로 출력하는 일련의 과정이 수행되도록 하는 모드일 수 있다. 음성출력모드는, 사용자가 특정한 메뉴를 선택하거나 제어부(180)의 제어신호에 의하여 수행될 수 있다.
음성출력모드에 진입하면, 음성출력의 범위를 설정하는 단계(S20)가 진행될 수 있다.
음성출력의 범위는, 선택된 텍스트(T)의 전부 또는 그 일부일 수 있다. 텍스트(T)는 이동 단말기(100)의 메모리(160)에 저장되어 있을 수 있다.
메모리(160)는, 영구, 반영구, 임시로 데이터를 저장할 수 있는 다양한 수단일 수 있다. 예를 들어, 특정한 텍스트데이터를 이동 단말기(100)에 영구 또는 반영구로 저장하고자 사용하는 기록매체이거나, 무선 통신부(110) 나 인터페이스부(170)를 통하여 획득되어 잠시 저장되었다가 제거하고자 사용하는 기록매체를 모두 포함하는 개념일 수 있음을 의미한다. 이와 같은 메모리(160)의 범위는, 이하에서 동일하다.
음성출력의 범위는, 제어부(180)의 제어동작 또는 사용자의 선택에 의하여 결정될 수 있다. 예를 들어, 사용자는 터치 동작을 수행하여 텍스트의 특정 부분을 선택할 수 있다. 이에 대해서는 해당하는 부분에서 보다 구체적으로 설명하도록 한다.
범위내의 텍스트를 음성테이터로 변환하는 단계(S30)가 진행될 수 있다.
텍스트를 음성데이터로 변환하는 과정은, 전술한 바와 같이, 프론트앤드파트(187)와, 백앤드파트(184)를 거치며 진행될 수 있다.
음성을 출력하는 단계(S40) 및 변환된 음성데이터를 저장하는 단계(S50)를 포함할 수 있다.
제어부(180)는, 음성데이터를 음향 출력 모듈(152)로 송출하여 사용자가 청각을 통하여 음성을 인지할 수 있도록 한다. 또한, 제어부(180)는, 변환한 음성데이터를 메모리(160)에 저장할 수 있다.
범위내의 텍스트를 반복하여 음성을 출력할 것인가 여부를 판단하는 단계(S60) 및 반복하여 음성을 출력하는 경우에 저장한 음성데이터에 기초하여 음성을 출력하는 단계(S70)가 진행될 수 있다.
음성으로 변환된 텍스트는, 제어부(180)의 제어신호 또는 사용자의 선택에 의하여 반복하여 출력될 수 있다. 예를 들어, 텍스트가 A, B, C, D로 구성되어 있으며, 그 중에서 A, B, C 부분이 이미 음성으로 출력된 경우가 있을 수 있다. 이와 같은 상황에서 사용자는 A 부분을 다시 듣고 싶을 수 있다.
제어부(180)는, A 부분을 다시 출력하고자 하는 신호가 입력되면, 기 저장하였던 음성데이터를 이용하여 음성을 출력할 수 있다. 즉, 유닛셀렉션을 포함하는 TTS 과정을 다시 수행하지 않을 수 있음을 의미한다. TTS 과정을 다시 수행하지 않을 수 있음으로 인하여, 음성을 출력하는데 소요되는 시간이 단축될 수 있다. 따라서 이동 단말기(100)의 사용성이 향상되는 효과를 기대할 수 있다.
도 6은 도 5 이동 단말기에 텍스트가 표시된 상태를 도시한 도면이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는 디스플레이(151)에 텍스트(T)를 표시할 수 있다. 텍스트(T)는 사용자가 저장한 특정한 문서, 웹페이지, 문자메시지, 이메일 등 문자로 표시된 다양한 콘텐츠를 포함할 수 있다.
제어부(180)는 음성전환버튼(TM)을 표시할 수 있다. 음성전환버튼(TM)은, 디스플레이(151)에 텍스트(T)가 표시되는 경우에 선택적으로 표시될 수 있다. 예를 들어, 평소에는 표시되지 않다가, 텍스트(T)가 표시되는 경우에 표시되는 히든메뉴 형태일 수 있음을 의미한다. 음성전환버튼(TM)을 선택하면, 표시된 텍스트(T)가 음성으로 출력될 수 있다.
텍스트(T)의 음성출력은, 이동 단말기(100)에 마련된 버튼(button)에 의하여 수행될 수 있다. 예를 들어, 이동 단말기(100)의 기능선택버튼(PB)을 누르면, 음성전환 기능이 실행될 수 있음을 의미한다. 물리적인 촉감을 느낄 수 있는 기능선택버튼(PB)을 사용하여 음성출력이 이루어지도록 하면, 이동 단말기(100)의 디스플레이(151)를 주시하지 않고서도 음성출력 기능을 실행할 수 있다.
도 7은 도 5 이동 단말기에서 TTS 동작이 이루어지는 상태를 도시한 도면이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)는, 음성출력 기능을 수행할 수 있다.
사용자가 손가락(F) 등으로 음성전환버튼(TM)을 선택하면, 음성출력 기능이 실행될 수 있다. 즉, 제어부(180)가 선택된 택스트(T)가 TTS 전환되어 음성으로 출력되도록 할 수 있음을 의미한다.
음성은 이동 단말기(100)의 음향 출력 모듈(152)로 출력될 수 있다. 텍스트(T)가 음성으로 출력되므로, 사용자는 운전이나 다른 작업을 하는 동시에 텍스트(T)를 인지할 수 있다.
텍스트(T)가 음성으로 출력됨과 함께, 음성데이터가 메모리(160)에 저장될 수 있다.
도 8 내지 도 10은 도 5 이동 단말기에서 출력되었던 음성을 재출력하는 과정을 도시한 도면이다.
이들 도면에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 음성으로 출력하는 현재 위치를 표시하는 인디케이터(IC)를 표시할 수 있다. 또한, 제어부(180)는, 음성으로 출력된 출력부분(ATS)을 비출력부분(BTS)과 구별하여 표시할 수 있다.
인디케이터(IC)는, 텍스트(T) 상에서 현재 음성이 출력되는 지점을 따라 이동할 수 있다. 즉, 음성이 출력되면, 인디케이터(IC)의 위치는 계속하여 이동될 수 있음을 의미한다. 인디케이터(IC)가 표시됨으로 인하여, 사용자는 현재의 출력위치를 시각적으로 인지할 수 있다.
출력부분(ATS)과 비출력부분(BTS)은, 색상, 명도 등이 서로 다르게 표시될 수 있다. 예를 들어, 제어부(180)는 이미 음성으로 출력된 출력부분(ATS)는 어둡게 표시하고, 아직 출력되지 않은 비출력부분(BTS)은 밝게 표시할 수 있다.
도 9에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)는 사용자의 터치동작에 의하여 재생되는 위치를 변경할 수 있다.
사용자는 손가락(F) 등으로 인디케이터(IC)의 위치를 변경할 수 있다. 예를 들어, 인디케이터(IC)를 터치하여 기 재생되었던 출력부분(ATS)의 특정 부분까지 드래그하는 동작을 수행할 수 있음을 의미한다. 사용자가 터치앤드래그 동작을 수행하면, 그에 대응되어 인디케이터(IC)가 이동될 수 있다.
도 10에 도시한 바와 같이, 특정 위치로 인디케이터(IC)가 이동되면, 제어부(180)는 그 위치부터의 음성을 출력할 수 있다.
제어부(180)가 출력하는 부분은, 그 전에 이미 출력되었던 부분일 수 있다. 사용자가 선택한 특정 부분이 이미 출력되었던 부분인 경우에, 제어부(180)는 메모리(160)에 저장되어 있는 음성데이터를 검색할 수 있다.
메모리(160)에는, TTS 과정을 거치며 변환된 음성데이터가 저장되어 있을 수 있다. 제어부(180)는, 메모리(160)에 저장되어 있던 음성데이터 중에서 사용자가 선택한 그 부분을 다시 출력할 수 있다. 사용자가 선택한 부분에 대해서 다시 TTS를 진행하지 않아도 됨으로 인하여, 해당 부분의 음성을 출력하는데 소요되는 시간 딜레이가 감소될 수 있다.
시간 딜레이의 감소는, 해당 부분에 대한 음성데이터가 없음으로 인하여 새로이 음성으로 변환하는 과정을 거치는 경우를 생각해볼 때 보다 명확히 이해될 수 있다. 본 발명의 일 실시예에 따른 이동 단말기(100)에 의하면, 새로이 음성으로 변환하는 과정이 필요 없음으로 인한 빠른 응답성으로 인하여 이동 단말기(100)를 이용한 음성 서비스 수요 확산에 기여할 수 있다.
도 11은 도 5 이동 단말기에 따른 효과를 도시한 그래프이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)는, 종래에 비한 시간 딜레이 감소의 효과를 나타낼 수 있다.
도 11의 (a)에 도시한 바와 같이, 사용자는 특정한 시점에 TTS 기능을 이용한 음성의 출력 기능을 선택할 수 있다. 사용자가 특정한 시점에 음성의 출력 기능을 선택하면, t1 시점에 이르기까지 제어부(180)는 음성을 출력하기 위한 준비과정을 거칠 수 있다.
t1 시점에 이르러 음성을 출력할 준비가 완료되면, 음성출력(SP)이 이루어질 수 있다. 음성출력(SP)은, 사용자가 과거의 특정 시점에서 다시 출력되도록 하는 입력을 한 t2 시점까지 계속될 수 있다.
t2 시점에서 사용자가 과거 특정 시점에서 다시 출력되도록 하는 입력을 수행하면, 종래의 경우에는 다시 음성을 출력하기 위한 준비과정을 진행해야 한다. 따라서 t2 시점에서 t3 시점까지 출력이 이루어지지 않는 딜레이가 발생할 수 있다.
t3 시점에서, 음성출력(SP)을 위한 준비가 완려되면, 제어부(180)는 음성을 출력할 수 있다.
도 11의 (b)에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)는, 음성을 출력하고 있던 도중인 t2 시점에 사용자가 기 출력된 부분을 선택하는 경우에도 시간 딜레이가 실질적으로 발생하지 않도록 할 수 있다. 즉, 음성 출력을 위하여 새로이 TTS 과정을 거치지 않고, 기 변환하였던 음성데이터를 사용할 수 잇음으로 인하여 시간 딜레이를 최소화 시킬 수 있음을 의미한다. 따라서 이동 단말기(100)의 사용자는, 불폄함을 느끼지 않고 특정 시점으로 이동하여 음성을 재출력할 수 있다.
도 12 내지 도 22는 도 5 이동 단말기에 대한 조작에 대응한 동작을 도시한 도면이다.
이들 도면에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 사용자의 각종 다양한 터치동작에 대응하여 이동 단말기(100)의 동작을 제어할 수 있다.
도 12에 도시한 바와 같이, 이동 단말기(100)의 제어부(180)는, 텍스트(T)를 음성으로 변환하여 출력하고 있을 수 있다.
도 13에 도시한 바와 같이, 음성의 출력과정에 사용자는 디스플레이(151)를 터치하여 제1 내지 2 드래그(D1, D2)하는 터치동작을 수행할 수 있다.
제1 내지 2 드래그(D1, D2)는, 원형의 드래그일 수 있다. 즉, 손가락(F) 등으로 최초 터치한 지점에서 시계 내지는 반시계 방향으로 회전하며 드래그 동작을 수행할 수 있음을 의미한다.
시계 내지 반시계 방향으로 회전하는 제1,2 드래그(D1, D2)가 입력되면, 제어부(180)는 인디케이터(IC)를 그 방향에 각각대응되도록 이동하여 표시할 수 있다. 즉, 재생되는 위치를 현재 위치의 전방 또는 후방으로 이동할 수 있음을 의미한다.
제1 내지 2 드래그(D1, D2)가 이루어지는 길이, 속도 등에 따라 이동된 제1,2 인디케이터(IC1, IC2)의 위치 등은 달라질 수 있다. 예를 들어, 제1 드래그(D1)가 기준 속도보다 빠르거나 길게 이루어지면, 제1 인디케이터(IC1)는 문단 단위로 이동할 수 있음을 의미한다. 이에 반하여, 제1 드래그(D1)가 기준 속도보다 느리거나 짧게 이루어지면, 제1 인디케이터(IC1)는 단어 단위로 이동할 수 있다.
도 14에 도시한 바와 같이, 음성의 출력과정에 사용자는 디스플레이(151)를 터치하여 제3 내지 4 드래그(D3, D4)할 수 있다.
제3 내지 4 드래그(D3, D4)는, 손가락(F) 등으로 최초 터치한 지점에서 좌측 내지는 우측으로 이동하는 드래그 동작일 수 있다.
좌측 내지 우측으로 이동하는 제3 내지 제4 드래그(D3, D4)가 입력되면, 제어부(180)는 인디케이터(IC)를 문장 단위로 이동하여 표시할 수 있다. 즉, 현재 재생 중인 문장의 앞 문장 내지는 뒷 문장으로 이동하여 음성을 출력할 수 있음을 의미한다.
도 15에 도시한 바와 같이, 음성의 출력과정에 사용자는 디스플레이(151)를 터치하여 제5 내지 6 드래그(D5, D6)하는 터치동작을 수행할 수 있다.
제 5 내지 6 드래그(D5, D6)는, 상하방향의 드래그일 수 있다. 즉, 손가락(F) 등으로 최초 터치한 지점에서 상방 내지 하방으로 드래그 동작을 수행할 수 있음을 의미한다.
상방 내지 하방으로 드래그하는 제5, 6 드래그(D5, D6)가 입력되면, 제어부(180)는 음성의 재생속도를 변경할 수 있다. 예를 들어, 제5 드래그(D5)가 입력되면 재생속도가 빨라지고, 제6 드래그(D6)가 입력되면 재생속도가 느려지도록 할 수 있음을 의미한다. 상방 내지 하방으로 드래그하는 제5, 6 드래그(D5, D6)는, 음량을 조절하는 기능에 대응될 수도 있다.
도 16에 도시한 바와 같이, 음성의 출력과정에 사용자는 디스플레이(151)를 멀티터치하여 제7 내지 10 드래그(D7 내지 D10)하는 터치동작을 수행할 수 있다.
제7 내 내지 10 드래그(D7 내지 D10)는, 멀티터치된 제1,2 손가락(F1, F2)의 거리가 가까워지거나 멀어지는 터치동작일 수 있다.
서로 가까워지거나 멀어지는 제7 내지 10 드래그(D7 내지 D10)가 입려되면, 제어부(180)는 음성의 재생속도를 변경할 수 있다.
도 17에 도시한 바와 같이, 음성의 재생속도는 기 설정된 값에 따라 서로 다른 형태로 변경될 수 있다.
도 17의 (a)에 도시한 바와 같이, t1 내지 t5 시점에 사용자가 음성의 재생속도를 변경하는 동작을 수행할 수 있다. 사용자로부터 음성의 재생속도를 변경하도록 하는 동작이 입력되면, 제어부(180)는 재생속도가 그 시점에 급격하게 변경되도록 할 수 있다. 즉, 기존 재생속도가 v1 일 경우에, 변경된 재생속도인 v2로 급격하게 쉬프트(shift)될 수 있음을 의미한다.
도 17의 (b)에 도시한 바와 같이, t1, t3, t5, t7 시점에 사용자가 음성의 재생 속도를 변경하는 동작을 수행할 수 있다. 사용자로부터 음성의 재생속도를 변경하도록 하는 동작이 입력되면, 제어부(180)는 그 시점에서부터 음성의 재생속도를 순차적으로 증감할 수 있다. 예를 들어, t1 시점에 사용자가 음성의 재생속도가 증가되도록 하는 터치동작을 수행한 경우에, 제어부(180)는 t2 시점까지 음성의 재생속도가 순차적으로 조금씩 증가되도록 할 수 있음을 의미한다.
도 18에 도시한 바와 같이, 사용자는 손가락(F)으로 디스플레이(151)의 특정 지점을 터치한 이후에 원하는 적절한 터치동작을 수행할 수 있다. 예를 들어, 시계 내지 반시계 방향으로 드래그하거나, 상하 방향으로 드래그하거나, 좌우 방향으로 드래그할 수 있다. 제어부(180)는, 사용자의 드래그 방향에 대응되는 특정 기능을 수행할 수 있다.
도 19에 도시한 바와 같이, 음성의 출력과정에 사용자는 손가락(F)으로 디스플레이(151)의 특정 지점을 터치하는 동작을 수행할 수 있다.
음성의 출력 중에 사용자가 손가락(F)으로 디스플레이(151)의 특정 지점을 터치하면, 제어부(180)는 음성의 출력을 정지할 수 있다. 나아가, 정지된 상태에서 다시 디스플레이(151)를 터치하면, 제어부(180)는 정지되었던 출력이 다시 수행되도록 할 수 있다.
도 20에 도시한 바와 같이, 음성의 출력이 정지되어 있는 상태에서, 디스플레이(151)를 터치하여 제11 드래그(D11)하는 터치동작이 수행될 수 있다.
제11 드래그(D11)는, 일 지점을 터치한 후 좌측으로 드래그하는 터치동작일 수 있다. 이와 같은 터치동작이 수행되면, 제어부(180)는, 터치가 시작된 지점에서부터 음성이 출력되도록 할 수 있다.
터치가 시작된 지점에서부터 음성이 출력되면, 제어부(180)는 인데케이터(IC)를 터치가 시작된 지점으로 이동하여 표시할 수 있다.
도 21에 도시한 바와 같이, 음성의 출력이 정지되어 있는 상태에서, 디스플레이(151)를 터치하여 일정한 거리만큼 제12 드래그(D12)하는 터치동작이 수행될 수 있다.
제12 드래그(D12)는, 일 지점을 터치한 후 사용자가 원하는 종점까지 드래그하는 터치동작일 수 있다. 이와 같은 터치동작이 수행되면, 제어부(180)는, 제12 드래그(D12)에 포함된 범위내의 텍스트를 음성으로 변환하여 출력할 수 있다. 즉, 제12 드래그(D12)는, 음성으로 출력할 구간을 선택하는 터치동작일 수 있다.
도 22에 도시한 바와 같이, 음성의 출력이 정지되어 있는 상태에서, 디스플레이(151)를 멀티터치하는 터치동작이 수행될 수 있다.
멀티터치를 하는 제1,2 손가락(F1, F2)은, 음성으로 출력할 구간의 시점 및 종점을 각각 터치하는 동작일 수 있다. 제1,2 손가락(F1, F2)을 이용한 멀티터치가 수행되면, 제어부(180)는 해당하는 구간 내의 텍스트를 음성으로 출력할 수 있다.
도 12 내지 도22에서는, 이해의 편의를 위하여 특정 터치동작에 대해서 특정한 기능이 매칭되어 있는 경우를 설명하였다. 그러나 특정 터치동작에 다른 기능이 매칭되는 경우도 가능함은 물론이다. 예를 들어, 제1, 2 드래그(D1, D2)에 음량의 크기를 변경하는 기능이 매칭되어 있는 경우도 가능함을 의미한다.
도 23 및 도 24는 도 5 이동 단말기의 설정에 대한 조작을 도시한 도면이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는 음성이 출력되는 상태를 변경할 수 있다.
도 23에 도시한 바와 같이, 디스플레이(151)에는 음성의 종류를 선택할 수 있는 제1 팝업창(P1)이 표시될 수 있다. 예를 들어, 젊은 남자, 나이든 남자, 젊은 여자, 나이든 여자 중에서 특정한 음성을 선택할 수 있다.
도 24에 도시한 바와 같이, 디스플레이(151)에는 음성의 재생속도를 선택할 수 있는 제2 팝업창(P2)이 표시될 수 있다. 예를 들어, 특정한 속도를 직접 선택할 수 있음을 의미한다. 나아가, 재생속도의 선택 옵션 중에는, 일정한 시간 내에 선택된 텍스트에 대한 음성 출력이 완료되도록 하는 것이 있을 수 있다. 예를 들어, 5분 이내에 해당 부분에 대한 음성의 출력이 종료되도록 할 수 있음을 의미한다.
도 25 내지 도 27은 도 5 이동 단말기의 동작을 도시한 도면이다.
이들 도면에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 사용자의 터치동작이 수행되면 미리 TTS 기능을 수행하여 시간 딜레이를 최소화할 수 있다.
도 25의 (a)에 도시한 바와 같이, t0 시점에 특정한 기능을 실행하기 위하여 사용자가 디스플레이(151)를 터치하는 터치다운이 발생할 수 있다. 터치동작은, 터치다운이 있은 후에 그 위치에서 터치업되는 단순한 터치, 터치다운이 있은 후에 터치다운 위치가 계속하여 이동되다가 특정 위치에서 터치업되는 드래그 터치, 터치다운이 있은 후에 일정 시간 이상 터치다움이 그 위치에서 유지된 이후에 터치업되는 롱터치 등으로 구분될 수 있다.
터치동작이 어떠한 기능을 위하여 수행된 것인가에 대한 제어부(180)의 판단은, 전술한 바와 같이, 터치업 신호가 입력된 후에 이루어질 수 있다. 따라서 종래의 TTS 시스템은, t0 시점에 터치다운 동작이 입력되면, 터치업 동작이 입력되는 t1 시점까지 대기한 후에 TTS 동작을 개시하였다. t1 시점에서 TTS 동작을 개시하면, 일련의 준비동작을 수행한 후 t2 시점에서 음성의 출력이 개시될 수 있다. 따라서 사용자가 TTS 동작의 수행을 의도한 시점인 t0에서 실재로 음성이 출력되는 t2 시점까지의 사이에 시간 딜레이가 발생하게 된다.
도 25의 (b)에 도시한 바와 같이, 본 발명의 일 실시예에 따른 TTS 시스템은, t0 시점에 터치다운 신호가 입력되면, TTS 동작을 바로 개시할 수 있다. 따라서 t1 시점에 터치업 신호가 입력되면, 그와 실질적으로 동시 또는 매우 짧은 시간 내에 음성의 출력을 시작할 수 있다. 결과적으로, 시간 딜레이를 t1부터 t2 사이의 시간만큼 감소시킬 수 있는 효과가 있다.
도 26에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 텍스트(T)에 대한 음성 출력을 수행하고 있거나, 특정 지점에서 음성출력이 정지된 상태일 수 있다.
특정한 상태에서, 사용자가 손가락(F) 등으로 디스플레이(151)을 터치할 수 있다. 즉, 제어부(180)가 터치다운 신호를 획득할 수 있음을 의미한다.
음성 출력의 수행 내지는 정지된 상태에서 사용자가 디스플레이(151)를 터치하는 것은, 음성출력을 재개하거나 특정한 지점으로 이동하여 음성을 출력하고자 하는 의도가 있을 수 있다. 따라서 제어부(180)는, 터치다운 신호를 획득하면, 아직 재생되지 않는 부분의 일 부분에 대한 TTS 동작을 수행할 수 있다.
제1 내지 7 변환영역(PT1 내지 PT7)은, 제어부(180)가 사용자의 터치다운 신호에 대응하여 미리 수행한 TTS 동작 수행영역일 수 있다. 아직 재생되지 않은 특정 문장의 앞 부분을 일정영역 만큼 미리 TTS 변환해놓음으로 인하여, 사용자가 제1 내지 7 변환영역(PT1 내지 PT7) 중 하나를 선택하면 빠른 음성출력이 가능할 수 있다.
제1 내지 7 변환영역(PT1 내지 PT7)은, 아직 음성의 출력이 이루어지지 않은 비출력부분(BTS)에 속해있을 수 있다. 즉, 음성으로 출력된 음성데이터가 존재하는 출력부분(ATS)의 경우는, 사용자의 선택이 있는 경우에 언제든지 빠르게 음성을 출력할 수 있다. 이에 반하여, 음성데이터가 존재하지 않음으로 인하여 비출력부분(BTS) 중 특정 지점을 선택하면, 음성의 출력을 위한 사전 동작으로 인하여 시간 딜레이가 발생할 수 있다. 본 발명의 일 실시예에 따른 이동 단말기(100)는, 비출력부분(BTS)의 일정 영역을 미리 변환함으로써 시간 딜레이를 최소화할 수 있다.
제1 내지 7 변환영역(PT1 내지 PT7)은, 비출력부분(BTS) 중에서 사용자가 선택할 가능성이 높은 부분일 수 있다. 예를 들어, 제1 내지 7 변환영역(PT1 내지 PT7)은 독립된 문장의 첫 부분인거나, 단락의 첫 부분이거나, 사용자가 즐겨찾기 등으로 미리 지정해놓은 지점이거나, 사용자가 과거에 반복하여 선택한 부분일 수 있다.
도 27에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는 하이라이트영역(H1 내지 H3)에 대한 음성출력을 수행할 수 있다.
제1 내지 3 하이라이트영역(H1 내지 H3)은, 사용자가 선정한 영역일 수 있다. 나아가, 제1 내지 3 하이라이트영역(H1 내지 H3)은 무선 통신부(110)를 통하여 획득한 정보일 수 있다.
제1 내지 3하이라이트영역(H1 내지 H3)는, 사용자가 중요한 것으로 지정하거나 사용자가 주요한 것으로 태깅한 부분일 수 있다.
제어부(180)는, 제1 내지 3하이라이트영역(H1 내지 H3)의 경우는, 기 재생되었는가 여부와 관계없이 TTS를 통하여 미리 음성데이터를 저장할 수 있다. 제1 내지 3하이라이트영역(H1 내지 H3)은, 사용자가 그 부분을 재생할 가능성이 높다. 따라서 해당 부분의 음성데이터를 저장해놓음으로써, 사용자가 해당 부분을 선택한 경우에 시간 딜레이 없이 재생이 가능하도록 할 수 있음을 의미한다.
도 28은 도 5 이동 단말기의 배터리 관련 동작을 도시한 도면이다.
이에 도시한 바와 같이, 본 발명의 일 실시예에 따른 이동 단말기(100)의 제어부(180)는, 이동 단말기(100)의 배터리 잔량과 관계하여 음성출력을 제어할 수 있다.
제어부(180)는, 이동 단말기(100)의 배터리 충전량이 기 설정된 일정한 수준 이하인가 여부를 판단할 수 있다. 배터리의 충전량이 일정한 수준 이하이면, 디스플레이부(151) 밝기 및/또는 음향 출력 모듈(152)의 음량을 조절할 수 있다. 제어부(180)는, 디스플레이부(151)의 밝기 및/또는 음향 출력 모듈(152)의 음량을 배터리의 충전량에 따라서 순차적으로 줄일 수 있다.
본 발명은 기재된 실시예들에 한정되는 것이 아니고, 본 발명의 사상 및 범위를 벗어나지 않고 다양하게 수정 및 변형할 수 있음은 이 기술의 분야에서 통상의 지식을 가진 자에게 자명하다. 따라서, 그러한 수정예 또는 변형예들은 본 발명의 특허청구범위에 속한다 하여야 할 것이다.

Claims (26)

  1. 음향출력 모듈;
    텍스트가 저장된 메모리; 및
    상기 텍스트 중 적어도 일부를 음성으로 변환하여 상기 음향출력 모듈을 통하여 출력하는 제어부를 포함하되,
    상기 제어부는,
    상기 음성으로 변환하여 출력한 음성데이터 중 적어도 일부를 상기 메모리에 저장하고, 상기 적어도 일부의 텍스트에 대한 음성출력 신호를 획득하면 상기 저장한 음성데이터에 기초한 음성을 상기 음향출력 모듈로 출력하는 것을 특징으로 하는 이동 단말기.
  2. 제1 항에 있어서,
    상기 메모리에는,
    적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성(recorded speech)을 포함하는 데이터베이스가 더 저장되어 있으며,
    상기 제어부는,
    상기 녹음된 음성 중, 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성데이터를 생성하는 것을 특징으로 하는 이동 단말기.
  3. 제2 항에 있어서,
    상기 제어부는,
    상기 조합하여 생성한 음성데이터를 상기 메모리에 저장하여, 상기 적어도 일부의 텍스트에 대한 반복 출력시에, 상기 음성데이터의 조합 없이 상기 저장한 음성데이터에 기초한 음성을 출력하는 것을 특징으로 하는 이동 단말기.
  4. 제1 항에 있어서,
    상기 제어부는,
    터치신호를 획득하면, 상기 음성의 재생속성을 변경하는 것을 특징으로 하는 이동 단말기.
  5. 제4 항에 있어서,
    상기 재생속성은,
    상기 텍스트 중에서 상기 음성이 출력되는 위치, 상가 텍스트 중에서 상기 음성이 출력되는 범위, 상기 음성의 반복출력여부, 상기 음성의 출력여부, 상기 음성의 볼륨, 상기 음성의 출력속도, 상기 음성의 피치(pitch) 중 적어도 하나인 것을 특징으로 하는 이동 단말기.
  6. 제4 항에 있어서,
    상기 제어부는,
    상기 터치신호의 방향, 거리, 지속시간 중 적어도 하나에 따라 상기 재생속성을 변경하는 것을 특징으로 하는 이동 단말기.
  7. 제1 항에 있어서,
    상기 제어부는,
    상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시하는 것을 특징으로 하는 이동 단말기.
  8. 제7 항에 있어서,
    상기 제어부는,
    상기 인디케이터의 위치를 변경하는 터치신호를 획득하면, 상기 인디케이터의 변경된 위치에 대응된 텍스트를 상기 음성으로 출력하는 것을 특징으로 하는 이동 단말기.
  9. 제1 항에 있어서,
    상기 제어부는,
    상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시하는 것을 특징으로 하는 이동 단말기.
  10. 제1 항에 있어서,
    상기 제어부는,
    설정된 시간 내에 상기 텍스트 중 적어도 일부가 음성으로 출력되도록 상기 음성의 출력속도를 조절하는 것을 특징으로 하는 이동 단말기.
  11. 제1 항에 있어서,
    상기 제어부는,
    터치신호를 획득하면 상기 텍스트에 대한 음성 변환을 개시하되,
    상기 음성 변환이 개시되도록 하는 터치신호는,
    터치신호가 발생되는 터치다운 신호인 것을 특징으로 하는 이동 단말기.
  12. 제11 항에 있어서,
    상기 제어부는,
    상기 터치다운 신호가 입력되면, 상기 텍스트 내의 서로 이격된 적어도 두 영역에 대한 상기 음성 변환을 개시하는 것을 특징으로 하는 이동 단말기.
  13. 제11 항에 있어서,
    상기 제어부는,
    상기 터치다운 신호가 입력되면, 상기 텍스트 중에서 상기 음성으로 출력되지 않은 부분 중 적어도 일부에 대한 상기 음성 변환을 개시하는 것을 특징으로 하는 이동 단말기.
  14. 음향출력 모듈;
    텍스트가 저장된 메모리; 및
    상기 텍스트 중 적어도 일부를 음성으로 변환하여 상기 음향출력 모듈을 통하여 출력하는 제어부를 포함하되,
    상기 제어부는,
    상기 출력한 음성 중 적어도 일부를 재 출력하는 신호를 획득한 경우에,
    상기 메모리에 저장된 상기 음성의 음성데이터를 사용하여 상기 음성 중 적어도 일부를 재 출력하는 것을 특징으로 하는 이동 단말기.
  15. 제14 항에 있어서,
    상기 메모리에는,
    적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성(recorded speech)을 포함하는 데이터베이스가 더 저장되어 있으며,
    상기 제어부는,
    상기 녹음된 음성 중 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성데이터를 생성하는 것을 특징으로 하는 이동 단말기.
  16. 제1 항에 있어서,
    상기 제어부는,
    터치신호를 획득하면, 상기 음성의 재생속성을 변경하는 것을 특징으로 하는 이동 단말기.
  17. 제4 항에 있어서,
    상기 제어부는,
    상기 터치신호의 방향, 거리, 지속시간 중 적어도 하나에 따라 상기 재생속성을 변경하는 것을 특징으로 하는 이동 단말기.
  18. 제1 항에 있어서,
    상기 제어부는,
    상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시하는 것을 특징으로 하는 이동 단말기.
  19. 제1 항에 있어서,
    상기 제어부는,
    상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시하는 것을 특징으로 하는 이동 단말기.
  20. 제1 항에 있어서,
    상기 제어부는,
    터치신호를 획득하면 상기 텍스트에 대한 음성 변환을 개시하되,
    상기 음성 변환이 개시되도록 하는 터치신호는,
    터치신호가 발생되는 터치다운 신호인 것을 특징으로 하는 이동 단말기.
  21. 음성출력모드에 진입하는 단계;
    텍스트 중 적어도 일부를 음성데이터로 변환하여 음성으로 출력하는 단계;
    상기 음성데이터 중 적어도 일부를 저장하는 단계; 및
    상기 음성으로 출력한 텍스트에 대한 음성출력 신호를 획득하면, 상기 저정한 음성데이터에 기초한 음성을 출력하는 단계를 포함하는 이동 단말기의 제어방법.
  22. 제21 항에 있어서,
    상기 음성데이터로 변환하여 음성으로 출력하는 단계는,
    데이터베이스에 저장된 적어도 하나의 단음(phone), 적어도 하나의 연음(diphone), 적어도 하나의 음절(syllable), 적어도 하나의 형태소(morpheme), 적어도 하나의 단어(word), 적어도 하나의 구(phrase), 적어도 하나의 절(clause), 적어도 하나의 문장(sentence) 중 적어도 한 형태의 녹음된 음성 중, 상기 텍스트 중 적어도 일부에 대응된 음성을 조합하여 상기 음성테이터로 변환하는 단계를 포함하는 것을 특징으로 하는 이동 단말기의 제어방법.
  23. 제21 항에 있어서,
    터치신호를 획득하는 단계; 및
    상기 획득한 터치신호에 기초하여 상기 음성의 출력속성을 변경하는 단계를 더 포함하는 이동 단말기의 제어방법.
  24. 제21 항에 있어서,
    상기 텍스트 중 상기 음성이 출력되는 위치를 표시하는 인디케이터를 표시하는 단계를 더 포함하는 이동 단말기의 제어방법.
  25. 제21 항에 있어서,
    상기 텍스트 중에서 상기 음성으로 출력된 부분과 상기 음성으로 출력되지 않은 부분을 서로 다르게 표시하는 단계를 더 포함하는 이동 단말기의 제어방법.
  26. 제21 항에 있어서,
    상기 음성데이터의 변환은,
    터치신호가 발생되는 터치다운 신호를 획득하면 개시되는 것을 특징으로 하는 이동 단말기의 제어방법.
PCT/KR2011/005453 2011-07-22 2011-07-22 이동 단말기 및 그 제어방법 WO2013015463A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/KR2011/005453 WO2013015463A1 (ko) 2011-07-22 2011-07-22 이동 단말기 및 그 제어방법
US13/239,558 US20130024189A1 (en) 2011-07-22 2011-09-22 Mobile terminal and display method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2011/005453 WO2013015463A1 (ko) 2011-07-22 2011-07-22 이동 단말기 및 그 제어방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/239,558 Continuation US20130024189A1 (en) 2011-07-22 2011-09-22 Mobile terminal and display method thereof

Publications (1)

Publication Number Publication Date
WO2013015463A1 true WO2013015463A1 (ko) 2013-01-31

Family

ID=47556396

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/005453 WO2013015463A1 (ko) 2011-07-22 2011-07-22 이동 단말기 및 그 제어방법

Country Status (2)

Country Link
US (1) US20130024189A1 (ko)
WO (1) WO2013015463A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886951A (zh) * 2016-09-29 2018-04-06 百度在线网络技术(北京)有限公司 一种语音检测方法、装置及设备

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930192B1 (en) * 2010-07-27 2015-01-06 Colvard Learning Systems, Llc Computer-based grapheme-to-speech conversion using a pointing device
KR102023008B1 (ko) * 2012-12-10 2019-09-19 엘지전자 주식회사 음성-텍스트 변환 디스플레이 장치 및 그 방법
US9646613B2 (en) * 2013-11-29 2017-05-09 Daon Holdings Limited Methods and systems for splitting a digital signal
EP3393112B1 (en) 2014-05-23 2020-12-30 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
US10691207B2 (en) * 2015-09-22 2020-06-23 Hewlett-Packard Development Company, L.P. Display devices with virtual reprsentations of electronic devices

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000015885U (ko) * 1999-01-19 2000-08-16 류영동 음성 메시지 저장 및 알람 장치
KR20080060457A (ko) * 2006-12-27 2008-07-02 뉴미디어라이프(주) Tts기능을 갖는 휴대용 멀티미디어 단말기
KR20100033849A (ko) * 2008-09-22 2010-03-31 엘지전자 주식회사 단말기 및 음성 합성 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060106618A1 (en) * 2004-10-29 2006-05-18 Microsoft Corporation System and method for converting text to speech
US8954328B2 (en) * 2009-01-15 2015-02-10 K-Nfb Reading Technology, Inc. Systems and methods for document narration with multiple characters having multiple moods
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000015885U (ko) * 1999-01-19 2000-08-16 류영동 음성 메시지 저장 및 알람 장치
KR20080060457A (ko) * 2006-12-27 2008-07-02 뉴미디어라이프(주) Tts기능을 갖는 휴대용 멀티미디어 단말기
KR20100033849A (ko) * 2008-09-22 2010-03-31 엘지전자 주식회사 단말기 및 음성 합성 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886951A (zh) * 2016-09-29 2018-04-06 百度在线网络技术(北京)有限公司 一种语音检测方法、装置及设备

Also Published As

Publication number Publication date
US20130024189A1 (en) 2013-01-24

Similar Documents

Publication Publication Date Title
WO2020045927A1 (en) Electronic device and method for generating short cut of quick command
WO2012157792A1 (en) Electronic device
WO2015111818A1 (en) Emotional-speech synthesizing device, method of operating the same and mobile terminal including the same
WO2013015463A1 (ko) 이동 단말기 및 그 제어방법
WO2014010974A1 (en) User interface apparatus and method for user terminal
WO2011068375A2 (en) Method and apparatus for providing user interface
WO2013105826A1 (en) Method and apparatus for executing a user function using voice recognition
WO2011062429A2 (en) Method and apparatus for operating mobile terminal having at least two display units
WO2013122269A1 (ko) 단말기의 사용자 인터페이스 제공 방법
WO2012133983A1 (ko) 차량에 장착되는 영상표시기기에서의 이미지 처리
WO2011087204A2 (en) Digital signage apparatus and method using the same
WO2020122677A1 (en) Method of performing function of electronic device and electronic device using same
WO2015199279A1 (en) Mobile terminal and control method thereof
WO2013077487A1 (en) Electronic device and method of operating the same
WO2014035195A2 (en) User interface apparatus in a user terminal and method for supporting the same
WO2019160198A1 (ko) 이동 단말기 및 그 제어방법
WO2019112181A1 (ko) 오디오 데이터에 포함된 음소 정보를 이용하여 어플리케이션을 실행하기 위한 전자 장치 및 그의 동작 방법
WO2017175942A1 (en) Mobile terminal and method for controlling the same
WO2021002584A1 (ko) 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
WO2014208783A1 (ko) 이동 단말기 및 이동 단말기의 제어 방법
WO2020050475A1 (ko) 전자 장치 및 단축 명령어에 대응하는 태스크 수행 방법
WO2020167006A1 (en) Method of providing speech recognition service and electronic device for same
WO2016200005A1 (en) Mobile terminal and display operating method thereof
WO2018124355A1 (ko) 오디오 장치 및 그 제어방법
WO2020101389A1 (ko) 음성 인식 기반 이미지를 표시하는 전자 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11870033

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11870033

Country of ref document: EP

Kind code of ref document: A1