KR102510958B1 - Mobile terminal and operation method thereof, mobile communication system - Google Patents
Mobile terminal and operation method thereof, mobile communication system Download PDFInfo
- Publication number
- KR102510958B1 KR102510958B1 KR1020150151797A KR20150151797A KR102510958B1 KR 102510958 B1 KR102510958 B1 KR 102510958B1 KR 1020150151797 A KR1020150151797 A KR 1020150151797A KR 20150151797 A KR20150151797 A KR 20150151797A KR 102510958 B1 KR102510958 B1 KR 102510958B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- mobile terminal
- call
- mode
- terminal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000010295 mobile communication Methods 0.000 title description 12
- 238000004891 communication Methods 0.000 claims description 22
- 230000036651 mood Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 7
- 238000005516 engineering process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/39—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2242/00—Special services or facilities
- H04M2242/12—Language recognition, selection or translation arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/22—Details of telephonic subscriber devices including a touch pad, a touch sensor or a touch detector
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
이동 단말기의 구동 방법이 개시된다. 본 방법은 외부 단말기와 통화 시작 전에 이동 단말기를 STT(Speech To Text)모드 또는 TTS(Text To Speech) 모드로 설정되는 단계, 사용자 음성 이외의 소리가 뮤트(Mute)되도록 설정하는 단계 및 이동 단말기가 STT 모드로 동작되는 경우, 사용자 음성을 수신하여 텍스트로 변환하고, 변환된 텍스트를 외부 단말기로 전송할 수 있다. 이에 따라, 사용자 편의성이 향상된다.A method of driving a mobile terminal is disclosed. The method includes the steps of setting a mobile terminal to STT (Speech To Text) mode or TTS (Text To Speech) mode before starting a call with an external terminal, setting sounds other than the user's voice to be muted, and the mobile terminal When operating in the STT mode, a user's voice may be received, converted into text, and the converted text may be transmitted to an external terminal. Accordingly, user convenience is improved.
Description
본 발명은 이동 통신 시스템에 관한 것으로 더 상세하게는 TTS(Text To Speech) 기능을 탑재한 이동 단말기 및 그 구동 방법, 이동 통신 시스템에 관한 것이다.The present invention relates to a mobile communication system, and more particularly, to a mobile terminal equipped with a Text To Speech (TTS) function, a method for driving the same, and a mobile communication system.
단말기는 이동 가능여부에 따라 이동 단말기(mobile/portable terminal) 및 고정 단말기(stationary terminal)로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mounted terminal)로 나뉠 수 있다. Terminals can be divided into mobile/portable terminals and stationary terminals according to whether or not they can move. Again, the mobile terminal may be divided into a handheld terminal and a vehicle mounted terminal depending on whether the user can directly carry the mobile terminal.
이동 단말기의 기능은 다양화 되고 있다. 예를 들면, 데이터와 음성통신, 카메라를 통한 사진촬영 및 비디오 촬영, 음성녹음, 스피커 시스템을 통한 음악파일 재생 그리고 디스플레이부에 이미지나 비디오를 출력하는 기능이 있다. 일부 단말기는 전자게임 플레이 기능이 추가되거나, 멀티미디어 플레이어 기능을 수행한다. 특히 최근의 이동 단말기는 방송과 비디오나 텔레비전 프로그램과 같은 시각적 컨텐츠를 제공하는 멀티캐스트 신호를 수신할 수 있다. Functions of mobile terminals are diversifying. For example, there are functions of data and voice communication, photographing and video recording through a camera, voice recording, music file reproduction through a speaker system, and outputting an image or video to a display unit. Some terminals have an electronic game play function added or a multimedia player function. In particular, recent mobile terminals can receive multicast signals providing visual content such as broadcasting and video or television programs.
현재 이동 단말기는 이동 전화 통신 서비스 이외에도 SMS 등의 다양한 서비스를 제공하고 있고, 문자를 음성으로 변환하고 출력하는 서비스 즉, TTS(Text to Speech) 서비스를 제공하고 있다. 이동 단말기는 STT(Speech to Text) 기술(음성을 문자로 변환하여 출력하는 기술)도 탑재할 수 있다.Currently, mobile terminals provide various services, such as SMS, in addition to mobile phone communication services, and provide a text to speech (TTS) service that converts and outputs text into voice. The mobile terminal can also be equipped with STT (Speech to Text) technology (a technology that converts voice into text and outputs it).
이동 단말기에 TTS/STT 기술이 사용되는 경우, 시각 또는 청각 장애를 가진 사용자에게 큰 도움이 된다.When TTS/STT technology is used in a mobile terminal, it is of great help to users with visual or hearing impairments.
종래기술에서는 이동 단말기가 음성 통화 중에 음성 전달이 어려운 상황에 거절 메시지(가령, 문자메시지)를 전송하거나, 다른 방식(가령, 채팅)의 메시지를 전송했었다. 그러나, 상기의 메시지는 현재 상황을 정확히 전달하는데 한계점이 있었다.In the prior art, a mobile terminal transmits a rejection message (eg, text message) or transmits a message in another method (eg, chatting) in a situation where voice transmission is difficult during a voice call. However, the above message has a limitation in accurately conveying the current situation.
이에 따라, 보다 사용자 편의성이 고려된 이동 단말 기술이 요청된다.Accordingly, a mobile terminal technology in which user convenience is considered is required.
본 발명은 상술한 종래 기술의 한계점을 해결하기 위해 고안된 것으로 본 발명의 일 실시예의 목적은 더욱 사용자 편의성이 고려된 이동 단말기 및 그 구동 방법을 제공함에 있다.The present invention has been devised to solve the above-mentioned limitations of the prior art, and an object of an embodiment of the present invention is to provide a mobile terminal and a driving method thereof in consideration of user convenience.
본 발명의 일 실시예의 다른 목적은 음성 인식을 보다 높일 수 있는 이동 단말기 및 그 구동 방법을 제공함에 있다.Another object of one embodiment of the present invention is to provide a mobile terminal and a method of driving the same capable of enhancing voice recognition.
본 발명의 일 실시예의 다른 목적은 번역 서비스를 제공하는 이동 통신 단말기 및 이동 통신 시스템을 제공함에 있다.Another object of one embodiment of the present invention is to provide a mobile communication terminal and a mobile communication system providing translation services.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical problems to be achieved in the present invention are not limited to the above-mentioned technical problems, and other technical problems not mentioned will be clearly understood by those skilled in the art from the description below. You will be able to.
본 발명의 다양한 실시예에 따른 이동 통신 시스템은 제1 단말기; 제2 단말기; 상기 제1 단말기 및 상기 제2 단말기의 통신을 중재하는 서버; 상기 서버는, 상기 제1 단말기로부터 수신되는 음성을 텍스트로 변환하여 상기 제2 단말기로 전송하고, 상기 제2 단말기로부터 변환된 텍스트에 대한 번역 요청을 수신하는 경우, 상기 제2 단말에 설정된 언어로 상기 변환된 텍스트를 번역하여 상기 제2 단말기로 제공할 수 있다.A mobile communication system according to various embodiments of the present invention includes a first terminal; a second terminal; a server mediating communication between the first terminal and the second terminal; The server converts the voice received from the first terminal into text and transmits it to the second terminal, and when receiving a translation request for the converted text from the second terminal, the server converts the text into a language set in the second terminal. The converted text may be translated and provided to the second terminal.
상기 본 발명의 양태들은 본 발명의 바람직한 실시예들 중 일부에 불과하며, 본원 발명의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 발명의 상세한 설명을 기반으로 도출되고 이해될 수 있다.The above aspects of the present invention are only some of the preferred embodiments of the present invention, and various embodiments in which the technical features of the present invention are reflected are detailed descriptions of the present invention to be detailed below by those skilled in the art. It can be derived and understood based on.
본 발명의 다양한 실시예에 따라, 아래와 같은 효과가 있다.According to various embodiments of the present invention, there are the following effects.
첫째, STT/TTS 기술을 탑재한 이동 단말기가 제공됨으로써, 사용자 편의성이 향상될 수 있다.First, user convenience can be improved by providing a mobile terminal equipped with STT/TTS technology.
둘째, 언어 번역 기능을 탑재한 이동 단말기가 제공됨으로써, 사용자 편의성이 향상될 수 있다.Second, user convenience can be improved by providing a mobile terminal equipped with a language translation function.
셋째, STT 기술 이용시 음성 인식율이 높아져 장치 효율성 및 사용자 편의성이 향상될 수 있다.Third, when using the STT technology, the voice recognition rate is increased, so device efficiency and user convenience can be improved.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects obtainable in the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the description below. will be.
도 1은 실시예에 따른 이동 단말기의 블록도이다.
도 2는 실시예에 따른 상기 이동 단말기의 구동 방법을 나타내는 도면이다.
도 3 및 도 4는 실시예에 따른 번역 서비스를 제공하는 이동 단말기를 나타내는 도면이다.
도 5는 실시예에 따른 TTS/STT 기능 및 번역 기능을 탑재한 이동 통신 시스템을 나타내는 도면이다.1 is a block diagram of a mobile terminal according to an embodiment.
2 is a diagram illustrating a method of driving the mobile terminal according to an embodiment.
3 and 4 are diagrams illustrating a mobile terminal providing a translation service according to an embodiment.
5 is a diagram illustrating a mobile communication system equipped with a TTS/STT function and a translation function according to an embodiment.
이하, 본 발명의 실시예들이 적용되는 장치 및 다양한 방법들에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.Hereinafter, an apparatus and various methods to which embodiments of the present invention are applied will be described in more detail with reference to the drawings. The suffixes "module" and "unit" for components used in the following description are given or used together in consideration of ease of writing the specification, and do not have meanings or roles that are distinct from each other by themselves.
실시예의 설명에 있어서, 각 구성 요소의 " 상(위) 또는 하(아래)", "전(앞) 또는 후(뒤)"에 형성되는 것으로 기재되는 경우에 있어, "상(위) 또는 하(아래)" 및"전(앞) 또는 후(뒤)"는 두 개의 구성 요소들이 서로 직접 접촉되거나 하나 이상의 또 다른 구성 요소가 두 개의 구성 요소들 사이에 배치되어 형성되는 것을 모두 포함한다. In the description of the embodiment, in the case of being described as being formed in "upper (above) or lower (below)", "before (front) or after (rear)" of each component, "upper (above) or lower (below)" (below)" and "before (front) or after (rear)" include both formed by direct contact between two components or by placing one or more other components between the two components.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재될 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥 상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, terms such as "include", "comprise" or "have" described above mean that the corresponding component may be inherent unless otherwise stated, excluding other components. It should be construed as being able to further include other components. All terms, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs, unless defined otherwise. Commonly used terms, such as terms defined in a dictionary, should be interpreted as consistent with the meaning in the context of the related art, and unless explicitly defined in the present invention, they are not interpreted in an ideal or excessively formal meaning.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성 요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성 요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.Also, terms such as first, second, A, B, (a), and (b) may be used in describing the components of the present invention. These terms are only used to distinguish the component from other components, and the nature, order, or order of the corresponding component is not limited by the term. When an element is described as being “connected,” “coupled to,” or “connected” to another element, that element is or may be directly connected to the other element, but there is another element between the elements. It will be understood that elements may be “connected”, “coupled” or “connected”.
도 1은 실시예에 따른 이동 단말기의 블록도이다.1 is a block diagram of a mobile terminal according to an embodiment.
이동 단말기(100)에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다. The
그러나, 본 명세서에 기재된 실시 예에 따른 구성은 이동 단말기(100)에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.However, it is easy for those skilled in the art that the configuration according to the embodiment described in this specification may be applied to fixed terminals such as digital TVs, desktop computers, digital signage, etc., except when applicable only to the
이동 단말기(100)는 통신부(110), 메모리(120), 제어부(130) 및 트랜스 모듈(140)을 포함할 수 있다. 상술한 구성 요소 이외에도 이동 단말기(100)는 다양한 모듈을 포함하는 것이 일반적이나, 본 발명에 관련되지 않은 구성요소는 생략하기로 한다.The
통신부(110)는 외부 단말기(200)와 통신을 수행하는 모듈을 포함한다. 통신부(110)는 이동 통신 모듈을 포함한다. 이동통신 모듈은, 이동통신을 위한 기술표준들 또는 통신방식(예를 들어, GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), CDMA2000(Code Division Multi Access 2000), EV-DO(Enhanced Voice-Data Optimized or Enhanced Voice-Data Only), WCDMA(Wideband CDMA), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTE-A(Long Term Evolution-Advanced) 등)에 따라 구축된 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. The
통신부(110)는 무선 인터넷 통신을 위한 모듈을 포함할 수 있다. 무선 인터넷 기술로는, 예를 들어 WLAN(Wireless LAN), Wi-Fi(Wireless-Fidelity), Wi-Fi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), WiBro(Wireless Broadband), WiMAX(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTE-A(Long Term Evolution-Advanced) 등이 있으며, 상기 무선 인터넷 모듈은 상기에서 나열되지 않은 인터넷 기술까지 포함한 범위에서 적어도 하나의 무선 인터넷 기술에 따라 데이터를 송수신하게 된다.The
통신부(110)는 근거리 통신 모듈을 포함할 수 있고, 근거리 통신 모듈은 근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다. 이러한, 근거리 통신 모듈은, 근거리 무선 통신망(Wireless Area Networks)을 통해 이동 단말기(100)와 무선 통신 시스템 사이, 이동 단말기(100)와 다른 이동 단말기(100) 사이, 또는 이동 단말기(100)와 다른 이동 단말기(100, 또는 외부서버)가 위치한 네트워크 사이의 무선 통신을 지원할 수 있다. 상기 근거리 무선 통신망은 근거리 무선 개인 통신망(Wireless Personal Area Networks)일 수 있다.The
메모리(120)는 제어부(130)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(120)는 터치 스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.The memory 120 may store programs for operation of the
메모리(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), SSD 타입(Solid State Disk type), SDD 타입(Silicon Disk Drive type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(120)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작될 수도 있다.The memory 120 may be a flash memory type, a hard disk type, a solid state disk type, a silicon disk drive type, or a multimedia card micro type. ), card-type memory (eg SD or XD memory, etc.), RAM (random access memory; RAM), SRAM (static random access memory), ROM (read-only memory; ROM), EEPROM (electrically erasable programmable read -only memory), a programmable read-only memory (PROM), a magnetic memory, a magnetic disk, and an optical disk. The
트랜스 모듈(140)은 TTS 모듈(140a) 및 STT 모듈(140b)을 포함한다. TTS 모듈(140a)은 Text to Speech 의 약어로 사용자에 의해 텍스트가 입력되는 경우, 상기 텍스트에 대응되는 음성을 생성하는 모듈이다. STT 모듈(140b)은 TTS 모듈(140a)의 반대로 Speech to Text 의 약어로 사용자에 의해 음성이 입력되는 경우, 상기 음성에 대응되는 텍스트를 생성하는 모듈이다.The
제어부(130)는 외부 단말기(200)와 통화 시작 전에 단말기(100)가 STT(Speech To Text)모드 또는 TTS(Text To Speech) 모드로 설정되도록 상기 트랜스 모듈을 제어할 수 있다.The
여기서, 제어부(130)는 외부 단말기(200)로부터 통화가 수신되는 때에 모드 설정의사를 사용자에게 물어볼 수 있다. 가령, 팝업으로 상기 사용자 의사를 문의할 수 있다.Here, the
또한, 제어부(130)는 사용자 음성 이외의 소리에 대해서는 뮤트시킬 수 있다. 가령, 제어부(130)는 STT 모드로 단말(100)이 구동되는 경우, 목소리 이외의 잡음은 필터링하여 목소리 인식률을 높일 수 있다. 또한, 제어부(130)는 외부 단말기(200)와 미리 협의하여 필터링할 소리를 협상할 수 있다. Also, the
또한, 제어부(130)는 상기 단말(100)이 TTS 모드로 동작되는 경우, 텍스트를 입력받아 기 등록된 사용자 음성으로 변환하여, 변환된 사용자 음성을 외부 단말기(200)로 전송할 수 있다. 제어부(130)는 미리 변환될 사용자 음성을 선택할 수 있다.In addition, when the terminal 100 operates in the TTS mode, the
일반적으로, 제어부(130)는 통화 수신시에는 STT 모드로 설정되고, 통화 발신시에는 TTS 모드로 설정될 수 있으나, 이에 제한되지는 않는다.In general, the
제어부(130)는 미리 메모리(120)에 다양한 목소리를 저장하여 외부 단말기(200)로 해당 목소리를 이용하여 음성을 전달할 수 있다. 다양한 목소리는 기분 상태, 하이라이트 상태(가령, 애교 섞인 목소리, 우렁찬 목소리 등)를 다르게 하여 구성될 수 있다.The
제어부(130)는 단말(100)이 STT 모드로 동작되는 경우, 입력되는 사용자 음성이 기 등록된 사용자 음성인지 판단할 수 있다. 이때, 기 등록된 사용자 음성인 경우, 제어부(130)는 음성을 이에 대응되는 텍스트로 변경하여 외부 단말기(200)로 전송할 수 있다.When the terminal 100 is operated in the STT mode, the
제어부(130)는 패턴 인식, 비밀번호 인식 등의 보안 코드 입력을 사용자에게 요구하여 보안성을 높힐 수도 있다.The
또한, 제어부(130)는 상기 TTS/STT 모드 선택을 단말(100)에 구비된 기 등록된키 입력, 터치 입력, 모드 선택 음성 입력 등을 통해 수행할 수 있다.In addition, the
또한, 단말(100)은 상술한 구성요소 이외에 특정 언어를 기 설정된 언어로 번역하는 번역부(미도시)를 추가적으로 더 포함할 수 있다. 자세한 실시예는 후술하기로 한다.In addition, the terminal 100 may further include a translation unit (not shown) for translating a specific language into a preset language in addition to the above-described components. Detailed embodiments will be described later.
이하에서는 이동 단말기의 구동 방법을 설명하기로 한다.Hereinafter, a method of driving a mobile terminal will be described.
도 2는 본 발명의 실시예에 따른 이동 단말기의 구동 방법을 나타내는 흐름도이다.2 is a flowchart illustrating a method of driving a mobile terminal according to an embodiment of the present invention.
일단, 제1 이동 단말기(100)는 제2 이동 단말기(200)와 통신을 수행한다.First, the first
제1 이동 단말기와 통화 시작 전에 제1 이동 단말기를 STT(Speech To Text)모드 또는 TTS(Text To Speech) 모드로 설정한다(S210).Before starting a call with the first mobile terminal, the first mobile terminal is set to STT (Speech To Text) mode or TTS (Text To Speech) mode (S210).
제1 이동 단말기(100)는 제2 이동 단말기(200)에 통화를 발신하거나 또는 통화를 수신하는 경우, 상기 모드를 설정할 수 있다.The first
또한, 상기 제1 이동 단말기(100)에 구비된 키 버튼 입력 또는 기 설정된 사용자 음성 명령 입력에 의해 STT 모드 TTS 모드가 결정될 수 있다. In addition, the STT mode or TTS mode may be determined by inputting a key button provided in the first
그 다음으로, 제1 이동 단말기(100)는 사용자 음성 이외의 소리를 뮤트시킨다(S220). 가령, 제1 이동 단말기(100)가 STT 모드로 설정되는 경우, 사용자 음성 이외의 소리를 뮤트시켜 사용자 음성 인식률을 더 높힐 수 있다. 이 때, 제1 이동 단말기(100)는 제2 이동 단말기(200)와 특정 소리는 필터하고 특정 소리는 전송하도록 협상(Negotiation)을 수행할 수 있다. 또한, 제1 이동 단말기(100)는 TTS 모드로 설정되는 경우, 텍스트를 입력받을 수 있다. 이에 따라, 음성 인식률을 높이면서도 이동 단말기(100 ,200) 간 협상을 통해 필요한 소리는 필터링될 수 있다.Next, the first
제1 이동 단말기(100)가 STT 모드로 설정된 경우(S230), 사용자 음성을 수신하여 텍스트로 변환하고(S240), 변환된 텍스트를 제2 단말기(200)로 전송한다(S270).When the first
이때, 제1 이동 단말기(100)의 제어부(130)는 사용자 음성이 기 등록된 사용자 음성인지 판단할 수 있다. 제어부(130)는 사용자 음성이 기 등록된 사용자 음성이 아닌 경우, 적절한 이벤트(가령, 경고음, 진동 등)를 발생시킬 수 있다.At this time, the
만약, 제1 이동 단말기(100)가 TTS 모드로 설정된 경우(S230), 텍스트를 입력받아 기 등록된 사용자 음성을 변환한다(S250).If the first
기 등록된 사용자 음성은 제1 이동 단말기(100)의 소유자, 사용자 등의 목소리가 될 수 있으나, 이에 반드시 한정되는 것은 아니고 다양한 캐릭터를 갖는 목소리 등이 될 수 있다.The pre-registered user voice may be the voice of the owner or user of the first
S250 단계이후, 제1 단말기(100)는 변환된 사용자 음성을 제2 단말기(200)로 전송한다(S200).After step S250, the
한편, 제어부(130)는 제2 단말기(200)로부터 수신되는 음성이 기 설정된 언어가 아닌 경우, 수신되는 음성을 기 설정된 언어로 변환할 수 있다.Meanwhile, when the voice received from the
이때, 변환된 음성은 수신된 음성의 성별, 발음, 톤, 억양, 출신지 및 감정특성을 반영될 수 있다. In this case, the converted voice may reflect gender, pronunciation, tone, intonation, place of origin, and emotional characteristics of the received voice.
또한, 제어부(130)는 제2 단말기(200)로부터 수신되는 텍스트가 기 설정된 언어가 아닌 경우, 텍스트를 기 설정된 언어로 변환하여 사용자에게 제공할 수 있다.Also, when the text received from the
도 3에 따르면, 제2 단말기(200)는 STT 모듈을 통해 일본사람에게 "안녕하세요, 잘 지내십니까"라고 제1 단말기(100)로 전송할 수 있다. According to FIG. 3 , the
도 4와 같이, 제1 단말기(100)는 제2 단말기(200)로부터 수신된 "안녕하세요, 잘 지내십니까?"가 기 설정된 언어(일본어)와 다른 경우, 이에 대응되는 텍스트로 번역하여 사용자에게 제공할 수 있다.As shown in FIG. 4 , when "Hello, how are you?" received from the
이하에서는 도 5를 참고하여 서버가 시스템에 포함되는 경우를 살펴보기로 한다.Hereinafter, a case in which a server is included in a system will be described with reference to FIG. 5 .
도 5에 따르면, 서버(300)는 통신부(310), 메모리(320), 제어부(330), 트랜스 모듈(340), 번역부(350)를 포함할 수 있다.According to FIG. 5 , the
여기서, 통신부(310), 메모리(320), 제어부(330), 트랜스 모듈(340), 번역부(350)는 상술한 구성요소와 유사하므로, 자세한 설명은 생략하기로 한다.Here, since the
여기서, 제1 단말기(100) 및 제2 단말기(200)는 트랜스 모듈(340) 및 번역부(350)에 대응되는 구성요소가 없는 것으로 상정하기로 한다.Here, it is assumed that the
서버(300)는 제1 단말기(100) 및 제2 단말기(200) 간의 통신을 중재하는 역할을 수행한다.The
서버(300)는 제1 단말기(100)로부터 수신되는 음성을 텍스트로 변환하여 상기 제2 단말기(200)로 전송할 수 있다. 서버(300)는 트랜스 모듈(340)을 통해, 음성을 텍스트로 텍스트를 음성으로 변환할 수 있다.The
서버(300)는 제2 단말기(200)로부터 변환된 텍스트에 대한 번역 요청을 수신하는 경우, 제2 단말(200)에 설정된 언어로 변환된 텍스트를 번역하여 제2 단말기(200)로 제공할 수 있다. 서버(300)는 제2 단말(200)로부터 수신되는 텍스트 역시 제1 단말(100)에 설정된 언어로 번역하여 제1 단말(100)에 제공할 수 있다.When receiving a translation request for the converted text from the
상술한 실시예에 따른 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작될 수 있고, 상기 프로그램은 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.The method according to the above-described embodiment may be produced as a program to be executed on a computer, and the program may be stored in a computer-readable recording medium. Examples of the computer-readable recording medium include ROM, RAM, There are CD-ROMs, magnetic tapes, floppy disks, optical data storage devices, and the like, and also include those implemented in the form of carrier waves (for example, transmission through the Internet).
컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상술한 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 실시예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The computer-readable recording medium is distributed to computer systems connected through a network, so that computer-readable codes can be stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for implementing the above-described method can be easily inferred by programmers in the technical field to which the embodiment belongs.
본 발명은 본 발명의 정신 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 당업자에게 자명하다. It is apparent to those skilled in the art that the present invention can be embodied in other specific forms without departing from the spirit and essential characteristics of the present invention.
따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.Accordingly, the above detailed description should not be construed as limiting in all respects and should be considered illustrative. The scope of the present invention should be determined by reasonable interpretation of the appended claims, and all changes within the equivalent scope of the present invention are included in the scope of the present invention.
100 : 제1 단말기
200 : 제2 단말기
300 ; 서버100: first terminal
200: second terminal
300; server
Claims (16)
통화 수신 시에는 STT 모드로, 통화 발신 시에는 TTS 모드로 통화 변환 모드 및 사용 언어를 설정하는 단계;
통화 변환 모드가 STT 모드로 설정된 상태에서 외부 단말기로부터 통화를 수신하는 경우, 사용자의 음성을 상기 설정된 사용 언어의 텍스트로 변환하여 표시하는 단계; 및
통화 변환 모드가 TTS 모드로 설정된 상태에서 상기 외부 단말기로 통화를 발신하는 경우, 상기 이동 단말기를 통해 입력되는 텍스트를 미리 상기 이동 단말기의 메모리에 저장된 사용자의 기분 상태 또는 하이라이트 상태에 따른 다양한 목소리 중 하나의 음성으로 변환하고 상기 외부 단말기로 전송하는 단계;를 포함하는 이동 단말기의 구동 방법. In the driving method of the mobile terminal,
Setting a call conversion mode and a language to be used in STT mode when receiving a call and TTS mode when outgoing a call;
When a call is received from an external terminal while the call conversion mode is set to the STT mode, converting the user's voice into text in the set language and displaying the converted text; and
When a call is made to the external terminal in a state where the call conversion mode is set to the TTS mode, the text input through the mobile terminal is stored in the memory of the mobile terminal in advance and one of various voices according to the user's mood state or highlight state. A method of driving a mobile terminal comprising: converting a voice into a voice and transmitting the sound to the external terminal.
상기 하이라이트 상태에 따른 목소리는 애교 섞인 목소리 또는 우렁찬 목소리를 포함하는 이동 단말기의 구동 방법.According to claim 1,
The voice according to the highlight state includes a charming voice or a loud voice.
디스플레이;
통화 수신 시에는 STT 모드로, 통화 발신 시에는 TTS 모드로 통화 변환 모드를 설정하는 트랜스 모듈;
외부 단말기와 통신하는 통신부; 및
사용자의 입력 신호에 따라 상기 통화 변환 모드 및 사용 언어를 설정하는 제어부;를 포함하고,
상기 제어부는,
통화 변환 모드가 STT 모드로 설정된 상태에서 상기 외부 단말기로부터 통화를 수신하는 경우, 사용자의 음성을 설정된 사용 언어의 텍스트로 변환하여 상기 디스플레이에 표시하고,
통화 변환 모드가 TTS 모드로 설정된 상태에서 상기 외부 단말기로 통화를 발신하는 경우, 텍스트를 입력받아 미리 상기 이동 단말기의 메모리에 저장된 사용자의 기분 상태 또는 하이라이트 상태에 따른 다양한 목소리 중 하나의 음성으로 변환하고 상기 외부 단말기로 전송하는 이동 단말기.In the mobile terminal,
display;
A trans module for setting a call conversion mode to STT mode when receiving a call and to TTS mode when sending a call;
a communication unit that communicates with an external terminal; and
A control unit configured to set the currency conversion mode and the language used according to a user's input signal;
The control unit,
When a call is received from the external terminal while the call conversion mode is set to the STT mode, the user's voice is converted into text in a set language and displayed on the display;
When a call is made to the external terminal while the call conversion mode is set to the TTS mode, the text is received and converted into one of various voices according to the user's mood state or highlight state stored in the memory of the mobile terminal in advance, A mobile terminal transmitting to the external terminal.
상기 하이라이트 상태에 따른 목소리는 애교 섞인 목소리 또는 우렁찬 목소리를 포함하는 이동 단말기.According to claim 8,
The voice according to the highlight state includes a charming voice or a loud voice.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150151797A KR102510958B1 (en) | 2015-10-30 | 2015-10-30 | Mobile terminal and operation method thereof, mobile communication system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150151797A KR102510958B1 (en) | 2015-10-30 | 2015-10-30 | Mobile terminal and operation method thereof, mobile communication system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170050352A KR20170050352A (en) | 2017-05-11 |
KR102510958B1 true KR102510958B1 (en) | 2023-03-16 |
Family
ID=58741312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150151797A KR102510958B1 (en) | 2015-10-30 | 2015-10-30 | Mobile terminal and operation method thereof, mobile communication system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102510958B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210150042A (en) | 2020-06-03 | 2021-12-10 | 주식회사 이앤알 | The manufacturing method of Non-PVC eco-friendly floor board without harmful material |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100798623B1 (en) * | 2007-04-10 | 2008-01-28 | 에스케이 텔레콤주식회사 | Apparatus and method for voice processing in mobile communication terminal |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100920174B1 (en) | 2007-09-14 | 2009-10-06 | 주식회사 케이티 | Apparatus and system for providing text to speech service based on a self-voice and method thereof |
KR102108500B1 (en) * | 2013-02-22 | 2020-05-08 | 삼성전자 주식회사 | Supporting Method And System For communication Service, and Electronic Device supporting the same |
-
2015
- 2015-10-30 KR KR1020150151797A patent/KR102510958B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100798623B1 (en) * | 2007-04-10 | 2008-01-28 | 에스케이 텔레콤주식회사 | Apparatus and method for voice processing in mobile communication terminal |
Also Published As
Publication number | Publication date |
---|---|
KR20170050352A (en) | 2017-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240096345A1 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
KR101972955B1 (en) | Method and apparatus for connecting service between user devices using voice | |
US8958745B2 (en) | Electronic device and operating method thereof | |
KR101861006B1 (en) | Device and method of translating a language into another language | |
CN105393302A (en) | Multi-level speech recognition | |
KR102161439B1 (en) | Method and apparatus for recognizing voice in portable devices | |
CA2810223A1 (en) | Creation and management of near field communications tags | |
US9311911B2 (en) | Method and apparatus for live call text-to-speech | |
CN112470217A (en) | Method for determining electronic device to perform speech recognition and electronic device | |
KR102173242B1 (en) | Local wireless data communication system, method and apparatus for automactic setup of imformation | |
US20160353173A1 (en) | Voice processing method and system for smart tvs | |
CN104394265A (en) | Automatic session method and device based on mobile intelligent terminal | |
US20170118586A1 (en) | Voice data transmission processing method, terminal and computer storage medium | |
US20200320993A1 (en) | Dialogue processing apparatus, a vehicle having the same, and a dialogue processing method | |
KR102510958B1 (en) | Mobile terminal and operation method thereof, mobile communication system | |
US20220183007A1 (en) | Method and device for transmission bandwidth determination | |
US9143864B2 (en) | Audio playback system | |
KR20170082265A (en) | Mobile terminal | |
US9973604B2 (en) | Framework for user-created device applications | |
CN110737765A (en) | Dialogue data processing method for multi-turn dialogue and related device | |
KR102131915B1 (en) | System for providing message and method thereof | |
WO2022247265A1 (en) | Method for creating chat interface, and electronic device | |
US10679604B2 (en) | Method and apparatus for transmitting audio | |
WO2018010432A1 (en) | Sound code tag-based configuration method, device and storage medium | |
CN104935867A (en) | Video communication method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |