KR101470900B1 - 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체 - Google Patents

모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체 Download PDF

Info

Publication number
KR101470900B1
KR101470900B1 KR1020120128570A KR20120128570A KR101470900B1 KR 101470900 B1 KR101470900 B1 KR 101470900B1 KR 1020120128570 A KR1020120128570 A KR 1020120128570A KR 20120128570 A KR20120128570 A KR 20120128570A KR 101470900 B1 KR101470900 B1 KR 101470900B1
Authority
KR
South Korea
Prior art keywords
voice
detection signal
mobile terminal
text
motion detection
Prior art date
Application number
KR1020120128570A
Other languages
English (en)
Other versions
KR20140062217A (ko
Inventor
최웅식
Original Assignee
최웅식
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 최웅식 filed Critical 최웅식
Priority to KR1020120128570A priority Critical patent/KR101470900B1/ko
Publication of KR20140062217A publication Critical patent/KR20140062217A/ko
Application granted granted Critical
Publication of KR101470900B1 publication Critical patent/KR101470900B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/34Microprocessors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체가 개시된다. 상기 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 모바일 단말기의 제1 동작입력을 입력받는 단계, 동작감지 센서부에서 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계, 상기 제어부에서 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 음성을 녹음하는 단계, 상기 음성 녹음 중에 상기 사용자로부터 상기 모바일 단말기의 제2 동작입력을 입력받는 단계, 상기 동작감지 센서부에서 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계, 상기 제어부에서 상기 제2 동작감지신호에 따라 상기 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계, 및 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하는 것을 특징으로 한다.

Description

모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체{Method for converting speech to text in mobile terminal equipment and recording medium thereof}
본 발명은 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체에 관한 것으로서, 특히 모바일 단말기의 흔들림을 감지하여 생성된 동작감지신호에 따라 음성 녹음 및 텍스트 변환을 수행할 수 있고, 사용자의 동작입력에 따라 여러 개의 음성 구간 각각에 식별정보를 대응시킴으로써 여러 개의 음성 구간에 대응되는 텍스트들을 서로 구별하여 표시할 수 있는 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체에 관한 것이다.
종래의 모바일 단말기를 이용한 음성/텍스트 변환방법은, 모바일 단말기에서 음성을 녹음할 때 터치스크린 화면상의 녹음 버튼을 눌러 음성 녹음을 시작하고 화면상의 정지 버튼을 눌러 음성 녹음을 종료하며 녹음된 구간의 음성을 텍스트로 변환하여 모바일 단말기에 표시한다. 그런데 이러한 종래 기술은, 음성을 텍스트로 변환하기 위해서는 사용자가 모바일 단말기의 화면을 보고 녹음 버튼 및 정지 버튼을 눌러야 하기 때문에, 사용자가 모바일 단말기의 화면을 보기 어려운 상황에서는 정확하게 모바일 단말기의 녹음 버튼 및 정지 버튼을 누르는 것이 쉽지 않아 음성 녹음 및 텍스트 변환을 조작하기 어려운 문제점이 있다.
또한, 이러한 종래 기술은 사용자가 여러 개의 음성 구간을 녹음하여 텍스트로 변환하는 경우 텍스트로 변환된 여러 개의 음성 구간을 동일한 텍스트로 표시하기 때문에, 사용자가 변환된 텍스트로부터는 각각의 음성 구간의 화자(speaker)를 구별하기 어려운 문제점이 있다.
KR1020120077295 A
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 모바일 단말기의 흔들림을 감지하여 생성된 동작감지신호에 따라 음성 녹음 및 텍스트 변환을 수행할 수 있고, 사용자의 동작입력에 따라 여러 개의 음성 구간 각각에 식별정보를 대응시킴으로써 여러 개의 음성 구간에 대응되는 텍스트들을 서로 구별하여 표시할 수 있는 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체를 제공하는 것을 목적으로 한다.
상기와 같은 목적을 달성하기 위하여, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 모바일 단말기의 제1 동작입력을 입력받는 단계, 동작감지 센서부에서 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계, 상기 제어부에서 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 음성을 녹음하는 단계, 상기 음성 녹음 중에 상기 사용자로부터 상기 모바일 단말기의 제2 동작입력을 입력받는 단계, 상기 동작감지 센서부에서 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계, 상기 제어부에서 상기 제2 동작감지신호에 따라 상기 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계, 및 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하는 것을 특징으로 한다.
바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 상기 오디오 입출력부를 통해 입력되는 상기 음성을 녹음하고, 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지되면 상기 음성 녹음을 종료하고 상기 음성데이터를 생성할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수 또는 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 감지된 흔들림 방향 또는 상기 제2 동작감지신호에서 감지된 흔들림 방향에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 상기 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 상기 제1 동작감지신호에서 상기 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하거나, 상기 제2 동작감지신호에서 상기 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 상기 제2 동작감지신호에서 상기 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 생성된 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 상기 식별번호에 대응되는 색상으로 상기 디스플레이부에 표시할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수 또는 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 상기 디스플레이부에 표시할 수 있다.
또한 바람직하게는, 상기 제어부는, 상기 제1 동작감지신호에서 감지된 흔들림 방향 또는 상기 제2 동작감지신호에서 감지된 흔들림 방향에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 상기 디스플레이부에 표시할 수 있다.
또한 바람직하게는, 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계는, 상기 사용자로부터 텍스트 변환 명령을 입력받는 단계, 상기 텍스트 변환 명령에 따라 상기 음성데이터를 음성/텍스트 변환 서버로 전송하는 단계, 및 상기 음성/텍스트 변환 서버로부터 전송받은 상기 음성데이터에 대응되는 텍스트를 디스플레이부에 표시하는 단계를 포함할 수 있다.
상기와 같은 목적을 달성하기 위하여, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 동작감지 센서부가 사용자로부터 입력받은 모바일 단말기의 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계, 상기 제어부가 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 제1 음성을 녹음하는 단계, 상기 동작감지 센서부가 상기 제1 음성 녹음 중에 상기 사용자로부터 입력받은 상기 모바일 단말기의 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계, 상기 제어부에서 상기 제2 동작감지신호에 따라 상기 제1 음성 녹음을 종료하고 녹음된 제1 음성으로부터 제1 음성데이터를 생성하는 단계, 상기 동작감지 센서부가 상기 사용자로부터 입력받은 상기 모바일 단말기의 제3 동작입력에 대응되는 제3 동작감지신호를 생성하여 상기 제어부로 출력하는 단계, 상기 제어부가 상기 제3 동작감지신호에 따라 상기 오디오 입출력부를 통해 입력되는 제2 음성을 녹음하는 단계, 상기 동작감지 센서부가 상기 제2 음성 녹음 중에 상기 사용자로부터 입력받은 상기 모바일 단말기의 제4 동작입력에 대응되는 제4 동작감지신호를 생성하여 상기 제어부로 출력하는 단계, 상기 제어부에서 상기 제4 동작감지신호에 따라 상기 제2 음성 녹음을 종료하고 녹음된 제2 음성으로부터 제2 음성데이터를 생성하는 단계, 및 상기 사용자로부터 텍스트 변환 명령이 입력되면 상기 생성된 제1 음성데이터 및 제2 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하는 것을 특징으로 한다.
바람직하게는, 상술한 바와 같은 모바일 단말기에서의 음성/텍스트 변환방법은, 모바일 단말기에서의 음성/텍스트 변환방법을 수행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체에 의해 구현될 수 있다.
상기와 같은 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체는, 모바일 단말기의 흔들림을 감지하여 생성된 동작감지신호에 따라 음성 녹음 및 텍스트 변환을 수행할 수 있기 때문에, 사용자가 모바일 단말기의 화면을 보기 어려운 상황에서도 음성 녹음 및 텍스트 변환을 쉽게 수행할 수 있는 효과가 있다.
또한, 상기와 같은 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체는, 사용자의 동작입력에 따라 여러 개의 음성 구간 각각에 식별정보를 대응시킴으로써 여러 개의 음성 구간에 대응되는 텍스트들을 서로 구별하여 표시할 수 있기 때문에, 사용자가 변환된 텍스트로부터 각각의 음성 구간의 화자(speaker)를 쉽게 구별할 수 있는 효과가 있다.
또한, 상기와 같은 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체는, 음성 녹음을 시작해야 하는 짧은 순간에도 간단한 인터페이스 신호로 음성 구간에 대응되는 사람을 매칭시켜 텍스트로 변환할 수 있는 효과가 있다.
또한, 상기와 같은 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체는, 모바일 단말기를 간단히 조작함으로써 음성데이터로부터 변환된 텍스트를 다른 언어로 번역하여 표시할 수 있는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 음성/텍스트 변환시스템을 나타내는 도면이다.
도 2는 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 나타내는 순서도(Flowchart)이다.
도 3은 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법에서 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계의 일실시예를 나타내는 순서도이다.
도 4는 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 나타내는 순서도이다.
도 5는 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법의 사용례를 나타내는 도면이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시 예를 예시하는 첨부 도면 및 도면에 기재된 내용을 참조하여야 한다.
이하 첨부한 도면을 참조하여 본 발명의 바람직한 실시 예를 설명함으로써, 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 음성/텍스트 변환시스템을 나타내는 도면이다. 도 1을 참조하면 본 발명의 일실시예에 따른 음성/텍스트 변환시스템(100)은, 모바일 단말기(110) 및 음성/텍스트 변환서버(150)를 포함할 수 있다.
모바일 단말기(110)는, 디스플레이부(111), 오디오 입출력부(113), 무선통신부(115), 동작감지 센서부(117) 및 제어부(119)를 포함할 수 있다. 상기 모바일 단말기(110)는, 휴대폰, 스마트폰, 개인휴대정보단말(PDA), 휴대용 멀티미디어 재생장치(PMP) 등 휴대가 가능한 다양한 형태의 단말기를 포함하는 개념으로서, 통상의 기술자에게 알려진 범위에서 다양하게 변경될 수 있다. 또한, 도 1에 도시된 모바일 단말기(110)의 구성은 예시적인 것으로서 모바일 단말기(110)의 구체적인 구성은 통상의 기술자에게 알려진 범위에서 다양하게 변경될 수 있다.
디스플레이부(111)는, 오디오 입출력부(113) 및 제어부(119)에 의해 생성된 음성데이터로부터 변환된 텍스트를 제어부(119)로부터 입력받아 표시할 수 있다. 디스플레이부(111)는, 모바일 단말기(110)의 외면에 형성될 수 있으며, 통상의 기술자에게 알려진 바와 같이, 액정표시장치(LCD), 발광다이오드(LED), 유기발광다이오드(OLED) 등 모바일 단말기(110)에 적용될 수 있는 다양한 형태의 디스플레이 장치에 의해 구현될 수 있다.
오디오 입출력부(113)는 모바일 단말기(110)의 외부에 형성되고, 모바일 단말기(110)의 외부로부터 음성 등을 입력받는 마이크부(미도시) 및 제어부(119)의 제어에 따라 외부로 음성 등을 출력하는 스피커부(미도시)를 포함할 수 있다. 상기 오디오 입출력부(113)를 구성하는 마이크부(미도시) 및 스피커부(미도시)의 구체적인 구성에 대해서는 통상의 기술자에게 널리 알려져 있으므로 여기에서는 자세한 설명을 생략한다.
무선통신부(115)는, WCDMA(Wideband Code Division Multiple Access), LTE(Long Term Evolution), WiBro(Wireless Broadband Internet) 또는 WiFi(Wireless Fidelity) 등과 같은 무선통신망을 통해 음성/텍스트 변환서버(150)와 데이터 통신을 수행할 수 있다. 무선통신부(115)는 상술한 바와 같은 다양한 이동통신방법 중 적어도 하나를 지원하는 통신모듈로 구현될 수 있으며, 통상의 기술자에게 알려진 범위에서 다양하게 변경될 수 있다.
동작감지 센서부(117)는, 사용자로부터 모바일 단말기(110)의 동작입력을 입력받은 경우, 상기 동작입력에 대응되는 동작감지신호를 생성하여 제어부(119)로 출력할 수 있다. 일례로서, 상기 동작입력은 사용자가 모바일 단말기(110)를 좌우, 상하 또는 대각선 방향으로 흔드는 동작을 입력하는 것을 의미한다. 상기 동작감지 센서부(117)는, 사용자 단말기(110)에 내장될 수 있고 자이로스코프(Gyroscope), 가속도 센서(Accelerometer sensor) 및 중력 센서(Gravity Sensor)와 같은 다양한 형태의 동작감지 센서에 의해 구현될 수 있다. 상기 사용자의 동작입력에 따라 동작감지 센서부(117)에서 출력되는 동작감지신호에는 모바일 단말기(110)의 이동방향 및 가속도 등의 정보가 포함될 수 있으며, 이에 대한 자세한 사항은 통상의 기술자에게 널리 알려져 있으므로 여기에서는 자세한 설명을 생략한다.
제어부(119)는, 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호에 따라 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 즉, 제어부(119)는, 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다.
또한, 상기 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제2 동작감지신호에 따라 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성할 수 있다. 즉, 제어부(119)는, 동작감지 센서부(117)로부터 입력받은 제2 동작감지신호에서 기준치 이상의 흔들림이 감지되면 음성 녹음을 종료하고 음성데이터를 생성할 수 있다. 상기 제어부(119)는, 모바일 단말기(110)의 다양한 구성요소를 제어하고 다양한 데이터를 처리하는 구성요소로서, CPU 프로세서와 같은 중앙처리장치에 의해 구현될 수 있다.
한편, 일례로서, 상기 제어부(119)는 제1 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있다. 또한 다른 예로서, 상기 제어부(119)는 제1 동작감지신호에서 감지된 흔들림 방향 또는 제2 동작감지신호에서 감지된 흔들림 방향에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있다. 또한 다른 예로서, 상기 제어부(119)는 제1 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제1 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하거나, 제2 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제2 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있다.
또한, 상기 제어부(119)는, 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)로 출력할 수 있다. 다른 예로서, 제어부(119)는 사용자로부터 입력받은 텍스트 변환 명령에 따라 상기 음성데이터를 무선통신부(115)를 통해 음성/텍스트 변환서버(150)로 전송할 수도 있다. 이에 따라, 음성/텍스트 변환서버(150)는 모바일 단말기(110)로부터 전송받은 음성데이터를 텍스트로 변환한 후 변환된 텍스트를 모바일 단말기(110)의 무선통신부(115)로 전송할 수 있으며, 제어부(119)는 무선통신부(115)를 통해 상기 변환된 텍스트를 전송받아 디스플레이부(111)로 출력할 수 있다. 이때, 제어부(119)는, 음성데이터와 함께 저장된 식별번호에 대응되는 색상으로 상기 변환된 텍스트를 디스플레이부(111)에 표시할 수도 있다.
또한, 상기 제어부(119)는, 제1 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)에 표시할 수 있다. 또한, 상기 제어부(119)는, 제1 동작감지신호에서 감지된 흔들림 방향 또는 제2 동작감지신호에서 감지된 흔들림 방향에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)에 표시할 수도 있다.
한편, 본 발명의 일실시예에 따른 모바일 단말기(110)의 제어부(119)에 의해 수행되는 음성/텍스트 변환방법에 대한 구체적인 설명은 도 2 내지 도 4를 참조하여 상술하기로 한다.
도 1에 도시된 음성/텍스트 변환서버(150)는, 모바일 단말기(110)와 데이터 통신을 수행할 수 있고 음성 데이터베이스(미도시)를 이용해 음성/텍스트 변환을 수행할 수 있다. 도 1에 도시된 음성/텍스트 변환서버(150)의 구체적인 구성 및 동작에 대해서는 통상의 기술자에게 널리 알려져 있으므로 여기에서는 자세한 설명을 생략한다.
도 2는 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 나타내는 순서도(Flowchart)이다. 도 2에 도시된 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은 도 1을 참조하여 상술한 모바일 단말기(110)에 의해 수행될 수 있다.
도 2를 참조하면, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 모바일 단말기(110)의 제1 동작입력을 입력받는 단계(S21)를 포함할 수 있다. 상기 제1 동작입력은, 사용자가 모바일 단말기(110)를 손에 쥔 상태에서 모바일 단말기(110)를 움직이는 다양한 동작을 의미할 수 있다. 일례로서, 상기 제1 동작입력은 사용자가 모바일 단말기(110)를 좌우, 상하 또는 대각선 방향 등으로 흔드는 동작일 수 있다.
다음으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 동작감지 센서부(117)에서 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부(119)로 출력하는 단계(S22)를 포함할 수 있다. 상술한 바와 같이, 동작감지 센서부(117)는, 사용자가 제1 동작입력을 입력하면 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성할 수 있다. 상기 제1 동작감지신호에는 제1 동작입력에 대응되는 모바일 단말기(110)의 이동방향 및 가속도 등의 정보가 포함될 수 있다.
다음으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제어부(119)에서 제1 동작감지신호에 따라 오디오 입출력부(113)를 통해 입력되는 음성을 녹음하는 단계(S23)를 포함할 수 있다.
즉, 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호를 분석하여 상기 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 예를 들면, 제어부(119)는, 제1 동작감지신호에 포함된 모바일 단말기(110)의 가속도의 크기가 기준 가속도보다 큰 경우에는, 사용자의 제1 동작입력에 기준치 이상의 흔들림이 있었던 것으로 판단할 수 있다.
다음으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 음성 녹음 중에 사용자로부터 모바일 단말기(110)의 제2 동작입력을 입력받는 단계(S24)를 포함할 수 있다. 즉, 사용자는 제1 동작입력에 따라 음성이 녹음되는 도중에 음성 녹음을 종료하고 싶은 경우 제2 동작입력을 입력할 수 있다. 상기 제2 동작입력은, 제1 동작입력과 유사하게, 사용자가 모바일 단말기(110)를 손에 쥔 상태에서 모바일 단말기(110)를 움직이는 다양한 동작을 의미할 수 있다. 일례로서, 상기 제2 동작입력은 사용자가 모바일 단말기(110)를 좌우, 상하 또는 대각선 방향 등으로 흔드는 동작일 수 있다.
다음으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 동작감지 센서부(117)에서 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 제어부(119)로 출력하는 단계(S25)를 포함할 수 있다. 상술한 바와 같이, 동작감지 센서부(117)는, 사용자가 제2 동작입력을 입력하면 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성할 수 있다. 상기 제2 동작감지신호에는 제2 동작입력에 대응되는 모바일 단말기(110)의 이동방향 및 가속도 등의 정보가 포함될 수 있다.
다음으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제어부(119)에서 제2 동작감지신호에 따라 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계(S26)를 포함할 수 있다.
즉, 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제2 동작감지신호를 분석하여 상기 제2 동작감지신호에서 기준치 이상의 흔들림이 감지되면 음성 녹음을 종료하고 음성데이터를 생성할 수 있다. 예를 들면, 제어부(119)는, 제2 동작감지신호에 포함된 모바일 단말기(110)의 가속도의 크기가 기준 가속도보다 큰 경우에는, 사용자의 제2 동작입력에 기준치 이상의 흔들림이 있었던 것으로 판단할 수 있다.
마지막으로, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)에 표시하는 단계(S27)를 포함할 수 있다. 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 모바일 단말기(110)에서 생성된 음성데이터를 텍스트로 변환할 수도 있고, 모바일 단말기(110)에서 음성데이터를 음성/텍스트 변환서버(150)로 전송하고, 음성/텍스트 변환서버(150)에서 음성데이터들을 텍스트로 변환한 후 모바일 단말기(110)로 전송하면, 모바일 단말기(110)가 전송받은 텍스트들을 디스플레이부(111)에 표시할 수도 있다.
정리하면, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 모바일 단말기(110)의 동작감지 센서부(117)에 의해 생성되는 동작감지신호를 분석하여 모바일 단말기(110)의 동작입력에 따른 흔들림이 일정 기준치 이상인 경우, 오디오 입출력부(113)를 통해 입력되는 음성을 녹음하거나 음성 녹음을 종료하고 음성데이터를 생성할 수 있고, 녹음된 음성을 텍스트로 변환하여 디스플레이부(111)를 통해 사용자에게 표시할 수 있다.
한편, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 횟수 및 흔드는 방향 등에 따라 다양한 알고리즘이 적용될 수 있다. 이하에서 이와 같은 다양한 알고리즘 실시예를 설명하기로 한다.
일례로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있고, 상기 음성데이터를 텍스트로 변환한 후 디스플레이부(111)에 표시할 때 상기 식별번호에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
즉, 사용자가 제1 동작입력 또는 제2 동작입력으로서 모바일 단말기(110)를 여러 번 흔든 경우에는, 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수를 측정하여 사용자가 모바일 단말기(110)를 흔든 횟수를 감지할 수 있다. 이후, 제어부(119)는, 사용자가 모바일 단말기(110)를 흔든 횟수에 따라 식별번호를 생성하여 녹음된 음성데이터와 함께 저장할 수 있다.
예를 들면, 사용자는 제1 동작입력으로서 모바일 단말기(110)를 두 번 흔들 수 있고, 이에 따라 제어부(119)는 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 이후, 음성 녹음 중에 사용자는 제2 동작입력으로서 모바일 단말기(110)를 한 번 흔들 수 있고, 이에 따라 제어부(119)는 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성할 수 있다. 이때, 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 두 번 흔들었으므로, 식별번호 "2"를 상기 음성데이터와 함께 저장할 수 있다. 상기 식별번호는, 사용자의 설정에 따라, 제1 동작입력에 대응되는 값으로 설정될 수도 있고, 제2 동작입력에 대응되는 값으로 설정될 수도 있다.
이후, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상기 음성데이터를 텍스트로 변환한 후, 상기 변환된 텍스트를 식별번호 "2"에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
따라서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 횟수에 따라 녹음된 음성 구간 각각에 식별정보를 대응시킬 수 있으므로, 여러 개의 텍스트들을 서로 구별하여 디스플레이부(111)에 표시할 수 있다. 예를 들면, A, B, C, 세 사람이 모여서 회의를 하는 경우, A의 음성을 녹음할 때는 모바일 단말기(110)를 1번 흔들고, B의 음성을 녹음할 때는 모바일 단말기(110)를 2번 흔들고, C의 음성을 녹음할 때에는 모바일 단말기(110)를 3번 흔들면, 녹음된 음성 데이터들이 텍스트로 변환되어 디스플레이부(111)에 표시될 때, A의 음성 구간, B의 음성 구간 및 C의 음성 구간에 대응되는 텍스트들이 각기 다른 고유한 색깔로 표시되기 때문에 사용자가 디스플레이부(111)에 표시된 텍스트로부터 각각의 음성 구간의 화자(speaker)를 쉽게 알 수 있게 된다. 통상의 기술자에게 알려진 바와 같이, 각각의 식별번호에 대응되는 색상은 사용자의 설정에 따라 변경될 수 있다.
다른 예로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 감지된 흔들림 방향 또는 제2 동작감지신호에서 감지된 흔들림 방향에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있고, 상기 음성데이터를 텍스트로 변환하여 상기 식별번호에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
즉, 사용자가 제1 동작입력 또는 제2 동작입력으로서 모바일 단말기(110)를 가로 방향으로 흔들거나 세로 방향으로 흔든 경우, 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호 또는 제2 동작감지신호에 포함된 모바일 단말기(110)의 이동방향 정보에 따라 사용자가 모바일 단말기(110)를 흔든 방향을 감지할 수 있다. 이후, 제어부(119)는, 사용자가 모바일 단말기(110)를 흔든 방향에 따라 식별번호를 생성하여 녹음된 음성데이터와 함께 저장할 수 있다.
예를 들면, 사용자는 제1 동작입력으로서 모바일 단말기(110)를 가로 방향으로 한 번 흔들 수 있고, 이에 따라 제어부(119)는 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 이후, 음성 녹음 중에 사용자는 제2 동작입력으로서 모바일 단말기(110)를 한 번 흔들 수 있고, 이에 따라 제어부(119)는 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성할 수 있다. 이때, 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 가로 방향으로 흔들었으므로, 식별번호 "1"을 상기 음성데이터와 함께 저장할 수 있다. 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 세로 방향으로 흔든 경우에는 식별번호 "2"를 상기 음성데이터와 함께 저장할 수 있다. 상기 식별번호는, 사용자의 설정에 따라, 제1 동작입력에 대응되는 값으로 설정될 수도 있고, 제2 동작입력에 대응되는 값으로 설정될 수도 있다.
이후, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상기 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 식별번호에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
따라서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 방향에 따라 녹음된 음성 구간 각각에 식별정보를 대응시킬 수 있으므로, 여러 개의 텍스트들을 서로 구별하여 디스플레이부(111)에 표시할 수 있다. 예를 들면, A(질문자), B(답변자) 두 사람이 인터뷰를 하는 경우, A의 음성을 녹음할 때는 모바일 단말기(110)를 가로 방향으로 흔들고, B의 음성을 녹음할 때는 모바일 단말기(110)를 세로 방향으로 흔들면, 녹음된 음성 데이터들이 텍스트로 변환되어 디스플레이부(111)에 표시될 때, A의 음성 및 B의 음성이 각기 다른 고유한 색깔로 표시되기 때문에 사용자가 디스플레이부(111)에 표시된 텍스트로부터 각각의 음성 구간이 질문자에 의한 것인지 답변자에 의한 것인지를 쉽게 알 수 있게 된다.
또 다른 예로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제1 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하거나, 제2 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제2 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있고, 상기 음성데이터를 텍스트로 변환하여 상기 식별번호에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
즉, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상술한 바와 같은 모바일 단말기(110)를 흔든 횟수에 따라 음성데이터에 식별번호를 부여하는 방법과 모바일 단말기(110)를 흔든 방향에 따라 음성데이터에 식별번호를 부여하는 방법을 조합하여, 음성데이터에 식별번호를 부여할 수 있다.
예를 들면, 사용자는 제1 동작입력으로서 모바일 단말기(110)를 가로 방향으로 한 번, 세로 방향으로 한 번 흔들 수 있고, 이에 따라 제어부(119)는 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 이후, 음성 녹음 중에 사용자는 제2 동작입력으로서 모바일 단말기(110)를 한 번 흔들 수 있고, 이에 따라 제어부(119)는 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성할 수 있다. 이때, 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 가로 방향으로 한 번, 세로 방향으로 한 번 흔들었으므로, 식별번호 "11"을 상기 음성데이터와 함께 저장할 수 있다. 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 가로 방향으로만 한 번 흔든 경우에는 식별번호 "10"을 상기 음성데이터와 함께 저장할 수 있다. 사용자의 설정에 따라, 상기 식별번호는 제1 동작입력에 대응되는 값으로 설정될 수도 있고, 제2 동작입력에 대응되는 값으로 설정될 수도 있다.
이후, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상기 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 식별번호에 대응되는 색상으로 디스플레이부(111)에 표시할 수 있다.
따라서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 횟수 및 흔드는 방향에 따라 녹음된 음성 구간 각각에 식별정보를 대응시킬 수 있으므로, 여러 개의 텍스트들을 서로 구별하여 디스플레이부(111)에 표시할 수 있다.
한편, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 횟수 및 흔드는 방향 등에 따라 디스플레이부(111)에 표시되는 텍스트의 언어를 설정할 수도 있다.
일례로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수에 대응되는 번역 언어에 따라 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)에 표시할 수 있다.
즉, 사용자가 제1 동작입력 또는 제2 동작입력으로서 모바일 단말기(110)를 여러 번 흔든 경우에는, 제어부(119)는 동작감지 센서부(117)로부터 입력받은 제1 동작감지신호 또는 제2 동작감지신호에서 기준치 이상의 흔들림이 감지된 횟수를 측정하여 사용자가 모바일 단말기(110)를 흔든 횟수를 감지할 수 있다. 이후, 제어부(119)는, 사용자가 모바일 단말기(110)를 흔든 횟수에 따라 번역 언어를 설정하여 음성데이터를 텍스트로 변환할 수 있다.
예를 들면, 사용자는 제1 동작입력으로서 모바일 단말기(110)를 두 번 흔들 수 있고, 이에 따라 제어부(119)는 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있다. 이후, 음성 녹음 중에 사용자는 제2 동작입력으로서 모바일 단말기(110)를 한 번 흔들 수 있고, 이에 따라 제어부(119)는 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성할 수 있다. 이때, 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 두 번 흔들었으므로, 음성데이터로부터 변환된 텍스트를 영어로 번역하여 디스플레이부(111)에 표시할 수 있다. 제어부(119)는 사용자가 제1 동작입력에서 모바일 단말기(110)를 세 번 흔든 경우에는 음성데이터로부터 변환된 텍스트를 중국어로 번역하여 디스플레이부(111)에 표시할 수 있다. 사용자의 설정에 따라, 상기 번역 언어는 제1 동작입력에 대응되는 값으로 설정될 수도 있고, 제2 동작입력에 대응되는 값으로 설정될 수도 있다. 또한, 모바일 단말기(110)를 흔든 횟수에 대응되는 번역 언어도 사용자의 설정에 따라 다양한 언어로 변경될 수 있다.
따라서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 모바일 단말기(110)를 흔드는 횟수에 따라 다양한 언어로 텍스트를 번역하여 디스플레이부(111)에 표시할 수 있다.
다른 예로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 감지된 흔들림 방향 또는 제2 동작감지신호에서 감지된 흔들림 방향에 대응되는 번역 언어에 따라 생성된 음성데이터를 텍스트로 변환하여 디스플레이부(111)에 표시할 수 있다.
또 다른 예로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제1 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제1 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 번역 언어를 설정하거나, 제2 동작감지신호에서 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 제2 동작감지신호에서 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 번역 언어를 설정할 수 있고, 음성데이터로부터 변환된 텍스트를 상기 설정된 번역 언어에 따라 번역하여 디스플레이부(111)에 표시할 수 있다. 즉, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상술한 바와 같은 모바일 단말기(110)를 흔든 횟수에 따라 번역 언어를 설정하는 방법과 모바일 단말기(110)를 흔든 방향에 따라 번역 언어를 설정하는 방법을 조합하여, 번역 언어를 설정할 수도 있다.
한편, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자의 제1 동작입력 및 제2 동작입력에 포함되는 흔들림 횟수 및 흔들림 방향 등에 따라 다양한 방법으로 식별번호를 생성하고 번역 언어를 설정할 수도 있다. 일례로서, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자의 제1 동작입력에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수 있고, 사용자의 제2 동작입력에 따라 번역 언어를 선택하여 변환된 텍스트를 디스플레이부(111)에 표시할 수도 있다. 또한, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자의 제1 동작입력 또는 제2 동작입력의 가로방향 흔들림에 따라 식별번호를 생성하여 음성데이터와 함께 저장할 수도 있고, 사용자의 제1 동작입력 또는 제2 동작입력의 세로방향 흔들림에 따라 음성 구간의 녹음을 시작하거나 종료할 수도 있다. 이와 같이, 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 통상의 기술자에게 알려진 범위에서 다양하게 변경될 수 있다.
도 3은 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법에서 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계(S27)의 일실시예를 나타내는 순서도이다.
도 2에 도시된 S27 단계는, 도 3에 도시된 바와 같이, 사용자로부터 텍스트 변환 명령을 입력받는 단계(S31), 텍스트 변환 명령에 따라 음성데이터를 음성/텍스트 변환 서버(150)로 전송하는 단계(S32) 및 음성/텍스트 변환 서버(150)로부터 전송받은 음성데이터에 대응되는 텍스트를 디스플레이부(111)에 표시하는 단계(S33)를 포함할 수 있다.
여기에서, 텍스트 변환 명령은, 녹음된 음성데이터를 텍스트로 변환하고자 할 때 사용자가 모바일 단말기(110)의 터치스크린과 같은 인터페이스부(미도시)를 통해 입력할 수 있는 명령으로서, 예를 들면, 사용자가 모바일 단말기(110)의 터치스크린에 표시된 텍스트 변환 아이콘을 터치함으로써 입력할 수 있다.
본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 텍스트 변환 명령이 입력되면, 녹음된 음성데이터를 음성/텍스트 변환서버(150)로 전송할 수 있고, 음성/텍스트 변환서버(150)가 음성데이터를 텍스트로 변환하여 모바일 단말기(110)로 전송하면, 모바일 단말기(110)는 음성/텍스트 변환서버(150)로부터 전송받은 텍스트를 디스플레이부(111)에 표시할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 나타내는 순서도이다. 도 4에 도시된 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은 도 1을 참조하여 상술한 모바일 단말기(110)에 의해 수행될 수 있다.
도 4를 참조하면, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 동작감지 센서부(117)가 사용자로부터 입력받은 모바일 단말기(110)의 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부(119)로 출력하는 단계(S41)를 포함할 수 있다.
다음으로, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제어부(119)가 제1 동작감지신호에 따라 오디오 입출력부(113)를 통해 입력되는 음성을 녹음하는 단계(S42)를 포함할 수 있다.
다음으로, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 동작감지 센서부가 음성 녹음 중에 사용자로부터 입력받은 모바일 단말기(110)의 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 제어부(119)로 출력하는 단계(S43)를 포함할 수 있다.
다음으로, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 제어부(119)에서 제2 동작감지신호에 따라 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계(S44)를 포함할 수 있다.
도 4에 도시된 S41, S42, S43, S44 단계에 대해서는 도 2를 참조하여 상술한 바 있으므로 여기에서는 자세한 설명을 생략한다.
다음으로, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 텍스트 변환명령이 입력되었는지 판단하는 단계(S45)를 포함할 수 있다. 도 3을 참조하여 상술한 바와 같이 텍스트 변환명령은 녹음된 음성데이터를 텍스트로 변환하고자 할 때 사용자가 모바일 단말기(110)의 터치스크린과 같은 인터페이스부(미도시)를 통해 입력할 수 있는 명령으로서, 예를 들면 사용자가 모바일 단말기(110)의 터치스크린에 표시된 텍스트 변환 아이콘을 터치함으로써 입력할 수 있다.
사용자가 텍스트 변환명령을 입력하지 않고(S45 -> NO) 새로운 음성 구간의 녹음을 원하는 경우에는, 사용자는 모바일 단말기(110)의 제1 동작입력을 다시 입력할 수 있다. 이에 따라, 모바일 단말기(110)는, S41, S42, S43, S44 단계를 거쳐 새로운 음성 구간의 음성데이터를 생성하여 저장할 수 있다. 즉, 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자의 선택에 따라 여러 개의 음성 구간을 계속해서 녹음할 수 있다.
한편, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자가 일정시간 이내에 텍스트 변환명령을 입력하지 않은 경우(S45 -> NO)에는, 바로 S42 단계를 수행하여 오디오 입출력부(113)를 통해 입력되는 음성을 녹음할 수 있고, 사용자의 제2 동작입력에 따라 음성 녹음을 종료하고 음성데이터를 생성할 수도 있다. 즉, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 텍스트 변환명령이 입력되지 않은 후 최초로 입력되는 사용자의 동작입력을 음성녹음 시작 신호가 아닌 음성녹음 종료 신호로 해석할 수도 있다.
다음으로, 본 발명의 다른 실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 사용자로부터 텍스트 변환명령이 입력되면(S45 -> YES), S41, S42, S43, S44 단계를 통해 생성된 적어도 하나의 음성데이터들을 텍스트로 변환하여 디스플레이부(111)에 표시하는 단계(S46)를 포함할 수 있다. 상술한 바와 같이, 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 모바일 단말기(110)에서 상기 적어도 하나의 음성데이터들을 텍스트로 변환할 수도 있고, 모바일 단말기(110)에서 상기 적어도 하나의 음성데이터들을 음성/텍스트 변환서버(150)로 전송하고, 음성/텍스트 변환서버(150)에서 상기 적어도 하나의 음성데이터들을 텍스트로 변환한 후 모바일 단말기(110)로 전송하면, 모바일 단말기(110)가 전송받은 텍스트들을 디스플레이부(111)에 표시할 수 있다.
한편, 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법은, 상술한 바와 같은 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 수행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체에 의해 수행될 수 있다. 즉, 사용자는 자신의 모바일 단말기(110)에 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법을 수행하는 프로그램(어플리케이션)을 설치함으로써, 본 발명에 따른 모바일 단말기에서의 음성/텍스트 변환방법이 수행될 수 있다.
도 5는 본 발명의 일실시예에 따른 모바일 단말기에서의 음성/텍스트 변환방법의 사용례를 나타내는 도면이다.
먼저, 도 5의 (a)를 참조하면, 사용자는 모바일 단말기(110)를 흔들어서 동작입력을 입력함으로써 음성 구간의 녹음을 시작할 수 있다.
다음으로, 도 5의 (b)를 참조하면, 사용자는 음성 구간의 녹음을 종료하고자 할 때에는 모바일 단말기(110)를 다시 흔들어서 동작입력을 입력함으로써 음성 구간의 녹음을 종료할 수 있다.
도 4를 참조하여 상술한 바와 같이, 사용자가 추가로 새로운 음성 구간의 녹음을 원하는 경우에는 다시 도 5의 (a)와 같이 모바일 단말기(110)를 흔들어서 동작입력을 입력할 수 있고, 사용자가 녹음된 음성데이터를 텍스트로 확인하고 싶은 경우에는 도 5의 (c)와 같이 텍스트 변환명령을 입력함으로써 음성데이터로부터 변환된 텍스트를 모바일 단말기(110)의 디스플레이부(111)를 통해 확인할 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
110: 모바일 단말기 111: 디스플레이부
113: 오디오 입출력부 115: 무선통신부
117: 동작감지 센서부 119: 제어부
150: 음성/텍스트 변환서버

Claims (11)

  1. 사용자로부터 모바일 단말기의 제1 동작입력을 입력받는 단계;
    동작감지 센서부에서 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계;
    상기 제어부에서 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 음성을 녹음하는 단계;
    상기 음성 녹음 중에 상기 사용자로부터 상기 모바일 단말기의 제2 동작입력을 입력받는 단계;
    상기 동작감지 센서부에서 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계;
    상기 제어부에서 상기 제2 동작감지신호에 따라 상기 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계; 및
    상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하고,
    상기 제어부는,
    상기 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 상기 오디오 입출력부를 통해 입력되는 상기 음성을 녹음하고, 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지되면 상기 음성 녹음을 종료하고 상기 음성데이터를 생성하며, 상기 제1 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수 또는 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장하고, 상기 생성된 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 상기 식별번호에 대응되는 색상으로 상기 디스플레이부에 표시하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  2. 삭제
  3. 삭제
  4. 사용자로부터 모바일 단말기의 제1 동작입력을 입력받는 단계;
    동작감지 센서부에서 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계;
    상기 제어부에서 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 음성을 녹음하는 단계;
    상기 음성 녹음 중에 상기 사용자로부터 상기 모바일 단말기의 제2 동작입력을 입력받는 단계;
    상기 동작감지 센서부에서 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계;
    상기 제어부에서 상기 제2 동작감지신호에 따라 상기 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계; 및
    상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하고,
    상기 제어부는,
    상기 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 상기 오디오 입출력부를 통해 입력되는 상기 음성을 녹음하고, 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지되면 상기 음성 녹음을 종료하고 상기 음성데이터를 생성하며, 상기 제1 동작감지신호에서 감지된 흔들림 방향 또는 상기 제2 동작감지신호에서 감지된 흔들림 방향에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장하고, 상기 생성된 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 상기 식별번호에 대응되는 색상으로 상기 디스플레이부에 표시하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  5. 사용자로부터 모바일 단말기의 제1 동작입력을 입력받는 단계;
    동작감지 센서부에서 상기 제1 동작입력에 대응되는 제1 동작감지신호를 생성하여 제어부로 출력하는 단계;
    상기 제어부에서 상기 제1 동작감지신호에 따라 오디오 입출력부를 통해 입력되는 음성을 녹음하는 단계;
    상기 음성 녹음 중에 상기 사용자로부터 상기 모바일 단말기의 제2 동작입력을 입력받는 단계;
    상기 동작감지 센서부에서 상기 제2 동작입력에 대응되는 제2 동작감지신호를 생성하여 상기 제어부로 출력하는 단계;
    상기 제어부에서 상기 제2 동작감지신호에 따라 상기 음성 녹음을 종료하고 녹음된 음성으로부터 음성데이터를 생성하는 단계; 및
    상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계를 포함하고,
    상기 제어부는,
    상기 제1 동작감지신호에서 기준치 이상의 흔들림이 감지되면 상기 오디오 입출력부를 통해 입력되는 상기 음성을 녹음하고, 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지되면 상기 음성 녹음을 종료하고 상기 음성데이터를 생성하며, 상기 제1 동작감지신호에서 상기 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 상기 제1 동작감지신호에서 상기 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하거나, 상기 제2 동작감지신호에서 상기 기준치 이상의 가로방향 흔들림이 감지된 횟수 및 상기 제2 동작감지신호에서 상기 기준치 이상의 세로방향 흔들림이 감지된 횟수에 따라 식별번호를 생성하여 상기 음성데이터와 함께 저장하고, 상기 생성된 음성데이터를 텍스트로 변환하고, 상기 변환된 텍스트를 상기 식별번호에 대응되는 색상으로 상기 디스플레이부에 표시하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  6. 삭제
  7. 제1항, 제4항 또는 제5항 중 어느 한 항에 있어서, 상기 제어부는,
    상기 제1 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수 또는 상기 제2 동작감지신호에서 상기 기준치 이상의 흔들림이 감지된 횟수에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 상기 디스플레이부에 표시하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  8. 제1항, 제4항 또는 제5항 중 어느 한 항에 있어서, 상기 제어부는,
    상기 제1 동작감지신호에서 감지된 흔들림 방향 또는 상기 제2 동작감지신호에서 감지된 흔들림 방향에 대응되는 번역 언어에 따라 상기 생성된 음성데이터를 텍스트로 변환하여 상기 디스플레이부에 표시하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  9. 제1항, 제4항 또는 제5항 중 어느 한 항에 있어서, 상기 생성된 음성데이터를 텍스트로 변환하여 디스플레이부에 표시하는 단계는,
    상기 사용자로부터 텍스트 변환 명령을 입력받는 단계;
    상기 텍스트 변환 명령에 따라 상기 음성데이터를 음성/텍스트 변환 서버로 전송하는 단계; 및
    상기 음성/텍스트 변환 서버로부터 전송받은 상기 음성데이터에 대응되는 텍스트를 디스플레이부에 표시하는 단계를 포함하는 것을 특징으로 하는 모바일 단말기에서의 음성/텍스트 변환방법.
  10. 삭제
  11. 제1항, 제4항 또는 제5항 중 어느 한 항에 기재된 모바일 단말기에서의 음성/텍스트 변환방법을 수행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체.
KR1020120128570A 2012-11-14 2012-11-14 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체 KR101470900B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120128570A KR101470900B1 (ko) 2012-11-14 2012-11-14 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120128570A KR101470900B1 (ko) 2012-11-14 2012-11-14 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체

Publications (2)

Publication Number Publication Date
KR20140062217A KR20140062217A (ko) 2014-05-23
KR101470900B1 true KR101470900B1 (ko) 2014-12-09

Family

ID=50890537

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120128570A KR101470900B1 (ko) 2012-11-14 2012-11-14 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체

Country Status (1)

Country Link
KR (1) KR101470900B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102530669B1 (ko) 2020-10-07 2023-05-09 네이버 주식회사 앱과 웹의 연동을 통해 음성 파일에 대한 메모를 작성하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100045434A (ko) * 2010-04-22 2010-05-03 엘지전자 주식회사 제스쳐를 이용한 명령 입력 방법
KR20110037654A (ko) * 2009-10-07 2011-04-13 엘지전자 주식회사 이동 단말기에서의 터치 신호 처리 방법 및 이를 이용한 이동 단말기
KR20110058182A (ko) * 2009-11-26 2011-06-01 정기현 움직임 감지 센서를 사용한 휴대용 단말기 구동방법
KR20110100620A (ko) * 2008-11-10 2011-09-14 구글 인코포레이티드 멀티센서 음성 검출

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110100620A (ko) * 2008-11-10 2011-09-14 구글 인코포레이티드 멀티센서 음성 검출
KR20110037654A (ko) * 2009-10-07 2011-04-13 엘지전자 주식회사 이동 단말기에서의 터치 신호 처리 방법 및 이를 이용한 이동 단말기
KR20110058182A (ko) * 2009-11-26 2011-06-01 정기현 움직임 감지 센서를 사용한 휴대용 단말기 구동방법
KR20100045434A (ko) * 2010-04-22 2010-05-03 엘지전자 주식회사 제스쳐를 이용한 명령 입력 방법

Also Published As

Publication number Publication date
KR20140062217A (ko) 2014-05-23

Similar Documents

Publication Publication Date Title
US10546582B2 (en) Information processing device, method of information processing, and program
KR102185166B1 (ko) 생체 정보를 인식하기 위한 전자 장치 및 방법
CN107950030B (zh) 显示装置以及控制显示装置的方法
EP2704024B1 (en) Input assistance device, input asssistance method, and program
JP2015090589A (ja) 認証制御システム、認証制御方法およびプログラム
CN109240577B (zh) 一种截屏方法及终端
KR102127394B1 (ko) 모바일 디바이스 및 그 제어 방법
CN109240785B (zh) 一种设置语言的方法、终端及存储介质
CN107257510B (zh) 视频统一播放方法、终端及计算机可读存储介质
CN108551521B (zh) 一种登录信息提示方法及移动终端
JP2018508086A (ja) 入力処理方法、装置及び機器
US20190265798A1 (en) Information processing apparatus, information processing method, program, and information processing system
CN109683768B (zh) 一种应用的操作方法及移动终端
KR102271184B1 (ko) 영상 투사 장치 및 그의 동작 방법
CN111010523A (zh) 一种视频录制方法及电子设备
WO2019120190A1 (zh) 拨号方法及移动终端
US20140172909A1 (en) Apparatus and method for providing service application using robot
EP3086221A2 (en) Electronic apparatus, image display system, control program, and method for operating electronic apparatus
US20190129517A1 (en) Remote control by way of sequences of keyboard codes
WO2017005080A1 (zh) 网页显示方法、终端设备及存储介质
WO2015014138A1 (zh) 一种显示框显示的方法、装置和设备
KR101470900B1 (ko) 모바일 단말기에서의 음성/텍스트 변환방법 및 그 기록매체
CN109388471B (zh) 一种导航方法及装置
WO2014103544A1 (ja) 表示制御装置、表示制御方法および記録媒体
CN109788144B (zh) 一种拍摄方法及终端设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181113

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191203

Year of fee payment: 6