KR20180092467A - 모바일 음성 및 텍스트 변환 방법 - Google Patents

모바일 음성 및 텍스트 변환 방법 Download PDF

Info

Publication number
KR20180092467A
KR20180092467A KR1020170018169A KR20170018169A KR20180092467A KR 20180092467 A KR20180092467 A KR 20180092467A KR 1020170018169 A KR1020170018169 A KR 1020170018169A KR 20170018169 A KR20170018169 A KR 20170018169A KR 20180092467 A KR20180092467 A KR 20180092467A
Authority
KR
South Korea
Prior art keywords
voice
unit
data
text
conversion
Prior art date
Application number
KR1020170018169A
Other languages
English (en)
Inventor
권오영
성용후
Original Assignee
한국기술교육대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국기술교육대학교 산학협력단 filed Critical 한국기술교육대학교 산학협력단
Priority to KR1020170018169A priority Critical patent/KR20180092467A/ko
Publication of KR20180092467A publication Critical patent/KR20180092467A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72519
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/34Microprocessors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 모바일 음성 및 텍스트 변환 방법에 관한 것으로, 사용자가 모바일 음성 변환기 마이크부에 음성데이터를 입력하는 단계; 상기 마이크부에 입력된 음성 데이터를 제어부로 전송하는 단계; 상기 제어부에서 음성 데이터의 음성 및 텍스트 변환할 변환 구간, 음성 데이터를 오디오 입출력부에 전달하는 단계; 상기 제어부로부터 받은 변환 구간의 정보에 따라 오디오 입출력부의 음성 데이터 출력을 변환 구간만큼 출력하는 단계; 상기 오디오 입출력부의 출력된 음성 데이터를 마이크부에서 음성 데이터를 입력 동시에, 음성 및 텍스트 변환부에서 음성데이터를 텍스트로 변환하는 단계; 상기 음성 및 텍스트 변환부에서 변환된 데이터를 제어부로 전송 단계; 및 상기 제어부에 있는 음성 및 텍스트 변환부에서 변환된 데이터를 디스플레이부에 표시하는 단계;를 포함하는 것을 특징으로 한다.

Description

모바일 음성 및 텍스트 변환 방법{Method for Converting Mobile Speech and Text}
본 발명은 모바일 음성 및 텍스트 변환 방법에 관한 것으로, 더욱 상세하게는 모바일 음성 및 텍스트 변환기의 처리 길이를 길게 처리하는 모바일 음성 및 텍스트 변환방법에 관한 것이다.
일반적으로 모바일 음성 및 텍스트 변환기는 모바일의 음성녹음 버튼을 모바일의 터치 스크린에서 시작하면 녹음을 진행한다. 이때 녹음은 10초 내지 30초 동안 진행하며 그 이상 녹음이 진행될 경우 모바일 음성 및 텍스트 변환기에서 음성 변환이 이루어지지 않는 문제점이 발생한다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은 음성 변환처리길이를 10분 내지 30분으로 늘릴 수 있는 모바일 음성 및 텍스트 변환 방법을 제공하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명은 사용자가 모바일 음성 변환기 마이크부에 음성데이터를 입력하는 단계; 상기 마이크부에 입력된 음성 데이터를 제어부로 전송하는 단계; 상기 제어부에서 음성 데이터의 음성 및 텍스트 변환할 변환 구간, 음성 데이터를 오디오 입출력부에 전달하는 단계; 상기 제어부로부터 받은 변환 구간의 정보에 따라 오디오 입출력부의 음성 데이터 출력을 변환 구간만큼 출력하는 단계; 상기 오디오 입출력부의 출력된 음성 데이터를 마이크부에서 음성 데이터를 입력 동시에, 음성 및 텍스트 변환부에서 음성데이터를 텍스트로 변환하는 단계; 상기 음성 및 텍스트 변환부에서 변환된 데이터를 제어부로 전송 단계; 및 상기 제어부에 있는 음성 및 텍스트 변환부에서 변환된 데이터를 디스플레이부에 표시하는 단계;를 포함하는 모바일 음성 및 텍스트 변환 방법을 제공한다.
상기 오디오 입출력부는 제어부에서 음성 데이터, 음성 및 텍스트 변환 구간 정보를 받고, 음성 데이터를 출력을 진행하며, 변환 구간의 정보만큼 수행을 하고, 변환 구간의 정보가 없을 시에는 최소 변환 단위(1초 내지10초)를 수행할 수 있다.
이러한 특징에 따르면, 변환처리 길이를 10분 내지 30분으로 늘림으로써 보다 긴 시간 동안 동작이 이루지게 하는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 모바일 음성 및 텍스트 변환 장치의 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 모바일 음성 및 텍스트 변환 방법의 순서도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
그러면 본 발명의 일 실시예에 따른 모바일 음성 및 텍스트 변환 장치 및 방법에 대하여 설명한다.
먼저, 도 1은 본 발명의 일실시예에 따른 모바일 음성/텍스트 변환 장치의 블럭도이다.
도 1을 참조하면, 본 발명의 모바일 음성 및 텍스트 변환장치는 모바일 단말기(100)에서 동작이 이루어지며, 상기 단말기(100)는 제어부(101), 마이크부(102), 오디오 입출력부(103), 음성 및 텍스트 변환부(104), 및 디스플레이부(105)를 포함하여 구성된다.
상기 모바일 단말기(100)는 스마트폰, 태블릿PC, 노트북 및 컴퓨터 중 어느 하나이며, 이에 한정하지 않는다.
상기 제어부(101)는 오디오 입출력부(103)에 음성 및 텍스트 변환 구간 정보와 음성 데이터 정보를 전달 할 수 있다. 이에 따라, 오디오 입출력부(103)은 음성 데이터를 출력을 하며, 동시에 마이크부(102)는 음성 데이터를 입력 받으며 음성 및 텍트스 변환부(104)에서 음성 데이터를 텍스트로 변환 할 수 있다.
상기 제어부(101)은 마이크부(102)에서 음성 데이터를 입력을 받아서 제어부에 전송하고, 음성 데이터에 대해서 디스플레이부(105)에 표시 할 수 있다.
상기 마이크부(102)는 모바일의 단말기의 외부의 하단에 위치하여 형성 되어 있으며, 음성 데어터를 입력을 받을 수 있다. 이에 따라 제어부(101)에 음성 데이터를 전달 할 수 있다.
상기 오디오 입출력부(103)는 모바일 단말기(100)의 외부에 형성 되고, 외부로부터의 음성을 입력 받는 마이크부(102), 제어부(101)는 외부로 음성 출력을 조절 하며, 음성 출력 구간 설정을 제어할 수 있다.
상기 음성 및 텍스트 변환부(104)는 음성 데이터를 텍스트로 변환한 데이터를 제어부(101)에 전달 할 수 있다. 이에 따라 제어부(101)는 변환된 텍스트 데이터를 디스플레이부(105)에서 표시할 수 있다.
상기 디스플레이어부(105)는 모바일 단말기(100)의 외부의 외면에 위치하여 형성 되어 있으며, 통상 기술자에게 알려진 바와 같이 액정표시장치(LCD), 발광다이오드(LED)등 모바일 단말기(100)에 적용 될 수 있는 다양한 형태의 디스플레이 장치를 구현될 수 있다.
또한, 상기 디스플레이부(105)는 모바일 단말기의 음성 및 텍스트 변환부(104)에 의해서 생성된 텍스트 데이터를 제어부(101)로부터 입력받아 표시 할 수 있고, 제어부(101)에 입력된 음성 데이터를 오디오 입출력부(103)에서 출력 시에 제어부(101)는 마이크부(102)에서 음성 데이터를 입력받아 제어부에 전송하고, 음성 데이터에 대해 디스플레이부(105)에 표시할 수 있다.
도 2는 본 발명의 일실시예에 따른 모바일 음성 및 텍스트 변환 방법의 순서도이다.
도 2를 참조하면, 분 발명의 모바일 음성 및 텍스트 변환 방법은, 먼저 사용자로 하여금 모바일 단말기(100)의 마이크부(102)에 음성 데이터를 입력 받는다(S11).
상기 모바일 단말기(100)을 다양하게 위치시키고 마이크부(102)에 음성 데이터를 입력할 수 있다.
일례로서, 손으로 쥐고 사용하거나, 책상 위, 다양한 사물 위에 놓고 마이크부(102)에 음성 데이터를 입력할 수 있다.
다음으로, 상기 마이크부(102)에 입력된 음성 데이터를 제어부(101)에 전송 한다(S12).
이때, 마이크부(102)는 길이가 10분 내지 30분인 음성 데이터를 입력을 받아 입력된 음성 데이터를 갖게 되고 제어부(101)에 전달할 수 있다.
다음으로, 상기 제어부(101)에서 마이크부(102)로부터 받은 음성 데이터에 대해서 음성 및 텍스트 변환 구간 설정한 것을 오디오 입출력부(103)에 전송 한다(S13).
즉, 제어부(101)에서 음성 데이터10분 내지 30분 사이에서 제어부(101)가 음성 및 텍스트 변환 구간을 설정하며, 설정이 없을 시에는 자동으로 최소 변환 구간(1초 내지 10초)로 설정한다.
상기 입출력부(103)는 제어부(101)로부터 받은 변환 구간 정보에 따라 오디오 입출력부(103)의 음성 데이터 출력을 변환 구간만큼 출력한다(S14).
즉, 오디오 입출력부(103)는 제어부(101)로부터 음성 및 텍스트 변환 구간 정보를 받으며, 받은 변환 구간에 대해서 구간만큼만 출력하며, 받은 구간에 대한 특정 변환 구간이 없다면, 최소 변환 구간 1초 내지10초만큼 출력한다.
다음으로, 상기 음성 및 텍스트 변환부(104)는 오디오 상기 입출력부(103)의 출력된 음성 데이터를 마이크부(102)에서 음성 데이터를 입력과 동시에 음성 및 텍스트 변환부(104)에서 음성 데이터를 텍스트로 변환된 데이터로 저장 한다(S15).
즉, 오디오 입출력부(103)에서 제어부(101)로부터 받은 음성 데이터, 음성 및 텍스트 변환 구간 정보를 바탕으로 음성 데이터를 출력을 하며, 마이크부(102)는 오디오 입출력부(103)에서 출력하는 음성 데이터를 입력을 받으며, 동시에 음성 및 텍스트 변환부(104)에선 음성 및 텍스트 변환 구간10분 내지 30분에 대해서 음성 및 텍스트 변환 작업을 0초 내지 13초 단위로 작업 진행하며, 음성 및 텍스트 변환부는 음성 및 텍스트 변환 구간의 마지막에 도착하면 작업을 마친다.
다음으로, 음성 및 텍스트 변환부(104)는 변환된 텍스트 데이터를 제어부로 전송한다(S16). 즉 음성 및 텍스트 변환부(104)는 변환된 텍스트 데이터를 제어부(101)로 변환 구간 정보만큼 처리된 텍스트 데이터를 전달한다.
다음으로, 제어부(101)는 음성 및 텍스트 변환부(104)에서 변환된 텍스트 데이터를 디스플레이부(105)에 표시 한다(S17).
즉, 제어부(101)는 최종 변환된 텍스트 데이터를 디스플레이부(105)에서 표시하여 확인할 수 있으며, 확인하면서 수정 작업 및 저장을 할 수 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100: 단말기 101: 제어부
102: 마이크부 103: 오디오 입출력부
104: 음성 및 텍스트 변환부 105: 디스플레이부

Claims (2)

  1. 사용자가 모바일 음성 변환기 마이크부에 음성데이터를 입력하는 단계;
    상기 마이크부에 입력된 음성 데이터를 제어부로 전송하는 단계;
    상기 제어부에서 음성 데이터의 음성 및 텍스트 변환할 변환 구간, 음성 데이터를 오디오 입출력부에 전달하는 단계;
    상기 제어부로부터 받은 변환 구간의 정보에 따라 오디오 입출력부의 음성 데이터 출력을 변환 구간만큼 출력하는 단계;
    상기 오디오 입출력부의 출력된 음성 데이터를 마이크부에서 음성 데이터를 입력 동시에, 음성 및 텍스트 변환부에서 음성데이터를 텍스트로 변환하는 단계;
    상기 음성 및 텍스트 변환부에서 변환된 데이터를 제어부로 전송 단계; 및
    상기 제어부에 있는 음성 및 텍스트 변환부에서 변환된 데이터를 디스플레이부에 표시하는 단계;를 포함하는 것을 특징으로 하는 모바일 음성 및 텍스트 변환 방법.
  2. 제 1항에 있어서,
    상기 오디오 입출력부는 제어부에서 음성 데이터, 음성 및 텍스트 변환 구간 정보를 받고, 음성 데이터를 출력을 진행하며, 변환 구간의 정보만큼 수행을 하고, 변환 구간의 정보가 없을 시에는 최소 변환 단위(1초 내지10초)를 수행하는 것을 특징으로 하는 모바일 음성 및 텍스트 변환 방법.
KR1020170018169A 2017-02-09 2017-02-09 모바일 음성 및 텍스트 변환 방법 KR20180092467A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170018169A KR20180092467A (ko) 2017-02-09 2017-02-09 모바일 음성 및 텍스트 변환 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170018169A KR20180092467A (ko) 2017-02-09 2017-02-09 모바일 음성 및 텍스트 변환 방법

Publications (1)

Publication Number Publication Date
KR20180092467A true KR20180092467A (ko) 2018-08-20

Family

ID=63442964

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170018169A KR20180092467A (ko) 2017-02-09 2017-02-09 모바일 음성 및 텍스트 변환 방법

Country Status (1)

Country Link
KR (1) KR20180092467A (ko)

Similar Documents

Publication Publication Date Title
US8886524B1 (en) Signal processing based on audio context
CN101188728B (zh) 具有视频通话功能的显示装置及其方法以及视频通话系统
WO2018182293A1 (en) Method for operating speech recognition service and electronic device supporting the same
AU2010327452A1 (en) Mobile device and control method thereof
US10073672B2 (en) Method, system, and computer storage medium for voice control of a split-screen terminal
JP2017538240A (ja) インターフェース表示方法、装置、プログラム及び記録媒体
US9625969B2 (en) Method and apparatus for controlling power consumption of a portable terminal
JP2018508086A (ja) 入力処理方法、装置及び機器
US7746729B2 (en) Electronic device with working mode switching function and method of switching working mode
EP3637227A1 (en) Method for performing operation on intelligent wearing device by using gesture, and intelligent wearing device
KR20140036584A (ko) 음성 신호의 음량을 조절하기 위한 방법 및 그 전자 장치
US10379507B2 (en) Voice control type bath system and operating method thereof
US9367277B2 (en) Image processing apparatus
US9363358B2 (en) Wireless Bluetooth apparatus with intercom and broadcasting functions and operating method thereof
KR20180092467A (ko) 모바일 음성 및 텍스트 변환 방법
JP2019062326A (ja) 通信装置、投影装置、通信接続方法、及びプログラム
EP3316594A1 (en) Audio device and audio device control method
KR20150088532A (ko) 통화 중 서비스 제공 장치 및 이를 이용하는 방법
KR20200079125A (ko) 전자 장치 및 전자 장치의 제어 방법
KR102178174B1 (ko) 사용자 단말, 방송 장치, 이를 포함하는 방송 시스템 및 그 제어방법
US9997086B1 (en) Handheld communication device and method(s) of use
WO2007021791A3 (en) Method and apparatus for accessing a contacts database and telephone services
KR20150126761A (ko) 모바일 단말기를 이용한 프리젠테이션 제어 시스템
JP2020119043A (ja) 音声翻訳システムおよび音声翻訳方法
CN105930254B (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application