KR20010090220A - 텍스트 처리 방식의 음성화일 편집기 - Google Patents
텍스트 처리 방식의 음성화일 편집기 Download PDFInfo
- Publication number
- KR20010090220A KR20010090220A KR1020000014930A KR20000014930A KR20010090220A KR 20010090220 A KR20010090220 A KR 20010090220A KR 1020000014930 A KR1020000014930 A KR 1020000014930A KR 20000014930 A KR20000014930 A KR 20000014930A KR 20010090220 A KR20010090220 A KR 20010090220A
- Authority
- KR
- South Korea
- Prior art keywords
- file
- voice
- voice file
- edited
- text
- Prior art date
Links
- 238000000034 method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
녹음된 음성화일의 내용을 음성인식 알고리즘을 이용하여 텍스트 변환하여 이를 편집하는 음성화일 편집 소프트웨어.
Description
음성으로 녹음된 언어의 디지털파일(.wav등) 내용을 편집하는 방법으로 음성의 파형을 모니터상에 디스플레이 하여 이를 편집하는 방법. 이는 파형과 실제 음절의 구별이 어려워 실제 응용에는 많은 불편이 따른다. 본 발명은 시간축을 도입한 범용의 음성인식 알고리즘을 제안하여 이를 시간축의 독립변수로 읽어 텍스트화하여 그 내용을 인지하면서 편집하는 편리한 편집 소프트웨어를 개발한 것이다.
디지털 음성파일을 읽어들인 후에 이를 아날로그 파형으로 일단 저장한 뒤에 에 이를 시간축으로 세분화하여 범용음성인식 알고리즘에 입력 인식시킨다. 시간축에 의한 각음절의 시작시간과 끝나는 시간이 독립변수가 되어 음성파일 편집기를 통해 텍스트 형태로 모니터에 출력되면 각각의 독립변수에 주어진 어드레스를 바꾸어 주는 것 만으로 음성파일의 편집이 가능해 진다. 일단 텍스트상에서 편집이 끝난 파일은 이를 다시 디지탈화 하여 저장하면 음성파일의 편집이 끝나고 재생시에는 편집된 내용을 들을 수 있게 된다. 반복적인 편집이 가능하므로 일차 음원을확보 하였다면 이를 사용자가 원하는 대로 몇번이든 수정이 가능해 진다.
모니터상에 '나는학생이고당신은선생입니다' 라는 음성화일 텍스트를 편집한다고 할때 `학생`(시간축 0.12~0.19)과 `선생`(시간축 0.28~0.35) 을 바꾸어 편집저장하고 싶다면 단순히 편집기에 출력된 텍스트에서 `학생`이란 단어를 오려서 `선생`이란 자리에 넣고 `선생`이란 단어를 오려서 `학생`이 있던 자리에 오려 붙이면 자동적으로 지정된 시간축에 입력되어 아날로그 파형이 저장되므로 재생시에는 `나는선생이고당신은학생입니다`는 내용으로 출력되는 것이다. 혹시 연속음절에 대한 인식상의 문제가 발생한다 하여도 편집자가 이를 인지하고 있기만 하다면 아닐로그 파형상의 편집이므로 편집후의 재생에는 문제가 없게된다. 이를테면 텍스트가 음성파형을 잘못 인식하여 `선생`을 `슨생`으로 표시 하였다 하여도 편집 시에 `슨생`을 오려서 원하는 곳에 붙여도 그 파형을 오려 붙인 결과이니 재생시에는 오리지널 파형이 이동한 것이되어 `선생`으로 들려지게 된다. 텍스트상의 `슨생`의 원음성파는 `선생`이기 때문이다. 이는 음성인식력이 다소 떨어지는 시스템이라 하여도 유용한 결과를 가져 올 것이고, 또 실시간의 음성인식에 필요치 않으므로 보다 정교한 음성인식이 가능하다.
음성파일의 채집 이후 수정을 요하는 경우 현재까지는 재 채집을 해야하는등처리에 많은 어려움이 있다. 이 텍스트 기반의 음성파일 편집기는 시간축에 아날로그 파형을 도입하여 텍스트를 편집하는 것만으로 음성파를 이동하여 자유로운 음성파일 편집을 가능하게 하고자하는 목적으로 고안되었다. 음성파일의 편집 작업에 임의성과 창조성을 갖는 자유를 부여하여 마치 문장을 다듬는 것과 같이 음성파일을 편집 할 수 있어서 차후로는 방송이나 음성인식 서비스등에 폭 넓은 사용 효과를 줄 것으로 기대된다.
Claims (1)
- 아날로그 파형을 이용한 음성편집과 이를 응용한 소프트웨어 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000014930A KR20010090220A (ko) | 2000-03-24 | 2000-03-24 | 텍스트 처리 방식의 음성화일 편집기 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000014930A KR20010090220A (ko) | 2000-03-24 | 2000-03-24 | 텍스트 처리 방식의 음성화일 편집기 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20010090220A true KR20010090220A (ko) | 2001-10-18 |
Family
ID=19658062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000014930A KR20010090220A (ko) | 2000-03-24 | 2000-03-24 | 텍스트 처리 방식의 음성화일 편집기 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20010090220A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020001308A (ko) * | 2000-06-28 | 2002-01-09 | 김홍재 | 지식정보 쇼핑몰 구축을 위한 방법 및 그 장치 |
KR102654803B1 (ko) * | 2023-11-20 | 2024-04-08 | 주식회사 액션파워 | 음성인식 학습 데이터에서 음성-텍스트 정렬 오류를 검출하는 방법 |
-
2000
- 2000-03-24 KR KR1020000014930A patent/KR20010090220A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020001308A (ko) * | 2000-06-28 | 2002-01-09 | 김홍재 | 지식정보 쇼핑몰 구축을 위한 방법 및 그 장치 |
KR102654803B1 (ko) * | 2023-11-20 | 2024-04-08 | 주식회사 액션파워 | 음성인식 학습 데이터에서 음성-텍스트 정렬 오류를 검출하는 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100591655B1 (ko) | 음성 합성을 위한 음성 합성 방법, 음성 합성 장치 및 컴퓨터 판독 가능 기록 매체 | |
JP2008500573A (ja) | メッセージを変更するための方法及びシステム | |
JP2006323806A (ja) | テキストを音声に変換するシステムおよび方法 | |
CN112185341A (zh) | 基于语音合成的配音方法、装置、设备和存储介质 | |
JP2020154057A (ja) | 音声データのテキスト編集装置及び音声データのテキスト編集方法 | |
JP3518898B2 (ja) | 音声合成装置 | |
AU769036B2 (en) | Device and method for digital voice processing | |
KR20010090220A (ko) | 텍스트 처리 방식의 음성화일 편집기 | |
Sherwood | Computers: The computer speaks: Rapid speech synthesis from printed text input could accommodate an unlimited vocabulary | |
JP2006139162A (ja) | 語学学習装置 | |
JPS6073589A (ja) | 音声合成装置 | |
JP3094622B2 (ja) | テキスト音声合成装置 | |
JP2740510B2 (ja) | テキスト音声合成方式 | |
JP3282151B2 (ja) | 音声制御方式 | |
KR20010081353A (ko) | 음절 구분 기능을 구비한 디지털 오디오 재생 장치 및방법 | |
Cao | GoldWave in Pronunciation Education: The Application of Voice Editing Software | |
Kyritsi et al. | A score-to-singing voice synthesis system for the greek language | |
JPH0618378Y2 (ja) | 単語学習装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JPS5991497A (ja) | 音声合成出力装置 | |
JPH02223983A (ja) | プレゼンテーション支援システム | |
JP3292218B2 (ja) | 音声メッセージ作成装置 | |
JPH02251998A (ja) | 音声合成装置 | |
Komal Singh et al. | Speech synthesis. | |
JPH0997093A (ja) | 合成音のアクセント変更方法および旅客案内用自動放送装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |