KR101349797B1 - 전자기기에서 음성 파일 재생 방법 및 장치 - Google Patents

전자기기에서 음성 파일 재생 방법 및 장치 Download PDF

Info

Publication number
KR101349797B1
KR101349797B1 KR1020070062786A KR20070062786A KR101349797B1 KR 101349797 B1 KR101349797 B1 KR 101349797B1 KR 1020070062786 A KR1020070062786 A KR 1020070062786A KR 20070062786 A KR20070062786 A KR 20070062786A KR 101349797 B1 KR101349797 B1 KR 101349797B1
Authority
KR
South Korea
Prior art keywords
voice
section
silent
signal
electronic device
Prior art date
Application number
KR1020070062786A
Other languages
English (en)
Other versions
KR20080113844A (ko
Inventor
이남일
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070062786A priority Critical patent/KR101349797B1/ko
Publication of KR20080113844A publication Critical patent/KR20080113844A/ko
Application granted granted Critical
Publication of KR101349797B1 publication Critical patent/KR101349797B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/022Electronic editing of analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B2020/10935Digital recording or reproducing wherein a time constraint must be met
    • G11B2020/10981Recording or reproducing data when the data rate or the relative speed between record carrier and transducer is variable

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 발명은 전자기기에서 음성 파일 녹음 방법 및 장치에 관한 것으로서, 전자기기에서 음성 파일 녹음 방법은, 입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판단하는 과정과, 상기 묵음 구간으로 판단되는 신호 구간의 시작 부분에 특정 마커를 삽입하여 저장하는 과정을 포함하며, 상기 특정 마커는 상기 특정 마커가 삽입된 부분부터 미리 설정된 시간 구간이 재생 속도 비조절 구간임을 나타냄으로써, 상기 음성 파일의 재생 속도가 변동되더라도 상기 묵음 구간이 일정한 재생 시간을 갖도록 유지하여 사용자가 상기 음성 파일을 쉽게 이해하도록 도울 수 있다.
음성 재생, 속도 조절, VAD(Voice Activity Detection), 묵음 구간

Description

전자기기에서 음성 파일 재생 방법 및 장치{APPARATUS AND METHOD FOR VOICE FILE PLAYING IN ELECTRONIC DEVICE}
도 1은 종래 기술에 따른 전자기기에서 음성 녹음 방법을 도시하는 도면,
도 2는 종래 기술에 따른 전자기기에서 음성 파일의 재생 속도 조절 결과를 도시하는 도면,
도 3은 본 발명에 따른 전자기기에서 음성 녹음 방법을 도시하는 도면,
도 4는 본 발명에 따른 전자기기의 블록 구성을 도시하는 도면,
도 5는 본 발명의 실시 예에 따른 전자기기에서 음성을 녹음하는 절차를 도시하는 도면,
도 6은 본 발명의 실시 예에 따른 전자기기에서 음성 파일을 재생하는 절차를 도시하는 도면, 및
도 7은 본 발명의 실시 예에 따른 전자기기에서 음성 파일의 재생 속도 조절 결과를 도시하는 도면.
본 발명은 전자기기에서 음성 파일 재생 방법 및 장치에 관한 것으로서, 특히 속도를 조절하여 음성 파일을 재생할 수 있는 전자기기에서 상기 음성 파일의 무음 구간에 속도 조절이 적용되는 것을 방지하기 위한 방법 및 장치에 관한 것이다.
일반적으로, 음성 녹음 장치는 메모리의 사용을 감소시키기 위해 입력되는 음성 신호를 압축하여 저장한다. 하지만, 상기 음성 녹음 장치에서 음성을 단순히 압축하여 저장할 경우, 녹음시에 빈번하게 발생되는 묵음 구간으로 인해 메모리 사용 효율성이 떨어지게 된다. 여기서, 상기 묵음 구간은 음성 신호가 존재하지 않는 구간을 의미한다.
이에 따라, 종래에 제공된 음성 녹음 장치는 음성 활동 검출(Voice ctivity Detection; 이하 'VAD'라 칭함) 알고리즘을 이용하여 상기 묵음 구간을 검출한 후, 상기 검출된 묵음 구간 중 일부 구간을 제거하고, 나머지 구간들을 녹음하여 저장하고 있다. 즉, 상기 음성 녹음 장치는 도 1에 도시된 바와 같이, 상기 VAD 알고리즘을 이용하여 마이크를 통해 입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판별한 후, 상기 묵음 구간 중 일부 묵음 구간(행오버(hangover) 구간)(101)만을 녹음하고 그 이외의 묵음 구간은 녹음하지 않고 제거한다. 여기서, 상기 일부 묵음 구간(101)을 추가로 녹음하는 것은 상기 음성 신호와 음성 신호 사이에 묵음 구간이 전혀 존재하지 않음으로써 사용자가 상기 음성 신호를 이해하기 어려워지는 것을 방지하기 위함이다. 따라서, 상기 일부 묵음 구간(101)은 사용자가 음성 파일을 이해하는데 문제가 없을 정도의 길이로 설정된다.
최근에 제공되는 음성 녹음 장치는 사용자의 어학 공부 등에 도움을 주기 위해 음성 파일의 재생 속도를 조절할 수 있는 기능을 제공하고 있다. 즉, 상기 음성 녹음 장치는 음의 높낮이는 그대로 유지하면서 특정 부분을 느린 속도로 재생하거나 빠른 속도로 재생할 수 있도록 하는 기능을 제공하고 있다.
상기와 같이 음성 녹음 장치에서 재생 속도를 조절하는 기능은 도 2에 도시된 바와 같이, 음성 구간과 묵음 구간의 구별 없이 동일하게 적용됨으로써, 상기 음성 구간의 재생 속도가 빨라지면, 상기 묵음 구간의 재생 속도 역시 빨라지게 된다. 하지만, 상기 묵음 구간은 사용자가 음성 파일을 이해하는데 적합한 길이로 설정되어 있기 때문에 상기 재생 속도 조절로 인해 상기 묵음 구간의 재생 시간이 변동되면, 사용자에게 불편함을 줄 수 있다. 예를 들어, 상기 묵음 구간의 재생 시간이 짧아질 경우, 음성 신호 간의 간격이 가까워져서 사용자가 청취시에 상기 음성 신호 간의 구분이 어려울 수 있다. 또한, 상기 묵음 구간의 재생 시간이 길어질 경우, 상기 음성 신호 간의 간격이 멀어져서 사용자가 청취시에 다음 음성 신호를 듣기까지 시간이 지루하게 느껴질 수 있다. 따라서, 상기 묵음 구간은 어떠한 경우에도 일정한 재생 시간을 유지해야할 필요성이 있다.
본 발명은 상술한 바와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 전자기기에서 음성 파일 재생 방법 및 장치를 제공함에 있다.
본 발명의 다른 목적은 전자기기에서 음성 파일의 특정 구간에 속도 조절이 적용되는 것을 방지하기 위한 방법 및 장치를 제공함에 있다.
상술한 목적들을 달성하기 위한 본 발명의 제 1견지에 따르면, 전자기기에서 음성 파일 녹음 방법은, 입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판단하는 과정과, 상기 묵음 구간으로 판단되는 신호 구간의 시작 부분에 특정 마커를 삽입하여 저장하는 과정을 포함하며,상기 특정 마커는 상기 특정 마커가 삽입된 부분부터 미리 설정된 시간 구간이 재생 속도 비조절 구간임을 나타내는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 2견지에 따르면, 전자기기에서 음성 파일 재생 방법은, 재생 속도 변경 여부를 확인하는 과정과, 음성 파일에서 음성 신호가 존재하지 않는 묵음 구간과 음성 신호가 존재하는 음성 구간을 판단하는 과정과, 상기 음성 파일에서 상기 묵음 구간의 재생 속도를 유지하고, 상기 음성 구간을 변경된 재생 속도로 재생하는 과정을 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 3견지에 따르면, 전자기기에서 음성 파일 녹음 장치는, 마이크로부터 입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판단하고, 상기 묵음 구간으로 판단되는 신호 구간의 시작 부분에 특정 마커를 삽입하여 인코딩한후 출력하는 녹음부와, 상기 녹음부로부터 인코딩된 음성 패킷을 제공받아 저장하는 저장부를 포함하며, 상기 특정 마커는 상기 특정 마커가 삽입된 부분부터 미리 설정된 시간 구간이 재생 속도 비조절 구간임을 나타내는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 4견지에 따르면, 전자기기에서 음성 파일 재생 장치는, 재생 속도 변경 여부와 변경된 재생 속도를 확인하는 제어부와, 음성 파일에서 음성 신호가 존재하지 않는 묵음 구간과 상기 음성 신호가 존재하는 음성 구간을 판단하고, 상기 묵음 구간의 재생 속도를 유지하고, 상기 음성 구간에 상기 변경된 재생 속도를 적용하여 재생하는 재생부를 포함하는 것을 특징으로 한다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
이하 본 발명에서는 음성 파일의 재생 속도를 조절할 수 있는 전자기기에서 묵음 구간에 상기 재생 속도 조절 기능이 적용되는 것을 방지하기 위한 방법 및 장치에 관해 설명할 것이다. 이하 설명에서 행오버(hanngover) 구간은, 음성 녹음 시, 입력되는 묵음 구간 중 녹음되는 일부 구간을 의미한다.
도 3은 본 발명에 따른 전자기기에서 음성을 녹음하는 방법을 도시하고 있다.
상기 도 3에 도시된 바와 같이, 본 발명에서는 행오버 구간(301)의 시작 부분에 특정 패턴을 가지는 마커(303)를 삽입하여 묵음 구간이 시작됨을 나타낸다. 즉, 본 발명에 따른 전자기기에서는 음성 녹음 시에 상기 행오버 구간(301)의 시작 부분에 상기 마커(303)를 삽입함으로써, 사용자가 재생 속도를 변경하여 음성 파일을 재생할 경우, 상기 마커(303)가 삽입된 행오버 구간만은 상기 사용자에 의해 설정된 재생 속도가 아닌 기본 재생 속도로 파일을 재생하도록 한다.
도 4는 본 발명에 따른 전자기기의 블록 구성을 도시하고 있다. 여기서, 상 기 전자기기는 제어부(400), 음성처리부(402), 마이크(408), 스피커(410), 저장부(412), 표시부(414), 입력부(416)를 포함하여 구성되며, 상기 음성처리부(402)는 녹음부(404)와 재생부(406)를 포함하여 구성된다.
상기 도 4를 참조하면, 상기 제어부(400)는 상기 전자기기의 전반적인 동작을 처리 및 제어하기 위한 기능을 수행하며, 본 발명에 따라 상기 음성처리부(402)를 제어하여 음성을 녹음하고, 녹음된 음성 파일을 재생하기 위한 기능을 제어 및 처리한다.
상기 음성처리부(402)는 접속된 마이크(408) 및 스피커(410)를 통해 음성신호의 입출력처리를 행하는 기능을 수행한다. 예를 들어, 상기 제어부(400)로부터 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 상기 스피커(410)를 통해 송출하고, 상기 마이크(408)로부터 인가되는 음성신호를 디지털 음성신호로 변환하여 상기 제어부(400)로 제공하는 역할을 수행한다. 특히, 상기 음성 처리부(402)는 상기 녹음부(404)와 재생부(406)를 포함하여 상기 마이크(408)로부터 인가되는 신호를 녹음하여 상기 저장부(412)에 저장하고, 상기 제어부(400)를 통해 제공되는 음성 파일을 재생하여 상기 스피커(410)로 출력하기 위한 기능을 수행한다.
상기 녹음부(404)는 상기 제어부(400)로부터 음성 녹음 신호가 입력될 시, 음성 활동 검출(Voice ctivity Detection; 이하 'VAD'라 칭함) 알고리즘을 이용하여 상기 마이크(408)를 통해 입력되는 신호가 음성 신호인지 묵음 신호인지 판별한 후, 상기 음성 신호일 경우 인코딩하여 상기 저장부(412)의 지정된 파일에 저장하 고, 상기 묵음 신호일 경우, 현재 입력되는 신호 구간이 묵음 구간인지 여부를 판단한다. 상기 녹음부(404)는 상기 묵음 신호가 일정 시간 이상 입력되어 현재 신호 구간이 상기 묵음 구간으로 판단될 경우, 상기 묵음 구간 중 미리 설정된 길이에 해당하는 일부 구간만을 행오버 구간으로 설정하여 상기 지정된 파일에 저장하고, 나머지 묵음 구간은 폐기처리한다. 이때, 상기 녹음부(404)는 본 발명에 따라 상기 행오버 구간이 시작되는 부분에 특정 패턴을 가지는 마커를 삽입하여 상기 묵음 구간이 시작됨을 나타낸다. 여기서, 상기 묵음 신호가 일정 시간 이상 입력되는 구간을 묵음 구간으로 판단하는 이유는 일반적으로 음성에서 단어와 단어 사이 혹은 문장과 문장 사이에 묵음이 빈번하게 발생되기 때문이다. 즉, 상기 녹음부(404)는 상기 단어와 단어 사이 혹은 문장과 문장 사이에 짧게 발생되는 묵음은 음성 구간으로 간주하여 녹음을 수행하고, 상기 묵음이 일정 시간 이상 지속되어 입력될 경우, 해당 구간을 묵음 구간으로 간주하여 일부 구간만을 녹음하고 나머지 구간은 폐기 처리한다.
상기 재생부(406)는 상기 제어부(400)로부터 음성 파일 재생 신호가 입력될 시, 상기 저장부(412)로부터 해당 음성 파일을 독출한 후, 이를 디코딩하여 재생하기 위한 기능을 처리한다. 특히, 본 발명에 따라 상기 재생부(406)는 상기 제어부(400)로부터 사용자에 의해 설정된 재생 속도가 입력될 시, 해당 음성 파일에서 묵음 구간을 검사한 후, 음성 구간은 상기 입력된 재생 속도로 재생처리하고, 상기 묵음 구간은 기본 재생 속도로 재생처리한다. 여기서, 상기 재생부(406)는 상기 음성 파일에서 묵음 구간을 나타내는 마커를 이용하여 상기 묵음 구간을 검사한다.
상기 저장부(412)는 프로그램 메모리, 데이터 메모리 및 불휘발성 메모리 등을 포함한다. 상기 프로그램 메모리는 상기 전자기기의 전반적인 동작을 제어하기 위한 프로그램을 저장하고, 플래시 메모리(flash memory)를 사용할 수 있다. 상기 데이터 메모리는 상기 전자기기 동작 중에 발생되는 데이터를 임시 저장하는 기능을 수행하고, 램(Random Access Memory; RAM)을 사용할 수 있다. 본 발명에 따라 상기 데이터 메모리는 상기 녹음부(404)로부터 입력되는 묵음 신호를 임시 저장한다. 상기 불휘발성 메모리는 시스템 파라미터(system parameter) 및 기타 저장용 데이터, 예를 들어, 음성 및 영상을 저장한다. 본 발명에 따라 상기 불휘발성 메모리는 녹음된 음성 파일을 저장한다.
상기 표시부(414)는 상기 전자기기의 동작 중에 발생되는 상태 정보, 제한된 숫자의 문자들을 디스플레이하고, 특히, 음성 파일의 재생 속도를 설정하기 위한 창을 디스플레이한다. 상기 입력부(416)는 다수의 기능키들을 구비하여 사용자가 누르는 키에 상응하는 데이터를 상기 제어부(400)로 제공하고, 특히, 상기 사용자로부터 음성 파일 재생 속도를 설정받아 상기 제어부(400)로 제공한다.
도 5는 본 발명의 실시 예에 따른 전자기기에서 음성을 녹음하는 절차를 도시하고 있다.
상기 도 5를 참조하면, 전자기기는 501단계에서 음성 녹음 이벤트가 발생될 시, 503단계에서 VAD 알고리즘을 이용하여 마이크를 통해 입력되는 신호가 음성 신호인지 묵음 신호인지 여부를 판별한다.
상기 전자기기는 상기 505단계에서 상기 입력되는 신호가 음성 신호로 판별될 시, 507단계로 진행하여 묵음 카운터가 0과 행오버 시간 사이의 값인지 검사한다. 여기서, 상기 전자기기는 상기 묵음 카운터를 검사함으로써, 상기 입력된 음성 신호 이전에 입력되어 임시 저장 중인 묵음 신호가 존재하는지 검사한다.
상기 묵음 카운터가 0과 행오버 시간 사이의 값일 경우, 상기 전자기기는 임시 저장된 묵음 신호가 존재한다고 판단하고 509단계로 진행하여 임시 저장된 음성 패킷을 지정된 파일에 저장한 후, 511단계에서 상기 입력된 음성 신호를 인코딩하고 생성된 음성 패킷을 상기 지정된 파일에 이어 저장한다. 이후, 상기 전자기기는 513단계에서 상기 묵음 카운터를 초기화하고, 515단계로 진행하여 음성 녹음이 종료되는지 검사한다. 상기 전자기기는 상기 음성 녹음이 종료되지 않을 시 상기 505단계로 되돌아가 이하 단계를 재수행하고, 상기 음성 녹음이 종료될 시 본 발명에 따른 알고리즘을 종료한다.
상기 묵음 카운터가 0과 행오버 시간 사이의 값이 아닐 경우, 즉, 상기 묵음 카운터가 0일 시, 상기 전자기기는 임시 저장된 묵음 신호가 존재하지 않는다고 판단하고 상기 511단계로 진행하여 상기 입력된 신호를 인코딩한 후, 상기 인코딩으로 생성된 음성 패킷을 상기 지정된 파일에 저장한다. 이후, 상기 전자기기는 513단계에서 상기 묵음 카운터를 초기화한 후, 상기 515단계로 진행하여 음성 녹음이 종료되는지 검사하고, 이하 단계를 재수행한다.
상기 전자기기는 상기 505단계에서 상기 입력되는 신호가 음성 신호가 아닌 묵음 신호로 판별될 시, 517단계로 진행하여 묵음 카운터가 기 설정된 행오버 시간 보다 작은지 검사한다.
상기 묵음 카운터가 상기 행오버 시간보다 작을 경우, 상기 전자기기는 519단계로 진행하여 상기 입력된 묵음 신호를 인코딩한 후, 상기 인코딩으로 생성된 음성 패킷을 임시 저장한다. 이후, 상기 전자기기는 상기 묵음 카운터를 1만큼 증가시키고, 상기 515단계로 진행하여 음성 녹음이 종료되는지 검사하고, 이하 단계를 재수행한다.
상기 묵음 카운터가 상기 행오버 시간보다 작지 않을 경우, 상기 전자기기는 523단계로 진행하여 상기 묵음 카운터가 상기 행오버 시간과 동일한지 여부를 검사한다. 만일, 상기 묵음 카운터가 상기 행오버 시간과 동일할 경우, 상기 전자기기는 525단계로 진행하여 상기 지정된 파일에 특정 패턴을 가지는 마커를 삽입하고, 상기 입력된 묵음 신호를 인코딩하여 생성된 음성 패킷을 임시 저장한다. 이후, 상기 전자기기는 527단계로 진행하여 임시 저장된 음성 패킷들을 상기 지정된 파일에 저장한다. 여기서, 상기 임시 저장된 음성 패킷들은 상기 지정된 파일에서 상기 삽입된 마커 이후에 이어 저장된다. 이후, 상기 전자기기는 상기 521단계에서 상기 묵음 카운터를 1만큼 증가시키고, 상기 515단계로 진행하여 음성 녹음이 종료되는지 검사하고, 이하 단계를 재수행한다.
반면, 상기 묵음 카운터가 상기 행오버 시간보다 클 경우, 상기 전자기기는 529단계에서 상기 입력된 묵음 신호를 폐기처리한 후, 상기 521단계로 진행하여 상기 묵음 카운터를 1만큼 증가시키고, 상기 515단계로 진행하여 음성 녹음이 종료되는지 검사하고, 이하 단계를 재수행한다.
도 6은 본 발명의 실시 예에 따른 전자기기에서 음성 파일을 재생하는 절차를 도시하고 있다.
상기 도 6을 참조하면, 전자기기는 601단계에서 음성 파일 재생 이벤트가 발생되면, 603단계로 진행하여 재생 속도 조절 기능이 설정되었는지 여부를 검사한다.
만일 상기 재생 속도 조절 기능이 설정되지 않았을 시, 상기 전자기기는 627단계로 진행하여 기 설정된 기본 속도로 해당 음성 파일을 재생한 후, 본 발명에 따른 알고리즘을 종료한다.
반면 상기 재생 속도 조절 기능이 설정되었을 시, 상기 전자기기는 605단계로 진행하여 해당 음성 파일에 묵음 구간을 나타내는 마커가 존재하는지 탐색한다.
상기 전자기기는 607단계에서 상기 마커가 탐색되지 않을 시, 하기 613단계로 진행하고, 상기 마커가 탐색될 시, 609단계로 진행하여 상기 마커가 탐색된 부분에 저장된 음성 패킷의 묵음 구간 플래그(flag)를 1로 설정한 후, 611단계에서 묵음 구간을 판별하기 위해 기 설정된 카운터를 설정한다.
이후, 상기 전자기기는 613단계에서 해당 음성 파일에서 음성 패킷을 독출하고, 615단계로 진행하여 상기 음성 패킷을 디코딩한다. 이때, 상기 전자기기는 상기 음성 패킷을 하나의 프레임 단위로 독출할 수 있다.
이후, 상기 전자기기는 617단계에서 상기 디코딩된 음성 패킷의 묵음 구간 플래그가 1로 설정되었는지 여부를 검사하여 상기 음성 패킷이 묵음 구간에 해당하 는 음성 패킷인지 검사한다. 상기 묵음 구간 플래그가 1로 설정되지 않았을 시, 상기 전자기기는 상기 음성 패킷이 상기 묵음 구간이 아닌 음성 구간에 해당하는 음성 패킷이라고 판단하여 619단계에서 사용자에 의해 설정된 재생 속도로 상기 음성 패킷을 재생처리한다. 이후, 상기 전자기기는 621단계로 진행하여 상기 음성 파일의 재생이 종료되는지 검사한 후, 상기 재생이 종료되지 않을 시 상기 613단계로 되돌아가 이하 단계를 재수행하고, 상기 재생이 종료될 시 본 발명에 따른 알고리즘을 종료한다.
상기 묵음 구간 플래그가 1로 설정되었을 시, 상기 전자기기는 상기 음성 패킷이 상기 묵음 구간에 해당하는 음성 패킷이라고 판단하여 623단계에서 설정된 카운터가 0인지 검사한다.
상기 설정된 카운터가 0일 시, 상기 전자기기는 상기 묵음 구간이 종료되었음을 판단하고 상기 619단계에서 사용자에 의해 설정된 재생 속도로 상기 음성 패킷을 재생처리한다. 이후, 상기 전자기기는 621단계로 진행하여 상기 음성 파일의 재생이 종료되는지 검사한 후, 상기 재생이 종료되지 않을 시 상기 613단계로 되돌아가 이하 단계를 재수행하고, 상기 재생이 종료될 시 본 발명에 따른 알고리즘을 종료한다.
상기 설정된 카운터가 0이 아닐 시, 상기 전자기기는 상기 음성 패킷이 상기 묵음 구간에 해당하는 음성 패킷이라고 판단하고 625단계로 진행하여 상기 음성 패킷을 기본 재생 속도로 재생 처리하고, 상기 카운터를 1만큼 감소시킨다. 이후, 상기 전자기기는 621단계로 진행하여 상기 음성 파일의 재생이 종료되는지 검사한 후, 상기 재생이 종료되지 않을 시 상기 613단계로 되돌아가 이하 단계를 재수행하고, 상기 재생이 종료될 시 본 발명에 따른 알고리즘을 종료한다.
도 7은 본 발명의 실시 예에 따른 전자기기에서 음성 파일의 재생 속도를 조절한 결과를 도시하고 있다.
상기 도 7에 도시된 바와 같이, 본 발명에 따라 음성 녹음 시, 묵음 구간에 특정 패턴을 가지는 마커를 삽입하고, 음성 파일 재생 시, 상기 삽입된 마커를 통해 묵음 구간을 검사하여 상기 묵음 구간을 항상 기본 재생 속도로 재생함으로써, 상기 묵음 구간이 일정한 재생 시간을 갖도록 유지할 수 있다. 즉, 사용자에 의해 재생 속도가 변동되어 음성 구간 1, 2, 3의 재생 시간이 짧아지더라도 묵음 구간 1, 2의 재생 시간은 동일하게 유지할 수 있다. 따라서, 상기 음성 파일의 재생 속도를 달리 설정하더라도 사용자는 항상 일정한 묵음 구간이 삽입된 상태의 음성 파일을 청취할 수 있으므로 상기 음성 파일의 내용을 쉽게 이해할 수 있는 장점이 있다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이 본 발명은 전자기기에서 음성을 녹음할 시, 묵음 구간에 마커를 삽입하고, 음성 파일을 재생할 시, 상기 삽입된 마커를 이용하여 상기 묵음 구간을 항상 기본 재생 속도로 재생함으로써, 상기 음성 파일의 재생 속도가 변동되더라도 상기 묵음 구간이 일정한 재생 시간을 갖도록 유지하여 사용자가 상기 음성 파일을 쉽게 이해하도록 돕는 효과가 있다.

Claims (10)

  1. 전자기기에서 음성 파일 녹음 방법에 있어서,
    입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판단하는 과정과,
    상기 묵음 구간으로 판단되는 신호 구간의 시작 부분에 특정 마커를 삽입하여 저장하는 과정을 포함하며,
    상기 특정 마커는 상기 특정 마커가 삽입된 부분부터 미리 설정된 시간 구간이 재생 속도 비조절 구간임을 나타내는 것을 특징으로 하는 방법.
  2. 제 1항에 있어서,
    상기 음성 구간인지 묵음 구간인지 여부를 판단하는 과정은,
    음성 활동 검출(Voice ctivity Detection) 알고리즘을 이용하여 입력되는 신호가 음성 신호인지 묵음 신호인지 판단하는 과정과,
    상기 묵음 신호가 일정 시간 이상 입력되는지 판단하여 상기 음성 구간인지 묵음 구간인지 여부를 판단하는 과정을 포함하는 것을 특징으로 하는 방법.
  3. 전자기기에서 음성 파일 재생 방법에 있어서,
    재생 속도 변경 여부를 확인하는 과정과,
    음성 파일에서 음성 신호가 존재하지 않는 묵음 구간과 음성 신호가 존재하는 음성 구간을 판단하는 과정과,
    상기 음성 파일에서 상기 묵음 구간의 재생 속도를 유지하고, 상기 음성 구간을 변경된 재생 속도로 재생하는 과정을 포함하는 것을 특징으로 하는 방법.
  4. 삭제
  5. 제 3항에 있어서,
    상기 음성 파일에서 상기 음성 신호가 존재하지 않는 묵음 구간과 음성 신호가 존재하는 음성 구간을 판단하는 과정은,
    상기 음성 파일에서 묵음 구간을 나타내는 마커를 검색하는 과정과,
    상기 검색된 마커 이후에 존재하는 음성 패킷 중 일정 길이의 음성 패킷을 묵음 구간으로 판단하는 과정을 포함하는 것을 특징으로 하는 방법.
  6. 전자기기에서 음성 파일 녹음 장치에 있어서,
    마이크로부터 입력되는 신호 구간이 음성 구간인지 묵음 구간인지 여부를 판단하고, 상기 묵음 구간으로 판단되는 신호 구간의 시작 부분에 특정 마커를 삽입하여 인코딩한후 출력하는 녹음부와,
    상기 녹음부로부터 인코딩된 음성 패킷을 제공받아 저장하는 저장부를 포함하며,
    상기 특정 마커는 상기 특정 마커가 삽입된 부분부터 미리 설정된 시간 구간이 재생 속도 비조절 구간임을 나타내는 것을 특징으로 하는 장치.
  7. 제 6항에 있어서,
    상기 녹음부는, 음성 활동 검출(Voice ctivity Detection) 알고리즘을 이용하여 입력되는 신호가 음성 신호인지 묵음 신호인지 판단하고, 상기 묵음 신호가 일정 시간 이상 입력되는지 판단하여 상기 음성 구간인지 묵음 구간인지 여부를 판단하는 것을 특징으로 하는 장치.
  8. 전자기기에서 음성 파일 재생 장치에 있어서,
    재생 속도 변경 여부와 변경된 재생 속도를 확인하는 제어부와,
    음성 파일에서 음성 신호가 존재하지 않는 묵음 구간과 상기 음성 신호가 존재하는 음성 구간을 판단하고, 상기 묵음 구간의 재생 속도를 유지하고, 상기 음성 구간에 상기 변경된 재생 속도를 적용하여 재생하는 재생부를 포함하는 것을 특징으로 하는 장치.
  9. 삭제
  10. 제 8항에 있어서,
    상기 재생부는, 상기 음성 파일에서 묵음 구간을 나타내는 마커를 검색하여 상기 묵음 구간을 판단하는 것을 특징으로 하는 장치.
KR1020070062786A 2007-06-26 2007-06-26 전자기기에서 음성 파일 재생 방법 및 장치 KR101349797B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070062786A KR101349797B1 (ko) 2007-06-26 2007-06-26 전자기기에서 음성 파일 재생 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070062786A KR101349797B1 (ko) 2007-06-26 2007-06-26 전자기기에서 음성 파일 재생 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080113844A KR20080113844A (ko) 2008-12-31
KR101349797B1 true KR101349797B1 (ko) 2014-01-13

Family

ID=40371042

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070062786A KR101349797B1 (ko) 2007-06-26 2007-06-26 전자기기에서 음성 파일 재생 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101349797B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016088919A1 (ko) * 2014-12-04 2016-06-09 (주) 트라이너스 무선 마이크로폰 시스템
CN107193841B (zh) * 2016-03-15 2022-07-26 北京三星通信技术研究有限公司 媒体文件加速播放、传输及存储的方法和装置
EP3633671B1 (en) * 2017-05-24 2021-09-08 Nippon Hoso Kyokai Audio guidance generation device, audio guidance generation method, and broadcasting system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07101360B2 (ja) * 1987-09-28 1995-11-01 シャープ株式会社 音声録音再生装置
KR19980702887A (ko) * 1996-01-19 1998-08-05 모리시타 요이찌 재생속도 변환장치
JP3187242B2 (ja) * 1994-04-05 2001-07-11 日本放送協会 話速変換装置
US20010034601A1 (en) * 1999-02-05 2001-10-25 Kaoru Chujo Voice activity detection apparatus, and voice activity/non-activity detection method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07101360B2 (ja) * 1987-09-28 1995-11-01 シャープ株式会社 音声録音再生装置
JP3187242B2 (ja) * 1994-04-05 2001-07-11 日本放送協会 話速変換装置
KR19980702887A (ko) * 1996-01-19 1998-08-05 모리시타 요이찌 재생속도 변환장치
US20010034601A1 (en) * 1999-02-05 2001-10-25 Kaoru Chujo Voice activity detection apparatus, and voice activity/non-activity detection method

Also Published As

Publication number Publication date
KR20080113844A (ko) 2008-12-31

Similar Documents

Publication Publication Date Title
US8731914B2 (en) System and method for winding audio content using a voice activity detection algorithm
KR101349797B1 (ko) 전자기기에서 음성 파일 재생 방법 및 장치
KR20080071516A (ko) 재생 장치, 재생 방법 및 재생 프로그램이 기록된 컴퓨터판독 가능한 기록 매체
WO2009090705A1 (ja) 記録再生装置
JP2007183410A (ja) 情報再生装置および方法
JP4934990B2 (ja) 音声信号記録再生装置
JP2008197199A (ja) オーディオ符号化装置及びオーディオ復号化装置
JP3978465B2 (ja) 録音再生装置
JPWO2005093750A1 (ja) ディジタルダビング装置
JP4202524B2 (ja) 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体
KR100447371B1 (ko) 녹음 비교 기능을 갖는 어학 학습 장치 및 이를 이용한어학학습 방법
US20050060053A1 (en) Method and apparatus to adaptively insert additional information into an audio signal, a method and apparatus to reproduce additional information inserted into audio data, and a recording medium to store programs to execute the methods
KR200230867Y1 (ko) 외부 메모리를 이용한 어학 학습 장치
JP4284601B2 (ja) オーディオ信号処理装置および方法、記録媒体、並びにプログラム
JPH0368399B2 (ko)
JP2010008938A (ja) ボイスレコーダー、及び音声録音方法
JPH0728384A (ja) 語学練習機
JPS61182699A (ja) 固体メモリを用いた音声信号記録再生方法
US20140185830A1 (en) Methods, systems, and apparatus for audio backtracking control
KR101744912B1 (ko) 라디오 녹음 모듈 및 방법
KR20060026557A (ko) 디지털 오디오 기기에서의 자동 음량 조절 장치 및 방법
JP4985562B2 (ja) 録音装置、方法及びプログラム
JP6273456B2 (ja) 音声再生装置
KR100576842B1 (ko) 디지털 오디오 신호의 구간 재생 장치
KR0135774B1 (ko) 문장 인지를 위한 테이프 기록 및 재생방법과 재생장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181227

Year of fee payment: 6