KR100677215B1 - 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법 - Google Patents

엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법 Download PDF

Info

Publication number
KR100677215B1
KR100677215B1 KR1020040104384A KR20040104384A KR100677215B1 KR 100677215 B1 KR100677215 B1 KR 100677215B1 KR 1020040104384 A KR1020040104384 A KR 1020040104384A KR 20040104384 A KR20040104384 A KR 20040104384A KR 100677215 B1 KR100677215 B1 KR 100677215B1
Authority
KR
South Korea
Prior art keywords
file
list
voice
player
name
Prior art date
Application number
KR1020040104384A
Other languages
English (en)
Other versions
KR20060065893A (ko
Inventor
김훈
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020040104384A priority Critical patent/KR100677215B1/ko
Publication of KR20060065893A publication Critical patent/KR20060065893A/ko
Application granted granted Critical
Publication of KR100677215B1 publication Critical patent/KR100677215B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00057MPEG-1 or MPEG-2 audio layer III [MP3]

Abstract

본 발명은 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법에 관한 것으로, 종래에는 엠피3 플레이어에 저장된 엠피3 파일의 개수가 소정 개수 이상으로 많아질 경우 사용자는 다수의 엠피3 파일에서 원하는 엠피3 파일을 선택함에 어려움을 겪는 문제점이 있었다. 이러한 문제점을 감안한 본 발명은 저장된 엠피3 파일의 파일명에서 파일 확장자를 제외한 엠피3 파일명에 대응한 문자정보를 리스트로 구성하는 단계; 저장된 엠피3 파일 중 일부 파일이 삭제되거나 추가되면 상기 리스트를 업데이트 하는 단계; 상기 리스트를 소리로 출력하는 단계; 및 입력되는 사용자 음성을 음성인식하고, 음성인식된 사용자 음성에 대응하는 엠피3 파일을 재생하는 단계를 포함하여 이루어져 엠피3 파일명을 음성 합성을 통해 사용자에게 들려주고 엠피3 파일명의 음성 인식에 의해 해당 엠피3 파일을 선택 재생함으로써 사용자는 엠피3 파일명을 듣고 원하는 엠피3 파일의 이름을 말하여 원하는 음악을 선곡하여 듣는 효과가 있다.

Description

엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법{METHOD FOR SELECTING FILE USING TEXT TO SPEECH IN MP3 PLAYER}
도 1은 본 발명을 설명하기 위한 엠피3 플레이어의 구성을 보인 예시도.
도 2는 본 발명의 실시 예에 따른 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법의 동작 흐름도.
본 발명은 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법에 관한 것으로, 특히 사용자가 엠피3 파일명을 듣고, 원하는 곡의 엠피3 파일명을 말하여 듣고 싶은 음악을 선곡하여 들을 수 있게 한 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법에 관한 것이다.
엠피3는 오디오 데이터 압축 기술로 엠펙1,2의 기능 사양 중 일부이고, 음질을 보장하면서 음악 파일의 데이터 용량을 압축하여 파일 크기가 작으면서 고품질 오디오 파일을 제공한다.
엠피3 파일은 원본 음성의 1/12 크기로 CD 수준의 음질을 제공한다. 컴퓨터가 재생 시간이 3분 정도 되는 데이터를 엠피3 파일로 변환하여 저장할 경우 650Mbyte의 CD에 약 200개 정도의 엠피3 파일을 저장할 수 있고, 엠피3 플레이어의 256Mbyte 메모리에는 80개 정도의 엠피3 파일을 저장할 수 있다.
엠피3 플레이어는 대중화된 엠피3 파일을 재생할 때 메모리에 저장된 엠피3 파일의 파일명을 표시창에 문자 데이터로 출력하고, 사용자는 표시창에 출력된 엠피3 파일명을 확인하고 듣고 싶은 엠피3 파일을 선택하여 원하는 음악을 청취한다.
엠피3 플레이어의 표시창 크기는 하나의 엠피3 파일명을 나타내기에는 충분하지만 여러 엠피3 파일명을 나타내기에 불충분하므로 사용자는 방향 버튼을 눌러 한 번에 하나씩 다음 엠피3 파일로 이동 확인하면서 저장된 엠피3 파일의 리스트를 확인한다.
만약 엠피3 플레이어가 수십에서 수백 개의 엠피3 파일을 보관할 경우 사용자는 원하는 엠피3 파일을 선택하고자 여러 번의 버튼을 눌러 원하는 곡을 선곡해야 하는 불편함이 있다.
그러나, 상기와 같은 종래 기술에 있어서, 엠피3 플레이어에 저장된 엠피3 파일의 개수가 소정 개수 이상으로 많아질 경우 사용자는 다수의 엠피3 파일에서 원하는 엠피3 파일을 선택함에 어려움을 겪는 문제점이 있다.
따라서, 본 발명은 상기와 같은 문제점을 감안하여 창안한 것으로, 엠피3 파일명을 음성 합성을 통해 사용자에게 들려주고 엠피3 파일명의 음성 인식에 의해 해당 엠피3 파일을 선택 재생할 수 있도록 한 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법을 제공함에 그 목적이 있다.
상기와 같은 목적을 달성하기 위한 본 발명은, 저장된 엠피3 파일의 파일명에서 파일 확장자를 제외한 엠피3 파일명에 대응한 문자정보를 리스트로 구성하는 단계; 저장된 엠피3 파일 중 일부 파일이 삭제되거나 추가되면 상기 리스트를 업데이트 하는 단계; 상기 리스트를 소리로 출력하는 단계; 및 입력되는 사용자 음성을 음성인식하고, 음성인식된 사용자 음성에 대응하는 엠피3 파일을 재생하는 단계를 포함하여 이루어진 것을 특징으로 한다.
이하, 본 발명에 따른 실시 예를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.
도 1은 본 발명을 설명하기 위한 엠피3 플레이어의 구성을 보인 예시도이다.
엠피3 플레이어는 표시창(13)에 현재 선택된 엠피3 파일의 이름을 출력하고, 음성 합성 버튼(12), 음성 인식 버튼(11)을 구비한다. 음성 합성 버튼(12)은 엠피3 플레이어에 엠피3 파일의 이름을 음성 합성하여 출력하도록 명령하고, 음성 인식 버튼(11)은 엠피3 플레이어에 사용자가 말하는 엠피3 파일명에 대해 음성 인식하도록 명령한다.
엠피3 플레이어는 음성 합성 버튼(12)의 눌림을 판단하여 눌리면 저장된 엠피3 파일의 이름을 리스트로 작성하고 엠피3 파일명을 음성 합성하여 출력하고, 음성 인식 버튼(11)의 눌림을 판단하여 눌리면 마이크(14)에 의해 사용자의 음성을 녹음하여 녹음된 사용자 음성으로부터 엠피3 파일명을 음성 인식하여 해당 엠피3 파일을 선택하고 재생한다.
도 2는 본 발명의 실시 예에 따른 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법의 동작 흐름도로서, 이에 도시된 바와 같이 엠피 3 파일을 다운로드 하는 단계와, 저장된 엠피3 파일의 파일명에서 파일 확장자를 제외한 엠피3 파일명에 대응한 문자정보를 추출하여 이를 리스트로 구성하는 단계와, 저장된 엠피3 파일 중 일부 파일이 삭제되거나 추가되면 엠피3 파일명에 대응하는 문자정보를 리스트로 구성하는 동작을 다시 한번 수행하여 상기 리스트를 업데이트 하는 단계와, 음성 합성 신호가 활성화되면 상기 리스트를 음성 합성에 필요한 문자정보로 이용하여 음성 합성 파라미터를 추출하고 추출된 음성 합성 파라미터를 이용하여 상기 리스트를 소리로 출력하는 단계와, 음성 인식 신호가 활성화되면 입력되는 사용자 음성을 녹음하고 녹음된 사용자 음성에서 엠피3 파일명에 유력한 후보를 추출하고 화자 독립 음성인식을 수행하여 문자 정보인 엠피3 파일명을 출력하는 단계와, 음성인식된 엠피3 파일명을 이용하여 리스트에서 일치하는 엠피3 파일을 검색하고 이를 재생하는 단계로 이루어진다.
사용자가 엠피3 플레이어에 다수의 엠피3 파일을 저장하고, 음성 합성 버튼과 음성 인식 버튼을 이용하여 원하는 엠피3 파일을 선택 재생한다고 가정하자.
엠피3 플레이어는 저장된 엠피3 파일의 파일명에서 파일 확장자를 제외한 엠피3 파일명에 대응한 문자 정보를 리스트로 구성한다. 예를 들어, 엠피3 파일이 엄정화-해피데이.mp3, 신형원-터.mp3, 클론-월드컵송.mp3, 이정현-반.mp3일 때 리스트는 엄정화,해피데이, 신형원,터, 클론,월드컵송, 이정현,반을 포함한다.
엠피3 플레이어는 리스트를 음성 합성에 필요한 문자 정보로 이용하여 음성 합성 파라미터를 추출하고 음성 합성 버튼의 눌림을 판단하여 눌리면 음성 합성 파라미터를 출력하여 이어폰을 통해 파일 번호, 엠피3 파일명을 사용자에게 들려준다. 예를 들어, 엠피3 플레이어는 음성 합성 파라미터로 1번 파일 엄정화 해피데이, 2번 파일 신형원 터...등의 합성된 음성을 출력한다.
엠피3 플레이어에 저장된 엠피3 파일 중 일부 파일이 삭제되거나 추가되는 일이 발생하면 엠피3 플레이어는 엠피3 파일명에 대응한 문자 정보를 리스트로 구성하는 동작을 다시 수행하여 리스트를 업데이트한다.
사용자가 음성 인식 버튼을 누르고 선택을 원하는 엠피3 파일의 이름을 말하면 엠피3 플레이어는 마이크로 입력되는 사용자 음성을 녹음하고 화자 독립 음성 인식을 수행한다. 엠피3 플레이어는 녹음된 오디오에서 엠피3 파일명에 유력한 후보를 추출하고 화자 독립 음성 인식을 수행하여 문자 정보인 엠피3 파일명을 출력한다.
엠피3 플레이어는 음성 인식된 엠피3 파일명을 이용하여 리스트에서 일치하 는 엠피3 파일을 검색하고 일치된 검색 결과에 해당하는 엠피3 파일을 선택하여 재생한다.
사용자가 음성 인식 버튼을 누르고 엠피3 파일의 재생, 정지, 반복 등을 음성으로 명령하면 엠피3 플레이어는 사용자의 명령을 음성 인식하여 엠피3 파일을 재생, 정지, 반복 등으로 처리한다. 엠피3 플레이어는 음성 인식 버튼의 눌림에 의해 사용자의 음성을 녹음하고 녹음된 음성이 재생, 정지, 반복 명령인지를 음성 인식하여 해당 명령을 판단하고 엠피3 파일의 재생 동작을 수행한다.
이상에서 상세히 설명한 바와 같이, 본 발명은 엠피3 파일명을 음성 합성을 통해 사용자에게 들려주고 엠피3 파일명의 음성 인식에 의해 해당 엠피3 파일을 선택 재생함으로써 사용자는 엠피3 파일명을 듣고 원하는 엠피3 파일의 이름을 말하여 원하는 음악을 선곡하여 듣는 효과가 있다.
또한, 음성 합성으로 저장된 엠피3 파일의 정보를 제공하고 음성 인식에 의해 해당 곡을 선곡하므로 시각 장애인과 같이 시각을 통해 파일 정보를 획득하기 어려운 이는 음성 인식으로 원하는 엠피3 파일을 선택하여 원하는 곡을 재생하는 효과가 있다.

Claims (5)

  1. 저장된 엠피3 파일의 파일명에서 파일 확장자를 제외한 엠피3 파일명에 대응한 문자정보를 리스트로 구성하는 단계;
    저장된 엠피3 파일 중 일부 파일이 삭제되거나 추가되면 상기 리스트를 업데이트 하는 단계;
    상기 리스트를 소리로 출력하는 단계; 및
    입력되는 사용자 음성을 음성인식하고, 음성인식된 사용자 음성에 대응하는 엠피3 파일을 재생하는 단계
    를 포함하여 이루어진 것을 특징으로 하는 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법.
  2. 제1항에 있어서, 상기 엠피3 파일을 재생하는 단계는,
    음성으로 입력되는 사용자 제어명령을 녹음하는 단계; 및
    상기 녹음된 사용자 제어명령을 음성인식하고 이를 이용하여 엠피3 파일의 재생동작을 수행하는 단계를 포함하여 이루어진 것을 특징으로 하는 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법.
  3. 제1항에 있어서, 상기 리스트를 구성하는 단계는,
    엠피3 파일의 파일번호, 곡명, 가수명 중 최소한 어느 하나 이상을 포함하여 리스트를 구성하는 것을 특징으로 하는 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법.
  4. 제1항에 있어서, 상기 리스트를 소리로 출력하는 단계는,
    상기 리스트를 이용하여 음성합성 파라미터를 추출하고 추출된 음성합성 파라미터를 이용하여 상기 리스트를 소리로 출력하는 것을 특징으로 하는 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법.
  5. 제1항에 있어서, 상기 엠피3 파일을 재생하는 단계는,
    입력되는 사용자 음성을 녹음하고 녹음된 사용자 음성에 대한 화자 독립 음성인식을 수행하여 엠피3 파일명에 대응하는 문자정보를 추출하는 단계; 및
    상기 추출된 문자정보를 상기 리스트에서 검색하고 이에 대응하는 엠피3 파일을 재생하는 단계
    를 포함하여 이루어진 것을 특징으로 하는 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일 선택 방법.
KR1020040104384A 2004-12-10 2004-12-10 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법 KR100677215B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040104384A KR100677215B1 (ko) 2004-12-10 2004-12-10 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040104384A KR100677215B1 (ko) 2004-12-10 2004-12-10 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법

Publications (2)

Publication Number Publication Date
KR20060065893A KR20060065893A (ko) 2006-06-14
KR100677215B1 true KR100677215B1 (ko) 2007-02-02

Family

ID=37160894

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040104384A KR100677215B1 (ko) 2004-12-10 2004-12-10 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법

Country Status (1)

Country Link
KR (1) KR100677215B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268545A (ja) 1999-03-17 2000-09-29 Toshiba Video Products Japan Kk 音声再生装置
KR20010011985A (ko) * 1999-07-31 2001-02-15 윤종용 엠피3 곡 선택재생방법
KR20010076508A (ko) * 2000-01-26 2001-08-16 구자홍 Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
KR20010099450A (ko) * 2001-09-28 2001-11-09 오진근 음악파일 재생장치
KR20040062317A (ko) * 2003-01-02 2004-07-07 엘지전자 주식회사 오디오 데이터 파일의 부가 정보 음성 안내방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268545A (ja) 1999-03-17 2000-09-29 Toshiba Video Products Japan Kk 音声再生装置
KR20010011985A (ko) * 1999-07-31 2001-02-15 윤종용 엠피3 곡 선택재생방법
KR20010076508A (ko) * 2000-01-26 2001-08-16 구자홍 Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
KR20010099450A (ko) * 2001-09-28 2001-11-09 오진근 음악파일 재생장치
KR20040062317A (ko) * 2003-01-02 2004-07-07 엘지전자 주식회사 오디오 데이터 파일의 부가 정보 음성 안내방법

Also Published As

Publication number Publication date
KR20060065893A (ko) 2006-06-14

Similar Documents

Publication Publication Date Title
US20090287650A1 (en) Media file searching based on voice recognition
KR100339587B1 (ko) Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
CN101017502B (zh) 使用歌词的重复模式提取歌词结构的设备、系统和方法
JP2006195385A (ja) 音楽再生装置および音楽再生プログラム
US20030072463A1 (en) Sound-activated song selection broadcasting apparatus
US20040064306A1 (en) Voice activated music playback system
JP2006318182A (ja) 音声検索装置、音声検索方法、音声再生方法および携帯再生装置、並びに、楽曲検索装置、楽曲検索方法、楽曲再生方法
KR101727587B1 (ko) 디지털 녹취 파일 녹취록 생성 방법
US20050016364A1 (en) Information playback apparatus, information playback method, and computer readable medium therefor
KR100677215B1 (ko) 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법
JP2006189799A (ja) 選択可能な音声パターンの音声入力方法及び装置
JP4588626B2 (ja) 楽曲再生装置、再生制御方法、および、プログラム
JP2006276560A (ja) 音楽再生装置および音楽再生方法
JP2018159779A (ja) 音声再生態様決定装置、および音声再生態様決定プログラム
KR100707727B1 (ko) 휴대용 파일 재생기
WO2001035404A1 (en) An area setting and a play executing method for repeat-playing in a digital audio player
KR20100068756A (ko) 식별정보에 의해 출력이 조절되는 디지털 음원 재생 장치 및 방법
JP5098896B2 (ja) 再生装置および再生方法
KR102274275B1 (ko) 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법
JP2001312288A (ja) 音楽データ処理装置
JP2008136530A (ja) 録音データ自動出力システム
KR20000072678A (ko) 미디어 파일 재생 방법
JPH1031492A (ja) オーディオ装置
KR100563320B1 (ko) 단일 메모리를 갖는 어학학습장치 및 그 제어방법
JP2007172745A (ja) 楽曲再生装置、プログラム及び楽曲選曲方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee