KR20090047159A - 오디오-북 재생 방법 및 장치 - Google Patents

오디오-북 재생 방법 및 장치 Download PDF

Info

Publication number
KR20090047159A
KR20090047159A KR1020070113190A KR20070113190A KR20090047159A KR 20090047159 A KR20090047159 A KR 20090047159A KR 1020070113190 A KR1020070113190 A KR 1020070113190A KR 20070113190 A KR20070113190 A KR 20070113190A KR 20090047159 A KR20090047159 A KR 20090047159A
Authority
KR
South Korea
Prior art keywords
speech
audio
data
book
text data
Prior art date
Application number
KR1020070113190A
Other languages
English (en)
Inventor
노태권
최영규
박영민
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070113190A priority Critical patent/KR20090047159A/ko
Priority to US12/131,259 priority patent/US20090119108A1/en
Publication of KR20090047159A publication Critical patent/KR20090047159A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • G11B20/04Direct recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 오디오-북 재생 장치 및 방법, 그리고 그 방법을 컴퓨터 상에서 실행하기 위한 컴퓨터 프로그램 저장매체에 관한 것이다.
그 중 본 발명에 의한 오디오-북 재생 방법은 (a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계; (b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;(c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및 (d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 의한 오디오-북 재생 방법 및 장치를 이용하면 사용자는 휴대용 멀티미디어 재생 장치를 통해 시각적 및 청각적으로 독서를 즐길 수 있다.
또한 본 발명은 더블 버퍼링(double buffering) 기술을 채택하여 끊김 없는(seamless) 텍스트 및 스피치 재생 서비스를 제공한다.

Description

오디오-북 재생 방법 및 장치{Audio-book playback method and apparatus thereof}
본 발명은 오디오-북에 관한 것으로, 특히 오디오-북 재생시 텍스트 재생 모드 및 스피치 재생 모드를 동시에 제공하기 위한 오디오-북 재생 방법 및 장치에 관한 것이다.
종래의 MP3 플레이어 등의 휴대용 멀티미디어 장치는 동영상 파일이나 음악 파일의 재생을 주된 기능으로 한다. 하지만 최근의 휴대용 멀티미디어 장치는 텍스트 뷰어(text viewer) 기능을 추가함으로써 다양한 책의 내용을 텍스트 또는 영상의 형태로 사용자에게 시각적으로 전달할 수 있다.
한편 TTS(text-to-speech) 변환 기술의 발달에 힘입어 사용자는 손쉽게 텍스트 데이터를 스피치 데이터 또는 음성 데이터로 변환할 수 있게 됨으로써 눈이 아닌 귀를 통해 책을 읽는 것이 가능해졌다.
그러나 기존의 휴대용 멀티미디어 장치는 텍스트 뷰어 및 TTS 변환 기술의 장점을 모두 제공할 수 있는 편리하고 효율적인 오디오-북(audio-book) 기능을 제공하지 못하고 있다.
본 발명이 해결하고자 하는 과제는 상기한 종래 기술의 문제점을 극복하고 텍스트 뷰어(text viewer) 기능 및 북텔러(book teller) 기능을 결합한 오디오-북 재생 장치 및 방법을 제공하여 사용자로 하여금 편리하고 효율적으로 독서할 수 있도록 하는 것이다.
상기한 기술적 과제을 해결하기 위한 본 발명에 의한 오디오-북 재생 방법은
a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계;
(b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;
(c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및
(d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 것을 특징으로 한다.
상기한 또 다른 기술적 과제을 해결하기 위한 본 발명에 의한 오디오-북 재생 방법은
오디오-북 재생 모드를 선택하는 단계; 및
상기 재생 모드 선택 단계에서의 선택에 따라
텍스트를 재생하는 단계;
스피치를 재생하는 단계; 및
텍스트 및 스피치를 동시에 재생하는 단계 중 어느 하나의 단계를 수행하 는 단계를 포함하는 것을 특징으로 한다.
상기한 또 다른 기술적 과제을 해결하기 위한 본 발명에 의한 오디오-북 재생 방법을 컴퓨터상에서 수행하기 위한 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체는
(a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계;
(b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;
(c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및
(d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 것을 특징으로 한다.
상기한 또 다른 기술적 과제을 해결하기 위한 본 발명에 의한 오디오-북 재생 장치는
텍스트 데이터를 표시하기 위한 디스플레이;
스피치-재생할 텍스트 데이터를 버퍼링하기 위한 버퍼; 및
상기 버퍼에 저장된 텍스트 데이터를 스피치 데이터로 변환하기 위한 TTS 변환기를 포함하며,
상기 텍스트 데이터 및 상기 변환된 스피치 데이터를 출력함과 동시에 다음에 재생할 텍스트 데이터를 버퍼링하는 것을 특징으로 한다.
본 발명에 의한 오디오-북 재생 방법 및 장치를 이용하면 사용자는 휴대용 멀티미디어 재생 장치를 통해 시각적 및 청각적으로 독서를 즐길 수 있다.
또한 본 발명은 더블 버퍼링(double buffering) 기술을 채택하여 실시간(realtime 또는 seamless) 텍스트/스피치 재생 모드를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 의한 바람직한 실시예들을 설명하기로 한다.
도 1은 본 발명에 의한 오디오-북 재생 장치(1)의 물리적 구성을 보여주는 기능 블록도이다.
본 발명의 오디오-북 재생 장치(1)는 메모리(11), TTS 변환기(text-to-speech converter)(12), LCD(liquefied crystal display)(13), 데이터 버스(14), 버퍼(15), 사용자 입력 수단(16) 및 스피커(17)를 포함한다.
LCD(13)는 텍스트 뷰어(text viewer) 프로그램을 표시하기 위한 것이며, 버퍼(15)는 스피치-재생할 페이지의 텍스트 데이터를 버퍼링하기 위한 것이다.
TTS 변환기(12)는 버퍼(15)에 저장된 텍스트 데이터를 스피치 데이터로 변환하기 위한 것이며, 스피커(17)는 변환된 스피치 데이터를 출력하기 위한 것이다. 상기 사용자 입력 수단(16)은 메뉴키, 방향키, 확인키 등을 포함하는 리모콘이나 제어 패널을 의미한다.
본 발명에 의한 오디오-북 재생 장치(1)는 텍스트 데이터 및 스피치 데이터의 재생함과 동시에 연속되는 다음 텍스트 데이터를 버퍼링 및/또는 변환하는 것을 특징으로 하는데 각 구성요소의 구체적인 기능은 이하의 설명으로부터 보다 명백해 질 것이다.
상기 오디오-북 재생 장치는 독립된 전자 제품으로 구현될 수도 있지만, MP3 플레이어, PMP, PDA, 휴대폰 등의 휴대용 멀티미디어 재생 장치의 일부분으로 구현될 수도 있다.
도 2는 본 발명에 의한 오디오-북 재생 방법의 구체적인 동작을 보여주는 흐름도이다.
먼저 사용자가 먼저 오디오-북 재생 장치(1)의 전원을 켠(단계 21) 후 오디오-북 재생 모드를 선택한다(단계 22). 사용자가 선택할 수 있는 오디오-북 재생 모드에는 텍스트 재생 모드, 스피치 재생 모드 및 텍스트/스피치 재생 모드가 있다.
만약 사용자가 단계 22에서 텍스트 재생 모드를 선택한 경우 오디오-북 재생 장치(1)는 텍스트 재생(단계 23)만을 수행하게 된다. 반면 스피치 재생 모드가 선택된 경우에는 오디오-북 재생 장치(1)는 스피치 재생(단계 24)만을 수행한다. 또한 텍스트/스피치 재생 모드가 선택된 경우에는 텍스트 재생(단계 23) 및 스피치 재생(단계 24)이 동시에 수행된다.
도 5(a) 및 (b)는 상기 오디오-북 재생 모드 선택 단계(단계 22)가 그래픽 유저 인터페이스(Graphic User Interface)로서 구현된 예를 보여 준다. 먼저 사용자가 오디오-북 재생 장치(1)의 사용자 입력 수단(16)에 포함된 메뉴키를 누르면 LCD(또는 텍스트 뷰어)(13)에 재생 모드 선택창(51)이 표시된다.
현재 재생 모드는 텍스트 재생 모드(511)로 설정되어 있다(도 5(a)). 사용자가 오디오-북 재생 모드로서 텍스트/스피치 재생 모드를 선택하고자 한다면 사용자 입력 수단(16)에 포함된 방향키를 눌러 재생 모드 선택창(51) 내의 커서를 텍스트/스피치 재생 모드(513)로 이동시킨 후 확인키를 누른면 된다(도 5(b)).
도 3은 도 2의 본 발명에 따른 오디오-북의 스피치 재생 단계(단계 24)의 보다 구체적인 동작들을 보여주는 흐름도이다.
먼저 오디오-북 재생 장치(1)는 오디오-북 파일에 포함된 텍스트 데이터 중 일부 텍스트 데이터를 버퍼 메모리(15)에 버퍼링한다(단계 31).
그런 다음 상기 버퍼링된 텍스트 데이터들은 TTS 변환(text-to-speech conversion)을 거쳐 대응되는 스피치 데이터로 변환된다(단계 32). 이때 변환생성된(transduced) 스피치 데이터는 하나 이상의 오디오 파일 포맷들(예: MP3, WMA, OGG, WMA) 중 어느 하나의 파일 포맷을 갖게 된다. 상기 파일 포맷들 중 끊김 없는 오디오-북의 재생(seamless playing) 및 실시간 재생(real time playing)이 보장할 수 있는 포맷을 선택하는 것이 바람직하다. 또한 상기 오디오 포맷 선택에 있어 TTS 변환기의 처리능력, 메모리(11), 버퍼(15)의 저장 공간의 크기 등도 고려되어야 한다.
단계 33에선 상기 TTS 변환된 스피치 데이터들은 스피커(17)를 통해 음성(또는 스피치)으로 재생된다. 이때 LCD(13)에 표시되는 텍스트와 스피커(17)를 통해 출력되는 음성은 상호 동기화되어야 한다(synchronized).
일단 스피치 재생이 시작되면 오디오-북 재생 장치(1)는 현재 재생 중인 데이터가 오디오-북의 파일의 마지막 데이터인지 여부를 판단한다(단계 36).
만약 현재 재생 중인 데이터가 마지막 데이터라면 스피치 재생 프로세스는 종료된다. 그러나 만약 현재 재생 중인 데이터가 마지막 데이터가 아니라면 오디오-북 재생 장치(1)는 현재 재생 중인 데이터를 뒤따르는 다음 텍스트 데이터의 일정량 버퍼(15)에 버퍼링한다.
상기 다음 텍스트 데이터에 대한 버퍼링(단계 31)은 상기 현재 데이터에 대한 스피치 재생(단계 33)이 진행되는 동안 수행하는 것이 바람직하다(일명 "double buffering"이라 한다). 더 나아가 상기 다음 텍스트 데이터에 대한 TTS 변환(단계 32)도 상기 현재 데이터에 대한 스피치 재생(단계 33)이 진행되는 동안 수행될 수 있다. 그 이유는 오디오-북 재생이 끊김 없이 이루어(seamless playing) 질 수 있도록 하기 위함이다. 다시 말해 현재 버퍼링되어 있는 데이터가 모두 재생되기 전까지 다음 데이터의 버퍼링이 시작되어야 할 것이다.
상기 단계 31에서 이루어지는 현재 데이터 또는 다음 데이터의 버퍼링의 양도 데이터의 끊김 없는 재생을 보장할 수 있는 범위 내에서 결정되어야 한다.
또한 상기 한 번에 버퍼링할 데이터의 양은 TTS 변환기(12)의 처리능력, 메모리(11), 버퍼(15)의 저장 공간의 크기, 디스플레이(또는 텍스트 뷰어)에 한 번에 표시될 수 있는 데이터의 양 등도 고려하여 결정되어야 한다.
이하에서는 상기 도 2의 단계 22에서 사용자에 의해 텍스트/스피치 재생 모드(513)가 선택된 경우 텍스트 재생(단계 23) 및 스피치 재생(단계 24)을 동시에 수행하는 실시예를 도 2, 4 및 5를 참조하여 설명한다.
도 4는 도 2의 본 발명에 의한 오디오-북의 스피치 재생 단계(단계 24)의 보다 구체적인 동작들을 보여주는 또 다른 흐름도이다.
도 5는 도 2 및 4에 의한 오디오-북 재생 방법이 그래픽 유저 인터페이스(Graphic User Interface) 상에서 구현된 예를 보여 준다.
일단 텍스트 재생(단계 23)이 수행되어 처음 재생할 1 페이지가 LCD(또는 텍스트 뷰어)(13)에 표시된다(도 5(c)).
오디오-북 재생 장치(1)는 텍스트 재생(단계 23)을 수행함과 동시에 스피치 재생(단계 24)을 수행하는데, 먼저 처음 재생하고자 하는 페이지의 번호를 페이지 번호로 설정한다(단계 41). 도 5의 경우 맨 처음 재생하고자 하는 페이지가 1 페이지이므로 페이지 번호로 "1"이 설정된다.
그런 다음 1 페이지의 텍스트 데이터들이 버퍼(15)에 버퍼링된다(단계 42). 상기 단계 42에서 버퍼링되는 데이터의 양은 오디오-북의 끊김 없는 재생을 보장될 수 있는 범위 내에서 결정되어야 한다.
따라서 LCD(13) 상의 텍스트 뷰어의 크기가 변경되거나, 표시되는 텍스트 폰트이 종류나 크기나 변경되면 한 번에 버퍼링되는 데이터의 양도 더불어 변경되어야 할 것이다. 가령 LCD(13)(또는 한 페이지)에 한 번에 50자의 한글 글자들이 표시될 수 있다면 버퍼에 한 번에 저장되어야 하는 텍스트 데이터의 양은, 한 페이지의 텍스트 분량에 해당하는, 최소 100bytes이어야 한다. 만약 텍스트 폰트의 크기가 두 배로 확대되면 하나의 페이지에 표시되는 글자들의 수는 25개이므로 최소 50bytes의 텍스트 데이터가 버퍼링되어야 한다. 만약 이 경우에도 100bytes를 버퍼링한다면 한 번에 2 페이지의 분량의 텍스트 데이터가 버퍼링되는 것이다.
상기 버퍼링된 텍스트 데이터들은 TTS 변환(text-to-speech conversion)을 거쳐 텍스트 데이터에 대응하는 스피치 데이터가 생성된다(단계 43).
단계 43에서 TTS 변환된 스피치 데이터들은 스피커(17)를 통해 음성(또는 스피치)으로 재생된다(단계 44).
이때 LCD(13)에 표시되는 텍스트와 스피커(17)를 통해 출력되는 음성은 상호 동기화된다(synchronized). 가령 도 5 (d)의 경우 현재 스피커를 통해 "어지럽히고"라는 음성이 출력되고 있으며 이 음성에 동기화된 LCD(13) 상의 단어 "어지럽히고"는 다른 단어들과 구분하기 위해 다른 크기 및/또는 폰트(font)로 표시된다.
단계 44에서 스피치 재생이 시작되면 오디오-북 재생 장치(1)는 현재 재생 중인 페이지가 오디오-북의 마지막 페이지인지 여부를 판단한다(단계 45).
만약 현재 페이지가 마지막 페이지라면 스피치 재생 프로세스는 종료될 것이지만, 마지막 페이지가 아니라면 페이지 번호를 다음 페이지로 바꾼(단계 46) 후 그 다음 페이지의 텍스트 데이터를 버퍼링한다. 이렇게 함으로써 1 페이지의 재생이 끝나면(도 5(e)) 끊김 없이 곧바로 2 페이지가 재생될 수 있다. 2 페이지의 텍스트 데이터는 LCD(13)에 표시되고 이에 동기화된 대응(corresponding) 스피치 데이터는 스피커(17)를 통해 출력된다(도 5(f)).
만약 사용자가 오디오-북 재생 중 스피치 재생을 중단하고 텍스트 재생 모드로 돌아가고자 한다면 사용자는 사용자 입력 수단(16)을 이용해 도 5(f) 내지 (g)와 같이 재생 모드를 텍스트 재생 모드로 변경하면 된다.
도 6은 본 발명에 의한 오디오-북 재생 방법의 또 다른 실시예를 보여주는 흐름도이다.
도 6에 의한 실시예와 도 4에 의한 실시예는 그 구체적인 동작에 있어 공통된 부분이 많이 있다. 따라서 도 4의 실시예와 차이 나는 부분들을 중심으로 도 6에 의한 실시예를 설명하기로 한다.
먼저 사용자는 오디오-북 재생 장치(1)의 전원을 켜고 텍스트 재생 모드로서 오디오-북을 재생한다(단계 61 내지 62). 사용자가 텍스트 전용 모드에서 오디오-북을 읽던 중 그 내용을 음성으로도 동시에 듣고자 한다면 사용자 입력 수단(16)를 이용하여 오디오-북 재생 모드를 텍스트/스피치 재생 모드 변경하여야 한다(단계 63). 사용자가 텍스트/스피치 재생 모드를 선택하면 그 다음 단계 64 내지 단계 69를 수행하게 되는데 이 단계들은 각각 도 4의 단계 41 내지 단계 46와 동일하다. 다만 단계 64에서 현재 재생 중인 페이지의 번호가 페이지 번호로 설정된다는 점에서 차이가 있다(이에 반해 단계 41에서는 오디오-북의 처음 페이지가 페이지 번호로 설정된다).
도 7은 상기 도 6에 따른 오디오-북 재생 방법을 그래픽 유저 인터페이스상에서 구현한 예를 보여준다.
먼저 오디오-북이 텍스트 재생 모드로서 재생되고 있다(도 7(a)).
이때 사용자가 오디오-북의 내용을 음성으로도 듣고 싶다면 사용자 입력 수단(16)에 포함된 메뉴키와 방향키를 눌러 선택창 내의 커서를 텍스트/스피치 재생 모드로 이동시킨 후 확인키를 누르면 된다(도 7(b)-(c)). 반대로 도 7(f)-(g)는 사용자가 텍스트/스피치 재생 모드를 종료시키는 과정을 보여준다.
본 발명에 의한 오디오-북 재생 방법은 컴퓨터상에서 수행하기 위해 컴퓨터 로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명에 의한 오디오-북 재생 장치의 물리적 구성을 보여주는 기능 블록도이다.
도 2는 본 발명에 의한 오디오-북 재생 방법의 구체적인 동작을 보여주는 흐름도이다.
도 3은 도 2의 본 발명에 의한 오디오-북의 스피치 재생 단계(단계 24)의 구체적인 동작들을 보여주는 흐름도이다.
도 4은 도 2의 본 발명에 의한 오디오-북의 스피치 재생 단계(단계 24)의 구체적인 동작들을 보여주는 또 다른 흐름도이다.
도 5는 도 2 및 4에 의한 오디오-북 재생 방법을 그래픽 유저 인터페이스(Graphic User Interface) 상에서 구현한 예를 보여 준다.
도 6는 본 발명에 의한 오디오-북 재생 방법의 또 다른 실시예를 보여주는 흐름도이다.
도 7은 도 6에 따른 오디오-북 재생 방법을 그래픽 유저 인터페이스상에서 구현한 예를 보여준다.

Claims (18)

  1. (a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계;
    (b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;
    (c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및
    (d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 오디오-북 재생 방법.
  2. 제 1항에 있어서, 상기 오디오-북 재생 방법은 상기 (c)단계 및 상기(d)단계를 동시에 수행하는 오디오-북 재생 방법.
  3. 제 1항에 있어서, 상기 오디오-북 재생 방법은 상기 (d) 단계에 앞서
    (e) 현재 스피치-재생 중인 데이터가 마지막 데이터인지 판단하는 단계를 더 포함하는 오디오-북 재생 방법.
  4. 제 1항에 있어서, 상기 오디오-북 재생 방법은
    (f) 버퍼링된 다음 텍스트 데이터를 TTS 변환하는 단계를 더 포함하는 오디오-북 재생 방법.
  5. 제 1항에 있어서, 상기 (a)단계 또는 상기(d)단계에서 버퍼링되는 데이터의 양은 오디오-북 재생의 끊김이 발생하지 않도록 하는 범위 내에서 결정되는 오디오-북 재생 방법.
  6. 제 5항에 있어서, 상기 (a)단계 또는 상기 (d)단계에서 버퍼링되는 텍스트 데이터의 양은 버퍼의 크기 및 디스플레이에 한 번에 표시될 수 있는 텍스트 데이터의 크기 중 하나 이상을 고려하여 결정되는 오디오-북 재생 방법.
  7. 제 1항에 있어서, 상기 오디오-북 재생 방법은 텍스트-재생 과정을 더 포함하며 상기 텍스트-재생 과정과 상기 스피치 재생 과정은 상호 동기화되는 오디오-북 재생 방법.
  8. 제 7항에 있어서, 스피치-재생 중인 스피치 데이터 부분에 대응하는 텍스트 데이터 부분을 나머지 부분과 구별되도록 표시하는 오디오-북 재생 방법.
  9. 오디오-북 재생 모드를 선택하는 단계; 및
    상기 재생 모드 선택 단계에서의 선택에 따라
    텍스트를 재생하는 단계;
    스피치를 재생하는 단계; 및
    텍스트 및 스피치를 동시에 재생하는 단계 중 어느 하나의 단계를 수행하는 단계를 포함하는 오디오-북 재생 방법.
  10. 제 9항에 있어서, 상기 스피치 재생 단계는
    (a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계;
    (b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;
    (c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및
    (d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 오디오-북 재생 방법.
  11. 제 10항에 있어서, 상기 오디오-북 재생 방법은 상기 (c)단계 및 상기(d)단계를 동시에 수행하는 오디오-북 재생 방법.
  12. 제 10항에 있어서, 상기 오디오-북 재생 방법은 상기 (d) 단계에 앞서
    (e) 현재 스피치-재생 중인 텍스트 데이터가 마지막 데이터인지 판단하는 단계를 더 포함하는 오디오-북 재생 방법.
  13. 제 10항에 있어서, 상기 오디오-북 재생 방법은
    (f) 상기 버퍼링된 다음 텍스트 데이터를 TTS 변환하는 단계를 더 포함하는 오디오-북 재생 방법.
  14. 제 13항에 있어서, 상기 오디오-북 재생 방법은 상기 (c)단계 및 상기(f)단 계를 동시에 수행하는 오디오-북 재생 방법.
  15. (a) 스피치-재생할 텍스트 데이터를 버퍼링하는 단계;
    (b) 상기 버퍼링된 텍스트 데이터를 스피치 데이터로 변환하는 단계;
    (c) 상기 변환된 스피치 데이터를 이용해 스피치-재생하는 단계; 및
    (d) 스피치-재생할 다음 텍스트 데이터를 버퍼링하는 단계를 포함하는 오디오-북 재생 방법을 컴퓨터상에서 수행하기 위한 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체.
  16. 텍스트 데이터를 표시하기 위한 디스플레이;
    스피치-재생할 텍스트 데이터를 버퍼링하기 위한 버퍼; 및
    상기 버퍼에 저장된 텍스트 데이터를 스피치 데이터로 변환하기 위한 TTS 변환기를 포함하며,
    상기 텍스트 데이터 및 상기 변환된 스피치 데이터를 출력함과 동시에 다음에 재생할 텍스트 데이터를 버퍼링하는 오디오-북 재생 장치.
  17. 제 16항에 있어서, 상기 버퍼에 의해 저장되는 텍스트 데이터의 양은 최소한 디스플레이에 한 번에 표시될 수 있는 텍스트 데이터의 크기로 하는 오디오-북 재생 장치.
  18. 제 16항에 의한 오디오-북 재생 장치를 포함하는 휴대용 멀티미디어 재생 장치.
KR1020070113190A 2007-11-07 2007-11-07 오디오-북 재생 방법 및 장치 KR20090047159A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070113190A KR20090047159A (ko) 2007-11-07 2007-11-07 오디오-북 재생 방법 및 장치
US12/131,259 US20090119108A1 (en) 2007-11-07 2008-06-02 Audio-book playback method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070113190A KR20090047159A (ko) 2007-11-07 2007-11-07 오디오-북 재생 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20090047159A true KR20090047159A (ko) 2009-05-12

Family

ID=40589101

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070113190A KR20090047159A (ko) 2007-11-07 2007-11-07 오디오-북 재생 방법 및 장치

Country Status (2)

Country Link
US (1) US20090119108A1 (ko)
KR (1) KR20090047159A (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100324895A1 (en) * 2009-01-15 2010-12-23 K-Nfb Reading Technology, Inc. Synchronization for document narration
US10705794B2 (en) * 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8888494B2 (en) * 2010-06-28 2014-11-18 Randall Lee THREEWITS Interactive environment for performing arts scripts
KR102023157B1 (ko) * 2012-07-06 2019-09-19 삼성전자 주식회사 휴대 단말기의 사용자 음성 녹음 및 재생 방법 및 장치
JP6039990B2 (ja) * 2012-10-11 2016-12-07 キヤノン株式会社 情報処理装置及びその制御方法
US9058398B2 (en) * 2012-10-26 2015-06-16 Audible, Inc. Managing use of a shared content consumption device
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10469275B1 (en) 2016-06-28 2019-11-05 Amazon Technologies, Inc. Clustering of discussion group participants
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032673A1 (fr) * 1995-04-09 1996-10-17 Sony Corporation Dispositif et procede de reproduction de signaux d'information
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US6466909B1 (en) * 1999-06-28 2002-10-15 Avaya Technology Corp. Shared text-to-speech resource
EP1374224B1 (en) * 2001-03-29 2006-02-08 Koninklijke Philips Electronics N.V. Text editing for recognized speech during synchronous playback
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices
JP5025261B2 (ja) * 2003-03-31 2012-09-12 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 信頼水準の指示により音声認識の結果を訂正するためのシステム
US20040249862A1 (en) * 2003-04-17 2004-12-09 Seung-Won Shin Sync signal insertion/detection method and apparatus for synchronization between audio file and text
EP1831805A2 (en) * 2004-12-22 2007-09-12 Koninklijke Philips Electronics N.V. Portable audio playback device and method for operation thereof
US7574453B2 (en) * 2005-01-03 2009-08-11 Orb Networks, Inc. System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
US20070117549A1 (en) * 2005-10-06 2007-05-24 Arnos Reed W Wireless handset and methods for use therewith
US20070117553A1 (en) * 2005-10-06 2007-05-24 Arnos Reed W Wireless handset and methods for use therewith
US20070117554A1 (en) * 2005-10-06 2007-05-24 Arnos Reed W Wireless handset and methods for use therewith
US7693717B2 (en) * 2006-04-12 2010-04-06 Custom Speech Usa, Inc. Session file modification with annotation using speech recognition or text to speech
US20070244700A1 (en) * 2006-04-12 2007-10-18 Jonathan Kahn Session File Modification with Selective Replacement of Session File Components

Also Published As

Publication number Publication date
US20090119108A1 (en) 2009-05-07

Similar Documents

Publication Publication Date Title
KR20090047159A (ko) 오디오-북 재생 방법 및 장치
CN101743531B (zh) 使用用户运动输入用户命令的方法及其多媒体设备
US8548618B1 (en) Systems and methods for creating narration audio
JP6128146B2 (ja) 音声検索装置、音声検索方法及びプログラム
US20060008258A1 (en) Device and method for reproducing compressed information
JP2012527007A (ja) マルチメディアファイル再生方法およびマルチメディア再生機器
KR20090006482A (ko) 미디어 인터페이스
CN100514384C (zh) 有声电子书
JP3460964B2 (ja) マルチメディア情報閲覧システムにおける音声読み上げ方法および記録媒体
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
JP2005062880A (ja) テキスト表示機能を有する音声プレイヤー及び表示方法
TWI223231B (en) Digital audio with parameters for real-time time scaling
JP2005321706A (ja) 電子書籍の再生方法及びその装置
KR100695209B1 (ko) 전자책의 녹음 내용을 저장하는 이동통신 단말기 및 방법
JP4191221B2 (ja) 記録再生装置、同時記録再生制御方法、および同時記録再生制御プログラム
KR101124798B1 (ko) 전자 그림책 편집 장치 및 방법
JP7229296B2 (ja) 関連情報提供方法及びシステム
KR100574045B1 (ko) 멀티미디어 콘텐츠 재생장치 및 재생방법
KR100473163B1 (ko) 멀티미디어 컨텐츠가 저장된 기록 매체 및 그 재생을 위한장치와 방법
JP2006208866A (ja) 再生装置
JP2007179604A (ja) 楽曲再生装置、再生制御方法、および、プログラム
KR100959585B1 (ko) 멀티 트랙 미디어 파일이 기록된 기록매체, 멀티 트랙 미디어 파일 재생 방법, 및 미디어 장치
JP2002245033A (ja) 携帯型電子機器および同装置の文字列表示方法
KR100932778B1 (ko) 멀티 트랙 미디어 파일이 기록된 기록매체, 멀티 트랙 미디어 파일 재생 방법, 및 미디어 장치
KR20110060773A (ko) 멀티미디어파일 재생방법 및 멀티미디어 재생기기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application