CN100351897C - 用于手持设备的文本语音转换 - Google Patents

用于手持设备的文本语音转换 Download PDF

Info

Publication number
CN100351897C
CN100351897C CNB038104636A CN03810463A CN100351897C CN 100351897 C CN100351897 C CN 100351897C CN B038104636 A CNB038104636 A CN B038104636A CN 03810463 A CN03810463 A CN 03810463A CN 100351897 C CN100351897 C CN 100351897C
Authority
CN
China
Prior art keywords
book
sound
time
text
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB038104636A
Other languages
English (en)
Other versions
CN1653517A (zh
Inventor
谢健磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1653517A publication Critical patent/CN1653517A/zh
Application granted granted Critical
Publication of CN100351897C publication Critical patent/CN100351897C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Telephone Function (AREA)
  • Electric Clocks (AREA)

Abstract

本发明提供了一种电子书籍(200)。所述电子书籍包括存储器(230)、文本语音转换(TTS)模块(270)和至少一个扬声器(290)。所述存储器存储文件。所述器件包括文本。所述TTS模块合成对应于文本的语音。所述至少一个扬声器输出所述语音。

Description

用于手持设备的文本语音转换
相关申请的交叉参考
这是一个非临时申请,它根据35U.S.C.§119要求2002年5月9日提交的、题目为“用于手持设备的文本语音转换(TTS)”、序号为10/146,406的非临时申请的权益,该非临时申请以引用方式包含在此。本申请也共同地涉及下述申请:序号10/154,147的律师记录(attorney docket)编号PU020112,序号10/135,151的律师记录编号PU020108和序号为10/142,406的律师记录编号PU020109,它们的题目分别为“交谈电子书籍”、“用于手持设备的语音命令和语音识别”和“用于增强的电子书籍的Mp3音频和Ttp”,它们与本申请一起共同被转让和同时被提交,其公开通过引用被包含在此。
技术领域
本发明一般地涉及手持设备,更具体而言涉及用于手持设备的文本语音转换(TTS)。
背景技术
电子书籍(也称为“Ebook”)是传统印刷的书籍(或其他印刷的材料,诸如杂志、报纸等)的电子版本,它可以使用个人计算机或使用电子书籍阅读器来被读取。不像PC或手持计算机那样,与传统的纸张书籍相比较,电子书籍阅读器提供了阅读经验(experience),同时增加了用于记录、快速导航和关键词搜索的强大电子特征。但是,这样的行为——不论它们是在PC、手持计算机或电子书籍阅读器上被执行——一般要求用户从显示器读取文本。因此,电子书籍的使用一般要求用户将他的或她的视觉注意力集中在显示器上以读取电子书籍的文本内容(例如书籍、杂志、报纸等)。
因此,具有使得用户可以不必观看显示器而吸收内容的、诸如电子书籍的手持设备是可取的和极其有利的。
发明内容
本发明、即具有文本语音转换(TTS)能力的手持设备解决了上述的问题以及现有技术的其他相关问题。
按照本发明的一个方面,提供了一种电子书籍。所述电子书籍包括存储器、文本语音转换(TTS)模块和至少一个扬声器。所述存储器存储文件。所述文件包括文本。TTS模块合成对应于文本的语音。所述至少一个扬声器输出所述语音。
按照本发明的另一个方面,提供了一种用于使用电子书籍的方法。至少一个文件被存储在电子书籍中。所述至少一个文件包括文本。对应于所述文本的语音被合成和从电子书籍输出。
附图说明
通过下面参照附图而详细说明的优选实施例,本发明的这些和其他方面、特点和优点将会变得清楚。
图1是图解按照本发明的一个说明性实施例的、可以应用本发明的计算机系统100的方框图;
图2是图解按照本发明的一个说明性实施例的、电子书籍200的方框图;
图3是图解按照本发明的一个说明性实施例的、用于使用具有文本语音转换(TTS)能力的电子书籍的方法的流程图;
图4是图解按照本发明的一个说明性实施例的、用于使用电子书籍来作为可听故事讲述器的方法的流程图;
图5是图解按照本发明的一个说明性实施例的、用于使用电子书籍来作为唤醒闹钟的方法的流程图。
具体实施方式
本发明涉及具有文本语音转换(TTS)能力的手持设备,并且涉及用于使用具有文本语音转换(TTS)能力的手持设备的方法。可以明白,本发明涉及任何类型的手持设备,其中包括但是不限于电子书籍(Ebook)、个人数字助理(PDA)等。但是,为了描述本发明,下面将说明电子书籍。
应当明白,可以以各种形式的硬件、软件、固件、专用处理器或其组合来实现本发明。优选的是,本发明被实现为硬件和软件的组合。而且,所述软件最好被实现为确实地嵌入在程序存储器上的一个应用程序。所述应用程序可以被上载到包括任何合适架构的机器上并且由该机器执行。优选的是,所述机器在包括诸如一个或多个中央处理单元(CPU)、随机存取存储器(RAM)和输入/输出(I/O)接口的计算机平台上实现。所述计算机平台也包括操作系统和微指令代码。在此描述的各种处理和功能可以是经由操作系统执行的微指令代码的一部分或应用程序的一部分(或其组合)。另外,诸如附加的数据存储器和打印机的各种其他外围设备可以连接到计算机平台。
还应当明白,因为最好以软件来实现在附图中描述的组成系统部件和方法步骤中的一些,因此在所述系统部件(或处理步骤)之间的实际连接可能依赖于本发明被编程的方式而不同。根据此处的示教,本领域内的一个普通技术人员能够考虑到本发明的这些和类似的实现方式和配置。
图1是图解按照本发明的一个说明性实施例的、可以应用本发明的计算机系统100的方框图。计算机处理系统100包括至少一个处理器(CPU)102,它经由系统总线104而工作地连接到其他部件。只读存储器(ROM)106、随机存取存储器(RAM)108、显示器适配器110、输入/输出适配器112和用户接口适配器114工作地连接到系统总线104。
显示器116通过显示器适配器110工作地连接到系统总线104。盘存储器(例如磁盘或光盘存储器)118通过输入/输出适配器112工作地连接到系统总线104。
鼠标120和键盘122通过用户接口适配器114工作地连接到系统总线104。鼠标120和键盘122用于向/从系统100输入/输出信息。
计算机系统100还包括文本语音转换(TTS)模块194和扬声器196。
图2是图解按照本发明的一个说明性实施例的、电子书籍200的方框图。电子书籍200包括通过总线201相互连接的下列元件:至少一个存储器(以下称“存储器”230);至少一个处理器(以下“处理器”240);用户输入器件250(例如键盘、小键盘和/或遥控器);显示器260;文本语音转换(TTS)模块270;扬声器290。根据此处的示教,本领域内的一个普通技术人员可以在保持本发明的精神和范围的情况下考虑出在图1和图2中分别示出的计算机系统100和电子书籍200的这些和各种其他配置。应当明白,在此使用的术语“电子书籍”指的是独立的电子书籍器件(例如电子书籍200)或在计算机系统(例如计算机系统100)中包括的电子书籍。
图3是图解按照本发明的一个说明性实施例的、用于使用具有文本语音转换(TTS)能力的电子书籍的方法的流程图。
一个或多个文件(以下称“文件”)被输入到电子书籍(步骤310)。所述文件至少包括文本。所述文件可以经由存储器(例如,软盘、紧致盘、闪速存储器等)被提供、从因特网下载等。所述文件可以是电子书籍应用文件、电子邮件文件、网页、字处理器文件等。所述文件然后被存储在电子书籍中(步骤320)。
选用地,在步骤325,向电子书籍的用户提供选择以在下述模式之间选择:严格的可视模式,其中在显示器上显示文本;严格的可听模式,其中文本被TTS模块合成并且由扬声器输出;组合的视听模式,其中文本被显示在显示器上,并且同时被TTS模块合成和由扬声器输出(260,270)。
电子书籍接收一个或多个命令(步骤330)。优选的是,所述命令对应于文件的重放。所述命令可以包括例如:用于开始合成对应于在文件中包括的文本的语音的命令,以便可听地再现所述文本;用于结束合成的命令;用于预设语音合成的开始时间和/或结束时间的命令;用于选择/改变在语音合成中使用的声音的命令;用于选择/改变合成的语音的速度的命令;对应于经过文件的导航(例如,跳过一个或多个页面、部分、章节等)的命令;等等。
对于不同声音的选择,可以在语音合成中使用许多不同类型的声音,诸如男人的声音、女人的声音、青少年的声音或甚至听起来有趣的声音(例如金花鼠(chipmunk)等)。而且,不同的声音可以用于单个文件的单个重放中。可以根据例如用户的偏好、不同的应用参数/情况和/或随机地进行特定声音的选择。
而且,应当明白,在步骤330接收的一些命令可能不对应于文本文件的重放。例如,如果诸如具有每日提醒时间表的日历功能的其他功能与电子书籍集成,则与日历功能(或任何其他功能)相关的信息可以被电子书籍接收。
所述多个命令随后用来控制具有TTS能力的电子书籍的操作(步骤340)。步骤340可以包括步骤:合成对应于文本的语音和/或显示所述文本(步骤340a)。应当明白,步骤340可以包括作用于在步骤330接收的任何类型的命令,包括支持合成对应于文本的语音和/或显示所述文本的命令以及可以被集成到电子书籍中的其他功能。
图4是图解按照本发明的一个说明性实施例的、用于使用电子书籍来作为可听故事讲述器的方法的流程图。优选的是,图4的方法用于在儿童的睡觉时间向儿童再现一个故事。但是,图4的方法可以用于成人以及儿童,并且可以在白天或晚上的任何时间被使用。
接收第一和第二输入,用于指定用以重放在电子书籍上的一个文件的开始时间和结束时间(步骤410)。接收第三输入,用于指定要重放的实际文件(步骤420)。接收第四输入,用于指定重放的声音(步骤430)。应当明白,步骤420和430可以由电子书籍在仅仅接收到第一和第二输入时随机地执行。或者,可以由用户提供所有(或数量少于总数的一些组合的)的输入。
重放在所选择的开始时间开始,包括合成对应于文件的语音以便可听地再现所述文本文件(步骤440)。选用地,可以在输出合成的语音的同时显示在文件中包括的文本。在随机或预定的时间已经过去后但是在所选择的结束时间之前,重放的音量和/或语音速度被降低(步骤450)。步骤450可以被重复预定的或随机的次数,以便递增地逐渐降低音量和/或语音速度。被降低的重放音量和/或语音速度意欲使得收听者瞌睡。重放在指定的结束时间结束(步骤460)。
图5是图解按照本发明的一个说明性实施例的、用于使用电子书籍来作为唤醒闹钟的方法的流程图。
接收第一输入,用于指定用以重放在电子书籍上的一个文件的开始时间(步骤510)。接收第二输入,用于指定要重放的实际文件(步骤520)。接收第三输入,用于指定重放的声音(步骤530)。应当明白,步骤520和530可以由电子书籍在仅仅接收到第一输入时随机地执行。或者,可以由用户提供所有(或数量少于总数的一些组合的)的输入。
重放在所选择的开始时间开始,包括合成对应于文本文件的语音以便可听地再现所述文本文件(步骤540)。选用地,可以在输出合成的语音的同时显示在文件中包括的文本。在随机或预定的时间已经过去后,重放的音量和/或语音速度被提高(步骤550)。步骤550可以被重复,以便以预定或随机的间隔递增地提高重放音量和/或语音速度,直到已经接收到停止重放输入。当已经接收到停止重放输入时重放结束(步骤560)。
因此,本发明有益地使得对于阅读不方便或不可取的应用可以使用具有TTS的电子书籍。例如,本发明可以用于在驾驶时阅读,用于向儿童可听地阅读故事,用于每日的时间提醒等等。根据此处提供的本发明的示教,本领域内的一个普通技术人员可以考虑出在保持本发明的精神和范围的同时有益地使用本发明的这些和各种其他情况。
虽然在此已经参照附图说明了示例性实施例,但是应当明白本发明不限于那些精确的实施例,并且可以在不脱离本发明的范围和精神的情况下由本领域内的一个技术人员在其中进行各种其他改变和修改。所有这样的改变和修改通常被包括在由所附的权利要求所限定的本发明的范围内。

Claims (19)

1.一种电子书籍,包括:
存储器,用于存储文件,所述文件包括文本;
文本语音转换TTS模块,用于合成对应于文本的语音;
至少一个扬声器,用于输出所述语音;
处理器,并且
其中所述电子书籍被用作睡觉时间故事讲述器,使得所述TTS模块随着时间而降低从所述TTS模块输出语音的速度。
2.按照权利要求1的电子书籍,其中所述TTS模块能够根据以随机为基础、用户指定的选择、和当前的一个文件的参数中的至少一个在语音合成时在多个声音的任何一个之间进行切换。
3.按照权利要求2的电子书籍,其中所述多个声音包括下述的至少一个:男人声音、女人声音、青少年声音和故意听起来有趣的声音。
4.按照权利要求1的电子书籍,其中所述TTS模块能够按照预定的开始时间和预定的结束时间的至少一个来合成语音。
5.按照权利要求1的电子书籍,其中所述电子书籍根据预定的开始时间或开始输入的接收来开始作为睡觉时间故事讲述器的工作。
6.按照权利要求1的电子书籍,其中所述电子书籍根据预定的结束时间或结束输入的接收来结束作为睡觉时间故事讲述器的工作。
7.按照权利要求1的电子书籍,其中,所述电子书籍被用作睡觉时间故事讲述器,使得所述处理器随着时间而降低从扬声器输出的语音的音量。
8.一种用于使用电子书籍的方法,包括步骤:
在电子书籍中存储至少一个文件,所述至少一个文件包括文本;
合成对应于所述文本的语音;以及
输出所述语音,
其中所述电子书籍被用作睡觉时间故事讲述器,使得所述合成步骤随着时间而降低输出语音的速度。
9.按照权利要求8的方法,还包括步骤:根据以随机为基础、用户指定的选择、和当前的一个文件的参数中的至少一个在语音合成时在多个声音的任何一个之间进行切换。
10.按照权利要求9的电子书籍,其中所述多个声音包括下述的至少一个:男人声音、女人声音、青少年声音和故意听起来有趣的声音。
11.按照权利要求8的方法,其中按照预定的开始时间和预定的结束时间的至少一个来执行所述合成步骤。
12.按照权利要求8的方法,其中所述电子书籍根据预定的开始时间或开始输入的接收来开始作为睡觉时间故事讲述器的工作。
13.按照权利要求8的方法,其中所述电子书籍根据预定的结束时间或结束输入的接收来结束作为睡觉时间故事讲述器的工作。
14.按照权利要求8的方法,其中所述电子书籍被用作睡觉时间故事讲述器,使得所述方法还包括随着时间而降低语音的音量的步骤。
15.一种手持设备,包括
存储器,用于存储文件,所述文件包括文本;
文本语音转换TTS模块,用于合成对应于所述文本的语音;
至少一个扬声器,用于输出所述语音,
处理器,并且
其中所述手持设备被用作睡觉时间故事讲述器,使得所述TTS模块随着时间而降低从所述TTS模块输出语音的速度。
16.按照权利要求15的手持设备,还包括显示器,用于显示所述文本,其中向手持设备的用户提供选择以在下述模式之间选择:严格的可视模式,其中在显示器上显示文本;严格的可听模式,其中文本被所述TTS模块合成并且由所述扬声器输出;以及组合的视听模式,其中文本被显示在显示器上,并且同时被所述TTS模块合成和由所述扬声器输出。
17.按照权利要求15的手持设备,其中所述TTS模块能够根据以随机为基础、用户指定的选择、和当前的一个文件的参数中的至少一个在语音合成时在多个声音的任何一个之间进行切换。
18.按照权利要求15的手持设备,其中所述TTS模块能够根据以随机为基础、用户指定的选择、和当前的一个文件的参数中的至少一个来调整输出语音的速度。
19.按照权利要求15的手持设备,其中所述手持设备具有日历功能,所述TTS模块合成包括对应于每日提醒时间表的信息的语音。
CNB038104636A 2002-05-09 2003-05-07 用于手持设备的文本语音转换 Expired - Fee Related CN100351897C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/142,406 2002-05-09
US10/142,406 US7299182B2 (en) 2002-05-09 2002-05-09 Text-to-speech (TTS) for hand-held devices

Publications (2)

Publication Number Publication Date
CN1653517A CN1653517A (zh) 2005-08-10
CN100351897C true CN100351897C (zh) 2007-11-28

Family

ID=29399891

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038104636A Expired - Fee Related CN100351897C (zh) 2002-05-09 2003-05-07 用于手持设备的文本语音转换

Country Status (9)

Country Link
US (1) US7299182B2 (zh)
EP (1) EP1504444B1 (zh)
JP (1) JP4785381B2 (zh)
KR (1) KR101022710B1 (zh)
CN (1) CN100351897C (zh)
AU (1) AU2003241378A1 (zh)
DE (1) DE60321162D1 (zh)
MX (1) MXPA04011118A (zh)
WO (1) WO2003096323A1 (zh)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004205605A (ja) * 2002-12-24 2004-07-22 Yamaha Corp 音声および楽曲再生装置およびシーケンスデータフォーマット
JP2004227468A (ja) * 2003-01-27 2004-08-12 Canon Inc 情報提供装置、情報提供方法
KR100556873B1 (ko) * 2003-07-25 2006-03-03 엘지전자 주식회사 이동 통신 단말기의 스케줄 브리핑 방법
US20060241945A1 (en) * 2005-04-25 2006-10-26 Morales Anthony E Control of settings using a command rotor
KR100724868B1 (ko) * 2005-09-07 2007-06-04 삼성전자주식회사 다수의 합성기를 제어하여 다양한 음성 합성 기능을제공하는 음성 합성 방법 및 그 시스템
JP4810343B2 (ja) * 2006-07-20 2011-11-09 キヤノン株式会社 音声処理装置およびその制御方法
US9170120B2 (en) * 2007-03-22 2015-10-27 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Vehicle navigation playback method
US8528040B2 (en) * 2007-10-02 2013-09-03 At&T Intellectual Property I, L.P. Aural indication of remote control commands
KR20090047159A (ko) * 2007-11-07 2009-05-12 삼성전자주식회사 오디오-북 재생 방법 및 장치
FR2930066A1 (fr) * 2008-04-15 2009-10-16 Radoslav Iliev Ionov Procede et dispositif appele "tabooks" de diffusion de messages a long terme
US20090303175A1 (en) * 2008-06-05 2009-12-10 Nokia Corporation Haptic user interface
US20090313020A1 (en) * 2008-06-12 2009-12-17 Nokia Corporation Text-to-speech user interface control
US20100003654A1 (en) * 2008-07-03 2010-01-07 Thompson Engineering Co. Prayer box
KR101053875B1 (ko) * 2008-07-14 2011-08-03 삼성전자주식회사 휴대 단말기와 동기화된 로봇의 이벤트 실행 방법 및 그시스템
US8990087B1 (en) * 2008-09-30 2015-03-24 Amazon Technologies, Inc. Providing text to speech from digital content on an electronic device
US20100324895A1 (en) * 2009-01-15 2010-12-23 K-Nfb Reading Technology, Inc. Synchronization for document narration
JP2010191356A (ja) * 2009-02-20 2010-09-02 Takeshi Ito 書籍音声情報提供システム
US20100225809A1 (en) * 2009-03-09 2010-09-09 Sony Corporation And Sony Electronics Inc. Electronic book with enhanced features
US8935656B2 (en) * 2009-09-09 2015-01-13 International Business Machines Corporation Communicating information in computing systems
JP5482042B2 (ja) * 2009-09-10 2014-04-23 富士通株式会社 合成音声テキスト入力装置及びプログラム
US20110205849A1 (en) * 2010-02-23 2011-08-25 Sony Corporation, A Japanese Corporation Digital calendar device and methods
US8103554B2 (en) * 2010-02-24 2012-01-24 GM Global Technology Operations LLC Method and system for playing an electronic book using an electronics system in a vehicle
US8392186B2 (en) 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
TW201142686A (en) * 2010-05-21 2011-12-01 Delta Electronics Inc Electronic apparatus having multi-mode interactive operation method
US20110313762A1 (en) * 2010-06-20 2011-12-22 International Business Machines Corporation Speech output with confidence indication
KR20110138882A (ko) * 2010-06-22 2011-12-28 삼성전자주식회사 Tv 장치 및 그의 제어 방법
US8888494B2 (en) 2010-06-28 2014-11-18 Randall Lee THREEWITS Interactive environment for performing arts scripts
US10642463B2 (en) 2010-06-28 2020-05-05 Randall Lee THREEWITS Interactive management system for performing arts productions
US9122656B2 (en) 2010-06-28 2015-09-01 Randall Lee THREEWITS Interactive blocking for performing arts scripts
US9870134B2 (en) 2010-06-28 2018-01-16 Randall Lee THREEWITS Interactive blocking and management for performing arts productions
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
CN101968805A (zh) * 2010-10-22 2011-02-09 厦门雅迅网络股份有限公司 一种提供资讯的系统和方法
CN101986369A (zh) * 2010-11-02 2011-03-16 中兴通讯股份有限公司 一种电纸书及其文档处理方法
US9268734B1 (en) * 2011-03-14 2016-02-23 Amazon Technologies, Inc. Selecting content-enhancement applications
US9424107B1 (en) 2011-03-14 2016-08-23 Amazon Technologies, Inc. Content enhancement techniques
US9477637B1 (en) 2011-03-14 2016-10-25 Amazon Technologies, Inc. Integrating content-item corrections
CN103020082B (zh) * 2011-09-23 2016-10-05 北京北大方正电子有限公司 一种阅读处理系统和方法、服务器、终端设备
US9620122B2 (en) * 2011-12-08 2017-04-11 Lenovo (Singapore) Pte. Ltd Hybrid speech recognition
US20130151955A1 (en) * 2011-12-09 2013-06-13 Mechell Williams Physical effects for electronic books
CN102495970B (zh) * 2011-12-20 2016-06-01 山西大学 会议主持系统及其实现方法
CN104035550B (zh) * 2013-03-07 2017-12-22 腾讯科技(深圳)有限公司 信息提供模式切换方法及装置
US20150112465A1 (en) * 2013-10-22 2015-04-23 Joseph Michael Quinn Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption
US20150278737A1 (en) * 2013-12-30 2015-10-01 Google Inc. Automatic Calendar Event Generation with Structured Data from Free-Form Speech
CN104966084A (zh) * 2015-07-07 2015-10-07 北京奥美达科技有限公司 一种基于ocr和tts的低视力阅读助视系统
KR20170124068A (ko) 2016-05-01 2017-11-09 (주)이노프레소 복합 휴먼 인터페이스가 구비된 전자기기
CN109375783B (zh) 2016-06-23 2022-03-11 株式会社音乐派索 具有多功能人机接口的电子设备
US10607606B2 (en) 2017-06-19 2020-03-31 Lenovo (Singapore) Pte. Ltd. Systems and methods for execution of digital assistant
CN107369462B (zh) * 2017-07-21 2020-06-26 阿里巴巴(中国)有限公司 电子书语音播放方法、装置及终端设备
CN107808007A (zh) * 2017-11-16 2018-03-16 百度在线网络技术(北京)有限公司 信息处理方法和装置
US10671251B2 (en) 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
US11443646B2 (en) 2017-12-22 2022-09-13 Fathom Technologies, LLC E-Reader interface system with audio and highlighting synchronization for digital books
CN114363691A (zh) * 2021-04-22 2022-04-15 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质
CN112995736A (zh) * 2021-04-22 2021-06-18 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质
US12008289B2 (en) 2021-07-07 2024-06-11 Honeywell International Inc. Methods and systems for transcription playback with variable emphasis

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0339316A2 (de) * 1988-04-28 1989-11-02 Deutsche Thomson-Brandt GmbH Elektrischer Wecker
US4985697A (en) * 1987-07-06 1991-01-15 Learning Insights, Ltd. Electronic book educational publishing method using buried reference materials and alternate learning levels
WO2001001373A2 (en) * 1999-06-25 2001-01-04 Discovery Communications, Inc. Electronic book with voice synthesis and recognition
CN1302398A (zh) * 1998-03-20 2001-07-04 诺福米迪亚股份有限公司 电子书籍系统

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615380A (en) * 1969-11-24 1997-03-25 Hyatt; Gilbert P. Integrated circuit computer system having a keyboard input and a sound output
JPS5664683A (en) * 1979-10-31 1981-06-01 Rhythm Watch Co Ltd Electronic time piece having alarm
JPS5694291A (en) * 1979-12-28 1981-07-30 Rhythm Watch Co Ltd Alarm announcing circuit of watch
CA1163812A (en) * 1980-02-15 1984-03-20 Shintaro Hashimoto Speech synthesizer timepiece with alarm function
JPS5742099A (en) * 1980-08-27 1982-03-09 Sharp Kk Voice informing device
JPS62222299A (ja) * 1986-03-24 1987-09-30 シャープ株式会社 音声報知装置
US5041086A (en) * 1987-12-04 1991-08-20 Pacesetter Infusion, Ltd. Clinical configuration of multimode medication infusion system
FR2692070B1 (fr) * 1992-06-05 1996-10-25 Thomson Csf Procede et dispositif de synthese vocale a vitesse variable.
US5386493A (en) * 1992-09-25 1995-01-31 Apple Computer, Inc. Apparatus and method for playing back audio at faster or slower rates without pitch distortion
EP0920207B2 (en) * 1992-12-09 2006-09-27 Sedna Patent Services, LLC Interactive terminal for television delivery system
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
US6243071B1 (en) * 1993-11-03 2001-06-05 Apple Computer, Inc. Tool set for navigating through an electronic book
JP3433532B2 (ja) * 1994-09-30 2003-08-04 日本ビクター株式会社 電子ブック装置
US5694521A (en) * 1995-01-11 1997-12-02 Rockwell International Corporation Variable speed playback system
US5771273A (en) * 1996-02-05 1998-06-23 Bell Atlantic Network Services, Inc. Network accessed personal secretary
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
US5812977A (en) * 1996-08-13 1998-09-22 Applied Voice Recognition L.P. Voice control computer interface enabling implementation of common subroutines
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US6009398A (en) * 1997-04-18 1999-12-28 U S West, Inc. Calendar system with direct and telephony networked voice control interface
IL120856A0 (en) * 1997-05-19 1997-09-30 Creator Ltd Controllable toy system operative in conjunction with a household audio entertainment player
JP2000099308A (ja) * 1998-09-28 2000-04-07 Wako Denshi Kk 電子ブックプレーヤ
US6324511B1 (en) * 1998-10-01 2001-11-27 Mindmaker, Inc. Method of and apparatus for multi-modal information presentation to computer users with dyslexia, reading disabilities or visual impairment
US6182041B1 (en) * 1998-10-13 2001-01-30 Nortel Networks Limited Text-to-speech based reminder system
US6236622B1 (en) * 1999-05-01 2001-05-22 Verilux, Inc. Lamp and alarm clock with gradually increasing light or sounds
US7110945B2 (en) * 1999-07-16 2006-09-19 Dreamations Llc Interactive book
CN1300018A (zh) * 1999-10-05 2001-06-20 株式会社东芝 书籍朗读电子机器,编辑系统,存储媒体,及信息提供系统
US6310833B1 (en) * 1999-11-30 2001-10-30 Salton, Inc. Interactive voice recognition digital clock
JP2001282281A (ja) * 2000-03-28 2001-10-12 Toshiba Corp 記憶媒体、配信方法及び音声出力装置
US6694297B2 (en) * 2000-03-30 2004-02-17 Fujitsu Limited Text information read-out device and music/voice reproduction device incorporating the same
JP2001343989A (ja) * 2000-03-31 2001-12-14 Tsukuba Seiko Co Ltd 朗読装置
US6633741B1 (en) * 2000-07-19 2003-10-14 John G. Posa Recap, summary, and auxiliary information generation for electronic books
US6876969B2 (en) * 2000-08-25 2005-04-05 Fujitsu Limited Document read-out apparatus and method and storage medium
JP2002149560A (ja) * 2000-08-28 2002-05-24 Sharp Corp 電子メール装置及び電子メールシステム
US7194071B2 (en) * 2000-12-28 2007-03-20 Intel Corporation Enhanced media gateway control protocol
US20020099552A1 (en) * 2001-01-25 2002-07-25 Darryl Rubin Annotating electronic information with audio clips
US7107533B2 (en) * 2001-04-09 2006-09-12 International Business Machines Corporation Electronic book with multimode I/O
JP2002334086A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US7020663B2 (en) * 2001-05-30 2006-03-28 George M. Hay System and method for the delivery of electronic books
JP4680429B2 (ja) * 2001-06-26 2011-05-11 Okiセミコンダクタ株式会社 テキスト音声変換装置における高速読上げ制御方法
US6838994B2 (en) * 2001-10-26 2005-01-04 Koninklijke Philips Electronics N.V. Adaptive alarm system
US20030158735A1 (en) * 2002-02-15 2003-08-21 Canon Kabushiki Kaisha Information processing apparatus and method with speech synthesis function
US20030200095A1 (en) * 2002-04-23 2003-10-23 Wu Shen Yu Method for presenting text information with speech utilizing information processing apparatus
US7109848B2 (en) * 2003-11-17 2006-09-19 Nokia Corporation Applications and methods for providing a reminder or an alert to a digital media capture device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4985697A (en) * 1987-07-06 1991-01-15 Learning Insights, Ltd. Electronic book educational publishing method using buried reference materials and alternate learning levels
EP0339316A2 (de) * 1988-04-28 1989-11-02 Deutsche Thomson-Brandt GmbH Elektrischer Wecker
CN1302398A (zh) * 1998-03-20 2001-07-04 诺福米迪亚股份有限公司 电子书籍系统
WO2001001373A2 (en) * 1999-06-25 2001-01-04 Discovery Communications, Inc. Electronic book with voice synthesis and recognition

Also Published As

Publication number Publication date
KR20040104721A (ko) 2004-12-10
DE60321162D1 (de) 2008-07-03
MXPA04011118A (es) 2005-02-14
EP1504444A1 (en) 2005-02-09
CN1653517A (zh) 2005-08-10
US7299182B2 (en) 2007-11-20
JP2005524879A (ja) 2005-08-18
AU2003241378A1 (en) 2003-11-11
KR101022710B1 (ko) 2011-03-22
JP4785381B2 (ja) 2011-10-05
EP1504444B1 (en) 2008-05-21
WO2003096323A1 (en) 2003-11-20
EP1504444A4 (en) 2005-05-18
US20030212559A1 (en) 2003-11-13

Similar Documents

Publication Publication Date Title
CN100351897C (zh) 用于手持设备的文本语音转换
US20030200858A1 (en) Mixing MP3 audio and T T P for enhanced E-book application
US20090132242A1 (en) Portable audio recording and playback system
JP2006323806A (ja) テキストを音声に変換するシステムおよび方法
WO2010133072A1 (zh) 发音评测装置及其方法
CN100514384C (zh) 有声电子书
CN1653516A (zh) 手持器件的语音命令和语音识别
KR100830689B1 (ko) 청킹을 이용한 언어학습용 멀티미디어 재생방법 및 상기 재생방법이 실행되는 프로그램이 기록된 기록매체
CN1991817A (zh) 电子邮件辅助暨文字转语音系统
CN1521657A (zh) 计算机辅助语言教学方法及其装置
CN1450446A (zh) 可携式电子装置的语言学习发音跟读系统及其方法
KR100329589B1 (ko) 음절 구분 기능을 구비한 디지털 오디오 재생 장치 및방법
TW200926085A (en) Intelligent conversion method with system for Chinese and the international phonetic alphabet (IPA)
Amelia Utilizing Balabolka to enhance teaching listening
JPS63231493A (ja) 音声規則合成装置を用いた文章読み上げ方法
KR20120110652A (ko) 전자 서적 출력 시스템
CN1770263A (zh) 语音识别系统以及方法
CN1755665A (zh) 语音文件生成系统以及方法
CN1624685A (zh) 段落式语言学习系统及其方法
JP2001228897A (ja) 音声入力装置及びその制御方法並びにプログラムコードを格納した記憶媒体
KR20020035018A (ko) 음성합성 기능을 갖는 휴대용 전자북
CN1622194A (zh) 乐音·语音再现装置和乐音·语音再现方法
KR20030036347A (ko) 전자 서적 시스템
CN1517978A (zh) 利用发音记述语言执行声音合成的终端设备
CN1474407A (zh) 一种同步播放音频与图文的设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071128

Termination date: 20170507