CN101354840A - 一种对电子书进行语音阅读控制的方法及装置 - Google Patents

一种对电子书进行语音阅读控制的方法及装置 Download PDF

Info

Publication number
CN101354840A
CN101354840A CNA2008102220710A CN200810222071A CN101354840A CN 101354840 A CN101354840 A CN 101354840A CN A2008102220710 A CNA2008102220710 A CN A2008102220710A CN 200810222071 A CN200810222071 A CN 200810222071A CN 101354840 A CN101354840 A CN 101354840A
Authority
CN
China
Prior art keywords
identifier
reading
user
link
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102220710A
Other languages
English (en)
Other versions
CN101354840B (zh
Inventor
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
X-READER TECHNOLOGY (BEIJING) Co Ltd
Original Assignee
X-READER TECHNOLOGY (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by X-READER TECHNOLOGY (BEIJING) Co Ltd filed Critical X-READER TECHNOLOGY (BEIJING) Co Ltd
Priority to CN2008102220710A priority Critical patent/CN101354840B/zh
Publication of CN101354840A publication Critical patent/CN101354840A/zh
Application granted granted Critical
Publication of CN101354840B publication Critical patent/CN101354840B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种对电子书进行语音阅读控制的方法及装置,利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;该方法包括:当获取到用户当前想要的电子书时,提供阅读类型给用户选择;根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。采用本发明,能够根据用户的选择方便、快速地找到用户想要的内容,大大提高用户的阅读便利性和阅读乐趣。

Description

一种对电子书进行语音阅读控制的方法及装置
技术领域
本发明涉及电子技术,尤其涉及一种对电子书进行语音阅读控制的方法及装置。
背景技术
目前,随着科技的进步,使得人们不仅可从传统的书籍或其他印刷的材料如报纸、杂志等来实现阅读,也可在个人电脑或其他电子装置上实现阅读。其中,在电脑或其他电子装置上阅读的书籍简称为电子书(E-book),该电子书是传统印刷的书籍或其他印刷的材料如杂志、报纸等的电子版本,人们可以在电脑或电子装置上对该电子版本进行阅读。并且,结合当今快速的网络以及当今互联网中蕴含的丰富信息资源,利用连接网络的个人电脑或电子装置来进行阅读,无形中可以使使用者拥有了许多资源。
但是,使用者通过在电脑或其他电子装置上阅读电子书基本上也都是沿袭传统的阅读习惯,即使用者单一地从显示器上阅读文本。因此,电子书的使用一般要求使用者的视觉注意力集中在显示器上以读取电子书的信息内容。而这对使用者的阅读而言,很容易造成视觉上的疲劳。因此,随着语音合成引擎技术的提高,现有技术中提出了一种解放使用者眼睛的语音合成方法,在获取到用户当前想要的某一章某一节的内容时,则该方法可包括:直接合成对应该内容的语音,之后,将该语音从耳机或扬声器中输出,并提供该语音给用户。
但是,现有的这种通过语音播放电子书的内容的方法是按照前后顺序依次播放上述电子书的所有内容,而使用者对阅读类型有不同的喜好,比如,如果使用者仅需阅读电子书中的重点或作者注时,则需要使用者在显示器上不停地按快进键,或者在众多复杂的内容中查找自己想要的阅读内容,而这显然大大浪费了使用者的时间,降低了使用者的满意度,也大大降低了用户的阅读乐趣。
发明内容
本发明提供了一种对电子书进行语音阅读控制的方法及装置,以便实现快速获取用户想要的阅读类型。
本发明所提供的一种对电子书进行语音阅读控制的方法,利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;该方法包括:
当获取到用户当前想要的电子书时,提供阅读类型给用户选择;
根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;
合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
本发明所提供的一种对电子书进行语音阅读控制的装置,包括:存储单元、阅读类型提供单元、获取单元和语音合成单元;其中,
所述存储单元用于存储电子书,该电子书中的内容被预设定的标识符所标识,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;
所述阅读类型提供单元用于获取到用户当前想要的电子书,并提供阅读类型给用户选择;
所述获取单元用于根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;
所述语音合成单元用于合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
从上述方案可以看出,本发明提供的一种对电子书进行语音阅读控制的方法及装置,利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;这样,当获取到用户当前想要的电子书时,提供阅读类型给用户选择;根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。可见,本发明通过获取该用户选择的阅读类型对应的阅读控制标识符所标识的内容,能够根据用户的选择方便、快速地找到用户想要的内容,大大提高用户的阅读便利性和阅读乐趣。
附图说明
图1为本发明实施例提供的一种对电子书进行语音阅读控制的装置的结构图;
图2为本发明实施例提供的一种对电子书进行语音阅读控制的工作流程图;
图3为本发明实施例中电子数据库中的结构框架示意图;
图4为本发明实施例中在图3所示的电子数据库中的结构框架中查找用户当前想要的内容的示意图;
图5为本发明实施例中对电子书进行语音阅读控制的具体应用流程图。
具体实施方式
本发明提供的一种对电子书进行语音阅读控制的方法,主要是利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;具体实现时,该方法包括:当获取到用户当前想要的电子书时,提供阅读类型给用户选择;根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;合成对应该阅读控制标识符所标识的内容的语音,并提供该语音,能够实现根据用户的选择方便、快速地找到用户想要的阅读类型,进而避免用户为获取自己想要的阅读类型而不停地按快进键的操作,大大提高用户的阅读乐趣。
其中,上述预定义的阅读类型可包括文章原文、作者注、读者注、链接和原文译文中的一个或其任意几个组合,而阅读控制标识符可包括:与文章原文相对应的原文标识符、与作者注相对应的作者注标识符、与读者注相对应的读者注标识符、与链接相对应的链接标识符、与原文译文相对应的译文标识符中的一个或其任意组合。比如,若阅读类型为作者注和读者注,则阅读控制标识符包括与作者注相对应的作者注标识符、与读者注相对应的读者注标识符。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
下面首先对本发明实施例提供的一种对电子书进行语音阅读控制的装置进行描述。
参见图1,图1为本发明实施例提供的一种对电子书进行语音阅读控制的装置的结构图,如图1所示,该装置包括:存储单元101、阅读类型提供单元102、获取单元103和语音合成单元104。
其中,存储单元101用于存储电子书,该电子书中的内容被预设定的标识符所标识,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符。
这里,可设置预设定的标识符由“v”+“标识内容”所构成,其中,v为小写字符,标识内容可统一使用英文单词,该英文单词可以缩写,也可不使用缩写,如文章标识符(vchapter),节标识符(vsection)等标识符,当然,也可设置标识符的其他构成方式,本发明实施例并非对此构成方式进行特殊限定。
其中,上述预定义的阅读类型可包括:文章原文、作者注(vauthornote)、读者注(vreadernote)、文章的链接(vlink)和原文译文(vtranslation,简写为vtrans)中的一个或者其任意组合;而相应地,阅读控制标识符可包括与文章原文相对应的原文标识符、与作者注相对应的作者注标识符、与读者注相对应的读者注标识符、与链接相对应的链接标识符、与原文译文相对应的译文标识符中的一个或其任意组合。其中,上述文章原文并非为整部电子书的所有内容,其可为某一本书中某一章(chapter)或某一节(section)的原文内容,本发明实施例对此并未限定。
阅读类型提供单元102用于获取到用户当前想要的电子书,并提供阅读类型给用户选择。
获取单元103用于根据该用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容。比如,若用户选择的阅读类型为:作者注(vauthornote)和读者注(vreadernote);则获取单元103用于获取对应的作者注标识符和读者注标识符所标识的内容。
语音合成单元104用于合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
其中,上述阅读控制标识符可进一步包括用于对电子书内容的重点进行标识的重点标识符(vemphasis),则获取单元103可包括:第一判断子单元1031、第一识别子单元1032和第二识别子单元1033。
其中,第一判断子单元1031用于针对用户所选择的阅读类型,判断用户当前是否选择对该阅读类型的重点进行阅读,如果是,发送第一识别通知给第一识别子单元1032,否则,继续判断用户当前是否选择对该阅读类型进行全读,在是的情况下,发送第二识别通知给第二识别子单元1033。比如,用户当前选择的阅读类型为作者注,则第一判断子单元1031判断用户当前是否选择对该作者注的重点进行阅读,如果是,发送第一识别通知给第一识别子单元1032,否则,继续判断用户当前是否选择对该作者注进行全读,在是的情况下,发送第二识别通知给第二识别子单元1033。
第一识别子单元1032用于在接收到上述第一识别通知后,在用户所选择的阅读类型中识别重点标识符,在识别到该重点标识符时,获取该重点标识符所标识的内容。
第二识别子单元1033用于在接收到上述第二识别通知后,识别该用户选择的阅读类型对应的阅读控制标识符,在识别到该阅读控制标识符时,获取该阅读控制标识符所标识的内容。比如,若用户当前选择的阅读类型为作者注,并且用户当前选择对该作者注进行全读,则直接识别作者注标识符(vauthornote),在识别到该作者注标识符时,获取该作者注标识符所标识的内容。
优选地,若用户选择的阅读类型为链接,则相应地,阅读控制标识符为与该链接相对应的链接标识符,其中,该链接标识符对应链接文件地址和链接文件接收的条件值(vlinkvalue),其中,所述链接文件接收的条件值可包括表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识。比如,当vlinkvalue=0时,则确定当前不需要将所述链接文件地址中的文本内容合成语音,当vlinkvalue为除0外的任意一个数值时,则确定当前需要将所述链接文件地址中的文本内容合成语音,则获取单元103可进一步包括:获取子单元1034和第二判断子单元1035。
其中,获取子单元1034用于在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值。
第二判断子单元1035用于判断该条件值当前为第一标识还是第二标识,如果是第一标识,获取所述链接文件地址中的文本内容,并执行第一判断子单元1031判断用户当前选择的对链接文件地址中的文本内容的重点进行阅读的操作,否则,结束当前流程。
当然,优选地,若第二判断子单元1035在判断出该条件值当前为第二标识时,则还可继续判断用户当前是否还选择其他的阅读类型,在是的情况下,执行第一判断子单元1031判断是否对用户选择的其他的阅读类型的重点进行阅读的操作。
比如,若获取子单元1034在电子书内容中识别出的当前链接标识符为:<vlink=“http://www.xxx.com/music/test01.txt”;vlinkvalue=0.5>,则可以看出该链接标识符对应的链接文件地址为http://www.xxx.com/music/test01.txt,而该链接标识符对应的链接文件接收的条件值vlinkvalue为0.5,若上述采用当vlinkvalue=0时,确定当前不需要将所述链接文件地址中的文本内容合成语音,当vlinkvalue为除0外的任意一个数值时,确定当前需要将所述链接文件地址中的文本内容合成语音的规则,则因为vlinkvalue=0.5,可确定出当前需要将http://www.xxx.com/music/test01.txt地址中的文本内容合成语音。
优选地,本实施例中,上述预设定的标识符除了包括阅读控制标识符之外,还可包括表示需要合成的语音所具有的特征信息的语音合成效果标识符;其中,语音合成单元104可包括:第三判断子单元1041、确定子单元1042和语音合成子单元1043。
其中,第三判断子单元1041用于判断阅读控制标识符所标识的内容中是否存在语音合成效果标识符,如果是,则发送确定通知给确定子单元1042。优选地,针对该阅读控制标识符所标识的内容中不存在语音合成效果标识符或者对应该阅读控制标识符所标识的内容中除语音合成效果标识符所标识的内容之外的其他内容,则可以按照预先设定的某一固定的语音特征合成该内容对应的语音,如可以按照之前朗读文本的语音特征合成对应该内容的语音等。
确定子单元1042用于接收到所述确定通知后,确定该语音合成效果标识符所表示的需要合成的语音的特征信息。优选地,该特征信息可以为要合成的语音的语速、音量、发话者的类别等信息。
语音合成子单元1043用于根据确定子单元1042确定的特征信息,合成对应该语音合成效果标识符所标识的内容的语音,并提供该语音。比如,若特征确定子单元1042确定出的特征信息为:一个30岁的男人的声音,则语音合成子单元1043利用一个30岁的男人的声音将所述语音合成效果标识符所标识的内容播放出来,并提供该语音给用户。
此外,为便于用户检索到自身想要的电子书,优选地,存储单元101可包括:图书类型确定子单元1011和存储子单元1012。
其中,图书类型确定子单元1011用于确定该标识后的电子书所属的图书类型。
存储子单元1012用于利用预先设置的控制键将标识后的电子书存储到该确定的图书类型所对应的存储空间中。
上述阅读类型提供单元102可包括内容获取子单元1021和阅读类型提供子单元1022。
其中,内容获取子单元1021用于利用预先设置的控制键在用户当前想要的电子书所属的图书类型对应的存储空间中获取到用户当前想要的电子书。而阅读类型提供子单元1022则用于提供阅读类型给用户选择。
需要说明的是,本发明实施例中,对电子书进行语音阅读控制的装置内部中的各个单元可以是物理功能单元,也可以是软件功能单元,并且各个单元还可进行细分或进行合并,具体实现时,本领域普通技术人员可根据实际情况进行处理,此处不再一一列举。
以上对本发明实施例提供的一种对电子书进行语音阅读控制的装置进行了描述,下面将本发明实施例提供的一种对电子书进行语音阅读控制的方法进行详细描述。
参见图2,图2为本发明实施例提供的一种对电子书进行语音阅读控制的工作流程图,如图2所示,该流程包括以下步骤:
步骤201,利用预设定的标识符对电子书的内容进行标识。
这里,可设置预设定的标识符由“v”和“标识内容”所构成,其中,v为小写字符,标识内容可统一使用英文单词,该英文单词可以缩写,也可不使用缩写,如用于标识文章节的节标识符(vsection)、用于标识内容重点的重点标识符(vemphasis)等。
这里,上述预设定的标识符可包括与预定义的阅读类型相对应的阅读控制标识符。其中,预定义的阅读类型可包括预定义的阅读类型包括文章原文、作者注、读者注、链接和原文译文中的一个或其任意组合,相应地,阅读控制标识符包括:与文章原文相对应的原文标识符、与作者注相对应的作者注标识符、与读者注相对应的读者注标识符、与链接相对应的链接标识符、与原文译文相对应的译文标识符中的一个或其任意组合。比如,若阅读类型为作者注和读者注,则阅读控制标识符包括与作者注相对应的作者注标识符、与读者注相对应的读者注标识符。
本实施例中,可预先对阅读控制标识符所包含的各个具体标识符进行定义,其中,定义后的阅读控制标识符具体可包括:用于标识作者注的作者注标识符(vauthornote)、用于标识读者注的读者注标识符(vreadernote)、用于标识原文译文的译文标识符(vtranslation,简写为vtrans)、用于标识文章节的节标识符(vsection)、用于标识链接的链接标识符(vlink)。
其中,链接标识符对应链接文件地址和链接文件接收的条件值(vlinkvalue),并且,该链接文件接收的条件值至少包括表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识,这样根据当前的条件值可以判断当前是否需要将所述链接文件地址中的文本内容合成语音。
需要说明的是,上述作者注标识符、读者注标识符、或者译文标识符可成对使用。并且,可嵌套在节标识符所标识的内容中。并且,上述预设定的标识符还可包括需要合成的语音所具有的特征信息的语音合成效果标识符,这样,便于合成有特色的语音效果,具体在下面进行描述。
步骤202,将标识后的电子书的内容进行存储。
优选地,可将上述标识后的电子书统一存储在预设定的存储介质的根目录如C盘或D盘等的第一级目录“_book”目录下,其中,上述将标识后的电子书的内容进行存储具体实现时,可先确定该标识后的电子书所属的图书类型,之后,将标识后的电子书存储到该确定的图书类型所对应的存储空间中。其中,将标识后的电子书存储的具体框架可参见图3。如图3所示,该图书分类和内容组织模式为“存储介质的根目录book目录-图书分类目录-内容文件”,比如,当前电子书所属的图书类型为科幻小说,则将上述标识后的电子书存储在科幻小说对应的存储空间中。
步骤203,获取用户想要的电子书。
这里,若上述将标识后的电子书存储在图3所示的框架中,则在当用户想要获取某一电子书的内容时,如用户想要获取科幻小说异形3中第二章中的内容,则可利用预先设置的控制键在科幻小说所属的存储空间中查找科幻小说异形3中第二章,其中,该控制键可包括向上、向下、向左、向右、确认/进入,以及返回/退出等各种具有不同功能的键。比如,若当前在查找用户想要的电子书时所在的位置为科幻小说,则利用确认/进入键直接进入到科幻小说,之后,再利用向下键即可在科幻小说所对应的存储空间中查找到科幻小说异形3,其中,在如图3所示的框架中查找用户当前想要的电子书的示意图可参见图4所示。
需要说明的是,为体现出后续的语音效果,可将获取到的用户想要的电子书暂存到缓存器中,如将在科幻小说所对应的存储空间中获取到的用户想要的科幻小说异形3的内容暂存到缓存器中,之后,执行步骤204。当然,本实施例中,用户也可利用预先设置的控制键查找某一本电子书或该电子书中的某一节的内容,具体实现与上述所描述的类似,这里不再赘述。
步骤204,提供阅读类型给用户选择。
步骤205,根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容。
本实施例中,若用户选择的阅读类型为作者注,则该用户选择的阅读类型对应的阅读控制标识符为作者注标识符,在电子书内容中识别作者注标识符,在识别到该作者注标识符时,获取该作者注标识符所标识的内容。
步骤206,合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
至此,实现了对电子书进行语音阅读控制的操作,如此,可实现根据用户的选择方便、快速地播放需要的阅读类型,进而避免用户为获取自己想要的阅读内容而需要在众多复杂的内容所执行的一些浪费时间的操作,大大提高用户的阅读便利性和阅读乐趣。
为使本发明实施例更加清楚,下面对本发明实施例的具体应用进行详细描述。
参见图5,图5为本发明实施例中对电子书进行语音阅读控制的具体应用流程图。本实施例中,用户选择的阅读类型可以包括:文章原文、作者注、读者注、原文翻译中一个或其任意组合。其中,文章原文并非为整部文章的原文,而是针对用户想要的某一部分的内容所对应的文章原文。比如,用户当前想要的电子书为《资治通鉴》,则用户当前选择的阅读类型可以包括:《资治通鉴》中某一节中的文言文内容(相当于文章原文)、《资治通鉴》中某一节中的作者注等。如图5所示,该流程包括以下步骤:
步骤501,利用预设定的标识符对电子书的内容进行标识。
上述预设定的标识符包括阅读控制标识符,其中,该阅读控制标识符包括上述步骤201定义的各个具体标识符之外,还可包括针对阅读类型所进行的阅读方式的标识符,如包括用于对电子书内容中的重点进行标识的重点标识符(vemphasis),并且,该重点标识符可嵌套在节标识符,或者作者注标识符,或者读者注标识符所标识的内容中。
此外,上述预设定的标识符不仅仅包括阅读控制标识符,还包括语音合成效果标识符。其中,该语音合成效果标识符包括表示需要合成的语音所具有的特征信息的语音合成效果标识符,即对合成语音的效果进行标识的标识符,可包括:用于对电子书的内容中角色人物所说的语句进行标识的语句标识符(vsay),和用于对电子书的内容中的要进行合成的单词进行标识的单词标识符(vword)。
具体地,上述语句标识符可包括:用于对电子书的内容中角色人物所用的语言进行标识的语言标识符(vsaylanguage,简写为vsaylang),如vsaylang=CN,则表示电子书的内容中角色人物的语言为汉语;用于对电子书的内容中角色人物所用的语速进行标识的语速标识符(vsayspeed);用于对电子书内容中角色人物的角色特征进行标识的角色标识符(vsayrole),如vsayrole=CN-M-30表示电子书内容中角色人物角色为一个30岁的中国男人;用于对电子书的内容中角色人物的语调进行标识的语调标识符(vsayfrequence,简写为vsayfreq),用于对电子书的内容中角色人物的发音进行标识的发音标识符(vsayeffect),如vsayeffect可包括表示该合成后的语音是机器人声,还是机场广播发声效果等;和用于对电子书的内容中角色人物的音量进行标识的音量标识符(vsayvolume)中的任意一个组合。
而单词标识符vword包括:用于对待进行语音合成的词的类型进行标识的词类型标识符(vwordclass),如vwordclass用来标识该词的读法是数字、电话号码、日期、拼音、姓名等不同的类型;用于对待进行语音合成的的多音字的发音进行标识的发音标识符(vwordpronounce,简写为vwordpron),该发音标识符主要用于标识中文单词;用于在待进行的语音合成过程中词的合成速度进行标识的速度标识符(vwordspeed),用于对待进行的语音合成过程中词的合成语言进行标识的语言标识符(vwordlanguage,简写为vwordlang),和用于对待进行语音合成过程中词的音效进行标识的音效标识符(vwordeffect)的任意一种组合。
步骤502,将标识后的电子书进行存储。
步骤503,当获取到用户当前想要的电子书时,提供阅读类型给用户选择。
优选地,若上述获取到用户当前想要的电子书为《资治通鉴》,则利用预先设置的控制键可在《资治通鉴》所属的图书类型对应的存储空间中查找《资治通鉴》,具体可参见图4所示的检索示意图。需要说明的是,为体现出后续的语音效果,可将获取到的用户当前想要的电子书暂存到缓存器中如将获取到的用户当前想要的电子书《资治通鉴》的内容暂存到缓存器中,之后,提供阅读类型给用户选择,若用户选择的阅读类型为《资治通鉴》的链接,则用户选择的阅读类型对应的阅读控制标识符为链接标识符,之后,执行步骤504。
步骤504,在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值。
这里,链接标识符对应链接文件地址和链接文件接收的条件值,其中,所述链接文件接收的条件值表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识。
步骤505,判断上述获取的链接文件接收的条件值当前为第一标识还是第二标识,如果是第一标识,执行步骤506,否则,执行步骤509。
本实施例中,也可在判断出上述获取的链接文件接收的条件值当前为第二标识时,直接结束当前流程,具体情况可根据用户的选择来决定。
步骤506,获取所述链接文件地址中的文本内容,判断该文本内容中当前是否存在语音合成效果标识符,如果是,执行步骤507,否则,执行步骤508。
步骤507,根据该语音合成效果标识符合成对应该语音合成效果标识符所标识的内容的语音,并提供该语音。至此,结束当前据链接标识符实现电子书阅读的流程。
其中,上述步骤可为先确定该语音合成效果标识符所表示的需要合成的语音的特征信息,之后,根据该确定的特征信息,合成对应该语音合成效果标识符所标识的内容的语音。具体地,假如上述链接文件地址中的文本内容为《资治通鉴》第二章第一节的内容,并且,该内容中存在语音合成效果标识符所标识的内容,则识别该语音合成效果标识符,若该语音合成效果标识符为vsayrole=CN-M-30,即<vsayrole=CN-M-30>资治通鉴》第二章第一节的内容</vsay>,则合成对应该《资治通鉴》第二章第一节的内容的语音,该合成后的语音为一个30岁的男人利用中文阅读《资治通鉴》第二章第一节的内容的语音。
步骤508,按照预先设定的某一固定的语音特征合成对应该内容的语音,并提供该语音。
具体地,上述预先设定的某一固定的语音特征可为:按照合成上述用户当前想要的内容之前的朗读文本的语音特征合成对应该内容的语音,或将合成对应该内容的语音固定设置为一个中国50岁的男人朗读电子书内容的语音等。这里,也可在判断出该文本内容中当前存在语音合成效果标识符所标识的文本内容时,针对该文本内容中除语音合成效果标识符所标识的文本内容之外的其他文本内容,执行步骤508。比如,若上述预先设定的某一固定的语音特征可为:按照合成上述用户当前想要的内容之前朗读文本的语音特征合成该内容对应的语音,则在判断出该文本内容中当前存在语音合成效果标识符所标识的文本内容时,利用之前朗读文本的语音朗读该文本内容中除语音合成效果标识符所标识的文本内容之外的其他文本内容。至此,结束根据链接标识符实现电子书阅读的流程。
步骤509,判断用户当前是否还选择其他的阅读类型,在是的情况下,针对该用户所选择的其他的阅读类型,判断用户当前是否选择对该阅读类型中的重点进行阅读,如果是,执行步骤510,否则,执行步骤511。
步骤510,在用户所选择的阅读类型中识别重点标识符,在识别到该重点标识符时,获取该重点标识符所标识的内容,之后,执行步骤513。
优选地,在上述步骤506中获取所述链接文件地址中的文本内容后,还可返回继续执行步骤510,其中,步骤510具体可为:判断用户当前选择的对链接文件地址中的文本内容的重点进行阅读。
步骤511,判断用户当前是否选择对该阅读类型进行全读,在是的情况下,执行步骤512,否则,在缓存器中删除该存储的用户当前想要的内容(电子书),结束当前流程。
步骤512,识别该用户选择的阅读类型对应的阅读控制标识符,在识别到该阅读控制标识符时,获取该阅读控制标识符所标识的内容,之后,执行步骤513。
步骤513,判断该阅读控制标识符所标识的内容中是否存在语音合成效果标识符,如果是,返回执行步骤507,否则,执行步骤514。
这里,如果在用户所选择的阅读类型中识别重点标识符,在识别到该重点标识符时,获取该重点标识符所标识的内容之后,执行步骤513,则步骤513具体可为判断该重点标识符所标识的内容中是否存在语音合成效果标识符,如果是,返回执行步骤507,否则,执行步骤514。如果在识别该用户选择的阅读类型对应的阅读控制标识符,在识别到该阅读控制标识符时,获取该阅读控制标识符所标识的内容之后,执行步骤513,则步骤513具体可为:判断该用户选择的阅读类型对应的阅读控制标识符所标识的内容中是否存在语音合成效果标识符,如果是,返回执行步骤507,否则,执行步骤514。
步骤514,按照预先设定的某一固定的语音特征合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
这里,也可在判断出该阅读控制标识符所标识的内容中当前存在语音合成效果标识符所标识的内容时,针对该阅读控制标识符所标识的内容中除语音合成效果标识符所标识的内容之外的其他内容,执行步骤514。比如,若上述预先设定的某一固定的语音特征可为:按照合成上述用户当前想要的内容对应的之前朗读文本的语音特征合成对应的语音,则在判断出该阅读控制标识符所标识的内容中当前存在语音合成效果标识符所标识的内容时,利用之前朗读文本的语音朗读该阅读控制标识符所标识的内容中除语音合成效果标识符所标识的内容之外的其他内容。
可见,本发明实施例中提供的一种对电子书进行语音阅读控制的方法,利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;该方法包括:当获取到用户当前想要的电子书时,提供阅读类型给用户选择;根据该用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;合成对应该阅读控制标识符所标识的内容的语音,并提供该语音,能够根据用户的选择方便、快速地找到用户想要的内容,大大提高用户的阅读便利性和阅读乐趣。。
需要说明的是,上述实施例都是利用控制键在图书分类目录中查找用户想要的内容,应用中,也可在内容阅读中或者在章文件浏览中根据用户的需要获取用户想要的内容,具体可与图4中查找用户当前想要的内容的操作类似,这里不再赘述。
还需要说明的是,为便于用户获知当前电子书的属性信息,上述预设定的标识符除了包括阅读控制标识符,语音合成效果标识符之外,还可包括信息标注的标识符,其中,定义后的信息标注的标识符为对电子书的属性信息进行标识的标识符,具体构成可包括:用于标识电子书分类的类型标识符(vclassfication),其中,如果该电子书可分为多个不同的类,则不同类之间用逗号“,”进行分开。如《vclassfication》《圣经》,新约《/vclassfication》。以及用于标识电子书名的书名标识符(vbookname)、标识电子书原作者的作者标识符(vauthor)、标识电子书版权的版权信息标识符vcopyright、标识电子书摘要的摘要标识符(vsummary)和标识电子书一章的章标识符(vchapter)。其中,类型标识符、书名标识符、作者标识符、版权信息标识符、摘要标识符和章标识符都可成对使用,如<vbookname>马太福音</vbookname>,<vauthor>使徒马太</vauthor>等,采用这种信息标注的标识符,可以便于使用者尽快获知该电子书的属性信息,具体操作可与采用上述的阅读控制标识符,语音合成效果标识符所对应的操作,这里不再赘述。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1、一种对电子书进行语音阅读控制的方法,其特征在于,利用预设定的标识符对电子书的内容进行标识,并将标识后的电子书进行存储,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;该方法包括:
当获取到用户当前想要的电子书时,提供阅读类型给用户选择;
根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;
合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
2、根据权利要求1所述的方法,其特征在于,所述预定义的阅读类型包括文章原文、作者注、读者注、链接和原文译文中的一个或其任意组合;
所述阅读控制标识符包括:与文章原文相对应的原文标识符、与作者注相对应的作者注标识符、与读者注相对应的读者注标识符、与链接相对应的链接标识符、与原文译文相对应的译文标识符中的一个或其任意组合。
3、根据权利要求2所述的方法,其特征在于,所述阅读控制标识符还包括用于对电子书内容的重点进行标识的重点标识符;
所述根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容包括:
针对用户所选择的阅读类型,判断用户当前是否选择对该阅读类型的重点进行阅读,如果是,在用户所选择的阅读类型中识别重点标识符,在识别到该重点标识符时,获取该重点标识符所标识的内容,否则,继续判断用户当前是否选择对该阅读类型进行全读,在是的情况下,识别该用户选择的阅读类型对应的阅读控制标识符,在识别到该阅读控制标识符时,获取该阅读控制标识符所标识的内容。
4、根据权利要求2所述的方法,其特征在于,若用户选择的阅读类型为链接,则所述阅读控制标识符为与所述链接相对应的链接标识符,所述链接标识符对应链接文件地址和链接文件接收的条件值,其中,所述链接文件接收的条件值表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识;
所述根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容为:在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值,判断该条件值当前为第一标识还是第二标识,如果是第一标识,获取所述链接文件地址中的文本内容,否则,结束当前流程。
5、根据权利要求3所述的方法,其特征在于,若用户选择的阅读类型为链接,则所述阅读控制标识符为与所述链接对应的链接标识符,所述链接标识符对应链接文件地址和链接文件接收的条件值,其中,所述链接文件接收的条件值表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识;
所述根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容为:在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值,判断该条件值当前为第一标识还是第二标识,如果是第一标识,获取所述链接文件地址中的文本内容,否则,判断用户当前是否还选择其他的阅读类型,在是的情况下,执行判断是否对该选择的其他的阅读类型的重点进行阅读的操作。
6、根据权利要求1所述的方法,其特征在于,所述预设定的标识符还包括表示需要合成的语音所具有的特征信息的语音合成效果标识符;
所述合成对应该阅读控制标识符所标识的内容的语音包括:判断该阅读控制标识符所标识的内容中是否存在语音合成效果标识符,如果是,则确定该语音合成效果标识符所表示的需要合成的语音的特征信息,根据该确定的特征信息,合成对应该语音合成效果标识符所标识的内容的语音。
7、根据权利要求1所述的方法,其特征在于,所述将标识后的电子书进行存储包括:
确定该标识后的电子书所属的图书类型;
利用预先设置的控制键将标识后的电子书存储到对应该确定的类型的存储空间中;
所述获取到用户当前想要的电子书包括:
利用预先设置的控制键在用户当前想要的电子书所属的图书类型对应的存储空间中获取用户当前想要的电子书。
8、一种对电子书进行语音阅读控制的装置,其特征在于,该装置包括:存储单元、阅读类型提供单元、获取单元和语音合成单元;其中,
所述存储单元用于存储电子书,该电子书中的内容被预设定的标识符所标识,其中,所述预设定的标识符包括与预定义的阅读类型相对应的阅读控制标识符;
所述阅读类型提供单元用于获取到用户当前想要的电子书,并提供阅读类型给用户选择;
所述获取单元用于根据用户选择的阅读类型,获取对应的阅读控制标识符所标识的内容;
所述语音合成单元用于合成对应该阅读控制标识符所标识的内容的语音,并提供该语音。
9、根据权利要求8所述的装置,其特征在于,所述阅读控制标识符还包括用于对电子书内容的重点进行标识的重点标识符,所述获取单元包括:第一判断子单元、第一识别子单元和第二识别子单元;其中,
所述第一判断子单元用于针对用户所选择的阅读类型,判断用户当前是否选择对该阅读类型的重点进行阅读,如果是,发送第一识别通知给所述第一识别子单元,否则,继续判断用户当前是否选择对该阅读类型进行全读,在是的情况下,发送第二识别通知给所述第二识别子单元;
所述第一识别子单元用于接收到所述第一识别通知后,在用户所选择的阅读类型中识别重点标识符,在识别到该重点标识符时,获取该重点标识符所标识的内容;
所述第二识别子单元用于接收到所述第二识别通知后,识别该用户选择的阅读类型对应的阅读控制标识符,在识别到该阅读控制标识符时,获取该阅读控制标识符所标识的内容。
10、根据权利要求9所述的装置,其特征在于,若用户选择的阅读类型为链接,则所述阅读控制标识符为与所述链接相对应的链接标识符,所述链接标识符对应链接文件地址和链接文件接收的条件值,其中,所述链接文件接收的条件值包括表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识;所述获取单元还包括:
获取子单元,用于在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值;
第二判断子单元,用于判断该条件值当前为第一标识还是第二标识,如果是第一标识,获取所述链接文件地址中的文本内容,并执行所述第一判断子单元判断用户当前选择的对链接文件地址中的文本内容的重点进行阅读的操作,否则,结束当前流程。
11、根据权利要求8所述的装置,其特征在于,若用户选择的阅读类型为链接,则所述阅读控制标识符为所述链接对应的链接标识符,所述链接标识符对应链接文件地址和链接文件接收的条件值,其中,所述链接文件接收的条件值包括表示当前需要将所述链接文件地址中的文本内容合成语音的第一标识和表示当前不需要将所述链接文件地址中的文本内容合成语音的第二标识;所述获取单元还包括:
获取子单元,用于在电子书内容中识别链接标识符,获取该链接标识符对应的链接文件接收的条件值;
第二判断子单元,用于判断该条件值当前为第一标识还是第二标识,如果是第一标识,获取所述链接文件地址中的文本内容,并执行所述第一判断子单元判断用户当前选择的对链接文件地址中的文本内容的重点进行阅读的操作,否则,继续判断用户当前是否还选择其他的阅读类型,在是的情况下,执行第一判断子单元判断是否对用户选择的其他的阅读类型的重点进行阅读的操作。
12、根据权利要求8所述的装置,其特征在于,所述预设定的标识符还包括表示需要合成的语音所具有的特征信息的语音合成效果标识符;所述语音合成单元包括:第三判断子单元、确定子单元和语音合成子单元;其中,
所述第三判断子单元用于判断阅读控制标识符所标识的内容中是否存在语音合成效果标识符,如果是,则发送确定通知给所述确定子单元;
所述确定子单元用于接收到所述确定通知后,确定该语音合成效果标识符所表示的需要合成的语音的特征信息;
所述语音合成子单元用于根据所述确定子单元确定的特征信息,合成对应该语音合成效果标识符所标识的内容的语音。
CN2008102220710A 2008-09-08 2008-09-08 一种对电子书进行语音阅读控制的方法及装置 Expired - Fee Related CN101354840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102220710A CN101354840B (zh) 2008-09-08 2008-09-08 一种对电子书进行语音阅读控制的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102220710A CN101354840B (zh) 2008-09-08 2008-09-08 一种对电子书进行语音阅读控制的方法及装置

Publications (2)

Publication Number Publication Date
CN101354840A true CN101354840A (zh) 2009-01-28
CN101354840B CN101354840B (zh) 2011-09-28

Family

ID=40307634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102220710A Expired - Fee Related CN101354840B (zh) 2008-09-08 2008-09-08 一种对电子书进行语音阅读控制的方法及装置

Country Status (1)

Country Link
CN (1) CN101354840B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012905A (zh) * 2010-09-07 2011-04-13 郭恒勋 可作学习平台的手机、可定位的媒体播放器及其处理方法
CN103098124A (zh) * 2010-09-14 2013-05-08 索尼公司 用于文本到语音转换的方法和系统
CN103329088A (zh) * 2011-01-27 2013-09-25 惠普发展公司,有限责任合伙企业 具有可变路径的电子书
CN103678416A (zh) * 2012-09-26 2014-03-26 杨裴生 网络新闻及信息的阅读互动系统
CN104361132A (zh) * 2014-12-09 2015-02-18 夏武 一种语言数据处理方法及装置
CN105745684A (zh) * 2013-12-20 2016-07-06 谷歌公司 针对电子书的基于实体的摘要
CN108305611A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 文本转语音的方法、装置、存储介质和计算机设备
CN109065019A (zh) * 2018-08-27 2018-12-21 北京光年无限科技有限公司 一种面向智能机器人的故事数据处理方法及系统
CN109686142A (zh) * 2018-12-29 2019-04-26 北京智能管家科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN109994000A (zh) * 2019-03-28 2019-07-09 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质
CN110060659A (zh) * 2019-04-26 2019-07-26 贾铮 电子书语音播报设备及方法
CN110797001A (zh) * 2018-07-17 2020-02-14 广州阿里巴巴文学信息技术有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN111401059A (zh) * 2020-03-16 2020-07-10 深圳市子瑜杰恩科技有限公司 小说朗读的方法
CN111667815A (zh) * 2020-06-04 2020-09-15 上海肇观电子科技有限公司 用于文本到语音转换的方法、设备、芯片电路和介质
CN114579015A (zh) * 2022-02-28 2022-06-03 掌阅科技股份有限公司 电子书的控制方法、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2639955Y (zh) * 2003-04-18 2004-09-08 王顺迁 智能交互式电子书系统
CN2669291Y (zh) * 2003-08-14 2005-01-05 蒋治国 电子语音图书
CN2708419Y (zh) * 2004-06-15 2005-07-06 蒋治国 一种电子语音图书
CN2821736Y (zh) * 2005-06-30 2006-09-27 四川长虹朝华信息产品有限责任公司 一种自动识别书册和页码的发音书籍

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012905A (zh) * 2010-09-07 2011-04-13 郭恒勋 可作学习平台的手机、可定位的媒体播放器及其处理方法
CN102012905B (zh) * 2010-09-07 2016-10-26 郭恒勋 可作学习平台的手机、可定位的媒体播放处理方法及其装置
CN103098124B (zh) * 2010-09-14 2016-06-01 索尼公司 用于文本到语音转换的方法和系统
CN103098124A (zh) * 2010-09-14 2013-05-08 索尼公司 用于文本到语音转换的方法和系统
CN103329088B (zh) * 2011-01-27 2018-03-13 企业服务发展公司有限责任合伙企业 具有可变路径的电子书
US9557895B2 (en) 2011-01-27 2017-01-31 Hewlett Packard Enterprise Development Lp Electronic book with changeable paths
CN103329088A (zh) * 2011-01-27 2013-09-25 惠普发展公司,有限责任合伙企业 具有可变路径的电子书
CN103678416A (zh) * 2012-09-26 2014-03-26 杨裴生 网络新闻及信息的阅读互动系统
CN105745684A (zh) * 2013-12-20 2016-07-06 谷歌公司 针对电子书的基于实体的摘要
CN104361132B (zh) * 2014-12-09 2017-09-22 夏武 一种语言数据处理方法及装置
CN104361132A (zh) * 2014-12-09 2015-02-18 夏武 一种语言数据处理方法及装置
CN108305611A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 文本转语音的方法、装置、存储介质和计算机设备
CN110797001A (zh) * 2018-07-17 2020-02-14 广州阿里巴巴文学信息技术有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN110797001B (zh) * 2018-07-17 2022-04-12 阿里巴巴(中国)有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN109065019A (zh) * 2018-08-27 2018-12-21 北京光年无限科技有限公司 一种面向智能机器人的故事数据处理方法及系统
CN109686142A (zh) * 2018-12-29 2019-04-26 北京智能管家科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN109994000B (zh) * 2019-03-28 2021-10-19 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质
CN109994000A (zh) * 2019-03-28 2019-07-09 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质
CN110060659A (zh) * 2019-04-26 2019-07-26 贾铮 电子书语音播报设备及方法
CN111401059A (zh) * 2020-03-16 2020-07-10 深圳市子瑜杰恩科技有限公司 小说朗读的方法
CN111667815A (zh) * 2020-06-04 2020-09-15 上海肇观电子科技有限公司 用于文本到语音转换的方法、设备、芯片电路和介质
CN111667815B (zh) * 2020-06-04 2023-09-01 上海肇观电子科技有限公司 用于文本到语音转换的方法、设备、芯片电路和介质
CN114579015A (zh) * 2022-02-28 2022-06-03 掌阅科技股份有限公司 电子书的控制方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN101354840B (zh) 2011-09-28

Similar Documents

Publication Publication Date Title
CN101354840B (zh) 一种对电子书进行语音阅读控制的方法及装置
US9576580B2 (en) Identifying corresponding positions in different representations of a textual work
JP5671557B2 (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
US8352272B2 (en) Systems and methods for text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US20100082328A1 (en) Systems and methods for speech preprocessing in text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
CN105279227B (zh) 同音词的语音搜索处理方法及装置
JP2000081892A (ja) 効果音付加装置および効果音付加方法
US9613641B2 (en) Identifying corresponding positions in different representations of a textual work
CN102081634A (zh) 语音检索装置和语音检索方法
US8200485B1 (en) Voice interface and methods for improving recognition accuracy of voice search queries
JP2011076566A (ja) 情報処理装置、端末装置、サーバ装置、通信システム、表示制御方法、プログラム、およびコンピュータ読取り可能な記録媒体
KR20080083290A (ko) 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치
US20140278401A1 (en) Identifying corresponding positions in different representations of a textual work
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JP2002297667A (ja) 文書閲覧装置
JP2003296352A (ja) 情報配信装置、情報提供装置、およびプログラム
JP2002304407A (ja) プログラム及び情報処理装置
JP5713775B2 (ja) 楽曲検索装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110928

Termination date: 20150908

EXPY Termination of patent right or utility model