CN107369462A - 电子书语音播放方法、装置及终端设备 - Google Patents

电子书语音播放方法、装置及终端设备 Download PDF

Info

Publication number
CN107369462A
CN107369462A CN201710601433.6A CN201710601433A CN107369462A CN 107369462 A CN107369462 A CN 107369462A CN 201710601433 A CN201710601433 A CN 201710601433A CN 107369462 A CN107369462 A CN 107369462A
Authority
CN
China
Prior art keywords
audio
content
book
ebook
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710601433.6A
Other languages
English (en)
Other versions
CN107369462B (zh
Inventor
董明舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Alibaba Literature Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Alibaba Literature Information Technology Co Ltd filed Critical Guangzhou Alibaba Literature Information Technology Co Ltd
Priority to CN201710601433.6A priority Critical patent/CN107369462B/zh
Publication of CN107369462A publication Critical patent/CN107369462A/zh
Priority to PCT/CN2018/096162 priority patent/WO2019015613A1/zh
Application granted granted Critical
Publication of CN107369462B publication Critical patent/CN107369462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Abstract

本发明实施例提供一种电子书语音播放方法、装置及终端设备,其中,根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。通过本发明实施例,使得用户能够获得较好的“听书”体验。

Description

电子书语音播放方法、装置及终端设备
技术领域
本发明实施例涉及电子书数据处理技术领域,尤其涉及一种电子书语音播放方法、装置及终端设备。
背景技术
电子书是利用计算机技术将文字、图片、声音、影像等信息内容数字化的出版物。随着互联网技术应用的越来越广泛,传统的纸质阅读方式已逐渐被电子书取代,人们越来越趋向于利用互联网和计算机技术,通过用于阅读电子书的电子书阅读应用下载电子书进行阅读。
但随着智能终端技术的发展,人们对电子书阅读应用的要求也越来越高,比如,如何在眼睛疲劳或者光线不好的情况下也可以阅读自己感兴趣的电子书。因此,如何满足用户的这一需求就成为亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种电子书语音播放方法、装置及终端设备,以解决用户在眼睛疲劳或者光线不好的情况下阅读电子书的问题。
根据本发明实施例的一个方面,提供了一种电子书语音播放方法,包括:根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
根据本发明实施例的另一个方面,还提供了一种电子书语音播放装置,包括:内容确定模块,用于根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;音频播放模块,用于获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
根据本发明实施例的再一个方面,还提供了一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的电子书语音播放方法对应的操作。
通过本发明实施例提供的电子书语音播放方案,在用户在眼睛疲劳或者光线不好的情况下,可以通过语音播放指令进行相应电子书内容的语音播放,实现了电子书阅读应用的“听书”功能。并且,本发明实施例中,使用真实人声音频,相比较于机器合成的音频,真实人声音频因为通过真实人声录制,其在语音语调以及流畅性方面都远优于机器合成,使得用户能够获得较好的“听书”体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一的一种电子书语音播放方法的步骤流程图;
图2是根据本发明实施例二的一种电子书语音播放方法的步骤流程图;
图3是根据本发明实施例三的一种电子书语音播放装置的结构框图;
图4是根据本发明实施例四的一种电子书语音播放装置的结构框图;
图5是根据本发明实施例五的一种终端设备的结构示意图。
具体实施方式
当然,实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
实施例一
参照图1,示出了根据本发明实施例一的一种电子书语音播放方法的步骤流程图。
本实施例的电子书语音播放方法包括以下步骤:
步骤S102::根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容。
其中,语音播放指令的生成可以以任意适当方式实现,包括但不限于:接收到用户对电子书界面中显示的语音播放按钮或选项的操作后生成,或者,接收到用户对显示的电子书页面的设定操作(如双击)后生成,或者,接收到用户通过相应的设置菜单进行语音播放设置后生成,等等,本发明实施例对此不作限制。
待语音播放的电子书内容可以是电子书阅读应用默认设置的内容,如当前显示的某一页电子书的全部内容,也可以是用户选择的一段或多段、一行或多行、一句或多句等内容。
步骤S104:获得与待语音播放的电子书内容相对应的真实人声音频,并播放该真实人声音频。
在确定了待语音播放的电子书内容后,即可获得该电子书内容所对应的真实人声音频,进而进行播放。
其中,真实人声音频是真实的人的语音生成的音频,如,由真实的人朗读生成的音频、或由真实的人的对白生成的音频、或对真实的人声进行处理后生成的音频(如对真实的人朗读过的句子进行重新拆分再合成等处理后生成的音频)等等。
通过本实施例提供的电子书语音播放方案,在用户在眼睛疲劳或者光线不好的情况下,可以通过语音播放指令进行相应电子书内容的语音播放,实现了电子书阅读应用的“听书”功能。并且,本发明实施例中,使用真实人声音频,相比较于机器合成的音频,真实人声音频因为通过真实人声录制,其在语音语调以及流畅性方面都远优于机器合成,使得用户能够获得较好的“听书”体验。
本实施例的电子书语音播放方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:各种终端设备(包括PC机、平板电脑、移动终端等)和服务器等。
实施例二
参照图2,示出了根据本发明实施例二的一种电子书语音播放方法的步骤流程图。
本实施例的电子书语音播放方法包括以下步骤:
步骤S202:根据指示对电子书进行语音播放的语音播放指令和对电子书的显示内容的选择操作,确定待语音播放的电子书内容。
用户在阅读电子书时,在某些情况下会有“听书”的需求,如眼睛疲劳或者光线不好或者其它情况等,在此情况下,电子书应用所在的设备在接收到相应的用户操作后,生成相应的语音播放指令,以指示对相应的电子书内容进行语音播放。其中,如实施例一中所述,待语音播放的电子书内容可以是电子书阅读应用默认设置的内容,也可以是用户选择的内容。本实施例中,以用户选择为例,对本发明实施例提供的电子书语音播放方案进行说明。
由用户选择待语音播放的电子书内容时,用户可以选择电子书内容的某一段或某几段、某一行或某几行、某一句或某几句的内容等,通过该种方式,可以提高用户“听书”内容的灵活性,提升用户“听书”体验。但本领域技术人员应当明了,如实施例一中所述的电子书阅读应用默认设置的待语音播放的电子书内容也可同样适用本实施例的方案。
需要说明的是,在实际应用中,用户指示语音播放的操作和用户选择电子书内容的操作可以采用任意适当的顺序。如,可以先通过适当方式指示进行语音播放,然后再选择电子书内容;也可以先选择电子书内容,再指示对选择的电子书内容进行语音播放。本实施例中,仅以后者为例对本发明实施例的方案进行说明,但本领域技术人员可以参照本实施例实现基于前一方式的电子书语音播放方案。
在采用先选择电子书内容,再指示对选择的电子书内容进行语音播放的方式中,可以先接收对电子书的显示内容的选择操作,根据选择操作确定待语音播放的电子书内容。
在一种可选方式中,可以接收用户对电子书的显示内容的第一操作,确定第一操作在所述显示内容中的第一作用点;接收用户对所述显示内容的第二操作,确定第二操作在所述显示内容中的第二作用点;将第一作用点和第二作用点之间的显示内容确定为待语音播放的电子书内容。其中,第一操作和第二操作包括但不限于点选操作。
在另一种可选方式中,可以接收用户对电子书的显示内容的第三操作,确定第三操作在所述显示内容中的第三作用点;以第三作用点为参考点,将包括第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为起点的第二设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为终点的第三设定范围内的显示内容确定为待语音播放的电子书内容。其中,第一设定范围、第二设定范围和第三设定范围可以相同也可以不同,可以由本领域技术人员根据实际需求设置。并且,在以第三作用点为参考点,将包括第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容中,可以以第三作用点为中点,将第一设定范围内的显示内容确定为待语音播放的电子书内容,但不限于此,第三作用点也可以不为中点。第三操作包括但不限于点选操作。通过该种方式,简化了用户操作,减轻了系统操作负担。
在再一种可选方式中,可以接收用户对电子书的显示内容的选择操作,确定所述选择操作所选择的显示内容对应的内容标记;将所述内容标记所标记的内容确定为待语音播放的电子书内容。此种方式中,电子书内容中预先设置有相应的内容标记,该内容标记可以由本领域技术人员根据实际需求设置,如每一章或每一节设置一个内容标记,或者,每一页设置一个内容标记,或者,每一段设置一个内容标记,或者,根据对电子书内容的分析,每一个完整情节(如老师和学生在课堂上的对话情节)或每一个完整场景(如某个海上场景)设置一个内容标记,等等。在此情况下,当用户进行了选择操作,如,通过第一操作和第二操作的方式选择了某部分电子书内容;或者,在当前显示的电子书内容的任意位置进行了点击操作,如第三操作的方式;或者,当内容标记在电子书中以适当提示方式展示给用户,在用户对相应的提示进行操作后,电子书阅读应用会先确定对应的内容标记,进而,将该内容标记所标记的整部分电子书内容确定为待语音播放的电子书内容。
但不限于上述方式,在实际应用中,其它适当的确定待语音播放的电子书内容的方式也同样适用于本发明实施例的方案,如将电子书当前显示的整个页面的内容确定为待语音播放的电子书内容等。
步骤S204:获得与待语音播放的电子书内容相对应的真实人声音频,并播放所述真实人声音频。
其中,真实人声音频包括以下至少之一:从与电子书对应的影视剧中获取的影视台词音频、与电子书对应的电子书内容朗读音频、电子书所在的电子书阅读应用的用户录制的用户音频。
例如,电子书“三生三世十里桃花”里的一句话“虽于我只是短短两个月,于你却是极漫长的一生,司命给你写的命格你有否看过?”,若用户选择了电子书中的这句话,或者语音播放至该处,则可以播放电视剧“三生三世十里桃花”中演员说的这句话,但不限于此,图书改编为影视作品后,可能原文与影视台词不能完全一致,也即,不能精确匹配,在此情况下,匹配度满足一定阈值或标准即可,该阈值或标准可以由本领域技术人员适当设置,本发明实施例对此不作限制。
又例如,电子书“三国演义”对应有真人原声原文朗读音频,则在此情况下,可以确定与待语音播放的电子书内容对应的音频的起始位置,从该起始位置进行播放。
再例如,电子书阅读应用的用户自己朗读了电子书的全部或部分内容并录制成音频,或者,结合电子书内容进行语音评论并保存为音频,在该音频可被使用的情况下,如该音频被用户设置为共享、或发送给他人、或在电子书阅读应用中通过适当方式进行了发布,如,通过电子书评论发布或通过分享方式或通过其它适当方式发布等,则当用户自己语音播放该电子书内容,或者可获得该音频的他人对该电子书内容进行语音播放时,可使用该音频实现“听书”。此种方式中,在步骤S202根据电子书的语音播放指令,确定待语音播放的电子书内容之前,还可以接收用户通过电子书阅读应用为电子书的内容录制的朗读音频,将录制的音频和对应的电子书的内容关联存储;和/或,接收用户通过电子书阅读应用为电子书的内容录制的评论音频,将评论音频和对应的电子书的内容关联存储。基于录制和关联存储的用户录制的音频,实现“听书”功能,进一步提升用户使用电子书阅读应用的体验。
需要说明的是,在一种可选方案中,还可以对上述真实人声音频进行进一步的处理,如拆分后重新合成,以满足某些情形下的真实人声音频播放需要,如,影视台词的拆分和重新组合、朗读音频的拆分和重新组合、用户音频的拆分和重新组合等等,从而形成新的真实人声音频。
此外,真实人声音频还可以与背景音频和/或业务音频进行合成,生成合成音频,在此情况下,将获得与待语音播放的电子书内容相对应的合成音频,其中,合成音频除包括所述真实人声音频外,还包括背景音频和/或业务音频;进而播放该合成音频。其中,背景音频可以为背景音乐,通过背景音频可以进一步烘托气氛,使用户更能感受该部分电子书内容的气氛;业务音频可以为由当前真实人声音频中的人录制的业务音频,或者,是与待语音播放的电子书内容相关的业务音频,如情节相关的业务音频。业务音频可以插入在当前真实人声音频的开头、结尾、或者开头至结尾中任意适当的位置,可选地,业务音频可以实现为广告音频。
在一种获得与待语音播放的电子书内容相对应的真实人声音频的实现方式中,可以为电子书预先设置内容标记,也为真实人声音频预先设置音频标记。也即,电子书中预设有用于标记电子书内容的至少一个内容标记,真实人声音频中预设有用于标记音频内容的至少一个音频标记,基于此,可以根据所述内容标记与所述音频标记之间的对应关系,获得与电子书内容相对应的真实人声音频。
具体地,可以确定与待语音播放的电子书内容对应的内容标记;根据预存的内容标记与音频标记的对应关系,确定与所述内容标记对应的音频标记;获取与确定的所述音频标记相对应的音频内容。通过内容标记和音频标记的方式,可以快速、准确地获得与电子书内容相对应的真实人声音频,提高“听书”功能对用户操作的响应速度。
在另一种获得与待语音播放的电子书内容相对应的真实人声音频的实现方式中,可以预先(如在根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容的步骤之前)对已存在或已获取的真实人声音频进行语音识别,获得对应的文字内容;确定电子书中与文字内容相匹配的电子书内容;建立并存储所述文字内容对应的真实人声音频与确定的电子书内容之间的对应关系。例如,对一段时长为30分钟的影视台词音频进行语音识别,获得对应的多段文字内容;进而,将该多段文字内容分别与电子书内容进行匹配,根据匹配结果确定该多段文字内容与电子书中的多段内容之间的对应关系;进而,可以根据二者之间的关系,建立并存储语音识别出的多段文字内容对应的真实人声音频中的多个部分与多段电子书内容之间的对应关系。基于此,在获得与待语音播放的电子书内容相对应的真实人声音频时,可以根据该对应关系,获得与待语音播放的电子书内容相对应的真实人声音频。
此外,在一种可选方式中,如果真实人声音频包括多种,如,包括影视台词音频、电子书内容朗读音频、和用户音频中的至少两个时,在获得与电子书内容相对应的真实人声音频时,可以按照预设的优先级,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与电子书内容相对应的真实人声音频;或者,也可以接收用户对影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项的选择操作,获得所述选择操作所选择的、与电子书内容相对应的真实人声音频;或者,也可以根据用户播放真实人声音频的历史数据,确定用户的音频类型偏好;根据用户的音频类型偏好,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与待语音播放的电子书内容相对应的真实人声音频。如,用户的历史数据表明该用户有过十次的语音播放记录,其中,八次使用了影视台词音频,则在用户再次进行语音播放时,可以直接使用影视台词音频进行相应的电子书内容的语音播放。
又例如,在第一种方式中,假设设置影视台词音频、电子书内容朗读音频、和用户音频这三种音频的优先级从高到低依次为:用户音频、影视台词音频、电子书内容朗读音频。则当电子书的某部分文字同时对应有这三种音频时,则播放用户音频;而如果电子书的某部分文字仅对应有其中的部分音频时,如对应有影视台词音频和电子书内容朗读音频,则根据该优先级将播放影视台词音频,而若该部分文字仅对应有电子书内容朗读音频,则将播放该电子书内容朗读音频。需要说明的是,上述优先级设置仅为示例性说明,本领域技术人员可以根据实际需要适当设置,本发明实施例对此不作限制。通过设置优先级,既最大可能地保证了电子书文字对应有音频,又使得音频的形式多样化。
而通过第二种方式,为用户选择与电子书内容对应的真实人声音频提供了更大的灵活性,用户可以自行选择音频进而进行播放。其中,影视台词音频、电子书内容朗读音频、和用户音频对应的选项可以由本领域技术人员根据实际需求适当设置,在一种可选的实现方式中,可以通过弹窗或者透明覆盖层显示影视台词音频、电子书内容朗读音频、和用户音频对应的选项。例如,当接收到对某部分电子书内容进行语音播放的语音播放指令后,电子书应用通过弹窗或者透明覆盖层向用户展示相应的音频选项供用户选择,在得到用户的选择结果后,播放与该选择结果对应的真实人声音频,如,用户选择了影视台词音频,则播放与该部分电子书内容对应的影视台词音频。基于显示电子书内容的界面,通过弹窗或透明覆盖层显示音频选项,方便了用户操作,提升了用户使用体验。
通过上述过程,实现了电子书内容的“听书”功能,在此基础上,可选地,还可以进一步进行下述步骤S206或步骤S208的操作。
步骤S206:在播放真实人声音频的过程中,接收到对电子书的翻页操作,暂停所述真实人声音频的播放;根据翻页操作重新确定待语音播放的电子书内容;获得与重新确定的电子书内容相对应的真实人声音频并播放。
在某一真实人声音频播放过程中,有可能该音频还未播放完,用户即进行了相应的操作,如上翻页或下翻页操作,电子书阅读应用在监测到音频播放过程中的翻页操作后,会自动暂停该音频的播放;进一步地,根据该翻页操作重新确定待语音播放的电子书内容,如,确定该翻页操作最终的目标页面,进而根据该目标页面的内容重新确定待语音播放的电子书内容。
一种可能的情况下,假设当前真实人声音频正在播放电子书第5页第三段的第一句话的内容,此时,用户进行了连续的下翻页操作,最后停在了电子书页面的第10页,此种情况下,可以停止之前的音频,转而播放第10页的电子书内容的真实人声音频(如第10页的首个电子书的内容标记对应的音频,或者,第10页的起始文字对应的音频,或者,第10页的情节或者场景对应的音频等等);也可以停止之前的音频,接收用户对第10页的电子书内容的选择操作后,播放该次选择操作所选择的电子书内容对应的真实人声音频。上翻页操作与下翻页操作类似,在此不再赘述。
另一种可能的情况下,假设当前真实人声音频正在播放电子书第5页第三段的第一句话的内容,此时,用户进行了连续的下翻页操作,翻至电子书页面的第10页后又进行了上翻页操作,翻回至电子书页面的第5页,此种情况下,则可以继续之前中断的真实人声音频的播放。但不限于此,也可以停止之前的音频,重新确定第5页的电子书内容对应的真实人声音频,如,第5页的首个电子书的内容标记对应的音频,或者,第5页的起始文字对应的音频,或者,第5页的情节或者场景对应的音频等等。但继续之前中断的真实人声音频的播放的方式相较于其它方式,更接近于用户“听书”的真实需求,提升用户“听书”体验。
当然,实际应用中,若在播放真实人声音频的过程中,接收到对电子书的翻页操作,也可以停止真实人声音频的播放,等待用户的下一个语音播放指令。
步骤S208:在播放真实人声音频的过程中,接收对播放的真实人声音频的音频处理指令,对真实人声音频进行音频处理指令所指示的操作。
其中,音频处理指令包括但不限于以下至少之一:用于指示暂停真实人声音频播放的暂停指令、用于指示调整真实人声音频的播放速度的第一调整指令、用于指示调整真实人声音频的播放进度的第二调整指令、用于指示退出真实人声音频播放的退出指令、用于指示切换真实人声音频的类型的切换指令。
例如,用户在通过真实人声音频“听书”过程中,需要离开终端设备时,可以通过操作“暂停”或类似操作选项向电子书阅读应用发送暂停指令,暂停当前音频的播放;或者,当检测到用户中断了电子书阅读应用转而使用其它应用时,电子书阅读应用可以自动生成相应的暂停指令,指示暂停当前音频的播放。
又例如,用户需要终止音频播放时,可以通过操作“停止”或类似操作选项向电子书阅读应用发送于指示退出真实人声音频播放的退出指令,以停止当前真实人声音频的播放。
再例如,如前所述,当真实人声音频包括影视台词音频、电子书内容朗读音频、和用户音频中的至少两个时,用户可以通过对显示的其它音频类型的选择操作,或者,通过“切换人声”或类似操作选项向电子书阅读应用发送指示切换真实人声音频的类型的切换指令。如,当前真实人声音频为用户音频,用户通过对“切换人声”操作选项的操作,从显示的多种音频类型中选择一个类型进行切换,例如,将用户音频切换为影视台词音频或者电子书内容朗读音频。
又例如,用户希望调整音频的播放速度,则可以通过相应的播放速度调整操作选项,向电子书阅读应用发送指示调整真实人声音频的播放速度的第一调整指令,以调整当前音频的播放速度。如,用户选择了“2倍速”播放,则当前真实人声音频的播放速度将调整为原播放速度的2倍。
再例如,用户希望快进或快退音频,则可以通过相应的播放进度调整操作选项,向电子书阅读应用发送指示调整真实人声音频的播放进度的第二调整指令。如,用户可以通过点选“快进”或类似操作选项,或者,通过拖动音频播放进度条,进行当前真实人声音频的播放进度的调整。
需要说明的是,上述音频处理指令可以由本领域技术人员通过任意适当的设置实现,在一种可选方式中,可以通过悬浮图标或悬浮窗口或透明覆盖层,显示上述音频处理指令。通过这种显示音频处理指令的方式,一方面,尽可能地减小了显示的音频处理指令对用户阅读电子书造成的影响;另一方向,也使得用户对音频的控制和处理更为便利,提升了用户“听书”体验。
通过本实施例提供的电子书语音播放方案,在用户在眼睛疲劳或者光线不好的情况下,可以通过语音播放指令进行相应电子书内容的语音播放,实现了电子书阅读应用的“听书”功能。并且,本发明实施例中,使用真实人声音频,相比较于机器合成的音频,真实人声音频因为通过真实人声录制,其在语音语调以及流畅性方面都远优于机器合成,使得用户能够获得较好的“听书”体验。
本实施例的电子书语音播放方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:各种终端设备(包括PC机、平板电脑、移动终端等)和服务器等。
实施例三
参照图3,示出了根据本发明实施例三的一种电子书语音播放装置的结构框图。
本实施例的电子书语音播放装置包括:内容确定模块302,用于根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;音频播放模块304,用于获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
通过本实施例提供的电子书语音播放装置,在用户在眼睛疲劳或者光线不好的情况下,可以通过语音播放指令进行相应电子书内容的语音播放,实现了电子书阅读应用的“听书”功能。并且,本发明实施例中,使用真实人声音频,相比较于机器合成的音频,真实人声音频因为通过真实人声录制,其在语音语调以及流畅性方面都远优于机器合成,使得用户能够获得较好的“听书”体验。
实施例四
参照图4,示出了根据本发明实施例四的一种电子书语音播放装置的结构框图。
本实施例的电子书语音播放装置包括:内容确定模块402,用于根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;音频播放模块404,用于获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
可选地,真实人声音频包括以下至少之一:从与电子书对应的影视剧中获取的影视台词音频、与电子书对应的电子书内容朗读音频、电子书所在的电子书阅读应用的用户录制的用户音频。
可选地,音频播放模块404用于获得与待播放的电子书内容相对应的合成音频,其中,合成音频除包括真实人声音频外,还包括背景音频和/或业务音频;播放所述合成音频。
可选地,电子书中预设有用于标记电子书内容的至少一个内容标记,真实人声音频中预设有用于标记音频内容的至少一个音频标记;音频播放模块404,用于根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
可选地,音频播放模块404用于确定与待语音播放的电子书内容对应的内容标记;根据预存的内容标记与音频标记的对应关系,确定与所述内容标记对应的音频标记;获取与确定的所述音频标记相对应的音频内容,并播放所述音频内容。
可选地,本实施例的电子书语音播放装置还包括:建立关系模块406,用于在内容确定模块402根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容之前,对真实人声音频进行语音识别,获得对应的文字内容;确定电子书中与所述文字内容相匹配的电子书内容;建立并存储所述文字内容对应的真实人声音频与确定的电子书内容之间的对应关系;音频播放模块404用于根据所述对应关系,获得与待语音播放的电子书内容相对应的真实人声音频,并播放所述真实人声音频。
可选地,当真实人声音频包括影视台词音频、电子书内容朗读音频、和用户音频中的至少两个时,音频播放模块404用于按照预设的优先级,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与电子书内容相对应的真实人声音频,并播放所述真实人声音频;或者,音频播放模块404用于接收用户对影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项的选择操作,获得所述选择操作所选择的、与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频;或者,音频播放模块404用于根据用户播放真实人声音频的历史数据,确定用户的音频类型偏好;根据用户的音频类型偏好,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与待语音播放的电子书内容相对应的真实人声音频,并播放所述真实人声音频。
可选地,本实施例的电子书语音播放装置还包括:显示模块408,用于在音频播放模块404接收用户对影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项的选择操作之前,通过弹窗或者透明覆盖层显示影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项。
可选地,内容确定模块402用于根据指示对电子书进行语音播放的语音播放指令和对电子书的显示内容的选择操作,确定待语音播放的电子书内容。
可选地,本实施例的电子书语音播放装置还包括:内容选择模块410,用于在内容确定模块402根据指示对电子书进行语音播放的语音播放指令和对电子书的显示内容的选择操作,确定待语音播放的电子书内容之前,接收对电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容。
可选地,内容选择模块410包括:第一选择模块4102,用于接收用户对电子书的显示内容的第一操作,确定第一操作在显示内容中的第一作用点;接收用户对显示内容的第二操作,确定第二操作在所述显示内容中的第二作用点;将第一作用点和第二作用点之间的显示内容确定为待语音播放的电子书内容。
可选地,内容选择模块410包括:第二选择模块4104,用于接收用户对电子书的显示内容的第三操作,确定第三操作在所述显示内容中的第三作用点;以第三作用点为参考点,将包括第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为起点的第二设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为终点的第三设定范围内的显示内容确定为待语音播放的电子书内容。
可选地,内容选择模块410包括:第三选择模块4106,用于接收用户对电子书的显示内容的选择操作,确定所述选择操作所选择的显示内容对应的内容标记;将所述内容标记所标记的内容确定为待语音播放的电子书内容。
可选地,本实施例的电子书语音播放装置还包括:录制存储模块412,用于在内容确定模块402根据电子书的语音播放指令,确定待语音播放的电子书内容之前,接收用户通过电子书阅读应用为电子书的内容录制的朗读音频,将录制的音频和对应的电子书的内容关联存储;和/或,接收用户通过电子书阅读应用为电子书的内容录制的评论音频,将评论音频和对应的电子书的内容关联存储。
可选地,本实施例的电子书语音播放装置还包括:音频处理模块414,用于接收对播放的真实人声音频的音频处理指令,对所述真实人声音频进行所述音频处理指令所指示的操作。
可选地,所述音频处理指令包括以下至少之一:用于指示暂停所述真实人声音频播放的暂停指令、用于指示调整所述真实人声音频的播放速度的第一调整指令、用于指示调整所述真实人声音频的播放进度的第二调整指令、用于指示退出所述真实人声音频播放的退出指令、用于指示切换真实人声音频的类型的切换指令。
可选地,显示模块408还用于通过悬浮图标或悬浮窗口或透明覆盖层,显示所述音频处理指令。
可选地,本实施例的电子书语音播放装置还包括:重确定模块416,用于在播放真实人声音频的过程中,接收到对电子书的翻页操作,暂停所述真实人声音频的播放;根据所述翻页操作重新确定待语音播放的电子书内容;获得与重新确定的所述电子书内容相对应的真实人声音频并播放。
本实施例的电子书语音播放装置用于实现前述多个方法实施例中相应的电子书语音播放方法,并具有相应的方法实施例的有益效果,在此不再赘述。
实施例五
参照图5,示出了根据本发明实施例五的一种终端设备的结构示意图,本发明具体实施例并不对终端设备的具体实现做限定。
如图5所示,该终端设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如其它终端设备或服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述电子书语音播放方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
在一种可选的实施方式中,真实人声音频包括以下至少之一:从与电子书对应的影视剧中获取的影视台词音频、与电子书对应的电子书内容朗读音频、电子书所在的电子书阅读应用的用户录制的用户音频。
在一种可选的实施方式中,程序510还用于使得处理器502在获得与待播放的电子书内容相对应的真实人声音频,并播放所述真实人声音频时,获得与待播放的电子书内容相对应的合成音频,其中,所述合成音频除包括所述真实人声音频外,还包括背景音频和/或业务音频;播放所述合成音频。
在一种可选的实施方式中,电子书中预设有用于标记电子书内容的至少一个内容标记,真实人声音频中预设有用于标记音频内容的至少一个音频标记;程序510还用于使得处理器502在获得与所述电子书内容相对应的真实人声音频时,根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频。
在一种可选的实施方式中,程序510还用于使得处理器502在根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频时,确定与待语音播放的电子书内容对应的内容标记;根据预存的内容标记与音频标记的对应关系,确定与所述内容标记对应的音频标记;获取与确定的所述音频标记相对应的音频内容。
在一种可选的实施方式中,程序510还用于使得处理器502在根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容之前,对真实人声音频进行语音识别,获得对应的文字内容;确定所述电子书中与所述文字内容相匹配的电子书内容;建立并存储所述文字内容对应的真实人声音频与确定的所述电子书内容之间的对应关系;程序510还用于使得处理器502在获得与待播放的电子书内容相对应的真实人声音频时,根据所述对应关系,获得与待播放的电子书内容相对应的真实人声音频。
在一种可选的实施方式中,当真实人声音频包括影视台词音频、电子书内容朗读音频、和用户音频中的至少两个时,程序510还用于使得处理器502在获得与所述电子书内容相对应的真实人声音频时,按照预设的优先级,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与所述电子书内容相对应的真实人声音频;或者,接收用户对影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项的选择操作,获得所述选择操作所选择的、与所述电子书内容相对应的真实人声音频或者,根据用户播放真实人声音频的历史数据,确定用户的音频类型偏好;根据用户的音频类型偏好,从影视台词音频、电子书内容朗读音频、和用户音频中的至少两个中,获得与待播放的电子书内容相对应的真实人声音频。
在一种可选的实施方式中,程序510还用于使得处理器502在接收用户对影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项的选择操作之前,通过弹窗或者透明覆盖层显示影视台词音频、电子书内容朗读音频、和用户音频中的至少两个对应的选项。
在一种可选的实施方式中,程序510还用于使得处理器502在根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容时,根据指示对电子书进行语音播放的语音播放指令和对电子书的显示内容的选择操作,确定待语音播放的电子书内容。
在一种可选的实施方式中,程序510还用于使得处理器502在根据指示对电子书进行语音播放的语音播放指令和对电子书的显示内容的选择操作,确定待语音播放的电子书内容之前,接收对电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容。
在一种可选的实施方式中,程序510还用于使得处理器502在接收对电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容时,接收用户对电子书的显示内容的第一操作,确定第一操作在所述显示内容中的第一作用点;接收用户对所述显示内容的第二操作,确定第二操作在所述显示内容中的第二作用点;将第一作用点和第二作用点之间的显示内容确定为待语音播放的电子书内容。
在一种可选的实施方式中,程序510还用于使得处理器502在接收对电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容时,接收用户对电子书的显示内容的第三操作,确定第三操作在所述显示内容中的第三作用点;以第三作用点为参考点,将包括第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为起点的第二设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以第三作用点为终点的第三设定范围内的显示内容确定为待语音播放的电子书内容。
在一种可选的实施方式中,程序510还用于使得处理器502在接收对电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容时,接收用户对电子书的显示内容的选择操作,确定所述选择操作所选择的显示内容对应的内容标记;将所述内容标记所标记的内容确定为待语音播放的电子书内容。
在一种可选的实施方式中,程序510还用于使得处理器502在根据电子书的语音播放指令,确定待语音播放的电子书内容之前,接收用户通过电子书阅读应用为电子书的内容录制的朗读音频,将录制的音频和对应的电子书的内容关联存储;和/或,接收用户通过电子书阅读应用为电子书的内容录制的评论音频,将评论音频和对应的电子书的内容关联存储。
在一种可选的实施方式中,程序510还用于使得处理器502接收对播放的真实人声音频的音频处理指令,对真实人声音频进行所述音频处理指令所指示的操作。
在一种可选的实施方式中,音频处理指令包括以下至少之一:用于指示暂停真实人声音频播放的暂停指令、用于指示调整真实人声音频的播放速度的第一调整指令、用于指示调整真实人声音频的播放进度的第二调整指令、用于指示退出真实人声音频播放的退出指令、用于指示切换真实人声音频的类型的切换指令。
在一种可选的实施方式中,程序510还用于使得处理器502通过悬浮图标或悬浮窗口或透明覆盖层,显示所述音频处理指令。
在一种可选的实施方式中,程序510还用于使得处理器502在播放真实人声音频的过程中,接收到对电子书的翻页操作,暂停真实人声音频的播放;根据所述翻页操作重新确定待语音播放的电子书内容;获得与重新确定的电子书内容相对应的真实人声音频并播放。
程序510中各步骤的具体实现可以参见上述电子书语音播放方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例,在用户在眼睛疲劳或者光线不好的情况下,可以通过语音播放指令进行相应电子书内容的语音播放,实现了电子书阅读应用的“听书”功能。并且,本发明实施例中,使用真实人声音频,相比较于机器合成的音频,真实人声音频因为通过真实人声录制,其在语音语调以及流畅性方面都远优于机器合成,使得用户能够获得较好的“听书”体验。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的电子书语音播放方法。此外,当通用计算机访问用于实现在此示出的电子书语音播放方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的电子书语音播放方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (37)

1.一种电子书语音播放方法,包括:
根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;
获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
2.根据权利要求1所述的方法,其中,所述真实人声音频包括以下至少之一:从与所述电子书对应的影视剧中获取的影视台词音频、与所述电子书对应的电子书内容朗读音频、所述电子书所在的电子书阅读应用的用户录制的用户音频。
3.根据权利要求1或2所述的方法,其中,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频,包括:
获得与所述电子书内容相对应的合成音频,其中,所述合成音频除包括所述真实人声音频外,还包括背景音频和/或业务音频;
播放所述合成音频。
4.根据权利要求1-3任一项所述的方法,其中,所述电子书中预设有用于标记电子书内容的至少一个内容标记,所述真实人声音频中预设有用于标记音频内容的至少一个音频标记;
所述获得与所述电子书内容相对应的真实人声音频,包括:
根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频。
5.根据权利要求4所述的方法,其中,根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频,包括:
确定与所述待语音播放的电子书内容对应的内容标记;根据预存的内容标记与音频标记的对应关系,确定与所述内容标记对应的音频标记;获取与确定的所述音频标记相对应的音频内容。
6.根据权利要求1-3任一项所述的方法,其中,
在所述根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容之前,所述方法还包括:对真实人声音频进行语音识别,获得对应的文字内容;确定所述电子书中与所述文字内容相匹配的电子书内容;建立并存储所述文字内容对应的真实人声音频与确定的所述电子书内容之间的对应关系;
所述获得与所述电子书内容相对应的真实人声音频,包括:根据所述对应关系,获得与所述电子书内容相对应的真实人声音频。
7.根据权利要求2所述的方法,其中,当所述真实人声音频包括所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个时,
所述获得与所述电子书内容相对应的真实人声音频,包括:
按照预设的优先级,从所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个中,获得与所述电子书内容相对应的真实人声音频;
或者,
接收用户对所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项的选择操作,获得所述选择操作所选择的、与所述电子书内容相对应的真实人声音频;
或者,
根据用户播放真实人声音频的历史数据,确定用户的音频类型偏好;根据所述用户的音频类型偏好,从所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个中,获得与所述电子书内容相对应的真实人声音频。
8.根据权利要求7所述的方法,其中,在所述接收用户对所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项的选择操作之前,所述方法还包括:
通过弹窗或者透明覆盖层显示所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项。
9.根据权利要求1所述的方法,其中,所述根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容,包括:
根据指示对电子书进行语音播放的语音播放指令和对所述电子书的显示内容的选择操作,确定待语音播放的电子书内容。
10.根据权利要求9所述的方法,其中,在所述根据指示对电子书进行语音播放的语音播放指令和对所述电子书的显示内容的选择操作,确定待语音播放的电子书内容之前,所述方法还包括:
接收对所述电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容。
11.根据权利要求10所述的方法,其中,所述接收对所述电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容,包括:
接收用户对所述电子书的显示内容的第一操作,确定所述第一操作在所述显示内容中的第一作用点;
接收用户对所述显示内容的第二操作,确定所述第二操作在所述显示内容中的第二作用点;
将所述第一作用点和所述第二作用点之间的显示内容确定为待语音播放的电子书内容。
12.根据权利要求10所述的方法,其中,所述接收对所述电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容,包括:
接收用户对所述电子书的显示内容的第三操作,确定所述第三操作在所述显示内容中的第三作用点;
以所述第三作用点为参考点,将包括所述第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以所述第三作用点为起点的第二设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以所述第三作用点为终点的第三设定范围内的显示内容确定为待语音播放的电子书内容。
13.根据权利要求10所述的方法,其中,所述接收对所述电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容,包括:
接收用户对所述电子书的显示内容的选择操作,确定所述选择操作所选择的显示内容对应的内容标记;
将所述内容标记所标记的内容确定为待语音播放的电子书内容。
14.根据权利要求1所述的方法,其中,在所述根据电子书的语音播放指令,确定待语音播放的电子书内容之前,所述方法还包括:
接收用户通过电子书阅读应用为所述电子书的内容录制的朗读音频,将录制的所述音频和对应的所述电子书的内容关联存储;
和/或,
接收用户通过电子书阅读应用为所述电子书的内容录制的评论音频,将所述评论音频和对应的所述电子书的内容关联存储。
15.根据权利要求1所述的方法,其中,所述方法还包括:
接收对播放的所述真实人声音频的音频处理指令,对所述真实人声音频进行所述音频处理指令所指示的操作。
16.根据权利要求15所述的方法,其中,所述音频处理指令包括以下至少之一:用于指示暂停所述真实人声音频播放的暂停指令、用于指示调整所述真实人声音频的播放速度的第一调整指令、用于指示调整所述真实人声音频的播放进度的第二调整指令、用于指示退出所述真实人声音频播放的退出指令、用于指示切换真实人声音频的类型的切换指令。
17.根据权利要求15或16所述的方法,其中,所述方法还包括:
通过悬浮图标或悬浮窗口或透明覆盖层,显示所述音频处理指令。
18.根据权利要求1所述的方法,其中,所述方法还包括:
在播放所述真实人声音频的过程中,接收到对所述电子书的翻页操作,暂停所述真实人声音频的播放;
根据所述翻页操作重新确定待语音播放的电子书内容;
获得与重新确定的所述电子书内容相对应的真实人声音频并播放。
19.一种电子书语音播放装置,包括:
内容确定模块,用于根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容;
音频播放模块,用于获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
20.根据权利要求19所述的装置,其中,所述真实人声音频包括以下至少之一:从与所述电子书对应的影视剧中获取的影视台词音频、与所述电子书对应的电子书内容朗读音频、所述电子书所在的电子书阅读应用的用户录制的用户音频。
21.根据权利要求19或20所述的装置,其中,所述音频播放模块,用于获得与所述电子书内容相对应的合成音频,其中,所述合成音频除包括所述真实人声音频外,还包括背景音频和/或业务音频;播放所述合成音频。
22.根据权利要求19-21任一项所述的装置,其中,所述电子书中预设有用于标记电子书内容的至少一个内容标记,所述真实人声音频中预设有用于标记音频内容的至少一个音频标记;
所述音频播放模块,用于根据所述内容标记与所述音频标记之间的对应关系,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
23.根据权利要求22所述的装置,其中,所述音频播放模块,用于确定与所述待语音播放的电子书内容对应的内容标记;根据预存的内容标记与音频标记的对应关系,确定与所述内容标记对应的音频标记;获取与确定的所述音频标记相对应的音频内容,并播放所述音频内容。
24.根据权利要求19-21任一项所述的装置,其中,
所述装置还包括:建立关系模块,用于在所述内容确定模块根据指示对电子书进行语音播放的语音播放指令,确定待语音播放的电子书内容之前,对真实人声音频进行语音识别,获得对应的文字内容;确定所述电子书中与所述文字内容相匹配的电子书内容;建立并存储所述文字内容对应的真实人声音频与确定的所述电子书内容之间的对应关系;
所述音频播放模块,用于根据所述对应关系,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
25.根据权利要求20所述的装置,其中,当所述真实人声音频包括所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个时,
所述音频播放模块,用于按照预设的优先级,从所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个中,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频;
或者,
所述音频播放模块,用于接收用户对所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项的选择操作,获得所述选择操作所选择的、与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频;
或者,
所述音频播放模块,用于根据用户播放真实人声音频的历史数据,确定用户的音频类型偏好;根据所述用户的音频类型偏好,从所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个中,获得与所述电子书内容相对应的真实人声音频,并播放所述真实人声音频。
26.根据权利要求25所述的装置,其中,所述装置还包括:
显示模块,用于在所述音频播放模块接收用户对所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项的选择操作之前,通过弹窗或者透明覆盖层显示所述影视台词音频、所述电子书内容朗读音频、和所述用户音频中的至少两个对应的选项。
27.根据权利要求19所述的装置,其中,所述内容确定模块,用于根据指示对电子书进行语音播放的语音播放指令和对所述电子书的显示内容的选择操作,确定待语音播放的电子书内容。
28.根据权利要求27所述的装置,其中,所述装置还包括:
内容选择模块,用于在所述内容确定模块根据指示对电子书进行语音播放的语音播放指令和对所述电子书的显示内容的选择操作,确定待语音播放的电子书内容之前,接收对所述电子书的显示内容的选择操作,根据所述选择操作确定待语音播放的电子书内容。
29.根据权利要求28所述的装置,其中,所述内容选择模块包括:
第一选择模块,用于接收用户对所述电子书的显示内容的第一操作,确定所述第一操作在所述显示内容中的第一作用点;接收用户对所述显示内容的第二操作,确定所述第二操作在所述显示内容中的第二作用点;将所述第一作用点和所述第二作用点之间的显示内容确定为待语音播放的电子书内容。
30.根据权利要求28所述的装置,其中,所述内容选择模块包括:
第二选择模块,用于接收用户对所述电子书的显示内容的第三操作,确定所述第三操作在所述显示内容中的第三作用点;以所述第三作用点为参考点,将包括所述第三作用点在内的第一设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以所述第三作用点为起点的第二设定范围内的显示内容确定为待语音播放的电子书内容;或者,将以所述第三作用点为终点的第三设定范围内的显示内容确定为待语音播放的电子书内容。
31.根据权利要求28所述的装置,其中,所述内容选择模块包括:
第三选择模块,用于接收用户对所述电子书的显示内容的选择操作,确定所述选择操作所选择的显示内容对应的内容标记;将所述内容标记所标记的内容确定为待语音播放的电子书内容。
32.根据权利要求19所述的装置,其中,所述装置还包括:
录制存储模块,用于在所述内容确定模块根据电子书的语音播放指令,确定待语音播放的电子书内容之前,接收用户通过电子书阅读应用为所述电子书的内容录制的朗读音频,将录制的所述音频和对应的所述电子书的内容关联存储;和/或,接收用户通过电子书阅读应用为所述电子书的内容录制的评论音频,将所述评论音频和对应的所述电子书的内容关联存储。
33.根据权利要求19所述的装置,其中,所述装置还包括:
音频处理模块,用于接收对播放的所述真实人声音频的音频处理指令,对所述真实人声音频进行所述音频处理指令所指示的操作。
34.根据权利要求33所述的装置,其中,所述音频处理指令包括以下至少之一:用于指示暂停所述真实人声音频播放的暂停指令、用于指示调整所述真实人声音频的播放速度的第一调整指令、用于指示调整所述真实人声音频的播放进度的第二调整指令、用于指示退出所述真实人声音频播放的退出指令、用于指示切换真实人声音频的类型的切换指令。
35.根据权利要求33或34所述的装置,其中,所述显示模块,还用于通过悬浮图标或悬浮窗口或透明覆盖层,显示所述音频处理指令。
36.根据权利要求19所述的装置,其中,所述装置还包括:
重确定模块,用于在播放所述真实人声音频的过程中,接收到对所述电子书的翻页操作,暂停所述真实人声音频的播放;根据所述翻页操作重新确定待语音播放的电子书内容;获得与重新确定的所述电子书内容相对应的真实人声音频并播放。
37.一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-18任一项所述的电子书语音播放方法对应的操作。
CN201710601433.6A 2017-07-21 2017-07-21 电子书语音播放方法、装置及终端设备 Active CN107369462B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710601433.6A CN107369462B (zh) 2017-07-21 2017-07-21 电子书语音播放方法、装置及终端设备
PCT/CN2018/096162 WO2019015613A1 (zh) 2017-07-21 2018-07-18 电子书语音播放方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710601433.6A CN107369462B (zh) 2017-07-21 2017-07-21 电子书语音播放方法、装置及终端设备

Publications (2)

Publication Number Publication Date
CN107369462A true CN107369462A (zh) 2017-11-21
CN107369462B CN107369462B (zh) 2020-06-26

Family

ID=60307242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710601433.6A Active CN107369462B (zh) 2017-07-21 2017-07-21 电子书语音播放方法、装置及终端设备

Country Status (2)

Country Link
CN (1) CN107369462B (zh)
WO (1) WO2019015613A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992250A (zh) * 2017-12-20 2018-05-04 维沃移动通信有限公司 一种电子书文件内容的显示方法、移动终端
CN108509605A (zh) * 2018-04-03 2018-09-07 优视科技有限公司 一种新闻信息的语音播放方法、装置和终端设备
CN108874266A (zh) * 2018-06-27 2018-11-23 北京微播视界科技有限公司 文本播放方法、客户端、终端和存储介质
CN109189983A (zh) * 2018-09-18 2019-01-11 王全志 用于学习的语音播放方法及装置
WO2019015613A1 (zh) * 2017-07-21 2019-01-24 广州阿里巴巴文学信息技术有限公司 电子书语音播放方法、装置及终端设备
CN109828711A (zh) * 2019-01-25 2019-05-31 努比亚技术有限公司 一种移动终端的阅读管理方法、移动终端及存储介质
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN110797001A (zh) * 2018-07-17 2020-02-14 广州阿里巴巴文学信息技术有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN111324330A (zh) * 2020-02-07 2020-06-23 掌阅科技股份有限公司 电子书的播放处理方法、计算设备及计算机存储介质
CN111459446A (zh) * 2020-03-27 2020-07-28 掌阅科技股份有限公司 电子书的资源处理方法、计算设备及计算机存储介质
CN111833903A (zh) * 2019-04-22 2020-10-27 珠海金山办公软件有限公司 一种执行操作任务的方法及装置
TWI717627B (zh) * 2018-08-09 2021-02-01 台灣大哥大股份有限公司 電子書語音朗讀裝置及其方法
CN113779204A (zh) * 2020-06-09 2021-12-10 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1653517A (zh) * 2002-05-09 2005-08-10 汤姆森特许公司 用于手持设备的文本语音转换
CN101968969A (zh) * 2010-10-22 2011-02-09 康佳集团股份有限公司 电子书移动装置及电子书的背景音乐播放方法
CN102723004A (zh) * 2011-03-29 2012-10-10 汉王科技股份有限公司 电子文档点读控制方法及装置
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1204511C (zh) * 2001-10-17 2005-06-01 英华达(南京)科技有限公司 可播放背景音乐及朗读电子书的装置及方法
KR101675178B1 (ko) * 2009-09-02 2016-11-10 아마존 테크놀로지스, 인크. 터치-스크린 사용자 인터페이스
US20110119590A1 (en) * 2009-11-18 2011-05-19 Nambirajan Seshadri System and method for providing a speech controlled personal electronic book system
CN105869446B (zh) * 2016-03-29 2018-09-25 广州阿里巴巴文学信息技术有限公司 一种电子阅读装置和语音阅读加载方法
CN107369462B (zh) * 2017-07-21 2020-06-26 阿里巴巴(中国)有限公司 电子书语音播放方法、装置及终端设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1653517A (zh) * 2002-05-09 2005-08-10 汤姆森特许公司 用于手持设备的文本语音转换
CN101968969A (zh) * 2010-10-22 2011-02-09 康佳集团股份有限公司 电子书移动装置及电子书的背景音乐播放方法
CN102723004A (zh) * 2011-03-29 2012-10-10 汉王科技股份有限公司 电子文档点读控制方法及装置
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019015613A1 (zh) * 2017-07-21 2019-01-24 广州阿里巴巴文学信息技术有限公司 电子书语音播放方法、装置及终端设备
CN107992250A (zh) * 2017-12-20 2018-05-04 维沃移动通信有限公司 一种电子书文件内容的显示方法、移动终端
CN108509605A (zh) * 2018-04-03 2018-09-07 优视科技有限公司 一种新闻信息的语音播放方法、装置和终端设备
CN108874266A (zh) * 2018-06-27 2018-11-23 北京微播视界科技有限公司 文本播放方法、客户端、终端和存储介质
CN110797001B (zh) * 2018-07-17 2022-04-12 阿里巴巴(中国)有限公司 电子书语音音频的生成方法、装置及可读存储介质
CN110797001A (zh) * 2018-07-17 2020-02-14 广州阿里巴巴文学信息技术有限公司 电子书语音音频的生成方法、装置及可读存储介质
TWI717627B (zh) * 2018-08-09 2021-02-01 台灣大哥大股份有限公司 電子書語音朗讀裝置及其方法
CN109189983A (zh) * 2018-09-18 2019-01-11 王全志 用于学习的语音播放方法及装置
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN110032355B (zh) * 2018-12-24 2022-05-17 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN109828711A (zh) * 2019-01-25 2019-05-31 努比亚技术有限公司 一种移动终端的阅读管理方法、移动终端及存储介质
CN111833903A (zh) * 2019-04-22 2020-10-27 珠海金山办公软件有限公司 一种执行操作任务的方法及装置
CN111324330A (zh) * 2020-02-07 2020-06-23 掌阅科技股份有限公司 电子书的播放处理方法、计算设备及计算机存储介质
CN111459446A (zh) * 2020-03-27 2020-07-28 掌阅科技股份有限公司 电子书的资源处理方法、计算设备及计算机存储介质
CN113779204A (zh) * 2020-06-09 2021-12-10 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN107369462B (zh) 2020-06-26
WO2019015613A1 (zh) 2019-01-24

Similar Documents

Publication Publication Date Title
CN107369462A (zh) 电子书语音播放方法、装置及终端设备
JP7065740B2 (ja) アプリケーション機能情報表示方法、装置、及び端末装置
US10997364B2 (en) Operations on sound files associated with cells in spreadsheets
US7500193B2 (en) Method and apparatus for annotating a line-based document
US9031493B2 (en) Custom narration of electronic books
US9218110B2 (en) Information processing apparatus, information processing method, information processing program and recording medium for storing the program
US20100050064A1 (en) System and method for selecting a multimedia presentation to accompany text
CN107577385A (zh) 媒体环境中的智能自动化助理
JP2015517684A (ja) コンテンツのカスタマイズ
US10642463B2 (en) Interactive management system for performing arts productions
US20220093132A1 (en) Method for acquiring video and electronic device
CN105190678A (zh) 语言学习环境
US20180226101A1 (en) Methods and systems for interactive multimedia creation
KR101158319B1 (ko) 어학학습 전자기기 구동 방법, 시스템 및 이를 응용한 동시통역 학습기
CN113365134B (zh) 音频分享方法、装置、设备及介质
EP3506255A1 (en) Voice feedback for user interface of media playback device
KR20100007702A (ko) 애니메이션 제작 방법 및 장치
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
US20150106394A1 (en) Automatically playing audio announcements in music player
CN106873869A (zh) 一种音乐播放的控制方法及装置
CN109923515A (zh) 使用网络可寻址设备创建电影化的讲故事体验
US11049490B2 (en) Audio playback device and audio playback method thereof for adjusting text to speech of a target character using spectral features
US20220246135A1 (en) Information processing system, information processing method, and recording medium
CN114023301A (zh) 音频编辑方法、电子设备及存储介质
CN105868400A (zh) 录音信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200604

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 03

Applicant before: GUANGZHOU ALIBABA LITERATURE INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant