CN108053696A - 一种根据阅读内容进行声音播放的方法、装置和终端设备 - Google Patents

一种根据阅读内容进行声音播放的方法、装置和终端设备 Download PDF

Info

Publication number
CN108053696A
CN108053696A CN201810008014.6A CN201810008014A CN108053696A CN 108053696 A CN108053696 A CN 108053696A CN 201810008014 A CN201810008014 A CN 201810008014A CN 108053696 A CN108053696 A CN 108053696A
Authority
CN
China
Prior art keywords
reading content
sound
reading
content
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810008014.6A
Other languages
English (en)
Inventor
李洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Alibaba Literature Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Alibaba Literature Information Technology Co Ltd filed Critical Guangzhou Alibaba Literature Information Technology Co Ltd
Priority to CN201810008014.6A priority Critical patent/CN108053696A/zh
Publication of CN108053696A publication Critical patent/CN108053696A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本申请实施例提供了一种根据阅读内容进行声音播放的方法、装置和终端设备,所述方法包括:获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。本申请实施例改善听书功能的声音播放效果,增强听书功能的情景代入感。

Description

一种根据阅读内容进行声音播放的方法、装置和终端设备
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种根据阅读内容进行声音播放的方法、装置和终端设备。
背景技术
随着电子阅读的发展,主要阅读应用程序(APP)都有听书的功能,也就是把文字通过语音识别的技术,转换成语音。听书的功能对于不方便进行文字阅读的用户非常有用,用户也可以基于阅读环境以及护眼的需求选择开启听书的功能。
但通常听书的功能都存在一些体验不好的问题,例如播放的声音语气单调,不流畅等。此外,在听书的功能中的发音人设定后不能动态变更,各种阅读内容的采用同一发音人造成听书过程枯燥,无法实现阅读内容的情景代入。
因此,如何改善听书功能的声音播放效果成为现有技术中亟需解决的技术问题。
发明内容
本申请实施例提供了一种根据阅读内容进行声音播放的方法、装置和终端设备,其改善听书功能的声音播放效果,增强听书功能的情景代入感。
根据本申请实施例的一个方面,提供了一种根据阅读内容进行声音播放的方法,所述方法包括:
获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;
根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
根据本申请实施例的另一个方面,还提供了一种根据阅读内容进行声音播放的装置,所述装置包括:
类型确定模块,用于获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;
声音播放模块,用于根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
根据本申请实施例的又一个方面,还提供了一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的根据阅读内容进行声音播放的方法对应的操作。
根据本申请实施例提供的技术方案,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
附图说明
图1是根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤流程图;
图2是根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤S2的步骤流程图;
图3是根据本申请实施例二的一种根据阅读内容进行声音播放的方法的步骤流程图;
图4是根据本申请实施例三的一种根据阅读内容进行声音播放的装置的结构框图;
图5是根据本申请实施例三的一种根据阅读内容进行声音播放的装置的声音播放模块结构框图;
图6是根据本申请实施例四的一种根据阅读内容进行声音播放的装置的结构框图;
图7是根据本申请实施例五的一种终端设备的结构框图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本申请实施例的具体实施方式作进一步详细说明。以下实施例用于说明本申请,但不用来限制本申请的范围。
本领域技术人员可以理解,本申请实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
参照图1,示出了根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤流程图。
值得说明的是,本申请所述步骤S101至S102并不代表其执行的先后顺序。
本实施例的根据阅读内容进行声音播放的方法包括以下步骤:
步骤S101:获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。
在本实施例一具体实现中,所述阅读对象为可以为电子书等可阅读文件,本实施例用户在进行电子书阅读时,将阅读的电子书章节作为阅读内容。
具体地,所述阅读内容可以为一章内容,一节内容或者一段对话等。
本实施例根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。所述阅读内容的情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
比如,根据所述阅读内容为庆祝场景,则采用欢快声音类型;根据所述阅读内容为分离场景,则采用悲伤声音类型;根据所述阅读内容为男生或者女生,则分别采用男女声音类型;根据所述阅读内容涉及的老人还是儿童,则分别采用老人儿童声音类型;根据所述阅读内容伤心或者高兴,则分别采用伤心或者高兴声音类型等。
步骤S102:根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
在本申请实施例的具体实现中,参见图2,所述步骤S102包括:
步骤S1021:动态选择与所述声音类型匹配的声音参数设置所述语音合成器。
步骤S1022:令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
因此本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器,从而实现动态的根据所述阅读内容,播放不同声音类型的声音,进一步增强了听书功能的情景代入感。例如,在对话的场景下,根据不同角色动态改变不同声音类型,输出不同的声音播放对话。
通过本实施例,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
本实施例的根据阅读内容进行声音播放的方法可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行,包括但不限于:各种终端设备或者服务器,包括但不限于PC机、平板电脑、移动终端等。
实施例二
参照图3,示出了根据本申请实施例二的一种根据阅读内容进行声音播放的方法的步骤流程图。
值得说明的是,本申请所述步骤S301至S303并不代表其执行的先后顺序。
本实施例的根据阅读内容进行声音播放的方法包括以下步骤:
步骤S301:对所述阅读对象的阅读内容配置情节信息,所述情节信息标识所述阅读内容对应的声音类型。
具体地,本实施例在文学编辑对所述阅读对象进行编辑审核时,对所述阅读对象的阅读内容配置情节信息,标识出发音人类型的声音类型。
此外,本实施例也可以采用其他方式对所述阅读内容配置情节信息,比如通过机器学习的方式等。
步骤S302:获得所述阅读对象的阅读内容,所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。
在本实施例一具体实现中,所述阅读对象为可以为电子书等可阅读文件,本实施例用户在进行电子书阅读时,将阅读的电子书章节作为阅读内容。
具体地,所述阅读内容可以为一章内容,一节内容或者一段对话等。
本实施例根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。所述阅读内容的情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
比如,根据所述阅读内容为庆祝场景,则采用欢快声音类型;根据所述阅读内容为分离场景,则采用悲伤声音类型;根据所述阅读内容为男生或者女生,则分别采用男女声音类型;根据所述阅读内容涉及的老人还是儿童,则分别采用老人儿童声音类型;根据所述阅读内容伤心或者高兴,则分别采用伤心或者高兴声音类型等。
本实施例所述声音类型包含在阅读内容数据中,即本实施例获得阅读内容的同时可以获得所述阅读内容对应的声音类型,根据所述声音类型进行阅读内容播放。因此,由于所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型,本实施例可以实时的获得所述阅读内容对应的声音类型,以便实时根据所述声音类型实现声音的切换。
本申请也可以在加载阅读内容时,再根据阅读内容读取所述阅读内容对应的声音类型,或者每次根据所述阅读内容判断其声音类型。
步骤S303:根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
在本申请实施例的具体实现中,动态选择与所述声音类型匹配的声音参数设置所述语音合成器,令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
因此,本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器,从而实现动态的根据所述阅读内容,播放不同声音类型的声音,进一步增强了听书功能的情景代入感。例如,在对话的场景下,根据不同角色动态改变不同声音类型,输出不同的声音播放对话。
通过本实施例,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
本实施例的根据阅读内容进行声音播放的方法可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行,包括但不限于:各种终端设备或者服务器,包括但不限于PC机、平板电脑、移动终端等。
实施例三
参照图4,示出了根据本申请实施例三的一种根据阅读内容进行声音播放的装置的结构框图。
本实施例的根据阅读内容进行声音播放的装置包括:
类型确定模块401,用于获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;
声音播放模块402,用于根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
在本实施例一具体实现中,所述阅读对象为可以为电子书等可阅读文件,本实施例用户在进行电子书阅读时,将阅读的电子书章节作为阅读内容。
具体地,所述阅读内容可以为一章内容,一节内容或者一段对话等。
本实施例根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。所述阅读内容的情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
比如,根据所述阅读内容为庆祝场景,则采用欢快声音类型;根据所述阅读内容为分离场景,则采用悲伤声音类型;根据所述阅读内容为男生或者女生,则分别采用男女声音类型;根据所述阅读内容涉及的老人还是儿童,则分别采用老人儿童声音类型;根据所述阅读内容伤心或者高兴,则分别采用伤心或者高兴声音类型等。
在本申请实施例的具体实现中,参见图5,所述声音播放模块402包括:
参数设定单元4021,用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器。
声音输出单元4022,用于令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
因此本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器,从而实现动态的根据所述阅读内容,播放不同声音类型的声音,进一步增强了听书功能的情景代入感。例如,在对话的场景下,根据不同角色动态改变不同声音类型,输出不同的声音播放对话。
通过本实施例,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
本实施例的根据阅读内容进行声音播放的装置可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行,包括但不限于:各种终端设备或者服务器,包括但不限于PC机、平板电脑、移动终端等。
实施例四
参照图6,示出了根据本申请实施例四的一种根据阅读内容进行声音播放的装置的结构框图。
本实施例的根据阅读内容进行声音播放的装置包括:
类型设定模块601,用于对所述阅读对象的阅读内容配置情节信息,所述情节信息标识所述阅读内容对应的声音类型。
类型确定模块602,用于获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。
声音播放模块603,用于根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
具体地,本实施例在文学编辑对所述阅读对象进行编辑审核时,对所述阅读对象的阅读内容配置情节信息,标识出发音人类型的声音类型。
此外,本实施例也可以采用其他方式对所述阅读内容配置情节信息,比如通过机器学习的方式等。
在本实施例一具体实现中,所述阅读对象为可以为电子书等可阅读文件,本实施例用户在进行电子书阅读时,将阅读的电子书章节作为阅读内容。
具体地,所述阅读内容可以为一章内容,一节内容或者一段对话等。
本实施例根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。所述阅读内容的情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
比如,根据所述阅读内容为庆祝场景,则采用欢快声音类型;根据所述阅读内容为分离场景,则采用悲伤声音类型;根据所述阅读内容为男生或者女生,则分别采用男女声音类型;根据所述阅读内容涉及的老人还是儿童,则分别采用老人儿童声音类型;根据所述阅读内容伤心或者高兴,则分别采用伤心或者高兴声音类型等。
本实施例所述声音类型包含在阅读内容数据中,即本实施例获得阅读内容的同时可以获得所述阅读内容对应的声音类型,根据所述声音类型进行阅读内容播放。因此,由于所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型,本实施例可以实时的获得所述阅读内容对应的声音类型,以便实时根据所述声音类型实现声音的切换。
本申请也可以在加载阅读内容时,再根据阅读内容读取所述阅读内容对应的声音类型,或者每次根据所述阅读内容判断其声音类型。
在本申请实施例的具体实现中,动态选择与所述声音类型匹配的声音参数设置所述语音合成器,令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
因此,本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器,从而实现动态的根据所述阅读内容,播放不同声音类型的声音,进一步增强了听书功能的情景代入感。例如,在对话的场景下,根据不同角色动态改变不同声音类型,输出不同的声音播放对话。
通过本实施例,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
本实施例的根据阅读内容进行声音播放的方法可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行,包括但不限于:各种终端设备或者服务器,包括但不限于PC机、平板电脑、移动终端等。
实施例五
参照图7,示出了根据本申请实施例五的一种终端设备的结构框图,本申请具体实施例并不对终端设备的具体实现做限定。
如图7所示,该终端设备可以包括:处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。
其中:
处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。
通信接口704,用于与其它设备比如其它终端或服务器等的网元通信。
处理器702,用于执行程序710,具体可以执行上述根据阅读内容进行声音播放的方法实施例中的相关步骤。
具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。
处理器702可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。终端设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器706,用于存放程序710。存储器706可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序710具体可以用于使得处理器702执行以下操作:获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
在一种可选的实施方式中,程序710还用于对所述阅读对象的阅读内容配置情节信息,所述情节信息标识所述阅读内容对应的声音类型。
在一种可选的实施方式中,程序710还用于获得所述阅读对象的阅读内容,所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。
在一种可选的实施方式中,所述情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
在一种可选的实施方式中,程序710还用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器;令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
通过本实施例,本申请获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而,根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此,本申请输出的声音类型为根据阅读内容的情节信息确定的。因此,本申请改善听书功能的声音播放效果,增强听书功能的情景代入感,提升了用户体验,增强了用户黏性。
因此,本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器,从而实现动态的根据所述阅读内容,播放不同声音类型的声音,进一步增强了听书功能的情景代入感。例如,在对话的场景下,根据不同角色动态改变不同声音类型,输出不同的声音播放对话。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的根据阅读内容进行声音播放的方法。此外,当通用计算机访问用于实现在此示出的根据阅读内容进行声音播放的方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的根据阅读内容进行声音播放的方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。

Claims (11)

1.一种根据阅读内容进行声音播放的方法,其特征在于,所述方法包括:
获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;
根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
2.根据权利要求1所述的方法,其特征在于,所述获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型之前还包括:
对所述阅读对象的阅读内容配置情节信息,所述情节信息标识所述阅读内容对应的声音类型。
3.根据权利要求2所述的方法,其特征在于,所述获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型具体为:
获得所述阅读对象的阅读内容,所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。
4.根据权利要求3所述的方法,其特征在于,所述情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容包括:
动态选择与所述声音类型匹配的声音参数设置所述语音合成器;
令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
6.一种根据阅读内容进行声音播放的装置,其特征在于,所述装置包括:
类型确定模块,用于获得阅读对象的阅读内容,并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型;
声音播放模块,用于根据所述声音类型,设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
类型设定模块,用于对所述阅读对象的阅读内容配置情节信息,所述情节信息标识所述阅读内容对应的声音类型。
8.根据权利要求7所述的装置,其特征在于,所述类型确定模块具体用于:
获得所述阅读对象的阅读内容,所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。
9.根据权利要求8所述的装置,其特征在于,所述情节信息包括:
场景信息、人物性别、人物年龄、人物情绪中至少其一。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述声音播放模块包括:
参数设定单元,用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器;
声音输出单元,用于令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。
11.一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-5中任一项对应的操作。
CN201810008014.6A 2018-01-04 2018-01-04 一种根据阅读内容进行声音播放的方法、装置和终端设备 Pending CN108053696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810008014.6A CN108053696A (zh) 2018-01-04 2018-01-04 一种根据阅读内容进行声音播放的方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810008014.6A CN108053696A (zh) 2018-01-04 2018-01-04 一种根据阅读内容进行声音播放的方法、装置和终端设备

Publications (1)

Publication Number Publication Date
CN108053696A true CN108053696A (zh) 2018-05-18

Family

ID=62126423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810008014.6A Pending CN108053696A (zh) 2018-01-04 2018-01-04 一种根据阅读内容进行声音播放的方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN108053696A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962219A (zh) * 2018-06-29 2018-12-07 百度在线网络技术(北京)有限公司 用于处理文本的方法和装置
CN109273001A (zh) * 2018-10-25 2019-01-25 珠海格力电器股份有限公司 一种语音播报方法、装置、计算装置和存储介质
CN109981448A (zh) * 2019-03-28 2019-07-05 联想(北京)有限公司 信息处理方法和电子设备
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN111667811A (zh) * 2020-06-15 2020-09-15 北京百度网讯科技有限公司 语音合成方法、装置、设备和介质
CN112562430A (zh) * 2019-09-26 2021-03-26 阿里巴巴集团控股有限公司 辅助阅读方法、视频播放方法、装置、设备及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954361A (zh) * 2004-05-11 2007-04-25 松下电器产业株式会社 声音合成装置和方法
US20120001923A1 (en) * 2010-07-03 2012-01-05 Sara Weinzimmer Sound-enhanced ebook with sound events triggered by reader progress
CN102385858A (zh) * 2010-08-31 2012-03-21 国际商业机器公司 情感语音合成方法和系统
CN103020105A (zh) * 2011-09-27 2013-04-03 株式会社东芝 文档读出支持设备和方法
CN103310784A (zh) * 2012-03-14 2013-09-18 株式会社东芝 文本到语音的方法和系统
CN103366731A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音合成方法及系统
CN103543979A (zh) * 2012-07-17 2014-01-29 联想(北京)有限公司 一种输出语音的方法、语音交互的方法及电子设备
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN106384586A (zh) * 2016-09-07 2017-02-08 北京小米移动软件有限公司 朗读文本信息的方法及装置
CN106688035A (zh) * 2014-10-30 2017-05-17 株式会社东芝 声音合成装置、声音合成方法及程序
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN107452400A (zh) * 2017-07-24 2017-12-08 珠海市魅族科技有限公司 语音播报方法及装置、计算机装置和计算机可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954361A (zh) * 2004-05-11 2007-04-25 松下电器产业株式会社 声音合成装置和方法
US20120001923A1 (en) * 2010-07-03 2012-01-05 Sara Weinzimmer Sound-enhanced ebook with sound events triggered by reader progress
CN102385858A (zh) * 2010-08-31 2012-03-21 国际商业机器公司 情感语音合成方法和系统
CN103020105A (zh) * 2011-09-27 2013-04-03 株式会社东芝 文档读出支持设备和方法
CN103310784A (zh) * 2012-03-14 2013-09-18 株式会社东芝 文本到语音的方法和系统
CN103366731A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音合成方法及系统
CN103543979A (zh) * 2012-07-17 2014-01-29 联想(北京)有限公司 一种输出语音的方法、语音交互的方法及电子设备
CN106688035A (zh) * 2014-10-30 2017-05-17 株式会社东芝 声音合成装置、声音合成方法及程序
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN106384586A (zh) * 2016-09-07 2017-02-08 北京小米移动软件有限公司 朗读文本信息的方法及装置
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN107452400A (zh) * 2017-07-24 2017-12-08 珠海市魅族科技有限公司 语音播报方法及装置、计算机装置和计算机可读存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962219A (zh) * 2018-06-29 2018-12-07 百度在线网络技术(北京)有限公司 用于处理文本的方法和装置
CN109273001A (zh) * 2018-10-25 2019-01-25 珠海格力电器股份有限公司 一种语音播报方法、装置、计算装置和存储介质
CN109273001B (zh) * 2018-10-25 2021-06-18 珠海格力电器股份有限公司 一种语音播报方法、装置、计算装置和存储介质
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN110032355B (zh) * 2018-12-24 2022-05-17 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN109981448A (zh) * 2019-03-28 2019-07-05 联想(北京)有限公司 信息处理方法和电子设备
CN109981448B (zh) * 2019-03-28 2022-03-25 联想(北京)有限公司 信息处理方法和电子设备
CN112562430A (zh) * 2019-09-26 2021-03-26 阿里巴巴集团控股有限公司 辅助阅读方法、视频播放方法、装置、设备及存储介质
CN111667811A (zh) * 2020-06-15 2020-09-15 北京百度网讯科技有限公司 语音合成方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN108053696A (zh) 一种根据阅读内容进行声音播放的方法、装置和终端设备
CN105006234B (zh) 一种k歌处理方法及装置
CN106652997B (zh) 一种音频合成的方法及终端
CN106804005B (zh) 一种视频的制作方法及移动终端
US8983842B2 (en) Apparatus, process, and program for combining speech and audio data
US20180090116A1 (en) Audio Processing Method, Apparatus and System
CN104966527A (zh) K歌处理方法、装置以及k歌处理系统
CN110264986A (zh) 在线k歌装置、方法及计算机可读存储介质
CN104050961A (zh) 语音合成装置和方法以及存储有语音合成程序的记录介质
CN109190879B (zh) 一种训练改编水平评价模型、评价改编水平的方法及装置
JP2019091416A (ja) 人工知能応用を構築する方法及び装置
CN111583973B (zh) 一种音乐分享方法、装置及计算机可读存储介质
CN109785868A (zh) 音乐文件转化与播放方法、装置、计算机设备及存储介质
CN110797001B (zh) 电子书语音音频的生成方法、装置及可读存储介质
CN104866186B (zh) 一种文字播放方法和电子设备
CN108509605A (zh) 一种新闻信息的语音播放方法、装置和终端设备
CN108777804A (zh) 媒体播放方法及装置
WO2023005193A1 (zh) 字幕显示方法及装置
CN109508166A (zh) 音频播放方法、装置、设备及存储介质
CN108806732A (zh) 一种基于人工智能的背景音乐处理方法以及电子设备
CN113963674A (zh) 作品生成的方法、装置、电子设备及存储介质
CN112685000B (zh) 音频处理方法、装置、计算机设备及存储介质
KR101975193B1 (ko) 자동 작곡 장치 및 컴퓨터 수행 가능한 자동 작곡 방법
CN111883090A (zh) 基于移动终端的音频文件的制作方法及装置
CN110109645A (zh) 一种交互式音乐试听方法、装置和终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200604

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 03

Applicant before: GUANGZHOU ALIBABA LITERATURE INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180518

RJ01 Rejection of invention patent application after publication