一种机器人讲故事的方法、装置、机器人及存储介质
技术领域
本申请属于智能机器人技术领域,尤其涉及一种机器人讲故事的方法、装置、机器人及存储介质。
背景技术
现有技术中,一些服务型机器人具备讲故事的功能,目前机器人讲故事的方式通常有两种,一是机器人通过获取纯语音文件进行播放的方式,二是机器人通过获取文本文件,然后将文本文件转换成语音信息进行播放的方式。
然而,采用第一种方式会消耗大量的流量,采用第二种方式虽然消耗流量比较小,但是转换的语音只包括一种音色,声音单调,不易引起听众的兴趣,用户体验不高。
发明内容
有鉴于此,本申请提供了一种机器人讲故事的方法、装置、机器人及存储介质,既可以减少流量的消耗,又可以采用多角色所对应音色的语音来讲故事,使得故事更加生动有趣,有效提高用户体验。
本申请第一方面提供了一种机器人讲故事的方法,包括:
获取包含故事内容的文本文件;
提取所述故事内容中的各个角色信息;
生成与各个角色信息所对应音色的语音;
基于各个角色信息所对应音色的语音朗读所述故事内容。
本申请第二方面提供了一种机器人讲故事的装置,包括:
文本获取单元,用于获取包含故事内容的文本文件;
角色提取单元,用于提取所述故事内容中的各个角色信息;
音色生成单元,用于生成与各个角色信息所对应音色的语音;
朗读单元,用于基于各个角色信息所对应音色的语音朗读所述故事内容。
本申请第三方面提供了一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述方法的步骤。
本申请与现有技术相比,通过获取文本文件的方式,避免了现有技术中获取纯语音文件时消耗大量流量的技术问题,并通过提取故事内容中的各个角色信息,生成与各个角色信息所对应音色的语音,通过各个角色信息所对应音色的语音朗读所述故事内容,解决了现有技术采用一种音色的语音朗读故事内容,声音单调,趣味性低,用户体验不高的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例一提供的一种机器人讲故事的方法的实现流程示意图;
图2是本申请实施例二提供的一种机器人讲故事的方法的实现流程示意图;
图3是本申请实施例三提供的一种机器人讲故事的装置的结构示意图;
图4是本申请实施例三提供的音色生成单元的结构示意图;
图5是本申请实施例三提供的朗读单元的结构示意图;
图6是本申请实施例四提供的机器人的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
实施例一
下面对本申请实施例一提供的一种机器人讲故事的方法进行描述,请参阅附图1,本申请实施例一种的一种机器人讲故事的方法包括步骤S101-S104。
步骤S101,获取包含故事内容的文本文件。
在该实施例中,首先获取包含故事内容的文本文件,所述故事内容可以包括至少一个角色信息。比如《花千骨》、《大灰狼与小红帽》或者《郭德纲相声》等文本文件,所述文本文件可以标注每段文字所对应的角色信息,或者也可以不标注所对应的角色信息,当不标注对应的角色信息时,机器人可提取每段文字的关键词来进行识别该文本段对应的角色信息,本申请对文本文件的具体格式不作限定。
步骤S102,提取所述故事内容中的各个角色信息。
在该实施例中,可以根据获取的文本文件来提取所应对应的角色信息,当文本文件中标注了每段文字所对应的角色信息时,机器人可以通过文字识别来确定该段文字的角色信息,比如,文本文件为“大灰狼:小红帽,我要吃了你!”。则机器人可以首先识别冒号所在的位置,然后提取冒号前的文字,并与数据库进行匹配,判断该段文字所对应的角色信息。
当文本文件未标注角色信息时,比如文本文件为:
小红帽,我要吃了你!
该段文字,未标注角色信息,则机器人可以对每段文字的关键词进行提取,比如可以提取该段文字的第1、6、11……个字起始的连续的三个字,则对于该段文字,可以提取“小红帽”和“吃了你”,将提取出词语与数据库中预先存储的词语进行匹配,找到与提取出的词语对应的角色信息,其中,数据库中可以预先存储有每个角色的常用词语,对于关键词的提取方式本申请不作限定。
此外,用户也可以对文本文件的角色信息自定义,比如《大灰狼与小红帽》的故事中,当机器人识别出大灰狼与小红帽后,用户可以将角色大灰狼替换为用户感兴趣的角色,比如郭德纲、孙悟空、林志玲等,以进一步增加趣味性。
S103,生成与各个角色信息所对应音色的语音。
例如,女生角色采用女性的语音,男生角色采用男性的语音。另外,还可以进一步区分不同年龄层的角色,根据不同年龄层的角色的特点生成对应音色的语音。
S104,基于各个角色信息所对应音色的语音朗读所述故事内容。
在该实施例中,可以在数据库中,提取与各个角色信息所对应的音色参数,并利用所得到的音色参数生成对应的语音,通过所述语音朗读故事内容,比如,所提取的角色信息为大灰狼,则可以在数据库中寻找大灰狼所对应的音色参数,所述数据库可以存储在本地和/或服务器上,机器人可以先在本地的存储器中寻找是否保存有与大灰狼所对应的音色,当未找到时,可以在服务器中寻找大灰狼所对应的音色,或者也可以从服务器中下载大灰狼的声纹数据,根据声纹数据提取大灰狼的音色参数。
在本申请实施例中,通过获取文本文件的方式,避免了现有技术中获取纯语音文件时消耗大量流量的技术问题,并通过提取故事内容中的各个角色信息,生成与各个角色信息所对应音色的语音,实现了不同的角色可以用不同的音色所对应的语音特征朗读出来,解决了现有技术中将文本文件转换成语音时,声音单调,用户体验不高的技术问题。
实施例二
附图2是本申请实施例二提供的一种机器人讲故事的方法的实现流程示意图,包括步骤S201-S213。
步骤S201,获取包含故事内容的文本文件。
步骤S202,提取所述故事内容中的各个角色信息。
本实施例中,步骤S201-S202与实施例一所述的步骤S101-S102执行方式相同,具体参见实施例一的描述,此处不再赘述。
此外,在该步骤后,还可以包括以列表的方式存储各个角色信息,其中列表中各个角色信息的顺序按照所述故事内容的出场顺序进行排列。比如,《大灰狼与小红帽》的故事中,每个段落对应的角色依次为:旁白、小红帽、大灰狼、旁白、小红帽,则可以按照角色出场顺序依次存储角色信息:旁白、小红帽、大灰狼、旁白、小红帽。
步骤S203,判断本地是否存储有所述各个角色信息所对应音色的语音,若是,则执行S204,否则,则执行S205。
步骤S204,从本地获取每一个角色信息所对应音色的语音,建立并保存每一个角色信息与其所对应音色的语音的对应关系
步骤S205,获取第一角色信息与第二角色信息,从网络获取各个第一角色信息所对应的声纹数据,根据所述声纹数据生成对应音色的语音,建立并保存每一个第一角色信息与其所对应音色的语音的对应关系,从本地获取各个第二角色信息所对应音色的语音,建立并保存每一个第二角色信息与其对应音色的语音的对应关系。
在该实施例中,给出了一种生成与各个角色语音所对应音色的语音的方法,首先机器人判断文本文件的各个角色信息所对应的音色参数是否全部保存在本地,若是,则建立并保存每一个角色信息与音色参数的对应关系,若否,则对于本地没有保存音色参数的第一角色信息,会向服务器请求下载与该角色信息相对应的声纹数据,然后机器人从该声纹数据中提取音色参数,建立并保存每一个第一角色信息与其所对应音色的语音的对应关系,对于本地保存音色参数的第二角色信息,直接建立并保存每一个第二角色信息与音色参数的对应关系。
步骤S206,确定所述故事内容中当前待朗读的故事片段。
步骤S207,确定所述当前待朗读的故事片段所对应的角色信息,并获取该角色信息对应音色的语音。
步骤S208,基于该角色对应音色的语音朗读该故事片段。
步骤S209,判断故事是否结束,若否,则执行S210,若否,则执行S211。
在该实施例中,提供了一种朗读故事内容的方法,首先确定当前待朗读故事片段以及对应的音色参数,然后根据该音色参数读取该故事片段,重复执行上述过程直到故事结束。
此外,为保证语音信息的逼真,每一角色除了对应音色参数外,还可以对应有语速、声调等语音特征参数信息,因此,在这种情况下会占据较大的存储空间,因此,在本申请实施例中,还可以检查后续文本段落中所包含角色信息,当某一角色不在后续的文本段落中出现时,则可以删除其所对应的音色特征参数,释放资源,保证足够的内存大小,在这种情况下,相比于传统的获取纯语音文件进行播放的方式会占用较小的存储空间。
在本申请实施例中,通过获取文本文件的方式,避免了现有技术中获取纯语音文件时消耗大量流量的技术问题,并通过提取故事内容中的各个角色信息,生成与各个角色信息所对应音色的语音,实现了不同的角色可以用不同的音色所对应的语音特征朗读出来,解决了现有技术中将文本文件转换成语音时,声音单调,用户体验不高的技术问题。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例三
附图3是本申请实施例三提供的一种机器人讲故事的装置,为了便于说明,仅示出与本申请相关的部分,如图3所示机器人讲故事的装置300包括单元301-304。
文本获取单元301,用于获取包含故事内容的文本文件。
角色提取单元302,用于提取所述故事内容中的各个角色信息。
音色生成单元303,用于生成与各个角色信息所对应音色的语音。
朗读单元304,用于基于各个角色信息所对应音色的语音朗读所述故事内容。
优选地,所述音色生成单元303可以进一步包括子单元3031-3033,如图4所示。
判断子单元3031,用于判断本地是否存储有所述各个角色信息所对应音色的语音;
音色生成第一子单元3032,用于若是,从本地获取每一个角色信息所对应音色的语音,建立并保存每一个角色信息与其对应音色的语音的对应关系;
音色生成第二子单元3033,用于若否,则获取第一角色信息和第二角色信息,从网络获取各个第一角色信息对应的声纹数据,根据所述声纹数据生成对应音色的语音,建立并保存每一个第一角色信息与其对应音色的语音的对应关系,从本地获取各个第二角色信息所对应音色的语音,建立并保存每一个第二角色信息与其对应音色的语音的对应关系,其中所述第一角色信息是指所述各个角色信息中本地未存储有对应音色的语音的角色信息,所述第二角色信息是指所述各个角色信息中本地存储有对应音色的语音的角色信息。
优选地,所述朗读单元304可以进一步包括子单元3041-3044,如图5所示。
当前片段确定子单元3041,用于确定所述故事内容中当前待朗读的故事片段,所述故事片段为单个角色对应的文本段;
当前音色确定子单元3042,用于确定所述当前待朗读的故事片段所对应的角色信息,并获取该角色信息对应音色的语音;
当前片段朗读子单元3043,用于基于该角色信息对应音色的语音朗读该故事片段;
下一片段朗读子单元3044,用于当所述故事内容中的所有故事片段未朗读完时,获取下一个故事片段,并将所述下一个故事片段作为当前待朗读片段。
进一步地,所述朗读单元304还可以包括标记子单元,用于标记所述故事内容中每一个故事片段所属的角色信息。
进一步地,所述机器人讲故事的装置300还可以包括角色信息存储单元,用于以列表的方式存储所述各个角色信息,其中列表中各个角色信息的顺序按照所述故事内容中角色的出场顺序进行排列。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例四
图6是本申请实施例四提供的机器人的结构示意图。如图6所示,该机器人4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现如上述的机器人讲故事的方法中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器40执行所述计算机程序42时实现如上述的机器人讲故事的装置中各单元的功能,例如图3所示单元301至304的功能。
所述机器人4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图6仅仅是机器人4的示例,并不构成对机器人4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述机器人4还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述机器人4的内部存储单元,例如机器人4的硬盘或内存。所述存储器41也可以是所述机器人4的外部存储设备,例如机器人4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器41还可以既包括所述机器人4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述机器人所需的其它程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。