CN104123857B

CN104123857B - 一种实现个性化点读的设备及方法

Info

Publication number: CN104123857B
Application number: CN201410335751.9A
Authority: CN
Inventors: 张震
Original assignee: WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Current assignee: Cereal Technology (Shenzhen) Co., Ltd.
Priority date: 2014-07-16
Filing date: 2014-07-16
Publication date: 2016-08-17
Anticipated expiration: 2034-07-16
Also published as: CN104123857A

Abstract

本发明涉及实现个性化点读的设备及方法，所述方法包括在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成个性化语音关键词词典；然后，基于该关键词词典，生成基于样本采集对象的个性化语言模型；在建立个性化语言模型之后，当使用者通过点读设备进行点读时，点读设备通过常规点读方法，获取需要朗读的文本内容，随后，由点读设备基于个性化语言模型将该文本内容生成个性化语音朗读内容，并通过点读设备实现播放，从而扩大了点读设备的应用。

Description

一种实现个性化点读的设备及方法

技术领域

本发明涉及一种实现个性化点读的设备及方法。属于点读笔技术领域。

背景技术

现在市场上有很多点读笔等学习用品，点读笔是运用光电识别技术，结合语音技术开发而成的一种阅读和学习工具，通常与教材配合使用，通过识别印在学习教材上的光学辨别码，点读笔找到对应的内部保存的音视频内容，然后通过自带的喇叭播放音频。

然而，现有点读笔只能按照预先设定好的语音对点读内容进行朗诵，应用受到了限制，无法根据用户的需要进行个性化点读。例如，点读笔使用过程中，有些用户习惯于特定人的语音，特别是针对婴幼儿的点读笔，使用点读笔点读故事、图画或其他内容的小朋友喜欢听到父亲、母亲、自己或者是特定亲人为自己讲解朗读声音，而现有点读设备并不能满足上述需要，从而限制了点读设备的应用。

因此，如何对现有点读笔进行改进，使得通过该点读设备能够模拟用户的声音进行点读内容的朗诵，成为目前需要解决的技术问题。

发明内容

本发明的目的是如何设计一种能够模拟用户的声音进行点读内容的朗诵的方法及设备。

本发明的技术方案如下：

一种通过点读设备实现个性化点读的方法，具体包括以下步骤：

在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成个性化语音关键词词典；其中，在个性化语音样本采集过程中，通过所述点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。

在对个性化语音样本进行处理和关键词词典建立之后，基于该关键词词典，生成基于样本采集对象的个性化语言模型。

在建立个性化语言模型之后，当使用者通过点读设备进行点读时，点读设备通过常规点读方法，获取需要朗读的文本内容，随后，由点读设备基于个性化语言模型将该文本内容生成个性化语音朗读内容，并通过点读设备实现播放。

其中，所述关键词词典根据重要性分为由低到高的若干等级，所述等级越高采样样本越完善，语音模拟程度也越高。并且，所述关键词词典等级能够由用户进行选择。若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备。

此外，还提供了一种实现个性化点读的点读设备，所述点读设备包括：

个性化语音关键词词典形成模块，用于形成个性化语音关键词词典；所述个性化语音关键词词典是在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成的；其中，在个性化语音样本采集过程中，通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。

个性化语言模型生成模块，用于在对个性化语音样本进行处理和关键词词典形成之后，基于该关键词词典，生成基于样本采集对象的个性化语言模型。

个性化语音朗读内容生成模块，用于在生成个性化语言模型之后，当使用者通过点读设备进行点读时，在点读设备通过常规点读方法获取需要朗读的文本内容后，基于个性化语言模型将所述文本内容生成个性化语音朗读内容，并通过点读设备实现播放。

若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。

本发明在采集个性化声音样本后，在点读设备中通过个性化语音生成技术实现将点读设备的语音点读个性化的目的，可以根据用户的需要，模拟不同用户的声音进行点读内容的朗诵，从而扩大了点读设备的应用。

附图说明

图1是本发明的实现个性化点读的点读设备结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明设计了一种实现个性化点读的设备及方法，通过语音生成技术，采集特定的语音样本后，把点读设备的朗诵语音替换为特定的语音，从而实现点读设备的个性化。

本发明所涉及的方法具体内容包括以下方面：

1、语音样本采集与关键词词典建立

构建个性化语音的第一步工作是进行个性化语音样本采集，并通过样本处理后形成使用者的个性化语音关键词词典。在个性化语音样本采集过程中，可以通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集，例如，预先通过点读设备或者其他设备采集孩子想听到的大人的语音样本，或者对点读笔使用者自身的语音进行采集。考虑到样本的数量和细致程度与建立耗费的成本相矛盾，可以采用分层次构建的方式，将关键词词典根据重要性分为由低到高的若干等级，等级越高采样样本越完善，语音模拟程度也越高。在使用过程中由用户选择自己希望建立的关键词词典等级，从而降低耗费的成本。其中，若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备。

2、基于关键词词典建立使用者个人语言模型

在对个性化语音样本进行处理和关键词词典建立之后，基于该关键词词典，通过一系列的语音处理算法，最终生成基于样本采集对象的个性化语言模型。

3、基于个性化语言模型实现个性化点读

在成功建立使用者个性化语言模型之后，当使用者通过点读设备进行点读时，点读设备通过常规点读技术，可以获取需要朗读的文本内容。随后，由点读设备基于个性化语言模型将该文本内容生成带有使用者个人特点的个性化语音朗读内容，并通过点读设备实现播放。其中，在存在多个个性化语言模型时，点读设备还能够根据用户的选择，选择特定的模型后，将所述文本内容生成对应的个性化语音朗读内容，并通过点读设备实现播放。例如，若点读设备中存在爸爸，妈妈等多个个性化语言模型时，可以通过点读设备进行选择其中某个模型，进行个性化点读。从而最终实现基于不同语音特色的个性化点读功能。

本发明还设计了一种实现个性化点读的点读设备，所述的设备包括个性化语音关键词词典形成模块，个性化语言模型生成模块以及个性化语音朗读内容生成模块。

所述的个性化语音关键词词典形成模块，用于形成个性化语音关键词词典；所述个性化语音关键词词典是在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成的；其中，在个性化语音样本采集过程中，通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。

所述的个性化语言模型生成模块，用于在对个性化语音样本进行处理和关键词词典形成之后，基于该关键词词典，生成基于样本采集对象的个性化语言模型。

所述的个性化语音朗读内容生成模块，用于在生成个性化语言模型之后，当使用者通过点读设备进行点读时，在点读设备通过常规点读方法获取需要朗读的文本内容后，基于个性化语言模型将所述文本内容生成个性化语音朗读内容，并通过点读设备实现播放。

所述关键词词典根据重要性分为由低到高的若干等级。其中，所述等级越高采样样本越完善，语音模拟程度也越高。而且，所述关键词词典等级能够由用户进行选择。若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

以上对本发明实施例所提供的点读设备、系统和方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种通过点读设备实现个性化点读的方法，其特征在于，具体包括以下步骤：

在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成个性化语音关键词词典；采用分层次构建的方式，将关键词词典根据重要性分为由低到高的若干等级；其中，由用户选择希望建立的关键词词典等级，在个性化语音样本采集过程中，通过所述点读设备或其他设备对将要模拟的一个或多个对象进行语音采集；

在对个性化语音样本进行处理和关键词词典建立之后，基于该关键词词典，生成基于样本采集对象的个性化语言模型；

2.根据权利要求1所述的方法，其特征在于，所述等级越高采样样本越完善，语音模拟程度也越高。

3.根据权利要求1或2所述的方法，其特征在于，若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备。

4.一种实现个性化点读的点读设备，其特征在于，具体包括：

个性化语音关键词词典形成模块，用于形成个性化语音关键词词典；所述个性化语音关键词词典是在点读设备进行点读之前，进行个性化语音样本采集，在完成语音样本采集后，通过对采集的样本进行处理形成的；其中，在个性化语音样本采集过程中，通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集；

个性化语言模型生成模块，用于在对个性化语音样本进行处理和关键词词典形成之后，基于该关键词词典，生成基于样本采集对象的个性化语言模型；

个性化语音朗读内容生成模块，用于在生成个性化语言模型之后，当使用者通过点读设备进行点读时，在点读设备通过常规点读方法获取需要朗读的文本内容后，基于个性化语言模型将所述文本内容生成个性化语音朗读内容，并通过点读设备实现播放；

其中，采用分层次构建的方式，将关键词词典根据重要性分为由低到高的若干等级，并且，关键词词典等级能够由用户进行选择。

5.根据权利要求4所述的点读设备，其特征在于，所述等级越高采样样本越完善，语音模拟程度也越高。

6.根据权利要求4-5任一项所述的点读设备，其特征在于，若通过其他设备对一个或多个对象进行语音采集，则在语音采集完成后，将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块；或者，在语音采集完成后，由其他设备通过对采集的样本进行处理形成个性化语音关键词词典，将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。