CN104123857B - 一种实现个性化点读的设备及方法 - Google Patents

一种实现个性化点读的设备及方法 Download PDF

Info

Publication number
CN104123857B
CN104123857B CN201410335751.9A CN201410335751A CN104123857B CN 104123857 B CN104123857 B CN 104123857B CN 201410335751 A CN201410335751 A CN 201410335751A CN 104123857 B CN104123857 B CN 104123857B
Authority
CN
China
Prior art keywords
reading
key word
word dictionary
equipment
personalized speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410335751.9A
Other languages
English (en)
Other versions
CN104123857A (zh
Inventor
张震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cereal Technology (Shenzhen) Co., Ltd.
Original Assignee
WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING filed Critical WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Priority to CN201410335751.9A priority Critical patent/CN104123857B/zh
Publication of CN104123857A publication Critical patent/CN104123857A/zh
Application granted granted Critical
Publication of CN104123857B publication Critical patent/CN104123857B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及实现个性化点读的设备及方法,所述方法包括在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成个性化语音关键词词典;然后,基于该关键词词典,生成基于样本采集对象的个性化语言模型;在建立个性化语言模型之后,当使用者通过点读设备进行点读时,点读设备通过常规点读方法,获取需要朗读的文本内容,随后,由点读设备基于个性化语言模型将该文本内容生成个性化语音朗读内容,并通过点读设备实现播放,从而扩大了点读设备的应用。

Description

一种实现个性化点读的设备及方法
技术领域
本发明涉及一种实现个性化点读的设备及方法。属于点读笔技术领域。
背景技术
现在市场上有很多点读笔等学习用品,点读笔是运用光电识别技术,结合语音技术开发而成的一种阅读和学习工具,通常与教材配合使用,通过识别印在学习教材上的光学辨别码,点读笔找到对应的内部保存的音视频内容,然后通过自带的喇叭播放音频。
然而,现有点读笔只能按照预先设定好的语音对点读内容进行朗诵,应用受到了限制,无法根据用户的需要进行个性化点读。例如,点读笔使用过程中,有些用户习惯于特定人的语音,特别是针对婴幼儿的点读笔,使用点读笔点读故事、图画或其他内容的小朋友喜欢听到父亲、母亲、自己或者是特定亲人为自己讲解朗读声音,而现有点读设备并不能满足上述需要,从而限制了点读设备的应用。
因此,如何对现有点读笔进行改进,使得通过该点读设备能够模拟用户的声音进行点读内容的朗诵,成为目前需要解决的技术问题。
发明内容
本发明的目的是如何设计一种能够模拟用户的声音进行点读内容的朗诵的方法及设备。
本发明的技术方案如下:
一种通过点读设备实现个性化点读的方法,具体包括以下步骤:
在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成个性化语音关键词词典;其中,在个性化语音样本采集过程中,通过所述点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。
在对个性化语音样本进行处理和关键词词典建立之后,基于该关键词词典,生成基于样本采集对象的个性化语言模型。
在建立个性化语言模型之后,当使用者通过点读设备进行点读时,点读设备通过常规点读方法,获取需要朗读的文本内容,随后,由点读设备基于个性化语言模型将该文本内容生成个性化语音朗读内容,并通过点读设备实现播放。
其中,所述关键词词典根据重要性分为由低到高的若干等级,所述等级越高采样样本越完善,语音模拟程度也越高。并且,所述关键词词典等级能够由用户进行选择。若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备。
此外,还提供了一种实现个性化点读的点读设备,所述点读设备包括:
个性化语音关键词词典形成模块,用于形成个性化语音关键词词典;所述个性化语音关键词词典是在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成的;其中,在个性化语音样本采集过程中,通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。
个性化语言模型生成模块,用于在对个性化语音样本进行处理和关键词词典形成之后,基于该关键词词典,生成基于样本采集对象的个性化语言模型。
个性化语音朗读内容生成模块,用于在生成个性化语言模型之后,当使用者通过点读设备进行点读时,在点读设备通过常规点读方法获取需要朗读的文本内容后,基于个性化语言模型将所述文本内容生成个性化语音朗读内容,并通过点读设备实现播放。
若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。
本发明在采集个性化声音样本后,在点读设备中通过个性化语音生成技术实现将点读设备的语音点读个性化的目的,可以根据用户的需要,模拟不同用户的声音进行点读内容的朗诵,从而扩大了点读设备的应用。
附图说明
图1是本发明的实现个性化点读的点读设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明设计了一种实现个性化点读的设备及方法,通过语音生成技术,采集特定的语音样本后,把点读设备的朗诵语音替换为特定的语音,从而实现点读设备的个性化。
本发明所涉及的方法具体内容包括以下方面:
1、语音样本采集与关键词词典建立
构建个性化语音的第一步工作是进行个性化语音样本采集,并通过样本处理后形成使用者的个性化语音关键词词典。在个性化语音样本采集过程中,可以通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集,例如,预先通过点读设备或者其他设备采集孩子想听到的大人的语音样本,或者对点读笔使用者自身的语音进行采集。考虑到样本的数量和细致程度与建立耗费的成本相矛盾,可以采用分层次构建的方式,将关键词词典根据重要性分为由低到高的若干等级,等级越高采样样本越完善,语音模拟程度也越高。在使用过程中由用户选择自己希望建立的关键词词典等级,从而降低耗费的成本。其中,若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备。
2、基于关键词词典建立使用者个人语言模型
在对个性化语音样本进行处理和关键词词典建立之后,基于该关键词词典,通过一系列的语音处理算法,最终生成基于样本采集对象的个性化语言模型。
3、基于个性化语言模型实现个性化点读
在成功建立使用者个性化语言模型之后,当使用者通过点读设备进行点读时,点读设备通过常规点读技术,可以获取需要朗读的文本内容。随后,由点读设备基于个性化语言模型将该文本内容生成带有使用者个人特点的个性化语音朗读内容,并通过点读设备实现播放。其中,在存在多个个性化语言模型时,点读设备还能够根据用户的选择,选择特定的模型后,将所述文本内容生成对应的个性化语音朗读内容,并通过点读设备实现播放。例如,若点读设备中存在爸爸,妈妈等多个个性化语言模型时,可以通过点读设备进行选择其中某个模型,进行个性化点读。从而最终实现基于不同语音特色的个性化点读功能。
本发明还设计了一种实现个性化点读的点读设备,所述的设备包括个性化语音关键词词典形成模块,个性化语言模型生成模块以及个性化语音朗读内容生成模块。
所述的个性化语音关键词词典形成模块,用于形成个性化语音关键词词典;所述个性化语音关键词词典是在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成的;其中,在个性化语音样本采集过程中,通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集。
所述的个性化语言模型生成模块,用于在对个性化语音样本进行处理和关键词词典形成之后,基于该关键词词典,生成基于样本采集对象的个性化语言模型。
所述的个性化语音朗读内容生成模块,用于在生成个性化语言模型之后,当使用者通过点读设备进行点读时,在点读设备通过常规点读方法获取需要朗读的文本内容后,基于个性化语言模型将所述文本内容生成个性化语音朗读内容,并通过点读设备实现播放。
所述关键词词典根据重要性分为由低到高的若干等级。其中,所述等级越高采样样本越完善,语音模拟程度也越高。而且,所述关键词词典等级能够由用户进行选择。若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的点读设备、系统和方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种通过点读设备实现个性化点读的方法,其特征在于,具体包括以下步骤:
在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成个性化语音关键词词典;采用分层次构建的方式,将关键词词典根据重要性分为由低到高的若干等级;其中,由用户选择希望建立的关键词词典等级,在个性化语音样本采集过程中,通过所述点读设备或其他设备对将要模拟的一个或多个对象进行语音采集;
在对个性化语音样本进行处理和关键词词典建立之后,基于该关键词词典,生成基于样本采集对象的个性化语言模型;
在建立个性化语言模型之后,当使用者通过点读设备进行点读时,点读设备通过常规点读方法,获取需要朗读的文本内容,随后,由点读设备基于个性化语言模型将该文本内容生成个性化语音朗读内容,并通过点读设备实现播放。
2.根据权利要求1所述的方法,其特征在于,所述等级越高采样样本越完善,语音模拟程度也越高。
3.根据权利要求1或2所述的方法,其特征在于,若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备。
4.一种实现个性化点读的点读设备,其特征在于,具体包括:
个性化语音关键词词典形成模块,用于形成个性化语音关键词词典;所述个性化语音关键词词典是在点读设备进行点读之前,进行个性化语音样本采集,在完成语音样本采集后,通过对采集的样本进行处理形成的;其中,在个性化语音样本采集过程中,通过点读设备或其他设备对将要模拟的一个或多个对象进行语音采集;
个性化语言模型生成模块,用于在对个性化语音样本进行处理和关键词词典形成之后,基于该关键词词典,生成基于样本采集对象的个性化语言模型;
个性化语音朗读内容生成模块,用于在生成个性化语言模型之后,当使用者通过点读设备进行点读时,在点读设备通过常规点读方法获取需要朗读的文本内容后,基于个性化语言模型将所述文本内容生成个性化语音朗读内容,并通过点读设备实现播放;
其中,采用分层次构建的方式,将关键词词典根据重要性分为由低到高的若干等级,并且,关键词词典等级能够由用户进行选择。
5.根据权利要求4所述的点读设备,其特征在于,所述等级越高采样样本越完善,语音模拟程度也越高。
6.根据权利要求4-5任一项所述的点读设备,其特征在于,若通过其他设备对一个或多个对象进行语音采集,则在语音采集完成后,将所采集的个性化语音样本传送给点读设备的个性化语音关键词词典形成模块;或者,在语音采集完成后,由其他设备通过对采集的样本进行处理形成个性化语音关键词词典,将个性化语音关键词词典传送给点读设备的个性化语音关键词词典形成模块。
CN201410335751.9A 2014-07-16 2014-07-16 一种实现个性化点读的设备及方法 Active CN104123857B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410335751.9A CN104123857B (zh) 2014-07-16 2014-07-16 一种实现个性化点读的设备及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410335751.9A CN104123857B (zh) 2014-07-16 2014-07-16 一种实现个性化点读的设备及方法

Publications (2)

Publication Number Publication Date
CN104123857A CN104123857A (zh) 2014-10-29
CN104123857B true CN104123857B (zh) 2016-08-17

Family

ID=51769250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410335751.9A Active CN104123857B (zh) 2014-07-16 2014-07-16 一种实现个性化点读的设备及方法

Country Status (1)

Country Link
CN (1) CN104123857B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107748744B (zh) * 2017-10-31 2021-01-26 广东小天才科技有限公司 一种勾勒框知识库的建立方法及装置
CN107798931A (zh) * 2017-12-05 2018-03-13 上海电机学院 一种智能幼教学习系统及方法
CN108847214B (zh) * 2018-06-27 2021-03-26 北京微播视界科技有限公司 语音处理方法、客户端、装置、终端、服务器和存储介质
CN109036374B (zh) * 2018-07-03 2019-12-03 百度在线网络技术(北京)有限公司 数据处理方法和装置
CN111352890A (zh) * 2018-12-20 2020-06-30 安徽蓁叶文化科技有限公司 一种基于光学图像识别技术的触控阅读器
CN110111640B (zh) * 2019-04-22 2022-03-08 苏州好字声教育科技有限公司 练字学习方法、练字笔及终端设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568472A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 说话人可选的语音合成系统及其实现方法
WO2012151786A1 (zh) * 2011-05-11 2012-11-15 北京航空航天大学 结合情感点的汉语语音情感提取及建模方法
CN102831195A (zh) * 2012-08-03 2012-12-19 河南省佰腾电子科技有限公司 个性化语音采集与语义确定系统及其方法
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
CN103198721A (zh) * 2013-03-27 2013-07-10 苏州市职业大学 苏州话学习系统
CN103455530A (zh) * 2012-10-25 2013-12-18 河南省佰腾电子科技有限公司 随身携带式创建个性化语音对应文本文字数据库的装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568472A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 说话人可选的语音合成系统及其实现方法
WO2012151786A1 (zh) * 2011-05-11 2012-11-15 北京航空航天大学 结合情感点的汉语语音情感提取及建模方法
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
CN102831195A (zh) * 2012-08-03 2012-12-19 河南省佰腾电子科技有限公司 个性化语音采集与语义确定系统及其方法
CN103455530A (zh) * 2012-10-25 2013-12-18 河南省佰腾电子科技有限公司 随身携带式创建个性化语音对应文本文字数据库的装置
CN103198721A (zh) * 2013-03-27 2013-07-10 苏州市职业大学 苏州话学习系统

Also Published As

Publication number Publication date
CN104123857A (zh) 2014-10-29

Similar Documents

Publication Publication Date Title
CN104123857B (zh) 一种实现个性化点读的设备及方法
CN105304080B (zh) 语音合成装置及方法
CN110998716A (zh) 经由教师-学生学习在话音识别中进行的域自适应
CN106384593B (zh) 一种语音信息转换、信息生成方法及装置
CN106980624B (zh) 一种文本数据的处理方法和装置
US10977299B2 (en) Systems and methods for consolidating recorded content
JP6876752B2 (ja) 応答方法及び装置
CN105702250B (zh) 语音识别方法和装置
JP6556575B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
KR20170026593A (ko) 소셜 대화형 입력들에 대한 컴퓨터 응답 생성
CN105426362A (zh) 语音翻译装置、方法及程序
CN103236259A (zh) 语音识别处理及反馈系统、语音回复方法
JP2020515913A (ja) 音声応答方法、装置及びスマートデバイス
CN107864410B (zh) 一种多媒体数据处理方法、装置、电子设备以及存储介质
US10108395B2 (en) Audio device with auditory system display and methods for use therewith
CN106547889A (zh) 一种题目推送方法及装置
US20120265527A1 (en) Interactive voice recognition electronic device and method
CN110019962B (zh) 一种视频文案信息的生成方法及装置
JP2016102920A (ja) 文書記録システム及び文書記録プログラム
EP1912193A1 (en) Interactive storyteller system
CN108986841A (zh) 音频信息处理方法、装置及存储介质
CN111105776A (zh) 有声播放装置及其播放方法
Peláez-Moreno et al. Analyzing phonetic confusions using formal concept analysis
CN109492126B (zh) 一种智能交互方法及装置
JP2018004813A (ja) コミュニケーション能力推定装置、方法およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20170119

Address after: Nine road Tairan Industrial Park Futian District Sha Tau Street Tairan 518048 Shenzhen city Guangdong province 211 industrial buildings 403B

Patentee after: Cereal Technology (Shenzhen) Co., Ltd.

Address before: 100098 Beijing city Haidian District No. 48 Zhichun Road Yingdu building block C four unit 3B

Patentee before: Beijing Whaty Technology Development Co., Ltd.