CN108630224B - 控制语速的方法及装置 - Google Patents

控制语速的方法及装置 Download PDF

Info

Publication number
CN108630224B
CN108630224B CN201810242194.4A CN201810242194A CN108630224B CN 108630224 B CN108630224 B CN 108630224B CN 201810242194 A CN201810242194 A CN 201810242194A CN 108630224 B CN108630224 B CN 108630224B
Authority
CN
China
Prior art keywords
reading
current
text information
following
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810242194.4A
Other languages
English (en)
Other versions
CN108630224A (zh
Inventor
周海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201810242194.4A priority Critical patent/CN108630224B/zh
Publication of CN108630224A publication Critical patent/CN108630224A/zh
Application granted granted Critical
Publication of CN108630224B publication Critical patent/CN108630224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种控制语速的方法,包括:获取需要跟读的内容的预设文本信息;确定当前跟读轮数,并根据当前跟读轮数确定相对应的当前播放语速,根据当前播放语速将预设文本信息转换为演示语音,接收交互对象基于演示语音输入的当前跟读语音,将当前跟读语音转换为当前跟读文本信息,在当前跟读文本信息与预设文本信息一致时,当前跟读轮数加一,并重复执行上述步骤,直至当前跟读文本信息与预设文本信息不一致。本控制语速的方法,随着跟读轮数的增加,逐渐加快演示语音的播放速度,通过加快演示语音的播放速度,使儿童带着与演示语音比拼的竞赛感,更好的激活儿童的积极性,使其更好的锻炼语言能力。

Description

控制语速的方法及装置
技术领域
本发明涉及语音识别技术领域,特别涉及一种控制语速的方法及装置。
背景技术
目前,在儿童智能产品中,跟读是一个重要的锻炼语言的功能,但只进行跟读,无法激活儿童的积极性,增加更丰富的跟读体验才能使锻炼跟读的效果更好。
发明内容
本发明提供一种控制语速的方法,用于解决现有方式只能简单跟读导致跟读学习效果差的问题。
本发明实施例提供的一种控制语速的方法,包括:
步骤1:获取需要跟读的内容的预设文本信息;
步骤2:确定当前跟读轮数,并根据所述当前跟读轮数确定相对应的当前播放语速,所述当前跟读轮数与所述当前播放语速为正相关关系;
步骤3:根据所述当前播放语速将所述预设文本信息转换为演示语音,并以所述当前播放语速播放所述演示语音;
步骤4:接收交互对象基于所述演示语音输入的当前跟读语音,将所述当前跟读语音转换为当前跟读文本信息,并判断所述当前跟读文本信息与所述预设文本信息是否一致;
步骤5:在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,并重复执行步骤4,直至所述当前跟读文本信息与所述预设文本信息不一致。
在一个实施例中,在所述当前跟读文本信息与所述预设文本信息不一致之后,还包括:
确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置,将所述文本位置处对应的预设文本信息转换为自然语音,并播放所述自然语音。
在一个实施例中,将所述当前跟读语音转换为当前跟读文本信息包括:
判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;
在两轮的交互对象相同时,将所述本轮的当前跟读语音转换为当前跟读文本信息;
在两轮的交互对象不同时,初始化所述当前跟读轮数,并将所述本轮的当前跟读语音转换为当前跟读文本信息。
在一个实施例中,在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,包括:
在所述当前跟读文本信息与所述预设文本信息一致时,获取进入下一轮跟读的指令,根据所述指令对所述当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定所述当前跟读文本信息与所述预设文本信息一致时开始计时,当计时达到预设时间时,对所述当前跟读轮数进行加一处理,并进入下一轮跟读。
在一个实施例中,当前跟读文本信息与所述预设文本信息不一致之后,还包括:
根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息,并根据所述跟读信息确定所述交互对象的评价系数,所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。
本发明实施例还提供一种控制语速的装置,包括:
获取模块,用于获取需要跟读的内容的预设文本信息;
语速确定模块,用于确定当前跟读轮数,并根据所述当前跟读轮数确定相对应的当前播放语速,所述当前跟读轮数与所述当前播放语速为正相关关系;
语音播放模块,用于根据所述当前播放语速将所述预设文本信息转换为演示语音,并以所述当前播放语速播放所述演示语音;
语音接收比对模块,接收交互对象基于所述演示语音输入的当前跟读语音,将所述当前跟读语音转换为当前跟读文本信息,并判断所述当前跟读文本信息与所述预设文本信息是否一致;
语音执行控制模块,在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,并重复执行所述语音接收比对模块的判断过程,直至所述当前跟读文本信息与所述预设文本信息不一致。
在一个实施例中,控制语速的装置还包括:
纠错模块,用于确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置,将所述文本位置处对应的预设文本信息转换为自然语音,并播放所述自然语音。
在一个实施例中,语音接收比对模块包括:
交互对象确认模块,用于判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;
第一执行模块,用于在两轮的交互对象相同时,将所述本轮的当前跟读语音转换为当前跟读文本信息;
第二执行模块,用于在两轮的交互对象不同时,初始化所述本轮的当前跟读轮数,并将所述当前跟读语音转换为当前跟读文本信息。
在一个实施例中,语音执行控制模块用于:在所述当前跟读文本信息与所述预设文本信息一致时,获取进入下一轮跟读的指令,根据所述指令对所述当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定所述当前跟读文本信息与所述预设文本信息一致时开始计时,当计时达到预设时间时,对所述当前跟读轮数进行加一处理,并进入下一轮跟读。
在一个实施例中,控制语速的装置还包括:评价模块,用于根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息,并根据所述跟读信息确定所述交互对象的评价系数,所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。
本控制语速的方法及装置用于解决现有方式只能简单跟读导致跟读学习效果差的问题。具体表现在不仅可以让儿童跟读,并且可以控制跟读语音的语速,通过改变跟读语音的语速,使儿童产生与演示语音竞争的感觉;并且对儿童的跟读结果进行评价,使儿童对自己的跟读结果有直观的了解,使儿童想要超越自己,获得比先前的跟读评价更好的跟读评价,更好的激活儿童的积极性,使其更好的锻炼语言能力。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种控制语速的方法的示意图;
图2为本发明实施例中一种控制语速的装置的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种控制语速的方法,如图1所示,包括:
S1:获取需要跟读的内容的预设文本信息;
S2:确定当前跟读轮数,并根据当前跟读轮数确定相对应的当前播放语速,当前跟读轮数与当前播放语速为正相关关系;
S3:根据当前播放语速将预设文本信息转换为演示语音,并以当前播放语速播放演示语音;
S4:接收交互对象基于演示语音输入的当前跟读语音,将当前跟读语音转换为当前跟读文本信息,并判断当前跟读文本信息与预设文本信息是否一致;
S5:在当前跟读文本信息与预设文本信息一致时,当前跟读轮数加一,并重复执行步骤S4,直至当前跟读文本信息与预设文本信息不一致。
例如:获取需要跟读的内容的预设文本信息;确定当前跟读轮数和当前播放语速;初始跟读轮数为1,当前播放语速为2+(当前跟读轮数-1)*0.5个字每秒,在第1轮,初始播放语速为每秒钟2个字;根据当前播放语速将预设文本信息转换为演示语音,并以当前播放语速播放演示语音;接收交互对象基于演示语音输入的当前跟读语音,交互对象可以是儿童;将当前跟读语音转换为当前跟读文本信息,并判断当前跟读文本信息与预设文本信息是否一致;在当前跟读文本信息与预设文本信息一致时,说明交互对象本轮跟读完成,为提高播放语速进入下一轮跟读,当前跟读轮数加一为下一轮跟读轮数,即进入第2轮跟读,获取需要跟读的内容的预设文本信息;确定当前跟读轮数和当前播放语速;在第2轮,播放语速为每秒钟2.5个字;根据当前播放语速将预设文本信息转换为演示语音,并以当前播放语速播放演示语音;接收交互对象基于演示语音输入的当前跟读语音,将当前跟读语音转换为当前跟读文本信息,并判断当前跟读文本信息与预设文本信息是否一致;在当前跟读文本信息与预设文本信息一致时,进入第3轮跟读。随着跟读轮数的增加,逐渐加快演示语音的播放速度;在当前跟读文本信息与预设文本信息不一致,即跟读语音出错后停止本次跟读。
上述控制语速的方法,随着跟读轮数的增加,逐渐加快演示语音的播放速度,不仅提高了跟读播放的多样性,而且逐渐提高了跟读的复杂性和难度;通过加快演示语音的播放速度,使儿童带着与演示语音比拼的竞赛感,更好的激活儿童的积极性,使其更好的锻炼语言能力。
为实现对用户跟读出错位置的纠正,在一个实施例中,在当前跟读文本信息与预设文本信息不一致之后,还包括:
确定预设文本信息中与当前跟读文本信息不一致的文本位置,将文本位置处对应的预设文本信息转换为自然语音,并播放自然语音。
通过上述步骤对出错位置进行指出并播放出错位置正确的自然语音,让用户(比如儿童)能够纠正跟读出错的位置。
为了确保在本次跟读中交互对象是同一个;在一个实施例中,将当前跟读语音转换为当前跟读文本信息包括:
判断输入本轮的当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;可以采用声纹识别的方式来判断本轮的当前跟读语音的交互对象与上一轮跟读语音的交互对象是否是同一个。
在两轮的交互对象相同时,将本轮的当前跟读语音转换为当前跟读文本信息;即当没有改变跟读的交互对象时,继续本次跟读。
在两轮的交互对象不同时,初始化当前跟读轮数,并将本轮的当前跟读语音转换为当前跟读文本信息。即当本轮跟读的交互对象改变时,将当前跟读轮数重置为初始跟读轮数,重新开始跟读。
为了保证跟读质量,在一个实施例中,在当前跟读文本信息与预设文本信息一致时,当前跟读轮数加一,包括:
在当前跟读文本信息与预设文本信息一致时,获取进入下一轮跟读的指令,根据指令对当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定当前跟读文本信息与预设文本信息一致时开始计时,当计时达到预设时间时,对当前跟读轮数进行加一处理,并进入下一轮跟读。当本轮跟读结束后,通过在每轮跟读之间设置一定的时间间隔,给交互对象一点准备或休息时间,保证交互对象的跟读的质量。
为了实现对交互对象的跟读进行评价,在一个实施例中,当前跟读文本信息与预设文本信息不一致之后,还包括:
根据交互对象每一轮输入的当前跟读语音确定交互对象的跟读信息,并根据跟读信息确定交互对象的评价系数,跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。在本次跟读完成后对交互对象的跟读进行评价。对儿童的跟读结果进行评价,使儿童对自己的跟读结果有直观的了解,使儿童想要超越自己,获得比先前的跟读评价更好的跟读评价,更好的激活儿童的积极性,使其更好的锻炼语言能力。
本发明实施例还提供一种控制语速的装置,如图2所示,包括:
获取模块21,用于获取需要跟读的内容的预设文本信息;
语速确定模块22,用于确定当前跟读轮数,并根据当前跟读轮数确定相对应的当前播放语速,当前跟读轮数与当前播放语速为正相关关系;
语音播放模块23,用于根据当前播放语速将预设文本信息转换为演示语音,并以当前播放语速播放演示语音;
语音接收比对模块24,接收交互对象基于演示语音输入的当前跟读语音,将当前跟读语音转换为当前跟读文本信息,并判断当前跟读文本信息与预设文本信息是否一致;
语音执行控制模块25,在当前跟读文本信息与预设文本信息一致时,当前跟读轮数加一,并重复执行所述语音接收比对模块的判断过程,直至当前跟读文本信息与预设文本信息不一致。
例如:获取模块获取需要跟读的内容的预设文本信息;语速确定模块确定当前跟读轮数和当前播放语速;初始跟读轮数为1,当前播放语速为2+(当前跟读轮数-1)*0.5个字每秒,初始播放语速为每秒钟2个字;语音播放模块根据当前播放语速将预设文本信息转换为演示语音,并以当前播放语速播放演示语音;语音接收比对模块接收交互对象基于演示语音输入的当前跟读语音,将当前跟读语音转换为当前跟读文本信息,并判断当前跟读文本信息与预设文本信息是否一致;语音执行控制模块在当前跟读文本信息与预设文本信息一致时,当前跟读轮数加一,并重复执行上述步骤,直至当前跟读文本信息与预设文本信息不一致,即跟读语音出错后停止本次跟读。
上述控制语速的装置,随着跟读轮数的增加,逐渐加快演示语音的播放速度,不仅提高了跟读播放的多样性,而且逐渐提高了跟读的复杂性和难度;通过加快演示语音的播放速度,使儿童带着与演示语音比拼的竞赛感,更好的激活儿童的积极性,使其更好的锻炼语言能力。
为实现对用户跟读出错位置的纠正,在一个实施例中,控制语速的装置还包括:
纠错模块,用于确定预设文本信息中与当前跟读文本信息不一致的文本位置,将文本位置处对应的预设文本信息转换为自然语音,并播放自然语音。通过纠错模块对出错位置进行指出并播放出错位置正确的自然语音,让用户能够纠正跟读出错的位置。
为了确保在本次跟读中,交互对象是同一个;在一个实施例中,语音接收比对模块包括:
交互对象确认单元,用于判断输入本轮的当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;采用声纹识别的方式来判断当前跟读语音的交互对象与上一轮跟读语音的交互对象是否是同一个。
第一执行单元,用于在两轮的交互对象相同时,将本轮的当前跟读语音转换为当前跟读文本信息;即当没有改变跟读的交互对象时,继续本次跟读。
第二执行单元,用于在两轮的交互对象不同时,初始化当前跟读轮数,并将本轮的当前跟读语音转换为当前跟读文本信息。即当本轮跟读的交互对象改变时,重新开始本次跟读。
为了使每轮跟读之间有一定的时间间隔,在一个实施例中,语音执行控制模块用于:在当前跟读文本信息与预设文本信息一致时,获取进入下一轮跟读的指令,根据指令对当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定当前跟读文本信息与预设文本信息一致时开始计时,当计时达到预设时间时,对当前跟读轮数进行加一处理,并进入下一轮跟读。当本轮跟读结束后,给交互对象一点准备或休息时间,保证交互对象的跟读的质量。
为了实现对交互对象的跟读进行评价,在一个实施例中,控制语速的装置还包括:评价模块,用于根据交互对象每一轮输入的当前跟读语音确定交互对象的跟读信息,并根据跟读信息确定交互对象的评价系数,跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。在本次跟读完成后对交互对象的跟读进行评价。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种控制语速的方法,其特征在于,包括:
步骤1:获取需要跟读的内容的预设文本信息;
步骤2:确定当前跟读轮数,并根据所述当前跟读轮数确定相对应的当前播放语速,所述当前跟读轮数与所述当前播放语速为正相关关系;
步骤3:根据所述当前播放语速将所述预设文本信息转换为演示语音,并以所述当前播放语速播放所述演示语音;
步骤4:接收交互对象基于所述演示语音输入的当前跟读语音,将所述当前跟读语音转换为当前跟读文本信息,并判断所述当前跟读文本信息与所述预设文本信息是否一致;
步骤5:在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,并重复执行步骤4,直至所述当前跟读文本信息与所述预设文本信息不一致。
2.如权利要求1所述的方法,其特征在于,在所述当前跟读文本信息与所述预设文本信息不一致之后,还包括:
确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置,将所述文本位置处对应的预设文本信息转换为自然语音,并播放所述自然语音。
3.如权利要求1所述的方法,其特征在于,所述将所述当前跟读语音转换为当前跟读文本信息包括:
判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;
在两轮的交互对象相同时,将所述本轮的当前跟读语音转换为当前跟读文本信息;
在两轮的交互对象不同时,初始化所述当前跟读轮数,并将所述本轮的当前跟读语音转换为当前跟读文本信息。
4.如权利要求1所述的方法,其特征在于,所述在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,包括:
在所述当前跟读文本信息与所述预设文本信息一致时,获取进入下一轮跟读的指令,根据所述指令对所述当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定所述当前跟读文本信息与所述预设文本信息一致时开始计时,当计时达到预设时间时,对所述当前跟读轮数进行加一处理,并进入下一轮跟读。
5.如权利要求1所述的方法,其特征在于,在所述当前跟读文本信息与所述预设文本信息不一致之后,还包括:
根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息,并根据所述跟读信息确定所述交互对象的评价系数,所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。
6.一种控制语速的装置,其特征在于,包括:
获取模块,用于获取需要跟读的内容的预设文本信息;
语速确定模块,用于确定当前跟读轮数,并根据所述当前跟读轮数确定相对应的当前播放语速,所述当前跟读轮数与所述当前播放语速为正相关关系;
语音播放模块,用于根据所述当前播放语速将所述预设文本信息转换为演示语音,并以所述当前播放语速播放所述演示语音;
语音接收比对模块,接收交互对象基于所述演示语音输入的当前跟读语音,将所述当前跟读语音转换为当前跟读文本信息,并判断所述当前跟读文本信息与所述预设文本信息是否一致;
语音执行控制模块,在所述当前跟读文本信息与所述预设文本信息一致时,所述当前跟读轮数加一,并重复执行所述语音接收比对模块的判断过程,直至所述当前跟读文本信息与所述预设文本信息不一致。
7.如权利要求6所述的装置,其特征在于,还包括:
纠错模块,用于确定所述预设文本信息中与所述当前跟读文本信息不一致的文本位置,将所述文本位置处对应的预设文本信息转换为自然语音,并播放所述自然语音。
8.如权利要求6所述的装置,其特征在于,所述语音接收比对模块包括:
交互对象确认模块,用于判断输入本轮的所述当前跟读语音的交互对象与输入上一轮的当前跟读语音的交互对象是否相同;
第一执行模块,用于在两轮的交互对象相同时,将所述本轮的当前跟读语音转换为当前跟读文本信息;
第二执行模块,用于在两轮的交互对象不同时,初始化所述当前跟读轮数,并将所述本轮的当前跟读语音转换为当前跟读文本信息。
9.如权利要求6所述的装置,其特征在于,所述语音执行控制模块用于:在所述当前跟读文本信息与所述预设文本信息一致时,获取进入下一轮跟读的指令,根据所述指令对所述当前跟读轮数进行加一处理,并进入下一轮跟读;或
在确定所述当前跟读文本信息与所述预设文本信息一致时开始计时,当计时达到预设时间时,对所述当前跟读轮数进行加一处理,并进入下一轮跟读。
10.如权利要求6所述的装置,其特征在于,还包括:评价模块,用于根据交互对象每一轮输入的当前跟读语音确定所述交互对象的跟读信息,并根据所述跟读信息确定所述交互对象的评价系数,所述跟读信息包括当前跟读语音的时长、最大跟读轮数、最大播放语速中的一项或多项。
CN201810242194.4A 2018-03-22 2018-03-22 控制语速的方法及装置 Active CN108630224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810242194.4A CN108630224B (zh) 2018-03-22 2018-03-22 控制语速的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810242194.4A CN108630224B (zh) 2018-03-22 2018-03-22 控制语速的方法及装置

Publications (2)

Publication Number Publication Date
CN108630224A CN108630224A (zh) 2018-10-09
CN108630224B true CN108630224B (zh) 2020-06-09

Family

ID=63696172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810242194.4A Active CN108630224B (zh) 2018-03-22 2018-03-22 控制语速的方法及装置

Country Status (1)

Country Link
CN (1) CN108630224B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033769B (zh) * 2019-04-23 2022-09-06 施永兵 一种录入语音处理方法、终端及计算机可读存储介质
CN111798830A (zh) * 2020-07-07 2020-10-20 云知声智能科技股份有限公司 婴儿安抚机器人及基于婴儿安抚机器人的安抚方法
CN112634862B (zh) * 2020-12-18 2024-01-23 北京大米科技有限公司 一种信息交互方法、装置、可读存储介质和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1510596A (zh) * 2002-12-24 2004-07-07 英业达股份有限公司 线性听讲跟读语言学习的系统及方法
CN1512387A (zh) * 2002-12-27 2004-07-14 联想(北京)有限公司 一种带有语言复读功能的计算机及其实现方法
WO2007145079A1 (ja) * 2006-06-12 2007-12-21 Kazuo Ishikawa 反復再生学習機およびプログラム
JP2013114118A (ja) * 2011-11-30 2013-06-10 Nippon Telegr & Teleph Corp <Ntt> 話者話速制御装置およびその動作方法
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
JP2015049309A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム
CN105869626A (zh) * 2016-05-31 2016-08-17 宇龙计算机通信科技(深圳)有限公司 一种语速自动调节的方法及终端
CN106486111A (zh) * 2016-10-14 2017-03-08 北京光年无限科技有限公司 基于智能机器人的多tts引擎输出语速调节方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1510596A (zh) * 2002-12-24 2004-07-07 英业达股份有限公司 线性听讲跟读语言学习的系统及方法
CN1512387A (zh) * 2002-12-27 2004-07-14 联想(北京)有限公司 一种带有语言复读功能的计算机及其实现方法
WO2007145079A1 (ja) * 2006-06-12 2007-12-21 Kazuo Ishikawa 反復再生学習機およびプログラム
JP2013114118A (ja) * 2011-11-30 2013-06-10 Nippon Telegr & Teleph Corp <Ntt> 話者話速制御装置およびその動作方法
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
JP2015049309A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム
CN105869626A (zh) * 2016-05-31 2016-08-17 宇龙计算机通信科技(深圳)有限公司 一种语速自动调节的方法及终端
CN106486111A (zh) * 2016-10-14 2017-03-08 北京光年无限科技有限公司 基于智能机器人的多tts引擎输出语速调节方法及系统

Also Published As

Publication number Publication date
CN108630224A (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN108630224B (zh) 控制语速的方法及装置
US8103503B2 (en) Speech recognition for determining if a user has correctly read a target sentence string
CN109271585B (zh) 一种信息推送方法及家教设备
CN108159687B (zh) 一种基于多人交互过程的自动引导系统及智能音箱设备
CN108053839B (zh) 一种语言练习成果的展示方法及麦克风设备
CN106558252B (zh) 由计算机实现的口语练习方法及装置
CN108039180B (zh) 一种儿童语言表达练习的成果获悉方法及麦克风设备
CN111312218B (zh) 神经网络的训练和语音端点检测方法及装置
CN104637350A (zh) 一种成人听力言语康复系统
CN109344292A (zh) 赛事得分片段的生成方法、装置、服务器和存储介质
CN110460867A (zh) 连麦互动方法、连麦互动系统、电子设备以及存储介质
CN109872726A (zh) 发音评估方法、装置、电子设备和介质
CN109448717B (zh) 一种语音单词拼写识别方法、设备及存储介质
CN109033448B (zh) 一种学习引导方法及家教设备
CN113160855B (zh) 在线语音活性检测系统改进方法和装置
JP6967777B2 (ja) 言語機能訓練システムおよび装置
CN109859773A (zh) 一种声音的录制方法、装置、存储介质及电子设备
CN109509485B (zh) 智能化听力锻炼方法及装置
CN106357715A (zh) 发音矫正方法、玩具、移动终端和系统
CN106327949A (zh) 一种音乐节奏训练方法与装置
CN109410666A (zh) 一种互动点读装置及点读方法
Rayner et al. Methodological issues in evaluating a spoken CALL game: Can crowdsourcing help us perform controlled experiments?
KR101270010B1 (ko) 음성 인식 기반의 단답형 학습 방법 및 시스템
CN111028590B (zh) 一种听写过程中引导用户书写的方法及学习设备
CN109255988A (zh) 基于错误发音检测的语言学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Applicant after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100000 AOC mansion, floor 12, building No. 1, No. 16, Center Road, Sun Palace, Chaoyang District, Beijing

Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant