CN101206898B - 自动断句的复读装置与复读方法 - Google Patents
自动断句的复读装置与复读方法 Download PDFInfo
- Publication number
- CN101206898B CN101206898B CN200610170105A CN200610170105A CN101206898B CN 101206898 B CN101206898 B CN 101206898B CN 200610170105 A CN200610170105 A CN 200610170105A CN 200610170105 A CN200610170105 A CN 200610170105A CN 101206898 B CN101206898 B CN 101206898B
- Authority
- CN
- China
- Prior art keywords
- reading
- point
- acoustic signals
- punctuate
- repeating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供了一种自动断句的复读装置与复读方法。该复读装置包括声波分析模块、复读触发模块、复读提取模块和复读播放模块。其中声波分析模块接收声波信号并分析声波信号,判断出多个断句点;复读触发模块接收复读命令并于声波信号上设定复读终点;复读提取模块设定早于复读终点且最接近的断句点为复读起点;复读播放模块播放复读起点到复读终点的声波信号。通过该复读装置和复读方法,使用者不必自行设定复读起点,即可重复听取完整的句子,并可避免反复倒带、浪费时间。
Description
技术领域
本发明涉及一种复读装置与复读方法,特别是一种自动断句的复读装置与复读方法。
背景技术
语言学习机或音乐播放设备通常具有复读功能。方便使用者在学习语言或对某段音乐感兴趣时,可以重复不断聆听以便于记忆或加深印象,而不需让使用者反复倒带浪费时间。
一般具备语音复读功能的设备,仅能以人工设定时间A、B点,设备再以A、B点作为复读范围重复播放。或者,先以人工设定A点(复读起点),再由具备复读功能的设备自行计算延后一段固定时间作为B点(复读终点)。
但对于使用者在使用上来说,当某段话语或音乐听不清楚或有兴趣想要重听时,往往已经错过了A点,此时就必须倒带回放再去寻找一次A点,再作复读起始的设定。再者,可能因为使用者反应快慢的不同,导致A点的位置与使用者所希望的位置有所误差,因此造成使用上不方便。
目前已有提出可自动设定复读起始位置(A点)的播放装置,让使用者不需要自行设定复读起点(A点)。其作法为:当使用者启动复读功能时,便同时设定该点为复读终点(B点),再由该复读终点往回推一段固定时间(例如,10秒),作为复读起点。这样,虽然不需再由使用者自行设定复读起点,但每次复读的时间却也被限制只能回推一段固定时间。但是当语音播放时,可能第一句播放的时间为5秒、第二句播放的时间为20秒等,必须依照句子的长短来决定其播放的时间,并没有一段固定的时间,因此该装置回推一段固定时间设定为复读起点,往往无法真正返回到使用者所希望回到的复读起点,也无法返回到句子的一开头而重复听取完整的句子。
因此,如何让具备语音复读功能的设备不需再经由使用者自行设定复读起点,而且设备自动设定的复读起点为正确的起始点,让使用者能重复听取完整的句子,这是一个亟待解决的问题。
发明内容
为了解决上述问题,本发明提供了一种自动断句的复读装置与复读方法。通过该装置与方法,能自动分析出声波信号的断句点,当启动复读功能时即可往回找到最接近的断句点,将其设定为复读起点。因为声波信号先经过断句的分析,所以设定的复读起点均为断句点,因此复读播放所听到的都是每个句子的开始,可帮助使用者重复听取完整的句子。
本发明所提供的自动断句的复读装置包含:声波分析模块、复读触发模块、复读提取模块及复读播放模块。
声波分析模块接收声波信号并分析声波信号,判断出多个断句点。判断该断句点可以采用三种方法:第一,分析声波信号的声波能量;第二,利用频谱分析的方式;以及,第三,利用语音辨识的方式。
复读触发模块接收复读命令并在声波信号上设定复读终点。当接收到复读命令时,可以采用三种方法在声波信号上设定复读终点:第一,当收到复读命令时,即将声波信号所对应的时间点,设定为复读终点;第二,收到复读命令的时间点,在声波信号上往回寻找前一个断句的结束位置,设定为复读终点;第三,收到复读命令,在声波信号上往后寻找该复读命令接收时间点所在断句的结束位置,设定为复读终点。
复读提取模块设定早于复读终点,并且最接近的断句点为复读起点。
复读播放模块播放由复读提取模块所设定的复读起点到复读触发模块所设定的复读终点的声波信号。
进一步讲,本发明提供的自动断句的复读方法,其包含下列步骤:接收声波信号;分析该声波信号,判断出多个断句点;接收复读命令并在声波信号上设定复读终点;设定早于该复读终点并且最接近的断句点为复读起点;以及播放复读起点到复读终点的声波信号。
为此,本发明提供的自动断句的复读装置和复读方法,不需要再由使用者自行设定复读起点,而且设备自动设定的复读起点为正确的起点,让使用者能够重复听取完整的句子,在反复聆听时可以避免反复倒带、浪费时间。
附图说明
图1自动断句的复读装置的示意图,
图2自动断句的复读方法的流程图,
图3设定复读起点的具体步骤流程图,
图4播放复读声波信号的具体步骤流程图。
其中,附图标记说明如下:
10声波分析模块,
20复读触发模块,
30复读提取模块,
40复读播放模块。
具体实施方式
以下配合附图,通过具体实施方式对本发明作进一步的说明。
图1为自动断句的复读装置的示意图。自动断句的复读装置包含:声波分析模块10、复读触发模块20、复读提取模块30和复读播放模块40。
声波分析模块10接收声波信号,该声波信号可以是语言朗读,例如:使用者学习英文听取英语会话。另一方面,使用者在聆听语言朗读时,有时会有背景音乐穿插在其中,例如:听取日语会话时,柔和的管弦配乐当作背景音乐。因此,声波信号也可以是语言朗读加上背景音乐。
当声波分析模块10接收声波信号后,会分析声波信号而判断出多个断句点。语言朗读是一句话接着一句话播放,而每句话之间会产生所谓的断句,而一篇文章的朗读或一段语音的播放,便会产生多个断句点。判断出每个句子的断句点,可以让使用者在聆听声波信号的播放中,想要复读重听时,可以回到每一个语音句的起始点。这样,确保使用者一启动复读功能,即可回到前一个句子或先前任何一个句子的起始点重新开始聆听。
声波分析模块10在声波信号正常播放时,即同时进行断句点的判断。所以,在使用者聆听声波信号正常播放时,声波分析模块10同时进行断句点的分析。
声波分析模块10分析声波信号,判断出多个断句点的方法可以采用下列三种方式达到。第一种方式,分析声波信号的声波能量,当声波信号的声波能量低于平均值时,判断为断句点。一段声波信号在播放时,其声波能量会有高低起伏,以使用者的观点来说,便是听起来会有所谓的抑扬顿挫,简单的说就是声音会有大小声、高低音的分别。语言朗读在一个句子结束,接着下一个句子开始之间,会有短暂的静音或是声波能量降低,也就是所谓的断句点出现。第一种方式便是利用这个特性,先设定一个声波能量的平均值,当声波信号在播放时,只要其声波能量低于该平均值即判断为断句点。
第二种方式,声波分析模块10利用频谱分析,将声波信号区分为语言朗读与背景音乐,再判断出语言朗读的断句点。如前所述,声波信号有时会有语言朗读与背景音乐同时存在。由于语言朗读与背景音乐的频谱有所差异,因此声波分析模块10可以先利用频谱分析的方式,区分出语言朗读与背景音乐,再将区分出的语言朗读利用第一种方式或其它的方式,判断出断句点。
第三种方式,声波分析模块10利用语音辨识判断出断句点。语音辨识主要的目的是希望电子设备听懂人类说话的声音,进而执行相对应的工作。当声音藉由模拟到数字的转换输入电子设备,并以数值方式储存后,语音辨识程序便开始以事先储存好的声音样本与输入的测试声音样本进行比对工作。因此,通过语音辨识可以辨识出声波信号中的每一个句子,进而判断出每个句子的断句点。
复读触发模块20接收复读命令并在声波信号上设定复读终点。复读命令由使用者下达,当使用者在听取声波信号时,可随时下达复读命令,用以通知本发明的复读装置准备进行复读的动作。当复读触发模块20接收到复读命令时,可以采用三种方式在声波信号上设定复读终点。第一种方式,使用者下达复读命令的时间点,便是复读的终点。因此,当复读触发模块20接收复读命令时,便会在声波分析模块10所接收到的声波信号上,将接收到复读命令的时间点设定为复读终点。
第二种方式,复读触发模块20收到复读命令,便在声波信号上往回寻找前一个断句的结束位置,将其设定为复读终点。这样,可以让使用者在启用复读功能时,所听取的复读播放是完整的句子。
第三种方式,复读触发模块20收到复读命令,便在声波信号上往后寻找该复读命令接收时间点所在断句的结束位置,将其没定为复读终点。这样的作法同样可以让使用者在启用复读功能时,所听取的复读播放是完整的句子。与前一种方式的差异在于,第二种方式是在声波信号上往回寻找前一个断句的结束位置,而第三种方式是在声波信号上往后寻找当前所在断句的结束位置。其中,上述三种复读终点的设定方式,可以由使用者根据需求或喜好而自行选择。
复读提取模块30设定早于复读终点并且最接近的断句点为复读起点。复读提取模块30会依据复读触发模块20所设定的复读终点,往回寻找最接近复读终点的断句点,并将其设定为复读起点。如果使用者连续下达多次复读命令,表示使用者想要回到更前一个的断句点。所以,当复读触发模块20连续接收多次复读命令时,复读提取模块30会重设更早一个的断句点为复读起点。这样,即使复读提取模块30自动往回寻找的前一个断句点,不是使用者所想要重听的复读起点,使用者也可以通过重复下达复读命令,从而回到真正想要重听的复读起点。
最后,复读播放模块40播放复读提取模块30所设定的复读起点到复读触发模块20所设定的复读终点的声波信号。复读播放模块40播放复读起点到复读终点的声波信号的次数可以为一次或多次,可由使用者依喜好与需要自行选择。
图2为自动断句的复读方法的流程图,包含下列步骤:
步骤S210:接收声波信号。声波信号可以是语言朗读或是语言朗读加背景音乐。
步骤S220:分析声波信号判断出多个断句点。判断断句点的方法可以采用下列三种方式。第一种方式,分析声波信号的声波能量,当声波信号的声波能量低于平均值时,判断为断句点。第二种方式,利用频谱分析,将声波信号区分为语言朗读与背景音乐,再判断出语言朗读的断句点。第三种方式,利用语音辨识判断出断句点。
步骤S230:接收复读命令并在声波信号上设定复读终点。使用者听取步骤S210所接收的声波信号,可随时下达复读命令。当接收到复读命令时,可以采用三种方法在声波信号上设定复读终点:第一,收到复读命令在声波信号所对应的时间点,即设定为复读终点;第二,收到复读命令的时间点,在声波信号上往回寻找前一个断句的结束位置,设定为复读终点;第三,收到复读命令,在声波信号上往后寻找该复读命令接收时间点所在断句的结束位置,设定为复读终点。
步骤S240:设定早于复读终点并且最接近的断句点为复读起点。步骤S240会依据步骤S230所设定的复读终点,往回寻找距离复读终点最接近的断句点作为复读起点。
步骤S250:播放步骤S240所设定的复读起点到步骤S230所设定的复读终点的声波信号。
图3为设定复读起点的详细流程图。S240为设定复读起点的步骤,可以将该步骤再细分为下列步骤:
步骤S242:往回寻找前一个断句点,设定为复读起点。
步骤S244:判断是否有未处理的复读命令。如果有未处理的复读命令则回到步骤S242。如果没有未处理的复读命令则进行步骤S250。
当步骤S230连续接收多次复读命令时,首先经过步骤S242由复读终点往回寻找前一个断句点,设定为复读起点。接下来步骤S244会判断是否有未处理的复读命令,由于所接收到的复读命令为多次,所以又回到步骤S242由先前已经设定好的复读起点再往回寻找前一个断句点,将更早一个的断句点重新设为复读起点,直到复读命令处理完毕。所以,使用者如果想要回到早于复读终点前第N个断句点,只要下达N次复读命令,就可以回到想要的断句点,而将其当作复读起点。
这样,即使一开始步骤S242自动往回寻找的前一个断句点,并非使用者所想要重听的复读起点时,使用者也可以通过重复再下达一次复读命令,而回到更早一个的断句点。通过多次下达复读命令,而回到使用者真正想要重听的复读起点。
图4为播放复读声波信号的详细流程图。S250为播放复读声波信号的步骤,该步骤可以包含下列步骤:
步骤S252:判断是否停止播放复读。「否」的话再回到步骤S250继续播放复读起点到复读终点的声波信号。「是」的话则结束。
当使用者觉得播放复读声波信号的次数已经足够时,只要停止播放复读,即可停止播放复读起点到复读终点的声波信号。因此,播放复读起点到复读终点的声波信号的次数可以为一次或多次,由使用者依喜好与需求自行选择。
虽然本发明的技术内容已经以较佳实施例揭示如上,然而,其并非用来限定本发明,任何本领域的技术人员,在不脱离本发明精神的情况下所作的少许改变与润色,均应涵盖在本发明的范围之内。因此,本发明的保护范围应当以所附的权利要求范围为准。
Claims (14)
1.一种自动断句的复读装置,其中包括:
声波分析模块,其接收声波信号并分析该声波信号,判断出多个断句点;
复读触发模块,其接收复读命令并在该声波信号上设定复读终点;
复读提取模块,设定早于该复读终点并且最接近的该断句点为复读起点;以及
复读播放模块,播放该复读起点到该复读终点的该声波信号。
2.如权利要求1所述的复读装置,其特征在于,该声波分析模块分析声波信号的声波能量,在声波信号的声波能量低于平均值时,判断为断句点。
3.如权利要求1所述的复读装置,其特征在于,该声波分析模块利用频谱分析将声波信号区分为语言朗读与背景音乐,再判断出该语言朗读的断句点。
4.如权利要求1所述的复读装置,其特征在于,该声波分析模块利用语音辨识判断出断句点。
5.如权利要求1所述的复读装置,其特征在于,该复读触发模块连续接收多次复读命令时,复读提取模块重设更早一个的断句点为复读起点。
6.如权利要求1所述的复读装置,其特征在于,该复读播放模块播放复读起点到复读终点的声波信号的次数为一次。
7.如权利要求1所述的复读装置,其特征在于,该复读播放模块播放复读起点到复读终点的声波信号的次数为多次。
8.一种自动断句的复读方法,包含下列步骤:
接收声波信号;
分析该声波信号,判断出多个断句点;
接收复读命令并在声波信号上设定复读终点;
设定早于该复读终点并且最接近的断句点为复读起点;以及
播放复读起点到复读终点的声波信号。
9.如权利要求8所述的复读方法,其特征在于,该分析步骤为分析声波信号的声波能量,在声波信号的声波能量低于平均值时,判断为断句点。
10.如权利要求8所述的复读方法,其特征在于,该分析步骤利用频谱分析将声波信号区分为语言朗读与背景音乐,再判断出该语言朗读的断句点。
11.如权利要求8所述的复读方法,其特征在于,该分析步骤利用语音辨识判断出断句点。
12.如权利要求8所述的复读方法,其特征在于,连续接收多次复读命令时,重设更早一个的断句点为复读起点。
13.如权利要求8所述的复读方法,其特征在于,该播放步骤播放复读起点到复读终点的声波信号的次数为一次。
14.如权利要求8所述的复读方法,其特征在于,该播放步骤播放复读起点到复读终点的声波信号的次数为多次。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610170105A CN101206898B (zh) | 2006-12-22 | 2006-12-22 | 自动断句的复读装置与复读方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610170105A CN101206898B (zh) | 2006-12-22 | 2006-12-22 | 自动断句的复读装置与复读方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101206898A CN101206898A (zh) | 2008-06-25 |
CN101206898B true CN101206898B (zh) | 2010-05-19 |
Family
ID=39567009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200610170105A Active CN101206898B (zh) | 2006-12-22 | 2006-12-22 | 自动断句的复读装置与复读方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101206898B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101487722B (zh) * | 2008-12-31 | 2013-10-23 | 深圳市凯立德科技股份有限公司 | 一种导航装置和导航方法 |
CN102142271B (zh) * | 2010-01-29 | 2013-12-25 | 朱友平 | 同步显示波形的手持式多媒体播放器与复读方法 |
CN102411622B (zh) * | 2011-11-24 | 2014-04-23 | 陈雪茹 | 便携式音频播放器设置电子书签的方法 |
CN103761064A (zh) * | 2013-12-27 | 2014-04-30 | 圆展科技股份有限公司 | 自动语音输入系统及其方法 |
CN103905925B (zh) * | 2014-03-07 | 2018-04-27 | 深圳创维数字技术有限公司 | 一种节目重复播放的方法和终端 |
CN105280206B (zh) * | 2014-06-23 | 2018-08-07 | 广东小天才科技有限公司 | 一种音频的播放方法、装置 |
CN105304102B (zh) * | 2014-07-11 | 2017-12-01 | 广东小天才科技有限公司 | 一种音频处理方法及装置 |
CN105006179A (zh) * | 2015-05-29 | 2015-10-28 | 广东小天才科技有限公司 | 语音输入的内容跟读方法和装置 |
CN109743633B (zh) * | 2019-01-11 | 2021-08-20 | 广东小天才科技有限公司 | 播放器的多媒体文件播放方法、装置、终端及存储介质 |
CN109698976A (zh) * | 2019-01-14 | 2019-04-30 | 全玲 | 基于音频特征提取的快进快退播放方法、装置和播放器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2341245Y (zh) * | 1998-05-22 | 1999-09-29 | 中山市通力电子厂 | 智能声控语言复读、跟读学习机 |
JP2005071551A (ja) * | 2003-08-28 | 2005-03-17 | Funai Electric Co Ltd | ディスク再生装置及びその制御方法 |
-
2006
- 2006-12-22 CN CN200610170105A patent/CN101206898B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2341245Y (zh) * | 1998-05-22 | 1999-09-29 | 中山市通力电子厂 | 智能声控语言复读、跟读学习机 |
JP2005071551A (ja) * | 2003-08-28 | 2005-03-17 | Funai Electric Co Ltd | ディスク再生装置及びその制御方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101206898A (zh) | 2008-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101206898B (zh) | 自动断句的复读装置与复读方法 | |
KR100472904B1 (ko) | 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법 | |
CN102917119B (zh) | 一种移动终端基于语音识别处理音乐的方法及系统 | |
CN108242238B (zh) | 一种音频文件生成方法及装置、终端设备 | |
CN101189657A (zh) | 一种用于对多媒体信号执行自动配音的方法和设备 | |
JPS5862699A (ja) | 音声認識装置 | |
CN108305611B (zh) | 文本转语音的方法、装置、存储介质和计算机设备 | |
CN112420015A (zh) | 一种音频合成方法、装置、设备及计算机可读存储介质 | |
CN111739536A (zh) | 一种音频处理的方法和装置 | |
CN105280206A (zh) | 一种音频的播放方法、装置 | |
CN114842827A (zh) | 一种音频合成方法、电子设备及可读存储介质 | |
CN110992984B (zh) | 音频处理方法及装置、存储介质 | |
CN110808050B (zh) | 语音识别方法及智能设备 | |
CN102142271B (zh) | 同步显示波形的手持式多媒体播放器与复读方法 | |
CN109271480B (zh) | 一种语音搜题方法及电子设备 | |
CN101819797A (zh) | 具有互动音频录制功能的电子装置及其录制方法 | |
CN107452408B (zh) | 一种音频播放方法及装置 | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
CN113707128B (zh) | 用于全双工语音交互系统的测试方法及系统 | |
JP2007221574A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2007086592A (ja) | 音声出力装置および音声出力方法 | |
JP3081469B2 (ja) | 話速変換装置 | |
JP3978465B2 (ja) | 録音再生装置 | |
CN105915940B (zh) | 媒体数据的重播方法和装置 | |
CN110838211A (zh) | 语音抢答方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |