CN113488045A - 一种听写内容控制的系统及方法 - Google Patents

一种听写内容控制的系统及方法 Download PDF

Info

Publication number
CN113488045A
CN113488045A CN202110751103.1A CN202110751103A CN113488045A CN 113488045 A CN113488045 A CN 113488045A CN 202110751103 A CN202110751103 A CN 202110751103A CN 113488045 A CN113488045 A CN 113488045A
Authority
CN
China
Prior art keywords
dictation
file
user
module
broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110751103.1A
Other languages
English (en)
Inventor
秦曙光
陈家峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Readboy Education Technology Co Ltd
Original Assignee
Readboy Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Readboy Education Technology Co Ltd filed Critical Readboy Education Technology Co Ltd
Priority to CN202110751103.1A priority Critical patent/CN113488045A/zh
Publication of CN113488045A publication Critical patent/CN113488045A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种听写内容控制的系统及方法,通过建立听写音频播报文件的索引文件,结合语音识别,可以根据用户的语音控制指令,自动寻找并跳转至指定位置的生词的起始处进行播报,不需要用户手动拖动进度条就可以精准控制听写内容的播报,有助于提高听写效率,改善用户体验。

Description

一种听写内容控制的系统及方法
技术领域
本发明涉及智能教育技术领域,具体涉及一种听写内容控制的系统及方法。
背景技术
听写是学习语言时一种常见的教学方式。目前,大多数人主要是利用电子设备(比如智能手机、笔记本电脑、平板电脑等)提供的播放器来播放听写音频,并写下听写音频中报读的文字,以进行听写练习。实践中发现,当听写者想要重听听写音频中的某一段内容时,往往需要手动地拖动播放器进度条,以将播放器进度条的位置调整至与该段内容对应的播放时间点,并重新播放。然而,用户很难手动地将播放器进度条的位置调整至某一精确的播放时间点,进而无法准确地控制听写播报进度。
发明内容
针对现有技术的不足,本发明旨在提供一种听写内容控制的系统及方法。
为了实现上述目的,本发明采用如下技术方案:
一种听写内容控制的系统,包括:
数据存储模块:包括有数据库存储模块和音频数据存储模块;所述数据库存储模块用于采用数据库的方式存储用户信息、教材信息、各个教材中各个章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url以及所含的生词信息;音频数据存储模块用于将各个教材中各个章节或课文的听写音频播报文件存储在本地,每个听写音频播报文件均创建有对应的索引文件,所述索引文件用于记录各个生词在听写音频播报文件中的起始时间戳,并按起始时间戳的先后顺序对各个生词进行排列;
听写设置模块:用于供用户设置本次听写的教材及章节或课文;
听写播报模块:用于根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url;用于根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;用于在用户触发开始听写事件后默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令,当采集到用户的听写控制语音指令时,根据用户的听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报;所述听写控制语音指令用于指定从听写音频播报文件的当前位置生词跳转至哪个位置的生词进行播报。
本发明还提供一种利用上述系统的方法,具体过程为:
用户想要进行听写时,触发听写事件,听写设置模块弹出听写设置界面,供用户设置本次听写的范围;用户在听写设置界面上设置本次听写的教材以及章节或课文;
听写播报模块根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url,然后根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;
用户触发开始听写事件后,听写播报模块默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令;
听写播报模块采集到语音时,将其转为文字并判断其是否和预存的听写控制语音指令相匹配,如果不匹配,不进行操作,如果匹配,则该语音为听写控制语音指令,根据该听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报。
本发明的有益效果在于:本发明通过建立听写音频播报文件的索引文件,结合语音识别,可以根据用户的语音控制指令,自动寻找并跳转至指定位置的生词的起始处进行播报,不需要用户手动拖动进度条就可以精准控制听写内容的播报,有助于提高听写效率,改善用户体验。
具体实施方式
以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1
本实施例提供一种听写内容控制的系统,包括:
数据存储模块:包括有数据库存储模块和音频数据存储模块;所述数据库存储模块用于采用数据库的方式存储用户信息(昵称、年级、学校等)、教材信息(教材名称、出版社、科目等)、各个教材中各个章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url以及所含的生词信息;音频数据存储模块用于将各个教材中各个章节或课文的听写音频播报文件存储在本地,每个听写音频播报文件均创建有对应的索引文件,所述索引文件用于记录各个生词在听写音频播报文件中的起始时间戳,并按起始时间戳的先后顺序对各个生词进行排列;
听写设置模块:用于供用户设置本次听写的教材及章节或课文;
听写播报模块:用于根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url;用于根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;用于在用户触发开始听写事件后默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令,当采集到用户的听写控制语音指令时,根据用户的听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报;所述听写控制语音指令用于指定从听写音频播报文件的当前位置生词跳转至哪个位置的生词进行播报。
上述系统可应用在各种智能终端上,例如学生平板、智能手机等。
实施例2
本实施例提供利用实施例1所述系统的方法,具体过程为:
用户想要进行听写时,触发听写事件(可以通过按键、语音、手势等方式触发),听写设置模块弹出听写设置界面,供用户设置本次听写的范围;用户在听写设置界面上设置本次听写的教材以及章节或课文;
听写播报模块根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url,然后根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;
用户触发开始听写事件后(可以通过按键、语音、手势等方式触发),听写播报模块默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令;
听写播报模块采集到语音时,将其转为文字并判断其是否和预存的听写控制语音指令相匹配,如果不匹配,不进行操作,如果匹配,则该语音为听写控制语音指令,根据该听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报。
具体地,可以预存多个听写控制语音指令如上一个、下一个、上两个、下两个等,如果听写控制语音指令是上一个,则按照索引文件的起始时间戳顺序,从当前位置的生词跳转至上一个生词的起始时间戳处进行播报。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。

Claims (2)

1.一种听写内容控制的系统,其特征在于,包括:
数据存储模块:包括有数据库存储模块和音频数据存储模块;所述数据库存储模块用于采用数据库的方式存储用户信息、教材信息、各个教材中各个章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url以及所含的生词信息;音频数据存储模块用于将各个教材中各个章节或课文的听写音频播报文件存储在本地,每个听写音频播报文件均创建有对应的索引文件,所述索引文件用于记录各个生词在听写音频播报文件中的起始时间戳,并按起始时间戳的先后顺序对各个生词进行排列;
听写设置模块:用于供用户设置本次听写的教材及章节或课文;
听写播报模块:用于根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url;用于根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;用于在用户触发开始听写事件后默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令,当采集到用户的听写控制语音指令时,根据用户的听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报;所述听写控制语音指令用于指定从听写音频播报文件的当前位置生词跳转至哪个位置的生词进行播报。
2.一种利用权利要求1所述系统的方法,其特征在于,具体过程为:
用户想要进行听写时,触发听写事件,听写设置模块弹出听写设置界面,供用户设置本次听写的范围;用户在听写设置界面上设置本次听写的教材以及章节或课文;
听写播报模块根据用户设置的本次听写的教材及章节或课文,在数据库存储模块中搜索该教材及章节或课文的听写音频播报文件在本地的存储路径或在服务器的下载url,然后根据听写音频播报文件在本地的存储路径或在服务器的下载url获取对应的听写音频播报文件及索引文件;
用户触发开始听写事件后,听写播报模块默认从头开始播报听写音频播报文件,并实时监测用户的听写控制语音指令;
听写播报模块采集到语音时,将其转为文字并判断其是否和预存的听写控制语音指令相匹配,如果不匹配,不进行操作,如果匹配,则该语音为听写控制语音指令,根据该听写控制语音指令在索引文件中找到对应位置的生词的起始时间戳,并跳转至听写音频播报文件对应的时间戳位置进行播报。
CN202110751103.1A 2021-07-01 2021-07-01 一种听写内容控制的系统及方法 Pending CN113488045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110751103.1A CN113488045A (zh) 2021-07-01 2021-07-01 一种听写内容控制的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110751103.1A CN113488045A (zh) 2021-07-01 2021-07-01 一种听写内容控制的系统及方法

Publications (1)

Publication Number Publication Date
CN113488045A true CN113488045A (zh) 2021-10-08

Family

ID=77940331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110751103.1A Pending CN113488045A (zh) 2021-07-01 2021-07-01 一种听写内容控制的系统及方法

Country Status (1)

Country Link
CN (1) CN113488045A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204496731U (zh) * 2015-01-19 2015-07-22 王功成 一种语音控制听写装置
CN109460209A (zh) * 2018-12-20 2019-03-12 广东小天才科技有限公司 一种听写报读进度的控制方法及电子设备
CN111026786A (zh) * 2019-04-11 2020-04-17 广东小天才科技有限公司 一种听写列表生成方法及家教设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204496731U (zh) * 2015-01-19 2015-07-22 王功成 一种语音控制听写装置
CN109460209A (zh) * 2018-12-20 2019-03-12 广东小天才科技有限公司 一种听写报读进度的控制方法及电子设备
CN111026786A (zh) * 2019-04-11 2020-04-17 广东小天才科技有限公司 一种听写列表生成方法及家教设备

Similar Documents

Publication Publication Date Title
CN109460209B (zh) 一种听写报读进度的控制方法及电子设备
CN111970257B (zh) 一种文稿显示控制方法、装置、电子设备和存储介质
US10580394B2 (en) Method, client and computer storage medium for processing information
KR101158319B1 (ko) 어학학습 전자기기 구동 방법, 시스템 및 이를 응용한 동시통역 학습기
CN101467142A (zh) 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法
US20200302112A1 (en) Speech to text enhanced media editing
CN105912558A (zh) 声音检索装置和声音检索方法
CN111081084B (zh) 一种听写内容的播报方法及电子设备
CN109471955B (zh) 视频片段的定位方法、计算设备及存储介质
CN107679196A (zh) 一种多媒体识别方法、电子设备及存储介质
US20200410967A1 (en) Method for displaying triggered by audio, computer apparatus and storage medium
CN111405374A (zh) 一种视频进度节点生成方法、装置、设备及存储介质
CN111553138B (zh) 用于规范内容结构文档的辅助写作方法及装置
CN111128254B (zh) 音频播放方法、电子设备及存储介质
CN105006179A (zh) 语音输入的内容跟读方法和装置
CN113497968A (zh) 一种听写内容获取的方法
CN101097659A (zh) 语言学习系统及其方法
CN104679755A (zh) 一种音频搜索方法及装置、终端
CN113488045A (zh) 一种听写内容控制的系统及方法
Chand et al. A framework for lecture video segmentation from extracted speech content
CN113010649B (zh) 一种语文生词听写进度的控制系统及方法
CN113194380B (zh) 一种英语生词听写进度的控制系统及方法
WO2021017302A1 (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
CN108109637B (zh) 音频与文本同步录制方法及装置
CN113301370A (zh) 一种双师直播课程习题视频片段入库的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211008