CN1532832A - 层次型定位音频数据流的方法及使用该方法的语言学习机 - Google Patents

层次型定位音频数据流的方法及使用该方法的语言学习机 Download PDF

Info

Publication number
CN1532832A
CN1532832A CNA031078575A CN03107857A CN1532832A CN 1532832 A CN1532832 A CN 1532832A CN A031078575 A CNA031078575 A CN A031078575A CN 03107857 A CN03107857 A CN 03107857A CN 1532832 A CN1532832 A CN 1532832A
Authority
CN
China
Prior art keywords
locating information
level
data stream
audio data
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA031078575A
Other languages
English (en)
Inventor
余晓冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA031078575A priority Critical patent/CN1532832A/zh
Publication of CN1532832A publication Critical patent/CN1532832A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供一种层次型定位音频数据流的方法及使用该方法的语言学习机,本发明的方法是在存储器中存入音频数据流的同时,存入对应的多层定位信息。控制器在系统菜单中根据音频数据流对应的多层定位信息生成有由定位信息项组成的层次型菜单。同时,与音频数据流对应的多层定位信息中也包含有整句层次和词或词组层次定位信息,在播放状态时,按键组合105的上、下、左、右四个键,分别用来控制控制器做整句层次的前后定位和词或词组层次的前后定位。因此,本发明既能方便以层次型菜单方式选择学习内容,同时又能方便以整句和词或词组为单位复读跟读。

Description

层次型定位音频数据流的方法及使用该方法的语言学习机
所属技术领域
本发明涉及学习和教学设备,尤其是使用压缩音频数据源的语言学习机。
背景技术
近年来,随着数字音频压缩技术和集成电路技术的发展,语言学习机开始完全采用半导体存储器作为记录语音的载体,如各种MP3复读机。MP3是MPEG Layer3的缩写,是一种音频信息的压缩格式。
MP3复读机除了复读和跟读对比外,还提供有按句的前后搜索和同步文字显示等实用的功能,这些功能是以歌词的方式实现的,特点是没有分层,歌词之间完全是对等的关系,而且只记录有文本和音频的同步信息,即帧(frame)数或时间,在比特率和采样率可变的情况下,帧长是不同的,同步信息就不能直接定出地址偏移量了,这样功能的进一步增强就受到限制。
虽然MP3复读机比磁带复读机方便多了,但针对外语学习来说,还很需要改进。
在一段连续的语音材料中,可能分为若干课、若干段落、若干组练习、若干组听力、若干组生词等用户如果只想学习其中某一个内容,就需要重复按句搜索,十分不便,但若把语音材料完全拆细,又不便管理。
另外,外语学习者在听力起步阶段,只有把句子分段来听,逐渐熟悉连音、轻音、略音,才能有效提升外语听力,把句子分段也方便跟读摹仿,现有的MP3复读机如果把句子划分为小段,要听完整的一句,又无法实现,只能连续听。
发明内容
因此,本发明的目的就是提供一种方便的层次型定位音频数据流的方法及使用该方法的语言学习机,既能方便以层次型菜单方式选择学习内容,同时又能方便以整句和词或词组为单位复读跟读。音频数据流在半导体存储器中通常以音频数据文件方式存在,领域技术人员知道还可以有其他存储方式。
本发明的技术方案是在存储器和/或存储卡中存入音频数据流的同时,存入对应的多层定位信息,定位信息包含有层次数据、地址偏移量或压缩音频数据流在帧长等长情况下的帧数、文本数据,定位信息的总和逻辑上构成以各层定位信息为节点的树。控制器在系统菜单的音频数据流的菜单项下根据音频数据流对应的多层定位信息生成有由定位信息项组成的层次型菜单。
本发明的语言学习机,如图2所示,包含有控制器201、存储器和/或存储卡202、键盘203、显示器204、音频解码器205,如图1所示,键盘包含有一按键组合105,至少包含上、下、左、右四个键,在用户选择定位信息项状态时,分别用来控制控制器做菜单的前后滚动和菜单层次的进入退出操作,按键组合105的中间位置包含有中央键,用来控制控制器做选定当前层次的当前项的定位信息的操作,不进入下一层次。这样按键组合105就可以在任意层次上选定学习内容。
同时,与音频数据流对应的多层定位信息中也包含有整句层次和词或词组层次定位信息,在播放状态时,按键组合105的上、下、左、右四个键,分别用来控制控制器做整句层次的前后定位和词或词组层次的前后定位,中央键用来控制控制器做整句层次或是词或词组层次的复读。再加上跟读/对比键106控制控制器改变跟读状态,这样就实现了以整句和词或词组为单位复读跟读。
附图说明
图1为实施例1的语言学习机结构示意图。
图2为实施例1的电路原理的方框图。
图3为实施例1的音频数据流和对应的多层定位信息的数据格式。
图4为实施例1的音频数据流中的各学习内容的关系示意图。
图5为实施例1的包括动态生成的定位信息项菜单的菜单系统示意图。
图6为实施例1的通过菜单选择学习内容的操作流程图。
图7、8、9为实施例1的实现以整句和词或词组为单位复读的操作流程图。
图10为实施例2的语言学习机结构示意图。
具体实施方式
在图1所示实施例1中,语言学习机100包含有外壳、键盘102、显示器103,键盘包含有按键组合105,跟读/对比键106,自动/手动键107,退出/关机键108和提示键109。
下面结合图2说明其工作原理:
用户操作键盘102,向控制器201手动输入控制信号,控制器201将操作的结果通过数据总线发送到显示器103,音频数据流及对应的多层定位信息存在存储器和/或存储卡202中,控制器201同时将多层定位信息转化为层次型菜单链接在系统菜单的音频数据流的菜单项下,在显示器103中一并显示,并可由用户操作控制,用户选定的学习内容通过音频解码器205解码输出。其中,控制器201可采用摩托罗拉MC68332微处理器实现,音频解码器205可采用Micronas MAS3507D音频解码器芯片实现。
实施例1的音频数据流和对应的多层定位信息的数据格式如图3所示,本实施例的定位信息置于音频数据流之前,也可以置于音频数据流之后,或分别存储。定位信息包括各层定位信息,每层定位信息又包括层内的定位信息列表,整句以上层次每个定位信息由层次序数、对应内容的下一层次数据偏移量、文本信息和同步字节组成。本实施例中,整句层次的层次序数为2,词或词组层次的层次序数为1,整句以上层次按顺序增加。整句层次每个定位信息由层次序数、对应内容的下一层次数据偏移量、对应内容的音频数据偏移量、文本信息和同步字节组成。词或词组层次每个定位信息由层次序数、对应内容的音频数据偏移量、文本信息和同步字节组成。其中,音频数据偏移量一般取音频数据帧头部的偏移量。定位信息的总和逻辑上构成以各层定位信息为节点的树,根节点为该音频数据流文件,如图4所示。
用户选择学习内容时,控制器读出文件中的定位信息,还原为菜单树,链接到系统菜单中。如图5所示,控制器在文件1项下链接了文件1内部定位信息构成的菜单树,实施例中只显示到段落层次,整句层次或是词或词组层次在播放时由用户操作控制。
下面说明用户选择内容时的操作。菜单滚动到当前音频数据流项时,右键或中央键被激活则进入选择内容操作。如图6所示,此处有两种用户选择操作,一种是按中央键,一种是按右键,本实施例中按中央键就是第一种预定的用户激活模式,按右键就是第二种预定的用户激活模式,第一种预定的用户激活模式控制控制器直接选定当前的定位信息,进入播放,第二种预定的用户激活模式控制控制器进入当前定位信息包含的下层定位信息列表。第一种预定的用户激活模式还可以包含下一层次为整句时按右键。
选定学习内容后,本实施例就进入播放状态,下面说明播放状态时用户的操作。如图7、8、9所示,此处用到的变量有学习内容对应音频数据的首尾偏移量、学习内容对应整句层次定位信息的首尾偏移量、当前复读单位、当前音频数据偏移量、当前整句层次定位信息偏移量、当前词或词组层次定位信息偏移量,为表示方便,图7、8、9中对变量名称作了简化,分别称为音首、音尾、句首、句尾、复读单位、音偏、句偏、词偏。图7、8、9所示为手动状态时的操作流程,自动状态时,若按动键盘组合105则自动转到手动状态。手动状态时,当前复读单位播放完后,暂停等待用户输入,按自动/手动键107可恢复自动状态。手动状态时,按下跟读/对比键106,进入录音状态,再次按下跟读/对比键106,进入当前复读单位和录音的循环播放状态,直到按动其它键为止。手动状态时,键盘组合105的上、下、左、右四个键有切换复读单位的功能。
在图10所示实施例2中,语言学习机100的键盘组合105没有中央键,上、下、左、右四个键的键帽也合为一个。在用户选择定位信息项状态,本实施例没有实现第一种预定的用户激活模式,就只有右键实现的预定的用户激活模式,当然也可以用其它键实现第一种预定的用户激活模式,比如用上键,去掉上键的滚动菜单功能。在播放状态,本实施例用上键来控制控制器做词或词组层次的复读,左键来控制控制器做整句层次的复读,用上、左两个键大于预定时间T的按压,分别来控制控制器做整句层次的前向定位和词或词组层次的前向定位。

Claims (10)

1、一种层次型定位音频数据流的方法,包括步骤:
(a)在存储器和/或存储卡中存入音频数据流及对应的多层定位信息;
(b)响应用户控制输入,确定播放内容;
(c)播放选定的内容;
其特征在于定位信息包含有层次数据、音频数据地址偏移量或压缩音频数据流在帧长等长情况下的帧数、文本数据,定位信息的总和逻辑上构成以各层定位信息为节点的树。
2、根据权利要求1所述的定位方法,其特征在于步骤(b)包括步骤:
(d)响应用户控制输入,滚动菜单到当前音频数据流项;
(e)响应预定的用户激活模式;
(f)判断下一层次是否为整句层次;
(g)如果下一层次是整句层次则当前定位信息置为选定内容,结束步骤(b);
(h)如果下一层次不是整句层次则显示下一层次定位信息的文本数据列表;
(i)响应用户控制输入,滚动菜单;
(j)返回步骤(e)。
3、根据权利要求1所述的定位方法,其特征在于步骤(b)包括步骤:
(k)响应用户控制输入,滚动菜单到当前音频数据流项;
(l)响应预定的用户激活模式;
(m)判断用户激活模式的种类;
(n)如果是第一种预定的用户激活模式则当前定位信息置为选定内容,结束步骤(b);
(o)如果是第二种预定的用户激活模式则显示下一层次定位信息的文本数据列表;
(p)响应用户控制输入,滚动菜单;
(q)返回步骤(l)。
4、根据权利要求1或2或3所述的定位方法,其特征在于步骤(c)包括步骤:
(r)响应用户控制输入,按整句层次的定位信息向前后调整播放的音频数据流的当前偏移;
(s)响应用户控制输入,按词或词组层次的定位信息向前后调整播放的音频数据流的当前偏移。
5、一种能够用层次型定位音频数据流的方法操作的语言学习机,包含有控制器、存储器和/或存储卡、键盘、显示器、音频解码器,其特征在于包含有一按键组合,至少包含上、下、左、右四个键,在播放状态时,分别用来控制控制器做整句层次的前后定位和词或词组层次的前后定位。
6、根据权利要求5所述的语言学习机,其特征在于按键组合的中间位置包含有中央键,在播放状态时,用来控制控制器做整句层次或是词或词组层次的复读。
7、根据权利要求5或6所述的语言学习机,其特征在于控制器在系统菜单的音频数据流的菜单项下根据音频数据流对应的多层定位信息生成有包含定位信息项的层次型菜单。
8、根据权利要求7所述的语言学习机,其特征在于按键组合的中间位置包含有中央键,中央键在用户选择定位信息项状态时,用来控制控制器做选定当前层次的当前项的定位信息的操作,不进入下一层次。
9、一种语言学习机,包含有控制器、存储器和/或存储卡、键盘、显示器、音频解码器,其特征在于控制器在系统菜单的音频数据流的菜单项下根据音频数据流对应的多层定位信息生成有包含定位信息项的层次型菜单。
10、根据权利要求9所述的语言学习机,其特征在于键盘包含有一按键组合,至少包含上、下、左、右四个键,按键组合的中间位置包含有中央键,在用户选择定位信息项状态时,用来控制控制器做选定当前层次的当前项的定位信息的操作,不进入下一层次。
CNA031078575A 2003-03-25 2003-03-25 层次型定位音频数据流的方法及使用该方法的语言学习机 Pending CN1532832A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA031078575A CN1532832A (zh) 2003-03-25 2003-03-25 层次型定位音频数据流的方法及使用该方法的语言学习机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA031078575A CN1532832A (zh) 2003-03-25 2003-03-25 层次型定位音频数据流的方法及使用该方法的语言学习机

Publications (1)

Publication Number Publication Date
CN1532832A true CN1532832A (zh) 2004-09-29

Family

ID=34283037

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA031078575A Pending CN1532832A (zh) 2003-03-25 2003-03-25 层次型定位音频数据流的方法及使用该方法的语言学习机

Country Status (1)

Country Link
CN (1) CN1532832A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411622A (zh) * 2011-11-24 2012-04-11 陈雪茹 便携式音频播放器设置电子书签的方法
CN101901622B (zh) * 2009-05-27 2012-08-29 鸿富锦精密工业(深圳)有限公司 音频资料定位方法
CN102929395A (zh) * 2012-10-25 2013-02-13 张洪旗 指触定位星组合键盘
CN102956122A (zh) * 2011-08-10 2013-03-06 卡西欧计算机株式会社 声音学习装置和声音学习方法
WO2017096804A1 (zh) * 2015-12-11 2017-06-15 乐视控股(北京)有限公司 在设备上呈现项目菜单的方法及装置
CN111556406A (zh) * 2020-04-23 2020-08-18 深圳市威麦科技有限公司 音频处理方法、音频处理装置及耳机
CN115309312A (zh) * 2021-04-21 2022-11-08 花瓣云科技有限公司 一种内容显示方法与电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901622B (zh) * 2009-05-27 2012-08-29 鸿富锦精密工业(深圳)有限公司 音频资料定位方法
CN102956122A (zh) * 2011-08-10 2013-03-06 卡西欧计算机株式会社 声音学习装置和声音学习方法
CN102956122B (zh) * 2011-08-10 2015-01-14 卡西欧计算机株式会社 声音学习装置和声音学习方法
CN102411622A (zh) * 2011-11-24 2012-04-11 陈雪茹 便携式音频播放器设置电子书签的方法
CN102929395A (zh) * 2012-10-25 2013-02-13 张洪旗 指触定位星组合键盘
WO2017096804A1 (zh) * 2015-12-11 2017-06-15 乐视控股(北京)有限公司 在设备上呈现项目菜单的方法及装置
CN111556406A (zh) * 2020-04-23 2020-08-18 深圳市威麦科技有限公司 音频处理方法、音频处理装置及耳机
CN111556406B (zh) * 2020-04-23 2022-04-22 深圳市威麦科技有限公司 音频处理方法、音频处理装置及耳机
CN115309312A (zh) * 2021-04-21 2022-11-08 花瓣云科技有限公司 一种内容显示方法与电子设备

Similar Documents

Publication Publication Date Title
US7953236B2 (en) Audio user interface (UI) for previewing and selecting audio streams using 3D positional audio techniques
US5386493A (en) Apparatus and method for playing back audio at faster or slower rates without pitch distortion
EP1353336B1 (en) Karaoke reproducing apparatus
US7684991B2 (en) Digital audio file search method and apparatus using text-to-speech processing
US6928433B2 (en) Automatic hierarchical categorization of music by metadata
CN100547654C (zh) 语音合成装置
CN106971749A (zh) 音频处理方法及电子设备
US20070064562A1 (en) Apparatus and method for reproducing audio file
US20020193895A1 (en) Enhanced encoder for synchronizing multimedia files into an audio bit stream
RU2005121274A (ru) Мультимедийный редактор для устройств беспроводной связи и способ его реализации
WO1999008175A2 (en) Universally accessible computing system
JP2006323806A (ja) テキストを音声に変換するシステムおよび方法
WO2007068090A1 (en) System and method for authoring media content
Roy NewsComm--a hand-held device for interactive access to structured audio
CN101622857A (zh) 照片背面上的pc元数据
CN1532832A (zh) 层次型定位音频数据流的方法及使用该方法的语言学习机
CN1945692B (zh) 一种在语音合成系统中提升提示音匹配效果的智能方法
KR100830689B1 (ko) 청킹을 이용한 언어학습용 멀티미디어 재생방법 및 상기 재생방법이 실행되는 프로그램이 기록된 기록매체
CN1822091B (zh) 显示字符的电子音乐设备
JP2005326811A (ja) 音声合成装置および音声合成方法
CN1332365C (zh) 一种实现音频和文本信息同步控制的方法和装置
CN101661788B (zh) 再现设备和再现方法
CN1916885B (zh) 实现影音文同步播放的方法
CN2842652Y (zh) 声控点播mp3播放器
CN1145913C (zh) 重现信息或执行功能的设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication