CN1367906A

CN1367906A - 使用数字音频和字幕数据的学习方法和装置

Info

Publication number: CN1367906A
Application number: CN 00811190
Authority: CN
Inventors: 朴奎珍
Original assignee: Individual
Current assignee: Individual
Priority date: 1999-07-31
Filing date: 2000-07-31
Publication date: 2002-09-04
Anticipated expiration: 2020-07-31
Also published as: CN1269087C; CN1595470A; WO2001009785A1; CN1189836C; AU6186900A

Abstract

公开一种利用数字音频及其同步字幕数据进行学习的方法和装置。当学习语言或歌曲时,可以同时或者有选择地输出声音、乐曲伴奏和文本。可在能够存储数字音频文件和字幕数据的重现装置中实现该目的。可以根据学习进程来调整声音、乐曲伴奏和字幕数据的输出。重现装置应该有两个或多个声道,并且声道可以存储不同的内容。用户可以任意选择不同的声道。

Description

使用数字音频和字幕数据的学习方法和装置

发明领域

本发明涉及一种利用数字音频及其同步字幕数据进行学习的方法和装置。更具体地说，本发明涉及一种利用数字音频和其同步的字幕数据的输出声道选择进行学习的方法和装置，其中，在诸如外语、歌词、乐曲等等之类的特定主题需要被反复学习的情况下，可根据学习者的学习进程调整难度来进行学习，从而使自学可以成为可能。

发明背景

根据数字信号处理技术方面的发展，利用数字音频信号的各种产品已被开发并出售。这样的例子有使用数字音频文件的MP3播放器、讲话学习装置，以及通过利用数字音频文件来输出乐曲伴奏的卡拉OK录音。这些装置不仅输出歌词和乐曲伴奏而且还输出文字中的字幕数据。也就是说，将文字和音频信号的输出一起显示，因此，它们对语言学习和歌曲学习很有帮助。

实质上，数字音频数据只包括声音的信息。可是，这种数字音频数据可以存储字幕信息。当播放该数字数据时，可以通过诸如耳机之类的声音输出设备以及通过诸如液晶显示器之类的显示设备来获取该输出。

数字音频数据的比特排列由帧或者AAU(音频存取单元)组成。这些帧单元覆盖了MP3装置和所有DVD(数字多用光盘)标准和MPEG的标准音频部分。

能够把字幕数据插入到数字音频数据中的软件可以通过帧编号来表示字幕显示位置，因此，它可以被应用到以帧单元的形式来排列比特流的所有数字音频数据中。

可是，在用于重现数字音频数据的传统语言学习装置中，用户只可单向地收听并收看输出的数字音频数据和字幕数据，前者是通过扬声器或耳机输出的。因此，学习者无法设置各种情形，并因此无法有效地学习讲话。

另外，在卡拉OK的情况下，歌词和乐曲伴奏同时被输出，因此不了解的人可以通过观看显示的文字来演唱这首歌。可是，同样在这种情况下，这个人还是应该预先大概了解这首歌曲。也就是说，如果这个人要很好地演唱这首歌曲，那么此人必须对原始歌手的这首歌曲已经很熟悉。

因此，存在着对这样一种装置的需求：在这种装置中，可以以有选择地输出原始歌手的声音的方式来把传统音频装置和卡拉OK组合到一起。

发明内容

本发明的目的在于方便对语言和歌曲的学习。

因此，本发明的一个目的是提供一种利用数字音频及其字幕数据进行学习的方法，其中，可根据学习进程来调整难度等级，以方便学习并可实现自学。

本发明的另一个目的是提供一种利用数字音频及其字幕数据的输出声道选择的学习方法和学习装置，其中，在讲话学习的情况下，用户可以有选择地设置音频输出环境，以使用户可以执行所期望的角色。

在实现上面的目的时，根据本发明，利用数字音频及其字幕数据进行学习的方法包括如下步骤：形成第一学习方式存储模式，用于通过把歌曲字幕、原始歌手的声音以及乐曲伴奏的信号转换成为数字文件来存储它们；和形成第二学习方式存储模式，用于通过把歌曲字幕和乐曲伴奏的信号转换成为数字文件来存储它们，由此而为任意的歌曲形成数字文件，并且基于第一或第二学习方式存储模式来重现该数字文件以便于学习任意的歌曲。

在本发明的另一方面中，根据本发明，利用数字音频及其字幕数据进行学习的方法包括如下步骤：形成第一学习方式存储模式，用于通过区分讲话者的声音和文字中的讲话细节或者文字中的新闻细节的字幕，以及通过把音频和字幕的信号转换为数字文件来存储外语讲话或新闻；和形成第二学习方式存储模式，用于通过区分讲话者的声音和文字中的讲话细节或者文字中的新闻细节的字幕，以及通过只把讲话者的声音信号转换为数字文件来存储外语讲话或新闻，由此为任意的讲话或新闻形成数字文件，并且按照用户的重现选择来重现该数字文件，以便能够学习任意的讲话或新闻。

在本发明的另一方面中，根据本发明，利用数字音频及其字幕数据进行学习的方法包括如下步骤：形成第一学习方式存储模式，用于通过准备一部外国电影的所有谈话者的所有话音和所有谈话字幕的数字数据文件来记录全部声音，全部字幕；和形成第二学习方式存储模式，通过在删除某些谈话者的话音之后记录一部电影剧本来存储数据文件，以使用户代替所删除的话音来交谈，由此形成数字数据，并且，如果该用户选择学习重现模式并选择谈话者，则有选择地重现该数字数据文件以使该用户代替该特定的谈话者来交谈。

在本发明的另一方面中，根据本发明，利用字幕数据的输出声道选择进行学习的方法包括如下步骤：在用户输入用于重现音频信号的操作开启信号时检验当前重现操作的操作模式(第一步)；如果发现操作模式是标准声道输出，则将已设置的音频信号输出到相应的声道(R和L)(第二步)；如果操作模式被设置到右声道(R)，则把音频信号重现并输出到右声道(第三步)；和如果操作模式被设置到左声道(L)，则把音频信号重现并输出到左声道(第四步)。

在本发明的另一方面中，根据本发明，利用字幕数据的输出声道选择进行学习的学习装置，其特征在于：如果来自按键盘的用于重现音频信号的操作开启信号是一个输入，则检验由控制部分当前设置的重现期间的操作模式；如果操作模式标准，控制部分则控制解码器输出已经设置到相应声道(R和L)的音频信号；如果操作模式被设置到右声道(R)，控制部分则控制解码器把音频信号重现并输出到右声道；和如果操作模式被设置到左声道(L)，控制部分则控制解码器把音频信号重现并输出到左声道。

附图说明

通过参考附图详细描述本发明的优选实施例，本发明上面的目的和其他优点将变得更加显而易见。

图1是表示作为硬件实例的数字音频播放器的构造方框图，该硬件应用于根据本发明的学习方法；

图2是表示在根据本发明学习歌曲的学习方法中用于数字音频及其字幕数据的输入/输出过程的流程图；

图3是表示在根据本发明学习外语讲话的学习方法中用于数字音频及其字幕数据的输入/输出过程的流程图；

图4是表示在根据本发明通过外国电影剧本及其音轨来学习外语的学习方法中用于数字音频及其字幕数据的输入/输出过程的流程图；

图5a到5c说明了相应的学习外国电影的字幕画面的输出状态；

图6是表示作为本发明中使用的硬件的例子的传统立体声重现装置的部分方框图；

图7是表示作为本发明中使用的硬件的例子的传统多声道重现装置的部分方框图；

图8是表示根据本发明对采用立体声声道的字幕数据利用输出声道选择的学习方法的流程图；

图9是表示根据本发明对采用多声道的字幕数据利用输出声道选择的学习方法的流程图；和

图10说明了根据本发明对于字幕数据采用使用输出声道选择的学习方法的个人计算机的构造。

具体实施方式

下面将参见附图描述本发明的优选实施例。实例1

根据本发明利用数字音频及其字幕数据的学习方法包括：(1)一种通过使数字音频存储模式和字幕数据存储模式彼此不同来有选择地选择输出状态的方法；和(2)一种在把数字音频和字幕数据存储在不同的声道(不止立体声声道)之后有选择地设置输出状态的方法。

在本发明中，前者和后者的区别在于：一种是在其中利用了数字音频和字幕数据的方法，一种是在其中利用了数字音频和字幕数据的输出声道选择的方法。原则上，很明显在本发明的两种方法之间存在的相似性在于在学习中数字音频和字幕数据都被利用。首先，参见图1到5，即，在实例1到3中，将描述利用数字音频和字幕数据的方法，然后，参见图6到10，即，在实例4中，将描述利用数字音频和字幕数据的输出声道选择的方法。

图1是表示作为硬件实例的数字音频播放器的构造方框图，该硬件应用于根据本发明的学习方法。

如该图所示，数字音频播放器50包括：调制解调器31，用于通过PSTN/ISDN网从有线交换台的字幕学习网络服务器43接收字幕数字数据；通信接口32，用于根据此传输数据由内部设备通过数据总线从PC机42中接收可读的数据；和内部屏上文字讲话学习数据存储器33，用于存储讲话学习话音和字幕数据，存储器33通过连接器44连接到外部学习数据存储器41。

调制解调器31、通信接口32和内部学习数据存储器33被连接到DSP/CPU39，DSP/CPU39具有I/O端口，ROM45和RAM46。

DSP/CPU39连接到具有PLAY、REW、FF和STOP键的开关，并且还连接到LCD38，在把字幕数据转换成为文字之后，LCD 38显示该字幕数据。通过CODEC34、变换器47和滤波器48传送已经由DSP/CPU 39处理的数字音频信号，以便最后通过语音输出设备36输出。

当数字音频播放器从外部设备收到字幕讲话学习数据时，该数据源成为有线交换台的数据库服务器43，以便形成调制解调器通信模式，并且将CPU连接到有线交换台的服务器，也就是说，驱动调制解调器31以执行DTMF拨号。

另外，在数字音频播放器中，可以通过接口设备32从PC机42接收所需要的数字数据。

DSP/CPU39在从调制解调器31或者从通信接口32接收到数字音频和字幕数据之后对它们进行处理，以便把他们存储到内部学习数据存储器33中。

通过诸如计算机(并行)打印机端口、串行端口、USB或火线(IEEE 1394)之类的有线设备，或者通过诸如红外线数据或蓝牙之类的无线形式来连接通信接口32，以便可以把数据储存到重现装置的存储装置中，即，储存到学习数据存储器33中。存储装置可以是诸如闪速存储器之类的非易失存储器或者是诸如DVD(数字多用光盘)之类的读/写存储装置。

连接到DSP/CPU39的开关部分40选择数字音频播放器的各种功能。例如，如果开关部分40的PLAY开关被开启，则CPU39使播放器处于学习重现模式，并且把选定的数字文件从内部学习数据存储器33中提出以便对其进行处理。

已经被DSP/CPU39处理过的数字音频数据在通过CODEC34、转换器47和滤波器48传送信号之后以模拟话音的形式输出。同时，由DSP/CPU39处理的字幕数据在通过LCD驱动器37之后显示在LCD38上。

以这种方式，通过声音和文字的同时输出，可以改善语言学习效果。

图2是表示根据本发明在学习歌曲的学习方法中的数字音频及其字幕数据的输入/输出过程的流程图。

如该图所示，如果选定一首歌曲，那么检验它是否是歌曲数字数据文件准备模式。如果它是有关的模式，那么在第一学习方式存储模式，将歌曲区分成为原始歌手的声音、乐曲伴奏和歌词字幕。按照这种方式，就像卡拉OK那样，形成并记录数字数据文件。

在上面，主题是流行歌曲，但是只要给出歌词，原始歌手的声音以及乐曲伴奏，或者只要给出歌词和原始歌手的声音，那么任何种类的歌曲都可以被采用，比如古典的，半古典的，儿童歌曲等等。在上下文中，应该理解以下所论及的歌曲是所有类型的歌曲。

然后，在第二学习方式存储模式，通过只使用乐曲伴奏和字幕数据来准备数字数据。在此条件下，判断这首歌曲是否由二重唱歌手的声音组成。如果不是，那么在第三学习方式存储模式，通过只使用乐曲伴奏来准备数字数据文件。在这种情形下，可以跳过第三学习方式存储模式。

可是，在执行第二学习方式存储模式之后，如果发现这首歌是二重唱歌手的声音，则在第四学习方式存储模式，通过只采用歌手a的声音和字幕数据来准备数字文件。然后在第五学习方式存储模式，通过只采用歌手b的声音和字幕数据来准备数字文件。

可以对如期望的那样多的歌曲执行这种歌曲分开存储。

此后，如果用户通过重现模式的选择执行所希望的歌曲，则可以实现有关歌曲的播放，以使讲话学习变得有趣。

例如，如果一个人对歌词很熟悉，那么可以只输出乐曲伴奏。或者一个人可以选择第二学习方式存储模式，并且可以练习这首歌曲而不必看歌词。如果一个人对歌词和乐曲都不擅长，那么可以同时输出歌词和乐曲。在这种方式中，用户选项是任意的。实例2

图3是表示根据本发明在学习外语讲话或新闻的学习方法中的数字音频及其字幕数据的输入/输出过程的流程图。

在此，如果用户选择了学习语言的讲话或新闻，该系统则判断它是否是使用讲话或新闻的语言学习数字数据文件准备模式。如果它是此数字准备模式，即，如果它是学习数据输入模式，那么在第一学习方式存储模式，通过将诸如讲话或新闻之类的字幕数据与讲话者的音频数据一起装载来形成数字数据文件。

在判断是否需要翻译期间，如果没要求翻译，那么在第二学习方式存储模式，只把讲话者的声音装载到数字数据文件，以便将其记录。

如果发现一种与伴随的同时翻译一起给出的双字幕模式，那么在第三学习方式存储模式，当输出讲话者的声音时，将一个LCD屏幕分成两个区域，以使LCD屏幕的一个区域可以显示原始的字幕文字，而LCD屏幕的另外一个区域可以显示该原始讲话的翻译版本。然后记录所准备的数字数据文件。

在这种方式中，可以根据爱好和理解能力选择讲话和新闻。因此，通过采用讲话或新闻可以有效地学习外语。实例3

图4是表示根据本发明在通过外国电影剧本及其音轨来学习外语的学习方法中的数字音频及其字幕数据的输入/输出过程的流程图。

在此，选择使用电影剧本和实时音轨的讲话学习方式。然后该系统判断它是否是使用剧本及其音轨的一种数字数据文件准备模式。如果它是该数字文件准备模式，即一种学习数据输入模式，那么在第一学习方式存储模式，把电影的谈话者的所有声音、谈话者的姓名以及谈话者的字幕文字都输入到数字数据文件中。因此，记录了该电影的全部声音和全部字幕。在这种情况下，字幕数据显示在LCD上，如图5a所示。

然后在第二学习方式存储模式，执行全声音情形。也就是说，输出字幕数据，而在存储该文件时使实时语音输出静音。在该第二学习方式存储模式，对每一谈话者分开执行记录。

在这种情形下，在预定序列中可以以闪烁的形式显示谈话者的字幕。

在该第二学习方式存储模式，用户可以通过执行一种配音方式代替某一个谈话者来讲话。以这种方式，用户可以确认他或她自己发音的正确性，并且如果发音不好或者不正确，那么用户可以纠正他或她的发音。

为此，用户的声音可以通过数字音频信号处理装置的传声器在原始谈话者的声音之后被反馈。这样，用户可以听到他或她自己的发音。

在第三学习方式存储模式，依下列各项来准备数字数据文件。也就是说，输出相关谈话者的姓名，而使音轨音频和字幕数据静音并且分别转向消隐时间。这需要高记录能力，因此，它的实际应用非常低。因此可以将其去掉。

按照这种方式，用户通过代替电影的谈话者来参与到外国电影中，从而可以改善语言学习效率。

代替谈话者的姓名，向各个谈话者分配序列代码，并且每个序列代码与每一个相关的谈话者匹配。按照这种方式，可以分开储存每一谈话者的每一字幕数据。

因此，通过使用外国电影的剧本和音频来构筑一个学习数据库。在这种状态中，用户选择该用户想代替原始谈话者与之交谈的那个谈话者。然后，分别输出挑选出来的期望的谈话者。或者可以删除一个相关的谈话者。

如图5b所示，如果用户想通过选择一个特定的角色来参与该电影，那么他或她自己的声音通过数字音频信号处理装置的传声器反馈到他或她自己的耳朵里，因为他或她已经代替这个特定谈话者来讲话。该用户可以识别任何不正确的发音，以便在学习外语时能够纠正不正确的发音。

另外如图5c所示，即使在执行特定的谈话者删除模式时，可以不删除原始谈话者的姓名，而是将其表示出来，因此用户会觉得好象自己就是这个实际演员。因此，可以以一种自然的方式来表达感觉与情绪，从而可改善学习外语的效率。

通过重复这种参与学习，可以学会外语的本地发音，从而实现学习的高效率。另外，根据用户的选择，可以以相同的方式删除特定谈话者的声音和字幕数据，并因此能够加强外语的学习。

在上面，通过举例说明了把各种学习数据储存在数字音频播放器的数字存储装置中，并且可以有选择地读出所储存的内容从而实现讲话学习。然而，也可以从PC机中或者从数据服务器下载各种准备的数据，以便将其存储并且将有选择地读出以实现外语学习。实例4

在这个实例中，在学习外语时采用字幕数据的输出声道选择以及数字音频。参见图6和7，首先，简要描述有关传统立体声声道或多声道重现装置的操作。然后参考该描述来说明本发明。

与本发明的方法相关的多声道重现装置(图7)包括：外部数据存储存储器110；外部接口190，用于发射数据到外部装置和从外部装置接收数据；用户输入按键盘180；在其中安装了用于驱动整个系统的程序的控制部分120；解码器130，用于转换数字音频信号；DAC140，用于转换解码器130转换的模拟信号以便通过至少多个声道把它们输出到扬声器；和屏幕驱动设备160，用于驱动一个画面显示设备170，该画面显示设备170显示字幕数据。

存储器110是一个存储装置，用于在从外部信源接收数字音频文件数据之后将其存储。储存的音频文件可以通过用户的控制信号来重现。该音频文件或是在产品出售之前的产品制造期间就已经被储存，或者可以在制造之后通过外部接口190从PC机或其它外部信源中下载该音频文件而被储存。稍后将描述外部接口190。字幕数据也储存在存储器110中，并且在重现期间从存储器中读出此字幕数据。例如，存储器110可以是非易失的存储器，比如闪速存储器或者诸如DVD之类的光盘；同时其他种类的存储装置也是可以使用的。可拆卸或固定地将存储器110安装在重现装置内。

按键盘180用于输入音频文件重现的命令，并且包括一个记录按键，一个重现按键，一个模式选择按键等等。也就是说，按键盘180包括功能键，比如重现功能键，重复重现按键，模式选择按键(标准，以及左和右声道)。由用户输入的控制信号通过按键盘180输入到控制部分120。

控制部分120包括一台微计算机，并且储存了用于执行重现和字幕显示的程序。另外，控制部分120连接到接口190，用于接收来自外部信源的数字文件。控制部分120还存储程序，用于与音频信号的输出同步地把字幕数据输出到画面显示设备。

可以以不同方式构成接口190，以使它可以通过诸如打印机端口(并行端口)、串行端口、USB(通用串行总线)，火线(IEEE1394)等等之类的有线或者通过诸如蓝牙之类的无线路由来发射数据。

控制部分120连接到用于转换数字音频信号的解码器130。解码器130通过多声道转换已记录的储存的音频信号。例如，可以利用诸如可以重现各种多声道数字音频信号的AAC、AC-3等之类的芯片来构成解码器130。

已经由解码器130转换的数字音频信号是数字信号，因此，由DAC140把它们重新转换成模拟音频信号。输出信号被输出到相应声道的扬声器150和152，从而实现声音混频效应。

图6示出了两个扬声器，但是其数量可以根据分配给解码器130的声道的数量而增加或减少。图7说明了基于多声道方法的多个扬声器。另外，本发明可以应用于象传统方法中使用头戴式耳机或者耳机的情况中。这一切都应该在本发明的范围之内。

参考号码160是一个屏上字幕驱动设备，它由控制部分120的控制信号操作。参考号码170是一个画面显示设备，用于显示正被画面驱动设备160启动的字幕数据。该画面显示设备可以是LCD(液晶显示器)或者CRT(阴极射线管)。如果重现音频，控制部分120则输出与该音频同步的字幕数据，该输出通过画面显示设备170来进行。因此，音频信号通过扬声器被输出，而同步的字幕数据显示在画面显示设备170上。因此，用户可以在观看字幕数据和收听音频输出的同时学习语言。

考虑到画面显示设备170的大小来确定字幕数据块的大小，并且相应的字幕数据块与音频输出同步。也就是说，音频信号具有关于每一字幕数据块的开始位置的信息。

通过利用上面提到的位置信息，控制部分120把字幕数据与音频信号同步地输出到画面显示设备170。也就是说，控制部分120监视正在被重现的音频信号中的位置信息。然后，控制部分120把音频信号的位置信息与字幕数据的位置信息进行比较。然后，在同步出现的瞬时，将字幕数据显示在画面显示设备170上。

利用如上所述的装置，根据本发明的学习方法包括如下步骤：在通过按键盘180输入重现音频信号的操作信号后，由控制部分120检查当前设置的重现的操作模式；由控制部分120(如果操作模式标准)控制解码器130，以便把音频信号输出到相应的右和左声道(R和L)；如果操作模式已经被设置到右声道R，则控制部分120通过控制解码器130把音频信号重现并输出到右声道R；如果操作模式已经被设置到左声道L，则控制部分120通过控制解码器130把音频信号重现并输出到左声道L。

为了描述方便起见，假定数字音频文件是立体声文件，在该立体声文件中给出如图6所示的两个声道。可是，在多声道记录方法中，提供更多的声道，在该方式，可以针对每一声道分别地这些控制。在立体声声道中，仅仅提供标准、左和右声道，而在多声道方法中，增加了声道数量。

用户通过按下按键盘180的有关功能键来在标准模式、左声道输出模式和右声道输出模式之中选择一种模式。在选择功能键之后，用户选择讲话学习数据或者卡拉OK歌曲，以便通过按下按键盘180的重现按键来把选定的内容输入到控制部分120中。当重现开始时，与音频信号同步地把字幕数据显示在画面显示设备170上。

在转变到重现模式之前，控制部分120首先检查操作模式的设置状态。它储存在控制部分120的内部存储器(RAM和ROM)中，并且在必要时将其取出来使用。作为检验操作模式的结果，如果发现是标准模式，那么控制部分120把控制信号输出给解码器130，以重现有关的音频文件，以便通过左和右声道将音频信号输出到扬声器150和152。因此，两个扬声器150和152在通过左和右声道接收该音频信号之后同时将其输出。与此同时，把与音频信号同步的字幕数据显示在画面显示设备170，因此，用户可以通过收听音频输出同时观看字幕数据来学习讲话。

同时，如果发现操作模式是左声道模式或右声道模式，控制部分120则向解码器130输出控制信号，以便只输出有关声道的信号。解码器130只对有关声道的信号解码，并且由DAC140把输出的数字音频信号转换成模拟信号，以便最终通过扬声器150和152之一输出。

根据一个实例来描述这种输出。

在语言学习的情况下，假定有两个谈话者A和B，而且他们之间的谈话分别储存到左和右声道中。如果用户想通过记住谈话者A的谈话来语言讲话，并且想与谈话者B交谈，则接同谈话者B讲话的那个声道，而关掉谈话者A的声道。也就是说，以这种方式来设置操作模式。

在用这种方式设置操作模式之后，如果用户启动该重现装置，则使谈话者A的声道始终静音。因此，用户可以在记住文字之后或者通过观看显示的字幕数据来实现语言学习。字幕数据不经受任何选择模式，因此，以标准方式显示字幕数据。然而，字幕数据也可以附属于选择方式，以便有选择地将其输出。

另外，可以同时启动一种选定的声道和非选定的其它声道。原因如下：如果接通单个声道以便只通过选定的声道输出信号，则不启动声道的剩余部分，并且只启动一个扬声器。也就是说，只通过单个扬声器输出该音频信号，并且这可能给出真实的感觉。可是，如果用户只通过一个扬声器或者只通过一个耳机收听，则失去听觉平衡从而导致疲劳。

因此，在选择一个声道之后，如果用户选择全声道重现模式，这就是说，如果选定的声道是右声道R，并且如果选择全声道重现模式，控制部分120则以通过第一和第二扬声器150和152输出右声道R的信号这样一种方式来控制DAC142。按照这种方式，当使用头戴式耳机或扬声器时，可以保持听觉平衡。此方法在图8中示出。

图9说明了其中使用多声道的本发明的学习方法。也就是说，扩展立体声的方法，以便可对相应的声道进行选择，并且可以通过所有的扬声器来输出选定的声道信号。

在学习谈话者A的谈话之后，通过关闭谈话者B的讲话区段并接通谈话者A的讲话区段，用户可以学习谈话者B的讲话。同样在这种环境之下，可以以可选择的方式设置字幕数据。

在上面的说明中，只有两个谈话者。然而，通过提供多个声道，可基于上述原理有效地学习谈话者A、B、C、D...的讲话。

在卡拉OK的情况下，通过采用两个声道的方法可以把歌曲和乐曲伴奏记录在相应的声道中。这种情况下，歌曲和乐曲伴奏分别是单声道类型的。如果歌曲和乐曲伴奏被制成立体声类型，那么至少需要四个声道。

在同时重现两个声道的情况下，歌曲和乐曲伴奏被分开输出，因此，用户可以以一种简单的方式学习歌曲。另外，在使歌曲被用户略微熟悉之后，如果关掉歌曲声道，则只重现乐曲伴奏。因此，用户可以在收听乐曲伴奏的同时演唱这首歌曲。另外，在完整地学习这首歌曲之后，用户可以接通两个声道以便同时重现歌曲和乐曲伴奏，以使用户可以象歌手一样演唱歌曲。同样在这种环境之下，可以显示字幕数据。另外，通过使用多声道(两个以上声道)，可通过有选择地重现多个声道来演奏合唱或二重奏。

在本发明的方法中，不仅可以利用音频信号，而且可以利用字幕数据。换言之，可以有选择地显示与音频信号相关的字幕数据，并且以这种方式，可以调整学习的难度等级。也就是说，可以根据学习进程来开启或者关闭字幕数据。当用户记住了所有的谈话时，阻止显示所有字幕数据，并且只显示诸如A和B之类的顺序，以便只凭用户的记忆对课文的其余部分进行交谈。

另外，在本发明的学习装置中，提供下列功能。也就是说，根据本发明利用字幕数据的输出声道选择来学习的学习装置的特征在于：如果从按键盘180输入用于重现音频信号的操作启动信号，检查由控制部分120当前设置的重现期间的操作模式；如果操作模式是标准的，控制部分120控制解码器130输出已经被设置到相应声道(R和L)的音频信号；如果操作模式被设置到右声道(R)，控制部分控制解码器130把音频信号重现并输出到右声道(R)；如果将操作模式设置到左声道(L)，控制部分控制解码器把音频信号重现并输出到左声道。也就是说，用户可以练习如上所定义的选择，并且使上面的操作成为可能的装置都在本发明的范围内。

在具有上述功能的装置中，如果需要，不仅可根据需要尽可能多地增加扬声器，而且可增加画面显示设备，以便可将音频信号链接到字幕数据。

本发明不仅可应用到讲话学习装置和卡拉OK中，而且可应用到传统的个人计算机。图10说明了传统的个人计算机的结构。如果将该计算机与图5和6相比较，解码器130的作用可以通过CPU+MB中的程序来实现。另外，音频信号的重现可以通过声卡和扬声器来实现。可以用图形卡和显示器实现画面显示设备。数字文件可以储存在HDD中或者CD中，因此，计算机具有与语言学习装置或者卡拉OK等同的功能。因此通过传统计算机可以实现本发明的目的。

根据如上所述的本发明，当使用用于学习外语或者歌曲的数字文件时，可以以任意方式进行学习，从而改善学习效率。

也就是说，用户可以根据所达到的学习水平任意调整学习进程。

Claims

1.一种利用数字音频及其字幕数据进行学习的方法，包括步骤：

形成第一学习方式存储模式，用于通过把歌曲字幕，原始歌手的声音以及乐曲伴奏的信号转换成为数字文件来存储它们；和

形成第二学习方式存储模式，用于通过把歌曲字幕和乐曲伴奏的信号转换成为数字文件来存储它们，

由此为任意一首歌曲形成数字文件，并且基于第一或第二学习方式存储模式重现该数字文件，以便于学习任意一首歌曲。

2.一种利用数字音频存储歌曲组成部分的存储方法，包括步骤：

形成第一学习方式存储模式，用于通过把歌曲字幕，原始歌手的声音以及乐曲伴奏的信号转换成为数字文件来存储它们；

形成第二学习方式存储模式，用于通过以相应可存储的形式把歌曲字幕和乐曲伴奏的信号转换成为数字文件来存储它们；和

形成第三学习方式存储模式，用于通过把乐曲伴奏的信号转换成为数字文件来存储该乐曲伴奏的信号，

由此组合上面的存储模式中的一种或二种或者多种以存储这首歌曲的组成部分。

3.一种利用数字音频及其字幕数据进行学习的方法，包括步骤：

形成第一学习方式存储模式，通过区分讲话者的声音和文字中的讲话细节或者文字中的新闻细节的字幕，以及通过把音频和字幕的信号转换为数字文件来存储外语讲话或新闻的声音和字幕；和

形成第二学习方式存储模式，通过区分讲话者的声音和文字中的讲话细节或者文字中的新闻细节的字幕，以及通过只把讲话者声音的信号转换为数字文件来只存储外语讲话或新闻的声音，

由此为任意的讲话或新闻形成数字文件，并且按照用户的重现选择来重现该数字文件以便可以通过该讲话或新闻任意学习语言。

4.根据权利要求3所述的方法，其特征在于还包括步骤：形成第三学习方式存储模式，用于以数字文件的形式存储谈话者的声音、讲话或新闻的字幕以及讲话或新闻的译文。

5.一种用于存储讲话或新闻的存储方法，包括步骤：

形成第二学习方式存储模式，通过区分讲话者的声音和文字中的讲话细节或者文字中的新闻细节的字幕，以及通过只把讲话者的声音的信号转换为数字文件来只存储外语讲话或新闻的声音，

由此以数字文件的形式储存任意的讲话或新闻。

6.一种利用数字音频及其字幕数据进行学习的方法，包括步骤：

形成第一学习方式存储模式，用于通过准备一部外国电影或戏剧的所有谈话者的所有话音和所有交谈字幕的数字数据文件来记录全部声音和全部字幕；和

形成第二学习方式存储模式，用于通过在删除某些谈话者的话音之后记录电影或戏剧的剧本来存储数据文件，以使用户代替所删除的话音来交谈，

由此形成数字数据，如果该用户选择学习重现模式并选择了谈话者，则有选择地重现该数字数据文件，以使该用户代替特定的谈话者来交谈。

7.根据权利要求6所述的方法，其特征在于当输入谈话者的姓名和字幕数据时，把序列码分配给谈话者来代替谈话者的姓名，并且谈话者的姓名分别与序列码匹配，由此当进行学习时可以有选择地删除特定谈话者的字幕和音频输出。

8.根据权利要求6所述的方法，其特征在于可以通过诸如打印机端口(并行端口)、串行端口、USB(通用串行总线)、火线(IEEE1394)之类的有线线路，或者诸如红外线数据或蓝牙之类的无线路由来发射由第一和第二学习方式存储模式准备的数字文件。

9.根据权利要求7所述的方法，其特征在于重现装置的数字文件存储装置是诸如闪速存储器或DVD(数字多用光盘)之类的非易失性存储器。

10.一种利用字幕数据和音频的输出声道选择进行学习的方法，包括步骤：

在用户输入用于重现音频信号的操作启动信号时，检查当前重现操作的操作模式(第一步)；

如果发现操作模式是标准声道输出，则输出已经被设置到相应声道(R和L)的音频信号(第二步)；

如果操作模式被设置到右声道(R)，则把音频信号重现并输出到右声道(第三步)；和

如果操作模式被设置到左声道(L)，则把音频信号重现并输出到左声道(第四步)。

11.根据权利要求10所述的方法，其特征在于在第三和/或第四步，当重现选定的声道输出信号时，还要通过非选定声道来输出选定声道的信号，以便通过两个声道(R和L)输出选定声道的信号。

12.根据权利要求10和11所述的方法，其特征在于与选定声道的音频信号的输出同步地输出字幕数据。

13.根据权利要求12所述的方法，其特征在于可以根据学习的进度、难度等级或者个人喜好来接通或关闭与音频信号同步的字幕数据。

14.根据权利要求10所述的方法，其特征在于可以通过诸如打印机端口(并行端口)、串行端口、USB(通用串行总线)、火线(IEEE1394)之类的有线线路，或者通过诸如红外线数据或蓝牙之类的无线路由发射数字文件。

15.根据权利要求10所述的方法，其特征在于重现装置的数字文件存储装置是诸如闪速存储器或DVD(数字多用光盘)之类的非易失性存储器。

16.一种利用字幕数据和音频的输出声道选择，通过使用三个或三个以上的声道进行学习的方法，包括步骤：

如果发现操作模式是标准声道输出，则输出已经被设置到相应声道(R和L)的音频信号(第二步)；和

如果操作模式被设置到特定的声道(R)，则把该信号重现并输出到此特定的声道(第三步)。

17.根据权利要求16所述的方法，其特征在于，在第三步，当重现选定的声道输出信号时，还要通过非选定声道输出选定声道的信号，以使选定声道的信号通过其余声道输出。

18.根据权利要求17所述的方法，其特征在于通过重现装置的显示屏与选定声道的音频信号的输出同步地输出字幕数据。

19.根据权利要求18所述的方法，其特征在于可以根据学习进度、难度等级或者个人喜好来接通或关闭与音频信号同步的字幕数据。

20.一种通过使用输出声道选择进行学习的学习装置，其特征在于：

如果从按键盘输入用于重现音频信号的操作启动信号，则由控制部分检查当前设置的重现期间的操作模式；

如果操作模式是标准的，控制部分则控制解码器输出已经设置到相应声道(R和L)的音频信号；

如果操作模式设置到右声道(R)，控制部分则控制解码器把音频信号重现并输出到右声道；和

如果操作模式设置到左声道(L)，控制部分则控制解码器把音频信号重现并输出到左声道。

21.根据权利要求20所述的学习装置，其特征在于通过重现装置的显示屏与选定声道的音频信号的输出同步地输出字幕数据。