CN100559459C

CN100559459C - 随乐曲同步地再现语音的装置和方法

Info

Publication number: CN100559459C
Application number: CNB2003101244039A
Authority: CN
Inventors: 川隆宏
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2002-12-24
Filing date: 2003-12-24
Publication date: 2009-11-11
Anticipated expiration: 2023-12-24
Also published as: KR100682443B1; US7365260B2; TWI250508B; TW200426778A; CN1510659A; KR20040058034A; US20040133425A1; JP2004205605A

Abstract

一种乐曲序列数据由多个事件数据组成，该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据。多个语音数据文件独立于该乐曲序列数据被存储在存储器中。在乐曲再现中，依次地读出该乐曲序列数据的单独事件数据，且产生一个乐音信号以响应于每个读取的播放事件数据。同时，作为对每个读取的用户事件数据的响应输出一个语音再现指令。根据该语音再现指令，从存储器中存储的语音数据文件中选择一个语音数据文件，并且基于每个读取的语音数据产生一个语音信号。

Description

随乐曲同步地再现语音的装置和方法

技术领域

本发明涉及一种用于在乐曲序列内的指定定时再现一特定语音序列的改进的语音/乐曲再现装置和方法。

背景技术

在现今移动或可携电话(比如便携式电话)和相关领域中，随乐曲同步进行视觉显示和语音(比如人声)再现已广为人知。日本专利申请公开的公开号为2002-101191的申请公开了一种用于在预定定时同步听觉再现乐曲和语音的技术。

同时，作为随乐曲同步听觉再现语音(比如人声)技术的一个例子，有一种方法也广为人知，根据该方法，在单个序列文件中定义了乐曲序列和语音序列，从而通过再现该序列文件可听觉再现乐曲和语音。图13是一种用于实施该方法的常规语音/乐曲再现装置的通用配置的示意框图。在常规的语音/乐曲再现装置中，加入了语音的乐曲数据文件51由播放器52载入到声音中间设备53中，声音中间设备53解译载入的文件以产生乐曲再现声源控制数据和语音再现声源控制数据，并将这些产生的声源控制数据输出到声源单元54。声源单元54包括乐曲再现声源和语音再现声源，声源单元54将各声源再现的乐音和语音信号混合并将混合的结果输出到扬声器55。

在加入了语音的乐曲数据文件中包括的语音序列包括将要听觉再现或发声的个别语音的产生定时的时间信息指示，根据该时间信息，该语音序列可与乐曲序列同步。因此，当编辑加入了语音的乐曲数据文件或修正该语音序列的再现内容时，常规的语音/乐曲再现装置在解译两个序列的时间信息时必须编辑或修正给出的部分以确认语音和乐曲之间的同步，从而编辑或修改会需要相当的时间和工作。而且，当需要仅待再现语音不同的多个再现模式时，就必须根据各个待再现语音准备相同的乐曲序列，这在数据量特别是小型设备比如可携电话中的数据量方面会造成相当大的浪费。

发明内容

从上述可见，本发明的目的是提供一种改进的语音/乐曲再现装置、方法和程序以及改进的序列数据格式，其允许容易地编辑或修改语音序列和避免数据量的浪费。

为了实现上述目的，本发明提供一种语音/乐曲再现装置，其包括：第一存储部分，存储包括多个事件数据的乐曲序列数据，该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据；第二存储部分，存储多个语音数据文件；乐曲序列再现部分，用于从第一存储部分依次地读出乐曲序列数据的各个事件数据，由该乐曲序列再现部分输出一语音再现指令，以响应于该用户事件数据的读取；乐音声源部分，用于根据该乐曲序列再现部分读取的播放数据产生乐音信号；语音再现部分，用于从第二存储中部分存储的语音数据文件中选择一个语音数据文件，并依次地读出选定的语音数据文件中包括的语音数据，以响应于该乐曲序列再现部分输出的语音再现指令；以及语音声源部分，用于基于该语音再现部分读出的语音数据产生语音信号。

有了这样的设置，便可以在乐曲的进程中在预定的定时容易地再现语音数据。同时，本发明的设置也允许与乐曲进程同步的语音数据再现序列被容易地修正、编辑等。语音再现指令可包括指明要从第二存储部分中存储的语音数据文件中选定的一个语音数据文件的信息。而且，可以创建想要的语音数据内容以响应于用户的输入操作，且包括这样创建的语音数据内容的一个语音数据文件可被写入第二存储部分中。这样，对每个个别用户以原有的方式，通过该装置进行的必要处理可被极容易地编程，从而该语音数据在乐曲的进程中在预定的定时被再现。这种设置对于没有或几乎没有乐曲序列数据的专业知识的普通用户是很有利和方便的，其体现在当本发明应用于可携电话或其他可携终端设备时，它允许乐曲和语音对用户以原有的方式连接在一起。

本发明还提供一种用于利用存储乐曲序列数据的存储介质再现语音和乐曲的方法，该乐曲序列数据由多个事件数据和多个语音数据文件组成，该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据，该方法包括：乐曲序列再现步骤，其从存储介质中依次地读出乐曲序列的各个事件数据，并输出一个语音再现指令以响应于读取的用户事件数据；语音再现步骤，其响应于该乐曲序列再现步骤输出的语音再现指令，从存储介质中存储的语音数据文件中选择一个语音数据文件，并依次地读出选定的语音数据文件中包括的语音数据。在该方法中，根据该乐曲序列再现步骤读出的播放事件数据产生一个乐音信号，并基于该语音再现步骤读出的语音数据产生一个语音信号。

本发明还提供一种包括一组指令的程序，用于使计算机执行上述语音/乐曲再现方法。

本发明还提供一种新颖和有用的语音/乐曲再现序列数据格式，其包括：序列数据块，其包括由多个事件数据组成的乐曲序列数据，该多个事件数据包括播放事件数据和用户事件数据；以及语音数据块，其包括多个语音数据文件。根据本发明的格式，该用户事件数据设计用于连接语音到乐曲的进程，对该用户事件数据分配一个语音数据文件，其在用户事件的产生定时再现，在产生定时再现的该语音数据文件从所述语音数据块中包括的多个语音数据文件中选择。

下面将描述本发明的实施例，但应当意识到本发明不限于描述的实施例，不背离其基本原理本发明可有许多的改型。因而本发明的范围由所附的权利要求书唯一地确定。

附图说明

为更好地理解本发明的目的和其他特征，下面将结合附图更详细地描述优选的实施例：

图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图；

图2是应用语音/乐曲再现装置实施例的可携电话的通用配置框图；

图3是说明语音/乐曲再现装置实施例操作的流程图；

图4也是说明语音/乐曲再现装置实施例的图；

图5是说明应用语音/乐曲再现装置的第一个例子的图；

图6也是说明应用语音/乐曲再现装置实施例的第一个例子的流程图；

图7是说明应用语音/乐曲再现装置实施例的第二个例子的图；

图8也是说明应用语音/乐曲再现装置实施例的第二个例子的流程图；

图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图；

图10是第二实施例中SMAF文件的结构图；

图11是说明语音/乐曲再现装置第二实施例操作的图；

图12也是说明语音/乐曲再现装置第二实施例操作的流程图；以及

图13是常规语音/乐曲再现装置的通用配置的示意框图。

具体实施方式

图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图，图2是应用该语音/乐曲再现装置的可携手机(比如便携式电话)的通用硬件配置框图。在图2中，标号1表示CPU(中央处理器)，2表示ROM(只读存储器)，其存储有将由CPU 1执行的程序，3表示用于临时存储数据的RAM(随机存取存储器)；在示例中，RAM是非易失存储器的形式。标号4表示包括数字键盘和功能键的操作部分，显示部分5是LCD(液晶显示)的形式，通信部分6经天线7与基站通信。

标号8表示语音处理部分，其解压从通信部分6输出的压缩语音数据，并将该语音数据转换成模拟信号以提供转换的模拟信号到扬声器9。语音处理部分8也将麦克风10提取的语音信号转换成数字语音数据并压缩该数字语音数据以提供压缩的数字语音数据到通信部分6。标号12表示声源单元，其包括乐曲再现声源12a和语音再现声源12b。在示例中，乐曲再现声源12a设计为利用FM或PCM方案产生乐音信号，语音再现声源12b利用波形卷积方案或共振峰合成方案合成语音(比如人声)。呼入信号旋律(铃声旋律)由乐曲再现声源12a产生，传递语音的乐音(加入了语音的乐音)由乐曲再现声源12a和语音再现声源12b再现。注意的是，除非明确指定，否则这里使用的术语“语音”典型地指人声比如歌声、哼声或叙述声；然而，术语“语音”也指人造的特殊声音比如动物或机器的语音。

如图1所示，乐曲数据文件21存储在RAM3中。乐曲数据文件21包括用作呼入信号旋律的乐曲数据组，用于娱乐收听的乐曲数据组的乐曲数据组。乐曲数据文件21中包括的每个乐曲数据组可通过因特网下载。特别地，乐曲数据文件21包括应用于乐曲再现声源12a的表示不同控制事件的事件数据比如乐音产生指令，和表示事件的各个产生定时的时间数据。而且，在即时实施例中，乐曲数据文件21包括用户事件数据，用于指示预定的语音数据(比如表示人声的数据)从RAM3中载入。用户事件数据的产生定时也可通过上述时间数据设定。播放器22是用于根据用户的指令将乐曲数据文件21内的乐曲数据载入到声音中间设备23并控制乐曲数据文件21的软件。声音中间设备23也是用于根据时间数据将从播放器22提供的乐曲数据转换成声源控制数据并依次地提供转换的声源控制数据到声源单元12的乐曲再现声源12a的软件(图2)。乐曲再现声源12a将声源控制数据转换成乐音信号。

而且，在图1中，多个语音数据文件26的每一个都有记录于其中的语音数据并存储在RAM3中。播放器27将文件编号由声音中间设备23指定的语音数据文件26的一个载到声音中间设备28。声音中间设备28依次地将从播放器27提供的语音数据文件内的个别语音数据输出到声源单元12的语音再现声源12b。语音再现声源12b将提供的语音数据转换成模拟语音信号。从乐曲再现声源12a和语音再现声源12b输出的乐音和语音信号由合成部分29合成并提供到扬声器13。

接下来将参考流程图3和图4，其描述了语音/乐曲再现装置即时实施例的操作。应用本发明的可携电话的主要电话功能与常规可携电话相同因而不再赘述。

一旦用户在操作部分4上通过输入乐曲的唯一乐曲编号指定想要的乐曲并指示乐曲再现，播放器22就从乐曲数据文件读出指定乐曲的乐曲数据，并将读出的乐曲数据载入到声音中间设备23中，见图3的步骤Sa1。然后，声音中间设备23基于载入的乐音数据启动乐曲再现处理，见步骤Sa2。首先，在步骤Sa3读出第一事件数据，在步骤Sa4确定读出的事件数据是否为用户事件的一个代表。如果读出的事件数据不表示用户事件(在步骤Sa4确定“不”)，在步骤Sa5进一步确定读出的事件数据是否为普通事件的一个代表(即乐曲再现事件)。如果读出的数据表示普通事件(在步骤Sa5确定“是”)，声音中间设备23将该事件数据传到乐曲再现声源12a，见步骤Sa6。依次地，乐曲再现声源12a基于该事件数据再现一个乐音信号，见步骤Sa7。然后，声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的，控制转到步骤Sa3以读出下一事件数据。

通过重复上述步骤完成想要的乐曲再现。一旦在乐曲再现过程中检测到一个用户事件，即一旦在步骤Sa4确定为“是”，声音中间设备23发送该用户事件到播放器27，见步骤Sa9。一收到该用户事件，播放器27将该用户事件指定的文件编号的语音数据文件26载入到声音中间设备28中，见步骤Sa10。依次地，声音中间设备28在步骤Sa11启动语音再现处理并依次地输出载入的语音数据到语音再现声源12b。这样，语音再现声源12b在步骤Sa12完成语音再现。

在发送用户事件到播放器27之后，声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的，控制转到步骤Sa3以重复上述操作。

图4是说明上述操作的框图，其特别地表明“语音数据1”作为对检测到“用户事件1”的响应而被再现，然后“语音数据2”作为对检测到“用户事件2”的响应而被再现。注意的是，作为对用户事件的响应而再现的语音数据文件由用户指定的先前选定的文件编号指定，并通过应用软件写为相应的乐曲数据组内的一个用户事件。这里，应用软件可预存在ROM2中或基于JAVA(注册商标)实现。

接着，参考图5和流程图6，其描述了关于上述语音/乐曲再现装置的使用或应用的第一个例子。

在应用的第一例子中，一旦启动了应用软件，则向语音再现声源12b提供查询语音数据从而进行查询语音再现(图5和图6的步骤Sb1)。比如，在提问的情况下再现查询语音比如“是”、“否”、“A”、“B”和“C”。在用血型算命的情况下再现查询语音比如“A”、“B”、“AB”、“B”和“O”。而且，在占星的情况下再现查询语音比如“巨蟹”和“狮子”。一旦用户在步骤Sb2利用操作部分4的数字键盘答复了查询，应用软件在步骤Sb3接收答复并在步骤Sb4分配由收到的答复表示的语音数据文件26的文件编号给一个用户事件。然后在步骤Sb5完成乐曲数据再现。如果在乐曲数据再现过程中检测到一个用户事件，再现通过上述处理分配给该用户事件的语音数据组。比如，词组“您今天将有好运”听起来是乐曲乐音。

接着，参考图7和流程图8，其描述了关于上述语音/乐曲再现装置应用的第二个例子。

在应用的第二个例子中，一旦启动了应用软件，屏幕显示或类似物上会请求输入歌词。作为对该请求的响应，用户选择一个特定乐曲(其中预设了一个或多个用户事件)，并在乐曲内的特定定时使用数字键盘输入原歌词的文本，见图7和图8的步骤Sc1。然后，应用软件将输入的歌词(一个或多个文本)转换成语音数据并将RAM3中转换的语音数据注册为语音数据文件26，见步骤Sc2。然后应用软件分配语音数据文件26的文件编号给用户事件，见步骤Sc3。注意的是，歌词可被输入并分配给正在讨论的乐曲的多个部分(比如A旋律部分、B旋律部分、连接部分等)而不是乐曲的仅一个部分。

然后在步骤Sc4完成对应乐曲数据组的再现。如果在乐曲数据再现的过程中检测到用户事件(其上分配有语音数据文件的文件编号)，则经过上述操作分配给该用户事件的歌词的语音数据被再现。比如，词组“生日快乐，Ton chan！”听起来是乐曲乐音(图7)。

注意的是，原歌词可随其传递的旋律一起收听，这时乐音音阶和乐音长度可分配给歌词的个别元素(音节)，例如，以下列任一种方式：

(1)当注册歌词(文本)时，表示预定乐音音阶和长度的标记被传给该文本，声源在再现的时候根据这些标记控制待再现的音阶和长度。

(2)当再现乐曲序列时，提取跟随检测到的用户事件的旋律的乐音音阶和长度，同时控制对应于构成歌词(文本)的音节的乐音以呈现乐音音阶和长度从而产生这样控制的乐音。

这里，在第一个和第二个例子中运用的应用软件可存储在ROM 2中或基于JAVA(注册商标)实现。

接着将给出关于本发明第二实施例的描述。

图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图。在该图中，标号31表示第二实施例中的SMAF(合成音乐移动设备应用格式)文件。这里，SMAF文件是一种用于可携终端的多媒体内容数据格式的文件，在即时实施例中，乐曲数据和语音数据被写入单个SMAF文件中。图10示出该实施例中运用的SMAF文件的一种结构。在示例中，使用了如下块(数据块)：

内容信息块，存储SMAF文件的不同管理信息；

乐谱轨迹块，存储要提供到声源的乐曲的序列轨迹；

序列数据块，存储实际的播放数据；以及

HV数据块，存储HV(语音)数据HV-1，HV-2，……

实际的播放数的序列包括记录于其中的“HV Note ON”事件，HV数据块中每个数据的发声由“HV Note ON”事件指明。注意的是，“HV Note ON”对应于第一实施例中的用户事件。

而且，在图9中，标号32表示乐曲播放器，33表示乐曲的声音中间设备，34表示语音播放器，以及35表示语音的声音中间设备。它们的功能与图1中示出的相同。标号36表示声源设备，其中提供有用于再现乐曲的音序器37，用于基于从音序器37输出的声源控制数据产生乐音信号的声源38，以及语音再现声源39。声源38和39产生的乐音信号和语音信号通过合成电路40合成并提供到扬声器。

接着，参考图11和流程图12，其描述了语音/乐曲再现装置第二实施例的操作。

一旦用户指示再现想要的乐曲，播放器32从SMAF文件31读出对应的指定乐曲，并将读出的乐曲数据载入到声音中间设备33中，见图12的步骤Sd1。然后声音中间设备33将载入的乐曲数据转换成声源控制数据，并输出该转换的声源控制数据到音序器37(步骤Sd2：乐曲再现启动)。音序器37在步骤Sd3从声源控制数据中读出第一事件数据，并在步骤Sd4确定读出的事件数据是否为HV Note On事件的一个代表。如果读出的事件数据在步骤Sd4确定为并不表示HV Note On事件，则在步骤Sd5进一步确定读出的事件数据是否为普通事件(乐曲再现事件)的一个代表。如果读出的事件数据在步骤Sd5确定为表示普通事件，则音序器37传递该事件数据到声源38，从而声源38在步骤Sd6基于事件数据再现乐音信号。然后，音序器37在步骤Sd7确定是否检测到乐曲数据组的结束。如果在步骤Sd7答复是否定的，则控制转到步骤Sd3以读出下一事件数据。

通过重复上述步骤完成想要的乐曲的再现。一旦在乐曲再现的过程中检测到HV Note On事件，即一旦在步骤Sd4确定为“是”，则音序器37发送一个指定分配的HV数据的ID到HV Note On事件，见步骤Sd9。依次地，播放器34从SMAF文件读出所述ID指定的HV数据并将该HV数据载入到声音中间设备35中，见步骤Sd10。声音中间设备35将该HV数据转换成声源控制数据(用于指定语音的参数)，并输出该转换的声源控制数据到声源39。这样，声源39在步骤Sd11完成语音再现。

在发送HV Note ON事件到播放器34后，音序器37在步骤Sd7确定是否检测到数据结束。如果在步骤Sd7答复是否定的，则控制转到步骤Sd3以重复上述操作。图11是说明上述操作的框图，其特别地表示在乐曲序列的过程中，当检测到“HV Note ON事件1”时再现“语音数据HV-1”，然后当检测到“HV Note ON事件2”时再现“语音数据HV-2”。

类似于上述第一实施例，第二实施例可在插入歌唱语音和/或叙述的地方再现乐曲。

SMAF文件通常由内容撰写器创建并发送到感兴趣的用户；然而，如果用户的可携终端装置具有处理SMAF数据的功能，第二实施例允许与应用的上述第二个例子类似的使用或应用。

乐曲序列数据内的一个或多个用户事件数据在每个个别乐曲的一个或多个位置(比如时间位置和/或测量位置)中被预先并入。有了这种设置，当用户进行操作以分配想要的语音数据文件时，就不再需要用户将用户事件逐个地并入乐曲中，这可极大地减少用户的负担。也就是说，用户不需要具有乐曲序列数据的文件结构的具体知识。用户只要分配与先前合并的用户事件相关的想要的语音数据文件；或者，应用软件自动地分配合适的语音数据文件。因而，当不具备或具备很少的乐曲序列数据专业知识的业余用户比如可携电话的普通用户想自由地将原语音(比如人声)和乐曲同步合并时，可实现极简单的使用或便利性。可选地，对应于乐曲序列数据内一个或多个想要的位置，通过用户操作当然可自由地合并一个或多个用户事件数据。这时，原语音能够在原来的定时同步地与乐曲合并。

作为一种改型，多个语音数据文件可分配给一个用户事件数据，从而分配的语音数据文件会在作为再现起始点使用的用户事件数据的定时被依次地(或同时地)再现。

虽然本发明的实施例已经被描述为再现日文语音，但是也可以再现日文之外的许多其他语言比如英文、中文、德文、韩文和西班牙文的语音。而且也可再现除人声之外或替代人声的动物语音。

简而言之，根据本发明，包括由用户事件的乐曲数据文件和由用户事件指示再现的语音数据文件由各个再现部分处理。因而，本发明允许语音序列容易地随需要编辑或修改。而且，即使在需要准备多个语音序列模式的情况下，仍能够仅准备多个语音数据文件，从而本发明可避免数据量的浪费。

Claims

1.一种语音和乐曲再现装置，其包括：

第一存储装置，存储多个事件数据组成的乐曲序列数据，该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据；

第二存储装置，存储多个语音数据文件；

乐曲序列再现装置，用于依次地从该第一存储装置读出乐曲序列数据的各个事件数据；响应于读出的用户事件数据，所述乐曲序列再现装置输出语音再现指令；

乐音声源装置，用于根据所述乐曲序列再现装置读出的播放数据产生乐音信号；

语音再现装置，响应于所述乐曲序列再现装置输出的语音再现指令，从所述第二存储装置中存储的语音数据文件中选择一个语音数据文件，并且依次地读出选定的语音数据文件中包括的语音数据；以及

语音声源装置，用于基于所述语音再现装置读出的语音数据产生语音信号。

2.根据权利要求1所述的语音和乐曲再现装置，其中，该语音再现指令包括指明要从所述第二存储装置中存储的语音数据文件中选定的语音数据文件的信息。

3.根据权利要求1所述的语音和乐曲再现装置，其中，还包括分配装置，用于基于用户的指令分配想要的语音数据文件给该用户事件数据。

4.根据权利要求1所述的语音和乐曲再现装置，其中，还包括：

接收装置，用于接收设计用于分配想要的语音数据文件给该用户事件数据的程序；以及

程序执行装置，用于执行所述接收装置接收的程序。

5.根据权利要求4所述的语音和乐曲再现装置，其中，在所述程序执行装置的执行期间，所述程序与用户交互作用，并且根据交互作用的结果自动地确定哪个语音数据被分配到哪个用户事件数据。

6.根据权利要求1至5所述的语音和乐曲再现装置，其中，还包括语音数据文件创建装置，用于响应于用户的输入操作创建想要的语音数据内容，并且将由该创建的语音数据内容组成的语音数据文件写入到所述第二存储装置中。

7.根据权利要求1至5所述的语音和乐曲再现装置，其中，还包括：

接收装置，用于接收一个程序，该程序设计用于使用户输入想要的语音数据内容和使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中；以及

程序执行装置，用于执行由所述接收装置接收的程序。

8.根据权利要求7所述的语音和乐曲再现装置，其中，所述程序使用户按照与想要的用户事件数据的对应关系输入想要的语音数据内容，使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中，并且分配该语音数据文件给想要的用户事件数据。

9.根据权利要求7所述的语音和乐曲再现装置，其中，用户输入的该语音数据内容包括用户想要的文本数据。

10.根据权利要求1所述的语音和乐曲再现装置，其中，所述第二存储装置中存储的语音数据文件中包括的语音数据包括文本数据，所述语音声源基于该语音数据中包括的文本数据合成音频的语音信号。

11.根据权利要求1所述的语音和乐曲再现装置，其中，所述第一存储装置和第二存储装置由同一存储介质实现。

12.根据权利要求1所述的语音和乐曲再现装置，其中，所述语音数据文件中包括的语音数据是表示人声的数据。

13.根据权利要求1所述的语音和乐曲再现装置，其内嵌于便携式通信终端中。

14.一种用于再现语音和乐曲的方法，其利用存储由多个事件数据和多个语音数据文件组成的乐曲序列数据的存储介质，所述多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据，所述方法包括：

乐曲序列再现步骤，依次地从所述存储介质读出该乐曲序列数据的各个事件数据，并且响应于读出的用户事件数据输出语音再现指令；以及

语音再现步骤，响应于所述乐曲序列再现步骤输出的语音再现指令，从所述存储介质中存储的语音数据文件中选择一个语音数据文件，并且依次地读出选定的语音数据文件中包括的语音数据，

其中，根据所述乐曲序列再现步骤读出的播放事件数据产生一个乐音信号，并且基于所述语音再现步骤读出的语音数据产生一个语音信号。

15.根据权利要求14的方法，其中，还包括分配步骤，响应于用户操作，分配所述存储介质中存储的多个语音数据文件中想要的一个给所述存储介质中存储的乐曲数据中包括的用户事件数据中想要的一个。

16.根据权利要求14或15所述的方法，其中，还包括语音数据文件创建步骤，响应于用户的输入操作创建想要的语音数据内容，并且将由创建的语音数据内容组成的语音数据文件写入到所述存储介质中。

17.根据权利要求14所述的方法，其中所述语音数据文件中包括的语音数据是表示人声的数据。