CN100559459C - 随乐曲同步地再现语音的装置和方法 - Google Patents

随乐曲同步地再现语音的装置和方法 Download PDF

Info

Publication number
CN100559459C
CN100559459C CNB2003101244039A CN200310124403A CN100559459C CN 100559459 C CN100559459 C CN 100559459C CN B2003101244039 A CNB2003101244039 A CN B2003101244039A CN 200310124403 A CN200310124403 A CN 200310124403A CN 100559459 C CN100559459 C CN 100559459C
Authority
CN
China
Prior art keywords
voice
data
user
melody
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2003101244039A
Other languages
English (en)
Other versions
CN1510659A (zh
Inventor
川隆宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of CN1510659A publication Critical patent/CN1510659A/zh
Application granted granted Critical
Publication of CN100559459C publication Critical patent/CN100559459C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2230/00General physical, ergonomic or hardware implementation of electrophonic musical tools or instruments, e.g. shape or architecture
    • G10H2230/005Device type or category
    • G10H2230/021Mobile ringtone, i.e. generation, transmission, conversion or downloading of ringing tones or other sounds for mobile telephony; Special musical data formats or protocols herefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/201Physical layer or hardware aspects of transmission to or from an electrophonic musical instrument, e.g. voltage levels, bit streams, code words or symbols over a physical link connecting network nodes or instruments
    • G10H2240/241Telephone transmission, i.e. using twisted pair telephone lines or any type of telephone network
    • G10H2240/251Mobile telephone transmission, i.e. transmitting, accessing or controlling music data wirelessly via a wireless or mobile telephone receiver, analog or digital, e.g. DECT GSM, UMTS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/325Synchronizing two or more audio tracks or files according to musical features or musical timings

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Telephone Function (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

一种乐曲序列数据由多个事件数据组成,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据。多个语音数据文件独立于该乐曲序列数据被存储在存储器中。在乐曲再现中,依次地读出该乐曲序列数据的单独事件数据,且产生一个乐音信号以响应于每个读取的播放事件数据。同时,作为对每个读取的用户事件数据的响应输出一个语音再现指令。根据该语音再现指令,从存储器中存储的语音数据文件中选择一个语音数据文件,并且基于每个读取的语音数据产生一个语音信号。

Description

随乐曲同步地再现语音的装置和方法
技术领域
本发明涉及一种用于在乐曲序列内的指定定时再现一特定语音序列的改进的语音/乐曲再现装置和方法。
背景技术
在现今移动或可携电话(比如便携式电话)和相关领域中,随乐曲同步进行视觉显示和语音(比如人声)再现已广为人知。日本专利申请公开的公开号为2002-101191的申请公开了一种用于在预定定时同步听觉再现乐曲和语音的技术。
同时,作为随乐曲同步听觉再现语音(比如人声)技术的一个例子,有一种方法也广为人知,根据该方法,在单个序列文件中定义了乐曲序列和语音序列,从而通过再现该序列文件可听觉再现乐曲和语音。图13是一种用于实施该方法的常规语音/乐曲再现装置的通用配置的示意框图。在常规的语音/乐曲再现装置中,加入了语音的乐曲数据文件51由播放器52载入到声音中间设备53中,声音中间设备53解译载入的文件以产生乐曲再现声源控制数据和语音再现声源控制数据,并将这些产生的声源控制数据输出到声源单元54。声源单元54包括乐曲再现声源和语音再现声源,声源单元54将各声源再现的乐音和语音信号混合并将混合的结果输出到扬声器55。
在加入了语音的乐曲数据文件中包括的语音序列包括将要听觉再现或发声的个别语音的产生定时的时间信息指示,根据该时间信息,该语音序列可与乐曲序列同步。因此,当编辑加入了语音的乐曲数据文件或修正该语音序列的再现内容时,常规的语音/乐曲再现装置在解译两个序列的时间信息时必须编辑或修正给出的部分以确认语音和乐曲之间的同步,从而编辑或修改会需要相当的时间和工作。而且,当需要仅待再现语音不同的多个再现模式时,就必须根据各个待再现语音准备相同的乐曲序列,这在数据量特别是小型设备比如可携电话中的数据量方面会造成相当大的浪费。
发明内容
从上述可见,本发明的目的是提供一种改进的语音/乐曲再现装置、方法和程序以及改进的序列数据格式,其允许容易地编辑或修改语音序列和避免数据量的浪费。
为了实现上述目的,本发明提供一种语音/乐曲再现装置,其包括:第一存储部分,存储包括多个事件数据的乐曲序列数据,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据;第二存储部分,存储多个语音数据文件;乐曲序列再现部分,用于从第一存储部分依次地读出乐曲序列数据的各个事件数据,由该乐曲序列再现部分输出一语音再现指令,以响应于该用户事件数据的读取;乐音声源部分,用于根据该乐曲序列再现部分读取的播放数据产生乐音信号;语音再现部分,用于从第二存储中部分存储的语音数据文件中选择一个语音数据文件,并依次地读出选定的语音数据文件中包括的语音数据,以响应于该乐曲序列再现部分输出的语音再现指令;以及语音声源部分,用于基于该语音再现部分读出的语音数据产生语音信号。
有了这样的设置,便可以在乐曲的进程中在预定的定时容易地再现语音数据。同时,本发明的设置也允许与乐曲进程同步的语音数据再现序列被容易地修正、编辑等。语音再现指令可包括指明要从第二存储部分中存储的语音数据文件中选定的一个语音数据文件的信息。而且,可以创建想要的语音数据内容以响应于用户的输入操作,且包括这样创建的语音数据内容的一个语音数据文件可被写入第二存储部分中。这样,对每个个别用户以原有的方式,通过该装置进行的必要处理可被极容易地编程,从而该语音数据在乐曲的进程中在预定的定时被再现。这种设置对于没有或几乎没有乐曲序列数据的专业知识的普通用户是很有利和方便的,其体现在当本发明应用于可携电话或其他可携终端设备时,它允许乐曲和语音对用户以原有的方式连接在一起。
本发明还提供一种用于利用存储乐曲序列数据的存储介质再现语音和乐曲的方法,该乐曲序列数据由多个事件数据和多个语音数据文件组成,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据,该方法包括:乐曲序列再现步骤,其从存储介质中依次地读出乐曲序列的各个事件数据,并输出一个语音再现指令以响应于读取的用户事件数据;语音再现步骤,其响应于该乐曲序列再现步骤输出的语音再现指令,从存储介质中存储的语音数据文件中选择一个语音数据文件,并依次地读出选定的语音数据文件中包括的语音数据。在该方法中,根据该乐曲序列再现步骤读出的播放事件数据产生一个乐音信号,并基于该语音再现步骤读出的语音数据产生一个语音信号。
本发明还提供一种包括一组指令的程序,用于使计算机执行上述语音/乐曲再现方法。
本发明还提供一种新颖和有用的语音/乐曲再现序列数据格式,其包括:序列数据块,其包括由多个事件数据组成的乐曲序列数据,该多个事件数据包括播放事件数据和用户事件数据;以及语音数据块,其包括多个语音数据文件。根据本发明的格式,该用户事件数据设计用于连接语音到乐曲的进程,对该用户事件数据分配一个语音数据文件,其在用户事件的产生定时再现,在产生定时再现的该语音数据文件从所述语音数据块中包括的多个语音数据文件中选择。
下面将描述本发明的实施例,但应当意识到本发明不限于描述的实施例,不背离其基本原理本发明可有许多的改型。因而本发明的范围由所附的权利要求书唯一地确定。
附图说明
为更好地理解本发明的目的和其他特征,下面将结合附图更详细地描述优选的实施例:
图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图;
图2是应用语音/乐曲再现装置实施例的可携电话的通用配置框图;
图3是说明语音/乐曲再现装置实施例操作的流程图;
图4也是说明语音/乐曲再现装置实施例的图;
图5是说明应用语音/乐曲再现装置的第一个例子的图;
图6也是说明应用语音/乐曲再现装置实施例的第一个例子的流程图;
图7是说明应用语音/乐曲再现装置实施例的第二个例子的图;
图8也是说明应用语音/乐曲再现装置实施例的第二个例子的流程图;
图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图;
图10是第二实施例中SMAF文件的结构图;
图11是说明语音/乐曲再现装置第二实施例操作的图;
图12也是说明语音/乐曲再现装置第二实施例操作的流程图;以及
图13是常规语音/乐曲再现装置的通用配置的示意框图。
具体实施方式
图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图,图2是应用该语音/乐曲再现装置的可携手机(比如便携式电话)的通用硬件配置框图。在图2中,标号1表示CPU(中央处理器),2表示ROM(只读存储器),其存储有将由CPU 1执行的程序,3表示用于临时存储数据的RAM(随机存取存储器);在示例中,RAM是非易失存储器的形式。标号4表示包括数字键盘和功能键的操作部分,显示部分5是LCD(液晶显示)的形式,通信部分6经天线7与基站通信。
标号8表示语音处理部分,其解压从通信部分6输出的压缩语音数据,并将该语音数据转换成模拟信号以提供转换的模拟信号到扬声器9。语音处理部分8也将麦克风10提取的语音信号转换成数字语音数据并压缩该数字语音数据以提供压缩的数字语音数据到通信部分6。标号12表示声源单元,其包括乐曲再现声源12a和语音再现声源12b。在示例中,乐曲再现声源12a设计为利用FM或PCM方案产生乐音信号,语音再现声源12b利用波形卷积方案或共振峰合成方案合成语音(比如人声)。呼入信号旋律(铃声旋律)由乐曲再现声源12a产生,传递语音的乐音(加入了语音的乐音)由乐曲再现声源12a和语音再现声源12b再现。注意的是,除非明确指定,否则这里使用的术语“语音”典型地指人声比如歌声、哼声或叙述声;然而,术语“语音”也指人造的特殊声音比如动物或机器的语音。
如图1所示,乐曲数据文件21存储在RAM3中。乐曲数据文件21包括用作呼入信号旋律的乐曲数据组,用于娱乐收听的乐曲数据组的乐曲数据组。乐曲数据文件21中包括的每个乐曲数据组可通过因特网下载。特别地,乐曲数据文件21包括应用于乐曲再现声源12a的表示不同控制事件的事件数据比如乐音产生指令,和表示事件的各个产生定时的时间数据。而且,在即时实施例中,乐曲数据文件21包括用户事件数据,用于指示预定的语音数据(比如表示人声的数据)从RAM3中载入。用户事件数据的产生定时也可通过上述时间数据设定。播放器22是用于根据用户的指令将乐曲数据文件21内的乐曲数据载入到声音中间设备23并控制乐曲数据文件21的软件。声音中间设备23也是用于根据时间数据将从播放器22提供的乐曲数据转换成声源控制数据并依次地提供转换的声源控制数据到声源单元12的乐曲再现声源12a的软件(图2)。乐曲再现声源12a将声源控制数据转换成乐音信号。
而且,在图1中,多个语音数据文件26的每一个都有记录于其中的语音数据并存储在RAM3中。播放器27将文件编号由声音中间设备23指定的语音数据文件26的一个载到声音中间设备28。声音中间设备28依次地将从播放器27提供的语音数据文件内的个别语音数据输出到声源单元12的语音再现声源12b。语音再现声源12b将提供的语音数据转换成模拟语音信号。从乐曲再现声源12a和语音再现声源12b输出的乐音和语音信号由合成部分29合成并提供到扬声器13。
接下来将参考流程图3和图4,其描述了语音/乐曲再现装置即时实施例的操作。应用本发明的可携电话的主要电话功能与常规可携电话相同因而不再赘述。
一旦用户在操作部分4上通过输入乐曲的唯一乐曲编号指定想要的乐曲并指示乐曲再现,播放器22就从乐曲数据文件读出指定乐曲的乐曲数据,并将读出的乐曲数据载入到声音中间设备23中,见图3的步骤Sa1。然后,声音中间设备23基于载入的乐音数据启动乐曲再现处理,见步骤Sa2。首先,在步骤Sa3读出第一事件数据,在步骤Sa4确定读出的事件数据是否为用户事件的一个代表。如果读出的事件数据不表示用户事件(在步骤Sa4确定“不”),在步骤Sa5进一步确定读出的事件数据是否为普通事件的一个代表(即乐曲再现事件)。如果读出的数据表示普通事件(在步骤Sa5确定“是”),声音中间设备23将该事件数据传到乐曲再现声源12a,见步骤Sa6。依次地,乐曲再现声源12a基于该事件数据再现一个乐音信号,见步骤Sa7。然后,声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的,控制转到步骤Sa3以读出下一事件数据。
通过重复上述步骤完成想要的乐曲再现。一旦在乐曲再现过程中检测到一个用户事件,即一旦在步骤Sa4确定为“是”,声音中间设备23发送该用户事件到播放器27,见步骤Sa9。一收到该用户事件,播放器27将该用户事件指定的文件编号的语音数据文件26载入到声音中间设备28中,见步骤Sa10。依次地,声音中间设备28在步骤Sa11启动语音再现处理并依次地输出载入的语音数据到语音再现声源12b。这样,语音再现声源12b在步骤Sa12完成语音再现。
在发送用户事件到播放器27之后,声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的,控制转到步骤Sa3以重复上述操作。
图4是说明上述操作的框图,其特别地表明“语音数据1”作为对检测到“用户事件1”的响应而被再现,然后“语音数据2”作为对检测到“用户事件2”的响应而被再现。注意的是,作为对用户事件的响应而再现的语音数据文件由用户指定的先前选定的文件编号指定,并通过应用软件写为相应的乐曲数据组内的一个用户事件。这里,应用软件可预存在ROM2中或基于JAVA(注册商标)实现。
接着,参考图5和流程图6,其描述了关于上述语音/乐曲再现装置的使用或应用的第一个例子。
在应用的第一例子中,一旦启动了应用软件,则向语音再现声源12b提供查询语音数据从而进行查询语音再现(图5和图6的步骤Sb1)。比如,在提问的情况下再现查询语音比如“是”、“否”、“A”、“B”和“C”。在用血型算命的情况下再现查询语音比如“A”、“B”、“AB”、“B”和“O”。而且,在占星的情况下再现查询语音比如“巨蟹”和“狮子”。一旦用户在步骤Sb2利用操作部分4的数字键盘答复了查询,应用软件在步骤Sb3接收答复并在步骤Sb4分配由收到的答复表示的语音数据文件26的文件编号给一个用户事件。然后在步骤Sb5完成乐曲数据再现。如果在乐曲数据再现过程中检测到一个用户事件,再现通过上述处理分配给该用户事件的语音数据组。比如,词组“您今天将有好运”听起来是乐曲乐音。
接着,参考图7和流程图8,其描述了关于上述语音/乐曲再现装置应用的第二个例子。
在应用的第二个例子中,一旦启动了应用软件,屏幕显示或类似物上会请求输入歌词。作为对该请求的响应,用户选择一个特定乐曲(其中预设了一个或多个用户事件),并在乐曲内的特定定时使用数字键盘输入原歌词的文本,见图7和图8的步骤Sc1。然后,应用软件将输入的歌词(一个或多个文本)转换成语音数据并将RAM3中转换的语音数据注册为语音数据文件26,见步骤Sc2。然后应用软件分配语音数据文件26的文件编号给用户事件,见步骤Sc3。注意的是,歌词可被输入并分配给正在讨论的乐曲的多个部分(比如A旋律部分、B旋律部分、连接部分等)而不是乐曲的仅一个部分。
然后在步骤Sc4完成对应乐曲数据组的再现。如果在乐曲数据再现的过程中检测到用户事件(其上分配有语音数据文件的文件编号),则经过上述操作分配给该用户事件的歌词的语音数据被再现。比如,词组“生日快乐,Ton chan!”听起来是乐曲乐音(图7)。
注意的是,原歌词可随其传递的旋律一起收听,这时乐音音阶和乐音长度可分配给歌词的个别元素(音节),例如,以下列任一种方式:
(1)当注册歌词(文本)时,表示预定乐音音阶和长度的标记被传给该文本,声源在再现的时候根据这些标记控制待再现的音阶和长度。
(2)当再现乐曲序列时,提取跟随检测到的用户事件的旋律的乐音音阶和长度,同时控制对应于构成歌词(文本)的音节的乐音以呈现乐音音阶和长度从而产生这样控制的乐音。
这里,在第一个和第二个例子中运用的应用软件可存储在ROM 2中或基于JAVA(注册商标)实现。
接着将给出关于本发明第二实施例的描述。
图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图。在该图中,标号31表示第二实施例中的SMAF(合成音乐移动设备应用格式)文件。这里,SMAF文件是一种用于可携终端的多媒体内容数据格式的文件,在即时实施例中,乐曲数据和语音数据被写入单个SMAF文件中。图10示出该实施例中运用的SMAF文件的一种结构。在示例中,使用了如下块(数据块):
内容信息块,存储SMAF文件的不同管理信息;
乐谱轨迹块,存储要提供到声源的乐曲的序列轨迹;
序列数据块,存储实际的播放数据;以及
HV数据块,存储HV(语音)数据HV-1,HV-2,……
实际的播放数的序列包括记录于其中的“HV Note ON”事件,HV数据块中每个数据的发声由“HV Note ON”事件指明。注意的是,“HV Note ON”对应于第一实施例中的用户事件。
而且,在图9中,标号32表示乐曲播放器,33表示乐曲的声音中间设备,34表示语音播放器,以及35表示语音的声音中间设备。它们的功能与图1中示出的相同。标号36表示声源设备,其中提供有用于再现乐曲的音序器37,用于基于从音序器37输出的声源控制数据产生乐音信号的声源38,以及语音再现声源39。声源38和39产生的乐音信号和语音信号通过合成电路40合成并提供到扬声器。
接着,参考图11和流程图12,其描述了语音/乐曲再现装置第二实施例的操作。
一旦用户指示再现想要的乐曲,播放器32从SMAF文件31读出对应的指定乐曲,并将读出的乐曲数据载入到声音中间设备33中,见图12的步骤Sd1。然后声音中间设备33将载入的乐曲数据转换成声源控制数据,并输出该转换的声源控制数据到音序器37(步骤Sd2:乐曲再现启动)。音序器37在步骤Sd3从声源控制数据中读出第一事件数据,并在步骤Sd4确定读出的事件数据是否为HV Note On事件的一个代表。如果读出的事件数据在步骤Sd4确定为并不表示HV Note On事件,则在步骤Sd5进一步确定读出的事件数据是否为普通事件(乐曲再现事件)的一个代表。如果读出的事件数据在步骤Sd5确定为表示普通事件,则音序器37传递该事件数据到声源38,从而声源38在步骤Sd6基于事件数据再现乐音信号。然后,音序器37在步骤Sd7确定是否检测到乐曲数据组的结束。如果在步骤Sd7答复是否定的,则控制转到步骤Sd3以读出下一事件数据。
通过重复上述步骤完成想要的乐曲的再现。一旦在乐曲再现的过程中检测到HV Note On事件,即一旦在步骤Sd4确定为“是”,则音序器37发送一个指定分配的HV数据的ID到HV Note On事件,见步骤Sd9。依次地,播放器34从SMAF文件读出所述ID指定的HV数据并将该HV数据载入到声音中间设备35中,见步骤Sd10。声音中间设备35将该HV数据转换成声源控制数据(用于指定语音的参数),并输出该转换的声源控制数据到声源39。这样,声源39在步骤Sd11完成语音再现。
在发送HV Note ON事件到播放器34后,音序器37在步骤Sd7确定是否检测到数据结束。如果在步骤Sd7答复是否定的,则控制转到步骤Sd3以重复上述操作。图11是说明上述操作的框图,其特别地表示在乐曲序列的过程中,当检测到“HV Note ON事件1”时再现“语音数据HV-1”,然后当检测到“HV Note ON事件2”时再现“语音数据HV-2”。
类似于上述第一实施例,第二实施例可在插入歌唱语音和/或叙述的地方再现乐曲。
SMAF文件通常由内容撰写器创建并发送到感兴趣的用户;然而,如果用户的可携终端装置具有处理SMAF数据的功能,第二实施例允许与应用的上述第二个例子类似的使用或应用。
乐曲序列数据内的一个或多个用户事件数据在每个个别乐曲的一个或多个位置(比如时间位置和/或测量位置)中被预先并入。有了这种设置,当用户进行操作以分配想要的语音数据文件时,就不再需要用户将用户事件逐个地并入乐曲中,这可极大地减少用户的负担。也就是说,用户不需要具有乐曲序列数据的文件结构的具体知识。用户只要分配与先前合并的用户事件相关的想要的语音数据文件;或者,应用软件自动地分配合适的语音数据文件。因而,当不具备或具备很少的乐曲序列数据专业知识的业余用户比如可携电话的普通用户想自由地将原语音(比如人声)和乐曲同步合并时,可实现极简单的使用或便利性。可选地,对应于乐曲序列数据内一个或多个想要的位置,通过用户操作当然可自由地合并一个或多个用户事件数据。这时,原语音能够在原来的定时同步地与乐曲合并。
作为一种改型,多个语音数据文件可分配给一个用户事件数据,从而分配的语音数据文件会在作为再现起始点使用的用户事件数据的定时被依次地(或同时地)再现。
虽然本发明的实施例已经被描述为再现日文语音,但是也可以再现日文之外的许多其他语言比如英文、中文、德文、韩文和西班牙文的语音。而且也可再现除人声之外或替代人声的动物语音。
简而言之,根据本发明,包括由用户事件的乐曲数据文件和由用户事件指示再现的语音数据文件由各个再现部分处理。因而,本发明允许语音序列容易地随需要编辑或修改。而且,即使在需要准备多个语音序列模式的情况下,仍能够仅准备多个语音数据文件,从而本发明可避免数据量的浪费。

Claims (17)

1.一种语音和乐曲再现装置,其包括:
第一存储装置,存储多个事件数据组成的乐曲序列数据,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据;
第二存储装置,存储多个语音数据文件;
乐曲序列再现装置,用于依次地从该第一存储装置读出乐曲序列数据的各个事件数据;响应于读出的用户事件数据,所述乐曲序列再现装置输出语音再现指令;
乐音声源装置,用于根据所述乐曲序列再现装置读出的播放数据产生乐音信号;
语音再现装置,响应于所述乐曲序列再现装置输出的语音再现指令,从所述第二存储装置中存储的语音数据文件中选择一个语音数据文件,并且依次地读出选定的语音数据文件中包括的语音数据;以及
语音声源装置,用于基于所述语音再现装置读出的语音数据产生语音信号。
2.根据权利要求1所述的语音和乐曲再现装置,其中,该语音再现指令包括指明要从所述第二存储装置中存储的语音数据文件中选定的语音数据文件的信息。
3.根据权利要求1所述的语音和乐曲再现装置,其中,还包括分配装置,用于基于用户的指令分配想要的语音数据文件给该用户事件数据。
4.根据权利要求1所述的语音和乐曲再现装置,其中,还包括:
接收装置,用于接收设计用于分配想要的语音数据文件给该用户事件数据的程序;以及
程序执行装置,用于执行所述接收装置接收的程序。
5.根据权利要求4所述的语音和乐曲再现装置,其中,在所述程序执行装置的执行期间,所述程序与用户交互作用,并且根据交互作用的结果自动地确定哪个语音数据被分配到哪个用户事件数据。
6.根据权利要求1至5所述的语音和乐曲再现装置,其中,还包括语音数据文件创建装置,用于响应于用户的输入操作创建想要的语音数据内容,并且将由该创建的语音数据内容组成的语音数据文件写入到所述第二存储装置中。
7.根据权利要求1至5所述的语音和乐曲再现装置,其中,还包括:
接收装置,用于接收一个程序,该程序设计用于使用户输入想要的语音数据内容和使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中;以及
程序执行装置,用于执行由所述接收装置接收的程序。
8.根据权利要求7所述的语音和乐曲再现装置,其中,所述程序使用户按照与想要的用户事件数据的对应关系输入想要的语音数据内容,使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中,并且分配该语音数据文件给想要的用户事件数据。
9.根据权利要求7所述的语音和乐曲再现装置,其中,用户输入的该语音数据内容包括用户想要的文本数据。
10.根据权利要求1所述的语音和乐曲再现装置,其中,所述第二存储装置中存储的语音数据文件中包括的语音数据包括文本数据,所述语音声源基于该语音数据中包括的文本数据合成音频的语音信号。
11.根据权利要求1所述的语音和乐曲再现装置,其中,所述第一存储装置和第二存储装置由同一存储介质实现。
12.根据权利要求1所述的语音和乐曲再现装置,其中,所述语音数据文件中包括的语音数据是表示人声的数据。
13.根据权利要求1所述的语音和乐曲再现装置,其内嵌于便携式通信终端中。
14.一种用于再现语音和乐曲的方法,其利用存储由多个事件数据和多个语音数据文件组成的乐曲序列数据的存储介质,所述多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据,所述方法包括:
乐曲序列再现步骤,依次地从所述存储介质读出该乐曲序列数据的各个事件数据,并且响应于读出的用户事件数据输出语音再现指令;以及
语音再现步骤,响应于所述乐曲序列再现步骤输出的语音再现指令,从所述存储介质中存储的语音数据文件中选择一个语音数据文件,并且依次地读出选定的语音数据文件中包括的语音数据,
其中,根据所述乐曲序列再现步骤读出的播放事件数据产生一个乐音信号,并且基于所述语音再现步骤读出的语音数据产生一个语音信号。
15.根据权利要求14的方法,其中,还包括分配步骤,响应于用户操作,分配所述存储介质中存储的多个语音数据文件中想要的一个给所述存储介质中存储的乐曲数据中包括的用户事件数据中想要的一个。
16.根据权利要求14或15所述的方法,其中,还包括语音数据文件创建步骤,响应于用户的输入操作创建想要的语音数据内容,并且将由创建的语音数据内容组成的语音数据文件写入到所述存储介质中。
17.根据权利要求14所述的方法,其中所述语音数据文件中包括的语音数据是表示人声的数据。
CNB2003101244039A 2002-12-24 2003-12-24 随乐曲同步地再现语音的装置和方法 Expired - Fee Related CN100559459C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002371750 2002-12-24
JP2002371750A JP2004205605A (ja) 2002-12-24 2002-12-24 音声および楽曲再生装置およびシーケンスデータフォーマット

Publications (2)

Publication Number Publication Date
CN1510659A CN1510659A (zh) 2004-07-07
CN100559459C true CN100559459C (zh) 2009-11-11

Family

ID=32677206

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101244039A Expired - Fee Related CN100559459C (zh) 2002-12-24 2003-12-24 随乐曲同步地再现语音的装置和方法

Country Status (5)

Country Link
US (1) US7365260B2 (zh)
JP (1) JP2004205605A (zh)
KR (1) KR100682443B1 (zh)
CN (1) CN100559459C (zh)
TW (1) TWI250508B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193992A (zh) * 2010-03-11 2011-09-21 姜胡彬 用于生成定制歌曲的系统和方法

Families Citing this family (167)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9818386B2 (en) 1999-10-19 2017-11-14 Medialab Solutions Corp. Interactive digital music recorder and player
US7176372B2 (en) * 1999-10-19 2007-02-13 Medialab Solutions Llc Interactive digital music recorder and player
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP3879402B2 (ja) * 2000-12-28 2007-02-14 ヤマハ株式会社 歌唱合成方法と装置及び記録媒体
GB0500483D0 (en) * 2005-01-11 2005-02-16 Nokia Corp Multi-party sessions in a communication system
US20060293089A1 (en) * 2005-06-22 2006-12-28 Magix Ag System and method for automatic creation of digitally enhanced ringtones for cellphones
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
KR100658869B1 (ko) * 2005-12-21 2006-12-15 엘지전자 주식회사 음악생성장치 및 그 운용방법
WO2007091475A1 (ja) * 2006-02-08 2007-08-16 Nec Corporation 音声合成装置、音声合成方法及びプログラム
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8352272B2 (en) * 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8396714B2 (en) * 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US7977560B2 (en) * 2008-12-29 2011-07-12 International Business Machines Corporation Automated generation of a song for process learning
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8682938B2 (en) * 2012-02-16 2014-03-25 Giftrapped, Llc System and method for generating personalized songs
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9263060B2 (en) 2012-08-21 2016-02-16 Marian Mason Publishing Company, Llc Artificial neural network based system for classification of the emotional content of digital music
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
EP3159892B1 (en) * 2014-06-17 2020-02-12 Yamaha Corporation Controller and system for voice generation based on characters
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
JP6305275B2 (ja) * 2014-08-21 2018-04-04 株式会社河合楽器製作所 電子楽器における音声アシスト装置及びプログラム
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731847A (en) * 1982-04-26 1988-03-15 Texas Instruments Incorporated Electronic apparatus for simulating singing of song
JPS62137082A (ja) 1985-12-11 1987-06-19 諸木 一義 座敷船及び水上座敷
JPH0652034B2 (ja) 1986-02-19 1994-07-06 旭化成工業株式会社 自動掘削機
JPH05341793A (ja) * 1991-04-19 1993-12-24 Pioneer Electron Corp カラオケ演奏装置
JP3507090B2 (ja) * 1992-12-25 2004-03-15 キヤノン株式会社 音声処理装置及びその方法
US5703311A (en) * 1995-08-03 1997-12-30 Yamaha Corporation Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques
US6304846B1 (en) * 1997-10-22 2001-10-16 Texas Instruments Incorporated Singing voice synthesis
WO1999040566A1 (fr) 1998-02-09 1999-08-12 Sony Corporation Procede et appareil de traitement de signaux numeriques, procede et appareil de generation de donnees de commande et support pour programme d'enregistrement
JP2000105595A (ja) * 1998-09-30 2000-04-11 Victor Co Of Japan Ltd 歌唱装置及び記録媒体
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6459774B1 (en) * 1999-05-25 2002-10-01 Lucent Technologies Inc. Structured voicemail messages
US6321179B1 (en) 1999-06-29 2001-11-20 Xerox Corporation System and method for using noisy collaborative filtering to rank and present items
US6694297B2 (en) * 2000-03-30 2004-02-17 Fujitsu Limited Text information read-out device and music/voice reproduction device incorporating the same
DE60133660T2 (de) * 2000-09-25 2009-05-28 Yamaha Corp., Hamamatsu Mobiles endgerät
US6928410B1 (en) * 2000-11-06 2005-08-09 Nokia Mobile Phones Ltd. Method and apparatus for musical modification of speech signal
US7058889B2 (en) * 2001-03-23 2006-06-06 Koninklijke Philips Electronics N.V. Synchronizing text/visual information with audio playback
JP2002311967A (ja) 2001-04-13 2002-10-25 Casio Comput Co Ltd 替え歌作成装置及び替え歌作成プログラム及び替え歌作成方法
JP2002334261A (ja) 2001-05-09 2002-11-22 Noiman:Kk 情報提供方法及び情報記録媒体並びに教習所紹介システム
US20030200858A1 (en) * 2002-04-29 2003-10-30 Jianlei Xie Mixing MP3 audio and T T P for enhanced E-book application
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193992A (zh) * 2010-03-11 2011-09-21 姜胡彬 用于生成定制歌曲的系统和方法

Also Published As

Publication number Publication date
KR100682443B1 (ko) 2007-02-15
US7365260B2 (en) 2008-04-29
TWI250508B (en) 2006-03-01
TW200426778A (en) 2004-12-01
CN1510659A (zh) 2004-07-07
KR20040058034A (ko) 2004-07-03
US20040133425A1 (en) 2004-07-08
JP2004205605A (ja) 2004-07-22

Similar Documents

Publication Publication Date Title
CN100559459C (zh) 随乐曲同步地再现语音的装置和方法
KR100724918B1 (ko) 발음제어장치, 그 제어방법 및 매체
TW561449B (en) Portable telephone apparatus with music composition capability
US7010291B2 (en) Mobile telephone unit using singing voice synthesis and mobile telephone system
EP0933917B1 (en) Cellular phone with voice-programmed ringing melody
WO2001065534A1 (fr) Terminal telephonique
JP3570332B2 (ja) 携帯電話装置及びその着信メロディ入力方法
JP4174940B2 (ja) カラオケ装置
KR100521575B1 (ko) 악음 생성 장치, 이동 단말 장치, 악음 생성 방법, 및기억 매체
TW491989B (en) Music reproducing apparatus, music reproducing method and telephone terminal device
JP3666366B2 (ja) 携帯用端末装置
JP2002152329A (ja) 携帯端末装置
JP2002200338A (ja) 楽曲データ処理機能がある携帯端末装置
JP3974069B2 (ja) 合唱曲や重唱曲を処理するカラオケ演奏方法およびカラオケシステム
KR20080080013A (ko) 휴대 단말 장치
JP4337726B2 (ja) 携帯端末装置、プログラムおよび記録媒体
KR20060076638A (ko) Μιdi 파일 합성 장치 및 방법
JPH10288993A (ja) 声帯模写機能付きカラオケ装置
JPH0412400A (ja) 輪唱機能付カラオケ装置
JP2004166290A (ja) 携帯用端末装置
KR20030083655A (ko) 휴대용 이동통신단말기의 벨소리 파일과 음악 파일의 합성 및 변환 방법
JPH0511786A (ja) 音楽再生装置
JP2008151918A (ja) 携帯情報端末および携帯情報端末用プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1062952

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1062952

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091111

Termination date: 20171224

CF01 Termination of patent right due to non-payment of annual fee