CN100559459C - 随乐曲同步地再现语音的装置和方法 - Google Patents
随乐曲同步地再现语音的装置和方法 Download PDFInfo
- Publication number
- CN100559459C CN100559459C CNB2003101244039A CN200310124403A CN100559459C CN 100559459 C CN100559459 C CN 100559459C CN B2003101244039 A CNB2003101244039 A CN B2003101244039A CN 200310124403 A CN200310124403 A CN 200310124403A CN 100559459 C CN100559459 C CN 100559459C
- Authority
- CN
- China
- Prior art keywords
- voice
- data
- user
- melody
- data file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
- G10H1/0041—Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2230/00—General physical, ergonomic or hardware implementation of electrophonic musical tools or instruments, e.g. shape or architecture
- G10H2230/005—Device type or category
- G10H2230/021—Mobile ringtone, i.e. generation, transmission, conversion or downloading of ringing tones or other sounds for mobile telephony; Special musical data formats or protocols herefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/171—Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
- G10H2240/201—Physical layer or hardware aspects of transmission to or from an electrophonic musical instrument, e.g. voltage levels, bit streams, code words or symbols over a physical link connecting network nodes or instruments
- G10H2240/241—Telephone transmission, i.e. using twisted pair telephone lines or any type of telephone network
- G10H2240/251—Mobile telephone transmission, i.e. transmitting, accessing or controlling music data wirelessly via a wireless or mobile telephone receiver, analog or digital, e.g. DECT GSM, UMTS
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/325—Synchronizing two or more audio tracks or files according to musical features or musical timings
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Electrophonic Musical Instruments (AREA)
- Telephone Function (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
一种乐曲序列数据由多个事件数据组成,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据。多个语音数据文件独立于该乐曲序列数据被存储在存储器中。在乐曲再现中,依次地读出该乐曲序列数据的单独事件数据,且产生一个乐音信号以响应于每个读取的播放事件数据。同时,作为对每个读取的用户事件数据的响应输出一个语音再现指令。根据该语音再现指令,从存储器中存储的语音数据文件中选择一个语音数据文件,并且基于每个读取的语音数据产生一个语音信号。
Description
技术领域
本发明涉及一种用于在乐曲序列内的指定定时再现一特定语音序列的改进的语音/乐曲再现装置和方法。
背景技术
在现今移动或可携电话(比如便携式电话)和相关领域中,随乐曲同步进行视觉显示和语音(比如人声)再现已广为人知。日本专利申请公开的公开号为2002-101191的申请公开了一种用于在预定定时同步听觉再现乐曲和语音的技术。
同时,作为随乐曲同步听觉再现语音(比如人声)技术的一个例子,有一种方法也广为人知,根据该方法,在单个序列文件中定义了乐曲序列和语音序列,从而通过再现该序列文件可听觉再现乐曲和语音。图13是一种用于实施该方法的常规语音/乐曲再现装置的通用配置的示意框图。在常规的语音/乐曲再现装置中,加入了语音的乐曲数据文件51由播放器52载入到声音中间设备53中,声音中间设备53解译载入的文件以产生乐曲再现声源控制数据和语音再现声源控制数据,并将这些产生的声源控制数据输出到声源单元54。声源单元54包括乐曲再现声源和语音再现声源,声源单元54将各声源再现的乐音和语音信号混合并将混合的结果输出到扬声器55。
在加入了语音的乐曲数据文件中包括的语音序列包括将要听觉再现或发声的个别语音的产生定时的时间信息指示,根据该时间信息,该语音序列可与乐曲序列同步。因此,当编辑加入了语音的乐曲数据文件或修正该语音序列的再现内容时,常规的语音/乐曲再现装置在解译两个序列的时间信息时必须编辑或修正给出的部分以确认语音和乐曲之间的同步,从而编辑或修改会需要相当的时间和工作。而且,当需要仅待再现语音不同的多个再现模式时,就必须根据各个待再现语音准备相同的乐曲序列,这在数据量特别是小型设备比如可携电话中的数据量方面会造成相当大的浪费。
发明内容
从上述可见,本发明的目的是提供一种改进的语音/乐曲再现装置、方法和程序以及改进的序列数据格式,其允许容易地编辑或修改语音序列和避免数据量的浪费。
为了实现上述目的,本发明提供一种语音/乐曲再现装置,其包括:第一存储部分,存储包括多个事件数据的乐曲序列数据,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据;第二存储部分,存储多个语音数据文件;乐曲序列再现部分,用于从第一存储部分依次地读出乐曲序列数据的各个事件数据,由该乐曲序列再现部分输出一语音再现指令,以响应于该用户事件数据的读取;乐音声源部分,用于根据该乐曲序列再现部分读取的播放数据产生乐音信号;语音再现部分,用于从第二存储中部分存储的语音数据文件中选择一个语音数据文件,并依次地读出选定的语音数据文件中包括的语音数据,以响应于该乐曲序列再现部分输出的语音再现指令;以及语音声源部分,用于基于该语音再现部分读出的语音数据产生语音信号。
有了这样的设置,便可以在乐曲的进程中在预定的定时容易地再现语音数据。同时,本发明的设置也允许与乐曲进程同步的语音数据再现序列被容易地修正、编辑等。语音再现指令可包括指明要从第二存储部分中存储的语音数据文件中选定的一个语音数据文件的信息。而且,可以创建想要的语音数据内容以响应于用户的输入操作,且包括这样创建的语音数据内容的一个语音数据文件可被写入第二存储部分中。这样,对每个个别用户以原有的方式,通过该装置进行的必要处理可被极容易地编程,从而该语音数据在乐曲的进程中在预定的定时被再现。这种设置对于没有或几乎没有乐曲序列数据的专业知识的普通用户是很有利和方便的,其体现在当本发明应用于可携电话或其他可携终端设备时,它允许乐曲和语音对用户以原有的方式连接在一起。
本发明还提供一种用于利用存储乐曲序列数据的存储介质再现语音和乐曲的方法,该乐曲序列数据由多个事件数据和多个语音数据文件组成,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据,该方法包括:乐曲序列再现步骤,其从存储介质中依次地读出乐曲序列的各个事件数据,并输出一个语音再现指令以响应于读取的用户事件数据;语音再现步骤,其响应于该乐曲序列再现步骤输出的语音再现指令,从存储介质中存储的语音数据文件中选择一个语音数据文件,并依次地读出选定的语音数据文件中包括的语音数据。在该方法中,根据该乐曲序列再现步骤读出的播放事件数据产生一个乐音信号,并基于该语音再现步骤读出的语音数据产生一个语音信号。
本发明还提供一种包括一组指令的程序,用于使计算机执行上述语音/乐曲再现方法。
本发明还提供一种新颖和有用的语音/乐曲再现序列数据格式,其包括:序列数据块,其包括由多个事件数据组成的乐曲序列数据,该多个事件数据包括播放事件数据和用户事件数据;以及语音数据块,其包括多个语音数据文件。根据本发明的格式,该用户事件数据设计用于连接语音到乐曲的进程,对该用户事件数据分配一个语音数据文件,其在用户事件的产生定时再现,在产生定时再现的该语音数据文件从所述语音数据块中包括的多个语音数据文件中选择。
下面将描述本发明的实施例,但应当意识到本发明不限于描述的实施例,不背离其基本原理本发明可有许多的改型。因而本发明的范围由所附的权利要求书唯一地确定。
附图说明
为更好地理解本发明的目的和其他特征,下面将结合附图更详细地描述优选的实施例:
图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图;
图2是应用语音/乐曲再现装置实施例的可携电话的通用配置框图;
图3是说明语音/乐曲再现装置实施例操作的流程图;
图4也是说明语音/乐曲再现装置实施例的图;
图5是说明应用语音/乐曲再现装置的第一个例子的图;
图6也是说明应用语音/乐曲再现装置实施例的第一个例子的流程图;
图7是说明应用语音/乐曲再现装置实施例的第二个例子的图;
图8也是说明应用语音/乐曲再现装置实施例的第二个例子的流程图;
图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图;
图10是第二实施例中SMAF文件的结构图;
图11是说明语音/乐曲再现装置第二实施例操作的图;
图12也是说明语音/乐曲再现装置第二实施例操作的流程图;以及
图13是常规语音/乐曲再现装置的通用配置的示意框图。
具体实施方式
图1是根据本发明一个实施例的语音/乐曲再现装置的功能框图,图2是应用该语音/乐曲再现装置的可携手机(比如便携式电话)的通用硬件配置框图。在图2中,标号1表示CPU(中央处理器),2表示ROM(只读存储器),其存储有将由CPU 1执行的程序,3表示用于临时存储数据的RAM(随机存取存储器);在示例中,RAM是非易失存储器的形式。标号4表示包括数字键盘和功能键的操作部分,显示部分5是LCD(液晶显示)的形式,通信部分6经天线7与基站通信。
标号8表示语音处理部分,其解压从通信部分6输出的压缩语音数据,并将该语音数据转换成模拟信号以提供转换的模拟信号到扬声器9。语音处理部分8也将麦克风10提取的语音信号转换成数字语音数据并压缩该数字语音数据以提供压缩的数字语音数据到通信部分6。标号12表示声源单元,其包括乐曲再现声源12a和语音再现声源12b。在示例中,乐曲再现声源12a设计为利用FM或PCM方案产生乐音信号,语音再现声源12b利用波形卷积方案或共振峰合成方案合成语音(比如人声)。呼入信号旋律(铃声旋律)由乐曲再现声源12a产生,传递语音的乐音(加入了语音的乐音)由乐曲再现声源12a和语音再现声源12b再现。注意的是,除非明确指定,否则这里使用的术语“语音”典型地指人声比如歌声、哼声或叙述声;然而,术语“语音”也指人造的特殊声音比如动物或机器的语音。
如图1所示,乐曲数据文件21存储在RAM3中。乐曲数据文件21包括用作呼入信号旋律的乐曲数据组,用于娱乐收听的乐曲数据组的乐曲数据组。乐曲数据文件21中包括的每个乐曲数据组可通过因特网下载。特别地,乐曲数据文件21包括应用于乐曲再现声源12a的表示不同控制事件的事件数据比如乐音产生指令,和表示事件的各个产生定时的时间数据。而且,在即时实施例中,乐曲数据文件21包括用户事件数据,用于指示预定的语音数据(比如表示人声的数据)从RAM3中载入。用户事件数据的产生定时也可通过上述时间数据设定。播放器22是用于根据用户的指令将乐曲数据文件21内的乐曲数据载入到声音中间设备23并控制乐曲数据文件21的软件。声音中间设备23也是用于根据时间数据将从播放器22提供的乐曲数据转换成声源控制数据并依次地提供转换的声源控制数据到声源单元12的乐曲再现声源12a的软件(图2)。乐曲再现声源12a将声源控制数据转换成乐音信号。
而且,在图1中,多个语音数据文件26的每一个都有记录于其中的语音数据并存储在RAM3中。播放器27将文件编号由声音中间设备23指定的语音数据文件26的一个载到声音中间设备28。声音中间设备28依次地将从播放器27提供的语音数据文件内的个别语音数据输出到声源单元12的语音再现声源12b。语音再现声源12b将提供的语音数据转换成模拟语音信号。从乐曲再现声源12a和语音再现声源12b输出的乐音和语音信号由合成部分29合成并提供到扬声器13。
接下来将参考流程图3和图4,其描述了语音/乐曲再现装置即时实施例的操作。应用本发明的可携电话的主要电话功能与常规可携电话相同因而不再赘述。
一旦用户在操作部分4上通过输入乐曲的唯一乐曲编号指定想要的乐曲并指示乐曲再现,播放器22就从乐曲数据文件读出指定乐曲的乐曲数据,并将读出的乐曲数据载入到声音中间设备23中,见图3的步骤Sa1。然后,声音中间设备23基于载入的乐音数据启动乐曲再现处理,见步骤Sa2。首先,在步骤Sa3读出第一事件数据,在步骤Sa4确定读出的事件数据是否为用户事件的一个代表。如果读出的事件数据不表示用户事件(在步骤Sa4确定“不”),在步骤Sa5进一步确定读出的事件数据是否为普通事件的一个代表(即乐曲再现事件)。如果读出的数据表示普通事件(在步骤Sa5确定“是”),声音中间设备23将该事件数据传到乐曲再现声源12a,见步骤Sa6。依次地,乐曲再现声源12a基于该事件数据再现一个乐音信号,见步骤Sa7。然后,声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的,控制转到步骤Sa3以读出下一事件数据。
通过重复上述步骤完成想要的乐曲再现。一旦在乐曲再现过程中检测到一个用户事件,即一旦在步骤Sa4确定为“是”,声音中间设备23发送该用户事件到播放器27,见步骤Sa9。一收到该用户事件,播放器27将该用户事件指定的文件编号的语音数据文件26载入到声音中间设备28中,见步骤Sa10。依次地,声音中间设备28在步骤Sa11启动语音再现处理并依次地输出载入的语音数据到语音再现声源12b。这样,语音再现声源12b在步骤Sa12完成语音再现。
在发送用户事件到播放器27之后,声音中间设备23在步骤Sa8确定是否检测到乐曲数据组的结束。如果在步骤Sa8答复是否定的,控制转到步骤Sa3以重复上述操作。
图4是说明上述操作的框图,其特别地表明“语音数据1”作为对检测到“用户事件1”的响应而被再现,然后“语音数据2”作为对检测到“用户事件2”的响应而被再现。注意的是,作为对用户事件的响应而再现的语音数据文件由用户指定的先前选定的文件编号指定,并通过应用软件写为相应的乐曲数据组内的一个用户事件。这里,应用软件可预存在ROM2中或基于JAVA(注册商标)实现。
接着,参考图5和流程图6,其描述了关于上述语音/乐曲再现装置的使用或应用的第一个例子。
在应用的第一例子中,一旦启动了应用软件,则向语音再现声源12b提供查询语音数据从而进行查询语音再现(图5和图6的步骤Sb1)。比如,在提问的情况下再现查询语音比如“是”、“否”、“A”、“B”和“C”。在用血型算命的情况下再现查询语音比如“A”、“B”、“AB”、“B”和“O”。而且,在占星的情况下再现查询语音比如“巨蟹”和“狮子”。一旦用户在步骤Sb2利用操作部分4的数字键盘答复了查询,应用软件在步骤Sb3接收答复并在步骤Sb4分配由收到的答复表示的语音数据文件26的文件编号给一个用户事件。然后在步骤Sb5完成乐曲数据再现。如果在乐曲数据再现过程中检测到一个用户事件,再现通过上述处理分配给该用户事件的语音数据组。比如,词组“您今天将有好运”听起来是乐曲乐音。
接着,参考图7和流程图8,其描述了关于上述语音/乐曲再现装置应用的第二个例子。
在应用的第二个例子中,一旦启动了应用软件,屏幕显示或类似物上会请求输入歌词。作为对该请求的响应,用户选择一个特定乐曲(其中预设了一个或多个用户事件),并在乐曲内的特定定时使用数字键盘输入原歌词的文本,见图7和图8的步骤Sc1。然后,应用软件将输入的歌词(一个或多个文本)转换成语音数据并将RAM3中转换的语音数据注册为语音数据文件26,见步骤Sc2。然后应用软件分配语音数据文件26的文件编号给用户事件,见步骤Sc3。注意的是,歌词可被输入并分配给正在讨论的乐曲的多个部分(比如A旋律部分、B旋律部分、连接部分等)而不是乐曲的仅一个部分。
然后在步骤Sc4完成对应乐曲数据组的再现。如果在乐曲数据再现的过程中检测到用户事件(其上分配有语音数据文件的文件编号),则经过上述操作分配给该用户事件的歌词的语音数据被再现。比如,词组“生日快乐,Ton chan!”听起来是乐曲乐音(图7)。
注意的是,原歌词可随其传递的旋律一起收听,这时乐音音阶和乐音长度可分配给歌词的个别元素(音节),例如,以下列任一种方式:
(1)当注册歌词(文本)时,表示预定乐音音阶和长度的标记被传给该文本,声源在再现的时候根据这些标记控制待再现的音阶和长度。
(2)当再现乐曲序列时,提取跟随检测到的用户事件的旋律的乐音音阶和长度,同时控制对应于构成歌词(文本)的音节的乐音以呈现乐音音阶和长度从而产生这样控制的乐音。
这里,在第一个和第二个例子中运用的应用软件可存储在ROM 2中或基于JAVA(注册商标)实现。
接着将给出关于本发明第二实施例的描述。
图9是根据本发明第二实施例的语音/乐曲再现装置的功能框图。在该图中,标号31表示第二实施例中的SMAF(合成音乐移动设备应用格式)文件。这里,SMAF文件是一种用于可携终端的多媒体内容数据格式的文件,在即时实施例中,乐曲数据和语音数据被写入单个SMAF文件中。图10示出该实施例中运用的SMAF文件的一种结构。在示例中,使用了如下块(数据块):
内容信息块,存储SMAF文件的不同管理信息;
乐谱轨迹块,存储要提供到声源的乐曲的序列轨迹;
序列数据块,存储实际的播放数据;以及
HV数据块,存储HV(语音)数据HV-1,HV-2,……
实际的播放数的序列包括记录于其中的“HV Note ON”事件,HV数据块中每个数据的发声由“HV Note ON”事件指明。注意的是,“HV Note ON”对应于第一实施例中的用户事件。
而且,在图9中,标号32表示乐曲播放器,33表示乐曲的声音中间设备,34表示语音播放器,以及35表示语音的声音中间设备。它们的功能与图1中示出的相同。标号36表示声源设备,其中提供有用于再现乐曲的音序器37,用于基于从音序器37输出的声源控制数据产生乐音信号的声源38,以及语音再现声源39。声源38和39产生的乐音信号和语音信号通过合成电路40合成并提供到扬声器。
接着,参考图11和流程图12,其描述了语音/乐曲再现装置第二实施例的操作。
一旦用户指示再现想要的乐曲,播放器32从SMAF文件31读出对应的指定乐曲,并将读出的乐曲数据载入到声音中间设备33中,见图12的步骤Sd1。然后声音中间设备33将载入的乐曲数据转换成声源控制数据,并输出该转换的声源控制数据到音序器37(步骤Sd2:乐曲再现启动)。音序器37在步骤Sd3从声源控制数据中读出第一事件数据,并在步骤Sd4确定读出的事件数据是否为HV Note On事件的一个代表。如果读出的事件数据在步骤Sd4确定为并不表示HV Note On事件,则在步骤Sd5进一步确定读出的事件数据是否为普通事件(乐曲再现事件)的一个代表。如果读出的事件数据在步骤Sd5确定为表示普通事件,则音序器37传递该事件数据到声源38,从而声源38在步骤Sd6基于事件数据再现乐音信号。然后,音序器37在步骤Sd7确定是否检测到乐曲数据组的结束。如果在步骤Sd7答复是否定的,则控制转到步骤Sd3以读出下一事件数据。
通过重复上述步骤完成想要的乐曲的再现。一旦在乐曲再现的过程中检测到HV Note On事件,即一旦在步骤Sd4确定为“是”,则音序器37发送一个指定分配的HV数据的ID到HV Note On事件,见步骤Sd9。依次地,播放器34从SMAF文件读出所述ID指定的HV数据并将该HV数据载入到声音中间设备35中,见步骤Sd10。声音中间设备35将该HV数据转换成声源控制数据(用于指定语音的参数),并输出该转换的声源控制数据到声源39。这样,声源39在步骤Sd11完成语音再现。
在发送HV Note ON事件到播放器34后,音序器37在步骤Sd7确定是否检测到数据结束。如果在步骤Sd7答复是否定的,则控制转到步骤Sd3以重复上述操作。图11是说明上述操作的框图,其特别地表示在乐曲序列的过程中,当检测到“HV Note ON事件1”时再现“语音数据HV-1”,然后当检测到“HV Note ON事件2”时再现“语音数据HV-2”。
类似于上述第一实施例,第二实施例可在插入歌唱语音和/或叙述的地方再现乐曲。
SMAF文件通常由内容撰写器创建并发送到感兴趣的用户;然而,如果用户的可携终端装置具有处理SMAF数据的功能,第二实施例允许与应用的上述第二个例子类似的使用或应用。
乐曲序列数据内的一个或多个用户事件数据在每个个别乐曲的一个或多个位置(比如时间位置和/或测量位置)中被预先并入。有了这种设置,当用户进行操作以分配想要的语音数据文件时,就不再需要用户将用户事件逐个地并入乐曲中,这可极大地减少用户的负担。也就是说,用户不需要具有乐曲序列数据的文件结构的具体知识。用户只要分配与先前合并的用户事件相关的想要的语音数据文件;或者,应用软件自动地分配合适的语音数据文件。因而,当不具备或具备很少的乐曲序列数据专业知识的业余用户比如可携电话的普通用户想自由地将原语音(比如人声)和乐曲同步合并时,可实现极简单的使用或便利性。可选地,对应于乐曲序列数据内一个或多个想要的位置,通过用户操作当然可自由地合并一个或多个用户事件数据。这时,原语音能够在原来的定时同步地与乐曲合并。
作为一种改型,多个语音数据文件可分配给一个用户事件数据,从而分配的语音数据文件会在作为再现起始点使用的用户事件数据的定时被依次地(或同时地)再现。
虽然本发明的实施例已经被描述为再现日文语音,但是也可以再现日文之外的许多其他语言比如英文、中文、德文、韩文和西班牙文的语音。而且也可再现除人声之外或替代人声的动物语音。
简而言之,根据本发明,包括由用户事件的乐曲数据文件和由用户事件指示再现的语音数据文件由各个再现部分处理。因而,本发明允许语音序列容易地随需要编辑或修改。而且,即使在需要准备多个语音序列模式的情况下,仍能够仅准备多个语音数据文件,从而本发明可避免数据量的浪费。
Claims (17)
1.一种语音和乐曲再现装置,其包括:
第一存储装置,存储多个事件数据组成的乐曲序列数据,该多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据;
第二存储装置,存储多个语音数据文件;
乐曲序列再现装置,用于依次地从该第一存储装置读出乐曲序列数据的各个事件数据;响应于读出的用户事件数据,所述乐曲序列再现装置输出语音再现指令;
乐音声源装置,用于根据所述乐曲序列再现装置读出的播放数据产生乐音信号;
语音再现装置,响应于所述乐曲序列再现装置输出的语音再现指令,从所述第二存储装置中存储的语音数据文件中选择一个语音数据文件,并且依次地读出选定的语音数据文件中包括的语音数据;以及
语音声源装置,用于基于所述语音再现装置读出的语音数据产生语音信号。
2.根据权利要求1所述的语音和乐曲再现装置,其中,该语音再现指令包括指明要从所述第二存储装置中存储的语音数据文件中选定的语音数据文件的信息。
3.根据权利要求1所述的语音和乐曲再现装置,其中,还包括分配装置,用于基于用户的指令分配想要的语音数据文件给该用户事件数据。
4.根据权利要求1所述的语音和乐曲再现装置,其中,还包括:
接收装置,用于接收设计用于分配想要的语音数据文件给该用户事件数据的程序;以及
程序执行装置,用于执行所述接收装置接收的程序。
5.根据权利要求4所述的语音和乐曲再现装置,其中,在所述程序执行装置的执行期间,所述程序与用户交互作用,并且根据交互作用的结果自动地确定哪个语音数据被分配到哪个用户事件数据。
6.根据权利要求1至5所述的语音和乐曲再现装置,其中,还包括语音数据文件创建装置,用于响应于用户的输入操作创建想要的语音数据内容,并且将由该创建的语音数据内容组成的语音数据文件写入到所述第二存储装置中。
7.根据权利要求1至5所述的语音和乐曲再现装置,其中,还包括:
接收装置,用于接收一个程序,该程序设计用于使用户输入想要的语音数据内容和使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中;以及
程序执行装置,用于执行由所述接收装置接收的程序。
8.根据权利要求7所述的语音和乐曲再现装置,其中,所述程序使用户按照与想要的用户事件数据的对应关系输入想要的语音数据内容,使由用户输入的语音数据内容组成的语音数据文件存储在所述第二存储装置中,并且分配该语音数据文件给想要的用户事件数据。
9.根据权利要求7所述的语音和乐曲再现装置,其中,用户输入的该语音数据内容包括用户想要的文本数据。
10.根据权利要求1所述的语音和乐曲再现装置,其中,所述第二存储装置中存储的语音数据文件中包括的语音数据包括文本数据,所述语音声源基于该语音数据中包括的文本数据合成音频的语音信号。
11.根据权利要求1所述的语音和乐曲再现装置,其中,所述第一存储装置和第二存储装置由同一存储介质实现。
12.根据权利要求1所述的语音和乐曲再现装置,其中,所述语音数据文件中包括的语音数据是表示人声的数据。
13.根据权利要求1所述的语音和乐曲再现装置,其内嵌于便携式通信终端中。
14.一种用于再现语音和乐曲的方法,其利用存储由多个事件数据和多个语音数据文件组成的乐曲序列数据的存储介质,所述多个事件数据包括播放事件数据和设计用于将语音连接到乐曲进程的用户事件数据,所述方法包括:
乐曲序列再现步骤,依次地从所述存储介质读出该乐曲序列数据的各个事件数据,并且响应于读出的用户事件数据输出语音再现指令;以及
语音再现步骤,响应于所述乐曲序列再现步骤输出的语音再现指令,从所述存储介质中存储的语音数据文件中选择一个语音数据文件,并且依次地读出选定的语音数据文件中包括的语音数据,
其中,根据所述乐曲序列再现步骤读出的播放事件数据产生一个乐音信号,并且基于所述语音再现步骤读出的语音数据产生一个语音信号。
15.根据权利要求14的方法,其中,还包括分配步骤,响应于用户操作,分配所述存储介质中存储的多个语音数据文件中想要的一个给所述存储介质中存储的乐曲数据中包括的用户事件数据中想要的一个。
16.根据权利要求14或15所述的方法,其中,还包括语音数据文件创建步骤,响应于用户的输入操作创建想要的语音数据内容,并且将由创建的语音数据内容组成的语音数据文件写入到所述存储介质中。
17.根据权利要求14所述的方法,其中所述语音数据文件中包括的语音数据是表示人声的数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002371750 | 2002-12-24 | ||
JP2002371750A JP2004205605A (ja) | 2002-12-24 | 2002-12-24 | 音声および楽曲再生装置およびシーケンスデータフォーマット |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1510659A CN1510659A (zh) | 2004-07-07 |
CN100559459C true CN100559459C (zh) | 2009-11-11 |
Family
ID=32677206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101244039A Expired - Fee Related CN100559459C (zh) | 2002-12-24 | 2003-12-24 | 随乐曲同步地再现语音的装置和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7365260B2 (zh) |
JP (1) | JP2004205605A (zh) |
KR (1) | KR100682443B1 (zh) |
CN (1) | CN100559459C (zh) |
TW (1) | TWI250508B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193992A (zh) * | 2010-03-11 | 2011-09-21 | 姜胡彬 | 用于生成定制歌曲的系统和方法 |
Families Citing this family (167)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9818386B2 (en) | 1999-10-19 | 2017-11-14 | Medialab Solutions Corp. | Interactive digital music recorder and player |
US7176372B2 (en) * | 1999-10-19 | 2007-02-13 | Medialab Solutions Llc | Interactive digital music recorder and player |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
JP3879402B2 (ja) * | 2000-12-28 | 2007-02-14 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
GB0500483D0 (en) * | 2005-01-11 | 2005-02-16 | Nokia Corp | Multi-party sessions in a communication system |
US20060293089A1 (en) * | 2005-06-22 | 2006-12-28 | Magix Ag | System and method for automatic creation of digitally enhanced ringtones for cellphones |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
KR100658869B1 (ko) * | 2005-12-21 | 2006-12-15 | 엘지전자 주식회사 | 음악생성장치 및 그 운용방법 |
WO2007091475A1 (ja) * | 2006-02-08 | 2007-08-16 | Nec Corporation | 音声合成装置、音声合成方法及びプログラム |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8352272B2 (en) * | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8396714B2 (en) * | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8352268B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US7977560B2 (en) * | 2008-12-29 | 2011-07-12 | International Business Machines Corporation | Automated generation of a song for process learning |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE112011100329T5 (de) | 2010-01-25 | 2012-10-31 | Andrew Peter Nelson Jerram | Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8682938B2 (en) * | 2012-02-16 | 2014-03-25 | Giftrapped, Llc | System and method for generating personalized songs |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9263060B2 (en) | 2012-08-21 | 2016-02-16 | Marian Mason Publishing Company, Llc | Artificial neural network based system for classification of the emotional content of digital music |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
EP3159892B1 (en) * | 2014-06-17 | 2020-02-12 | Yamaha Corporation | Controller and system for voice generation based on characters |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
JP6305275B2 (ja) * | 2014-08-21 | 2018-04-04 | 株式会社河合楽器製作所 | 電子楽器における音声アシスト装置及びプログラム |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4731847A (en) * | 1982-04-26 | 1988-03-15 | Texas Instruments Incorporated | Electronic apparatus for simulating singing of song |
JPS62137082A (ja) | 1985-12-11 | 1987-06-19 | 諸木 一義 | 座敷船及び水上座敷 |
JPH0652034B2 (ja) | 1986-02-19 | 1994-07-06 | 旭化成工業株式会社 | 自動掘削機 |
JPH05341793A (ja) * | 1991-04-19 | 1993-12-24 | Pioneer Electron Corp | カラオケ演奏装置 |
JP3507090B2 (ja) * | 1992-12-25 | 2004-03-15 | キヤノン株式会社 | 音声処理装置及びその方法 |
US5703311A (en) * | 1995-08-03 | 1997-12-30 | Yamaha Corporation | Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques |
US6304846B1 (en) * | 1997-10-22 | 2001-10-16 | Texas Instruments Incorporated | Singing voice synthesis |
WO1999040566A1 (fr) | 1998-02-09 | 1999-08-12 | Sony Corporation | Procede et appareil de traitement de signaux numeriques, procede et appareil de generation de donnees de commande et support pour programme d'enregistrement |
JP2000105595A (ja) * | 1998-09-30 | 2000-04-11 | Victor Co Of Japan Ltd | 歌唱装置及び記録媒体 |
US6327590B1 (en) | 1999-05-05 | 2001-12-04 | Xerox Corporation | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis |
US6459774B1 (en) * | 1999-05-25 | 2002-10-01 | Lucent Technologies Inc. | Structured voicemail messages |
US6321179B1 (en) | 1999-06-29 | 2001-11-20 | Xerox Corporation | System and method for using noisy collaborative filtering to rank and present items |
US6694297B2 (en) * | 2000-03-30 | 2004-02-17 | Fujitsu Limited | Text information read-out device and music/voice reproduction device incorporating the same |
DE60133660T2 (de) * | 2000-09-25 | 2009-05-28 | Yamaha Corp., Hamamatsu | Mobiles endgerät |
US6928410B1 (en) * | 2000-11-06 | 2005-08-09 | Nokia Mobile Phones Ltd. | Method and apparatus for musical modification of speech signal |
US7058889B2 (en) * | 2001-03-23 | 2006-06-06 | Koninklijke Philips Electronics N.V. | Synchronizing text/visual information with audio playback |
JP2002311967A (ja) | 2001-04-13 | 2002-10-25 | Casio Comput Co Ltd | 替え歌作成装置及び替え歌作成プログラム及び替え歌作成方法 |
JP2002334261A (ja) | 2001-05-09 | 2002-11-22 | Noiman:Kk | 情報提供方法及び情報記録媒体並びに教習所紹介システム |
US20030200858A1 (en) * | 2002-04-29 | 2003-10-30 | Jianlei Xie | Mixing MP3 audio and T T P for enhanced E-book application |
US7299182B2 (en) * | 2002-05-09 | 2007-11-20 | Thomson Licensing | Text-to-speech (TTS) for hand-held devices |
-
2002
- 2002-12-24 JP JP2002371750A patent/JP2004205605A/ja active Pending
-
2003
- 2003-12-16 US US10/738,584 patent/US7365260B2/en not_active Expired - Fee Related
- 2003-12-23 KR KR1020030095266A patent/KR100682443B1/ko not_active IP Right Cessation
- 2003-12-24 CN CNB2003101244039A patent/CN100559459C/zh not_active Expired - Fee Related
- 2003-12-24 TW TW092136718A patent/TWI250508B/zh not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193992A (zh) * | 2010-03-11 | 2011-09-21 | 姜胡彬 | 用于生成定制歌曲的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
KR100682443B1 (ko) | 2007-02-15 |
US7365260B2 (en) | 2008-04-29 |
TWI250508B (en) | 2006-03-01 |
TW200426778A (en) | 2004-12-01 |
CN1510659A (zh) | 2004-07-07 |
KR20040058034A (ko) | 2004-07-03 |
US20040133425A1 (en) | 2004-07-08 |
JP2004205605A (ja) | 2004-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100559459C (zh) | 随乐曲同步地再现语音的装置和方法 | |
KR100724918B1 (ko) | 발음제어장치, 그 제어방법 및 매체 | |
TW561449B (en) | Portable telephone apparatus with music composition capability | |
US7010291B2 (en) | Mobile telephone unit using singing voice synthesis and mobile telephone system | |
EP0933917B1 (en) | Cellular phone with voice-programmed ringing melody | |
WO2001065534A1 (fr) | Terminal telephonique | |
JP3570332B2 (ja) | 携帯電話装置及びその着信メロディ入力方法 | |
JP4174940B2 (ja) | カラオケ装置 | |
KR100521575B1 (ko) | 악음 생성 장치, 이동 단말 장치, 악음 생성 방법, 및기억 매체 | |
TW491989B (en) | Music reproducing apparatus, music reproducing method and telephone terminal device | |
JP3666366B2 (ja) | 携帯用端末装置 | |
JP2002152329A (ja) | 携帯端末装置 | |
JP2002200338A (ja) | 楽曲データ処理機能がある携帯端末装置 | |
JP3974069B2 (ja) | 合唱曲や重唱曲を処理するカラオケ演奏方法およびカラオケシステム | |
KR20080080013A (ko) | 휴대 단말 장치 | |
JP4337726B2 (ja) | 携帯端末装置、プログラムおよび記録媒体 | |
KR20060076638A (ko) | Μιdi 파일 합성 장치 및 방법 | |
JPH10288993A (ja) | 声帯模写機能付きカラオケ装置 | |
JPH0412400A (ja) | 輪唱機能付カラオケ装置 | |
JP2004166290A (ja) | 携帯用端末装置 | |
KR20030083655A (ko) | 휴대용 이동통신단말기의 벨소리 파일과 음악 파일의 합성 및 변환 방법 | |
JPH0511786A (ja) | 音楽再生装置 | |
JP2008151918A (ja) | 携帯情報端末および携帯情報端末用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1062952 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1062952 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091111 Termination date: 20171224 |
|
CF01 | Termination of patent right due to non-payment of annual fee |