CN1729685A - 音频信号识别方法和系统 - Google Patents

音频信号识别方法和系统 Download PDF

Info

Publication number
CN1729685A
CN1729685A CNA200380106762XA CN200380106762A CN1729685A CN 1729685 A CN1729685 A CN 1729685A CN A200380106762X A CNA200380106762X A CN A200380106762XA CN 200380106762 A CN200380106762 A CN 200380106762A CN 1729685 A CN1729685 A CN 1729685A
Authority
CN
China
Prior art keywords
audio signal
user preference
feature
arbitrary
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200380106762XA
Other languages
English (en)
Inventor
K·J·伍德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1729685A publication Critical patent/CN1729685A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Circuits Of Receivers In General (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

一种用于从一组音频信号中识别出一个音频信号的方法。用户偏好(106)被接收(104)。该组音频信号被同时接收(108),所述信号例如来自于多个无线电广播源。所述音频信号被分析(110)以用来提取特征(112)。基于对用户偏好(106)和所提取出的特征(112)的比较,音频信号被识别(114)。可选择地,所识别出的音频信号被输出(116)。

Description

音频信号识别方法和系统
本发明涉及一种用于从多个音频信号中识别出一个音频信号的方法和系统。
有数量不断增加的可以提供给消费者和其它终端用户的音频—视频(AV)内容,例如通过地面、电缆、卫星和因特网传输的娱乐服务。尽管新的内容可用,但是很多消费者仍然不知道这些内容,因为他们没有足够的搜索工具。例如印刷媒体的传统工具不能突出每个可用的内容源,它们必定的集中在一个有限内容集合上,例如,在出版物的发行地区可接收到的电视台和广播电台。这种模型不能完全服务更广阔的并非基于地理的内容分发,例如通过卫星和因特网进行的内容分发。作为一种选择,电子节目指南(EPG)被提出用来使用户能够更容易选择项目;然而,出于商业或其它原因,这些节目指南不能覆盖所有的可提供给用户的内容。另外,当选择一个项目时,用户需要作出判断(例如基于项目的描述),这种判断可能不正确,并导致用户可能拒绝其感兴趣的内容,或者反之亦然。
传统上消费者希望根据需要访问内容。这种类型的无计划使用是流行的,因为它不需要计划和努力。一种通常做法是用户对可用的频道进行尝试,以搜寻要观看或收听的内容。这种处理的缺点包括对很多频道进行尝试所必需的时间和随机的成功机会:一种典型的结果是找到一个合适的项目,但是错过了节目的开始;或者完全错过了整个项目。
另一种方式是使用主题频道。一个想观看关于某特定主题的节目的用户很可能查看特定于该主题的频道。不幸的是,为了吸引足够数量的观众,主题频道倾向于具有比任何特定用户的兴趣更大的范围。对于无线电广播频道也同样如此。
在一个娱乐频道中,项目的主题可以通过元数据描述符的方式来被描述,例如由欧洲广播联盟定义的并被很多欧洲广播商所使用的在节目发送控制(PDC)和无线电广播数据系统(RDS)之中的节目类型PTY码。一个PTY码能够被分配给一个节目项目,以将其同多个粗分类中的一个相联系,例如用来区分古典和流行音乐。如同主题频道一样,这种分类通常比一个特定用户的偏好更宽泛;而且,广播商和服务提供商并没有广泛采用这种元数据服务。
用户乐意于在期望获取更适合于他们的特定偏好的情况下对内容进行访问;优选地,他们希望根据需要和用最小努力来访问内容。
改进现有技术是本发明的一个目的。
根据本发明的第一个方面,提供了一种从多个音频信号中识别一个音频信号的方法,该方法包括:
■接收一个用户偏好;
■同时接收多个音频信号;
■分析所述音频信号以提取特征;和
■基于对用户偏好和提取出的特征的比较来识别一个第一音频信号。
根据本发明的第二方面,提出了一种用于从多个音频信号中识别一个音频信号的系统,包括:
—一个适于接收用户偏好的接收装置;
—适于同时接收多个音频信号的音频输入装置;
—适于分析所述音频信号来提取出特征并基于对用户偏好和提取出的特征的比较来识别一个第一音频信号的处理装置。
归功于本发明,以有效和精确的方式从多个音频信号中识别出一个对应于用户偏好的音频信号是可能的。音频信号可以是数字的或模拟的。
有利地,该第一音频信号被输出;例如一个基本上同用户偏好相符合的当前可用的音频信号。理想地,对所述音频信号的分析被连续执行,并基于对用户偏好和提取出的特征的比较来进一步识别出一个第二音频信号。用这种方式,该方法识别出用于可能的未来用途的附加的音频信号。优选地并根据一个预定义规则,所述输出从第一音频信号切换到第二音频信号。该规则是根据任何合适的标准来确定的,例如操作性能或者用户请求。有利地,该方法存储该第二音频信号,并且当输出从第一音频信号切换至第二音频信号时,从存储器中调用该第二音频信号。例如,这能够使得在第二音频信号的输出开始之前完成第一音频信号的输出。理想地,当识别到该第二信号时开始对该第二音频信号的存储。用这种方式,第二音频信号的输出能够基本上在第二音频信号的开始时就开始。一个进一步的优势可通过存储多个音频信号来获得。这种存储有利于增强性能,例如允许音频信号以一种不同于信号被识别的顺序被输出。而且,用户能够影响所存储的音频信号的输出,例如通过跳过一个当前输出的音频信号。他也能改变他的偏好并根据新的偏好请求对已存储的音频信号的重新分析。
有利地,接收用户偏好包括从一个用户接口接收所述偏好。这允许用户通过任何合适的用户接口方法来标识他的偏好。可选择地,接收用户偏好包括从一个存储器中接收所述偏好。这样,通过参考一个或多个所存储的参数来获得用户偏好,这些参数是先前确定的,例如通过监视先前的使用。可选择地,所存储的参数是固定的,并表示一个固定的用户偏好。在某些实施例中,该方法包括将听述用户偏好转换为特征。
所提取的特征包括音频信号的内在特征。因为音频信号包括音乐内容,因此其内在特征是音乐特征。
本发明的一个优势是用户不需要检查音频信号来从多个音频信号中识别一个音频信号。而且,本发明可以用于独立地或与服务提供商、广播商等的已分类内容合作来识别音频信号。此外,合适的音频信号包括哪些同数字联网的服务(例如,因特网广播电台、AV流送等)和传统电视以及无线电广播服务相关的音频信号。另外,本发明基本上支持音频信号的实时识别出及其输出。
仅通过举例的方式并参考附图来描述本发明的各实施例,其中:
图1是用来从多个音频信号中识别出一个音频信号的方法的流程图;
图2是包含更多步骤的图1的方法的流程图;
图3是用来从多个音频信号中识别出一个音频信号的系统的示意性的表示;
图4是进一步包括一个用于输出所识别的音频信号的输出装置的图3的系统的示意性的表示;
图5是用来从多个音频信号中识别出一个音频信号的系统的第二实施例的示意性的表示,其中描述一个优选处理装置;
图6是用来从多个音频信号中识别出一个音频信号的图5的系统的第一应用的示意性的表示,其中该处理由一个服务提供商设备和一个用户设备来执行;和
图7是用来从多个音频信号中识别出一个音频信号的图5的系统的第二应用的示意性的表示,其中该处理由一个网络服务提供商来执行。
图1表示了一种用来从多个音频信号中识别出一个音频信号的方法的流程图。该方法开始于102。一个用户偏好106被接收(104)。多个音频信号被同时接收(108),这样使得所述音频信号可用于分析(110)以提取特征(112)。所述分析可以依次对每个音频信号顺序地执行,或同时对所述信号或其任意组合执行。理想地,为了基本上实时的应用,对音频信号执行同时分析。然后基于对用户偏好和所提取特征的比较来识别(114)一个音频信号。被识别出的音频信号可选择地(如虚线框描述)被输出(116)。优选地,对音频信号的分析被连续地执行,且附加的音频信号被进一步识别。当意图输出时,根据预定义的规则,所述输出从一个识别出的音频信号切换至另一个。任何合适的预定义规则都可以被确定。一个例子是一种同一个所识别出的音频信号相关联的规则,比如基于当前输出的所识别出的音频信号的结束。另一个例子是一种响应于用户输入的规则,例如用户请求跳过当前输出的所识别出的音频信号的剩余部分。
在这里使用的术语“音频信号”是同包括一个或多个音频信号的内容相关联的,包括娱乐频道(例如广播电台、TV频道和因特网频道)、娱乐频道内的节目项目(例如广播和TV演出)和分立的项目(例如音乐轨道和类似的短项目)。从音频信号提取出的特征包括音频信号的内在特征。术语“内在特征”意思是一个音频信号的那些包括该音频信号的属性的特征,例如音乐特征;区别于其它的如那些仅仅同音频信号相关的特征,例如元数据或音量级。音乐特征的例子包括音调、音高和节奏。所接收到的用户偏好标识出一个或多个一起表示该用户偏好的特征。一个合适的用户偏好可以从一个接口(例如一个用户接口)或者从一个存储器接收。在例如一个先前定义的用户偏好被多次使用的情况下,后种方式是合适的,从而节省了用户的时间和精力。
图2表示了包含更多步骤的图1中的方法的流程图。该方法开始于202,且一个用户偏好206被接收(204)。多个音频信号被同时接收(210)并被存储(212)。所述音频信号被分析(214)来提取特征216。因为音频信号被存储,所以能够依次对每个音频信号执行分析,与同时分析相比,这可以潜在地节约成本。这种方式特别适合于作为后台处理识别音频信号而不是基本上实时的应用。基于对用户偏好和所提取特征的比较,音频信号随后被识别(218)。该图表示了用户偏好206被转换(208)成一个或多个特征。一个所识别信号随后被存储(220),并输出(222)所述所识别的信号。所述输出从当前音频信号切换至下一个音频信号,其中从存储器调用下一个音频信号。优选地,当识别出一个音频信号时,开始存储该信号。这允许例如基本上从所识别的音频信号的起始处开始输出该识别出的音频信号。
图3是用来从多个音频信号中识别出一个音频信号的系统的示意性的表示。该系统包括一个用于接收一个用户偏好312的接收装置310,一个同时接收两个音频信号304、306的音频输入装置302和一个分析所述音频信号来提取特征并基于对该用户偏好和所提取特征的比较来识别一个音频信号的处理器308。接收装置310可以是一个用户接口,一个有线接口或一个无线接口。例如,接收装置310可以接口到一个包含用户偏好的存储器。尽管只有两个音频信号304、306被示出,一般来说,一个系统将能够接收一个合适数量音频信号以用于所想要的应用。音频信号304、306是模拟的或数字编码的,且来自于任何合适的源,包括广播电台(例如AM、FM、DAB)、电视(例如地面、电缆、卫星)和数字联网的服务(例如GSM、3G、因特网)。因特网提供的服务包括可下载的和流格式的无线电广播和TV服务。该音频输入装置302提供了接收并给处理器308提供可用的音频信号304、306的能力。典型地,该音频输入装置302包括一个用于每个音频输入的接收装置,例如一个或多个模拟FM无线电调谐器和一个因特网调谐器(例如来访问流送广播内容的URL)。任选地,处理器308包括控制一个调谐器的能力,以使该调谐器能够接收替换的音频信号。该音频输入装置302可选择地包括接收库内容的装置,例如一个用户CD集。当一个模拟音频信号被这样接收时,为了有利于随后的处理,其将被音频输入装置302或者处理器308转换为数字格式。
处理器308分析音频信号来提取特征。用于分析的方法将取决于整体应用。本发明支持基本上是实时的和那些不是实时的应用。在前一种情况下,最小化用于分析的时间明显是明智的。因为所述特征对于音频信号来说是内在的,因此更快的(分析)处理也许不能最小化分析时间。通常,对于基本上实时的应用来说,改进的性能是通过给每个接收到的音频信号安排一个分析器来实现的,这将在下面同图5联系起来做进一步的讨论。相反的,对于非实时应用,可以通过在两个或更多音频信号之间共享一个分析器来获得足够的性能。处理器308在已经分析并提取了特征后,然后基于对用户偏好312和所提取特征的比较来识别出一个音频信号。本发明支持一次完成(one-shot)的分析和识别,例如打开一个收音机并自动地识别一个其音频信号当前相应于用户偏好的电台。本发明也支持连续分析和识别,这在下面进一步讨论。
图4是进一步包括一个用于输出一个识别出的音频信号的输出装置的图3中的系统的示意性的表示。该系统包括一个用于接收用户偏好412的接收装置410,一个同时接收两个音频信号404、406的音频输入装置402,以及一个处理器408,该处理器用于分析音频信号来提取特征、基于对用户偏好和所提取特征的比较来识别一个音频信号并且控制(414)输出装置416以输出(418)识别出的音频信号。一个有用的方面是输出所识别出的音频信号的能力。该输出由控制一个输出装置的处理器来管理。该物理输出装置可以集成在处理器自身之内,这样从处理器输出的识别出的音频信号由控制该输出装置的处理器来确定。在该实施例中,示出一个包括一个由处理器408控制(414)的切换开关装置的分离的输出装置416。例如,在音频信号404被处理器最初识别时,该开关装置被控制来选择将被输出(418)的音频信号404。该处理器能够被设置成连续分析和识别音频信号;这样处理器能够在最初的识别之后基于对用户偏好和所提取特征的比较来识别另外的音频信号。根据一个预先定义的规则,该输出随后能够从一个所识别出的音频信号切换到另一个所识别出的音频信号。能够定义任何合适的规则,例如在当前输出音频信号的末尾进行切换,或者一旦音频信号被识别出就立即切换到输出该音频信号。所采用的规则将取决于系统所希望的性能。可以同一个合适的规则一起使用另外的措施以提高性能,如下面要讨论的那样。关于图4的实施例,一个合适的规则可以是当一个音频信号被识别时打开输出装置。该规则包含在处理器408中。假设音频信号404首先被识别,然后该处理器(根据该规则)控制(414)输出装置416来选择要被输出(418)的音频信号404。该处理器继续分析音频信号404和406,并在此期间继续识别音频信号404。接着,音频信号406被识别,然后处理器(根据该规则)控制(414)输出装置416从音频信号404切换到音频信号406。
图5是用来从多个音频信号中识别出一个音频信号的系统的第二实施例的示意性的表示,其中描述了一个优选的处理装置。归功于一个更灵活的实施方式,超出图4的那些特征的额外特征能够被实现。该图表示了一个系统的例子,该系统包含处理器500、音频输入装置502、输出装置504、接收装置506和存储器508,这些装置都通过总线510互相连接。该音频输入装置502接收多个音频信号,例如使用一个或多个调谐器来接收同标准广播和网络提供的服务相联系的音频信号。调谐器的数目和型号将取决于该应用;调谐器的例子包括那些能够接收地面无线电广播(包括AM、FM、DAB)、地面TV广播(模拟和数字)、卫星TV和无线电广播、有线TV和无线电广播频道、移动电话通信(例如GSM和3G系统)以及网络服务(例如因特网广播和其它的音频—视频服务)的调谐器。处理器500包括CPU 512、分析器514、非易失性程序存储器(例如ROM)516和易失性存储器(例如RAM)518,它们通过总线510互相连接。音频输入装置502接收多个音频信号,并将这些信号放在总线510上。分析器514分析所述音频信号来提取随后将要被存储的特征。该分析器可以依次对每个音频信号顺序地执行分析。为了效率,优选地每个音频信号被同时分析。该分析器能够采用任何合适的装置来实现,优选地采用一个或多个专用电路,例如ASIC或CPU;每个电路可以被共享于几个音频输入装置(例如调谐器)之间;理想地,每个电路被分配给一个装置。在一些应用中,例如那些不实时操作的应用,分析器514的功能可以由CPU512替代执行。该非易失性程序存储器包括用于CPU 512和分析器(当由软件驱动时)的程序指令。该接收装置506接收用户偏好,然后将其放在总线510上。该接收装置可以是一个用户接口的一部分;任何能够使用户进行交互并确定用户偏好的用户接口都是合适的。或者,接收装置可以仅通过一个替换实体接收用户偏好,如存储器508或(有线或无线)网络接口;其例子将同图6和7联系起来在下面讨论。任何合适的方法都可以用来确定用户偏好,包括用户隐含地提供偏好的情况;一个例子是由一个当前调谐的广播电台的音频信号的一个或多个特征来代表用户偏好的情况。该CPU 512基于对用户偏好和所提取特征的比较来识别出一个音频信号。用户偏好可以已经以一种需要转换为用于音频信号识别的特征的格式被接收;在接收装置无能为力的情况下,所述转换通过CPU 512来执行。然后该CPU 512通过经由总线510将所选择的识别出的音频信号转送至输出装置504来控制对所识别出的音频信号的输出。输出装置504又可以根据接口需要进一步处理所述音频信号,例如通过将它们转换为另一种格式(例如数字—模拟转换、压缩/解压缩等)。
该CPU 512也同存储器508交互。存储器508是包括利用了磁介质和光介质的存储器在内的任何合适类型的存储器。优选地,该存储器可以同时写入和读取,例如一个硬盘驱动器。该存储装置508可以用于以下目的的任意组合。一个目的是存储所提取特征,且这些特征同用户偏好相应。另一个目的是以日志的形式记录音频信号的身份;例如其音频信号被识别的广播电台。这样的日志能够用来指导用户访问那些预期包含有用户喜欢的内容的电台;如果所述记录还表明音频信号被识别的那天的时间,则这种能力能够被进一步增强。该日志也可以用来帮助细化用户偏好,例如在太多或太少音频信号被识别的情况下,通过例如选择一个或多个记录来表示用户偏好。一个进一步的目的是存储识别出的音频信号。这允许输出一个识别出的音频信号的整体。此外,对于实时应用,所识别出的音频信号的输出顺序能够被调整。例如,处理器500从接收的无线电广播服务中识别出音频信号并以最近的顺序安排输出这些信号,以此来模拟一个同用户偏好相应的无线电广播服务。在当前识别出的音频信号被输出时,该处理器可以识别又一个音频信号,该信号然后被存储并被提升至等待输出的识别出的音频信号列表的开始处。更进一步,一组所存储的识别出的音频信号可以被用户查看;此外,该组可以被编辑或者甚至对于一个经修改的用户偏好被重新分析,以便例如细化(收紧)用户偏好并因此减少该组的大小。一个再进一步的目的是存储所接收的音频信号。这将有利于允许对音频信号的非实时分析;这种分析适合于作为后台功能识别音频信号的应用,并能通过在多于一个的音频信号之间共享分析装置来节省成本。一个进一步的好处在于能够通过采用多个用户偏好来分析所接收的音频信号,例如当用户在多于一个偏好之下进行搜索时。上面描述的和图中示出的该总线510的设置有利于这些不同的存储选项。应注意到,一个采用了本发明的系统可以是分布式的,例如如上描述的处理器500的功能可以在一个服务提供商处执行,或者在用户端或这些位置的组合处执行。
图6是用来从多个音频信号中识别出一个音频信号的图5的系统的第一应用的示意性的表示,其中所述处理由一个服务提供商设备和一个用户设备来执行。服务提供商设备600包括一个同时接收音频信号608的音频输入装置602(包括调谐器606),所述信号例如来自于如上所述的广播服务提供商。用户偏好604被从存储器612接收,并代表一组用户的偏好。该偏好可以以任何合适的方式由服务提供商确定,例如通过市场调查。处理器610分析所述音频信号来提取特征,并基于对用户偏好604和所提取特征的比较来识别音频信号。处理器610的一个实施例的例子在前面图5的附图标记500及其相关描述中已经给出。识别出的音频信号620在处理器610的控制下由输出装置614输出,该装置例如是一个广播FM无线电发射器。例如,服务提供商提供一个或多个从由调谐器606接收的音频信号导出的主题音频信号频道(与一组用户的偏好相应)。用户设备650包括包含了调谐器654和库读出器656的音频输入装置652。调谐器654接收来自于服务提供商600(以及也可能来自于其它地方的音频信号,包括无线电和TV广播和因特网服务)的音频信号620。该库读出器从例如媒体播放器接收本地产生的音频信号;这些信号可以用来在没有来自于调谐器654的识别出的音频信号可用的情况下识别另外的音频信号。在处理器660中根据接收自用户接口662的用户偏好664来分析和识别所接收的音频信号658。该处理器根据应用的要求(如上讨论的那样)使用存储器666,并控制将识别出的音频信号668输出至输出装置670。处理器660的实施方式的一个例子在前面附图5的附图标记500及其相关描述中已经给出。该实施例的一个优势在于,对于一个给定的用户偏好,该用户设备能够被更经济地制造并更有效地操作,因为更少的音频信号需要被用户设备接收和处理。本实施例特别适合于广播通信方法。明显地,该实施例包括这样一种情况,其中对接收自常规广播和网络服务提供商的音频信号的处理完全由该用户设备来执行。
图7是用来从多个音频信号中识别出一个音频信号的图5的系统的第二应用的示意性的表示,其中所述处理由一个网络服务提供商来执行。在该实施例中,网络服务提供商设备702包括一个用于接收音频信号716的音频输入装置710(包括库读出器712和调谐器714),所述音频信号由服务器706根据用户偏好724分析和识别。服务器706的一个实施方式的例子在前面图5的附图标记500和508的组合及其相关描述中已经给出。在该实施例中,该用户偏好724以从一个移动电话718发出的SMS消息720的形式被GSM接收器704经由GSM网络722接收。该服务器控制将识别出的音频信号726输出至输出装置708,该装置可以例如是HTTP端口。用户然后能够接收所识别出的音频信号726,并在播放器728上播放和/或将它们下载至一个像PC、PDA、MP3自动电唱机或诸如此类的装置730上。该实施例具有不需要专业用户设备的优势;现有的产品(例如MP3播放器和PC)都能够被使用。该实施例特别适合于对等(peer-peer)通信方法,包括物理介质分发(例如邮递的CD-ROM)。
前述的方法和实施方式仅仅通过例子的方式被描述,且表示对一系列能够容易地被本领域的熟练技术人员理解以利用本发明的优势的方法和实施例的选择。
在上面参考图1的描述中,公开了一种用于从一组音频信号中识别出一个音频信号的方法。用户偏好106被接收(104)。该组音频信号被同时接收(108),所述信号例如来自于多个无线电广播源。所述音频信号被分析(110)以提取特征112。基于对用户偏好106和所提取特征112的比较,音频信号被识别(114)。可选择地,所识别出的音频信号被输出(116)。

Claims (23)

1.一种用来从多个音频信号中识别一个音频信号的方法,该方法包括:
■接收(104)用户偏好;
■同时接收(108)多个音频信号;
■分析(110)所述音频信号以提取特征;和
■基于对用户偏好和所提取出的特征的比较来识别(114)一个第一音频信号。
2.如权利要求1所述的方法,进一步包括输出(116)所述第一音频信号。
3.如权利要求1或2所述的方法,其中所述对音频信号的分析是连续执行的,并且基于对用户偏好和所提取出的特征的比较来进一步识别一个第二音频信号。
4.如权利要求2和3所述的方法,其中,根据一个预定义的规则,所述输出从所述第一音频信号切换至所述第二音频信号
5.如权利要求4所述的方法,进一步包括存储(220)所述第二音频信号,并且当所述输出从所述第一音频信号切换至所述第二音频信号时,从存储器调用所述第二音频信号。
6.如权利要求5所述的方法,其中当识别出所述第二信号时,开始对所述第二音频信号的所述存储。
7.如权利要求1-5中的任一条所述的方法,进一步包括存储(212)多个音频信号。
8.如任一在先权利要求所述的方法,其中所述对用户偏好的接收包括从一个用户接口接收所述偏好。
9.如权利要求1-7中的任一条所述的方法,其中所述对用户偏好的接收包括从存储器接收所述偏好。
10.如任一在先权利要求所述的方法,其中所提取出的特征包括内在特征。
11.如权利要求10所述的方法,其中所述内在特征是音乐特征。
12.一种如任一在先权利要求所述的方法,进一步包括将所述用户偏好转换(208)成特征。
13.一种用来从多个音频信号中识别一个音频信号的系统,该系统包括:
-一个适于接收用户偏好的接收装置(310);
-适于同时接收多个音频信号的音频输入装置(302);
-适于分析音频信号来提取特征并基于对用户偏好和所提取出的特征的比较来识别一个第一音频信号的处理装置(308)。
14.如权利要求13所述的系统,进一步包括一个用于输出所述第一音频信号的输出装置(416),所述处理装置适于控制所述输出装置。
15.如权利要求13或14所述的系统,其中所述处理装置适于连续分析音频信号并基于对用户偏好和所提取出的特征的比较来进一步识别一个第二音频信号。
16.如权利要求14和15所述的系统,其中,根据一个预定义的规则,所述处理装置适于控制所述输出装置以从所述第一音频信号切换至所述第二音频信号
17.如权利要求13-16中的任一条所述的系统,进一步包括存储装置(508)。
18.如权利要求17所述的系统,其中所述存储装置适于同时写入和读取。
19.如权利要求13-18中的任一条所述的系统,其中所述接收装置是一个用户接口(662)。
20.如权利要求13-18中的任一条所述的系统,其中所述接收装置是一个无线接口(704)。
21.一种包括适于执行如权利要求1-12中的任一条所述的方法的软件的记录载体。
22.一种被设置成执行如权利要求1-12中的任一条所述的方法步骤的软件工具。
23.一种包括处理装置的系统,所述处理装置按照如权利要求22所述的软件工具的指示执行操作。
CNA200380106762XA 2002-12-20 2003-12-10 音频信号识别方法和系统 Pending CN1729685A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0229940.2A GB0229940D0 (en) 2002-12-20 2002-12-20 Audio signal analysing method and apparatus
GB0229940.2 2002-12-20
GB0303970.8 2003-02-21

Publications (1)

Publication Number Publication Date
CN1729685A true CN1729685A (zh) 2006-02-01

Family

ID=9950260

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA200380106829XA Pending CN1729507A (zh) 2002-12-20 2003-12-10 对音频信号进行排序
CN2003801067615A Expired - Fee Related CN1729506B (zh) 2002-12-20 2003-12-10 音频信号分析方法和设备
CNA200380106762XA Pending CN1729685A (zh) 2002-12-20 2003-12-10 音频信号识别方法和系统

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CNA200380106829XA Pending CN1729507A (zh) 2002-12-20 2003-12-10 对音频信号进行排序
CN2003801067615A Expired - Fee Related CN1729506B (zh) 2002-12-20 2003-12-10 音频信号分析方法和设备

Country Status (10)

Country Link
US (1) US20060075883A1 (zh)
EP (1) EP1579419B1 (zh)
JP (1) JP2006510944A (zh)
KR (1) KR20050085765A (zh)
CN (3) CN1729507A (zh)
AT (1) ATE459073T1 (zh)
AU (1) AU2003285629A1 (zh)
DE (1) DE60331475D1 (zh)
GB (2) GB0229940D0 (zh)
WO (1) WO2004057569A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107004412A (zh) * 2014-11-28 2017-08-01 微软技术许可有限责任公司 用于监听设备的设备仲裁

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1695339A4 (en) * 2003-12-08 2007-07-18 Neural Signals Inc SYSTEM AND METHOD FOR GENERATING SPEECH FROM BRAIN ACTIVITY
CN101189610B (zh) * 2005-06-01 2011-12-14 皇家飞利浦电子股份有限公司 用于确定内容项特性的方法和电子设备
JP4672474B2 (ja) * 2005-07-22 2011-04-20 株式会社河合楽器製作所 自動採譜装置及びプログラム
JP4722738B2 (ja) * 2006-03-14 2011-07-13 三菱電機株式会社 楽曲分析方法及び楽曲分析装置
JP4489058B2 (ja) * 2006-07-13 2010-06-23 アルパイン株式会社 和音判定方法および装置
US7667125B2 (en) * 2007-02-01 2010-02-23 Museami, Inc. Music transcription
JP2010518459A (ja) * 2007-02-14 2010-05-27 ミューズアミ, インコーポレイテッド 配布オーディオファイル編集用ウェブポータル
US8283546B2 (en) * 2007-03-28 2012-10-09 Van Os Jan L Melody encoding and searching system
WO2009103023A2 (en) 2008-02-13 2009-08-20 Museami, Inc. Music score deconstruction
US9177540B2 (en) 2009-06-01 2015-11-03 Music Mastermind, Inc. System and method for conforming an audio input to a musical key
US9251776B2 (en) 2009-06-01 2016-02-02 Zya, Inc. System and method creating harmonizing tracks for an audio input
US9310959B2 (en) 2009-06-01 2016-04-12 Zya, Inc. System and method for enhancing audio
US8338686B2 (en) 2009-06-01 2012-12-25 Music Mastermind, Inc. System and method for producing a harmonious musical accompaniment
US8768707B2 (en) * 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US10134051B1 (en) * 2012-06-11 2018-11-20 Ct Acquisition Holdco, Llc Methods and systems for audio identification and reward provision and management
EP3063618A4 (en) * 2013-10-30 2017-07-26 Music Mastermind, Inc. System and method for enhancing audio, conforming an audio input to a musical key, and creating harmonizing tracks for an audio input
JP2016057417A (ja) * 2014-09-09 2016-04-21 カシオ計算機株式会社 情報出力装置、コンテンツ出力方法、及びプログラム
CN108074552A (zh) * 2016-11-18 2018-05-25 北京酷我科技有限公司 一种钢琴的电子曲谱转换方法及系统
CN107680614B (zh) * 2017-09-30 2021-02-12 广州酷狗计算机科技有限公司 音频信号处理方法、装置和存储介质
CN109739112B (zh) * 2018-12-29 2022-03-04 张卫校 一种摇摆物体控制方法与摇摆物体
CN111613195B (zh) * 2019-02-22 2022-12-09 浙江大学 音频拼接方法、装置及存储介质
US11361742B2 (en) * 2019-09-27 2022-06-14 Eventide Inc. Modal reverb effects for an acoustic space

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5038658A (en) * 1988-02-29 1991-08-13 Nec Home Electronics Ltd. Method for automatically transcribing music and apparatus therefore
JP3047068B2 (ja) * 1988-10-31 2000-05-29 日本電気株式会社 自動採譜方法及び装置
JP3132099B2 (ja) * 1991-10-16 2001-02-05 カシオ計算機株式会社 スケール判別装置
JP2963585B2 (ja) * 1992-09-08 1999-10-18 ヤマハ 株式会社 調決定装置
JP2658767B2 (ja) * 1992-10-13 1997-09-30 ヤマハ株式会社 自動伴奏装置
JP3072452B2 (ja) * 1993-03-19 2000-07-31 ヤマハ株式会社 カラオケ装置
JP3206370B2 (ja) * 1995-05-02 2001-09-10 ヤマハ株式会社 音楽情報分析装置
US6031171A (en) * 1995-07-11 2000-02-29 Yamaha Corporation Performance data analyzer
US5953005A (en) * 1996-06-28 1999-09-14 Sun Microsystems, Inc. System and method for on-line multimedia access
US6057502A (en) * 1999-03-30 2000-05-02 Yamaha Corporation Apparatus and method for recognizing musical chords
FI20001592A (fi) * 2000-07-03 2002-04-11 Elmorex Ltd Oy Nuottipohjaisen koodin generointi
JP3744366B2 (ja) * 2001-03-06 2006-02-08 ヤマハ株式会社 楽曲データに基づく音楽記号自動決定装置、楽曲データに基づく楽譜表示制御装置、および、楽曲データに基づく音楽記号自動決定プログラム
US6703551B2 (en) * 2001-05-17 2004-03-09 Ssd Company Limited Musical scale recognition method and apparatus thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107004412A (zh) * 2014-11-28 2017-08-01 微软技术许可有限责任公司 用于监听设备的设备仲裁

Also Published As

Publication number Publication date
GB0229940D0 (en) 2003-01-29
ATE459073T1 (de) 2010-03-15
WO2004057569A1 (en) 2004-07-08
JP2006510944A (ja) 2006-03-30
DE60331475D1 (de) 2010-04-08
EP1579419B1 (en) 2010-02-24
CN1729507A (zh) 2006-02-01
EP1579419A1 (en) 2005-09-28
CN1729506A (zh) 2006-02-01
US20060075883A1 (en) 2006-04-13
CN1729506B (zh) 2010-05-26
AU2003285629A1 (en) 2004-07-14
KR20050085765A (ko) 2005-08-29
GB0303970D0 (en) 2003-03-26

Similar Documents

Publication Publication Date Title
CN1729685A (zh) 音频信号识别方法和系统
US7499630B2 (en) Method for playing back multimedia data using an entertainment device
JP4528763B2 (ja) インターネットからデータをストリーミングするリアルタイム記録エージェント
US7366461B1 (en) Method and apparatus for improving the quality of a recorded broadcast audio program
US8239561B2 (en) System and method for locating and capturing desired media content from media broadcasts
CN1726489A (zh) 个人音频录制系统
CN101051514B (zh) 记录和复现装置与记录和复现方法
US20100319015A1 (en) Method and system for removing advertising content from television or radio content
US20020120456A1 (en) Method and arrangement for search and recording of media signals
US9460202B2 (en) Apparatus, method and computer readable recording medium for providing music related information by recognition of music output through television
EP2284788A1 (en) Personalized entertainment system
US20030167174A1 (en) Automatic audio recorder-player and operating method therefor
CN1585947A (zh) 用于个人信息检索、更新和表示的方法和系统
CA2622223A1 (en) Audio playlist creation system and method
CN101084629A (zh) 广播接收机
CN100546267C (zh) 用于处理信息的系统、装置、方法、记录介质和计算机程序
KR20050085829A (ko) 오디오 신호 식별 방법 및 시스템
DE10116722C1 (de) Unterhaltungsgerät
CN1781309A (zh) 用于自动搜索可通过网络访问的信息源以得到满足预定标准的内容的方法和设备
EP2928094B1 (en) Receiving apparatus and method of providing information associated with received broadcast signals
CN100349382C (zh) 数字广播节目自动储存方法
US20030084459A1 (en) Method and apparatus for modifying a media database with broadcast media
CN1960206A (zh) 使用多下载算法来下载地面dmb数据的方法及其设备
US20240039651A1 (en) Radio tuner system using metadata and method thereof
EP1691496A1 (en) Radio receiver capable of downloading audio data from a remote database

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication