CN109446374A - 流匹配系统中的结果的存留和实时排名 - Google Patents
流匹配系统中的结果的存留和实时排名 Download PDFInfo
- Publication number
- CN109446374A CN109446374A CN201811257138.4A CN201811257138A CN109446374A CN 109446374 A CN109446374 A CN 109446374A CN 201811257138 A CN201811257138 A CN 201811257138A CN 109446374 A CN109446374 A CN 109446374A
- Authority
- CN
- China
- Prior art keywords
- sample
- matching
- reference audio
- audio sample
- probe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000523 sample Substances 0.000 claims abstract description 212
- 230000000717 retained effect Effects 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 30
- 239000013074 reference sample Substances 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 230000014759 maintenance of location Effects 0.000 claims description 7
- 241000208340 Araliaceae Species 0.000 claims description 6
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 6
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 6
- 235000008434 ginseng Nutrition 0.000 claims description 6
- 238000005259 measurement Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000000670 limiting effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本申请涉及流匹配系统中的结果的存留和实时排名。匹配系统接收探针音频样本以用于与数据仓库的参考进行比较。生成比较以确定与探针样本的一部分或第一量的足够匹配。给所得匹配参考指派排名得分。匹配参考被保留,除非满足得分阈值。连续生成与探针样本的第二量的比较,并且通过指派排名得分的进一步匹配参考来更新保留的参考。保留的结果被合并并且被确定满足得分阈值以用于作为匹配参考的输出结果公布。
Description
分案说明
本申请属于申请日为2013年12月30日的中国发明专利申请201380068864.0的分案申请。
相关申请的交叉引用
本申请要求2012年12月31日提交的题为“HOLD BACK AND REAL TIME RANKING OFRESULTS IN A STREAMING MATCHING SYSTEM”的美国专利申请No.13/732,108的权益,其整体以引用方式并入本文。
技术领域
本公开总体涉及在流匹配系统中基于排名来匹配对象,并且具体地讲,涉及保留匹配并且连续对结果进行排名,以向结果提供更好的置信度。
背景技术
一种类型的匹配基于匹配旋律或音频内容(例如,歌曲),这些旋律或音频内容可存储在大的数据仓库中,具有多个不同的版本或者有一定程度的变化的相关拷贝。此类系统通常被称作音频匹配系统。在一些情况下,由于旋律的差异或者分析的作曲中的某些特性变化,匹配尤其具有挑战性。例如,数据仓库可具有源自多个不同的版本的接近精确匹配,诸如来自内容变化的慢速唱片音轨或者原始歌曲音轨、限制(explicit)歌曲或非限制(non-explicit)歌曲。在用户提供对音频内容的访问并且服务器在没有接收完整音频文件的情况下匹配内容的情形下,当数据仓库保存有多个接近精确匹配时,匹配精确匹配会具挑战性。
发明内容
下面呈现本公开的各种方面的简化发明内容以便提供对这些方面的基本理解。本发明内容不是所有可以想到的方面的详尽概述,既不旨在识别关键或重要元素,也不旨在描绘这些方面的范围。其目的是以简化形式呈现本公开的一些概念作为稍后呈现的具体实施方式的前序。
本文所公开的系统和方法涉及将比较对象与多个参考对象进行匹配以识别匹配结果。所述结果被保留并更新,直至附加量的比较对象被处理。所述结果被评分并比较,以便确定哪些结果通过得分阈值并且可作为结果在其它结果之前发出、被立即公布、和/或被一起公布以增加结果的置信度。
在实施例的一个示例中,一种方法包括使用处理器执行存储在计算机可读介质上的计算机可执行指令以执行动作。所述动作包括接收探针音频样本,并且将所述探针音频样本与多个参考音频样本进行比较,以识别至少一个匹配参考音频样本。响应于识别出多个匹配参考音频样本,所述动作还包括给所述匹配参考音频样本指派相应排名得分。
实施例的另一示例包括一种系统,该系统包括存储计算机可执行组件的存储器以及执行存储在所述存储器中的计算机可执行组件的微处理器。所述计算机可执行组件包括接收音频流内容的第一部分的接收组件。比较组件生成音频流内容的所述第一部分与多个参考音频样本的比较。匹配组件基于所述比较来识别具有与音频流内容的所述第一部分的足够匹配的匹配参考音频样本。排名组件为所述多个参考音频样本中的匹配参考音频样本构造第一排名得分。
本文还公开了一种包括计算机可执行指令的计算机可读存储介质,所述计算机可执行指令响应于执行使得包括处理器的计算系统执行操作。所述操作包括经由所述处理器接收探针音频样本的第一部分。所述操作还包括将所述第一部分与多个参考音频样本进行比较以识别多个匹配参考音频样本。识别满足足够匹配阈值的多个匹配参考音频样本。根据参数集合对匹配参考音频样本进行评分,并且保留不满足得分阈值的匹配参考音频样本免于被输出。
以下描述和附图详细阐述了本公开的某些例示性方面。然而,这些方面仅指示了可采用本公开的原理的各种方法中的一小部分。本公开旨在包括所有这样的方面及其等同物。本公开的其它优点和新颖性特征将通过结合附图考虑本公开的以下具体实施方式而变得显而易见。
附图说明
图1是图示出依据本文所述的各个方面和实现方式的匹配系统的示例非限制性实施例的框图。
图2是图示出依据本文所述的各个方面和实现方式的系统的示例非限制性实施例的框图。
图3是图示出依据本文所述的各个方面和实现方式的具有匹配组件的系统的示例非限制性实施例的框图。
图4是图示出依据本文所述的各个方面和实现方式的具有匹配组件的系统的示例非限制性实施例的框图。
图5图示出依据本文所述的各个方面和实现方式的排名组件的示例。
图6图示出依据本文所述的各个方面和实现方式的处理媒体内容的匹配的示例非限制性实施例的流程图的示例。
图7图示出依据本文所述的各个方面和实现方式的处理媒体内容的匹配的示例非限制性实施例的流程图。
图8图示出依据本文所述的各个方面和实现方式的直播媒体流的示例非限制性实施例的流程图。
图9是图示出依据本文所述的各个方面和实现方式布置的示例计算装置的框图。
图10是图示出依据本公开的各个方面和实现方式的示例联网环境的框图。
具体实施方式
概述
现在参照附图描述本公开的各个方面,其中,始终使用相似附图标记来指代相似元件。在以下描述中,为了说明,阐述了众多具体细节以便提供一个或多个方面的彻底理解。然而,应该理解,本公开的某些方面可在没有这些具体细节的情况下实践,或者随其它方法、组件、材料等来实践。在其它情况下,公知结构和装置以框图形式示出,以方便描述一个或多个方面。
将理解,依据本公开所述的一个或多个实现方式,用户可选择不提供与数据收集方面有关的个人信息、人口统计信息、位置信息、专有信息、敏感信息等。此外,本文所述的一个或多个实现方式可提供使收集、接收或传送的数据匿名。
依据本公开所述的一个或多个实现方式,音频匹配系统接收音频信号的节选(探针)作为输入,并且试图在大的参考音频信号库中定位对应的音频节选。例如,移动电话可记录嘈杂环境(例如,嘈杂的酒吧或者其它地方)中播放的音乐,匹配系统可利用其通过将嘈杂探针与大的参考库进行匹配来返回关于该播放的音乐的信息。匹配系统可操作以通过随着从客户端接收音频剪辑实时地执行音频样本(音乐记录)与参考对象(例如,音频参考)的匹配来使时延最小化。可基于诸如时间和/或接收的音频的增量的各种参数以及随着接收记录音频流实时地执行匹配。
例如,对于具有数千万音频参考的数据库,系统可能会找到满足预定义的匹配阈值的多个匹配。所得匹配的多重性可能由于多个原因产生,诸如参考集中的副本、或者同一音轨可既在合辑专辑上也在慢速唱片专辑上。另一示例是所得音频参考可来自原始版本以及较冷门的混音版本,这二者均匹配探针音频样本。尽管本文作为示例讨论了音频内容,该含义中也包括其它媒体内容,诸如视频内容、图像内容等。
在流匹配系统的背景下,可能难以知道是否一旦通过用于确定匹配的预定阈值就返回匹配,确切地讲返回可用匹配中的哪一个,或者是否等待直至更好的匹配变得可用。在本公开的各个方面,组件的实时排名系统在匹配系统中操作以进行排名并将可能较冷门的参考存留(hold back)或保留(retain)以免于被输出,直至确定了更大的置信度以输出匹配。接收组件接收媒体流内容的第一部分以用于确定在媒体内容参考当中匹配是否可用。比较组件随着接收至少一个参考音频而实时地通过生成音频流内容的第一部分与多个参考音频样本的比较来识别至少一个参考音频样本。匹配组件基于所述比较来识别音频流内容的第一部分与多个参考音频样本之间的足够匹配,并且排名组件为多个参考音频样本中的匹配参考音频样本构造第一排名得分。
流匹配系统中的结果的存留和实时排名的非限制性示例
现在参照图1,描绘了系统100。例如,系统100可对由特征向量表示的对象进行匹配,并且基于在系统接收用于匹配的对象(诸如,在视频或音频流中)的同时确定的连续更新的结果排名输出所得匹配。系统100可包括存储计算机可执行组件的存储器以及执行存储在所述存储器中的计算机可执行组件的处理器,其示例可参照图9找到。另外,系统100可包括接收组件102、比较组件112、匹配组件118和排名组件124。
接收组件102可被配置为接收第一特征向量104(表示为U)。U可与参考对象106关联。接收组件102还可接收第二特征向量108(表示为V),其可与比较对象110关联。第一特征向量104(例如,U)和第二特征向量108(例如,V)可为d维向量,其中d可以是例如任何正整数。U或V的d个维度可分别涉及与参考对象106和比较对象110关联的不同特征,如结合图2进一步描述的。
在仍参照图1的同时,现在还转向图2,描绘了示图200。示图200图示出了参考对象或比较对象的各种示例。例如,对象106、110可涉及图像202、音频204和/或文本206中的至少一个。例如,在对象106、110涉及图像202的情况下,特征向量104、108(例如,U和V)可包括诸如像素值的图像特征。例如,第一特征向量104可包括参考图像的像素的像素值,并且第二特征向量108可包括比较图像的像素的像素值。在其它实施例中,特征向量104、108可包括与参考图像和比较图像关联的小波或其它特征(包括例如局部特征)。另外,特征向量可包括具有内容的一个或多个标识符的音频指纹或者总结或识别音频内容的基于紧凑内容的签名。例如,在对象106、110涉及音频204的情况下,则第一特征向量104可包括参考音频的小波的小波值(或者与音频关联的其它特征),并且第二特征向量108可包括比较音频的小波的小波值(或者与音频关联的其它特征)。例如,在对象106、110涉及文本206的情况下,则第一特征向量104可包括参考文本中所包括的各种字的字数(或者与文本关联的其它特征),并且第二特征向量108可包括比较文本中的各种字的字数(或者与文本关联的其它特征)。示例202、204和206是非限制性的,并且可存在其它示例,诸如可由d维特征向量表示的基本上任何对象。
转回图1,比较组件118可被配置为随着接收比较对象(例如,音频流内容)的第一部分或片段,实时地在参考对象(例如,参考音频样本)的一个或多个音量中识别参考对象106(例如,音频样本)。比较对象118生成音频流内容的第一部分(例如,预定义数量的特征向量、预定义的时间周期和/或量)与多个参考音频样本的比较。
匹配组件124可被配置为基于所述比较识别比较对象110的第一部分与多个参考对象106之间的足够匹配。例如,所述匹配可基于一个或多个特征向量U和V之间的一致性得分120来识别。因此,U和V的足够匹配126可意指参考对象106(或参考对象106的一部分)与比较对象110(或比较对象110的关联部分)之间的足够匹配。
另外地或另选地,一致性得分120可基于参数122来确定。参数122可指示是否使用指示函数或距离度量来确定一致性得分122,例如以便确定足够匹配。排名组件124可被配置为构造第一匹配参考结果集合128(表示为P)和第二匹配参考结果集合130(表示为Q)。P可基于U的维度的第一顺序排序(例如,第一特征向量104的第一部分)来构造,并且Q可基于U的维度的第二顺序排序(例如,第二特征向量108的第一部分)来构造,其中,第一顺序排序和第二顺序排序可分别包括比较对象110的第一子集和第二子集。P和Q可以是相对于彼此的不同连续序列的匹配结果。第一顺序排序或第二顺序排序可以是另一个的子集,并且二者均为比较对象110的子集。
图3图示出依据本文所公开的各种实施例的作为匹配系统操作的系统300。例如,系统300操作以将比较对象(诸如,样本音频流)与参考对象(例如,参考音频)连续匹配,连续对匹配结果进行排名,并且通过保留匹配除非满足预定得分阈值来生成更大的置信度以用于输出匹配结果。例如,系统300包括上述组件,并且还包括评分组件302,其比较排名得分,更新排名并且确定足够匹配结果。
评分组件302被配置为随着经由接收组件102、比较组件112、匹配组件118和排名组件124对比较对象110的第一部分进行处理和排名,实时地接收由排名组件124生成的匹配结果。评分组件302可接收第一排名集合128,并且随着比较对象110的附加部分被处理以确定参考对象匹配,评分组件可动态地更新匹配结果的排名,利用具有满足足够匹配126的预定阈值的置信度水平的附加结果来更新匹配结果,和/或确定满足更高的第二预定得分阈值以用于立即输出。
在一个实施例中,系统300操作以保留第一排名得分集合以及与得分排名关联的对应的匹配结果(匹配参考对象)以用于比较对象110的附加部分的进一步处理或匹配。第一排名集合可随匹配结果接收,并且评分组件可公布满足排名匹配的第二预定阈值得分的任何排名结果。第二预定阈值(得分阈值)可与具有更高置信度阈值水平的用于匹配参考的足够匹配阈值相区分,其中,足够匹配可提供比较对象之间的一种一致性水平,而得分阈值基于参数304提供更大的匹配可能性。第二预定阈值(得分阈值)可由诸如参数304的进一步标准来满足和/或在匹配结果中包括在从参考对象中的比较内计算的比较对象的另外的部分确定的更大量的特征向量。
例如,评分组件302可利用各种参数304以便确定匹配的排名是否足以作为匹配来输出和/或为了更大的置信度是否需要利用音频流的附加部分或片段的附加匹配操作/处理。如果没有匹配结果满足用于立即输出的第二预定阈值,则第一排名匹配集合可被保留并且基于利用比较对象110的另外的部分的附加迭代匹配处理来动态地更新。
例如,评分组件302操作以生成匹配参考音频样本的第一匹配参考结果128与第二匹配参考结果130的得分比较。第二结果130可包括与音频流内容(例如,比较对象110)的第二或附加部分关联的第二排名得分。评分组件302可操作以通过基于相同比较对象或媒体流的附加迭代结果、基于分析的更大量的流内容、和/或系统300接收媒体流内容的预定量的时间改变排序,来迭代地并且动态地更改排名匹配的得分。另外地或另选地,评分组件302可这样操作:对第一排名集合128中接收的排名加权,以便根据从第一排名集合和第二排名集合之间的比较的第二排名集合130更新排名结果,并且公布满足得分阈值或者满足比确定的其它所得参考匹配更大程度的得分阈值的任何保留的结果。
在一个实施例中,比较对象110的第二部分的第二匹配参考结果130(例如,V[vald])包括第一部分,并且可包括音频样本(例如,比较对象)的子集,以便进一步确定结果和/或确定的附加匹配参考结果的强度。排名组件124可结合评分组件302来工作,以基于得分比较动态地更改与匹配参考音频样本关联的第一排名得分。响应于基于处理的比较对象110的量或者时间量中的至少一个达到第二预定阈值,可公布匹配结果以输出。确定输出的匹配结果可在公布之前基于关联的排名得分来排序,并且可进一步包含在公布时关于结果及其排名的准确度的更大置信度。例如,在可与各种专辑、原版慢速唱片、混音版本等出现多个不同的匹配结果的情况下,可以可能匹配的更大准确度或置信度公布预定数量的结果,而不是一旦媒体流的第一部分被比较并识别为足够匹配就立即公布结果。
评分组件302可基于参数或度量从比较对象的各种部分生成排名得分的连续比较。所述参数或度量可包括例如基于和/或指示相应匹配参考音频样本是否各自可用于销售、匹配参考音频样本的相应受欢迎度、相应匹配参考音频样本是否来自原版专辑和/或合辑专辑、和/或匹配参考音频样本的相应销售量的一个或多个权重或得分。
另外,识别的匹配结果可根据匹配强度来排名,并且然后,评分组件可基于所述参数对匹配进一步评分。例如,可从接收的媒体流内容的第一部分接收第一排名集合,并且找到多个匹配参考结果,诸如参考A、B和C。这些参考中的每一个可基于比较内容/对象的部分与参考内容/对象之间的特征向量之间的值的强度来排名。所述参考可在作为匹配参考输出之前被排名并传递给评分组件302。评分组件302然后可保留匹配,直至确定得分,处理了比较对象的其它附加部分,和/或经过了用于匹配组件的匹配处理操作的时间量。例如,仅一个或多个(例如,A和B)可作为匹配输出,其中C没有通过预定阈值。
评分组件302可操作以保留每个匹配,并且基于参数/度量304来进一步分析它们。在一些情形下,匹配中的一个或多个可满足基于参数集合的第二预定阈值。然后,评分组件302可将这些匹配作为结果从系统300输出,和/或继续保留这些匹配结果。然后,评分组件302可继续接收匹配和关联的排名,以与所比较保留的结果比较。例如,参考A可继续作为匹配接收,然而,基于与该参考匹配的附加数据(附加量的音频流、或者接收的比较对象的附加部分),参考A相对于其它参考B和C排名得更高。因此,评分组件302可将排名的增加计入在得分内,以确定参考A是否满足第二预定阈值以及参考A满足或不满足该阈值的程度有多少。
参照图4,图示出了生成得分或度量以用于输出匹配参考的匹配系统的示例性评分组件。评分组件302可生成音乐内容所特定的得分400和/或还可为其它类型的内容(例如,电影、TV节目)定义合适的得分,诸如由上述比较对象110表示的。在一个示例中,得分400可被表示成具有一位或多位的整数,其可包括多个分量。还可以想到不同位长的其它整数,其中,一个或多个分量可按照各种顺序排列和/或在其表示上具有不同的有效度。
例如,高阶位402可操作以跟踪销售的可用性。例如,如果高阶位402为一(1),则对象110(例如,歌曲音轨等)各自可用于销售,并且否则为零(0)。另外,接下来的四位的集合404可用作受欢迎度度量。该度量可来自诸如对对象或音频音轨的web搜索次数和/或点击(例如,观看、下载等)次数的探试法,其可被指定为具有所示的四位或更多位的二进制数。在另一实施例中,在音频参考的情况下,另一位(例如,第六位)可将匹配参考指定为原版慢速唱片或合辑专辑。例如,人可指定音轨是原版慢速唱片,或者如果是合辑专辑,则为零,反之亦然。剩余位408可用于对销售量数据和/或与潜在匹配内容参考有关的其它数据进行编码。因此,得分越高,匹配系统必须越优先返回该参考,并且参考满足第二预定阈值的程度或置信度水平越大,以用于作为匹配结果被公布。得分的每个分量的顺序和有效度(与其对应的参数或度量)可变化,而不限于上面为描述得分400而提供的示例。例如,得分可被表示为可包括任何数量的分量的整数。这些分量中的每一个可包括基于特征的相对重要性占据最高至最低有效位位置的位的组或集合(一个或多个)。
评分组件302可按照优先顺序基本上使用参数304(度量标准)来比较两个得分,以从保留的匹配参考中就哪些匹配参考更适合于公布或输出进行决策。得分400因此提供一种手段来比较任一对参考匹配(例如,具有第一匹配参考集合和/或具有不同数量的匹配特征向量的第二相同参考的集合、和/或不同的参考的音轨),基于得分重新计算匹配列表的排名,和/或将得分传递给排名组件124以重新配置将被输出的存储的匹配的排名。
在另一实施例中,由评分组件302定义预定义的得分阈值T(第二预定阈值或得分阈值),如果高于该阈值,则评分组件不会存留匹配使其免于作为匹配被公布或输出。例如,所述阈值可以是被图示出为T=11111000000000000000000000000000的得分400。高于该阈值的任何匹配被认为足够好,因此可被立即返回给用户。低于该阈值的匹配可被存留,直至上述系统接收并匹配了至少N秒的探针(例如,比较对象、音频样本流等)和/或探针的附加部分(量)。例如,可使用值N=5秒。另外地或另选地,探针或比较对象的量也可被指定为使得从第一部分生成的匹配(例如,一个或多个特征)被保留,直至另外的部分也随第一部分一起或者单独地被匹配。通过保留初始匹配,可通过提升匹配的初始排名结果、弱化它们和/或丢弃不满足附加阈值(例如,T)的那些匹配实现更大的置信度。
在大多数情况下,客户端(例如,客户端装置)将显示第一匹配,但是为了完整起见,上述系统操作以实时地返回排名匹配的完整列表。在匹配时,系统可从客户端接收探针剪辑(例如,比较对象),并且将开始剪辑的指纹识别和匹配。响应于匹配组件识别出匹配或者匹配集合,排名组件对它们进行排名,立即返回并去除高于阈值T的那些匹配。系统如今等待公布结果,直至接收到更多匹配。每当接收到新的匹配集合时,可将它们合并到剩余未返回/保留的匹配集合中,可以执行排名,并且可以执行与第二预定阈值或者得分阈值的比较。在N秒和/或N周期性间隔的数据被接收并匹配之后,系统可检索迄今为止找到的所有匹配的排名集合并且将它们返回。在此之后接收的任何后续匹配可被排名并立即返回给用户。
现在参照图5,图示出了依据本文所述的各个方面的排名组件124。在一个示例中,排名组件124可容纳评分组件302,其操作以对满足足够匹配阈值的匹配参考进行评分。排名组件124还可包括保留组件502和合并组件504。
保留组件503保留具有足够匹配或满足匹配阈值的匹配参考音频样本。基于参数304满足得分阈值的任何匹配参考结果可作为一个或多个公布匹配506被立即公布。保留组件502可保留初始匹配参考结果及其关联的第一排名得分使其免于被输出,直至从比较对象(探针样本)的附加部分确定至少第二匹配参考音频样本集合。因此,排名组件124可操作以连续地比较匹配参考结果的排名得分,并且确定哪些结果满足得分阈值以用于作为一个或多个公布匹配506被公布。
保留组件502可基于预定参数来保留匹配参考结果,所述预定参数包括比较操作的时间或者比较的音频流内容的量中的至少一个。另外,所述参数可包括相应匹配参考音频样本是否各自可用于销售、匹配参考音频样本的相应受欢迎度、相应匹配参考音频样本是来自原版专辑还是合辑专辑、或者匹配参考音频样本的相应销售量的指示,其中每个参数可被不同地加权以用于确定排名得分以及每个匹配参考是否满足得分阈值(所讨论的第二预定阈值)。
在一定量的时间和/或处理一定量的比较对象之后,继基于得分排名公布最佳或最优匹配参考结果之后,保留组件502可操作以作为公布匹配506公布所有匹配或者被确定为与其它参考匹配相比更大程度地满足得分阈值的匹配的子集。
合并组件504可操作以进一步将匹配参考音频样本与至少一个附加匹配参考音频样本合并,所述附加匹配参考音频样本从与音频流内容的第二部分的足够匹配而具有第二排名得分。例如,随着音频探针或比较对象的附加部分或片段被处理,可发现附加匹配参考并将其包括在保留的第一匹配集合内。另选地或另外地,合并组件504可操作以通过利用新排名的匹配参考结果更新排名来合并得分排名,诸如,当附加量的音频探针或比较对象数据可指示更强匹配和/或揭示参数304中的一个或多个的增加时。
流匹配系统中的结果的存留和实时排名的方法的非限制性示例
图6-8图示出依据所公开的主题的各种方法。尽管为了说明简单,所述方法被示出并描述为一系列动作,所公开的主题不限于所述动作的顺序,因为一些动作可按照与本文所示出和描述的不同的顺序进行和/或与其它动作同时进行。例如,本领域技术人员将理解并意识到,所述方法可另选地被表示为一系列相互关联的状态或事件,诸如状态图。此外,实现依据所公开的主题的方法并非要求所有图示出的动作。另外,将理解,本公开中所公开的方法能够被存储在制品中以方便这些方法向计算机或其它计算装置的运输和转移。
现在参照图6,图示出了依据所公开的各种实施例的匹配系统的示例方法600。在附图标记602处,接收探针音频样本。探针音频样本可包括可包含媒体内容的流的媒体内容的任何比较对象(例如,音频、视频、文本数据等),例如如上面参照图2所讨论的。
在附图标记604处,方法600包括将探针音频样本与多个参考音频样本进行比较以识别至少一个匹配参考音频样本。例如,将探针音频样本与多个参考音频样本进行比较以识别一个或多个匹配参考音频样本的步骤可包括生成探针音频样本的指纹并且通过至少匹配阈值或者足够匹配确定来识别与探针音频样本的指纹匹配的多个参考音频样本的相应指纹。
在附图标记606处,响应于识别出多个匹配参考音频样本,给匹配参考音频样本指派相应排名得分。例如,给匹配参考音频样本指派相应排名得分的步骤可包括基于一个或多个度量/参数生成相应排名得分。所述参数可包括指示相应匹配参考音频样本是否各自可用于销售的可用性度量、指示匹配参考音频样本的相应受欢迎度的受欢迎度度量、指示相应匹配参考音频样本是来自原版专辑还是合辑专辑的合辑度量和/或指示匹配参考音频样本的相应销售量的销售度量。
例如,排名得分可包括特定位长(诸如,三十二位或者一些其它位长)向量,其指定用来确定匹配是否将作为输出结果被公布的各种参数标准。在一个示例中,高位可表示可用性度量(例如,是否可公开销售),其它位可表示受欢迎度度量(例如,启发式数据),诸如对匹配参考结果的web搜索和/或观看或下载次数,其它位可指示合辑度量或其它元数据(例如,来源是原版慢速唱片还是合辑专辑),用于销售量数据的位和/或作为排名得分的因子的其它标准使用。
在一个实施例中,可基于指纹识别或维度值之间的相关程度对所得匹配(例如,匹配参考音频样本)进行排名,并且然后可基于上述参数/度量的集合对排名的匹配进行评分。
在另一实施例中,方法流程可在指派相应排名得分之后通过连续将探针音频样本与多个参考音频样本进行比较来继续,以确定所述多个匹配参考音频样本当中比初始识别排名更高的匹配,和/或修改已经指派的排名得分。例如,可进一步匹配探针样本的附加部分,以便生成另外的匹配参考和/或在针对匹配的比较中识别附加特征/维度。尽管来自样本的初始量的第一匹配集合可识别多个匹配,但是探针样本的更多量可强化或减弱已经确定的匹配以及发现附加匹配。例如,如果发现附加匹配,则可针对保留的匹配减弱或降低参数,和/或从以比利用探针样本的先前部分所出现的更少特征中,针对匹配阈值降低匹配排名。例如,在附加结果降低匹配的强度的情况下(例如,音频混音或其它更改的记录和/或类似媒体),所述参数可或多或少地应用于保留的匹配结果。因此,通过保留初始结果免于被输出,具有最高得分排名的一个或多个匹配参考可响应于进一步的比较分析而输出,并且具有更高的置信度水平。
现在参照图7,图示出了依据本公开所描述的各个方面的匹配系统的示例方法700。在附图标记702处,方法700包括经由处理器接收探针音频样本的第一部分。例如,第一部分可从接收探针样本的时间量和/或足以使匹配操作进行的探针样本的量(例如,1/50的媒体内容、1/50秒、检测到的特征向量的数量等)来确定。
在704,将探针样本的第一部分与多个参考音频样本进行比较以识别多个匹配参考音频样本。在706,识别满足足够匹配阈值的一个或多个匹配参考音频样本。
在708,基于参数集合对满足足够匹配阈值的匹配参考音频样本进行评分。
在710,保留匹配参考音频样本使其不输出。在一个实施例中,具有超过排名或得分阈值的相应指派的排名得分的那些参考可被设定为立即公布而不保留,而其它参考在公布之前被保留,以便于接收另外的数据和/或发生另外的匹配操作(诸如,探针样本的附加部分或量)。在另一实施例中,在匹配参考样本被保留一定时间之后,可设定公布预定义数量的匹配参考结果(例如,匹配音频样本结果)。另外地或另选地,在输出具有超过排名阈值的相应排名得分的匹配参考音频样本的预定义量的时间之后,所述方法可通过输出被保留的具有相应指派的排名得分的多个匹配参考音频样本或者不进一步保留发现的匹配来继续,这可确保初始公布最佳匹配以用于输出。
708处的动作可进一步参照图8的方法800来继续。在802,高于或满足得分阈值(基于上述参数确定)的被保留(例如,被数据仓库或其它存储器保留)的匹配参考音频样本可被公布。在804,可生成比较以用于将探针音频样本的第二部分与多个参考音频样本进行匹配以识别任何附加匹配参考音频样本,和/或加强/减弱保留的匹配参考结果。可基于进一步的比较以及用于保留的匹配参考音频样本的参数集合并且还利用从探针样本的第二部分识别的任何附加匹配参考音频样本来连续地或迭代地重新评估排名得分。在806,可基于重新评估的排名得分将保留的匹配公布和/或立即公布附加匹配结果。在一个示例中,比集合的其它匹配参考音频样本更大地满足得分阈值的匹配参考音频样本的子集(所述集合包括保留的匹配结果和附加匹配参考音频样本)可作为输出被公布。随后,不必保留另外的匹配结果,以使得生成匹配的探针样本的附加部分可立即作为输出被公布,而无需任何保留或存留。另选地,另外的结果可继续被保留并且通过与任何附加匹配的比较来重新评估。匹配参考音频样本和附加匹配参考音频样本,
示例性联网和分布式环境
本领域普通技术人员可以理解,本文所述的各种实施例可结合任何计算机或者其它客户端或服务器装置来实现,其可作为计算机网络的一部分来部署或者被部署在分布式计算环境中,并且可连接到任何类型的可找到媒体的数据仓库。在这一点上,本文所述的各种实施例可在具有任何数量的存储器或存储单元以及跨任何数量的存储单元发生的任何数量的应用和进程的任何计算机系统或环境中实现。这包括(但不限于)服务器计算机和客户端计算机部署在具有远程或本地存储的网络环境或分布式计算环境中的环境。
分布式计算通过计算装置和系统之间的通信交换来提供计算机资源和服务的共享。这些资源和服务包括信息的交换、对诸如文件的对象的高速缓存和盘存储。这些资源和服务还包括多个处理单元之间的处理能力的共享以用于负载平衡、资源扩展、处理专门化、等等。分布式计算利用了网络连接,从而允许客户端利用它们的集体力量来使整个企业受益。在这一点上,各种装置可具有可参与如针对本公开的各种实施例所述的机制的应用、对象或资源。
图9提供了示例性联网或分布式计算环境的示意图。该分布式计算环境包括计算对象910、912等以及计算对象或装置920、922、924、926、928等,其可包括如应用930、932、934、936、938所表示的程序、方法、数据仓库、可编程逻辑等。可以理解,计算对象99、912等以及计算对象或装置920、922、924、926、928等可包括不同的装置,诸如个人数字助理(PDA)、音频/视频装置、移动电话、MP3播放器、个人计算机、平板、膝上型计算机等。
每个计算对象910、912等和计算对象或装置920、922、924、926、928等可经由通信网络940直接或间接地与一个或多个其它计算对象910、912等和计算对象或装置920、922、924、926、928等通信。即使在图9中被示出为单个元件,网络940也可包括向图9的系统提供服务的其它计算对象和计算装置,和/或可表示未示出的多个互连网络。每个计算对象910、912等或计算对象或装置920、922、924、926、928等还可包含可利用API或其它对象、软件、固件和/或硬件的适合于与本公开的各种实施例通信或者实现本公开的各种实施例的应用,诸如应用930、932、934、936、938。
存在支持分布式计算环境的各种系统、组件和网络配置。例如,计算系统可由有线或无线系统、本地网络或者广泛分布的网络连接在一起。当前,许多网络被耦接至互联网,互联网为广泛分布的计算提供了基础结构并且涵盖许多不同的网络,但是任何网络基础结构可用于发生在各种实施例中所描述的系统的示例性通信。
因此,可采用诸如客户端/服务器、对等、或混合架构之类的网络拓扑和网络基础结构的主机。“客户端”是使用与它无关的另一类或组的服务的一类或组中的成员。客户端可以是进程,例如大致上是请求由另一程序或进程提供的服务的指令或任务集合。客户端可以是或者可以使用利用所请求的服务,而不必“知道”关于其它程序或服务本身的任何工作细节的进程。
在客户端/服务器架构中,尤其是联网的系统中,客户端通常是访问另一计算机(例如,服务器)所提供的共享网络资源的计算机。在图9的例示中,作为非限制性示例,计算对象或装置920、922、924、926、928等可被认为是客户端,并且计算对象99、912等可被认为是服务器,其中计算对象910、912等提供数据服务,例如从客户端计算对象或装置920、922、924、926、928等接收数据、存储数据、处理数据、向客户端计算对象或装置920、922、924、926、928等传送数据,但是任何计算机可被视为客户端、服务器或这二者,这取决于环境。
服务器通常是可通过诸如互联网或无线网络基础结构的远程网络或本地网络来访问的远程计算机系统。客户端进程可在第一计算机系统中活动,而服务器进程可在第二计算机系统中活动,它们通过通信介质彼此通信,因此提供分布式功能并且允许多个客户端利用服务器的信息收集能力。
在通信网络/总线940为例如互联网的网络环境中,计算对象910、912等可以是客户端计算对象或装置920、922、924、926、928等经由诸如超文本传输协议(HTTP)的多种已知协议中的任一种与其通信的Web服务器。对象910、912等也可担当客户端计算对象或装置920、922、924、926、928等,这可为分布式计算环境的特性。
示例性计算装置
如所述,有利的是,本文所述的技术可应用于适合于实现本文所述的各种实施例的任何装置。可以想到结合各种实施例使用所有类型的手持式、便携式和其它计算装置和计算对象,例如,在装置可能希望从数据仓库读取事务或者将事务写到数据仓库的任何地方。因此,下面在图10中描述的以下通用远程计算机仅是计算装置的一个示例。
尽管未要求,实施例可部分地经由操作系统来实现,以供装置或对象的服务开发者使用和/或被包括在操作以执行本文所述的各种实施例的一个或多个功能方面的应用软件内。软件可以在由诸如客户端工作站、服务器或其它装置的一个或多个计算机执行的诸如程序模块的计算机可执行指令的通用上下文中描述。本领域技术人员将理解,计算机系统具有可用于传递数据的各种配置和协议,并且因此,特定配置或协议均不应被视为限制性的。
图10因此图示出了可实现本文所述的实施例的一个或多个方面的合适的计算系统环境1000的示例,尽管如上已清楚,计算系统环境1000仅是合适的计算环境的一个示例,而并非意在对使用范围或功能提出任何限制。也不应该将计算环境1000解释为具有与示例性操作环境1000中所示的任一组件或其组合有关的任何依赖性或要求。
参照图10,用于实现一个或多个实施例的示例性远程装置包括计算机1010形式的通用计算装置。计算机1010的组件可包括(但不限于)处理单元1020、系统存储器1030以及将包括系统存储器的各种系统组件耦接至处理单元1020的系统总线1022。
计算机1010包括各种计算机可读介质,并且可以是可由计算机1010访问的任何可用介质。系统存储器1030可包括易失性和/或非易失性存储器(诸如,只读存储器(ROM)和/或随机存取存储器(RAM))形式的计算机存储介质。作为示例而非限制,存储器1030还可包括操作系统、应用程序、其它程序模块和程序数据。
用户可通过输入装置1040向计算机1010中录入命令和信息。监视器或其它类型的显示装置也经由接口(诸如,输出接口1050)连接到系统总线1022。除了监视器之外,计算机还可包括诸如扬声器和打印机的其它外围输出装置,它们可通过输出接口1050连接。
计算机1010可使用到一个或多个其它远程计算机(诸如,远程计算机1070)的逻辑连接来在联网或分布式环境中操作。远程计算机1070可以是个人计算机、服务器、路由器、网络PC、对等装置或者其它常见的网络节点,或者任何其它远程媒体消费或传输装置,并且可包括上面关于计算机1010所描述的任何或所有元件。图10中所描绘的逻辑连接包括诸如局域网(LAN)或广域网(WAN)的网络1072,但是也可包括其它网络/总线。这些联网环境在家庭、办公室、企业范围的计算机网络、内联网和互联网中是常见的。
如上所述,尽管结合各种计算装置和网络架构描述了示例性实施例,但是基本概念可应用于期望以灵活的方式发布或消费媒体的任何网络系统和任何计算装置或系统。
本文中使用词语“示例性”来表示充当示例、实例或例示。为避免疑惑,本文所公开的主题不限于这些示例。另外,本文中被描述为“示例性”的任何方面或设计并非必然被解释为与其它方面或设计相比是优选或有利的,也不意味着排除本领域普通技术人员已知的等效示例性结构和技术。此外,在具体实施方式或权利要求书中使用术语“包括”、“具有”、“包含”和其它类似词语的方面,为避免疑惑,这些术语旨在以类似于术语“包括”的方式是包含性的,作为开放的过渡词而不排除任何附加或其它元素。
计算装置通常包括各种介质,其可包括计算机可读存储介质。计算机可读存储介质可以是能够被计算机访问的任何可用存储介质,通常是非瞬时性的,并且可包括易失性和非易失性介质、可移动和不可移动介质二者。作为示例而非限制,计算机可读存储介质可结合用于存储信息的任何方法或技术来实现,诸如计算机可读指令、程序模块、结构化数据或非结构化数据。计算机可读存储介质可包括(但不限于)RAM、ROM、EEPROM、闪速存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储装置、磁带盒、磁带、磁盘存储装置或者其它磁存储装置、或者可用于存储期望的信息的其它有形和/或非瞬时性介质。计算机可读存储介质可由一个或多个本地或远程计算装置来访问(例如,经由访问请求、查询或者其它数据检索协议)以用于相对于由介质存储的信息的各种操作。
如所述,本文所述的各种技术可结合硬件或软件或者在适当的时候以二者的组合来实现。如本文所用,术语“组件”、“系统”等同样旨在表示计算机相关实体,无论是硬件、硬件和软件的组合、软件或者执行中的软件。例如,组件可以是(但不限于是)在处理器上运行的进程、处理器、对象、可执行代码、执行线程、程序和/或计算机。作为例示,在计算机上运行的应用和计算机二者均可以是组件。一个或多个组件可驻留于进程和/或执行线程内,并且组件可位于一个计算机上和/或分布于两个或更多个计算机之间。另外,组件可采取以下形式:专门设计的硬件;通用硬件,通过在其上执行软件来将其专门化,所述软件使得该硬件能够执行特定功能(例如,编码和/或解码);存储在计算机可读介质上的软件;或其组合。
已针对若干组件之间的交互描述了上述系统。可以理解,这些系统和组件可包括那些组件或指定的子组件、某些指定的组件或子组件和/或附加组件,以及根据上述内容的各种排列和组合。子组件还可被实现为通信地耦接至其它组件的组件,而不是被包括在父组件内(层次)。另外,需要注意的是,一个或多个组件可被组合成提供聚合功能的单个组件,或者被分成若干单独的子组件,并且可提供任一个或多个中间层(诸如,管理层)以通信地耦接至这些子组件,以便提供集成功能。本文所述的任何组件也可与本文未具体描述但是本领域技术人员通常已知的一个或多个其它组件交互。
鉴于上述示例性系统,可依据所述主题实现的方法将参照各附图的流程图来更好地理解。尽管为了说明简洁起见,以一系列方框示出和描述了方法,但是要求保护的主题受所述方框的顺序的限制,因为一些方框可按照与本文所描绘和描述的不同的顺序进行和/或与其它方框同时进行。尽管经由流程图示出了非顺序或分支的流程,可以理解,可实现达到相同或相似结果的各种其它分支、流程路径和方框顺序。此外,实现下面所述的方法并非要求所有示出的方框。
除了本文所述的各种实施例以外,将理解,可使用其它类似实施例,或者可在不背离的情况下对所描述的实施例进行修改和添加以便执行对应实施例的相同或等同功能。另外,多个处理芯片或多个装置可共享本文所述的一个或多个功能的执行,并且类似地,可跨多个装置进行存储。因此,本发明不限于任何单个实施例,而是应当依据所附权利要求书的广度、精神和范围来解释。
Claims (21)
1.一种方法,所述方法包括:
使用处理器执行存储在非暂时性计算机可读介质上的计算机可执行指令以执行操作,所述操作包括:
从音频流系统接收探针音频样本;
基于所述探针音频样本的第一部分与参考音频样本的第一比较,识别足够匹配参考音频样本;以及
响应于确定所述足够匹配参考音频样本不满足预定得分阈值:
保留所述足够匹配参考音频样本;
基于所述探针音频样本的第二部分与所述参考音频样本的第二比较,识别附加匹配参考音频样本;以及
基于所述第一比较和所述第二比较,输出所述参考音频样本中的至少一个。
2.根据权利要求1所述的方法,进一步包括:
基于所述第一比较给所述足够匹配参考音频样本指派第一相应排名得分,其中所述第一比较包括所述探针音频样本的所述第一部分的特征向量与所述参考音频样本的相应第一特征向量的比较;
基于所述第二比较给所述附加匹配参考音频样本指派第二相应排名得分,其中所述第二比较包括所述探针音频样本的所述第二部分的特征向量与所述参考音频样本的相应第二特征向量的比较;
使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本;以及
基于加权第一排名得分集合和加权第二排名得分集合输出所述参考音频样本中的至少一个。
3.根据权利要求2所述的方法,其中,使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本包括:
更新所述足够匹配参考音频样本的排名得分。
4.根据权利要求2所述的方法,其中,使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本包括:
向所述足够匹配参考音频样本添加来自所述附加匹配参考音频样本的匹配。
5.根据权利要求2所述的方法,进一步包括:
输出预定义数量的具有相应的最高的所指派的排名得分的匹配参考音频样本。
6.根据权利要求2所述的方法,进一步包括:
输出所述足够匹配参考音频样本中具有超过所定义排名阈值的相应的所指派的排名得分的个体。
7.根据权利要求2所述的方法,其中基于所述加权第一排名得分集合和所述加权第二排名得分集合输出所述参考音频样本中的所述至少一个包括:
响应于用于匹配参考音频样本的时间量的流逝,输出所述足够匹配参考音频样本中的至少一个。
8.根据权利要求1所述的方法,其中基于所述探针音频样本的所述第一部分与参考音频样本的所述第一比较,识别足够匹配参考音频样本包括:
生成所述探针音频样本的所述第一部分的指纹,其中所述探针音频样本的所述第一部分是所述探针音频样本的时间片段;以及
识别与所述探针音频样本的所述第一部分的所述指纹匹配达至少所定义的匹配阈值的所述参考音频样本的时间片段的相应指纹。
9.根据权利要求8所述的方法,进一步包括:
丢弃具有不满足附加阈值的相应第二一致性得分的一些所述足够匹配参考音频样本。
10.一种系统,所述系统包括:
接收组件,所述接收组件被配置为从音频流服务接收探针音频样本;
比较组件,所述比较组件被配置为比较所述探针音频样本的第一部分与参考音频样本;
匹配组件,所述匹配组件被配置为基于所述探针音频样本的所述第一部分的特征向量与所述参考音频样本的相应第一特征向量的第一比较,识别足够匹配参考音频样本;
保留组件,所述保留组件被配置为基于确定所述足够匹配参考音频样本均不满足预定得分阈值保留所述足够匹配参考音频样本,
所述比较组件被进一步配置为:
基于所述探针音频样本的第二部分的特征向量与所述参考音频样本的第二特征向量的第二比较,识别附加匹配参考音频样本;以及
评分组件,所述评分组件被配置为基于所述第一比较和所述第二比较,输出所述参考音频样本中的至少一个。
11.根据权利要求10所述的系统,进一步包括:
排名组件,所述排名组件被配置为:
基于所述第一比较给所述足够匹配参考音频样本指派第一相应排名得分;以及
基于所述第二比较给所述附加匹配参考音频样本指派第二相应排名得分,以及
其中所述评分组件被进一步配置为:
使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本;以及
其中所述评分组件被进一步配置为:
基于加权第一排名得分集合和加权第二排名得分集合输出所述参考音频样本中的至少一个。
12.根据权利要求11所述的系统,其中,使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本包括:
更新所述足够匹配参考音频样本的排名得分。
13.根据权利要求11所述的系统,其中,使用所述第一相应排名得分和所述第二相应排名得分更新所述足够匹配参考音频样本包括:
向所述足够匹配参考音频样本添加来自所述附加匹配参考音频样本的匹配。
14.根据权利要求11所述的系统,其中所述第一相应排名得分或所述第二相应排名得分是基于由以下各项组成的组中的至少一项而生成的:所述相应匹配参考音频样本是否各自可用于销售、所述足够匹配参考音频样本的相应受欢迎度程度、相应匹配参考音频样本是来自原版专辑还是合辑专辑、以及所述足够匹配参考音频样本的相应销售量。
15.根据权利要求11所述的系统,进一步包括:
合并组件,所述合并组件将所述足够匹配参考音频样本与至少一个附加匹配参考音频样本合并,所述至少一个附加匹配参考音频样本根据与所述音频流内容的第二时间片段的足够匹配而具有第二排名得分。
16.根据权利要求10所述的系统,其中,所述保留组件基于预定参数集合来保留所述足够匹配参考音频样本,所述预定参数集合包括比较操作的时间或者所比较的音频流内容的量中的至少一个。
17.根据权利要求10所述的系统,其中所述评分组件被进一步配置为丢弃具有不满足附加阈值的第二一致性得分的所述足够匹配参考音频样本。
18.一种包括计算机可执行指令的非暂时性计算机可读存储介质,所述计算机可执行指令响应于执行而使得包括处理器的计算系统执行操作,所述操作包括:
接收探针样本;
比较所述探针样本的第一部分与参考样本,以基于所述探针样本的所述第一部分的特征向量与所述参考样本的相应第一特征向量的第一比较来识别足够匹配参考样本;
响应于确定所述足够匹配参考样本均不满足预定得分阈值:
保留所述足够匹配参考样本;以及
比较所述探针样本的第二部分与所述参考样本,以基于所述探针样本的所述第二部分的特征向量与所述参考样本的第二特征向量的第二比较来识别附加匹配参考样本;以及
基于所述第一比较和所述第二比较,输出所述参考样本中的至少一个。
19.根据权利要求18所述的非暂时性计算机可读存储介质,其中所述探针样本是音频探针样本,所述参考样本是参考音频样本,并且所述特征向量包括音频指纹。
20.根据权利要求18所述的非暂时性计算机可读存储介质,其中所述探针样本是文本探针样本,所述参考样本是参考音频样本,并且所述特征向量包括各种字的字数。
21.一种方法,所述方法包括:
使用处理器执行存储在计算机可读介质上的计算机可执行指令以执行以下动作:
经由所述处理器接收探针音频样本的第一部分;
将所述第一部分与多个参考音频样本进行比较以识别多个匹配参考音频样本;
识别满足足够匹配阈值的多个匹配参考音频样本;
基于参数集合对满足所述足够匹配阈值的所述匹配参考音频样本进行评分;以及
保留所述匹配参考音频样本免于被输出,其中所保留的所述匹配参考音频样本不满足基于所述参数集合的预定得分阈值;
生成所述探针音频样本的第二部分与所述多个参考音频样本的比较以识别任何附加匹配参考音频样本;
基于与从所述探针样本的所述第二部分所识别的所述任何附加匹配参考音频样本的进一步比较并且基于所保留的匹配参考音频样本的所述参数集合,迭代地重新评估所保留的匹配参考音频样本的得分,以确定所保留的匹配参考音频样本和所述附加匹配参考音频样本的得分;以及
输出所保留的匹配参考音频样本和所述附加匹配参考音频样本的子集作为匹配,所述匹配比该集合中的其它匹配参考音频样本更大地满足所述预定得分阈值。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/732,108 | 2012-12-31 | ||
US13/732,108 US9529907B2 (en) | 2012-12-31 | 2012-12-31 | Hold back and real time ranking of results in a streaming matching system |
CN201380068864.0A CN104885053B (zh) | 2012-12-31 | 2013-12-30 | 流匹配系统中的结果的存留和实时排名 |
PCT/US2013/078205 WO2014106147A2 (en) | 2012-12-31 | 2013-12-30 | Hold back and real time ranking of results in a streaming matching system |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380068864.0A Division CN104885053B (zh) | 2012-12-31 | 2013-12-30 | 流匹配系统中的结果的存留和实时排名 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109446374A true CN109446374A (zh) | 2019-03-08 |
CN109446374B CN109446374B (zh) | 2022-04-08 |
Family
ID=50002861
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811257138.4A Active CN109446374B (zh) | 2012-12-31 | 2013-12-30 | 流匹配系统中的结果的存留和实时排名 |
CN201380068864.0A Active CN104885053B (zh) | 2012-12-31 | 2013-12-30 | 流匹配系统中的结果的存留和实时排名 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380068864.0A Active CN104885053B (zh) | 2012-12-31 | 2013-12-30 | 流匹配系统中的结果的存留和实时排名 |
Country Status (5)
Country | Link |
---|---|
US (3) | US9529907B2 (zh) |
EP (1) | EP2939103B1 (zh) |
JP (2) | JP6185080B2 (zh) |
CN (2) | CN109446374B (zh) |
WO (1) | WO2014106147A2 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9460201B2 (en) * | 2013-05-06 | 2016-10-04 | Iheartmedia Management Services, Inc. | Unordered matching of audio fingerprints |
US10289971B2 (en) * | 2015-02-13 | 2019-05-14 | Atlassian Pty Ltd | Issue and trigger rebalancing in a ranked issue management system |
US11823658B2 (en) * | 2015-02-20 | 2023-11-21 | Sri International | Trial-based calibration for audio-based identification, recognition, and detection system |
CN104991946B (zh) * | 2015-07-13 | 2021-04-13 | 联想(北京)有限公司 | 一种信息处理方法、服务器和用户设备 |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
US10713296B2 (en) | 2016-09-09 | 2020-07-14 | Gracenote, Inc. | Audio identification based on data structure |
US10803119B2 (en) * | 2017-01-02 | 2020-10-13 | Gracenote, Inc. | Automated cover song identification |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
WO2020242434A1 (en) * | 2019-05-24 | 2020-12-03 | Google Llc | Method and device for navigating two or more users to a meeting location |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US10827028B1 (en) | 2019-09-05 | 2020-11-03 | Spotify Ab | Systems and methods for playing media content on a target device |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11373657B2 (en) * | 2020-05-01 | 2022-06-28 | Raytheon Applied Signal Technology, Inc. | System and method for speaker identification in audio data |
CN111641898B (zh) * | 2020-06-08 | 2021-12-03 | 京东方科技集团股份有限公司 | 发声装置、显示装置、发声控制方法及装置 |
US11315545B2 (en) | 2020-07-09 | 2022-04-26 | Raytheon Applied Signal Technology, Inc. | System and method for language identification in audio data |
US12020697B2 (en) | 2020-07-15 | 2024-06-25 | Raytheon Applied Signal Technology, Inc. | Systems and methods for fast filtering of audio keyword search |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020083060A1 (en) * | 2000-07-31 | 2002-06-27 | Wang Avery Li-Chun | System and methods for recognizing sound and music signals in high noise and distortion |
US20070192305A1 (en) * | 2006-01-27 | 2007-08-16 | William Derek Finley | Search term suggestion method based on analysis of correlated data in three dimensions |
CN101569092A (zh) * | 2006-12-21 | 2009-10-28 | 皇家飞利浦电子股份有限公司 | 用于处理音频数据的系统 |
US20090282218A1 (en) * | 2005-10-26 | 2009-11-12 | Cortica, Ltd. | Unsupervised Clustering of Multimedia Data Using a Large-Scale Matching System |
US20110276157A1 (en) * | 2010-05-04 | 2011-11-10 | Avery Li-Chun Wang | Methods and Systems for Processing a Sample of a Media Stream |
US20120059845A1 (en) * | 2005-11-29 | 2012-03-08 | Google Inc. | Detecting Repeating Content In Broadcast Media |
CN102405495A (zh) * | 2009-03-11 | 2012-04-04 | 谷歌公司 | 使用稀疏特征对信息检索进行音频分类 |
US20120331386A1 (en) * | 1999-06-28 | 2012-12-27 | Gracenote, Inc. | System and method for providing acoustic analysis data |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7013301B2 (en) * | 2003-09-23 | 2006-03-14 | Predixis Corporation | Audio fingerprinting system and method |
GB9918611D0 (en) * | 1999-08-07 | 1999-10-13 | Sibelius Software Ltd | Music database searching |
WO2001031627A2 (en) * | 1999-10-28 | 2001-05-03 | Canon Kabushiki Kaisha | Pattern matching method and apparatus |
US6545209B1 (en) * | 2000-07-05 | 2003-04-08 | Microsoft Corporation | Music content characteristic identification and matching |
US7853664B1 (en) * | 2000-07-31 | 2010-12-14 | Landmark Digital Services Llc | Method and system for purchasing pre-recorded music |
WO2003009277A2 (en) * | 2001-07-20 | 2003-01-30 | Gracenote, Inc. | Automatic identification of sound recordings |
CN1708758A (zh) * | 2002-11-01 | 2005-12-14 | 皇家飞利浦电子股份有限公司 | 改进的音频数据指纹搜索 |
US7580921B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7516074B2 (en) * | 2005-09-01 | 2009-04-07 | Auditude, Inc. | Extraction and matching of characteristic fingerprints from audio signals |
KR100735820B1 (ko) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 |
US20070266001A1 (en) * | 2006-05-09 | 2007-11-15 | Microsoft Corporation | Presentation of duplicate and near duplicate search results |
US20070282860A1 (en) * | 2006-05-12 | 2007-12-06 | Marios Athineos | Method and system for music information retrieval |
CN101553799B (zh) * | 2006-07-03 | 2012-03-21 | 英特尔公司 | 用于快速音频搜索的方法和设备 |
US8364669B1 (en) * | 2006-07-21 | 2013-01-29 | Aol Inc. | Popularity of content items |
US20080168045A1 (en) * | 2007-01-10 | 2008-07-10 | Microsoft Corporation | Content rank |
US8266142B2 (en) * | 2007-06-06 | 2012-09-11 | Dolby Laboratories Licensing Corporation | Audio/Video fingerprint search accuracy using multiple search combining |
JP4645653B2 (ja) * | 2008-01-15 | 2011-03-09 | 日本電気株式会社 | 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法 |
US8344233B2 (en) | 2008-05-07 | 2013-01-01 | Microsoft Corporation | Scalable music recommendation by search |
JP2011040116A (ja) * | 2009-08-06 | 2011-02-24 | Jvc Kenwood Holdings Inc | 情報取得システム、情報取得装置、および情報取得方法 |
US8584198B2 (en) | 2010-11-12 | 2013-11-12 | Google Inc. | Syndication including melody recognition and opt out |
US20120124172A1 (en) | 2010-11-15 | 2012-05-17 | Google Inc. | Providing Different Versions of a Media File |
US8805090B1 (en) * | 2012-02-07 | 2014-08-12 | Google Inc. | Matching based upon rank |
-
2012
- 2012-12-31 US US13/732,108 patent/US9529907B2/en active Active
-
2013
- 2013-12-30 CN CN201811257138.4A patent/CN109446374B/zh active Active
- 2013-12-30 CN CN201380068864.0A patent/CN104885053B/zh active Active
- 2013-12-30 WO PCT/US2013/078205 patent/WO2014106147A2/en active Application Filing
- 2013-12-30 JP JP2015550828A patent/JP6185080B2/ja active Active
- 2013-12-30 EP EP13824453.8A patent/EP2939103B1/en active Active
-
2016
- 2016-11-10 US US15/348,776 patent/US9754026B2/en active Active
-
2017
- 2017-07-25 JP JP2017143317A patent/JP6449386B2/ja active Active
- 2017-08-29 US US15/689,092 patent/US10120934B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120331386A1 (en) * | 1999-06-28 | 2012-12-27 | Gracenote, Inc. | System and method for providing acoustic analysis data |
US20020083060A1 (en) * | 2000-07-31 | 2002-06-27 | Wang Avery Li-Chun | System and methods for recognizing sound and music signals in high noise and distortion |
CN1592906A (zh) * | 2000-07-31 | 2005-03-09 | 沙扎姆娱乐有限公司 | 用于在强噪声和失真下识别声音和音乐信号的系统和方法 |
US20090282218A1 (en) * | 2005-10-26 | 2009-11-12 | Cortica, Ltd. | Unsupervised Clustering of Multimedia Data Using a Large-Scale Matching System |
US20120059845A1 (en) * | 2005-11-29 | 2012-03-08 | Google Inc. | Detecting Repeating Content In Broadcast Media |
US20070192305A1 (en) * | 2006-01-27 | 2007-08-16 | William Derek Finley | Search term suggestion method based on analysis of correlated data in three dimensions |
CN101569092A (zh) * | 2006-12-21 | 2009-10-28 | 皇家飞利浦电子股份有限公司 | 用于处理音频数据的系统 |
CN102405495A (zh) * | 2009-03-11 | 2012-04-04 | 谷歌公司 | 使用稀疏特征对信息检索进行音频分类 |
US20110276157A1 (en) * | 2010-05-04 | 2011-11-10 | Avery Li-Chun Wang | Methods and Systems for Processing a Sample of a Media Stream |
Also Published As
Publication number | Publication date |
---|---|
WO2014106147A3 (en) | 2014-09-12 |
JP6185080B2 (ja) | 2017-08-23 |
JP6449386B2 (ja) | 2019-01-09 |
JP2017191618A (ja) | 2017-10-19 |
US10120934B2 (en) | 2018-11-06 |
US9529907B2 (en) | 2016-12-27 |
JP2016509290A (ja) | 2016-03-24 |
US9754026B2 (en) | 2017-09-05 |
CN104885053A (zh) | 2015-09-02 |
EP2939103B1 (en) | 2019-03-06 |
CN104885053B (zh) | 2018-11-27 |
WO2014106147A2 (en) | 2014-07-03 |
EP2939103A2 (en) | 2015-11-04 |
US20140185815A1 (en) | 2014-07-03 |
EP2939103A4 (en) | 2016-07-06 |
US20170357718A1 (en) | 2017-12-14 |
US20170061002A1 (en) | 2017-03-02 |
CN109446374B (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104885053B (zh) | 流匹配系统中的结果的存留和实时排名 | |
Zangerle et al. | Evaluating recommender systems: survey and framework | |
US9928526B2 (en) | Methods and systems that predict future actions from instrumentation-generated events | |
US8060497B1 (en) | Framework for evaluating web search scoring functions | |
WO2022252363A1 (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN109804428A (zh) | 计算代理的合成语音选择 | |
Wu | Service Computing: Concept, Method and Technology | |
JP2023515556A (ja) | 機械学習技術を用いた通信ワークフローのための強化された処理 | |
US9165075B2 (en) | Managing user ratings in a web services environment | |
Corbellini et al. | An architecture and platform for developing distributed recommendation algorithms on large-scale social networks | |
US9146989B2 (en) | Analytic comparison of libraries and playlists | |
US9299331B1 (en) | Techniques for selecting musical content for playback | |
US20180189709A1 (en) | System and method for analyzing media for talent discovery | |
KR20140091577A (ko) | 컨텐츠의 유사성 및 관련성 | |
JP5430960B2 (ja) | コンテンツ分類装置、方法及びプログラム | |
Rai et al. | Using open source intelligence as a tool for reliable web searching | |
US20200327477A1 (en) | System and method for analyzing media for talent discovery | |
Santhosh et al. | Telemetry and analytics best practices and lessons learned | |
Huang et al. | A Comprehensive Survey on Retrieval Methods in Recommender Systems | |
CN111026973B (zh) | 一种商品兴趣度预测方法、装置及电子设备 | |
Alkan et al. | WaPUPS: Web access pattern extraction under user-defined pattern scoring | |
Mortensen | Design and evaluation of a recommender system | |
AU2018297311A1 (en) | System and method for analyzing media for talent discovery | |
Ludwig et al. | Selection algorithm for grid services based on a quality of service metric | |
Suarez Mariscal et al. | Assessing Explainable Recommendations from Knowledge Graph-based in an International Streaming Platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |