JP2016509290A5 - - Google Patents

Download PDF

Info

Publication number
JP2016509290A5
JP2016509290A5 JP2015550828A JP2015550828A JP2016509290A5 JP 2016509290 A5 JP2016509290 A5 JP 2016509290A5 JP 2015550828 A JP2015550828 A JP 2015550828A JP 2015550828 A JP2015550828 A JP 2015550828A JP 2016509290 A5 JP2016509290 A5 JP 2016509290A5
Authority
JP
Japan
Prior art keywords
reference audio
audio samples
time segment
scores
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015550828A
Other languages
English (en)
Other versions
JP6185080B2 (ja
JP2016509290A (ja
Filing date
Publication date
Priority claimed from US13/732,108 external-priority patent/US9529907B2/en
Application filed filed Critical
Publication of JP2016509290A publication Critical patent/JP2016509290A/ja
Publication of JP2016509290A5 publication Critical patent/JP2016509290A5/ja
Application granted granted Critical
Publication of JP6185080B2 publication Critical patent/JP6185080B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (19)

  1. プロセッサを使用するステップであって、コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を実行して、
    オーディオストリーミングシステムから、プローブオーディオサンプルを受信するステップと、
    第1のセットの整合性スコアに基づいて、複数の十分に一致しているリファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第1のセットの整合性スコアが前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
    前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定するステップと、
    前記十分に一致しているリファレンスオーディオサンプルを保持するステップと、
    前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てるステップと、
    第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
    前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるステップと、
    前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするステップと、
    前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するステップと
    含む動作を実行するためにプロセッサを使用するステップを含む、方法。
  2. 定義済みのランキング閾値を超過しているそれぞれの割り当てられたランキングスコアを有する前記一致リファレンスオーディオサンプルのうちの1つを出力するステップをさらに含む、請求項1に記載の方法。
  3. 前記定義済みのランキング閾値を超過しているランキングスコアのそれぞれを有する前記一致リファレンスオーディオサンプルのうちの1つを出力するステップの定義済みの時間量の後に、それぞれの割り当てられたランキングスコアを有する前記複数の一致リファレンスオーディオサンプルを出力するステップをさらに含む、請求項2に記載の方法。
  4. 前記定義済みの時間量は、受信された前記プローブオーディオサンプルの分量に基づく、請求項3に記載の方法。
  5. 前記少なくとも1つの一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの前記第1のタイムセグメント前記リファレンスオーディオサンプルの前記対応するタイムセグメントと比較するステップは、
    前記プローブオーディオサンプルの前記第1のタイムセグメントのフィンガープリントを生成するステップと、
    少なくとも定義済みの一致しているモノの閾値によって前記プローブオーディオサンプルの前記第1のタイムセグメントの前記フィンガープリントに一致している前記リファレンスオーディオサンプルの前記対応するタイムセグメントのそれぞれのフィンガープリントを特定するステップとを含む、請求項1に記載の方法。
  6. 前記ランキングスコアのそれぞれは、
    前記一致リファレンスオーディオサンプルのそれぞれが販売のために個々に利用可能であるかどうかを示すそれぞれの利用可能性の評価尺度と、
    前記一致リファレンスオーディオサンプルのそれぞれの人気を示すそれぞれの人気の評価尺度と、
    前記一致リファレンスオーディオサンプルのそれぞれがオリジナルアルバムであるかまたはコンピレーションアルバムであるかを示すそれぞれのコンピレーションの評価尺度と、
    前記一致リファレンスオーディオサンプルのそれぞれの販売量を示すそれぞれの販売の評価尺度と
    からなるグループのうちの少なくとも1つに基づいて、生成される、請求項1に記載の方法。
  7. 前記ランキングスコアのそれぞれは、各々が対応する評価尺度の重要度に基づいて最上位から最下位ビット位置を占めるビットのセットを含むコンポーネントのセットを含むビットベクトルのシーケンスを含む、請求項6に記載の方法。
  8. 前記それぞれの人気の評価尺度は、前記一致リファレンスオーディオサンプルのそれぞれに関連した少なくとも1つのパラメータに関連付けられたヒューリスティックから生成される、請求項6に記載の方法。
  9. システムであって、
    コンピュータ実行可能コンポーネントを記憶するメモリと、
    前記メモリに記憶されているコンピュータ実行可能コンポーネントを実行するマイクロプロセッサであって、前記コンピュータ実行可能コンポーネントは、
    オーディオストリーミングサービスから、プローブオーディオサンプルを受信する、受信コンポーネントと、
    前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較する、比較コンポーネントと、
    前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成された第1のセットの整合性スコアに基づいて複数の十分に一致しているリファレンスオーディオサンプルを特定する、照合コンポーネントと、
    前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定し、前記十分に一致しているリファレンスオーディオサンプルを保持する、保持コンポーネントと、
    前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てる、ランク付けコンポーネントと、
    前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするように構成される、スコア決定コンポーネントを含み、
    前記比較コンポーネントは、第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較することであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントに対応する特徴ベクトルとの間に生成される、比較することを行うようにさらに構成され、
    前記ランク付けコンポーネントは、前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるようにさらに構成され、
    前記スコア決定コンポーネントは、前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するようにさらに構成される、マイクロプロセッサとを備える、システム。
  10. 前記第2のタイムセグメントは、前記オーディオストリーミングコンテンツの前記第1のタイムセグメントを含む、請求項9に記載のシステム。
  11. 前記スコア決定コンポーネントは、どの一致リファレンスオーディオサンプルを前記スコア比較に基づいて出力するかを動的に決定する、請求項9に記載のシステム。
  12. 前記保持コンポーネントは、比較処理の時間、または比較された前記オーディオストリーミングコンテンツの分量のうちの少なくとも1つを含む定義済みのパラメータのセットに基づいて、前記一致リファレンスオーディオサンプルを保持する、請求項9に記載のシステム。
  13. 記ランキングスコアのそれぞれは、前記一致リファレンスオーディオサンプルのそれぞれが販売に関して個々に利用可能であるかどうか、前記一致リファレンスオーディオサンプルのそれぞれの人気、前記一致リファレンスオーディオサンプルのそれぞれがオリジナルアルバムであるかまたはコンピレーションアルバムであるか、および前記一致リファレンスオーディオサンプルのそれぞれの販売量からなるグループのうちの少なくとも1つに基づいて、生成される、請求項9に記載のシステム。
  14. 前記一致リファレンスオーディオサンプルを、前記オーディオストリーミングコンテンツの第2のタイムセグメントと十分に一致しているモノの第2のランキングスコアを有している少なくとも1つの追加の一致リファレンスオーディオサンプルとマージする、マージコンポーネントをさらに含む、請求項9に記載のシステム。
  15. 実行に応じて、プロセッサを備えるコンピューティングシステムに処理を実行させるコンピュータ実行可能命令を含むコンピュータ可読記憶媒体であって、前記処理は、
    オーディオストリーミングシステムから、プローブオーディオサンプルを受信するステップと、
    第1のセットの整合性スコアに基づいて、複数の十分に一致しているリファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第1のセットの整合性スコアが前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
    前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定するステップと、
    前記十分に一致しているリファレンスオーディオサンプルを保持するステップと、
    前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てるステップと、
    第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
    前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるステップと、
    前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするステップと、
    前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するステップとを含む、コンピュータ可読記憶媒体。
  16. それぞれの最高の割り当てられたランキングスコアを有する定義済みの数の一致リファレンスオーディオサンプルを出力するステップをさらに含む、請求項1に記載の方法。
  17. 追加の閾値を満たしていない第2の整合性スコアを有する前記十分に一致しているリファレンスオーディオサンプルを放棄するステップをさらに含む、請求項1に記載の方法。
  18. 前記スコア決定コンポーネントは、それぞれの最高の割り当てられたランキングスコアを有する定義済みの数の一致リファレンスオーディオサンプルを出力するようにさらに構成される、請求項9に記載のシステム。
  19. 前記スコア決定コンポーネントは、追加の閾値を満たしていない第2の整合性スコアを有する前記十分に一致しているリファレンスオーディオサンプルを放棄するようにさらに構成される、請求項9に記載のシステム。
JP2015550828A 2012-12-31 2013-12-30 ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング Active JP6185080B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/732,108 US9529907B2 (en) 2012-12-31 2012-12-31 Hold back and real time ranking of results in a streaming matching system
US13/732,108 2012-12-31
PCT/US2013/078205 WO2014106147A2 (en) 2012-12-31 2013-12-30 Hold back and real time ranking of results in a streaming matching system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017143317A Division JP6449386B2 (ja) 2012-12-31 2017-07-25 ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング

Publications (3)

Publication Number Publication Date
JP2016509290A JP2016509290A (ja) 2016-03-24
JP2016509290A5 true JP2016509290A5 (ja) 2017-01-19
JP6185080B2 JP6185080B2 (ja) 2017-08-23

Family

ID=50002861

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015550828A Active JP6185080B2 (ja) 2012-12-31 2013-12-30 ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング
JP2017143317A Active JP6449386B2 (ja) 2012-12-31 2017-07-25 ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017143317A Active JP6449386B2 (ja) 2012-12-31 2017-07-25 ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング

Country Status (5)

Country Link
US (3) US9529907B2 (ja)
EP (1) EP2939103B1 (ja)
JP (2) JP6185080B2 (ja)
CN (2) CN104885053B (ja)
WO (1) WO2014106147A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460201B2 (en) * 2013-05-06 2016-10-04 Iheartmedia Management Services, Inc. Unordered matching of audio fingerprints
US10289971B2 (en) 2015-02-13 2019-05-14 Atlassian Pty Ltd Issue and trigger rebalancing in a ranked issue management system
US11823658B2 (en) * 2015-02-20 2023-11-21 Sri International Trial-based calibration for audio-based identification, recognition, and detection system
CN104991946B (zh) * 2015-07-13 2021-04-13 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
US9728188B1 (en) * 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
US10713296B2 (en) 2016-09-09 2020-07-14 Gracenote, Inc. Audio identification based on data structure
US10803119B2 (en) * 2017-01-02 2020-10-13 Gracenote, Inc. Automated cover song identification
EP3709194A1 (en) 2019-03-15 2020-09-16 Spotify AB Ensemble-based data comparison
EP3827222B1 (en) * 2019-05-24 2022-07-06 Google LLC Method and device for navigating two or more users to a meeting location
US11094319B2 (en) 2019-08-30 2021-08-17 Spotify Ab Systems and methods for generating a cleaned version of ambient sound
US10827028B1 (en) 2019-09-05 2020-11-03 Spotify Ab Systems and methods for playing media content on a target device
US11308959B2 (en) 2020-02-11 2022-04-19 Spotify Ab Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices
US11373657B2 (en) * 2020-05-01 2022-06-28 Raytheon Applied Signal Technology, Inc. System and method for speaker identification in audio data
US11315545B2 (en) 2020-07-09 2022-04-26 Raytheon Applied Signal Technology, Inc. System and method for language identification in audio data

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7013301B2 (en) * 2003-09-23 2006-03-14 Predixis Corporation Audio fingerprinting system and method
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
GB9918611D0 (en) * 1999-08-07 1999-10-13 Sibelius Software Ltd Music database searching
DE60036486T2 (de) * 1999-10-28 2008-06-12 Canon K.K. Methode und apparat zum prüfen von musterübereinstimmungen
US6545209B1 (en) * 2000-07-05 2003-04-08 Microsoft Corporation Music content characteristic identification and matching
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US7853664B1 (en) * 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
KR20040024870A (ko) * 2001-07-20 2004-03-22 그레이스노트 아이엔씨 음성 기록의 자동 확인
US20060013451A1 (en) * 2002-11-01 2006-01-19 Koninklijke Philips Electronics, N.V. Audio data fingerprint searching
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7516074B2 (en) * 2005-09-01 2009-04-07 Auditude, Inc. Extraction and matching of characteristic fingerprints from audio signals
US8326775B2 (en) * 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
EP1986145A1 (en) * 2005-11-29 2008-10-29 Google Inc. Social and interactive applications for mass media
US20070192305A1 (en) 2006-01-27 2007-08-16 William Derek Finley Search term suggestion method based on analysis of correlated data in three dimensions
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
US20070266001A1 (en) * 2006-05-09 2007-11-15 Microsoft Corporation Presentation of duplicate and near duplicate search results
WO2007133754A2 (en) * 2006-05-12 2007-11-22 Owl Multimedia, Inc. Method and system for music information retrieval
CN101553799B (zh) * 2006-07-03 2012-03-21 英特尔公司 用于快速音频搜索的方法和设备
US8364669B1 (en) * 2006-07-21 2013-01-29 Aol Inc. Popularity of content items
JP2010513974A (ja) * 2006-12-21 2010-04-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データを処理するシステム
US20080168045A1 (en) * 2007-01-10 2008-07-10 Microsoft Corporation Content rank
US8266142B2 (en) * 2007-06-06 2012-09-11 Dolby Laboratories Licensing Corporation Audio/Video fingerprint search accuracy using multiple search combining
JP4645653B2 (ja) * 2008-01-15 2011-03-09 日本電気株式会社 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法
US8344233B2 (en) 2008-05-07 2013-01-01 Microsoft Corporation Scalable music recommendation by search
EP2406787B1 (en) * 2009-03-11 2014-05-14 Google, Inc. Audio classification for information retrieval using sparse features
JP2011040116A (ja) * 2009-08-06 2011-02-24 Jvc Kenwood Holdings Inc 情報取得システム、情報取得装置、および情報取得方法
CN102959543B (zh) * 2010-05-04 2016-05-25 沙扎姆娱乐有限公司 用于处理媒体流的样本的方法和系统
US8584198B2 (en) 2010-11-12 2013-11-12 Google Inc. Syndication including melody recognition and opt out
US20120124172A1 (en) 2010-11-15 2012-05-17 Google Inc. Providing Different Versions of a Media File
US8805090B1 (en) * 2012-02-07 2014-08-12 Google Inc. Matching based upon rank

Similar Documents

Publication Publication Date Title
JP2016509290A5 (ja)
JP5669630B2 (ja) テスト・ケース生成方法、プログラム及びシステム
Kursa et al. Feature selection with the Boruta package
WO2019128426A1 (en) Method for training model and information recommendation system
US8990149B2 (en) Generating a predictive model from multiple data sources
JP2012208604A5 (ja)
JP2014518424A5 (ja)
WO2018014566A1 (zh) 一种负载均衡的方法、装置、计算机可读存储介质及系统
JP2013511097A5 (ja)
US8812503B2 (en) Information processing device, method and program
EP2991003A2 (en) Method and apparatus for classification
JP2019009774A5 (ja)
JP2013544387A5 (ja)
WO2015184992A1 (zh) 一种识别重复图片的方法、图片搜索去重方法及其装置
RU2017110461A (ru) Основанные на хешах решения кодера для кодирования видео
JP2008538642A5 (ja)
JP2013517569A5 (ja)
RU2016150428A (ru) Заполнение записей контактов пользователя
JP2016508769A5 (ja)
JP2011081549A5 (ja) 情報処理装置及び情報処理方法
RU2016106637A (ru) Решение относительно наличия/отсутствия вокализации для обработки речи
JP2018049004A5 (ja)
US11948053B2 (en) Inferencer graph for implementing machine learning model topology
JP2013097467A5 (ja)
KR101573112B1 (ko) 데이터 분배 방법 및 장치