JP2016509290A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016509290A5 JP2016509290A5 JP2015550828A JP2015550828A JP2016509290A5 JP 2016509290 A5 JP2016509290 A5 JP 2016509290A5 JP 2015550828 A JP2015550828 A JP 2015550828A JP 2015550828 A JP2015550828 A JP 2015550828A JP 2016509290 A5 JP2016509290 A5 JP 2016509290A5
- Authority
- JP
- Japan
- Prior art keywords
- reference audio
- audio samples
- time segment
- scores
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000523 sample Substances 0.000 claims 52
- 230000000875 corresponding Effects 0.000 claims 13
Claims (19)
- プロセッサを使用するステップであって、コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を実行して、
オーディオストリーミングシステムから、プローブオーディオサンプルを受信するステップと、
第1のセットの整合性スコアに基づいて、複数の十分に一致しているリファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第1のセットの整合性スコアが前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定するステップと、
前記十分に一致しているリファレンスオーディオサンプルを保持するステップと、
前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てるステップと、
第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるステップと、
前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするステップと、
前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するステップと
を含む動作を実行するためにプロセッサを使用するステップを含む、方法。 - 定義済みのランキング閾値を超過しているそれぞれの割り当てられたランキングスコアを有する前記一致リファレンスオーディオサンプルのうちの1つを出力するステップをさらに含む、請求項1に記載の方法。
- 前記定義済みのランキング閾値を超過しているランキングスコアのそれぞれを有する前記一致リファレンスオーディオサンプルのうちの1つを出力するステップの定義済みの時間量の後に、それぞれの割り当てられたランキングスコアを有する前記複数の一致リファレンスオーディオサンプルを出力するステップをさらに含む、請求項2に記載の方法。
- 前記定義済みの時間量は、受信された前記プローブオーディオサンプルの分量に基づく、請求項3に記載の方法。
- 前記少なくとも1つの一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの前記第1のタイムセグメントを前記リファレンスオーディオサンプルの前記対応するタイムセグメントと比較するステップは、
前記プローブオーディオサンプルの前記第1のタイムセグメントのフィンガープリントを生成するステップと、
少なくとも定義済みの一致しているモノの閾値によって前記プローブオーディオサンプルの前記第1のタイムセグメントの前記フィンガープリントに一致している前記リファレンスオーディオサンプルの前記対応するタイムセグメントのそれぞれのフィンガープリントを特定するステップとを含む、請求項1に記載の方法。 - 前記ランキングスコアのそれぞれは、
前記一致リファレンスオーディオサンプルのそれぞれが販売のために個々に利用可能であるかどうかを示すそれぞれの利用可能性の評価尺度と、
前記一致リファレンスオーディオサンプルのそれぞれの人気を示すそれぞれの人気の評価尺度と、
前記一致リファレンスオーディオサンプルのそれぞれがオリジナルアルバムであるかまたはコンピレーションアルバムであるかを示すそれぞれのコンピレーションの評価尺度と、
前記一致リファレンスオーディオサンプルのそれぞれの販売量を示すそれぞれの販売の評価尺度と
からなるグループのうちの少なくとも1つに基づいて、生成される、請求項1に記載の方法。 - 前記ランキングスコアのそれぞれは、各々が対応する評価尺度の重要度に基づいて最上位から最下位ビット位置を占めるビットのセットを含むコンポーネントのセットを含むビットベクトルのシーケンスを含む、請求項6に記載の方法。
- 前記それぞれの人気の評価尺度は、前記一致リファレンスオーディオサンプルのそれぞれに関連した少なくとも1つのパラメータに関連付けられたヒューリスティックから生成される、請求項6に記載の方法。
- システムであって、
コンピュータ実行可能コンポーネントを記憶するメモリと、
前記メモリに記憶されているコンピュータ実行可能コンポーネントを実行するマイクロプロセッサであって、前記コンピュータ実行可能コンポーネントは、
オーディオストリーミングサービスから、プローブオーディオサンプルを受信する、受信コンポーネントと、
前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較する、比較コンポーネントと、
前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成された第1のセットの整合性スコアに基づいて複数の十分に一致しているリファレンスオーディオサンプルを特定する、照合コンポーネントと、
前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定し、前記十分に一致しているリファレンスオーディオサンプルを保持する、保持コンポーネントと、
前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てる、ランク付けコンポーネントと、
前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするように構成される、スコア決定コンポーネントを含み、
前記比較コンポーネントは、第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較することであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントに対応する特徴ベクトルとの間に生成される、比較することを行うようにさらに構成され、
前記ランク付けコンポーネントは、前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるようにさらに構成され、
前記スコア決定コンポーネントは、前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するようにさらに構成される、マイクロプロセッサとを備える、システム。 - 前記第2のタイムセグメントは、前記オーディオストリーミングコンテンツの前記第1のタイムセグメントを含む、請求項9に記載のシステム。
- 前記スコア決定コンポーネントは、どの一致リファレンスオーディオサンプルを前記スコア比較に基づいて出力するかを動的に決定する、請求項9に記載のシステム。
- 前記保持コンポーネントは、比較処理の時間、または比較された前記オーディオストリーミングコンテンツの分量のうちの少なくとも1つを含む定義済みのパラメータのセットに基づいて、前記一致リファレンスオーディオサンプルを保持する、請求項9に記載のシステム。
- 前記ランキングスコアのそれぞれは、前記一致リファレンスオーディオサンプルのそれぞれが販売に関して個々に利用可能であるかどうか、前記一致リファレンスオーディオサンプルのそれぞれの人気、前記一致リファレンスオーディオサンプルのそれぞれがオリジナルアルバムであるかまたはコンピレーションアルバムであるか、および前記一致リファレンスオーディオサンプルのそれぞれの販売量からなるグループのうちの少なくとも1つに基づいて、生成される、請求項9に記載のシステム。
- 前記一致リファレンスオーディオサンプルを、前記オーディオストリーミングコンテンツの第2のタイムセグメントと十分に一致しているモノの第2のランキングスコアを有している少なくとも1つの追加の一致リファレンスオーディオサンプルとマージする、マージコンポーネントをさらに含む、請求項9に記載のシステム。
- 実行に応じて、プロセッサを備えるコンピューティングシステムに処理を実行させるコンピュータ実行可能命令を含むコンピュータ可読記憶媒体であって、前記処理は、
オーディオストリーミングシステムから、プローブオーディオサンプルを受信するステップと、
第1のセットの整合性スコアに基づいて、複数の十分に一致しているリファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第1のタイムセグメントを複数のリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第1のセットの整合性スコアが前記プローブオーディオサンプルの前記第1のタイムセグメントの1つまたは複数の特徴ベクトルと前記リファレンスオーディオサンプルの各々の前記第1のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
前記十分に一致しているリファレンスオーディオサンプルが所定のスコア閾値を満たしていないと決定するステップと、
前記十分に一致しているリファレンスオーディオサンプルを保持するステップと、
前記第1のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記十分に一致しているリファレンスオーディオサンプルに割り当てるステップと、
第2のセットの整合性スコアに基づいて、複数の追加の一致リファレンスオーディオサンプルを特定するために、前記プローブオーディオサンプルの第2のタイムセグメントを前記十分に一致しているリファレンスオーディオサンプルの対応するタイムセグメントと比較するステップであって、前記第2のセットの整合性スコアが前記プローブオーディオサンプルの前記第2のタイムセグメントの1つまたは複数の特徴ベクトルと前記十分に一致しているリファレンスオーディオサンプルの各々の前記第2のタイムセグメントの対応する特徴ベクトルとの間に生成される、ステップと、
前記第2のセットの整合性スコアに基づいて、ランキングスコアのそれぞれを前記追加の一致リファレンスオーディオサンプルに割り当てるステップと、
前記第1のセットのランキングスコアと前記第2のセットのランキングスコアとを別々に重み付けするステップと、
前記重み付けされた第1および第2のセットのランキングスコアに基づいて、前記リファレンスオーディオサンプルのうちの少なくとも1つを出力するステップとを含む、コンピュータ可読記憶媒体。 - それぞれの最高の割り当てられたランキングスコアを有する定義済みの数の一致リファレンスオーディオサンプルを出力するステップをさらに含む、請求項1に記載の方法。
- 追加の閾値を満たしていない第2の整合性スコアを有する前記十分に一致しているリファレンスオーディオサンプルを放棄するステップをさらに含む、請求項1に記載の方法。
- 前記スコア決定コンポーネントは、それぞれの最高の割り当てられたランキングスコアを有する定義済みの数の一致リファレンスオーディオサンプルを出力するようにさらに構成される、請求項9に記載のシステム。
- 前記スコア決定コンポーネントは、追加の閾値を満たしていない第2の整合性スコアを有する前記十分に一致しているリファレンスオーディオサンプルを放棄するようにさらに構成される、請求項9に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/732,108 US9529907B2 (en) | 2012-12-31 | 2012-12-31 | Hold back and real time ranking of results in a streaming matching system |
US13/732,108 | 2012-12-31 | ||
PCT/US2013/078205 WO2014106147A2 (en) | 2012-12-31 | 2013-12-30 | Hold back and real time ranking of results in a streaming matching system |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017143317A Division JP6449386B2 (ja) | 2012-12-31 | 2017-07-25 | ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016509290A JP2016509290A (ja) | 2016-03-24 |
JP2016509290A5 true JP2016509290A5 (ja) | 2017-01-19 |
JP6185080B2 JP6185080B2 (ja) | 2017-08-23 |
Family
ID=50002861
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015550828A Active JP6185080B2 (ja) | 2012-12-31 | 2013-12-30 | ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング |
JP2017143317A Active JP6449386B2 (ja) | 2012-12-31 | 2017-07-25 | ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017143317A Active JP6449386B2 (ja) | 2012-12-31 | 2017-07-25 | ストリーミング照合システムにおける結果のホールドバックおよびリアルタイムランキング |
Country Status (5)
Country | Link |
---|---|
US (3) | US9529907B2 (ja) |
EP (1) | EP2939103B1 (ja) |
JP (2) | JP6185080B2 (ja) |
CN (2) | CN104885053B (ja) |
WO (1) | WO2014106147A2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9460201B2 (en) * | 2013-05-06 | 2016-10-04 | Iheartmedia Management Services, Inc. | Unordered matching of audio fingerprints |
US10289971B2 (en) | 2015-02-13 | 2019-05-14 | Atlassian Pty Ltd | Issue and trigger rebalancing in a ranked issue management system |
US11823658B2 (en) * | 2015-02-20 | 2023-11-21 | Sri International | Trial-based calibration for audio-based identification, recognition, and detection system |
CN104991946B (zh) * | 2015-07-13 | 2021-04-13 | 联想(北京)有限公司 | 一种信息处理方法、服务器和用户设备 |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
US10713296B2 (en) | 2016-09-09 | 2020-07-14 | Gracenote, Inc. | Audio identification based on data structure |
US10803119B2 (en) * | 2017-01-02 | 2020-10-13 | Gracenote, Inc. | Automated cover song identification |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
EP3827222B1 (en) * | 2019-05-24 | 2022-07-06 | Google LLC | Method and device for navigating two or more users to a meeting location |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US10827028B1 (en) | 2019-09-05 | 2020-11-03 | Spotify Ab | Systems and methods for playing media content on a target device |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11373657B2 (en) * | 2020-05-01 | 2022-06-28 | Raytheon Applied Signal Technology, Inc. | System and method for speaker identification in audio data |
US11315545B2 (en) | 2020-07-09 | 2022-04-26 | Raytheon Applied Signal Technology, Inc. | System and method for language identification in audio data |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7013301B2 (en) * | 2003-09-23 | 2006-03-14 | Predixis Corporation | Audio fingerprinting system and method |
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
GB9918611D0 (en) * | 1999-08-07 | 1999-10-13 | Sibelius Software Ltd | Music database searching |
DE60036486T2 (de) * | 1999-10-28 | 2008-06-12 | Canon K.K. | Methode und apparat zum prüfen von musterübereinstimmungen |
US6545209B1 (en) * | 2000-07-05 | 2003-04-08 | Microsoft Corporation | Music content characteristic identification and matching |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
US7853664B1 (en) * | 2000-07-31 | 2010-12-14 | Landmark Digital Services Llc | Method and system for purchasing pre-recorded music |
KR20040024870A (ko) * | 2001-07-20 | 2004-03-22 | 그레이스노트 아이엔씨 | 음성 기록의 자동 확인 |
US20060013451A1 (en) * | 2002-11-01 | 2006-01-19 | Koninklijke Philips Electronics, N.V. | Audio data fingerprint searching |
US7580921B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7516074B2 (en) * | 2005-09-01 | 2009-04-07 | Auditude, Inc. | Extraction and matching of characteristic fingerprints from audio signals |
US8326775B2 (en) * | 2005-10-26 | 2012-12-04 | Cortica Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
EP1986145A1 (en) * | 2005-11-29 | 2008-10-29 | Google Inc. | Social and interactive applications for mass media |
US20070192305A1 (en) | 2006-01-27 | 2007-08-16 | William Derek Finley | Search term suggestion method based on analysis of correlated data in three dimensions |
KR100735820B1 (ko) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 |
US20070266001A1 (en) * | 2006-05-09 | 2007-11-15 | Microsoft Corporation | Presentation of duplicate and near duplicate search results |
WO2007133754A2 (en) * | 2006-05-12 | 2007-11-22 | Owl Multimedia, Inc. | Method and system for music information retrieval |
CN101553799B (zh) * | 2006-07-03 | 2012-03-21 | 英特尔公司 | 用于快速音频搜索的方法和设备 |
US8364669B1 (en) * | 2006-07-21 | 2013-01-29 | Aol Inc. | Popularity of content items |
JP2010513974A (ja) * | 2006-12-21 | 2010-04-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声データを処理するシステム |
US20080168045A1 (en) * | 2007-01-10 | 2008-07-10 | Microsoft Corporation | Content rank |
US8266142B2 (en) * | 2007-06-06 | 2012-09-11 | Dolby Laboratories Licensing Corporation | Audio/Video fingerprint search accuracy using multiple search combining |
JP4645653B2 (ja) * | 2008-01-15 | 2011-03-09 | 日本電気株式会社 | 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法 |
US8344233B2 (en) | 2008-05-07 | 2013-01-01 | Microsoft Corporation | Scalable music recommendation by search |
EP2406787B1 (en) * | 2009-03-11 | 2014-05-14 | Google, Inc. | Audio classification for information retrieval using sparse features |
JP2011040116A (ja) * | 2009-08-06 | 2011-02-24 | Jvc Kenwood Holdings Inc | 情報取得システム、情報取得装置、および情報取得方法 |
CN102959543B (zh) * | 2010-05-04 | 2016-05-25 | 沙扎姆娱乐有限公司 | 用于处理媒体流的样本的方法和系统 |
US8584198B2 (en) | 2010-11-12 | 2013-11-12 | Google Inc. | Syndication including melody recognition and opt out |
US20120124172A1 (en) | 2010-11-15 | 2012-05-17 | Google Inc. | Providing Different Versions of a Media File |
US8805090B1 (en) * | 2012-02-07 | 2014-08-12 | Google Inc. | Matching based upon rank |
-
2012
- 2012-12-31 US US13/732,108 patent/US9529907B2/en active Active
-
2013
- 2013-12-30 JP JP2015550828A patent/JP6185080B2/ja active Active
- 2013-12-30 EP EP13824453.8A patent/EP2939103B1/en active Active
- 2013-12-30 WO PCT/US2013/078205 patent/WO2014106147A2/en active Application Filing
- 2013-12-30 CN CN201380068864.0A patent/CN104885053B/zh active Active
- 2013-12-30 CN CN201811257138.4A patent/CN109446374B/zh active Active
-
2016
- 2016-11-10 US US15/348,776 patent/US9754026B2/en active Active
-
2017
- 2017-07-25 JP JP2017143317A patent/JP6449386B2/ja active Active
- 2017-08-29 US US15/689,092 patent/US10120934B2/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016509290A5 (ja) | ||
JP5669630B2 (ja) | テスト・ケース生成方法、プログラム及びシステム | |
Kursa et al. | Feature selection with the Boruta package | |
WO2019128426A1 (en) | Method for training model and information recommendation system | |
US8990149B2 (en) | Generating a predictive model from multiple data sources | |
JP2012208604A5 (ja) | ||
JP2014518424A5 (ja) | ||
WO2018014566A1 (zh) | 一种负载均衡的方法、装置、计算机可读存储介质及系统 | |
JP2013511097A5 (ja) | ||
US8812503B2 (en) | Information processing device, method and program | |
EP2991003A2 (en) | Method and apparatus for classification | |
JP2019009774A5 (ja) | ||
JP2013544387A5 (ja) | ||
WO2015184992A1 (zh) | 一种识别重复图片的方法、图片搜索去重方法及其装置 | |
RU2017110461A (ru) | Основанные на хешах решения кодера для кодирования видео | |
JP2008538642A5 (ja) | ||
JP2013517569A5 (ja) | ||
RU2016150428A (ru) | Заполнение записей контактов пользователя | |
JP2016508769A5 (ja) | ||
JP2011081549A5 (ja) | 情報処理装置及び情報処理方法 | |
RU2016106637A (ru) | Решение относительно наличия/отсутствия вокализации для обработки речи | |
JP2018049004A5 (ja) | ||
US11948053B2 (en) | Inferencer graph for implementing machine learning model topology | |
JP2013097467A5 (ja) | ||
KR101573112B1 (ko) | 데이터 분배 방법 및 장치 |