RU2451332C2 - Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков - Google Patents

Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков Download PDF

Info

Publication number
RU2451332C2
RU2451332C2 RU2008119231/08A RU2008119231A RU2451332C2 RU 2451332 C2 RU2451332 C2 RU 2451332C2 RU 2008119231/08 A RU2008119231/08 A RU 2008119231/08A RU 2008119231 A RU2008119231 A RU 2008119231A RU 2451332 C2 RU2451332 C2 RU 2451332C2
Authority
RU
Russia
Prior art keywords
feature vector
audio
dimension
signals
weight coefficient
Prior art date
Application number
RU2008119231/08A
Other languages
English (en)
Other versions
RU2008119231A (ru
Inventor
Мартин Ф. МАККИННИ (NL)
Мартин Ф. МАККИННИ
Дирк Й. БРЕБАРТ (NL)
Дирк Й. БРЕБАРТ
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2008119231A publication Critical patent/RU2008119231A/ru
Application granted granted Critical
Publication of RU2451332C2 publication Critical patent/RU2451332C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Receiver Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

Изобретение относится к способу для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала. Техническим результатом является обеспечение более точного вычисления метрики подобия. Способ включает: вычисление расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, причем весовой коэффициент зависит от признаков набора сигналов. 2 н. и 4 з.п. ф-лы, 2 ил.

Description

Изобретение относится к способу для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Изобретение дополнительно относится к электронному устройству для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Изобретение также относится к программному обеспечению, чтобы делать программируемое устройство работоспособным для выполнения способа вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Одно воплощение данного способа известно из WO 2004/095315. Известный способ для нахождения подобных аудиосигналов имеет недостаток в том, что вычисленная метрика подобия не является оптимальной в том смысле, что либо не все подобные аудиосигналы находятся, либо не все аудиосигналы, определенные как подобные, являются в достаточной степени подобными.
В SOONIL KWON И ДР.: "SPEAKER CHANGE DETECTION USING A NEW WEIGHTED DISTANCE MEASURE" ICSLP 2002: 7TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING. DENVER, COLORADO, SEPT. 16-20, 2002, INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING. (ICSLP), ADELAIDE: CAUSAL PRODUCTIONS, AU, vol. 4, 16 September 2002 (2002-09-16), pages 2537-2540, раскрыт алгоритм для обнаружения изменений акустической системы аудиопотока. Для этих целей вычисляют взвешенное возведенное в квадрат евклидово расстояние между двумя соседними аудиосегментами.
Первой целью изобретения является обеспечение способа типа, описанного во вступительном абзаце, который обеспечивает более точное вычисление метрики подобия.
Второй целью изобретения является обеспечение электронного устройства типа, описанного во вступительном абзаце, который обеспечивает более точное вычисление метрики подобия.
Согласно изобретению первая цель достигается тем, что способ содержит этап вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличается тем, что весовой коэффициент зависит от признаков набора сигналов. Эксперименты показали, что более точное вычисление метрики подобия может быть получено приданием большего веса определенным размерностям (признакам), в особенности тем размерностям, которые важны для классификации (музыки).
Аудио- и/или видеосигнал может происходить из любого подходящего источника. В наиболее общем случае, аудиосигнал может происходить из аудиофайла, который может иметь любой формат из некоторого количества форматов. Примеры форматов аудиофайлов - это несжатые, например, (WAV), сжатые без потерь, например, Windows Media Audio (WMA) и сжатые с потерями форматы, как, например, файл MP3 (MPEG-1 Audio Layer 3), AAC (Advanced Audio Codec) и т.д. Также входной аудиосигнал может быть получен оцифровкой аудиосигнала с использованием любой подходящей технологии, которая известна специалисту в данной области техники.
В одном воплощении способа изобретения весовой коэффициент конкретного одного из признаков зависит от дисперсии значения конкретного одного признака для набора сигналов (то есть общей дисперсии всех значений всех классов в размерности) и/или от дисперсии среднего значения конкретного одного признака на класс сигналов набора (то есть дисперсии множества средних значений в размерности, причем средние значения определяются на класс). Таким образом, тем размерностям, которые важны для классификации (музыки), задают больший вес. Дисперсии могут вычисляться в многомерном пространстве. Набором сигналов может быть набор, принадлежащий компании или организации, или персональный набор. Если набором сигналов является набор, принадлежащий компании или организации, весовой коэффициент может быть заранее сконфигурирован в аппаратном обеспечении или программном обеспечении или может быть получен от компании или организации через Интернет.
Весовой коэффициент может зависеть от дисперсии среднего значения конкретного одного признака на класс сигналов набора, поделенной на дисперсию значения конкретного одного признака для набора сигналов.
Весовой коэффициент может зависеть от классификации (например, жанр, тональность и/или артист) первого или второго аудио- и/или видеосигнала. Классификация может быть извлечена, например, из ID3 тега аудиофайла. Например, взвешенная ковариационная матрица, используемая, когда пользователь выбирает песню в стиле рок в качестве начальной песни, может отличаться от взвешенной ковариационной матрицы, используемой, когда он выбирает фрагмент классической музыки в качестве начальной песни.
Согласно изобретению вторая цель достигается тем, что электронное устройство содержит электронную схемотехнику, причем электронная схемотехника работоспособна для вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличается тем, что весовой коэффициент зависит от признаков набора сигналов.
Эти и другие аспекты изобретения очевидны из и будут дополнительно объяснены посредством примера со ссылкой на чертежи, на которых:
Фиг. 1 показывает три уравнения, используемые в одном воплощении изобретения;
Фиг. 2 показывает примеры значений признаков в двухмерном пространстве признаков, в котором значения признаков могут быть классифицированы по двум жанрам.
Соответствующие элементы на чертежах обозначены одинаковыми ссылочными позициями.
Способ изобретения может быть использован для нахождения музыки, похожей на целевую песню или текущий выбор воспроизведения. Например, если слушатель имеет большую коллекцию музыки и прослушивает трек, который ему особенно нравится, он мог бы просто нажать на кнопку, которая инициировала бы поиск по всей коллекции музыки и возвратила бы список из наиболее похожих песен и затем дала бы команду для их проигрывания. Такая функция называется LikeMusic™ в определенных потребительских устройствах Philips. Эта функция предусматривается в переносных mp3 плеерах, автомобильных радио и домашних развлекательных системах и применима к большим локальным коллекциям музыки, потоковой музыки или аудио, так же как широковещательной музыки и аудио. Дополнительно, пользователи могли бы слушать радио и иметь поиск по кнопке для похожих песен в их частной коллекции или наоборот. Алгоритм LikeMusic™ работает на признаках (статистиках сигналов), которые автоматически извлекаются из самой формы аудиосигнала, так что нет необходимости во внешних или аннотированных метаданных. Первый алгоритм LikeMusic™ использовал стандартную статистическую меру расстояния (расстояние Махаланобиса) для вычисления расстояний между песнями.
Так как музыкальное подобие может быть описано в соответствии с многими размерностями, часто представляет интерес изолирование конкретной размерности подобия. Способ изобретения обеспечивает эффективный способ для вычисления расстояния подобия из акустических параметров в соответствии с конкретной перцепционной размерностью подобия посредством модифицирования алгоритма LikeMusic™ для взвешивания размерностей признаков, которые важны для классификации музыки. Взвешивание размерностей признаков может быть основано, например, на классификации по жанру, артисту и/или тональности.
В одном воплощении способа изобретения способ сначала извлекает признаки (описательную статистику аудиосигнала) из каждой песни и генерирует перечень с именем каждого трека и связанными с ним признаками. Признаки могут появляться из широкого диапазона статистики. На современных ПК эти признаки извлекают несколько сот раз в реальном масштабе времени. Когда проигрывается песня, способ может извлекать признаки из этой песни в реальном масштабе времени или искать их в перечне базы данных, если они появились из базы данных. Разница между этими подходами в том, что признаки, перечисленные в базе данных, усреднены по всей песне, тогда как признаки, извлекаемые в реальном масштабе времени, представляют только участок песни (они могут накапливаться конкретное количество времени и затем могут быть усреднены по этому времени). Оба способа имеют достоинства и недостатки, которые зависят от типа анализируемой музыки: (например, если песня содержит несколько стилей, и интерес представляет только один из этих частных стилей, тогда для этой цели локальный анализ лучше, чем усредненный по всей песне анализ). В большинстве случаев, тем не менее, стиль песни не меняется очень сильно, и оба способа дают одинаковые результаты.
Процедура рекомендации, выполняемая автоматически или после нажатия кнопки, либо искала, либо вычисляла бы признаки текущего выбранного воспроизведения, вычисляла бы меру расстояния, D, между текущей песней и каждой песней в базе данных и затем рекомендовала бы ближайшие 20 песен. Пользователь может настроить количество рекомендуемых песен, и система может автоматически остановиться в поисковой точке и проигрывать рекомендованные (подобные) песни. Мера расстояния, D, является модифицированной формой расстояния Махаланобиса между векторами признаков в многомерном пространстве признаков с весовым коэффициентом, который придает больший вес размерностям (признакам), которые важны для классификации музыки. Это пространство признаков является, например, 20-мерным пространством.
Расстояние D между аудиотреком 1 и аудиотреком 2 может быть вычислено с помощью уравнения (1) на Фиг. 1, где μ1 и μ2 - это векторы трека 1 и трека 2 соответственно, а W - это взвешенная ковариационная матрица всех векторов признаков в базе данных. Взвешенная ковариационная матрица W является константой, которая не меняется от одной рекомендации к следующей. Она может быть определена из коллекции аудиотреков, принадлежащих компании или организации, или она может быть определена из личной коллекции аудиотреков пользователя. W может быть вычислена из уравнения (2) на Фиг. 1, где С - это ковариационная матрица всех признаков из базы данных (например, учебной базы данных), а gw является весовым вектором жанра, определенным в уравнении (3) из Фиг. 1, где
Figure 00000001
- это вектор дисперсий признаков в целом (диагональ ковариационной матрицы С, например, содержащая дисперсии значений признаков жанров 11 и 13 для признака 1 и дисперсии значений признаков жанров 11 и 13 для признака 2, см. Фиг. 2), а
Figure 00000002
- это вектор дисперсий средних значений признаков на жанр (например, содержащий дисперсию между средним значением 15 признака жанра 11 и средним значением 17 признака жанра 13 для признака 1 и дисперсию между средним значением 15 признака жанра 11 и средним значением 17 признака жанра 13 для признака 2, см. Фиг. 2). Вычисление такого же типа может быть выполнено для классов музыкальных артистов, музыкальной тональности или персональных классов музыки вместо жанра музыки. Каждая вариация затем вычисляет расстояние в соответствии с другой размерностью подобия.
Способ может быть выполняться в аппаратном обеспечении или программном обеспечении, например, на специализированном процессоре или на процессоре общего назначения, таком как процессор Intel Pentium или AMD Athlon. Электронное устройство, выполняющее способ, может быть переносным устройством или стационарным устройством, таким как ПК/устройство мультимедийного центра.
Хотя изобретение было описано вместе с предпочтительными воплощениями, следует понимать, что для специалистов в данной области техники будут очевидны его модификации в пределах обрисованных выше принципов, и, таким образом, изобретение не ограничивается предпочтительными воплощениями, а предполагается, что охватывает такие модификации. Изобретение присуще каждому и любому характеристическому признаку и каждой и любой комбинации характеристических признаков. Ссылочные позиции в формуле изобретения не ограничивают ее объем охраны. Использование глагола «содержать» и его спряжений не исключает наличие элементов, других, нежели изложенные в формуле изобретения. Использование единственного числа для элемента не исключает наличие множества таких элементов.
«Средства», как должно быть очевидно специалисту в данной области техники, означает, что включают в себя любое аппаратное обеспечение (такое как отдельные или интегральные схемы или электронные элементы) или программное обеспечение (такое как программы или части программ), которые выполняют при работе или спроектированы, чтобы выполнять конкретную функцию, является ли она единственной или в соединении с другими функциями, является ли она изолированной или во взаимодействии с другими элементами. Изобретение может быть реализовано посредством аппаратного обеспечения, содержащего несколько различных элементов, или посредством соответствующим образом запрограммированного компьютера. В пункте устройства формулы изобретения, перечисляющем несколько средств, некоторые из этих средств могут быть воплощены одним и тем же элементом аппаратного обеспечения. "Программное обеспечение" следует понимать как обозначение любого программного продукта, сохраненного на считываемом компьютером носителе, таком как флоппи-диск, загружаемого через сеть, такую как Интернет, или реализуемого любым другим способом.

Claims (6)

1. Способ нахождения подобных аудио- и/или видеосигналов, содержащий этап вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала, содержащий:
вычисление расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличающийся тем, что весовой коэффициент зависит от признаков набора сигналов.
2. Способ по п.1, в котором весовой коэффициент конкретного одного из признаков зависит от дисперсии значения конкретного одного признака для набора сигналов и/или от дисперсии среднего значения (15, 17) конкретного одного признака на класс (11, 13) сигналов набора.
3. Способ по п.2, в котором весовой коэффициент зависит от дисперсии среднего значения конкретного одного признака на класс сигналов набора, поделенной на дисперсию значения конкретного одного признака для набора сигналов.
4. Способ по п.1, в котором весовой коэффициент зависит от классификации первого или второго аудио- и/или видеосигнала.
5. Машиночитаемый носитель, имеющий сохраненное на нем программное обеспечение, предназначенное для выполнения способа по п.1.
6. Электронное устройство для нахождения подобных аудио- и/или видеосигналов, содержащее электронную схемотехнику, выполненную с возможностью вычисления метрики подобия между первым вектором признаков и вторым вектором признаков аудио- и/или видеосигнала, вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличающееся тем, что весовой коэффициент зависит от признаков набора сигналов.
RU2008119231/08A 2005-10-17 2006-10-16 Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков RU2451332C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05109636 2005-10-17
EP05109636.0 2005-10-17

Publications (2)

Publication Number Publication Date
RU2008119231A RU2008119231A (ru) 2009-12-10
RU2451332C2 true RU2451332C2 (ru) 2012-05-20

Family

ID=37734940

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008119231/08A RU2451332C2 (ru) 2005-10-17 2006-10-16 Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков

Country Status (7)

Country Link
US (1) US8214304B2 (ru)
EP (1) EP1941400A1 (ru)
JP (1) JP5498017B2 (ru)
CN (1) CN101292241B (ru)
BR (1) BRPI0617432A2 (ru)
RU (1) RU2451332C2 (ru)
WO (1) WO2007046049A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2747442C2 (ru) * 2016-05-20 2021-05-05 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102956237B (zh) * 2011-08-19 2016-12-07 杜比实验室特许公司 测量内容一致性的方法和设备
US8626607B1 (en) * 2011-08-31 2014-01-07 Amazon Technologies, Inc. Generating media recommendations based upon beats per minute
US9235198B2 (en) * 2012-10-25 2016-01-12 International Business Machines Corporation System and method for using biometrics to predict and select music preferences
US20150169177A1 (en) * 2012-11-29 2015-06-18 Google Inc. Classifying particular images as primary images
CN104484459B (zh) * 2014-12-29 2019-07-23 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置
US20170046510A1 (en) * 2015-08-14 2017-02-16 Qualcomm Incorporated Methods and Systems of Building Classifier Models in Computing Devices
US11681747B2 (en) * 2019-11-25 2023-06-20 Gracenote, Inc. Methods and apparatus to generate recommendations based on attribute vectors
US11461649B2 (en) * 2020-03-19 2022-10-04 Adobe Inc. Searching for music
CN113592750B (zh) * 2021-07-30 2023-10-20 成都市晶林科技有限公司 一种基于梯度直方图的红外增强方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317883B2 (en) * 1998-12-11 2001-11-13 Mediaone Group, Inc. System and method for content-based television program selection
WO2002011440A2 (en) * 2000-07-27 2002-02-07 Koninklijke Philips Electronics N.V. Method and apparatus for generating television program recommendations based on similarity metric
RU2229173C2 (ru) * 1998-10-05 2004-05-20 Конинклейке Филипс Электроникс Н.В. Система защиты от копирования записанной информации

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173275B1 (en) * 1993-09-20 2001-01-09 Hnc Software, Inc. Representation and retrieval of images using context vectors derived from image information elements
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
WO2002095534A2 (en) * 2001-05-18 2002-11-28 Biowulf Technologies, Llc Methods for feature selection in a learning machine
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
US6763148B1 (en) * 2000-11-13 2004-07-13 Visual Key, Inc. Image recognition methods
US7328153B2 (en) * 2001-07-20 2008-02-05 Gracenote, Inc. Automatic identification of sound recordings
WO2004095315A1 (en) 2003-04-24 2004-11-04 Koninklijke Philips Electronics N.V. Parameterized temporal feature analysis
CA2579903C (en) * 2004-09-17 2012-03-13 Cyberextruder.Com, Inc. System, method, and apparatus for generating a three-dimensional representation from one or more two-dimensional images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2229173C2 (ru) * 1998-10-05 2004-05-20 Конинклейке Филипс Электроникс Н.В. Система защиты от копирования записанной информации
US6317883B2 (en) * 1998-12-11 2001-11-13 Mediaone Group, Inc. System and method for content-based television program selection
WO2002011440A2 (en) * 2000-07-27 2002-02-07 Koninklijke Philips Electronics N.V. Method and apparatus for generating television program recommendations based on similarity metric

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SOONIL KWON et al. "SPEAKER CHANGE DETECTION USING A NEW WEIGTED DISTANCE MEASURE" опубл. 2002, [он-лайн] [найдено 29.04.2011]. Найдено в Интернет <URL: http://sail.usc.edu/publications/ICSLP2002_kwon.pdf>. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2747442C2 (ru) * 2016-05-20 2021-05-05 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа

Also Published As

Publication number Publication date
US20080281895A1 (en) 2008-11-13
CN101292241B (zh) 2012-06-06
RU2008119231A (ru) 2009-12-10
EP1941400A1 (en) 2008-07-09
JP2009511981A (ja) 2009-03-19
BRPI0617432A2 (pt) 2011-07-26
WO2007046049A1 (en) 2007-04-26
JP5498017B2 (ja) 2014-05-21
US8214304B2 (en) 2012-07-03
CN101292241A (zh) 2008-10-22

Similar Documents

Publication Publication Date Title
RU2451332C2 (ru) Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков
Burred et al. Hierarchical automatic audio signal classification
Whitman et al. Artist detection in music with minnowmatch
Tzanetakis et al. Marsyas: A framework for audio analysis
US9313593B2 (en) Ranking representative segments in media data
Li et al. Classification of general audio data for content-based retrieval
Foote et al. Audio Retrieval by Rhythmic Similarity.
US9077581B2 (en) Device and method for monitoring, rating and/or tuning to an audio content channel
US20060155399A1 (en) Method and system for generating acoustic fingerprints
EP3508986A1 (en) Music cover identification for search, compliance, and licensing
US20080275904A1 (en) Method of Generating and Methods of Filtering a User Profile
CN1998044B (zh) 音频信号分类方法和系统
JP2005322401A (ja) メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム
JP2007519092A (ja) メロディデータベースの検索
Patil et al. Music genre classification using MFCC, K-NN and SVM classifier
West et al. A model-based approach to constructing music similarity functions
You et al. Comparative study of singing voice detection methods
Jin et al. Better than MFCC audio classification features
US20180173400A1 (en) Media Content Selection
Krishnamoorthy et al. Hierarchical audio content classification system using an optimal feature selection algorithm
KR100869643B1 (ko) 음악구조를 이용한 엠피쓰리 형식의 가요 음향에 대한 요약장치, 방법 및 이를 구현하기 위한 프로그램이 저장된기록매체
Jitendra et al. An ensemble model of CNN with Bi-LSTM for automatic singer identification
Horsburgh et al. Music-inspired texture representation
Tsai et al. Content-based retrieval of MP3 songs for one singer using quantization tree indexing and melody-line tracking method
US20230351152A1 (en) Music analysis method and apparatus for cross-comparing music properties using artificial neural network

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20171017