RU2451332C2 - Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков - Google Patents
Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков Download PDFInfo
- Publication number
- RU2451332C2 RU2451332C2 RU2008119231/08A RU2008119231A RU2451332C2 RU 2451332 C2 RU2451332 C2 RU 2451332C2 RU 2008119231/08 A RU2008119231/08 A RU 2008119231/08A RU 2008119231 A RU2008119231 A RU 2008119231A RU 2451332 C2 RU2451332 C2 RU 2451332C2
- Authority
- RU
- Russia
- Prior art keywords
- feature vector
- audio
- dimension
- signals
- weight coefficient
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Receiver Circuits (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
Изобретение относится к способу для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала. Техническим результатом является обеспечение более точного вычисления метрики подобия. Способ включает: вычисление расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, причем весовой коэффициент зависит от признаков набора сигналов. 2 н. и 4 з.п. ф-лы, 2 ил.
Description
Изобретение относится к способу для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Изобретение дополнительно относится к электронному устройству для вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Изобретение также относится к программному обеспечению, чтобы делать программируемое устройство работоспособным для выполнения способа вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала.
Одно воплощение данного способа известно из WO 2004/095315. Известный способ для нахождения подобных аудиосигналов имеет недостаток в том, что вычисленная метрика подобия не является оптимальной в том смысле, что либо не все подобные аудиосигналы находятся, либо не все аудиосигналы, определенные как подобные, являются в достаточной степени подобными.
В SOONIL KWON И ДР.: "SPEAKER CHANGE DETECTION USING A NEW WEIGHTED DISTANCE MEASURE" ICSLP 2002: 7TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING. DENVER, COLORADO, SEPT. 16-20, 2002, INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING. (ICSLP), ADELAIDE: CAUSAL PRODUCTIONS, AU, vol. 4, 16 September 2002 (2002-09-16), pages 2537-2540, раскрыт алгоритм для обнаружения изменений акустической системы аудиопотока. Для этих целей вычисляют взвешенное возведенное в квадрат евклидово расстояние между двумя соседними аудиосегментами.
Первой целью изобретения является обеспечение способа типа, описанного во вступительном абзаце, который обеспечивает более точное вычисление метрики подобия.
Второй целью изобретения является обеспечение электронного устройства типа, описанного во вступительном абзаце, который обеспечивает более точное вычисление метрики подобия.
Согласно изобретению первая цель достигается тем, что способ содержит этап вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличается тем, что весовой коэффициент зависит от признаков набора сигналов. Эксперименты показали, что более точное вычисление метрики подобия может быть получено приданием большего веса определенным размерностям (признакам), в особенности тем размерностям, которые важны для классификации (музыки).
Аудио- и/или видеосигнал может происходить из любого подходящего источника. В наиболее общем случае, аудиосигнал может происходить из аудиофайла, который может иметь любой формат из некоторого количества форматов. Примеры форматов аудиофайлов - это несжатые, например, (WAV), сжатые без потерь, например, Windows Media Audio (WMA) и сжатые с потерями форматы, как, например, файл MP3 (MPEG-1 Audio Layer 3), AAC (Advanced Audio Codec) и т.д. Также входной аудиосигнал может быть получен оцифровкой аудиосигнала с использованием любой подходящей технологии, которая известна специалисту в данной области техники.
В одном воплощении способа изобретения весовой коэффициент конкретного одного из признаков зависит от дисперсии значения конкретного одного признака для набора сигналов (то есть общей дисперсии всех значений всех классов в размерности) и/или от дисперсии среднего значения конкретного одного признака на класс сигналов набора (то есть дисперсии множества средних значений в размерности, причем средние значения определяются на класс). Таким образом, тем размерностям, которые важны для классификации (музыки), задают больший вес. Дисперсии могут вычисляться в многомерном пространстве. Набором сигналов может быть набор, принадлежащий компании или организации, или персональный набор. Если набором сигналов является набор, принадлежащий компании или организации, весовой коэффициент может быть заранее сконфигурирован в аппаратном обеспечении или программном обеспечении или может быть получен от компании или организации через Интернет.
Весовой коэффициент может зависеть от дисперсии среднего значения конкретного одного признака на класс сигналов набора, поделенной на дисперсию значения конкретного одного признака для набора сигналов.
Весовой коэффициент может зависеть от классификации (например, жанр, тональность и/или артист) первого или второго аудио- и/или видеосигнала. Классификация может быть извлечена, например, из ID3 тега аудиофайла. Например, взвешенная ковариационная матрица, используемая, когда пользователь выбирает песню в стиле рок в качестве начальной песни, может отличаться от взвешенной ковариационной матрицы, используемой, когда он выбирает фрагмент классической музыки в качестве начальной песни.
Согласно изобретению вторая цель достигается тем, что электронное устройство содержит электронную схемотехнику, причем электронная схемотехника работоспособна для вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличается тем, что весовой коэффициент зависит от признаков набора сигналов.
Эти и другие аспекты изобретения очевидны из и будут дополнительно объяснены посредством примера со ссылкой на чертежи, на которых:
Фиг. 1 показывает три уравнения, используемые в одном воплощении изобретения;
Фиг. 2 показывает примеры значений признаков в двухмерном пространстве признаков, в котором значения признаков могут быть классифицированы по двум жанрам.
Соответствующие элементы на чертежах обозначены одинаковыми ссылочными позициями.
Способ изобретения может быть использован для нахождения музыки, похожей на целевую песню или текущий выбор воспроизведения. Например, если слушатель имеет большую коллекцию музыки и прослушивает трек, который ему особенно нравится, он мог бы просто нажать на кнопку, которая инициировала бы поиск по всей коллекции музыки и возвратила бы список из наиболее похожих песен и затем дала бы команду для их проигрывания. Такая функция называется LikeMusic™ в определенных потребительских устройствах Philips. Эта функция предусматривается в переносных mp3 плеерах, автомобильных радио и домашних развлекательных системах и применима к большим локальным коллекциям музыки, потоковой музыки или аудио, так же как широковещательной музыки и аудио. Дополнительно, пользователи могли бы слушать радио и иметь поиск по кнопке для похожих песен в их частной коллекции или наоборот. Алгоритм LikeMusic™ работает на признаках (статистиках сигналов), которые автоматически извлекаются из самой формы аудиосигнала, так что нет необходимости во внешних или аннотированных метаданных. Первый алгоритм LikeMusic™ использовал стандартную статистическую меру расстояния (расстояние Махаланобиса) для вычисления расстояний между песнями.
Так как музыкальное подобие может быть описано в соответствии с многими размерностями, часто представляет интерес изолирование конкретной размерности подобия. Способ изобретения обеспечивает эффективный способ для вычисления расстояния подобия из акустических параметров в соответствии с конкретной перцепционной размерностью подобия посредством модифицирования алгоритма LikeMusic™ для взвешивания размерностей признаков, которые важны для классификации музыки. Взвешивание размерностей признаков может быть основано, например, на классификации по жанру, артисту и/или тональности.
В одном воплощении способа изобретения способ сначала извлекает признаки (описательную статистику аудиосигнала) из каждой песни и генерирует перечень с именем каждого трека и связанными с ним признаками. Признаки могут появляться из широкого диапазона статистики. На современных ПК эти признаки извлекают несколько сот раз в реальном масштабе времени. Когда проигрывается песня, способ может извлекать признаки из этой песни в реальном масштабе времени или искать их в перечне базы данных, если они появились из базы данных. Разница между этими подходами в том, что признаки, перечисленные в базе данных, усреднены по всей песне, тогда как признаки, извлекаемые в реальном масштабе времени, представляют только участок песни (они могут накапливаться конкретное количество времени и затем могут быть усреднены по этому времени). Оба способа имеют достоинства и недостатки, которые зависят от типа анализируемой музыки: (например, если песня содержит несколько стилей, и интерес представляет только один из этих частных стилей, тогда для этой цели локальный анализ лучше, чем усредненный по всей песне анализ). В большинстве случаев, тем не менее, стиль песни не меняется очень сильно, и оба способа дают одинаковые результаты.
Процедура рекомендации, выполняемая автоматически или после нажатия кнопки, либо искала, либо вычисляла бы признаки текущего выбранного воспроизведения, вычисляла бы меру расстояния, D, между текущей песней и каждой песней в базе данных и затем рекомендовала бы ближайшие 20 песен. Пользователь может настроить количество рекомендуемых песен, и система может автоматически остановиться в поисковой точке и проигрывать рекомендованные (подобные) песни. Мера расстояния, D, является модифицированной формой расстояния Махаланобиса между векторами признаков в многомерном пространстве признаков с весовым коэффициентом, который придает больший вес размерностям (признакам), которые важны для классификации музыки. Это пространство признаков является, например, 20-мерным пространством.
Расстояние D между аудиотреком 1 и аудиотреком 2 может быть вычислено с помощью уравнения (1) на Фиг. 1, где μ1 и μ2 - это векторы трека 1 и трека 2 соответственно, а W - это взвешенная ковариационная матрица всех векторов признаков в базе данных. Взвешенная ковариационная матрица W является константой, которая не меняется от одной рекомендации к следующей. Она может быть определена из коллекции аудиотреков, принадлежащих компании или организации, или она может быть определена из личной коллекции аудиотреков пользователя. W может быть вычислена из уравнения (2) на Фиг. 1, где С - это ковариационная матрица всех признаков из базы данных (например, учебной базы данных), а gw является весовым вектором жанра, определенным в уравнении (3) из Фиг. 1, где - это вектор дисперсий признаков в целом (диагональ ковариационной матрицы С, например, содержащая дисперсии значений признаков жанров 11 и 13 для признака 1 и дисперсии значений признаков жанров 11 и 13 для признака 2, см. Фиг. 2), а - это вектор дисперсий средних значений признаков на жанр (например, содержащий дисперсию между средним значением 15 признака жанра 11 и средним значением 17 признака жанра 13 для признака 1 и дисперсию между средним значением 15 признака жанра 11 и средним значением 17 признака жанра 13 для признака 2, см. Фиг. 2). Вычисление такого же типа может быть выполнено для классов музыкальных артистов, музыкальной тональности или персональных классов музыки вместо жанра музыки. Каждая вариация затем вычисляет расстояние в соответствии с другой размерностью подобия.
Способ может быть выполняться в аппаратном обеспечении или программном обеспечении, например, на специализированном процессоре или на процессоре общего назначения, таком как процессор Intel Pentium или AMD Athlon. Электронное устройство, выполняющее способ, может быть переносным устройством или стационарным устройством, таким как ПК/устройство мультимедийного центра.
Хотя изобретение было описано вместе с предпочтительными воплощениями, следует понимать, что для специалистов в данной области техники будут очевидны его модификации в пределах обрисованных выше принципов, и, таким образом, изобретение не ограничивается предпочтительными воплощениями, а предполагается, что охватывает такие модификации. Изобретение присуще каждому и любому характеристическому признаку и каждой и любой комбинации характеристических признаков. Ссылочные позиции в формуле изобретения не ограничивают ее объем охраны. Использование глагола «содержать» и его спряжений не исключает наличие элементов, других, нежели изложенные в формуле изобретения. Использование единственного числа для элемента не исключает наличие множества таких элементов.
«Средства», как должно быть очевидно специалисту в данной области техники, означает, что включают в себя любое аппаратное обеспечение (такое как отдельные или интегральные схемы или электронные элементы) или программное обеспечение (такое как программы или части программ), которые выполняют при работе или спроектированы, чтобы выполнять конкретную функцию, является ли она единственной или в соединении с другими функциями, является ли она изолированной или во взаимодействии с другими элементами. Изобретение может быть реализовано посредством аппаратного обеспечения, содержащего несколько различных элементов, или посредством соответствующим образом запрограммированного компьютера. В пункте устройства формулы изобретения, перечисляющем несколько средств, некоторые из этих средств могут быть воплощены одним и тем же элементом аппаратного обеспечения. "Программное обеспечение" следует понимать как обозначение любого программного продукта, сохраненного на считываемом компьютером носителе, таком как флоппи-диск, загружаемого через сеть, такую как Интернет, или реализуемого любым другим способом.
Claims (6)
1. Способ нахождения подобных аудио- и/или видеосигналов, содержащий этап вычисления метрики подобия между первым вектором признаков первого аудио- и/или видеосигнала и вторым вектором признаков второго аудио- и/или видеосигнала, содержащий:
вычисление расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличающийся тем, что весовой коэффициент зависит от признаков набора сигналов.
вычисление расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличающийся тем, что весовой коэффициент зависит от признаков набора сигналов.
2. Способ по п.1, в котором весовой коэффициент конкретного одного из признаков зависит от дисперсии значения конкретного одного признака для набора сигналов и/или от дисперсии среднего значения (15, 17) конкретного одного признака на класс (11, 13) сигналов набора.
3. Способ по п.2, в котором весовой коэффициент зависит от дисперсии среднего значения конкретного одного признака на класс сигналов набора, поделенной на дисперсию значения конкретного одного признака для набора сигналов.
4. Способ по п.1, в котором весовой коэффициент зависит от классификации первого или второго аудио- и/или видеосигнала.
5. Машиночитаемый носитель, имеющий сохраненное на нем программное обеспечение, предназначенное для выполнения способа по п.1.
6. Электронное устройство для нахождения подобных аудио- и/или видеосигналов, содержащее электронную схемотехнику, выполненную с возможностью вычисления метрики подобия между первым вектором признаков и вторым вектором признаков аудио- и/или видеосигнала, вычисления расстояния между первым вектором признаков и вторым вектором признаков, причем как первый вектор признаков, так и второй вектор признаков содержат значение признака второй размерности, причем используется весовой коэффициент, который придает больший вес первой размерности, чем второй размерности, отличающееся тем, что весовой коэффициент зависит от признаков набора сигналов.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05109636 | 2005-10-17 | ||
EP05109636.0 | 2005-10-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2008119231A RU2008119231A (ru) | 2009-12-10 |
RU2451332C2 true RU2451332C2 (ru) | 2012-05-20 |
Family
ID=37734940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008119231/08A RU2451332C2 (ru) | 2005-10-17 | 2006-10-16 | Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков |
Country Status (7)
Country | Link |
---|---|
US (1) | US8214304B2 (ru) |
EP (1) | EP1941400A1 (ru) |
JP (1) | JP5498017B2 (ru) |
CN (1) | CN101292241B (ru) |
BR (1) | BRPI0617432A2 (ru) |
RU (1) | RU2451332C2 (ru) |
WO (1) | WO2007046049A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2747442C2 (ru) * | 2016-05-20 | 2021-05-05 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102956237B (zh) * | 2011-08-19 | 2016-12-07 | 杜比实验室特许公司 | 测量内容一致性的方法和设备 |
US8626607B1 (en) * | 2011-08-31 | 2014-01-07 | Amazon Technologies, Inc. | Generating media recommendations based upon beats per minute |
US9235198B2 (en) * | 2012-10-25 | 2016-01-12 | International Business Machines Corporation | System and method for using biometrics to predict and select music preferences |
US20150169177A1 (en) * | 2012-11-29 | 2015-06-18 | Google Inc. | Classifying particular images as primary images |
CN104484459B (zh) * | 2014-12-29 | 2019-07-23 | 北京奇虎科技有限公司 | 一种对知识图谱中的实体进行合并的方法及装置 |
US20170046510A1 (en) * | 2015-08-14 | 2017-02-16 | Qualcomm Incorporated | Methods and Systems of Building Classifier Models in Computing Devices |
US11681747B2 (en) * | 2019-11-25 | 2023-06-20 | Gracenote, Inc. | Methods and apparatus to generate recommendations based on attribute vectors |
US11461649B2 (en) * | 2020-03-19 | 2022-10-04 | Adobe Inc. | Searching for music |
CN113592750B (zh) * | 2021-07-30 | 2023-10-20 | 成都市晶林科技有限公司 | 一种基于梯度直方图的红外增强方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317883B2 (en) * | 1998-12-11 | 2001-11-13 | Mediaone Group, Inc. | System and method for content-based television program selection |
WO2002011440A2 (en) * | 2000-07-27 | 2002-02-07 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating television program recommendations based on similarity metric |
RU2229173C2 (ru) * | 1998-10-05 | 2004-05-20 | Конинклейке Филипс Электроникс Н.В. | Система защиты от копирования записанной информации |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6173275B1 (en) * | 1993-09-20 | 2001-01-09 | Hnc Software, Inc. | Representation and retrieval of images using context vectors derived from image information elements |
US5982903A (en) * | 1995-09-26 | 1999-11-09 | Nippon Telegraph And Telephone Corporation | Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table |
US5930749A (en) * | 1996-02-02 | 1999-07-27 | International Business Machines Corporation | Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions |
WO2002095534A2 (en) * | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Methods for feature selection in a learning machine |
US6598054B2 (en) * | 1999-01-26 | 2003-07-22 | Xerox Corporation | System and method for clustering data objects in a collection |
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
US6763148B1 (en) * | 2000-11-13 | 2004-07-13 | Visual Key, Inc. | Image recognition methods |
US7328153B2 (en) * | 2001-07-20 | 2008-02-05 | Gracenote, Inc. | Automatic identification of sound recordings |
WO2004095315A1 (en) | 2003-04-24 | 2004-11-04 | Koninklijke Philips Electronics N.V. | Parameterized temporal feature analysis |
CA2579903C (en) * | 2004-09-17 | 2012-03-13 | Cyberextruder.Com, Inc. | System, method, and apparatus for generating a three-dimensional representation from one or more two-dimensional images |
-
2006
- 2006-10-16 BR BRPI0617432-9A patent/BRPI0617432A2/pt not_active Application Discontinuation
- 2006-10-16 EP EP06809602A patent/EP1941400A1/en not_active Ceased
- 2006-10-16 US US12/090,360 patent/US8214304B2/en not_active Expired - Fee Related
- 2006-10-16 WO PCT/IB2006/053788 patent/WO2007046049A1/en active Application Filing
- 2006-10-16 JP JP2008535175A patent/JP5498017B2/ja not_active Expired - Fee Related
- 2006-10-16 CN CN2006800387183A patent/CN101292241B/zh not_active Expired - Fee Related
- 2006-10-16 RU RU2008119231/08A patent/RU2451332C2/ru not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2229173C2 (ru) * | 1998-10-05 | 2004-05-20 | Конинклейке Филипс Электроникс Н.В. | Система защиты от копирования записанной информации |
US6317883B2 (en) * | 1998-12-11 | 2001-11-13 | Mediaone Group, Inc. | System and method for content-based television program selection |
WO2002011440A2 (en) * | 2000-07-27 | 2002-02-07 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating television program recommendations based on similarity metric |
Non-Patent Citations (1)
Title |
---|
SOONIL KWON et al. "SPEAKER CHANGE DETECTION USING A NEW WEIGTED DISTANCE MEASURE" опубл. 2002, [он-лайн] [найдено 29.04.2011]. Найдено в Интернет <URL: http://sail.usc.edu/publications/ICSLP2002_kwon.pdf>. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2747442C2 (ru) * | 2016-05-20 | 2021-05-05 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа |
Also Published As
Publication number | Publication date |
---|---|
US20080281895A1 (en) | 2008-11-13 |
CN101292241B (zh) | 2012-06-06 |
RU2008119231A (ru) | 2009-12-10 |
EP1941400A1 (en) | 2008-07-09 |
JP2009511981A (ja) | 2009-03-19 |
BRPI0617432A2 (pt) | 2011-07-26 |
WO2007046049A1 (en) | 2007-04-26 |
JP5498017B2 (ja) | 2014-05-21 |
US8214304B2 (en) | 2012-07-03 |
CN101292241A (zh) | 2008-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2451332C2 (ru) | Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков | |
Burred et al. | Hierarchical automatic audio signal classification | |
Whitman et al. | Artist detection in music with minnowmatch | |
Tzanetakis et al. | Marsyas: A framework for audio analysis | |
US9313593B2 (en) | Ranking representative segments in media data | |
Li et al. | Classification of general audio data for content-based retrieval | |
Foote et al. | Audio Retrieval by Rhythmic Similarity. | |
US9077581B2 (en) | Device and method for monitoring, rating and/or tuning to an audio content channel | |
US20060155399A1 (en) | Method and system for generating acoustic fingerprints | |
EP3508986A1 (en) | Music cover identification for search, compliance, and licensing | |
US20080275904A1 (en) | Method of Generating and Methods of Filtering a User Profile | |
CN1998044B (zh) | 音频信号分类方法和系统 | |
JP2005322401A (ja) | メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム | |
JP2007519092A (ja) | メロディデータベースの検索 | |
Patil et al. | Music genre classification using MFCC, K-NN and SVM classifier | |
West et al. | A model-based approach to constructing music similarity functions | |
You et al. | Comparative study of singing voice detection methods | |
Jin et al. | Better than MFCC audio classification features | |
US20180173400A1 (en) | Media Content Selection | |
Krishnamoorthy et al. | Hierarchical audio content classification system using an optimal feature selection algorithm | |
KR100869643B1 (ko) | 음악구조를 이용한 엠피쓰리 형식의 가요 음향에 대한 요약장치, 방법 및 이를 구현하기 위한 프로그램이 저장된기록매체 | |
Jitendra et al. | An ensemble model of CNN with Bi-LSTM for automatic singer identification | |
Horsburgh et al. | Music-inspired texture representation | |
Tsai et al. | Content-based retrieval of MP3 songs for one singer using quantization tree indexing and melody-line tracking method | |
US20230351152A1 (en) | Music analysis method and apparatus for cross-comparing music properties using artificial neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20171017 |