RU2747442C2 - Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа - Google Patents
Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа Download PDFInfo
- Publication number
- RU2747442C2 RU2747442C2 RU2018145032A RU2018145032A RU2747442C2 RU 2747442 C2 RU2747442 C2 RU 2747442C2 RU 2018145032 A RU2018145032 A RU 2018145032A RU 2018145032 A RU2018145032 A RU 2018145032A RU 2747442 C2 RU2747442 C2 RU 2747442C2
- Authority
- RU
- Russia
- Prior art keywords
- zero
- values
- sequence
- information
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 64
- 238000004590 computer program Methods 0.000 title claims description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 44
- 230000003595 spectral effect Effects 0.000 claims abstract description 28
- 238000001228 spectrum Methods 0.000 claims abstract description 14
- 230000004907 flux Effects 0.000 claims abstract description 12
- 230000008859 change Effects 0.000 claims abstract description 7
- 238000001914 filtration Methods 0.000 claims description 17
- 238000005314 correlation function Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 14
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 42
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/02—Comparing digital values
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
- G06F2218/16—Classification; Matching by matching signal segments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к области обработки сигналов. Техническим результатом является обеспечение определения информации о подобии для одного или нескольких входных сигналов, которые являются звуковыми сигналами или видеосигналами. Раскрыто устройство для определения информации о подобии для одного или нескольких входных сигналов, которые являются звуковыми сигналами или видеосигналами, причем устройство сконфигурировано для определения информации о переходе через ноль, описывающей количество переходов через ноль в соответствующей части для множества частей по меньшей мере одного из упомянутого одного или нескольких входных сигналов, и причем устройство сконфигурировано для выполнения сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии, описывающую подобие между разными частями или сегментами одного входного сигнала либо между разными частями или сегментами двух сравниваемых сигналов; причем устройство сконфигурировано для определения двух или более характерных значений на каждый блок сигнала для множества блоков сигнала, причем упомянутые два или более характерных значения описывают признаки блоков сигнала, и причем упомянутые два или более характерных значения содержат значение перехода через ноль, которое является информацией о переходе через ноль; и причем устройство сконфигурировано для определения меры спектральной неравномерности в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала, и/или причем устройство сконфигурировано для определения значений спектрального потока в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала, причем значения спектрального потока описывают изменение между спектрами двух соответствующих последовательных блоков сигнала в виде одного количественного значения; причем устройство сконфигурировано для выполнения сравнения на основе упомянутых двух или более характерных значений, чтобы определить информацию о подобии, причем устройство сконфигурировано для выполнения первого сравнения на основе последовательности характерных значений первого типа для множества блоков сигнала и выполнения второго сравнения на основе последовательности характерных значений второго типа для множества блоков сигнала, причем устройство сконфигурировано для сравнения последовательности первых значений перехода через ноль, которая содержит множество значений перехода через ноль, и последовательности вторых значений перехода через ноль, которая содержит множество значений перехода через ноль, для получения информации о подобии, описывающей подобие между первым сегментом сигнала и вторым сегментом сигнала, причем последовательность первых значений перехода через ноль соответствует первому сегменту сигнала, и причем последовательность вторых значений перехода через ноль соответствует второму сегменту сигнала, и причем значения перехода через ноль составляют информацию о переходе через ноль; причем устройство сконфигурировано для сравнения результата первого сравнения и результата второго сравнения, чтобы получить информацию о надежности; причем устройство сконфигурировано для приема одного или нескольких звуковых сигналов или одного или нескольких видеосигналов в качестве упомянутого одного или нескольких входных сигналов и для определения информации о переходе через ноль на основе упомянутого одного или нескольких звуковых сигналов или на основе упомянутого одного или нескольких видеосигналов. 3 н. и 16 з.п. ф-лы, 8 ил.
Description
Область техники
В соответствии с настоящим изобретением один вариант осуществления относится к устройству для определения информации о подобии на основе одного или нескольких входных сигналов.
В соответствии с настоящим изобретением другой вариант осуществления относится к способу для определения информации о подобии на основе одного или нескольких входных сигналов.
В соответствии с изобретением один вариант осуществления относится к компьютерной программе для выполнения упомянутого способа.
В соответствии с изобретением другой вариант осуществления относится к устройству для определения информации об автокорреляции.
В соответствии с изобретением другой вариант осуществления относится к устройству для определения информации о взаимной корреляции.
Некоторые варианты осуществления относятся к высоконадежному способу корреляции с низкой вычислительной сложностью.
Уровень техники изобретения
Многие технические применения, например в области обработки звука, обработки видео или обработки сигналов, требуют получения информации о подобии на основе одного или нескольких входных сигналов. Например, иногда желательно сравнить два сдвинутых во времени сегмента одного входного сигнала, например, чтобы получить информацию о периодичности одного входного сигнала. Такая идея может использоваться для подготовки операций обработки звука (манипуляции со звуком) или для определения характеристик звукового сигнала. Например, с использованием этой идеи можно извлечь основную частоту из звукового сигнала. Также информация о подобии между разными частями одного и того же звукового сигнала может использоваться в ситуациях, в которых нужно временное расширение или временное сокращение звукового сигнала.
С другой стороны, также может быть желательно сравнить два разных входных сигнала и получить информацию о подобии входных сигналов. Например, информацию о подобии можно получить без применения сдвига во времени к одному из входных сигналов, или для однократного сдвига во времени между входными сигналами, или для нескольких значений сдвига во времени у входных сигналов. Сравнивая два входных сигнала, которые могут быть, например, звуковыми сигналами, можно классифицировать по меньшей мере один из звуковых сигналов. В качестве альтернативы можно найти подходящее время для выполнения перекрытия с суммированием между звуковыми сигналами.
Однако многие разные применения в области обработки звука или вообще обработки сигналов возможны на основе информации о подобии, описывающей подобие между двумя разными входными сигналами (звуковыми сигналами) или подобие между разными, сдвинутыми во времени частями одного входного сигнала (звукового сигнала).
Во встраиваемых системах, например цифровых процессорах сигналов (DSP), доступны лишь ограниченные ресурсы памяти и циклов процессора. Чтобы вычислять нужные алгоритмы в реальном масштабе времени, может быть желательно выполнить оптимизацию для соответствующей платформы. Эти оптимизации можно разделить приблизительно на две категории. Первая категория включает в себя оптимизации, которые пользуются определенной архитектурой процессора. Она включает в себя, например, приближения тригонометрических функций или использование быстрых FFT, или так называемых операций с одним потоком команд и многими потоками данных.
Вторая категория занимается, например, оптимизацией самих алгоритмов. Обнаружено, что если нужно вычислить, например, взаимную корреляцию для определения смещения времени между двумя звуковыми сигналами, то циклы процессора и пространство памяти ограничивают максимальное обнаруживаемое запаздывание.
Ниже будут описываться некоторые традиционные идеи. Обнаружено, что для сокращения нагрузки на память и вычислительной нагрузки часто может использоваться понижающая дискретизация. Обнаружено, что при использовании понижающей дискретизации с множителем 4 было бы сэкономлено 3/4 (то есть 75%) необходимой памяти, либо обнаруживаемое запаздывание увеличилось бы в четыре раза. Также обнаружено, что эта экономия нивелируется недостатками. Например, имеет место снижение точности. Результаты, которые получались с точностью до выборки, теперь доступны с максимальной точностью в n выборок, причем n описывает множитель понижающей дискретизации.
Кроме того, надежность снижается с увеличивающимся множителем понижающей дискретизации. Помехи, которые могут возникать во время передачи звука, сильно ухудшают результат. Это включает в себя шум, сжатие динамического диапазона, кодирование звука, ограничитель и фильтрацию (например, эквалайзер).
Обнаружено, что понижающую дискретизацию также можно понимать следующим образом: используется звуковая выборка из звукового потока с равноудаленными интервалами и, так сказать, представляет собой окружающие ее выборки. Количество окружающих выборок также может называться размером блока. В вышеприведенном примере размер n блока был бы равен 4. В качестве представителя этого блока использовалась бы каждая четвертая выборка из звукового потока. Для объяснения касательно понижающей дискретизации предполагается, что вышестоящий фильтр понижающей дискретизации уменьшает самую высокую возникающую частоту в n раз для соответствия критерию Найквиста.
Кроме того, обнаружено, что традиционная понижающая дискретизация дает существенные недостатки, например в плане надежности.
В связи с этой ситуацией необходима концепция для получения информации о подобии на основе одного или нескольких входных сигналов, которая способствует лучшему компромиссу между надежностью и вычислительной сложностью.
Сущность изобретения
В соответствии с изобретением один вариант осуществления создает устройство для определения информации о подобии на основе одного или нескольких входных сигналов. Устройство сконфигурировано для определения информации о переходе через ноль, описывающей количество переходов через ноль в соответствующей части для множества частей по меньшей мере одного из одного или нескольких входных звуковых сигналов. Устройство сконфигурировано для выполнения сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии.
Этот вариант осуществления основывается на выявлении того, что информация о переходе через ноль, которая описывает количество переходов через ноль в соответствующей части для множества частей, является очень надежной величиной, которую можно вычислить с умеренными вычислительными затратами, но допускает достоверное определение информации о подобии, описывающей подобие между разными частями (или сегментами) одного входного сигнала или между разными частями (или сегментами) двух сравниваемых входных сигналов. Информацию о переходе через ноль можно получить, например, подсчитывая количество переходов через ноль, и информация о переходе через ноль не изменяется сильно различными операциями обработки, которые могут применяться к одному или нескольким входным сигналам. Также информация о переходе через ноль может принимать вид последовательности одиночных целых чисел, которые можно ассоциировать (по отдельности) с последующими частями одного или нескольких входных сигналов. Таким образом, предоставляя, например, одно значение информации о переходе через ноль (или, в качестве альтернативы, два значения информации о переходе через ноль) на каждую часть одного или нескольких входных сигналов, причем каждая часть одного или нескольких входных сигналов может содержать множество выборок одного или нескольких входных сигналов, можно значительно уменьшить количество информации, и информация о переходе через ноль (значение перехода через ноль) может служить в качестве "представителя" соответствующей части одного или нескольких входных сигналов. Следовательно, сравнение значений информации о переходе через ноль или наборов либо последовательностей значений информации о переходе через ноль обычно гораздо эффективнее в вычислительном отношении, нежели сравнение всех сегментов одного или нескольких входных сигналов. Таким образом, выполнение сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии, эффективно в вычислительном отношении, но еще предоставляет достоверную информацию о подобии разных сегментов одного или нескольких входных сигналов (причем каждый из упомянутых сегментов обычно содержит множество частей по меньшей мере одного или нескольких входных сигналов, а следовательно, отображается в множество значений информации о переходе через ноль).
В предпочтительном варианте осуществления устройство сконфигурировано для определения общего количества переходов через ноль, или количества восходящих переходов через ноль, или количества нисходящих переходов через ноль в качестве информации о переходе через ноль для множества частей одного или нескольких входных сигналов. Обнаружено, что общее количество переходов через ноль, количество восходящих переходов через ноль и количество нисходящих переходов через ноль являются достоверной информацией, которая может использоваться отдельно или в сочетании для "представления" соответствующих частей одного или нескольких входных сигналов. Также следует отметить, что количество переходов через ноль можно легко вычислить путем подсчета, как часто знак одного или нескольких входных сигналов меняется с положительного на отрицательный, и/или наоборот.
В предпочтительном варианте осуществления устройство сконфигурировано для определения, в качестве информации о переходе через ноль, частоты переходов через ноль для множества частей по меньшей мере одного из одного или нескольких входных сигналов. Обнаружено, что частота переходов через ноль является конкретной, достоверной информацией. Например, частота переходов через ноль может учитывать даже изменение длины частей входных звуковых сигналов. С другой стороны, используя частоту переходов через ноль, можно даже сравнить сигналы, которые дискретизируются с разными частотами дискретизации (например, если произведение множителя понижающей дискретизации и частоты дискретизации дает одинаковый результат для обоих сигналов, то это означает, например, что характерные значения ассоциируются с одними и теми же единицами времени). Таким образом, обнаружено, что значение частоты переходов через ноль является очень достоверным представителем соответствующей части одного или нескольких входных сигналов.
В предпочтительном варианте осуществления устройство сконфигурировано для определения информации о переходе через ноль, так что по меньшей мере одно значение перехода через ноль ассоциируется с каждой частью из множества частей по меньшей мере одного из одного или нескольких входных сигналов. Таким образом, существует надежное представление сегмента по меньшей мере одного из одного или нескольких входных сигналов, причем упомянутый сегмент обычно содержит множество частей.
В предпочтительном варианте осуществления устройство сконфигурировано для определения последовательности первых значений перехода через ноль для первого сегмента сигнала, причем первый сегмент сигнала содержит множество блоков сигнала (или "частей" сигнала), и причем последовательность первых значений перехода через ноль содержит одно значение перехода через ноль (или, в некоторых случаях, больше одного значения перехода через ноль), ассоциированное с каждым из блоков сигнала (или частей сигнала) первого сегмента сигнала. Кроме того, устройство предпочтительно сконфигурировано для определения последовательности вторых значений перехода через ноль для второго сегмента сигнала, причем второй сегмент сигнала содержит множество блоков сигнала (или частей сигнала), и причем последовательность вторых значений перехода через ноль содержит одно значение перехода через ноль (или, в некоторых случаях, больше одного значения перехода через ноль), ассоциированное с каждым из блоков сигнала (или частей сигнала) второго сегмента сигнала. Таким образом, можно сравнить последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль для определения информации о подобии. Сравнение последовательностей значений перехода через ноль обеспечивает очень достоверный результат, поскольку каждая последовательность значений перехода через ноль содержит множество "характерных значений", представляющих соответствующий сегмент сигнала. Соответственно, надежность можно повысить путем оценивания последовательностей значений перехода через ноль при сравнении.
В предпочтительном варианте осуществления устройство сконфигурировано для сравнения последовательности первых значений перехода через ноль, которая содержит множество значений перехода через ноль, и последовательности вторых значений перехода через ноль, которая содержит множество значений перехода через ноль, для получения информации о подобии, описывающей подобие между первым сегментом сигнала и вторым сегментом сигнала, причем последовательность первых значений перехода через ноль соответствует первому сегменту сигнала, и причем последовательность вторых значений перехода через ноль соответствует второму сегменту сигнала, и причем значения перехода через ноль составляют информацию о переходе через ноль. Путем сравнения последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль можно получить достоверный результат сравнения. Также последовательность первых значений перехода через ноль обычно содержит гораздо меньше отдельных значений, чем первый сегмент сигнала, который представляется последовательностью первых значений перехода через ноль, и последовательность вторых значений перехода через ноль обычно содержит гораздо меньше отдельных значений, чем второй сегмент сигнала, который представляется последовательностью вторых значений перехода через ноль. В некоторых вариантах осуществления количество отдельных значений в последовательности первых значений перехода через ноль может быть по меньшей мере в 10 раз меньше количества отдельных (выборочных) значений первого сегмента сигнала. Такое же отношение может выдерживаться для количества отдельных значений в последовательности вторых значений перехода через ноль и количества отдельных (выборочных) значений второго сегмента сигнала. Таким образом, сравнение между последовательностями первых и вторых значений перехода через ноль может выполняться очень эффективно по сравнению со сравнением между выборочными значениями первого и второго сегментов сигнала. Кроме того, следует отметить, что последовательности значений перехода через ноль можно сравнивать с помощью любых традиционных алгоритмов, которые хорошо подходят для сравнения последовательностей значений, что допускает гибкую реализацию устройства.
В предпочтительном варианте осуществления устройство сконфигурировано для вычисления корреляционного значения с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, чтобы получить информацию о подобии. В качестве альтернативы устройство может конфигурироваться для вычисления значения разницы средней величины с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, чтобы получить информацию о подобии. В качестве другой альтернативы устройство может конфигурироваться для вычисления нормы разницы между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль для получения информации о подобии. В качестве еще одной альтернативы устройство может конфигурироваться для вычисления евклидова расстояния между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль для получения информации о подобии. Обнаружено, что вышеупомянутые эффективные в вычислительном отношении концепции для определения информации о подобии дают хороший результат сравнения.
В предпочтительном варианте осуществления устройство может конфигурироваться для вычисления множества значений меры разности между последовательностью первых значений перехода через ноль, или ее частью, и множеством сдвинутых во времени версий последовательности вторых значений перехода через ноль, или ее сдвинутых во времени частей, для получения информации о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью. Соответственно, можно определить, какое временное выравнивание между первым сегментом сигнала, который представляется последовательностью первых значений перехода через ноль, и вторым сегментом сигнала, который представляется последовательностью вторых значений перехода через ноль, способствует максимальному подобию. Следовательно, можно получить информацию, которая эквивалентна информации об автокорреляции, если первый сегмент сигнала и второй сегмент сигнала взяты из одного входного сигнала, или получить информацию, которая эквивалентна информации о взаимной корреляции, если первый сегмент сигнала и второй сегмент сигнала взяты из разных входных сигналов. Следовательно, информация об автокорреляции или информация о взаимной корреляции получается для разных значений отставания автокорреляции или значений отставания взаимной корреляции, причем значения отставания автокорреляции или значения отставания взаимной корреляции соответствуют соответствующим сдвигам во времени у сдвинутой во времени версии последовательности вторых значений перехода через ноль (или ее сдвинутой во времени части). Таким образом, последовательности значений перехода через ноль фактически могут использоваться для получения значений результата автокорреляционной функции или взаимно-корреляционной функции для разных значений отставания автокорреляции или значений отставания взаимной корреляции.
В предпочтительном варианте осуществления устройство сконфигурировано для вычисления корреляционной функции с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, чтобы получить информацию о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью. В качестве альтернативы устройство может конфигурироваться для вычисления функции разницы средней величины с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, для сравнения части последовательности первых значений перехода через ноль и сдвинутых во времени частей последовательности вторых значений перехода через ноль, и для получения информации о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью. Соответственно, можно надежно и эффективно определить, для какого сдвига во времени сегменты сигнала, лежащие в основе последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, содержат максимальное подобие. Также можно с небольшими затратами идентифицировать периодичность сегментов сигнала, лежащих в основе последовательности первых значений перехода через ноль и/или последовательности вторых значений перехода через ноль.
В предпочтительном варианте осуществления устройство сконфигурировано для вычисления корреляционной функции с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, чтобы получить информацию о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью. В качестве альтернативы устройство может конфигурироваться для вычисления функции разницы средней величины с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, для сравнения части последовательности первых значений перехода через ноль и сдвинутых во времени частей последовательности вторых значений перехода через ноль, и для получения информации о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью. Обнаружено, что вычисление корреляционной функции (которая обычно описывает корреляционные значения для разных сдвигов во времени у последовательностей значений перехода через ноль) составляет эффективный способ для определения информации о сдвигах во времени, которая обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль (или ее частью) и сдвинутой во времени версией последовательности вторых значений перехода через ноль (или ее частью), что позволяет, в свою очередь, прийти к информации о сдвиге во времени, который обеспечивает максимальное подобие между первым сегментом сигнала и (сдвинутой во времени версией) второго сегмента сигнала. Аналогичным образом вычисление функции разницы средней величины, которая обычно описывает разницу средней величины между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль для разных сдвигов во времени, позволяет получить информацию о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль (или ее частью) и сдвинутой во времени версией последовательности вторых значений перехода через ноль (или ее частью). Эта информация, в свою очередь, позволяет прийти к информации о сдвиге во времени, который обеспечивает максимальное подобие между первым сегментом сигнала и вторым сегментом сигнала.
Таким образом, обнаружено, что последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль хорошо подходят для вычисления корреляционной функции или функции разницы средней величины на ее основе.
В предпочтительном варианте осуществления устройство сконфигурировано для удаления постоянной составляющей из последовательности первых значений перехода через ноль и из последовательности вторых значений перехода через ноль перед сравнением последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль. Обнаружено, что удаление постоянной составляющей (например, среднего значения или т. п.) из последовательностей первых и вторых значений перехода через ноль упрощает оценку и сравнение последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль.
В предпочтительном варианте осуществления устройство сконфигурировано для удаления постоянной составляющей (например, "значения DC" или среднего значения) из одного или нескольких входных сигналов и/или применения фильтрации верхних частот к одному или нескольким входным сигналам перед определением информации о переходе через ноль. Обнаружено, что удаление такой "постоянной составляющей" гарантирует, что информация о переходе через ноль получается с хорошей или даже максимальной точностью.
В варианте осуществления устройство сконфигурировано для определения двух или более характерных значений на каждый блок сигнала для множества блоков сигнала, причем упомянутые два или более характерных значения описывают признаки блока сигнала, и причем упомянутые два или более характерных значения содержат значение перехода через ноль (которое является информацией о переходе через ноль). В этом случае устройство сконфигурировано для выполнения сравнения на основе двух или более характерных значений на каждый блок сигнала, чтобы определить информацию о подобии. Этот вариант осуществления основывается на выявлении того, что надежность концепции можно повысить, если значение перехода через ноль (которое считается "информацией о переходе через ноль") дополняется другой характерной величиной (значением), которая описывает другой признак блоков сигнала.
В предпочтительном варианте осуществления характерные значения содержат "положительное значение перехода через ноль", описывающее количество восходящих переходов через ноль в соответствующем блоке сигнала, и "отрицательное значение перехода через ноль", описывающее количество нисходящих переходов через ноль в соответствующем блоке сигнала, на каждый блок сигнала. Используя такие характерные значения, можно выполнять проверку надежности. В частности, можно проверить, пропущены ли восходящие переходы через ноль или нисходящие переходы через ноль, поскольку количество нисходящих переходов через ноль и количество восходящих переходов через ноль должно быть очень похожим.
В предпочтительном варианте осуществления устройство сконфигурировано для выполнения первого сравнения на основе последовательности характерных значений первого типа для множества блоков сигнала и выполнения второго сравнения на основе последовательности характерных значений второго типа для множества блоков сигнала. В этом случае устройство сконфигурировано для сравнения результата первого сравнения и результата второго сравнения, чтобы получить информацию о надежности. Таким образом, надежность способа можно проверить, используя два разных типа характерных значений и сравнивая результаты, полученные с использованием двух разных типов характерных значений. В частности, если есть несовпадение между результатами, полученными с использованием первого типа характерных значений, которое превышает некоторое (пороговое) значение, то можно сделать вывод, что ненадежен либо первый тип характерных значений, либо второй тип характерных значений, либо оба типа характерных значений. В этом случае может формироваться предупреждение, указывающее, что сравнение ненадежно.
В предпочтительном варианте осуществления устройство сконфигурировано для определения одного из двух характерных значений, которые определяются для соответствующего блока сигнала, с использованием представления соответствующего блока сигнала в частотной области. Обнаружено, что надежность может повысить использование представления в частотной области соответствующего блока сигнала, чтобы получить характерное значение, поскольку некоторые типы обработки и искажения влияют только на представление входного сигнала (например, звукового сигнала) во временной области, но обладают небольшим влиянием на представление в частотной области.
В предпочтительном варианте осуществления устройство сконфигурировано для определения мер спектральной неравномерности в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала. Обнаружено, что меры спектральной неравномерности дают хорошее представление для некоторых типов входных сигналов (например, для звуковых сигналов).
В предпочтительном варианте осуществления устройство сконфигурировано для определения значений спектральной неравномерности, описывающих неравномерность спектра соответствующего блока сигнала, в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала. Обнаружено, что значения спектральной неравномерности, описывающие неравномерность спектра соответствующего блока сигнала, способствуют хорошей надежности информации о подобии.
В предпочтительном варианте осуществления устройство сконфигурировано для определения значений спектрального потока (описывающих, например, как быстро меняется энергетический спектр сигнала) в качестве одного из двух (или более) характерных значений, которые определяются на каждый блок сигнала, причем значения спектрального потока описывают изменение между спектрами двух соответствующих последовательных блоков сигнала в виде одного количественного значения. Обнаружено, что использование значений спектрального потока позволяет получить очень достоверную информацию о подобии для некоторых типов входных сигналов, например, для звуковых сигналов.
В предпочтительном варианте осуществления устройство сконфигурировано для определения коэффициентов линейного предсказания для соответствующего блока сигнала в качестве одного из двух (или более) характерных значений, которые определяются на каждый блок сигнала. Обнаружено, что коэффициенты линейного предсказания также являются величинами, которые дают достоверную информацию о подобии по меньшей мере для некоторых типов входных сигналов (например, для звуковых сигналов).
В предпочтительном варианте осуществления устройство сконфигурировано для приема одного или нескольких звуковых сигналов, либо одного или нескольких видеосигналов, либо одного или нескольких сигналов датчика в качестве одного или нескольких входных сигналов. В этом случае устройство сконфигурировано для определения информации о переходе через ноль на основе одного или нескольких звуковых сигналов, либо на основе одного или нескольких видеосигналов, либо на основе одного или нескольких сигналов датчика. Обнаружено, что частота переходов через ноль составляет очень достоверную характерную величину для частей "технических сигналов", например, звуковых сигналов, видеосигналов и сигналов датчика. Звуковые сигналы и видеосигналы обычно являются сигналами, которые постоянно меняют свой знак, причем частота переходов через ноль обладает хорошей корреляцией со звуковым контентом или визуализируемым контентом, представленным упомянутыми звуковыми сигналами или видеосигналами. Также многие сигналы датчика имеют такие характеристики. Таким образом, следует отметить, что описанное в этом документе устройство также может применяться к другим техническим достоверным сигналам, например, сигналам датчика от разных типов физических датчиков. Так как вектор входного сигнала будет "освобожден" от компонента DC (например, от среднего значения) перед обработкой (то есть компонент DC будет удален), такие сигналы также будут содержать переходы через ноль, которые можно оценивать с использованием обсуждаемой в этом документе концепции.
В качестве дополнительного замечания следует отметить, что компонент DC (например, постоянная составляющая или среднее значение) в некоторых вариантах осуществления будет удален из входного сигнала и из вектора характерных значений.
В предпочтительном варианте осуществления устройство сконфигурировано для использования информации о подобии, чтобы получить информацию об автокорреляции касательно звукового сигнала или видеосигнала. В качестве альтернативы устройство может конфигурироваться для использования информации о подобии, чтобы получить информацию о взаимной корреляции относительно двух звуковых сигналов или относительно двух видеосигналов. В качестве альтернативы устройство может конфигурироваться для использования информации о подобии, чтобы определить сдвиг во времени для получения наилучшего возможного выравнивания между двумя звуковыми сигналами, или чтобы определить сдвиг во времени для получения наилучшего возможного выравнивания между двумя видеосигналами. Обнаружено, что использование информации о переходе через ноль в качестве характерного значения, представляющего часть входного сигнала, предусматривает очень эффективную в вычислительном отношении концепцию для определения информации об автокорреляции, или информации о взаимной корреляции, или сдвига во времени, чтобы получить наилучшее возможное выравнивание между двумя звуковыми сигналами или между двумя видеосигналами. Обнаружено, что представление частей одного или нескольких входных сигналов с помощью информации о переходе через ноль (или значений перехода через ноль) сокращает объем данных (то есть вычислительную нагрузку) для определения информации об автокорреляции, информации о взаимной корреляции или сдвига во времени, чтобы получить наилучшее возможное выравнивание.
В соответствии с изобретением один вариант осуществления создает способ для определения информации о подобии на основе одного или нескольких входных сигналов. Способ содержит определение информации о переходе через ноль, описывающей количество переходов через ноль в соответствующей части для множества частей по меньшей мере одного из одного или нескольких входных сигналов. Способ дополнительно содержит выполнение сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии. Этот способ основывается на тех же соображениях, что рассмотрены выше для соответствующего устройства.
Другой вариант осуществления в соответствии с изобретением создает компьютерную программу для выполнения этого способа, когда компьютерная программа исполняется на компьютере.
В соответствии с изобретением один вариант осуществления создает устройство для определения информации об автокорреляции, которая описывает подобие между разными сегментами одного сигнала, который является звуковым сигналом или видеосигналом. Устройство содержит анализатор перехода через ноль, сконфигурированный для определения информации о переходе через ноль для множества блоков сигнала, которая содержит по меньшей мере одно значение перехода через ноль на каждый блок (также обозначенный как часть) сигнала. Значения перехода через ноль описывают количество переходов через ноль для соответствующего блока (или части) сигнала. Компаратор последовательностей значений перехода через ноль сконфигурирован для сравнения последовательности первых значений перехода через ноль из значений перехода через ноль, ассоциированных с первым сегментом сигнала, с последовательностью вторых значений перехода через ноль из значений перехода через ноль, ассоциированных со вторым сегментом сигнала, чтобы получить информацию об автокорреляции. Это устройство для определения информации об автокорреляции основывается на тех же соображениях, которые уже упомянуты выше.
Другой вариант осуществления в соответствии с изобретением создает устройство для определения информации о взаимной корреляции, которая описывает подобие между первым сигналом и вторым сигналом, которые являются звуковыми сигналами или видеосигналами. Устройство содержит анализатор перехода через ноль, сконфигурированный для определения информации о переходе через ноль для множества блоков (или частей) первого сигнала, которая содержит по меньшей мере одно значение перехода через ноль на каждый блок первого сигнала, и для определения информации о переходе через ноль для множества блоков второго сигнала, которая содержит по меньшей мере одно значение перехода через ноль на каждый блок второго сигнала. Значения перехода через ноль описывают количество переходов через ноль для соответствующего блока соответствующего сигнала. Устройство также содержит компаратор последовательностей значений перехода через ноль, сконфигурированный для сравнения последовательности значений перехода через ноль из значений перехода через ноль, ассоциированных с сегментом первого сигнала, с последовательностью значений перехода через ноль из значений перехода через ноль, ассоциированных с сегментом второго сигнала, чтобы получить информацию о взаимной корреляции. Это устройство хорошо подходит для получения информации о взаимной корреляции на основе двух звуковых сигналов или двух видеосигналов, причем вычислительную сложность можно снизить с использованием значений перехода через ноль в качестве характерных значений для блоков (или частей) сигналов.
Краткое описание чертежей
Варианты осуществления в соответствии с настоящим изобретением будут описываться позднее со ссылкой на приложенные фигуры, на которых:
Фиг. 1 показывает блок-схему устройства для определения информации о подобии в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 2 показывает блок-схему устройства для определения информации о подобии в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 3 показывает блок-схему устройства для определения информации о подобии в соответствии с другим вариантом осуществления настоящего изобретения;
Фиг. 4 показывает схематическое представление определения информации о подобии для случая, в котором вычисляется автокорреляция;
Фиг. 5 показывает схематическое представление определения информации о подобии для случая, в котором используется взаимная корреляция;
Фиг. 6 показывает подробное схематическое представление определения последовательности значений перехода через ноль; и
Фиг. 7 показывает блок-схему алгоритма способа для определения информации о подобии в соответствии с вариантом осуществления настоящего изобретения.
1. Устройство для определения информации о подобии в соответствии с фиг. 1
Фиг. 1 показывает блок-схему устройства для определения информации о подобии на основе одного или нескольких входных сигналов в соответствии с вариантом осуществления настоящего изобретения.
Устройство в соответствии с фиг. 1 полностью обозначается цифрой 100.
Устройство 100 содержит определение 110 информации о переходе через ноль, которое конфигурируется для приема по меньшей мере одного входного сигнала 112 и предоставления информации 114 о переходе через ноль на основе по меньшей мере одного входного сигнала. Например, определение (или определитель) 110 информации о переходе через ноль может конфигурироваться для определения информации 114 о переходе через ноль так, что информация 114 о переходе через ноль описывает количество переходов через ноль в соответствующей части для множества частей по меньшей мере одного входного сигнала из одного или нескольких входных сигналов 112. Устройство дополнительно содержит сравнение (или компаратор) 120, которое принимает информацию 114 о переходе через ноль и которое на ее основе предоставляет информацию 122 о подобии. Например, сравнение (или компаратор) 120 может конфигурироваться для выполнения сравнения на основе информации 114 о переходе через ноль, чтобы определить информацию 122 о подобии. Например, сравнение 120 может конфигурироваться для выполнения корреляционной операции (например, автокорреляционной операции или взаимно-корреляционной операции) на основе информации 114 о переходе через ноль. В качестве альтернативы сравнение 120 может вычислять значение разницы средней величины, или норму разницы, или евклидово расстояние на основе разных значений (или наборов значений) информации о переходе через ноль. Соответственно, можно получить информацию 122 о подобии.
Что касается функциональных возможностей устройства 100, то можно упомянуть, что информация о переходе через ноль, которая получается для множества частей по меньшей мере одного входного сигнала 112, используется в качестве "характерной информации", причем, например, каждое значение информации 114 о переходе через ноль представляет часть (например, блок выборок) входного сигнала 112. Иначе говоря, непрерывная во времени либо дискретная (дискретизированная) часть входного сигнала 112 "отображается" в одно значение, которое представляет количество переходов через ноль в упомянутой части, например, в виде одиночного целого значения. Таким образом, вся часть входного сигнала 112, содержащая несколько (например, 10 или больше) выборочных значений, отображается в одно значение информации о переходе через ноль (или, в некоторых вариантах осуществления, в два значения информации о переходе через ноль, причем одно представляет количество восходящих переходов через ноль, а другое представляет количество нисходящих переходов через ноль). Однако обнаружено, что информация о переходе через ноль является очень компактной, но достоверной характерной информацией, так что выведение информации 114 о переходе через ноль из частей входного сигнала 112 приводит к тому, что сравнению 120 нужно обрабатывать только относительно небольшое количество информации.
Сравнение 120 сравнивает соответствующие значения перехода через ноль в информации 114 о переходе через ноль для получения информации о подобии. Другими словами, если устройству 100 нужно сравнить два сегмента входного сигнала 112, то значения перехода через ноль, соответствующие этим двум сегментам, эффективно сравниваются с помощью сравнения 120, например, с использованием корреляционной операции, операции вычисления значения разницы средней величины, вычисления нормы разницы или вычисления евклидова расстояния. Аналогичным образом, если устройству 100 нужно сравнить два сегмента разных входных сигналов, то с помощью сравнения 120 сравниваются значения перехода через ноль, ассоциированные с этими сегментами.
В результате обнаружено, что значительно эффективнее в вычислительном отношении выводить значения перехода через ноль (информацию 114 о переходе через ноль) из входного сигнала, а затем сравнивать относительно небольшое количество значений перехода через ноль с использованием сравнения 120 по сравнению со сравнением довольно большого количества выборочных значений в сегментах одного или нескольких входных сигналов, которые нужно сравнить.
Однако следует отметить, что устройство 100 в соответствии с фиг. 1 можно дополнить любым из описанных в этом документе признаков и функциональных возможностей, по отдельности либо в сочетании.
2. Устройство в соответствии с фиг. 2
Фиг. 2 показывает блок-схему устройства 200 для определения информации о подобии на основе одного или нескольких входных сигналов. Устройство 200 сконфигурировано для приема входного сигнала 212 и предоставления на его основе информации 222 о подобии и/или информации 232 о сдвиге во времени. Устройство 200 содержит определитель 210 значения перехода через ноль, который также можно рассматривать как вычислитель значения перехода через ноль и который может, например, осуществлять функциональные возможности определения 110 информации о переходе через ноль. Определитель 210 значения перехода через ноль может, например, принимать входной сигнал. Однако при необходимости к входному сигналу 212 может применяться "удаление DC" или фильтрация верхних частот (блок 216) для получения входного сигнала 218 с нулевым средним. Другими словами, определитель 210 значения перехода через ноль предпочтительно принимает входной сигнал с нулевым средним, потому что количество переходов через ноль является наиболее достоверным для такого входного сигнала с нулевым средним. Если нужно допустить, что входной сигнал 212 не обязательно содержит нулевое среднее, то рекомендуется применять удаление DC/фильтрацию 216 верхних частот перед вводом сигнала в определитель 210 значения перехода через ноль.
Определитель 210 значения перехода через ноль предоставляет обычно одно (в некоторых вариантах осуществления даже два) значение перехода через ноль для каждой рассматриваемой части входного сигнала 212 (или входного сигнала 218 с нулевым средним). Соответственно, определитель 210 значения перехода через ноль эффективно предоставляет последовательность 214 значений перехода через ноль, которая может считаться информацией о переходе через ноль. Последовательность 214 значений перехода через ноль может содержать, например, последовательность значений перехода через ноль, при этом каждое ассоциируется с частью входного сигнала 212, 218 и каждое описывает количество переходов через ноль (восходящих переходов через ноль, или нисходящих переходов через ноль, или восходящих и нисходящих переходов через ноль) в ассоциированной части входного сигнала.
Устройство 200 также содержит сравнение (или компаратор) 220 последовательностей значений перехода через ноль, функциональные возможности которого аналогичны функциональным возможностям сравнения 120. Сравнение 220 последовательностей значений перехода через ноль принимает последовательность 214 значений перехода через ноль, предоставленную определителем 210 значения перехода через ноль, или версию 228 с нулевым средним последовательности 214 значений перехода через ноль. Например, последовательность 214 значений перехода через ноль может содержать одно неотрицательное целое значение для каждой части входного сигнала 212, 218. Однако в некоторых случаях сравнение последовательностей значений перехода через ноль можно реализовать проще, если сравнение 220 последовательностей значений перехода через ноль принимает входную последовательность с нулевым средним. С этой целью при необходимости может присутствовать удаление DC или фильтр 226 верхних частот, который принимает последовательность 214 значений перехода через ноль и на ее основе предоставляет версию 228 с нулевым средним последовательности значений перехода через ноль. Например, удаление DC/фильтрация 226 верхних частот может определить среднее значение у значений последовательности 214 значений перехода через ноль и вычесть среднее значение из отдельных значений последовательности 214 значений перехода через ноль, чтобы получить отдельные значения версии 228 с нулевым средним последовательности значений перехода через ноль, которая используется в качестве входной величины для сравнения 220 последовательностей значений перехода через ноль. Сравнение 220 последовательностей значений перехода через ноль может использовать или оценивать две последовательности значений перехода через ноль (или подпоследовательности), которые ассоциируются со сравниваемыми сегментами входного сигнала 212. Например, сравнение 220 последовательностей значений перехода через ноль может конфигурироваться для вычисления "автокорреляционного" значения на основе двух последовательностей значений перехода через ноль (или подпоследовательностей). Результат упомянутого вычисления автокорреляционного значения может составить информацию 222 о подобии.
Однако сравнение последовательностей значений перехода через ноль может использовать другие подходы для сравнения последовательностей значений перехода через ноль или подпоследовательностей значений перехода через ноль. Некоторым из этих концепций сравнения может не требоваться удаление DC/фильтрация 226 верхних частот, тогда как другие методики сравнения (например, вычисление автокорреляционного значения) могут извлекать пользу из удаления DC/фильтрации 226 верхних частот.
Сравнение 220 последовательностей значений перехода через ноль при необходимости может сравнивать несколько пар последовательностей значений перехода через ноль или подпоследовательностей значений перехода через ноль и, соответственно, предоставлять множество значений информации о подобии, которые представляют подобия между разными парами сегментов входных сигналов.
Устройство при необходимости дополнительно содержит вычисление 230 сдвига во времени. Вычисление 230 сдвига во времени может конфигурироваться, например, для приема информации 222 о подобии, которая описывает подобия между множеством пар сегментов входного сигнала 212, 218. Кроме того, вычисление 230 сдвига во времени может конфигурироваться для идентификации значения информации о подобии из множества упомянутой информации о подобии, которое представляет или сигнализирует максимальное подобие, чтобы посредством этого сделать вывод, какая пара сегментов входного сигнала 212, 218 содержит максимальное подобие. Соответственно, информация 232 о сдвиге во времени может определяться с помощью вычисления 230 сдвига во времени, чтобы описать сдвиг во времени между двумя сегментами входного сигнала 212, 218, которые содержат максимальное подобие. Соответственно, устройство 200 может эффективно получать информацию 232 о сдвиге во времени, смысл которой аналогичен запаздыванию, для которого информация об автокорреляции содержит пик.
Таким образом, предоставленная устройством 200 информация 232 о сдвиге во времени может использоваться, например, для обнаружения периодичности во входном сигнале 212, 218 и представления интервала периодичности.
Однако устройство 200 в соответствии с фиг. 2 можно дополнить любым из описанных в этом документе признаков или функциональных возможностей, по отдельности либо в сочетании.
3. Устройство в соответствии с фиг. 3
Фиг. 3 показывает блок-схему устройства 300 для определения информации о подобии. Устройство 300 сконфигурировано для приема первого сегмента 312 сигнала ("сегмента 1 сигнала") и второго сегмента 314 сигнала ("сегмента 2 сигнала"). Первый сегмент 312 сигнала и второй сегмент 314 сигнала являются сравниваемыми сегментами сигнала и могут быть двумя сегментами одного и того же сигнала. В качестве альтернативы первый сегмент 312 сигнала может быть сегментом первого сигнала, а второй сегмент 314 сигнала может быть сегментом второго сигнала. Сегменты 312, 314 сигнала могут перекрываться или не перекрываться во времени. При необходимости первое удаление DC или фильтрация 316 верхних частот может применяться к первому сегменту сигнала. Аналогичным образом удаление DC или фильтрация 318 верхних частот при необходимости может применяться ко второму сегменту 314 сигнала. Функциональные возможности удаления DC/фильтрации 316, 318 верхних частот сопоставимы с функциональными возможностями удаления DC/фильтрации 216 верхних частот.
Устройство 300 также содержит определитель 320 значения перехода через ноль (также обозначенный как вычислитель значения перехода через ноль), который сконфигурирован для приема первого сегмента 312 сигнала и второго сегмента 314 сигнала или их версий с нулевым средним, предоставленных удалениями 316, 318 DC. Определитель значения перехода через ноль может, например, определить количество восходящих переходов через ноль (отрицательно-положительных переходов через ноль), или количество нисходящих переходов через ноль (положительно-отрицательных переходов через ноль), или количество восходящих и нисходящих переходов через ноль для каждой из множества частей (или блоков) первого сегмента 312 сигнала. Аналогичным образом определитель 320 значения перехода через ноль может конфигурироваться для определения или вычисления количества восходящих переходов через ноль, или количества нисходящих переходов через ноль, или количества восходящих и нисходящих переходов через ноль для каждой из множества частей (или блоков) второго сегмента 314 сигнала. Соответственно, определитель значения перехода через ноль может конфигурироваться для предоставления последовательности 322 значений перехода через ноль для первого сегмента 312 сигнала (то есть ассоциированной с ним), причем упомянутая последовательность 322 значений перехода через ноль содержит значения перехода через ноль, ассоциированные с частями (или блоками) первого 312 сегмента сигнала (например, ровно одно или ровно два неотрицательных целых значения для каждой части или блока первого сегмента 312 сигнала). Аналогичным образом последовательность 324 вторых значений перехода через ноль, которая предоставляется определителем 320 значения перехода через ноль для второго сегмента 314 сигнала, может содержать ровно одно или ровно два неотрицательных целых значения для каждой части или блока второго сегмента 314 сигнала (каждое из отдельных значений, представляющих количество восходящих переходов через ноль, или количество нисходящих переходов через ноль, или количество общих переходов через ноль в соответствующей части, с которой ассоциируется соответствующее отдельное значение).
Устройство 300 при необходимости может дополнительно содержать удаление DC или фильтрацию 326 верхних частот, которая может удалять среднее значение из последовательности 322 первых значений перехода через ноль или которая может фильтровать верхние частоты у последовательности 322 первых значений перехода через ноль. Аналогичным образом устройство может содержать удаление DC или фильтрацию 328 верхних частот, которая удаляет среднее значение из последовательности 324 значений перехода через ноль или фильтрует верхние частоты у последовательности 324 значений перехода через ноль.
Устройство 300 также содержит сравнение 330 последовательностей значений перехода через ноль (или компаратор значений перехода через ноль), которое конфигурируется для приема последовательности 322 первых значений перехода через ноль или ее версии с нулевым средним, предоставленной удалением DC/фильтром 326 верхних частот, и последовательности 324 вторых значений перехода через ноль или ее версии с нулевым средним, предоставленной удалением DC/фильтром 328 верхних частот. Сравнение последовательностей значений перехода через ноль сконфигурирован для сравнения последовательности 222 первых значений перехода через ноль (или ее версии с нулевым средним) и последовательности 324 вторых значений перехода через ноль (или ее версии с нулевым средним) для получения информации о подобии (которая может принимать вид одного значения подобия). Например, сравнение 330 последовательностей значений перехода через ноль может конфигурироваться для вычисления взаимно-корреляционного значения, значения функции разницы средней величины, нормы L1 или евклидова расстояния на основе последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, при помощи чего последовательность 322 первых значений перехода через ноль сравнивается с последовательностью 324 вторых значений перехода через ноль. Таким образом, информацию 332 о подобии, которая может представляться, например, одиночным значением, ассоциированным со сравнением между двумя последовательностями 322, 324 значений перехода через ноль, можно предоставить на основе сравнения последовательностей значений перехода через ноль. Однако информация о подобии также может содержать последовательность значений, которые предоставляются для сравнений разных пар последовательностей значений перехода через ноль или для сравнений разных подпоследовательностей двух последовательностей значений перехода через ноль. Например, информация 332 о подобии может содержать взаимно-корреляционное значение, взаимно-корреляционную функцию (то есть взаимно-корреляционные значения для множества значений отставания взаимной корреляции) или значение функции разницы средней величины.
Устройство 300 при необходимости также может содержать вычисление 340 сдвига во времени, которое может, например, принимать несколько значений информации о подобии, ассоциированных со сравнением разных пар последовательностей значений перехода через ноль или подпоследовательностей значений перехода через ноль. Например, вычисление 340 сдвига во времени может определять, для какой пары последовательностей значений перехода через ноль или для какой пары подпоследовательностей значений перехода через ноль возникает максимальное подобие. Другими словами, вычисление сдвига во времени может использовать информацию о подобии для нескольких сегментов сигнала или для нескольких последовательностей значений перехода через ноль.
Устройство 300 при необходимости также может содержать определитель значения признака/вычислитель 350 значения признака, который может конфигурироваться для определения или вычисления одного или нескольких значений дополнительного признака. Одно или несколько значений дополнительного признака могут описывать или представлять одну часть (или блок) первого сегмента сигнала или второго сегмента сигнала. Например, может быть одно значение дополнительного признака, ассоциированное с каждым значением перехода через ноль в последовательности 322 первых значений перехода через ноль и в последовательности 324 вторых значений перехода через ноль.
Таким образом, в дополнение к сравнению последовательностей значений перехода через ноль можно сравнивать одну или несколько последовательностей значений дополнительного признака, чтобы получить информацию 332 о подобии. Например, сравнение между последовательностью 322 первых значений перехода через ноль и последовательностью 324 вторых значений перехода через ноль, каждая из которых содержит n значений, можно вычислить с помощью сравнения 330 последовательностей значений перехода через ноль, чтобы получить первую частичную информацию о подобии. К тому же можно сравнить первую последовательность значений признака и вторую последовательность значений признака, каждая из которых содержит n значений признака, чтобы получить второй частичный результат сравнения. В конечном счете можно объединить первый частичный результат сравнения (или первую частичную информацию о подобии) и второй частичный результат сравнения (или частичную информацию о подобии) для получения информации 332 о подобии. Таким образом, для сравнения некоторого первого сегмента сигнала с некоторым вторым сегментом сигнала последовательность значений перехода через ноль и последовательность значений дополнительного признака, ассоциированную с некоторым первым сегментом сигнала, можно использовать при сравнении, и с тем же успехом при сравнении можно использовать последовательность вторых значений перехода через ноль и вторую последовательность значений дополнительного признака. Таким образом, результат сравнения между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль можно объединить с результатом сравнения между первой последовательностью значений дополнительного признака и второй последовательностью значений дополнительного признака для получения информации о подобии. Следовательно, каждая часть или блок первого сегмента сигнала представляется двумя характерными значениями, значением перехода через ноль и значением дополнительного признака, и каждый блок второго сегмента сигнала также представляется по меньшей мере двумя характерными значениями, а именно значением перехода через ноль и значением дополнительного признака. Используя два типа представителей (значение перехода через ноль и значение дополнительного признака), можно повысить надежность сравнения, так что информацию 322 о подобии можно считать более надежной. Информация 332 о подобии может выводиться с помощью различных типов объединения первого частичного результата сравнения и второго частичного результата сравнения. Например, можно вычислить среднее и/или среднее взвешенное первого частичного результата сравнения и второго частичного результата сравнения. В качестве альтернативы можно использовать минимальное значение первого частичного результата сравнения и второго частичного результата сравнения для получения информации 332 о подобии. Однако можно использовать другие подходы линейной или нелинейной комбинации для вывода информации 332 о подобии из первого частичного результата сравнения и второго частичного результата сравнения.
4. Пример в соответствии с фиг. 4
Ниже будет описываться пример для определения информации о подобии со ссылкой на фиг. 4.
Фиг. 4 в первой строке 410 показывает представление первого сигнала. Абсцисса 412 описывает время. Как видно, сигнал подразделяется на два последующих неперекрывающихся сегмента 420, 422 ("сегмент 1", "сегмент 2"). Первый сегмент 420 подразделяется во времени на n=3 неперекрывающихся блока 422, 424, 426 (также обозначенные как части). Каждый из блоков 422, 424, 426 содержит набор выборочных значений, которые указываются вертикальными линиями, пересекающими ось времени.
Первое значение перехода через ноль "значение 1 перехода через ноль" определяется или вычисляется на основе выборочных значений "сигнала 1", которые во времени располагаются в первом блоке 422. Аналогичным образом второе значение перехода через ноль "значение 2 перехода через ноль" определяется или вычисляется на основе выборочных значений, которые во времени располагаются во втором блоке 424. Кроме того, третье значение перехода через ноль "значение 3 перехода через ноль" определяется или вычисляется на основе выборочных значений, которые во времени располагаются в третьем блоке 426.
Аналогичным образом дополнительные значения перехода через ноль ("значение 4 перехода через ноль", "значение 5 перехода через ноль", "значение 6 перехода через ноль") вычисляются на основе выборок "сигнала 1", которые располагаются в четвертом блоке 432, в пятом блоке 434 или в шестом блоке 436. Таким образом, каждое из значений перехода через ноль может считаться характерным значением соответствующего блока значений сигнала или выборок сигнала, для которого оно вычислялось.
Кроме того, можно упомянуть, что последовательность первых значений перехода через ноль ассоциируется с первым сегментом 420 первого сигнала (сигнала 1), а последовательность вторых значений перехода через ноль ассоциируется со вторым сегментом 430 первого сигнала (сигнала 1). Например, последовательность первых значений перехода через ноль содержит значение перехода через ноль, ассоциированное с первым блоком 422, значение перехода через ноль, ассоциированное со вторым блоком 424, и значение перехода через ноль, ассоциированное с третьим блоком 426. Последовательность вторых значений перехода через ноль содержит значение перехода через ноль, ассоциированное с четвертым блоком 432, значение перехода через ноль, ассоциированное с пятым блоком 434, и значение перехода через ноль, ассоциированное с шестым блоком 436. Последовательность первых значений перехода через ноль иллюстрируется по номеру 450 ссылки, а последовательность вторых значений перехода через ноль иллюстрируется по номеру 456 ссылки. Следует отметить, что последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль могут соответствовать информации 114 о переходе через ноль, или последовательности 214 значений перехода через ноль, или последовательностям 322, 324 первых и вторых значений перехода через ноль. Таким образом, последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль можно предоставить с помощью определения 110 информации о переходе через ноль или определителя 210, 320 значения перехода через ноль. Кроме того, последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль можно сравнить с помощью сравнения 120 или с помощью сравнения 220, 330 последовательностей значений перехода через ноль. Например, последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль можно сравнить с использованием вычисления корреляции. В качестве альтернативы могут использоваться другие концепции для сравнения двух последовательностей значений, как описано в этом документе.
Таким образом, получается значение подобия, которое представляет (или описывает) подобие между первым сегментом 420 (на котором основывается последовательность первых значений перехода через ноль) и вторым сегментом 430 (на котором основывается последовательность вторых значений перехода через ноль). Другими словами, значение подобия представляет подобие тех сегментов входного сигнала, на которых основываются последовательности значений перехода через ноль, которые сравнивают.
В качестве другого примера сравнение перекрывающихся сегментов первого сигнала (сигнала 1) показано по номеру 440 ссылки. Как видно, третий сегмент, содержащий блоки сигнала или сегменты сигнала "блок 1", "блок 2", "блок 3" и "блок 4", сравнивается с четвертым сегментом "сегмент 4", который содержит блоки сигнала или части сигнала "блок 4", "блок 5", "блок 6" и "блок 7". Аналогично упомянутому раньше случаю, одно значение перехода через ноль ассоциируется с каждым из упомянутых блоков с "блока 1" по "блок 7", причем значения перехода через ноль обозначаются "значением 1a перехода через ноль" по "значение 7a перехода через ноль".
Соответственно, третья последовательность значений перехода через ноль содержит значения перехода через ноль с 1a по 4a, а четвертая последовательность значений перехода через ноль содержит значения перехода через ноль с 4a по 7a. Соответственно, можно сравнить третью последовательность значений перехода через ноль и четвертую последовательность значений перехода через ноль, причем значение 1a перехода через ноль сравнивается со значением 4a перехода через ноль, причем значение 2a перехода через ноль сравнивается со значением 5a перехода через ноль, и т. п. Соответственно, можно сравнивать перекрывающиеся сегменты (сегмент 3 и сегмент 4) одного сигнала, причем сегменты представляются "перекрывающимися" последовательностями значений перехода через ноль. Естественно, не нужно несколько раз вычислять те значения перехода через ноль, которые являются общими для двух (или более) последовательностей значений перехода через ноль. Точнее, для сравнения достаточно вычислить каждое значение перехода через ноль только один раз и выбрать те подмножества значений перехода через ноль, соответствующие сравниваемым сегментам сигнала.
5. Пример в соответствии с фиг. 5
Далее будет описываться исполнение сравнения сигналов (или их частей) со ссылкой на фиг. 5. Сравнение может соответствовать, например, взаимной корреляции, в которой блоки (или части) сравниваемых сегментов сигнала представляются значениями перехода через ноль.
Представление по номеру 510 ссылки показывает сегмент 520 первого сигнала, причем этот сегмент содержит первый блок 522, второй блок 524 и третий блок 526, причем блоки 522, 524, 526 являются, например, неперекрывающимися, непосредственно следующими временными частями сегмента 520 сигнала. Каждый из блоков 522, 524, 526 может содержать некоторое количество выборок сигнала, если сигнал дискретный, причем выборки сигнала представляются вертикальными линиями, пересекающими ось 512 времени (абсциссу). Первое значение перехода через ноль у первого сигнала (значения 1,1 перехода через ноль) ассоциируется с первым блоком 522, второе значение перехода через ноль (значение 1,2 перехода через ноль) у первого сигнала ассоциируется со вторым блоком 524, и третье значение перехода через ноль (значение 1,3 перехода через ноль) ассоциируется с третьим блоком 526.
Аналогичным образом имеется второй сигнал, который отличается от первого сигнала и который представляется по номеру 530 ссылки. Абсцисса 532 описывает время. Для сравнения выбирается сегмент сигнала (здесь обозначенный как "второй сегмент сигнала" 540) второго сигнала. Второй сигнал 540 содержит блоки 542, 544, 546, которые также обозначаются как "значение 2,3 перехода через ноль", "значение 2,4 перехода через ноль" и "значение 2,5 перехода через ноль". Таким образом, последовательность первых значений перехода через ноль, содержащая значения перехода через ноль "значения 1,1 перехода через ноль", "значение 1,2 перехода через ноль" и "значение 1,3 перехода через ноль", ассоциируется с (первым) сегментом 520 сигнала первого сигнала, который выбирается для сравнения. Аналогичным образом последовательность вторых значений перехода через ноль, содержащая значения перехода через ноль "значение 2,3 перехода через ноль", "значение 2,4 перехода через ноль" и "значение 2,5 перехода через ноль", ассоциируется со (вторым) сегментом 540 сигнала второго сигнала, причем упомянутый (второй) сегмент 540 выбран для сравнения. Соответственно, сравнивается последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль, чтобы получить информацию о подобии, описывающую подобие между первым сегментом 520 сигнала и вторым сегментом 540 сигнала. Снова блоки или части первого сегмента 520 сигнала представляются отдельными значениями последовательности первых значений перехода через ноль, а блоки или части второго сегмента 540 сигнала представляются отдельными значениями последовательности вторых значений перехода через ноль.
Приходим к выводу, что сравнение полных сегментов 520, 540 сигнала, содержащих большое количество отдельных выборочных значений первого сигнала и второго сигнала, заменяется сравнением последовательностей значений перехода через ноль. Однако количество значений в последовательности значений перехода через ноль обычно гораздо меньше количества выборочных значений сигнал в сегменте сигнала, представленном последовательностью значений перехода через ноль. Например, количество значений перехода через ноль, необходимых для представления сегмента сигнала, может быть меньше в 10 раз или даже еще больше, чем количество выборок сигнала в дискретном представлении сегмента сигнала. Таким образом, сравнение последовательностей значений перехода через ноль требует гораздо меньше времени, нежели сравнение сегментов сигнала, представленных выборочными значениями сигнала.
6. Пример в соответствии с фиг. 6
Фиг. 6 показывает схематическое представление того, как выводить значения перехода через ноль из сигнала, например, звукового сигнала или видеосигнала.
Сегмент сигнала представляется по номеру 610 ссылки. Абсцисса 612 описывает время, а ордината 614 описывает значения сигнала. Эволюция сигнала во времени описывается кривой 620.
Даже если кривая показана в виде непрерывной во времени кривой 620, сигнал можно, конечно, представить также с помощью дискретных выборок, обладающих достаточным временным разрешением. Однако для сравнения сегмент 630 сигнала задается (произвольно). Этот сегмент 630 сигнала, который задается начальным временем t0 и конечным временем t3, подразделяется на три временных части или блока: первый блок 632, начинающийся в момент t0 и заканчивающийся в момент t1, второй блок 634, начинающийся в момент t1 и заканчивающийся в момент t2, и третий блок 636, начинающийся в момент t2 и заканчивающийся в момент t3. Как видно, можно легко идентифицировать переходы через ноль. Переходы через ноль являются точками, в которых значение рассматриваемого сигнала пересекает "нулевую линию", то есть ординату 612. Восходящие переходы через ноль можно отличить от нисходящих переходов через ноль. Например, восходящий переход через ноль является точкой, в которой значение сигнала равно нулю, причем значение сигнала отрицательное прямо перед упомянутым переходом через ноль, и причем значение сигнала положительное сразу после перехода через ноль, что можно легко определить для непрерывных во времени сигналов. Однако для дискретных сигналов переход через ноль можно идентифицировать, если первая выборка принимает отрицательное значение, а непосредственно следующее выборочное значение принимает положительное значение. Восходящий переход через ноль также можно идентифицировать, если первое выборочное значение принимает отрицательное значение, непосредственно следующее выборочное значение принимает нулевое значение, а другое непосредственно следующее выборочное значение принимает положительное значение.
Нисходящий переход через ноль находится в точке, причем значение сигнала принимает нулевое значение для случая, когда значение сигнала положительное прямо перед переходом через ноль, и значение сигнала отрицательное сразу после перехода через ноль. Это можно легко идентифицировать для непрерывных во времени сигналов. Для дискретных сигналов нисходящий переход через ноль можно идентифицировать, если обнаруживается, что первое выборочное значение принимает положительное значение, а непосредственно следующее второе выборочное значение принимает отрицательное значение. Также в качестве частного случая нисходящий переход через ноль можно идентифицировать, если первое выборочное значение принимает положительное значение, непосредственно следующее второе выборочное значение принимает нулевое значение, а другое непосредственно следующее третье выборочное значение принимает отрицательное значение.
Ссылаясь, например, на первый блок 632, можно идентифицировать три восходящих перехода через ноль (отмеченные "x"). Также можно идентифицировать три нисходящих перехода через ноль (отмеченные "⋅"). Как упоминалось выше, идентификация возможна как для непрерывных во времени сигналов (например, с использованием аналоговой схемы), так и для дискретных сигналов (например, с использованием цифровой оценки, как обсуждалось раньше).
Ссылаясь на второй блок 634, видно, что можно идентифицировать шесть восходящих переходов через ноль и пять нисходящих переходов через ноль. В третьем блоке 636 можно идентифицировать четыре восходящих перехода через ноль и пять нисходящих переходов через ноль.
В зависимости от фактической реализации определителя значения перехода через ноль и сравнения последовательностей значений перехода через ноль количество восходящих переходов через ноль в разных блоках и/или количество нисходящих переходов через ноль в отдельных блоках может считаться отдельными признаками. В некоторых вариантах осуществления оценивается только количество восходящих переходов через ноль в разных блоках. В других вариантах осуществления оценивается только количество нисходящих переходов через ноль в отдельных блоках. В некоторых вариантах осуществления оценивается количество восходящих переходов через ноль в отдельных блоках и количество нисходящих переходов через ноль в отдельных блоках. Однако в некоторых других вариантах осуществления оценивается общее количество переходов через ноль в отдельных блоках (в том плане, что количество общих переходов через ноль в разных блоках составляет последовательность значений перехода через ноль).
Пример последовательности значений перехода через ноль (в виде последовательности цифр 6, 11 и 9) показан по номеру 650 ссылки.
Таким образом, последовательность значений перехода через ноль 6, 11, 9 можно ассоциировать, например, с "сегментом 1" 630. Другой сегмент сигнала или другого сигнала можно представить другой последовательностью значений перехода через ноль (например, последовательностью 7, 12, 8). Конечно, последовательности значений перехода через ноль могут иметь разные длины.
Следовательно, сравнение, которое выполняется с помощью сравнения последовательностей значений перехода через ноль, может выполняться на основе последовательностей значений перехода через ноль, ассоциированных с разными сегментами одного сигнала или ассоциированных с сегментами разных сравниваемых сигналов.
7. Способ в соответствии с фиг. 7
Фиг. 7 показывает блок-схему способа для определения информации о подобии на основе одного или нескольких входных сигналов. Способ 700 содержит определение 710 информации о переходе через ноль, описывающей количество переходов через ноль в соответствующей части входного сигнала для множества частей по меньшей мере одного из одного или нескольких входных сигналов. Способ 700 также содержит выполнение 720 сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии.
Следует отметить, что способ 700 основывается на тех же соображениях, что рассмотрены выше по отношению к устройствам 100, 200, 300. Также способ 700 можно дополнить любым из описанных в этом документе признаков и функциональных возможностей, например, по отношению к соответствующим устройствам.
8. Применения
Варианты осуществления в соответствии с настоящим изобретением могут применяться в различных технических устройствах. Например, описанные выше устройства могут использоваться в анализаторе сигналов для анализа звукового сигнала, видеосигнала, сигнала датчика от физического датчика или любых других электрических либо оптических сигналов. Аналогичным образом описанные в этом документе устройства могут использоваться в процессоре сигналов для обработки звукового сигнала, видеосигнала, сигнала датчика от физического датчика, измеряющего физическую величину, или другого электрического сигнала либо оптического сигнала.
В качестве примера описанное в этом документе устройство может использоваться в звуковом процессоре для выравнивания звуковых сигналов. В качестве альтернативы описанное в этом документе устройство может использоваться при определении высоты тона, причем описанное в этом документе устройство может выполнять функциональные возможности "автокорреляции", которые содержат сравнение разных сегментов сигнала.
Однако многие разные применения описанного в этом документе устройства можно реализовать со звуковым кодером или звуковым декодером.
9. Дополнительные аспекты и выводы
Варианты осуществления в соответствии с изобретением основываются на выявлении того, что количество переходов через ноль (например, заданное в виде изменения знака) в блоке идентифицировано как характерное значение для очень надежных оценок. Например, значение, представляющее упомянутое количество переходов через ноль в блоке, может представлять некоторое количество "окружающих" выборок (например, выборок соответствующего блока). Обнаружено, что имеет второстепенное значение то, используются все изменения знака (или все переходы через ноль) либо только изменения с отрицательного на положительный (восходящие переходы через ноль) или с положительного на отрицательный (нисходящие переходы через ноль). Таким образом, представитель (например, значение, представляющее выборки блока входного сигнала) включает в себя количество изменений знака в его блоке (входного сигнала). Для функционирования этого способа предпочтительно, чтобы постоянная составляющая (компонент DC) удалялась из сигнала (например, из входного сигнала или из нескольких входных сигналов) перед подсчетом (например, подсчетом переходов через ноль). Это удаление постоянной составляющей может считаться "удалением DC" или "фильтрацией DC".
Потоки данных представителей (то есть потоки данных, содержащие значения, представляющие количество переходов через ноль в разных блоках одного или нескольких сигналов, например, последовательности значений перехода через ноль) могут поступать во взаимную корреляцию (например, в сравнение 120 или в сравнение 220, 330 последовательностей значений перехода через ноль) для вычисления запаздывания между потоками (например, запаздывания между разными последовательностями значений перехода через ноль). Потом результаты можно умножить на размер n блока (например, представляющий размер блока входного сигнала в выборках) для достижения настоящего смещения (например, сдвига во времени между двумя входными сигналами в виде выборок).
Чтобы взаимная корреляция предоставила достоверный результат, также следует удалить постоянную составляющую (например, "компонент DC") или среднее из обоих потоков данных (например, из обеих последовательностей значений перехода через ноль). Это может выполняться, например, с помощью удаления DC/фильтрации 226 или удаления DC/фильтрации 326, 328. Если используется общее количество переходов через ноль, то все значения могут быть положительными (или нулем в некоторых исключительных случаях). Однако при использовании последовательности положительных значений в некоторых случаях нельзя добиться достоверного результата из корреляции.
Однако описанный в этом документе способ не ограничивается взаимной корреляцией. Он также может использоваться для применений, которые используют автокорреляцию. Например, сошлемся на сравнение 220 последовательностей значений перехода через ноль, которое может применять, например, такую автокорреляцию.
В качестве необязательного расширения способа можно использовать два представителя на каждый блок. Например, один представитель может отдельно хранить (или представлять) количество изменений с положительного на отрицательный (например, количество нисходящих переходов через ноль в блоке), а один может отдельно хранить (или представлять) количество изменений с отрицательного на положительный (например, восходящие переходы через ноль). Если доступна дополнительная мощность обработки для одновременного выполнения корреляций (причем одна корреляция может работать на последовательностях значений перехода через ноль, представляющих количество восходящих переходов через ноль, и одна корреляция может работать на последовательности значений перехода через ноль, представляющей количество нисходящих переходов через ноль), то надежность дополнительно повышается, поскольку можно сравнить оба результата, и можно получить меру надежности. Следует отметить, что в некоторых случаях оба значения почти идентичны. Однако в некоторых случаях эта концепция полезна. Таким образом, если используются дополнительные признаки, то иногда предпочтительно, чтобы признаки были разными, что будет описываться ниже.
Результаты проверки показали, что в этих способах размер блока отходит на задний план по отношению к надежности. Поэтому главным (или иногда единственным) решающим фактором является то, какой точности нужно достичь для соответствующего применения.
Также следует отметить, что описанные в этом документе устройства и способы могут использоваться для всех коррелируемых типов сигнала. Описанная в этом документе концепция не ограничивается звуковыми применениями, даже если концепция дает очень полезные результаты при использовании для звуковых сигналов.
Ниже будут описываться некоторые необязательные расширения.
В частности, при необходимости может использоваться один или несколько дополнительных признаков в описанных в этом документе вариантах осуществления.
Описанный в этом документе способ можно изменить и расширить с использованием разных признаков. Например, при обработке звуковых сигналов значения, вычисленные из сигнала, которые могут использоваться для описания сигнала, идентифицируются в качестве признаков. Они включают в себя количество переходов через ноль или частоту переходов через ноль. Оба можно равнозначно использовать в вариантах осуществления изобретения. Иначе говоря, упомянутые в этом документе значения перехода через ноль могут описывать количество переходов через ноль в соответствующей части входного сигнала или (среднее) количество переходов через ноль в единицу времени в блоке входного сигнала.
Кроме того, помимо признаков, которые можно вычислить из количества переходов через ноль (во временной области), также можно вычислить другие признаки во временной области или в частотной области. Такое определение дополнительных признаков или значений признака показано, например, по номеру 350 ссылки на фиг. 3. Для вычисления в частотной области каждый блок выборок можно перенести в частотную область с использованием дискретного преобразования Фурье (или другого преобразования в частотной области, или преобразования из временной области в частотную область), и из вычисленного спектра определяются признаки или значения признака. Эти признаки включают в себя, например, меру спектральной неравномерности и/или спектральный поток (либо значения спектрального потока). Спектральный поток является мерой изменения между двумя последующими спектрами (например, между спектрами, ассоциированными с последующими блоками входного сигнала) и вычисляется из нормы вектора (например, нормы L2) разности обоих спектров или из расстояния между двумя спектральными векторами. Дополнительные возможные признаки включают в себя коэффициенты LPC (коэффициенты кодирования с линейным предсказанием).
Кроме того, в качестве дополнительных признаков могут использоваться значения, полученные с помощью понижающей дискретизации одного или нескольких входных сигналов (в дополнение к значениям перехода через ноль). Кроме простой понижающей дискретизации, могут использоваться другие характерные значения. Примеры включают в себя энергию блока, средние значения выборок или коэффициент амплитуды. Даже если эти представления блоков не дают надежных результатов при определении в одиночку для обширного набора тестовых данных, они могут дополнять значения перехода через ноль в качестве значений дополнительного признака.
Однако следует отметить, что также можно извлечь другие значения признака из представления в частотной области блока (или части) на основе одного или нескольких входных сигналов. Например, положение спектрального максимума могло бы представляться с помощью значения признака. В качестве альтернативы количество пиков спектра могло бы представляться с помощью значения признака. В качестве другого варианта с помощью значения признака мог бы представляться наклон спектра, описывающий то, как спектр меняется с частотой.
Эти дополнительные признаки или значения признака можно использовать в сравнение последовательностей значений признака (например, в сравнении 220 последовательностей значений признака или в сравнении 330 последовательностей значений признака) в том плане, что при сравнении используются последовательность значений перехода через ноль и последовательность значений признака, содержащая значения дополнительного признака, представляющие иные признаки, нежели значения перехода через ноль.
Следует отметить, что дополнительные функции при необходимости можно использовать для вычисления смещения времени. Эти дополнительные функции могут использоваться в дополнение к автокорреляции или взаимной корреляции либо в качестве замены автокорреляции или взаимной корреляции. Для определения смещения времени (например, между двумя входными сигналами) можно вычислить корреляционную функцию.
В качестве альтернативы можно определить "функцию разницы средней величины" (AMDF).
В принципе, смещение времени можно определить путем сравнения представления x(t) сигнала (или сегмента сигнала) со сдвинутым во времени представлением x(t+d), причем переменная d является смещением времени. Например, x1(t) можно сравнить с x1(t+d) или x2(t+d), причем x1 - первый сигнал, а x2 - второй сигнал. Представление x может быть сигналом (или одним из двух или более сигналов), или сигналом с пониженной дискретизацией, или основанным на признаке представлением в соответствии с описанным в этом документе изобретением. Смещение времени соответствует d, которое максимизирует подобие между x(t) и x(t+d) (или между x1(t) и x2(t+d)).
Корреляцию можно вычислить путем умножения каждой выборки из блока на каждую выборку из сдвинутого во времени блока, а потом сложения всех произведений. Это соответствует скалярному произведению (внутреннему произведению) при рассмотрении обоих блоков в качестве векторов.
Могут использоваться альтернативные меры подобия, например, норма L1 либо евклидово расстояние. При использовании нормы L1 вычисляется среднее значение поэлементной разницы между x(t) и x(t+d), или между x1(t) и x1(t+d), или между x1(t) и x2(t+d).
Другими словами, для выполнения автокорреляции на основе входного сигнала x1 нужно определить подобие между частями сигнала x1(t) и x1(t+d) для разных значений "отставания автокорреляции" d, и нужно определить, для какого d результирующее значение подобия принимает максимальное значение. x1(t) представляется последовательностью первых значений перехода через ноль, а x1(t+d) представляется последовательностью вторых значений перехода через ноль, причем последовательность вторых значений перехода через ноль зависит от выбранного d. Сравнивая последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль для разных значений d, можно определить, для какого значения d последовательность первых значений перехода через ноль и последовательность вторых значений перехода через ноль (которые все принадлежат сигналу x1, только для разных значений d) больше всего похожи. Следовательно, можно определить значение d, максимизирующее подобие.
В качестве альтернативы может определяться взаимная корреляция между двумя входными сигналами x1(t) и x2(t). Сегменты сигнала, ассоциированные с x1(t) и x2(t+d), можно сравнить, например, для разных значений d путем сравнения последовательностей значений перехода через ноль, ассоциированных с x1(t) и x2(t+d). Результат сравнения соответствующих последовательностей значений перехода через ноль дает хороший вывод о подобии соответствующих сигналов x1(t) и x2(t+d).
Таким образом, сравнивая последовательности значений перехода через ноль (например, с использованием автокорреляции, взаимной корреляции или любой другой функции сравнения), можно получить численный результат, который является хорошей оценкой прямого сравнения между лежащими в основе частями x1(t) и x1(t+d) или x1(t) и x2(t+d) сигнала.
Ниже будут даны некоторые дополнительные комментарии и кратко описаны некоторые дополнительные необязательные расширения.
Следует отметить, что даже корреляция с точностью до выборки привела к ошибочным обнаружениям при использовании для выборочных данных. Эти ошибочные обнаружения не появляются при использовании обсуждаемого в этом документе способа с переходом через ноль. Таким образом, используя итеративную концепцию или способ, который основывается на использовании в начале способа с переходом через ноль, можно улучшить результат корреляции с точностью до выборки. Например, корреляцию с точностью до выборки можно использовать, как только получен более грубый результат с использованием описанного в этом документе подхода с переходом через ноль. Таким образом, описанная в этом документе концепция также может обладать преимуществом помимо оптимизации вычислительных затрат, а именно алгоритмическим преимуществом.
Кроме того, раскрытые в этом документе варианты осуществления при необходимости можно дополнить блоком (или этапом) проверки надежности, который определяет информацию о надежности по отношению к результату корреляции. Например, можно вычислить спектральную неравномерность или меру спектральной неравномерности по результату корреляции (например, по автокорреляционной функции или по взаимно-корреляционной функции). Мера спектральной неравномерности служит в качестве меры качества для качества результатов корреляции. Чем больше пик возвышается над окружением, тем надежнее результат. Другими словами, блок проверки надежности может вычислить меру спектральной неравномерности автокорреляционной функции (например, автокорреляционной функции 222) или взаимно-корреляционной функции (например, взаимно-корреляционной функции 332) и может вывести информацию о надежности (описывающую надежность соответствующей корреляционной функции) из меры спектральной неравномерности.
Кроме того, раскрытые в этом документе варианты осуществления при необходимости можно расширить выполнением итеративного поиска. Например, на первом этапе может использоваться сравнительно большой размер блока (например, частей по меньшей мере одного входного сигнала), так что каждое из значений перехода через ноль представляет такой сравнительно большой блок. Соответственно, можно получить грубый результат (например, информацию о подобии), который не сильно чувствителен к небольшим сдвигам во времени. Потом (например, на втором этапе) можно использовать сравнительно меньший размер блока (например, частей по меньшей мере одного входного звукового сигнала), чтобы получить уточненную информацию о подобии. Используемый на втором этапе диапазон поиска (например, диапазон, на котором вычисляется последовательность значений перехода через ноль) может зависеть от результата первого этапа. Соответственно, первый этап, использующий сравнительно большие блоки (с которыми ассоциируется соответствующее значение перехода через ноль) и, соответственно, сравнительно большой диапазон поиска, может использоваться для определения диапазона поиска, используемого на втором этапе, причем диапазон поиска на втором этапе может быть меньше диапазона поиска на первом этапе (например, из-за меньшего размера блока, используемого на втором этапе).
В заключение описано несколько вариантов осуществления, в которых использование значений перехода через ноль, или последовательностей значений перехода через ноль, позволяет приблизительно получить результат автокорреляции или взаимной корреляции одного или нескольких технически значимых сигналов (например, звуковых сигналов, видеосигналов или т.п.), причем сложность можно сохранить небольшой, и причем качество результатов обычно очень хорошее.
Также следует отметить, что варианты осуществления в соответствии с изобретением могут использоваться для измерения запаздывания, как упоминалось выше.
10. Альтернативные варианты реализации
Хотя некоторые аспекты описаны применительно к устройству, понято, что эти аспекты также представляют собой описание соответствующего способа, причем блок или устройство соответствует этапу способа или признаку этапа способа. По аналогии аспекты, описанные применительно к этапу способа, также представляют собой описание соответствующего блока или элемента либо признака соответствующего устройства. Некоторые или все этапы способа могут исполняться аппаратным устройством (или с его использованием), например микропроцессором, программируемым компьютером или электронной схемой. В некоторых вариантах осуществления таким устройством может исполняться один или несколько самых важных этапов способа.
В зависимости от некоторых требований к реализации варианты осуществления изобретения можно реализовать в аппаратных средствах или в программном обеспечении. Реализация может осуществляться с использованием цифрового носителя информации, например дискеты, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, содержащего сохраненные на нем электронно считываемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой так, что выполняется соответствующий способ. Поэтому цифровой носитель информации может быть машиночитаемым.
Некоторые варианты осуществления в соответствии с изобретением содержат носитель информации с электронно считываемыми управляющими сигналами, которые допускают взаимодействие с программируемой компьютерной системой так, что выполняется один из описанных в этом документе способов.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт исполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных в этом документе способов, сохраненную на машиночитаемом носителе.
Другими словами, вариант осуществления патентоспособного способа поэтому является компьютерной программой с программным кодом для выполнения одного из описанных в этом документе способов, когда компьютерная программа исполняется на компьютере.
Дополнительный вариант осуществления патентоспособных способов поэтому является носителем информации (или цифровым запоминающим носителем, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных в этом документе способов. Носитель информации, цифровой запоминающий носитель или носитель записи обычно являются материальными и/или неизменяемыми со временем.
Дополнительный вариант осуществления патентоспособного способа поэтому является потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из описанных в этом документе способов. Поток данных или последовательность сигналов могут конфигурироваться, например, для передачи по соединению передачи данных, например по Интернету.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, сконфигурированные или приспособленные для выполнения одного из описанных в этом документе способов.
Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для выполнения одного из описанных в этом документе способов.
Дополнительный вариант осуществления в соответствии с изобретением содержит устройство или систему, сконфигурированные для передачи приемнику (например, электронно или оптически) компьютерной программы для выполнения одного из описанных в этом документе способов. Приемник может быть, например, компьютером, мобильным устройством, запоминающим устройством или т.п. Устройство или система могут, например, содержать файл-сервер для передачи компьютерной программы приемнику.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей описанных в этом документе способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнить один из описанных в этом документе способов. Как правило, способы предпочтительно выполняются любым аппаратным устройством.
Описанное в этом документе устройство можно реализовать с использованием аппаратного устройства или с использованием компьютера, или с использованием сочетания аппаратного устройства и компьютера.
Описанное в этом документе устройство или любые компоненты описанного в этом документе устройства можно по меньшей мере частично реализовать в аппаратных средствах и/или в программном обеспечении.
Описанные в этом документе способы можно выполнять с использованием аппаратного устройства или с использованием компьютера, или с использованием сочетания аппаратного устройства и компьютера.
Описанные в этом документе способы или любые компоненты описанного в этом документе устройства могут по меньшей мере частично выполняться аппаратными средствами и/или программным обеспечением.
Вариант осуществления создает устройство для определения информации о подобии на основе одного или нескольких входных сигналов, как описано в этом документе.
Другой вариант осуществления создает способ для выполнения любых функциональных возможностей устройства, описанного или заявленного в этом документе.
Другой вариант осуществления создает компьютерную программу для выполнения упомянутого способа.
Вышеописанные варианты осуществления являются всего лишь пояснительными для принципов настоящего изобретения. Подразумевается, что модификации и изменения описанных в этом документе компоновок и подробностей будут очевидны другим специалистам в данной области техники. Поэтому есть намерение ограничиться только объемом предстоящей формулы изобретения, а не определенными подробностями, представленными посредством описания и объяснения вариантов осуществления в этом документе.
Claims (59)
1. Устройство (100; 200; 300) для определения информации (122; 222; 332) о подобии для одного или нескольких входных сигналов (112; 212; 312, 314), которые являются звуковыми сигналами или видеосигналами,
причем устройство сконфигурировано для определения информации (114; 214; 322, 324) о переходе через ноль, описывающей количество переходов через ноль в соответствующей части (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) для множества частей по меньшей мере одного из упомянутого одного или нескольких входных сигналов, и
причем устройство сконфигурировано для выполнения сравнения на основе информации о переходе через ноль, чтобы определить информацию о подобии, описывающую подобие между разными частями или сегментами одного входного сигнала либо между разными частями или сегментами двух сравниваемых сигналов;
причем устройство сконфигурировано для определения двух или более характерных значений на каждый блок сигнала для множества блоков сигнала,
причем упомянутые два или более характерных значения описывают признаки блоков сигнала, и
причем упомянутые два или более характерных значения содержат значение перехода через ноль, которое является информацией о переходе через ноль; и
причем устройство сконфигурировано для определения меры спектральной неравномерности в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала, и/или
причем устройство сконфигурировано для определения значений спектрального потока в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала,
причем значения спектрального потока описывают изменение между спектрами двух соответствующих последовательных блоков сигнала в виде одного количественного значения;
причем устройство сконфигурировано для выполнения сравнения на основе упомянутых двух или более характерных значений, чтобы определить информацию о подобии,
причем устройство сконфигурировано для выполнения первого сравнения на основе последовательности характерных значений первого типа для множества блоков сигнала и выполнения второго сравнения на основе последовательности характерных значений второго типа для множества блоков сигнала,
причем устройство сконфигурировано для сравнения последовательности (322; 450) первых значений перехода через ноль, которая содержит множество значений перехода через ноль, и последовательности (324; 456) вторых значений перехода через ноль, которая содержит множество значений перехода через ноль, для получения информации о подобии, описывающей подобие между первым сегментом (420) сигнала и вторым сегментом (430) сигнала,
причем последовательность первых значений перехода через ноль соответствует первому сегменту сигнала, и причем последовательность вторых значений перехода через ноль соответствует второму сегменту сигнала, и
причем значения перехода через ноль составляют информацию о переходе через ноль;
причем устройство сконфигурировано для сравнения результата первого сравнения и результата второго сравнения, чтобы получить информацию о надежности;
причем устройство сконфигурировано для приема одного или нескольких звуковых сигналов или одного или нескольких видеосигналов в качестве упомянутого одного или нескольких входных сигналов (112; 212; 312, 314) и для определения информации (114; 214; 322, 324) о переходе через ноль на основе упомянутого одного или нескольких звуковых сигналов или на основе упомянутого одного или нескольких видеосигналов.
2. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для определения общего количества переходов через ноль, или количества восходящих переходов через ноль, или количества нисходящих переходов через ноль в качестве информации (114; 214; 322, 324) о переходе через ноль для множества частей (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) упомянутого по меньшей мере одного из упомянутого одного или нескольких входных сигналов.
3. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для определения частоты переходов через ноль в качестве информации (114; 214; 322, 324) о переходе через ноль для множества частей (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) упомянутого по меньшей мере одного из упомянутого одного или нескольких входных сигналов.
4. Устройство по п. 1, причем устройство (100; 200; 300) сконфигурировано для определения информации (114; 214; 322, 324) о переходе через ноль, так что по меньшей мере одно значение перехода через ноль ассоциируется с каждой частью (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) из множества частей упомянутого по меньшей мере одного из упомянутого одного или нескольких входных сигналов.
5. Устройство (100; 200; 300) по п. 1,
причем устройство сконфигурировано для определения последовательности (114, 214, 322, 450) первых значений перехода через ноль для первого сегмента (420; 520) сигнала, причем первый сегмент сигнала содержит множество блоков (422, 424, 426; 522, 524, 526) сигнала, и причем последовательность первых значений перехода через ноль содержит одно или несколько значений перехода через ноль, ассоциированных с каждым из блоков сигнала первого сегмента сигнала; и
причем устройство сконфигурировано для определения последовательности (114, 214, 324, 456) вторых значений перехода через ноль для второго сегмента (430; 540) сигнала, причем второй сегмент сигнала содержит множество блоков (432, 434, 436; 542, 544, 546) сигнала, и причем последовательность вторых значений перехода через ноль содержит одно или несколько значений перехода через ноль, ассоциированных с каждым из блоков сигнала второго сегмента сигнала.
6. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для вычисления корреляционного значения с использованием последовательности (322; 450) первых значений перехода через ноль и последовательности (324; 456) вторых значений перехода через ноль для получения информации (122; 222; 332) о подобии; или
причем устройство сконфигурировано для вычисления значения разницы средней величины с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, чтобы получить информацию о подобии; или
причем устройство сконфигурировано для вычисления нормы разницы между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль для получения информации о подобии; или
причем устройство сконфигурировано для вычисления евклидова расстояния между последовательностью первых значений перехода через ноль и последовательностью вторых значений перехода через ноль для получения информации о подобии.
7. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для вычисления множества значений меры разности между последовательностью первых значений перехода через ноль, или ее частью, и множеством сдвинутых во времени версий последовательности вторых значений перехода через ноль, или ее сдвинутых во времени частей, чтобы получить информацию (232; 342) о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью.
8. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для вычисления корреляционной функции с использованием последовательности (322; 450) первых значений перехода через ноль и последовательности (324; 456) вторых значений перехода через ноль, чтобы получить информацию (232; 342) о сдвиге во времени, который обеспечивает максимальное подобие между последовательностью первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией последовательности вторых значений перехода через ноль, или ее частью; или
причем устройство сконфигурировано для вычисления функции разницы средней величины с использованием последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль, для сравнения части последовательности первых значений перехода через ноль и сдвинутых во времени частей последовательности вторых значений перехода через ноль, и для получения информации о сдвиге (d) во времени, который обеспечивает максимальное подобие между последовательностью (x1(t); 322; 450) первых значений перехода через ноль, или ее частью, и сдвинутой во времени версией (x2(t+d)) последовательности (x2(t); 324; 456) вторых значений перехода через ноль, или ее частью.
9. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для удаления постоянной составляющей из последовательности (114; 214; 322) первых значений перехода через ноль и/или из последовательности (324) вторых значений перехода через ноль перед сравнением последовательности первых значений перехода через ноль и последовательности вторых значений перехода через ноль.
10. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для удаления постоянной составляющей из упомянутого одного или нескольких входных сигналов (112; 212; 312, 314) и/или применения фильтрации верхних частот к упомянутому одному или нескольким входным сигналам перед определением информации о переходе через ноль.
11. Устройство (100; 200; 300) по п. 1, в котором характерные значения содержат положительное значение перехода через ноль, описывающее количество восходящих переходов через ноль в соответствующем блоке сигнала, и отрицательное значение перехода через ноль, описывающее количество нисходящих переходов через ноль в соответствующем блоке сигнала, на каждый блок сигнала.
12. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для определения одного из двух характерных значений, которые определяются на каждый блок сигнала, с использованием представления соответствующего блока сигнала в частотной области.
13. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для определения значений спектральной неравномерности, описывающих неравномерность спектра соответствующего блока сигнала, в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала.
14. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для определения коэффициентов линейного предсказания (LPC) для соответствующего блока сигнала в качестве одного из двух характерных значений, которые определяются на каждый блок сигнала.
15. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для приема одного или нескольких звуковых сигналов или одного или нескольких видеосигналов в качестве упомянутого одного или нескольких входных сигналов (112; 212; 312, 314) и для определения информации (114; 214; 322, 324) о переходе через ноль на основе упомянутого одного или нескольких звуковых сигналов или на основе упомянутого одного или нескольких видеосигналов.
16. Устройство (100; 200; 300) по п. 1, причем устройство сконфигурировано для использования информации (122; 222; 332) о подобии, чтобы получить информацию об автокорреляции касательно звукового сигнала или видеосигнала; или
причем устройство сконфигурировано для использования информации о подобии, чтобы получить информацию о взаимной корреляции относительно двух звуковых сигналов или относительно двух видеосигналов; или
причем устройство сконфигурировано для использования информации о подобии, чтобы определить сдвиг (232; 342) во времени для получения наилучшего возможного выравнивания между двумя звуковыми сигналами, или чтобы определить сдвиг (232; 342) во времени для получения наилучшего возможного выравнивания между двумя видеосигналами.
17. Устройство по п. 1, причем устройство сконфигурировано для определения на первом этапе первой информации о переходе через ноль с использованием размера первого блока и для выполнения сравнения на основе первой информации о переходе через ноль, чтобы получить информацию, представляющую сдвиг во времени между подобными областями упомянутого одного или нескольких входных сигналов, и
причем устройство сконфигурировано для определения на втором этапе второй информации о переходе через ноль с использованием размера второго блока, чтобы получить уточненную информацию, представляющую сдвиг во времени между подобными областями упомянутого одного или нескольких входных сигналов,
причем диапазон, для которого определяется вторая информация о переходе через ноль, зависит от информации, представляющей сдвиг во времени между подобными областями упомянутого одного или нескольких входных сигналов, полученной на первом этапе, и причем размер второго блока меньше размера первого блока.
18. Способ (700) определения информации о подобии для одного или нескольких входных сигналов, которые являются звуковыми сигналами или видеосигналами,
причем способ содержит этап, на котором определяют (710) информацию о переходе через ноль, описывающую количество переходов через ноль в соответствующей части для множества частей по меньшей мере одного из упомянутого одного или нескольких входных сигналов, и
причем способ содержит этап, на котором выполняют (720) сравнение на основе информации о переходе через ноль, чтобы определить информацию о подобии, описывающую подобие между разными частями или сегментами одного входного сигнала либо между разными частями или сегментами двух сравниваемых сигналов;
причем способ содержит этап, на котором определяют два или более характерных значения на каждый блок сигнала для множества блоков сигнала,
причем упомянутые два или более характерных значения описывают признаки блоков сигнала, и
причем упомянутые два или более характерных значения содержат значение перехода через ноль, которое является информацией о переходе через ноль; и
причем способ содержит этап, на котором определяют меры спектральной неравномерности в качестве одного из упомянутых двух или более характерных значений, которые определяются на каждый блок сигнала, и/или
причем способ содержит этап, на котором определяют значения спектрального потока в качестве одного из упомянутых двух или более характерных значений, которые определяются на каждый блок сигнала,
причем значения спектрального потока описывают изменение между спектрами двух соответствующих последовательных блоков сигнала в виде одного количественного значения;
причем способ содержит этап, на котором выполняют сравнение на основе упомянутых двух или более характерных значений, чтобы определить информацию о подобии,
причем первое сравнение выполняют на основе последовательности характерных значений первого типа для множества блоков сигнала, и причем второе сравнение выполняют на основе последовательности характерных значений второго типа для множества блоков сигнала,
причем последовательность (322; 450) первых значений перехода через ноль, которая содержит множество значений перехода через ноль, и последовательность (324; 456) вторых значений перехода через ноль, которая содержит множество значений перехода через ноль, сравнивают для получения информации о подобии, описывающей подобие между первым сегментом (420) сигнала и вторым сегментом (430) сигнала,
причем последовательность первых значений перехода через ноль соответствует первому сегменту сигнала, и причем последовательность вторых значений перехода через ноль соответствует второму сегменту сигнала, и
причем значения перехода через ноль составляют информацию о переходе через ноль,
причем сравнивают результат первого сравнения и результат второго сравнения, чтобы получить информацию о надежности;
причем способ содержит этап, на котором принимают один или несколько звуковых сигналов или один или несколько видеосигналов в качестве упомянутого одного или нескольких входных сигналов (112; 212; 312, 314) и определяют информацию (114; 214; 322, 324) о переходе через ноль на основе упомянутого одного или нескольких звуковых сигналов или на основе упомянутого одного или нескольких видеосигналов.
19. Цифровой запоминающий носитель, содержащий сохраненную на нем компьютерную программу, которая, при исполнении на компьютере, предписывает компьютеру выполнять способ по п. 18.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16170744 | 2016-05-20 | ||
EP16170744.3 | 2016-05-20 | ||
EP16199181.5A EP3246824A1 (en) | 2016-05-20 | 2016-11-16 | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
EP16199181.5 | 2016-11-16 | ||
PCT/EP2017/062044 WO2017198794A1 (en) | 2016-05-20 | 2017-05-18 | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018145032A RU2018145032A (ru) | 2020-06-22 |
RU2018145032A3 RU2018145032A3 (ru) | 2020-06-22 |
RU2747442C2 true RU2747442C2 (ru) | 2021-05-05 |
Family
ID=56117481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018145032A RU2747442C2 (ru) | 2016-05-20 | 2017-05-18 | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа |
Country Status (11)
Country | Link |
---|---|
US (1) | US10565284B2 (ru) |
EP (2) | EP3246824A1 (ru) |
JP (2) | JP6962664B2 (ru) |
KR (1) | KR102306332B1 (ru) |
CN (1) | CN109478198B (ru) |
AU (1) | AU2017266384B2 (ru) |
BR (1) | BR112018073889B1 (ru) |
CA (1) | CA3024772C (ru) |
MX (1) | MX2018014113A (ru) |
RU (1) | RU2747442C2 (ru) |
WO (1) | WO2017198794A1 (ru) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101457749B1 (ko) | 2008-06-27 | 2014-11-03 | 가부시키가이샤 바이오베르데 | 세포 및 조직의 동결 보존용 조성물 |
EP3246824A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
CN111341302B (zh) * | 2020-03-02 | 2023-10-31 | 苏宁云计算有限公司 | 一种语音流采样率确定方法及装置 |
TWI766259B (zh) * | 2020-03-27 | 2022-06-01 | 莊龍飛 | 運動課程評分方法與系統、電腦程式產品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998027543A2 (en) * | 1996-12-18 | 1998-06-25 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US20090296860A1 (en) * | 2008-06-02 | 2009-12-03 | Harris Corporation | Adaptive correlation |
RU2451332C2 (ru) * | 2005-10-17 | 2012-05-20 | Конинклейке Филипс Электроникс Н.В. | Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков |
US20120250830A1 (en) * | 2011-03-29 | 2012-10-04 | Microsoft Corporation | Conference signal anomaly detection |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5846396A (ja) * | 1981-09-16 | 1983-03-17 | 株式会社日立製作所 | 音声信号検出装置 |
JPS607459A (ja) * | 1983-06-27 | 1985-01-16 | 松下電器産業株式会社 | 音響装置 |
JPS62194298A (ja) * | 1986-02-21 | 1987-08-26 | 株式会社日立製作所 | ピツチ抽出方式 |
JPH02203397A (ja) * | 1989-02-02 | 1990-08-13 | Toshiba Corp | 有音・無音検出方式 |
JPH0689095A (ja) * | 1992-09-08 | 1994-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号選択装置 |
US9191260B1 (en) * | 1999-04-05 | 2015-11-17 | Lightworks Ii, Llc | Method and apparatus to determine a match between signals |
JP3823804B2 (ja) * | 2001-10-22 | 2006-09-20 | ソニー株式会社 | 信号処理方法及び装置、信号処理プログラム、並びに記録媒体 |
TW564400B (en) * | 2001-12-25 | 2003-12-01 | Univ Nat Cheng Kung | Speech coding/decoding method and speech coder/decoder |
US8024390B2 (en) * | 2005-07-01 | 2011-09-20 | Schneider Electric USA, Inc. | Automated data alignment based upon indirect device relationships |
CN101292280B (zh) * | 2005-10-17 | 2015-04-22 | 皇家飞利浦电子股份有限公司 | 导出音频输入信号的一个特征集的方法 |
JP2007292940A (ja) * | 2006-04-24 | 2007-11-08 | Toyota Motor Corp | 音声識別装置及び音声識別方法 |
JP2008257020A (ja) * | 2007-04-06 | 2008-10-23 | Alpine Electronics Inc | メロディーの類似度算出方法及び類似度算出装置 |
JP2011065093A (ja) * | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
JP5569228B2 (ja) * | 2010-08-02 | 2014-08-13 | ソニー株式会社 | テンポ検出装置、テンポ検出方法およびプログラム |
JP5641326B2 (ja) * | 2010-12-21 | 2014-12-17 | ソニー株式会社 | コンテンツ再生装置および方法、並びにプログラム |
JP2012203351A (ja) * | 2011-03-28 | 2012-10-22 | Yamaha Corp | 子音識別装置、およびプログラム |
DE102014011424A1 (de) * | 2014-07-31 | 2016-02-04 | Airbus Operations Gmbh | Technik der zerstörungsfreien Prüfung |
EP3246824A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
-
2016
- 2016-11-16 EP EP16199181.5A patent/EP3246824A1/en not_active Withdrawn
-
2017
- 2017-05-18 WO PCT/EP2017/062044 patent/WO2017198794A1/en active Search and Examination
- 2017-05-18 AU AU2017266384A patent/AU2017266384B2/en active Active
- 2017-05-18 CN CN201780045322.XA patent/CN109478198B/zh active Active
- 2017-05-18 EP EP17723440.8A patent/EP3458973A1/en active Pending
- 2017-05-18 CA CA3024772A patent/CA3024772C/en active Active
- 2017-05-18 BR BR112018073889-1A patent/BR112018073889B1/pt active IP Right Grant
- 2017-05-18 MX MX2018014113A patent/MX2018014113A/es unknown
- 2017-05-18 JP JP2018560989A patent/JP6962664B2/ja active Active
- 2017-05-18 RU RU2018145032A patent/RU2747442C2/ru active
- 2017-05-18 KR KR1020187036689A patent/KR102306332B1/ko active IP Right Grant
-
2018
- 2018-11-20 US US16/196,711 patent/US10565284B2/en active Active
-
2021
- 2021-05-06 JP JP2021078687A patent/JP7317888B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998027543A2 (en) * | 1996-12-18 | 1998-06-25 | Interval Research Corporation | Multi-feature speech/music discrimination system |
RU2451332C2 (ru) * | 2005-10-17 | 2012-05-20 | Конинклейке Филипс Электроникс Н.В. | Способ и устройство для вычисления метрики подобия между первым вектором признаков и вторым вектором признаков |
US20090296860A1 (en) * | 2008-06-02 | 2009-12-03 | Harris Corporation | Adaptive correlation |
US20120250830A1 (en) * | 2011-03-29 | 2012-10-04 | Microsoft Corporation | Conference signal anomaly detection |
Also Published As
Publication number | Publication date |
---|---|
EP3458973A1 (en) | 2019-03-27 |
BR112018073889A8 (pt) | 2023-01-31 |
JP6962664B2 (ja) | 2021-11-05 |
CN109478198B (zh) | 2023-09-22 |
BR112018073889B1 (pt) | 2024-03-12 |
KR20190008925A (ko) | 2019-01-25 |
US20190095398A1 (en) | 2019-03-28 |
BR112018073889A2 (pt) | 2019-02-26 |
JP7317888B2 (ja) | 2023-07-31 |
US10565284B2 (en) | 2020-02-18 |
CN109478198A (zh) | 2019-03-15 |
CA3024772C (en) | 2021-05-04 |
AU2017266384A1 (en) | 2018-12-06 |
WO2017198794A1 (en) | 2017-11-23 |
RU2018145032A (ru) | 2020-06-22 |
RU2018145032A3 (ru) | 2020-06-22 |
EP3246824A1 (en) | 2017-11-22 |
AU2017266384B2 (en) | 2020-05-14 |
MX2018014113A (es) | 2019-06-17 |
JP2019523901A (ja) | 2019-08-29 |
CA3024772A1 (en) | 2017-11-23 |
KR102306332B1 (ko) | 2021-09-29 |
JP2021157180A (ja) | 2021-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2747442C2 (ru) | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа | |
US10418051B2 (en) | Indexing based on time-variant transforms of an audio signal's spectrogram | |
CA2566540C (en) | Device and method for analyzing an information signal | |
US9317561B2 (en) | Scene change detection around a set of seed points in media data | |
CN108665903B (zh) | 一种音频信号相似程度的自动检测方法及其系统 | |
US20100110834A1 (en) | Apparatus and method of detecting target sound | |
US20120197641A1 (en) | Consonant-segment detection apparatus and consonant-segment detection method | |
US20110255700A1 (en) | Detecting Musical Structures | |
Muhammad | Extended average magnitude difference function based pitch detection | |
US11341747B2 (en) | Generation of video hash | |
US10068558B2 (en) | Method and installation for processing a sequence of signals for polyphonic note recognition | |
WO2013170610A1 (zh) | 检测基音周期的正确性的方法和装置 | |
CN112446329A (zh) | 一种时变结构瞬时频率确定方法、系统、装置及存储介质 | |
CN115662441B (zh) | 一种基于自监督学习的语音鉴伪方法、装置及存储介质 | |
Bergen et al. | Scalable similarity search in seismology: a new approach to large-scale earthquake detection | |
EP2709102A1 (en) | Method and apparatus for determining an optimum frequency range within a full frequency range of a watermarked input signal | |
Tao et al. | Audio Tampering Detection Based on Quantization Artifacts | |
Vyas et al. | Detection of chorus from an audio clip using dynamic time warping algorithm | |
Samiappan et al. | Epoch Extraction Using Hilbert–Huang Transform for Identification of Closed Glottis Interval | |
Shiv | Improved frequency estimation in sinusoidal models through iterative linear programming schemes | |
Govind et al. | A Robust Algorithm for Speech Polarity Detection Using Epochs and Hilbert Phase Information | |
KR20140143285A (ko) | 시계열 신호 식별 장치 및 시계열 신호 식별 방법 | |
Ju et al. | Structural Analysis Algorithm for Automatic Transcription'Pansori' |