CN109478198A - 用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序 - Google Patents
用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序 Download PDFInfo
- Publication number
- CN109478198A CN109478198A CN201780045322.XA CN201780045322A CN109478198A CN 109478198 A CN109478198 A CN 109478198A CN 201780045322 A CN201780045322 A CN 201780045322A CN 109478198 A CN109478198 A CN 109478198A
- Authority
- CN
- China
- Prior art keywords
- zero passage
- zero
- signal
- information
- value sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000004590 computer program Methods 0.000 title claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims description 39
- 238000001228 spectrum Methods 0.000 claims description 25
- 230000007423 decrease Effects 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 18
- 230000014509 gene expression Effects 0.000 claims description 15
- 230000000630 rising effect Effects 0.000 claims description 13
- 238000005314 correlation function Methods 0.000 claims description 10
- 230000004907 flux Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 description 21
- 238000012545 processing Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000220317 Rosa Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/02—Comparing digital values
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
- G06F2218/16—Classification; Matching by matching signal segments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
用于基于一个或多个输入信号确定相似度信息的装置用于对于一个或多个输入信号中的至少一个的多个部分确定描述各自的部分中的过零数量的过零信息。该装置用于基于过零信息进行比较以确定相似度信息。还描述了用于确定相似度信息的方法和计算机程序。此外,用于确定自相关信息的装置和用于确定互相关信息的装置基于相似考虑。
Description
技术领域
根据本发明的实施例涉及用于基于一个或多个输入信号确定相似度信息的装置。
根据本发明的另一实施例涉及用于基于一个或多个输入信号确定相似度信息的方法。
根据本发明的实施例涉及用于执行所述方法的计算机程序。
根据本发明的另一实施例涉及用于确定自相关信息的装置。
根据本发明的另一实施例涉及用于确定互相关信息的装置。
一些实施例涉及具有低计算复杂度的高度强健的相关方法。
背景技术
许多技术应用,例如在音频处理、视频处理或信号处理领域中,要求基于一个或多个输入信号获得相似度信息。例如,有时候期望比较单个输入信号的两个时移段,例如,以获得关于单个输入信号的周期性的信息。此类概念可用于准备音频处理(音频操纵)操作或确定音频信号的特性。例如,使用此概念可从音频信号中提取基频。此外,关于相同音频信号的不同部分之间的相似度的信息可被用于描述音频信号的时间延伸或时间缩短的情形中。
另一方面,也期望比较两个不同输入信号并获得关于输入信号的相似度的信息。例如,可在不对输入信号中的一个或对于输入信号之间的单个时移或对于输入信号的时移的多个值应用时移的情况下获得相似度信息。通过比较两个输入信号(其可为音频信号),可以对音频信号中的至少一个分类。可选地,可以找到用于进行音频信号之间的重叠相加的合适时机。
然而,音频处理或更具体的信号处理领域中的许多不同应用可能基于描述两个不同输入信号(音频信号)之间的相似度或单个输入信号(音频信号)的不同时移部分之间的相似度的相似度信息。
在嵌入式系统诸如数字信号处理器(DSP)中,自然地仅有限的内存资源和处理器周期是可用的。为了能够实时地计算期望算法,可以期望对各个平台进行最优化。此类最优化可大体被划分为两类。第一类包括利用特定处理器架构的最优化。此包括,例如,三角函数的近似或快速FFT的使用或所谓的单指令多数据操作。
第二类自身关注,例如,算法自身的最优化。已发现,如果(例如)用于确定两个音频信号之间的时间偏移的互相关已被计算,处理器周期以及存储空间将限制最大可检测延迟。
在下文中,将描述一些传统概念。已发现,为了减小内存和计算负载,可频繁地使用降采样。已发现,使用四倍的降采样,可节省3/4(即,75%)的所需内存,或可将可检测延迟增大四倍。已发现,这些节省由于缺点而被抵消。例如,存在准确度降低。之前样本准确的结果此时将以n个样本的最大准确度而可获得,其中n描述降采样因子。
此外,强健性随着降采样因子的增大而减小。可在音频传递期间发生的干扰极端地恶化结果。这包括噪声、动态范围压缩、音频编码、限制器和滤波(例如,均衡器)。
已发现,降采样可理解如下:音频样本来自等距间隔的音频流,且可以说是其周围样本的代表。周围样本的数量可被称为块大小。在以上示例中,块大小n将等于4。来自音频流的每第4个样本将被用作此块的代表。为了解释降采样,假设上游降采样滤波器将最高发生频率降低n倍以满足奈奎斯特准则。
此外,已发现,传统降采样带来例如关于强健性的明显缺点。
有鉴于此情形,需要用于基于一个或多个输入信号获得相似度信息的概念,其带来强健性和计算复杂度之间的改进的权衡。
发明内容
根据本发明的实施例创立一种用于基于一个或多个输入信号确定相似度信息的装置。该装置用于对于一个或多个输入信号中的至少一个的多个部分确定描述各自的部分中的过零数量的过零信息。该装置用于基于过零信息进行比较以确定相似度信息。
此实施例基于如下发现:描述多个部分的各自的部分中的过零数量的过零信息是非常强健的量,其可以以适度的计算工作量计算但仍允许描述待被待被比较的单个输入信号的不同部分(或段)之间或两个输入信号的不同部分(或段)之间的相似度的相似度信息的可靠确定。可获得过零信息,例如,通过计数过零数量,且过零信息不会被可被应用至输入信号的一个或多个的各种处理操作严重地改变。此外,过零信息可为单个整数数字的序列,其可(单独地)与一个或多个输入信号的连续(subsequent)部分相关联。因此,通过对一个或多个输入信号的每部分提供(例如)单个过零信息值(或,可选地,两个过零信息值),其中一个或多个输入信号的每个部分可包括一个或多个输入信号的多个样本,可明显地减小信息量,且过零信息(过零值)可用作一个或多个输入信号的各个部分的“代表”。因此,比较过零信息的值或过零信息的值的集合或序列相比于比较一个或多个输入信号的整个段典型地计算高效。因此,基于过零信息进行比较以确定相似度信息是计算高效的但仍提供关于一个或多个输入信号的不同段(其中所述段通常各自包括至少一个或多个输入信号的多个部分,且因此各自映射至过零信息的多个值)的相似度的有意义的信息。
在优选实施例中,该装置用于对于一个或多个输入信号中的多个部分确定过零总数量、或上升过零数量、或下降过零数量作为过零信息。已发现,过零总数量、上升过零数量以及下降过零数量均为有意义的信息,其可被用来单独地或组合地“表示”一个或多个输入信号的各个部分。此外,应注意,可通过计数一个或多个输入信号的符号从正变为负和/或反之亦然的次数而简单地计算过零数量。
在优选实施例中,该装置用于对于一个或多个输入信号中的至少一个的多个部分确定过零率作为过零信息。已发现,过零率是特别有意义的信息。例如,过零率甚至可考虑输入音频信号的部分的长度的变化。另一方面,使用过零率,甚至可以比较以不同采样率采样的信号(例如,如果降采样因子和采样率的乘积对于两个信号提供相同结果,这意味着,例如,代表值与相同时间单位相关联)。因此,已发现,过零率值是一个或多个输入信号的各个部分的非常有意义的代表。
在优选实施例中,该装置用于确定过零信息,使得至少一个过零值与一个或多个输入信号中的至少一个的多个部分中的每个部分相关联。因此,存在一个或多个输入信号的至少一个的段的可靠表示,其中所述段通常包括多个部分。
在优选实施例中,该装置用于对于第一信号段确定第一过零值序列,其中第一信号段包括多个信号块(或信号“部分”),以及其中第一过零值序列包括与第一信号段的信号块(或信号部分)中的每个相关联的一个过零值(或在某些情况下,多于一个过零值)。此外,该装置优选地用于对于第二信号段确定第二过零值序列,其中第二信号段包括多个信号块(或信号部分),以及其中第二过零值序列包括与第二信号段的信号块(或信号部分)中的每个相关联的一个过零值(或在某些情况下,多于一个过零值)。因此,可以比较第一过零值序列和第二过零值序列以确定相似度信息。比较过零值序列提供很有意义的结果,因为每个过零值序列包括表示各自信号段的多个“代表值”。相应地,通过评估比较中的过零值序列,可增大可靠性。
在优选实施例中,该装置用于比较包括多个过零值的第一过零值序列与包括多个过零值的第二过零值序列,获得描述第一信号段与第二信号段之间的相似度的相似度信息,其中第一过零值序列与第一信号段相对应,以及其中第二过零值序列与第二信号段相对应,以及其中过零值构成过零信息。通过比较第一过零值序列和第二过零值序列,可以获得有意义的比较结果。此外,第一过零值序列通常包括比由第一过零值序列表示的第一信号段更少的个别值,以及第二过零值序列通常包括比由第二过零值序列表示的第二信号段更少的个别值。在一些实施例中,第一过零值序列的个别值的数量可以比第一信号段的个别(样本)值的数量少至少10倍。相同关系也可适用于第二过零值序列的个别值的数量与第二信号段的个别(样本)值的数量。因此,在与第一和第二信号段的样本值之间的比较相比时,第一和第二过零值序列之间的比较可以以很高效的方式进行。此外,应注意,可通过适合于值序列的比较的任意传统算法比较过零值序列,这允许装置的灵活实施。
在优选实施例中,该装置用于使用第一过零值序列和第二过零值序列计算相关值,获得相似度信息。可选地,该装置可用于使用第一过零值序列和第二过零值序列计算平均幅度差值,获得相似度信息。作为另一可选例,该装置可用于计算第一过零值序列和第二过零值序列之间的差的范数,获得相似度信息。作为又一可选例,该装置可用于计算第一过零值序列和第二过零值序列之间的欧几里得距离,获得相似度信息。已发现,用于确定相似度信息的上述计算高效的概念导致良好的比较结果。
在优选实施例中,该装置可用于计算第一过零值序列或其部分和第二过零值序列的多个时移版本或其时移部分之间的多个差度量值,获得关于提供第一过零值序列或其部分和第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息。相应地,可以确定由第一过零值序列表示的第一信号段与由第二过零值序列表示的第二信号段之间的哪个时间对齐带来最大相似度。因此,如果第一信号段和第二信号段取自单个输入信号可以获得等同于自相关信息的信息,或如果第一信号段和第二信号段取自不同输入信号可以获得等同于互相关信息的信息。自相关信息或互相关信息因此被获得用于不同的自相关滞后值或互相关滞后值,其中自相关滞后值或互相关滞后值与第二过零值序列的时移版本(或其时移部分)的各个时移相对应。因此,过零值序列可被实际上用于获得用于不同的自相关滞后值或互相关滞后值的自相关函数或互相关函数的结果值。
在优选实施例中,该装置用于使用第一过零值序列和第二过零值序列计算相关函数,获得关于提供第一过零值序列或其部分和第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息。可选地,该装置可用于使用第一过零值序列和第二过零值序列计算平均幅度差函数,比较第一过零值序列的部分和第二过零值序列的时移部分,并获得关于提供第一过零值序列或其部分和第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息。相应地,可以以可靠且高效的方式,确定为第一过零值序列和第二过零值序列的基础的哪些时移信号段包括最大相似度。此外,可以以适度工作量识别为第一过零值序列和/或第二过零值序列的基础的信号段的周期性。
在优选实施例中,该装置用于使用第一过零值序列和第二过零值序列计算相关函数,获得关于提供第一过零值序列或其部分和第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息。可选地,该装置可用于使用第一过零值序列和第二过零值序列计算平均幅度差函数,比较第一过零值序列的部分和第二过零值序列的时移部分,并获得关于提供第一过零值序列或其部分和第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息。已发现,相关函数(其通常描述用于过零值序列的不同时移的相关值)的计算构成用于确定关于提供第一过零值序列(或其部分)和第二过零值序列的时移版本(或其部分)之间的最大相似度的时移的信息的高效方法,此信息转而允许得出关于提供第一信号段和第二信号段(的时移版本)之间的最大相似度的时移的信息。类似地,平均幅度差函数(其通常描述对于不同时移的第一过零值序列和第二过零值序列之间的平均幅度差)的计算允许获得关于提供第一过零值序列(或其部分)和第二过零值序列的时移版本(或其部分)之间的最大相似度的时移的信息。此信息转而允许得出关于提供第一信号段和第二信号段的之间的最大相似度的时移的信息。
因此,已发现,第一过零值序列和第二过零值序列适合于基于其计算相关函数或平均幅度差函数。
在优选实施例中,该装置用于在比较第一过零值序列和第二过零值序列之前从第一过零值序列和/或从第二过零值序列中移除常数分量。已发现,从第一和第二过零值序列中移除常数分量(例如,平均值等)使得更易于评估和比较第一过零值序列和第二过零值序列。
在优选实施例中,该装置用于在确定过零信息之前从一个或多个输入信号中移除常数分量(例如,“DC值”或平均值)和/或对一个或多个输入信号应用高通滤波。已发现,移除此类“常数分量”确保以良好或甚至最大准确度获得过零信息。
在实施例中,该装置用于对于多个信号块确定每信号块的两个或更多个代表值,其中两个或更多个代表值描述信号块的特征,以及其中两个或更多个代表值包括(作为过零信息的)过零值。在此情况下,该装置用于基于每信号块的两个或更多个代表值进行比较,以确定相似度信息。此实施例基于以下发现:如果通过描述信号块的另一特征的另一代表量(值)增补过零值(其被视为“过零信息”),可改进概念的可靠性。
在优选实施例中,代表值对每信号块包括描述各自的信号块中的上升过零数量的“正过零值”和描述各自的信号块中的下降过零数量的“负过零值”。通过使用此类代表值,可进行可靠性检查。特别地,可检查是否已错过上升过零或下降过零,因为上升过零数量和下降过零数量应该是非常相似的。
在优选实施例中,该装置用于对于多个信号块基于第一类型的代表值序列进行第一比较,以及对于多个信号块基于第二类型的代表值序列进行第二比较。在此情况下,该装置用于比较第一比较的结果和第二比较的结果,以获得可靠性信息。因此,通过使用两种不同类型的代表值且通过比较使用两种不同类型的代表值获得的结果,可检查方法的可靠性。特别地,如果使用超出某个(阈)值的第一类型的代表值获得的结果之间存在矛盾,则可得出第一类型的代表值或第二类型的代表值中任一者或两种类型的代表值是不可靠的。在此情况下,可生成告警,指示比较是不可靠的。
在优选实施例中,该装置用于确定两个代表值中的一个,该两个代表值是对各自的信号块使用各自的信号块的频域表示确定的。已发现,使用各自的信号块的频域表示以获得代表值可以改进可靠性,因为一些类型的处理和变形仅影响输入信号(例如,音频信号)的时域表示而对频域表示具有很少影响。
在优选实施例中,该装置用于确定谱平坦度度量作为对每信号块确定的两个代表值中的一个。已发现,谱平坦度度量构成一些类型的输入信号(例如,音频信号)的良好表示。
在优选实施例中,该装置用于确定描述各自的信号块的谱的平坦度的谱平坦度值作为对每信号块确定的两个代表值中的一个。已发现,描述各自的信号块的谱的平坦度的谱平坦度值带来相似度信息的良好可靠性。
在优选实施例中,该装置用于确定谱通量值(例如,描述信号的功率谱多快得变化)作为对每信号块确定的两个(或更多个)代表值中的一个,其中谱通量值以单个量化值的形式描述两个各自的连续的信号块的谱之间的变化。已发现,使用谱通量值允许获得用于一些类型的输入信号,如(例如)音频信号的特别有意义的相似度信息。
在优选实施例中,该装置用于确定用于各自的信号块的线性预测系数作为对每信号块确定的两个(或更多个)代表值中的一个。已发现,线性预测系数也是导致至少用于一些类型的输入信号(例如,音频信号)的有意义的相似度信息的量。
在优选实施例中,该装置用于接收一个或多个音频信号或一个或多个视频信号或一个或多个传感器信号作为一个或多个输入信号。在此情况下,该装置用于基于一个或多个音频信号或基于一个或多个视频信号或基于一个或多个传感器信号确定过零信息。已发现,过零率构成用于“技术信号”如(例如)音频信号和视频信号和传感器信号的部分的特别有意义的代表量。音频信号和视频信号通常为有规律地改变其符号的信号,其中过零率具有对于由所述音频信号或视频信号表示的音频内容或视频内容的良好相关性。此外,许多传感器信号具有此类特性。因此,应注意,本文中描述的装置也可适用于其他技术有意义的信号,如(例如)来自不同类型的物理传感器的传感器信号。由于在处理(即,DC分量被移除)之前输入信号向量将“释放”自DC分量(例如,平均值),此类信号也将具有可使用本文中描述的概念评估的过零。
作为额外评论,应注意,在一些实施例中,DC分量(例如,常数分量或平均值)将从输入信号以及从代表值的向量中移除。
在优选实施例中,该装置用于使用相似度信息以获得关于音频信号或视频信号的自相关信息。可选地,该装置可用于使用相似度信息以获得与两个音频信号或与两个视频信号相关的互相关信息。可选地,该装置可用于使用相似度信息以确定获得两个音频信号之间的最可行对齐的时移,或确定获得两个视频信号之间的最可行对齐的时移。已发现,使用过零信息作为表示输入信号的部分的代表值提供用以确定自相关信息或互相关信息或获得两个音频信号之间或两个视频信号之间的最可行对齐的时移的计算非常高效的概念。已发现,通过过零信息(或过零值)表示一个或多个输入信号的部分减少用于确定自相关信息、互相关信息或获得最可行对齐的时移的数据量(即,计算负载)。
根据本发明的实施例创立一种用于基于一个或多个输入信号确定相似度信息的方法。该方法包括对于一个或多个输入信号中的至少一个的多个部分确定描述各自的部分中的过零数量的过零信息。该方法还包括基于过零信息进行比较,以确定相似度信息。此方法基于以上针对相应装置论述的相同考虑。
根据本发明的另一实施例创立一种计算机程序,当计算机程序运行于计算机上时,用于执行此方法。
根据本发明的实施例创立一种用于确定描述作为音频信号或视频信号的单个信号的不同段之间的相似度的自相关信息的装置。该装置包括过零分析器,过零分析器用于对于信号的多个块确定包括信号的每块(也被表示为部分)的至少一个过零值的过零信息。过零值描述信号的各个块(或部分)的过零数量。过零值序列比较器用于比较与信号的第一信号段相关联的过零值的第一过零值序列和与信号的第二信号段相关联的过零值的第二过零值序列,以获得自相关信息。用于确定自相关信息的此装置基于以上已提及的相同考虑。
根据本发明的实施例创立一种用于确定描述作为音频信号或视频信号的第一信号和第二信号之间的相似度的互相关信息的装置。该装置包括过零分析器,过零分析器用于对于第一信号的多个块(或部分)确定包括第一信号的每块的至少一个过零值的过零信息并对于第二信号的多个块确定包括第二信号的每块的至少一个过零值的过零信息。过零值描述对于各个信号的各个块的过零数量。该装置还包括过零值序列比较器,过零值序列比较器用于比较与第一信号的信号段相关联的过零值的过零值序列和与第二信号的信号段相关联的过零值的过零值序列,以获得互相关信息。此装置适合于基于两个音频信号或两个视频信号获得互相关信息,其中可通过使用过零值作为用于信号的块(或部分)的代表值来减小计算复杂度。
附图说明
随后将参考附图描述根据本发明的实施例,其中:
图1示出根据本发明的实施例的用于确定相似度信息的装置的示意性框图;
图2示出根据本发明的实施例的用于确定相似度信息的装置的示意性框图;
图3示出根据本发明的另一实施例的用于确定相似度信息的装置的示意性框图;
图4示出对于计算自相关的情况的相似度信息的确定的示意性表示;
图5示出对于使用互相关的情况的相似度信息的确定的示意性表示;
图6示出过零值序列的确定的详细示意性表示;以及
图7示出根据本发明的实施例的用于确定相似度信息的方法的流程图。
具体实施方式
1.根据图1的用于确定相似度信息的装置
图1示出根据本发明的实施例的用于基于一个或多个输入信号确定相似度信息的装置的示意性框图。
根据图1的装置整体被表示为100。
装置100包括过零信息确定110,过零信息确定110用于接收至少一个输入信号112并基于至少一个输入信号提供过零信息114。例如,过零信息确定(或确定器)110可用于确定过零信息114,使得过零信息114对于一个或多个输入信号112的至少一个输入信号的多个部分描述各自的部分中的过零数量。该装置还包括接收过零信息114并基于其提供相似度信息122的比较(或比较器)120。例如,比较(或比较器)120可用于基于过零信息114进行比较,以确定相似度信息122。例如,比较120可用于基于过零信息114进行相关操作(例如,自相关操作或互相关操作)。可选地,比较120可基于过零信息的不同值(或集合值)计算平均幅度差值或差的范数或欧几里得距离。相应地,可获得相似度信息122。
关于装置100的功能,可以说对于至少一个输入信号112的多个部分获得的过零信息被用作“代表信息”,其中,例如,过零信息114的每个值表示输入信号112的部分(例如,样本的块)。换言之,输入信号112的时间连续或时间离散(采样的)部分被“映射”至单个值,该单个值例如以单个整数值的形式表示所述部分中的过零数量。因此,包括多个(例如,10个或更多)样本值的输入信号112的整个部分被映射至单个过零信息值(或,在一些实施例中,映射至两个过零信息值、一个表示上升过零数量且另一个表示下降过零数量)。然而,过零信息已被发现为是非常紧凑但有意义的代表信息,从而从输入信号112的部分得出过零信息114具有如下效果:仅相对少量的信息需要通过比较120处理。
比较120比较过零信息114的对应过零值,以获得相似度信息。换句话说,如果输入信号112的两个段将被装置110比较,则与这两个段对应的过零值通过比较120而被有效地比较,例如,使用相关操作、平均幅度差值计算操作、差的范数的计算、或欧几里得距离的计算。类似地,如果不同输入信号的两个段将被装置100比较,则与这些段相关联的过零值将通过比较120而被比较。
因此,已发现,当与比较待被比较的一个或多个输入信号的段的相对大量的样本值相比时,从输入信号得出过零值(过零信息114)且然后使用比较120比较相对少量的过零值是计算实质更高效的。
然而,应注意,可通过本文中独立地或组合地描述的特征和功能对根据图1的装置100进行补充。
2.根据图2的装置
图2示出用于基于一个或多个输入信号确定相似度信息的装置200的示意性框图。装置200用于接收输入信号212并基于其提供相似度信息222和/或时移信息232。装置200包括过零值确定器210,过零值确定器210也可被视为过零值计算器,且可采用过零信息确定110的功能。过零值确定器210可(例如)接收输入信号。然而,可选择地,“DC移除”或高通滤波可被应用于输入信号212(块216)以获得零平均输入信号218。换句话说,过零值确定器210优选地接收零平均输入信号,因为过零数量对于此类零平均输入信号是最具意义的。如果假设输入信号212无需包括零平均,则推荐在将信号输入至过零值确定器210之前应用DC移除/高通滤波216。
过零值确定器210通常对于将要考虑的输入信号212(或零平均输入信号218)的每个部分提供一个(在一些实施例中,甚至是两个)过零值。相应地,过零值确定器210有效地提供可被视为过零信息的过零值序列214。过零值序列214可以(例如)包括过零值的序列,每个与输入信号212、218的部分相关联且每个描述输入信号的相关部分中的过零(上升过零、或下降过零点、或上升以及下降过零)数量。
装置200还包括过零值序列比较(或比较器)220,其功能类似于比较120的功能。过零值序列比较220接收由过零值确定器210提供的过零值序列214或过零值序列214的零平均版本228。例如,过零值序列214可包括用于输入信号212、218的每个部分的一个非负整数值。然而,在一些情况下,如果过零值序列比较220接收零平均输入序列,可更简单地实施过零值序列比较。为此目的,可选择地存在DC移除或高通滤波226,其接收过零值序列214并基于其提供过零值序列的零平均版本228。例如,DC移除/高通滤波226可确定过零值序列214的值的平均值并从过零值序列214的个别值中减掉平均值,以获得被用作过零值序列比较220的输入量的过零值序列的零平均版本228的个别值。过零值序列比较220可使用或评估与待被比较的输入信号212的段相关联的两个过零值序列(或子序列)。例如,过零值序列比较220可用于基于两个过零值序列(或子序列)计算“自相关”值。所述自相关值计算的结果可构成相似度信息222。
然而,过零值序列比较可使用过零值序列或过零值子序列的比较的不同方法。这些比较概念中的一些可能不需要DC移除/高通滤波226,而另外的比较技术(如,例如,自相关值的计算)可得益于DC移除/高通滤波226。
过零值序列比较220可可选地比较多对过零值序列或过零值子序列且因此提供表示输入信号的不同对段之间的相似度的多个相似度信息值。
可选地,该装置还包括时移计算230。时移计算230可以,例如,用于接收描述输入信号212的多个成对段之间的相似度的相似度信息222。此外,时移计算230可以用于从多个所述相似度信息中识别表示或信号表示最大相似度的相似度信息值,并借此得出输入信号212、218的哪对段包括最大相似度。相应地,时移信息232可由时移计算230确定以描述输入信号212、218的包括最大相似度的两段之间的时移。相应地,装置200可有效地获得时移信息232,其含义类似于自相关信息包括峰值的时间滞后。
因此,装置200所提供的时移信息232可以,例如,用于检测输入信号212、218内的周期性并表示周期性间隔。
然而,可通过本文中独立地或组合地描述的特征和功能对根据图2的装置200进行补充。
3.根据图3的装置
图3示出用于确定相似度信息的装置300的示意性框图。装置300用于接收第一信号段(“信号段1”)312和第二信号段(“信号段2”)314。第一信号段312和第二信号段314为待被比较的信号段且可以为相同信号的两个信号段。可选地,第一信号段312可以为第一信号的段,且第二信号段314可以为第二信号的信号段。信号段312、314可以为时间上重叠的或时间上不重叠的。可选地,第一DC移除或高通滤波316可被应用于第一信号段。类似地,DC移除或高通滤波318可可选地应用于第二信号段314。DC移除/高通滤波316、318的功能相当于DC移除/高通滤波216的功能。
装置300还包括过零值确定器(也可表示为过零值计算器)320,过零值确定器320用于接收第一信号段312以及第二信号段314,或由DC移除316、318提供的其零平均版本。过零值确定器可以,例如,对于第一信号段312的多个部分(或块)中的每个确定上升过零(负至正过零)数量或下降过零(正至负过零)数量或上升和下降过零数量。类似地,过零值确定器320可用于对于第二信号段314的多个部分(或块)中的每个确定或计算上升过零数量或下降过零数量或上升和下降过零数量。相应地,过零值确定器可用于提供用于(即,相关联于)第一信号段312的过零值序列322,其中所述过零值序列322包括与第一信号段312的部分(或块)相关联的过零值(例如,对于第一信号段312的每个部分或块,正好一个或正好两个非负整数值)。类似地,由过零值确定器320对于第二信号段314提供的第二过零值序列324可包括用于第二信号段314的每个部分或块的正好一个或正好两个非负整数值(个别值中的每个表示与相应的个别值相关联的各自的部分内的上升过零数量或下降过零数量或总过零数量)。
装置300还可(可选地)包括可从第一过零值序列322中移除平均值或可对第一过零值序列322进行高通滤波的DC移除或高通滤波326。类似地,装置可包括可从第二过零值序列324中移除平均值或可对第二过零值序列324进行高通滤波的DC移除或高通滤波328。
装置300还包括过零值序列比较(或过零值比较器)330,过零值序列比较330用于接收第一过零值序列322或由DC移除/高通滤波器326提供的其零平均版本,以及第二过零值序列324或由DC移除/高通滤波器328提供的其零平均版本。过零值序列比较用于比较第一过零值序列322(或其零平均版本)和第二过零值序列324(或其零平均版本),获得相似度信息(其可采用单个相似度值的形式)。例如,过零值序列比较330可用于基于第一过零值序列和第二过零值序列计算互相关值、平均幅度差函数值、L1范数或欧几里得距离,由此比较第一过零值序列322与第二过零值序列324。因此,可基于过零值序列比较提供相似度信息332(其可,例如由与两个过零值序列322、324之间的比较相关联的单个值表示)。然而,相似度信息还可包括值的序列,值被提供用于不同对过零值序列的比较、或用于两个过零值序列的不同子序列的比较。例如,相似度信息332可包括互相关值、互相关函数(即,用于多个互相关滞后值的互相关值)或平均幅度差函数值。
可选地,装置300还可包括时移计算340,时移计算340可以,例如,接收与不同对的过零值序列或过零值子序列的比较相关联的多个相似度信息值。例如,时移计算340可以确定对于哪对过零值序列或对于哪对过零值子序列,发生最大相似度。换句话说,时移计算可使用用于多个信号段或多个过零值序列的相似度信息。
可选地,装置300还可包括特征值确定器/特征值计算器350,特征值确定器/特征值计算器可用于确定或计算一个或多个额外特征值。一个或多个额外特征值可各自描述或表示第一信号段或第二信号段的一个部分(或块)。例如,存在与第一过零值序列233和第二过零值序列324的每个过零值相关联的一个额外特征值。
因此,除了过零值序列的比较,可比较一个或多个额外特征值序列以获得相似度信息332。例如,各自包括n个值的第一过零值序列322和第二过零值序列324之间的比较可由过零值序列比较330计算,以获得第一部分相似度信息。此外,各自包括n个特征值的第一特征值序列和第二特征值序列可被比较以获得第二部分比较结果。最终,可组合第一部分比较结果(或第一部分相似度信息)和第二部分比较结果(或部分相似度信息)以获得相似度信息332。因此,为了某个第一信号段和某个第二信号段的比较,与该某个第一信号段相关联的过零值序列和额外特征值序列被用于比较中,以及第二过零值序列和第二额外特征值序列也被用于比较中。因此,可将第一过零值序列和第二过零值序列之间的比较结果与第一额外特征值序列和第二额外特征值序列之间的比较结果组合,以获得相似度信息。因此,第一信号段的每个部分或块由两个代表值(过零值和额外特征值)表示,第二信号段的每个块也由至少两个代表值(即过零值和额外特征值)表示。通过使用两种类型的代表(过零值和额外特征值),可改进比较的可靠性,从而相似度信息322可被视为是更可靠的。可通过第一部分比较结果和第二部分比较结果的各种类型的组合得出相似度信息322。例如,可计算第一部分比较结果和第二部分比较结果的平均和/或加权平均。可选地,第一部分比较结果的最小值和第二部分比较结果的最小值可被用来获得相似度信息332。然而,其它线性或非线性方法可被用来从第一部分比较结果和第二部分比较结果得出相似度信息332。
4.根据图4的示例
在下文中,将参考图4描述相似度信息的确定的示例。
图4在第一条线410中示出第一信号的表示。横坐标412描述时间。如可看到的,信号被划分成两个连续(subsequent)的不重叠段420、422(“段1”、“段2”).第一段420在时间上被划分成n=3个不重叠块(也被表示为部分)422、424、426。块422、424、426中的每个包括由与时间轴相交的垂直线指示的一组样本值。
基于时间上位于第一块422内的“信号1”的样本值确定或计算第一过零值“过零值1”。类似地,基于时间上位于第二块424内的样本值确定或计算第二过零值“过零值2”。此外,基于时间上位于第三块426内的样本值确定或计算第三过零值“过零值3”。
类似地,可基于位于第四块432、第五块434或第六块436中的“信号1”的样本计算其它过零值(“过零值4”、“过零值5”、“过零值6”)。因此,过零值中的每个可被视为为之所计算出的信号值或信号样本的相应块的表示值。
此外,可以说,第一过零值序列与第一信号(信号1)的第一段420相关联,第二过零值序列与第一信号(信号1)的第二段430相关联。例如,第一过零值序列包括与第一块422相关联的过零值、与第二块424相关联的过零值以及与第三块426相关联的过零值。第二过零值序列包括与第四块432相关联的过零值、与第五块434相关联的过零值以及与第六块436相关联的过零值。第一过零值序列以附图标记450示出,且第二过零值序列以附图标记456示出。应注意,第一过零值序列和第二过零值序列可与过零信息114或过零值序列214或第一和第二过零值序列322、324相对应。因此,第一过零值序列和第二过零值序列可由过零信息确定110或由过零值确定器210、320提供。此外,可通过比较120或通过过零值序列比较220、330比较第一过零值序列和第二过零值序列。例如,可使用相关的计算比较第一过零值序列和第二过零值序列。可选地,也可使用用于两个值序列的比较的其它概念,如本文中所述。
因此,获得表示(或描述)第一段420(第一过零值序列基于其)和第二段430(第二过零值序列基于其)之间的相似度的相似度值。换句话说,相似度值表示已经计算出的过零值序列所基于的输入信号的那些段之间的相似度。
作为另一示例,第一信号(信号1)的重叠部分的比较以附图标记440示出。如可看到的,比较包括信号块或信号段“块1”、“块2”、“块3”和“块4”的第三段与包括信号块或信号段“块4”、“块5”、“块6”和“块7的第四段“段4”。类似于前述情况,一个过零值与所述块“块1”至“块7”中的每个相关联,其中过零值以“过零值1a”至“过零值7a”表示。
相应地,第三过零值序列包括过零值1a至4a,且第四过零值序列包括过零值4a至7a。相应地,可比较第三过零值序列和第四过零值序列,其中比较过零值1a和过零值4a、其中比较过零值2a和过零值5a等等。相应地,可以比较单个信号的重叠段(段3和段4),其中段由“重叠”过零值序列表示。自然地,无需多次计算对两个(或更多个)过零值序列共有的那些过零值。相反,仅计算每个过零值一次并选择与待被比较的信号段对应的过零值的那些子集合用于比较自然是足够的。
5.根据图5的示例
随后将参考图5描述信号(或其部分)的比较的执行。比较可以,例如,对应于互相关,其中待被比较的信号段的块(或部分)由过零值表示。
附图标记510处的表示示出第一信号的段520,其中此段包括第一块522、第二块524以及第三块526,其中块522、524、526例如是不重叠的,是信号段520的紧随后时间部分。块522、524、526中的每个在信号是时间离散的情况下可包括多个信号样本,其中信号样本由与时间轴512(横坐标)交叉的垂直线表示。第一信号的第一过零值(过零值1,1)与第一块522相关联,第一信号的第二过零值(过零值1,2)与第二块524相关联,以及第三过零值(过零值1,3)与第三块526相关联。
类似地,存在与第一信号不同且以附图标记530表示的第二信号。横坐标532表示时间。第二信号的信号段(本文中表示为“第二信号段”540)被选中用于比较。第二信号540包括块542、544、546(也被表示为“过零值2,3”、“过零值2,4”以及“过零值2,5”)。因此,包括过零值“过零值1,1”、“过零值1,2”以及“过零值1,3”的第一过零值序列与被选中用于比较的第一信号的(第一)信号段520相关联。类似地,包括过零值“过零值2,3”、“过零值2,4”以及“过零值2,5”的第二过零值序列与第二信号的(第二)信号段540相关联,其中所述(第二)段被选中用于比较。相应地,比较第一过零值序列和第二过零值序列,以获得描述第一信号段520和第二信号段540之间的相似度的相似度信息。此外,第一信号段520的块或部分由第一过零值序列的个别值表示,且第二信号段540的块或部分由第二过零值序列的个别值表示。
总之,各自包括第一信号和第二信号的大量个别样本值的完整信号段520、540的比较由过零值序列的比较替代。然而,过零值序列的值的数量通常远小于由过零值序列表示的信号段的信号样本值的数量。例如,表示信号段所需的过零值的数量可以比信号段的时间离散表示的信号样本的数量少10倍或甚至更多倍。因此,过零值序列的比较比由信号样本值表示的信号段的比较花费更少的时间。
6.根据图6的示例
图6示出如何从信号如,例如音频信号或视频信号得出过零值的示意性表示。
以附图标记610表示信号的段。横坐标612描述时间,且纵坐标614描述信号值。信号的时间演变由曲线620描述。
即使曲线被示出为时间连续曲线620,信号也可自然地由具有足够时间分辨率的时间离散样本表示。
然而,信号段630被(任意地)限定用于比较。由开始时间t0和结束时间t3限定的此信号段630被划分成三个时间部分或块,始于时间t0止于时间t1的第一块632、始于时间t1止于时间t2的第二块634以及始于时间t2止于时间t3的第三块636。如可看到的,可容易地识别过零。过零为所考虑的信号的值与“零线”(即,纵坐标612)交叉的点。可将上升过零和下降过零区分开。例如,上升过零是信号值为0的点,其中信号值在所述过零不久之前为负,且其中信号值在过零不久之后为正,如对于时间连续信号可容易地确定的。然而,对于时间离散信号,如果第一样本取负值且紧随后样本值取正值,可识别过零。如果第一样本值取负值,紧随后样本值取0值以及另一紧随后样本值取正值,则可识别上升过零。
下降过零是对于信号值在过零不久之前为正且其中信号值在过零不久之后为负的情况下信号值取0值所在的点。对于时间连续信号可容易地识别此。对于时间离散信号,如果发现第一样本值取正值且紧随后第二样本值取负值,可识别下降过零。此外,作为特定情况,如果第一样本值取正值,紧随后第二样本值取0值以及另一紧随后第三样本值取负值,可识别下降过零。
例如,参考第一块632,可识别三个上升过零(标记为“x”)。此外,可识别三个下降过零(标记为“.”)。如上所提及,对于时间连续信号(例如,使用模拟电路)以及对于时间离散信号(例如,使用数字评估,如前所述),识别均是可行的。
参考第二块634,可看出,可识别六个上升过零以及五个下降过零。在第三块636中,可识别四个上升过零和五个下降过零。
取决于过零值确定器和过零值序列比较的实际实施,不同块内的上升过零数量和/或个别块内的下降过零数量可被视为独立特征。在一些实施例中,仅评估不同块中的上升过零数量。在另外的实施例中,仅评估个别块中的下降过零数量。在一些实施例中,评估个别块中的上升过零数量以及个别块中的下降过零数量两者。然而,在一些实施例中,评估个别块中的总过零数量(其中不同块内的总过零数量组成过零值序列)。
过零值序列(以数字6、11和9的序列的形式)的示例以附图标记650示出。
因此,过零值序列6,11,9可以,例如,与“段1”630相关联。信号或另一信号的另一段可由另一过零值序列(例如,由序列7,12,8)表示。自然地,过零值序列也可采用不同长度。
因此,通过过零值序列比较进行的比较可基于与单个信号的不同段相关联或与待被比较的不同信号的段相关联的过零值序列而进行。
7.根据图7的方法
图7示出用于基于一个或多个输入信号确定相似度信息的方法的示意性框图。方法700包括对于一个或多个输入信号的至少一个的多个部分确定710描述各自的部分中的过零数量的过零信息。方法700还包括基于过零信息进行720比较,以确定相似度信息。
应注意,方法700基于以上关于装置100、200、300所论述的相同考虑。此外,可通过本文中例如关于相应装置描述的特征和功能对方法700进行补充。
8.应用
根据本发明的实施例可应用于各种技术装置中。例如,以上描述的装置可在用于分析音频信号、视频信号、来自物理传感器的传感器信号或任意其它电信号或光信号的信号分析器中使用。类似地,本文中描述的装置可在用于处理音频信号、视频信号、来自感测物理量的物理传感器的传感器信号或另一电信号或光信号的信号处理器中使用。
例如,本文中描述的装置可在用于对齐音频信号的音频处理器中使用。可选地,本文中描述的装置可用于音高确定,其中本文中描述的装置可执行“自相关”功能,其包括比较不同信号段。
然而,可实施具有音频编码器或音频解码器的本文中描述的装置的许多不同应用。
9.其它方面和结论
根据本发明的实施例基于以下发现:块内的过零(例如,被定义为用于非常强健的估计的代表值。例如,表示块内的所述过零数量的值可表示“周围”样本(例如,各个块的样本)的数量。已发现,使用所有符号改变(或所有过零)、或仅从负至正的改变(上升过零)或从正至负的改变(下降过零)仅是次要重要的。因此,代表(例如,表示输入信号的块的样本的值)包括在(输入信号的)其块中的符号改变的数量。为使此方法作用,优选地,在计数(例如,计数过零)之前从信号中(例如,从输入信号中或从多个输入信号中)移除常数分量(DC分量)。常数分量的此移除可被视为“DC移除”或“DC滤波”。
代表的数据流(即,包括表示一个或多个信号的不同块中的过零数量的值的数据流,如,例如过零值序列)可被馈送至互相关(例如,比较120或过零值序列比较220、330)以计算流之间的延迟(例如,不同过零值序列之间的延迟)。随后,结果可与块大小n(例如,以样本表示输入信号的块的大小)相乘以达到真实偏移(例如,关于样本的两个输入信号之间的时移)。
为了使得互相关能够提供有效结果,也应从两个数据流(例如,从两个过零值序列)中移除常数分量(例如,“DC分量”)或平均。此可通过(例如)DC移除/滤波226或通过DC移除/滤波326、328执行。如果使用过零总数量,所有值可以是正(或0,在一些例外情况下)。然而,当使用一系列正值时,在一些情况下不能从相关得到有意义的结果。
然而,本文中描述的方法不限于互相关。也可用于使用自相关的应用。例如,参考过零值序列比较220,其可,例如,利用此类自相关。
作为方法的可选扩展,可使用每块两个代表。例如,一个代表可单独地保存(或表示)从正至负的改变的数量(例如,块中的下降过零的数量)以及一个可单独地保存(或表示)从负至正的改变(例如上升过零)的数量。如果额外处理功率对于同时运行相关(其中一个相关可操作在表示上升过零数量的过零值序列上且其中一个相关可操作在表示下降过零数量的过零值序列上)是可用的,可进一步增强强健性,因为可比较两个结果且可获得可靠性的度量。应注意,在一些情况下,两个值是近乎相等的。然而,在一些情况下,此概念是有用的。因此,如果使用额外特征,有时候优选地特征是不同的,如下将所描述的。
测试结果已示出,在这些方法中,块大小后退至关于强健性的背景技术。因此,主要(或有时候仅)决定因子是为各个应用达到哪种准确度。
应注意,本文中描述的装置和方法可被用于待被相关的所有信号类型。本文中描述的概念不限于音频应用,即使当被用于音频信号时概念带来特别有利的结果。
在下文中,将描述一些可选扩展。
特别地,一个或多个其它特征可可选地用于本文中描述的实施例中。
可使用不同特征修改或扩展本文中描述的方法。例如,在音频信号处理中,从信号计算出的可被用于描述信号的值被识别为特征。这包括过零数量或过零率。可在本发明的实施例中等同地使用二者。换言之,本文中提及的过零值可描述输入信号的各个部分中的过零数量或输入信号的块中的每时间单位(平均)过零数量。
此外,除了(在时域中)可从过零数量计算出的特征,可在时域中或在频域中计算其它特征。额外特征或特征值的此确定以(例如)图3中的附图标记350示出。为了在频域中计算,通过使用离散傅里叶变换(或不同频域变换或时域至频域变换)可将样本的每个块传递至频域且可从计算的谱中确定特征或特征值。这些特征包括(例如)谱平坦度度量和/或谱通量(或谱通量值)。谱通量为两个连续(subsequent)谱之间(例如,与输入信号的连续块相关联的谱之间)的改变的度量,且从两个谱的差的向量范数(例如L2范数)或从两个谱向量之间的距离度量计算出。其它可能特征包括LPC系数(线性预测编码系数)。
此外,通过降采样一个或多个输入信号获得的值可被用作额外特征(除过零值以外)。除了简单降采样,可使用其它表示值。示例包括块的能量,样本的均值或峰值因子。即使块的这些表示在对于测试数据的广泛集合单独采用时不能提供可靠结果,它们可以作为额外特征值补充过零值。
然而,应注意,其它特征值也可基于一个或多个输入信号从块(或部分)的频域表示提取。例如,谱最大值的位置可由特征值表示。可选地,谱峰值的数量可由特征值表示。作为另一选项,描述谱如何随着频率变化的谱斜率可由特征值表示。
这些额外特征或特征值可被用于特征值序列比较(例如,特征值序列比较220或特征值序列比较330)中,其中过零值序列和包括表示并非过零值的其它特征的额外特征值的特征值序列可被用在比较中。
应注意,可以可选地使用其它函数用于计算时间偏移。除了自相关或互相关,或作为自相关或互相关的替代,可使用这些其它函数。为了确定(例如,两个输入信号之间的)时间偏移,可计算相关函数。
可选地,可确定“平均幅度差函数”(AMDF)。
原则上,可通过比较信号(或信号的段)的表示x(t)与时移表示x(t+d)确定时间偏移,其中变量d为时间偏移。例如,可将x1(t)与x1(t+d)或x2(t+d)进行比较,其中x1为第一信号,x2为第二信号。根据本文中描述的发明,表示x可以为信号(或两个或更多个信号中的一个)或降采样的信号或基于特征的表示。时间偏移对应于d,其最大化x(t)和x(t+d)之间(或x1(t)和x2(t+d)之间)的相似度。
通过将来自块的每个样本与来自时移块的每个样本相乘且通过随后将所有乘积相加可计算相关。当考虑两个块为向量时,此对应于这些标量乘积(内积)。
可使用可选的相似度度量,例如,L1范数或欧几里得距离。当使用L1范数时,计算x(t)和x(t+d)之间或x1(t)和x1(t+d)之间或x1(t)和x2(t+d)之间的逐元素差的均值。
换句话说,为了基于输入信号x1计算自相关,需要对于“自相关滞后”d的不同值确定信号部分x1(t)和x1(t+d)之间的相似度,且需要确定对于哪个d得出的相似度值取最大值。x1(t)由第一过零值序列表示且x1(t+d)由第二过零值序列表示,其中第二过零值序列独立于所选的d。通过比较用于不同的d值的第一过零值序列和第二过零值序列,可确定对于哪个d值,第一过零值序列和第二过零值序列(其都属于信号x1,仅用于不同值d)是最相似的。因此,最大化相似度的d值可被确定。
可选地,可确定两个输入信号x1(t)和x2(t)之间的互相关。例如,对于不同d值,通过比较与x1(t)和x2(t+d)相关的过零值序列,可比较与x1(t)和x2(t+d)相关的信号段。各个过零值序列的比较的结果允许得出各个信号x1(t)和x2(t+d)的相似度的良好结论。
因此,通过比较过零值序列(例如,使用自相关、互相关或任意其他比较函数),可获得数值结果,其是作为基础的信号部分x1(t)和x1(t+d)或x1(t)和x2(t+d)之间的直接比较的良好估计。
在下文中,可提供一些其他评论,且将简要地论述一些其他可选扩展。
应注意,即使样本准确相关当用于样本数据时已经导致错检测(错误检测)。使用本文中论述的过零方法,这些错误检测没有出现。因此,通过使用基于最初使用过零方法的迭代概念或方法,可改进样本准确相关结果。例如,一旦已经使用本文中描述的过零方法获得粗糙结果,可使用样本准确相关。因此,本文中描述的概念也可包括除最优化计算工作量(即,算法优势)之外的优势。
此外,可以可选地通过确定关于相关结果的可靠性信息的可靠性检查块(或步骤)补充本文中公开的实施例。例如,可在相关结果上(例如,在自相关函数上或互相关函数上)计算谱平坦度或谱平坦度度量。谱平坦度的度量用作用于相关结果的质量的质量度量。峰值相对于其周围增大越多,结果越可靠。换句话说,可靠性检查块可以计算自相关函数(例如,自相关函数222)或互相关函数(例如,互相关函数332)的谱平坦度的度量,且可从谱平坦度的度量得出可靠性信息(描述各个相关函数的可靠性)。
此外,可以可选地扩展本文中公开的实施例,以执行迭代搜索。例如,可在第一步骤中使用(例如,至少一个输入信号的部分的)相对大的块大小,使得过零值中的每个表示此相对大的块。相应地,可获得对于小时移不很敏感的(例如,相似度信息的)粗略结果。随后,可(例如,在第二步骤中)使用(例如,至少一个输入音频信号的部分的)相对小的块大小,以获得精细的相似度信息。在第二步骤中使用的搜索范围(例如,在其上计算过零值序列的范围)可取决于第一步骤的结果。相应地,使用相对大的块(相应的过零值与其相关联)以及因此相对大的搜索范围的第一步骤可被用来确定在第二步骤中使用的搜索范围,其中第二步骤中的搜索范围可以小于第一步骤中的搜索范围(例如,归因于第二步骤中使用较小块大小)。
总之,已描述一些实施例,其中使用过零值或过零值序列允许近似一个或多个技术上有意义的信号(例如,音频信号、视频信号等)的自相关或互相关的结果,其中可保持复杂度为小,且其中结果的质量通常很好。
应注意,根据本发明的实施例可用于延迟的测量,如上所提及。
10.实施可选例
尽管已经在装置的上下文中描述了一些方面,清楚的是,这些方面也表示相应方法的描述,其中块或设备对应于方法步骤或方法步骤的特征。类似地,已经在方法步骤的上下文中描述的方面也可表示相应装置的相应块或项或特征的描述。可以通过(或使用)硬件装置(如,例如微处理器、可编程计算机或电子电路)执行方法步骤的一些或全部。在一些实施例中,可以由这种装置执行最重要的方法步骤中的一个或多个。
依据某些实施需求,可以以硬件或软件实施本发明的实施例。可以使用具有存储于其上的电子可读控制信号的数字存储介质(例如软盘、DVD、蓝光光盘、CD、ROM、PROM、EPROM、EEPROM或闪存)执行该实施以执行各个方法,电子可读控制信号与(或能够与)可编程计算机系统协作。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有能够与可编程计算机系统协作以执行本文描述的方法中的一个的电子可读控制信号的数据载体。
通常,本发明的实施例可以被实施为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法中的一个。程序代码可以存储在例如机器可读载体上。
其他实施例包括用于执行本文描述的方法中的一个的计算机程序,所述计算机程序存储在机器可读载体上。
换言之,本发明的方法的实施例因此是一种计算机程序,其具有用于当计算机程序在计算机上运行时执行本文描述的方法中的一个的程序代码。
因此,本发明的方法的另一实施例是数据载体(或数字存储介质或计算机可读介质),包括记录于其上的用于执行本文描述的方法中的一个的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非易失的。
因此,本发明的方法的另一实施例是数据流或信号序列,其表示用于执行本文描述的方法中的一个的计算机程序。例如,数据流或信号序列可以被配置为经由数据通信连接(例如经由互联网)被传输。
另一实施例包括处理构件,例如计算机或可编程逻辑设备,其被配置为或适于执行本文描述的方法中的一个。
另一实施例包括其上安装有用于执行本文描述的方法中的一个的计算机程序的计算机。
根据本发明的另一实施例包括用于将用于执行本文描述的方法中的一个的计算机程序(例如,电子地或光学地)传输至接收器的装置或系统。接收器可以例如是计算机、移动设备、存储设备或类似设备。装置或系统可以例如包括用于将计算机程序传输至接收器的文件服务器。
在一些实施例中,可编程逻辑设备(例如,现场可编程门阵列)可用于执行本文描述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文描述的方法中的一个。通常,优选地由任何硬件装置执行方法。
可以使用硬件装置或使用计算机或使用硬件装置和计算机的组合实施本文中描述的装置。
可以至少部分地以硬件和/或以软件实施本文中描述的装置或本文中描述的装置的任何组件。
可以使用硬件装置或使用计算机或使用硬件装置和计算机的组合实施本文中描述的方法。
可以至少部分地以硬件和/或以软件实施本文中描述的方法或本文中描述的装置的任何组件。
实施例创立一种用于基于一个或多个输入信号确定相似度信息的装置,如本文中所述。
另一实施例创立一种用于执行本文中描述或主张的装置的任意功能的方法。
另一实施例创立一种用于执行所述方法的计算机程序。
上述实施例仅表示本发明的原理的说明。应当理解的是,本文中描述的布置和细节的修改和变型对于本领域技术人员来说是显而易见的。因此,意图是本发明仅受所附权利要求的范围限制,而不受借助于本文中的实施例的描述和解释而呈现的具体细节的限制。
Claims (26)
1.一种用于基于一个或多个输入信号(112;212;312;314)确定相似度信息(122;222;332)的装置(100;200;300),
其中所述装置用于对于所述一个或多个输入信号中的至少一个的多个部分确定描述各自的部分(422,424,426,432,434,436;522,524,526,542,544,546)中的过零数量的过零信息(114;214;322,324);以及
其中所述装置用于基于所述过零信息进行比较,以确定相似度信息。
2.根据权利要求1所述的装置(100;200;300),其中所述装置用于对于所述一个或多个输入信号中的至少一个的多个部分(422,424,426,432,434,436;522,524,526,542,544,546)确定过零总数量、或上升过零数量、或下降过零数量作为所述过零信息(114;214;322,324)。
3.根据权利要求1所述的装置(100;200;300),其中所述装置用于对于所述一个或多个输入信号中的至少一个的多个部分(422,424,426,432,434,436;522,524,526,542,544,546)确定过零率作为所述过零信息(114;214;322,324)。
4.根据权利要求1-3中任一项所述的装置,其中所述装置(100;200;300)用于确定所述过零信息(114;214;322,324),使得至少一个过零值与所述一个或多个输入信号中的至少一个的多个部分中的每个部分(422,424,426,432,434,436;522,524,526,542,544,546)相关联。
5.根据权利要求1-4中任一项所述的装置(100;200;300),
其中所述装置用于对于第一信号段(420;520)确定第一过零值序列(114,214,322,450),其中所述第一信号段包括多个信号块(422,424,426;522,524,526),以及其中所述第一过零值序列包括与所述第一信号段的信号块中的每个相关联的一个或多个过零值;以及
其中所述装置用于对于第二信号段(430;540)确定第二过零值序列(114,214,324,456),其中所述第二信号段包括多个信号块(432,434,436;542,544,546),以及其中所述第二过零值序列包括与所述第二信号段的信号块中的每个相关联的一个或多个过零值。
6.根据权利要求1-5中任一项所述的装置(100;200;300),其中所述装置用于比较包括多个过零值的第一过零值序列(322;450)与包括多个过零值的第二过零值序列(324;456),获得描述第一信号段(420)与第二信号段(430)之间的相似度的相似度信息,
其中所述第一过零值序列与所述第一信号段相对应,以及其中所述第二过零值序列与所述第二信号段相对应,以及
其中所述过零值构成所述过零信息。
7.根据权利要求6所述的装置(100;200;300),其中所述装置用于使用所述第一过零值序列(322;450)和所述第二过零值序列(324;456)计算相关值,获得所述相似度信息(122;222;332);或
其中所述装置用于使用所述第一过零值序列和所述第二过零值序列计算平均幅度差值,获得所述相似度信息;或
其中所述装置用于计算所述第一过零值序列和所述第二过零值序列之间的差的范数,获得所述相似度信息;或
其中所述装置用于计算所述第一过零值序列和所述第二过零值序列之间的欧几里得距离,获得所述相似度信息。
8.根据权利要求6所述的装置(100;200;300),其中所述装置用于计算所述第一过零值序列或其部分和所述第二过零值序列的多个时移版本或其时移部分之间的多个差度量值,获得关于提供所述第一过零值序列或其部分和所述第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息(232;324)。
9.根据权利要求6或8所述的装置(100;200;300),其中所述装置用于使用所述第一过零值序列(322;450)和所述第二过零值序列(324;456)计算相关函数,获得关于提供所述第一过零值序列或其部分和所述第二过零值序列的时移版本或其部分之间的最大相似度的时移的信息(232;324);或
其中所述装置用于使用所述第一过零值序列和所述第二过零值序列计算平均幅度差函数,比较所述第一过零值序列的部分和所述第二过零值序列的时移部分,并获得关于提供所述第一过零值序列(x1(t);322;450))或其部分和所述第二过零值序列(x2(t);32;456))的时移版本(x2(t+d))或其部分之间的最大相似度的时移(d)的信息。
10.根据权利要求1-9中任一项所述的装置(100;200;300),其中所述装置用于在比较所述第一过零值序列和所述第二过零值序列之前从所述第一过零值序列(114;214;322)和/或从所述第二过零值序列(324)中移除常数分量。
11.根据权利要求1-10中任一项所述的装置(100;200;300),其中所述装置用于在确定所述过零信息之前从所述一个或多个输入信号(112;212;312;314)中移除常数分量和/或对所述一个或多个输入信号应用高通滤波。
12.根据权利要求1-11中任一项所述的装置(100;200;300),其中所述装置用于对于多个信号块确定每信号块的两个或更多个代表值,
其中所述两个或更多个代表值描述信号块的特征,以及
其中所述两个或更多个代表值包括作为过零信息的过零值;以及
其中所述装置用于基于所述两个或更多个代表值进行比较,以确定所述相似度信息。
13.根据权利要求12所述的装置(100;200;300),其中所述代表值对每信号块包括描述各自的信号块中的上升过零数量的正过零值和描述各自的信号块中的下降过零数量的负过零值。
14.根据权利要求12或13所述的装置(100;200;300),其中所述装置用于对于多个信号块基于第一类型的代表值序列进行第一比较,以及对于多个信号块基于第二类型的代表值序列进行第二比较,以及
其中所述装置用于比较所述第一比较的结果和所述第二比较的结果,以获得可靠性信息。
15.根据权利要求12-14中任一项所述的装置(100;200;300),其中所述装置用于确定两个代表值中的一个,所述两个代表值是对每信号块使用各自的信号块的频域表示确定的。
16.根据权利要求12-15中任一项所述的装置(100;200;300),其中所述装置用于确定谱平坦度度量作为对每信号块确定的两个代表值中的一个。
17.根据权利要求12-16中任一项所述的装置(100;200;300),其中所述装置用于确定描述各自的信号块的谱的平坦度的谱平坦度值作为对每信号块确定的两个代表值中的一个。
18.根据权利要求12-17中任一项所述的装置(100;200;300),其中所述装置用于确定谱通量值作为对每信号块确定的两个代表值中的一个,
其中所述谱通量值以单个量化值的形式描述两个各自连续的信号块的谱之间的变化。
19.根据权利要求12-18中任一项所述的装置(100;200;300),其中所述装置用于确定用于各自的信号块的线性预测系数(LPC)作为对每信号块确定的两个代表值中的一个。
20.根据权利要求1-19中任一项所述的装置(100;200;300),其中所述装置用于接收一个或多个音频信号或一个或多个视频信号作为所述一个或多个输入信号(112;212;312;314)并基于所述一个或多个音频信号或基于所述一个或多个视频信号确定所述过零信息(114;214;322,324)。
21.根据权利要求1-20中任一项所述的装置(100;200;300),其中所述装置用于使用所述相似度信息(122;222;332)以获得关于音频信号或视频信号的自相关信息;或
其中所述装置用于使用所述相似度信息以获得与两个音频信号相关或与两个视频信号相关的互相关信息;或
其中所述装置用于使用所述相似度信息以确定获得两个音频信号之间的最可行对齐的时移(232;342),或确定获得两个视频信号之间的最可行对齐的时移(232;342)。
22.根据权利要求1-21中任一项所述的装置,其中所述装置用于在第一步骤中使用第一块大小确定第一过零信息并基于所述第一过零信息进行比较,以获得表示所述一个或多个输入信号的相似区域之间的时移的信息,以及
其中所述装置用于在第二步骤中使用第二块大小确定第二过零信息,以获得表示所述一个或多个输入信号的相似区域之间的时移的精细信息,
其中对于其确定所述第二过零信息的范围取决于在所述第一步骤中获得的表示所述一个或多个输入信号的相似区域之间的时移的信息,以及其中所述第二块大小小于所述第一块大小。
23.一种用于基于一个或多个输入信号确定相似度信息的方法(700),
其中所述方法包括对于所述一个或多个输入信号中的至少一个的多个部分确定(710)描述各自的部分中的过零数量的过零信息,以及
其中所述方法包括基于所述过零信息进行(720)比较,以确定相似度信息。
24.一种计算机程序,用于在所述计算机程序运行于计算机上时执行权利要求23所述的方法。
25.一种用于确定描述单个信号的不同段之间的相似度的自相关信息(122;222)的装置(100;200),所述信号为音频信号或视频信号,所述装置包括:
过零分析器(112;210),用于对于信号的多个块确定包括所述信号的每块的至少一个过零值的过零信息(114;214),
其中所述过零值描述用于所述信号的各个块的过零数量;
过零值序列比较器(120;220),用于比较与所述信号的第一信号段相关联的过零值的过零值序列和与所述信号的第二信号段相关联的过零值的第二过零值序列,以获得所述自相关信息。
26.一种用于确定描述第一信号(312)和第二信号(314)之间的相似度的互相关信息(332)的装置(300),所述第一信号和第二信号为音频信号或视频信号,所述装置包括:
过零分析器(320),用于对于所述第一信号的多个块确定包括所述第一信号的每块的至少一个过零值的过零信息(322)并对于所述第二信号的多个块确定包括所述第二信号的每块的至少一个过零值的过零信息(324),
其中所述过零值描述各个信号的各个块的过零数量;
过零值序列比较器(330),用于比较与所述第一信号的信号段相关联的过零值的过零值序列和与所述第二信号的信号段相关联的过零值的过零值序列,以获得所述互相关信息。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16170744 | 2016-05-20 | ||
EP16170744.3 | 2016-05-20 | ||
EP16199181.5A EP3246824A1 (en) | 2016-05-20 | 2016-11-16 | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
EP16199181.5 | 2016-11-16 | ||
PCT/EP2017/062044 WO2017198794A1 (en) | 2016-05-20 | 2017-05-18 | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109478198A true CN109478198A (zh) | 2019-03-15 |
CN109478198B CN109478198B (zh) | 2023-09-22 |
Family
ID=56117481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780045322.XA Active CN109478198B (zh) | 2016-05-20 | 2017-05-18 | 用于确定相似度信息的装置、方法及计算机存储介质 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10565284B2 (zh) |
EP (2) | EP3246824A1 (zh) |
JP (2) | JP6962664B2 (zh) |
KR (1) | KR102306332B1 (zh) |
CN (1) | CN109478198B (zh) |
AU (1) | AU2017266384B2 (zh) |
BR (1) | BR112018073889B1 (zh) |
CA (1) | CA3024772C (zh) |
MX (1) | MX2018014113A (zh) |
RU (1) | RU2747442C2 (zh) |
WO (1) | WO2017198794A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111341302A (zh) * | 2020-03-02 | 2020-06-26 | 苏宁云计算有限公司 | 一种语音流采样率确定方法及装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103858859B (zh) | 2008-06-27 | 2015-11-04 | 博傲沃德株式会社 | 细胞及组织的冷冻保存用组合物 |
EP3246824A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
TWI766259B (zh) * | 2020-03-27 | 2022-06-01 | 莊龍飛 | 運動課程評分方法與系統、電腦程式產品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998027543A2 (en) * | 1996-12-18 | 1998-06-25 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP2003132041A (ja) * | 2001-10-22 | 2003-05-09 | Sony Corp | 信号処理方法及び装置、信号処理プログラム、並びに記録媒体 |
TW564400B (en) * | 2001-12-25 | 2003-12-01 | Univ Nat Cheng Kung | Speech coding/decoding method and speech coder/decoder |
JP2008257020A (ja) * | 2007-04-06 | 2008-10-23 | Alpine Electronics Inc | メロディーの類似度算出方法及び類似度算出装置 |
JP2009511980A (ja) * | 2005-10-17 | 2009-03-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ入力信号についての特徴のセットを導出する方法 |
US20090296860A1 (en) * | 2008-06-02 | 2009-12-03 | Harris Corporation | Adaptive correlation |
US20120250830A1 (en) * | 2011-03-29 | 2012-10-04 | Microsoft Corporation | Conference signal anomaly detection |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5846396A (ja) * | 1981-09-16 | 1983-03-17 | 株式会社日立製作所 | 音声信号検出装置 |
JPS607459A (ja) * | 1983-06-27 | 1985-01-16 | 松下電器産業株式会社 | 音響装置 |
JPS62194298A (ja) * | 1986-02-21 | 1987-08-26 | 株式会社日立製作所 | ピツチ抽出方式 |
JPH02203397A (ja) * | 1989-02-02 | 1990-08-13 | Toshiba Corp | 有音・無音検出方式 |
JPH0689095A (ja) * | 1992-09-08 | 1994-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号選択装置 |
US9191260B1 (en) * | 1999-04-05 | 2015-11-17 | Lightworks Ii, Llc | Method and apparatus to determine a match between signals |
US8024390B2 (en) * | 2005-07-01 | 2011-09-20 | Schneider Electric USA, Inc. | Automated data alignment based upon indirect device relationships |
US8214304B2 (en) | 2005-10-17 | 2012-07-03 | Koninklijke Philips Electronics N.V. | Method and device for calculating a similarity metric between a first feature vector and a second feature vector |
JP2007292940A (ja) * | 2006-04-24 | 2007-11-08 | Toyota Motor Corp | 音声識別装置及び音声識別方法 |
JP2011065093A (ja) | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
JP5569228B2 (ja) | 2010-08-02 | 2014-08-13 | ソニー株式会社 | テンポ検出装置、テンポ検出方法およびプログラム |
JP5641326B2 (ja) | 2010-12-21 | 2014-12-17 | ソニー株式会社 | コンテンツ再生装置および方法、並びにプログラム |
JP2012203351A (ja) * | 2011-03-28 | 2012-10-22 | Yamaha Corp | 子音識別装置、およびプログラム |
DE102014011424A1 (de) * | 2014-07-31 | 2016-02-04 | Airbus Operations Gmbh | Technik der zerstörungsfreien Prüfung |
EP3246824A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program |
-
2016
- 2016-11-16 EP EP16199181.5A patent/EP3246824A1/en not_active Withdrawn
-
2017
- 2017-05-18 EP EP17723440.8A patent/EP3458973A1/en active Pending
- 2017-05-18 CA CA3024772A patent/CA3024772C/en active Active
- 2017-05-18 JP JP2018560989A patent/JP6962664B2/ja active Active
- 2017-05-18 AU AU2017266384A patent/AU2017266384B2/en active Active
- 2017-05-18 BR BR112018073889-1A patent/BR112018073889B1/pt active IP Right Grant
- 2017-05-18 MX MX2018014113A patent/MX2018014113A/es unknown
- 2017-05-18 RU RU2018145032A patent/RU2747442C2/ru active
- 2017-05-18 WO PCT/EP2017/062044 patent/WO2017198794A1/en active Search and Examination
- 2017-05-18 CN CN201780045322.XA patent/CN109478198B/zh active Active
- 2017-05-18 KR KR1020187036689A patent/KR102306332B1/ko active IP Right Grant
-
2018
- 2018-11-20 US US16/196,711 patent/US10565284B2/en active Active
-
2021
- 2021-05-06 JP JP2021078687A patent/JP7317888B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998027543A2 (en) * | 1996-12-18 | 1998-06-25 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP2003132041A (ja) * | 2001-10-22 | 2003-05-09 | Sony Corp | 信号処理方法及び装置、信号処理プログラム、並びに記録媒体 |
TW564400B (en) * | 2001-12-25 | 2003-12-01 | Univ Nat Cheng Kung | Speech coding/decoding method and speech coder/decoder |
JP2009511980A (ja) * | 2005-10-17 | 2009-03-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ入力信号についての特徴のセットを導出する方法 |
JP2008257020A (ja) * | 2007-04-06 | 2008-10-23 | Alpine Electronics Inc | メロディーの類似度算出方法及び類似度算出装置 |
US20090296860A1 (en) * | 2008-06-02 | 2009-12-03 | Harris Corporation | Adaptive correlation |
US20120250830A1 (en) * | 2011-03-29 | 2012-10-04 | Microsoft Corporation | Conference signal anomaly detection |
Non-Patent Citations (3)
Title |
---|
JUSTIN LEE 等: "Acoustic Hazard Detection for Pedestrians", 《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION》 * |
LIE LU等: "A robust audio classification and segmentation method", 《9TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》 * |
ROBERT GUBKA 等: "A comparison of audio features for", 《DIGITAL TECHNOLOGIES》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111341302A (zh) * | 2020-03-02 | 2020-06-26 | 苏宁云计算有限公司 | 一种语音流采样率确定方法及装置 |
CN111341302B (zh) * | 2020-03-02 | 2023-10-31 | 苏宁云计算有限公司 | 一种语音流采样率确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
RU2747442C2 (ru) | 2021-05-05 |
JP6962664B2 (ja) | 2021-11-05 |
EP3458973A1 (en) | 2019-03-27 |
RU2018145032A (ru) | 2020-06-22 |
BR112018073889B1 (pt) | 2024-03-12 |
CA3024772C (en) | 2021-05-04 |
US20190095398A1 (en) | 2019-03-28 |
BR112018073889A2 (pt) | 2019-02-26 |
US10565284B2 (en) | 2020-02-18 |
MX2018014113A (es) | 2019-06-17 |
AU2017266384B2 (en) | 2020-05-14 |
WO2017198794A1 (en) | 2017-11-23 |
EP3246824A1 (en) | 2017-11-22 |
JP7317888B2 (ja) | 2023-07-31 |
JP2019523901A (ja) | 2019-08-29 |
AU2017266384A1 (en) | 2018-12-06 |
JP2021157180A (ja) | 2021-10-07 |
KR20190008925A (ko) | 2019-01-25 |
BR112018073889A8 (pt) | 2023-01-31 |
RU2018145032A3 (zh) | 2020-06-22 |
CA3024772A1 (en) | 2017-11-23 |
CN109478198B (zh) | 2023-09-22 |
KR102306332B1 (ko) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109478198A (zh) | 用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序 | |
US11657798B2 (en) | Methods and apparatus to segment audio and determine audio segment similarities | |
US10127905B2 (en) | Apparatus and method for generating acoustic model for speech, and apparatus and method for speech recognition using acoustic model | |
CN110136744B (zh) | 一种音频指纹生成方法、设备及存储介质 | |
US8586847B2 (en) | Musical fingerprinting based on onset intervals | |
CN103489445B (zh) | 一种识别音频中人声的方法及装置 | |
US8983082B2 (en) | Detecting musical structures | |
CN109979418B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
EP2926337A1 (en) | Clustering and synchronizing multimedia contents | |
CN107004417A (zh) | Mdct域错误掩盖 | |
JP6251486B2 (ja) | エンベロープを検出する方法及びその装置 | |
CN112446329A (zh) | 一种时变结构瞬时频率确定方法、系统、装置及存储介质 | |
Bergen et al. | Scalable similarity search in seismology: a new approach to large-scale earthquake detection | |
US11521629B1 (en) | Method for obtaining digital audio tampering evidence based on phase deviation detection | |
KR20160120361A (ko) | 먼지의 종류를 판별하는 방법 및 장치 | |
JP6467780B2 (ja) | 音声検査装置、音声検査方法、および音声検査プログラム | |
JP7472012B2 (ja) | 異常信号抽出装置 | |
JP2011164497A (ja) | テンポ値検出装置およびテンポ値検出方法 | |
CN111581599B (zh) | 重量值输出方法和数字称重变送器 | |
Govind et al. | A Robust Algorithm for Speech Polarity Detection Using Epochs and Hilbert Phase Information | |
You | Robust automatic speech recognition algorithms for dealing with noise and accent | |
Shiv | Improved frequency estimation in sinusoidal models through iterative linear programming schemes | |
Zhang et al. | Robust speech recognition with nonstationary noise | |
FR2808594A1 (fr) | Dispositif et procede rapide de mesure de la periode d'un signal complexe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |