RU2015105093A - METHOD FOR COMPARING THE FIRST INCOMING AUDIO TRACK WITH AN INDEXED AUDIO TRACK - Google Patents

METHOD FOR COMPARING THE FIRST INCOMING AUDIO TRACK WITH AN INDEXED AUDIO TRACK Download PDF

Info

Publication number
RU2015105093A
RU2015105093A RU2015105093A RU2015105093A RU2015105093A RU 2015105093 A RU2015105093 A RU 2015105093A RU 2015105093 A RU2015105093 A RU 2015105093A RU 2015105093 A RU2015105093 A RU 2015105093A RU 2015105093 A RU2015105093 A RU 2015105093A
Authority
RU
Russia
Prior art keywords
audio
audio track
track
candidate
signature
Prior art date
Application number
RU2015105093A
Other languages
Russian (ru)
Other versions
RU2606567C2 (en
Inventor
Елена Андреевна Калинина
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2015105093A priority Critical patent/RU2606567C2/en
Priority to PCT/IB2015/051557 priority patent/WO2016024172A1/en
Priority to US15/103,994 priority patent/US9558272B2/en
Publication of RU2015105093A publication Critical patent/RU2015105093A/en
Application granted granted Critical
Publication of RU2606567C2 publication Critical patent/RU2606567C2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/008Means for controlling the transition from one tone waveform to another
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • G10L21/045Time compression or expansion by changing speed using thinning out or insertion of a waveform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • G10L21/045Time compression or expansion by changing speed using thinning out or insertion of a waveform
    • G10L21/047Time compression or expansion by changing speed using thinning out or insertion of a waveform characterised by the type of waveform to be thinned out or inserted

Abstract

1. Способ сравнения первого входящего аудиотрека с индексированным аудиотреком посредством сервера, включающий:выбор индексированного аудиотрека из набора индексированных аудиотреков в качестве аудиотрека-кандидата посредством:определения первой короткой аудиосигнатуры, являющейся аудиосигнатурой первой части первого входящего аудиотрека и содержащей первое хромаслово, причем первая часть первого аудиотрека имеет предварительно определенную длительность от начала первого входящего аудиотрека;определения аудиотрека-кандидата из набора индексированных аудиотреков, при этом аудиотрек-кандидат имеет вторую короткую аудиосигнатуру, содержащую второе хромаслово, причем начальная часть второго хромаслова идентична начальной части первого хромаслова, а вторая короткая аудиосигнатура является аудиосигнатурой первой части аудиотрека-кандидата, причем первая часть аудиотрека-кандидата имеет первую предварительно определенную длительность от начала аудиотрека-кандидата;проверку на совпадение аудиотрека-кандидата с первым аудиотреком посредством:определения первой длинной аудиосигнатуры, являющейся аудиосигнатурой второй части первого входящего аудиотрека; извлечения второй длинной аудиосигнатуры, являющейся аудиосигнатурой второй части аудиотрека-кандидата;причем вторая часть первого аудиотрека и вторая часть аудиотрека-кандидата имеют вторую предварительно определенную длительность от начала, соответственно, первого аудиотрека и аудиотрека-кандидата; каждая первая часть соответствующего первого аудиотрека и аудиотрека-кандидата полностью входит во вторую часть1. A method of comparing a first incoming audio track with an indexed audio track through a server, comprising: selecting an indexed audio track from a set of indexed audio tracks as a candidate audio track by: determining a first short audio signature that is an audio signature of a first part of a first incoming audio track and containing a first chroma word, wherein the first part of the first the audio track has a predetermined duration from the beginning of the first incoming audio track; definitions of the candidate audio track c of a set of indexed audio tracks, wherein the candidate audio track has a second short audio signature containing a second chroma word, the initial part of the second chroma word being identical to the initial part of the first chroma word, and the second short audio signature is the audio signature of the first part of the candidate audio track, the first part of the candidate audio track having the first a predetermined duration from the beginning of the candidate audio track; checking for the matching of the candidate audio track with the first audio track by: determining rvoy long audiosignatury being audiosignaturoy second part of the first incoming audio track; extracting the second long audio signature, which is the audio signature of the second part of the candidate audio track; wherein the second part of the first audio track and the second part of the candidate audio track have a second predetermined duration from the beginning, respectively, of the first audio track and the candidate audio track; each first part of the corresponding first audio track and the candidate audio track is fully included in the second part

Claims (23)

1. Способ сравнения первого входящего аудиотрека с индексированным аудиотреком посредством сервера, включающий:1. A method of comparing a first incoming audio track with an indexed audio track through a server, comprising: выбор индексированного аудиотрека из набора индексированных аудиотреков в качестве аудиотрека-кандидата посредством:selecting an indexed audio track from a set of indexed audio tracks as a candidate audio track by: определения первой короткой аудиосигнатуры, являющейся аудиосигнатурой первой части первого входящего аудиотрека и содержащей первое хромаслово, причем первая часть первого аудиотрека имеет предварительно определенную длительность от начала первого входящего аудиотрека;determining the first short audio signature, which is the audio signature of the first part of the first incoming audio track and containing the first chroma word, the first part of the first audio track having a predetermined duration from the beginning of the first incoming audio track; определения аудиотрека-кандидата из набора индексированных аудиотреков, при этом аудиотрек-кандидат имеет вторую короткую аудиосигнатуру, содержащую второе хромаслово, причем начальная часть второго хромаслова идентична начальной части первого хромаслова, а вторая короткая аудиосигнатура является аудиосигнатурой первой части аудиотрека-кандидата, причем первая часть аудиотрека-кандидата имеет первую предварительно определенную длительность от начала аудиотрека-кандидата;determining a candidate audio track from a set of indexed audio tracks, wherein the candidate audio track has a second short audio signature containing a second chroma word, wherein the initial part of the second chroma word is identical to the initial part of the first chroma word, and the second short audio signature is the audio signature of the first part of the candidate audio track, the first part of the audio track - the candidate has a first predetermined duration from the beginning of the candidate audio track; проверку на совпадение аудиотрека-кандидата с первым аудиотреком посредством:checking that the candidate audio track matches the first audio track by: определения первой длинной аудиосигнатуры, являющейся аудиосигнатурой второй части первого входящего аудиотрека; извлечения второй длинной аудиосигнатуры, являющейся аудиосигнатурой второй части аудиотрека-кандидата;determining the first long audio signature, which is the audio signature of the second part of the first incoming audio track; extracting the second long audio signature, which is the audio signature of the second part of the candidate audio track; причем вторая часть первого аудиотрека и вторая часть аудиотрека-кандидата имеют вторую предварительно определенную длительность от начала, соответственно, первого аудиотрека и аудиотрека-кандидата; каждая первая часть соответствующего первого аудиотрека и аудиотрека-кандидата полностью входит во вторую часть соответствующего первого аудиотрека и аудиотрека-кандидата;moreover, the second part of the first audio track and the second part of the candidate audio track have a second predetermined duration from the beginning, respectively, of the first audio track and the candidate audio track; each first part of the corresponding first audio track and the candidate audio track is fully included in the second part of the corresponding first audio track and the candidate audio track; осуществления побитного сравнения первой длинной аудиосигнатуры со второй длинной аудиосигнатурой.bitwise comparing the first long audio signature with the second long audio signature. 2. Способ по п. 1, в котором в качестве начальной части хромаслова используют комбинацию:2. The method according to p. 1, in which as the initial part of the chroma word use a combination of: первого байта или первой многобайтовой последовательности, являющейся последовательностью байтов в начале начальной части соответствующего хромаслова и имеющая предварительно определенное число байтов; и последующего байта или второй многобайтовой последовательности, являющейся последовательностью байтов, следующей за первой многобайтовой последовательностью или за первым байтом каждого соответствующего хромаслова, причем во второй многобайтовой последовательности имеется предварительно определенное число байтов.the first byte or the first multibyte sequence, which is a sequence of bytes at the beginning of the initial part of the corresponding chroma word and having a predetermined number of bytes; and a subsequent byte or second multibyte sequence, which is a sequence of bytes following the first multibyte sequence or the first byte of each corresponding chroma word, wherein the second multibyte sequence has a predetermined number of bytes. 3. Способ по п. 1, в котором в качестве первой предварительно определенной длительности используют меньший из интервалов:3. The method according to p. 1, in which the first of a predetermined duration using the smaller of the intervals: предварительно определенной длительности в пределах временного интервала от 9 до 27 секунд иa predetermined duration within the time interval from 9 to 27 seconds and длительности соответствующего аудиотрека.duration of the corresponding audio track. 4. Способ по п. 3, в котором в качестве первой предварительно определенной длительности используют меньший из интервалов: 21 секунда и длительность соответствующего аудиотрека.4. The method according to p. 3, in which the first of a predetermined duration using the shorter of the intervals: 21 seconds and the duration of the corresponding audio track. 5. Способ по п. 1, в котором в качестве второй предварительно определенной длительности используют меньший из интервалов:5. The method according to p. 1, in which the second of a predetermined duration using the smaller of the intervals: предварительно определенной длительности в пределах временного интервала от 96 до 141 секунд иa predetermined duration within the time interval from 96 to 141 seconds and длительности соответствующего аудиотрека.duration of the corresponding audio track. 6. Способ по п. 5, в котором в качестве второй предварительно определенной длительности используют меньший из интервалов: 120 секунд и длительность соответствующего аудиотрека.6. The method according to p. 5, in which the second of a predetermined duration using the shorter of the intervals: 120 seconds and the duration of the corresponding audio track. 7. Способ по п. 1, в котором указанное первое хромаслово и указанное второе хромаслово характеризуют часть соответствующего аудиотрека, а длительность части аудиотрека находится между 1/2 и 8 секундами.7. The method according to claim 1, wherein said first chroma and second chroma characterize a portion of the corresponding audio track, and the duration of the portion of the audio track is between 1/2 and 8 seconds. 8. Способ по п. 7, в котором формируют указанное первое хромаслово и указанное второе хромаслово.8. The method according to p. 7, in which form the specified first chroma and the second chroma. 9. Способ по п. 1, в котором указанное первое хромаслово и указанное второе хромаслово содержат указание на идентификатор трека, связанный с соответствующим аудиотреком.9. The method according to claim 1, wherein said first chroma word and said second chroma word contain an indication of a track identifier associated with a corresponding audio track. 10. Способ по п. 9, в котором идентификатор трека содержит третью многобайтовую последовательность, расположенную после последующего байта или второй многобайтовой последовательности.10. The method of claim 9, wherein the track identifier comprises a third multibyte sequence located after the subsequent byte or second multibyte sequence. 11. Способ по п. 1, в котором указанное первое хромаслово и указанное второе хромаслово содержат указание на информацию о длительности трека, связанную с соответствующим аудиотреком.11. The method according to p. 1, in which the specified first chroma and the second chroma contain an indication of information about the duration of the track associated with the corresponding audio track. 12. Способ по п. 11, в котором указание на длительность трека содержит один байт, который следует сразу после последующего байта или второй многобайтовой последовательности.12. The method according to p. 11, in which an indication of the duration of the track contains one byte, which follows immediately after the next byte or second multibyte sequence. 13. Способ по любому из пп. 10-12, в котором указанное определение аудиотрека-кандидата содержит сравнение соответствующей длительности первого входящего аудиотрека и аудиотрека-кандидата.13. The method according to any one of paragraphs. 10-12, wherein said determination of a candidate audio track comprises comparing the corresponding duration of the first incoming audio track and the candidate audio track. 14. Способ по п. 13, в котором определяют несовпадение аудиотрека-кандидата с первым входящим треком кандидатом на основе отличия длительности трека на значение, превышающее предварительно установленное значение.14. The method according to p. 13, in which the discrepancy between the candidate audio track and the first incoming track by the candidate is determined based on the difference in the track duration by a value exceeding the preset value. 15. Способ по п. 13, в котором аудиотрек-кандидат содержит множество аудиотреков-кандидатов, и выбирают подгруппы множества аудиотреков-кандидатов на основе предварительно определенного порогового числа кандидатов.15. The method of claim 13, wherein the candidate audio track comprises a plurality of candidate audio tracks, and subgroups of a plurality of candidate audio tracks are selected based on a predetermined threshold number of candidates. 16. Способ по п. 1, в котором побитное сравнение первой длинной аудиосигнатуры со второй длинной аудиосигнатурой содержит смещение первой длинной аудиосигнатуры по отношению ко второй длительной аудиосигнатуре.16. The method of claim 1, wherein the bitwise comparison of the first long audio signature with the second long audio signature comprises offsetting the first long audio signature with respect to the second long audio signature. 17. Способ по п. 16, в котором указанное смещение содержит амплитуду смещения, находящуюся в промежутке 20 секунд.17. The method of claim 16, wherein said offset comprises an offset amplitude in the range of 20 seconds. 18. Способ по п. 1, в котором определяют, что начальная часть второго хромаслова идентична начальной части первого хромаслова, посредством определения, что вся последовательность байтов в начальной части второго хромаслова совпадает со всей последовательностью байтов в начальной части первого хромаслова.18. The method of claim 1, wherein it is determined that the initial part of the second chroma word is identical to the initial part of the first chroma word by determining that the entire sequence of bytes in the initial part of the second chroma word matches the entire sequence of bytes in the initial part of the first chroma word. 19. Способ по п. 1, в котором по меньшей мере одна из короткой аудиосигнатуры и длинной аудиосигнатуры содержит указание на идентификатор трека, связанный с соответствующим аудиотреком.19. The method of claim 1, wherein at least one of the short audio signature and the long audio signature includes an indication of a track identifier associated with the corresponding audio track. 20. Способ по п. 1, в котором до указанного определения первой короткой аудиосигнатуры получают по меньшей мере часть первого входящего аудиотрека.20. The method of claim 1, wherein prior to said determining the first short audio signature, at least a portion of the first incoming audio track is received. 21. Способ по п. 1, в котором получают вторую короткую аудиосигнатуру посредством извлечения с использованием индекса.21. The method of claim 1, wherein a second short audio signature is obtained by extraction using an index. 22. Способ по п. 21, в котором указанный индекс является инвертированным индексом аудиотрека.22. The method of claim 21, wherein said index is an inverted index of an audio track. 23. Способ по п. 22, в котором инвертированным индексом аудиотрека является прюнинг-индекс, сформированный для множества коротких аудиосигнатур, или индекс проверки, сформированный для множества длинных аудиосигнатур. 23. The method of claim 22, wherein the inverted index of the audio track is a tuning index generated for a plurality of short audio signatures, or a verification index generated for a plurality of long audio signatures.
RU2015105093A 2014-08-14 2015-02-16 Method of comparison of the first input audio track with the indexed audio track RU2606567C2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2015105093A RU2606567C2 (en) 2015-02-16 2015-02-16 Method of comparison of the first input audio track with the indexed audio track
PCT/IB2015/051557 WO2016024172A1 (en) 2014-08-14 2015-03-03 Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine
US15/103,994 US9558272B2 (en) 2014-08-14 2015-03-03 Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015105093A RU2606567C2 (en) 2015-02-16 2015-02-16 Method of comparison of the first input audio track with the indexed audio track

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2014133395 Substitution 2014-08-14 2014-08-14

Publications (2)

Publication Number Publication Date
RU2015105093A true RU2015105093A (en) 2016-09-10
RU2606567C2 RU2606567C2 (en) 2017-01-10

Family

ID=56889317

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015105093A RU2606567C2 (en) 2014-08-14 2015-02-16 Method of comparison of the first input audio track with the indexed audio track

Country Status (1)

Country Link
RU (1) RU2606567C2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003030522A1 (en) * 2001-10-01 2003-04-10 Fortel Dtv, Inc. Digital video synchronizer with both decoded digital and undecoded analog outputs
KR100803206B1 (en) * 2005-11-11 2008-02-14 삼성전자주식회사 Apparatus and method for generating audio fingerprint and searching audio data
CN103250205B (en) * 2010-12-07 2017-05-10 英派尔科技开发有限公司 Audio fingerprint differences for end-to-end quality of experience measurement
RU2459281C1 (en) * 2011-09-15 2012-08-20 Общество с ограниченной ответственностью "Цифрасофт" Device and method to generate signature of acoustic signal, device to identify acoustic signal
KR102105313B1 (en) * 2012-06-28 2020-04-29 구글 엘엘씨 Generating a sequence of audio fingerprints at a set top box

Also Published As

Publication number Publication date
RU2606567C2 (en) 2017-01-10

Similar Documents

Publication Publication Date Title
SG10201907025VA (en) Method and system for verifying identities
EA201791569A1 (en) METHOD AND SYSTEM FOR DETERMINING THE STATUS OF MALIGNANT TUMOR
CO2017008821A2 (en) Systems and methods for performing fingerprint-based user authentication using images captured using mobile devices
EA201791503A1 (en) GROUPING OF PALETTE INDICES FOR CABAC-CODING WITH HIGH PERFORMANCE
SA517382335B1 (en) Deriving Motion Information for Sub-Blocks in Video Coding
MY192409A (en) Business processing method and apparatus
BR112017016469A2 (en) csi measurement under lte coverage enhancements
MX2015009172A (en) Systems and methods for identifying and reporting application and file vulnerabilities.
AU2018375785A1 (en) Validation methods and systems for sequence variant calls
MX359189B (en) Method, apparatus and system for determining disturbing telephone number.
MX2018000863A (en) System and method for validating authorship of an electronic signature session.
MX2018010163A (en) Systems and methods for providing block chain-based multifactor personal identity verification.
ZA201906992B (en) A communication method and apparatus
MX2018000651A (en) Systems and methods for partitioning search indexes for improved efficiency in identifying media segments.
JP2017098806A5 (en)
MX343492B (en) Methods and apparatus for identifying media.
IN2015DE01395A (en)
TN2017000327A1 (en) Restriction on palette block size in video coding
CO2018005318A2 (en) Automated address verification system and method
MX2017005370A (en) Multimedia file playing method and apparatus.
CL2014002816A1 (en) User authentication method, which includes receiving a user request to initiate authentication session, accessing a memory stored record associated with the user, generating a security matrix, transmitting the matrix to the user, receiving from the user an orderly sequence of values of code selected from the matrix, validate the received sequence, generate an authentication result; apparatus; system
TW201613339A (en) Subtitle processing device and its associated method and method of parsing subtitle
PH12016000002B1 (en) Proactive duplicate identification
GB2553042A (en) Product indexing method and system thereof
DE60324585D1 (en) METHOD, METHOD AND COMPUTER PROGRAM FOR DETECTING POINT CORRESPONDENCES IN POINT QUANTITIES

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20170217

NF4A Reinstatement of patent

Effective date: 20180522