KR20220067169A - 오디오 핑거 프린트 매칭 시스템 및 방법 - Google Patents

오디오 핑거 프린트 매칭 시스템 및 방법 Download PDF

Info

Publication number
KR20220067169A
KR20220067169A KR1020200153580A KR20200153580A KR20220067169A KR 20220067169 A KR20220067169 A KR 20220067169A KR 1020200153580 A KR1020200153580 A KR 1020200153580A KR 20200153580 A KR20200153580 A KR 20200153580A KR 20220067169 A KR20220067169 A KR 20220067169A
Authority
KR
South Korea
Prior art keywords
sound source
matching
effective range
audio fingerprint
straight line
Prior art date
Application number
KR1020200153580A
Other languages
English (en)
Other versions
KR102447553B1 (ko
Inventor
유정수
방경식
이정환
Original Assignee
주식회사 샵캐스트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 샵캐스트 filed Critical 주식회사 샵캐스트
Priority to KR1020200153580A priority Critical patent/KR102447553B1/ko
Publication of KR20220067169A publication Critical patent/KR20220067169A/ko
Application granted granted Critical
Publication of KR102447553B1 publication Critical patent/KR102447553B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • G06K9/6201
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Acoustics & Sound (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Printers Characterized By Their Purpose (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템은 레퍼런스 음원과 쿼리 음원의 핑거 프린트를 매칭하여 유사도 이미지를 추출하는 이미지 추출부; 상기 유사도 이미지에서 직선 검출의 유효 범위를 설정하는 유효 범위 설정부; 상기 유효 범위에서 X축으로의 기 설정된 간격을 따라 매칭 포인트를 추출하는 매칭 포인트 추출부; 상기 매칭 포인트를 이용하여 직선을 검출하는 직선 검출부;를 포함할 수 있다.

Description

오디오 핑거 프린트 매칭 시스템 및 방법{SYSTEM AND METHOD FOR MATCHING AUDIO FINGER PRINT}
본 발명은 오디오 핑거 프린트 매칭 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 레퍼런스 음원과 쿼리 음원의 핑거 프린트를 매칭하여 레퍼런스 음원과 쿼리 음원의 동일 여부를 산출하는 오디오 핑거 프린트 매칭 시스템 및 방법에 관할 것인다.
최근에는 음원 관련 저작권 협회 등에서 음원을 듣고서 무슨 음원인지를 판독하는 시스템이 많이 이용되고 있다.
그런데, 수백만 곡의 음원을 대비해야 하기 때문에 시간이나 연산량으로 볼 때 상당한 로드(load)가 걸리는 작업이다.
깨끗한 음질의 음원을 쿼리(query)로 입력받는 경우에는 시간이나 연산량과는 무관하게 판독률은 높게 나올 수 있다.
그러나, 배경음악(background music)이나 노이즈(noise)가 많은 음원은 정확한 음원 판독이 어려운 경우가 많다.
한편, 대한민국 공개특허 제10-2019-0051261 A (2019.05.15)호에서는 오디오 핑거프린트 매칭 시스템을 개시하고 있다.
여기서는, 먼저 쿼리(query) 음원을 스펙트로그램(spectrogram)으로 변환하고 스펙트로그램에서 특징적인 주파수(frequency)를 시간 단위로 추출하여 오디오 핑거프린트를 생성한다. 그리고 이를 데이터베이스에 저장된 수백만 레퍼런스(reference) 음원의 핑거프린트와 대비하여 유사 음원을 찾아낸다.
보자 자세하게는 유사도 매트릭스(similarity matrix)의 세로축은 쿼리 음원이고 가로축은 레퍼런스 음원이라고 할 때, 서로 일치하는 스트링(string)의 매칭 구간이 대각선 형태로 나타나게 된다.
그러나, 유사도 매트릭스 상에서 대각선이 나타나는지 여부에 대한 검출에 많은 시간이 걸리는 문제가 있다.
본 발명은 상기와 같은 문제를 해결하기 위한 것으로서, 연산량을 대폭 줄이고 보다 빠르게 레퍼런스 음원과 쿼리 음원을 매칭할 수 있는 오디오 핑거 프린트 매칭 시스템 및 방법을 제공하고자 함이다.
본 발명이 해결하고자 하는 과제가 상술한 과제로 제한되는 것은 아니며, 언급되지 아니한 과제들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템은 레퍼런스 음원과 쿼리 음원의 핑거 프린트를 매칭하여 유사도 이미지를 추출하는 이미지 추출부; 상기 유사도 이미지에서 직선 검출의 유효 범위를 설정하는 유효 범위 설정부; 상기 유효 범위에서 X축으로의 기 설정된 간격을 따라 매칭 포인트를 추출하는 매칭 포인트 추출부; 상기 매칭 포인트를 이용하여 직선을 검출하는 직선 검출부;를 포함할 수 있다.
본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템에 의하면, 연산량을 대폭 줄이고 보다 빠르게 레퍼런스 음원과 쿼리 음원을 매칭할 수 있는 장점이 있다.
본 발명의 효과가 상술한 효과들로 제한되는 것은 아니며, 언급되지 아니한 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템을 설명하기 위한 개략도.
도 2는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 유효 범위 설정부를 설명하기 위한 개략도.
도 3은 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 매칭 포인트 추출부를 설명하기 위한 개략도.
도 4는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 직선 검출부를 설명하기 위한 개략도.
도 5는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 개 략 구성 블록도.
이하에서는 도면을 참조하여 본 발명의 구체적인 실시예를 상세하게 설명한다. 다만, 본 발명의 사상은 제시되는 실시예에 제한되지 아니하고, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시예를 용이하게 제안할 수 있을 것이나, 이 또한 본원 발명 사상 범위 내에 포함된다고 할 것이다.
본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템은 레퍼런스 음원과 쿼리 음원의 핑거 프린트를 매칭하여 유사도 이미지를 추출하는 이미지 추출부; 상기 유사도 이미지에서 직선 검출의 유효 범위를 설정하는 유효 범위 설정부; 상기 유효 범위에서 X축으로의 기 설정된 간격을 따라 매칭 포인트를 추출하는 매칭 포인트 추출부; 상기 매칭 포인트를 이용하여 직선을 검출하는 직선 검출부;를 포함할 수 있다.
또, 상기 직선 검출부는 상기 매칭 포인트에서 이상점(outlier)을 제거한 후, 상기 매칭 포인트간을 연결하여 직선을 검출할 수 있다.
또, 상기 유효 범위 설정부는 레퍼런스 음원과 쿼리 음원의 상대적인 길이 차에 따라 상기 유효 범위를 설정할 수 있다.
또, 상기 매칭 포인트 추출부는 상기 유효 범위의 크기에 따라 X축으로의 간격을 조절할 수 있다.
또, 상기 매칭 포인트 추출부는 상기 유효 범위의 크기가 상대적으로 작은 경우 X축으로의 간격이 크고, 상기 유효 범위의 크기가 상대적으로 큰 경우 X축으로의 간격이 작을 수 있다.
본 발명의 다른 일 실시예에 따른 오디오 핑거 프린트 매칭 방법은 상기 오디오 핑거 프린트 매칭 시스템을 이용하여 레퍼런스 음원과 쿼리 음원을 매칭하는 방법일 수 있다.
각 실시예의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
도 1은 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템을 설명하기 위한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 유효 범위 설정부를 설명하기 위한 개략도이다.
도 3은 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 매칭 포인트 추출부를 설명하기 위한 개략도이다.
도 4는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 직선 검출부를 설명하기 위한 개략도이다.
도 5는 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템의 개 략 구성 블록도이다.
첨부된 도면은 본 발명의 기술적 사상을 보다 명확하게 표현하기 위하여, 본 발명의 기술적 사상과 관련성이 떨어지거나 당업자로부터 용이하게 도출될 수 있는 부분은 간략화 하거나 생략하였다.
도 1내지 도 5에 도시한 바와 같이, 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템(10)은 쿼리 음원(Q)이 레퍼런스 음원(R)의 저작권에 저촉되는 음원인지 여부를 판단하기 위해 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭하는 시스템을 의미할 수 있다.
일례로, 도 1에 도시한 바와 같이, 상기 오디오 핑거 프린트 매칭 시스템(10)은 레퍼런스 음원(R)의 핑거 프린트와 쿼리 음원(Q)의 핑거 프린트를 매칭하여 레퍼런스 음원(R)과 쿼리 음원(Q)이 동일한지 여부를 판단하는 시스템일 수 있다.
레퍼런스 음원(R)의 핑거 프린트와 쿼리 음원(Q)의 핑거 프린트를 매칭하는 방법은 앞서 종래기술에서 설명한 바와 같이, 공지된 기술이라는 점에서 자세한 설명은 생략한다.
일례로, 상기 오디오 핑거 프린트 매칭 시스템(10)은 레퍼런스 음원(R) 및 레퍼런스 음원(R)의 핑거 프린트를 저장하고, 쿼리 음원(Q) 및 쿼리 음원(Q)의 핑거 프린트를 저장하는 메모리부(200)를 포함할 수 있다.
여기서, 일례로, 상기 오디오 핑거 프린트 매칭 시스템(10)은 레퍼런스 음원(R)과 쿼리 음원(Q)의 핑거 프린트를 매칭하여 유사도 이미지(I)를 추출하는 이미지 추출부(110)를 포함할 수 있다.
일례로, 상기 이미지 추출부(110)는 상기 메모리부(200)에 저장된 레퍼런스 음원(R)과 쿼리 음원(Q)의 핑거 프린트를 이용하여 이들을 상호 매칭할 수 있으며 상기 유사도 이미지(I)를 추출/생성할 수 있다.
일례로, 도 1에 도시한 바와 같이, 상기 유사도 이미지(I)에는 레퍼런스 음원(R)과 쿼리 음원(Q)의 핑거 프린트가 동일한 경우 소정의 경사각을 가지는 직선(L)이 표시될 수 있다.
반대로, 레퍼런스 음원(R)과 쿼리 음원(Q)의 핑거 프린트가 동일하지 않은 경우 상기 유사도 이미지(I)에는 소정의 경사각을 가지는 직선(L)이 표시되지 않을 수 있다.
여기서, 종래에는 상기 유사도 이미지(I) 상에 직선(L)을 검출하기 위해 많은 시간이 걸리는 문제가 있는 바, 본 발명은 상기 유사도 이미지(I) 상에 직선(L)을 보다 빠르게 검출하는 목적이 있다.
이를 위해, 상기 오디오 핑거 프린트 매칭 시스템(10)은 상기 유사도 이미지(I)에서 직선(L) 검출의 유효 범위(C)를 설정하는 유효 범위 설정부(120)를 더 포함할 수 있다.
일례로, 상기 유효 범위 설정부(120)는 상기 유사도 이미지(I)의 전체 면적 중 의미 있는 상기 유효 범위(C)를 설정/추출하는 구성일 수 있다.
이를 보다 자세히 설명하자면, 도 2에 도시한 바와 같이, 상기 유효 범위 설정부(120)는 상기 유사도 이미지(I) 상에서 꼭지점을 잇는 대각선을 기준으로 X축으로 기 설정된 범위 및 Y 축으로 기 설정된 범위로 확장하여 상기 유효 범위(C)를 추출할 수 있다.
상기 유효 범위(C)는 아래에서 설명될 직선(L)을 이루는 매칭 포인트(P1)를 찾는 대상 범위를 의미할 수 있다.
상기 유효 범위 설정부(120)는 상기 유사도 이미지(I) 전체 면적 중 일부인 상기 유효 범위(C)를 추출함에 따라 상기 매칭 포인트(P1)를 찾는 범위가 줄어들어 보다 빠르게 레퍼런스 음원(R)과 쿼리 음원(Q)이 동일한지 여부를 판단하는데 도움을 줄 수 있다.
여기서, 일례로, 상기 오디오 핑거 프린트 매칭 시스템(10)은 상기 유효 범위(C)에서 X축으로의 기 설정된 간격을 따라 매칭 포인트(P1)를 추출하는 매칭 포인트 추출부(130)를 더 포함할 수 있다.
이를 보다 자세히 설명하자면, 도 3에 도시한 바와 같이, 상기 매칭 포인트 추출부(130)는 상기 유효 범위 설정부(120)가 설정한 상기 유사도 이미지(I) 내의 상기 유효 범위(C) 내에서 다른 점들보다 더 진한 상기 매칭 포인트(P1)를 추출할 수 있다.
일례로, 상기 매칭 포인트(P1)는 레퍼런스 음원(R)과 쿼리 음원(Q)의 핑거 프린트가 시간에 따라 동일한 주파수를 가지는 지점을 의미할 수 있다.
이 때, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C) 전체 면적에 대해 상기 매칭 포인트(P1)를 추출하는 것이 아니라 X 축으로의 기 설정된 간격에 대해서 상기 매칭 포인트(P1)를 추출함에 따라 매우 빠른 속도로 상기 매칭 포인트(P1)를 추출할 수 있다.
상기 매칭 포인트 추출부(130)에 의해 추출된 상기 유사도 이미지(I)의 상기 유효 범위(C) 내에는 상기 매칭 포인트(P1)뿐만 아니라 이상점(P2, outlier)도 추출될 수 있다.
일례로, 상기 이상점(P2)은 레퍼런스 음원(R)과 쿼리 음원(Q)에 존재하는 노이즈 등에 의해 발생되는 포인트일 수 있다.
도 4(a)에 도시한 바와 같이, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C) 내에서 상대적으로 진하게 표시되는 상기 매칭 포인트(P1) 및 상기 이상점(P2)을 추출할 수 있다.
여기서, 일례로, 상기 오디오 핑거 프린트 매칭 시스템(10)은 상기 매칭 포인트(P1)를 이용하여 직선(L)을 검출하는 직선 검출부(140)를 더 포함할 수 있다.
일례로, 상기 직선 검출부(140)는 상기 매칭 포인트 추출부(130)에 의해 추출된 상기 매칭 포인트(P1)를 이용하여 직선(L)을 생성하는 구성일 수 있다.
일례로, 도 4(b)에 도시한 바와 같이, 상기 직선 검출부(140)는 도 4(a)에서 존재하는 상기 매칭 포인트(P1)와 상기 이상점(P2) 중 상기 이상점(P2)을 제거한 후, 상기 매칭 포인트(P1)간을 이어 직선(L)을 생성할 수 있다.
일례로, 상기 직선 검출부(140)는 도 4(a)에서 존재하는 포인트들 간의 X축, Y축으로의 거리, 각도를 이용하여 무 경향을 가지는 상기 이상점(P2)을 제거하고, 일정한 경향(예를 들어, 이웃하는 포인트 간의 각도가 경향성을 가짐)을 가지는 상기 매칭 포인트(P1) 만을 추출한 후, 상기 매칭 포인트(P1) 간을 이어 직선(L)을 생성할 수 있다.
그 결과, 도 4(c)에 도시한 바와 같이, 상기 직선 검출부(140)는 상기 유사도 이미지(I) 상에서 직선(L)을 검출할 수 있으며, 직선(L)의 검출로 인해 레퍼런스 음원(R)과 쿼리 음원(Q)임으로 판단할 수 있다.
이하에서는, 상기 오디오 핑거 프린트 매칭 시스템(10)에 대해 더욱 자세히 설명하겠다.
일례로, 상기 유효 범위 설정부(120)는 레퍼런스 음원(R)과 쿼리 음원(Q)의 상대적인 길이 차에 따라 상기 유효 범위(C)를 설정할 수 있다.
이를 보다 자세히 설명하자면, 도 1에 도시한 바와 같이, 일례로, 쿼리 음원(Q)이 레퍼런스 음원(R)과 동일한 음원 부분(A)을 포함하나, 전/후로 동일하지 않은 음원(B)을 더 포함할 수 있다.
따라서, 쿼리 음원(Q)의 길이(러닝 타임)는 레퍼런스 음원(R)의 길이(러닝 타임)보다 더 클 수 있다.
여기서, 상기 유효 범위 설정부(120)는 레퍼런스 음원(R)과 쿼리 음원(Q)의 상대적인 길이 차를 구하고, 상대적인 길이 차가 크면 상기 유효 범위(C)를 더 크게 설정하고, 상대적인 실이 차가 작으면 상기 유효 범위(C)를 더 작게 설정할 수 있다.
따라서, 보다 빠르게 및 보다 정확하게 레퍼런스 음원(R)과 쿼리 음원(Q)의 동일 여부를 판단할 수 있다.
여기서, 일례로, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C)의 크기에 따라 X축으로의 간격을 조절할 수 있다.
이를 보다 자세히 설명하자면, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C) 내에서 X축으로의 간격에 따라 상기 매칭 포인트(P1)를 추출하는 바, 상기 유효 범위(C)의 크기에 따라 X축으로의 간격을 조절하여 상기 매칭 포인트(P1)를 추출할 수 있다.
일례로, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C)의 크기가 상대적으로 작은 경우 X축으로의 간격이 크고, 상기 유효 범위(C)의 크기가 상대적으로 큰 경우 X축으로의 간격이 작을 수 있다.
즉, 상기 매칭 포인트 추출부(130)는 상기 유효 범위(C)의 면적이 상대적으로 작은 경우, 쿼리 음원(Q)과 레퍼런스 음원(R)이 동일할 가능성이 크다는 점에서 X축으로의 간격을 상대적으로 크게 설정하여 보다 빠른 속도로 상기 매칭 포인트(P1)를 추출하고, 상기 유효 범위(C)의 면적이 상대적으로 큰 경우, 쿼리 음원(Q)과 레퍼런스 음원(R)의 동일한지 여부를 보다 정확하게 판단하기 위해 X축으로의 간격을 상대적으로 작게 설정하여 보다 세밀하게 상기 매칭 포인트(P1)를 추출할 수 있다.
일례로, 상기 오디오 핑거 프린트 매칭 시스템(10)은 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭하는데 필요한 데이터/정보를 외부 장치와 송수신하는 통신부(300)를 포함할 수 있으며, 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭하는데 필요한 데이터/정보/연산식을 관리자로부터 입력받는 입력부(400)를 더 포함할 수 있다.
또한, 상기 오디오 핑거 프린트 매칭 시스템(10)은 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭하는데 필요한 데이터/정보를 관리자에게 표시하는 디스플레이부(500)를 더 포함할 수 있다.
일례로, 상기 이미지 추출부(110), 상기 유효 범위 설정부(120), 상기 매칭 포인트 추출부(130) 및 상기 직선 검출부(140)는 이들을 통합, 제어하는 제어부(100)에 구비될 수 있으나, 여기에 한정되는 것은 아니며, 각각 별개의 구성으로서 상호 통신하여 구현될 수도 있다.
앞서 설명한 바와 같이, 본 발명의 일 실시예에 따른 오디오 핑거 프린트 매칭 시스템(10)은 연산량을 대폭 줄이고 보다 빠르게 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭할 수 있는 장점이 있다.
한편, 본 발명의 다른 일 실시예에 따른 오디오 핑거 프린트 매칭 방법은 앞서 설명한 상기 오디오 핑거 프린트 매칭 시스템(10)를 이용하여 레퍼런스 음원(R)과 쿼리 음원(Q)을 매칭하는 방법을 의미할 수 있다.
상기에서는 본 발명에 따른 실시예를 기준으로 본 발명의 구성과 특징을 설명하였으나 본 발명은 이에 한정되지 않으며, 본 발명의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 발명이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.
110: 이미지 추출부
120: 유효 범위 설정부
130: 매칭 포인트 추출부
140: 직선 검출부

Claims (6)

  1. 오디오 핑거 프린트 매칭 시스템에 있어서,
    레퍼런스 음원과 쿼리 음원의 핑거 프린트를 매칭하여 유사도 이미지를 추출하는 이미지 추출부;
    상기 유사도 이미지에서 직선 검출의 유효 범위를 설정하는 유효 범위 설정부;
    상기 유효 범위에서 X축으로의 기 설정된 간격을 따라 매칭 포인트를 추출하는 매칭 포인트 추출부;
    상기 매칭 포인트를 이용하여 직선을 검출하는 직선 검출부;를 포함하는,
    오디오 핑거 프린트 매칭 시스템.
  2. 제1항에 있어서,
    상기 직선 검출부는,
    상기 매칭 포인트에서 이상점(outlier)을 제거한 후,
    상기 매칭 포인트간을 연결하여 직선을 검출하는,
    오디오 핑거 프린트 매칭 시스템.
  3. 제1항에 있어서,
    상기 유효 범위 설정부는,
    레퍼런스 음원과 쿼리 음원의 상대적인 길이 차에 따라 상기 유효 범위를 설정하는,
    오디오 핑거 프린트 매칭 시스템.
  4. 제3항에 있어서,
    상기 매칭 포인트 추출부는,
    상기 유효 범위의 크기에 따라 X축으로의 간격을 조절하는,
    오디오 핑거 프린트 매칭 시스템.
  5. 제4항에 있어서,
    상기 매칭 포인트 추출부는,
    상기 유효 범위의 크기가 상대적으로 작은 경우 X축으로의 간격이 크고,
    상기 유효 범위의 크기가 상대적으로 큰 경우 X축으로의 간격이 작은,
    오디오 핑거 프린트 매칭 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 따른 오디오 핑거 프린트 매칭 시스템을 이용하여 레퍼런스 음원과 쿼리 음원을 매칭하는 오디오 핑거 프린트 매칭 방법.
KR1020200153580A 2020-11-17 2020-11-17 오디오 핑거 프린트 매칭 시스템 및 방법 KR102447553B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200153580A KR102447553B1 (ko) 2020-11-17 2020-11-17 오디오 핑거 프린트 매칭 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200153580A KR102447553B1 (ko) 2020-11-17 2020-11-17 오디오 핑거 프린트 매칭 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20220067169A true KR20220067169A (ko) 2022-05-24
KR102447553B1 KR102447553B1 (ko) 2022-09-27

Family

ID=81807726

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200153580A KR102447553B1 (ko) 2020-11-17 2020-11-17 오디오 핑거 프린트 매칭 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102447553B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180027209A (ko) * 2016-09-06 2018-03-14 주식회사 티앤블루랩 오디오 핑거프린트 추출 장치 및 방법
KR20190051261A (ko) * 2017-11-06 2019-05-15 주식회사 샵캐스트 오디오 핑거프린트 매칭 시스템
KR20190051265A (ko) * 2017-11-06 2019-05-15 주식회사 샵캐스트 오디오 핑거프린트 매칭 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180027209A (ko) * 2016-09-06 2018-03-14 주식회사 티앤블루랩 오디오 핑거프린트 추출 장치 및 방법
KR20190051261A (ko) * 2017-11-06 2019-05-15 주식회사 샵캐스트 오디오 핑거프린트 매칭 시스템
KR20190051265A (ko) * 2017-11-06 2019-05-15 주식회사 샵캐스트 오디오 핑거프린트 매칭 방법

Also Published As

Publication number Publication date
KR102447553B1 (ko) 2022-09-27

Similar Documents

Publication Publication Date Title
US9330267B2 (en) Filtering confidential information in voice and image data
CN109151518B (zh) 一种被盗账号的识别方法、装置及电子设备
EP3296922B1 (en) Fingerprint identification method and terminal
US8417026B2 (en) Gesture recognition methods and systems
KR20200006002A (ko) 비디오 콘텐츠에 대한 자동 햅틱 생성을 제공하기 위한 시스템들 및 방법들
CN106461756B (zh) 使用音频信号的接近发现
KR102119897B1 (ko) 피부 상태 탐지 방법 및 전자 디바이스
JP7159438B2 (ja) エコー検出
CN105072455A (zh) 视频匹配方法和装置
CN111818385B (zh) 视频处理方法、视频处理装置及终端设备
CN112905996A (zh) 基于多维度数据关联分析的信息安全溯源系统及方法
US9704015B2 (en) Fingerprint image processing method and device
CN110689885B (zh) 机器合成语音识别方法、装置、存储介质及电子设备
CN110020272B (zh) 缓存方法、装置以及计算机存储介质
JP2023015228A (ja) 情報処理システム、情報処理装置、情報処理方法、及びコンピュータプログラム
KR102447553B1 (ko) 오디오 핑거 프린트 매칭 시스템 및 방법
WO2021056731A1 (zh) 基于日志数据分析的行为检测方法、装置、设备及介质
CN111400542A (zh) 音频指纹的生成方法、装置、设备及存储介质
US10853393B2 (en) Expired map data based anti-counterfeiting method, apparatus, storage medium and device
KR102447554B1 (ko) 오디오 핑거프린트 매칭을 기반으로하는 음원 인식 방법 및 장치
KR102301205B1 (ko) 병렬 오디오 식별 시스템
WO2024087644A1 (zh) 生物识别方法、更新方法、电子设备及存储介质
CN110895698B (zh) 电子红包识别方法、电子红包识别装置及移动终端
JP7023324B2 (ja) マルチメディア信号認識のための電子装置およびその動作方法
CN112052729B (zh) 一种基于人脸识别的智能动态高清视频检测方法及系统

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant