KR100661040B1 - 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체 - Google Patents

정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체 Download PDF

Info

Publication number
KR100661040B1
KR100661040B1 KR19990040891A KR19990040891A KR100661040B1 KR 100661040 B1 KR100661040 B1 KR 100661040B1 KR 19990040891 A KR19990040891 A KR 19990040891A KR 19990040891 A KR19990040891 A KR 19990040891A KR 100661040 B1 KR100661040 B1 KR 100661040B1
Authority
KR
South Korea
Prior art keywords
search condition
data
information
correlation coefficient
information processing
Prior art date
Application number
KR19990040891A
Other languages
English (en)
Other versions
KR20000023379A (ko
Inventor
도구리야스히로
아까기리겐조
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20000023379A publication Critical patent/KR20000023379A/ko
Application granted granted Critical
Publication of KR100661040B1 publication Critical patent/KR100661040B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10564Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account frequency
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

신호 특성을 검색 조건으로 하여, AV 데이타를 효율적으로 검색한다.
스텝 S3에서, 비교 판정부는 부호화 오디오 데이타의 스펙트럼 계수와, 샘플 파형의 스펙트럼 계수와의 상관 계수(유사도)를 연산하고, 연산한 상관 계수의 값이 스텝 S1에서 설정한 임계치보다도 큰 것을 추출하여 검색 결과로 한다. 스텝 S4에서, 비교 판정부는 검색 결과를 만족할 수 있는지의 여부를 판정한다. 스텝 S3에서 검색된 부호화 오디오 데이타의 개수가 소정의 임계치이상으로서, 검색 결과를 만족할 수 없다고 판정된 경우, 스텝 S5로 진행한다. 스텝 S5에서, 비교 판정부는 검색 조건인 샘플 파형의 주파수 대역의 수가 그 최대치보다도 작은지의 여부를 판정하고, 주파수 대역의 수가 그 최대치보다도 작다고 판정한 경우, 스텝 S6에서 검색 조건인 샘플 파형의 주파수 대역의 수를 1만큼 증가시켜서 스텝 S3으로 복귀한다.
정보 처리 장치, 정보 기록 장치, 기록 매체, 제공 매체, 샘플 파형

Description

정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체{APPARATUS AND METHOD FOR PROCESSING AN INFORMATION, APPARATUS AND METHOD FOR RECORDING AN INFORMATION, RECORDING MEDIUM AND PROVIDING MEDIUM}
도 1은 본 발명을 적용한 오디오 데이타 검색 장치의 구성예를 나타내는 블럭도.
도 2는 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 3은 검색 조건을 설명하는 도면.
도 4는 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 5은 검색 조건을 설명하는 도면.
도 6은 검색 결과의 범위를 한정하는 처리를 설명하는 흐름도.
도 7은 신호 특성이 계층적으로 기록되어 있는 기록 매체의 포맷의 예를 나타내는 도면.
도 8은 도 7에 도시한 포맷으로 신호 특성을 기록하는 정보 기록 장치의 구성예를 나타내는 도면.
도 9는 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭 도이다.
도 10은 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 11은 신호 특성이 계층적으로 기록되어 있는 기록 매체의 포맷의 예를 나타내는 도면.
도 12는 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 13은 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 14는 검색 조건을 설명하는 도면.
도 15는 신호 특성이 계층적으로 기록되어 있는 기록 매체의 포맷의 예를 나타내는 도면.
도 16은 도 15에 도시된 포맷으로 신호 특성을 기록하는 정보 기록 장치의 구성예를 나타내는 도면.
도 17은 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 18은 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 19는 검색 조건을 설명하는 도면.
도 20은 신호 특성이 계층적으로 기록되어 있는 기록 매체의 포맷의 예를 나 타내는 도면.
도 21은 도 1의 오디오 데이타 검색 장치의 기능적인 구성예를 나타내는 블럭도.
도 22는 신호 특성이 계층적으로 저장되어 있는 비트 스트림의 포맷의 예를 나타내는 도면.
도 23은 종래의 오디오 데이타 검색 장치의 구성예를 나타내는 블럭도.
도 24는 종래의 부호화 장치의 구성을 도시하는 블럭도.
도 25는 도 23의 복호부(154)의 구성을 도시하는 블럭도.
<도면의 주요 부분에 대한 부호의 설명>
1 : CPU
2 : ROM
3 : RAM
4 : 하드디스크
5 : 인터페이스
6 : 버스
11, 21, 31, 81, 91, 121 : 비트 추출부
12, 22, 32, 72 : 하프만 복호부
13, 23, 33, 73 : 역양자화부
14, 24, 52, 62, 74, 83, 112, 123, 132 : 비교 판정부
15, 53 : 평균치 계산부
25, 41, 75 : 스펙트럼 변환부
34 : 매체 기록부
35. 94 : 기록 매체
51, 61, 111, 131 : 기록 데이타 판독부
63 : 스펙트럼 판정부
71 : 데이타 판독부
82, 92, 112 : 어택 복원부
84, 101, 113, 125, 135 : 어택 검출부
93 : 매체 기록부
124, 133 : 대역 분할부
본 발명은 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체, 및 제공 매체에 관한 것으로, 특히 신호 특성에 기초하여, 압축 부호화된 오디오 데이타를 검색하는 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체, 및 제공 매체에 관한 것이다.
최근, 고능률 부호화 기술의 발달에 따라, 음성 데이타 및 화상 데이타를 압축 부호화하여 보관하는 것이 일반화되어, 다수의 부호화된 데이타 중에서 원하는 데이타를 효율적으로 검색하는 방법이 필요해지고 있다.
도 23은 종래의 오디오 데이타 검색 장치의 기능적인 구성을 나타내고 있다. 이 오디오 데이타 검색 장치의 데이타 베이스(156)에는 압축 부호화된 오디오 데이타(이하, 부호화 오디오 데이타로 기술함)와, 부호화 오디오 데이타에 대응된, 오디오 데이타의 속성 정보(예를 들면, 표제, 작자명, 작성 날짜, 및 내용의 분류 구분 등)가 기술되어 있는 검색용 텍스트 데이타 베이스가, 미리 기록되어 있다.
검색 조건 입력부(151)는 사용자에 의한 검색 조건(속성 정보, 및 샘플 파형의 신호 특성)의 입력을 접수하여, 속성 정보를 속성 검색부(152)로 공급하고, 신호 특성을 비교 판정부(155)로 공급한다.
속성 검색부(152)는 검색 조건 입력부(151)로부터 입력된 속성 정보(예를 들면, 작자명)에 적합한 것을 데이타 베이스(156)에 기억되어 있는 검색용 텍스트 데이타 베이스 중에서 검색하고, 그것에 대응하는 부호화 오디오 데이타를 추출하여 후보 선정부(153)로 출력한다.
후보 선정부(153)는 속성 검색부(152)로부터 입력된 부호화 오디오 데이타를, 차례로 복호부(154)로 출력한다. 복호부(154)는 후보 선정부(153)로부터 입력된 부호화 오디오 데이타를 복호하여, 비교 판정부(155)로 출력한다.
비교 판정부(155)는 복호부(154)로부터 입력된 오디오 데이타와, 검색 조건 입력부로부터 공급된 샘플 파형의 신호 특성(예를 들면, 파형 진폭등)과의 유사한 정도를 구하고, 유사도가 소정의 임계치 이상이면, 그 오디오 데이타를 검색 결과로서 출력한다. 또, 유사도를 구하기 위해서는 예를 들면 샘플 파형과 검색된 오디오 데이타와의 파형 진폭, 진폭 평균치, 전력 분포, 또는 주파수 스펙트럼 등의 상관 계수를 연산하는 방법이 있다.
이어서, 도 23의 데이타 베이스(156)에 미리 기록되어 있는 부호화 오디오 데이타를 생성하는 부호화 장치에 대해 설명하지만, 그 전에 오디오 데이타를 효율적으로 압축 부호화하는 방법에 대해 설명한다. 오디오 데이타를 효율적으로 압축 부호화하는 방법은 크게 대역 분할 부호화 방식과 변환 부호화 방식으로 나눌 수 있다. 또한, 양자를 조합한 방식도 존재한다.
대역 분할 부호화 방식은 이산 시간 파형 신호(예를 들면, 오디오 데이타)를 직교 미러 필터 QMF(Quadrature Mirror Filter)등의 대역 분할 필터에 의해 복수의 주파수 대역으로 분할하여, 각 대역마다 알맞은 부호화를 실시하는 방식으로, 서브 밴드 부호화라고도 한다. 또, 직교 미러 필터의 상세한 것은 예를 들면, IEEE Trans. Acoust. Speech. Signal Processing. vo1.ASSP-33, 1985년 2월호 203-128페이지에 피. 엘. 츄(P. L. Chu)에 의해 "Quadrature mirror filter design for an arbitrary number ofequal bandwidth channels"라는 제목으로 기재되어 있다.
변환 부호화 방식은 블럭 부호화 방식이라고도 하고, 이산 시간 파형 신호를 소정의 표본화 단위로 블럭화하고, 이 블럭(프레임이라고도 기술함)의 신호를 주파수 스펙트럼으로 변환한 후, 부호화하는 방식이다. 주파수 스펙트럼으로 변환하는 방법의 종류로는 예를 들면 이산프리에 변환 DFT(Discrete Fourier Transform), 이산 코사인 변환 DCT(Discrete Cosine Transform), 또는 수정 이산 코사인 변환 MDCT(Modified Discrete Cosine Transform)등이 있다. 수정 이산 코사인 변환은 시간축 상의 인접 블럭과 변환 구간을 중복시킴으로써, 블럭 왜곡이 적은 효율적인 변환을 할 수 있다. 또, 그 상세한 것은 예를 들면, IEEE Transactions, ASSP-34, 1986 10월호, No. 5, 1153-1161 페이지에 제이. 피. 프린슨(J. P. Princen), 에이. 비. 브레들리(A. B. Bradley)가 기술한 "Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation" 및 제이. 제이. 프린썬(J. J. Princern), 에이. 더블유. 존슨(A. W. Johnson) 및 에이. 비. 브레들리(A. B. Bradley)(ICASSP 1987)가 기술한 "Subband/Transform Coding Using Filter Band Design Based on Time Domain Aliasing Cancellation" 에 기재되어 있다.
대역 분할 부호화 방식에서는 주파수 대역마다 분할된 신호를, 한편 변환 부호화 방식에서는 주파수 스펙트럼으로 변환된 신호를, 양자화하고나서 부호화함으로써, 소위 마스킹 효과등의 청각적인 성질을 이용하여 양자화 잡음이 발생하는 대역을 제한할 수 있다. 또한, 이 양자화 전에, 각각의 신호를 정규화함으로써, 효율적인 부호화를 할 수 있다.
예를 들면, 대역 분할 부호화 방식에서 양자화를 행하는 경우, 대역 분할폭을 인간의 청각 특성을 고려하여 주파수의 고역만큼 대역 폭이 넓어지는 임계 대역(크리티컬 밴드)이라고 하는 대역 폭으로 분할하는 것이 바람직하다.
주파수 대역으로 분할된 신호는 각 대역마다 비트 할당(비트 얼로케이션)이 행해져 부호화된다. 예를 들면, 각 대역마다의 신호의 진폭 절대치에 기초하여 동적으로 비트 할당을 행하면, 양자화 잡음 스펙트럼이 평탄해지고, 잡음 에너지가 최소가 된다. 또, 이 방법은 IEEE Transactions of Accoustics Speech and signal Processing. vol. ASSP-25, 1997 8월호, No. 4에 알. 젤린스키(R. Zellnski)와 피. 놀(P. Noll)에 의한 "Adaptive Transform Coding of Speech Signals"에 기재되어 있다. 단, 이 방법으로는 마스킹 효과가 이용되지 않으므로, 청각적으로는 알맞지 않은 문제가 있다.
또한, 예를 들면 각 대역마다 양호한 S/N 비가 되는 고정화된 비트 할당을 하면, 청각적으로는 마스킹 효과를 얻을 수 있지만, 예를 들면 정현파의 특성을 측정하는 경우, 비트 할당이 고정되어 있기 때문에 특성치를 양호하게 얻을 수 없는 문제가 있다. 또, 이 방법은 "The critical band coder-digital encoding of the perceptual requirements of the auditory system" : 엠. 에이. 크란스너(M. A. Kransner), MIT, (ICASSP 1980)에 기재되어 있다.
이들의 문제를 해결하기 위해, 비트 할당으로 사용할 수 있는 전비트를, 동적인 할당분과 고정적인 할당분으로 분할하고, 그 분할 비율을, 예를 들면 입력 신호의 스펙트럼 분포가 균일할수록 고정적인 비트 할당분의 비율을 크게 하도록, 분할 비율을 입력 신호에 의존시킴으로써 효율적인 부호화를 행하는 방법도 있다.
그런데, 오디오 신호의 양자화 및 부호화에서, 오디오 파형의 일부에서 진폭이 급격히 증가하거나, 또는 감소하는 진폭 급변점(이하, 어택이라고 기술함)이 존재하는 파형은 어택에서 양자화 오차가 증대한다. 또한, 변환 부호화 방식에 따라 부호화된 신호에서는 어택에서의 스펙트럼 계수의 양자화 오차가, 역스펙트럼 변환시 (복호시)에, 시간 영역 상에서 블럭 전체로 넓어진다. 이 영향에 따라, 진폭의 급증점의 직전이나 급감점 직후에, 소위 프리에코라고 하는 청각상 귀에 거슬리는 잡음이 발생한다.
이 프리에코를 막기 위해서는 예를 들면 파형 신호의 어택을 미리 검지하고, 어택이 존재하는 블럭의 진폭을 균등화하도록, 어택의 전후의 신호의 게인을 증폭하거나, 또는 감쇠하는 방법(게인 컨트롤)이 있다. 이 방법의 부호화시에서는 이득 컨트롤이 실시된 파형 신호와 동시에, 게인의 위치 및 게인 컨트롤된 레벨의 정보가 부호화된다. 또한, 복호시에서는 게인의 위치 및 게인 컨트롤된 레벨의 정보에 기초하여, 부호 시와는 반대의 게인 컨트롤이 실시되어 파형 신호가 복호된다. 또, 이 게인 컨트롤을 하는 방법은 분할된 주파수 대역마다 실시하는 것도 가능하다.
도 24는 도 23의 데이타 베이스(156)에 미리 기록되어 있는 부호화 오디오 데이타를 생성하는 부호화 장치의 구성을 나타내고 있다. 이 부호화 장치는 상술된 변환 부호화 방식에 의해 오디오 데이타를 압축 부호화하는 것이다.
스펙트럼 변환부(161)는 입력된 오디오 파형 신호를 소정의 스펙트럼 변환 처리(예를 들면, 이산 코사인 변환 처리)에 의해, 스펙트럼 계수로 변환하여 양자화부(162)로 출력한다. 양자화부(162)는 스펙트럼 변환부(161)에서 입력된 스펙트럼 계수에 정규화 및 양자화를 실시하고, 얻어진 양자화 스펙트럼 계수와 양자화 파라미터(정규화 계수 및 양자화폭 계수)를 하프만 부호화부(163)로 출력한다. 하프만 부호화부(163)는 양자화부(162)로부터 입력된 양자화 스펙트럼 계수 및 양자화 파라미터를 가변 길이 부호화하여 비트 다중화부(164)로 출력한다. 비트 다중화부(164)는 하프만 부호화부(163)로부터 입력된 부호화되어 있는 양자화 스펙트럼 계수 및 양자화 파라미터와, 그 밖의 부호화 파라미터를, 소정의 비트 스트림 형식 으로 다중화하여 출력한다.
도 25는 도 24의 부호화 장치에 의해 생성된 부호화 오디오 데이타를 복호하는 도 23의 복호부(154)의 구성을 나타내고 있다. 도 24의 비트 다중화부(164)에 대응하는 비트 분해부(171)는 입력된 부호화 오디오 데이타를 부호화 스펙트럼 계수 및 부호화 파라미터로 분해하고, 하프만 복호부(172)로 출력한다. 하프만 복호부(172)는 부호화 스펙트럼 계수 및 부호화 파라미터에, 도 24의 하프만 부호화부(163)의 부호화에 대응하는 복호를 실시하고, 얻어진 양자화 스펙트럼 계수와 양자화 파라미터를 역양자화부(173)로 출력한다. 역양자화부(173)는 양자화 파라미터에 기초하여 양자화 스펙트럼 계수를 역양자화하여 역정규화하고, 얻어진 스펙트럼 계수를 역스펙트럼 변환부(174)로 출력한다. 역스펙트럼 변환부(174)는 역양자화부(173)로부터 입력된 스펙트럼 계수에, 도 24의 스펙트럼 변환부(161)의 스펙트럼 변환 처리에 대응하는 역스펙트럼 변환 처리를 실시하고, 얻어진 오디오 파형 신호를 출력한다.
그런데, 상술된 종래의 오디오 데이타 검색 장치에 의한 검색으로는 압축 부호화되어 있는 오디오 데이타를 검색하기 위해서는 그것을 완전히 복호해야 하고, 복호된 정보를 기록하는 방대한 메모리와, 복호에 관한 방대한 처리시간이 필요해지는 과제가 있었다.
본 발명은 이러한 상황에 감안하여 행해진 것으로서, 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호함으로써, AV 데이타를 효율적으로 검색 할 수 있도록 하는 것이다.
청구항 1에 기재된 정보 처리 장치는 검색 조건을 접수하는 접수 수단과, 접수 수단이 접수한 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 수단과, 접수 수단이 접수한 검색 조건과 복호 수단으로 복호된 AV 데이타와의 상관 계수를 연산하는 연산 수단과, 연산 수단이 연산한 상관 계수를 소정의 임계치와 비교하는 비교 수단과, 검색 조건 또는 임계치를 증가시키는 증가 수단을 구비하는 것을 특징으로 한다.
청구항 6에 기재된 정보 처리 방법은 검색 조건을 접수하는 접수 스텝과, 접수 스텝에서 접수한 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 스텝과, 접수 스텝에서 접수한 검색 조건과 복호 스텝에서 복호된 AV 데이타와의 상관 계수를 연산하는 연산 스텝과, 연산 스텝에서 연산한 상관 계수를 소정의 임계치와 비교하는 비교 스텝과, 검색 조건 또는 임계치를 증가시키는 증가 스텝을 포함하는 것을 특징으로 한다.
청구항 7에 기재된 제공 매체는 검색 조건을 접수하는 접수 스텝과, 접수 스텝에서 접수한 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 스텝과, 접수 스텝에서 접수한 검색 조건과 복호 스텝에서 복호된 AV 데이타와의 상관 계수를 연산하는 연산 스텝과, 연산 스텝에서 연산한 상관 계수를 소정의 임계치와 비교하는 비교 스텝과, 검색 조건 또는 임계치를 증가시키는 증가 스텝을 포함하는 처리를 정보 처리 장치에서 실행되는 컴퓨터가 판독 가능한 프로그램을 제공하는 것을 특징으로 한다.
청구항 8에 기재된 정보 처리 장치는 검색 조건을 접수하는 접수 수단과, 접수 수단이 접수한 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 수단과, 접수 수단이 접수한 검색 조건과 추출 수단이 추출한 신호 특성과의 상관 계수를 연산하는 연산 수단과, 연산 수단이 연산한 상관 계수를 소정의 임계치와 비교하는 비교 수단과, 검색 조건 또는 임계치를 증가시키는 증가 수단을 구비하는 것을 특징으로 한다.
청구항 13에 기재된 정보 처리 방법은 검색 조건을 접수하는 접수 스텝과, 접수 스텝에서 접수한 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 스텝과, 접수 스텝에서 접수한 검색 조건과 추출 스텝에서 추출한 신호 특성과의 상관 계수를 연산하는 연산 스텝과, 연산 스텝에서 연산한 상관 계수를 소정의 임계치와 비교하는 비교 스텝과, 검색 조건 또는 임계치를 증가시키는 증가 스텝을 포함하는 것을 특징으로 한다.
청구항 14에 기재된 제공 매체는 검색 조건을 접수하는 접수 스텝과, 접수 스텝에서 접수한 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 스텝과, 접수 스텝에서 접수한 검색 조건과 추출 스텝에서 추출한 신호 특성과의 상관 계수를 연산하는 연산 스텝과, 연산 스텝에서 연산한 상관 계수를 소정의 임계치와 비교하는 비교 스텝과, 검색 조건 또는 임계치를 증가시키는 증가 스텝을 포함하는 처리를 정보 처리 장치에 실행시키는 컴퓨터가 판독 가능한 프로그램을 제공하는 것을 특징으로 한다.
청구항 15에 기재된 정보 기록 장치는 입력된 AV 데이타의 신호 특성을 검출하는 검출 수단과, 검출 수단이 검출한 신호 특성을 계층적으로 기록하는 기록 수단을 구비하는 것을 특징으로 한다.
청구항 20에 기재된 정보 기록 방법은 입력된 AV 데이타의 신호 특성을 검출하는 검출 스텝과, 검출 스텝에서 검출한 신호 특성을 계층적으로 기록하는 기록스텝을 포함하는 것을 특징으로 한다.
청구항 21에 기재된 제공 매체는 입력된 AV 데이타의 신호 특성을 검출하는 검출 스텝과, 검출 스텝에서 검출한 신호 특성을 계층적으로 기록하는 기록 스텝을 포함하는 처리를 정보 기록 장치에서 실행되는 컴퓨터가 판독 가능한 프로그램을 제공하는 것을 특징으로 한다.
청구항 22에 기재된 기록 매체는 신호 특성이 계층적으로 구성되어 있는 AV 데이타가 기록되어 있는 것을 특징으로 한다.
청구항 1에 기재된 정보 처리 장치, 청구항 6에 기재된 정보 처리 방법, 및 청구항 7에 기재된 제공 매체에서는 검색 조건이 접수되고, 접수된 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부가 복호되고, 접수된 검색 조건과 복호된 AV 데이타와의 상관 계수가 연산되고, 소정의 임계치와 비교된다. 또한, 검색 조건 또는 임계치가 증가된다.
청구항 8에 기재된 정보 처리 장치, 청구항 13에 기재된 정보 처리 방법, 및 청구항 14에 기재된 제공 매체에서는 검색 조건이 접수되고, 접수된 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일 부가 추출되고, 접수된 검색 조건과 추출된 신호 특성과의 상관 계수가 연산되고, 소정의 임계치와 비교된다. 또한, 검색 조건 또는 임계치가 증가된다.
청구항 15에 기재된 정보 기록 장치, 청구항 20에 기재된 정보 기록 방법, 및 청구항 21에 기재된 제공 매체에서는 입력된 AV 데이타의 신호 특성이 검출되고, 검출된 신호 특성이 계층적으로 기록된다.
청구항 22에 기재된 기록 매체에서는 신호 특성이 계층적으로 구성되어 있는 AV 데이타가 기록된다.
이하에 본 발명의 실시예를 설명하지만, 특허 청구의 범위에 기재된 발명의 각 수단과 이하의 실시예와의 대응 관계를 밝히기 위해, 각 수단의 후의 괄호 내에, 대응하는 실시예(단 일례)를 부가하여 본 발명의 특징을 기술하면, 다음과 같아진다. 단, 물론 이 기재는 각 수단을 기재한 것에 한정하는 것을 의미할 만한 것이 아니다.
청구항 1에 기재된 정보 처리 장치는 검색 조건을 접수하는 접수 수단(예를 들면, 도 2의 평균치 계산부(15))와, 접수 수단이 접수한 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 수단(예를 들면, 도 2의 비트 추출부(11))와, 접수 수단이 접수한 검색 조건과 복호 수단으로 복호된 AV 데이타와의 상관 계수를 연산하는 연산 수단(예를 들면, 도 6의 스텝 S3)과, 연산 수단이 연산한 상관 계수를 소정의 임계치와 비교하는 비교 수단(예를 들면, 도 6의 스텝 S3)과, 검색 조건 또는 임계치를 증가시키는 증가 수단(예를 들면, 도 6의 스텝 S6)를 구비하는 것을 특징으로 한다.
청구항 8에 기재된 정보 처리 장치는 검색 조건을 접수하는 접수 수단(예를 들면, 도 9의 평균치 계산부(53))과, 접수 수단이 접수한 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 수단(예를 들면, 도 9의 기록 데이타 판독부(51))와, 접수 수단이 접수한 검색 조건과 추출 수단이 추출한 신호 특성과의 상관 계수를 연산하는 연산 수단(예를 들면, 도 6의 스텝 S3)와, 연산 수단이 연산한 상관 계수를 소정의 임계치와 비교하는 비교 수단(예를 들면, 도 6의 스텝 S3)과, 검색 조건 또는 임계치를 증가시키는 증가 수단(예를 들면, 도 6의 스텝 S6)를 구비하는 것을 특징으로 한다.
청구항 15에 기재된 정보 기록 장치는 입력된 AV 데이타의 신호 특성을 검출하는 검출 수단(예를 들면, 도 8의 (B)의 스펙트럼 변환부(41))와, 검출 수단이 검출한 신호 특성을 계층적으로 기록하는 기록 수단(예를 들면, 도 8의 (B)의 매체 기록부(34))를 구비하는 것을 특징으로 한다.
본 발명을 적용한 오디오 데이타 검색 장치의 구성에 대해, 도 1을 참조하여 설명한다. 이 오디오 데이타 검색 장치의 버스(6)에는 CPU(1), ROM(2), RAM(3), 하드디스크(HDD : 4), 및 인터페이스(I/F : 5)가 접속되어 있다.
CPU(1)은 ROM(2)에 저장되어 있는 BIOS(Basic Input/Output System) 프로그램에 기초하여, 하드디스크(4)에 기억되어 있는 검색 프로그램을 RAM(3)으로 전송시켜 기억시키도록 이루어져 있다. 또한, CPU(1)은 RAM(3)으로부터 검색 프로그램을 판독하여 실행하도록 이루어져 있다.
하드디스크(4)는 상술된 검색 프로그램과 동시에, 검색 대상이 되는 압축 부호화된 오디오 데이타를 기억하도록 되어 있다. 인터페이스(5)는 검색 조건의 입력을 접수하도록 이루어져 있다. 또한, 인터페이스(5)는 검색된 결과를 디스플레이, 또는 스피커 등(모두 도시하지 않음)으로 출력하도록 이루어져 있다.
또, 이 오디오 데이타 검색 장치는 검색 프로그램에 기초하여, 오디오 데이타의 속성 정보(텍스트 정보), 및 신호 특성을 검색 조건으로 하여 검색을 하도록 이루어져 있지만, 오디오 데이타의 속성 정보를 검색 조건으로 하는 검색에 대해서는 종래의 검색 방법과 동일하므로, 이하의 설명에서는 오디오 데이타의 신호 특성을 검색 조건으로 하여 검색을 하는 부분에 대해 설명한다.
도 2는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다. 이 구성예에서는 도 3에 도시된 바와 같은 파형 신호의 블럭 단위의 진폭 평균치를 검색 조건으로 하여 부호화 오디오 데이타가 검색된다.
비트 추출부(11)는 하드디스크(4)에 기억되어 있는 부호화 오디오 데이타를 차례로 판독하고, 그 중에서 부호화 스펙트럼 계수의 직류 성분만을 추출하여 하프만 복호부(12)로 출력한다. 하프만 복호부(12)는 비트 추출부(11)로부터 입력된 부호화 스펙트럼 계수의 직류 성분을 복호하고, 얻어진 양자화 스펙트럼 계수의 직류 성분을 역양자화부(13)로 출력한다. 역양자화부(13)는 하프만 복호부(12)로부터 입력된 양자화 스펙트럼 계수의 직류 성분을 역양자화하고, 얻어진 스펙트럼 계수의 직류 성분을 비교 판정부(14)로 출력한다.
또, 여기서 얻어진 스펙트럼 계수의 직류 성분은 부호화시에서의 이산 코사 인 변환의 특성에 따라, 부호화전의 원래의 파형 신호의 각 블럭마다의 진폭 평균치와 이론적으로 같은 것이 알려져 있다. 따라서, 스펙트럼 계수의 직류 성분을, 또한 역스펙트럼 변환할 필요는 없다.
평균치 계산부(15)는 검색 조건으로서 입력된 샘플 파형의 소정의 블럭 단위의 진폭 평균치를 연산하여 비교 판정부(14)로 출력한다.
비교 판정부(14)는 역양자화부(13)로부터 입력된 스펙트럼 계수의 직류 성분과, 평균치 계산부(15)로부터 입력된 샘플 파형의 소정의 블럭 단위의 진폭 평균치와의 상관 계수를 연산함으로써, 스펙트럼 계수의 직류 성분의, 샘플 파형의 진폭 평균치에 대한 유사도를 구한다. 또한, 비교 판정부(14)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하고, 그 결과를 출력한다. 또, 비교 판정부(14)는 유사도의 값을 출력하도록 해도 좋다.
이상과 같이, 도 2의 구성예에서는 부호화 스펙트럼 계수의 직류 성분만을 복호하고 있기 때문에, 종래의 검색 방법과 마찬가지로, 모든 부호화 스펙트럼 계수를 부호화하고, 또한 역스펙트럼 변환하여 얻어지는 파형 신호와, 샘플 신호를 비교하는 경우에 비교하여, 그 처리 시간이 적다. 또한, 상술된 임계치를 서서히 증가시킴으로써, 검색 결과의 범위를 한정하는 것이 가능하다.
도 4는 오디오 데이타 검색 장치의 기능 블럭의 다른 구성예를 나타내고 있다. 이 구성예에서는 도 5에 도시된 바와 같이 파형 신호의 프레임 단위의 스펙트럼 계수의 일부를 검색 조건으로 하여 부호화 오디오 데이타가 검색된다.
비트 추출부(21)는 하드디스크(4)에 기억되어 있는 부호화 오디오 데이타를 차례로 판독하고, 그 중에서 검색 조건에 대응하는 주파수 대역의 일부(예를 들면, 도 5에 도시된 바와 같이 주파수의 저역측에서 4번째까지의 대역)의 부호화 스펙트럼 계수를 추출하여 하프만 복호부(22)로 출력한다. 하프만 복호부(22)는 비트 추출부(21)로부터 입력된 일부의 부호화 스펙트럼 계수를 복호하고, 얻어진 양자화 스펙트럼 계수를 역양자화부(23)로 출력한다. 역양자화부(23)는 하프만 복호부(22)로부터 입력된 양자화 스펙트럼 계수를 역양자화하고, 얻어진 일부의 주파수 대역의 스펙트럼 계수를 비교 판정부(24)로 출력한다.
스펙트럼 변환부(25)는 검색 조건으로서 입력된 샘플 파형의 임의의 주파수 대역의 스펙트럼 계수를 연산하여 비교 판정부(24)로 출력한다.
비교 판정부(24)는 역양자화부(23)로부터 입력된 일부의 주파수 대역의 스펙트럼 계수와, 스펙트럼 변환부(25)로부터 입력된 샘플 파형의 임의의 주파수 대역의 스펙트럼 계수와의 상관 계수를 연산함으로써 양자의 유사도를 구한다. 또한, 비교 판정부(24)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하고, 그 결과를 출력한다. 또, 비교 판정부(24)는 유사도의 값을 출력하도록 해도 좋다.
이 구성예에서 검색 결과의 범위를 더욱 한정하는 경우, 검색 조건이 되는 샘플 파형의 주파수 대역의 수, 및 유사 판정의 임계치를 서서히 증가시켜 검색을 하면, 검색 결과의 범위를 계층적인 상세도로 한정하는 것이 가능하다.
이 검색 결과의 범위를 한정하는 처리에 대해 도 6의 흐름도를 참조하여 설명한다. 스텝 S1에서, 비교 판정부(24)는 유사도의 판정 기준이 되는 임계치를 소 정값으로 초기화한다. 스텝 S2에서, 비교 판정부(24)는 검색 조건이 되는 샘플 파형의 주파수 대역의 수(스펙트럼수)를 소정의 값으로 초기화한다.
이 검색 조건의 설정에 대응하여, 데이타 베이스(하드디스크(4))에 기억되어 있는 부호화 오디오 데이타가 차례로 판독되고, 이들로부터, 검색 조건에 대응하는 주파수 대역의 스펙트럼 계수가, 비트 추출부(21) 내지 역양자화부(23)에 의해 복호되어 비교 판정부(24)로 출력된다. 한편, 스펙트럼 변환부(25)는 샘플 파형의 스펙트럼 계수를 연산하여 비교 판정부(24)로 출력한다.
스텝 S3에서, 비교 판정부(24)는 역양자화부(23)로부터 입력된, 부호화 오디오 데이타의 스펙트럼 계수와, 스펙트럼 변환부(25)로부터 입력된 샘플 파형의 스펙트럼 계수와의 상관 계수(유사도)를 연산하고, 연산한 상관 계수의 값이 스텝 S1에서 설정한 임계치보다도 큰 것을 추출하여 검색 결과로 한다.
스텝 S4에서, 비교 판정부(24)는 예를 들면 스텝 S3에서 검색된 부호화 오디오 데이타의 수가 소정의 값 이하인지의 여부를 판정함으로써, 검색 결과가 만족할 수 있는지의 여부를 판정한다. 스텝 S3에서 검색된 부호화 오디오 데이타의 수가 소정값 이상으로서, 검색 결과를 만족할 수 있는 것이 아니라고 판정된 경우, 스텝 S5로 진행한다.
스텝 S5에서, 비교 판정부(24)는 검색 조건으로서 설정되어 있는 샘플 파형의 주파수 대역의 수가 그 최대치보다도 작은지의 여부를 판정한다. 검색 조건인 샘플 파형의 주파수 대역의 수(스펙트럼수)가 그 최대치보다도 작다고 판정된 경우, 스텝 S6에서, 검색 조건인 샘플 파형의 주파수 대역의 수(스펙트럼수)를 1만큼 증가시켜서 스텝 S3으로 복귀한다.
그 후, 스텝 S3 내지 S6의 처리가 반복되고, 스텝 S5에서 검색 조건인 샘플 파형의 주파수 대역의 수가 그 최대치보다도 작지 않다고(동일하다고) 판정된 경우, 스텝 S7에서 비교 판정부(24)는 유사도의 판정 기준이 되는 임계치를 소정의 값만큼 증가시킨다.
그 후, 스텝 S2 내지 S7의 처리가 반복되고, 스텝 S4에 있어서, 스텝 S3에서 검색된 부호화 오디오 데이타의 수가 소정의 값 이하이고, 검색 결과를 만족할 수 있다고 판정된 경우, 검색 결과의 범위를 한정하는 처리를 종료한다.
도 7은 데이타 베이스가 되는 기록 매체에 기록되어 있는 오디오 데이타의 포맷의 예를 나타내고 있다. 이 포맷에서, 각 오디오 데이타(데이타 레코드 1 내지 M)는 각 오디오 데이타를 식별하는 데이타 식별 번호, 속성 정보가 기술되어 있는 속성 정보 블럭, 및 오디오 데이타의 신호 특성이 기술되어 있는 신호 특성 정보 블럭으로 구성된다.
속성 정보 블럭에 기술된 속성 정보는 예를 들면 오디오 데이타의 작자명, 곡명, 가수명, 분류, 저작권 정보, 및 제작 연월일등의 텍스트 데이타이다.
신호 특성 정보 블럭은 프레임 총수 N을 기술하는 영역, 및 각 프레임의 스펙트럼 계수를 기술하는 영역(프레임 데이타 영역)으로 구성된다.
프레임 데이타 영역에는 분할된 주파수 대역의 총수 W와, 각 주파수 대역의 스펙트럼 계수 X1 내지 XW가 낮은 주파수 대역측에서 순서대로 기술되어 있다.
또, 이 프레임 데이타 영역에는 주파수 대역의 총수 W를 1로 하여 스펙트럼 계수 X1에, 이 프레임의 스펙트럼 계수의 직류 성분을 기술하도록 해도 좋다.
도 8은 도 7에 도시한 포맷의 오디오 데이타를 기록 매체에 기록하는 정보 기록 장치의 구성예를 나타내고 있다. 도 8의 (A)는 종래의 정보 부호화 장치(도 24)에 의해 생성된 부호화 오디오 데이타를 입력 신호로 하는 구성예이다. 입력된 부호화 오디오 데이타는 비트 추출부(31)에 의해 소정의 부호화 스펙트럼 계수가 추출되고, 하프만 복호부(32)에 의해 복호되고, 역양자화부(33)에 의해 역양자화되고, 얻어진 스펙트럼 계수가 매체 기록부(34)에 의해, 도 7에 도시된 포맷으로 기록 매체(35)에 기록된다.
도 8의 (B)는 오디오 파형 신호를 입력 신호로 하는 구성예이다. 입력된 오디오 파형 신호는 스펙트럼 변환부(41)에 의해, 블럭화되고, 블럭 단위로 스펙트럼 계수로 변환된다. 얻어진 스펙트럼 계수는 매체 기록부(34)에 의해, 도 7에 도시된 포맷으로 기록 매체(35)에 기록된다.
도 9는 도 7에 도시된 포맷의 프레임 데이타 영역에, 주파수 대역의 총수 W를 1로서 스펙트럼 계수 X1에 그 프레임의 스펙트럼 계수의 직류 성분을 기술한 기록 매체(35)를 데이타 베이스로 하는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다.
기록 데이타 판독부(51)는 기록 매체(35)에 기록되어 있는 오디오 데이타의 신호 특성 정보 블럭 내의 검색 조건에 대응하는 프레임 데이타 영역의 스펙트럼 계수 X1(그 프레임의 스펙트럼 계수의 직류 성분)을 판독하여 비교 판정부(52)로 출 력한다. 또, 스펙트럼 계수의 직류 성분은 부호화시에서의 이산 코사인 변환의 특성에 따라, 부호화전의 원래의 파형 신호의 각 블럭마다의 진폭 평균치와 같다.
평균치 계산부(53)는 검색 조건으로서 입력된 샘플 파형의 블럭 단위의 진폭 평균치를 연산하여 비교 판정부(52)로 출력한다.
비교 판정부(52)는 기록 데이타 판독부(51)로부터 입력된 스펙트럼 계수의 직류 성분과, 평균치 계산부(53)로부터 입력된 샘플 파형의 블럭 단위의 진폭 평균치와의 상관 계수를 연산함으로써, 스펙트럼 계수의 직류 성분의, 샘플 파형의 진폭 평균치에 대한 유사도를 구한다. 또한, 비교 판정부(52)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(52)는 유사도의 값을 출력하도록 해도 좋다.
이상과 같이, 도 9의 구성예에서는 부호화 스펙트럼 계수의 직류 성분만을 복호하고 있으므로, 종래의 검색 방법과 마찬가지로, 모든 부호화 스펙트럼 계수를 부호화하고, 또한 역스펙트럼 변환하여 얻어진 파형 신호와, 샘플 신호를 비교하는 경우에 비교하여 그 처리 시간이 적다. 또한, 상술한 임계치를 서서히 증가시킴으로써, 검색 결과의 범위를 한정하는 것이 가능하다.
도 10은 도 7에 도시된 포맷의 오디오 데이타가 기록되어 있는 기록 매체(35)를 데이타 베이스로 하는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다.
기록 데이타 판독부(61)는 기록 매체(35)에 기록되어 있는 오디오 데이타의 신호 특성 정보 블럭 내의 프레임 데이타 영역에서, 검색 조건에 대응하는 주파수 대역의 스펙트럼 계수만을 판독하여 비교 판정부(62)로 출력한다. 즉, 검색 결과의 범위를 한정하는 단계에서, 판독되는 스펙트럼 계수의 수가 서서히 증가된다.
스펙트럼 변환부(63)는 검색 조건으로서 입력된 샘플 파형의 주파수 대역의 스펙트럼 계수를 연산하여 비교 판정부(62)로 출력한다.
비교 판정부(62)는 기록 데이타 판독부(61)로부터 입력된 검색 조건에 대응하는 주파수 대역의 스펙트럼 계수와, 스펙트럼 변환부(63)로부터 입력된 샘플 파형의 스펙트럼 계수와의 상관 계수를 연산함으로써 양자의 유사도를 구한다. 또한, 비교 판정부(62)는 구해진 유사도와 소정의 임계치를 비교함에 따라, 양자의 일치 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(62)는 유사도의 값을 출력하도록 해도 좋다.
이 구성에서 검색 결과의 범위를 더욱 한정하는 경우, 검색 조건이 되는 샘플 파형의 주파수 대역의 수, 및 유사 판정의 임계치를 서서히 증가시켜 검색을 하면, 검색 결과를 계층적인 상세도로 한정하는 것이 가능하다.
도 11은 도 7에 도시된 포맷의 변형예를 나타내고 있고, 이 변형예의 프레임 데이타 영역에는 분할된 주파수 대역의 총수 W, 각 주파수 대역의 부호화 스펙트럼 Y1 내지 YW, 및 부호화 스펙트럼 Y1 내지 YW를 복호하기 위한 정보(스펙트럼의 정규화 계수, 양자화폭 계수, 및 하프만 코드 부호 길이의 번호등)가 기술되어 있다.
도 12는 도 11에 도시된 포맷의 오디오 데이타가 기록되어 있는 기록 매체(35)를 데이타 베이스로 하는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다. 기록 데이타 판독부(71)는 기록 매체(35)에 기록되어 있는 오 디오 데이타의 신호 특성 정보 블럭 내의 프레임 데이타 영역에서, 검색 조건에 대응하는 주파수 대역의 부호화 스펙트럼, 및 스펙트럼 복호용 정보를 판독하여 하프만 복호부(72)로 출력한다. 출력된 부호화 스펙트럼은 스펙트럼 복호용 정보에 기초하여, 하프만 복호부(72)로 복호되고, 역양자화부(73)에서 역양자화되고, 얻어진 스펙트럼 계수는 비교 판정부(74)로 출력된다.
스펙트럼 변환부(75)는 검색 조건으로서 입력된 샘플 파형의 주파수 대역마다의 스펙트럼 계수를 연산하여 비교 판정부(74)로 출력한다.
비교 판정부(74)는 역양자화부(73)로부터 입력된 검색 조건에 대응하는 주파수 대역의 스펙트럼 계수와, 스펙트럼 변환부(75)로부터 입력된 샘플 파형의 스펙트럼 계수와의 상관 계수를 연산함으로써 유사도를 구한다. 또한, 비교 판정부(74)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(74)는 유사도의 값을 출력하도록 해도 좋다.
이 구성에서 검색 결과를 더욱 한정하는 경우, 검색 조건이 되는 샘플 파형의 주파수 대역의 수, 및 유사 판정의 임계치를 서서히 증가시켜 검색을 하면, 검색 결과의 범위를 계층적인 상세도로 한정하는 것이 가능하다.
도 13은 오디오 데이타 검색 장치의 또 다른 구성예를 나타내고 있다. 이 구성예에서는 도 14에 도시된 바와 같은 파형 신호의 진폭 급변점(어택)을 검색 조건으로 하여 부호화 오디오 데이타가 검색된다. 또 검색되는 부호화 오디오 데이타에는 어택 정보(어택의 위치 및 레벨)가 저장되어 있는 것으로 한다.
비트 추출부(81)는 하드디스크(4)에 기억되어 있는 부호화 오디오 데이타를 차례로 판독하고, 그 중에서 부호화되어 있는 어택 정보를 추출하여, 어택 복원부(82)로 출력한다. 또, 여기서는 모든 어택 정보가 추출되는 것은 아니고, 예를 들면 소정의 프레임마다, 프레임의 최초의 창구간의 최초의 어택 정보와 같이 검색 조건에 대응한 일부의 어택 특성이 추출된다.
어택 복원부(82)는 비트 추출부(81)로부터 입력된 어택 정보를 복원하고, 얻어진 어택의 위치 및 레벨을 비교 판정부(83)로 출력한다.
어택 검출부(84)는 검색 조건으로서 입력된 샘플 파형의 어택 정보를 검출하여 비교 판정부(83)로 출력한다.
비교 판정부(83)는 어택 복원부(82)로부터 입력된 어택 정보와, 어택 검출부(84)로부터 입력된 샘플 파형의 어택 정보와의 상관 계수를 연산함으로써, 양자의 유사도를 구한다. 또한, 비교 판정부(83)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(83)는 유사도의 값을 출력하도록 해도 좋다.
또, 도 13의 구성예에서는 검색 조건인 어택 정보를 추출하는 범위를 서서히 증가시킴으로써, 검색 결과의 범위를 한정하는 것이 가능하다.
도 15는 데이타 베이스가 되는 기록 매체에 기록되어 있는 오디오 데이타의 포맷의 예를 나타내고 있다. 이 포맷에서, 각 오디오 데이타(데이타 레코드 1 내지 M)는 각 오디오 데이타를 식별하는 데이타 식별 번호, 속성 정보가 기술되어 있는 속성 정보 블럭, 및 오디오 데이타의 신호 특성이 기술되어 있는 신호 특성 정보 블럭으로 구성된다.
속성 정보 블럭에 기술된 속성 정보는 예를 들면 오디오 데이타의 작자명, 곡명, 가수명, 분류, 저작권 정보, 및 제작 연월일등의 텍스트 데이타이다.
신호 특성 정보 블럭은 프레임 총수 N을 기술하는 영역, 및 각 프레임의 신호 특성을 기술하는 영역(프레임 데이타 영역)으로 구성된다. 프레임 데이타 영역에는 그 프레임에 설정된 구간창의 총수 W와, 각 구간창의 어택 정보가 기술되고, 또한 각 구간창의 어택 정보에는 그 구간창에 존재하는 어택의 총수 T와 각 어택의 위치 및 레벨이 기술되어 있다. 또, 어택의 위치는 그 어택의 프레임 구간 내 및 창구간 내에서의 상대 위치로 표시된다. 또한, 어택 레벨은 그 어택의 진폭 급변도에 의해 표시된다.
도 16은 도 15에 도시된 포맷의 오디오 데이타를 기록 매체에 기술하는 정보 기록 장치의 구성예를 나타내고 있다. 도 16의 (A)은 어택 정보가 부호화되어 있는 부호화 오디오 데이타를 입력 신호로 하는 구성예이다. 비트 추출부(91)는 입력된 부호화 오디오 데이타로부터 소정의 부호화되어 있는 어택 정보를 추출한다. 추출된 부호화되어 있는 어택 정보는 어택 복원부(92)에 의해 복원되고, 얻어진 어택의 위치 및 레벨이 매체 기록부(93)에 의해, 도 15에 도시된 포맷으로 기록 매체(94)에 기록된다.
도 16의 (B)는 오디오 파형 신호를 입력 신호로 하는 구성예이다. 어택 검출부(101)는 입력된 오디오 파형 신호로부터 어택을 검출하고, 그 위치와 레벨이, 매체 기록부(93)에 의해, 도 15에 도시된 포맷으로 기록 매체(94)에 기록된다.
도 17은 도 15에 도시된 포맷의 오디오 데이타가 기록되어 있는 기록 매체(94)를 데이타 베이스로 하는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다.
기록 데이타 판독부(111)는 기록 매체(94)에 기록되어 있는 오디오 데이타의 신호 특성 정보 블럭 중에서, 검색 조건(예를 들면, 소정의 프레임마다, 최초의 구간창의 최초의 어택 정보)에 대응하는 일부의 어택 정보만을 판독하여 비교 판정부(112)로 출력한다.
어택 검출부(113)는 검색 조건으로서 입력된 샘플 파형의 어택을 검출하여 그 위치와 레벨을 비교 판정부(112)로 출력한다.
비교 판정부(112)는 기록 데이타 판독부(111)로부터 입력된, 검색 조건에 대응하는 어택 정보와, 어택 검출부(113)로부터 입력된 샘플 파형의 어택 정보와의 상관 계수를 연산함으로써 양자의 유사도를 구한다. 또한, 비교 판정부(112)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(112)는 유사도의 값을 출력하도록 해도 좋다.
이 구성예에서 검색 결과의 범위를 한정하는 경우, 예를 들면 구간창의 수를 늘려, 검색 조건이 되는 샘플 파형으로부터 검출하는 어택 정보를 서서히 증가시킴과 동시에, 유사 판정의 임계치를 서서히 증가시켜 검색을 하면, 검색 결과의 범위를 계층적인 상세도로 한정하는 것이 가능하다.
도 18은 오디오 데이타 검색 장치의 기능 블럭의 또 다른 구성예를 나타내고 있다. 이 구성예에서는 도 19에 도시된 바와 같은 파형 신호의 주파수 대역마다의 어택을 검색 조건으로 하여 오디오 부호화 데이타가 검색된다. 또 검색되는 부호화 오디오 데이타에는 주파수 대역마다의 어택 정보(어택의 위치 및 레벨)가 저장되어 있는 것으로 한다.
비트 추출부(121)는 하드디스크(4)에 기억되어 있는 부호화 오디오 데이타를 차례로 판독하고, 그 중에서 부호화되어 있는 어택 정보를 추출하여, 어택 복원부(122)로 출력한다. 또, 여기서는 모든 어택 정보가 추출되는 것은 아니고, 검색 조건(예를 들면, 소정의 프레임마다, 최저 주파수 대역의 최초의 구간창의 최초의 어택 정보)에 대응한 일부의 어택 특성이 추출된다.
어택 복원부(122)는 비트 추출부(121)로부터 입력된 부호화되어 있는 어택 정보를 복원하고, 얻어진 어택의 위치 및 레벨을 비교 판정부(123)로 출력한다.
대역 분할부(124)는 검색 조건으로서 입력된 샘플 파형을 소정의 주파수 대역으로 분할하여 어택 검출부(125)로 출력한다. 어택 검출부(125)는 대역 분할부(124)로부터 입력된 대역 분할된 샘플 파형으로부터, 각 대역의 어택 정보를 검출하고, 그 위치와 레벨을 비교 판정부(123)로 출력한다.
비교 판정부(123)는 어택 복원부(122)로부터 입력된 주파수 대역마다의 어택 정보와, 어택 검출부(125)로부터 입력된 샘플 파형의 주파수 대역마다의 어택 정보와의 상관 계수를 연산함으로써, 양자의 유사도를 구한다.
또한, 비교 판정부(123)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(123) 는 유사도의 값을 출력하도록 해도 좋다.
또, 도 18의 구성에서는 검색 조건인 어택 정보를 추출하는 주파수 대역의 수 등을 서서히 증가시킴으로써, 검색 결과의 범위를 한정하는 것이 가능하다.
도 20은 데이타 베이스가 되는 기록 매체에 기록되어 있는 오디오 데이타의 포맷의 예를 나타내고 있다. 이 포맷에서, 각 오디오 데이타(데이타 레코드 1 내지 M)는 오디오 데이타를 식별하는 데이타 식별 번호, 속성 정보가 기술되어 있는 속성 정보 블럭, 및 오디오 데이타의 신호 특성이 기술되어 있는 신호 특성 정보 블럭으로 구성된다.
속성 정보 블럭에 기술된 속성 정보는 예를 들면 오디오 데이타의 작자, 곡명, 가수명, 분류, 저작권 정보, 및 제작 연월일등의 텍스트 데이타이다.
신호 특성 정보 블럭은 프레임 총수 N을 기술하는 영역, 및 각 프레임의 신호 특성을 기술하는 영역(프레임 데이타 영역)으로 구성된다.
프레임 데이타 영역에는 분할된 주파수 대역의 총수 K와, 주파수 대역별도의 어택 정보가 기술되어 있다.
주파수 대역 별도의 어택 정보에는 그 프레임에 설정된 구간창의 총수 W와 각 구간창의 어택 정보가 기술되고, 각 구간창의 어택 정보에는 어택의 총수 T와 각 어택의 위치 및 레벨이 기술되어 있다.
또, 도 20에 도시된 포맷의 오디오 데이타를 기록 매체에 기술하는 정보 기록 장치의 구성은 도 16에 도시된 정보 기록 장치의 구성과 동일하므로, 그 설명을 생략한다.
도 21은 도 20에 도시된 포맷의 오디오 데이타가 기록되어 있는 기록 매체(94)를 데이타 베이스로 하는 오디오 데이타 검색 장치의 기능 블럭의 구성예를 나타내고 있다.
기록 데이타 판독부(131)는 기록 매체(94)에 기록되어 있는 오디오 데이타의 신호 특성 정보 블럭 중에서, 검색 조건(예를 들면, 소정의 프레임마다, 최저 주파수 대역의 최초의 창구간의 최초의 어택 정보)에 대응하는 일부의 어택 정보만을 판독하여 비교 판정부(132)로 출력한다.
대역 분할부(133)는 검색 조건으로서 입력된 샘플 파형을 소정의 주파수 대역으로 분할하여, 어택 검출부(134)로 출력한다. 어택 검출부(134)는 주파수 대역별의 어택을 검출하고, 그 위치와 레벨을 비교 판정부(132)로 출력한다.
비교 판정부(132)는 기록 데이타 판독부(131)로부터 입력된 검색 조건에 대응하는 주파수 대역별의 어택 정보와, 어택 검출부(134)로부터 입력된 샘플 파형의 주파수 대역별의 어택 정보와의 상관 계수를 연산함으로써, 양자의 유사도를 구한다. 또한, 비교 판정부(132)는 구해진 유사도와 소정의 임계치를 비교함으로써, 양자의 일치, 또는 불일치를 판정하여 그 결과를 출력한다. 또, 비교 판정부(132)는 유사도의 값을 출력하도록 해도 좋다.
이 구성에서 검색 결과의 범위를 한정하는 경우, 예를 들면 검색 조건의 주파수 대역의 수를 서서히 증가시킴과 동시에, 유사 판정의 임계치를 서서히 증가시켜 검색하면, 검색 결과의 범위를 계층적인 상세도로 한정하는 것이 가능하다.
또, 본 실시예에서는 기록 매체에 기록되어 있는 부호화 오디오 데이타를 데 이타 베이스로서 검색하도록 했지만, 차례로 입력되어 오는 오디오 데이타의 비트 스트림을 데이타 베이스로서 검색하는 것도 가능하다.
도 22는 그와 같은 오디오 부호화 데이타의 비트 스트림의 포맷을 일례를 나타내고 있다. 이 비트 스트림은 전체 헤더에 계속해서 각 프레임의 데이타가, 차례로 저장되어 있다. 각 프레임의 데이타는 프레임 헤더, 스펙트럼 복호 정보, 및 부호화 스펙트럼으로 구성되어 있다. 스펙트럼 복호 정보에는 스펙트럼의 복호에 필요한 정규화 계수 및 양자화폭 계수, 및 어택 정보등이 저장되어 있고, 또한 어택 정보에는 어택수, 어택의 위치, 및 레벨이 저장되어 있다.
또한, 본 발명은 오디오 데이타의 검색뿐만 아니라, 비디오 데이타의 검색에도 적용하는 것이 가능하다.
또, 상기 각 처리를 행하는 컴퓨터 프로그램은 자기디스크, CD-ROM 등의 정보 기록 매체로 이루어지는 제공 매체 외에, 인터넷, 디지탈 위성등의 네트워크 제공 매체를 통해 사용자에게 제공할 수 있다.
이상과 같이, 청구항 1에 기재된 정보 처리 장치, 청구항 6에 기재된 정보 처리 방법, 및 청구항 7에 기재된 제공 매체에 따르면, 검색 조건에 대응하여 부호화되어 있는 AV 데이타의 일부를 복호하고, 복호한 AV 데이타와 검색 조건과의 상관 계수를 연산하여 소정의 임계치와 비교하고, 또한 검색 조건 또는 임계치를 증가시키도록 했으므로, 신호 특성을 검색 조건으로 하여, AV 데이타를 효율적으로 검색하는 것이 가능해진다.
청구항 8에 기재된 정보 처리 장치, 청구항 13에 기재된 정보 처리 방법, 및 청구항 14에 기재된 제공 매체에 따르면, 검색 조건에 대응하여 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하고, 추출한 신호 특성과 검색 조건과의 상관 계수를 연산하여 소정의 임계치와 비교하고, 또한 검색 조건 또는 임계치를 증가시키도록 했으므로, 신호 특성을 검색 조건으로 하여, AV 데이타를 효율적으로 검색하는 것이 가능해진다.
청구항 15에 기재된 정보 기록 장치, 청구항 20에 기재된 정보 기록 방법, 및 청구항 21에 기재된 제공 매체에 따르면, 입력된 AV 데이타의 신호 특성을 검출하고, 검출한 신호 특성을 계층적으로 기록하도록 했으므로, 신호 특성의 일부를 추출하는 것이 가능해진다.
청구항 22에 기재된 기록 매체에 따르면, 신호 특성이 계층적으로 구성되어 있는 AV 데이타가 기록되어 있으므로, 신호 특성의 일부를 추출하는 것이 가능해진다.

Claims (22)

  1. 부호화되어 있는 AV 데이타를 검색하는 정보 처리 장치에 있어서,
    검색 조건을 접수하는 접수 수단과,
    상기 접수 수단이 접수한 검색 조건에 대응하여 상기 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 수단과,
    상기 접수 수단이 접수한 검색 조건과 상기 복호 수단으로 복호된 AV 데이타와의 상관 계수를 연산하는 연산 수단과,
    상기 연산 수단이 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비교 수단과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 수단을 구비하는 것을 특징으로 하는 정보 처리 장치.
  2. 제1항에 있어서, 상기 검색 조건은 블럭마다의 스펙트럼 계수의 평균치인 것을 특징으로 하는 정보 처리 장치.
  3. 제1항에 있어서, 상기 검색 조건은 주파수 대역마다의 스펙트럼 계수치인 것을 특징으로 하는 정보 처리 장치.
  4. 제1항에 있어서, 상기 검색 조건은 블럭마다의 어택 정보인 것을 특징으로 하는 정보 처리 장치.
  5. 제1항에 있어서, 상기 검색 조건은 주파수 대역마다의 어택 정보인 것을 특징으로 하는 정보 처리 장치.
  6. 부호화되어 있는 AV 데이타를 검색하는 정보 처리 방법에 있어서,
    검색 조건을 접수하는 접수 스텝과,
    상기 접수 스텝에서 접수한 검색 조건에 대응하여 상기 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 스텝과,
    상기 접수 스텝에서 접수한 검색 조건과 상기 복호 스텝에서 복호된 AV 데이타와의 상관 계수를 연산하는 연산 스텝과,
    상기 연산 스텝에서 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비교 스텝과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 스텝을 포함하는 것을 특징으로 하는 정보 처리 방법.
  7. 부호화되어 있는 AV 데이타를 검색하는 정보 처리 장치에,
    검색 조건을 접수하는 접수 스텝과,
    상기 접수 스텝에서 접수한 검색 조건에 대응하여 상기 부호화되어 있는 AV 데이타의 일부를 복호하는 복호 스텝과,
    상기 접수 스텝에서 접수한 검색 조건과 상기 복호 스텝에서 복호된 AV 데이타와의 상관 계수를 연산하는 연산 스텝과,
    상기 연산 스텝에서 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비교 스텝과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 스텝을 포함하는 처리를 실행시키는 컴퓨터가 판독 가능한 프로그램을 제공하는 것을 특징으로 하는 제공 매체.
  8. 신호 특성이 계층적으로 기록되어 있는 AV 데이타를 검색하는 정보 처리 장치에 있어서,
    검색 조건을 접수하는 접수 수단과,
    상기 접수 수단이 접수한 검색 조건에 대응하여 상기 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 수단과,
    상기 접수 수단이 접수한 검색 조건과 상기 추출 수단이 추출한 신호 특성과의 상관 계수를 연산하는 연산 수단과,
    상기 연산 수단이 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비교 수단과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 수단을 구비하는 것을 특징으로 하는 정보 처리 장치.
  9. 제8항에 있어서, 상기 검색 조건은 블럭마다의 스펙트럼 계수의 평균치인 것을 특징으로 하는 정보 처리 장치.
  10. 제8항에 있어서, 상기 검색 조건은 주파수 대역마다의 스펙트럼 계수치인 것을 특징으로 하는 정보 처리 장치.
  11. 제8항에 있어서, 상기 검색 조건은 블럭마다의 어택 정보인 것을 특징으로 하는 정보 처리 장치.
  12. 제8항에 있어서, 상기 검색 조건은 주파수 대역마다의 어택 정보인 것을 특징으로 하는 정보 처리 장치.
  13. 신호 특성이 계층적으로 기록되어 있는 AV 데이타를 검색하는 정보 처리 방법에 있어서,
    검색 조건을 접수하는 접수 스텝과,
    상기 접수 스텝에서 접수한 검색 조건에 대응하여 상기 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 스텝과,
    상기 접수 스텝에서 접수한 검색 조건과 상기 추출 스텝에서 추출한 신호 특성과의 상관 계수를 연산하는 연산 스텝과,
    상기 연산 스텝에서 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비 교 스텝과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 스텝을 포함하는 것을 특징으로 하는 정보 처리 방법.
  14. 신호 특성이 계층적으로 기록되어 있는 AV 데이타를 검색하는 정보 처리 장치에,
    검색 조건을 접수하는 접수 스텝과,
    상기 접수 스텝에서 접수한 검색 조건에 대응하여 상기 신호 특성이 계층적으로 기록되어 있는 AV 데이타로부터 신호 특성의 일부를 추출하는 추출 스텝과,
    상기 접수 스텝에서 접수한 검색 조건과 상기 추출 스텝에서 추출한 신호 특성과의 상관 계수를 연산하는 연산 스텝과,
    상기 연산 스텝에서 연산한 상기 상관 계수를 소정의 임계치와 비교하는 비교 스텝과,
    상기 검색 조건 또는 상기 임계치를 증가시키는 증가 스텝을 포함하는 처리를 실행시키는 컴퓨터가 판독 가능한 프로그램을 제공하는 것을 특징으로 하는 제공 매체.
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
KR19990040891A 1998-09-24 1999-09-22 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체 KR100661040B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP26911498A JP2000101439A (ja) 1998-09-24 1998-09-24 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
JP1998-269114 1998-09-24

Publications (2)

Publication Number Publication Date
KR20000023379A KR20000023379A (ko) 2000-04-25
KR100661040B1 true KR100661040B1 (ko) 2006-12-26

Family

ID=17467878

Family Applications (1)

Application Number Title Priority Date Filing Date
KR19990040891A KR100661040B1 (ko) 1998-09-24 1999-09-22 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체

Country Status (4)

Country Link
US (1) US6532445B1 (ko)
EP (1) EP0989754A2 (ko)
JP (1) JP2000101439A (ko)
KR (1) KR100661040B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220110909A (ko) * 2021-02-01 2022-08-09 인하대학교 산학협력단 검색량 데이터와 var 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711558B1 (en) 2000-04-07 2004-03-23 Washington University Associative database scanning and information retrieval
JP4053424B2 (ja) * 2001-01-17 2008-02-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ロバスト・チェックサム
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
JP4506004B2 (ja) * 2001-03-01 2010-07-21 ソニー株式会社 音楽認識装置
JP2002304185A (ja) * 2001-04-04 2002-10-18 Video Research:Kk 著作権管理システム、著作権管理方法及びプログラム
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
JP2003143015A (ja) * 2001-11-07 2003-05-16 Sony Corp 信号処理方法及び装置並びに符号列生成方法及び装置
AU2004290281A1 (en) 2003-05-23 2005-05-26 Washington University Intelligent data storage and processing using FPGA devices
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
US7770014B2 (en) 2004-04-30 2010-08-03 Microsoft Corporation Randomized signal transforms and their applications
CN1707612B (zh) * 2004-06-08 2010-11-17 深圳市朗科科技有限公司 一种视听播放装置及其播放方法
US7917299B2 (en) 2005-03-03 2011-03-29 Washington University Method and apparatus for performing similarity searching on a data stream with respect to a query string
JP2007206037A (ja) * 2006-02-06 2007-08-16 Nippon Telegr & Teleph Corp <Ntt> 信号測定分析装置
JP4841276B2 (ja) * 2006-03-22 2011-12-21 三洋電機株式会社 音楽信号蓄積装置および音楽信号蓄積プログラム
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
JP2009058548A (ja) * 2007-08-30 2009-03-19 Oki Electric Ind Co Ltd 音声検索装置
JP5311348B2 (ja) * 2009-09-03 2013-10-09 株式会社eVOICE 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
JP5604275B2 (ja) * 2010-12-02 2014-10-08 富士通テン株式会社 相関低減方法、音声信号変換装置および音響再生装置
JP5898534B2 (ja) * 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法
US9641892B2 (en) 2014-07-15 2017-05-02 The Nielsen Company (Us), Llc Frequency band selection and processing techniques for media source detection
CN105139863B (zh) * 2015-06-26 2020-07-21 司法鉴定科学研究院 一种音频频域连续性图谱计算方法
CN105100363A (zh) * 2015-06-29 2015-11-25 小米科技有限责任公司 信息处理方法、装置及终端
EP3560135A4 (en) 2016-12-22 2020-08-05 IP Reservoir, LLC PIPELINES INTENDED FOR AUTOMATIC ACCELERATED LEARNING BY EQUIPMENT
WO2019183543A1 (en) 2018-03-23 2019-09-26 John Rankin System and method for identifying a speaker's community of origin from a sound sample
WO2020014354A1 (en) * 2018-07-10 2020-01-16 John Rankin System and method for indexing sound fragments containing speech
CN111191671B (zh) * 2019-11-18 2023-11-14 广东浩迪智云技术有限公司 一种用电器波形检测方法、系统、电子设备及存储介质
US11699037B2 (en) 2020-03-09 2023-07-11 Rankin Labs, Llc Systems and methods for morpheme reflective engagement response for revision and transmission of a recording to a target individual

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5042069A (en) * 1989-04-18 1991-08-20 Pacific Communications Sciences, Inc. Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
JPH03285190A (ja) * 1990-03-30 1991-12-16 Toppan Printing Co Ltd 音源検出装置
JPH07298271A (ja) * 1994-04-28 1995-11-10 Matsushita Electric Ind Co Ltd 動画像符号化における動きベクトル検出方法及び装置
KR970078662A (ko) * 1996-05-27 1997-12-12 우메즈 쥰이찌로우 복호화없이 부호화된 영상 데이터에서 캡션을 검출하기 위한 구조
KR980004012A (ko) * 1996-03-08 1998-03-30 모리시다 요이치 오디오 비쥬얼 데이터를 부정 복사로부터 보호하면서 재생하는데 적합한 마이크로 프로세서 및 그것을 이용한 영상 정보 처리 시스템
KR19980071844A (ko) * 1997-02-27 1998-10-26 모리시타 요우이치 오브젝트 데이터 처리 장치, 오브젝트 데이터 기록 장치, 데이터 기억 매체 및 전송용 데이터 구조
KR19980081208A (ko) * 1997-03-31 1998-11-25 이데이노부유키 부호화 방법 및 장치와 복호화 방법 및 장치와 기록 매체

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55158715A (en) 1979-05-29 1980-12-10 Sony Corp Gain control circuit
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3134337B2 (ja) 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5437050A (en) * 1992-11-09 1995-07-25 Lamb; Robert G. Method and apparatus for recognizing broadcast information using multi-frequency magnitude detection
JP3186292B2 (ja) 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3186307B2 (ja) 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
US5581654A (en) 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
JP3125543B2 (ja) 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
US5754127A (en) 1994-02-05 1998-05-19 Sony Corporation Information encoding method and apparatus, and information decoding method and apparatus
JP3186412B2 (ja) 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277692B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US5918222A (en) * 1995-03-17 1999-06-29 Kabushiki Kaisha Toshiba Information disclosing apparatus and multi-modal information input/output system
US6078915A (en) * 1995-11-22 2000-06-20 Fujitsu Limited Information processing system
JP3521596B2 (ja) 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
JPH1084284A (ja) 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
US6027026A (en) * 1997-09-18 2000-02-22 Husain; Abbas M. Digital audio recording with coordinated handwritten notes

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5042069A (en) * 1989-04-18 1991-08-20 Pacific Communications Sciences, Inc. Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
JPH03285190A (ja) * 1990-03-30 1991-12-16 Toppan Printing Co Ltd 音源検出装置
JPH07298271A (ja) * 1994-04-28 1995-11-10 Matsushita Electric Ind Co Ltd 動画像符号化における動きベクトル検出方法及び装置
KR980004012A (ko) * 1996-03-08 1998-03-30 모리시다 요이치 오디오 비쥬얼 데이터를 부정 복사로부터 보호하면서 재생하는데 적합한 마이크로 프로세서 및 그것을 이용한 영상 정보 처리 시스템
KR970078662A (ko) * 1996-05-27 1997-12-12 우메즈 쥰이찌로우 복호화없이 부호화된 영상 데이터에서 캡션을 검출하기 위한 구조
KR19980071844A (ko) * 1997-02-27 1998-10-26 모리시타 요우이치 오브젝트 데이터 처리 장치, 오브젝트 데이터 기록 장치, 데이터 기억 매체 및 전송용 데이터 구조
KR19980081208A (ko) * 1997-03-31 1998-11-25 이데이노부유키 부호화 방법 및 장치와 복호화 방법 및 장치와 기록 매체

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220110909A (ko) * 2021-02-01 2022-08-09 인하대학교 산학협력단 검색량 데이터와 var 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법
KR102550687B1 (ko) * 2021-02-01 2023-07-03 인하대학교 산학협력단 검색량 데이터와 var 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법

Also Published As

Publication number Publication date
US6532445B1 (en) 2003-03-11
KR20000023379A (ko) 2000-04-25
EP0989754A2 (en) 2000-03-29
JP2000101439A (ja) 2000-04-07

Similar Documents

Publication Publication Date Title
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
KR100896737B1 (ko) 오디오 신호의 견고한 분류를 위한 장치 및 방법, 오디오신호 데이터베이스를 설정 및 운영하는 방법, 및 컴퓨터프로그램
KR100958144B1 (ko) 오디오 압축
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US8612215B2 (en) Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same
EP1667112B1 (en) Apparatus, method and medium for coding an audio signal using correlation between frequency bands
EP1998321B1 (en) Method and apparatus for encoding/decoding a digital signal
US10089994B1 (en) Acoustic fingerprint extraction and matching
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US20060212290A1 (en) Audio coding apparatus and audio decoding apparatus
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
US20040002854A1 (en) Audio coding method and apparatus using harmonic extraction
US7747435B2 (en) Information retrieving method and apparatus
US6772113B1 (en) Data processing apparatus for processing sound data, a data processing method for processing sound data, a program providing medium for processing sound data, and a recording medium for processing sound data
US20050254586A1 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
Joseph et al. Wavelet energy based voice activity detection and adaptive thresholding for efficient speech coding
US8301284B2 (en) Feature extraction apparatus, feature extraction method, and program thereof
US20030149559A1 (en) Audio coding and transcoding using perceptual distortion templates
US6750789B2 (en) Device and method for determining a coding block raster of a decoded signal
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JPH09230898A (ja) 音響信号変換符号化方法及び復号化方法
US20020095297A1 (en) Device and method for processing audio information
KR20050085761A (ko) 오디오 인코딩에서의 사인곡선 선택
Ruiz et al. Algorithm for achieving adaptive tiling of time axis for audio coding purposes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111213

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee