KR102118411B1 - 원신호 분리 시스템 및 방법 - Google Patents

원신호 분리 시스템 및 방법 Download PDF

Info

Publication number
KR102118411B1
KR102118411B1 KR1020147033692A KR20147033692A KR102118411B1 KR 102118411 B1 KR102118411 B1 KR 102118411B1 KR 1020147033692 A KR1020147033692 A KR 1020147033692A KR 20147033692 A KR20147033692 A KR 20147033692A KR 102118411 B1 KR102118411 B1 KR 102118411B1
Authority
KR
South Korea
Prior art keywords
signal
frequency
window
oscillator
amplitude
Prior art date
Application number
KR1020147033692A
Other languages
English (en)
Other versions
KR20150021508A (ko
Inventor
케빈 엠. 쇼트
브라이언 티. 혼
Original Assignee
액스모스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 액스모스 인코포레이티드 filed Critical 액스모스 인코포레이티드
Publication of KR20150021508A publication Critical patent/KR20150021508A/ko
Application granted granted Critical
Publication of KR102118411B1 publication Critical patent/KR102118411B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/66Radar-tracking systems; Analogous systems
    • G01S13/72Radar-tracking systems; Analogous systems for two-dimensional tracking, e.g. combination of angle and range tracking, track-while-scan radar
    • G01S13/723Radar-tracking systems; Analogous systems for two-dimensional tracking, e.g. combination of angle and range tracking, track-while-scan radar by using numerical data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/02Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
    • G01S3/74Multi-channel systems specially adapted for direction-finding, i.e. having a single antenna system capable of giving simultaneous indications of the directions of different signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/8006Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/28Details of pulse systems
    • G01S7/285Receivers
    • G01S7/288Coherent receivers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • G06F16/636Filtering based on additional data, e.g. user or group profiles by using biological or physiological data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/89Radar or analogous systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/02Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/28Details of pulse systems
    • G01S7/285Receivers
    • G01S7/288Coherent receivers
    • G01S7/2883Coherent receivers using FFT processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Abstract

신호를 처리하는 방법으로서, 복수의 원신호 방출기로부터 형성되고 오리지널 영역으로 표현된 신호를 취하는 단계, 상기 신호를 대체 영역의 복수의 구성요소의 수학적 표현으로 분해하는 단계, 상기 구성요소의 적어도 하나의 부분집합을 상기 복수의 원신호 방출기의 적어도 하나와 연관시키기 위해 상기 복수의 구성요소를 분석하는 단계, 상기 연관에 기초하여 상기 구성요소의 적어도 하나의 부분집합을 분리하는 단계, 및 상기 오리지널 영역, 상기 대체 영역 및 다른 영역중 적어도 하나에서 출력 신호를 생성하도록 구성요소의 적어도 하나의 부분집합을 복원하는 단계를 포함하는 신호 처리 방법.

Description

원신호 분리 시스템 및 방법{SYSTEMS AND METHODS FOR SOURCE SIGNAL SEPARATION}
본 발명은 신호 처리를 위한 방법 및 시스템에 관한 것이고, 보다 구체적으로, 신호를 상이한 성분으로 분리하기 위한 방법 및 시스템에 관한 것이다.
신호 분리(SS)는 개별적인 구성요소를 부분적으로 또는 전체적으로 분해하거나 분리하거나, 추출하거나 강화하거나 복원할 수 있도록, 소스로부터 나온 임의의 디지털 신호를 그 개별적인 구성요소로 분리하는 것이다. SS는 청각 데이터 및/또는 시각 데이터 또는 이미지를 포함하는 임의의 형태의 데이터에 실행될 수 있다. SS는 주요 성분 분석, 단일 값 분해, 공간 패턴 분석, 독립 성분 분석(ICA), 청각장면분석(computational auditory scene analysis, CASA) 또는 임의의 다른 이러한 기술을 사용하여 실행될 수 있다.
종래의 SS 기술은 보통 실시간 또는 근 실시간 실행을 위해 엄청난 양의 처리량을 필요로 하여서 상당히 자주, 주어진 신호에서 신호원을 효과적으로 식별하고 분리할 수 없다. 따라서, 실시간 또는 근 실시간 신호 분리를 제공하는 이러한 시스템을 동작시키기 위한 시스템 및 알고리즘이 필요하다.
여기에 개시된 다양한 실시예에 따른 SS를 위한 방법 및 시스템은 소스에 관계없이 사용가능하다. 오리지널 신호의 특성은 일반적으로 생성 방법 또는 장치에 대해 무관하다. SS 시스템 및 방법이 적용될 수 있는 신호원은 소리, 오디오, 비디오, 사진, (진료를 포함하는) 이미징, 통신, 광원, 무선, 레이더, 소나, 센서 및 지진파 소스를 포함하지만 이에 제한되는 것은 아니다. 여기에 기술된 방법 및 시스템은 신호 분리를 위한 소스에 관계없이 사용가능한 시스템 및 방법의 세트를 포함할 수 있다. 이것은 신호의 구성 부분을 수학적으로 기술하는 고해상 신호 처리의 방법, "코히어런트"한, 즉, 동일한 소스로부터 나오는 신호의 부분을 식별하는 추적 및 분할의 방법, 및 선택된 부분을 옵션으로 오리지널 신호 포맷으로 재결합하고, 및/또는 이들을 음성 인식 시스템과 같은 다른 적용에 직접 전송하는 방법을 포함한다.
비제한의 실시예에 따라, 신호를 처리하는 방법은 복수의 원신호 방출기로부터 형성되고 오리지널 영역으로 표현된 신호를 취하는 단계; 상기 신호를 대체 영역의 복수의 구성요소의 수학적 표현으로 분해하는 단계; 상기 구성요소의 적어도 하나의 부분집합을 상기 복수의 원신호 방출기의 적어도 하나와 연관시키기 위해 상기 복수의 구성요소를 분석하는 단계; 상기 연관에 기초하여 상기 구성요소의 적어도 하나의 부분집합을 분리하는 단계; 및 상기 오리지널 영역, 상기 대체 영역 및 다른 영역중 적어도 하나에서 출력 신호를 생성하도록 구성요소의 적어도 하나의 부분집합을 복원하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 포함하는 입력 신호를 수신하고 상기 시간 영역 신호 스트림으로부터 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우드 데이터 세트의 시작이 상기 제1 윈도우드 데이터 세트의 시작에 대해 시간 지연되어 있는 단계; 상기 제1 윈도우드 데이터 세트 및 상기 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계; 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역에 복소 스펙트럼 위상 에볼루션(Complex Spectral Phase Evolution, CSPE)을 행하는 단계; 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나와 맞는 주파수 영역 고해상 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계; 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 하나 이상의 오실레이터 피크로 구성된 적어도 하나의 트래클렛(tracklet)을 식별하기 위해 추적 알고리즘을 사용하는 단계; 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계; 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 시간 영역 신호 스트림으로부터 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우드 데이터 세트의 시작이 상기 제1 윈도우드 데이터 세트의 시작에 대해 시간 지연되어 있는 단계; 상기 제1 윈도우드 데이터 세트 및 상기 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계; 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 윈도우 및 제2 윈도우의 성분 주파수를 추정하기 위해 상기 주파수 영역에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계; 상기 CSPE에서 추정된 성분 주파수를 사용하여, 상기 기초 신호 오실레이터의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나와 맞는 고해상 주파수 영역 윈도우를 선택하기 위해 싱글렛 변환 프로세스에서, 저장된 고해상 주파수 영역 윈도우의 세트를 샘플링하는 단계; 상기 주파수 영역에서 FM 생성 및 AM 생성중 적어도 하나를 위해 필요한 파라미터를 저장하는 단계로서, 상기 FM 생성을 위한 파라미터는 진폭, 위상 기준 주파수, 및 변조율을 포함하고, 상기 AM 생성을 위한 파라미터는 진폭, 위상, 주파수 및 진폭 포락선 변조를 포함하는 단계; 및 FM 변조 오실레이터 피크 및 AM 변조 오실레이터 피크중 적어도 하나를 위한 주파수 스펙트럼을 재생성하는 단계로서, 상기 주파수 스펙트럼은 데이터 샘플 윈도우 내의 임의의 포인트에서 오실레이터가 턴온 또는 턴오프할 수 있는 임의의 과도 효과를 포함하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은 어느 정도 서로 간섭할 수 있는 복수의 신호 스트림을 수신하고 제1 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계로서, 제2 세트의 시작이 제1 세트의 시작 보다 지연되는 단계, 이러한 입력 샘플 윈도우 양측 모두를 시간 영역으로부터 주파수 영역으로 전환하는 단계로서, 최종 주파수 영역 데이터는 기본 변환 해상을 갖고 있는 단계, 기본 변환 해상 보다 큰 해상도에서 제1 및 제2 데이터 세트의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적절한 인자에 의해 적절하게 곱해질 때 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호에서 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계, 잡음 또는 간섭 신호와 연관될 가능성이 높은 트래클렛을 거부하는 단계, 트래클렛의 적어도 하나의 그룹핑을 선택하는 단계, 상기 선택된 트래클렛의 그룹핑으로부터 신호를 복원하는 단계 및 상기 선택된 그룹핑을 사용하여 희망의 포맷으로 출력을 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은 복수의 원신호 방출기로부터 형성되고 오리지널 영역에서 표현된 오리지널 신호를 취하는 단계, 상기 신호를 대안의 영역의 복수의 구성 요소의 수학적 표현으로 분해하는 단계, 상기 구성 요소의 적어도 하나의 부분집합을 상기 복수의 원신호 방출기의 적어도 하나와 연관시키기 위해 상기 복수의 구성요소를 분석하는 단계, 상기 연관에 기초하여 상기 구성요소를 분리하는 단계 및 상기 오리지널 입력 신호의 포맷으로 출력 신호로서 사용되기 위해 적어도 하나의 희망의 신호원에 상응하는 오리지널 입력 신호의 구성요소를 보존하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은, 복수의 원신호 방출기로부터 형성되고 오리지널 변환 영역에서 표현된 신호를 취하는 단계, 상기 신호를 대안의 영역의 복수의 구성요소의 수학적 표현으로 변환하는 단계, 상기 오리지널 변환 영역의 해상도 보다 큰 해상도에서 구성요소 특성을 추정하기 위해, 결합된 대안의 영역 데이터에 복소 스펙트럼 위상 에볼루선(CSPE)을 행하는 단계, 상기 구성요소의 적어도 하나의 부분집합을 상기 복수의 원신호 방출기의 적어도 하나와 연관시키기 위해 상기 복수의 구성요소를 분석하는 단계, 상기 연관에 기초하여 상기 구성요소의 적어도 하나의 부분집합을 분리하는 단계 및 상기 오리지널 영역, 대안의 영역 및 다른 영역의 적어도 하나에서 적어도 하나의 희망의 원신호 방출기로부터의 출력을 포함하는 출력 신호를 생성하기 위해 구성요소의 적어도 하나의 부분집합을 복원하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 입력 신호의 성분을 분리하는 방법은 어느 정도 서로 간섭하는 복수의 원신호 방출기로부터 형성되고 오리지널 영역에서 표현된 신호를 취하는 단계, 상기 신호를 대안의 영역의 복수의 구성요소의 표현으로 분해하는 단계, 위상, 주파수, 진폭 및 방향 정보의 표현을 허용하는 통합 영역 데이터 구조로 상기 분해된 신호를 표현하는 단계, 상기 복수의 원신호 방출기의 적어도 하나와 상기 구성요소의 적어도 하나의 부분집합을 연관시키기 위해 상기 복수의 구성요소를 분석하는 단계로서, 상기 분석은 상기 연관을 돕기 위해, 통합 영역 방향성 추정값의 사용을 포함하는 단계, 상기 연관에 기초하여 상기 구성요소의 적어도 하나의 부분집합을 분리하는 단계 및 희망의 포맷으로 적어도 하나의 희망의 원신호 방출기로부터의 출력을 포함하는 출력 신호를 생성하기 위해 구성요소의 적어도 하나의 부분집합을 복원하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 이러한 신호 스트림으로부터 제1 윈도우 및 제2 윈도우를 생성하는 단계로서, 상기 제2 윈도우의 시작이 상기 제1 윈도우의 시작 보다 지연되는 단계, 상기 윈도우의 적어도 하나를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 제1 및 제2 윈도우의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 기초 신호 오실레이터의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 주파수 영역 윈도우를 선택하기 위해 싱글렛 변환 프로세스에서, 저장된 고해상 주파수 영역 윈도우의 세트를 샘플링하는 단계, 주파수 영역에서 FM 생성 및 AM 생성중 적어도 하나에 필요한 파라미터를 저장하는 단계로서, 상기 FM 생성을 위한 파라미터는 진폭, 위상, 기준 주파수, 및 변조율을 포함하고 AM 생성에 필요한 파라미터는 진폭, 위상, 주파수, 및 진폭 포락선 정보를 포함하는 단계 및 FM 변조 오실레이터 피크 및 AM 변조 오실레이터 피크중 적어도 하나를 위한 주파수 스펙트럼을 재생성하는 단계로서, 상기 주파수 스펙트럼은 데이터 샘플 윈도우 내의 임의의 포인트에서 오실레이터가 턴온 또는 턴오프할 수 있는 임의의 과도 효과를 포함하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호 변조를 검출하기 위한 방법은 변조된 오실레이터를 생성하기 위해 안정 오실레이터에 적용될 수 있는 실수부 및 허수부를 갖고 있는 변조 복소 연산자의 세트를 제공하는 단계, 오실레이터에 대한 변조 효과를 해소할 수 있는 풀백(pullback) 연산자로서 알려진 추가 세트의 연산자를 제공하는 단계, 변조된 신호가 시간 영역으로부터 주파수 영역으로 변환될 때 변조 효과의 적어도 일부가 해소되도록 풀백 연산자를 변조된 신호에 적용하는 단계, 시간 지연된 윈도우 데이터 세트에 풀백 연산자를 적용하여 변조 효과가 시간 지연된 샘플 윈도우에서 해소되어서 초기 샘플 윈도우의 변환에 비교될 수 있는 상태로 반전되는 단계 및 변조된 신호의 주파수 변조를 위한 기초 기준 주파수를 드러내는 초해상 변환 표현을 유도하도록, 변환된 초기 및 풀백 시간 지연된 샘플 윈도 데이터를 비교하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은 어느 정도 서로 간섭하는 복수의 신호 스트림을 수신하고 제1 및 제2 세트의 입력 샘플을 생성하는 단계로서 제2 세트의 시작은 제1 세트의 시작에 대해 시간 지연되어 있는 단계, 제1 및 제2 세트의 입력 샘플 윈도우를 시간 영역으로부터 주파수 영역으로 전환하는 단계로서, 최종 주파수 영역 데이터는 기본 변환 해상도를 갖는 단계, 기본 변환 해상도 보다 큰 해상도에서 제1 및 제2 데이터 세트의 성분 주파수를 추정하기 위해 주파수 영역 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계로서, 상기 CSPE는 가변 길이의 윈도우 크기를 사용하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 복수의 오실레이터 피크를 포함하는 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 제1 윈도우 길이의 고해상 윈도우를 선택하기 위해, 저장된 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계, 잡음 또는 간섭 신호와 연관될 가능성이 높은 트래클렛을 거부하는 단계, 트래클렛의 적어도 하나의 그룹핑을 선택하는 단계, 상기 선택된 트래클렛의 그룹핑으로부터 신호를 복원하는 단계로서 이러한 복원은 상기 CSPE에서 분석된 제1 윈도우 길이와 옵션으로 상이한 희망의 길이의 윈도우를 사용하는 단계 및 상기 선택된 그룹핑을 사용하여 희망의 포맷으로 출력을 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 제1 윈도우 및 제2 윈도우를 생성하는 단계로서, 상기 제2 윈도우의 시작은 제1 윈도우의 시작보다 시간 지연되어 있는 단계, 상기 제1 윈도우 및 제2 윈도우를 주파수 영역으로 전환하고 기본 변환 해상도를 갖는 최종 주파수 영역 데이터를 저장하는 단계, 상기 기본 변환 해상도보다 큰 해상도에서 윈도우드 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 성분 주파수를 사용하여, 복수의 오실레이터 피크를 포함하는, 상기 기초 신호의 성분의 변조에 맞을 수 있는 주파수 영역 고해상 윈도우를 선택하도록, 저장된 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계 및 오실레이터의 변조의 추정값을 제공하는 것을 돕기 위해, 오실레이터 피크가 연관된 트래클렛의 성질로부터의 정보를 사용하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 신호를 처리하는 방법은 일련의 윈도우의 데이터 내의 초해상 주파수 정보를 분석하는 단계, 상기 초해상 주파수 정보를 데이터의 윈도우에 대한 상응한 위상 정보와 결합하는 단계, 시간의 전 또는 후방향으로 경과되는 윈도우에 대한 신호의 주파수 또는 위상을 예측하기 위해 데이터의 윈도우에 대해 신호의 에볼루션을 모델화하는 단계, 상기 모델 예측에 포함되지 않은 임의의 세트의 주파수 및 위상에 대한 예측 값을 예측하기 위해 신호 주파수 또는 위상의 임의의 조합을 사용하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 오리지널 신호의 무손실 표현을 생성하기 위해, 신호의 분해된 요소가 재결합될 수 있는 방식으로 신호의 수학적 분해를 생성하도록 신호를 처리하는 방법은 단기 안정 오실레이터, 주파수 변조 오실레이터 및 진폭 변조 오실레이터를 사용하여 생성된 오실레이터의 합을 사용하여 데이터 윈도우 내의 신호의 모델을 생성하는 단계, 희망의 정도의 정밀도가 달성되어 남아 있는 모두가 충분히 작은 잔류 신호가 될 때까지 오리지널 신호로부터 각 모델화된 신호 요소를 제거하는 단계, 잔류 신호가 정확하게 재생되도록 잔류 신호를 인코딩하는 단계 및 정확한 무손실 복원된 오리지널 신호로 재결합될 수 있도록 상기 인코딩된 잔류 신호와 함께 데이터의 모델화에 사용된 오실레이터 피크의 파라미터를 저장하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 제1 윈도우 및 제2 윈도우를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 시간 지연되어 있는 단계, 상기 제1 윈도우 및 제2 윈도우를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 윈도우드 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나와 맞는 주파수 영역 고해상 윈도우를 선택하기 위해, 저장된 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 하나 이상의 오실레이터 피크로 구성된 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 각각 상응하는 제1 세트 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 제1 세트의 입력 샘플 보다 시간 지연되어 있는 단계, 상기 제1 및 제2 세트의 입력 샘플 윈도우를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 입력 샘플 윈도우의 성분 주파수를 추정하기 위해 주파수 영역 데이터 세트에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수룰 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하도록, 저장된 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 하나 이상의 오실레이터 피크로 구성된 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 이러한 신호 스트림으로부터 제1 윈도우 및 제2 윈도우를 생성하는 단계로서, 제2 윈도우의 시작은 제1 윈도우의 시작 보다 시간 지연되어 있는 단계, 제1 및 제2 윈도우를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 제1 및 제2 윈도우의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 주파수 영역 윈도우를 선택하기 위해 저장된 고해상 주파수 영역 윈도우의 세트를 샘플링하고 상기 저장된 윈도우드 데이터 세트중 적어도 하나로부터 상기 추정된 성분의 효과를 제거하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 상응하는 입력 샘플의 세트를 각각 포함하는 제1 및 제2 윈도우를 생성하는 단계로서 상기 윈도우의 시작은 상기 제1 윈도우의 시작 보다 시간 지연되어 있는 단계, 상기 제1 및 제2 윈도우를 주파수 영역으로 전환하고 기본 변환 해상도를 갖는 최종 주파수 영역 데이터를 저장하는 단계, 통합 영역 표현에서 제1 세트 및 제2 세트의 주파수 영역 데이터를 각각 포함하는 복수의 채널을 표현하고 상기 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 보다 큰 해상도에서 실제 기초 주파수를 검출하기 위해 2개의 시간 분리된 샘플 윈도우 사이에 측정된 위상 회전을 사용하는 단계를 포함하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해, 저장된 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 오리지널 신호를 포함하는 시간 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 상기 오리지널 신호의 선택된 부분을 출력 신호로서 재생하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터, 상기 시간 영역에서 (분석 윈도우에 의해 곱해진) 제1 세트의 입력 샘플을 포함하는 제1 윈도우 및 상기 시간 영역에서 (분석 윈도우에 의해 곱해진) 제2 세트의 입력 샘플을 포함하는 제2 윈도우를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 입력 샘플 윈도우를 주파수 영역으로 전환하고 그 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역으로 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 컴퓨터 접근가능한 형태로 저장된 수학적 표현의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 분석 윈도우에 의해 곱해진 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 그 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 음성 처리 시스템에서 사용되도록 구성된 특성 벡터의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 상기 오리지널 신호의 선택된 부분을 출력 신호로서 재생하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 신호 스트림으로부터의 데이터를 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 그 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역으로 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 컴퓨터 접근가능한 형태로 저장된 수학적 표현의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 분석 윈도우에 의해 곱해진 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 그 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 음성 처리 시스템에서 사용되도록 구성된 특성 벡터의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우 데이터 세트 및 제2 윈도우 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 신호원으로부터 나오는 트래클렛을 그룹화하는 단계 및 상기 오리지널 신호의 선택된 부분을 출력 신호로서 재생하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 그 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역으로 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 신호원으로부터 나오는 트래클렛을 그룹화하는 단계 및 컴퓨터 접근가능한 형태로 저장된 수학적 표현의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 분석 윈도우에 의해 곱해진 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 그 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 신호원으로부터 나오는 트래클렛을 그룹화하는 단계 및 음성 처리 시스템에서 사용되도록 구성된 특성 벡터의 형태로 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 통합 영역 표현에서 제1 세트 및 제2 세트의 주파수 영역 데이터를 포함하는 제1 윈도우 및 제2 윈도우를 각각 포함하는 복수의 채널을 표현하고 상기 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 보다 큰 해상도에서 실제 기초 주파수를 검출하기 위해 2개의 시간 분리된 샘플 윈도우 사이에 측정된 위상 회전을 사용하는 단계를 포함하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 오디오 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 분석 윈도우에 의해 곱해진 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 그 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계 및 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 비디오 신호를 처리하는 방법은 디지털 이미지 또는 비디오 프레임의 행 또는 열을 스캔함으로써 생성될 수 있는 것과 같은 시간 영역 신호 스트림을 수신하고 옵션으로 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계 및 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 분석 윈도우에 의해 곱해진 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 그 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상도 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 비디오 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계를 포함하고, 상기 추적 알고리즘은 신호의 오실레이터 성분의 움직임을 예측하기 위해 상기 CSPE로부터의 정보를 사용한다.
다른 비제한의 실시예에 따라, 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계 및 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 비디오 신호를 처리하는 방법은 디지털 이미지 또는 비디오 프레임의 행 또는 열을 스캔함으로써 생성될 수 있는 것과 같은 시간 영역 신호 스트림을 수신하고 옵션으로 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 각각 상응하는 제1 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계를 포함하고, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작 보다 시간 지연되어 있다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계 및 상기 CSPE에서 추정된 성분 주파수를 사용하여, 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록, 저장된 고해상 윈도우의 세트를 샘플링하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하고 윈도우드 데이터 세트 내의 하나 이상의 오실레이터 피크에서 추정된 주파수 변조를 결정하는 단계, 샘플 데이터에 복수의 주파수 변조 풀백 연산자(FMPO)를 적용하는 단계, 기초 신호 성분의 주파수 변조의 향상된 추정값을 제공하기 위해 비선형 보간법, 선형 보간법, 및 외간법을 최종 데이터에 적용하는 단계, 및 상기 향상된 추정값을 추가 수정된 고해상 윈도우 데이터 세트에 저장하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하고 상기 기초 신호를 복수의 별개의 소스중 하나에 각각 상응하는 복수의 신호 성분으로 분리하는 단계, 상기 복수의 신호 성분을 가장 잘 나타내는 단일 합쳐진 신호를 복원하는 단계, 및 상기 합쳐진 신호를 출력으로서 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하고 상기 기초 신호를 복수의 별개의 소스중 하나에 각각 상응하는 복수의 신호 성분으로 분리하는 단계, 상기 복수의 신호 성분을 가장 잘 나타내는 단일 합쳐진 신호를 복원하는 단계, 및 상기 합쳐진 신호를 출력으로서 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하고 상기 기초 신호를 복수의 별개의 소스중 하나에 각각 상응하는 복수의 신호 성분으로 분리하는 단계, 상기 복수의 신호 성분을 가장 잘 나타내는 단일 합쳐진 신호를 복원하는 단계, 및 상기 합쳐진 신호를 출력으로서 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 영역 신호 스트림을 수신하고 분석 윈도우에 의해 곱해진 상기 신호 스트림으로부터의 샘플을 포함하는 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우의 시작은 상기 제1 윈도우의 시작 보다 지연되어 있는 단계, 상기 제1 및 제2 윈도우 데이터 세트를 주파수 영역으로 전환하고 최종 결과를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계, 상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하도록 주파수 영역 고해상 윈도우의 세트를 샘플링하고 상기 저장된 윈도우드 데이터 세트중 적어도 하나로부터 상기 추정된 성분의 효과를 제거하는 단계, 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계로서, 상기 추적 알고리즘은 신호의 오실레이터 성분의 움직임을 예측하기 위해 CSPE로부터의 정보를 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계로서, 이러한 그룹화는 트래클렛의 선택, 삭제 및 연관중 적어도 하나를 가능하게 하는 그래피컬 사용자 인터페이스에 표시되는 복수의 트래클렛의 시각 표현에 의해 지원되는 단계 및 출력 신호를 제공하는 단계를 포함하고, 상기 제1 및 제2 세트의 입력 샘플을 전환하는 단계는 상기 제1 및 제2 세트의 입력 샘플을 이산 푸리에 변환(DFT) 및 고속 푸리에 변환(FFT), 및 임의의 관련된 변환중 하나를 사용하여 주파수 영역으로 전환하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 각각 상응하는 제1 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작에 대해 시간 지연되어 있는 단계를 포함하고, 상기 제1 및 제2 세트의 입력 샘플을 전환하는 단계는 상기 제1 및 제2 세트의 입력 샘플을 이산 푸리에 변환(DFT) 및 고속 푸리에 변환(FFT)중 적어도 하나를 사용하여 주파수 영역으로 전환하는 단계를 포함하고, 상기 제1 세트의 샘플 및 제2 세트의 입력 샘플을 분석 윈도우에 의해 곱하는 단계, 상기 제1 및 제2 입력 샘플 윈도우를 주파수 영역으로 전환하는 단계, 상기 전환된 윈도우를 진폭 효과 및 주파수 효과중 적어도 하나를 추가함으로써 수정하는 단계, 및 최종 수정된 윈도우 데이터 세트를 저장하는 단계, 통합 영역 표현에서 제1 세트 및 제2 세트의 주파수 영역 데이터를 각각 포함하는 복수의 채널을 표현하고 상기 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 보다 큰 해상도에서 실제 기초 주파수를 검출하기 위해 2개의 시간 분리된 샘플 윈도우 사이에 측정된 위상 회전을 사용하는 단계를 포함하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조에 맞는 고해상 윈도우를 선택하도록 싱글렛 변환 프로세스에서, 저장된 고해상 윈도우의 세트를 샘플링하고 상기 저장된 윈도우드 데이터 세트중 적어도 하나로부터 상기 추정된 성분의 효과를 제거하는 단계, 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계로서, 상기 추적 알고리즘은 신호의 오실레이터 성분의 움직임을 예측하기 위해 CSPE로부터의 정보를 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계로서, 이러한 그룹화는 트래클렛의 선택, 삭제 및 연관중 적어도 하나를 가능하게 하는 그래피컬 사용자 인터페이스에 표시되는 복수의 트래클렛의 시각 표현에 의해 지원되는 단계 및 출력 신호를 제공하는 단계를 더 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 시간 영역 신호 스트림을 수신하고 상기 신호 스트림으로부터 시간 영역의 제1 세트의 입력 샘플 및 시간 영역의 제2 세트의 입력 샘플을 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작에 대해 시간 지연되어 있는 단계, 상기 제1 및 제2 입력 샘플 윈도우를 주파수 영역으로 전환하고 그 최종 변환된 윈도우드 데이터 세트를 분석을 위해 저장하는 단계, 상기 주파수 영역 데이터의 기본 전환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)를 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 적어도 하나의 오실레이터 피크를 포함하는 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해, 저장된 고해상 윈도우의 세트를 샘플링하는 단계, 저장된 고해상 윈도우 데이터 세트에서, 추정된 주파수 변조를 결정하는 단계, 복수의 주파수 변조 풀백 연산자(FMCO)를 동일한 데이터에 적용하는 단계, 기초 신호 성분의 주파수 변조의 향상된 추정값을 제공하기 위해 비선형 보간법, 선형 보간법, 및 외간법을 최종 데이터에 적용하는 단계, 및 상기 향상된 추정값을 추가 수정된 고해상 윈도우 데이터 세트에 저장하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계 및 출력 신호를 제공하는 단계를 포함한다.
다른 비제한의 실시예에 따라, 시간 영역 신호를 처리하는 방법은 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 각각 상응하는 제1 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작에 대해 시간 지연되어 있는 단계를 포함하고, 상기 제1 및 제2 세트의 입력 샘플을 전환하는 단계는 상기 제1 및 제2 세트의 입력 샘플을 이산 푸리에 변환(DFT) 및 고속 푸리에 변환(FFT) 또는 이산 코사인 변환 또는 다른 관련된 변환중 적어도 하나를 사용하여 주파수 영역으로 전환하는 단계를 포함하고, 상기 제1 세트의 샘플 및 제2 세트의 입력 샘플을 분석 윈도우에 의해 곱하는 단계, 상기 제1 및 제2 입력 샘플 윈도우를 주파수 영역으로 전환하는 단계, 상기 전환된 윈도우를 진폭 효과 및 주파수 효과중 적어도 하나를 추가함으로써 수정하는 단계, 및 최종 수정된 윈도우 데이터 세트를 저장하는 단계, 통합 영역 표현에서 제1 세트 및 제2 세트의 주파수 영역 데이터를 각각 포함하는 복수의 채널을 표현하고 상기 주파수 영역 데이터의 기본 변환 해상도 보다 큰 해상도에서 주파수 영역 데이터의 성분 주파수를 추정하기 위해 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계, 상기 보다 큰 해상도에서 실제 기초 주파수를 검출하기 위해 2개의 시간 분리된 샘플 윈도우 사이에 측정된 위상 회전을 사용하는 단계를 포함하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조에 맞는 고해상 윈도우를 선택하도록 싱글렛 변환 프로세스에서, 저장된 고해상 윈도우의 세트를 샘플링하고 상기 저장된 윈도우드 데이터 세트중 적어도 하나로부터 상기 추정된 성분의 효과를 제거하는 단계, 및 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계로서, 상기 추적 알고리즘은 신호의 오실레이터 성분의 움직임을 예측하기 위해 CSPE로부터의 정보를 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계로서, 이러한 그룹화는 트래클렛의 선택, 삭제 및 연관중 적어도 하나를 가능하게 하는 그래피컬 사용자 인터페이스에 표시되는 복수의 트래클렛의 시각 표현에 의해 지원되는 단계와 상기 기초 신호를 복수의 별개의 소스중 하나에 각각 상응하는 복수의 신호 성분으로 분리하는 단계. 및 상기 복수의 신호 성분을 가장 잘 나타내는 단일 합쳐진 신호를 옵션으로 복원하는 단계, 및 (옵션으로) 합쳐진 신호를 출력으로서 제공하는 단계를 더 포함한다.
비제한의 다른 실시예에 따라, 신호를 처리하는 방법은 상당한 양의 주변 잡음 또는 간섭 신호를 각각 포함하는 복수의 신호 스트림을 수신하고 상기 복수의 신호 스트림중 하나에 각각 상응하는 제1 및 제2 세트의 입력 샘플 윈도우를 생성하는 단계로서, 상기 제2 세트의 입력 샘플의 시작은 상기 제1 세트의 입력 샘플의 시작에 대해 시간 지연되어 있는 단계, 상기 제1 및 제2 샘플 윈도우를 분석 윈도우에 의해 곱하는 단계, 상기 제1 및 제2 입력 샘플 윈도우를 주파수 영역으로 전환하고 그 최종 데이터를 저장하는 단계, 기본 변환 해상도 보다 큰 해상도에서 상기 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계, 상기 CSPE에서 추정된 성분 주파수를 사용하여, 상기 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나에 맞는 고해상 윈도우를 선택하기 위해, 저장된 고해상 윈도우의 세트를 샘플링하는 단계, 상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 오실레이터 피크의 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계, 단일 소스로부터 나오는 트래클렛을 그룹화하는 단계, 잡음 또는 간섭 신호와 연관될 가능성이 높은 트래클렛을 거부하는 단계, 트래클렛의 적어도 하나의 그룹을 선택하는 단계, 트래클렛의 선택된 그룹으로부터 신호를 복원하는 단계 및 이러한 신호를 출력으로서 제공하는 단계를 포함한다.
반드시 일정한 비율로 도시되지 않은 도면에서, 동일한 숫자는 다수의 도면에서 실질상 유사한 구성요소를 가리킬 수 있다. 상이한 문자 접미사를 갖는 동일한 숫자는 실질상 유사한 구성요소의 상이한 경우를 나타낼 수 있다. 이러한 도면은 본원에 기술된 특정 실시예를 예로서 대략 설명하고 있는데, 본원은 이에 한정되지 않는다.
도 1은 비제한 실시예에 따른 신호 추출 프로세서의 도면이다.
도 2는 비제한 실시예에 따른 신호 추출 공정 단계를 설명하는 도면이다.
도 3은 비제한 실시예에 따른 단일 채널 프리프로세서를 사용하여 원신호를 사전처리하기 위한 방법을 설명하는 도면이다.
도 4는 비제한 실시예에 따른 신호 내의 주파수 변조를 검출하기 위해 단일 채널 프리프로세서를 사용하여 원신호를 사전처리하기 위한 방법을 도시한 도면이다.
도 5는 비제한 실시예에 따른 단일 채널 초해상 알고리즘을 도시하는 도면이다.
도 6은 비제한 실시예에 따른 신호 성분의 세트의 추출이 가능하도록 고정밀도의 주파수 및 AM 및 FM 변조를 발생하기 위한 방법을 도시하는 도면이다.
도 7은 비제한 실시예에 따른 통합 영역 초해상을 위한 방법예를 설명하는 도면이다.
도 8은 비제한 실시예에 따른 진폭 및 주파수 변조를 갖는 통합 영역 초해상을 위한 방법예를 설명하는 도면이다.
도 9은 비제한 실시예에 따른 FFT 스펙트럼의 그래픽 표현을 그래픽으로 도시한 도면이다.
도 10은 비제한 실시예에 따른 AM/FM 검출을 위한 고해상 윈도우를 생성하기 위한 방법예를 설명하는 도면이다.
도 11은 비제한 실시예에 따른 주파수 변조 검출을 위한 방법예를 설명하는 도면이다.
도 12는 비제한 실시예에 따른 변조 검출 판정 트리를 설명하는 도면이다.
도 13은 비제한 실시예에 따른 신호 성분 트래커에 의해 수행되는 방법예를 설명하는 도면이다.
도 14는 비제한 실시예에 따른 주파수 및 위상 예측을 사용할 수 있는 신호 성분 트래커에 의해 수행되는 방법예를 설명하는 도면이다.
도 15는 비제한 실시예에 따른 태블릿 또는 휴대폰에 대한 컴퓨터에 의해 생성된 인터페이스를 도시한 도면이다.
도 16은 비제한 실시예에 따른 트랙 에디터를 도시한 도면이다.
도 17은 비제한 실시예에 따른 트랙 에디터 하위 선택을 도시한 도면이다.
도 18은 비제한 실시예에 따른 트랙 에디터 데이터 비주얼라이저를 도시한 도면이다.
도 1은 원신호 분리를 위한 방법 100의 비제한 실시예를 도시한 도면이다. 예에서, 전형적인 입력 신호는 원신호(SS)가 소스에 관계없고 임의의 타입의 원신호에 대해 사용될 수 있도록 시스템으로의 입력으로 오디오 신호/소리를 포함하는 SS일 수 있다. 다른 전형적인 입력 신호가 주변 소리, 오디오, 비디오, 음성, 이미지, 통신, 지구 물리학, 소나(SONAR), 레이더(RADAR), 열, 옵티컬/광, 의료, 및 음악 신호를 포함할 수 있지만 이에 제한되는 것은 아니다. 방법 100은 SS를 분석하고, SS를 그 구성요소로 분리한 후 SS 신호를 전체 또는 부분적으로 재구성하기 위해 결합되거나 부분적으로 사용될 수 있는 하나 이상의 단계를 포함할 수 있다.
도 1에 도시된 바와 같이, 방법 100은 신호를 분리를 위해 신호를 처리하도록 단계 102에서 신호를 선택하도록 구성될 수 있다. 예에서, 인접한 샘플(여기에서, 시간에 따라 샘플의 윈도우를 나타낼 수 있는 "윈도우" 또는 "샘플 윈도우"로 부른다)이 분석을 위해 선택될 수 있다. 보통, 다수의 윈도우가 이들 사이에 작은 시간 지연을 갖고 선택될 수 있다. 또한, 단계 104에서, 방법 100은 도 1에 도시된 바와 같이 윈도우 B1과 같은 분석 윈도우에 의해 (즉, 인접 샘플의 형태로) SS를 곱하도록 구성될 수 있다. 이러한 분석 윈도우는 또한 여기에서 테이퍼로 부를 수 있다.
단계 108에서, HRW C1과 같은 고해상 윈도우(HRW)가 생성될 수 있다. 또한, 신호 준비에 사용된 분석 윈도우의 카피는 고해상 주파수 영역으로 전환되고 오실레이터 피크 분석을 위해 저장될 수 있다. 옵션으로, 진폭 및 주파수 변조 효과가 더해진 HRW의 세트가 저장될 수 있다. 단계 110에서, 주파수 영역 및 복소 스펙트럼 위상 에볼루션(CSPE) 고해상 주파수 추정값으로의 전환이 실행될 수 있다. 예에서, 시간-영역 윈도우는 고속 푸리에 변환(FFT), 이산 푸리에 변환(DFT), 이산 코사인 변환(DCT) 또는 다른 관련된 변환과 같은 변환을 통해 주파수 영역으로 전환된다. 종래에는 이러한 변환에 의해 생성된 주파수 추정값의 정밀도가 입력 샘플의 수에 의해 제한될 수 있다. CSPE 변환은 이러한 제한을 극복하고 매우 정확한 주파수 추정값 세트를 제공한다. 특히, CSPE 계산은 실제 기초가 되는 주파수를 검출하기 위해 2개의 시간상 분리된 샘플 윈도우의 변환 사이에 측정된 위상 회전을 사용한다.
단계 112에서, 방법 100은 싱글렛 변환 프로세스(Singlet Transform Process)를 통해 오실레이터 피크 파라미터를 식별하도록 구성될 수 있다. 구체적으로, CSPE 계산에 의해 제공되는 매우 정확한 주파수 추정값을 사용하여 기초 신호 성분의 진폭, 위상, 진폭 변조 및 주파수 변조를 추정하기 위해 가장 정확하게 맞는 고해상 윈도우(HRW)를 선택하도록 HRW가 샘플링된다. 일부 실시예에서, 근방의 오실레이터의 추정값이 보다 정확해질 수 있도록 이러한 성분의 효과가 제거될 수 있다. 이러한 싱글렛 변환 처리는 전체 오리지널 주파수 영역 신호 또는 그 일부를 생성하기 위해 역처리될 수 있다. 단계 114에서, 방법 100은 추적 및 그룹화를 수행하도록 구성될 수 있다. 예에서, 이러한 추적은 악기 또는 사람의 음성에 의해 생성된 단일 고조파와 같은, 추적 알고리즘을 사용하여 단일 오실레이터로부터 나올 수 있는 오실레이터 피크를 식별하도록 수행될 수 있다. 단일 소스로부터 나오는 것으로 판정된 오실레이터 피크의 세트는 트래클렛(tracklet)으로 부른다. 예에서, 그룹화는 단일 소스로부터 나오는 트래클렛을 식별하도록 수행될 수 있다. 예를 들어, 이러한 그룹화는 단일 악기 또는 사람의 음성의 다수의 고조파를 포함할 수 있다. 단일 소스로부터 나오는 것으로 판정된 트래클렛의 세트는 코히어런트 그룹(coherent group)으로 부른다.
단계 118에서, 오실레이터 피크는 싱글렛 변환 처리 이후의 임의의 단계에서 출력될 수 있다. 또한, 추적 및 그룹화 단계에서 수집된 정보는 바람직한 오실레이터 피크의 세트를 선택하도록 사용될 수 있다. 예에서, 일부 또는 모든 오실레이터 피크는 싱글렛 변환 처리를 사용하여 일부 또는 모든 오리지널 신호 포맷으로 정확하게 전환될 수 있다. 다른 예에서, 일부 또는 모든 오실레이터 피크는 음성 인식 시스템으로 입력으로서 사용될 수 있는 특성 벡터와 같은 다른 포맷으로 전환될 수 있거나 수학적 함수를 통해 직접 상이한 출력 포맷으로 더 변환될 수 있다. 상기 단계들은 임의의 타입의 신호를 분석하고, 분리하고 재구성하는데 사용될 수 있다. 이러한 시스템의 출력은 오리지널 신호와 동일한 형태를 가질 수 있거나 후속 분석을 위한 오리지널 신호의 수학적 표현의 형태를 가질 수 있다.
여기 상세한 설명에서 사용된 바와 같이, "주파수-위상 예측"은 오실레이터 피크로 구성된 트래클렛의 주파수 및 위상 에볼루션을 예측하기 위한 방법이다. 여기에서 사용된 바와 같이, "특성 벡터"는 신호로부터 측정된 데이터의 세트이다. 또한, 일반적으로 특성 벡터는 음성 인식 시스템으로의 입력으로서 사용된다. 여기에서 사용된 바와 같이, "윈도우드 변환"은 스펙트럼 피크를 상이하게 형성하기 위해 오리지널 샘플 윈도우를 "테이퍼" 또는 윈도우잉 함수(예를 들어, 해닝(Hanning), 해밍(Hamming), 박스카(boxcar), 트라이앵글(triangle), 바아틀레트(Bartlett), 블랙맨(Blackman), 체비쉐브(chebyshev), 가우시안(Gaussian) 등)에 의해 사전곱셈하는 것을 말한다. 여기에서 사용된 바와 같이, "국소(Short)"는 일반적으로, 국소 푸리에 변환(STFT, Short Time Fourier Transform)에서와 같이, 주어진 상황에 적절하고, 샘플링율에 따라, 수천 또는 수백의 샘플을 포함할 수 있는 유한 수의 샘플을 가리킨다. 예를 들어, 오디오 CD는 초 당 44100개의 샘플을 포함하여서 2048개의 샘플의 국소 윈도우가 여전히 1초의 약 1/20에 불과하다. 여기에서 사용되는 바와 같이, "트래클렛"은 트래커가 동일한 오실레이터로부터 나온 것으로 판정한 상이한 프레임으로부터의 오실레이터 피크를 가리킨다. 여기에서 사용된 바와 같이, "마할로노비스 거리(Mahalonobis Distance)"는 불확실한 측정값을 계산에 넣는 2개의 다차원 포인트 사이의 거리를 측정하기 위한 당업계에 주지된 알고리즘을 가리킨다. 이러한 알고리즘은 트래클렛 및 측정값이 동일한 소스 또는 동일한 트래클렛으로 조합되거나 할당되어야 하는 가능성을 결정하도록 추적 애플리케이션에서 널리 사용된다. 여기에서 사용된 바와 같이, "트래클렛 연관"은 어느 새로운 측정값이 어느 기존의 트래클렛과 결합되어야 하는지를 결정하기 위한 방법을 말한다. 여기에서 사용된 바와 같이, "그리디 어소시에이션(greedy association)"은 트래클렛 연관을 실행하기 위한 당업계에 공지된 알고리즘을 말한다. 여기에서 사용된 바와 같이, "파티셔닝"은 트래클렛을 별개의 그룹으로 분할하기 위한 방법을 말한다. 일반적으로 이러한 그룹은 말하는 사람과 같은 별개의 소리 방출기에 대응할 것이다. 여기에서 사용된 바와 같이, "유니온 파인드(union find)"는 파티셔닝을 위한 당업계에 공지된 알고리즘이다. 여기에서 사용된 바와 같이, "코히어런트 그룹"은 말하는 사람과 같은 동일한 신호 방출기로부터 나오는 것으로 판정된 트래클렛의 세트를 말한다. 여기에서 사용된 바와 같이, "멜 주파수 복소 계수(Mel Frequency Complex Coefficient)"는 음성 인식 시스템으로의 입력으로 널리 사용되는 특징의 주지된 타입이다.
하나 이상의 실시예에 따라, 여기에 개시된 SS에 대한 방법 및 시스템은 원신호를 복수의 신호 요소로 분리하는 것을 도울 수 있다. 여기에 개시된 방법 및 시스템은 원신호에서 개별적인 요소를 분리하고 강화하기 위해 전체적으로 또는 부분적으로 사용될 수 있다. 이러한 시스템 및 방법은 신호 분리를 위해 일반적으로 임의의 신호원에 적용될 수 있다.
하나 이상의 실시예에 따라, SS를 위한 방법 및 시스템은 신호 분리 및 강화를 수행하기 위해 부분적으로 또는 결합되어 사용될 수 있는 일련의 알고리즘의 실행을 도울 수 있다. 이러한 일련의 알고리즘은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다.
하나 이상의 실시예에 따라, SS를 위한 방법 및 시스템은 단일 채널 또는 멀티 채널일 수 있는 프리프로세서 및 단일 채널 또는 멀티 채널일 수 있는 초해상 모듈로 구성될 수 있다. 하나 이상의 실시예에 따라, SS를 위한 방법은 국소 안정 사인 곡선 발진(short-time stable sinusoidal oscillations)을 위한 방법, 국소 선형 주파수 변조 방법(short-time linear frequency modulation methods), 시변 진폭 변조 방법(time-varying amplitude modulation methods), 공동 진폭 및 주파수 변조 방법(joint amplitude and frequency modulation methods), 및 싱글렛 표현 방법(Singlet Representation method)을 포함하는 복소 스펙트럼 위상 에볼루션(Complex Spectral Phase Evolution)에 기초할 수 있는 방법군을 포함할 수 있다. 여기에 사용된 바와 같이, FM-CSPE는 주파수 변조 신호에 적용되는 CSPE 방법군의 특정 방법을 말한다. 마찬가지로, AM-CSPE는 진폭 변조 신호에 적용된 CSPE 방법군의 특정 방법을 말한다.
여기에 기술된 SS를 위한 방법 및 시스템은 다음의 장점중 하나 이상을 제공할 수 있다. 예를 들어, 이러한 방법 및 시스템은 원신호로부터 간섭 요소를 별개로 추출하도록 도울 수 있고, 원치 않는 요소는 원신호로부터 제거될 수 있다. 예에서, 원신호의 타겟 요소가 SS를 위한 방법 및 시스템을 사용하여 타겟 요소를 변질시키지 않고 추출되거나 격리될 수 있다. 다른 예에서, 동일한 주파수 범위내의 중첩 신호 요소가 (역시 "스미어링(smearing)" 또는 "불확실성 원리"로 알려진) 측정 프로세스의 콘볼루션 효과에도 불구하고 독립적으로 추출되고 강화될 수 있다. 여기에 기술된 바와 같은 SS에 대한 방법 및 시스템은 현 처리 기법에 대해 여기에 기술된 SS를 위한 방법 및 시스템의 처리 기법의 정확도로 인해 원신호를 상세하게 분석하도록 도울 수 있다.
하나 이상의 실시예에 따라, SS를 위한 방법 및 시스템은 코히어런트 소스를 식별하기 위해 시간적으로, 및/또는 고조파에 의해, 및/또는 다른 유사도 특성에 의해 신호 성분을 그룹화하기 위한 방법을 구현하도록 구성될 수 있는 신호 성분 트래커를 포함하도록 구성될 수 있다. 하나 이상의 실시예에 따라, SS를 위한 방법 및 시스템은 코히어런트 구조 선택기/분리기가 추출, 격리, 강화 및/또는 재합성을 위해 코히어런트 구조를 식별하기 위한 방법을 구현하도록 구성될 수 있도록 코히어런트 구조 집합기 및 코히어런트 구조 선택기/분리기를 포함하도록 구성될 수 있다. 하나 이상의 실시예에 따라, 이러한 방법 및 시스템은 다수의 신호 채널을 단일 수학적 구조로 결합하고 통합 영역에서 작동하도록 설계된 CSPE 방법의 버전을 사용하도록 통합 영역 변환 및 통합 영역 복소 스펙트럼 위상 에볼루션(CSPE)을 포함하도록 구성될 수 있다. 이러한 SS를 위한 방법 및 시스템은 오실레이터 피크의 세트로부터 주파수 영역 신호의 생성을 도울 수 있는 재합성 모듈을 포함하도록 구성될 수 있다. 이러한 재합성 모듈은 단일 채널 또는 다중 채널 모듈을 사용하여 구현될 수 있다.
하나 이상의 실시예에 따라, SS 시스템은 다중 채널 프리프로세서, 다중 채널 초해상 모듈, 트래커/집합기/선택기/분리기, 및 다중 채널 재합성 모듈을 포함하도록 구성될 수 있다. 하나 이상의 실시예에 따라, SS를 위한 방법은 복소 스펙트럼 위상 에볼루션(CSPE), 싱글렛 표현 방법, 통합 영역 변환, 통합 영역 복소 스펙트럼 위상 에볼루션, 단일 성분 추적, 코히어런트 구조 집합, 코히어런트 구조 분리, 시간 영역에서의 코히어런트 구조 복원, 주변 신호 재혼합 또는 재구성 및 다른 동작과 같은 하나 이상의 동작을 포함하도록 구성될 수 있다.
이러한 CSPE 동작은 고속 푸리에 변환(FFT) 또는 이산 푸리에 변환(DFT)의 정밀도 제한을 극복하기 위한 방법을 의미할 수 있다. 이러한 CSPE 동작은 일부 실시예에서 21.5Hz 로부터 0.1Hz 정도로, FFT 기반 스펙트럼 처리의 정밀도를 향상시킬 수 있다. 일부 실시예에서, 이러한 정밀도는 0.1Hz 보다 좋을 수 있다. 하나 이상의 실시예에 따라, CSPE 동작은 국소 안정 사인 곡선 발진 방법, 국소 선형 주파수 변조 방법, 시변 진폭 변조 방법, 및 공동 진폭 및 주파수 변조 방법을 포함하도록 구성될 수 있다.
싱글렛 표현 방법은 국속 안정 또는 불안정 오실레이터가 주파수 영역 신호로 투사되거나 주파수 영역 신호로부터 추출될 수 있는 방법을 말한다. 예에서, 오실레이터는 사인 곡선 발진, 임의의 기간의 국소 안정 발진, 불안정 발진, 또는 이러한 발진의 유한 합에 의해 희망 정도의 정밀도로 생성될 수 있는 신호를 포함하고 이에 제한되지 않는 임의의 발진 소스를 말한다. 싱글렛 변환 또는 싱글렛 표현은 다른 신호 요소와의 간섭의 정도를 나타낼 수 있는 오실레이터의 스미어링 특성에 대한 정보와 함께, 오실레이터의 진폭, 위상 및 (초해상) 주파수에 관한 정보를 포함할 수 있다. 또한, 싱글렛 표현은 오리지널 FFT 또는 DFT의 주어진 주파수 구간(bin) 내의 간섭의 데시벨의 수의 함수로서 스미어링 및 간섭 특성에 대한 정보를 포함할 수 있다. 일부 실시예에서, 싱글렛 표현은 (초해상) 주파수 변조, 진폭 변조 및 공동 주파수-진폭 변조 특성에 대한 정보를 포함할 수 있다.
통합 영역 변환은 다중 신호 채널을 단일 수학적 구조로 결합하기 위한 방법을 의미하고, 통합 영역 복소 스펙트럼 위상 에볼루션은 이러한 통합 영역에서 작동하도록 설계된 CSPE 방법의 일 버전을 의미할 수 있다. 신호 성분 추적은 코히어런트 소스를 식별하기 위해 시간적으로, 및/또는 고조파에 의해, 및/또는 다른 유사도 특성에 의해 신호 성분을 그룹화하기 위한 방법을 나타낼 수 있다. 코히어런트 구조 분리는 추출, 격리, 강화 및/또는 재합성을 위해 코히어런트 구조를 식별하기 위한 방법에 관한 것일 수 있고, 코히어런트 구조 재구성은 선택된 오실레이터 피크로 구성된 주파수 영역 또는 시간 영역 신호를 생성하기 위한 방법에 관한 것일 수 있다. 주변 신호 재혼합 또는 재구성은 특정 희망의 특성을 갖는 신호를 생성하기 위해 시간 영역의 코히어런트 구조 복원에 의해 생성된 신호에 오리지널 신호(또는 증폭되거나 감쇠된 버전의 오리지널 신호)를 더하기 위한 방법과 관련되어 있다. 예에서, 출력은 시간 영역에서의 코히어런트 구조 복원, 주변 신호 재혼합 또는 재구성, 특성 벡터 생성 및 수학적 표현으로부터 다른 출력 포맷으로의 자동 변환을 포함할 수 있다.
도 2는 원신호(202)를 복수의 요소로 분리하도록 구성될 수 있는 SS 시스템(200)의 실시예를 도시한 도면이다. 하나 이상의 실시예에 따라, SS 시스템(200)은 단일 채널 프리프로세서(204), 단일 채널 초해상 모듈(208), 다중 채널 프리프로세서(210), 다중 채널 초해상 모듈(212), 트래커/집합기/선택기/분리기(214), 단일 채널 재합성 모듈(220), 및 다중 채널 재합성 모듈(222)을 포함하도록 구성될 수 있다. 이러한 구성요소는 하드웨어, 소프트웨어, 또는 필드 프로그램가능 게이트 어레이(FPGA)와 같은 프로그램가능 하드웨어로 구현될 수 있다.
단일 채널 프리프로세서(204)는 단일 채널 초해상 모듈에 의해 처리될 수 있는 단일 채널 시간 영역 신호의 사전 처리(예를 들어, 준비)를 도울 수 있다. 단일 채널 초해상 모듈(208)은 단일 채널 프리프로세서에 의해 준비된 신호에서 오실레이터 피크의 세트를 검출하도록 도울 수 있다. 다중 채널 프리프로세서(210)는 다중 채널 초해상 모듈(212)에 의해 처리될 수 있는 다중 채널 시간 영역 신호의 사전 처리(예를 들어, 준비)를 도울 수 있다. 다중 채널 초해상 모듈(212)은 다중 채널 프리프로세성 의해 준비된 신호에서 오실레이터 피크의 집합을 검출하도록 도울 수 있다. 하나 이상의 실시예에서, 단일 채널 또는 다중 채널 프리프로세서는 시스템의 단일 구성요소로서 동작하도록 결합될 수 있다.
트래커/집합기/선택기/분리기("TASS")(214)는 오실레이터 피크의 부분 집합을 그룹화하고, 분리하고 및/또는 선택하도록 구성될 수 있다. 단일 채널 재합성 모듈(220)은 오실레이터 피크의 집합으로부터 주파수 영역 신호를 생성하도록 구성될 수 있다. 다중 채널 재합성 모듈(222)은 임의의 수의 채널을 포함하는 다중 채널 주파수 영역 신호를 오실레이터 피크의 집합으로부터 생성하도록 구성될 수 있다. 하나 이상의 실시예에서, 재합성은 단일 채널 모듈 또는 다중 채널 모듈에 의해 생성되는 것으로 기술되어 있지만, 이러한 모듈들은 시스템의 단일 구성요소로서 동작하도록 결합될 수 있다.
하나 이상의 실시예에 따라, 시스템(200)은 오디오, 비디오, 사진, 의료 영상, 셀룰러, 통신, 레이다, 소나 및 지진 신호 처리 시스템을 포함하고 이에 제한되지 않는 주문형, 하드웨어, 소프트웨어 또는 그 조합으로 구현되는, 다양한 형태의 알고리즘을 사용하거나 포함하도록 구성될 수 있다. 도 2에 도시된 바와 같이, 신호(202)가 수신될 수 있다. 이러한 신호(202)는 주변 소리와 같은 생중계(live-feed)와 연관된 데이터, 또는 잡음 환경의 기록과 같은 사전기록된 데이터를 포함할 수 있다. 수신된 신호(202)는 단일 채널 신호 또는 다중 채널 신호로서 분류될 수 있다. 신호(202)가 모노 오디오 신호와 같은 단일 채널의 데이터를 갖고 있다면, 신호(202)와 연관된 데이터는 단일 채널 프리프로세서(204)에 의해 주파수 영역으로 전환될 수 있다. 또한, 하나 이상의 오실레이터 피크가 단일 채널 초해상 모듈(208)을 사용하여 주파수 영역에서 식별될 수 있다.
반대로, 신호(202)가 스테레오 오디오 신호와 같은 다중 채널의 데이터를 갖고 있다면 신호는 다중 채널 프로세서(210)를 사용하여 주파수 영역으로 전환될 수 있다. 또한, 주파수 영역 신호는 이러한 주파수 데이터의 통합 영역 변환이 수행되고 이러한 통합 영역 주파수 데이터의 (초해상) 오실레이터 피크가 식별될 수 있는 통합 영역 초해상 모듈(212)에 전송될 수 있다.
하나 이상의 실시예에 따라, TASS 모듈(214)은 피크를 그룹화함으로써 이산 신호원을 식별하고 오실레이터 피크를 수집하여 희망의 이산 신호원을 격리하도록 사용될 수 있다. TASS 모듈(214)은 수집된 오실레이터 피크로부터 하나 이상의 코히어런트 그룹을 선택하도록 구성될 수 있다. 이에 따라, 하나 이상의 코히어런트 그룹의 피크는 하나 이상의 채널로 하나 이상의 포맷으로 출력으로서 분리되어 전달될 수 있다.
하나 이상의 실시예에 따라, 출력 신호가 도 2에 도시된 바와 같이 구성요소를 사용하여 재합성될 수 있다. 제한되지 않는 예로서, 오실레이터 피크는 원신호(202)가 본래 단일 채널의 신호인 경우에 단일 채널 재합성 모듈(220)을 사용하여 재합성 신호(218)로 전환될 수 있다. 재합성 신호(218)는 또한 여기에서 단일 채널 재합성 모듈(220)을 사용하여 생성된 단일 채널 신호로서 부를 수 있다. 마찬가지로, 오실레이터 피크는 원신호(202)가 본래 다중 채널 신호인 경우에 다중 채널 재합성 모듈(222)을 사용하여 재합성 신호(218)을 생성하도록 전환될 수 있다. 재합성 신호(210)는 역시 여기에서 다중 채널 재합성 모듈(222)을 사용하여 생성될 때 다중 채널 신호로서 부를 수 있다. 도시된 바와 같이, 신호 정보는 압축된 형태의 분석 파라미터로 출력될 수 있고; 및/또는 이러한 신호는 분석 파라미터의 수학적 변환, 또는 재해석에 의해 달성될 수 있는 것과 같은 다른 형태로 직접 출력될 수 있다. 다른 실시예에서, 신호 정보는 음성 인식기 또는 스피커 식별 시스템과 같은 다른 적용에 직접 전달될 수 있는 특성 벡터로서 출력될 수 있다.
하나 이상의 실시예에 따라, 단일 채널 프리프로세서(204)는 단일 채널 초해상 모듈(208)을 사용하여 단일 채널 CSPE 초해상 기법에 의해 처리하기 위한 단일 채널 시간 영역 신호 데이터를 준비하는 것을 돕도록 구성될 수 있다. 단일 채널 프리프로세서(204)로의 입력은 생중계 또는 기록된 파일일 수 있는 단일 채널 시간 영역 신호이다. 예에서, 다중 채널 데이터 스트림은 적어도 하나 보다 많은 채널의 다중 채널 데이터 스트림을 처리하도록 구성될 수 있는 다중 채널 프리프로세서(210)에 의해 처리된다.
종래의 신호 분석 시스템은 일반적으로 신호 분석 및 향상을 위해 시간 영역 신호 데이터를 주파수 영역으로 전환하도록 DFT 또는 FFT 또는 이산 코사인 변환(DCT) 또는 관련 변환을 사용한다. 여기에 개시된 바와 같은 SS를 위한 방법 및 시스템에서 채용된 기법은 제2 (이상의) FFT 로의 시간 영역 입력이 제1 FFT로의 입력에 대해 시간 지연된 샘플의 세트인 빌딩 블록으로서 2개(이상의) FFT를 사용하여 신호(202)의 사전 처리를 돕도록 구성될 수 있다.
도 3은 단일 채널 프리프로세서(204)를 사용하여 신호(202)를 사전처리하기 위한 방법(300)의 실시예를 도시하는 도면이다. 도시된 바와 같이, 단계 302에서, 시간 영역 신호 스트림이 단일 채널 프리프로세서(204)에 의해 수신될 수 있다. 단계 304에서, 샘플 윈도우가 신호(202)와 같은 입력 신호의 n개의 연속하는 샘플로 채워질 수 있다. 단계 308에서, 샘플 윈도우 A 및 샘플 윈도우 B와 같은 2개의 샘플링된 윈도우가 생성될 수 있다. 예에서, 샘플 윈도우 A의 크기 및 샘플 윈도우 A의 샘플의 수는 파라미터 파일에서 사용자에 규정될 수 있는 후속 및 이전의 샘플 윈도우와 중첩될 수 있거나, 소프트웨어 또는 하드웨어 구현의 일부로서 설정될 수 있다. 예에서, 샘플 윈도우 B는 여기에서, 샘플 윈도우 A 및 B가 시간상 오프셋될 수 있고 샘플 윈도우 B가 샘플 윈도우 A에 대해 지연될 수 있도록 시간 지연된 샘플로 부를 수 있다.
단계 310에서, 분석 윈도우(여기에서는 테이퍼로 부른다)가 테이퍼된 샘플 윈도우 A 및 테이퍼된 샘플 윈도우 B를 각각 생성하도록 샘플 윈도우 A 및 샘플 윈도우 B에 적용될 수 있다. 예에서, 분석 윈도우는 2개의 벡터가 항마다 쌍으로 함께 곱해지는 아다마르 곱을 사용하여 적용될 수 있다. 아다마르/슈어의 곱는 벡터, 행렬 또는 일반적으로 배열에서 정의될 수 있는 수학적 연산이다. 이러한 2개의 항목이 동일한 형상을 가질 때(그래서 동일한 수의 요소를 동일한 위치에서 가질 때) 아다마르/슈어 곱는 각각 벡터, 행렬, 또는 배열의 상응하는 입력의 요소간 곱으로서 정의된다. 이러한 연산은 예를 들어, ".*"에 의해 표시된 연산인 것으로 매트랩 프로그래밍 언어에서 정의되어 있고, 아래의 본문의 아래의 등식에서 ".*" 로서 또는 연산자 "□"로서 표시될 것이다. 예로서, 2개의 벡터가
Figure 112014116389614-pct00001
Figure 112014116389614-pct00002
로서 정의되어 있다면, 아다마르/슈어 곱는 벡터
Figure 112014116389614-pct00003
가 될 것이다. 다른 예에서, 분석 윈도우는 해닝 윈도우, 해밍 윈도우, 웰치 윈도우, 블랙맨 윈도우, 바틀렛 윈도우, 렉탱귤러/박스카 윈도우, 또는 규격 윈도우잉 함수, 또는 특별한 설계의 다른 유사한 분석 윈도우와 같은 규격 윈도우잉 함수로서 선택될 수 있다. 단계 312에서, 테이퍼된 샘플 윈도우 A 및 B가 DFT 또는 FFT 또는 이산 코사인 변환(DCT) 또는 관련된 변환을 사용하여 주파수 영역으로 전환될 수 있다. 결과로서, FDAT(A) 및 FDAT(B)가 복소 형태가 되도록 변환을 통해 생성될 수 있다.
도 4는 주파수 변조 검출이 필요할 때 단일 채널 프리프로세서(204)를 사용하여 신호(202)를 사전 처리하기 위한 방법 400의 실시예를 설명하고 있다. 도시된 바와 같이, 단계 402에서, 시간 영역 신호 스트림은 단일 채널 프리프로세서(204)에 의해 수신될 수 있다. 단계 404에서, 샘플 윈도우는 신호(202)와 같은 입력 신호의 n개의 후속 샘플로 채워질 수 있다. 단계 408에서, 샘플 윈도우 A, 샘플 윈도우 B, 샘플 윈도우 (B_up) 및 샘플 윈도우 (B_down)가 생성될 수 있다. 예에서, 샘플 윈도우 (B_up) 및 샘플 윈도우 (B_down)는 (B) 윈도우와 동일한 샘플을 포함할 수 있지만, 상이하게 처리될 수 있다. 예에서, 샘플 윈도우 A의 크기 및 샘플 윈도우 A의 샘플의 수는 파라미터 파일에 사용자에 규정될 수 있는 후속 및 이전의 샘플 윈도우와 중첩될 수 있거나, 소프트웨어 또는 하드웨어 구현의 일부로서 설정될 수 있다. 예에서, 샘플 윈도우 B는 샘플 윈도우 A 및 B가 시간상 오프셋될 수 있고 샘플 윈도우 B가 샘플 윈도우 A에 대해 지연될 수 있고 시간 지연된 샘플 윈도우라 불릴 수 있다.
단계 410에서, 분석 윈도우(여기에서는 테이퍼로 부른다)는 테이퍼된 샘플 윈도우 A 및 테이퍼된 샘플 윈도우 B를 각각 생성하도록 샘플 윈도우 A 및 샘플 윈도우 B에 적용될 수 있다. 단계 412에서, 변조 풀백 연산자가 신호(202)에서 주파수 변조 검출을 달성할 수 있는 테이퍼된 윈도우를 생성하도록 샘플 윈도우 (B_up) 및 샘플 윈도우 (B_down)에 적용될 수 있다. 예에서, 신호(202)에서의 주파수 변조 검출은 샘플 윈도우 (B_up) 및 샘플 윈도우 (B_down)와 같은 다른 샘플과 샘플링된 변조 풀백 연산자 사이의 아다마르 곱을 통해 달성될 수 있다. 예를 들어, 샘플 윈도우 (B_up)는 포지티브 주파수 변조의 검출을 위한 변조 풀백 연산자와 함께 사용될 수 있고, 샘플 윈도우 (B_down)는 네가티브 주파수 변조의 검출을 위한 변조 풀백 연산자와 함께 사용될 수 있다. 단계 414에서, 모든 4개의 테이퍼된 샘플 윈도우는 DFT 또는 FFT를 사용하여 주파수 영역으로 전환될 수 있다. 그 결과, FDAT(A), FDAT(B), FDAT(B_up), FDAT(B_down)가 복소 형태로 생성된다.
상술된 방법(예를 들어, 방법 300 및 400)은 FDAT(A)로부터 FDAT(B)로 복소 스펙트럼의 에볼루션을 분석하는 단계 및 이러한 복소 스펙트럼의 각 피크 근방의 복소 스펙트럼의 로컬 위상 에볼루션을 결정하는 단계를 더 포함할 수 있다. 이러한 최종 위상 변화는 관찰된 복소 스펙트럼 위상 에볼루션을 생성한 기본 주파수를, FFT 또는 DFT 보다 정밀한 초해상으로 결정하도록 사용될 수 있다. 기초 주파수 계산은 CSPE 방법을 통해 얻을 수 있는 초해상의 예이다. 또한, 방법 400은 신호(202)에서의 주파수 변조의 존재를 검출하도록 다운 변조 및 업 변조의 특성을 검출하기 위해 FDAT(A)로부터 FDAT(B_down)으로 그리고 FDAT(A)로부터 FDAT(B_up)로의 복소 스펙트럼의 에볼루션을 분석하는 단계를 포함할 수 있다.
이러한 방법은 검출된 기초 주파수의 각각에 대해 복소 스펙트럼의 근방 포인트의 복소 스펙트럼 위상 에볼루션 작용을 검사하는 단계를 더 포함할 수 있다. 이러한 검사는 복소 스펙트럼의 근방 포인트의 작용이 복소 스펙트럼의 피크 근방의 관찰된 작용과 일치하는지를 결정하는 것을 도울 수 있다. 이러한 방법은 작용이 양호한 피크를 수용하고 불일치된 피크를 거부하도록 적용될 수 있다. 마찬가지로, 각 개별적인 변조 기초 주파수에 대해, 이러한 방법은 복소 스펙트럼의 근방 포인트의 복소 스펙트럼 위상 에볼루션 작용을 검사하여 피크 근방의 관찰된 변조 작용과 일치하는 방식으로 발전하는지를 결정하는 단계를 포함할 수 있다.
이러한 방법은 각 일치된 피크에 대한 측정된 FFT 또는 DFT 복소 스펙트럼을 생성한 기초 신호 성분의 진폭 및 위상을 결정하도록 디콘볼루션 분석을 행하는 단계를 더 포함할 수 있다. 또한, 측정된 FFT 또는 DFT 복소 스펙트럼을 생성한 기초 신호 성분의 각 일치 변조 피크에 대한 기준 주파수, 진폭, 위상 및 변조율이 결정될 수 있다. 이러한 기준 주파수는 일반적으로 시간 영역 샘플의 프레임의 시작 또는 중앙에서 설정된다.
단일 채널 프리프로세서(204)에 의해 구현되는 상술된 방법은 단일 채널 CSPE 초해상 방법에 의해 처리될 수 있는 적어도 2개의 주파수 영역 데이터 세트를 생성한다. 설명된 바와 같이, 제2 세트로의 시간 영역 입력은 경미한 시간 지연에 상응하는 작은 수의 샘플 만큼 제1 세트로의 시간 영역 입력에 대해 지연되어 있다. 각 입력은 분석 윈도우에 의해 곱셈된 후에 DFT 또는 FFT에 의해 주파수 영역으로 변환된다. 프리프로세서의 주파수 영역 출력은 이후에 FDAT(A) 및 FDAT(B)로 부를 것이다. 또한, FDAT(B_up) 및 FDAT(B_down)와 같은 2개의 추가 주파수 영역 데이터 세트가 주파수 변조 검출이 요구되는 경우에 생성될 수 있다. FDAT(B_up) 및 FDAT(B_down)는 주파수 영역으로의 전환 전에 변조 풀백 연산자가 적용되는 샘플 윈도우 (B)에 포함된 시간 지연된 샘플의 주파수 영역 표현이다. FDAT(B_up)는 포지티브 주파수 변조 풀백 연산자가 적용되었고, FDAT(B_down)는 네가티브 주파수 변조 풀백 연산자가 적용되었다.
따라서, 상술된 입력, 방법 및 출력을 통해, 제한되지 않는 실시예에 따라, 프리프로세서는 주파수 영역에서 데이터의 세트를 생성한 후에 시간 영역에서 제1 세트의 입력 샘플을 생성하고 시간 영역에서 적어도 제2 세트의 입력 샘플을 생성하도록 신호 스트림을 수신한다. 제2 세트의 입력 샘플의 시작은 제1 세트의 입력 샘플의 시작 보다 지연되어 있어서, 이중 하나의 개시는 다른 것에 대해 시간 지연되어 있다. 그다음, 제1 및 제2 세트의 입력 샘플은 주파수 영역으로 전환되고, 복소 주파수 스펙트럼을 포함하는 주파수 영역 데이터는 제1 및 제2 세트의 입력 샘플의 각각에 대해 출력된다. 일부 실시예에서, 제1 및 제2 세트의 입력 샘플은 DFT 및 FFT 또는 다른 변환중 적어도 하나를 사용하여 주파수 스펙트럼으로 전환된다. 또 다른 실시예에서, 주파수 변조를 검출하는 옵션의 변환이 시간 지연된 윈도우에 적용될 수 있다. 일부 실시예에서, 테이퍼 또는 윈도우잉 함수가 시간 영역에서 이러한 윈도우에 적용될 수 있다.
일부 실시예에서, 적용된 변환은 복소 영역 데이터를 출력하지 않을 수도 있다. 예를 들어, 이산 코사인 변환(DCT)을 적용하면 복소 영역이 아닌 실제 데이터를 출력하는 결과를 초래하는 경향이 있다.
이해되는 바와 같이, 기술된 사전처리 방법은, (i) CSPE을 실행할 수 있도록 하는 윈도우 사이의 시간 지연의 개념을 도입하고, (ii) 주파수 변조 검출을 실행하도록 보통 적용되는 타입의 다양한 변환을 사용할 수 있다. "시간 지연"은 중첩되는 방식으로 제2 윈도우가 제1 윈도우의 시작 및 끝 보다 나중에 시작하고 끝나는 것을 의미한다. 이러한 시간 지연은 정보를 저장하는 인간 두뇌의 능력을 모방하고 있다.
하나 이상의 실시예에서, 단일 채널 초해상 모듈(208)이 신호(202)와 같은 오리지널 신호의 성분을 추출하도록 싱글렛 표현 방법을 허용하고 사용하기 위해 보다 높은 주파수 정밀도를 얻도록 구성될 수 있다. 단일 채널 초해상 모듈(28)은 신호(202)로부터 성분을 추출하는 것을 돕기 위해 다음의 입력을 사용하도록 구성될 수 있다. 단일 채널 초해상 모듈(208)은 단일 채널 프리프로세서(204)에 의해 생성되는 주파수 영역 데이터의 적어도 2개의 세트(FDAT(A) 및 FDAT(B)), 샘플 윈도우 A 및 샘플 윈도우 B에 테이퍼링 함수를 적용할 때, DFT 또는 FFT 변환등 보다 훨씬 더 정교한 해상도에서의 윈도우잉 함수의 변환의 초해상 분석 동안 사용될 수 있는 하나 이상의 파라미터와 같은 입력 정보를 필요로 할 수 있다. 이러한 정보는 윈도우잉 함수의 함수 형태가 공지되어 있고 일반적으로 임의의 희망의 정도의 정밀도로 분석될 수 있기 때문에 사전계산될 수 있다. 또한, 단일 채널 초해상 모듈(208)은 신호(202)에서 주파수 변조를 검출하기 위해 단일 채널 프리프로세서(204)에 의해 생성되는, 2개의 추가 세트의 주파수 영역 데이터 FDAT(B_up) 및 FDAT(B_down)을 필요로 할 수 있다. 옵션으로, 단일 채널 초해상 모듈(208)은 진폭 변조 및 공동 주파수/진폭 변조의 검출 및 특성화를 위해 추가 초해상 분석 윈도우를 사용할 수 있다.
도 5는 신호 성분의 세트를 추출할 수 있도록 고정밀 주파수 추정값을 생성하기 위한 방법 500을 도시하고 있다. 단일 채널 초해상 모듈(28)은 2개의 세트의 주파수 영역 데이터(FDAT(A) 및 FDAT(B)) 및 분석 윈도우를 포함할 수 있는 입력(502)을 사용하도록 구성될 수 있다. 단계 504에서, 단일 채널 초해상 모듈(208)은 후속 신호 추출을 위한 고해상 주파수를 생성하기 위해 복소 스펙트럼 위상 에볼루션을 계산하도록 구성될 수 있다. 단계 508에서, 복소 스펙트럼(FDAT(A) 또는 FDAT(B))의 오실레이터 피크는 오실레이트 피크의 리스트(510)를 생성하도록 식별된다. 이러한 오실레이터 피크는 주파수 영역으로의 오실레이터의 투사로서 정의될 수 있고 처리 프로세스의 일부 단계에서 국부 최대값으로 식별될 수 있다.
예에서, 단계 512에서, 복소 스펙트럼(FDAT(A) 또는 FDAT(B))의 근방 포인트의 CSPE 작용은 오실레이터 피크를 선택하도록 상기 식별된 국부 최대값의 각각에 대해 검사될 수 있다. 이러한 검사는 복소 스펙트럼의 근방 포인트의 작용이 복소 스펙트럼의 피크 근방의 관찰된 작용과 일치하는 여부를 결정하도록 도울 수 있다. 이러한 방법은 작용이 양호한 피크를 수용하고 불일치 피크를 거부하도록 적용될 수 있다. 마찬가지로, 각 개별적인 변조 기초 주파수에 대해, 복소 스펙트럼의 근방 포인트의 CSPE 작용은 이러한 포인트가 피크 근방의 관측된 변조 작용과 일치하는 방식으로 발전하는지를 결정하도록 검사될 수 있다. 예에서, 피크 거부 기준은 오실레이터의 원치않는 잡음 또는 사이드 로브(lobe)와 같은 다른 현상에 의해 생성된 논-타겟 최대값으로부터 오실레이터의 메인 로브에 의해 생성된 타겟 최대값을 식별하도록 적용될 수 있다. 또한, 다양한 선택 기준에 의한 타겟 최대값의 추출이 우선시될 수 있다. 다양한 선택 기준은 진폭 선택, 주파수 선택, 음향심리학 지각 모델 기반 선택, 또는 고조파를 나타내거나 고조파 관계에 근접하는 주파수 성분의 식별에 기초한 선택을 포함할 수 있지만 이에 제한되는 것은 아니다.
단계 514에서, 하나 이상의 싱글렛 표현 방법이 출력을 생성하도록 사용될 수 있다. 이러한 하나 이상의 싱글렛 표현 방법은 단계 520에서 오실레이터 피크(518)의 진폭, 위상 및 옵션으로 진폭 및 주파수 변조를 알아내는 단계를 포함할 수 있다. 또한, 하나 이상의 싱글렛 표현 방법은 단계 524에서 갱신된 오실레이터 피크(522)를 생성하는 단계 및 스펙트럼 데이터를 갱신하는 단계를 포함할 수 있다. 이러한 방법은 FDAT(A) 및 FDAT(B)로부터 오실레이터 피크의 영향을 제거하는 단계를 포함할 수 있고, 이것은 AM 변조 및 FM 변조 오실레이터 피크를 포함하는 임의의 타입의 오실레이터 피크에 대해 실시될 수 있다. 이러한 영향의 제거는 FDAT(A) 또는 FDAT(B)의 최대값의 영역을 넘어 확장될 수 있고, 존재하는 다른 신호 성분에 대한 오실레이터의 손상된 간섭 효과를 분리할 수 있다. 이러한 타입의 제거 프로세서는 이전의 처리 단계의 초해상 분석에 의해 가능한 비국부적 계산이다. 또한, 싱글렛 표현 방법은 나이퀴스트 주파수 및 DC(제로-모드) 주파수를 통해 신호 성분의 에일리어싱의 일관된 처리를 포함할 수 있다.
단계 528에서, 프로세스가 완료되었는지를 판정한다. 즉, 프로세스의 완료의 판정은 충분한 수의 타겟 최대값이 식별되었는지, 신호 성분이 추적 및/또는 코히어런트 그룹으로의 집합, 및/또는 분리 및 선택, 및/또는 재합성을 위해 준비되었는지를 포함할 수 있다. 신호 채널 초해상 모듈(208)은 프로세스가 완료되지 않았다면 스펙트럼 데이터(530)를 사용하여 처리 단계를 반복하도록 구성될 수 있다. 방법 500은 프로세스가 완료되었다고 판정되면 532로 진행하고 단계 532에서, 오실레이터 피크(534)는 사용자에게 출력되는데, 예를 들어, 표시된다.
도 6은 신호 성분의 세트의 추출이 가능하도록 고정밀 주파수 및 AM 및 FM 변조 추정값을 생성하기 위한 방법 600을 설명하고 있다. 이러한 방법 600은 방법 500에 의해 요구되는 데이터 세트와 달리 2개의 추가 세트의 주파수 영역 데이터 FDAT(B_up) 및 FDAT(B_down)를 필요로 할 수 있다. 이러한 추가 세트의 주파수 영역 데이터 세트에 의해 오리지널 신호(202)에서 AM 및/또는 주파수 변조의 검출이 가능하다. 단계 602에서, 방법 600은 FDAT(A), FDAT(B), FDAT(B_up) 및 FDAT(B_down)과 같은 복소 스펙트럼에 CSPE를 행할 수 있다. 단계 604에서 오실레이터 피크 리스트가 생성될 수 있고 단계 608에서, 오실레이터 피크가 방법 500의 508 및 512에 각각 개시된 기법을 사용하여 선택된다. 단계 610에서, 방법 600은 신호(202)로부터 성분을 추출하기 위해 하나 이상의 싱글렛 표현 기술을 포함하도록 구성될 수 있다. 이러한 기술은 향상된 싱글렛 피트 프로세스에 대한 설명에서 더 설명된다. 방법 600은 프로세스의 완료에 대해 판정하는 단계 612로 진행할 수 있다. 완료시에, 단계 614에서, 방법 600은 오실레이터 피크를 출력할 수 있다.
따라서, 비제한의 특정 실시예에 따라, 입력을 취하고 여기에 개시된 방법을 구현할 때, 프로세서는 각각 주어진, 또는 "기본적인" 변환 해상도를 갖는, 제1 세트 및 제2 세트의 주파수 영역 데이터를 수신하고, 여기에 더 설명되는 바와 같이, 프로세서는 이러한 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하여 초정밀도의 해상도에서 성분 주파수를 추정한다. 이러한 정밀도는 기본 변환 해상도 보다 보통 크다. 여기에 사용된 바와 같이, "변환 해상도"는 변환 방법의 고유의 해상도 한계를 가리키고; 예를 들어, DFT 또는 FFT가 초 당 Q 샘플로 샘플링된 데이터로부터 취해진 N-포인트 샘플 윈도우에서 계산되는 경우에, DFT 또는 FFT는 N개의 주파수 구간을 나타내고, (당업자에 공지된 표준 규정에 의해 정의된 바와 같이) 그중 절반은 포지티브 (또는 포지티브 스피닝) 주파수 구간에 상응하고 다른 절반은 네가티브 (또는 네가티브 스피닝) 주파수 구간에 상응하고; 이러한 방법에서 검출될 수 있는 최고의 적절하게 샘플링된 신호는 Q/2의 주파수이고 이것은 N/2 포지티브 주파수 구간으로 분할되어 구간 당 Q/N 헤르츠의 고유의 "변환 해상도"가 산출된다. 유사한 계산이 상응하는 "변환 해상도"를 결정하기 위해 다른 변환 기술중 하나에 대해 행해질 수 있다. 일부 실시예에서, 주파수 영역 데이터에서 하나 이상의 오실레이터 피크를 식별하는 단계, 작용이 양호하고 및/또는 단기 안정 오실레이션 피크를 결정하기 위해 위에서 식별된 오실레이터 피크중 적어도 하나 근방의 적어도 하나의 포인트의 CSPE 작용을 검사하는 단계 및 이러한 식별된 오실레이터 피크의 추출을 실행하는 단계를 포함하는 피크 선택이 더 실행될 수 있다. 또 다른 실시예에서, 또한, 각 식별된 오실레이터 피크의 진폭 및 위상이 결정되고 싱글렛 변환/싱글렛 표현이 실행되어 고해상 공간으로부터 저해상 공간으로 맵핑될 수 있다. 또 다른 실시예에서, 또한, 주파수 영역 데이터로부터 각 식별된 오실레이터 피크의 영향을 제거하기 위해 싱글렛 표현을 실행할 수 있다.
위에서 그리고 여기에서 사용된 바와 같이, "주어진", "오리지널" 또는 "기본" 변환 해상도는 주파수 영역 데이터의 입력 데이터 세트를 제공하기 위해 사용된, FFT와 같은 변환의 해상도, 즉, CSPE의 기본 빌딩 블록으로서 사용된 변환의 고유의 해상도이다. CSPE 변환 자체에 대해 추가 설명할 것이다.
CSPE는 표준 DFT 또는 FFT와 같은 종래의 변환에 의해 생성된 것보다 보다 정밀한 주파수의 추정값을 계산한다. 종래의 FFT 및 DFT 방법은 주파수 추정값이 주파수 구간의 중심에 위치되어 있다고 가정하지만, 하나 이상의 실시예에 따른 CSPE는 시간에 대해 신호의 복소 위상의 회전을 측정하여 주파수 구간 내의 그 위치의 고해상 추정값을 생성한다. 본문을 통해 언급된 CSPE는 주파수 구간에서 초고해상도에서, 복소 위상의 회전과 같은, 신호의 특성값을 추정하는 기능을 포함하는 것으로 이해해야 한다. 하나 이상의 실시예에서, 여기에 개시된 CSPE 방법은 초해상 주파수 신호 분석을 제공할 수 있다. 일반적으로, N개의 샘플은 신호, 예를 들어, .wav 포맷의 음악 파일로부터의 디지털 샘플링된 신호, 또는 임의의 센서 장치에 부착될 수 있는 아날로그-디지털 변환기의 출력, 또는 흑백 또는 RGB 포맷등의 이미지의 스캔 라인으로부터 얻어진다. 이산 푸리에 변환(DFT) 또는 고속 푸리에 변환(FFT)과 같은 푸리에 변환은 신호의 N 개의 샘플(예를 들어, 샘플 1,...,N)에 행해진다. 마찬가지로, N 개의 샘플이 신호의 시간 지연된 스냅숏(예를 들어, 시간 지연 τ에 대한 샘플 τ+1,...,τ+N)으로부터 얻어지고 푸리에 변환은 이러한 시간 지연된 샘플에 적용된다. 그다음, 오리지널 샘플과 시간 지연된 샘플 사이의 복소 푸리에 변환의 위상 에볼루션이 분석된다. 특히, (제1 변환된 벡터와 제2 변환된 벡터의 복소켤레의 엘리먼트에 대해 항마다 곱셈이 이루어지는 슈어 또는 아다마르 곱인 곱셈에 의해) 변환의 켤레 곱(conjugate product)이 얻어진 다음 이러한 켤레 곱의 각이 얻어진다. 이러한 곱 및 각 정도를 사용하여 다수의 유리한 적용이 실현될 수 있다. 예를 들어, 이러한 각은 신호의 정확한 기초 주파수를 결정하도록 주기의 분수 배수를 결정하기 위해 변환과 비교될 수 있다. 일단 위상 에볼루션이 오리지널 변화에 의해 가능한 것 보다 훨씬 더 높은 해상도에서 정확한 신호 주파수를 결정하는데 사용되면, 보정된 신호 파워 값을 계산하는 것이 가능해진다. 또한, 푸리에 변환의 주파수 구간 내의 파워는 주파수를 보정하기 위해 재할당될 수 있다. 이러한 경우에, 근방 주파수 구간으로 스미어링한 신호 파워는 정확한 원신호 주파수에 재할당된다.
CSPE 알고리즘에 의해 신호(202)의 주파수 스펙트럼 내의 진동 성분을 검출할 수 있고, 일반적으로, 변환에 있을 수 있는 주파수에 향상된 해상도를 제공한다. 상술된 바와 같이, 이러한 계산은 DFT 또는 FFT에 의해 이루어질 수 있다. 그러나, 연속 변환 및 하드웨어 기반 변환을 포함하는 다른 변환이 사용될 수 있다.
다음의 예에 도시된 바와 같이, 신호 s(t)가 주어지고 동일한 신호의 디지털 샘플링된 버전,
Figure 112014116389614-pct00004
가 정의되었다고 가정한다. 신호의 N 개의 샘플이 취해지고, 신호의 DFT가 DFT 행렬을 우선 정의함으로써 계산될 수 있다.
Figure 112014116389614-pct00005
에 대해, 행렬은 다음과 같이 기록할 수 있다.
Figure 112014116389614-pct00006
이러한 행렬의 각 열은 N 개의 포인트 샘플 윈도우에 대해 주기의 정수배로 진동하는 복소 사인파이다. 하나 이상의 실시예에서, 지수의 부호는 변할 수 있고, CSPE의 정의에서, 복소 켤레가 제1 또는 제2항에 배치될 수 있다.
N 개의 샘플의 주어진 블록에 대해,
Figure 112014116389614-pct00007
를 정의하고, 일반화하면,
Figure 112014116389614-pct00008
이고, 신호의 DFT는
Figure 112014116389614-pct00009
로서 계산될 수 있다.
상술된 바와 같이 CSPE는 N 개의 포인트의 초기 샘플과 N 개의 포인트의 시간 지연된 샘플 사이의 신호의 성분의 위상 에볼루션을 분석할 수 있다. 시간 지연이 Δ 및
Figure 112014116389614-pct00010
의 곱 및
Figure 112014116389614-pct00011
의 복소 켤레에 의해 지정될 수 있도록 하면, CSPE는
Figure 112014116389614-pct00012
(슈어 곱 또는 아다마르 곱으로도 알려진, 매트랩의 ".*" 연산자와 동등한, 구간 단위로 취해진) 곱의 각도로서 정의될 수 있고, 여기에서, ε 연산자는 곱이 슈어 또는 아다마르 곱에서와 같이 요소 단위로 취해졌음을 가리키고, Σ 연산자는 이러한 곱으로부터 나온 복소 입력의 각도가 취해졌음을 가리킨다.
사인파 데이터에 대한 이러한 프로세스의 예를 설명하기 위해, 주기 p=q+δ를 갖는 복소 사인파의 형태의 신호를 취한다. 여기에서, q는 정수이고 δ는 1 보다 작은 크기의 분수 편차이다. 즉,
Figure 112014116389614-pct00013
. 이러한 복소 사인파의 샘플은 다음과 같이 기록할 수 있다.
Figure 112014116389614-pct00014
하나의 샘플의 시프트를 취한다면, CSPE에서 Δ=1이고:
Figure 112014116389614-pct00015
이것은 다음과 같이 다시 쓸 수 있다.
Figure 112014116389614-pct00016
변환의 켤레 곱(다시 요소 단위로 취해진다)을 결정하고, 그 결과는 다음과 같다.
Figure 112014116389614-pct00017
CSPE는 이러한 곱의 각도를 취함으로써 발견되어 다음이 얻어진다.
Figure 112014116389614-pct00018
이것을 기준 DFT 계산의 정보와 비교하면, 주파수 구간은
Figure 112014116389614-pct00019
의 정수배이고, 따라서, CSPE 계산은
Figure 112014116389614-pct00020
의 정수배에서 나타나는 신호 대신에 이러한 신호가 실제 q+δ에 의해 주어진 분수 배수에 있다는 것을 결정하는 정보를 제공하였다. 이러한 결과는 고려중인 주파수 구간과 관계없어서, CSPE에 의해, 주파수 영역에서 무슨 구간이 고려되든 상관없이 기초 주파수를 정확하게 결정할 수 있다. 동일한 신호의 DFT를 볼 때, 신호는 주파수 구간 q-1, q, 또는 q+1에서 최대 파워를 가질 것이고, δ≠0이라면, 신호 파워는 구간의 범위 외측의 주파수 구간으로 상당히 누설될 것이다. 한편, CSPE에 의해 DFT의 주파수 구간의 파워는 신호 파워를 생산한 정확한 기초 주파수로 재할당될 수 있다. 하나 이상의 실시예에 따라, 우측 열의 Ω 행렬의 정의는 자주 "네가티브 주파수" 복소 사인파로서 해석되는데, 이유는 다음과 같다.
Figure 112014116389614-pct00021
마찬가지로 끝에서 두번째 열은 다음과 같다.
Figure 112014116389614-pct00022
여기에 사용되는 구문 '네가티브 주파수 성분'은 이러한 방식으로 재해석될 수 있는 (그리고 당분야에서 사용되는 표준 관습과 일치하는) 열로의 신호의 투사를 가리킬 수 있다.
하나 이상의 실시예에 따라, 본문의 방법 400 및 500에서 사용된 오실레이터 피크 선택 프로세스는 오실레이터의 메인 로브 효과인 주파수 영역 스펙트럼의 최대값의 식별 및, 주파수 영역 데이터로부터 오실레이터 피크를 추출하는 최적 순서의 결정을 도울 수 있다. 예에서, 오실레이터 피크 선택 프로세스는 FDAT(A)에 저자오딘 복소 주파수 데이터를 진폭으로 전환하는 단계를 포함할 수 있다. FDAT(A)의 요소의 진폭은 이러한 요소의 복소 값의 절대값이다. FDAT(A)의 요소의 진폭은 또한 여기에서 스펙트럼 진폭(A)로도 부를 수 있다.
이러한 오실레이터 피크 선택 프롯스는 스펙트럼 진폭(A)에서 국부 최대값을 식별하는 단계를 포함할 수 있다. 예에서, 위치 n에서의 요소는 위치 n에서의 진폭이 위치 n-1의 요소의 진폭과 위치 n+1에서의 요소의 진폭 보다 크다면 국부 최대값이다. 또한, 이러한 국부 최대값은 오실레이터 피크로 여기에서 부르는 오실레이터의 메인-로브 효과를 식별하도록 검사될 수 있다. 예를 들어, 국부 최대값의 진폭은 최소 임계값에 대해 검사될 수 있다. 다른 예에서, 국부 최대값의 위치에 상응하는 CSPE 주파수의 근접성은 위치에 상응하는 FFT 주파수 구간의 중심에 대해 결정된다. CSPE 주파수가 충분히 근접하지 않다면, 이것은 국부 최대값이 오실레이터의 사이드0로브 효과이거나 잡음 유도 피크라는 것을 의미할 수 있다. 그러나, 국부 최대값의 진폭이 임의의 임계값 보다 크다면, 국부 최대값은 이전의 검사에 관계없이 의미있는 피크로서 생각될 수 있고 오실레이터의 그룹으로부터 구성될 수 있다.
오실레이터 피크 선택 프로세스는 FDAT(A) 및 FDAT(B)로부터 오실레이터 피크를 추출하는 순서를 결정하는 단계를 포함할 수 있다. 보다 높은 우선순위의 피크가 주어진 적용에 적절한 선택 기준을 사용하여 선택되는데, 즉, 예를 들어, 특정 타입의 보다 높은 순서 피크는 보통 주어진 상황에서, 잡음 보다는 희망의 신호의 보다 가까운 특성이다. 피크는 다른 기법중에서, 크기 선택, (음성 인식 또는 음성 필터링을 위한 신호 추출의 경우에서와 같은) 음향심리학 지각 모델 기반 선택, 추적 기간, 추적 개시 시간, 고조파 연관, 근사 고조파 연관 또는 주어진 적용에 적절한 임의의 다른 기준에 의해 선택될 수 있다.
하나 이상의 실시예에 따라, CSPE 고해상 분석은 명확한 주파수를 갖는 구성된(예를 들어, 라인) 스펙트럼으로 구간 같은 신호 성분을 변환하도록 구성될 수 있는데, 잡음 같은 신호 대역은 일반적으로 구조를 띠지 않는다. 그래서, 신호는 실질상 톤 같은 성분과 잡음 같은 성분으로 분리될 수 있다. 오실레이터 피크를 선택하기 위해, 실시예에서 일련의 단계가 채용될 수 있다. 예를 들어, 먼저, CSPE 분석은 복소 스펙트럼의 피크 근방의 관찰된 움직임과 일치하는 방식으로 발전하는지를 결정하도록 검출된 각 개별적인 기초 주파수에 대한 복소 스펙트럼의 근방 포인트의 복소 스펙트럼 위상 에볼루션 반응을 검사할 수 있다. 추가 기준이 반응이 양호한 피크를 수용하고 반응이 불량한 (예를 들어, 불일치하는) 피크를 거부하도록 적용될 수 있다.
예에서, CSPE 분석은 측정된 FFT 또는 DFT 복소 스펙트럼을 생성한 기초 신호 성분의 진폭 및 위상을 결정하도록 각 일치된, 반응이 양호한 피크에 대한 디콘볼루션 분석을 행하도록 구성될 수 있다. 고해상 주파수 분석으로부터 얻어진 데이터는 중요도의 순서로 신호의 성분을 우선순위 부여하도록 사용될 수 있고, 예를 들어, 잡음 환경에서의 음성 신호의 인식의 경우의 우선순위는 명료함에 대한 지각 중요도 또는 영향에 기초할 수 있다. 음향심리학 지각 모델(PPM)이 데이터의 각 채널에 대한 독립 계산이 별개로 계산될 필요가 없도록 통일 영역에 제공될 수 있고, 통일 영역 PPM은 다중 채널 데이터의 특정 성분에 우선순위를 부여하는데 사용될 수 있는 정보를 줄 수 있다. 예에서, 통일 영역 PPM은 특정 방향 또는 방향의 범위로부터 나오는 신호를 강조하기 위해 사용될 수 있다. 이에 따라, 알고리즘으로의 신호의 스펙트럼, 공간 및 시간 영역의 효과를 통합하는 통일된 음향심리학 지각 모델(UPPM)이 제공된다. 이러한 알고리즘은 하드웨어로 구현되거나 소프트웨어로 실행될 수 있다.
하나 이상의 실시예에 따라, UPPM 계산은 3개의 단계로 분리될 수 있다. 제1 단계는 톤 및 잡음과 같은 신호 성분 사이를 구별할 수 있는 고행상 신호 분석을 포함할 수 있다. 제2 단계는 주파수, 소리 압력 베렐, 및 공간 위치에 기초한 신호 성분의 코히어런시 그룹의 계산을 포함할 수 있는데, 각 코히어런시 그룹은 향상될 수 있는 "명료함의 단위"를 제공한다. 또한, 코히어런시 그룹의 간섭 및 분리도는 통일 영역에 코히어런시 표면을 생성하도록 계산되고 투사될 수 있다. 예에서, 코히어런시 표면은 전체 공간 필드에 대해 정의되는 표면을 생성하도록 사용될 수 있다. 또한, 코히어런시 커브가 스테레오 오디오 신호, 좌우 채널에 대해 통일 영역으로부터의 변환에 의해 얻어질 수 있다. 따라서, 전통적인 단일 채널 처리 기술이 여전히 신호에 실행될 수 있다. 임의의 시간에, 다중 채널 신호가 통일 영역으로 다시 변환될 수 있거나 통일 영역의 신호가 신호 처리 목적을 위해 다중 채널 신호(또는 단일 채널 신호)로 변환될 수 있다.
하나 이상의 실시예에 따라, 싱글렛 표현 방법은 주파수 영역 데이터로부터 오실레이터의 파라미터를 식별할 수 있거나, 오실레이터의 파라미터를 사용하여 주파수 영역 데이터를 생성할 수 있는 동작의 세트를 포함할 수 있다. 하나 이상의 실시예에 다른 싱글렛 변환 프로세스의 다양한 단계는 주파수 영역에서 오실레이터의 투사의 정규화된 형상을 계산할 수 있다. 또한, 이러한 단계들은 DC를 통한 에일리어싱에 의해 유발된 간섭 효과를 설명하는, 계산된 스펙트럼을 주파수 데이터의 세트에 맞추고 저주파 오실레이터의 크기 및 위상을 계산함으로써 오실레이터의 크기 및 위상을 계산하는 단계를 포함할 수 있다. 또한, 이러한 단계들은 나이퀴스트 및 DC를 통한 에일리어싱을 설명하는, 오실레이터의 주파수 영역 표현을 주파수 영역 데이터로 또는 그로부터 가산하거나 감사하는 단계를 포함할 수 있다. 하나 이상의 실시예에 따라, 복소 분석 방법이 단일 FFT 윈도우 내의 오실레이터 피크의 주파수 및 진폭 변조를 더 특성화하기 위해 채용될 수 있다. 이러한 복소 알고리즘은 본문에 상세하게 더 설명되어 있다.
하나 이상의 실시예에 따라, 주파수 영역의 오실레이터의 투사의 정규화된 형상이 CSPE에 의해 생성된 바와 같이, 오실레이터 피크의 고정밀 주파수 추정값 및 단일 채널 프리프로세서(204)에서 사용된 분석 윈도우의 고해상 주파수 영역 버전을 포함하는 입력을 사용하여 계산될 수 있다. 단일 채널 프리프로세서(204)에서 사용된 분석 윈도우의 고해상 주파수 영역 버전은 또한 여기에서 FWIN으로도 부를 수 있다. FWIN은 샘플 윈도우 A 및 샘플 윈도우 B에 테이퍼를 적용하도록 단일 채널 프리프로세서(204)에서 사용된 분석 윈도우의 고해상 버전의 주파수 영역 표현이다. FWIN은 16 또는 32의 인수 만큼 오리지널 분석 보다 길 수 있다. 이러한 인수는 '업샘플'율로 부른다. 다른 실시예에서, 분석 윈도우의 고해상 버전은 수학적 함수 표현을 통해 정확하게 알 수 있다.
오실레이터의 주파수가 FFT 구간의 중심에 있다고 판정되면, 오실레이터 투사의 형상은 FWIN의 다운 샘플링된 버전과 매치하고, 먼저 그 중심에서 FWIN으로부터 포인터를 선택한 다음, 업샘플율의 간격에서 포인트를 선택함으로써 생성될 수 있다. 주파수가 FFT 구간의 중심에 있지 않다면, 오실레이터의 형상은 이러한 포인트로부터 주파수가 경미하게 오프셋된 FWIN의 부분집합에 상응할 수 있다. 하나 이상의 실시예에 따라, 주파수 영역으로의 오실레이터의 투사의 형상은 CSPE 주파수와 이러한 위치에 상응하는 FFT 구간의 중심 사이의 주파수의 거리를 계산하는 단계를 포함할 수 있는 방법을 사용하여 생성될 수 있다. 이러한 방법은 또한 위에서 계산된 오프셋 플러스 FWIN의 중심에서 FWIN으로부터 제1 샘플을 선택하는 단계를 포함할 수 있다. 이러한 방법은 업샘플율에 기초하여 사전결정된 간격에서 FWIN으로부터 샘플을 선택하는 계산 단계를 포함할 수 있다. 예를 들어, 계산된 오프셋이 FWIN의 5개의 구간에 상응하고, 업샘플율은 16이고, FWIN의 중심 구간이 32769에 상응한다면, 선택된 FWIN 구간은 [..., 32741, 32757, 32773, 32789, 32805...]일 수 있다. 예에서, 선택될 수 있는 구간의 수는 시스템의 사용자-규정된 파라미터에 의존할 수 있다. 이러한 단계의 출력은 FWIN으로부터 선택된 복소 샘플의 세트이고 이러한 복소 샘플은 여기에서 오실레이터 피크 노멀라이즈드 스펙트럼으로 부를 수 있다. 이러한 샘플은 부정확한 진폭 및 위상을 가질 수 있다.
하나 이상의 실시예에 따라, FWIN로부터 선택된 복소 샘플의 정확한 진폭 및 위상은 오실레이터의 피크 형상의 결정시 계산될 수 있다. 예에서, 진폭 및 위상 계산은 보통 FDAT(A)에 저장된 주파수 영역 데이터의 세트에 오실레이터의 형상을 맞춤으로써 달성될 수 있고, 이러한 형상은 오실레이터 피크 노멀라이즈드 스펙트럼, CSPE에 의해 계산되는 오실레이터 피크의 고정밀 주파수, 및 보통 FDAT(A)인 주파수 영역 데이터의 세트를 필요로 할 수 있는 피트(Fit) 진폭 위상으로도 부를 수 있다. 또한, 이러한 방법은 스펙트럼 데이터에 맞는 크기 및 위상 회전을 푸는 단계 및 샘플링된 노멀라이즈드 스펙트럼을 새로운 크기 및 위상으로 곱하는 단계를 포함할 수 있다.
신호 성분의 주파수의 추정시에, 측정된 신호의 스펙트럼으로의 신호 성분의 기여도(contribution)의 정확한 근사치가 결정될 수 있다. 하나 이상의 실시예에서, 이것은 주파수 구간의 중간에서 중심이 있지 않은 신호에 적용될 때 이산 푸리에 변환의 특성으로부터 얻어진다. 분석 윈도우의 고해상 버전을 수학적 함수 표현으로서 정확하게 알 수 있는 다른 실시예에서, 콘볼루션 특성은 연속으로 계산될 수 있다.
하나 이상의 실시예에 따라, 신호가 분석될 때, 유한 수의 샘플이 선택될 수 있고, 변환이 계산될 수 있다. 비제한의 예로서, DFT가 이러한 신호에 적용될 수 있다. 그러나, 유사한 특성을 갖고 당업자에게 주지된 다른 변환이 이러한 신호에 적용될 수 있다. 데이터의 윈도우의 변환은 일반적으로 윈도우잉 함수, W(t)가 데이터, S(t)에 의해 곱해지는 윈도우잉 단계 후에 이루어진다. W(t)를 분석 윈도우(나중에 데이터의 윈도우는 동일하거나 상이한 합성 윈도우를 사용하여 재조합될 수 있다)로 가정하자. 데이터가 시간 영역에서 윈도우에 의해 곱해지기 때문에, 콘볼루션 정리에 의하면, W(t)*S(t)의 곱의 주파수 영역 표현은 각각 W(t) 및 S(t)의 변환을 나타내는
Figure 112014116389614-pct00023
Figure 112014116389614-pct00024
변환의 콘볼루션을 나타낸다. 고해상 스펙트럼 분석에 의해 주파수
Figure 112014116389614-pct00025
에서 크기
Figure 112014116389614-pct00026
의 신호 성분이 존재한다는 것이 드러나면, 콘볼루션 정리는 실질상
Figure 112014116389614-pct00027
형태의 항을 제공하는, 분석 윈도우와 같이 형상화된
Figure 112014116389614-pct00028
에서 센터링된 기여도의 존재를 암시한다. 이산 푸리에 변환에 의해 계산된 스펙트럼과 같은 이산 스펙트럼에서, 샘플링된 버전의 스펙트럼을 산출하는 유한 그리드의 포인트가 존재한다. 따라서, 상술된
Figure 112014116389614-pct00029
에서 센터링된 기여도는 스펙트럼에서 최저 논제로 주파수의 정수배인 유한 그리드 포인트에 샘플링된다. 동등하게, 이산 푸리에 변환이 R 샘플/초의 샘플율에 의해 적절하게 샘플링된 데이터의 N 개의 포인트에 대해 계산되었다면, 포착된 최고 주파수는 R/2 Hz의 나이퀴스트 주파수이고 N/2 개의 독립 주파수 구간이 존재할 것이다. 이것은 (R/2 Hz)/(N/2 구간)=R/N Hz/구간의 최저 샘플링된 주파수를 제공한다. 또한, 이산 푸리에 변환의 모든 다른 주파수는 R/N의 정수배이다.
분석 윈도우 변환,
Figure 112014116389614-pct00030
와 이산 푸리에 변환과 같은 이산 변환의 주파수 그리드로 샘플링된 스펙트럼 값 사이의 관계 때문에, 크기,
Figure 112014116389614-pct00031
의 양호한 추정값을 계산하기 위해,
Figure 112014116389614-pct00032
로의 최근방의 그리드 포인트 상의 측정된 샘플 값과 함께
Figure 112014116389614-pct00033
의 지식을 사용하는 것이 가능하다. 이러한 값을 계산하기 위해,
Figure 112014116389614-pct00034
로의 최근방 주파수 그리드가 식별되고, 차이
Figure 112014116389614-pct00035
가 계산되고, 그리드 포인트 M grid 에서의 신호의 변환의 크기 값이 계산된다. 그다음, 진정한 크기가 다음의 관계로부터 계산될 수 있다.
Figure 112014116389614-pct00036
예에서,
Figure 112014116389614-pct00037
가 분석 윈도우의 변환의 최대 크기를 의미하도록 취해지고, 일반적으로 1로 정규화되어 있다. 또한, 분석 윈도우의 변환이 일반적으로 대칭성을 가져서
Figure 112014116389614-pct00038
의 부호는 일반적으로 중요하지 않다. 이러한 관계는 기본 콘볼루션 관계의 조작에 의해 당업자에 의해 보다 특이한 윈도우잉 함수에 대해 채택될 수 있다.
Figure 112014116389614-pct00039
를 알고 고정된 해상도를 가정하면,
Figure 112014116389614-pct00040
는 DFT의 주파수 그리드의 해상도보다 2배, 4배, 8배, 16배, 32배, 또는 64배, 또는 N 배 정교한 미세 스케일의 그리드에 샘플링될 수 있다. 이러한 경우에, 상이한 값
Figure 112014116389614-pct00041
이 미세 스케일의 그리드에 상응할 수 있는 주파수 구간의 최근방 분수로 계산된다. 예를 들어, 미세 스케일의 그리드가 변환의 오리지널 주파수 그리드 보다 16 배 미세하다면,
Figure 112014116389614-pct00042
는 오리지널 주파수 그리드의 1/16으로 계산된다. 희망의 미세한 해상도는 특정 적용에 의존될 수 있고 당업자에 의해 선택될 수 있다.
하나 이상의 실시예에 따라, 참 신호의 위상은 참 신호 주파수 및 크기의 추정시에 조정될 수 있어서 신호는 이산 주파수 스펙트럼에 의해 나타난 위상과 정렬될 수 있다. 그래서,
Figure 112014116389614-pct00043
가 크기 Mg rid 와 연관된 위상각을 나타내고
Figure 112014116389614-pct00044
Figure 112014116389614-pct00045
의 위상각을 나타내는 경우에, 분석 윈도우는
Figure 112014116389614-pct00046
와 같은 양 만큼 회전되어야 한다. 일단 이것이 이루어지면, 신호 성분에 대한 모든 정보는
Figure 112014116389614-pct00047
,
Figure 112014116389614-pct00048
, 및
Figure 112014116389614-pct00049
의 값에 의해 포착된다. 그 결과, 신호 성분의 복원은 분석 윈도우,
Figure 112014116389614-pct00050
의 표현, 주파수
Figure 112014116389614-pct00051
로의 표현의 시프팅, 각도
Figure 112014116389614-pct00052
만큼 회전하는 단계, 이것을 크기
Figure 112014116389614-pct00053
에 의해 곱셈하는 단계를 필요로 한다(분석 윈도우가 1의 최대 크기를 갖고 있는 것으로 가정하고, 그렇지 않으면 윈도우를 크기
Figure 112014116389614-pct00054
로 크기를 조정하는 인수에 의해 곱셈한다). 피트 진폭 및 위상의 추력은 오실레이터 피크의 참 진폭 및 위상, 그리고 오실레이터 피크의 크기 조정된 스펙트럼을 포함한다.
하나 이상의 실시예에 따라, 정확한 진폭 및 위상은 오실레이터의 피크 형상의 결정시에 저주파 오실레이터에 대해 계산될 수 있다. 이러한 저주파 오실레이터의 경우에, DC를 통한 에일리어싱의 효과는 이러한 오실레이터의 복소 켤레 투사를 간섭할 수 있다. 이러한 간섭 때문에, 종래의 기술을 사용하여 오실레이터의 참 진폭 및 위상을 측정하는 것이 어렵다. 하나 이상의 실시예에 따라 여기에 제시된 방법은 저주파 오실레이터의 참 진폭 및 위상을 계산하는 문제를 해결하는 획기적인 기술을 제공한다. 예에서, 이러한 방법은 저주파 오실레이터의 참 진폭 및 위상을 결정하도록 저주파 오실레이터 피크의 표준화된 스펙트럼, CSPE에 의해 계산되는 저주파 오실레이터 피크의 고정밀 주파수, 및 주파수 영역 데이터, 보통 FDAT(A)의 세트를 포함할 수 있는 입력을 사용하는 단계를 포함할 수 있다. 특정 실시예에서, 이러한 방법은 오실레이터의 스펙트럼로의 매치가 향상되도록 CSPE 주파수 값이 다양한 값으로 변하는 반복 단계를 포함할 수 있다.
신호 처리 적용에서, 데이터가 너무 느리게 샘플링되면, 고주파수에서 에일리어싱 문제가 존재할 수 있다. 또한 간섭이 극히 낮은 주파수에서 존재하고 여기에서는 DC 문제에 걸쳐 있는 간섭으로서 부를 것이다. 이러한 문제는 유한 샘플 윈도우가 신호를 분석하는데 사용될 때 발생한다. 이러한 샘플링에 사용되는 윈도우잉 함수가 직접적으로 수반되지만, 이러한 문제는 임의의 실현가능 유한-시간 윈도우 함수의 존재에 발생할 수 있다. 이러한 문제를 분명히 하기 위해, 주파수
Figure 112014116389614-pct00055
의 신호가 존재하고 DC 또는 0Hz 주파수 상태에 가깝다고 가정한다. 이러한 신호가 유한 시간 윈도우 W(t)에서 샘플링된다면, 상술된 바와 같이, 이러한 신호의 주파수 스펙트럼은
Figure 112014116389614-pct00056
로서 표시된, 윈도우잉 함수의 푸리에 변환을 갖는, 주파수
Figure 112014116389614-pct00057
에서 델타 함수의 주파수 영역에서의 콘볼루션이다. 이산 공식에서, 이러한 결과는 이산 변환의 주파수의 그리드로, 예를 들어, 고속 푸리에 변환(FFT)의 주파수 그리드로 투사된다. 윈도우잉 함수의 변환이 무한히 좁지 않기 때문에, 스펙트럼은
Figure 112014116389614-pct00058
를 포함하는 것 이외의 주파수 구간으로 파워 스필링(spilling)을 갖고 있다. 사실, 윈도우잉 함수의 변환은 모든 주파수에 확장되어 있고, 그래서 일부 신호 파워는 스펙트럼 전반에 분포되어 있어서 파워의 스필오버로부터 근방 주파수 구간의 오염을 유발한다. 윈도우잉 함수에 따라,
Figure 112014116389614-pct00059
가 제로로 떨어지는 비율은 변하지만, 실제 사용되는 대부분의 윈도우에 대해서는, 예를 들어, 해닝 윈도우, 해밍 윈도우, 박스카 윈도우, 파르젠(Pargen) 윈도우 및 많은 다른 당업자에게 알려진 윈도에 대해,
Figure 112014116389614-pct00060
를 포함하는 구간을 넘어서는 상당한 스필아웃이 존재한다. 이러한 스필오버 또는 스미어링 효과는 신호의 스펙트럼 전반에 걸쳐 중요하고, 2개의 신호 성분이 주파수에서 가까울 때, 스필오버로부터의 간섭은 상당할 수 있다. 그러나, 문제는 DC 구간 근방에서 심각해지는데, 그 이유는 임의의 저주파 신호가 복소 켤레 상을 DC의 타측 상의 그 미러 이미지로서 갖고 있기 때문이다. 이러한 복소 켤레 신호는 자주 "네가티브 주파수" 성분으로 생각되지만, 저주파 신호에 있어서, 이러한 페어링(pairing)은 강한 간섭 효과를 보장한다. 그러나, 이러한 페어링의 복소 켤레 성질로 인해, 주파수의 양호한 추정값이 얻어질 수 있는 경우에, 간섭 문제를 해결하면 참 기초 신호를 드러내고 간섭을 보정할 수 있다. 여기에 기술된 방법은 종래 방법의 문제를 다룬다. 이러한 방법은
Figure 112014116389614-pct00061
에서의 스펙트럼 및
Figure 112014116389614-pct00062
에서의 측정된 스펙트럼 값을 "포지티브 주파수" 성분으로부터의 기여도(contribution)의 반사로서 여기는 단계를 포함할 수 있는데, 이러한 "포지티브 주파수" 성분은
Figure 112014116389614-pct00063
로 표시될 것이고, 미러 이미지 또는 "네가티브 주파수" 성분으로부터의 기여도는
Figure 112014116389614-pct00064
로 표시될 것이다.
Figure 112014116389614-pct00065
기여도가
Figure 112014116389614-pct00066
의 네가티브 주파수로부터 나오기 때문에,
Figure 112014116389614-pct00067
에서의 기여도는 분석 윈도우
Figure 112014116389614-pct00068
의 켤레로부터 취해진다.
Figure 112014116389614-pct00069
Figure 112014116389614-pct00070
에 중심이 있도록 정의된다고 가정하면, 네가티브 주파수 성분으로부터의 기여도는
Figure 112014116389614-pct00071
의 중심으로부터의 거리
Figure 112014116389614-pct00072
에서 온다. 그래서, 주파수
Figure 112014116389614-pct00073
의 고해상 추정값이 취득되면, 포지티브 및 네가티브 주파수로부터의
Figure 112014116389614-pct00074
에서의 측정된 스펙트럼 값에 대한 기여도가 결정될 수 있다. 이러한 방법은
Figure 112014116389614-pct00075
Figure 112014116389614-pct00076
위치 모두에서 위상을 0으로 설정하는 단계를 포함할 수 있다. 이러한 위치에서 설정될 때,
Figure 112014116389614-pct00077
Figure 112014116389614-pct00078
에 대한 값이 완벽하게 알려져서, 차이
Figure 112014116389614-pct00079
가 얻어진다. 또한, 위상이 0일 때,
Figure 112014116389614-pct00080
Figure 112014116389614-pct00081
위치에서의 신호 성분은 실수값이어서, 네가티브 주파수로부터의 복소 켤레 스펙트럼은 포지티브 주파수에서의 스펙트럼과 동일한 상대 위상 위치에 있게 된다. 그러나, 위상이 0으로부터 차이가 날때, 상대 위상값은 반대로 회전되어야 하여서,
Figure 112014116389614-pct00082
에서의 위상이
Figure 112014116389614-pct00083
로 설정되는 경우에,
Figure 112014116389614-pct00084
에서의 위상은 복소 켤레 페어링을 유지하기 위해 -
Figure 112014116389614-pct00085
로 설정되어야 한다. 이것은 제로 위상 방위에서, 기여도
Figure 112014116389614-pct00086
Figure 112014116389614-pct00087
Figure 112014116389614-pct00088
의 상대 위상 차이를 갖지만,
Figure 112014116389614-pct00089
에서의 위상 방위가
Figure 112014116389614-pct00090
로 설정되어 있기 때문에,
Figure 112014116389614-pct00091
에서의 위상 방위는 역회전하고 -
Figure 112014116389614-pct00092
로 되어서, 기여도
Figure 112014116389614-pct00093
는 동일한 양만큼 역회전되어야 한다. 따라서, 임의의 위상 방위에서, 주어진 주파수에서의 순 기여도는
Figure 112014116389614-pct00094
Figure 112014116389614-pct00095
의 회전 및 역회전 버전의 결합이고, 이러한 합은 타원의 윤곽을 그린다. 또한, 이러한 타원의 주축이
Figure 112014116389614-pct00096
Figure 112014116389614-pct00097
이 정렬되도록 회전될 때 발생되기 때문에, 이것은 회전각이
Figure 112014116389614-pct00098
이고 회전 및 역회전의 버전의 합이
Figure 112014116389614-pct00099
일 때 발생한다. 그 결과, 주요각은 회전 및 역회전이 위상각의 평균인 각도에서 정렬되도록 텀을 놓을 때 발생한다. 단축의 위치도 마찬가지로 결정될 수 있는데, 그 이유는 π/2 라디안의 추가 회전 후에 발생하기 때문이다. 따라서, 단축에 대한 회전 및 역회전 버전은
Figure 112014116389614-pct00100
이다.
이러한 방법은 타원의 파라미터화를 도와서 각도 방위가 간단한 방식으로 결정될 수 있도록 하는 단계를 더 포함할 수 있다. 우선, x축에 장축을 갖고 크기 M을 갖는 타원에서, S는 단축의 크기라고 해보자. 이러한 타원은
Figure 112014116389614-pct00101
에 의해 파라미터화될 수 있고 τ에 대한 값을 규정함으로써, 타원상의 임의의 점이 선택될 수 있다. τ이 타원상의 점을 제공하는 경우에, 극좌표상의 점의 각도 위치, ρ는 (이것이 DC 문제의 간섭에 대한 위상각과 상응하기 때문에), 관계식
Figure 112014116389614-pct00102
로부터 발견될 수 있다. 이러한 형태의 파라미터화가 DC 문제를 통해 간섭에 적용될 때,
Figure 112014116389614-pct00103
Figure 112014116389614-pct00104
의 회전 및 역회전 합에 의해 형성된 타원은 회전되어서, 단축과 장축은 x축과 y축과 정렬된 다음, 측정된 스펙트럼은 최종 스펙트럼 성분에 의해 나타나는 실제 각도를 결정하기 위해 조사된다. 이러한 측정된 스펙트럼으로부터의 최종 각도는 Ω로 라벨링된다. 장축이
Figure 112014116389614-pct00105
이기 때문에, 추가 회전이 각도 Ω에서 최종값을 도출하기 위해 필요하다. 따라서, Ω-Δ에 상응하는 τ가 결정될 필요가 있고, 예에서, 다음의 관계를 사용하여 취득된다.
Figure 112014116389614-pct00106
이것은 다음과 같은 결과로서 제공된다.
Figure 112014116389614-pct00107
이러한 방법은 상기 관계식이 단지 스펙트럼의
Figure 112014116389614-pct00108
Figure 112014116389614-pct00109
위치에서 주파수 및 복소 켤레 관계식을 아는 것으로 결정된다는 것을 인식하는 단계를 더 포함할 수 있다. 이러한 분석 모두는 윈도우잉 함수의 변환의 상대 크기로부터 결정되었다. 이러한 상대 크기는 신호가 진폭 값에 의해 곱해질 때도 동일한 비율로 남을 것이다. 따라서, 참된 측정된 스펙트럼의 재생성은 스펙트럼으로부터 참 진폭 값을 선택한 후에 회전 및 역회전 기여도의 합을 다시 크기조정하여서 측정된 스펙트럼 값에 의해 나타난 진폭과 같도록 하는 단계를 필요로 할 수 있다. 최종 결과는
Figure 112014116389614-pct00110
에서의 신호의 참된 진폭의 고정밀도의 측정값이어서, 스펙트럼이
Figure 112014116389614-pct00111
에 위치된 윈도우잉 함수
Figure 112014116389614-pct00112
및,
Figure 112014116389614-pct00113
에 배치된 그 미러 영상, 복소 켤레 페어,
Figure 112014116389614-pct00114
에 의해 복원될 때, DC 구간에 걸친 간섭을 포함하는 최종 합은 참, 측정된 신호 스펙트럼의 고정밀도의 복원값이 될 것이다.
상기 분석은 스펙트럼의
Figure 112014116389614-pct00115
Figure 112014116389614-pct00116
위치에서의 상호작용에 초점을 맞추었고 유사한 분석이 등가의 결과를 유출하기 위해, 가공된 주파수중 하나에서 행해질 수 있다.
Figure 112014116389614-pct00117
Figure 112014116389614-pct00118
위치에서의 분석은 신호가 거기에 집중되어 있기 대문에 설명을 위한 것이고, 실제로는 일반적으로 최고 신호-잡음 비 및 가장 정확한 결과를 제공한다. 저주파수 오실레이터에 대한 피트 진폭 및 위상의 출력은 저주파수 오실레이터 피크의 참 진폭 및 위상, 그리고 저주파 오실레이터 피크의 스케일링된 스펙트럼이다.
하나 이상의 예에서,
Figure 112014116389614-pct00119
의 추정값이 충분히 정확하지 않다고 판단할 수 있다. 이러한 경우에, 주파수의 범위에서
Figure 112014116389614-pct00120
의 값을 변화시키고 희망의 정밀도에 도달할 때까지 이러한 프로세스를 계속하는 것이 가능하고, 아래 단락에 상세하게 더 설명되어 있다.
하나 이상의 실시예에 따라, 저주파수 방법을 사용하여 맞추어지는 일부 또는 모든 오실레이터 피크가 검사되고 에러에 대해 보정된다. 저주파 오실레이터 피크 에러를 검사하고 보정하는 방법은 맞추어진 스펙트럼으로부터 오실레이터 피크를 감산하는 단계 및 잔류 스펙트럼을 계산하는 단계를 포함할 수 있다. 오실레이터 피크의 중심 근방의 잔류 스펙트럼이 임계값 위에 있다면, 이러한 방법은 오리지널 스펙트럼의 양측의 간격에서 CSPE 주파수를 수정하는 단계 및 저주파 진폭 및 위상 계산을 반복하는 단계를 포함할 수 있다. 이에 따라, 이러한 방법은 최저 잔류 오류를 갖는 오실레이터 피크를 사용하는 단계를 포함할 수 있다. 본 단락에 기술된 방법은 주파수 및 진폭 변조 검출의 프로세스에서 사용될 수 있다.
하나 이상의 실시예에 따라, DC 또는 나이퀴스트에 걸쳐 있는 오실레이터 에일리어싱에 의한 간섭은 피크의 부정확한 식별 또는 피크의 재합성을 방지하기 위해 주파수 데이터에 오실레이터 피크를 제거하거나 더할 때 고려되어야 한다. 예에서, 이것은 주요 가산 또는 감산에 더하여 DC 또는 나이퀴스트를 통해 둘러싸는 부분의 복소 켤레를 가산하거나 감사하기 위한 방법을 구현함으로써 달성될 수 있다. 예에서, 이러한 방법은 오실레이터 피크 가산 및 감산을 행하도록 CSPE에 의해 계산되는 오실레이터 피크의 고정밀 주파수, 오실레이터 피크의 크기 조정된 스펙트럼, 및 주파수 영역 데이터의 세트를 포함할 수 있는 입력을 사용하는 단계를 포함할 수 있다. 이러한 방법은 주파수 영역 데이터에서 오실레이터 피크의 위치를 식별하는 단계 및 오실레이터 피크가 DC 주파수 또는 나이퀴스트 주파수에 의해 양분되어 있도록 되어 있는 경우에 오실레이터 피크를 주요 영역 및 꼬리 영역으로 나누는 단계를 포함할 수 있다. 이러한 꼬리 영역은 (복소 FFT의 주파수의 절반이 포지티브 (또는 포지티브-스피닝) 주파수로 지정되고 주파수의 절반이 네가티브 (또는 네가티브 스피닝) 주파수로 지정된 관례를 채택하는) -나이퀴스트(네가티브 나이퀴스트)와 DC 사이의 네가티브 주파수에 있는 부분이다.
예에서, 이러한 방법은 추가 동작이 피크의 부정확한 식별 또는 피크의 재합성을 방지하도록 실행될 때 주요 영역을 입력 주파수 영역 데이터에 추가하는 단계 및 테일 영역의 복소 켤레를 입력 주파수 영역 데이터에 추가하는 단계를 포함할 수 있다. 그렇지 않으면, 이러한 방법은 피크의 부정확한 식별 또는 피크의 재합성을 방지하도록 주요 영역을 입력 주파수 영역 데이터로부터 감산하는 단계 및 테일 영역의 복소 켤레를 입력 주파수 영역 데이터로부터 감산하는 단계를 포함할 수 있다. 방법은 이러한 단계로의 입력으로 수신된 주파수 영역 데이터의 수정된 세트를 출력할 수 있다.
하나 이상의 실시예에 따라, 단일 채널 초해상 방법의 출력은 개별적인 오실레이터 성분을 기술하는 파라미터의 세트를 포함할 수 있다. 각 세트는 해당 오실레이터를 단일 채널 재합성 방법으로 정확하게 복원하는데 사용된 정보를 포함할 수 있다. 바람직한 실시예에서, 이러한 정보는 오실레이터 성분에 대응하는 주파수, 진폭 및 위상 관련된 정보를 포함할 수 있다.
예에서, 다중 채널 프리프로세서(210)는 하나 이상의 실시예에 따라, 다중 채널 CSPE 초해상 기술에 의해 처리될 수 있는 다중 채널 시간 영역 신호 데이터를 준비하도록 구성될 수 있다. 예에서, 입력으로서, 다중 채널 시간 영역 신호는 다중 채널 프리프로세서(210)에 제공될 수 있다. 입력은 생중계되거나 기록된 파일일 수 있다. 다른 예에서, 단일 채널 데이터 스트림이 단일 채널 프리프로세서에 의해 처리될 수 있다.
다중 채널 프리프로세서(210)는 단일 채널 프리프로세서(204)에 대해 위에서 설명된 바와 같이 기술된 동일한 방법을 따르도록 구성될 수 있지만 이러한 방법은 다중 채널의 데이터에 대해 반복될 수 있다. 예에서, 다중 채널 프리프로세서(210)는 하나 이상의 실시예에 따라 입력 신호의 각 채널에 대해 방법을 실행할 수 있다. 이러한 방법은 해당 채널에 대해 입력 신호의 n개의 순차 샘플로 샘플 윈도우를 채우는 단계를 포함할 수 있다. 예에서, 이러한 순차 샘플 윈도우는 샘플 윈도우가 후속 및 이전의 샘플 윈도와 중복되는 샘플의 수 및 샘플 윈도우의 크기가 파라미터 파일에서 사용자에 의해 규정될 수 있도록 서로 중첩되어 구성될 수 있다. 또한 중첩하는 샘플 윈도우의 크기 및 수는 소프트웨어 또는 하드웨어 구현의 일부로서 설정될 수 있다. 예를 들어, 이후로 샘플 윈도우(A)로 부르는 샘플 윈도우가 정의될 수 있다.
이러한 방법은 제2, 시간 지연된 샘플 윈도우를 생성하는 단계를 더 포함할 수 있다. 예를 들어, 제2 샘플 윈도우는 이후로 샘플 윈도우(B)로 부를 수 있다. 샘플 윈도우(A) 및 샘플 윈도우(B)는 샘플 윈도우 B가 샘플 윈도우 A에 시간 지연되도록 시간상 오프셋될 수 있다. 샘플 윈도우(B)는 샘플 윈도우(A)에 대해 시간지연되어 있다. 이러한 방법은 주파수 변조 검출이 요구되는 경우에 2개 이상의 시간 지연된 샘플 윈도우를 생성하는 단계를 더 포함할 수 있다. 추가 샘플 윈도우는 샘플 윈도우 B와 동일한 샘플을 포함할 수 있지만, 추가 윈도우는 상이하게 처리될 수 있다. 추가 윈도우는 이후로 예를 들어, (B_up) 및 (B_down)으로 부를 수 있다. 주파수 변조의 검출은 (B_up) 및 (B_down) 샘플 윈도우에 '변조 풀백 연산자'를 적용하는 단계를 포함할 수 있다. 이것은 아다마르 곱을 통해 달성될 수 있다. 예를 들어, (B_up) 샘플 윈도우에 대해, 포지티브 n파수변조에 대한 변조 풀백 연산자가 사용될 수 있다. 또한, (B_down) 샘플 윈도우에 대해, 네가티브 주파수 변조에 대한 변조 풀백 연산자가 사용될 수 있다. 이러한 방법은 또한 분석 윈도우 또는 테이퍼를 샘플 윈도우 A 및 샘플 윈도우 B 모두에 별개로 적용하는 단계를 포함할 수 있다. 이것은 상술된 바와 같이, 아다마르 곱을 통해 달성될 수 있다. 예에서, 주파수 변조 검출은 (B_up) 및 (B_down) 샘플 윈도우에 분석 윈도를 적용하는 단계를 포함할 수 있다. 이러한 방법은 또한 테이퍼된 샘플 윈도우 A 및 테이퍼된 샘플 윈도우 B를 DFT 또는 FFT를 사용하여 주파수 영역으로 전환하는 단계를 더 포함할 수 있다. 예를 들어, 주파수 영역 출력은 이후로 FDAT_channel_X (A) 및 FDAT_channel_X (B)로 부를 수 있는데, 여기에서, X는 채널의 식별자이다. 또한, 주파수 변조 검출이 요구되는 경우에, FDAT_channel_X (B_up) 및 FDAT_channel_X (B_down) 윈도우가 (B_up) 및 (B_down) 샘플 윈도우에 대해 위에서 설명된 바와 동일한 프로세스를 사용하여 생성될 수 있다.
예에서, 다중 채널 프리프로세서(210)의 출력은 프레임 당 2개의 세트의 데이터를 포함할 수 있어서, 각 데이터 세트는 고속 푸리에 변환(FFT) 기술 또는 임의의 다른 관련된 주파수 변환 기술을 통해 주파수 영역으로 전환될 수 있었다. 각 채널에 대해, 제2 세트는 경미한 시간 지연에 상응하는 작은 수의 샘플 만큼 제1 세트에 지연될 수 있다. 예를 들어, 이러한 데이터 세트는 FDAT_channel_0 (A), FDAT_channel_0 (B)...FDAT_channel_N (A), 및 FDAT_channel_N (B)로 부를 수 있다. 예에서, 주파수 변조 검출이 요구되는 경우에, 2개의 추가 주파수 영역 데이터 세트가 각 채널에 대해 생성될 수 있다. 이것들은 이후로 예를 들어, FDAT_channel_X (B_up) 및 FDAT_channel_X (B_down)으로 부를 수 있다. FDAT_channel_X (B_up) 및 FDAT_channel_X (B_down)는 샘플 윈도우 B에 포함될 수 있는 시간 지연된 샘플로서, 주파수 영역으로 전환되기 전에 변조 풀백 오러레이터가 적용될 수 있는 시간 지연된 샘플의 주파수 영역 표현일 수 있다. FDAT_channel_X (B_up)에는 포지티브 주파수 변조 풀백 연산자가 적용될 수 있고, FDAT_channel_X (B_down)에는 네가티브 주파수 변조 풀백 연산자가 적용될 수 있다.
비제한의 실시예에 따라, 프리프로세서는 주파수 영역에서 데이터의 세트를 생성하기 위해 복수의 신호 스트림을 수신할 수 있다. 이러한 주파수 영역 데이터는 복수의 샘플 윈도우, 또는 "데이터 세트"를 포함할 수 있다. 설명을 위해, "샘플 윈도우"는 오리지널 시간 시리즈 데이터로부터 취해질 수 있는 n 개의 샘플의 윈도우에 관한 것일 수 있다. 그다음, 복수의 주파수 영역 데이터 세트의 각각은 제1 데이터 세트 및 제2 데이터 세트를 생성하도록 사용될 수 있고, 제2 데이터 세트 시간의 시작은 제1 데이터 세트의 시작에 대해 지연될 수 있고, 복수의 샘플 데이터 세트의 각각은 주파수 영역으로 전환될 수 있고 제1 및 제2 데이터 세트의 각각에 대해 복소 주파수 스펙트럼으로서 출력될 수 있다. 일부 예에서, 각 상응하는 제1 데이터 세트/윈도우 및 제2 데이터 세트/윈도우는 FFT, DCT와 같은 종래의 변환, 또는 임의의 다른 이러한 변환등을 사용함으로써 주파수 스펙트럼으로 전환될 수 있다.
예에서, 다중 채널 초해상 모듈이 정의될 수 있다. 다중 채널 초해상 모듈이 오리지널 신호의 성분을 추출하도록 싱글렛 변환을 사용할 수 있도록 하기 위해 고주파수 정밀도를 얻도록 구성될 수 있다. 예에서, 다중 채널 초해상 모듈의 입력은 다중 채널 프리프로세서(210)로부터 각 채널에 대한 주파수 영역 데이터에 대한 2개의 세트를 포함할 수 있다. 이러한 데이터 세트는 이후로 FDAT_chatmel_0 (A) 및 FDAT_channel__0 (B) ... FDAT_channel_N (A), 및 FDAT_channel_N (B)로 부를 수 있는데, 채널은 channel_0 내지 channel_N로서 규정되고, 주파수 데이터는 시간지연되지 않은 데이터에 대해 (A)로서 규정되고 시간지연된 데이터에 대해 (B)로서 규정된다.
이러한 입력은 테이퍼를 샘플 윈도우 A 및 샘플 윈도우 B에 적용할 때 사용되는 분석 윈도우를 기술하는 파라미터를 더 포함할 수 있다. 예에서, 주파수 변조가 요구되는 경우에, 입력은 단일 채널 프리프로세서에 의해 생성되는, 2개의 추가 세트의 주파수 영역 데이터, 데이터 FDAT (B_up) 및 데이터 FDAT (B_down)를 더 포함할 수 있다. 예에서, 이러한 입력은 주파수 및 진폭 변조의 검출 및 특성화를 위한 옵션의 추가 초해상 분석 윈도우를 더 포함할 수 있다.
도 7은 통합 영역 초해상도에 대한 방법 700을 설명하고 있다. 이러한 방법은 예를 들어, 안정 구간, 잡음과 같은 요소, 과도 이벤트 및 변조 주파수와 같은 이산 오브젝트로 분해함으로써, 통합 영역에서 신호 분해를 실행하는 단계를 설명하고 있다. 방법 700은 하나 이상의 실시예에 따라 확장된 단일 채널 초해상 방법일 수 있다.
이러한 방법은 702에서, 복수의 입력 채널로부터 얻어진 복소 스펙트럼 위상 에볼루션 주파수에 통합 영역 변환 및 통합 영역 복소 스펙트럼 위상 에볼루션(CSPE)을 실행하는 단계를 포함할 수 있다. 이러한 입력 채널은 이전에 설명된 채널 FDAT channel_0 (A), FDAT_channel_0 (B) ... FDAT_channel_N (A), 및 FDAT_channel_N (B)와 같은 다중 채널 초해상 모듈로의 채널 입력을 포함할 수 있다. 방법 700은 FDAT channel_0 (A), FDAT_channel_0 (B) ... FDAT_channel_N (A), 및 FDAT_channel_N (B)로부터 오실레이터 피크의 영향을 제거하도록 싱글렛 변환 방법을 사용하는 단계를 더 포함할 수 있다. 이것은 변환된 채널 데이터로부터 오실레이터 피크의 리스트를 생성함으로써 704에서 이루어질 수 있다. 또한, 오실레이터 피크의 리스트로부터, 708에서, 오실레이터 피크가 피크 선택 프로세스를 사용하여 선택될 수 있다. 이러한 피크 선택 프로세스는 오실레이터 피크를 식별하는 단계를 포함할 수 있다. 이러한 피크 선택 프로세스는 원치 않는 잡음 또는 오실레이터의 사이드 로브와 같은 다른 현상에 의해 생성된 논-타겟 최대값으로부터 오실레이터의 메인 로브에 의해 생성된 타겟 최대값을 구별하도록 피크 거부 기준을 적용하는 단계를 더 포함할 수 있다. 그다음, 타겟 최대값은 피크 선택의 우선순위를 부여하는데 사용될 수 있는 분리의 크기 및 주파수, 음향심리학 모델의 적용, 또는 트래커 상태 정보를 포함하는 복수의 인자에 기초하여 우선순위가 부여될 수 있다. 방법 700은 710에서, 각 채널에서 오실레이터 피크의 진폭 및 위상을 식별하도록 싱글렛 변환 방법을 사용하는 단계를 더 포함할 수 있다. 오실레이터 피크의 정보는 이러한 프로세스로부터 출력을 위해 저장될 수 있다. 방법 700은 또한 710에서, 이러한 프로세스가 완료되었는지를 판정하는 단계를 더 포함할 수 있다. 프로세스가 완료되었다면, 712에서, 이전에 저장된 오실레이터 피크 정보는 방법 700을 실행한 출력으로서 제공될 수 있다. 대안으로, 712에서 오실레이터 피크를 식별하는 프로세스가 완료되지 않았다고 판정되면, 방법 700은 반복될 수 있다.
예에서, 방법 700은 추적 및/또는 여과 및/또는 재합성을 위해 신호 성분을 준비하는 단계를 더 포함할 수 있다. 대안의 실시예에서, 통합 영역 초해상을 위한 방법이 진폭 및 위상 변조 검출과 함께 사용될 수 있다. 도 8은 방법 700에 포함된 단계 외에, 802에서 추가 변조 및 주파수 변조 검출을 통합하는 방법 800을 설명하고 있다 802에서, 진폭 및/또는 주파수 변조 검출이 요구되는 경우에, 향상된 피트 프로세스를 포함하는 기술이 사용된다.
s는 방법 700에 대해 이전에 설명된 바와 같이 선택된 오실레이터 피크의 주파수 및/또는 진폭 변조를 식별하는데 사용될 수 있다.
하나 이상의 실시예에 따라 스펙트럼 데이터의 통합 영역 표현이 아래에서 설명될 기술을 사용하여 계산될 수 있다.
통합 영역은 단일 채널의 데이터로서 다중 채널 신호의 표현일 수 있다. 다중 채널 신호를 통합 영역으로 전환하는 무손실 변환이 존재할 수 있다. 그 결과, 통합 영역 내의 신호는 개별적인 채널을 별개로 처리하지 않고 전체로서 처리될 수 있다. 예에서, 신호가 통합 영역으로 변환될 때도, 크기, 주파수, 및 신호 위치에 관련된 공간 성분에 대한 신호의 모든 정보가 유지될 수 있다. 이러한 신호의 변환은 통합 영역의 신호가 서라운드-사운드 신호 또는 RGB 신호의 스테레오 신호와 같은 다중 채널 신호로 다시 복귀할 수 있는 가역 기술일 수 있다. 예에서, 통합 영역 변환은 N이 오리지널 데이터 신호의 채널의 수를 나타내는 특별 단일 그룹, SU(N)으로부터 행렬에 의해 단일 크기 성분이 곱해지는 표현으로 오리지널, 다중 채널 신호가 전환될 수 있는 특징을 포함할 수 있다.
예에서, 통합 영역(UD)으로 전환하는 프로세스는 다중 채널 신호 스트림이 통합 영역에서 단일 채널 신호 스트림으로 전환될 수 있을 때 시작될 수 있다. 변환은 전환을 행하기 위해 사용될 수 있다. 이러한 변환은 단일 "신호"에 정보를 놓는 동안 각 채널의 신호 성분의 크기, 주파수, 내부 위상, 및 공간 위치에 대한 정보를 유지하는 단계를 포함할 수 있다. 또한, 변환은 단일, 1차원 스트림의 데이터 샘플 보다는 행렬의 스트림을 사용하는 단계를 포함할 수 있다. UD 변환은 UD 표현이 N-채널에 대한 복소 특별 단일 그룹(SU(N))의 요소에 의해 곱해지는 단일 크기 성분을 포함하므로 가역 기술일 수 있다. 일부 예에서, UD 행렬은 단일 그룹 U(n)으로부터 취해질 수 있다. SU(N) 그룹은 많은 방법으로 표현될 수 있다. 다중 채널 신호를 변환하는 목적을 위해, 복소 행렬의 구조가 채용될 수 있다. 예에서, 스테레오 입력이 UD로 표현될 수 있다. 스테레오 입력이 N=2이 되도록 2개의 채널을 포함하고 있기 때문에, 통합 영역의 표현은 2x2 복소 행렬에 의해 곱해지는 단일 크기 성분으로서 제공될 수 있다. 보다 구체적으로, 다중 채널 오디오 스트림의 변환은 다음과 같이 표현될 수 있다.
Figure 112014116389614-pct00121
여기에서, 크기는 주파수의 함수일 수 있고, N은 입력 채널의 수를 나타낼 수 있고, U는 통합 영역을 나타낸다.
(레프트/라이트와 같은) 종래의 2개의 채널 오디오 스트림에 대해 이러한 표현은 다음과 같이 될 수 있다.
Figure 112014116389614-pct00122
이러한 표현은 UD에서의 행렬의 스트림으로서의 표현과 2 채널 오디오 스트림 사이의 일대일 맵핑을 포함할 수 있고 이러한 변환은 무손실일 수 있다. 하나의 영역에서 이루어진 조작은 다른 영역에서 등가의 상대를 가질 수 있다. 당업자는 다수의 처리 기술이 유익한 것으로 증명될 수 있는 통합 영역 내의 신호에 실행될 수 있음을 이해할 수 있다. 예를 들어, 신호에 인가된 프로세스는 통합 영역에서 한번만 수행되면 되므로 보다 고속으로 실행될 수 있고, 그렇지 않으면 이러한 프로세스는 각 서브 채널에 대해 별개로 실행되어야 할 것이다. 또한, 통합 영역 조작은 동일한 시간에 모든 채널에 동작하는 장점이 있어서, 추가 동기화 프로세스가 실행될 필요 없이 채널이 동기화된 상태로 유지한다.
비제한의 실시예에 따라, 프로세서는 각각 변환 해상도를 갖는 제1 세트 및 제2 세트의 주파수 영역 데이터를 포함하는 복수의 채널을 수신하도록 구성될 수 있다. 복수의 채널은 통합 영역 표현에 결합될 수 있고 복소 스펙트럼 위상 에볼루션(CSPE)는 통합 영역 표현에 실행될 수 있어서 기본 변환 해상도 보다 큰 해상도 또는 정밀도에서 성분 주파수를 추정할 수 있다. 이러한 예에서, 상술된 처리는 CSPE가 복수의 채널을 통합 영역의 표현으로 바꾸므로 균일하게 적용될 수 있다. 예를 들어, 좌우 채널 대신에 CSPE가 모든 입력된 채널을 포함하는 표현을 단일 행렬이 형성하도록 할 수 있다.
다른 예에서, 통합 영역 표현에서 하나 이상의 오실레이터 피크를 식별하는 단계 및 작용이 양호한 피크를 유지하기 위해 적어도 하나의 식별된 오실레이터 피크 근방의 적어도 하나의 포인트의 CSPE 작용을 검사하는 단계를 포함하는 피크 선택의 추가 실행이 실행될 수 있다. 그다음, 이러한 식별된 피크는 우선순위에 따라 추출될 수 있다. 다른 예에서, 싱글렛 표현이 각 식별된 오실레이터 피크의 진폭 및 위상을 식별하기 위해 실행될 수 있다. 또 다른 예에서, 싱글렛 표현이 통합 영역 표현으로부터 각 식별된 오실레이터 피크의 영향을 제거하기 위해 실행될 수 있다.
예에서, 통합 영역 CSPE 방법이 정의될 수 있다. 예에서, 방법은 고해상 주파수 분석을 실행하는 단계를 포함할 수 있는 통합 영역에서의 신호의 처리 단계를 실행하는 단계를 포함할 수 있다. 고해상 주파수 분석은 상술된 1차원 CSPE 변환의 확장일 수 있다. 1차원 경우에서와 같이, 통합 영역에서의 신호의 성분의 위상 에볼루션은 N 개의 포인트의 초기 샘플과 N 개의 포인트의 시간 지연된 샘플 사이에 분석될 수 있다. 이러한 비교로부터, 신호 성분이 실제 나타나는 공간 위치를 나타내는 분수 배수가 얻어질 수 있다. 그 결과, 신호에 대한 정확한 기초 주파수 및 추정된 공간 위치가 결정될 수 있다. 샘플링된 신호에 존재하는 기초 주파수를 보정하기 위해, 이러한 정보가 고해상 주파수 분석을 얻는데 사용되는 변환의 주파수 구간의 신호 파워를 재할당하기 위해 사용될 수 있다.
하나 이상의 예에 따라, 통합 영역에서 신호를 조작하는데 사용될 수 있는 하나의 프로세스는 고해상 주파수 분석일 수 있고 이러한 프로세스는 복소 스펙트럼 위상 에볼루션(CSPE) 방법의 행렬 기반 버전으로서 구현될 수 있다. 그 결과, 이러한 변환은 특정 예에서, 예를 들어, 대략 46ms 윈도우에서 분석된 CD 샘플율에서 안정한 신호에 대해 0.01Hz 정도의 신호 정밀도를 제공할 수 있다. 다른 특정 예에서, 0.01Hz, 0.001Hz 또는 훨씬 더 미세한 정밀도의 신호 정밀도를 얻을 수 있다. CSPE 고해상 분석은 톤과 같은 신호 성분을 선명한 주파수를 갖는 라인 스펙트럼으로 전환할 수 있고, 반면 잡음과 같은 신호 대역은 구조화되지 않는다. 따라서, 신호는 실질상 톤과 같은 성분 및 잡음과 같은 성분으로 분리될 수 있다. 샘플 데이터의 프레임에 과도 신호 성분 또는 진폭 변조 또는 주파수 변조 신호 성분이 존재하는지를 검출하거나 주파수의 고조파 그룹핑을 검사하고 모으도록 추가 처리가 사용될 수 있다. 당업자는 이러한 처리가 신호 전체(예를 들어, 전체 오디오 신호) 또는 일부에 실행될 수 있음을 이해할 수 있다. 따라서, 윈도우잉 단계가 이러한 프로세스의 임의의 포인트에서 제공될 수 있다. 예를 들어, 데이터의 프레임은 다중 채널 데이터 스트림 또는 통합 영역의 데이터로부터 직접 취해질 수 있다.
예에서, UD 변환은 2개의 채널을 가진 스테레오 음악을 위한 음악 또는 다중 채널을 가진 서라운드 사운드 음악에서 존재할 수도 있는, 다중 채널에서 데이터를 동시에 분석하는 방법을 제공할 수 있다. 유사한 예에서, 적, 청 및 녹 채널을 갖는 RGB 포맷등과 같은, 다중 채널의 데이터로 구성된 것으로 이미지 및 비디오 데이터를 생각할 수 있다. 따라서, 다중 채널 신호가 특별 단일 그룹, SU(n)으로부터 취해진 행렬의 벡터에 의해 곱해진, 주파수 영역에서의 1차원 크기 벡터의 형태로 표현될 수 있다. 이에 따라, 다중 채널 신호의 통합 영역에서의 신호로의 보다 특별한 변환이 다음과 같이 일어날 수 있다.
하나의 실시예에서, 입력 데이터는 좌우로 지정된 데이터의 2개의 채널을 포함하는 스테레오 음악일 수 있고, 그 결과는 디멘션 2의 특별 단일 그룹, SU(2)로부터의 행렬의 벡터에 의해 곱해진 크기 벡터일 수 있다. 스테레오 음악의 최종 크기 벡터로의 상술된 전환을 달성하는 변환 프로세스는 복수의 단계를 포함할 수 있다. 제1 단계는 음악 데이터의 윈도우를 선택하는 단계 및 이것을 이산 푸리에 변환(DFT)와 같은 변환을 사용하여 주파수 영역으로 변환하는 단계를 포함할 수 있다. 이러한 단계를 실행한 결과로서, 이산 주파수 구간의 신호의 표현을 얻을 수 있다. 예에서, N 개의 샘플이 데이터의 윈도우에서 선택될 수 있다. 그 결과 N 개의 주파수 구간을 얻을 수 있다. 대안으로, 주파수의 통의 수를 변경할 수 있는 당업자에게 알려진 변환의 변형이 존재할 수 있다.
주파수 영역 변환으로 (일반적으로) 복소 주파수 정보의 2채널을 얻을 수 있다. 따라서, 각 주파수 구간은 2 요소를 갖는 복소 벡터로서 볼 수 있다. 그다음, 이러한 요소는 그룹 SU(2)로부터 취해진 복소 행렬에 의해 곱해져 단일 크기 성분을 얻을 수 있다. 이러한 크기 성분은 스테레오 음악의 표현으로서 행렬과 함께 저장될 수 있다.
예에서, 이러한 변환 프로세스는 다음과 같이 수학적으로 표현될 수 있다.
Figure 112014116389614-pct00123
주파수 영역으로 변환하기 위해 다음의 수학 연산이 실행될 수 있다.
Figure 112014116389614-pct00124
이러한 그룹 요소는 복수의 방법으로 표현될 수 있다. 예를 들어, 데이터의 2 채널에 대한 SU(2)에 대해, 표현은 아래와 같은 형태를 취할 수 있다.
Figure 112014116389614-pct00125
예에서, 주파수 영역 벡터의 성분을 갖는 각도가 다음과 같이 식별될 수 있다.
Figure 112014116389614-pct00126
의 j번째 복소 성분을
Figure 112014116389614-pct00127
로 하고
Figure 112014116389614-pct00128
의 j 번째 성분을
Figure 112014116389614-pct00129
로 하자. 그다음, 복소 주파수 성분은
Figure 112014116389614-pct00130
Figure 112014116389614-pct00131
를 설정함으로써 j 번째 주파수 구간에 대한 SU(2) 행렬의 요소(KS 노트: 이것은 아무런 갭 또는 분리 또는 복귀가 삽입되지 않은 SU(2)로서 나타나야 한다)에 식별될 수 있고, 위상 변수는 동일한
Figure 112014116389614-pct00132
Figure 112014116389614-pct00133
값일 수 있다. SU(2) 행렬이 j번째 주파수 구간에 대한 주파수 성분의 2-벡터에 의해 곱해지면, 그 결과는 다음과 같은 단일 크기 벡터일 수 있다.
Figure 112014116389614-pct00134
이러한 SU(2) 행렬은 유니테리행렬일 수 있고 역행렬을 가질 수 있어서, 모든 정보가 크기 벡터 및 U 행렬에 수용될 수 있다. 따라서, 다음과 같이 오리지널에 존재한 모든 정보를 포함할 수 있는 2 채널 데이터에 대한 새로운 표현이 제공될 수 있다.
Figure 112014116389614-pct00135
하나 이상의 예에서, 일단 데이터가 통합 영역 표현으로 표현되면, 이전에 표현된 2개의 독립 음악 채널, 즉, 좌우 주파수가 SU(2)로부터의 복소 행렬에 의해 곱해진 단일 크기 벡터로서 통합 영역으로 표현될 수 있다. 이러한 변환은 용이하게 역변환되어 편리한 방식으로 전후 변경가능하다.
상술된 하나 이상의 예에서, 다중 채널 신호 처리에 사용될 수 있는 대부분의 신호 처리 동작은 통일된 영역에서 계산될 수 있다. 그래서, 하나의 실시예에서, 전단 처리는 복소 스펙트럼 위상 에볼루션(CSPE)의 계산을 사용할 수 있다. 통일된 CSPE는 통합 영역으로 데이터의 윈도우를 전환함으로써 계산될 수 있다. 이러한 윈도우에 대한 표현은
Figure 112014116389614-pct00136
로 부른다. 또한, 통합 영역으로의 데이터의 시간 시프트 윈도우는
Figure 112014116389614-pct00137
로 표현될 수 있다. 그다음, 통일된 CSPE는
Figure 112014116389614-pct00138
의 계산을 필요로 할 수 있는데, 연산자
Figure 112014116389614-pct00139
는 모든 주파수 구간에 대해 행렬의 성분 곱(또한 슈어 곱 또는 아다마르 곱으로 알려져 있다)를 취하도록 구성되어 있고, *는 복소 켤레가 취해진 것을 나타낸다. 통합 영역에서 CSE의 리맵핑된 주파수를 얻기 위해, 통일된 CSPE에서의 복소 입력의 인수가 계산될 수 있다.
예에서, 전통 신호 처리 함수는 통합 영역에서 계산될 수 있도록 새로 준비되는 것이 유익할 수 있다. 예에서, 주파수 영역 또는 시간 영역에서 데이터의 일상적인 표현과 통합 영역 사이에 수학적 등가성이 존재할 수 있다. 통일된 CSPE에서의 주파수의 리맵핑과 결합될 때, 공간 위치 및 내부 위상 관계를 가짐으로써 신호 성분을 고려하는 것이 가능할 수 있다. 이것은 입력 데이터가 좌우 채널을 갖는 스테레오 오디오인 경우에, 스테레오 오디오의 공간 효과를 연관시킴으로써 청취자로의 접근의 각도에 걸쳐 있는 필드에서 동작하도록 이루어질 수 있다. 이러한 관점에서, σ의 주어진 값으로 일어날 수 있는 신호 성분은 크기가 통합 영역 표현 크기 값으로부터 유도된 크기 성분에 의해 주어지는 상태로 스테레오 필드에서 각도 σ에서 일어나는 것으로 보일 수 있다. 또한, 2개의 채널의 내부 위상각은 신호 성분에 할당된
Figure 112014116389614-pct00140
Figure 112014116389614-pct00141
값에서 보존될 수 있다.
예에서, 좌우 채널상의 음악은 주파수 f0 및 f1을 갖는 2개의 성분으로 구성될 수 있다. 이러한 성분이 통합 영역으로 전환되고 통일된 CSPE로 처리될 때, 이러한 신호는 이들의 크기, 공간 위치 및 내부 위상과 연관되어
Figure 112014116389614-pct00142
Figure 112014116389614-pct00143
일 수 있고, 제2 신호에 대해, 이러한 연관은
Figure 112014116389614-pct00144
Figure 112014116389614-pct00145
이다. 그다음, 코히어런시 표면의 결정은 공간 성분을 가지도록 채택될 수 있다. 예를 들어, f0과 같은 신호 성분이 마스킹 함수
Figure 112014116389614-pct00146
에 의해 주어진 근방 주파수에 대해 1 차원 마스킹 효과를 갖는다면, 이러한 마스킹 효과는 통합 영역으로 확장될 수 dT고, 코히어런시 표면 함수는 신호 성분 사이의 각도 분리와 관련된 공간 성분을 취할 것이고, 이것의 하나의 실시예를 코히어런시 함수
Figure 112014116389614-pct00147
로서 표현할 수 있다. 여기에서, 코사인 함수는 공간 성분을 나타낸다. 마찬가지로, 코히어런시 함수는 모든 신호 성분에 대해 유도될 수 있고 데이터의 전체 공간 필드에서 정의되는 전역 코히어런시 표면은 예를 들어, 공간 필드의 주어진 포인트에서 코히어런시 함수의 합, 또는 공간 필드의 주어진 포인트에서의 코히어런시 함수의 최대값 또는 공간 필드의 포인트에서 코히어런시 함수의 평균 또는 공간 필드의 포인트에서의 코히어런시 함수에 대한 다수의 다른 선택 규칙중 하나를 취함으로써 발견될 수 있다. 또한, 공간 방향으로 보다 빨리 줄어드는 함수 또는 공간 방향으로 보다 느리게 줄어드는 함수는 물론 코사인 함수 외의 다른 공간 함수가 사용될 수 있다.
예에서, 통합 영역으로 전환하는 프로세스, 고해상 통일된 CSPE 정보의 계산, 및 통합 영역에서의 코히어런시 표면의 계산은 다중 채널 신호를 구성하는 모든 성분들을 공동으로 고려하는 가능성을 제공할 수 있고 일관되게 이러한 성분들을 처리할 수 있다. 대안의 예에서, 신호 처리 알고리즘의 적용의 다른 개선 및 예가 가능하다. 예를 들어, CSPE 초해상 알고리즘은 단일 신호 성분만 보다는 보다 일반적으로 적용될 수 있다. 이에 따라, CSPE 알고리즘은 신호 주파수 사이에 일부 분리가 존재하는 경우에 많은 신호 성분을 분해하는데 사용될 수 있다. 다수의 신호가 존재할 때, 주파수의 초해상도는 개별적인 신호 성분에 의해 지배될 수 있는 스펙트럼 주파수 구간 근방에서 가장 정확할 수 있고, 신호 중심으로부터 떨어진 스펙트럼의 영역은 일반적으로 최근방 우세한 신호 주파수에 리맵핑될 수 있다. 예를 들어, 3개의 사인파로 구성된 신호에 대해, 신호는 주파수 구간의 중심에 있지 않다. 이러한 예에서, 알고리즘은 양호한 정밀도를 갖는 참 기초 주파수를 성공적으로 재계산하도록 구성될 수 있다. 도 9는 이러한 프로세스의 그래프이다. 오리지널 FFT 스펙트럼이 라인 911로서 도시되어 있고 리맵핑된 스펙트럼이 912로서 도시되어 있고, 이러한 리맵핑된 스펙트럼은 사실상 선 스펙트럼이다. 이러한 예에서, (주파수 구간 수로) 정확한 주파수는 28.7965317, 51.3764239, 및 65.56498312이고, 추정된 주파수는 28.7960955, 51.3771794, 및 65.5644420이다. 이러한 스펙트럼이 44100 샘플/초의 CD 샘플율에서 샘플링된 음악으로부터 계산되었다면, 각 주파수 구간의 기본 변환 해상도는 대략 21.53 Hz/bin이어서, 측정된 신호는 대략 ± 0.001 구간(bin)으로 정확하고, 이것은 ± 0.02153Hz와 등가이다. 하지만, 실제 음악 데이터는 완전하고 안정되지 않을 수 있다. 따라서, 계산된 고해상 스펙트럼의 정밀도는 근방 간섭 신호, 주파수의 변조 및 광대역 스펙트럼을 갖는 잡음과 같은 신호등의 존재에 의해 영향을 받을 수 있다. 이러한 예에서, 고해상 분석은 샘플 윈도우에 대해 비교적 안정될 수 있는 임의의 신호 성분에 대해 0.1Hz 정도의 신호 정밀도를 제공할 수 있다. 일 예가 노라 존스에 의한 추적으로부터 취해진 데이터의 윈도우에 대해 주어져 있고 리맵핑된 스펙트럼이 신호 920에 나타나 있다. 여기에서 오리지널 신호는 라인 922이고 리맵핑된 신호는 라인 921이다. 대안의 변형된 알고리즘의 예에서, 유사한 해상도가 변조율과 함께 윈도우의 초기 신호 주파수의 고해상 추정값을 리턴하면서 신호 성분을 선형 변조하기 위해 제공될 수 있다. 이것은 측정된 양 만큼 변조에 대응하는 복소 벡터에 의한 곱셈을 포함하도록 CSPE를 변경함으로써 발생될 수 있다(풀백 연산자). 이것은 보완 설명에서 설명되는 주파수 변조에 대한 단락에서 더 설명될 수 있다.
CSPE 기술은 또한 실제 함수가 복소 함수의 합과 그 복소 켤레 함수로서 표현될 수 있기 때문에 복소 신호에 더해 실제 신호에 대해 사용될 수 있다. 예를 들어, 주기
Figure 112014116389614-pct00148
(여기에서 p는 정수이고 δ는 1 보다 작은 크기의 분수 편차, 즉
Figure 112014116389614-pct00149
이다), 진폭 "a" 및 임의의 위상을 갖는 실제 사인파에 대해, 실제 사인파의 샘플은 다음과 같이(여기에서
Figure 112014116389614-pct00150
), 복소 사인파의 선형 조합으로서 기록될 수 있다.
Figure 112014116389614-pct00151
그리고 하나의 샘플 시프트는 다음과 같을 것이다.
Figure 112014116389614-pct00152
Figure 112014116389614-pct00153
이 정의되면, 벡터는 다음과 같이 기록할 수 있다.
Figure 112014116389614-pct00154
이러한 예에서, 이러한 벡터의 각각의 DFT는 다음과 같이 될 것이다.
Figure 112014116389614-pct00155
CSPE는 시프트 및 언시프트 변환의 복소 곱
Figure 112014116389614-pct00156
를 사용하여 계산될 수 있는데, 여기에서, 곱 연산자
Figure 112014116389614-pct00157
는 다음과 같이 벡터에서 요소간에 취해진 복소 곱으로서 정의될 수 있다.
Figure 112014116389614-pct00158
이러한 곱은 확장되어 다음을 얻을 수 있다.
Figure 112014116389614-pct00159
상기 등식을 단순화하면 다음이 얻어질 수 있다.
Figure 112014116389614-pct00160
예에서, 상기 단순화된 등식은 "포워드-스피닝" 또는 "포지티브-주파수" 복소 사인파 및 "백워드-스피닝" 또는 "네가티브-주파수" 복소 사인파에 대한 CSPE와 상호작용 항의 합으로서 볼 수 있다. 이러한 합의 처음 항과 마지막 항은 상술된 CSPE 계산과 동일할 수 있지만, 단일 복소 사인파 대신에, 2개의 복소 사인파의 선형 조합이 존재할 수 있다. 또한, 이러한 2개의 항으로부터 CSPE로의 영향은
Figure 112014116389614-pct00161
Figure 112014116389614-pct00162
에 각각 위치된 고도 집중된 피크를 나타낼 수 있다. 이러한 상호작용 항은 적절하게 처리되지 않으면 알고리즘의 정밀도를 감소시킬 수 있는 임의의 특성을 가질 수 있다. 아래에 도시된 바와 같이, 이러한 상호작용 항에 의해 도입된 바이어스는 데이터를 윈도우잉함으로써 최소화될 수 있다. 또한, 상호작용 항,
Figure 112014116389614-pct00163
는 다음과 같이 단순화될 수 있다.
Figure 112014116389614-pct00164
Figure 112014116389614-pct00165
는 예를 들어, 주파수 위치 q+δ에서 피크 집중될 수 있고
Figure 112014116389614-pct00166
는 주파수 위치-(q+δ)에서 피크 집중될 수 있고, 이러한 곱은 요소 마다 취해질 수 있다(그래서 다수의 경우에
Figure 112014116389614-pct00167
이다).
상술된 시나리오 예에 제공된 데이터는 해닝 윈도우, 해밍 윈도우, 또는 렉탱귤러 윈도우, 또는 임의의 다른 규격 윈도우잉 함수를 포함하고 이에 제한되지 않는 분석 윈도우를 사용하여 분석될 수 있다. 또한, 측정된 스펙트럼은 참(즉, 델타와 같은) 사인파 스펙트럼을 분석 윈도우로 콘볼빙함으로써 발견될 수 있다. 예를 들어, (박스카 윈도우와 같은) 렉탱귤러 윈도우가 사용된다면, 근방 스펙트럼 구간으로의 누설은 상당할 수 있고 충분한 힘을 가져서 상당한 상호작용 항을 생성할 수 있다. 이러한 상호작용 항에 의해 크기 제곱 항(즉,
Figure 112014116389614-pct00168
괄호의 항)이 간섭할 수 있다. 상당한 상호작용 항의 가능성을 줄이기 위해, 당업계에 알려진 다른 분석 윈도우가 사용되어 누설은 q+δ, 및 -(q+δ)의 이웃에 국한될 수 있어서,
Figure 112014116389614-pct00169
경우는 가장 일반적인 상황이다. 또한, CSPE가 계산된 후에, 주파수는 각도 정보를 추출함으로써 할당될 수 있다. 포지티브 주파수(k>0)에 대해, 다음과 같이 결정될 수 있다.
Figure 112014116389614-pct00170
네가티브 주파수(k<0)에 대해, 반대 값,
Figure 112014116389614-pct00171
가 결정될 수 있다. 결과적으로, (
Figure 112014116389614-pct00172
일 때의 경우일 수 있는) 실제 신호의 경우에, 포지티브 주파수의 모든 파워는 q+δ에 리맵핑될 수 있고, 네가티브 주파수의 모든 파워는 -(q+δ)로 리맵핑될 수 있다. 이러한 결과는 실질상 주파수 구간과 관계없고 주파수의 극히 정확한 추정값을 가능하게 할 수 있다.
예에서, CSPE는 분석 윈도우에 의해 윈도우잉된 실제 사인파에 대해 실행될 수 있다. 그다음, CSPE는 예를 들어, 기본 변환을 윈도우드 변환(windowed transform)으로 규정함으로써 윈도우잉의 효과를 포함하도록 일반화될 수 있다. 예를 위해, 데이터는 DFT를 계산하기 전에 윈도우잉될 수 있다. 또한, 예시를 위해, 임의의 분석 윈도우, A(t), 및 그 샘플링된 버전 An이 규정될 수 있다. 이러한 변환은 이전에 설명된 바와 같이 실행될 수 있다. 또한, 이러한 분석 윈도우는 아래와 같이 설명된 함수에 의해 사전 곱셈될 수 있다.
Figure 112014116389614-pct00173
여기에서 W 아랫첨자는 윈도우드 변환이 사용될 수 있는 것을 나타낸다.
따라서, 윈도우잉의 존재시에, 다음이 얻어질 수 있다.
Figure 112014116389614-pct00174
이러한 변환은 근방 주파수 구간으로의 누설을 최소화할 수 있고 또한 대부분의 경우에 간섭 항이 무시할 정도로 감소되도록 할 수 있다.
비제한의 일부 실시예에 따라, 신호 처리에 대한 통합 영역 모델/초해상 모델에서, 직교하지 않는 AM/FM 요소 간의 상호작용이 주파수 변경 신호에서 결정될 수 있다. 이러한 결정은 "추적자 인식(tracker aware)"될 수 있어서 상호작용 트래커는 트래클렛이 AM 및 FM 성분 사이에 일관된 결정을 하기 위해 진화함에 따라 트래클렛의 히스토리를 보도록 구성될 수 있다.
예에서, 향상된 피트 프로세스를 통해 변조 검출을 행하기 위한 방법이 규정될 수 있다. 방법을 설명하기 위해, 종래의 푸리에 기반 방법에 관해 가정한다. 이러한 가정에 의하면 종래의 푸리에 기반 분석은 임의의 오실레이터 피크가 일정한 주파수 및 진폭을 갖고, 단일 분석 윈도우의 시간 동안 안정한 사인파에 의해 생성될 수 있는 방식으로 이루어진다. 그러나, 많은 적용에서, 단일 분석 윈도우에서 주파수 및/또는 진폭의 변화를 검출할 필요가 있을 수 있다. 이러한 검출은 아래에 설명되는 바와 같이 하나 이상의 기술을 결합하거나 분리하여 고려함으로써 행해질 수 있다.
예에서, 고해상 윈도우(HRW)를 사용하는 진폭 변조(AM)/주파수 변조(FM) 검출 기술이 규정될 수 있다. 이러한 기술은 분석될 수 있는 오실레이터 피크를 특성화하기 위해 분석 윈도우의 고해상, 주파수 영역 버전을 시간 영역 샘플에 적용하는 단계를 포함하는 싱글렛 변환 처리를 포함할 수 있다. 설명을 위해, 분석 윈도우의 고해상 주파수 영역 버전은 (HRW)로 부를 수 있다.
예에서, 이러한 싱글렛 변환 처리는 샘플 윈도우에서 진폭 및/또는 주파수가 일정하지 않을 수 있는 오실레이터 피크를 특성화하는데 사용될 수 있다. 그렇게 하기 위해, 상응하는 진폭 및/또는 주파수 변조를 갖는 HRW가 분석을 위해 사용될 수 있다. 이러한 진폭 변조를 위해 설계된 HRW는 이후로 설명을 위해 (AM HRW)로 부를 수 있다. 예를 들어, 샘플 윈도우 동안 진폭이 증가한 사인파의 결과일 수 있는 오실레이터 피크를 분석하기 위해, HRW를 생성하기 위해 사용된 분석 윈도우가 주파수 영역으로 전환하기 전에 동일한 증가 진폭에 의해 곱해질 수 있는 HRW와 비교될 수 있다. 유사한 예에서, 주파수가 변조되는 오실레이터 피크를 분석하기 위해, 분석 윈도우가 주파수 영역으로의 전환 이전에 상응하는 주파수 변조율에 대해 변조 생성 연산자에 의해 곱해지는 HRW가 사용될 수 있다. 이러한 HRW는 이후로 설명을 위해 (FM HRW)로 부를 수 있다.
상술된 검출 기술은 진폭 및 주파수 변조 모두를 갖는 사인파의 효과를 분석하기 위해 결합될 수 있다. 이러한 HRW는 이후로 설명을 위해 (AM/FM HRW)로 부를 수 있다.
도 10은 고해상 AM/FM 윈도우를 생성하기 위한 방법의 예를 설명하고 있다. 방법 1000은 윈도우 함수(1002)에 의해 설명된 바와 같이, 오리지널 분석 윈도우의 카피에 의해 고해상 윈도우 생성의 프로세스를 시작하는 단계를 포함한다. 방법 1000은 진폭 변조(1012)의 분석을 위한 윈도우를 생성하기 위한, 아다마르 곱 등을 사용하여, 희망의 진폭 변조(1004)에 의해 분석 윈도우(1002)를 곱하는 단계를 1008에서 더 포함할 수 있다. 방법 1000은 주파수 변조(1018)의 분석을 위한 윈도우를 생성하기 위해 적절한 변조 양을 갖는 주파수 변조 생성 연산자(1010)에 의해 윈도우(1012)를 곱하는 단계를 1014에서 더 포함할 수 있다. 주파수 변조 생성 연산자(FMCO)가 주파수가 변조되는 것으로 주파수가 안정한 사인파를 변환하도록 구성될 수 있다. 방법 1000은 윈도우(1018)를 희망의 길이로 패딩하는 단계를 1020에서 더 포함할 수 있다. 바람직한 예에서, 희망의 길이는 샘플 윈도우의 오리지널 길이의 16 또는 32 배일 수 있다. 또한, 1020에서, FFT 또는 DFT 역시 이러한 분석을 주파수 영역으로 변환하기 위해 실행될 수 있다. 이러한 변환에 의해 도 10의 예에서 설명된 바와 같이, 고해상 윈도우(A)(1022)를 얻을 수 있다.
방법 1000은 또한 대안으로, 프리프로세서에서 샘플 시간 지연된 고해상 윈도우(B)(1034)를 준비할 때 사용되는 시간 지연을 위한 적절한 시프팅 인자에 의해 AM 윈도우(1004) 및 FM 윈도우(1010)를 시프팅함으로써 얻어질 수 있는 시간 시프팅된 AM 윈도우(1024) 및/또는 시간 시프팅된 FM 윈도우(1030)를 사용하여 단계 1008 내지 1020을 반복함으로써 실행될 수 있다.
진폭 변조(AM) 검출을 위한 방법의 예에서, 진폭 변조는 이전에 설명된 바와 같이, 각각 상이한 AM 포락선이 시간 영역에 적용될 수 있는 다양한 AM HRW와 비교하도록 싱글렛 변환 방법을 사용함으로써 검출될 수 있다. AM HRW는 유사한 진폭 변조를 갖는 사인파로부터 생성된 오실레이터 피크에 주파수 영역에서의 형상이 가장 근접할 수 있다. 따라서, 오리지널 신호의 진폭 변조는 최저 잔류 오류로 AM HRW를 선택함으로써 검출될 수 있다.
도 11은 주파수 변조 검출을 위한 방법 1100의 예를 도시하고 있다. 방법 1100은 주파수 영역 샘플(B_UP)(1110) 및 주파수 영역 샘플 윈도우(B_DOWN)(1112)의 2개의 추가 (B) 샘플을 생성하기 위해 프리프로세서에서 오리지널 시간 영역 오디오 샘플(1102)을 사용하는 단계를 1134에서 포함하고 있다. 추가 윈도우는 1134c에서, 포지티브 변조에 대한 주파수 변조 풀백 연산자(FMPO)를 하나의 (B) 윈도우에 적용함으로써 생성될 수 있고, 이러한 윈도우를 (B_up) 윈도우(1110)로 부를 수 있다. 이것은 아다마르 곱을 통해 달성될 수 있다. 마찬가지로, 방법 1030에 의해 주파수 변조 생성 연산자를 생성할 수 있다. 마찬가지로, 방법 1100은 1134d에서, 네가티브 변조를 위한 주파수 변조 풀백 연산자(FMPO)를 다른 (B) 윈도우에 적용하는 단계를 포함할 수 있고, 이러한 윈도우를 (B_down) 윈도우(1112)로 부를 수 있다. 이것은 또한 아다마르 곱을 통해 달성될 수 있다. 이러한 방법 1100은 1138a에서 (A) 윈도우 및 (B) 윈도우의 비변조 CSPE; 1138b에서 (A) 윈도우 및 (B_up) 윈도우의 업 변조 CSPE; 그리고 1138c에서, (A) 윈도우 및 (B_down) 윈도우의 다운 변조 CSPE의 3개의 복소 스펙트럼 위상 에볼루션(CSPE)을, 단일 채널 초해상 모듈에 대해 설명된 바와 같이, 실행하는 단계를 1138(a-c)에서 더 포함할 수 있다. 특정 비제한의 예에 따라, 입력을 취하고 여기에 기술된 방법을 구현할 때, 프로세서는 각각 주어진, 또는 "기본" 변환 해상도를 갖는 제1 세트 및 제2 세트의 주파수 영역 데이터를 수신하도록 구성될 수 있고, 이러한 프로세서는 또한, 정밀도가 기본 변환 해상도 보다 보통 크도록, 초고 정밀도의 해상도에서 성분 주파수를 추정하기 위해 여기에 더 기술된 바와 같이, 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하도록 구성될 수 있다. 여기에 사용된 바와 같이, "변환 해상도"는 변환 방법의 고유의 해상도 한계와 관련되어 있을 수 있는데, 예를 들어, DFT 또는 FFT가 초당 Q개의 샘플로 샘플링된 데이터로부터 취해진 N-포인트 샘플 윈도우에 대해 계산되는 경우에, DFT 또는 FFT는 N 개의 주파수 구간을 나타낼 수 있고, (당업계에 공지된 규격에 의해 규정된 바와 같이) 그 절반은 포지티브(또는 포지티브-스피닝) 주파수 구간에 상응할 것이고 나머지 절반은 네가티브(또는 네가티브-스피닝) 주파수 구간에 상응할 것이다. 이러한 방법에서 검출될 수 있는 최고 적절하게 샘플링된 신호는 N/2 개의 포지티브 주파수 구간으로 분할될 수 있는 Q/2의 주파수를 포함할 수 있어서, 구간 당 Q/N 헤르츠의 고유의 "변환 해상도"를 얻을 수 있다. 유사한 계산이 상응하는 "변환 해상도"를 결정하기 위해 다른 변환 기술중 하나에 대해 이루어질 수 있다. 일부 예에서, 주파수 영역 데이터에서 하나 이상의 오실레이터 피크를 식별하는 단계, 작용이 양호하고 및/또는 단기 안정한 진동 피크를 결정하기 위해 위에서 식별된 오실레이터 피크중 적어도 하나 근방의 적어도 하나의 포인트의 CSPE 반응을 검사하는 단계 및 식별된 오실레이터 피크의 추출을 실행하는 단계를 포함하는 피크 선택이 더 실행될 수 있다. 다른 예에서, 또한, 각 식별된 오실레이터 피크의 진폭 및 위상이 결정될 수 있고 고해상 공간으로부터 저해상 공간으로 맵핑하기 위해 싱글렛 변환/싱글렛 표현이 실행될 수 있다. 다른 예에서, 싱글렛 표현이 주파수 영역 데이터로부터 각 식별된 오실레이터 피크의 영향을 제거하기 위해 실행될 수 있다.
위와 여기에서 사용된 바와 같이, "주어진", "오리지널" 또는 "기본" 변환 해상도는 주파수 영역 데이터의 입력 데이터 세트를 제공하도록 사용될 수 있는, FFT와 같은 변환의 해상도, 즉, CSPE의 기본 빌딩 블록으로서 사용되는 변환의 고유의 해상도이다. CSPE 변환에 대한 추가 상세사항은 다음의 설명에서 설명될 수 있다.
예에서, 1138a 내지 1138c에서 CSPE를 실행하면 3개의 CSPE 윈도우, CSPE 윈도우(1114), CSPE_UP 변조 윈도우(1118), 및 CSPE_down 변조 윈도우(1120)를 생성할 수 있다. 일단 오실레이터 피크가 선택되면, CSPE, CSPE_up 및 CSPE_down의 피크 주변의 에어리어의 '편평도'가 분석될 수 있다. 포지티브 주파수 변조를 갖는 신호는 CSPE_up의 피크 주변에서 더 편평한 에어리어를 가질 수 있고, 네가티브 주파수 변조를 갖는 신호는 CSPE_down의 피크 주변에서 더 편평한 에어리어를 가질 수 있고, 비교적 낮은 양의 주파수 변조를 갖는 신호는 CSPE의 피크 주변에서 보다 편평한 에어리어를 가질 수 있다. 설명을 위해, '편평도'는 오실레이터 피크 근방의 주파수 구간이 거의 일정한 값에 맵핑되는 추정된 주파수(또는 그 등가의 측정값, A 및 B 윈도우에 대한 변환의 복소 공간의 유효 회전)의 플롯과 관련되어 있다. 방법 1100은 주파수 변조의 CSPE의 폭(1122), CSPE_up의 폭(1124) 및 CSPE_down의 폭(1128)을 각각 식별하기 위해 CSPE 윈도우(1114), CSPE_up 윈도우(1118) 및 CSPE_down 윈도우(1120)로부터 피크의 좌우의 값을 감산하는 단계를 1140(a-c)에서 더 포함할 수 있다. 주파수 변조가 검출되면, 1140에서 계산된 값, 즉, 값 1120-1124이 정확한 양의 주파수 변조를 보간하기 위해 1142에서 사용될 수 있다. 그 결과, 1130에서, 지시 변조율을 얻을 수 있다. 1144에서, 지시 변조율(1130)은 또한, 콘볼루션 분석(1148)에 더 사용될 수 있는, 고해상 주파수 영역 샘플(1132)을 얻기 위해 오실레이터 피크를 분석하고 제거하도록 FM HRW와 함께 사용될 수 있다.
예에서, FM 검출을 위한 방법이 상술될 수 있다. 복소 스펙트럼 위상 에볼루션 방법은 이전에 도입된 단시간 안정한 사인파 보다 복잡한 신호에 적용될 수 있도록 확장될 수 있다. 이러한 예에서, 주파수의 범위를 지나고 있을 수 있는 신호에 적용될 수 있고 광범위한 주파수를 규정할 수 있는 핵심 기초 파라미터를 양호한 정밀도로 결정할 수 있는 CSPE에 대한 변형이 도입될 수 있다.
연속 경우에서 선형 스위핑된 사인 신호를 규정하는 방법예는 다음과 같을 수 있다.
Figure 112014116389614-pct00175
여기에서, f0는 기초 주파수일 수 있고, δ/2는 주파수 변조율일 수 있고
Figure 112014116389614-pct00176
는 신호의 초기 위상일 수 있다. 신호가 이산 샘플링될 수 있는 경우에, 스위핑된 사인 신호의 편리한 형태는 다음과 같을 수 있다.
Figure 112014116389614-pct00177
여기에서, [0:N-1]는 0,1,2,...,N-1로 라벨 붙은 셈플의 벡터를 의미하도록 규정될 수 있고,
Figure 112014116389614-pct00178
는 자체와의 샘플 벡터의 아다마르/슈어 곱일 수 있다. 설명을 위해, 자체와의 벡터의 아다마르/슈어 곱은 이후로 아래의 설명에서
Figure 112014116389614-pct00179
로 간략화될 수 있다. 연산자
Figure 112014116389614-pct00180
는 이후로 아다마르/슈어 곱인 것으로 규정될 수 있다. 본 발명의 정신 및 범위로부터 벗어남 없이, 처음 2개의 항이 중괄호로
Figure 112014116389614-pct00181
로서 결합될 수 있지만, 또한, 결합되지 않은 형태로 쓰는 것이 편리할 수 있다. 상기 표기는 (당업자에 의해 때로 "해석 신호"로 부르는) 사인파의 복소 지수 형태를 나타낼 수 있지만, 이러한 복소 지수의 실수부 또는 허수부를 취함으로써 사인 또는 코사인 형태로 용이하게 다시 전환할 수 있다. 예에서, 벡터
Figure 112014116389614-pct00182
는 스위핑된 사인 신호로부터의 N 개의 포인트의 (복소화된) 샘플을 나타낼 수 있고, 아랫첨자가 벡터에 포함되는 마지막 샘플을 나타내기 위해 추가될 수 있어서, 예에서, 표시
Figure 112014116389614-pct00183
는 이러한 샘플의 벡터가 샘플 N-1에서 종료되었음을 나타내도록 사용될 수 있다(하지만 전체 N 개의 샘플이 벡터에 포함된 것을 의미한다). 결과적으로, 이러한 표기를 사용하여 N 개의 샘플의 다음 가능한 그룹은 다음과 같이 표현될 수 있다.
Figure 112014116389614-pct00184
기본적인 설명에서 설명된 CSPE 방법의 정신 및 범위에 따라, N 개의 샘플의 하나의 그룹으로부터 N 개의 샘플의 나중 그룹으로 신호의 에볼루션이 분석될 수 있다. 예에서, 이것은 아래와 같은 1-샘플 에볼루션 연산자(이것을 여러번 적용함으로써 하나 보다 많은 샘플에 의해 신호를 향상시킬 수 있다)가 되도록
Figure 112014116389614-pct00185
를 규정하기 위해 신호를 향상시킬 수 있는 에볼루션 연산자를 규정함으로써 달성될 수 있다.
Figure 112014116389614-pct00186
이로 인해
Figure 112014116389614-pct00187
는 각 입력이 값
Figure 112014116389614-pct00188
일 수 있는 길이 N의 벡터를 나타낼 수 있다. 그다음, 이것을 결합하고 리펙토링함으로써
Figure 112014116389614-pct00189
가 관찰될 수 있다. 이것은 지수부의 벡터 항의 다음과 같은 재배열에 의해 알 수 있다.
Figure 112014116389614-pct00190
여기에서, 마지막 단계는 다음과 같은 일반적인 항으로부터 나올 수 있다.
Figure 112014116389614-pct00191
따라서, 다음이 관찰될 수 있다.
Figure 112014116389614-pct00192
예에서, 에볼루션 연산자를 규정하는 기능은 중요할 수 있는데, 그 이유는 CSPE 방법의 기본 전제가 신호의 시간 전진된(time-advanced)(또는 일부 적용에서, 공간 전진된) 스냅샵을 신호의 오리지널 스냅샵과 비교한 후에 신호의 수학적 복원에 사용될 수 있는 기초 파라미터를 드러낼 수 있는 항을 분리하는 것이기 때문이다. 상술된 바와 같이, "주파수" f0는 샘플의 그룹의 제1 순시값에서 유지될 수 있고, 변조가 N 개의 샘플의 윈도우의 중심에서 순간 "주파수"에 상대적인 것으로 생각될 수 있도록 문제를 다시 표현하는 것이 보다 편리할 수 있다. "주파수" 주변에 인용부호가 놓였는데, 그 이유는 f0를 신호의 주기로 생각하고 항
Figure 112014116389614-pct00193
의 사인파 신호가 N 개의 샘플에서 정확하게 f0 주기를 관통할 수 있기 때문이다. 하지만, f0를 주파수로 부르는 것이 일반적일 수 있고 당업자는 사용에 따라 정확한 의미를 결정할 수 있다. 이러한 예에서, 변조는 초기 주파수 f0로부터 멀리 스위핑할 수 있고 이것을 N 개의 샘플의 그룹에서의 초기 순간 주파수를 f0으로 설정하는 것으로 볼 수 있다. N 개의 샘플의 그룹의 중심(센터)에서 일어날 수 있는 순간 주파수에 대한 변조로서 변조를 볼 수 있도록 변조 문제를 다시 표현하는 것이 가능하다. 이러한 센터링된 표현은 편리할 수 있어서 더 설명할 것이다.
예에서, 변조 신호의 생성은 안정 사인파로 시작될 수 있고, N 개의 샘플에 대한 Q 개의 주기는 다음이 되도록 취해질 수 있다.
Figure 112014116389614-pct00194
또한, (센터링된) 주파수 변조 생성 연산자(FMCO)는 다음과 같이 규정될 수 있다.
Figure 112014116389614-pct00195
그리고 FMCO가 샘플링된 사인파
Figure 112014116389614-pct00196
에 적용될 때, 그 결과는 다음과 같은 변조 신호,
Figure 112014116389614-pct00197
(여기에서 신호 에볼루션을 연구하는데 사용될 N+1 개의 포인트에 의해 규정된다)일 수 있다.
Figure 112014116389614-pct00198
여기에서 y는 선형 변조 신호일 수 있고, 순간 중심 주파수는 N 포인트 샘플 윈도우의 Q 개의 주기에 상응한다.
상술된 실시예에서, 선형 주파수 변조는 δ=1/N이라면 신호가 모든 순차 비중첩 N-포인트 샘플 윈도우에서 1 주기의 증가를 나타내는 방식으로 생성될 수 있다. 따라서, 주파수는 연속 및 선형 방식으로 증가할 수 있다고 생각할 수 있지만, 규정된 등식 구조는 (온전한 진동이 온전한 2π 간격을 통하는 통로가 되도록 규정될 수 있도록) 제1 N 개의 샘플에서 Q 개의 온전한 진동을 갖는 신호에 이를 수 있고, 그다음 N 개의 샘플에서, 신호는 Q+1개의 온전한 진동을 나타낼 수 있고, 그다음 N 개의 샘플에서 신호는 Q+2 개의 온전한 진동을 나타낼 수 있고, 기타 동일하다.
예에서, 변조 파라미터가 δ=2/N 이라면, 상기 공식은 (비중첩의) 모든 후속 N 개의 샘플의 윈도우에서 2 주기 만큼 증가할 수 있다. 대안의 예에서, 이러한 윈도우가 50% 만큼 중첩된다면, 각 후속 50% 중첩 윈도우에서 1 주기씩 증가시켜, 신호가 샘플 1 내지 N에 대해 Q 개의 온전한 진동을 나타낸다면, 샘플 N/2+1 내지 N/2+N의 50% 중첩 윈도우에 대해, 이러한 신호는 Q+1 개의 온전한 진동을 나타낼 수 있고 그다음 샘플 N+1 내지 2N의 50% 중첩 윈도우에 대해 신호는 Q+2 개의 온전한 진동을 나타낼 수 있다
마찬가지 예에서, 변조 파라미터가 δ=P/N 으로 취해진다면, 신호는 (비중첩의) 모든 후속 N 샘플의 윈도우에서 P 주기씩 증가를 나타낼 수 있다. 이러한 예에서, 신호 주파수의 공식은 주파수와 주기 사이의 통상적인 변환을 통해 Q (주기)의 값과 관련될 수 있다. 이러한 신호는 분석 윈도우의 중심의 순간 주파수가 윈도우에서 Q 개의 주기를 생성할 수 있는 주파수와 동일하도록 규정될 수 있다. 이러한 변조는 중심 주파수 주변에 있을 수 있다. 단시간 안정 사인파에 대해 CSPE에 유사한 방법을 전개시키고 이러한 방법을 변조 주파수로 확장하기 위해, 시간 진전된 신호 및 FMPO의 아다마르/슈어 곱으로부터의 최종 신호의 주파수 변환이 기껏해야 제1 신호의 변환으로부터의 위상 회전이 되는 방식으로 시간 진전된(또는 일부 경우에 공간 시프트된) 데이터에 동작할 수 있는 주파수 변조 풀백 연산자(FMPO)를 전개할 필요가 있을 수 있다.
예에서, FMPO는 아래와 같이 규정될 수 있다.
Figure 112014116389614-pct00199
이러한 예에서, 하수 단위 i의 부호는 업 풀백 오퍼레이션 또는 다운 풀백 오퍼레이션이 요구되는지에 따라 양 또는 음이 되도록 선택될 수 있다. 그다음, 신호를 변조하기 위한 CSPE는 다음과 같을 수 있다.
Figure 112014116389614-pct00200
이러한 결과의 전개는
Figure 112014116389614-pct00201
의 지수가 고려되고 인자
Figure 112014116389614-pct00202
는 전개를 위해 무시되는 다음의 공식으로부터 얻을 수 있다.
Figure 112014116389614-pct00203
여기에서, 상기 제1 라인으로부터 제2 라인으로의 변환은 다음과 같은 일반항을 고려하여 알 수 있다.
Figure 112014116389614-pct00204
상기 예에서, 모든 요소를 함께 놓음으로써
Figure 112014116389614-pct00205
의 결과를 얻을 수 있고 변조 CSPE를 위한 상기 결과가 얻어진다. 결과적으로, 변조 CSPE의 각도가 계산되고 N/(2π)에 의해 곱함으로써 더 표준화되면, 그 결과는 정확히
Figure 112014116389614-pct00206
가 될 수 있고 이러한 결과는 단일 변조 신호가 존재한다면 임의의 주파수 구간에서 발견될 수 있다. 실제, 다른 간섭 신호가 존재할 수 있지만, 그 결과는 변조 신호와 연관된 스펙트럼 피크 주변의 영역에 여전히 유지될 수 있다. 결과적으로 이러한 계산은 주파수 영역에서 국부 동작을 가능하게 했을 것이라는 결론에 도달할 수 있고, 이로 인해 국부 동작이 훨씬 더 정교할 수 있다. 당업자가 Q 및 δ를 분리한다면, 변조 신호는 정확하게 상술된 범위에 기술된 바와 같이 변조 신호 생성을 사용하여 재생성될 수 있다.
δ의 정확한 값을 결정하는 실시예에서, 변조율의 세트에 대한 변조 CSPE이 계산되고 이러한 최종 계산으로부터, δ의 정확한 값에 대한 보외법 또는 보간법을 행할 수 있다. 이러한 보외법은 변조율의 소수의 값에 대한 CSPE 및 변조된 CSPE의 계산후에, 리맵핑된 스펙트럼 피크의 폭을 측정함으로써 행해질 수 있다. 그다음, 이러한 변조의 정확한 값은 제로 근방의 폭의 스펙트럼 피크를 생성하는데 사용될 수 있고, 이러한 스펙트럼 피크의 폭이 변조율과 거의 선형으로 변하기 때문에, 제로 근방의 폭 피크를 생성할 수 있는 변조율과의 값을 추정하기 위해 보간법 또는 보외법을 사용할 수 있다. 이로 인해, 존재할 수 있고 상이한 변조율을 가질 수 있는 다수의 상이한 신호 성분에 대한 독립적인 변조 파라미터(즉, δ 값)의 계산을 허용하는 이익을 얻을 수 있다. 제2 접근법은 최적 변조율에 수렴하도록 반복 방법을 사용하는 것이 될 수 있다. 어느 경우에든, 모든 주파수 구간에서 파워를 취하고 이것을
Figure 112014116389614-pct00207
의 국부 측정된 값에서 재도표화함으로써 얻어지는 델타 함수와 같은 스펙트럼의 존재에 의해 희망의 결과가 검출될 수 있다. 이것은 δ의 정확한 값이 사용될 때 델타 함수로 스펙트럼을 감소시키는 것을 도울 수 있다. 다수의 상이한 변조 신호가 존재한다면, 스펙트럼 피크 p k 와 연관된 신호가 변조율 δ k 를 가질 수 있고 변조 CSPE가 δ k 에 의해 대체된 δ에 의해 계산될 수 있는 경우에, 국부적으로 피크 p k 주변의 최종 스펙트럼은 델타 함수와 유사할 수 있다. 그래서, 보외법/보간법을 통해, 또는 반복을 통해, (Q에 상응하는) 중심 주파수 값 또는 선형 변조 신호를 위한 변조율을 분리는 것이 가능할 수 있다.
예에서, 결합된 AM/FM 검출에 대한 방법이 규정될 수 있다. 따라서, 이제까지 설명된 진폭 및 주파수 변조 검출을 위한 방법은 주파수 변조 또는 진폭 변조를 검출하는데 사용될 수 있지만, 양측 모두를 위해 사용될 수는 없다. 이러한 기술을 연접된 체계로 집약하는, 혼합된 AM/FM 검출, 및 트래커 지원형 변조 검출을 갖는/갖지 않는, 다양한 판정 트리를 포함하는 다수의 방법이 존재할 수 있다. 판정 트리의 예는 아래에서 설명될 것이다.
신호 처리 방법예에서, 주파수 변조 및 진폭 변조는 구별불가능하거나 내부 혼합될 수 있다. 이러한 방법은 이러한 변조를 복소 평면으로 맵핑하여 방사형 변화가 진폭 변조로서 여겨지고 각도 변화가 주파수 변조로서 여겨지고 공분산 행렬이 추적 방법으로 출력될 수 있는 단계를 포함할 수 있다. 그다음, 이러한 트래커는 변조의 어느 부분이 진폭 변조로서 보다 양호하게 또는 보다 효과적으로 특성화되어 있는지 그리고 어느 부분이 주파수 변조로서 보다 양호하게 또는 보다 효과적으로 특성화되어 있는지를 결정하기 위해 시간에 대해 계산된 정보를 사용할 수 있다.
도 12는 AM/FM 검출을 결합하는데 사용될 수 있는 판정 트리(1200)를 사용한 방법예를 설명하고 있다. 이러한 검출 트리 방법(1200)은 CSPE 주파수 스펙트럼(1202)을 위한 변조의 소스를 식별하기 위해 CSPE 트위스트를 사용하는 단계를 포함할 수 있다. 이러한 방법 1200은 도 12에 도시된 3개의 프로세스예중 하나를 실행하기 위해 식별 단계 1204로부터 얻어진 변조 추정 1208을 사용하는 단계를 더 포함할 수 있다. 제1 예에서, 변조 추정 1208은 AM 특징의 신호를 제공할 수 있다. 제2 예에서, 변조 추정 1208은 혼합된 AM/FM 1212를 갖는 신호를 제공할 수 있고, 제3 예에서, 변조 추정 1208은 FM 특징의 신호 1214를 제공할 수 있다. 그다음, 이러한 판정 트리 방법 1200은 AM 특징의 신호 1210 및 AM/FM가 혼합된 신호 1212에 대한 윈도우 타입 검사를 실행하는 단계를 1218 및 1220에서 포함할 수 있다. 방법 1200은 예에서, 또한, FM 특징의 신호 1214에 대한 FM 속도를 보간하는 단계 1222에서 포함할 수 있다. 그다음, 방법 1200은 윈도우 타입 검사 1218-1220를 실행한 후에 얻어진 윈도우로부터 적용가능한 윈도우를 선택하는 단계를 1224 및/또는 1228에서 포함할 수 있다. 예에서, 이러한 방법은 1222에서 실행된 보간법 후에 정확한 FM 윈도우를 선택하는 단계를 1230에서 포함할 수 있다.
방법 1200은 1232-1234에서 윈도우 부분집합을 얻는 단계 및/또는 1224-1230에서 실행된 단계에 기초한 최근방 FM 윈도우를 1238에서 얻는 단계를 더 포함할 수 있다. 이러한 방법은 1240에서, 즉 1240a 및 1240b에서, 윈도우 부분집합 1232-1234에 대한 윈도우 파라미터를 보간하는 단계를 더 포함하여 1242에서, 추정된 윈도우 파라미터 1242a 및 추정된 윈도우 파라미터 1242b와 같은 추정된 윈도우 파라미터를 얻을 수 있다. 방법 1200은 1244에서, 추정된 윈도우 파라미터 1242에 대해 콘볼루션 분석을 행하는 단계를 더 포함할 수 있다. 또한, 방법 1200은 1248에서, 콘볼루션 분석 1244의 결과 및/또는 최근방 FM 윈도우 1238에 대한 잔류 오류 1248를 식별하는 단계를 포함할 수 있다. 이러한 에러에 기초하여 방법 1200은 1250에서, 가장 잘 맞는 윈도우, 변조, 진폭 및 위상을 선택하는 단계를 포함하고, 이러한 선택의 결과를 추정된 신호 파라미터 1252로서 제공하는 단계를 포함할 수 있다. 그 가장 단순한 형태로, 방법 1200은 비변조 사인파에 대한 피트-에러를 계산하는 단계, 다양한 AM HRW에 대한 피트-에러를 계산하는 단계, 최근접 유용한 FM HRW에 대한 피트-에러를 계산하는 단계, 및 최초 잔류 오류를 산출할 수 있는 HRW 및 피트 파라미터를 선택하는 단계를 포함함으로써 반복될 수 있다.
상기 단계가 종래의 FFT 기반 분석 보다 효과적으로 변조 효과를 검출할 수 있지만, AM 및 FM 모두를 동시에 검출할 수 있도록 하는 보다 정교한 판정 트리가 사용될 수 있다. 예에서, 이러한 정교한 판정 트리는 이전에 설명된 하나 이상의 FM 검출 방법중 하나를 사용하여 명백한 주파수 변조를 계산하는 단계를 포함할 수 있다. 이러한 주파수 변조는 이후로 '지시된 변조율'로 부를 수 있다. 이러한 정교한 판정 트리는 이러한 지시된 변조율이 경계를 벗어나거나 제로에 가까운지를 결정하는 단계를 더 포함할 수 있다. 이러한 지시된 변조율이 경계를 벗어나거나 제로에 가까우면, 변조는 진폭 효과가 우세할 수 있다. 따라서, 진폭 변조 윈도우가 상술된 복수의 AM 검출 방법중 하나를사용하여 이러한 지시된 변조율을 분석하는데 사용될 수 있다.
이러한 정교한 판정 트리의 예에서, 이러한 지시된 변조율이 특정 범위내에 있다면, 신호는 진폭 및 주파수 변조 모두에 의해 영향을 받을 수 있다. 따라서, 정교한 판정 트리는 AM/FM HRW의 세트를 선택하는 단계를 포함할 수 있다. 예에서, 진폭 변조는 CSPE 편평도 계산의 결과를 왜곡시킬 수 있다. 예를 들어, 윈도우 2 주기의 포지티브 주파수 변조를 갖는 사인파는 2.0의 지시된 변조율을 생성할 수 있지만, 동일한 사인파가 역시 진폭이 증가하고 있다면, 2.18의 지시된 변조율을 생성할 수 있다. 이러한 효과는 사전결정될 수 있고, 교정 테이블이 생성될 필요가 있을 수 있다.
하나 이상의 예에 따라, 진폭 변조 및 주파수 변조가 식별불가능하거나 상호혼합된 상황이 존재할 수 있다. 이러한 경우에, 이전 샘플 윈도우의 오실레이터의 동작의 지식이 참 변조를 식별하는데 사용될 수 있다. 예를 들어, 이러한 오실레이터 피크가 주파수가 떨어진 데이터의 트래클렛과 관계가 있다면, 주파수가 계속 떨어질 가능성이 높다. 일부 예에서, 피크 검출 프로세스는 트래커의 상태를 인식하여 이러한 추론을 할 수 있다. 다른 예에서, 이러한 피크 검출 프로세스는 트래커에 의해 마무리될 수 있는 애매한 정보를 출력할 수 있다. 또한, 일부 예에서, 피크 검출기는 아마도 AM/FM 결합으로 시작하여, AM/FM 검출 판정 트리에서 보다 적은 수의 단계를 사용하기 위해 이러한 트랙 정보를 사용할 수 있다.
하나 이상의 예에 따라, 이전에 설명된 다중 채널 초해상 방법은 출력으로서, 개별적인 오실레이터 성분 및 이들의 각 채널과의 관계를 나타내는 파라미터 세트를 가질 수 있다. 이러한 파라미터의 세트에서, 각 파라미터는 통합 영역 재합성 방법등의 사용에 의해 오실레이터를 정확하게 복원하도록 요구될 수 있는 정보를 포함할 수 있다. 바람직한 예에서, 이러한 정보는 일반적으로, 적용될 수 있는 임의의 적절한 진폭 또는 주파수 변조 파라미터는 물론 각 채널에 오실레이터의 주파수, 진폭, 통합 영역 시그마, 진폭 변조, 주파수 변조, 및 위상을 포함할 수 있다. 이러한 통합 영역 시그마는 각 채널로부터 유도될 수 있는 신호의 부분을 나타낸다.
비제한된 실시예에 따라, AM 및 FM 변조가 AM 및 FM 특성에 대한 초해상을 얻기 위해 단기간 윈도우에서 검출될 수 있다. 다른 실시예에서, 여기에 기술된 하나 이상의 주파수 변조 풀백 연산자는 적어도 하나의 세트의 샘플 데이터에 적용될 수 있다.
비제한된 실시예에 따라, 샘플 윈도우의 주파수 변조가 검출될 수 있다. 그다음, 복수의 주파수 변조 풀백 연산자(FMPO)가 적어도 보간법, 선형 보간법, 외간법 및 반복중 하나 이상을 받은 결과를 갖는 샘플 데이터의 세트에 적용되어 실제 변조율의 향상된 추정값을 제공할 수 있다. 일부 예에서, 복수의 FMPO는 "업", "다운" 및 "중립" 동작중 적어도 2개를 포함할 수 있다.
상술된 CSPE의 수정에서, 특정 실시예에 따라, "해밍 윈도우" 또는 다른 규격 윈도우 함수 또는 "테이퍼"와 같은 샘플 윈도우가 사용될 수 있지만, FM 입력 신호를 처리할 때, 이후로 비공식적으로 "트위스트 벡터"로 부를 수 있는 다른 벡터(FMPO - 주파수 변조 풀백 연산자)가 삽입될 수 있다. 보통, FM 신호는 시간 지연된 버전을 수신함에 따라 주파수가 이동할 수 있다. 또한, AM 신호는 강체 회전자와 같이 시간에 따라 전개되는 경향이 있지만 규격 CSPE에 사용된 분석 윈도우의 효과의 경우와 달리, AM 변조 경우에 AM 윈도우는 데이터의 일부일 수 있다. 따라서, AM 윈도우의 "강체 회전자"의 회전을 검출할 때, 시간 지연된 버전으로 AM 윈도우의 시프트를 허용해야만 한다. 주파수 변조 경우에 대해, FMPO를 적용하면 FM 주파수를 강체 회전자와 같이 변할 수 있는 뭔가로 다시 되돌릴 수 있고, 이로부터 주파수 및 각도 회전이 검출될 수 있다. 그다음, 주파수 변조 표현을 위한 기준 "기초" 또는 "앵커" 포인트 및 FM 변조를 유도할 수 있다.
비제한의 다른 실시예에 따라, AM 및 FM 변조는 AM 및 FM 시간 윈도우를 위한 초해상도를 달성하기 위해 단시간 윈도우에 검출될 수 있다. 그다음, 복소 스펙트럼 위상 에볼루션(CSPE)가 기본 변환 해상도 보다 클 수 있는 해상도 및/또는 정밀도에서 성분 주파수를 추정하기 위해 주파수 영역 데이터에 실행될 수 있다.
예에서, AM 신호의 진폭 효과는 샘플의 지연된 윈도우에 비교하여 샘플의 제1 스냅숏 또는 윈도우에서 상이할 수 있다. 이러한 진폭 효과가 어떻게 변하는지를 설명하면 CSPE로부터 기초 신호를 유도할 수 있다. 반대로, 상술된 바와 같이, FM 신호에 의해, FMPO가 기초 FM 반응을 유도하는데 사용될 수 있다. AM 신호에 의해, 진폭 효과의 에볼루션이 고려될 수 있다.
예에서, 진폭 변조 윈도를 생성하는 단계는 안정한 신호를 취하는 단계, 진폭 효과를 적용하는 단계 및 이러한 결과를 고해상 FFT에 넣는 단계를 포함할 수 있다. 이어서 진폭 포락선이 상방으로 기울어진 AM 효과, 진폭 포락선이 하방으로 기울어진 AM 효과, 진폭 포락선이 데이터 샘플의 임의의 포인트에서 시작하거나 중지된 AM 효과, 진폭 포락선이 상방 또는 하방으로 기우는 단계 또는 변동이 없는 단계 또는 하나의 AM 포락선 상태로부터 다른 AM 포락선 상태로 부드럽게 전이하는 단계를 포함할 수 있는 효과의 조합을 가질 수 있는 AM 효과, 및 이러한 상태의 임의의 조합을 포함하고 이에 제한되지 않는 다양한 진폭 변조 효과를 고려함으로써, 일련의 고해상 오실레이터 피크를 유도할 수 있고, 이러한 오실레이터 피크로부터, 적용된 효과중 어느 것이 주파수 스펙트럼의 주어진 성분과 가장 잘 맞는지를 결정할 수 있다.
일부 예에서, 복수의 진폭 효과는 사전계산될 수 있고 분석 윈도우에 의해 곱해질 수 있다. 다음으로, 이러한 진폭 효과는 고해상 FFT 또는 다른 변환을 통해 주파수 영역으로 전환될 수 있고 신호에서 검출된 스펙트럼 피크와 비교되어 이러한 스펙트럼 피크의 관찰된 구조와 연관될 수 있는 진폭 변조 효과를 결정할 수 있다. 이러한 AM 효과의 예는 진폭 포락선이 상방으로 기우는 AM 효과, 진폭 포락선이 하방으로 기우는 AM 효과, 진폭 포락선이 데이터 샘플의 임의의 포인트에서 시작하거나 중지된 AM 효과, 진폭 포락선이 상방 또는 하방으로 기우는 단계 또는 변동이 없는 단계 또는 하나의 AM 포락선 상태로부터 다른 AM 포락선 상태로 부드럽게 전이하는 단계를 포함할 수 있는 효과의 조합을 가질 수 있는 AM 효과, 및 이러한 상태의 임의의 조합을 포함할 수 있지만 이에 제한되지 않는다.
비제한된 다른 실시예에 따라, 가능한 공지된 진폭 효과의 라이브러리 내의 주지된 진폭 효과와 같은 복수의 진폭 효과가 기준 신호에 차례로 적용된 다음, 이러한 기준 신호에 고해상 변환/FFT가 적용될 수 있다. 신호의 복소 스펙트럼 위상 에볼루션 표현에서, 일부 진폭 효과에 의해 수정된 기초 신호의 오실레이터 피크가 분석되어, 가능한 진폭 효과의 세트중 어느 것이, 기초 신호/안정한 오실레이터에 적용될 때, 기초 신호의 실제 오실레이터 피크에 가장 잘 맞는 결과를 얻을 수 있는지를 결정할 수 있다. 신호가 인공 소리와 비교하여 음성인지와 같은 신호의 배경에 대해 알려진 정보가 어떤 진폭 효과가 기초 신호의 시간에 대한 진폭의 변화의 최상의 표현이 될 가능성이 높은지에 대한 판정을 더 도움이 되도록 사용될 수 있다.
비제한의 실시예에 따라, 과도 신호 요소(시작 및 중지)가 초해상 신호 처리 방법에서 AM 신호로서 처리될 수 있다. 시작 및 중지에 더하여, 상승, 하강 또는 일반적인 포락선을 포함하고 이에 제한되지 않는 다른 과도 신호 요소가 그렇게 처리될 수 있다. 단시간에 일어나는 선명한 잡음이 임의의 범위에서 일시적인 것으로 여겨질 수 있는데, 이러한 잡음의 단시간 지속시간은 샘플 윈도우 시간 보다 짧다. 짧은 충분한 이벤트가 매우 선명한 포락선을 갖는 경향을 나타낼 수 있고, 이러한 포락선 자체는 AM 효과와 같을 수 있다. 그 결과, 일부 예에서, 본 방법은 일시적인 신호 요소 자체를 AM 신호 효과로 나타내는 것으로 이러한 신호 요소를 처리하도록 구성될 수 있다.
하나 이상의 예에 따라, 도 2에 도시되어 있고 이후로 신호 성분 트래커(214)로 부르는 신호 성분 트래커/집합기/선택기/분리기(214)를 설명할 것이다. 하나 이상의 예에 따른 신호 성분 트래커(214)의 기능은 오실레이터 피크를 그룹화하고 추출한 다음 재합성하거나 출력 포맷중 하나로 출력하는 것일 수 있다.
도 13은 신호 성분 트래커에 의해 실행되는 방법 1300의 예를 도시하고 있다. 이러한 신호 성분 트래커는 단일 채널 초해상 모듈 또는 통합 영역 초해상 모듈에 의해 구성되는 신호 오실레이터 피크의 세트를 수신하도록 구성될 수 있는 입력 모듈을 포함할 수 있다. 신호 오실레이터 피크는 추적 방법에 의해 구조 및 구성이 주어질 수 있다. 이러한 오실레이터 피크는 오실레이터 피크의 세트로 구성될 수 있는데, 여기에서 세트의 각각의 멤버는 동일한 오실레이터("트래클렛")에 의해 유발되도록 결정될 수 있다. 방법 1300은 1304에서, 동일한 오실레이터로부터 피크를 식별하기 위해 주파수, 크기, 통합 영역 시그마, 및 다른 속성을 포함할 수 있는 연관 기준을 사용하여 '트래클렛'을 연관시키도록 입력 모듈(1302)에 의해 제공된 입력을 사용하는 단계를 포함할 수 있다. 방법 130은 1308에서, 이러한 '트래클렛'을 하나 이상의 "코히어런트 그룹"으로 그룹화하기 위해 동일한 소스에 의해 생성된 트래클렛의 세트를 식별하도록 이러한 트래클렛을 이들의 고조파 관계를 사용하여 연관시키는 단계를 더 포함할 수 있다. 이러한 트래클렛의 그룹화는 당업계에 공지된 복수의 추적 알고리즘중 하나를 사용하여 수행될 수 있다. 또한, 방법 1300은 1310에서, 이러한 코히어런트 그룹을 선택하는 단계, 1312에서, 이러한 코히어런트 그룹을 분리하여, 재합성을 위해, 여과된 오실레이터 피크 행렬을 제공하는 단계(1314)를 포함할 수 있다.
예에서, 당업계에 알려진 추적 알고리즘은 다중 가설 추적(MHT, Multi Hypothesis Tracking) 방법을 포함할 수 있다. 이러한 방법은 정확한 연관을 확인할 수 있는 데이터가 수신될 때까지 다수의 가능한 데이터 연관을 보존하는 단계를 포함할 수 있다. 일부 다른 예에서, 이러한 추적 알고리즘은 Greedy, Munkres, 또는 JVC와 같은, 트래클렛을 오실레이터 피크에 연관시키는 다른 주지된 알고리즘을 사용할 수 있다. 알고리즘에서, 칼만 필터는 주파수 및 진폭을 포함하고 이에 제한되지 않는 수차원으로 트래클렛의 운동을 예측하도록 적용될 수 있다. 또한, 주지된 그룹핑 알고리즘은 유니온 파인드(Union Find)와 같은 동일한 소스로부터 나오는 트래클렛을 식별하는 문제에 적용될 수 있다. 예를 들어, 소스의 고조파 패턴을 사용하여 개별적인 신호원을 식별함으로써 동작하는 지문 추적 알고리즘이 사용될 수 있다.
따라서, 비제한의 실시예에 따라, 신호 처리 방법은 오실레이터의 시간 에볼루션의 표현을 형성하는, 신호를 초해상 분석하고 트래클렛의 주파수 그룹으로 그룹화하는 단계 및, 이러한 데이터를 그룹화 알고리즘을 통해 코히어런트 그룹의 트래클렛으로 모아서 신호 내의 코히어런트 그룹의 주파수를 식별하는 단계를 포함할 수 있다. 이러한 트래클렛으로의 그룹화는 신호원이 시간에 따라 변함에 따라 왕래할 수 있는 단시간 안정한 오실레이터를 식별하도록, 칼만 필터와 같은 추적 알고리즘, 그리디 연관 또는 당업자에게 알려진 임의의 다른 이러한 알고리즘을 사용하여 실행될 수 있다. 이러한 데이터는 유니온 파인드와 같은(이에 제한되지 않는다) 주지된 추적 그룹화 알고리즘의 조합을 사용하여 트래클렛의 코히어런트 그룹으로 더 분할될 수 있다.
일부 예에서, 분석은 신호 요소를 트래클렛으로 모으는데 사용될 수 있다.
일부 예에서, 신호 요소를 코히어런트 그룹으로 모으는데 분할이 사용될 수 있다.
일부 예에서, AM 및 FM 효과가 트래클렛에 포함된 오실레이터 피크의 주파수 및 진폭의 측정된 에볼루션을 사용하여 검출되고 및/또는 보정될 수 있다.
일부 예에서, 트래클렛 또는 코히어런트 그룹의 주파수 및 진폭의 에볼루션이 음성 또는 논-음성을 식별하는데 사용될 수 있다. 예를 들어, 음성은 시간이 지남에 따라 주파수를 통해 곡선을 이루는 경향이 있지만, 논-음성은 자주 시간에 따라 진행함에 따라 주파수가 편평하다.
일부 예에서, 오실레이터 피크, 트래클렛 및 코히어런트 고조파 그룹을 보기 위해 인터페이스가 사람에게 제공될 수 있다.
일부 예에서, 어느 오실레이터 피크, 트래클렛 및 고조파 그룹이 출력되거나 강조될 수 있는지를 시스템이 결정하도록 사람이 도울 수 있다.
일부 예에서, 시스템은 어느 오실레이터 피크, 트래클렛 및 고조파 그룹이 유지되어야 하는지에 대해 사람의 선택으로부터 학습될 수 있다.
일부 예에서, 시스템은 개별적인 화자 또는 신호원의 목소리 패턴을 학습할 수 있다. 이러한 패턴은 고조파 분리, 주파수 및/또는 진폭의 변화율, 또는 오실레이터 피크에 포함될 수 있는 임의의 다른 데이터의 집합을 포함할 수 있다.
일부 예에서, 이러한 오실레이터 피크 검출, 추적 및 그룹핑 프로세스가 오디오 신호에 대해 사용될 수 있다.
일부 실시예에서, 이러한 오실레이터 피크 검출, 추적 및 그룹핑 프로세스가 RADAR, SONAR, LIDAR, 및 소리/오디오, 비디오 및 진동 센서를 포함하고 이에 제한되지 않는 임의의 신호에 대해 사용될 수 있다.
일부 예에서, 트래클렛은 코히어런트 그룹을 형성하도록 사용될 수 있다. 이러한 코히어런트 그룹을 형성하는 프로세스는 추적에서 "분할(partitioning)"로 부른다. 예를 들어, 음원에서, 각 트래클렛은 고조파를 제공할 수 있다. 트래클렛은 보통 주파수, 시간 및 도착의 검출(즉, 통합 영역의 시그마와 관련되어 있다)을 통해 이동할 수 있고, 이러한 트래클렛을 통해 진폭이 변할 수 있다. 여기에 사용된 "그룹핑"은 함께 이동하고 있을 수 있고 하나의 코히어런트 소스로부터 나올 수 있는 트래클렛 사이에서 고조파를 발견하려는 것과 관련되어 있을 수 있다. 시각적으로 볼 때, 아래에 기술된 바와 같이, 소리 신호의 시간-주파수 표현의 스위핑 커빙 라인은 보통 음성을 나타낼 수 있고, 편평한 수평 라인은 자주 차 알람 소리와 같은 인공적인 잡음을 나타낼 수 있다. 그 결과, 자연적으로 발생하는 잡음이 인공적인 소리에 대하여 예를 들어, 분할의 형상 및 타입에 의해 분리될 수 있다. 또한 분리는 분석 프로세스에서 계산될 수 있는 임의의 다른 파라미터에 기초할 수 있다. 그 결과, 자동화된 알고리즘이 주어진 적용을 위해 요구되는 대로 인공 사운드를 제거하거나 인공 사운들르 강화하도록 채용될 수 있다. 비제한의 실시예에 따라, 사용자 인터페이스가 요구되는 트래클렛 또는 코히어런트 그룹에 속하는 것으로서 그리고 시간 요소의 편집으로부터의 피드백에 기초한 신호의 요소의 스코어링으로서 신호를 식별하기 위해 시간 표현을 편집하기 위해 복수의 잠재적인 코히어런트 트래클렛으로서 신호를 보기 위해 제공될 수 있다. 다른 실시예에서, 개인으로부터의 음성에 기초하는 것과 같은 소리 신호가 개인에 의해 생성된 신호에 상응하는 트래클렛의 그룹화를 도울 수 있는 파라미터를 식별하기 위해 도입될 수 있다. 이러한 방식으로, 화자에 대해 설정된 특성 특징부를 유도하도록 화자의 패턴을 학습하는 것을 실행할 수 있다. 다른 실시예에서, 개안에 의해 나온 음성은 소스/개인의 공지된 특징 또는 "지문" 특유의 통합 영역 파라미터에 기초한 음성의 "지문 채취"에 기초하여 식별될 수 있다. 다른 실시예에서, 이러한 원신호는 본 발명의 범위에서 논의되는 신호의 임의의 타입중 하나일 수 있다.
주지된 추적 알고리즘에서, 트래커는 출력 품질을 향상시키기 위해 새로운 알고리즘을 채용할 수 있다. 예를 들어, 위상 예측 알고리즘이 동일한 음원으로부터 2개의 피크가 나올 가능성을 예측하는데 사용될 수 있다. 예에서, 피크 보정이 위상 예측을 사용하여 실행될 수 있다.
도 14는 위상 예측을 사용할 수 있는 신호 성분 트래커(214)에 의해 실행되는 방법 1400의 예를 도시하고 있다. 방법 1400은 도 13에 설명된 연관 기준에 더하여 '트래클렛'을 연관시키기 위한 기준으로서 위상 예측을 사용할 수 있다. 일부 예에서, 주파수-위상 예측의 출력에 의해 트래커는 오실레이터 피크와 연관된 파라미터를 재계산할 수 있다. 일부 예에서, 피크 보정이 근접을 사용하여 실행될 수 있다. 예를 들어, 트래커는 2개의 오실레이터 피크가 간섭하고 있는지를 계산할 수 있고, 이러한 간섭을 보정하기 위해 추적 상태 정보를 사용할 수 있다. 그다음, 오실레이터 피크가 출력을 제공하기 위해 선택될 수 있다.
예에서, 피크 선택의 방법은 통합 영역 시그마, 주파수 및 진폭과 같은 파라미터를 사용하여 피크를 평가하는 단계, 통합 영역 시그마, 주파수 및 진폭과 같은 파라미터를 사용하여 피크가 속한 트래클렛을 평가하는 단계, 통합 영역 시그마, 주파수, 및 진폭과 같은 파라미터를 사용하여 피크가 속한 코히어런트 그룹을 평가하는 단계, 피크가 속한 코히어런트 그룹이 희망의 화자와 매치하는지를 평가하는 단계, 트래클렛이 '직접 경로' 소스인 것으로 나타나는지를 식별하기 위해 고조파 "지문 채취"를 사용하여 주파수-위상 예측을 사용하는 단계를 포함할 수 있고(하지만 이에 제한되는 것은 아니다), 트래클렛의 또는 코히어런트 그룹의 파라미터를 평가할 때, 또는 통합 영역 시그마를 위상 정보와 결합함으로써 거리를 추정할 때 피크 예측 검사를 통과하지 못하는 피크의 파라미터를 무시할 수 있다.
상술된 바와 같이, 트래클렛은 하나의 소스 고조파로부터 나오는 것으로 결정될 수 있는 오실레이터 피크의 그룹화로서 규정될 수 있다. 예에서, 트래클렛 정보 프로세스는 단일 샘플 윈도우로부터 추출된 오실레이터 피크의 세트를 포함하는 입력에 기초하여 실행될 수 있다. 트래클렛은 그다음, 많은 상이한 주지된 추적 연관 방법 및 알고리즘을 사용하여 형성될 수 있다. 이러한 알고리즘은 트래클렛 포워드를 예측할 수 있는 방법, 트래클렛과 데이터의 새로운 부분(이러한 경우에, 오실레이터 피크) 사이의 연관의 비용을 계산할 수 있는 방법, 및 할당의 최적 세트를 선택할 수 있는 방법을 포함할 수 있다. 예로서, 트래클렛 예측 알고리즘은 선형 예측 및 칼만 필터 예측을 포함할 수 있지만 이에 제한되는 것은 아니다. 일부 예에서, 비용 추정 알고리즘은 마할라노비스 거리와 같은 통계학적 거리 계산과, 주파수 및 진폭의 차이와 같은 단순한 거리 계산을 포함할 수 있지만 이에 제한되는 것은 아니다. 또한, 예에서, 할당 알고리즘이 그리디 연관(Greedy Association), 먼크레스 연관(Munkres Association) 및, JVC 연관을 포함할 수 있지만 이에 제한되는 것은 아니다.
트래클렛 정보 프로세스의 출력은 트래클렛으로 형성된 오실레이터 피크의 세트를 포함할 수 있다.
상술된 바와 같이, 일부 예에서, 코히어런트 그룹을 형성하는 것이 바람직할 수 있다. 코히어런트 그룹은 동일한 음원에 의해 생성되는 것으로 결정될 수 있는 트래클렛의 세트일 수 있다.
비제한의 실시예에 따라, 신호 처리 방법은 초해상 분석, 신호 요소를 시간상의 스냅샵으로부터 주파수 트래클렛으로 할당하는 단계(시간상의 스냅샵은 초기 시작에서 시작하고 최종 시간에서 종료하는 데이터의 샘플 윈도우를 사용하는 단계, 이것을 분석 윈도우에 의해 곱하는 단계, 및 이것을 주파수 영역으로 전환하는 단계를 가리킬 수 있다), 즉, 신호 내의 주파수 트래클렛을 식별하기 위해 추적 알고리즘에 의해 데이터를 트래클렛으로 구성하는 단계, 및 트래클렛을 코히어런트 그룹으로 그룹화하는 것을 돕기 위해 주파수, 도착 각도, 진폭, 및 추적의 진폭의 경사중 적어도 하나를 사용하는 단계를 포함할 수 있다.
상술된 바와 같이, 일부 예에서, 코히어런트 그룹을 형성하는 것이 바람직할 수 있다. 코히어런트 그룹은 동일한 음원에 의해 생성되는 것으로 판정된 트래클렛의 세트일 수 있다. 예에서, 코히어런트 그룹은 트래클렛의 세트를 입력으로 수신할 수 있는 프로세스에 의해 형성될 수 있다. 그다음, 이러한 트래클렛의 세트는 공통 요소를 갖지 않은 세트로 분할될 수 있다. 이러한 트래클렛의 세트를 공통 요소를 갖지 않은 세트로 분할하기 위한 다수의 주지된 알고리즘이 존재한다. 예를 들어, 유니온 파인드 알고리즘이 채용될 수 있다. 대부분의 알고리즘에 있어서, 2개의 트래클렛이 동일한 소스로부터 나올 가능성을 계산하기 위해 비용 함수를 계산할 필요가 있을 수 있다. 이러한 비용 함수는 주파수, 진폭, 통합 영역 시그마, 및 위상을 포함하고 이에 제한되지 않는 오실레이터 피크의 싱글렛 표현에 저장된 특징중 하나를 사용할 수 있다. 이러한 비용 함수는 화자의 고조파 구조의 지식에 의존할 수 있다. 코히어런트 그룹 형성 프로세스를 실행한 결과로서, 출력으로서, 코히어런트 그룹으로 형성된 트래클렛의 세트가 생성될 수 있다.
비제한의 실시예에 따라, 통합 영역 방향성 추정값이 트래클렛의 출력된 세트와 함께 사용되어 관심의 트래클렛을 식별할 수 있다.
일부 실시예에서, 시간 및 주파수를 통해 오실레이터가 변함에 따라 위상의 에볼루션을 예측하는 것이 바람직할 수 있다. 예측된 위상의 지식은 피크가 특정 트래클렛과 연관되어야 하는 가능성을 스코어링하는 단계, 간섭 신호로부터 결과의 검출 및/또는 수리, 떨어져 나가거나 손실된 신호의 검출 및/또는 수리, 비직접 통로 신호에 대한 직접 통로의 검출, 압축 알고리즘 및 트래클렛의 코히어런트 그룹으로의 연관을 포함하는 (하지만 상기 설명에 설명된 동작에 제한되지 않는다) 다수의 단계의 처리에서 사용될 수 있다.
예에서, 신호의 기본 모델은 일반적인 복소 형태
Figure 112014116389614-pct00208
의 실수부로의 투사로서 취해질 수 있다. 또한, 예를 들어, 단기간 동안 진폭 항은 일정할 수 있다면, 즉,
Figure 112014116389614-pct00209
로 가정하면, 신호의 변화율은 θ의 변화율과 관련되어 있을 수 있고 그다음 이것은 순간 주파수와 관련될 수 있다. 이것은
Figure 112014116389614-pct00210
를 제공할 수 있고 θ의 변화율이 순간 주파수를 포함할 수 있기 때문에, 이것은 시간에 따라 전개될 수 있는 신호의 주파수 및 위상을 관련시킬 수 있는 방법을 제공할 수 있다. 실제로, 이러한 파라미터는 측정된 데이터에 기초할 수 있고, 고해상 분석에 의해 순간 주파수의 정확한 추정이 가능하여서, 미래 주파수 및 위상 값의 정확한 예측이 가능할 수 있다.
주파수 위상 예측의 알고리즘은 위상과 순간 주파수를 관련시키는 미분 등식,
Figure 112014116389614-pct00211
로 시작하고 충분히 짧은 시간의 윈도우에서, f(t)는 상수와 선형 항으로서 근사화될 수 있어서(당업자에 있어서 고차 항으로 용이하게 계속 확장될 수 있다)
Figure 112014116389614-pct00212
를 산출한다.
이러한 예는 또한, 데이터로부터 주파수를 추정하는 단계를 더 포함하고, 이것은 변환의 CSPE 군으로부터의 초해상 분석을 사용하여 이루어질 수 있다. 대안의 예에서, 주어진 샘플 데이터 윈도우, 즉 i번째 윈도우에 대한 주파수 추정은 윈도우의 중심에서 가장 정확한 것으로 가정할 수 있는데, 이것을 이후로
Figure 112014116389614-pct00213
로 부를 수 있다. 이러한 주파수 추정에 대한 최상의 위치는 제로 크로싱율 체크, 주파수 추정값등과의 맞춤 후의 잔류 오류 보기를 포함하고 이에 제한되지 않는 다양한 다른 방법에 의해 얻을 수 있다. j번째 윈도우에 대한 초해상 주파수 추정값은
Figure 112014116389614-pct00214
로 주어질 수 있고, 샘플 데이터 윈도우 j의 중간에서 가장 정확한 것으로 가정할 수 있다(또는 다양한 다른 방법에 의해 다시 위치될 수 있다). 따라서, 초해상 주파수 추정값 및 이러한 추정값이 위치된 관련 시간이 얻어질 수 있다. 미분 등식을 주파수 추정값과 일치할 수 있는 경계 조건을 가정하여 풀 수 있다면, 1차 근사값은 다음을 포함할 수 있다.
Figure 112014116389614-pct00215
여기에서, T는 2개의 주파수 추정값 사이의 시간일 수 있다(그리고 바람직한 실시예에서, 2개의 샘플 데이터 윈도우 사이의 시간 시프트로 취해질 수 있다). 최종 결과는 다음과 같이 시간의 함수로서 위상을 유도할 수 있는 것일 수 있다.
Figure 112014116389614-pct00216
여기에서, θ0는 신호의 추기 위상일 수 있다. 여기에서 제공된 방식은 초해상 주파수 추정값과 함께 사용될 때 매우 정확한 것으로 보여질 수 있다.
일부 예에서, 트래클렛의 위상은 상이한 시간으로 예측될 수 있다. 이러한 예측값과 새로운 오실레이터 피크의 측정된 위상 사이의 차이는 새로운 피크가 트래클렛으로 통합되어야 하는 가능성을 스코어링하는데 사용될 수 있다.
일부 예에서, 2개의 트래클렛이 간섭하고 있는 것으로 판정되면, 각 트래클렛의 예측된 주파수 및 위상은 결합된 신호 파워가 간섭 트래클렛에 재할당되도록 간섭 영역을 수리하는데 사용될 수 있다.
일부 예에서, 트래클렛이 주어진 프레임에서 데이터를 손실한 것으로 판정되면, 추정된 오실레이터 피크가 예측된 주파수, 진폭, 위상, 변조 타입, 도착 방향 및 추적된 오실레이터 피크에 포함될 수 있는 임의의 다른 특징을 사용하여 삽입될 수 있다.
일부 예에서, 트래클렛의 예측된 위상과 실제 위상 사이의 차이는 직접 경로로 또는 간접 경로를 통해 센서로 이동하였는지를 결정하는데 사용될 수 있다.
비제한의 다른 실시예에 따라, 신호 표현의 주파수/위상은 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델에 기초하여 예측될 수 있고, 그다음, 신호 요소는 이러한 예측에 기초하여 처리될 수 있다. 예를 들어, 두 프레임 마다 한번씩의 예측이 사용되어 예측된 프레임의 처리를 건너뛸 수 있다. 그 결과, 예를 들어, 프레임 2, 4, 6 및 8을 예측하기 위해 프레임 1, 3, 5, 7만을 처리하면 될 수 있다. 이러한 예에서, 프레임 2의 예측이 실행될 수 있고 또한 프레임 2가 무엇인 것으로 판명되었는지를 추정하여서 정확하게 측정할 수 있다. 이러한 방식으로, 예를 들어, 2개의 스펙트럼 피크가 얼마나 가깝게 라인 업을 생성하였는지를 판정할 수 있다. 이러한 정렬이 특정 허용오차 위에 있다면, 프레임 2는 확실히 수용가능하고 사전결정된 범위의 에러 내에 있도록 재계산될 수 있다. 정렬이 수용된 허용오차 내에 있다면, 아무런 추가 예측이 필요하지 않다.
상술된 바와 같이, 비제한의 실시예에 따라, 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델에 기초하여 신호 표현의 주파수/위상을 예측할 수 있다. 최종 모델은 주파수, 진폭, 위상 및 시간을 통해 신호 요소의 에볼루션을 예측할 수 있을 만큼 정확할 수 있다. 그 결과, 일부 데이터가 손실되어도 신호 요소 추적/트래클렛이 갭을 가로지르도록 유지하는 것이 가능하다. 트래클렛 교차의 예에서, 예측된 값은 기초 트래클렛의 반응 및 방향을 결정하는데 사용될 수 있다. 하나의 실시예에서, 신호 내의 갭의 예측성 보간법이 손실되거나 애매한 데이터의 일관적인 추정값을 결정하기 위해 전후방으로 실행될 수 있다. 하나의 실시예에서, 이것은 떨어진 패킷의 효과를 개선하기 위해 휴대폰 네트워크에서 구현될 수 있다.
다른 예에서, 신호 표현의 주파수 및/또는 위상은 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델에 기초하여 예측될 수 있고, 이러한 예측에 기초하여 신호 요소를 다른 요소와 그룹화할 수 있다. 이러한 신호의 측정값은 보통 무작위 보다 정학한 방식으로 시간적으로 전방으로 예측할 수 있을 만큼 충분히 정확하다. 간단히 말해서, 트래클렛이 어딘가에 간 것이 예측된 다음, 이러한 특성을 가진 이러한 트래클렛에 대해 관찰할 때, 이러한 관찰된 현상이 사실 이전에 접한 신호 요소와 연관되어 있다는 것을 유도할 수 있다.
비제한의 다른 실시예에 따라, 신호 표현의 주파수/위상은 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델에 기초하여 예측될 수 있고, 그다음, 신호 요소는 이러한 예측에 기초하여 처리될 수 있다. 예를 들어, 두 프레임 마다 예측할 수 있어서, 예측된 프레임의 처리를 건너뛸 수 있다. 그 결과, 예를 들어, 프레임 2, 4, 6 및 8을 예측하기 위해 프레임 1, 3, 5, 7만 처리하면 된다. 이러한 예에서, 프레임 2의 예측이 이루어지고 프레임 2가 무엇이었는지에 대한 신속한 추정이 실행될 수 있어서, 정확한 측정이 가능하다. 이러한 방식으로, 예를들어, 2개의 스펙트럼 피크가 얼마나 가깝게 라인업을 생성하였는지를 결정할 수 있다. 이러한 정렬이 특정 허용오차 위에 있다면, 프레임 2는 확실히 정렬이 수용가능하고 사전결정된 범위의 에러 내에 있도록 재계산될 수 있다. 한편, 이러한 정렬이 수용된 허용오차 내에 있다면, 아무런 추가 예측도 필요하지 않다.
일부 예에서, 신호 표현의 주파수/위상이 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델에 기초하여 예측될 수 있고, 이러한 예측에 기초하여 불완전한 신호 표현을 완성하기 위해 데이터를 제공하도록 사용될 수 있다.
일부 실시예에서, 신호 내의 코히어런트 신호 요소의 초해상, 통합 영역 모델이 예측되고 이러한 예측에 기초하여 신호 요소를 처리하도록 사용될 수 있다. 여기에서, 신호 요소의 처리는 신호의 표현의 압축을 돕도록 이러한 예측을 사용하는 단계를 포함할 수 있다. 상술된 바와 같이, 모든 프레임을 처리할 필요가 없으므로, 수학적 표현에 포함된 정보는 오리지널 데이터 보다 훨씬 더 적은 비트로 표현될 수 있다(즉, 자연스럽게 압축될 수 있다).
이러한 오실레이터 피크 검출 단계는 그 처리 판정을 안내하기 위해 추적 및/또는 그룹화 단계의 현 상태로부터 정보를 사용할 수 있다. 기술은 하술된 바와 같이, 오실레이터 피크 선택의 피팅 및 우선순위화를 추적 인식함으로써 간섭의 감소를 더 포함할 수 있다.
기술예에서, 피팅 추적을 통한 간섭의 감소가 구현될 수 있다. 2개의 오실레이터 피크가 거의 동일한 주파수에 있다면, 이들은 간섭할 수 있고 식별불가능할 수 있다. 2개의 트래클렛이 주어진 프레임에서 주파수가 교차할 궤도에 있는 것으로 검출되면, 양측 오실레이터의 합인 단일 피크만을 시스템이 검출할 수 있는 2개의 오실레이터 피크를 생성하도록 예측된 주파수 및 진폭을 사용할 수 있다.
다른 기술예에서, 오실레이터 피크 선택의 우선순위화가 행해질 수 있다. 계산 자원 한계, 또는 성능 또는 배터리 수명 또는 다수의 다른 특징을 최적화하려는 바람으로 인해, 시스템은 검출한 것 보다 적은 수의 오실레이터 피크를 맞출 수 있다. 시스템은 맞는 오실레이터 피크를 뽑기 위해 트래클렛 및/또는 그룹 상태 정보를 사용할 수 있다. 예를 들어, 소리 처리에서, 관심의 화자가 일관된 고조파 분리를 보인다면, 시스템은 우선 기존의 패턴에 맞는 오실레이터 피크를 발견하려고 할 수 있다. 마찬가지로, 신호 성분의 중요도의 음향심리학적 측정이 어느 오실레이터 피크가 처리되어야 하는지를 우선순위화하기 위해 사용될 수 있다.
잡음 환경으로부터 희망의 신호를 추출하거나 잡음 환경 내의 희망의 신호의 개선의 다른 기술예에서, 추적 및 그룹화 알고리즘이 피팅된 데이터의 측정된 파라미터중 하나와 함께 사용되어서 어느 트래클렛 또는 코히어런트 그룹이 잡음으로부터 추출되어야 하는지 또는 잡음에 대해 강화되어야 하는지를 결정할 수 있다.
비제한의 실시예에 따라, 트래커에 의해 애매함 측정값 또는 확실성 측정값이 트래클렛에 할당될 수 있다. 이러한 애매함 측정값은 칼만 필터, 베이시안 결정 프로세서, 스코어링 함수 또는, 확실성/애매함 측정값이 어느 트래클렛 또는 코히어런트 그룹이 추출되거나 강화되어야 하는지를 결정하는데 사용되는 유사한 프로세스에서 사용될 수 있다. 또 다른 실시예에서, 복수의 트래클렛의 교차가 교차점의 처리를 돕는데 사용되는 트래클렛 방향의 예측에 의해 식별될 수 있다. 예를 들어, 소리 처리에서, 트래클렛이 실제 교차할 때, 하나의 주파수에서 하나의 합쳐진 소리가 관찰될 수 있다. 이러한 예에서, 합쳐진 소리는 교차점에서 취해질 수 있고 트랙의 각각에 할당되어 자기 일관성을 가질 수 있다.
예에서, 출력은 입력시 수신된 피크의 부분집합을 포함할 수 있다. 일부의 경우에, 이러한 부분집합은 주파수 위상 예측 보정의 경우에서 처럼 수정될 수 있다.
다양한 기술이 관련 오실레이터 피크 및 트래클렛을 식별하기 위해 사용될 수 있다. 예에서, 프로세서는 복수의 오실레이터 피크를 수신할 수 있고 이러한 복수의 오실레이터 피크중 하나 이상을 재합성을 위해 선택할 수 있다.
대안의 예에서, 오실레이터 피크는 어느 것이 출력을 위해 요구되는지를 결정하기 위해 스코어링될 수 있다. 오실레이터 피크는 시간, 주파수, 위상, 진폭, 및 도착의 통합 영역 방향중 적어도 하나를 사용하여 스코어링될 수 있다.
대안의 예에서, 트래클렛은 어느 것이 출력되기를 희망되는지를 결정하기 위해 스코어링될 수 있다. 트래클렛은 시간, 주파수, 위상, 진폭, 도착의 통합 영역 방향, 이러한 특성중 하나의 변화 및 이러한 특성중 하나의 변화의 예측성중 적어도 하나를 사용하여 스코어링될 수 있다.
대안의 예에서, 트래클렛의 코히어런트 그룹이 어느 것이 출력되기를 요구되는지를 결정하기 위해 스코어링될 수 있다. 코히어런트 그룹은 시간, 주파수, 위상, 진폭, 도착의 통합 영역 방향, 이러한 특성중 하나의 변화 및 이러한 특성중 하나의 변화의 예측성, 및 사람의 공지된 고조파 주파수 패턴과 같은 공지된 고조파 구조와의 합치중 적어도 하나를 사용하여 스코어링될 수 있다.
대안의 예에서, 피크, 트래클렛 또는 코히어런트 그룹 스코어가 출력, 또는 출력으로부터 제거하도록 할당하는데 사용될 수 있다.
대안의 예에서, 피크, 트래클렛 또는 코히어런트 그룹의 스코어가 그 영향을 감소시키거나 증폭시키기 위해 출력의 진폭을 수정하도록 사용될 수 있다.
대안의 예에서, 피크, 트래클렛 또는 코히어런트 그룹 스코어가 음성 인식기와 같은 다른 시스템에 전송되어 그 추정 프로세스를 도울 수 있다.
대안의 예에서, 오리지널 신호가 복원된 신호와 결합되어 출력될 수 있다. 오리지널 또는 복원된 신호가 축소되거나 증폭된 후에 재결합될 수 있다.
대안의 예에서, 배경 잡음과 같은 요소, 다른 간섭 신호, 또는 바람직하지 않은 특성을 갖는 임의의 다른 신호가 거부되거나 축소될 수 있다.
대안의 예에서, 배경 잡음, 제2 또는 다른 간섭 신호가 배경을 모호하게 할 수 있는 주요 신호를 제거함으로써 드러날 수 있다.
대안 예에서 도 2에 도시된 바와 같은 신호 채널 재합성 모듈(220)이 단일 출력 채널로 타겟 오실레이터 피크의 주파수 영역 표현을 생성하기 위해 하나 이상의 예에 따라 사용될 수 있다. 예에서, 선택된 오실레이터 피크는 단일 채널 재합성을 사용하여 주파수 또는 시간 영역 신호로 다시 전환될 수 있다. 일부 적용을 위해, 이러한 오실레이터 피크는 시스템의 출력일 수 있다.
단일 채널 재합성 모듈(220)로의 입력은 단일 채널에서 이러한 오실레이터 피크의 주파수 영역 표현을 생성하는데 사용될 수 있는 파라미터를 포함하는 오실레이터 피크의 세트일 수 있다. 하나 이상의 예에서, 이러한 오실레이터 피크는 일반적으로 주파수, 진폭 및 위상을 포함하고 이에 제한되지 않는 파라미터중 하나를 포함할 수 있다. 또한, 샘플 윈도우(A) 및 샘플 윈도우(B)와 함께 사용된 분석 윈도우의 파라미터는 단일 채널 프리프로세서에서 결정된 것일 수 있다.
일부 예에서, 단일 채널 재합성 모듈(220)은 주파수 영역 데이터 투사량을 계산하기 위해 입력부에서 수신된 각 오실레이터 피크를 사용하기 위해 방법을 실행하도록 구성될 수 있다. 이러한 방법은 단일 채널 프리프로세서에서 샘플 윈도우(A) 및 샘플 윈도우(B)를 테이퍼하도록 사용된 분석 윈도우의 고해상 주파수 영역 버전을 샘플링함으로써 오실레이터의 표준화된 주파수 영역 표현을 생성하는 단계를 포함할 수 있다. 이러한 오실레이터의 표준화된 주파수 영역 표현은 오실레이터 피크의 진폭 및 위상에 의해 곱셈된다. 이러한 방법은 일단 오실레이터 피크에 상응하는 주파수 영역 데이터가 계산되면 이전에 생성된 스펙트럼을 합산하는 단계를 더 포함할 수 있다. 예에서, 시간 영역 데이터가 필요하다면, 주파수 출력을 시간 영역으로 전환할 수 있는 역-FFT(iFFT)를 행할 수 있다.
일부 예에서, 어느 정도 양의 배경 신호가 출력에서 희망의 특성을 제공하기 위해 필요할 수 있다. 여기에 사용된 방법의 장점은 출력 신호의 위상이 고정밀도로 보존될 수 있다는 것이다. 결과적으로, 오리지널 신호의 샘플의 위상은 추출되고 재합성된 신호의 위상과 매치할 수 있다. 일부 환경에서, 배경 신호를 추가하면 원하는 특성을 가진 결과를 산출할 수 있다. 이것은 오리지널 신호 또는 감쇠되거나 증폭된 버전의 오리지널 신호에서 다시 혼합하는 단계를 포함하는 다양한 기술에 의해 달성될 수 있다. 일부 예에서, 오리지널 신호가 추출된 신호와 재혼합되기 전에 재구성될 수 있도록, 압축된 형태의 싱글렛 표현과 같은, 오리지널 신호의 싱글렛 표현을 사용하는 것이 바림직할 수 있다.
단일 채널 재합성 모듈(220)에 의해 행해진 방법에 기초하여, 오실레이터 피크의 선택된 세트에 상응하는 오리지널 신호의 부분을 정확하게 나타내는 주파수 영역 또는 시간 영역 데이터의 세트가 단일 채널 재합성 모듈(220)로부터의 출력으로서 얻어질 수 있다.
일부 예에서, 도 2에 도시된 바와 같은 다중 채널 재합성 모듈(222)이 다중 채널 출력에서 타겟 피크의 주파수 영역 표현을 생성하기 위해 하나 이상의 예에 따라 사용될 수 있다. 이러한 다중 채널 재합성 모듈(222)은 선택된 오실레이터 피크를 주파수 또는 시간 영역 신호로 다시 전환하도록 구성될 수 있다. 일부 예에서, 이러한 오실레이터 피크는 시스템의 출력일 수 있다.
이러한 다중 채널 재합성 모듈(222)은 다중 채널로 이러한 오실레이터 피크의 주파수 영역 표현을 생성하는데 사용된 파라미터, 및 다중 채널 프리프로세서(210)에서 샘플 윈도우(A)와 샘플 윈도우(B)와 함께 사용된 분석 윈도우의 파라미터를 포함하는 오실레이터 피트의 세트를 입력으로서 수신하도록 구성될 수 있다. 예에서, 오실레이터 피크는 각 채널의 오실레이터 피크의 주파수, 진폭, 통합 영역 시그마, 및 위상을 포함할 수 있다.
이러한 다중 채널 재합성 모듈(222)은 각 채널에 대한 주파수 영역 데이터 투사량을 계산하기 위해 각 오실레이터 피크에 대한 방법을 실행하도록 구성될 수 있다. 이러한 방법은 통합 영역 시그마 및 입력 진폭을 사용하여 해당 피크에 대한 채널을 위한 진폭을 계산하는 단계를 포함할 수 있다. 이러한 방법은 단일 채널 프리프로세서에서 샘플 윈도우(A)와 샘플 윈도우(B)와 함께 사용된 분석 윈도우의 고해상 주파수 영역 버전을 샘플링함으로써 오실레이터의 표준화된 주파수 영역 표현을 생성하는 단계를 더 포함할 수 있다. 이러한 오실레이터의 표준화된 주파수 영역 표현은 입력부에서 수신된, 해당 채널에 대한 오실레이터 피크의 위상 및 단계 1에서 계산된 진폭에 의해 곱해진다. 이러한 방법은 일단 오실레이터 피크에 상응하는 주파수 영역 데이터가 계산되면 이전의 단계에서 생성된 스펙트럼을 합산하는 단계를 더 포함할 수 있다. 예에서, 채널 X에 대한 주파수 영역은 모든 오실레이터 피크에 대한 채널 X에 대한 모든 계산된 주파수 영역 스펙트럼의 합일 수 있다. 시간 영역 데이터가 요구된다면, 이러한 주파수 출력을 시간 영역으로 전환하도록 역 FFT(iFFT)가 실행될 수 있다.
예에서, 재합성된 신호가 안정한 주파수 신호, FM 피크 및 AM 피크를 포함하는, 복수의 신호 요소 또는 특성의 각각을 구축하기 위해 콘볼루션 모델을 사용하여 그리고 별개의 방법을 사용하여, 신호 처리 모델에서 구축될 수 있다. 주파수, 진폭, 주파수 변조 및 진폭 변조를 포함하는 오실레이터 피크 파라미터가 다음과 같은 상이한 (시간상 경미하게 나중인 것과 같은) 윈도우 위치 또는 윈도우 길이로 존재할 수 있는 파라미터를 예측하도록 재계산될 수 있다.
예에서 상이한 윈도우 길이가 오실레이터 피크 검출을 위해 사용되는 것 보다는 재합성을 위해 선택될 수 있다. 이것에 의해 시스템은 오실레이터 피크 검출에 사용될 수 있는 것 보다 재합성을 위한 보다 최적의 윈도우 길이를 사용할 수 있다.
예에서, 샘플 윈도우의 길이는 필요에 따라 조정될 수 있다. 특정 조건하에, 상이한 길이의 샘플 윈도우를 사용하는 것이 최적일 수 있다. 이것은 검출된 오실레이터 피크의 파라미터가 비교를 위해 조정될 수 있기 때문에 이루어질 수 있다. 예를 들어, 강한 주파수 변조의 기간 동안 보다 자주 샘플링하는 것이 유익할 수 있다.
일부 예에서, 프레임이 재합성에서 시프트될 수 있다. 예를 들어, 신호의 제1 스냅샵이 예를 들어, 0으로부터 1024 개의 데이터 포인트를 사용하여 취해질 수 있다. 다음은 데이터 포인트 512에서 시작할 수도 있고 데이터 포인트 1536까지 계속될 수도 있어, 윈도우 길이의 절반을 시프트할 수도 있다. 보다 작은 크기의 변화가 필요하여 (256 만큼의 시프트와 같은) 보다 적은 수의 데이터 포인트의 시프트가 필요하다면, 다시 시프트하는데, 이러한 경우에 각 신호 요소는 보다 가깝게 덮힌다. 재합성에서, 중간 세그먼트만이 사용되고(256 내지 768 그리고 512 내지 1024) 프레임 내의 전방 예측이 이루어져 보다 적은 수의 프레임을 만들수 있다. 예를 들어, 비디오 입력 신호를 처리하고 비디오를 와이드 스크린 포맷으로부터 구식의 텔레비전으로 전송할 때, 품질을 저하시키지 않고 프레임의 복잡한 조작을 할 필요없이 TV 이미지의 중심이 재생되고 에지가 제거되도록 수시로 동작을 변경할 수 있다.
다중 채널 재합성 모듈(222)에 의해 실행된 방법에 기초하여, 선택된 피크에 상응하는 오리지널 신호로부터의 주파수 영역의 부분을 정확하게 나타낼 수 있는 주파수 또는 시간 영역의 데이터의 윈도우가 다중 채널 재합성 모듈(222)로부터의 출력으로서 취득될 수 있다.
여기에 설명된 신호 분리(SS) 기술은 전송, 저장, 분석 또는 조작을 위해 (마이크로폰, 카메라, 라디오 수신기, 비디오 카메라, 트랜스듀서, 또는 다른 수신기등을 포함하는) 수집 메커니즘을 통해 신호를 전송하거나 포착할 수 있는 임의의 시스템에 적용될 수 있다. 이러한 신호는 이어서 수신기 사이에 전송되거나(예를 들어, RF 전송); 음성 호출의 전송등을 위한 오디오 포맷으로 전달되거나, 사진 또는 비디오등의 전송과 같은 이미지 또는 비디오 포맷으로 전달되거나, 음성으로부터 문자로 전환되는 것과 같은 문자 포맷으로 묘사되거나, 레이더 표시 또는 초음파와 같은 이미지로서 해석되고 렌더링될 수 있다(하지만 이에 제한되지 않는다).
일부 실시예에서, SS 기술은 디지털 신호 처리를 포함하는 하나 이상의 프로세스 및/또는 시스템에 도입될 수 있다. 디지털 신호 처리는 일반적으로 정보 신호를 수정하거나 향상시키기 위해 정보 신호를 수학적으로 조작하는 것으로서 규정되고, 일련의 숫자 또는 심볼 및 이러한 신호의 처리에 의한 이산 시간, 이산 주파수, 또는 이산 영역 신호의 표현의 특징을 가질 수 있다. SS 기술이 유익을 줄 수 있는 샘플 디지털 신호 처리 분야는 오디오 처리 및 압축, 음성 처리 및 인식, RF 전송, 생체 측정 분석, 소나 및 레이더, 센서 어레이, 초음파 검사, 스펙트럼 추정, 통계분석, 디지털 이미지, 디지털 및 셀 통신, 제어 시스템, 생체 의학, 의료 영상, 및 지지 데이터를 포함할 수 있지만 이에 제한되는 것은 아니다. 디지털 신호 처리는 연속 실제 아날로그 신호를 측정하고, 여과하고 및/또는 압축하는데 적용될 수 있다. 이러한 프로세스는 보통 신호를 아날로그로부터 디지털 포맷으로 전환함으로써, 아날로그 신호를 디지털 스트림의 숫자로 바꿀 수 있는 아날로그-디지털 변환기(ADC)를 사용하여 신호를 샘플링한 후 디지털화함으로써 시작될 수 있다. 보통, 분석 및 전송 후에, 요구되는 출력 신호는 디지털-아날로그 변환기(DAC)를 필요로 하는 다른 아날로그 출력 신호일 수 있다.
일부 실시예에서, SS 기술은 범용 컴퓨터 및 GPU; (디지털 신호 프로세서와 같은) 전용 단일 및 멀티 코어 프로세서; 주문형 집적 회로(ASIC)와 같은 주문형 하드웨어; 전계 프로그래머블 게이트 어레이(FPGA); 디지털 신호 컨트롤러; 및 스트림 프로세서중 하나 이상(하지만 이에 제한되지 않는다)에서 구현될 수 있다. 또한, 여기에 기술된 SS 기술은 펌웨어, 내장된 소프트웨어, 소프트웨어 플랫폼, 독립형 소프트웨어 애플리케이션, 및/또는 네트워크 또는 클라우드 기반 애플리케이션/서비스로서 구현될 수 있다. 이러한 구현은 컴퓨터; 휴대폰 또는 스마트폰; 태블릿; 또는 다른 통신; 오디오, 비디오, 센서, 레이더, 소나 또는 의료 영상 장치 또는 시스템; 또는 디지털 신호 처리가 성능 또는 일반적인 유용성을 향상시킬 수 있는 임의의 다른 시스템 또는 장치로서 구현될 수 있다.
일부 실시예에서, 여기에 설명된 신호 분리 기술은 대상의 범위, 고도, 방향, 속도 또는 다른 특성을 결정하는 방법으로서 무선파에 의존하는 레이더 기반 대상 검출 및 추적 시스템에서 사용될 수 있다. 이러한 레이더 시스템은 무선파의 경로에 있는 임의의 대상에 반사되어 무선파의 에너지의 일부를 수신기에 되돌리는 무선파(또는 마이크로파)의 펄스를 전송하는 프로세스를 포함할 수 있다. 일부 레이더의 사용예는 일반 이미징, 방공 및 미사일 방어 시스템, 항공 교통 제어, 지형, 선박 및 다른 해양 기반 관심 포인트의 위치 파악 해양 시스템, 항공 충돌 방지 시스템, 해양 감시 시스템, 우주 공간 감시 및 랑데부 시스템, 기상학 추적 및 감시, 고도 측량 및 비행 제어 시스템, 미사일 표적 위치파악 시스템, 지형 맵핑, 검출 및 위치파악 시스템, 오일 및 가스 발견 및 드릴링 시스템, 및 지질학적 관찰을 위한 지표 투과 레이더를 포함할 수 있지만 이에 제한되는 것은 아니다.
일부 실시예에서, SS 기술은 프로세스의 임의의 포인트에서 "잡음", "간섭", 및/또는 "클러터"를 경감하여 최종 사용 응용에 전달되는 최종 데이터의 품질을 강화시키기 위해 레이더 시스템에 적용될 수 있다. 이러한 SS 기술은 펄스도풀러, 이동 표적 지시, 자동 이득 제어("AGC"), 3D 맵핑 이미징 애플리케이션, 및/또는 수평, 수직, 선형 및 원형 편파와 같은, 임의의 다른 보정 알고리즘 및 시스템에 관계없이 또는 이러한 시스템의 하나 이상과 함께 도입될 수 있다. 반사된 신호는 거리가 증가함에 따라 신속하게 감소하여서 잡음에 의해 레이더 범위 한계가 도입되고, 희망의 신호의 전력이 낮을 수록 그것을 잡음으로부터 식별하는 것이 더 어렵다. 레이더 시스템은 관심의 실제 표적에 초점을 맞추는 동안 원치않는 신호, 즉 수동 신호 및 능동 신호 모두를 극복하도록 구성되어야 한다. 원치않는 신호를 극복함으로써 배경 잡음 또는 간섭의 레벨에 희망의 타겟 신호의 레벨을 비교하는, 레이더 시스템의 신호-잡음비("SNR")가 규정된다.
실시예에서, SS 기술의 도입에 의해 실제 표적을 주변의 잡음 신호, 간섭 및 클러터로부터의 격리를 향상시킬 수 있는 레이더 시스템의 SNR을 증가시킬 수 있다. 예에서, 잡음 및 간섭은 모든 전자 부품에 의해 생성될 수 있는, 신호의 불규칙 변동(random variation)의 내부 소스; 레이더 수신기에서 수신되는 희망의 에코 신호에 중첩되는 불규칙 변동; 및/또는 관심의 표적을 둘러싸는 배경의 열 방사와 같은 외부 소스를 포함하는 요인중 어느 하나에 의해 유발될 수 있다. 또한, 클러터는 레이더 운전자의 관심 밖의 표적으로부터 돌아온 무선 주파수 에코로 인해 유발될 수 있다. 이러한 표적은 (비, 새와 같은) 자연 대상; 대기 난기류 및 (이온층 반사와 같은) 다른 대기 효과; (빌딩과 같은) 인공 대상물; 및/또는 심지어 채프(chaff)와 같은 레이더 대항수단을 포함할 수 있다. 일부 클러터는 또한 레이더 송수신기와 안테나 사이의 긴 레이저 도파관에 의해 유발될 수 있다. 여기에 기술된 SS 방법 및 기술은 상기 및 다른 간섭 신호로부터 간섭을 효과적으로 경감시키는 기능을 할 수 있다. SS 기술은 주파수 대역, 스캔 타입, 사용되는 디스플레이 프로세서 및 시스템, 및/또는 최종 사용 및 링크에 관계없이 모든 형태의 레이더 신호, 장비 및 이미징 소프트웨어 및 하드웨어에 적용될 수 있다. 이러한 기술은 또한 전자기 스펙트럼의 다른 부분을 사용하는 다른 시스템에 적용될 수 있다. 이러한 시스템의 하나의 예는 무선파 보다는 레이저로부터의 가시광선을 사용하는 "라이더(LIDAR)"일 수 있다. 또한, 이러한 기술은 RF 기능(예를 들어, 레이다, 통신, 및 전자전)이 그 기능의 성능에서 확장되거나, 식별되거나, 분리되거나, 감추어지거나 달리 조작될 수 있도록 하는 확장가능한 다기능 RF 시스템과 같은 다른 무선주파수(RF) 기반 시스템에 적용될 수 있다.
비제한의 실시예에 따라, 여기에 이전에 설명된 기술의 임의의 프로세스 또는 조합을 사용하여 생성된 소스 분리된 신호는 모두 단독으로 또는 결합되어 음성 인식 엔진 또는 생체측정 음성 식별 시스템으로의 입력으로서 기능할 수 있는 (i) 오디오 파일; 및/또는 (ii) 오디오 신호 성분; 및/또는 (iii) 음성 특성 벡터로서 나타나는 출력을 생성할 수 있다. 일부 실시예에서, 여기에 설명된 신호 분리 기술은 예를 들어, 구어를 문자로 전환하거나, 음성 전환을 통해 자동 시스템을 제어하거나 구어를 자동 프로세스를 통해 음성 이외의 다른 출력으로 전환하도록 사용될 수 있는 음성 인식 시스템에 사용될 수 있다. 음성 인식을 향상시키기 위해 SS를 도입하는 것은 인식을 향상시키기 위해 사용된 임의의 다른 알고리즘 및 시스템에 관계없이 또는 이러한 시스템중 하나 이상과 결합되어 적용될 수 있다. 또한, SS는 디지털 신호로 전환되고 아날로그 신호로 재전환된 후에 다시 한번 디지털로 전환되어 음성 인식을 위해 처리되거나, 음성 인식 프로세스 바로 직전에 디지털 포맷으로 전환되었다면 오디오 신호로 전환될 수 있는 오리지널 음성 원신호등에 적용될 수 있다.
음성 인식은 "자동 음성 인식"("ASR"), "컴퓨터 음성 인식", 및/또는 "스피치 투 텍스트"로 부를 수 있다. 이러한 시스템은 "화자 종속" 시스템의 경우와 같이 훈련을 사용할 수 있거나 화자에 의한 훈련을 사용하지 않을 수 있다("화자 독립" 시스템으로 부른다). 음성 인식은 일반적으로 화자가 말하고 있는 것과 대조적으로 화자가 누구인지의 신원을 찾는 것과 관련되어 있다. 화자 인식은 화자 종속 시스템의 음성 전환의 업무를 단순화할 수 있거나 보안 프로세스의 일부로서 화자의 신원을 인증하는데 사용될 수 있다. 일부 실시예에서, SS를 음성 인식에 적용하는 것은 아날로그 음성 신호를 디지털 오디오로 전환한 다음 인식된 음성으로 전환하는 단계를 포함할 수 있다. 예에서, 이러한 전환은 디지털 오디오를 보다 양호한 음향 표현으로 변환하는 단계, 음성 인식자가 무슨 음소를 예측하는지를 알도록 규정을 적용하는 단계, 및 어느 음소가 말해지는지를 판정하는 단계, 및 이러한 음소를 말로 전환하는 단계를 포함할 수 있는 프로세스를 통해 실행될 수 있다. 이러한 디지털 오디오 포맷은 (모노 때 스테레오와 같은) 채널의 수, 비트율 및/또는 다른 특성에 대해 변할 수 있다.
음성 인식은 또한 음성 파형으로부터 특성 벡터를 추출하는 단계를 포함할 수 있다. 이러한 추출은 우선 윈도우드 고속 푸리에 변환(FFT)을 사용하여 디지털 오디오를 "주파수 영역"으로 변환함으로써 이루어질 수 있고, 최종 출력은 분광기가 생성하는 것과 유사하다. 이러한 영역에서, 주어진 샘플율에 대한 소리의 주파수 성분은 이러한 샘플에 대한 주파수 성분의 진폭의 그래프를 생성하는데 사용될 수 있다. 특성 벡터가 짧은 시간 간격 마다 음성 신호의 윈도우로부터 계산될 수 있고, 이러한 일련의 특성 벡터로서 발성이 표현될 수 있다.
일부 실시예에서, 자동 음성 인식기 엔진은 사람 음성에 의해 생성된 상이한 타입의 소리에 상관된 수천의 이러한 그래프의 데이터베이스로 구성될 수 있고, 이러한 샘플에서 생성된 그래프는 데이터에 대해 매칭될 수 있어서 소리를 기술하는 수를 생성한다. 주어진 음성 특성 벡터에 대한 가장 가능성이 높은 단어열이 2개 타입의 지식 소스, 즉, 음향 지식 및 언어 지식을 사용하여 발견된다. 음성 인식 엔진은 음성 소리의 음향 특성에 대한 "은닉 마르코프 모델"(HMM)로 부르는 수학적 기술을 사용할 수 있고 추계적 언어 모델이 언어 지식을 나타내는데 사용될 수 있다. 일부 예에서, 큰 배경 잡음 또는 다른 주변 환경 소리와 같은 간섭부에 의해 소리를 오해석하게 하여서, 사용자가 고품질 마이크로폰으로 조용한 방에 있었으면 가질 벡터와 상이한 벡터를 인식기가 결정할 수 있다. 전통적으로, 배경 잡음 및 가변성 문제는 어느 음소가 말해지는 지를 알아내기 위해 통계학적 모델을 사용하여 처리되었지만, 강한 간섭에는 대체로 결과가 좋지 않았다. SS 기술을 음성 인식 프로세스에 적용하는 실시예에서, 특성 벡터가 음성 파형으로부터 추출되는 인식 프로세스의 초기 단계의 SS의 도입은 다른 방법 보다 훨씬 더 높은 충실도로 음소 및 발성을 결정하는 정교함을 크게 증가시킬 수 있다. SS의 적용은 특성 벡터를 디지털 오디오 신호로부터 추출할 때 주변 잡음과 같은 간섭부의 영향을 크게 경감시킬 수 있다. SS 처리된 신호는음성 인식/식별에 대한 보다 높은 정밀도를 제공할 수 있고 (휴대폰, 태블릿 및 다른 퍼스널 디바이스 보안 특징부등에 의한) 온보드(onboard) 처리를 사용하여 또는 (접근 제한 시설, 빌딩, 금고 또는 다른 보안 위치와 같은) 접근 제어된 장치 또는 에어리어에 대한 네트워크 또는 클라우드에 링크되어, 임의의 기존의 음성 인식 또는 음성 보안 시스템에 도입될 수 있다. 음성/화자 인식을 위해, 유사한 프로세스가 관심의 화자의 특성 벡터를 추출하는데 사용될 수 있지만, 이러한 벡터는 화자에 의해 처음에 생성된 발성의 모델/라이브러리에 비교되고 대조될 수 있고 유사도 스코어가 생성될 수 있다. SS 기술은 디지털 신호로 전환되고 아날로그 신호로 재전환된 후에 다시 한번 디지털로 전환되어 음성 인식을 위해 처리된 오리지널 음성 원신호로의 적용, 또는 음성 인식 프로세서 바로 직접에 디지털로 전환된 오디오 신호로의 적용을 포함하고 이에 제한되지 않는 방법중 하나를 통해 향상된 특성 벡터를 전달함으로써 배경 잡음 또는 상충되는 대화와 같은 간섭을 경감함으로써 스코어링의 정교함을 강화시키도록 음성 인식에 도입될 수 있다. 여기에기술된 SS 방법 및 시스템은 독립형 처리 기술 및 기존의 소프트웨어 프로그램으로의 추가로서, 음성 인식을 사용하는 임의의 PC, 휴대폰, 태블릿, 또는 다른 시스템에 하드웨어 또는 소프트웨어로서 구현될 수 있다.
비제한의 실시예에 따라, 신호 요소의 표현이 신호의 모델로 개발되었다. 이러한 신호는 분해되고 개별적인 화자에 상응하는 트랙 및/또는 트래클렛으로 그룹화되고, 이러한 분해된 신호는 음성 인식 엔진에 사용되도록 구성된 특성 벡터로 변환되었다. 이러한 실시예에서, 특정 화자(예를 들어, 전화의 소유자)쪽으로 바이어스를 개발하고 도입할 수 있어서, 자동으로 이들의 음성을 떼어내어 그 환경의 모든 다른 소리에 대해 강화시킬 수도 있다.
다른 실시예에서, 음성 특성 또는 음성 벡터로 부를 수 있는 신호 요소의 표현은 신호의 원신호 분리 모델에서 개발될 수 있다. 그다음, 이러한 신호는 개별적인 화자에 상응하는 음성 특성 벡터로 분해될 수 있고, 이러한 분해된 표현은 음성 인식 엔진 또는 생체측정 음성 식별 시스템으로의 입력으로서 사용될 수 있다.
비제한의 실시예에 따라, 시스템은 원신호 분리의 공동/분배된 계산에 참여하기 위한 근방 프로세서와 함께, 마이크로폰과 같은 소리 수집 장치를 포함하고 있다. 일부 실시예에서, 이러한 알고리즘은 보다 적게 처리량 집약되도록 크기조정가능하여서 휴대폰, 스마트폰, 태블릿 또는 다른 모바일 장치에 사용될 수 있다. 일부 실시예에서, 이러한 처리의 일부는 이러한 모바일 장치에서 행해진 후에 원격 프로세서 또는 서버에 분배되거나 전송된 후에 결과가 다시 모바일 장치로 전달될 수 있다.
일부 실시예에서 SS 기술은 보청기에 사용될 수 있다. 보청기는 청력 장애/청력 손실을 가진 사람이 소리를 이해할 수 있도록 소리를 증폭하고 여과하는 것을 돕는 임의의 의료 장치이다. 보청기는 소리를 전기 신호로 전환한 후에 이러한 전기 신호를 디지털 신호 프로세서에 의해 처리하여 표적 소리를 강화하고 원치않는 배경 잡음을 최소화할 수 있는 마이크로폰(방향성 또는 전방향성)으로 구성되어 있다. 그다음, 이러한 최종 표적 소리는 증폭되어 환자의 외이도에서 스피커를 통해 재방송된다. 환자 컨트롤이 볼륨, 잡음 감소, 및 상이한 환경 설정을 위해 사용될 수 있다. 마이크로폰, DSP 및 장치에 대한 컨트롤이 보청기 자체 위에 또는 내에 또는 외부 제어 장치 또는 휴대폰에 위치될 수 있다.
일부 실시예에서, 여기에 기술된 원신호 분리를 위한 방법은 표적 소리를 증폭시키고, 하나의 사람이 말하는 것 또는 음원에 초점을 맞추고, 음식점에서 다른 소리를 끄고/최소화하는 동안 붐비는 음식점의 테이블에서의 대화와 같은 제한된 영역에 초점을 맞추고, 및/또는 사용자가 듣지 않도록 선택하고 및/또는 희망의 대화 또는 음원을 그가 이해하는 것을 방해하는 배경 또는 다른 주변 잡음을 최소화하거나 제거하는 목적(하지만 이에 제한되지 않는다)을 위한 임의의 설계된 보청기에서 구현될 수 있다. 이러한 SS 방법은 귀뒤 보청기(behind-the-ear aids), 내이도 보청기(in-the-canai hearing aids), 개방 외이도 보청기(open canal aids), 폐쇄 외이도 보청기(closed canal aids), 기도 보청기(air conduction hearing aids), 골전도/뼈 고정 보청기(bone conduction/bone anchored aids), 안경 보청기(eyeglass based aids), 외부 장치 링크 보청기(external device-linked aids), 휴대폰 보청기(cell phone based aids), PDA 보청기(PDA based aids), 아이패드 태블릿 보청기(iPad Tablet based aids), PC 보청기(PC based aids) 및 인공 와우를 포함하는 임의의 청력 보조 장치에 채용될 수 있지만 이에 제한되는 것은 아니다. SS 기술은 FDA 규정 보청기 및 처방전 없이 살 수 있는 소리 증폭 장치 모두를 포함하는 청력 보조 장치에 적용될 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법은 또한 휴대폰, 텔레비전, 라디오, PC, 클라우드, 태블릿 및 다른 청력 보정 관련 장치에 관련될 수 있다. 하나의 실시예는 방송을 이해하는 사용자의 능력을 해칠 수 있는 다른 배경 또는 주변 잡음을 최소화하거나 끄는 동안 방송을 사용자가 이해할 수 있도록 하기 위해 텔레비전에 연결될 수 있다. 마찬가지로, 이러한 적용의 유사한 실시예가 다른 상대의 호출자에 의해 전송되는 원치않는 배경 잡음은 물론 사용자가 통화를 받고 있는 위치에서 모두 주변 또는 배경 잡음을 최소화하거나 제거하도록 처리된 휴대폰 전송의 증폭을 포함할 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법은 임의의 청력 보조 장치에 위치되거나 통합되거나, 이러한 청력 보조 처리 장치로 벗어나 위치되고 무선, 적외선(IR), 블루투쓰, 유선 또는 다른 전송 방법을 통해 청력 보조 처리 장치에 전송되는 임의의 마이크로폰(스테레오 또는 모노, 방향성 또는 전방향성) 또는 마이크로폰 어레이와 함께 동작하도록 의도될 수 있다. 실시예는 소리가 이러한 장치에 기록되고 귀에 전송되어 방송되는 휴대폰 또는 태블릿 링크 보청기일 수 있다. 마찬가지로, 표적 소리원을 기록하기 위한 마이크로폰이 사용자 안경에 위치되거나, 옷 또는 보석류에 내장되거나, 사용자의 목 둘레에 착용되거나, 단추, 모자 또는 다른 옷 또는 패션 악세사리에 내장될 수 있다. 상기 예를 포함하지만 이에 제한되지 않는 마이크로폰은 표적 소리를 처리 장치에 전송할 수 있고, 이러한 처리 장치에서 여기에 기술된 SS 방법 및 시스템이 이러한 소리를 처리하기 위해 구성될 수 있다. 이러한 알고리즘 처리는 독립형 DSP에서 또는 내장된 펌웨어를 통한 장치의 CPU에서 일어날 수 있다. 이러한 처리 플랫폼은 장치 자체, 외부 제어 유닛, 태블릿, PC, PDA, 휴대폰 또는 클라우드를 통한 전송부 또는 셀 또는 무선 네트워크를 통한 중앙 서버로의 재전송부에 배치될 수 있다. 양측 보청기 또는 어레이 마이크로폰에 기록된 신호는 상술된 것을 포함하고 이에 제한되지 않는 외부 처리 유닛으로 또는 장치를 통해 실시간 또는 실시간에 가까운 처리를 위해 전송될 수 있다.
그다음, 일부 실시예에서, 여기에 기술된 SS 기술에 의해 처리된 신호는 출력 신호로 재합성되어 사용자의 귀 내부 또는 근방의 스피커를 통해, 또는 신경 또는 뼈 자극 장치를 통해 직접 지각 신경 처리를 위해 재생될 수 있다. 방송을 위한 스피커 기반 장치는 개방 외이도 및 폐쇄 외이도 시스템, 헤드폰, 전화 장치, 휴대폰, 블루투쓰 및 다른 스피커 기반 장치를 포함한다. 재합성된 신호는 (보청기 뒤와 같은) 동일한 장치에 포착되거나 (태블릿, 휴대폰, PC 또는 다른 휴대형 프로세서와 같은) 외부 처리 유닛으로부터 출력 스피커 장치로 전송될 수 있고 단일 재처리된 입력이거나 다수의 기록 장치로부터의 많은 동시 기록되고 혼합된 입력의 조합일 수 있다. SS 처리를 사용하는 청력 보조 기술은 장치 처리를 특정 환경에 적응시키기 위해 의료 프로그램된 파라미터 또는 사용자 제어된 파라미터를 포함하는 것을 특징으로 할 수 있다. 의료 파라미터의 실시예는 초기 피팅의 시간에 프로그래밍되거나 이어서 전화 또는 PC/웹 인터페이스 리프로그래밍을 통해 조정될 수 있는 거리 기반 SS 및 배경 잡음 감소 설정값이다. 사용자 기반 제어의 실시예는 표적 음성의 배경 잡음으로의 혼합, 표적 음성 증폭의 레벨, 실시간 또는 실시간에 가까운 전송의 사용, 사용자가 표적 소리원을 모으기를 원할 때의 면적 또는 방향을 조정하기 위한 거리 및 벡터 기반 제어, 직접 인터페이스를 위한 TV, 휴대폰, 라디오, 음성 제어 시스템 또는 다른 PC 기반 장치로 태핑하는 기능을 사용자가 제어할 수 있도록 하는 온보드 장치 다이얼, 외부 제어 유닛, 또는 PC/휴대폰/태블릿 기반 애플리케이션을 포함할 수 있다. 사용자는 또한 음식점 또는 가까운 대화와 같은 다양한 모드를 위해 장치를 설정하는 기능을 가질 수 있거나, 재방송된 소리의 명료함 또는 자연스러움에 대하여 표적 음성에 대한 지연된 도입부 사이의 교환을 결정할 수 있도록 재생을 위해 도입 시간을 제어할 수 있다.
비제한의 실시예에 따라, 시스템은 원신호 분리의 공동/분배된 계산에 참여하기 위한 근방 프로세서와 함께, 마이크로폰과 같은 소리 수집 장치, 또는 (예를 들어, 블루투쓰 또는 다른 전송 프로토콜을 사용하는) 통신을 위한 소리 전송 장치를 포함하고 있다. 일부 실시예에서, 이러한 알고리즘은 보다 적게 처리량 집약되도록 크기조정가능하여서 보청기에 사용될 수 있다. 일부 실시예에서, 일부 처리량은 프로세서에 의해 원격 서버에 분배될 수 있고 결과는 보청기에 전송될 수 있다.
하나의 변형에서, 휴대폰은 하나 이상의 처리를 실행할 수 있는 서버에 데이터를 전송할 수 있다. 일부 예에서, 보청기가 실제 보다 많은 양의 처리 능력을 필요로 할 때 원격 서버에 전송할 수 없기 때문에, 주머니 속의 휴대폰과 같은 근방의 장치에 전송할 수 있다. 이러한 전화는 로컬 수퍼 부스터 또는 외부 처리 시스템과 같이 동작할 수 있다. 이러한 예에서, 보청기는 규정된 모드로 전이하고 부가 계산력을 사용할 수도 있어 처리량을 휴대폰에 넘기고 향상된 기능을 달성할 수도 있다. 하나의 예에서, 제어부는 실제 휴대폰 또는 계산 태블릿에 배치되어, 예를 들어, 음식점에 앉아 있는 사람이 테이블 위에 휴대폰을 놓고 스크린을 태핑하거나 슬라이더 컨트롤을 이동시켜 테이블에 앉아 있는 사람의 방향으로 처리 및 원신호 분리를 맞출 수 있다. 이에 응답하여, 알고리즘이 테이블 상대 대화를 강화시키도록 돕기 위해 동작한다. 도 15는 태블릿 또는 휴대폰 제어를 위한 이러한 컴퓨터에 의해 생성된 인터페이스의 비제한 실시예를 도시하고 있다.
다른 실시예에서, 주변 잡음 또는 원치않는 배경 잡음이 입력 원신호로부터 제거될 수 있어서, 복원된 원신호를 생성한 다음, 이러한 원신호는 보다 낮은 잡음 레벨의 주변 또는 배경 잡음과 재결합되고 이러한 결합된 신호는 출력될 수 있다. 일부 실시예에서, 사용자는 재도입된 주변 잡음의 잡음 레벨을 동적으로 또는 정적으로 변경할 수 있다.
일부 실시예에서, 여기에 기술된 SS 기술은 전화에 사용될 수 있다. 셀룰러 네트워크 상의 모바일 폰에 대해, 오디오는 내장된 마이크로폰을 통해 포착되고 이어서 아날로그로부터 디지털 신호로 변환된다(보통 "A-D" 변환으로 부른다). 그다음, 이러한 최종 디지털 신호는 압축되거나 비압축된 형태로 셀룰러 네트워크를 통해 최종 단말기로 전송되고, 이러한 최종 단말기에 의해 오디오 출력으로서 전달된다. 전송 프로세스를 따른 어딘가에서 또는 전달의 종점에서, 디지털 신호는 다시 아날로그 신호로 변환된다. 보통, 전송을 위해 (휴대폰, 스피커폰, VoIP 폰등과 같은) 전화에 의해 포착된 오디오는 대화를 억제하거나 오디오 파일의 전송을 억제하지 않지만 의도된 수신자로의 출력 파일의 일반적인 품질에 영향을 줄 수 있는 주변 잡음 또는 다른 간섭을 포함할 수 있다. 예를 들어, 모바일 폰 내의 마이크로폰은 화자의 음성을 포착할 수 있지만, 전화의 수신자에게 전환되고 전송될 수 있는, 관심의 호출자 근방에서 일어나는 다른 대화의 잡음 역시 포착할 수 있다. 오디오가 수신자에게 전환되고 전달될 때, 청취자는 역시 전달된 간섭 잡음에 의해 화자를 이해하는 것이 어렵다는 것을 발견할 수 있다. 일반적으로 잡음 및 에코 은닉과 같은 특정 알고리즘이 전송을 위해 신호가 변환될 수 있는 (모바일 폰에서와 같은) 포착의 포인트에서 적용되지만, 이러한 적용된 알고리즘은 전통적으로 잡음/간섭 효과의 일부만을 경감시키고 수신측은 여전히 전송자를 이해하는 것을 방해할 수 있는 간섭 환경 잡음을 수신할 수 있다.
여기에 기술된 원신호 분리에 대한 방법은 원치않는 전송 신호가 호출자, 관심의 화자 및/또는 대화를 사용자가 이해하는 것을 방해하기 때문에 수신자가 듣거나 전송되기를 원치않는 배경 또는 다른 주변의 잡음을 최소화하거나 제거하는 동안 표적 소리를 증폭시키고 및/또는 전화 회담에서 말하는 관심의 사람 또는 휴대폰 또는 전화 사용자에게 초점을 맞출 목적으로 임의의 전에 도입될 수 있다.
이러한 SS 방법은 전화 적용시 원신호 포착, 변환, 전송 및/또는 수신자로의 전달/출력의 임의의 포인트 동안 도입되고 적용될 수 있다. 이러한 SS 방법은 통화 동안 항상 적용되도록 통합될 수 있거나, 전송자 또는 수신자가 통화 동안 간섭의 완화를 위해 SS 방법의 도입을 요청할 수 있는 제어 메커니즘에 의해 도입될 수 있다. SS 시스템 및 방법은 잡음 감소, 호출 명료성 및/또는 다른 성능 장점을 위해 다른 알고리즘과 함께 또는 단독으로 사용되도록 (휴대폰 또는 네트워크와 같은) 수집, 전송 또는 전달의 포인트로부터 구현될 수 있는, 펌웨어, 내장된 소프트웨어, 독립형 소프트웨어 애플리케이션 또는 플랫폼, 또는 추가 소프트웨어 기능 또는 특징으로서 통합될 수 있다.
일부 실시예에서, 이러한 SS 적용은 도로 잡음, 외부 환경, 잡음, 라디오 잡음, HVAC 잡음, 의도치 않은 객실 소음 및 동행 승객 잡음과 같은 유사한 간섭 음원중 하나와 혼합된 표적 오디오 커맨드의 요소를 처리하는 있어 문제가 될 수 있는 차량 음성 제어 시스템(car voice control system)에서 사용될 수 있다. 여기에 기술된 SS 방법은 자동차 내 음성 응답 시스템과 함께 사용되어 정확한 음성 응답 시스템 처리, 자동 제어 및 차량 보안을 위해 원치않거나 간섭하는 배경 잡음으로부터 표적 명령을 추출하고 증폭할 수 있다. 여기에 기술된 SS 방법은 음성 응답 시스템에 의해 처리될 수 있는 음성 또는 추출된 음성 특성을 사용함으로써 음성 명령 시스템과 상호작용할 수 있다. 이러한 처리 시스템은 자동차 기반 PC에 탑재되어 포함되거나 차량의 외측의 중앙 처리 서버에 전송될 수 있다. 이러한 시스템에 의해 제어되는 음성 응답 명령의 실시예는 자동차 내 네비게이션, HVAC, 윈도우, 라디오, 시트 기능, 와이퍼, 자동 제어 잠금 및 제어, 선루프 제어와 같은 자동 시스템 제어 및 휴대폰 인티그레이션 및 아이팟, 태블릿, 엠피3, 오디오 및 엔터테인먼트 디바이스 제어와 같은 제삼자 통합 디바이스 제어를 포함할 수 있지만 이에 제한되는 것은 아니다. 일한 SS 시스템은 또한 차량 중앙 오디오 처리 시스템을 통해 통과할 수 있는 신호를 전송하고 수신하는 것과 같은 처리를 위해 휴대폰, 블루투쓰 및 다른 핸드셋 시스템에 연결될 수 있다. SS 방법의 추가 배치는 차량 제어 및 보안을 위한 온보드 음성 생체측정일 수 있다. 여기에 기술된 SS 시스템 및 방법에 의해 포착된 음성 특성에 의해 각 개인 사용자에게 고유한 정밀한 음성 특성을 추출할 수 있다. 이러한 제어 특성의 대표적인 배치는 운전자/사용자에게 할당된 차량 잠금 및 알람 제어, 운전자 엔진 시동 및 끄기 제어(탑승에 의해 또는 휴대폰과 같은 외부 제어 장치를 통해 시작된다), 운전자 및/또는 특정 사용자 제어 및 비본질적인 차량 제어 시스템을 포함할 수 있지만 이에 제한되는 것은 아니다.
여기에 기술된 SS 시스템은 단일 마이크로폰(스테레오 또는 모노, 방향성 또는 전방향성) 또는 객실내에 구축된 마이크로폰 어레이 또는 블루투쓰 헤드셋 또는 다른 핸드프리 휴대폰 제어 장치와 같은 외부 시스템으로의 연결을 통해 가동될 수 있다. 이러한 시스템은 음성 제어 시스템이 운전자의 시트, 운전자 및 승객 시트 모두, 또는 지정된 생체 측정학적 특징을 가진 개인을 위한 프롬프트만을 수용하도록 사용자에 의해 배치되고 프로그램될 수 있다. 별개의 제어 역시 뒤쪽 시트의 개인이 뒤쪽 HVAC 시스템 또는 뒤쪽 엔터테인먼트 시스템을 제어할 수 있도록 추가될 수 있다. 일부 실시예에서, 운전 또는 추가인원 음성 생체측정학 제어는 이러한 시스템을 사용함으로써 또는 여기에 기술된 SS 방법을 사용하는 다른 장치로부터 사용자 음성 생체측정 프로파일을 다운로드함으로써 프로그램될 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법은 초음파, MRI, CT 스캔, PET 스캔, 엑스레이, SPECT, 감마 카메라 이미징, 뉴클리어 이미징, 광음향 이미징, 유방 온도 기록, 및 단층촬영장치를 포함하고 이에 제한되지 않는 정지 이미징 또는 시계열 이미징 신호 분석을 사용하는 일련의 의료 영상 적용에 배치될 수 있다. 여기에 기술된 SS 방법을 적용하면 표적 이미지의 해상도를 향상시킬 수 있고 상술되고 다른 의료 이미징 시스템 내의 이미징 장비에 의해 생성된 잡음을 감소시킬 수 있다. 여기에 기술된 SS 방법 및 시스템의 실시예는 초음파 프로브에서 해상도를 향상시키고 중첩 요소에 의해 생성된 잡음을 감소시키도록 의료 초음파 시스템에 적용할 수 있다. SS 알고리즘은 독립된 초음파 시스템, pc 기반 시스템, 태블릿 시스템, 스마트폰 앱, PDA, 및 휴대형 시스템에 통합될 수 있다. SS 알고리즘은 디바이스 내부 CPU를 흘러넘칠 수 있는 펌웨어, 디바이스에 로딩된 소프트웨어 또는 앱, 또는 DSP 또는 제어 박스 또는 초음파 프로브 자체에 통합된 다른 칩으로서 통합될 수 있다. 향상된 초음파를 위한 SS 방법 및 시스템은 프로브 내의 개별적인 요소에 의해 수집된 데이터의 합산 전 또는 후에 통합될 수 있다. 여기에 기술된 SS 방법 및 시스템은 표적 해부학에서 차이를 보상하기 위해 빔 각도 및 신호 강도의 조정과 호환가능하도록 빔 형성 전 및/또는 후에 사용될 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법 및 시스템은 임의의 형태의 (초음파 검사와 같은) 초음파 영상 소프트웨어 또는 2D 초음파, 3D 초음파, 4D 초음파, 조직 도플러, 흐름 도플러 조직 왜곡 분석, 탄력성 분석 및 다른 적용을 포함하고 이에 제한되지 않는 추가 이미징 분석 프로그램과 함께 사용될 수 있다. 이러한 SS 소프트웨어는 진단 및 수술 적용 모두를 포함하는 모든 의료 행위에 적용될 수 있다. SS 강화된 초음파 이미지의 실시예는 초음파 보조 조직 검사, 초음파 보조 카테테르 배치, 초음파 심장검사, 심장학 및 심장 수술 적용, 정형 외과 및 정형외고 수술 적용, 이미징 및 수술 모두를 포함하는 초음파검사 및 다른 산부인과 적용, 비뇨기관 적용, 소화과 적용, 연조직 적용, 머리, 목 및 두개 적용을 포함할 수 있다. 여기에 기술된 이러한 핵심 초음파 적용은 또한 수의학 적용 및 복합 재료, 구조 및 지질 조사의 초음파 분석을 포함하고 이에 제한되지 않는 산업 적용을 위한 초음파 하드웨어 및 이미징 소프트웨어 프로그램 모두와 함께 사용될 수 있다.
일부 실시예에서, SS 기술은 수중 음파 적용은 물론 수중 음파 탐지기(소나)와 관련된 적용에 사용될 수 있다. 소나는 물의 표면 위 또는 아래의 물체를 찾고, 통신하고 및/또는 검출하기 위해 소리 전파를 사용한다. 표적 대상에 의해 생성된 소리를 "들을" 수 있는 수동형 소나 기술에 기초한 적용; 및 소리의 펄스를 발산하고 에코를 들을 수 있는 능동형 소나 기술에 기초한 적용을 포함하는 2개 타입의 소나 기반 적용이 존재할 수 있다. 소나는 수중 "표적"의 에코 특성의 측정의 수단 및 음향 위치파악의 수단으로 사용될 수 있고, 잠수함 항해, 어뢰 및 광산을 위한 안내, 수중 조사 및 맵핑, 에코 사운딩, 파이프라인 조사, 파형 측정, 및 (표적 활동 분석을 사용하는 것과 같은) 관심의 표적의 코스, 범위, 궤적 및 속력을 결정하는 것을 포함한(하지만 이에 제한되지 않는다) 적용에 사용될 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법 및 시스템은 소리 전송기 및 수신기를 사용할 수 이고, 단상태, 쌍상태 또는 다중상태 구성으로 동작될 수 있고 음향 주파수가 매우 낮은(초저주파)로부터 극고(초음파)로 변할 수 있는 임의의 형태의 능동 소나에 의해 신호 품질을 강화시키도록 사용될 수 있다. 이러한 소나는 일반적으로 일정 주파수 또는 (수신시 펄스를 압축할 수 있는) 변하는 주파수의 "처프"에서 신호 발생기, 전력 증폭기 및 전기음향 트랜스듀서/어레이를 사용하여 전자적으로 생성된 소리의 펄스를 사용할 수 있다. 이러한 SS는 또한 요구되는 조사 각도를 포함하기 위해 스위핑될 수 있는 빔으로 음향 전력을 집중하는데 사용될 수 있는 빔 형성기와 함께 통합될 수 있다. 가끔, 이러한 음향 펄스는 화학적으로 폭약을 사용하는 것과 같은 다른 수단에 의해, 또는 공기 총을 사용함으로써, 또는 플라즈마 음원을 사용함으로써 생성될 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법 및 시스템은 보통 펄스를 전송하지 않고 "듣고" 일반적으로 큰 소리 데이터베이스에 검출된 소리를 비교함으로써, 검출된 소리의 소스를 식별하기 위한 광범위한 기술을 가질 수 있는 임의의 형태의 수동형 소나에 의해 신호 품질을 향상시키는데 사용될 수 있다. 수동형 소나를 사용함으로써, 표적에 방사된 잡음 레벨이 충분히 높은 경우에, 표적이 식별될 수 있다. 그러나, 일부 예에서, 물의 체적 탄성률, 질량 밀도, 온도, 용해된 불순물(보통 염도), 및 심지어 수압에 의해 결정된 소리 속력의 편차에 의해 동작이 영향을 받을 수 있다.
여기에 기술된 하나 이상의 실시예에 따라, 여기에 기술된 SS 방법은 소리 또는 반향이 수신되었을 때 분석 프로세스의 임의의 포인트에서 잡음, 간섭, 및/또는 흩뜨림을 경감시키는 것은 물론 소리 편차를 처리하기 위해 모든 형태의 능동형 및 수동형 소나에 적용될 수 있어서, 최종 사용 적용에 전달되는 최종 데이터의 품질을 향상시킬 수 있다. 이것은 빔 형성 및 좁은 빔 전송과 같은, 임의의 다른 보정 알고리즘에 관계없이 또는 이러한 시스템의 하나 이상과 결합되어 수신, 전송 또는 표시 시스템의 소프트웨어 또는 하드웨어 구성요소로 도입될 수 있다. 일부 예에서, 희망의 표적 반향 또는 특징을 방해하는 잡음의 소스의 범위는 파도 및 해상 운송으로부터 난류 및 해양 생물에까지 이를 수 있다. 또한, 물을 통한 수신기의 운동 역시 속력에 의존하는 저주파수 잡음을 유발할 수 있다. 능동형 소나가 사용될 때, 흩뜨러짐이 바닥과 표현으로부터 일어나는 것은 물론 바다 속의 작은 대상으로부터 일어날 수 있다. 능동형 및 수동형 소나에 더하여, SS 기술은 합성 개구 소나 및 파라메트릭 및 비선형 소나를 포함하고 이에 제한되지 않는 다른 소나 기반 시스템에 유익하도록 적용될 수 있다. 여기에 기술된 SS 방법 및 시스템은 또한 수면 아래에서 메시지를 전송하고 수신하도록 사용될 수 있는 수중 음향 통신을 포함하는 수중 음파 시스템에 도입될 수 있다. 이러한 통신을 채용하는 다수의 방법이 있지만 가장 일반적인 것은 수중 청음기를 사용하는 것일 수 있다. 수중 통신은 다중 경로 전파, 채널의 시간 편차, 작은 유용한 대역폭, 및 강한 신호 감쇠를 포함하고 이에 제한되지 않는, SS에 의해 처리될 수 있는, 다수의 요인으로 인해 어려울 수 있다.
일부 실시예에서, 여기에 기술된 SS 시스템 및 방법은 마이크로폰에 의존하는 시스템에 사용될 수 있다. 휴대폰 및 다른 전화 시스템과 같이, (단독으로 또는 셀룰러 네트워크 또는 다른 전화망에 함께 사용되는) 헤드셋, 스피커폰 및 일반적인 마이크로폰 기반 시스템은 전송/기록의 시간에 존재하는 의도치 않은 배경 잡음 및 주변 잡음은 물론 의도치 않은 수신, 처리 및 전송의 효과를 디바이스 사용자에게 줄 수 있다. 현 시스템은 화자를 압도할 수 있고 수신기/사용자가 의도된 전송/기록 신호를 이해하는 것을 어렵게 할 수 있는 다른 주변 또는 간섭 잡음으로부터 표적 사용자를 분리시킬 수 없다. 이러한 문제의 대표적인 예는 비행 제어 시스템을 통한 비행기 잡음의 전송, 휴대폰 헤드셋을 통해 공항에서의 PA 발표의 방송, 회담 전화 화자 시스템을 통한 실내 잡음 방송, "드라이브스루" 주문 시스템을 통한 시스템을 통한 자동차 및 실외 잡음, 또는 심지어 코치의 헤드셋을 통한 군중 잡음 방송을 포함할 수 있다.
여기에 기술된 SS 시스템 및 방법은 전송/기록 장치 내의 마이크로폰에 의해 포착된 원치않는/의도치않은 주변/배경 잡음에 관련하여 사용자의 품질/명료성을 향상시킬 목적으로 이러한 마이크로폰에 의존하는 장치에 통합될 수 있다. 이러한 SS 방법은 각 장치에 대해 최적화될 수 있어서 특정 화자, 또는 근방 디바이스 사용자 및 원거리 잡음을 끄는 것과 같은 규정된 제한 면적/반경으로부터 나온 음원만을 전송할 수 있다. 이것은 의도치 않은 배경 잡음이 아닌 표적 화자로부터의 소리를 추출하고 선택적으로 전송/기록하도록 SS 방법 및 시스템을 사용함으로써 달성될 수 있다.
이러한 시스템의 실시예는 블루투쓰 헤드셋에 여기에 기술된 SS 시스템 및 방법을 추가하는 것을 포함할 수 있다. 이러한 SS 기술은 기존의 프로세서에 추가된 펌웨어 또는 전용 DSP로서 헤드셋에 추가될 수 있다. 이러한 기술은 디바이스의 마이크로폰(방향성 또는 전방향성)에 의해 포착된 신호를 처리하고, 의도치않은 잡음으로부터 표적 음원을 추출할 수 있고, 그후에 최종 신호는 전송되거나 기록될 수 있다. 이로 인해 기록 장치 또는 전송 시스템은 확실하게 추출된 음원만을 기록할 수 있어서 해당 음원의 품질 및 명료성을 증가시킬 수 있다. 이러한 처리의 이러한 새로운 단계는 단독 특징으로서 사용될 수 있거나 다른 오디오 처리 및 향상 알고리즘과 함께 사용될 수 있다. 여기에 기술된 SS 시스템 및 방법의 다른 실시예는 마이크로폰 기반 기록에 사용될 수 있다. 표적 음원은 하나의 채널에서 추출되고 기록될 수 있지만, 배경 잡음은 별개의 채널로 기록될 수 있다. 각 채널은 그다음, 최적/희망의 소리 효과 및 품질을 위해 재혼합될 수 있다.
비제한의 실시예에 따라, 시스템은 소리 신호 분리의 공동/분배 계산에 참여하는 근방 프로세서와 함께, 마이크로폰과 같은 소리 수집 장치, 또는 (예를 들어, 블루투쓰 또는 다른 통신 프로토콜을 사용하는) 통신을 위한 소리 전송 장치를 포함한다. 일부 실시예에서, 일부 처리는 프로세서에 의해 원격 서버에 분배될 수 있고, 최종 결과는 통신 시스템을 통해 되돌려지고 전송될 수 있다.
다른 실시예에서, 표적 입력 신호로부터 구별되는 주변 잡음 또는 배경 잡음은 입력 원신호로부터 제거되어 복원된 원신호를 생성하고, 그다음, 이러한 복원된 원신호는 보다 낮거나 감소된 프레젠테이션 레벨의 주변 또는 배경 잡음과 재결합되고 이러한 조합된 신호가 출력될 수 있다. 일부 실시예에서, 사용자는 재도입된 주변 잡음의 프레젠테이션 레벨을 동적으로 또는 정적으로 변경할 수 있다.
일부 실시예에서, 여기에 기술된 SS 시스템 및 방법은 음성 제어 텔레비전 및 다른 대화형 장치 기반 애플리케이션에 사용될 수 있다. TV, 비디오 게임, 엔터테인먼트 시스템 및 대화형 장치를 위한 음성 인식 및 음성 구동 명령 시스템의 성장은 간섭 잡음, 명령을 방해하는 의도치 않은 화자, 및 명령 인식 및 응답에 영향을 주는 배경 잡음의 문제에 의해 제한되어왔다. 여기에 기술된 SS 방법은 정확한 음성 인식 및 응답을 보장하기 위해 임의의 이런 엔터테인먼트 장치에 구현될 수 있다. 또한, 이러한 장치는 여기에 기술된 SS 방법이 적용될 수 있는 (상술된 단락에서) 기술된 것과 유사한 음성 인식을 위해 네트워크 의존 솔루션에 연결되거나 사용할 수 있다. 여기에 기술된 SS 시스템 및 방법의 실시예는 텔레비전 기능을 위한 음성 응답/음성 제어에 SS의 사용을 포함할 수 있다. SS에 의해 시스템은 시스템에서 사전프로그램될 수 있는 특정 화자, 또는 리모콘 또는 다른 유사한 장치에 말하는 미지의 화자에 초점을 맞출 수 있다. 화자의 음성 명령은 케이블 TV 박스, DVR 시스템, 위상 시스템, DVD 플레이어, 통합음향장치, PC, 비디오 게임 시스템/콘솔, 인터넷 접속부, 클라우드 접속부, 화상회의 시스템, VOIP/인터넷 전화 시스템, 및 다른 유사한 장치를 포함하고 이에 제한되지 않는 모든 장치 특성 및 관련된 장치의 특성을 제어하도록 구성될 수 있다. 일부 예에서, TV 음성 응답 제어는 텔레비전 내장 마이크로폰/스피커, 전용 리모콘 마이크로폰/스피커, 외부 마이크로폰/스피커 시스템, 휴대폰, 태블릿, PC, 비디오 게임 시스템 및 헤드셋을 포함하고 이에 제한되지 않는 임의의 마이크로폰 또는 스피커/마이크로폰 결합 시스템에 의해 구동될 수 있다. 이러한 예에서, 제어 특성부는 방향성/전방향성 마이크로폰을 사용할 수 있고 및/또는 이러한 시스템으로의 IR, 블루투쓰, 와이파이, RF 또는 유선 연결을 사용할 수 있다. 이러한 시스템에 의해 음성 구동 질의를 수용하고 응답하는, 쌍방향 대화가 가능하고, 이러한 시스템은 또한 화상회의, 웹 회의, VOIP, 및 웹기반 회담 전화를 위한 인터페이스로서 기능할 수 있다. 여기에 기술된 음성 제어 TV를 위한 SS 방법 및 시스템은 수신된 음성을 재합성하거나 재합성하지 않을 수 있다. 잡음 환경에서, 수신된 음성은 음성 인식 엔진 또는 음성 응답 시스템을 구동하기 위한 여기에 기술된 SS 수학적 모델에 기초한 음성 특성 또는 음성 벡터로서 처리될 수 있다. 재합성된 음성에 의해, 다양한 레벨의 배경 잡음이 재통합될 수 있다. 이러한 시스템은 표적 음성 또는 음성들에 응답하도록 훈련될 수 있다. 일부 실시예에서, 화자 인식 훈련은 디바이스 초기화의 시간에 음성의 디바이스 사용 또는 인용을 통해 이루어질 수 있다.
일부 실시예에서, 여기에 기술된 SS 방법 및 시스템은 전원 감시 관련된 애플리케이션에 사용될 수 있다. 전원은 예를 들어, 일부 적용에서 대략 50Hz의 평균값을 갖는 연속 저레벨 잡음을 발생한다. 전격 수용의 변동에 의해 이러한 잡음 레벨에서 경미한 편차가 발생할 수 있다. 예를 들어, 증가된 전기 수요는 잡음 레벨을 낮출 수 있지만, 감소된 수요 레벨은 반대 효과를 가져올 수 있다. 전력 수요의 변동은 임의의 기록과 상관될 수 있는 고유의 시간/날짜 특징을 제공하는 기능을 전력망에 줄 수 있다. 여기에 기술된 SS 시스템 및 방법은 시스템의 매우 정확한 시계열 특징을 생성하도록 전력망을 감시하는데 사용될 수 있다. 이러한 특징은 임의의 기록 장치(오디오 또는 비디오) 또는 원신호 타입(아날로그 또는 디지털)로부터 유도될 수 있다. 저레벨의 오디오 신호는 시스템에 걸쳐 한결같을 수 있고 신호 분석은 발전소, 특정 기계 또는 임의의 다른 위치에서 일어날 수 있다. 여기에 기술된 SS 시스템 및 방법은 전력망의 매우 정확한 시계열 특징을 제공하도록 임의의 생중계 또는 기록으로부터 전원의 신호 영향을 추출하도록 구성될 수 있다. 이러한 특징은 실시간으로, 거의 실시간으로 또는 연속으로 분석될 수 있다. 이러한 시스템의 실시예는 전원의 임박한 전압저하, 전력 스파이크, 정전 또는 전력 두절을 예측하는데 SS를 사용할 수 있다. 이것은 규격/예측 변수 이력에 대한 저레벨 잡음의 변화를 분석함으로써 전력망 전체 레벨, 개별적인 현장, 또는 개별적인 장치에서 일어날 수 있다. 기록 장치는 상기 위치, 기계 또는 장치중 하나에서 주변 잡음을 기록할 수 있고 그다음, SS 방법은 다른 잡음으로부터 목표가 되는 전기 잡음을 분리한다. 이러한 SS 방법 및 시스템은 전력 잡음을 판독하도록 구성될 수 있고, 잡음 레벨이 우려된다면 임박한 이벤트에 대해 경고를 전송하도록 구성될 수 있다. 이러한 경고는 장치 자체에 나타나거나 네트워크를 통해, 무선으로 또는 클라우드를 통해 임의의 감시 장치, PC, 태블릿, 휴대폰 또는 임의의 다른 장치에 전송될 수 있다.
이러한 시스템의 다른 실시예는 범죄 과학 수사의 오디오 분석과 관련될 수 있다. 이러한 실시예는 기록이 생성된 날짜 및 시간의 식별 및 인증을 포함할 수 있다. 여기에 기술된 SS 방법 및 시스템은 기록으로부터 전기 시스템 잡음을 추출하고 해당 신호의 매우 정확한 수학적 표현을 생성하도록 사용될 수 있다. 이러한 신호는 이러한 기록이 생성된 추출 시간 및 날짜를 알아내도록 전기 그리드로부터의 공지된 기록과 상관될 수 있다. 이러한 인증은 증거로 자백되도록 그리고 이러한 기록이 불순하지 않다는 것을 보장하기 위해 이러한 기록을 인증할 필요가 있을 수 있다. 이러한 분석은 (오디오 또는 비디오, 디지털 또는 아날로그와 같은) 임의의 타입의 기록, 파일 포맷, 또는 기록의 지속시간에 대해 행해질 수 있다.
피트(fit) 사용자 인터페이스에 의해 사용자는 처리의 재합성 단계를 위한 추적, 그룹화 및 피크 선택을 보고 상호작용을 할 수 있다. 사용자 인터페이스는 저장된 데이터를 보고 수정하기 위해 "오프라인"으로 사용될 수 있거나, 처리 구성요소에 명령하고 이러한 데이터와 실시간으로 상호작용하도록 "온라인"으로 사용될 수 있다. 이것은 데이터를 분석하고, 컴포넌트 파라미터를 수정하는데 사용될 수 있다. 이것은 사용자 상호작용에 의해 최적의 컴포넌트 파라미터를 검출할 수 있다. 예를 들어, 재합성을 위해 사용자가 데이터를 선택하였다면, 피트 사용자 인터페이스는 유사한 데이터를 검출하기 위해 처리 파라미터를 계산할 수 있다.
비제한의 실시예에 따라, 트랙; 이러한 트랙, 트래클렛 및/또는 코히어런트 그룹을 갖는 신호 데이터를 추가하거나, 제거하거나, 그룹화하는 것중 적어도 하나를 하도록 시각 표현을 편집하기 위한 복수의 잠재적인 코히어런트 트래클렛 및/또는 코히어런트 그룹으로서 신호를 보기 위해 사용자 인터페이스가 제공된다.
다른 실시예에서, 트랙; 복수의 잠재적인 코히어런트 트래클렛; 및/또는 트랙, 트래클렛, 및/또는 코히어런트 그룹을 클릭할 수 있는 코히어런트 그룹들로서 신호를 볼 수 있고 이러한 트랙, 트래클렛 및/또는 코히어런트 그룹과 연관된 데이터를 제공하도록 사용자 인터페이스가 사용될 수 있다. 다른 실시예에서, 트랙; 복수의 잠재적인 코히어런트 트래클렛; 및/또는 이러한 트랙, 트래클렛 및/또는 그룹에 대한 특성 데이터를 포함하는 입력에 기초하여 사용자 인터페이스에서 트랙 및/또는 트래클렛을 조사하고 발견할 수 있는 코히어런트 그룹으로서 신호를 보기 위해 사용자 인터페이스가 사용될 수 있다. 다른 실시예에서, 사용자는 무슨 데이터가 트랙, 그룹 및/또는 트래클렛으로 연관되어 있는지를 수정하기 위해 수시로 스코어링 함수를 변경할 수 있다.
도 16에는 상기 실시예 및 설명에 따라 실시될 수 있는 트랙 에디터의 실시예가 도시되어 있다. 도시된 바와 같이, 이러한 트랙 에디터는 오실레이터 피크로 구성된 복수의 트래클렛을 표시한다. 비제한의 다양한 실시예에서, 오실레이터 피크는 트랙-id에 따라 컬러링될 수 있다. 또 다른 실시예에서, 오실레이터 피크는 코히어런트 그룹-id에 따라 컬러링될 수 있다. 다른 실시예에서, 오실레이터 피크는 이들이 재합성을 위해 선택되었는지에 따라 컬러링되거나 투명하도록 설정될 수 있다. 다른 실시예에서, 오실레이터 피크는 임의의 다른 오실레이터 피크 파라미터에 따라 컬러링될 수 있다. 다른 실시예에서, 오실레이터 피크는 진폭, 배경 전력에 대한 진폭, 또는 동일한 크기를 갖는 진폭에 따라 크기 조정될 수 있다.
도 17에는 트랙 에디터 GUI의 비제한의 실시예가 도시되어 있다. 비제한의 실시예에 따라, 사용자는 선택된 데이터에 대한 처리를 위해 트랙 에디터 GUI에 표시된 데이터를 선택할 수 있다. 하나의 실시예에서, 데이터는 박스 또는 올가미에 의한 드로잉등을 통해 에어리어가 선택될 수 있다. 다른 실시예에서, 사용자는 예를 들어, 트래클렛의 임의의 피크를 클릭함으로써 트래클렛에 의해 데이터를 선택할 수 있다. 다른 실시예에서, 사용자는 예를 들어, 코히어런트 그룹 내의 임의의 피크를 클릭함으로써 코히어런트 그룹에 의해 데이터를 선택할 수 있다. 또 다른 실시예에서, 사용자는 예를 들어, 임의의 피크를 클릭함으로써 오실레이터 피크에 의해 데이터를 선택할 수 있다.
일단 선택되면, 사용자는 이러한 데이터에 실행될 동작을 선택할 수 있다. 예를 들어, 사용자는 오실레이터 피크 통계, 도착 방향, 시간 영역 오디오, 분광 데이터등이 시각적으로 표현되는 다른 뷰에서 이러한 데이터를 도표화할 수 있다. 일부 실시예에서, 사용자는 "턴온/턴오프" 옵션등을 통해 재합성을 위해 선택 피크를 포함할지를 시스템에게 명령할 수 있다.
도 18에는 상술된 바와 같이 사용자가 선택한 데이터를 표시하기 위한 데이터 비주얼라이저의 실시예가 도시되어 있다.
이러한 SS 방법 및 시스템은 다양한 실시예에 따라 소프트웨어, 하드웨어, 펌웨어, 또는 임의의 조합으로 구현될 수 있다. 이러한 프로세스는 (퍼스널 컴퓨터, 모바일 폰, 이미징 디바이스, 보청기, 대화형 음성 응답 시스템, 회담 전화 시스템, 오디오 레코딩 디바이스, 차량용 음성 구동 시스템, 구술(dictation) 시스템, 및 통신 시스템과 같은) 다양한 컴퓨터가 구비된 장치에 실행되는 하나 이상의 컴퓨터 프로그램에서 구현될 수 있는 것이 바람직하다. 이러한 장치는 (범용 및 전용 마이크로프로세서와 같은) 컴퓨터 프로세서, 및 이러한 프로세서 입출력 장치에 의해 판독가능한 저장 매체를 포함할 수 있다. 각 컴퓨터 프로그램은 이러한 장치의 램에 상주하는 코드 모듈 내의 명령어(프로그램 코드)의 세트일 수 있다. 컴퓨터 프로세서에 의해 요구될 때까지, 이러한 명령어의 세트는 일부의 경우에 (반도체 메모리 장치, 하드디스크 드라이브, 또는 광디스크, 외부 하드드라이브, 메모리 카드 또는 플래시 드라이브와 같은 제거가능한 메모리 장치등과 같은) 다른 컴퓨터 메모리에 조장될 수 있거나 다른 컴퓨팅 장치에 저장되고 인터넷 또는 다른 네트워크를 통해 다운로드될 수 있다.
이와 같이 다수의 실시예를 설명하였지만, 다양한 변경, 수정, 및 향상이 당업자에게 용이하다는 것을 이해할 수 있다. 이러한 변경, 수정 및 향상은 본 발명의 일부를 형성하도록 의도되어 있고, 본 발명의 정신 및 범위 안에 있는 것으로 의도될 수 있다. 여기에 제시된 일부 예가 특정 조합의 기능 또는 구조 요소를 포하하지만, 이러한 기능 및 요소는 동일하거나 상이한 목표를 달성하기 위해 본 발명에 따라 다른 방식으로 결합될 수 있다는 것을 이해해야 한다. 특히, 하나의 실시예와 함께 기술된 동작, 요소, 및 특징은 다른 실시예의 유사하거나 다른 기능으로부터 제외되는 것은 의도된 것은 아니다. 또한, 여기에 기술된 요소 및 구성요소는 추가 구성요소로 더 분할되거나 함께 결합되어 동일한 기능을 실행하기 위한 보다 적은 수의 구성요소를 형성할 수 있다.
소수의 실시예만 도시되고 설명되었지만, 많은 변경 및 수정이 하기 청구범위에 기술된 정신 및 범위로부터 벗어남 없이 가능하다는 것을 이해할 것이다. 여기에 언급된 모든 특성 출원 및 특허, 해외 및 국내, 및 모든 다른 공보는 그 전체가 여기에 언급되어 통합되어 있다.
여기에 기술된 방법 및 시스템은 컴퓨터 소프트웨어, 프로그램 코드, 및/또는 명령어를 프로세서에서 실행하는 기계를 통해 부분적으로 또는 전체적으로 배치될 있다. 여기에 기술된 다양한 실시예는 이러한 기계에 대한 방법으로서, 이러한 기계와 관련되거나 일부로서의 시스템 또는 장치로서, 또는 이러한 기계중 하나 이상에서 실행되는, 컴퓨터 판독가능 매체에서 구현된 컴퓨터 프로그램 제품으로서 구현될 수 있다. 실시예에서, 이러한 프로세서는 서버, 클라우드 서버, 클라이언트, 네트워크 인프라스트럭처, 모바일 컴퓨팅 플랫폼, 고정형 컴퓨팅 플랫폼, 또는 다른 컴퓨팅 플랫폼의 일부일 수 있다. 프로세서는 프로그램 명령어, 코드, 이진 명령어등을 실행할 수 있는 임의의 종류의 계산 또는 처리 장치일 수 있다. 이러한 프로세서는 신호 프로세서, 디지털 프롯서, 내장된 프로세서, 마이크로프로세서 또는, 저장된 프로그램 코드 또는 프로그램 명령어의 실행을 직간접으로 도울 수 있는 코프로세서(수치연산 코프로세서, 그래픽 코프로세서, 통신 코프로세서등)와 같은 임의의 변형이거나 포함할 수 있다. 또한, 이러한 프로세서는 다수의 프로그램, 스레드, 및 코드를 실행할 수 있다. 이러한 스레드는 프로세서의 성능을 향상시키기 위해 그리고 애플리케이션의 동시 동작을 돕기 위해 동시에 실행될 수 있다. 구현에 의해, 여기에 기술된 방법, 프로그램 코드, 프로그램 명령어등은 하나 이상의 스레드로 구현될 수 있다. 이러한 스레드는 연관된 우선순위가 할당된 다른 스레드를 낳을 수 있고, 이러한 프로세서는 프로그램 코드로 제공된 명령어에 기초한 우선순위 또는 임의의 다른 순서에 기초하여 이러한 스레드를 실행할 수 있다. 이러한 프로세서, 또는 하나를 사용하는 임의의 기계는 여기 및 다른 곳에 기술된 메소드, 코드, 명령어 및 프로그램을 저장하는 메모리를 포함할 수 있다. 이러한 프로세서는 여기 및 다른 곳에 기술된 메소드, 코드 및 명령어를 저장할 수 있는 저장 매체에 인터페이스를 통해 접근할 수 있다. 컴퓨팅 또는 처리 장치에 의해 실행될 수 있는 메소드, 프로그램, 코드, 프로그램 명령어 또는 다른 타입의 명령어를 저장하기 위한 프로세서와 연관된 저장 매체는 CD-ROM, DVD, 메모리, 하드디스크, 플래시 드라이브, 램, 롬, 캐시등의 하나 이상을 포함할 수 있지만 이에 제한되는 것은 아니다.
프로세서는 멀티프로세서의 속력 및 성능을 향상시킬 수 있는 하나 이상의 코어를 포함할 수 있다. 실시예에서, 이러한 프로세서는 2개 이상의 독립형 코어(다이로 부른다)를 결합한 듀얼 코어 프로세서, 쿼드 코어 프로세서, 다른 칩 레벨 멀티플로세서등일 수 있다.
여기에 기술된 방법 및 시스템은 서버, 클라이언트, 방화벽, 게이트웨이, 허브, 라우터, 또는 다른 이러한 컴퓨터 및/또는 네트워킹 하드웨어에 컴퓨터 소프트웨어를 실행하는 기계를 통해 부분적으로 또는 전체적으로 배치될 수 있다. 이러한 소프트웨어 프로그램은 파일 서버, 프린트 서버, 도메인 서버, 인터넷 서버, 인트라넷 서버, 클라우드 서버 및 2차 서버, 호스트 서버, 분산 서버등과 같은 다른 변형을 포함할 수 있는 서버와 연관될 수 있다. 이러한 서버는 메모리, 프로세서, 컴퓨터 판독가능 매체, 저장 매체, 포트(물리적 및 가상), 통신 장치 및, 다른 서버, 클라이언트, 및 장치에 유선 또는 무선 매체등을 통해 접근할 수 있는 인터페이스중 하나 이상을 포함할 수 있다. 여기 및 다른 곳에 기술된 메소드, 프로그램, 또는 코드는 서버에 의해 실행될 수 있다. 또한, 본원에 기술된 방법의 실행을 위해 필요한 다른 장치는 서버와 연관된 인프라스트럭처의 일부로서 생각될 수 있다.
이러한 서버는 클라이언트, 다른 서버, 프린터, 데이터베이스 서버, 프린트 서버, 파일 서버, 통신 서버, 분산 서버, 소셜 네트워크등을 제한 없이 포함하는 다른 장치로의 인터페이스를 제공할 수 있다. 또한, 이러한 결합 및/또는 접속은 네트워크를 통한 프로그램의 원격 실행을 도울 수 있다. 이러한 장치의 일부 또는 모두의 네트워킹은 본 발명의 범위로부터 벗어남 없이 하나 이상의 위치에서 프로그램 또는 메소드를 병렬 처리하는 것을 도울 수 있다. 또한, 인터페이스를 통해 서버에 부착된 장치중 하나는 메소드, 프로그램, 코드 및/또는 명령어를 저장할 수 있는 적어도 하나의 저장 매체를 포함할 수 있다. 중앙 저장소는 상이한 장치에 실행되는 프로그램 명령어를 제공할 수 있다. 이러한 실시예에서, 원격 저장소는 프로그램 코드, 명령어 및 프로그램을 위한 저장 매체로서 동작할 수 있다.
이러한 소프트웨어 프로그램은 파일 클라이언트, 프린트 클라이언트, 도메인 클라이언트, 인터넷 클라이언트, 인트라넷 클라이언트 및, 2차 클라이언트, 호스트 클라이언트, 분산 클라이언트등과 같은 다른 변형을 포함할 수 있는 클라이언트와 연관될 수 있다. 이러한 클라이언트는 메모리, 프로세서, 컴퓨터 판독가능 매체, 저장 매체, 포트(물리적 및 가상), 통신 장치, 및 다른 클라이언트, 서버, 기계, 및 장치에 유선 또는 무선 매체등을 통해 접근할 수 있는 인터페이스중 하나 이상을 포함할 수 있다. 여기 및 다른 곳에 기술된 메소드, 프로그램, 코드는 클라이언트에 의해 실행될 수 있다. 또한, 보원에 기술된 메소드의 실행을 위해 필요한 다른 장치는 클라이언트와 연관된 인프라스트럭처의 일부로서 생각될 수 있다.
이러한 클라이언트는 서버, 다른 클라이언트, 프린터, 데이터베이스 서버, 프린트 서버, 파일 서버, 통신 서버, 분산 서버등을 제한 없이 포함하는 다른 장치로의 인터페이스를 포함할 수 있다. 또한, 이러한 결합 및/또는 접속은 네트워크를 통한 프로그램의 원격 실행을 도울 수 있다. 이러한 장치의 일부 또는 모두의 네트워킹은 본 발명의 범위로부터 벗어남 없이 하나 이상의 위치에서 프로그램 또는 메소드를 병렬 처리하는 것을 도울 수 있다. 또한, 인터페이스를 통해 클라이언트에 부착된 장치중 하나는 메소드, 프로그램, 애플리케이션, 코드 및/또는 명령어를 저장할 수 있는 적어도 하나의 저장 매체를 포함할 수 있다. 중앙 저장소는 상이한 장치에서 실행되는 프로그램 명령어를 제공할 수 있다. 이러한 실시예에서, 원격 저장소는 프로그램 코드, 명령어 및 프로그램을 위한 저장 매체로서 동작할 수 있다.
여기에 기술된 방법 및 시스템은 네트워크 인프라스트럭처를 통해 부분적으로 또는 전체적으로 배치될 수 있다. 이러한 네트워크 인프라스트럭처는 출력 장치, 서버, 라우터, 허브, 방화벽, 클라이언트, 퍼스널 컴퓨터, 통신 장치, 라우팅 장치 및 당업계에 알려진 바와 같은 다른 능동형 및 수동형 장치, 모듈 및/또는 컴포넌트와 같은 요소를 포함할 수 있다. 네트워크 인프라스트럭처와 연관된 컴퓨팅 및/또는 논-컴퓨팅 장치는 다른 컴포넌트 외에, 플래시 메모리, 버퍼, 스택, 램, 롬등과 같은 저장 매체를 포함할 수 있다. 여기 및 다른 곳에 기술된 프로세스, 메소드, 프로그램 코드, 명령어는 네트워크 인프라스트럭처 엘리먼트중 하나 이상에 의해 실행될 수 있다. 여기에 기술된 방법 및 시스템은 서비스형 소프트웨어(software as a service, SAAS), 서비스형 플랫폼(platform as a service, PaaS), 및/또는 서비스형 인프라스트럭처(infrastructure as a service, IaaS)의 특징을 포함하는 것을 포함하는, 임의의 종류의 사설, 커뮤니티, 또는 혼합 클라우드 컴퓨팅 네트워크 또는 클라우드 컴퓨팅 환경과 함께 사용되도록 적용될 수 있다.
여기에 그리고 다른 곳에 기술된 메소드, 프로그램 코드 및 명령어는 다수의 셀을 가진 셀룰러 네트워크에서 구현될 수 있다. 이러한 셀룰러 네트워크는 주파수 분할 다중 접속(FDMA) 네트워크 또는 코드 분할 다중 접속(CDMA) 네트워크일 수 있다. 이러한 셀룰러 네트워크는 모바일 디바이스, 셀 사이트, 기지국, 리피터, 안테나, 타워등을 포함할 수 있다. 이러한 셀 네트워크는 GSM, GPRS, 3G, EVDO, 메시, 또는 다른 네트워크 타입일 수 있다.
여기에 그리고 다른 곳에 기술된 메소드, 프로그램 코드, 및 명령어는 모바일 장치에서 또는 이를 통해 구현될 수 있다. 이러한 모바일 장치는 네비게이션 장치, 휴대폰, 모바일 폰, 모바일 퍼스널 디지털 어시스턴트, 랩탑, 팜탑, 넷북, 페이저, 전자책 리더, 음악 재생기등을 포함할 수 있다. 이러한 장치는 다른 컴포넌트 외에, 플래시 메모리, 버퍼, 램, 롬 및 하나 이상의 컴퓨팅 장치와 같은 저장 매체를 포함할 수 있다. 모바일 장치와 연관된 이러한 컴퓨팅 장치는 저장된 프로그램 코드, 메소드 및 명령어를 실행할 수 있다. 대안으로, 모바일 장치는 다른 장치와 함께 명령어를 실행하도록 구성될 수 있다. 이러한 모바일 장치는 서버와 인터페이스된 기지국과 통신할 수 있고 프로그램 코드를 실행하도록 구성될 수 있다. 이러한 모바일 장치는 피어투피어 네트워크, 메시 네트워크, 또는 다른 통신 네트워크로 통신할 수 있다. 이러한 프로그램 코드는 서버와 연관된 저장 매체에 저장될 수 있고 서버 내에 내장된 컴퓨팅 장치에 의해 실행될 수 있다. 이러한 기지국은 컴퓨팅 장치 및 저장 매체를 포함할 수 있다. 이러한 저장 장치는 이러한 기지국과 연관된 통신 장치에 의해 실행되는 프로그램 코드 및 명령어를 저장할 수 있다.
컴퓨터 소프트웨어, 프로그램 코드, 및/또는 명령어는 임의의 시간 간격 동안 계산하기 위해 사용되는 디지털 데이터를 포함하는 컴퓨터 컴포넌트, 디바이스, 및 기록 매체; 램(RAM)으로 알려진 반도체 저장부; 보통 하드 디스크, 테이프, 드럼, 카드 및 다른 타입과 같은 자기 저장부의 형태의 광 디스크와 같은 보다 영구 저장을 위한 대용량 저장부; 프로세서 레지스터, 캐시 메모리, 휘발성 메모리, 비휘발성 메모리; CD, DVD와 같은 광학 저장부; 플래시 메모리(예를 들어, USB 스택 또는 키), 플로피 디스크, 자기 테이프, 페이퍼 테이프, 펀치 카드, 독립형 램 디스크, 집드라이브, 외장형 대용량 저장부, 오프라인등과 같은 이동식 매체; 동적 메모리, 정적 메모리, 기록/쓰기 저장부, 변하기 쉬운(mutable) 저장부, 읽기 전용 저장부, 램, 순차 접근 저장부, 로케이션 어드레스어블, 파일 어드레스어블, 콘텐츠 어드레스어블, 네트워크 부착 저장부, 샌(storage area network), 바코드, 자기 잉크등과 같은 다른 컴퓨터 메모리를 포함할 수 있는 기계 판독가능 매체에 저장되고 및/또는 접근될 수 있다.
여기에 기술된 방법 및 시스템은 물리적 및/또는 무형 아이템을 하나의 상태로부터 다른 상태로 변환시킬 수 있다. 여기에 기술된 방법 및 시스템은 또한 물리적 및/또는 무형 아이템을 표현하는 데이터를 하나의 상태로부터 다른 상태로 변환시킬 수 있다.
도면의 순서도 및 블록도에 포함된, 여기에 기술된 요소들은 이러한 요소들 사이의 논리적 경계를 의미한다. 그러나, 소프트웨어 또는 하드웨어 엔지니어링 실시에 따라, 묘사된 요소 및 그 기능은 모놀리식 소프트웨어 구조로서, 독립형 소프트웨어 모듈로서, 또는 외부 루틴, 코드, 서비스등을 채용하는 모듈로서 저장된 프로그램 명령어를 실행할 수 있는 프로세서를 갖는 컴퓨터 실행가능 매체를 통해 기계에서 구현될 수 있고, 이러한 모든 구현은 본 발명의 범위 안에 있을 수 있다. 이러한 기계의 예는 퍼스널 디지털 어시스턴트, 랩탑, 퍼스널 컴퓨터, 모바일 폰, 다른 휴대형 컴퓨팅 장치, 의료 기기, 유무선 통신 장치, 트랜스듀서, 칩, 계산기, 위성, 태블릿 PC, 전자책, 개지트(gadget), 전자 장치, 인공 지능을 갖는 장치, 컴퓨팅 장치, 네트워킹 기기, 서버, 라우터등을 포함할 수 있지만 이에 제한되는 것은 아니다. 또한, 순서도 및 블록도 또는 임의의 다른 논리 컴포넌트에 표현된 요소는 프로그램 명령어를 실행할 수 있는 기계에서 구현될 수 있다. 따라서, 상기 도면 및 설명이 개시된 시스템의 기능적 특징을 제시하고 있지만, 분명히 언급하거나 본문으로부터 분명하지 않으면 이러한 기능적 특징을 구현하기 위한 소프트웨어의 특정 설계도 이러한 설명으로부터 추론되어서는 안된다. 마찬가지로, 상술된 다양한 단계는 변화될 수 있고 이러한 단계의 순서는 여기에 개시된 기술의 특정 적용에 따라 조정될 수 있다. 이러한 변형 및 수정은 본 발명의 범위에 포함되어 있다. 따라서, 다양한 단계를 위한 순서의 설명은 특정 적용에 의해 요구되거나, 분명히 언급하거 본문으로부터 분명하지 않으면, 이러한 단계를 위한 특정 실행 순서를 필요로 하지 않는 것으로 이해해야 한다.
상술된 방법 및/또는 프로세서, 및 이와 연관된 단계는 하드웨어, 소프트웨어 또는 특정 적용에 적절한 하드웨어 및 소프트웨어의 임의의 조합으로 구현될 수 있다. 이러한 하드웨어는 범용 컴퓨터 및/또는 전용 컴퓨팅 장치 또는 특정 컴퓨팅 장치 또는 특정 컴퓨팅 장치의 특정 특징 또는 컴포넌트를 포함할 수 있다. 이러한 프로세스는 내부 및/외부 메모리와 함께, 마이크로프로세서, 마이크로컨트롤러, 내장된 마이크로컨트롤러, 프로그래머블 디지털 신호 프로세서 또는 다른 프로그래머블 장치중 하나 이상에서 구현될 수 있다. 이러한 프로세스는 또한, 또는 대신에 주문형 집적 회로, 프로그래머블 게이트 어레이, 프로그래머블 어레이 로직, 또는 전자 신호를 처리하도록 구성될 수 있는 임의의 다른 장치 또는 장치의 조합에서 구현될 수 있다. 또한, 이러한 프로세스의 하나 이상은 기계 판독가능 매체에서 실행될 수 있는 컴퓨터 실행가능 코드로서 구현될 수 있다는 것을 이해할 것이다.
컴퓨터 실행가능 코드는 C와 구조적 프로그래밍 언어, C++와 같은 객체 지향 프로그래밍 언어, 또는, 프로세서, 프로세서 구조의 이질적인 조합은 물론 상기 장치중 하나, 또는 상이한 하드웨어 및 소프트웨어의 조합, 또는 프로그램 명령어를 실행할 수 있는 임의의 다른 기계에 저장되거나, 컴파일링되거나, 해석되어 실행될 수 있는 (어셈블리 언더, 하드웨어 기술 언어, 및 데이터베이스 프로그래밍 언어 및 기술을 포함하는) 임의의 다른 고레벨 또는 저레벨의 프로그래밍 언어를 사용하여 생성될 수 있다.
따라서, 하나의 특징에서, 상술된 방법 및 그 조합은 하나 이상의 컴퓨팅 장치에서 실행될 때 단계를 실행하는 컴퓨터 실행가능 코드로 구현될 수 있다. 다른 특징에서, 이러한 방법은 단계를 실행하는 시스템에서 구현될 수 있고, 다수의 방식으로 장치들에 분산될 수 있거나, 이러한 기능 모두가 전용, 독립형 장치 또는 다른 하드웨어에 통합될 수 있다. 다른 특징에서, 상술된 프로세스와 연관된 단계를 실행하기 위한 수단은 상술된 하드웨어 및/또는 소프트웨어중 하나를 포함할 수 있다. 이러한 모든 치환 및 조합은 본 발명의 범위 내에 있다.
본 명세서가 상세하게 도시되고 설명된 바람직한 실시예에 대해 설명되었지만, 다양한 수정 및 향상이 당업자에게 용이하게 이해될 것이다. 이에 따라, 본 명세서의 정신 및 범위는 상기 예에 의해 제한되지 않고 허용가능한 모든 것을 포함하는 것으로 이해해야 한다.
본 명세서(특히 청구범위)의 용어는 달리 특별히 지시하지 않으면 단수 및 복수 모두를 포함하도록 되어 있다. 용어 "포함하는"은 달리 언급하지 않으면 개방형 용어(즉, "포함하지만 이에 제한되지 않는" 의미를 갖는다)로 이해해야 한다. 여기의 값의 범위의 설명은 달리 언급되지 않으면, 단지 범위 내에 있는 각 별개의 값을 개별적으로 언급하는 약기 방법으로서 되어 있고, 각 개별적인 값은 개별적인 여기에 열거되는 것처럼 본 명세서에 통합되어 있다. 여기에 기술된 모든 방법은 달리 언급되거나 달리 분명히 말하지 않으면 임의의 적절한 순서로 실행될 수 있다. 여기에 제공된, 임의의 예 및 모든 예, 또는 예시 언어(예를 들어, "와 같은")는 본 명세서를 보다 잘 설명하기 위해 사용되었고 달리 언급되지 않으면 본 명세서의 범위를 제한하지 않는다. 본 명세서의 어떤 언어도 임의의 청구되지 않은 요소를 본 발명의 실시에 필수적인 것을 가리키는 것으로 해석해서는 안된다.
상기 기록된 설명에 의해 당업자가 최상의 모드로 생각되는 것을 사용할 수 있지만, 당업자는 그 변형, 조합, 및 특정 실시예, 방법, 및 예의 등가를 이해할 것이다. 따라서, 본 명세서는 상술된 실시예, 방법, 및 예에 의해 제한되지 않고, 본 발명의 범위 및 정신 내의 모든 실시예 및 방법에 의해 한정되어야 한다.
여기에 언급된 모든 문서는 여기에 언급되어 통합되어 있다.

Claims (20)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 시간 영역 신호를 처리하는 방법으로서,
    시간 영역 신호 스트림을 포함하는 입력 신호를 수신하고 상기 시간 영역 신호 스트림으로부터 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우드 데이터 세트의 시작이 상기 제1 윈도우드 데이터 세트의 시작에 대해 시간 지연되어 있는 단계;
    상기 제1 윈도우드 데이터 세트 및 상기 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계;
    상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트의 성분 주파수를 추정하기 위해 상기 주파수 영역 데이터에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계;
    상기 CSPE에서 추정된 성분 주파수를 사용하여, 그 성분이 적어도 하나의 오실레이터 피크를 포함하는 기초 신호의 성분의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나와 맞는 주파수 영역 고해상 윈도우를 선택하기 위해 주파수 영역 고해상 윈도우의 세트를 샘플링하는 단계;
    상기 기초 신호 내의 단일 오실레이터 소스로부터 나오는 하나 이상의 오실레이터 피크로 구성된 적어도 하나의 트래클렛을 식별하기 위해 추적 알고리즘을 사용하는 단계;
    단일 소스로부터 나오는 트래클렛을 그룹화하는 단계; 및
    출력 신호를 제공하는 단계를 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  7. 제6항에 있어서, 상기 입력 신호는 아날로그 음성 신호를 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  8. 제6항에 있어서, 상기 입력 신호의 적어도 일부는 하나 이상의 선택된 화자의 대화를 재생하도록 복원되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  9. 제6항에 있어서, 상기 입력 신호는 보청기에서 수신되고 상기 출력은 귀에 최종 전달되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  10. 제6항에 있어서, 상기 주파수 영역 고해상 윈도우의 세트는 사전계산되고 저장되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  11. 제6항에 있어서, 상기 주파수 영역 고해상 윈도우의 세트는 근 실시간 및 실시간중 하나로 계산되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  12. 제11항에 있어서, 상기 주파수 영역 고해상 윈도우의 세트는 함수 표현으로부터 계산되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  13. 제6항에 있어서, 상기 입력 신호의 구성 성분으로의 피팅을 돕기 위해, 통합 영역에서 도착 방향 추정값을 사용할 수 있도록 상기 CSPE로부터 상기 주파수 영역 데이터의 통합 영역 표현을 제공하는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  14. 제6항에 있어서, 오리지널 입력 신호의 보존된 부분의 진폭이 증대되거나 증가될 때를 포함하여, 상기 보존된 부분과 함께 수정된 레벨의 배경 잡음을 제공하도록 희망의 신호원과 연관되지 않은 구성요소의 적어도 일부를 추가하는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  15. 제14항에 있어서, 상기 보존된 부분의 진폭이 증가되는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  16. 시간 영역 신호를 처리하는 방법으로서,
    시간 영역 신호 스트림을 수신하고 상기 시간 영역 신호 스트림으로부터 제1 윈도우드 데이터 세트 및 제2 윈도우드 데이터 세트를 생성하는 단계로서, 상기 제2 윈도우드 데이터 세트의 시작이 상기 제1 윈도우드 데이터 세트의 시작에 대해 시간 지연되어 있는 단계;
    상기 제1 윈도우드 데이터 세트 및 상기 제2 윈도우드 데이터 세트를 주파수 영역으로 전환하고 최종 데이터를 기본 변환 해상도를 갖는 주파수 영역 데이터로서 저장하는 단계;
    상기 기본 변환 해상도 보다 큰 해상도에서 상기 제1 윈도우 및 제2 윈도우의 성분 주파수를 추정하기 위해 상기 주파수 영역에 복소 스펙트럼 위상 에볼루션(CSPE)을 행하는 단계;
    상기 CSPE에서 추정된 성분 주파수를 사용하여, 기초 신호 오실레이터의 진폭, 위상, 진폭 변조 및 주파수 변조중 적어도 하나와 맞는 고해상 주파수 영역 윈도우를 선택하기 위해 싱글렛 변환 프로세스에서, 저장된 고해상 주파수 영역 윈도우의 세트를 샘플링하는 단계;
    상기 주파수 영역에서 FM 생성 및 AM 생성중 적어도 하나를 위해 필요한 파라미터를 저장하는 단계로서, 상기 FM 생성을 위한 파라미터는 진폭, 위상 기준 주파수, 및 변조율을 포함하고, 상기 AM 생성을 위한 파라미터는 진폭, 위상, 주파수 및 진폭 포락선 변조를 포함하는 단계; 및
    FM 변조 오실레이터 피크 및 AM 변조 오실레이터 피크중 적어도 하나를 위한 주파수 스펙트럼을 재생성하는 단계로서, 상기 주파수 스펙트럼은 데이터 샘플 윈도우 내의 임의의 포인트에서 오실레이터가 턴온 또는 턴오프할 수 있는 임의의 과도 효과를 포함하는 단계를 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  17. 제16항에 있어서, FM 변조 오실레이터 피크 및 AM 변조 오실레이터 피크중 적어도 하나에 대한 재생성된 주파수 스펙트럼을 다른 오실레이터 피크에 대한 주파수 스펙트럼과 결합하는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  18. 제16항에 있어서, 신호 요소를 희망하는 정도의 정밀도로 표현하기 위해 상기 주파수 스펙트럼에 오실레이터 피크 신호 스프레딩 정보의 표현을 포함시키는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  19. 제16항에 있어서, 제로 주파수 구간 및 최고 주파수 구간중 적어도 하나를 통한 스미어링을 처리하기에 적절한 주파수 스펙트럼 표현에 대한 분석 윈도우를 선택하는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
  20. 제16항에 있어서, 연속 둘러싸는 효과(wrapping effect) 및 복수의 둘러싸는 효과중 적어도 하나를 처리하기 위해 상기 주파수 스펙트럼에 오실레이터 피크 신호 스프레딩 정보의 표현을 포함시키는 단계를 더 포함하는 것을 특징으로 하는 시간 영역 신호 처리 방법.
KR1020147033692A 2012-05-04 2013-05-03 원신호 분리 시스템 및 방법 KR102118411B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261642805P 2012-05-04 2012-05-04
US61/642,805 2012-05-04
US201361749606P 2013-01-07 2013-01-07
US61/749,606 2013-01-07
US201361785029P 2013-03-14 2013-03-14
US61/785,029 2013-03-14
PCT/US2013/039544 WO2013166439A1 (en) 2012-05-04 2013-05-03 Systems and methods for source signal separation

Publications (2)

Publication Number Publication Date
KR20150021508A KR20150021508A (ko) 2015-03-02
KR102118411B1 true KR102118411B1 (ko) 2020-06-03

Family

ID=49514924

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147033692A KR102118411B1 (ko) 2012-05-04 2013-05-03 원신호 분리 시스템 및 방법

Country Status (6)

Country Link
US (4) US8694306B1 (ko)
EP (1) EP2845191B1 (ko)
JP (2) JP6109927B2 (ko)
KR (1) KR102118411B1 (ko)
HK (1) HK1207919A1 (ko)
WO (1) WO2013166439A1 (ko)

Families Citing this family (201)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100904533B1 (ko) * 2008-01-11 2009-06-25 엘지전자 주식회사 전송 타이밍 조절 방법, 연속적인 패킷 전송 방법 및 이동통신 단말
JP5375400B2 (ja) * 2009-07-22 2013-12-25 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US9116226B2 (en) * 2010-10-07 2015-08-25 Siemens Medical Solutions Usa, Inc. Ultrasound image performance determination
KR20120071851A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 통신 시스템에서 신호 도래 방향 추정 장치 및 방법
US9064497B2 (en) 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
US9159313B2 (en) * 2012-04-03 2015-10-13 Sony Corporation Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis
US10497381B2 (en) 2012-05-04 2019-12-03 Xmos Inc. Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation
WO2013166439A1 (en) 2012-05-04 2013-11-07 Setem Technologies, Llc Systems and methods for source signal separation
CN102752058B (zh) * 2012-06-16 2013-10-16 天地融科技股份有限公司 音频数据传输系统、音频数据传输装置及电子签名工具
US10371732B2 (en) * 2012-10-26 2019-08-06 Keysight Technologies, Inc. Method and system for performing real-time spectral analysis of non-stationary signal
US10204638B2 (en) * 2013-03-12 2019-02-12 Aaware, Inc. Integrated sensor-array processor
EP3042377B1 (en) 2013-03-15 2023-01-11 Xmos Inc. Method and system for generating advanced feature discrimination vectors for use in speech recognition
US10184782B2 (en) * 2013-05-17 2019-01-22 Ninepoint Medical, Inc. Frequency-domain optical coherence tomography with extended field-of-view and reduction of aliasing artifacts
US9788128B2 (en) * 2013-06-14 2017-10-10 Gn Hearing A/S Hearing instrument with off-line speech messages
US9306722B2 (en) * 2013-07-02 2016-04-05 Cisco Technology, Inc. Tracking radar frequency enabling more channels
US10168305B2 (en) * 2013-10-17 2019-01-01 Battelle Memorial Institute Container screening system and method
JP6148163B2 (ja) * 2013-11-29 2017-06-14 本田技研工業株式会社 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム
US9429647B2 (en) * 2013-12-04 2016-08-30 Aruba Networks, Inc. Classifying wireless signals
US9319156B2 (en) * 2013-12-04 2016-04-19 Aruba Networks, Inc. Analyzing a particular wireless signal based on characteristics of other wireless signals
US10304221B2 (en) * 2014-01-31 2019-05-28 Intermountain Intellectual Asset Management, Llc Visualization techniques for disparate temporal population data
US9351060B2 (en) 2014-02-14 2016-05-24 Sonic Blocks, Inc. Modular quick-connect A/V system and methods thereof
CN106537502B (zh) * 2014-03-31 2019-10-15 索尼公司 用于生成音频内容的方法和装置
EP3129795A4 (en) * 2014-04-09 2019-01-16 Xmos Inc. METHOD AND SYSTEMS FOR IMPROVED MEASUREMENT, UNIT AND PARAMETER ESTIMATION, AND MEASUREMENT AND REDUCTION OF A WIDE-OUT EFFECT ON SOURCE SIGNAL SEPARATION
US9763276B2 (en) * 2014-05-30 2017-09-12 Apple Inc. Seamless connectivity between hearing aid and multiple devices
RU2654789C2 (ru) * 2014-05-30 2018-05-22 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и электронное устройство (варианты) обработки речевого запроса пользователя
US9355640B2 (en) * 2014-06-04 2016-05-31 Google Inc. Invoking action responsive to co-presence determination
EP3153880B1 (en) * 2014-06-09 2021-12-01 Nec Corporation Target detection device
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
US20170142178A1 (en) * 2014-07-18 2017-05-18 Sony Semiconductor Solutions Corporation Server device, information processing method for server device, and program
US9525944B2 (en) * 2014-08-05 2016-12-20 The Boeing Company Apparatus and method for an active and programmable acoustic metamaterial
US10630306B2 (en) * 2014-09-10 2020-04-21 Advantest Corporation Method and system for spectral leakage removal in DAC testing
US9678015B2 (en) 2014-09-26 2017-06-13 Frito-Lay North America, Inc. Method for elemental analysis of a snack food product in a dynamic production line
WO2016066123A1 (en) * 2014-10-29 2016-05-06 Mediatek Inc. Audio sample rate control method applied to audio front-end and related non-transitory machine readable medium
US9779752B2 (en) 2014-10-31 2017-10-03 At&T Intellectual Property I, L.P. Acoustic enhancement by leveraging metadata to mitigate the impact of noisy environments
JP6114249B2 (ja) * 2014-11-20 2017-04-12 ヤマハ株式会社 情報送信装置および情報送信方法
JP2016111472A (ja) * 2014-12-04 2016-06-20 株式会社リコー 画像形成装置、音声録音方法及び音声録音プログラム
CN105989851B (zh) 2015-02-15 2021-05-07 杜比实验室特许公司 音频源分离
JP6332545B2 (ja) * 2015-02-16 2018-05-30 株式会社島津製作所 ノイズレベル推定方法、測定データ処理装置、及び測定データ処理用プログラム
US9865278B2 (en) * 2015-03-10 2018-01-09 JVC Kenwood Corporation Audio signal processing device, audio signal processing method, and audio signal processing program
KR101658001B1 (ko) * 2015-03-18 2016-09-21 서강대학교산학협력단 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법
US10991362B2 (en) * 2015-03-18 2021-04-27 Industry-University Cooperation Foundation Sogang University Online target-speech extraction method based on auxiliary function for robust automatic speech recognition
US11694707B2 (en) 2015-03-18 2023-07-04 Industry-University Cooperation Foundation Sogang University Online target-speech extraction method based on auxiliary function for robust automatic speech recognition
US10657958B2 (en) * 2015-03-18 2020-05-19 Sogang University Research Foundation Online target-speech extraction method for robust automatic speech recognition
US9837100B2 (en) * 2015-05-05 2017-12-05 Getgo, Inc. Ambient sound rendering for online meetings
US10839309B2 (en) * 2015-06-04 2020-11-17 Accusonus, Inc. Data training in multi-sensor setups
GB2581032B (en) * 2015-06-22 2020-11-04 Time Machine Capital Ltd System and method for onset detection in a digital signal
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
GB2556220B (en) * 2015-07-24 2020-12-30 Halliburton Energy Services Inc Frequency hopping sounder signal for channel mapping and equalizer initalization
US11621017B2 (en) 2015-08-07 2023-04-04 Cirrus Logic, Inc. Event detection for playback management in an audio device
CN105245497B (zh) * 2015-08-31 2019-01-04 刘申宁 一种身份认证方法及装置
US10598648B2 (en) 2015-09-24 2020-03-24 Frito-Lay North America, Inc. Quantitative texture measurement apparatus and method
US11243190B2 (en) 2015-09-24 2022-02-08 Frito-Lay North America, Inc. Quantitative liquid texture measurement method
US10070661B2 (en) 2015-09-24 2018-09-11 Frito-Lay North America, Inc. Feedback control of food texture system and method
US9541537B1 (en) * 2015-09-24 2017-01-10 Frito-Lay North America, Inc. Quantitative texture measurement apparatus and method
US10107785B2 (en) 2015-09-24 2018-10-23 Frito-Lay North America, Inc. Quantitative liquid texture measurement apparatus and method
US10969316B2 (en) 2015-09-24 2021-04-06 Frito-Lay North America, Inc. Quantitative in-situ texture measurement apparatus and method
US9674808B1 (en) * 2015-10-21 2017-06-06 Mbit Wireless, Inc. Method and apparatus for early frequency synchronization in LTE wireless communication systems
US10037750B2 (en) * 2016-02-17 2018-07-31 RMXHTZ, Inc. Systems and methods for analyzing components of audio tracks
CN108885771B (zh) * 2016-03-07 2022-07-05 3M创新有限公司 用于个人防护设备的智能安全监视和分析系统
US10956484B1 (en) 2016-03-11 2021-03-23 Gracenote, Inc. Method to differentiate and classify fingerprints using fingerprint neighborhood analysis
US9846228B2 (en) 2016-04-07 2017-12-19 Uhnder, Inc. Software defined automotive radar systems
US10261179B2 (en) 2016-04-07 2019-04-16 Uhnder, Inc. Software defined automotive radar
WO2017175190A1 (en) 2016-04-07 2017-10-12 Uhnder, Inc. Adaptive transmission and interference cancellation for mimo radar
TWI577966B (zh) * 2016-04-11 2017-04-11 財團法人國家實驗研究院 複合式水文監測系統
US9791564B1 (en) 2016-04-25 2017-10-17 Uhnder, Inc. Adaptive filtering for FMCW interference mitigation in PMCW radar systems
US10573959B2 (en) 2016-04-25 2020-02-25 Uhnder, Inc. Vehicle radar system using shaped antenna patterns
US9575160B1 (en) 2016-04-25 2017-02-21 Uhnder, Inc. Vehicular radar sensing system utilizing high rate true random number generator
US9599702B1 (en) 2016-04-25 2017-03-21 Uhnder, Inc. On-demand multi-scan micro doppler for vehicle
WO2017187304A2 (en) 2016-04-25 2017-11-02 Uhnder, Inc. Digital frequency modulated continuous wave radar using handcrafted constant envelope modulation
US9869752B1 (en) 2016-04-25 2018-01-16 Ocean Acoustical Services And Instrumentation Systems, Inc. System and method for autonomous joint detection-classification and tracking of acoustic signals of interest
US9806914B1 (en) 2016-04-25 2017-10-31 Uhnder, Inc. Successive signal interference mitigation
WO2017187331A1 (en) 2016-04-25 2017-11-02 Uhnder, Inc. Vehicle radar system with a shared radar and communication system
US9791551B1 (en) 2016-04-25 2017-10-17 Uhnder, Inc. Vehicular radar system with self-interference cancellation
WO2017187278A1 (en) 2016-04-25 2017-11-02 Uhnder, Inc. Pmcw – pmcw interference mitigation
ES2713685T3 (es) * 2016-04-26 2019-05-23 Nokia Technologies Oy Métodos, aparatos y programas informáticos relativos a la modificación de una característica asociada a una señal de audio separada
IL245366A0 (en) * 2016-05-01 2016-08-31 Technion Res & Dev Foundation A multi-input and multi-output radar system (mimo) and a method for using it
US11774944B2 (en) 2016-05-09 2023-10-03 Strong Force Iot Portfolio 2016, Llc Methods and systems for the industrial internet of things
US11327475B2 (en) 2016-05-09 2022-05-10 Strong Force Iot Portfolio 2016, Llc Methods and systems for intelligent collection and analysis of vehicle data
US20180284741A1 (en) 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for industrial internet of things data collection for a chemical production process
US11373672B2 (en) 2016-06-14 2022-06-28 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments
US11237546B2 (en) 2016-06-15 2022-02-01 Strong Force loT Portfolio 2016, LLC Method and system of modifying a data collection trajectory for vehicles
US10817719B2 (en) * 2016-06-16 2020-10-27 Nec Corporation Signal processing device, signal processing method, and computer-readable recording medium
US9753121B1 (en) 2016-06-20 2017-09-05 Uhnder, Inc. Power control for improved near-far performance of radar systems
US10598783B2 (en) 2016-07-07 2020-03-24 Microsoft Technology Licensing, Llc Multi-frequency unwrapping
US9949020B1 (en) 2016-08-12 2018-04-17 Ocean Acoustical Services and Instrumentation System System and method for including soundscapes in online mapping utilities
JP6672114B2 (ja) * 2016-09-13 2020-03-25 本田技研工業株式会社 会話メンバー最適化装置、会話メンバー最適化方法およびプログラム
US9869762B1 (en) 2016-09-16 2018-01-16 Uhnder, Inc. Virtual radar configuration for 2D array
US10783430B2 (en) 2016-09-26 2020-09-22 The Boeing Company Signal removal to examine a spectrum of another signal
US10191506B2 (en) * 2016-09-29 2019-01-29 Enel X North America, Inc. Demand response dispatch prediction system including automated validation, estimation, and editing rules configuration engine
US10445312B1 (en) * 2016-10-14 2019-10-15 Google Llc Systems and methods for extracting signal differences from sparse data sets
US10429817B2 (en) * 2016-12-19 2019-10-01 Honeywell International Inc. Voice control of components of a facility
US10726835B2 (en) * 2016-12-23 2020-07-28 Amazon Technologies, Inc. Voice activated modular controller
US10297255B2 (en) 2017-01-23 2019-05-21 Bank Of America Corporation Data processing system with machine learning engine to provide automated collaboration assistance functions
US10972297B2 (en) 2017-01-23 2021-04-06 Bank Of America Corporation Data processing system with machine learning engine to provide automated collaboration assistance functions
IL250253B (en) 2017-01-24 2021-10-31 Arbe Robotics Ltd A method for separating targets and echoes from noise, in radar signals
US11320260B2 (en) * 2017-02-06 2022-05-03 The University Of British Columbia Apparatus and method for monitoring loss of soil cover
US11454697B2 (en) 2017-02-10 2022-09-27 Uhnder, Inc. Increasing performance of a receive pipeline of a radar with memory optimization
WO2018146634A1 (en) 2017-02-10 2018-08-16 Uhnder, Inc. Increasing performance of a receive pipeline of a radar with memory optimization
WO2018146530A1 (en) 2017-02-10 2018-08-16 Uhnder, Inc. Reduced complexity fft-based correlation for automotive radar
US10304473B2 (en) * 2017-03-15 2019-05-28 Guardian Glass, LLC Speech privacy system and/or associated method
US10539397B2 (en) * 2017-04-12 2020-01-21 Wilcox Industries Corp. Modular underwater torpedo system
US10732714B2 (en) 2017-05-08 2020-08-04 Cirrus Logic, Inc. Integrated haptic system
EP3827753A1 (en) * 2017-05-19 2021-06-02 Mayo Foundation for Medical Education and Research System and method for visualization of tissue microvasculature using ultrasound
KR101968158B1 (ko) * 2017-05-29 2019-08-13 주식회사 에스원 유효 신호 분리 장치 및 방법
US10627482B2 (en) * 2017-06-27 2020-04-21 Honeywell International Inc. Apparatus and method of quadrature detection using one mixer without oversampling in a receiver
US11259121B2 (en) 2017-07-21 2022-02-22 Cirrus Logic, Inc. Surface speaker
US11442445B2 (en) 2017-08-02 2022-09-13 Strong Force Iot Portfolio 2016, Llc Data collection systems and methods with alternate routing of input channels
EP3438978B1 (en) * 2017-08-02 2023-12-27 Rohde & Schwarz GmbH & Co. KG Signal assessment system and signal assessment method
US10942196B2 (en) * 2017-08-14 2021-03-09 Google Llc Systems and methods of motion detection using dynamic thresholds and data filtering
US11125873B1 (en) * 2017-09-20 2021-09-21 Fortem Technologies, Inc. Using radar sensors for collision avoidance
US11079462B2 (en) * 2017-10-24 2021-08-03 International Business Machines Corporation Facilitation of efficient signal source location employing a coarse algorithm and high-resolution computation
JP7131567B2 (ja) * 2017-10-25 2022-09-06 日本電気株式会社 生体認証装置、生体認証システム、生体認証方法、および生体認証プログラム
US10921422B2 (en) * 2017-10-25 2021-02-16 The Boeing Company Below-noise after transmit (BAT) Chirp Radar
IL255982A (en) 2017-11-29 2018-01-31 Arbe Robotics Ltd Detection, mitigation and prevention of mutual interference between fixed water radars in vehicles
DE102017221576A1 (de) * 2017-11-30 2019-06-06 Robert Bosch Gmbh Verfahren zur Mittelung von pulsierenden Messgrößen
US10690773B2 (en) * 2017-12-07 2020-06-23 Velodyne Lidar, Inc. Systems and methods for efficient multi-return light detectors
US11105890B2 (en) 2017-12-14 2021-08-31 Uhnder, Inc. Frequency modulated signal cancellation in variable power mode for radar applications
CN109959934B (zh) * 2017-12-26 2023-02-17 中国船舶重工集团公司七五〇试验场 一种多波束高分辨探测水下沉埋目标的方法
US10455339B2 (en) 2018-01-19 2019-10-22 Cirrus Logic, Inc. Always-on detection systems
EP3514554B1 (en) * 2018-01-19 2022-03-09 Socionext Inc. Evaluation circuitry
US10620704B2 (en) 2018-01-19 2020-04-14 Cirrus Logic, Inc. Haptic output systems
CN110149636B (zh) * 2018-02-13 2021-08-13 上海华为技术有限公司 信号接收方法、装置及设备
US10856755B2 (en) * 2018-03-06 2020-12-08 Ricoh Company, Ltd. Intelligent parameterization of time-frequency analysis of encephalography signals
US11139767B2 (en) 2018-03-22 2021-10-05 Cirrus Logic, Inc. Methods and apparatus for driving a transducer
US10795443B2 (en) 2018-03-23 2020-10-06 Cirrus Logic, Inc. Methods and apparatus for driving a transducer
US10820100B2 (en) 2018-03-26 2020-10-27 Cirrus Logic, Inc. Methods and apparatus for limiting the excursion of a transducer
US10158961B1 (en) 2018-03-29 2018-12-18 Cae Inc. Method and system for calibrating a sound signal in a playback audio system
US10832537B2 (en) 2018-04-04 2020-11-10 Cirrus Logic, Inc. Methods and apparatus for outputting a haptic signal to a haptic transducer
US11002819B2 (en) 2018-04-24 2021-05-11 The Boeing Company Angular resolution of targets using separate radar receivers
DE102018206689A1 (de) * 2018-04-30 2019-10-31 Sivantos Pte. Ltd. Verfahren zur Rauschunterdrückung in einem Audiosignal
US11069206B2 (en) 2018-05-04 2021-07-20 Cirrus Logic, Inc. Methods and apparatus for outputting a haptic signal to a haptic transducer
IL259190A (en) 2018-05-07 2018-06-28 Arbe Robotics Ltd System and method for frequency hopping MIMO FMCW imaging radar
US11013007B2 (en) * 2018-05-17 2021-05-18 Qualcomm Incorporated Early transmit beam switching
US10594530B2 (en) * 2018-05-29 2020-03-17 Qualcomm Incorporated Techniques for successive peak reduction crest factor reduction
CN108900259B (zh) * 2018-06-21 2020-04-10 厦门大学 一种基于多核处理器的在线水声通信算法测试装置
US10175350B1 (en) * 2018-06-28 2019-01-08 University Of South Florida Systems and methods for detecting buried objects
IL260694A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for two-stage signal processing in a radar system
IL260695A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for eliminating waiting times in a radar system
IL260696A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for structured self-testing of radio frequencies in a radar system
CN108828509B (zh) * 2018-08-06 2022-01-11 电子科技大学 一种多平台多辐射源承载关系判定方法
US11269415B2 (en) 2018-08-14 2022-03-08 Cirrus Logic, Inc. Haptic output systems
IL261636A (en) 2018-09-05 2018-10-31 Arbe Robotics Ltd Deflected MIMO antenna array for vehicle imaging radars
KR102128006B1 (ko) 2018-09-14 2020-06-29 국방과학연구소 능동 펄스 식별 장치 및 방법
US10784918B2 (en) 2018-09-14 2020-09-22 Discrete Partners, Inc Discrete spectrum transceiver
US20220036237A1 (en) * 2018-09-21 2022-02-03 Nec Corporation Information processing apparatus, information processing method, and program
RU2680735C1 (ru) * 2018-10-15 2019-02-26 Акционерное общество "Концерн "Созвездие" Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала
GB201817495D0 (en) 2018-10-26 2018-12-12 Cirrus Logic Int Semiconductor Ltd A force sensing system and method
US11474225B2 (en) 2018-11-09 2022-10-18 Uhnder, Inc. Pulse digital mimo radar system
US11017782B2 (en) 2018-11-14 2021-05-25 XMOS Ltd. Speaker classification
RU2688841C1 (ru) * 2018-12-07 2019-05-22 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный университет (СПбГУ)" Способ идентификации фракций термической разгонки нефти
US11121785B2 (en) 2019-01-10 2021-09-14 Exfo Inc. Detection and tracking of interferers in a RF spectrum with multi-lane processing
US10735109B1 (en) 2019-01-11 2020-08-04 Exfo Inc. Automated analysis of RF spectrum
WO2020157844A1 (ja) * 2019-01-30 2020-08-06 三菱電機株式会社 計測装置、計測方法及び計測プログラム
WO2020183392A1 (en) 2019-03-12 2020-09-17 Uhnder, Inc. Method and apparatus for mitigation of low frequency noise in radar systems
US10726683B1 (en) 2019-03-29 2020-07-28 Cirrus Logic, Inc. Identifying mechanical impedance of an electromagnetic load using a two-tone stimulus
US10955955B2 (en) 2019-03-29 2021-03-23 Cirrus Logic, Inc. Controller for use in a device comprising force sensors
US11644370B2 (en) 2019-03-29 2023-05-09 Cirrus Logic, Inc. Force sensing with an electromagnetic load
US10992297B2 (en) 2019-03-29 2021-04-27 Cirrus Logic, Inc. Device comprising force sensors
US11283337B2 (en) 2019-03-29 2022-03-22 Cirrus Logic, Inc. Methods and systems for improving transducer dynamics
US11509292B2 (en) 2019-03-29 2022-11-22 Cirrus Logic, Inc. Identifying mechanical impedance of an electromagnetic load using least-mean-squares filter
US10828672B2 (en) 2019-03-29 2020-11-10 Cirrus Logic, Inc. Driver circuitry
US11150733B2 (en) 2019-06-07 2021-10-19 Cirrus Logic, Inc. Methods and apparatuses for providing a haptic output signal to a haptic actuator
US10976825B2 (en) 2019-06-07 2021-04-13 Cirrus Logic, Inc. Methods and apparatuses for controlling operation of a vibrational output system and/or operation of an input sensor system
WO2020254788A1 (en) 2019-06-21 2020-12-24 Cirrus Logic International Semiconductor Limited A method and apparatus for configuring a plurality of virtual buttons on a device
CN110400575B (zh) * 2019-07-24 2024-03-29 腾讯科技(深圳)有限公司 通道间特征提取方法、音频分离方法和装置、计算设备
JP2022545709A (ja) * 2019-08-30 2022-10-28 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル・オーディオ信号のチャネル識別
US11408787B2 (en) 2019-10-15 2022-08-09 Cirrus Logic, Inc. Control methods for a force sensor system
US11380175B2 (en) 2019-10-24 2022-07-05 Cirrus Logic, Inc. Reproducibility of haptic waveform
CN110609263B (zh) * 2019-10-29 2022-11-04 电子科技大学 一种同时计算脉冲激光雷达目标回波时延和频偏的方法
CN111210815B (zh) * 2019-11-28 2023-01-06 赵铭 一种用于语音命令词识别的深度神经网络构建方法和识别方法及装置
US11540234B2 (en) 2019-12-05 2022-12-27 Exfo Inc. Automated narrow peak interference severity estimation
CN111134637B (zh) * 2019-12-06 2023-04-07 深圳绿米联创科技有限公司 信号处理方法、装置、电子设备及存储介质
US11545951B2 (en) 2019-12-06 2023-01-03 Cirrus Logic, Inc. Methods and systems for detecting and managing amplifier instability
IL271269A (en) 2019-12-09 2021-06-30 Arbe Robotics Ltd Radom for a planar antenna for car radar
CN111308426B (zh) * 2019-12-10 2023-09-29 哈尔滨工程大学 一种适用于单天线接收机的低信噪比周期调频信号检测与分离方法
WO2021144711A2 (en) 2020-01-13 2021-07-22 Uhnder, Inc. Method and system for intefrence management for digital radars
US11662821B2 (en) 2020-04-16 2023-05-30 Cirrus Logic, Inc. In-situ monitoring, calibration, and testing of a haptic actuator
CN111610512B (zh) * 2020-06-01 2022-08-09 桂林电子科技大学 一种基于稀疏贝叶斯学习的频控阵雷达离网目标定位方法
CN111766583B (zh) * 2020-07-28 2022-04-22 哈尔滨工业大学 一种基于实测数据的人体安检仪成像方法
CN112232369B (zh) * 2020-09-16 2022-10-28 南京理工大学 基于卷积神经网络的抗箔条干扰方法
US11323176B2 (en) * 2020-10-01 2022-05-03 Viavi Solutions Inc Modular cell site installation, testing, measurement, and maintenance tool
US11327158B1 (en) * 2020-10-19 2022-05-10 Aeva, Inc. Techniques to compensate for mirror Doppler spreading in coherent LiDAR systems using matched filtering
KR102492212B1 (ko) * 2020-10-19 2023-01-27 주식회사 딥히어링 음성 데이터의 품질 향상 방법, 및 이를 이용하는 장치
CN112557781A (zh) * 2020-10-21 2021-03-26 广东电网有限责任公司广州供电局 一种适用于校准器的宽频域信号测量方法
IL278587A (en) * 2020-11-09 2022-06-01 Arbe Robotics Ltd Estimating an efficient direction of arrival using a low degree approximation
CN112614484B (zh) * 2020-11-23 2022-05-20 北京百度网讯科技有限公司 特征信息挖掘方法、装置及电子设备
CN112319505B (zh) * 2020-11-26 2022-05-03 东风商用车有限公司 自动驾驶换道判断方法、装置、设备及存储介质
CN112731817B (zh) * 2020-12-22 2023-07-21 北京清雷科技有限公司 家电设备的控制设备及方法、移动通信设备
TWI774231B (zh) * 2021-02-05 2022-08-11 瑞昱半導體股份有限公司 聲音輸入輸出系統及噪音消除電路
CN113281707B (zh) * 2021-05-26 2022-10-21 上海电力大学 一种强噪声下基于加窗lasso的声源定位方法
US11933822B2 (en) 2021-06-16 2024-03-19 Cirrus Logic Inc. Methods and systems for in-system estimation of actuator parameters
CN113536223B (zh) * 2021-06-18 2023-07-25 中山大学 一种基于频域分解法的欠采样下结构模态识别方法及系统
US11908310B2 (en) 2021-06-22 2024-02-20 Cirrus Logic Inc. Methods and systems for detecting and managing unexpected spectral content in an amplifier system
US11765499B2 (en) 2021-06-22 2023-09-19 Cirrus Logic Inc. Methods and systems for managing mixed mode electromechanical actuator drive
IL285296B2 (en) * 2021-08-01 2023-09-01 Elbit Systems Ew And Sigint Elisra Ltd A system and method for separating and de-spacing radio signals
CN114136565B (zh) * 2021-10-22 2022-08-09 中南大学 一种多振源系统的故障诊断系统及方法
US11552649B1 (en) 2021-12-03 2023-01-10 Cirrus Logic, Inc. Analog-to-digital converter-embedded fixed-phase variable gain amplifier stages for dual monitoring paths
WO2023148955A1 (ja) * 2022-02-07 2023-08-10 日本電信電話株式会社 時間窓生成装置、方法及びプログラム
CN114966296B (zh) * 2022-08-01 2022-12-02 锦浪科技股份有限公司 一种振荡源定位方法及装置
CN115408887B (zh) * 2022-10-31 2023-01-10 交通运输部天津水运工程科学研究所 一种近海电厂取水卷吸机制数值模拟与评估方法
CN116593971A (zh) * 2023-07-13 2023-08-15 南京誉葆科技股份有限公司 一种瞬时频率特征的雷达信号调制识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009089315A (ja) * 2007-10-03 2009-04-23 Nippon Telegr & Teleph Corp <Ntt> 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体
KR101001839B1 (ko) * 2006-04-13 2010-12-15 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 역상관기
JP2011007861A (ja) * 2009-06-23 2011-01-13 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4559605A (en) 1983-09-16 1985-12-17 The Boeing Company Method and apparatus for random array beamforming
US6535666B1 (en) * 1995-06-02 2003-03-18 Trw Inc. Method and apparatus for separating signals transmitted over a waveguide
WO1997033273A1 (en) 1996-03-08 1997-09-12 Motorola Inc. Method and recognizer for recognizing a sampled sound signal in noise
CN1192358C (zh) 1997-12-08 2005-03-09 三菱电机株式会社 声音信号加工方法和声音信号加工装置
US6381571B1 (en) * 1998-05-01 2002-04-30 Texas Instruments Incorporated Sequential determination of utterance log-spectral mean by maximum a posteriori probability estimation
US7082391B1 (en) 1998-07-14 2006-07-25 Intel Corporation Automatic speech recognition
US6253175B1 (en) 1998-11-30 2001-06-26 International Business Machines Corporation Wavelet-based energy binning cepstal features for automatic speech recognition
US6879952B2 (en) * 2000-04-26 2005-04-12 Microsoft Corporation Sound source separation using convolutional mixing and a priori sound source knowledge
JP3784640B2 (ja) 2000-12-01 2006-06-14 三菱電機株式会社 波源検出装置及び波源検出方法
US6950796B2 (en) 2001-11-05 2005-09-27 Motorola, Inc. Speech recognition by dynamical noise model adaptation
WO2004053839A1 (en) * 2002-12-11 2004-06-24 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints
GB0229473D0 (en) * 2002-12-18 2003-01-22 Qinetiq Ltd Signal separation system and method
KR100486736B1 (ko) * 2003-03-31 2005-05-03 삼성전자주식회사 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치
JP4496379B2 (ja) * 2003-09-17 2010-07-07 財団法人北九州産業学術推進機構 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法
TWI463806B (zh) * 2003-12-19 2014-12-01 Creative Tech Ltd 處理數位影像之方法及系統
US7729912B1 (en) 2003-12-23 2010-06-01 At&T Intellectual Property Ii, L.P. System and method for latency reduction for automatic speech recognition using partial multi-pass results
WO2005069905A2 (en) 2004-01-16 2005-08-04 Ghz Tr Corporation Methods and apparatus for automotive radar sensors
JP2005229453A (ja) 2004-02-16 2005-08-25 Motorola Inc 伝搬モデルをチューニングする方法および装置
US7454333B2 (en) * 2004-09-13 2008-11-18 Mitsubishi Electric Research Lab, Inc. Separating multiple audio signals recorded as a single mixed signal
US20060269057A1 (en) 2005-05-26 2006-11-30 Groove Mobile, Inc. Systems and methods for high resolution signal analysis and chaotic data compression
US7457756B1 (en) 2005-06-09 2008-11-25 The United States Of America As Represented By The Director Of The National Security Agency Method of generating time-frequency signal representation preserving phase information
WO2007118583A1 (en) 2006-04-13 2007-10-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decorrelator
US7787819B2 (en) 2006-08-25 2010-08-31 Space Systems / Loral, Inc. Ground-based beamforming for satellite communications systems
EP1926321A1 (en) * 2006-11-27 2008-05-28 Matsushita Electric Industrial Co., Ltd. Hybrid texture representation
US20080228470A1 (en) * 2007-02-21 2008-09-18 Atsuo Hiroe Signal separating device, signal separating method, and computer program
US20110035215A1 (en) 2007-08-28 2011-02-10 Haim Sompolinsky Method, device and system for speech recognition
JP4599420B2 (ja) 2008-02-29 2010-12-15 株式会社東芝 特徴量抽出装置
WO2012119140A2 (en) * 2011-03-03 2012-09-07 Edwards Tyson Lavar System for autononous detection and separation of common elements within data, and methods and devices associated therewith
WO2013166439A1 (en) 2012-05-04 2013-11-07 Setem Technologies, Llc Systems and methods for source signal separation
US10497381B2 (en) 2012-05-04 2019-12-03 Xmos Inc. Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation
WO2014076827A1 (en) 2012-11-13 2014-05-22 Yoshimasa Electronic Inc. Method and device for recognizing speech
EP3042377B1 (en) 2013-03-15 2023-01-11 Xmos Inc. Method and system for generating advanced feature discrimination vectors for use in speech recognition
JP5941487B2 (ja) 2014-02-25 2016-06-29 住友ゴム工業株式会社 タイヤのパンク修理キット
EP3129795A4 (en) 2014-04-09 2019-01-16 Xmos Inc. METHOD AND SYSTEMS FOR IMPROVED MEASUREMENT, UNIT AND PARAMETER ESTIMATION, AND MEASUREMENT AND REDUCTION OF A WIDE-OUT EFFECT ON SOURCE SIGNAL SEPARATION

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101001839B1 (ko) * 2006-04-13 2010-12-15 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 역상관기
JP2009089315A (ja) * 2007-10-03 2009-04-23 Nippon Telegr & Teleph Corp <Ntt> 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体
JP2011007861A (ja) * 2009-06-23 2011-01-13 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム

Also Published As

Publication number Publication date
JP2017102488A (ja) 2017-06-08
JP6109927B2 (ja) 2017-04-05
EP2845191A1 (en) 2015-03-11
US8694306B1 (en) 2014-04-08
US20160071528A9 (en) 2016-03-10
EP2845191B1 (en) 2019-03-13
HK1207919A1 (en) 2016-02-12
US20140079248A1 (en) 2014-03-20
US9443535B2 (en) 2016-09-13
US20140163991A1 (en) 2014-06-12
EP2845191A4 (en) 2016-04-13
US9495975B2 (en) 2016-11-15
US10957336B2 (en) 2021-03-23
US20170004844A1 (en) 2017-01-05
JP6526083B2 (ja) 2019-06-05
JP2015524076A (ja) 2015-08-20
WO2013166439A1 (en) 2013-11-07
KR20150021508A (ko) 2015-03-02
US20140316771A1 (en) 2014-10-23

Similar Documents

Publication Publication Date Title
KR102118411B1 (ko) 원신호 분리 시스템 및 방법
US10978088B2 (en) Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation
JP6526049B2 (ja) 源信号分離における改良された測定、エンティティ及びパラメータ推定、及び経路伝播効果測定及び軽減のための方法及びシステム
JP2017516131A5 (ko)
CN109074816B (zh) 远场自动语音识别预处理
Kinoshita et al. A summary of the REVERB challenge: state-of-the-art and remaining challenges in reverberant speech processing research
EP3189521B1 (en) Method and apparatus for enhancing sound sources
Schädler et al. Separable spectro-temporal Gabor filter bank features: Reducing the complexity of robust features for automatic speech recognition
CN103165136A (zh) 音频处理方法及音频处理设备
KR102191736B1 (ko) 인공신경망을 이용한 음성향상방법 및 장치
US10580429B1 (en) System and method for acoustic speaker localization
Kim Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller
CN112992190B (zh) 音频信号的处理方法、装置、电子设备和存储介质
Gul et al. Preserving the beamforming effect for spatial cue-based pseudo-binaural dereverberation of a single source
Habib et al. Auditory inspired methods for localization of multiple concurrent speakers
US20230230580A1 (en) Data augmentation system and method for multi-microphone systems
US20230230582A1 (en) Data augmentation system and method for multi-microphone systems
US20230230599A1 (en) Data augmentation system and method for multi-microphone systems
Manamperi et al. Drone audition: Audio signal enhancement from drone embedded microphones using multichannel Wiener filtering and Gaussian-mixture based post-filtering
WO2023141557A1 (en) Data augmentation system and method for multi-microphone systems
Vesa Studies on binaural and monaural signal analysis methods and applications

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant