KR20050016327A - 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가 - Google Patents

다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가

Info

Publication number
KR20050016327A
KR20050016327A KR10-2004-7015544A KR20047015544A KR20050016327A KR 20050016327 A KR20050016327 A KR 20050016327A KR 20047015544 A KR20047015544 A KR 20047015544A KR 20050016327 A KR20050016327 A KR 20050016327A
Authority
KR
South Korea
Prior art keywords
frames
denoising
signal
input signal
processor
Prior art date
Application number
KR10-2004-7015544A
Other languages
English (en)
Inventor
엘비르 카우세빅
엘다르 카우세빅
Original Assignee
에베레스트 바이오메디컬 인스트루먼츠 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에베레스트 바이오메디컬 인스트루먼츠 컴퍼니 filed Critical 에베레스트 바이오메디컬 인스트루먼츠 컴퍼니
Priority to KR10-2004-7015544A priority Critical patent/KR20050016327A/ko
Publication of KR20050016327A publication Critical patent/KR20050016327A/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

노이즈 비율에 대해서 상대적으로 낮은 신호를 갖는 미약한 생체 신호를 디노이징(de-noising)하는 방법 및 장치는 신규 셋트의 프레임으로 구성된 데이터 셋트를 디노이징하는 반복 처리를 이용한다. 상기 방법은 각각의 요소 프레임상에서 비선형 디노이징 연산을 독립적으로 수행하고, 그 결과 생기는 디노이즈된 프레임을 결합한 결과 생기는 결합 디노이즈된 입력신호를 형성한다. 상기 방법은, 바람직하게 디지털 프로세서에서 수행된다.

Description

다중 부가 데이타 프레임을 생성하기 위해 새로운 알고리즘을 이용한 미약한 생체-신호의 고속 평가{FAST ESTIMATION OF WEAK BIO-SIGNALS USING NOVEL ALGORITHMS FOR GENERATING MULTIPLE ADDITIONAL DATA FRAMES}
도 1은 인체 주변의 청각 시스템의 부분 단면도;
도 2는 ER-10C 변환기를 사용하여 귀에서 측정되는 전형적인 ABR 클릭 자극의 주파수 영역 특성들을 나타내는 그래프;
도 3은 정상 청력의 어른으로 전형적인 ABR 피크 패턴을 나타내는 그래프;
도 4는 전형적인 ABR 신호 획득 및 처리 시스템을 나타내는 개략도;
도 5는 원래의 N개의 프레임들의 ABR 데이터가 결합되고 디노이즈되고 새로운 레벨에서 새로운 프레임들의 셋트가 생성되고, 그 처리가 레벨 K까지 반복되고, 레벨 K에서의 프레임들이 최종 평균된 프레임을 생성하여 평균되는 N*K개의 새로운 프레임들의 총 노이즈를 생성하는 것으로 트리-디노이징(tree-denoising) 알고리즘을 나타내는 그래프;
도 6은 데이터 취득 및 처리 시스템의 블럭 다이어그램을 나타내는 개략도;
도 7은 노이즈가 전극들에 부착된 3개의 5.2㏀ 저항들의 Y-네트워크를 이용하여 기록되는 시스템 노이즈 파형에 의해 감춰진, 8,192개의 프레임들을 평균하고, 65dB SPL 자극으로부터 초래되는 전형적인 ABR 파형을 나타내는 그래프;
도 8은 평균을 구하지 않고 물체의 두피로부터 모아진 자극없는 기록의 전력 스펙트럴(spectral) 밀도를 나타내는 그래프;
도 9는 평균을 구하지 않은 자극없는 ABR 기록의 히스토그램;
도 10은 6σ로 가우시안 확률 밀도 함수에서 노이즈만을 기록하는 로그-플롯(plot)을 나타내는 그래프;
도 11은 자극이 있을 때와 없을 때의 Fsp값들의 비교를 나타내는 그래프;
도 12는 웨이브렛 함수를 위한 시간과 주파수에서 에너지 집중들을 나타내는 시간 주파수-박스(box);
도 13은 ABR 신호 블럭 다이어그램;
도 14는 배직교 9-7 웨이브렛으로 32개의 레벨들에서 웨이브렛 변환을 사용하여 전형적인 평균된 ABR 신호의 분해를 나타내는 그래프;
도 15는 신호 x에 사용되는 LP 및 HP 필터들 및 디서메이션(decimation)의 셋트를 이용함에 의해 DWT를 나타내는 그래프;
도 16은 Matlab 인덱싱 컨벤션이 각각 [4,4] 및 [-4,2]로 지칭된 H 및 G 대신에, 각각 [1,9] 및 [1,7]로 지칭된 필터들 H 및 G를 사용하여 배직교 9-7 웨이브렛 변환에서 분해를 위한 LP필터 H와 HP필터 G 및 재구성을 위한 LP필터 H'와 HP필터 G'를 나타내는 일련의 그래프들;
도 17은 -20dB에서 +20dB까지의 SNR들로 노이즈 사인파들에서 이용된 종래의 디노이징과 비교되는 로패스 필터링의 결과들을 나타내는 일련의 그래프들;
도 18은 왼쪽 컬럼은 512에서 8,192 프레임들의 선형 평균의 진행을 나타내고 오른쪽 컬럼은 그에 대응되는 디노이즈된 선형 평균을 나타내어 전형적인 ABR 신호에서 이용되는 종래의 디노이징을 나타내는 일련의 그래프들;
도 19는 예컨대 N=8인 프레임들에서 원형 신호 x[n]이 한쌍으로 평균되고 3개의 레벨들에서 3개의 새로운 신호들 x1[n], x2[n], x3[n]을 생성하는 트리 디노이징 평균 알고리즘을 나타내는 그래프;
도 20은 예컨대 N=8인 프레임들에서 트리의 깊이가 log2(8)=3이고 각 레벨이 정확히 N개의 프레임들을 포함하여, 그것에서 레벨로부터 프레임들의 다른 결합을 구성하는, 순환-이동 트리 디노이징(CSTD)를 나타내는 그래프;
도 21은 순환 이동 디노이징 알고리즘을 나타내는 그래프;
도 22는 6개의 감소 함수들, 상수 삼수 및 하나의 증가 함수(sqrt(2)^k)에서 그려지는 문턱치 함수 선택을 나타내는 그래프;
도 23은 8개의 순환 사인파를 나타내는 그래프;
도 24는 시간 영역의 WGN~N[0.1]을 나타내는 그래프;
도 25는 임의의 노이즈 벡터(평균 9.1848e-005, 분산=0.999)의 히스토그램;
도 26은 임의의 노이즈 벡터의 전력 스펙트럴 밀도를 나타내는 그래프;
도 27은 왼쪽 컬럼이 정상에서 바닥까지 추가된 WGN으로 -20dB, -10dB 및 0dB의 SNR들로 3개의 단일 프레임 사인파들을 나타내고 오른쪽 컬럼은 모든 8,192 프레임들에서 선형적으로 독립적인 사인파들의 평균을 나타냄으로써 노이즈 사인파들과 그 선형 평균들을 나타내는 일련의 그래프들;
도 28은 512개의 데이터 프레임들을 선형 평균과 비교하여 신규한 웨이브렛 알고리즘의 수행을 나타내는 그래프;
도 29는 선형 평균(정상) 및 신규한 웨이브렛 알고리즘(바닥) 사이의 분산 비교를 나타내는 그래프;
도 30은 경험적인 환경 노이즈 레벨 측정을 나타내는 그래프;
도 31은 선형 위상(100-1500Hz)에서 BP 버터워쓰(Butterwoth) 필터에 의해 필터되고 8,192개의 프레임들의 전형적인 ABR 파형 평균을 나타내는 그래프;
도 32는 음영선에 의해 나타낸 도 29의 그래프 상에 감춰진 평균없이 ABR 데이터의 전형적인 단일 프레임을 나타내는 그래프;
도 33은 데이터의 512개의 프레임들에서 CSTD로 선형 평균의 비교를 나타내는 그래프;
도 34는 다수의 프레임들의 함수에서 선형 평균 및 CSTD 사이의 분산 비교를 나타내는 그래프;
도 35는 32, 128, 256 및 512개의 프레임들에서 선형 평균 및 CSTD 사이의 비교를 나타내는 일련의 그래프들;
도 36은 모든 8,192 프레임들에서 선형 평균으로 신규한 웨이브렛 디노이징의 비교를 나타내는 그래프;
도 37은 환자의 귀(귀 1 및 귀 2)에서의 Fsp 기록들을 나타내는 일련의 그래프들;
도 38은 귀 3과 귀 4는 동일한 환자에게 속하고 자극없는 기록을 공유하고 모든 다른 귀들이 자극없는 기록을 공유하는, 환자의 귀(귀 3 및 귀 4)에서의 Fsp 기록들을 나타내는 일련의 그래프들;
도 39는 환자의 귀(귀 9 및 귀 10)에서의 Fsp 기록들을 나타내는 일련의 그래프들;
도 40은 Fsp값이 3.1에 도달하지 않고 평균된 증가한 다수의 프레임들로 일반적인 증가 경향이 없는, 무효한 ABR 기록들의 예시 그래프;
도 41은 나타낸 3개의 파형들은 다음의 프레임 숫자들:1-4,096;4,097-8,192; 및 1-8,192로 평균되는 각 자극 레벨에서 덮여짐으로, 80, 75, 70, 60 및 30dB에서 물체에 자극 기록의 그래프;
도 42는 귀 1 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 43은 귀 2 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 44는 귀 3 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 45는 귀 4 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 46은 귀 5 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 47은 귀 6 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 48은 귀 7 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 49는 귀 8 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 50은 귀 9 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 51은 귀 10 CSTD(왼쪽) 및 분산 비교(오른쪽)를 나타내는 일련의 그래프들;
도 52는 귀 6 CSTD(왼쪽) 및 분산 비교(오른쪽)에서 다운샘플된 데이터를 나타내는 일련의 그래프들; 및
도 53은 방법에서 수행되거나, 컴퓨터와 같은, 처리기에서 실시되어지는 본 발명의 블럭 다이어그램이다.
바람직한 실시예의 상세한 설명
종래 기술에서 찾아볼 수 있는 데이터를 수집하기 위한 전형적인 상업 ABR 시스템은 귀 속으로 찰깍 소리를 내고 두피전극(Scalp Electrodes)으로부터의 데이터를 기록한다. 그 데이터는 필터로 여과되고, 자극이 주어진 후 약 15ms의 프레임에서의 평균이 구해진다. 현존하는 상업적 ABR 시스템은 여과되지 않고 평균도 구해지지 않은 원형 데이터(Raw data)의 긴 세션들을 기록하는 능력을 가지고 있지 않다. 새로운 알고리즘의 성능을 조사하기 위해서, 수천 프레임의 처리되지 않은 데이터(예를 들어, N=8,192와 같은)가 이후의 분석을 위해 기록될 필요가 있었다. 그 목적은 상이한 처리 설계와 파라미터에 대해 정확하게 동일한 데이터가 분석되도록 하기 위한 것이었다. 사용자 정의(Custom-built) 시스템이 데이터 취득과 저장을 위해 사용되었다. 이 시스템은 상업적 OAE와 ABR 테스트 장비의 설계사이며 제조사인 Everest Biomedical Instruments Company (Everest)에 의해 구현되었다. 이 시스템은 진료용 ABR 부품들의 조합과 고품질의 실험용 데이터 취득 장비로부터 구현되었다. 기본적인 시스템은 귀에 청각신호를 공급하기 위한 귀 프로브(Ear probe), 프리앰프에 연결되는 전극들, 데이터 취득 인터페이스, 신호처리시스템으로 구성된다. 이 시스템의 블록다이어그램은 아래 도2-1에 나타나 있다.
청각 자극은 Etymotic Research ER 10C 프로브를 이용하여 귀에 공급되는데, 이 프로브는 두 개의 별개의 스피커(리시버)와 두개의 내부적으로 연결된 마이크로폰을 가지고 있다. 프로브는 Etymotic Research에 의해 제조된 귀 삽입용 거품(Foam Ear Tip)을 사용하여 귀속으로 주입되었다. 두 개 중에서 한 개의 스피커만이 자극을 공급하는데 사용되었다. 마이크로폰은 저주파 테스트 신호의 청각누수(acoustic leakage)를 점검함으로써 테스트 도중에 프로브가 적합한 것인지를 확인하고, 귀에서의 자극 레벨 조정(calibration)을 하는데 사용되었다. 세 개의 전극들은 각 대상의 머리에 부착되었다. 귀 뒤쪽의 뼈부분인 유양돌기(mastoid process)의 왼편과 오른편에 각각 하나씩(M1, M2) 그리고 이마 상단의 중앙부위에 있는 두정부분(vertex)에 한 개(CZ)가 부착된다. 전극들은 표준 EEG와 ABR 형태에 따라 두정(CZ)과 유양돌기(M1과 M2) 부분에 위치되었다. 두정과 동측의 유양돌기(프로브가 있는 귀의 뒤쪽) 사이의 전위들이 차별적으로 기록되었다. 반대측의 유양돌기 전극(다른 쪽 귀의 뒤쪽)은 기준전위로 사용되었다. 두정과 동측전극 간의 반전 동상 전압(Inverted common mode voltage)은 60Hz 전력선의 간섭을 줄이기 위해 기준전극으로 가해졌다.
전극이 부착되는 프런트 엔드 전자 인터페이스는 현재 상업적으로 사용될 수 있는 Everest Biomedical Instruments' AudioScreener였다. 이 상품은 의료기기에 대한 전기안전 표준인 UL 2601에 부합하도록 Underwriters Laboratories (UL)에 의해 안전도 테스트와 공식인증을 받았다. 이 상품은 또한 미국 식품의약청(FDA: Food and Drug Administration)에 의해 510(k) 처리를 통한 청각 스크리닝의 의학적 사용승인을 받은 것이다. 그러나 이는 주로 청각 스크리닝을 위해 사용되는 손으로 쥘 만한 크기의 상품이기 때문에, 종래 기술에서 이용될 수 있는 다른 장비와 같이 긴 데이터 스트림을 기록할 수 있는 능력은 가지고 있지 않다. 그러므로, AudioScreener의 프런트 엔드 만이 오디오 자극 생성기와 고성능 EEG 프리앰프로 사용되었다.
청각 자극은 AudioScreener의 오디오 출력부분을 사용하여 생성되었다. 피크점은 주지된 바와 같이 표준 절차와 IEC 표준을 이용하여 조정되었다. 1kHz의 순수한 사인파를 생성하는 외부 신호 생성기가 삽입된 귀 프로브의 스피커부분으로 가해졌다. 출력은 Quest 표준 0.5 cc 커플러 (0.5 x 10-6 m3)를 장착하고 정확하게 눈금이 조정된 소리레벨 미터(Quest Model 1800)에 의해 피크치의 dB SPL로 측정되었다. 신호 생성기의 전기출력은 또한 두 개 채널의 디지털 오실로스코프를 사용하여 측정되었다. (Hewlett Packard 54645D) 그리고 나서 AudioScreener는 100μs의 사각펄스를 생성하였고, 이는 오실로스코프의 두 번째 채널에서 측정되었다. 사인파의 피크치 진폭과 찰깍하는 소리가 맞추어졌고, 피크치 SPL 레벨이 설정되었다. 이 기준 레벨은 테스트 도중 귀 내부의 눈금조정에 사용되었다. 자극의 반복비율은 초당 37회, 즉 매 27.03ms 당 한 번씩의 100 μs의 찰깍소리로 세팅되었다. 이러한 비율은 주지된 문헌에서 주어진 표준적인 데이터를 충족시키기 위해 선택된 것이었다. 일반적으로 21, 33, 37, 38 등의 자극 반복 비율이 이용되는데 이는 50Hz 및 60Hz 전력선 주파수에서 상대적으로 우월하기 때문이다. 그러므로 초당 37의 주파수로 취득된 프레임이 선형평균될 때, 전력선 간섭은 취득된 프레임과 반대위상(out of phase)이 되어 60Hz 간섭의 영향은 감소되었다. 프레임에 포함된 ABR 신호는 각각 새롭게 취득된 프레임과 함께 중첩적으로 합해지는 반면에 60Hz 전력선 간섭은 상쇄적으로 합해진다.
전극들은 AudioScreener의 프런트 엔드 앰프에 부착되었다. 신호는 Factor 13,000으로 차동증폭되어 다음 단으로 공급되었다. 차동 증폭된 신호는 반전되어 60Hz 전력선 간섭과 같은 동상의 간섭을 줄이기 위해 동측의 유양돌기에 부착된 기준전극으로 가해진다. 또한, 차동증폭된 신호는 3dB 주파수가 30Hz인 빌트인 2차 아날로그 고역통과필터(HPF)와 3dB 주파수가 3kHz인 3차 저역통과필터(LPF)로 필터링되었다. Everest 프리앰프의 입력 임피던스 10 MD였고, 입력 앰프의 동상 전압 제거비(CMRR: Common Mode Rejection Ratio)는 110 dB였다. 누수전류는 UL에 의해 100μA AC 이하, 10μA DC이하로 인증되었다.
AudioScreener 프리앰프 부분의 출력은 연속적 근사 Crystal Semiconductors의 A/D컨버터(NIDAQ PCI-MIO-16XE-10)를 가진 상업적으로 이용가능한 National Instrument 사의 데이터 취득(DAQ) 보드에 가해졌다. 데이터는 16비트 해상도로 샘플링되었다. ADC의 입력범위는 10V였다. 그러므로, ADC에 의해 탐지가능한 최소 전압은 ADC 입력에서 0.305mV였다. 이는 두피전극에 의해 측정된 신호의 해상도가 23nV임을 의미한다. 텍사스 오스틴에 있는 National Instruments 사의 PCI-MIOE 시리즈 사용자 매뉴얼(1997)을 참조한다.
그 당시의 하드웨어와 소프트웨어 데이터 취득 시스템의 샘플링 주파수는 fs=48,000Hz로 고정되었고, 24kHz로 조정된 안티-에일리어싱(anti-aliasing) 필터가 포함되어 있었다. 주지해야 할 것은 우리가 관심을 가지는 신호는 3kHz의 대역폭을 가진다는 사실이다.어떤 시스템이 이 작업을 수행하도록 특별히 설계된 것이었다면, 안티-에일리어싱 필터는 또한 3kHz로 조정되었을 것이고 샘플링 주파수는 6kHz를 약간 넘도록 선택되었을 것이다. 그러나, 이것은 다른 여러 가지의 신호처리 연구를 위하여 정식적으로 Everest에 의해 내부적으로 사용된 흥미로운 맞춤식 설계(custom-built) 시스템이었다. 그러므로, 발명자에게 교육이 이루어지면, 그 분야에서의 당업자에게 알려져 있는 다른 조정도 가능할 수 있었다. 덧붙여, 데이터 취득 하드웨어와 관련된 소프트웨어가 설계되었고 48 kHz로 샘플링된 신호들을 처리하도록 철저히 테스트되었다. 이 소프트웨어를 다른 샘플링 주파수에 사용되도록 다시 프로그래밍하는 것은 용이하지 않았다. 그러한 샘플링 소프트웨어는 과도한 실험없이도 그 분야의 기능인력 한 명만으로 쉽게 복사될 수도 있고, 데이터를 취득하기 위해 사용되는 그러한 소프트웨어는 데이터 취득 이후에 이를 디노이징하는데 초점을 맞춘 본원 발명과 특별히 관련된 것으로 여겨지지는 않는다. 결국, 이 시스템은 프레임 당 1,024샘플을 수집하였으며, 이는 자극 이후 대략 21.3ms의 기록과 일치하는 것이다. 이것은 대기 시간을 대략 20ms 연장할 수 있는 로 레벨 자극용 ABR을 조사하기 위해 행해졌다. 이 작업을 위해서는 자극에 따른 반응의 약 10 ms만 요구되고, 6kHz의 비율로 샘플된다. 이것은 단일 프레임이 64 샘플로 구성되는 것을 의미한다. 본 발명이 어떻게 수집되어 전처리되었는가에 관계없는 데이터 디노이징(de-noising)에 관한 것이라고 전술되었지만, 이것은 아래에 기술되는 바와 같이, 데이터 후처리에 의해 달성된다.
LabVIEW라 불리는 내셔널 인스트루먼트 데이터 취득 소프트웨어 패키지는 DAQ 카드로부터 데이터를 취하고, 호스트 PC 컴퓨터의 하드 디스크상에 표준 파일 포맷으로 저장하기 위해 사용된다. 총 8,192개의 데이터 프레임이 각각의 시험 조건을 위해 수집된다. 각 프레임은 1,024 샘플 또는 클릭 표현시 동기된 데이터의 21.3ms를 포함했다. LabVIEW가 데이터 취득 및 처리를 위한 향상된 시스템인 동안, 복잡한 계산 및 대량 데이터 어레이 연산을 위해 충분히 도움이 되지 않는다. 게다가, 그것은 내장 웨이블렛(wavelet) 용량을 제한하였다. LabVIEW 패키지는 단순히 프리 앰프로부터 데이터를 수집한 후 디스크상에 저장하였다. LabVIEW에서 신호처리, 필터링 또는 그 이외의 것이 전혀 발생되지 않았다.
표준 파일 포맷내에서 데이터를 이용할 수 있으면, Matlab이라 불리는 향상된 소프트웨어 패키지가 분석을 위해 사용된다. Matlab(MathWorks에 의함) Version 5.3.1은 신호처리를 위해 전부 사용된다. Matlab's 표준 툴에 부가해서, Matlab 신호처리, 웨이블렛 및 통계 툴박스가 이용된다.
모든 신호처리 연산은 Matlab내에서 수행된다. 첫번째는, 현존하는 LabVIEW 시스템에 의해 수집된 과대 데이터 셋트를 줄이는 것이었다. 두번째는, 각 프레임을 위한 웨이블렛 변환을 계산하여, 웨이브렛 계수를 구하는 것이었다. 이후, 본 발명의 교수에 따라 아래에 더 상세히 설명되는 바와 같이, 이들 웨이브렛 계수의 프레임은 재결합되어 문턱치화되며, 그리고 역(逆) 웨이브렛 변환은 웨이브렛 계수의 최종 프레임을 위해 계산된다. 마지막으로, 모든 데이터는 Matlab 그래프 특징을 이용하여 표시된다.
LabVIEW 데이터 셋트의 감소는 2개 스텝으로 달성된다. 우선, 512 샘플이 자극 표현에 따른 반응의 10.67ms에 대응하는 1,024 샘플 프레임으로부터 추출된다. 다음에, 프레임 사이즈가 512에서 64 샘프로 감소되는 것이 필요하게 되었다. 48kHz의 샘플링 비율에서의 3kHz 신호 샘플링은, 중요한 신호 이상의 불필요한 노이즈 에너지를 도입한다. 신호는 8의 인수로 오버 샘플된다. 그러나, 표준 신호처리 기술은 필터링 및 리샘플링(resampling)에 의해 이 조건을 충분히 교정할 수 있다. 이것을 달성하기 위한 전형적인 신호처리 방법은, 우선 FIR(finite response filter)을 이용하여 원본 샘플 비율의 8 또는 6kHz로 데이터를 로패스 필터하고, 결과러서 생기는 샘플을 8의 인수에 의해 10분의 1로 제거하여 프레임당 64 샘플을 생성한다. 그러나, 동등한 결과를 가지는 약간 다른 방법이 사용된다. 웨이브렛 처리가, 본 발명을 구현하기 위해 모든 데이터 프레임상에서 어떻게 해서도 수행되고 있기 때문에, 로패스 필터링 및 리샘플링은 웨이브렛 영역내에서 수행된다. 웨이브렛 변환은 원래 각각 512 포인트 데이터 프레임상에서 수행되어, log2(512)=9 분해 레벨로 귀착된다. 웨이브렛 분해의 제1차 3개의 레벨은 고주파 웨이브렛 계수를 생성한다. 이들 레벨에서 모든 계수는 0으로 설정된다. 웨이브렛 곗의 나머지는 총 64로 유지된다. 이 처리는 표준 신호처리 기술을 이용하는 로패스 필터링 및 리샘플링과 유사하다. 웨이브렛 변환은 다음 분해 레벨에서 64개 샘플을 이미 생서하였기 때문에 더 이상의 리샘플링은 필요없다. 아래에서 기술되는 바와 같이, 웨이브렛 변환은 FIR 필터의 연속 적용을 이용하여 수행되므로, 웨이브렛 변환을 이용한 필터링의 계산 가격은 표준 신호처리 방법을 이용한 것과 유사하다.
2개 방법의 유사성은 8,192 프레임의 기록시에 시험된다. 데이터는 Butterworth 선형 위상 Matlab 필터를 이용하여 6kHz로 로패스(LP) 필터된다. 그후, 프레임은 8개의 요인에 의해 10분의 1이 제거되어 프레임당 64 샘플을 생성한다. 그 후, 64 포인트 웨이브렛 변환은 6 분해 레벨로 수행되어, 프레임당 64 웨이브렛 계수를 생성한다. 프레임 재결합 및 웨이브렛 문턱치화를 갖는 전체 알고리즘이 적용되고, 역 웨이브렛 변환이 수행되어 처리된 ABS 데이터의 64 시간영역 샘플을 생산한다. 병렬로, 동일한 데이터가 512 웨이브렛 변환에 의해 로패스 필터링 없이 처리된다. 제1차 계수의 3개의 레벨(각각, 256, 128 및 64 길이)은 0으로 설정된다. 이것은 LP 필터링과 유사하다. 프레임당 나머지 64 계수도 상술한 경우와 동일한 알고리즘을 이용하여 처리된다. 역 웨이브렛 변환은 다시 처리된 ABS 데이터의 64 시간영역 샘플을 생성하여, 본질적으로 도일한 데이터를 생성하며, 선형 평균과 비교할 때 거의 동일한 성능을 갖는다. Butterworth 필터 및 웨이브렛 필터의 FIR 필터 특성이 약간 다르기 때문에, 데이터는 완전히 동일하지 않다. 그러므로, 이 작업에서 모든 신규한 처리는 64 샘플 프레임상에서 수행되고, 단지 초기의 오버 샘플링의 네거티브 효과에 의해 파일 사이즈 및 계산상의 불이익이 증가된다.
ABR 기록 처리시 존재하는 대량의 노이즈 때문에, 기록된 데이터가 사실 단일 요소을 갖는 것을 보증하는 것이 필요하다. 전극 배치 오류 또는 기록시 이도(ear canal)의 나빠짐 청각 조사 등과 같은 다수의 요인에 의해 데이터가 부정확하게 될 수 있다. 그 결과, 유효한 ABR 신호가 존재하는 것을 확실하게 하기 위해 기록 처리를 검사하는 것이 필요하다.
기록의 유효성은 신호의 변동을 검사함으로써 구해진다. 자극이 존재하지 않으면서 단지 노이즈이 기록되는 경우 평균 기록의 절대 에너지는 0이 되기 쉬운 것으로 예상된다. 자극이 존재하면, 이 장기간의 평균 에너지는 0보다 크게 된다.
ABR 데이터 취득 시스템의 성능은 청각 연구문헌에 공통적으로 언급되어 발표된 표준 시험뿐 아니라 전자공학 실험방법 양쪽을 이용하여 철저하게 시험된다.이 시스템은 짧은 입력, 임의의 신호 발생장치에 의해 발생된 공지된 입력, 자극이 없는 EEG 데이터 및 최종적으로 청각 자극이 존재하는 EEG 데이터로 시험된다. 이 시스템은 문헌상에서 예상되고, 보고된 것과 같이 수행된다.
웨이브렛 변환을 위해 사용된 많은 종류의 웨이브렛 및 이용 가능한 많은 종류의 변형이 있다. 본 발명의 ABR 신호의 디지털 취득의 속성 때문에, 기술 분야에서 공지된 이중직교(biorthogonal) 웨이브렛이라 불리는 특정 형태의 대칭 웨이브렛을 이용하는 이산 웨이브렛 변환(DWT)에 집중된다. 웨이브렛 변환은 2차원 어레이의 계수를 제공한다. 디노이징은 웨이브렛 계수의 크기를 감소시켜, 신호의 국부적인 부드러움을 유지한다.
웨이브렛 변환의 단순한 관점은, 그 변환이 모(母) 웨이브렛 함수를 이용하고, 모 웨이브렛의 팽창(dilation) 및 이동(translation)이 상이한 웨이브렛 함수의 패밀리를 생성하는 것이다.
이들 새로운 웨이브렛 함수의 각각은 원형 신호와 함께 휘감기고, 2차원 공간 계수가 상이한 스케일(scale) 및 이동으로 생성된다. 도 16은 각각의 스케일(수평 치수)에서 32 스케일(수직 치수) 및 64 이동시 일반적으로 평균화되어 필터된 ABR 신호의 웨이브렛 변환의 그래프를 나타낸다. 이중직교(biorthogonal) 웨이브렛은 웨이브렛 변환을 위해 사용된다.
본 발명에서 구현된 DWT는, 연속적으로 적용된 "constant-Q" 필터의 뱅크(bank)를 이용하여 원형 신호를 처리하는 것으로서 간주될 수 있다. 필터의 적용은 신호를 하이 패스(HP) 및 로 패스(LP) 요소으로 분해하여, 2의 인수로 감소시킨 후, 신호가 완전히 분해될 때까지 다른 셋트의 하이 패스 및 로 패스 요소으로 더 분해 등을 행한다. 각 분해 레벨에서, 계수는 0으로 설정되거나 크기가 감소될 수 있으므로, 신호의 특정한 특징이 재구성에 영향을 미친다. 분해를 위해 사용된 HP 및 LP 필터(각각 H 및 G)가 구형 미러 필터(QMFs)이고, 그들의 이중 직교 보충 수량이 적절한 종점 처리와 함께 재구성을 위해 사용되면, 위상 및 진폭에서의 완전한 재구성이 달성될 수 있다. 도 15는 아래에서 LP 및 HP 필터의 연속 적용을 이용하여 웨이브렛 분해가 어떻게 행해졌는가를 그래프적으로 나타낸다.
이중직교 9-7 웨이브렛을 사용하기 위한 웨이브렛 계수를 설명하기 위해 사용된 DWT는, 다음과 같다.
함수 h[k]와 g[k]는 9-7 웨이브렛을 위한 이중직교 분해 필터이다. 명칭 9-7은 h[k] 필터[-4, 4]를 위한 9 탭(tap)과 g[k] 필터[-4, 2]를 위한 7 탭에서 유래되었다. 이중직교 9-7 웨이브렛이 정의되는 교체 방법은 h[k] 및 g[k] 필터 양쪽을 위해 각각 4회인 0이 되는 순간의 횟수이다. 이중직교 9-7 웨이브렛은 4회의 0이 되는 순간(Matlab내에서 그것의 명칭은 bior4.4이다). 이 웨이브렛을 이용한 필터를 위해 사용된 계수는, 이중직교 9-7 웨이브렛을 위한 FIR 필터 계수를 나타내는 아래의 표 2에 주어졌다.
그들의 DWT 실시가 간단하고 짧은 FIR 필터를 이용하여 달성될 수 있기 때문에, 웨이브렛의 이중직교 클래스가 선택되어, 여전히 완전한 재구성을 허용한다. 이중직교 9-7 웨이브렛은 대칭적이고, 4회의 0이 되는 순간을 갖기 때문에, 선택된다. 이것은 부드러운 ABR 신호의 예상 규칙성대 거친 AWGN 노이즈을 0 규칙성 사이에서의 구별에 적합하다. 이중직교 9-7 웨이브렛을 구현하는 H, H', G 및 G'는 도 16에 도시되어 있다.
이중직교 9-7 웨이브렛은, 또한 연구 문헌에서 EEG 웨이브렛 신호처리를 위해 사용되는 웨이브렛이고, JPEG 2000 화상압축 표준이며, 그리고 국가의 지문 저장 데이타베이스를 위해 FBI에서도 사용된다.
현존하는 종래의 디노이징 알고리즘과 관계 있는 특성은 다음과 같다:
1. 웨이브렛 계수는 각 웨이브렛 분해 레벨에서 0으로 문턱치화된다
2. 원형 신호의 SNR은 디노이징을 적용하기 이전에 크게 된다(>+10dB)
3. 모든 디노이징 연산은 단일 데이터 벡터상에서 수행된다.
제1 특성은 본 발명에서 공통적이다. 제2 특성은 본 발명에 의해 극복된 제한으로서, 그 성능이 0보다 작은 SNR을 갖는 신호를 위해 증명된다. 종래 웨이브렛 디노이징의 제3 특성은, 단일 데이터 벡터로부터 모든 이용 가능한 데이터까지, 또는 ABR의 경우 단일, 최종 선형적으로 평균화된 프레임의 디노이징으로부터 모든 이용 가능한 프레임의 단계적인 디노이징 및 트리(tree)와 같은 형태의 재결합까지 여기서 확장된다.
본 발명의 하나의 양상은, 프레임 수의 함수로서 ABR 신호 추정량의 변동을 최적 선형 추정량의 변동을 초과하여 감소시키는 것이다. 본 발명자는 웨이브렛 디노이징이 비선형 처리이고, 그리고 그것은 각각 이용 가능한 개개의 N 프레임을 갖는다는 사실을 이용한다. 원형 N 프레임을 재결합시키고, 이들 재결합을 디노이즈(de-noise)하기 위한 방법들이 발견되어, 원형 프레임의 선형 결합이 아닌 추가 프레임을 생성한다. 그 후, 본 발명의 방법이 원형 프레임을 결합하고, 그들을 디노이징하는 것에 의해 단계적인 디노이징을 수행한 후, 모든 원형 및 신규 프레임이 가능한 한 많은 방법으로 재결합될 때까지 상기 절차를 반복한다. 이 업무를 구현하기 위해 광범위하게 다양한 다른 알고리즘이 가능하다.
바람직하게, 프레임은 2개의 인접하는 프레임을 이용하고, 그들의 선형 평균을 계산하여 결합된다. 이 방법은 간단성, 계산 안정성 및 잘 이해된 해동을 위해 선택된다. 그 후, 이 한쌍의 선형 평균이 디노이즈되고, 신규 프레임이 생성된다. 전반적인 아이디어는 가능한 한 프레임의 원형 배열만큼 많은 순열을 생성하며, 이들 프레임의 신규 결합을 평균하고 디노이징하는 것을 유지하는 것이다. 이 재결합 처리는 트리와 같은 처리로서, 재결합된 프레임의 신규 레벨이 생선된다. 평균 및 디노이즈 연산은 레벨 k-1로부터 더 이상 프레임의 선형 결합이 없는 레벨 k에서 프레임을 생성한다.
이 업무를 달성하기 위한 가능한 한 많은 알고리즘이 상이한 기준: 구현의 용이성, 계산의 효율성, 계산의 안정성 등에 의해 평가될 수 있다. 본 발명의 주요 양상은 상이한 웨이브렛 디노이징 기술의 구현이지 프레임 재배열의 순열 조합론이 아니기 때문에, 본 발명을 위해, 구현이 용이성이 사용된다. 프레임 재배열시 바람직한 실시예의 목표는 허용 가능한 성능을 얻는데 충분한 신규 프레임을 생성하는 것이다.
몇가지 알고리즘은 프레임의 재결합의 많은 어레이를 생성하는데 적합하다. 이러한 하나의 알고리즘은 한쌍으로 평균화하고 디노이징하는 것에 의해 신규 프레임의 어레이를 생성한다. 이 어레이의 신규 프레임은 원형 ABR 신호에서 프레임의 오더링(ordering)의 함수, 즉 {1, 2,..., N}이다. 다른 알고리즘은 순열에 의한 원형 ABR 프레임의 리오더링(reordering), 즉 {7, 19,..., N,..., N-93} 또는{73, 4,..., N,..., N-121}를 포함한다. 이 리오더링 처리는 어떠한 평균화 및 디노이징도 포함하지 않는, 단지 프레임 인덱스의 재배열이다. 신규 리오더링이 구해지면, 한쌍의 평균화 및 디노이징 알고리즘이 적용되어 프레임의 신규 어레이를 생성한다. 이 방법으로 많은 어레이의 프레임이 생성되어, 전반적으로 많은 수의 프레임 M≫N을 생성한다.
프레임 재결합을 위해 선택된 방법으로서 한쌍의 평균화 및 디노이징이 주어졌고, 이것을 달성하기 위해 간단한 알고리즘이 개시된다. 알고리즘 전체를 위해, 문턱치화하는 웨이브렛 계수는 δk보다 작은 모든 웨이브렛 계수를 0으로 설정함으로써 문턱치 함수를 이용하여 달성된다. 이 문턱치 처리는 함수 den(프레임 데이터 δk)으로서 아래에 표시된다.
신규 프레임의 생성을 달성하기 위한 간단한 방법은, 다음과 같은 트리 디노이징 알고리즘에 의한 것이 있다:
1. 원형 데이터[f1, f2,..., fN]의 N 프레임의 셋트를 수집한다
2. 신호 f1 및 f2의 제1차 2개 프레임과 평균 f12=(f1+f2 )/2를 구한다
3. 문턱치 δ1, fd12=den(fd121)를 이용하여 이 평균 f 12를 디노이즈한다
4. 신호 f34의 2개 이상의 프레임을 함께 선형적으로 평균하고, 평균fd34=den(fd341)를 디노이즈한다. 모든 N 프레임에 대해 이 처리를 계속한다
5. [fd12, fd34,..., fdN-1,N]로 이루어지는 신규 레벨의 프레임을 생성한다
6. fd1234=(fd12+fd34)를 생성하기 위해 각각 2개의 인접한 신규 프레임을 선형넉으로 평균화하고, fd1234=den(fd12342)를 생성하기 위해 그 평균을 디노이즈한다
7. 트리와 같은 형태로 적용을 계속한다
8. 각각 신규한 레벨 k에서 프레임을 디노이징하기 위해 상이한 δk를 적용한다.
이 트리 디노이징 알고리즘은 도 19에 기술되어 있다. 레벨의 총계는 K=log2(N)이다. 레벨 k-1에서 2개의 인접한 프레임의 평균화 및 디노이즈 연산이 레벨 k에서 단일 프레임을 생성하기 때문에, 각각의 신규 레벨 k에서 프레임의 수는 2의 인수로 감소된다. 그 후, 트리의 루트에서, 레벨 k=K, 단지 하나의 프레임이 남는다. 생성된 신규 프레임의 총계는 N-1이다. 이 알고리즘의 간단한 수정은 다수의 프레임을 제공하고, 다음에 소개될 것이다.
간단한 트리 디노이징 알고리즘은 트리의 각 신규 레벨에서 동일한 수의 프레임을 유지하도록 팽창될 수 있다. 레벨 k-1에서 인접한 프레임의 한쌍의 평균이 아니라, 레벨 k-1에서 1개 프레임에 의한 순환 이동의 한쌍의 평균이다. 이 방법은 순환이동 트리 디노이징(CSTD)라 불리고 있다. CSTD 알고리즘은 폭 N과 깊이 log2N의 프레임의 트리(또는 어레이)를 생성한다. 각 레벨 k에서, 1≤k≤log2N, 2개의 인접한 프레임(dyad)이 평균화되고 디노이즈되어, 신규 레벨이 생성된다. 이전과 마찬가지로, 한쌍의 평균화에 적용된 디노이징 연산은 비선형 연산이므로, 신규 프레임은 더 이상 2개의 원형 프레임의 선형 결합이 아니다.
알고리즘이 N 프레임을 취하고, 제1 레벨의 평균은 1,2; 3,4; 5,6;..,; N-1,N으로 열거된 프레임의 N/2 평균을 산출한다. 그 후, 제1 레벨에서 원형 프레임 2,3; 4,5; 6,7;...; (N-2),(N-1); N,1의 평균에 의해 원형 N 프레임으로부터 다른 셋트의 N/2 평균이 산출된다. 이들 2개 셋트의 N/2 프레임이 연결되어, 신규 레벨의 프레임이 다시 길이 N을 산출한다. 다음 레벨에서, 알고리즘이 반복되어, 각각 의 길이 N/4인, 4개 셋트의 순환이동 평균이 산출된다. 이 처리는 kmax=log2(N) 레벨(정수 k에 대해서 이것은 N이 2의 거듭제곱 또는 N=2k인 것을 필요로 한다) 동안 반복된다. 이것은 fd12로 표시하는 8 프레임에 대해 도 20에서 연산 fd12=den(fd12 1)로 기술되어 있다:
간단한 트리 디노이징 알고리즘보다 K배 많은 프레임을 제공하고, 구현 및 낮은 계산 복잡성 때문에, 이것이 바람직한 실시예에서 사용된 알고리즘이다. 총 M=N*log2(N)의 신규 프레임이 생성된다. 상기 알고리즘이 각 레벨에서 동등한 수의 프레임을 갖도록 하기 위해, 프레임의 원본 수가 2의 거듭제곱, 즉 N=2K, 여기서 K는 트리의 깊이인 것이 필요하다.
도 53에 도시된 바와 같이, 본 발명의 방법은 각각 M 샘플을 가지는 총 2N 데이터 프레임에 대해서 우선 한쌍의 데이터를 취득하는 것이 바람직하다. 다음에, 데이터 프레임은 이산 웨이브렛 변환을 받게 되고, 계수들은 연결된 형태로 또 다른 처리를 위해 저장된다. 다음에, 도시된 바와 같이 CSTD이 적용되어, 초기 이산 웨이브렛 변환에서 결정된 것과 같이, 인접한 프레임의 웨이브렛 계수를 평균화하는 것에 의해 단지 제공된 제1 절반을 가지는 웨이브렛 계수의 신규 셋트의 프레임의 절반을 제공한다. 그 후, 신규 셋트의 프레임은 가변 문턱치가 되는 것에 따라 디노이즈되고, 디노이즈된 웨이브렛 계수뿐만 아니라 신규 문턱치 가 계산되어 저장된다. 이것은 N-1배 동안 반복적으로 반복되고, 합성 계수들이 선형적으로 평균된다. 최종 프레임은 이후 역 이산 웨이브렛 변화되어 디노이즈 신호에 도달하게 된다.
CSTD 알고리즘에 대해서 기술하기 위해서는 2개의 아이템이 중요하다. 첫번째는, 디노이징없이, 순환이동 평균을 이용한 프레임 재결합이 각 레벨에서 프레임의 가단한 선형 결합을 가져오는 것이다. 어떤 특정 레벨에서 프레임의 선형 평균은 모든 다른 레벨에서 프레임의 선형 평균과 동일하다. 기술하기 위한 두번째 아이템은, CSTD 트리의 하부에서 각각의 프레임이 모든 다른 프레임과 동일하다. 이것은, 디노이징 없이, 하부에서 각각의 프레임은 원형 레벨에서 모든 프레임의 선형 평균이고, 그것들이 그 평균에 고작 1회 포함되는 것을 보증하는 순환이동 알고리즘 때문이다. 이들 2개의 결과는 웨이브렛 디노이징을 연구하기 위해 바람직한 순환이동 트리 알고리즘을 작성한다.
웨이브렛 계수의 문턱치화가 각각의 신규 레벨에서 프레임에 적용되는 경우, 되면, 문턱치화가 비선형 연산이기 때문에, 이전 레벨에서 이들 프레임은 프레임의 선형 결합이 아니다. 추가적으로, 트리의 하부 레벨에서 프레임은 또한 트리의 상부 레벨에서 프레임의 오더링의 함수이다. 예컨대, 프레임{1,2,3,4,5,6,7,8}의 오더링에 대한 CSTD의 적용은, 프레임, 즉 {5,3,8,1,7,6,4,2}의 오더링에 CSTD가 적용될 때 산출된 프레임과 상이한 트리의 하부 레벨에서 8 프레임을 산출한다. 이것은, CSTD 레벨의 함수와 같은 문턱치의 변동 때문이다. 각각의 프레임은 트리의 상부에서 하부까지 상이한 경로를 횡단하고, 각각의 신규 레벨에서 문턱치화 함수에 의해 상이하게 영향을 받게 된다. 이 사실은 트리의 상부 레벨에서 프레임을 단순히 오더링하고 CSRD를 재적용하는 것에 의해 상호 선형 결합하지 않는 대량의 프레임을 생성할 가능성을 제공한다. 이 리오더링(reordering)을 생산하는 2개의 알고리즘이 있다. 이 새로운 알고리즘들은 "Euler-Fermat 프레임 리오더링" 및 "모든 가능한 순열들"로 불리운다. 이 알고리즘들 중 하나가 프레임들에서 평균이나 디노이징과 같은, 연산을 행하지 않으면, 예측된 형태로 프레임들의 시퀀스를 리오더한다.
CSTD 알고리즘은 모든 가능성의 프레임 재결합에 철저하지 않다. 보다 전체의 결합들에서, CSTD의 사용 이전의 프레임들의 재배열이 가능하다. 필요한 것이 {1,2,...,N}으로부터 동일한 원소들을 포함하는 새로운 셋트까지의 각각 및 길이 N, 즉, {7,19,...,N,...,N-93}이나 {73,4,...,N,...,N-121}의 하나인 순차 및 그 함수이다. 이것을 달성하는 한가지 방법은 Euler와 Fermat에 의한, 이론적인 대수로부터 초래된 시퀀스 순열을 사용하는 것이다. 다음으로 정의되는 함수 ψ(k)를 사용하는 Euler에 의한 이론을 나타낸다; k>1일 때, ψ(k)는 k이하의 양의 정수들과 같고, k의 소수이다. mod로 나타내어지는, 모델로(Modulo) 함수는 2개의 정수를 나눈 나머지가 주어지는 것이다. 예를 들어, 3 mod 8 = 3, 11 mod 8 = 3, 및 16 mod 8 = 0이다. x≡y mod z으로 나타내는, Euler 이론은 x mod z이 y mod z과 등가관계인 것을 나타내는 congruence modulo함수를 사용한다. 예컨대, 73≡4 mod 23은, 73 mod 23 = 4이고, 4 mod 23 = 4이다. 따라서, 73과 4는 적합 모델로 23이고, 73과 4 둘을 23으로 나눈 값은 동일한 나머지, 즉 4가 된다. congruence modulo 함수를 프레임 숫자들의 새로운 시퀀스를 생성하는 데 사용한다. 이론은 증명없이 주어지고, 다음과 같다:
(Euler) α ψ(k) ≡1 mod k
여기에서, k는 양의 정수이고 a는 k의 소수이다. 예컨대, k=8이다. 그 후 ψ(8)=4이고, 이는 8의 소수인 8 이하의 4개의 숫자들(1,3,5,7)이기 때문이다. 따라서 ψ(8)=4th거듭제곱으로 구해지는 4개의 숫자들은, 1과 8의 congruence modulo이다, 즉, 14=1, 1 mod 8 = 1. 또한 34=81, 81 mod 8 = 1이다. 또, 5 4=625, 625 mod 8 = 1이다. 마지막으로, 74=2,401, 2,401 mod 8 = 1이다.
Fermat(최근에 입증된 그 마지막 이론은 아님)에 의한, 두번째 이론은 이 개념을 소수 숫자들로 확장한다. 또한 이 이론을 증명없이 사용한다:
(Fermat) p가 소수이고 α가 정수라면, α p ≡α mod p.
예컨대, a=8이고 p=3이라 하자. 그러면 83=512이고, 512 mod 3 = 2이다. 물론 8 mod 3 = 2이다. 따라서, 83≡ 8 mod 3이고, 83과 8은 congruence modulo 3이고, 83과 8 둘 다를 3으로 나눈 값은 동일한 나머지, 즉 2이다.
프레임들의 특정한 숫자에서(CSTD 목적을 위한 거듭제곱을 사용함), 가장 큰 숫자의 가능한 리오더링들을 산출하는 소수들의 셋트를 발견할 수 있다. 특히, N이 프레임들의 숫자를 나타내면, p는 N까지의 소수이고, iold는 전의 프레임들의 인덱스이고, 그 후 새로운 프레임들의 인덱스 inew는 다음의 방정식에 의해 구해진다:
i new = (i old ·p) mod N
보면, Wickerhauser, M.V., Personal Communications. 예컨대, N=8이면, 아래의 표 3은 Euler-Fermat 프레임 인덱스의 예를 제공하고, 값들 p=1,3,5,7에서 8개의 원 프레임들의 리오더링을 나타낸다.
p 프레임0 프레임1 프레임2 프레임3 프레임4 프레임5 프레임6 프레임7
1 0 1 2 3 4 5 6 7
3 0 3 6 1 4 7 2 5
5 0 5 2 7 4 1 6 3
7 0 7 6 5 4 3 2 1
프레임들의 각각의 새로운 리오더(reorder)는 정확히 N=8인 요소들을 가지며, 상기 원형 셋트내의 각 요소들은 오직 한번 상기 리오더로 나타난다.
간단한 컴퓨터 프로그램의 도움으로, 우리는 원형 데이터의 소정수의 프레임들을 위한 적절한 소수들(prime numbers)을 발견할 수 있다. 우리는 x=1 인 때까지 n 회수, 식 x = (p*x)modN 을 반복하고, 상기 식은 우리에게 pn= 1 modN 을 제공한다. 우리는 소정의 소수에 대해 반복회수 n을 최대화하기 원한다. 예컨대, N=512 인 데이터의 프레임들에 대해, 수 3, 5, 11, 13, 27(모두 512에 상대적으로 소수이다)는 n=128을 생성하고, 따라서 이들 상대 소수들에 대해 p128 =1 mod 512이다. 상대 소수들 7 및 9는 n=64를 생성하고, 상대 소수 17은 n=32를 생성한다. 따라서, 우리는 소수들 3, 5, 11, 13, 27 등을 선택한다. N이 2의 거듭제곱이라면, N개 요소들의 원 시퀀스의 순열들(permutations)의 최대수는 N/2와 같다. 예컨대, N=512에 대해, 상이한 순열들의 최대수는 256이고, 512보다 작은 모든 홀수들은 512에 상대적으로 소수이다.
율러 퍼맷(Euler-Fermat) 알고리즘은 CSTD의 애플리케이션 이전에 상이한 프레임 인덱스 리오더들의 총수를 증가시키기 위해 실행된다. 전체 알고리즘은 먼저, 여기서 서술된 율러 퍼맷 방법을 사용하여 원 N개 프레임들의 다수의 리오더들을 생성하고, 그후 CSTD 알고리즘을 프레임들의 각각의 새로운 리오더에 적용한다. P개의 새로운 재배열들이 율러 퍼맷 리오더들을 사용하여 발생되면, 이것은 총 M=P*N*log2(N)의 새로운 프레임들을 생성한다. 그후 우리는 율러 퍼맷 리오더들과 CSTD의 결합에 의해 발생될 수 있는 프레임들의 최대수의 상계(upper bound)를 갖는다: M=N*N/2*log2(N)=0.5*(N2*log2(N))
큰 수의 프레임들을 생성하기 위해, 가장 철저한 선택은 모든 가능한 순열들을 간단히 계산하는 것이었고, 그후 그들을 두개씩(dyadically) 평균화하여 디노이징(denoise)한다. 그러나, 모든 가능한 순열들의 수는 N!이고, 이것은 적은 수의 프레임들에 대하여서조차 매우 신속하게 증가한다. 예컨대, N=8에 대하여, 모든 가능한 순열들의 수는 M=40,320이고, N=512에 대하여, 모든 가능한 순열들의 수는 M=3.4*101166이다. 이 알고리즘은 실험실에서 검토된 것이 아니며, 왜냐하면 율러 퍼맷 리오더들과 CSTD의 결합은 이미 매우 큰 수의 프레임들을 생성하였고 신규한 디노이징 알고리즘의 평가(evaluation)에 충분하기 때문이다.
도 21은 특정 율러 퍼맷 순열에 대하여, CSTD 처리를 그래픽으로 도시한다. 원 신호 x[n]는 ABR 데이터의 N개의 프레임들로 구성된다. 예컨대, N을 32로 놓으면, CSTD는 5레벨들에서 32*log2(32)=160의 새로운 프레임들을 생성한다.
우리는 이제 웨이브렛 계수들의 문턱치화(thresholding) 처리를 검토한다. 문턱치화는 두가지 상이한 방식으로 적용된다. 문턱치화가 적용되는 제1 방식은 단일 DWT내에 있다. 웨이브렛 분할의 각 레벨에서, 상이한 스케일에서 계수들에 상이하게 영향을 미치는, 상이한 문턱치가 적용된다. 보다 높은 주파수들에 대응하는 웨이브렛 분할 스케일들은 보다 큰 문턱치를 가지고 문턱치화되고, 상기 스케일이 부가적인 레벨들의 분할에 따라 증가되기 때문에, 신호의 특징들은 더욱 현저해지고, 보다 적은 계수들이 0으로 세팅된다. 이것은 종래 기술에서 도노호(Donoho)에 의해 요약된 결과이다. 웨이브렛 계수들의 수는 데이터 프레임에서 샘플들의 수에 대응하고, 따라서 64포인트 신호 프레임의 웨이브렛 분할은 log2(64)=6의 분해 레벨들 및 64개 웨이브 계수들을 산출한다. 이 문턱치화는 표준 웨이브렛 디노이징 문헌에서 제시한 바와 같은 새로운 알고리즘에서 실행되고, 따라서 그 문턱치 레벨은 2i/2의 인수만큼 스케일마다 떨어지고, 여기서 i는 웨이브렛 분할 레벨이다. 이것은 표준 방법이고, 더이상 논의되지 않을 것이다.
변수 문턱치화가 실행되는 제2의 방식은 도 21에 도시된 바와 같이 CSTD레벨들 사이에서이며, 이것은 본원발명에 고유한 것이다. 웨이브렛 계수들은, δ1로 표시되는 상이한 초기 문턱치로 그 레벨에서 각 프레임에 대해 문턱치화된다. 문턱치 함수를 이해하는 올바른 방식은 두 변수들의 함수: 즉 δk,w로서이며, k는 CSTD 알고리즘 레벨에 대응하는 인덱스이고, w는 CSTD의 k번째 레벨에서 단일 프레임 내에 특정 웨이브렛 스케일에 대응하는 인덱스이다. 상기 내부 웨이브렛 스케일 문턱치화(within-wavelet-scale thresholding)가 기존의 표준 디노이징 알고리즘의 일부이기 때문에, 우리는 여기서 이것을 더 검토하지 않을 것이며, 문턱치화에 대한 미래의 논의에서 그렇게 가정할 것이다. 우리는 단지 δk로 표시된 CSTD 레벨 k의 함수로서 δ의 변동을 검토할 것이다. 우리가 문턱치화를 논의할 때, 우리는 본원 발명에 적용된 CSTD 레벨 의존 문턱치화에 대해서만 언급할 것이다.
CSTD 웨이브렛 계수 문턱치화에 수반되는 두개의 변수들이 존재한다. 제1의 변수는 트리 깊이(tree depth) 레벨을 가진 문턱치에 관한 함수이다. 제2의 변수는 상기 제1 레벨에서의 초기 값(δ1)이다. 둘 모두 본원발명의 효과에 중요한 역할을 담당한다.
우리는 CSTD 레벨에 δ을 연관시키는 기저함수를 선택할 때 다수의 선택을 가진다. 함수 δk는, 추정자(estimator)의 분산을 최소화하는 것을 찾아서, 통상적으로 사용되는 신호 처리 함수들의 범위로부터 선택된다. 직관적으로, 우리는, 순증가 함수, 순감소 함수, 또는 상수함수 중 하나인, 단조함수(monotonic function)를 선택하기 원하며, 이것은 CSTD의 거동이 레벨마다 일관적이기 때문이다.
제1 선택은 상수함수이며, 따라서 1≤k≤log2(N)인 모든 k에 대해 δk = δk-1 이 된다. 실행되는 제2의 주된 선택은 그 함수가 증가하든지 감소하는 것이다. 그 경우 우리는, 어떤 비율로, 어떤 방식으로, 등 그 함수가 증가(감소)하는 방식을 선택한다. 이 두 가정 모두는 그들을 인간 대상 데이터에 적용함으로서 검사되었고, 그 결과들은, 큰 델타로 시작하고 그것을 각 레벨에서 감소시키는 것이 실질적으로 보다 낮은 분산 및 RMS에러를 산출한다는 것을 명확히 나타낸다. 부가적으로, 문턱치 함수 δk=2-k/2는 가장 양호한 전체 결과들을 산출한다. 이것은, 전형적인 인간 대상 ABR 데이터에 대하여, 아래의 도 22에서 도시된다:
도 22의 결과는 감소함수 2-k/2가 전체적으로 가장 낮은 에러를 산출한다는 것을 설명한다. 그것은, 또한 각각의 특정 문턱치 함수에 대해 최소치가 존재하고, 그것이 초기 문턱치의 선택에 의존한다는 것을 설명한다. 이것은 계수들을 0으로 세팅하는 이하의 초기 문턱치의 선택이 매우 중요하다는 것을 의미하며, 왜냐하면 매우 큰 문턱치는 너무 많은 노이즈 관련 계수들을 유지시키고, 매우 작은 문턱치는 정보 관련 신호들에 관한 계수들을 제거하기 때문이다.
CSTD 알고리즘(M개의 새로운 프레임들을 생성시킴) 내에 웨이브렛 변환 연산의 애플리케이션에 관해 두 가지 선택이 가능했다. 한 가지 선택은 DWT를 실행하고, 디노이징하고, 그후 모든 새로이 생성된 프레임들의 각각의 독립적 프레임들 상에 IDWT를 실행하는 것이었다. 이것은 시간 영역에서 중간 프레임 재결합들을 모두 유지시키지만, 이것은 DWT 및 IDWT에 대하여서만 n*log2(n)=64(프레임 당 n=64 샘플들)의 차수의 2*M개 연산들을 요구했다. 대안적인 방식은 각 프레임에 대하여 먼저 M개의 상이한 DWT들을 계산하고, 그후 CSTD에 단지 웨이브렛 계수들만을 사용하고, 매번 IDWT를 실행하지는 않는 것이다. CSTD의 출력물에서, 웨이브렛 계수들의 단일 최종 프레임이 획득되고, IDWT는 오직 한번 적용되었다. 이것은 웨이브렛 변환들을 실행하는 것에 관하여 작업량을 2*M 에서 M+1 연산들로 감소시켰다.
우리는 이제 전체적 알고리즘을 제공하며, 그것은 ABR 신호 획득(acquisition) 및 상기 바람직한 실시예의 신규한 방법들을 결합한 것이다:
1. 이상에서 서술된 데이터 취득 시스템을 사용하여, 자극 제공(stimulus presentation)을 가지고 및 자극제공 없이, 8,192개 프레임들에 걸쳐 인간 대상들로부터 ABR 데이터를 획득한다.
2. 8,192개 프레임들의 각 프레임 상에 DWT를 실행함으로서 웨이브렛 계수들의 어레이를 생성하고, 원 프레임들[1, 2, ..., K]와 같이 배열된다.
3. 8,192개 프레임들 모두를 선형적으로 평균화함으로써 "최종 평균"을 생성하고, "진정한(true)" ABR 신호로서 사용될 평활(smooth) 신호를 얻기위해 필터링한다.
4. 총 M=N*log(N)개의 새로운 프레임들을 얻기 위해, 웨이브렛 계수들의 어레이를 디노이징하고, 각각은 상이하게 디노이징된다.(즉, 최대 8,192*13=106,496개 프레임들).
5. 리오더된 프레임들(즉, 크기 N의 [3,5,9,...N, N-3,...])을 얻기 위해, 율러 퍼맷 리오더들을 사용하여 원 웨이브렛 계수 프레임들의 P개 새로운 순열들 p를 생성한다.
각각의 새로운 순열 p에 대해 P회수 CSTD 연산들을 반복한다. 이것은 총 0.5*(N2*log2(N))개의 새로운 프레임들을 얻을 것이다.
6. N개 프레임들의 시퀀스를 얻기 위해 CSTD가 적용되었던 프레임들의 상이한 디노이징된 리오더들을 모두 선형적으로 평균화한다.
7. 웨이브렛 계수들의 한 프레임을 얻기 위해 N개 프레임들을 선형적으로 평균화한다.
8. 시간 영역 샘플들을 얻기 위해 이 평균화된 프레임상에 IDWT를 실행한다.
9. 증가하는 수의 프레임들에 대하여, 선형 평균과 최종 평균 간의 분산 및 RMS에러를 계산하고, 디노이징된 평균과 최종 평균 간의 분산 및 RMS에러에 비교한다.
율러 퍼맷 순열들의 효과가 검토되었고, 부가적인 프레임들이 그 성능에 크게 기여하는 것은 아니라는 것이 발견되었다. 단일 순열의 경우에 대하여 선형 평균화에 대한 분산에 있어서의 평균 감소는 9.25의 팩터인 반면에, 15개 상이한 율러 퍼맷 순열들의 애플리케이션은 상기 팩터가 9.52로 단지 증가하거나, 대략 3% 향상되었다. 이것은, CSTD의 애플리케이션이 점진적인 디노이징을 이용하기 위해 충분한 수의 프레임들을 제공한다는 것과, 프레임들의 다양한 리오더들에 대해 CSTD를 반복하는 것이 중요한 향상을 가져오지는 않는다는 것을 나타낸다.
그러나, 새로운 CSTD 프레임들이 원 프레임들의 간단한 선형적 결합이 아닌 반면에, 그들은 어느 정도 원 프레임들과 상호연관되어 있으며, 통계적으로 독립적이지 않다. 이것은, CSTD를 사용하는 SNR 향상의 양이, 중요하지만, 이론적으로 예상되는 결과의 가장 양호한 경우보다도 상당히 더 적게 되는 주된 이유이다.
또한, CSTD 처리는 선형 평균화 처리 및 디노이징 처리의 결합이다. CSTD와 선형 평균화 간의 결정적인 차이점은, CSTD가 문턱치보다 작은 웨이브렛 계수들을 0으로 세팅한다는 것이다. CSTD 처리에서 문턱치를 0으로 세팅한다는 것은, 웨이브렛 계수들이 모두 유지된다는 것을 의미하고, 이것은 선형 평균화를 실행하는 것과 유사하다. 문턱치들은 CSTD 레벨들의 수가 증가할수록 감소된다. 레벨들의 수, 또는 CSTD 트리의 깊이는 증가하는 수의 프레임들과 함께 증가하고, 따라서, 동시에 선형적으로 평균화되는 동안에 더 많은 프레임들이 더 작은 문턱치들에 의해 처리된다. 따라서, 선형 평균화에 비교할 때, 적은 수의 프레임들에 대하여, CSTD는 보다 큰 문턱치들을 가지고 더 많은 프레임들을 디노이징하는 반면에, 큰 수의 프레임들에 대하여, CSTD는 선형적으로 평균화되는 프레임들의 수에 비교할 때 매우 작은 문턱치들을 가지고 더 많은 프레임들을 디노이징한다. 따라서, CSTD는 매우 큰 수의 프레임들에 대하여 선형 평균화 성능에 도달한다.
게다가, 한 트리 레벨에서 그 다음 트리 레벨까지의 CSTD내에 삽입된 선형 평균화 처리들은 동시(simultaneous) 웨이브렛 디노이징 처리에 부가하여 SNR을 증가시킨다. 따라서, 적은 수의 프레임들에 대하여, 적은 양의 선형 평균화가 CSTD내에 발생하고, 대부분의 SNR향상은 선택 웨이브렛 계수들을 0으로 세팅하는 것으로부터 이루어진다. 프레임 수가 증가함에 따라, 더 많은 선형 평균화가 CSTD내에 실행되고, 노이즈가 웨이브렛 디노이징에 의한 것보다 선형 평균화 처리에 의해 더 많이 제거된다. 또한, 더 많은 프레임들이 처리됨에 따라, 더 작은 문턱치가 새로운 트리 레벨들에서 적용된다. 전체적으로, 그 문턱치들이 레벨마다 감소되기 때문에, 각 트리 열에서, 증가하는 수의 프레임들에 따라 디노이징에 의해 더 적은 노이즈가 제거되는 반면에, 선형 평균화에 의해 더 많은 노이즈가 제거된다.
따라서, 자체적으로 적용된 선형 평균화 처리를, 적분부로서 선형 평균화를 또한 사용하는 CSTD 처리에 비교할 때, 우리는 향상의 정도가 증가하는 수의 프레임들에 따라 일반적으로 감소하는 것을 발견한다. 그러나, ABR 신호 처리에 있어서, 우리는 적은 수의 프레임들(512 대 8,192)에 대한 SNR 향상에 관심이 있으며, 따라서, CSTD 알고리즘은 통상적인 선형 평균화에 비교할 때 향상을 가져온다.
본 발명은 미약한 생체신호들에 대한 애플리케이션을 위한 신규하고 신속한 웨이브렛 추정자를 제공한다. 약한 생체신호들은, 인체에 의해 생성되고 대량의 노이즈에 의해 손상되는 신호들로 정의되며, 따라서 결과적인 신호 대 노이즈 비율(SNR: signal-to-noise rate)은 0 dB보다 낮다. 다수의 신호 프레임들의 선형 평균화는 ABR들의 SNR을 증가시키기 위해 종래기술에서 일반적으로 사용된다. 통상적인 웨이브렛 디노이징은 노이즈를 나타나는 웨이브렛 계수들을 0으로 세팅하는 처리가고, 문턱치 함수를 사용하여, 신호를 나타내는 계수들을 유지시킨다. 그러나, 통상적인 웨이브렛 디노이징은 그 SNR이 0보다 작은 신호들에 대하여서는 오류가 생기며, 이는 너무 많은 웨이브렛 계수들이 0으로 감소되기 때문이다.
본 발명의 장치 및 방법을 사용하여, 원형 데이터 프레임들이 큰 수의 새로운 프레임들을 생성하기 위해 재결합되고, 그 각각은 변수 문턱치 함수를 사용하여 디노이징되었다. 새로운 프레임 결합들의 생성을 위한 몇몇 알고리즘들이 개시되며, 순환이동 트리 디노이징(CSTD:cyclic-shift tree de-noising)이 이 프레임들에 적용된다. 이 CSTD 알고리즘은 데이터의 원 N개 프레임들을 사용하고 N*log2(N)의 새로운 프레임들을 생성했다. 새로운 프레임들은 인접하는 원 프레임들을 평균화하고 상기 평균을 디노이징함으로써 유도되었다. 프레임들의 새로운 레벨들이 생성되었고, 각각의 레벨에서 상이한 디노이징 문턱치들이 이용되었다. 디노이징이 비선형 연산이기 때문에, CSTD 알고리즘은 원 프레임들의 선형 결합이 아닌 새로운 프레임들을 생성한다. 실험적 결과들은, 먼저 원 프레임들을 리오더하고 그후 CSTD를 사용하여 그들을 재결합하는 순열 방법들이 중요한 향상을 가져오지 못했다는 것을 보여준다.
CSTD 알고리즘을 사용하여, -20dB의 SNR을 가지고 상기 신규한 알고리즘을 시뮬레이팅된 노이즈 사인곡선(simulated noisy sinusoid)에 적용하면 제1의 512개 프레임들내에서 수용가능한 성능을 달성할 수 있다. 시뮬레이팅된 신호의 적은 수(즉, 512)의 프레임들에 대하여, 상기 신규한 알고리즘은, 선형 평균화에 비교할 때, 대략적으로 10의 인수만큼 그 추정치의 분산을 감소시키는 것으로 나타내어 졌다. 상기 신규한 알고리즘의 인간 대상 ABR 데이터로의 애플리케이션은 또한 성능에 있어 큰 향상을 가져왔다. 차선의 조건들에서 수집된 피크 V의 부근에서의 ABR 파형들의 면적은, 2-3회 정도로 더 많은 프레임들이 평균화될 것을 요구하는 선형 평균화에 비교할 때, 512밖에 안되는 프레임들에서 상기 신규한 알고리즘에 의해 대략화될 수 있다. 상기 신규한 알고리즘은 선형 평균화에 비교할 때, 대략적으로 3의 인수만큼 신호의 분산을 감소시키는 것으로 나타내어졌다. 이것은, 수집되어 대략 5의 인수만큼 평균화될 것을 필요로하는 프레임들의 수를 감소시키는 것과 동등하다.
상기 신규한 알고리즘은 몇가지 제한들을 가진다. 선형 평균화와 같이, 그것은 단일 프레임의 데이터에 적용할 수 없으며, 따라서 동일한 신호를 복수 측정해야 한다. 추정되는 신호는, 그 신호를 손상시키는 노이즈에 비교할 때 가간섭성이고 평활해야 하며, 왜냐하면 이것은 웨이브렛 디노이징의 기본이기 때문이다. 최종적으로, 그것의 현 실행에 있어서 상기 알고리즘은 상기 알고리즘의 애플리케이션 이전에 데이터의 모든 프레임들이 수집되어 저장될 것을 요구한다(즉, 512개 프레임들의 처리에 대하여, 512개 프레임들 전부가 메모리에서 이용가능해야 한다).
신규한 CSTD 알고리즘은 다른 분류의 약한 신호들 및 생체신호들에 적용될 수 있다. 예컨대, 입력신호는 또한, 그 입력신호가 부정기적으로 변화하거나, 비주기적이거나, 또는 반복적이지 않거나 한다는 의미에서 변형되어 동일한 신호 프로세서 및 방법을 사용하는 본원발명을 사용하여 디노이징될 수도 있다. 오직 필요로 하는 것은 입력신호가 다수의 보다 작은 부분들로 선택적으로 분할되는 것이며, 상기 보다 작은 부분들 각각은 그후 독립적으로 디노이징될 수 있다. 그 결과 신호는 그후, 디노이징된 변형 신호를 생성하도록 하는 분할을 위한 과정을 역으로 하여 다시 어셈블링될 수 있다. 상기 바람직한 실시예의 목적은 범용의 아기 듣기 스크리닝(universal infant hearing screening)에 적용할 수 있는 알고리즘을 생성하는 것이며, 여기서 검사의 속도와 결과들의 정확성이 결정적으로 중요하다.
이상의 관점에서, 본원 발명의 몇가지 목적들은 달성되고, 다른 잇점이 있는 결과들이 얻어진다. 본 발명의 범위를 벗어나지 않으면서 다양한 다른 변화들이 이상에서 이루어질 수 있으며, 그것은 이상의 설명에서 포함되고 첨부된 도면들에 도시된 모든 사항들은 예시로서 이해되어야 하며, 어떠한 한정하는 의미로도 이해되지 않아야 한다는 것을 의도한다. 본 발명은 그러므로 이하에서 제시된 청구범위에 의해서만 제한될 수 있다.
발명의 배경 및 요약
정확하고 빠른 생체-신호 취득 및 평가는 임상기기에서 매우 중요하다. 미국 및 전세계의 수천개의 병원에서, 외과의사, 내과의사 및 다른 의료전문가들은 매일 생체신호를 측정하는 진단장치로부터 얻은 입력에 기초하여 실질적인 건강-관련(종종 삶과 죽음)결정을 한다. 신호 평가 속도는 단지 한정된 데이터 수집을 허용하기 때문에, 오늘날의 의료 기술의 많은 어플리케이션들이 제한되는 많은 예들이 존재하고, 결과적인 의학적 결정은 단순히 불충분한 시간이 정확한 생체 신호 획득 및 평가를 위해 이용가능하기 때문에 부족한 데이터에 기초한다.
일례는 보편적인 신생아의 청력 선별(hearing screening)이다. 청력 평가 및 관리를 위한 국립센터에 의해 발표된 바와 같이, 미국에서 태어난 4,000,000명의 유아중에 1000명당 3명의 평균 발생률에 해당하는 연간 12,000명이 영구적인 청력상실을 가진다. 출생시 청력상실은 다른 어떤 출생 결함보다 높은 발생률을 가진다. 미국에서 청력 선별이 없는 청력 상실의 평균 나이는 3살이다. 감지되면, 청력 손실은 종종 보청기를 사용하여 소리 확대를 통해 교정될 수 있다. 보다 심각한 장해의 경우, 청력 손실은 청신경의 직접적인 신경 자극을 제공하는 인공귀(cochlear implant)를 사용하여 교정될 수 있다. 불행하게도, 청력상실이 3살까지 발견되지 않으면, 만약 교정될 수 있더라도, 언어발달의 형성기간이 경과하고, 이 어린이들은 그들의 여생 동안 정상적인 언어 능력을 결코 획득할 수 없다. 청력이 손상된 어린이들은 종종 그들의 언어 및 청력 이해 기술이 정상적인 수준으로 발달하지 않기 때문에, 심리적으로 장애가 있는 것처럼 잘못 분류된다. 때늦은 탐지의 감정적인 영향에 부가하여, 국립보건기구(NIH)는 전체적으로 수십억 달러의 경제적 영향을 가지고 특수 교육 및 손실된 생산성에서 어린이 당 $500,000 에 속하는 비용을 사회에 부가하는 것으로 평가했다.
만약 청력 손실이 초기에 감지되면, 보청기는 4주 동안 어린이에게 설치되고, 인공귀는 1살 때 수술로 삽입될 수 있다. 어린이 및 부모들이 청취 보조 장치, 부모 교육, 특수 언어 훈련 및 진행중인 의학적 검사를 포함하는 전체적인 삽입 프로그램에 삽입될 때, 이 어린이들은 그들이 학교에 다니는 때까지 완전하게 말하기 능력 및 청취력을 발달시킬 수 있다. 이것은 그들의 삶의 질에 심오한 영향을 미치고, 사회에 전체적으로 매우 큰 사회적 및 경제적 영향을 미친다. 청력 손실의 초기 감지가 만드는 현저한 차이의 결과, 미국내 32개 주는 모든 유아에 대한 청력 테스트를 명령하고, 다른 주들은 입법을 계류중이거나 진행중에 있다.
이하의 표 1은 이 작성된 설명에 사용되는 약어의 목록이다.
출생시에 정확하고 객관적인 청력 손실을 측정하기 위하여, 와우각 음향 검사(이음향방사검사(otoacoustic emission)-OAE) 및 청각 뇌간 반응 검사(ABR)가 다중 주파수 및 다중 자극 레벨들에서 실행될 필요가 있다. 이음향방사검사는 귀에서의 음조을 나타내고, 와우각으로부터 오는 이 음조들에 대한 반응을 측정한다.
청각뇌간반응검사는 귀에서 음향 클릭들(click)을 나타내고, 음향 자극에 반응하여 유발된 뉴런(neuron)에 의하여 생성된 유발된 전위를 측정한다. 이 두가지 검사들은 지속적인 반응을 요구하지 않으며, 청력의 객관적인 시험으로 고려된다. 이 모든 검사들로부터의 신호들은 신호 대 노이즈 비율(SNRs)이 0 dB 이하이면 완전히 소음에 묻힌다. OAE 및 ABR을 실행하는 모든 상업적으로 이용가능한 장치들은 획득한 신호를 키(key) 신호 특징의 정확한 식별을 위해 요구되는 레벨로 증가시키기 위해 선형 평균을 사용한다. OAE테스트를 위해, 선형 평균은 귀마다 일분 이하로 충분히 큰 SNR을 가진 신호들을 생성한다. 보통 OAE 검사들은 단일 자극 레벨에서 4주기동안 실행된다. ABR 검사를 위해, 본 발명의 바람직한 실시예의 초점은, 선형 평균 처리가 획득하여 평균을 내기 위해 많은 수의 프레임(frame)들을 요구하여, 하나의 귀에서 하나의 자극레벨 당 10분의 전체 검사 시간이 되도록 한다. 결과적으로, ABR 검사는 선별되는 모든 유아에게 일반적으로 실행되지 않고, OAE 검사가 실패한 유아에게만 실행된다. 또한 OAE 테스트가 청각 시스템의 신경 부분이 손상되거나 완전히 상실할 때, "패스(pass)"결과를 생성할 수 있음을 주지하는 것을 중요하다. 이는 OAE 검사에 의해 측정된 신호들이 청각 시스템의 신경 부분과 무관한 와우각에 의하여 생성되기 때문이다. 그러므로, ABR 검사로 하는 검사는 청력의 정확한 표시를 얻기 위해 필수적이다.
ABR 검사를 받지 못하는 유아들에 대해, 단일 자극 레벨에서 오직 단일 ABR 검사가 보통 퇴원에 앞서 이루어진다. 이 기술 제한의 결과로, NIH는 전국적인 청력 선별을 위해 오직 제한된 권고만을 발령하게 된다. 이것은 국립보건기구의, 유아 및 소아의 청력 손상의 초기 식별(Early Identification of hearing Impairment in Infants and Young Children, NIH Consens Statement, Mar 1-3 ; 11 (1) 1-24 (1993))에 나타내듯이 단지 몇 주기(3-5)의 단일 레벨에서 와우각 검사 및 오직 단일 레벨의 뇌간유발반응측정을 포함한다. 이상적으로, 모든 와우각 반응 및 뇌간 반응은 10개의 다른 주파수 및 각 주파수당 10개의 사운드 레벨에서 표준 청력 실행에 따라 측정되어야 한다.
생체 신호 측정 속도의 실질적인 증가는 이 문제를 극복하고 청력 손실 표시를 정확하게 감지하기 위해 필요하다. 단지 적은 수의 레벨들에서의 검사는 높은 비율의 잘못된 긍정적인(유형 I 에러)검사 결과의 원인이 된다. 일반적으로, 이 비율은 3-15%에 속하고, 여기서 오직 0.3%의 유아만이 사실상 청력 손실을 가지고 태어난다. 오늘날 미국에서 태어난 유아의 50% 이상이 출생시에 선별되고, 보통 50만에서 5천만 달러와 3억달러사이의 비용이 소요된다. 이는 또한 청력 손실을 가진것으로 잘못 식별된 유아의 부모에게 큰 감정적인 비용이다. 신생아의 청력 선별 검사에 대한 이러한 비판들은 그것의 국가적인 실행에 큰 방해가 되었다.
청력 손실을 위해 선별되는 대부분의 어린이들이 OAE 검사만 받고, ABR 검사를 받지 않는 부가적인 이유는 그것이 경제적으로 실행불가능하고-ABR 검사를 실행하기 위한 장치는 약 $20,000이다-, 그것은 하나 또는 기껏해야 두 개의 청력 레벨에서의 청력 검사를 제공하기 때문이다. 이것은 감지되지 않은 위험으로부터 유아에게 실질적인 부분의 청력 손상이 남겨진다.
많은 다른 예들은 생체신호의 작은 SNR에 의하여 제한된 임상기구들이 존재한다. 이것은 신경 손상을 방지하기 위한 수술동안 신경검사(neuromonitoring) 및 불필요하고 잠재적으로 건강을 위협하는 시간지연 및 희박한 측정 데이터에 기초하여 만들어지는 불완전한 결정에 의하여 각각 고통받는 것을 방지하기 위해, 마취 검사, 내이 신경 독성 관리의 사용을 포함한다. 미약한 생체신호라는 용어는 바람직하게는 약 0 dB 이하의 SNR을 가지는 인체로부터 획득한 신호를 의미하는 것으로 정의한다. 이 약한 신호는 또한 다른 어플리케이션에서 발견될 수 있으며, 본 발명은 다른 약한 신호들을 디-노이즈(de-noise)하기 위해 사용하는 것이 바람직하다. 그러나, 설명을 위해, 발명자는 본 발명의 어플리케이션을 나타내기 위해 생체 신호 어플리케이션을 선택하였다.
미약한 생체신호 취득 및 평가 과정의 중요한 방해는 신호를 변조하는 노이즈이다. 단어 "노이즈"는 여기서 측정되기를 원하는 정보-생성 신호의 에너지에 더해지는 많은 에너지 소스의 누적된 효과를 설명하기 위해 사용된다. 생체 신호를 변조하고 그들의 획득 및 처리를 방해하는 노이즈 유형의 어떤 예들은 이용가능한 문헌에서 발견할 수 있으며, 다음을 포함한다.
생리적인 노이즈:
- 전기적 활동(신경에서의 활동 전위, 셀들을 인/아웃하는 이온들의 이동)
- 혈류(노이즈를 유발하는 액체의 기계적인 이동)
- 호흡(차단된 공기 흐름 노이즈)
- 신진대사활동(화학적)
환경적인 노이즈:
- 파워 그리드(power grid )로부터의 방해(국가에 따라 50 Hz or 60 Hz )
- 음향 노이즈(팬을 식히는 장치, 비퍼(beepers), 다른 장치, 직원)
- 다른 장치 및 방송 매체로부터의 전자기적 및 무선 주파수 방해
생체 신호 획득 및 처리 노이즈:
- 변환기(Transducer)대 인체 인터페이스 노이즈(이동 노이즈, "전극 팝(pops)")
- 변환기 내부 노이즈(전극, 마이크로폰(microphone), 온도 센서)
- 다양한 유형의 전기적 노이즈(온도, 샷(shot),버스트(burst), 전자사태 노이즈(avalanche noise))
- 보드 상의 디지털 회로로부터의 전자기적 및 무선주파수 간섭
- 디지털 처리에서 연산 노이즈(양자화, 유한한 레지스터 길이 효과)
모든 다양한 노이즈 소스들로부터의 누적된 효과는 종종 기저 신호보다 훨씬 큰 결합된 노이즈 크기를 유발한다. 존재하는 목적을 위해, 모든 노이즈 소스들의 누적된 효과는 하나의 등가 노이즈 소스로 고려될 수 있다. 이 등가 노이즈 소스로부터의 노이즈는 추가적인 화이트 가우시안 노이즈(white Gaussian noise(AWGN))로 유형화될 수 있고, 확률 처리는 확률 신호 처리 공학 문헌에 일반적으로 규정된다. 용어 "추가적인" 은 신호를 다중화하는 노이즈 에너지와 달리, 노이즈 에너지가 신호에 부가되는 것을 의미한다. 이름"화이트"는 파워 스펙트럼 밀도가 모든 주파수에서 일정한 사실을 나타낸다. 지정"가우시안"은 노이즈의 확률밀도함수(PDF)가 가우시안 PDF에 ㅡ이하여 매우 근사되는 사실을 나타낸다. 노이즈는 또한 처리되는 신호와 무관한 것으로 가정한다. 이 가정들은 ABR을 포함하여 유발된 전위 신호에 대하여 생의공학(biomedical engineering) 및 의학 문헌에서 일반적이다. 이 키 특징들은 검사 객체로부터 수집된 데이터로 검사되고, 여기서 나타내는 결과는 AWGN 모델을 지지한다.
이 어플리케이션에서 사용되는 생체신호들은 인체내에서 생체반응에 의하여 생성되어, 전기적 신호로 변환되고, 그 후 임상 결정을 하기 위해 의료전문가에 의해 사용되는 임상적으로 유효한 데이터로 도달되도록 처리되는 신호이다. 오늘날 생체신호를 사용하는 대부분의 의료장치들은 디지털이고, 따라서 생체신호들은 대부분 일반적으로 디지털화되고, 이후 디지털로 처리된다. 많은 다른 예들이 존재한다.:
- 심전도(EKG): 심근 수축으로 생성된 전기적 신호
- 뇌파전위기록술(EEG): 전위를 생성하는 뉴런에 의하여 생성된 전기적 신호
- 전기안진검사(electronystamography(ENG)): 전정안반사기능(vestibulo- ocular function)에 의해 생성된 전기적 신호
- 호흡량 측정: 폐에 의해 생성된 공기 흐름 신호
- 혈중 산소 레벨 측정: 혈류의 투명도에 의해 생성된 광학적 신호
바람직한 실시예에서, 음향 자극에 반응하여 뇌간에 의해 생성된 신호는 노이즈 억제 알고리즘에 기초한 새로운 웨이브렛(wavelet)을 사용하여 분석된다. 음향 뇌간 반응은 그것이 약한 생체 신호의 좋은 예이기 때문에 선택된다. 그것은 자극의 개시후에 수 밀리초동안 일어나는 많은 EEG 종류이다. ABR들을 연구함으로써 파생된 주요 결과는 많은 약한, 반복하는 생체 신호에 직접 적용된다.
ABR 기록(recording) 및 처리 분야는 ABR이 의료장치에서 매우 다양한 어플리케이션을 찾을 수 있기 때문에 매우 광범위하다. ABR은 또한 초기 또는 빠른 유발 EEG 반응 뿐만 아니라 뇌간청각 유발전위검사(brainstem auditory evoked potential(BAEP or AEPs)), 뇌간청각유발반응(brainstem auditory evoked responses (BAER)), 뇌간유발반응(brainstem evoked response (BSER))으로 알려져있다. 매우 큰 문헌의 본체는 텍스트북, 핸드북 및 잡지의 형태로 존재하고, 여기서 ABRs의 많은 다른 사용들, 측면들 및 변형이 조사된다. 일반적으로 ABRs는 유아 청력 선별 및 검사하기 어렵거나 비협조적인 환자의 음향 민감성 측정, 8번째 신경의 신경진단 또는 뇌간기능장애 및 신경수술동안 8번째 신경(즉, 음향 신경) 및 뇌간 상태를 감시하는데 사용될 수 있다. 바람직한 실시예는 청력 감지를 위한 ABRs에 집중할 것이다.
단일의 공식적인, 상세한 기준이 ABR 기록을 위해 존재하지 않더라도, 중요한 파라미터들, 학명, 전극 배치 및 자극 유형 및 레벨의 범위, 게인(gain) 및 필터 셋팅(filter setting) 등등은 의료 기기에서 지속적으로 사용되었다. 이 관습은 최근의 공표 및 전미청각학회(AAA), 미국언어병리학회(ASHA) 및 많은 미국 주들의 의료 처리들에 의해 발간된 최근의 가이드라인(guidline)에 널리 따른다.신호 생성 및 처리의 어떤 부분들은 미국표준협회(ANSI) 및 국제전기표준회의(IEC)와 같은 다른 미국 및 국제 기준에서 구체화된다. IEC(국제전기표준회의)의 "Auditory Test Signals of Short Duration or Audiometric and Neuro-otological Purposes," International Standard IEC 645-3, 1판, 제네바, 스위스(1994)와, ANSI(미국표준협회)의 American National Standard Specifications For Audiometer, [ANSI S3- 6-1996], Acoustical Society of America, New York, New York (1996)을 보라. 여기서 참조에 의해 결합되는 "Handbook of Auditory Evoked Responses"에서 홀(Hall)은 ABR 역사 및 현재 상태, 방법들, 및 표준 데이터들의 철저한 처리를 준다. 그는 또한 ABR 기록을 위해 의학적으로 인정된 방법 및 표준 데이터를 통한 해석의 개요를 제시한다. 또한, 하이드(Hyde)는 여기서 참조에 의해 결합되는 그의 1998 페이퍼 "Objective detection and analysis of ABRs : An historical perspective"를 통해 ABR 처리에서 일반적으로 사용되는 신호 처리 방법의 훌륭한 배경을 제공한다. 많은 다른 것들을 따라 이 두가지 작업들은 일반적으로 인정된 의료 관습을 따르고, 상업적으로 이용가능한 ABR 검사 장치의 동작의 기초가 된다. 여기서 나타내는 데이터 수집 및 분석 방법들은 이 두 가지 작업에서 동일한 계수에 기초할 것이다.
첫번째의 청각 관련 신경 기록은 베르그(Berger)에 의해 1929년에, 위버(Weaver) 및 브레이(Bray)에 의해 1930년에 발표되었다. ABR 기록의 역사는 유웨트(Jewett) 및 윌리스턴(Williston)의 1971년 작업에 의해 철저한 설명 및 학명을시초로, 매우 풍부하다. 거기에서부터, 다양한 유형의 자극들, 전극 배치, 전극 유형, 처리 유형 등등에 따라 많은 방향이 있었다. 그러나, 그들은 결국 전체적으로 특정된 것은 아닌 의료 기준이 약간의 변형을 가진 하나로 수렴되었다. ABR은 많은 다른 환자 조건들(약한 상태, 환경, 하루의 시간 등)하에서 불변하고, 환자들을 따라 예측가능한 반응 형태를 가지는 것을 보여준다. 그것은 청력의 식별자이며, 환자 반응없이 객관적으로 측정될 수 있다. 그것의 크기는 마이크로볼트에 속하며, 그것은 일반적으로 밀리볼트에 속하는 크기의 노이즈에 의하여 오염될 수 있다. ABRs는 일반적으로 선형 평균법에 의하여 처리되고, 하나의 귀의 단일 자극 레벨에서의 반응 시험은 노이즈 조건, 전극 위치의 질 및 다른 요인들에 따라 약 5-10분이 걸린다. 그러므로, 양쪽 귀에서의 다중 레벨에서 시험은 기준 의료 세팅에서 한 시간 이상이 걸린다. 유아를 시험하기 위해 한 시간 이상이 걸리는 것은 유아들은 보통 병원에서 짧은 시간동안에만 있기 때문에 보편적인 신생아 청각 선별 검사 프로그램에서 어렵다. 그들이 다양한 다른 조건들에 대해 검사되어야 하는 짧은 시간동안, 그들의 생체 신호들은 지속적으로 모니터된다. 오랜 검사 시간을 가지는 다른 문제는 보통 연당 6,000-10,000명의 출생을 가지는 큰 대도시의 병원에서 발생한다. 평균 그들은 한번에 육아실에서 20명 이상의 유아를 가지고, 유아를 테스트하는 데는 한 시간이 걸리며, 각각의 유아는 헌신적인 직원과 많은 검사장치들을 요구한다. 이 유아 각각이 1시간이 넘는 검사로 선별되는 것을 요구하는 것은 병원측에 매우 크고 받아들이기 어려운 경제적 부담이 될 수 있다. 또한, 유아 건강 선별을 위한 표준 케어(care)는 모든 다른 선별 테스트들이 기껏해야 몇 분 걸린다는 것이다. 따라서, 의미있는 결과를 가지는 빠른 ABR 검사를 가지기 위하여 오랫동안 느껴진 필요가 있다.
의료 및 검사 목적으로 사용되는 전형적인 ABR 진단 시스템이 도 4에 도시된다. 뇌간유발반응은 귀도관(ear canal)에서 매우 짧은 시간의 청각 클릭들을 나타냄으로써 재현된다. ABR 검사 컨트롤러는 사용자 입력에 기초하여 클릭 생성을 시작한다. 클릭들은 디지털로 생성되고, 디지털-아날로그 컨버터(DAC)에 의하여 100ps의 시간동안 아날로그 전압 펄스로 변환된다. 이 아날로그 신호는 귀안에 삽입된 스피커로 공급되고, 음성 클릭들은 수천 번을 나타낸다. 클릭 반복률은 약 30-60 clicks/sec이며, 전체 검사 시간은 전형적으로 약 5-10분이다.
신호는 보통 3개의 피부 전극 셋트를 사용하여 획득된다.: 이마상에 하나, 각각의 귀 뒤에서 유양돌기(mastoid process) 상에 하나. 돌기 전극의 하나는 참조로 사용되는 반면, 이마 전극과 다른 돌기 전극사이의 전위는 약 15,000배로 별도로 증폭된다. 국가에 따라 50 또는 60 Hz에서 작동하는 전원 라인들은 ABR 기록에서 큰 전기적 간섭 신호를 생성한다. 이 간섭의 영향을 감소시키기 위해, 차분 앰프의 공통모드출력은 변환되고, 참고 전극으로 피드백된다. 이것은 EEG, ECG 및 ABR 장치에서 일상적으로 사용되는 공통모드능동접지회로를 생성한다. ADC는 3 kHz의 차단 주파수를 가진 안티-알리어스(anti-aliasing)로우 패스(LP)필터를 포함한다. 디지털 신호는 그 후, 사용자 선택가능한 필터 세팅을 가진 디지털 선형 위상 BP 필터에 의하여 필터링된다. 가장 일반적으로 사용되는 기준을 저주파수 차단을 위해 약 30-100 Hz이고, 고주파수 차단을 위해서는 1,500-3,000Hz이다.
데이터 취득의 시작은 ABR 검사 컨트롤러에 의해 클릭의 시작으로 동기화되고, 각각의 클릭 후에 약 15 ms의 주기동안 지속된다. 측정된 반응의 15 ms를 포함하는 데이터의 단일 프레임은 특정한 클릭에 반응한다. 수천개의 획득된 신호 프레임들은 그 후, ABR 반응의 완만한 평가를 얻기 위해 선형적으로 평균화된다. 최종 평균 프레임에서의 각 지점은 데이터의 N프레임들 각각을 가로질러 선형적으로 평균화된다. SNR은 신호 변화 및 노이즈 변화의 비율로 계산된다. 평균화는 SNR이 프리셋(preset)양을 초과할 때까지 지속되고, 시스템은 유효한 ABR 반응이 존재하는지를 결정한다. 유효한 ABR 파형이 얻어지면, ABR 해석에 숙련된 인간 전문가(일반적으로는 주-인증 청력학자(audiologist))는 피크(peak)가 어디인지, 그들의 지연속도(latency)가 무엇인지를 결정하고, 그 후 인터-피크 지연속도(inter-peak latency)를 계산한다. 그들은 그 후 그 결과가 건강한 대상을 위한 표준 데이터의 범위에 있는지를 결정한다. 만약, 결과가 표준 범위에 있지 않다면, 병리(pathology)는 존재하는 것으로 나타내어진다.
지난 10년동안, 신호 스포세싱에 기초한 웨이브렛은 신호 처리계에서 새로운 연구 영역으로 나타났다. 웨이브렛 어플리케이션의 대부분의 일반적인 분야는 노이즈 억제(일반적으로 웨이브렛 문헌에서 "디-노이즈(de-noising)"로 나타내는), 데이터 압축, 디지털 통신, 시스템 인식 및 추가되는 다른 것들 안에 있다.
웨이브렛 변환, 많은 푸리에 변환 집합은 웨이브렛이라 불리우는 직교 정규기저 함수의 셋트로 주어진 신호를 분해하는 처리가다. 본 발명은 유한한 길이의, 이산 신호를 이용하여, 이산신호 변환만이 논의될 것이다.
신호 처리 분야에서 주로 말해지는 전통적인 이산 푸리에 변환(DFT)에서, 신호는 기저 함수들로서 복잡한 사인파 함수를 사용하여 분해되고, 신호의 주파수 영역 표시를 생성한다. 이에 반해, 이산 웨이브렛 변환(DWT)은 기저 함수로서 웨이브렛(작은 파)으로 불리우는 특별하게 지정된 함수들의 집합을 사용한다. 웨이브렛 집합은 "모 웨이브렛"이라 불리우는 최초 웨이브렛 함수를 팽창(또는 "스트레칭")시킴으로써 형성된다. 웨이브렛 변환은 모 웨이브렛의 다른 팽창을 사용하여 시간 및 주파수 모두에서 신호를 분해한다. DWT의 어플리케이션으로, 1차원의 유한한 신호 x[n]은 2차원의 "웨이브렛 좌표"로 나타내어진다. 각 레벨의 신호 분해는 형성되고 스케일이라고 부른다. 각각의 스케일에서, 계수들의 셋트는 모 웨이브렛의 스케일된 버젼을 가지는 최초의 신호 x[n]의 내부 생성물을 계산하기 위해 생성된다. 모 웨이브렛 함수는 Ψ로 지정되고, 그것의 팽창은 Ψ(j)로 지정된다. 스케일 j에서 웨이브렛 함수의 위치 인덱스는 이동(translation)이라 부른다. 웨이브렛의 값은 2차원의 시퀀스 Ψ(j,k)에 의해 설명되고, 여기서 j는 웨이브렛의 스케일(또는 스테리체 레벨)인덱스이고, k는 이동(또는 위치)인덱스이다. 우리는 이후, DWT를 다음과 같이 정의한다.
계수들 C(j, k)는 원형 신호 x[n]에서 웨이브렛 Ψ(j, k)의 내적의 다른 스케일들 j과 이동 k의 웨이브렛 계수들이다. 웨이브렛 좌표들에서, 신호 에너지의 주파수 및 위치(시간)에 관한 정보가 보존된다. 복소 함수를 이용한 전통의 푸리에 변환에서 시간 정보는 사라진다.
종래의 웨이브렛 디노이징은 하위 신호 및 그와 혼합된 노이즈 둘 다의 평탄화 및 간섭 특성에 관한 가정을 이용하는 노이즈 억제 처리이다. 주파수 영역에서의 필터링과 비슷하게, 웨이브렛 계수 문턱치 알고리즘("웨이브렛 수축")은 웨이브렛 영역에서의 웨이브렛 계수들의 셋트들을 감소시킨다. 이 처리는 하위 신호가 평탄화되고 간섭되는 반면, 그 신호와 혼합된 노이즈는 난잡하고 조화가 없다는 가정을 기초로 한다. 신호의 평탄화는 그 폭과 관련된 특성이고, 신호를 여러번 미분할 수 있는 것과 관련되어 정의된다. 평탄화의 정도는 계산될 수 있는 다수의 연속적인 미분계수들과 동일하다.
신호는 그 에너지가 시간 및 주파수 영역 양쪽에서 집중되는지와 연관된다. 조화없는 노이즈는 "분출"되고, 집중되지 않는다. 간섭성의 한 측정은 얼마나 많은 웨이브렛 계수들이 신호 에너지의 99%를 나타낼 수 있는 지이다. 시간-주파수 신호 공간은 완전하게 모든 스케일들과 이동들에서 웨이브렛 계수들에 의해 미쳐진다(덮여진다). 반면에, 완전한 조화없는 노이즈는 전체 공간을 그 에너지의 99%를 나타내도록 미치는 계수들의 99%를 요구할 수 있다.
종래의 웨이브렛 디노이징 처리는 3단계의 처리이다:
1. 신호를 다른 스케일들에서 웨이브렛 계수들을 얻을 수 있도록 웨이브렛 변환
2. 계수들을 문턱치하고 문턱치 δ보다 작은 0으로 설정
3. 역 웨이브렛 변환을 원형 신호를 근사하도록 수행
디노이징 처리에서, 신호의 노이즈 요소들이 선택적으로 웨이브렛 계수들을 0으로 설정함에 의해 감소된다. 디노이징은 비선형 연산이고, 다른 계수들이 문턱치 함수에 의해 다르게 영향을 미친다. 이 알고리즘에서 제어하는 많은 파라미터들이 있다: 웨이브렛 분해의 레벨, 다른 웨이브렛 분해 레벨들에서 다른 문턱치들을 이용하는 문턱치 선택, 고정된 양에 의해 유지된 웨이브렛 계수들의 스케일링 등. 그러나, 이 모든 변형들에 공통점은 종래의 기술에서 단일 신호 프레임상에서 수행되는 처리이다.
종래의 디노이징에서 만들어진 가정들 중 하나는 디노이즈되어진 신호의 SNR이 비교적 높다는 것이다. 알고리즘은 신호의 진폭이 실질적으로 노이즈의 진폭보다 크다는 사실에 관련되고, 따라서 노이즈에서보다 신호에서 보다 큰 웨이브렛 계수들이 생성된다. 따라서, 작은 SNR 신호들에서 종래의 디노이징의 응용은 종래 기술에 의해 알려진 것에 의하면 실패한다.
종래의 디노이징은 노이즈에 의해 오류를 일으키는 신호의 빠른 추정자에 의해 정의되었다. 단일 웨이브렛 변환을 수행함에 의해, 신호의 단일 프레임상에서 동작하고 선택된 계수들을 0으로 설정하고, 그 후 역 웨이브렛 변환을 수행한다. 여기서 종래의 디노이징을 ABR 신호들에서 응용하는 2가지 방법을 제안하고, 데이터의 단일 프레임이 알고리즘에의 입력으로써 요구되도록 주어진다. 한 방법은 독립적으로 각 프레임을 디노이즈하는 것이고, 그 후 결과들을 평균한다. 종래의 디노이징이 단일의, 평균되지 않은 프레임에 이용되는 경우, 웨이브렛 계수들 |C(j,k)|<δ을 0으로 문턱치하는 것은 신호를 나타내는 것들을 포함하여, 모든 웨이브렛 계수들 대부분을 측정한다. 이 접근법은 대부분의 신호 에너지가 웨이브렛 계수를 0으로 설정함에 의해 사라지기 때문에, 완전히 실패한다. 디노이즈된 단일의 프레임 웨이브렛 계수들의 역 웨이브렛 변환은 매우 낮은 진폭, 노이즈만 가진 신호를 생산한다.
종래의 디노이징에 사용되는 두번째 방법은 단일의 평균된 프레임을 생성하기 위해 독립적인 ABR 프레임들을 먼저 평균하고, 그 후 그 단일의 평균된 프레임을 디노이즈한다. 이 접근법은 또한 매우 많은 수의 프레임들이 미리-평균될 때까지, 수행에서 실질적인 감소가 따라오게 된다. 따라서 종래의 디노이징은 선형 평균과 비교하는 경우 ABR 신호들을 디노이징하는 데에 사용되지 않는다.
본 발명은 모든 독립적인 N 프레임들로부터 정보를 이용하고 수행이 선형 평균 처리의 그것을 초과하는 추정량을 생산하는 디지털 처리기에서 알맞게 수행될 수 있는 새로운 알고리즘을 나타낸다. 새로운 알고리즘은 트리와 같은 형태로 원래의 낮은 SNR 데이터 프레임들을 재결합하고, K>>1일때, 크기 N*K의 새로운 프레임들의 어레이를 생성한다. 원형 데이터의 2개의 인접한 프레임들이 선형적으로 평균되고 디노이즈되고, 따라서 원래의 2개의 인접한 프레임들의 선형 결합이 아닌 새로운 프레임이 생성된다. 새로은 레벨의 프레임들이 생성되고 그 레벨에서의 각각의 새로운 프레임이 작은 문턱치값에서 평균되고 디노이즈된다. 이것이 도 5에서 설명된다.
새로운 프레임들의 어레이를 구성하는 처리가 반복된다. 새로운 방법은 첫번째로 각각의 N개의 원 ABR 데이터 프레임들에서 작은 문턱치 δk로 디노이징을 하고 그 후 새로운 단일-프레임 서브-평균들을 얻기 위해 프레임들을 재결합시킨다. 디노이징은 새로운 프레임들의 각각들에서 다른 문턱치 δk+1로 다시 행한다. 마지막 레벨의 프레임 K가 얻어지면, 이 레벨에서의 프레임들은 단일 디노이즈된 프레임을 생성하기 위해 선형으로 평균된다. 프레임 재결합의 바람직한 연산은 K=log2(N) 레벨들을 가지고, 바람직하게 각 레벨에서 다른 웨이브렛 계수 문턱치 δk가 레벨 k의 함수로 사용된다. 넓은 영역에서 신규의 알고리즘은 3가지의 주된 특징을 가진다:
1. N개의 원형 데이터 프레임들의 각 개개의 프레임은 신호를 측정하게 된다,
2. 디노이징이 계단 형태로 수행되고, 바람직하게는 다른 문턱치 레벨들을 사용한다,
3. K*N의 새로운 프레임들의 데이터는 바람직하게 원래의 N개의 프레임들로부터 생성된다.
이 알고리즘의 응용은 단지 작은 갯수의 ABR 프레임들이 얻어진 후에 파형이 인체 전문가에 의해 해석되어질 수 있는 평균된 신호의 질을 증가시킨다. 신규한 알고리즘은 선형 평균과 비교될 수 있다. 수행은 모의 실험된 데이터 및 인체 둘 다를 사용하여 선형 평균에 상반되어 테스트될 수 있고, 신규한 알고리즘이 하위의 낮은 SNR 신호의 주된 특징들의 보다 빠른 측정을 생산하도록 정의된다.
본 발명의 몇가지 이점들과 특징들이 상술되었지만, 완전한 설명은 도면들과 아래의 바람직한 실시예의 상세한 설명에 의해 가능하다.

Claims (22)

  1. 입력신호를 디노이징하기 위한 신호 프로세서로서,
    상기 신호 프로세서는 상기 입력신호를 복수 요소의 프레임들로서 저장하기 위한 메모리와 프로세서를 포함하고,
    상기 프로세서는:
    (a) 상기 각각의 요소 프레임들 상에서 비선형 디노이징 연산을 독립적으로 실행하고;
    (b) 결과로서 생기는 결합 디노이즈된 프레임을 형성하기 위해 결과로서 생기는 디노이즈된 프레임을 결합하도록 구성되는, 신호 프로세서.
  2. 제 1 항에 있어서,
    상기 프로세서는, 결과로서 생기는 결합 디노이즈된 입력신호로 최종적으로 결합되기 이전에, 복수회 동안 개개의 프레임을 반복적으로 디노이즈하도록 더 구성되는, 신호 프로세서.
  3. 제 2 항에 있어서,
    상기 프로세서는, 각각의 반복 이전에 복수의 프레임들을 결합하도록 구성되는, 신호 프로세서.
  4. 제 2 항에 있어서,
    상기 프로세서는, 각각의 디노이징의 반복동안 상이한 문턱치를 사용하도록 더 구성되는, 신호 프로세서.
  5. 제 1 항에 있어서,
    상기 프로세서는, 상기 요소 프레임들을 다시 디노이징하기 전에 상기 요소 프레임들을 리오더(reorder)하도록 더 구성되고, 모든 디노이즈된 프레임들은 결과 로서 생기는 디노이즈된 입력신호에 도달하도록 결합되는, 신호 프로세서.
  6. 제 1 항에 있어서,
    상기 입력신호는, 어레이 A1 또는 2N 개 프레임들로 구성되고, 상기 프로세서는 N-1회에 이르는 디노이징 반복들을 실행하도록 더 구성되는, 신호 프로세서.
  7. 입력신호를 디노이징하기 위한 신호 프로세서로서,
    상기 신호 프로세서는 상기 입력신호들을 복수 요소의 프레임들로서 저장하기 위한 메모리와 프로세서를 포함하고,
    상기 프로세서는:
    (a) 상기 각각의 요소 프레임들 상에서 비선형 디노이징 연산을 독립적으로 실행하고;
    (b) 상기 요소 프레임들을 리오더하고, 상기 각 요소 프레임들 상에서 비선형 디노이징 연산을 실행하고;
    (c) 결과로서 생기는 결합 디노이즈된 입력신호를 형성하기 위해, 결과로서 생기는 디노이즈된 프레임들을 결합하도록 구성된, 신호 프로세서.
  8. 제 7 항에 있어서,
    상기 프로세서는, 결과로서 생기는 결합 디노이즈된 입력신호로 최종적으로 결합되기 이전에, 각 디노이징 연산의 일부로서 복수회 동안 개개의 프레임들을 반복적으로 디노이즈하도록 더 구성되는, 신호 프로세서.
  9. 제 8 항에 있어서,
    상기 프로세서는, 각각의 반복 이전에 복수의 프레임들을 결합하도록 구성되는, 신호 프로세서.
  10. 제 8 항에 있어서,
    상기 프로세서는, 각각의 디노이징의 반복동안 상이한 문턱치를 사용하도록 더 구성되는, 신호 프로세서.
  11. 제 7 항에 있어서,
    상기 입력신호는, 어레이 A1 또는 2N 개 프레임들로 구성되고, 상기 프로세서는 N-1회에 이르는 디노이징 반복들을 실행하도록 더 구성되는, 신호 프로세서.
  12. 신호 프로세서로 입력신호를 디노이징하기 위한 방법으로서,
    상기 신호 프로세서는 상기 입력신호를 복수 요소의 프레임들로서 저장하기 위한 메모리를 포함하고,
    상기 방법은:
    (a) 상기 각각의 요소 프레임들 상에서 비선형 디노이징 연산을 독립적으로 실행하는 단계와;
    (b) 결과로서 생기는 결합 디노이즈된 입력신호를 형성하기 위해 결과로서 생기는 디노이즈된 프레임들을 결합하는 단계를 포함하는, 디노이징 방법.
  13. 제 12 항에 있어서,
    상기 디노이징 단계는, 결과로서 생기는 결합 디노이즈된 입력신호로 최종적으로 결합되기 이전에, 복수회 동안 개개의 프레임들을 반복적으로 디노이징하는 단계를 더 포함하는, 디노이징 방법.
  14. 제 13 항에 있어서,
    상기 디노이징 단계는, 각각의 반복 이전에 복수의 프레임들을 결합하는 단계를 포함하는, 디노이징 방법.
  15. 제 13 항에 있어서,
    상기 디노이징 단계는, 각각의 디노이징의 반복동안 상이한 문턱치를 사용하는 단계를 포함하는, 디노이징 방법.
  16. 제 12 항에 있어서,
    상기 요소 프레임들을 다시 디노이징하기 전에 상기 요소 프레임들을 리오더하고, 결과로서 생기는 결합 디노이즈된 입력신호에 도달하기 위해 모든 디노이즈된 프레임들을 결합하는 단계를 더 포함하는, 디노이징 방법.
  17. 제 12 항에 있어서,
    상기 입력신호는 어레이 A1 또는 2N 개 프레임들로 구성되고, 상기 디노이징 단계는 N-1회에 이르는 디노이징 반복들을 실행하는 단계를 포함하는, 디노이징 방법.
  18. 신호 프로세서를 사용하여 입력신호를 디노이징하기 위한 방법으로서,
    상기 신호 프로세서는 상기 입력신호를 복수 요소의 프레임들로서 저장하기 위한 메모리를 포함하고,
    상기 방법은:
    (a) 상기 각각의 요소 프레임들 상에서 비선형 디노이징 연산을 독립적으로 실행하는 단계와;
    (b) 상기 요소 프레임들을 리오더하고, 상기 각각의 요소 프레임들 상에서 비선형 디노이징 연산을 실행하는 단계와;
    (c) 결과로서 생기는 결합 디노이즈된 입력신호를 형성하기 위해, 결과로서 생기는 디노이즈된 프레임들을 결합하는 단계를 포함하는, 디노이징 방법.
  19. 제 18 항에 있어서,
    상기 디노이징 단계는, 결과로서 생기는 결합 디노이즈된 입력신호로 최종적으로 결합하기 이전에, 각 디노이징 연산의 일부로서 복수회 동안 개개의 프레임들을 반복적으로 디노이징하는 단계를 더 포함하는, 디노이징 방법.
  20. 제 19 항에 있어서,
    각각의 반복 이전에 복수의 프레임들을 결합하는 단계를 포함하는, 디노이징 방법.
  21. 제 19 항에 있어서,
    각각의 디노이징의 반복동안 상이한 문턱치를 사용하는 단계를 포함하는, 디노이징 방법.
  22. 제 18 항에 있어서,
    상기 입력신호는 어레이 A1 또는 2N 개 프레임들로 구성되고, 상기 디노이징 단계는 N-1회에 이르는 디노이징 반복들을 실행하는 단계를 포함하는, 디노이징 방법.
KR10-2004-7015544A 2002-03-29 2003-03-28 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가 KR20050016327A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2004-7015544A KR20050016327A (ko) 2002-03-29 2003-03-28 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/113,425 2002-03-29
KR10-2004-7015544A KR20050016327A (ko) 2002-03-29 2003-03-28 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가

Publications (1)

Publication Number Publication Date
KR20050016327A true KR20050016327A (ko) 2005-02-21

Family

ID=41783315

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7015544A KR20050016327A (ko) 2002-03-29 2003-03-28 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가

Country Status (1)

Country Link
KR (1) KR20050016327A (ko)

Similar Documents

Publication Publication Date Title
US7333619B2 (en) Fast wavelet estimation of weak bio-signals using novel algorithms for generating multiple additional data frames
US7054453B2 (en) Fast estimation of weak bio-signals using novel algorithms for generating multiple additional data frames
JP2005521542A5 (ko)
Tichko et al. Frequency-dependent fine structure in the frequency-following response: The byproduct of multiple generators
US8177726B2 (en) Rapid screening, threshold, and diagnostic tests for evaluation of hearing
Luke et al. Analysis methods for measuring passive auditory fNIRS responses generated by a block-design paradigm
Tognola et al. Time-frequency distributions of click-evoked otoacoustic emissions
Shukla et al. Wavelet based empirical approach to mitigate the effect of motion artifacts from EEG signal
US5891050A (en) Method and device for determining and monitoring the degree of narcosis in humans
Rupp et al. The representation of peripheral neural activity in the middle-latency evoked field of primary auditory cortex in humans
Causevic et al. Fast wavelet estimation of weak biosignals
Zheng et al. Synthesis and decomposition of transient-evoked otoacoustic emissions based on an active auditory model
John et al. Introduction to technical principles of auditory steady-state response testing
Jedrzejczak et al. Use of the matching pursuit algorithm with a dictionary of asymmetric waveforms in the analysis of transient evoked otoacoustic emissions
Janusauskas et al. Detection of transient-evoked otoacoustic emissions and the design of time windows
KR20050016327A (ko) 다중 부가 데이타 프레임을 생성하기 위해 새로운알고리즘을 이용한 미약한 생체-신호의 고속 평가
Silva et al. Objective estimation of loudness growth in hearing-impaired listeners
Marchesi et al. A bispectral approach to analyze nonlinear cochlear active mechanisms in transient evoked otoacoustic emissions
Causevic Fast wavelet estimation of weak biosignals
Lasky et al. Nonlinear functional modeling of scalp recorded auditory evoked responses to maximum length sequences
Kose et al. Principal and independent component-based analysis to enhance adaptive noise canceller for electrocardiogram signals
Wu et al. Comparison of different auto-detection methods for Wave V with wireless Automated Auditory Brainstem Response (AABR) measurement system
Adlercreutz Brainstem response estimation using continuous sound
Sudirman et al. Modeling of EEG signal sound frequency characteristic using time frequency analysis
Alwan Implementation of Wavelet-Kalman Filtering Technique for Auditory Brainstem Response

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application