TW201642252A - 訊號處理裝置、訊號處理方法以及訊號處理程式 - Google Patents
訊號處理裝置、訊號處理方法以及訊號處理程式 Download PDFInfo
- Publication number
- TW201642252A TW201642252A TW105125568A TW105125568A TW201642252A TW 201642252 A TW201642252 A TW 201642252A TW 105125568 A TW105125568 A TW 105125568A TW 105125568 A TW105125568 A TW 105125568A TW 201642252 A TW201642252 A TW 201642252A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- phase
- amplitude
- unit
- frequency
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 162
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000008859 change Effects 0.000 claims abstract description 561
- 230000001629 suppression Effects 0.000 claims description 287
- 238000004364 calculation method Methods 0.000 claims description 274
- 238000006243 chemical reaction Methods 0.000 claims description 233
- 238000001514 detection method Methods 0.000 claims description 87
- 238000001228 spectrum Methods 0.000 description 355
- 239000013598 vector Substances 0.000 description 161
- 238000000034 method Methods 0.000 description 158
- 230000006866 deterioration Effects 0.000 description 116
- 238000012937 correction Methods 0.000 description 73
- 238000010586 diagram Methods 0.000 description 69
- 230000006870 function Effects 0.000 description 53
- 230000008569 process Effects 0.000 description 40
- 239000000203 mixture Substances 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 18
- 230000035939 shock Effects 0.000 description 17
- 230000003595 spectral effect Effects 0.000 description 16
- 230000002194 synthesizing effect Effects 0.000 description 15
- 230000007704 transition Effects 0.000 description 13
- 238000006073 displacement reaction Methods 0.000 description 10
- 230000010354 integration Effects 0.000 description 10
- 238000012886 linear function Methods 0.000 description 9
- 230000009191 jumping Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 description 4
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
- A61B5/024—Detecting, measuring or recording pulse rate or heart rate
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7203—Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Physiology (AREA)
- Veterinary Medicine (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Cardiology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
提供用以有效檢測輸入信號的驟變之信號處理裝置。此信號處理裝置包括轉換裝置,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號。又,此信號處理裝置包括計算裝置,計算轉換裝置導出的相位成分信號及振幅成分信號的特徵值。又,此信號處理裝置,包括判斷裝置,根據計算裝置計算的特徵值,判斷關於輸入信號驟變的存在可能性。
Description
本發明係關於檢測信號變化的技術。
上述技術領域中,專利文件1揭示評估相位成分在時間方向的連續性,並平滑化每頻率的振幅成分的技術(段落0135~0138)。專利文件2中,記載經由測量相位的時間方向變動量,檢測頻率驟變。專利文件3在段落0024中,記載「隨著重疊脈衝性雜音,經常監視複數平面上I、Q信號的複數向量的相位變化,藉此確實檢測強電場環境下的脈衝性雜音」。此相位變化,係沿著時間軸。又,專利文件4的段落0031中,記載「相位直線化部25,經由直線化,修正從極座標轉換部24輸入的相位信號θ的上揚,並輸出其結果相位信號θ’至相位檢測部26」。又,專利文件4的段落0051中,記載關於相位傾斜檢測裝置,段落0040中,記載「第5圖中,顯示相位檢測部26的輸出入信號(輸入信號的相位θ’、輸出信號的相位傾斜dθ’)的一範例」。專利文件4的段落0031中,記載「相位直線化部25,經由直線化,修正從極座標轉換部24輸入的相位信號θ的上揚,並輸出其結果相位信號θ’至相位檢測部26」。專利文件5中,揭示使用振幅的衝擊音的檢測技術。
[專利文件1]專利第2010-237703號公開公報
[專利文件2]專利第2011-254122號公開公報
[專利文件3]專利第2007-251908號公開公報
[專利文件4]專利第2011-199808號公開公報
[專利文件5]聯合國專利第2008/111462號(WO2008/111462)
[非專利文件1]M. Kato、A. Sugiyama及M. Serizawa,”Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA(根據加權雜音評估和MMSE STSA,具有高語音品質的抑制雜音), “IEICE Trans. Fundamentals(IEICE Trans. 基本原理)(日本版), 第J87-A卷, 第7號,第851-860頁,2004年7月。
[非專利文件2]R. Martin, “Spectral subtraction based on minimum statistics(根據最小統計的頻譜減法), ”EUSPICO-94,第1182-1185頁,1994年9月。
[非專利文件3]「用於數位記錄媒體的動畫信號及附帶的音響信號的1.5百萬位元/秒符號化-第3部 音響」,日本工業規格 JIS X 4323,第99頁,1996年11月。
[非專利文件4]A. D. Cheveigne和H. Kawahara, “YIN, 用於語音和音樂的基礎頻率評估器” J. Acoustic Soc.
Amer.,(美國音響協會期刊)第111卷,第4號,第1917-1930頁。
[非專利文件5]J. L. Flanagan等,”語音編碼(Speech Coding)”, IEEE Transactions on Communications(IEEE通訊會報), 第27卷,第4號,1979年4月。
[非專利文件6]A. Subramanya等,”從語音信號自動移除擊鍵”,”IEEE Signal Processing Letters(IEEE信號處理學), 第14卷,第5號,第363-366頁,2007年5月”。
[非專利文件7]J. Murphy等,”Joint Baysian removal of impulse and background noise(衝量和背景雜音的連接貝氏移除)”IEEE Proceedings of ICASSP, 第261-264頁,2011年5月。
[非專利文件8]R. Talmon等,”使用非局部擴散濾波器的瞬間雜音降低”,IEEE Transactions on Audio(IEEE音頻,語音和語言處理會報), 第19卷,第6號,第1584-1599頁,2011年6月。
不過,上述的先行技術文件中記載的技術中,專利文件1及4,並非檢測輸入信號驟變的技術。又,專利文件2要檢測「頻率」的驟變,專利文件3要利用AM(調幅)信號的相位時間變化檢測脈衝性雜音。專利文件5係只使用振幅的衝擊音之檢測技術,穩健性不足。即,這些文件中記載的技術,不能有效檢測信號的驟變。
本發明的目的,係提供解決上述課題的技術。
為了達成上述目的,根據本發明的裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;計算裝置,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷裝置,根據上述計算裝置計算的上述特徵值,判斷關於上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的其他裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;第1算出裝置,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出裝置,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷裝置,根據上述第1相位傾斜及上述第2相位傾斜,判斷關於上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的又其他裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;產生裝置,上述輸入信號中除去上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷裝置,根據上述低相關信號及上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
一種信號裝置,為了達成上述目的,根據本發明的又其他裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;直線性計算裝置,計算頻率區域中上述相位成分信號的直線性;以及判斷裝置,根據上述直線性計算裝置計算的上述信號直線性,計算上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的方法,包括以下步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;計算步驟,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷步驟,根據計算的上述特徵值,判斷關於上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的其他方法,包括以下步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;第1算出步驟,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜及上述第2相位傾斜,判斷上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的又其他方法,包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;產生步驟,上述輸入信號中除去上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷步驟,根據上述低相關信號及上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
為了達成上述目的,根據本發明的又其他方法,包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;直線性計算步驟,計算頻率區域中上述相位成分信號的直線性;以及可能性計算步驟,根據計算的上述直線性,計算上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的程式,由電腦執行各步驟,包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;計算步驟,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷步驟,根據計算的上述特徵值,判斷關於上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的其他程式,由電腦執行各步驟,包括:
轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;第1算出步驟,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜及上述第2相位傾斜,判斷上述輸入信號驟變的存在可能性。
為了達成上述目的,根據本發明的又其他程式,由電腦執行各步驟,包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;產生步驟,上述輸入信號中除去報上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷步驟,根據上述低相關信號及上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
為了達成上述目的,根據本發明的又其他程式,由電腦執行各步驟,包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;直線性計算步驟,計算頻率區域中上述相位成分信號的直線性;以及可能性計算步驟,根據計算的上述直線性,計算上述輸入信號驟變的存在可能性。
根據本發明,可以有效檢測信號的驟變。
3‧‧‧框架
24‧‧‧極座標轉換部
25‧‧‧相位直線化部
30‧‧‧框架分割部
100‧‧‧信號處理裝置
101‧‧‧轉換部
102‧‧‧計算部
103‧‧‧信號驟變判斷部
110‧‧‧輸入信號
120‧‧‧相位成分信號
130‧‧‧振幅成分信號
200‧‧‧雜音抑制裝置
201‧‧‧轉換部
202‧‧‧相位控制部
203‧‧‧振幅控制部
204‧‧‧逆轉換部
205‧‧‧雜音抑制部
206‧‧‧輸入端子
207‧‧‧輸出端子
208‧‧‧計算部
209‧‧‧驟變判斷部
210‧‧‧記憶輸入信號
220‧‧‧相位頻譜(相位成分)
230‧‧‧振幅頻譜
240‧‧‧強調信號相位頻譜
250‧‧‧補正振幅頻譜
250‧‧‧強調信號振幅頻譜
260‧‧‧強調語音信號
301‧‧‧框架分割部(轉換部)
302‧‧‧開視窗處理部(相位控制部)
303‧‧‧傅立葉轉換部(振幅控制部)
304‧‧‧逆轉換部
305‧‧‧雜音抑制部
309‧‧‧驟變判斷部
310‧‧‧輸入信號
312‧‧‧相關除去部
320‧‧‧相位成分信號
330‧‧‧振幅成分信號
360‧‧‧強調信號
381、382‧‧‧算出部
401‧‧‧逆傅立葉轉換部
402‧‧‧開視窗處理部
403‧‧‧框架合成部
501‧‧‧相位旋轉部
502‧‧‧旋轉量產生部
503‧‧‧補正量算出部
504‧‧‧振幅補正部
1201‧‧‧變化量算出部
1202‧‧‧平坦度算出部
1203‧‧‧振幅平坦度算出部
1210‧‧‧相位變化量
1220‧‧‧平坦度
1225‧‧‧振幅平坦部
1230‧‧‧判斷結果
1301‧‧‧圖形
1302‧‧‧圖形
1303‧‧‧頻率
1410‧‧‧處理器
1420‧‧‧ROM(唯讀記憶體)
1440‧‧‧RAM(隨機存取記憶體)
1450‧‧‧儲存器
1451‧‧‧雜音抑制程式
1460‧‧‧輸出入界面
1461‧‧‧操作部
1462‧‧‧輸入部
1463‧‧‧輸出部
1464‧‧‧攝影機
1600‧‧‧雜音抑制裝置
1601‧‧‧轉換部
1608‧‧‧計算部
1609‧‧‧驟變判斷部
1650‧‧‧複數信號
1701‧‧‧變化量算出部
1800‧‧‧雜音抑制裝置
1808‧‧‧計算部
1809‧‧‧驟變判斷部
1810‧‧‧單位向量
1820‧‧‧第1旋轉向量
1830‧‧‧第2旋轉向量
1840‧‧‧判斷結果
1881‧‧‧單位向量產生部
1882、1883‧‧‧旋轉向量轉換部(旋轉向量產生部)
2000‧‧‧車輛
2001‧‧‧麥克風
2002‧‧‧影像記錄部
2100‧‧‧心電計
2101‧‧‧警報部
2200‧‧‧信號處理裝置
2201‧‧‧轉換部
2202‧‧‧第1算出部
2203‧‧‧第2算出部
2204‧‧‧信號驟變判斷部
2210‧‧‧輸入信號
2220‧‧‧相位成分信號
2230‧‧‧振幅成分信號
2250‧‧‧相位傾斜
2260‧‧‧傾斜
2300‧‧‧雜音抑制裝置
2301‧‧‧轉換部
2302‧‧‧相位控制部
2303‧‧‧振幅控制部
2304‧‧‧逆轉換部
2305‧‧‧雜音抑制部
2306‧‧‧輸入端子
2307‧‧‧輸出端子
2309‧‧‧驟變判斷部
2320‧‧‧相位頻譜(相位成分)
2330‧‧‧振幅頻譜(振幅成分)
2340‧‧‧強調信號相位頻譜
2350‧‧‧補正振幅頻譜
2350‧‧‧強調信號振幅頻譜
2360‧‧‧強調語音信號
2370‧‧‧時間區域信號
2381‧‧‧算出部
2382‧‧‧算出部
2401‧‧‧框架分割部
2402‧‧‧開視窗處理部(windowing unit)
2403‧‧‧傅立葉轉換部
2501‧‧‧逆傅立葉轉換部
2502‧‧‧開視窗處理部
2503‧‧‧框架合成部
2601‧‧‧相位旋轉部
2602‧‧‧旋轉量產生部
2603‧‧‧補正量算出部
2604‧‧‧振幅補正部
2701‧‧‧驟增部檢測部
2702‧‧‧延遲時間算出部
2703‧‧‧相位轉換部
2704‧‧‧傾斜算出部
2705‧‧‧傾斜算出部
2706‧‧‧平行度算出部
2707‧‧‧驟變判斷部
2710‧‧‧振幅最大值時機(最大值)
2720‧‧‧延遲時間(延遲時間n0)
2730‧‧‧相位信號
2740、2750‧‧‧相位傾斜
2740‧‧‧傾斜
2750‧‧‧傾斜
2801‧‧‧相位成分信號
2802‧‧‧圖形
2803‧‧‧直線
2840‧‧‧範圍
2910‧‧‧處理器
2920‧‧‧ROM(唯讀記憶體)
2940‧‧‧RAM(隨機存取記憶體)
2950‧‧‧儲存器
2951‧‧‧雜音抑制程式
2960‧‧‧輸出入界面
2961‧‧‧操作部
2962‧‧‧輸入部
2963‧‧‧輸出部
2964‧‧‧攝影機
3101‧‧‧轉換部
3200‧‧‧雜音抑制裝置
3201‧‧‧振幅平坦度算出部
3203‧‧‧振幅平坦度算出部
3209‧‧‧驟變判斷部
3300‧‧‧車輛
3301‧‧‧麥克風
3302‧‧‧影像記錄部
3400‧‧‧心電計
3401‧‧‧警報部
3500‧‧‧信號處理裝置
3501‧‧‧轉換部
3502‧‧‧相關除去部
3504‧‧‧信號驟變檢測部
3510‧‧‧輸入信號
3520‧‧‧相位成分信號
3530‧‧‧振幅成分信號
3550‧‧‧低相關信號
3600‧‧‧信號處理裝置
3601‧‧‧轉換部
3602‧‧‧相關除去部
3603‧‧‧第1算出部
3605‧‧‧第2算出部
3609‧‧‧信號驟變判斷部
3610‧‧‧輸入信號
3620‧‧‧相位成分信號
3630‧‧‧振幅成分信號
3640‧‧‧低相關信號
3650‧‧‧相位傾斜
3660‧‧‧傾斜
3700‧‧‧雜音抑制裝置
3701‧‧‧轉換部
3702‧‧‧相位控制部
3703‧‧‧振幅控制部
3704‧‧‧逆轉換部
3705‧‧‧雜音抑制部
3706‧‧‧輸入端子
3709‧‧‧驟變判斷部
3710‧‧‧惡化信號樣品(惡化信號)
3712‧‧‧相關除去部
3720‧‧‧相位頻譜(相位成分)
3730‧‧‧振幅頻譜(振幅成分)
3760‧‧‧強調信號
3770‧‧‧低相關信號
3781‧‧‧算出部
3782‧‧‧算出部
3783‧‧‧預測部
3784‧‧‧減算器
3785‧‧‧框架分割部
3786‧‧‧預測信號
3787‧‧‧低相關信號
3793‧‧‧預測部
3794‧‧‧減算器
3795‧‧‧框架分割部
3796‧‧‧信號樣品
3797‧‧‧預測信號
3801‧‧‧框架分割部
3802‧‧‧開視窗處理部(windowing unit)
3803‧‧‧傅立葉轉換部
3804‧‧‧惡化信號樣品
3811‧‧‧逆傅立葉轉換部
3812‧‧‧開視窗處理部
3813‧‧‧框架合成部
3901‧‧‧相位旋轉部
3902‧‧‧旋轉量產生部
3903‧‧‧補正量算出部
3904‧‧‧振幅補正部
4001‧‧‧驟增部檢測部
4002‧‧‧延遲時間算出部
4003‧‧‧相位轉換部
4004‧‧‧傾斜算出部
4005‧‧‧傾斜算出部
4006‧‧‧平行度算出部
4007‧‧‧驟變判斷部
4010‧‧‧振幅最大值時機
4020‧‧‧延遲時間τ(延遲時間n0)
4030‧‧‧相位
4040‧‧‧傾斜
4050‧‧‧相位傾斜
4101‧‧‧圖形
4102‧‧‧圖形
4103‧‧‧直線
4104‧‧‧範圍
4105‧‧‧重疊的部分
4210‧‧‧處理器
4220‧‧‧ROM(唯讀記憶體)
4240‧‧‧RAM(隨機存取記憶體)
4250‧‧‧儲存器
4251‧‧‧雜音抑制程式
4260‧‧‧輸出入界面
4261‧‧‧操作部
4262‧‧‧輸入部
4263‧‧‧輸出部
4264‧‧‧攝影機
4400‧‧‧雜音抑制裝置
4486‧‧‧開視窗部
4500‧‧‧雜音抑制裝置
4501‧‧‧振幅平坦度算出部
4509‧‧‧驟變判斷部
4600‧‧‧信號處理裝置
4601‧‧‧轉換部
4602‧‧‧直線性計算部
4604‧‧‧信號驟變判斷部
4610‧‧‧輸入信號
4620‧‧‧相位成分信號
4630‧‧‧振幅成分信號
4640‧‧‧直線性
4700‧‧‧雜音抑制裝置
4701‧‧‧轉換部
4702‧‧‧相位控制部
4703‧‧‧振幅控制部
4704‧‧‧逆轉換部
4705‧‧‧雜音抑制部
4706‧‧‧輸入端子
4707‧‧‧輸出端子
4708‧‧‧直線性計算部
4709‧‧‧驟變判斷部
4710‧‧‧輸入信號
4720‧‧‧相位頻譜(相位成分)
4730‧‧‧振幅頻譜(振幅成分)
4730‧‧‧惡化信號振幅頻譜
4740‧‧‧信號相位頻譜
4750‧‧‧補正振幅頻譜
4760‧‧‧強調語音信號
4901‧‧‧逆傅立葉轉換部
4902‧‧‧開視窗處理部
4903‧‧‧框架合成部
4730‧‧‧惡化振幅頻譜
5001‧‧‧相位旋轉部
5002‧‧‧旋轉量產生部
5003‧‧‧補正量算出部
5004‧‧‧振幅補正部
5101‧‧‧變化量算出部
5102‧‧‧平坦度算出部
5120‧‧‧平坦度
5130‧‧‧判斷結果
5110‧‧‧相位變化量
5120‧‧‧平坦度
5130‧‧‧驟變判斷結果
5201‧‧‧圖形
5202‧‧‧圖形
5203‧‧‧平坦度
5310‧‧‧處理器
5320‧‧‧ROM(唯讀記憶體)
5340‧‧‧RAM(隨機存取記憶體)
5350‧‧‧儲存器
5351‧‧‧雜音抑制程式
5360‧‧‧輸出入界面
5361‧‧‧操作部
5362‧‧‧輸入部
5363‧‧‧輸出部
5364‧‧‧攝影機
5500‧‧‧雜音抑制裝置
5501‧‧‧轉換部
5550‧‧‧複數信號
5508‧‧‧直線性檢測部
5509‧‧‧驟變判斷部
5601‧‧‧變化量算出部
5708‧‧‧直線性檢測部
5709‧‧‧驟變判斷部
5710‧‧‧單位向量
5720‧‧‧第1旋轉向量
5730‧‧‧第2旋轉向量
5740‧‧‧判斷結果
5781‧‧‧單位向量產生部
5782‧‧‧旋轉向量轉換部
5783‧‧‧旋轉向量轉換部
5900‧‧‧車輛
5902‧‧‧影像記錄部
6000‧‧‧心電計
6001‧‧‧警報部
6100‧‧‧硬碟驅動器
a‧‧‧振幅
A(k)‧‧‧振幅
FM(k)‧‧‧平坦度
f(ψ)‧‧‧加權函數
g‧‧‧整數
k‧‧‧離散頻率
I(k)‧‧‧計數值
N‧‧‧臨界值
P(k)‧‧‧相位
△P(k)‧‧‧傾斜
RotVec‧‧‧旋轉向量
X[k]‧‧‧頻率區域信號
x[n]‧‧‧時間區域信號
Yn(k)‧‧‧惡化信號頻譜
argYn(k)‧‧‧惡化信號相位頻譜
|Yn(k)|‧‧‧惡化信號振幅頻譜
E(|S’|^2)‧‧‧期待值
θ‧‧‧相位信號
θ’‧‧‧相位信號
[第1圖]係顯示根據本發明第一實施例的信號處理裝置的構成方塊圖;[第2圖]係顯示根據本發明第二實施例的雜音抑制裝置的構成方塊圖;[第3圖]係顯示根據本發明第二實施例的轉換部的構成方塊圖;[第4圖]係顯示根據本發明第二實施例的逆轉換部的構成方塊圖;[第5圖]係顯示根據本發明第二實施例的相位控制部及振幅控制部的構成方塊圖;[第6圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第7圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第8圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第9圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第10圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第11圖]係說明根據本發明第二實施例的相位控制部的動作圖;[第12圖]係說明根據本發明第二實施例的計算部及驟變
判斷部的構成圖;[第13圖]係說明根據本發明第二實施例的計算部的處理圖;[第14圖]係顯示根據本發明第二實施例的雜音抑制裝置的硬體構成方塊圖;[第15圖]係說明根據本發明第二實施例的雜音抑制裝置的處理流程的流程圖;[第16圖]係顯示根據本發明第三實施例的雜音抑制裝置的構成方塊圖;[第17圖]係顯示根據本發明第三實施例的相位控制部及振幅控制部的構成方塊圖;[第18圖]係顯示根據本發明第四實施例的相位控制部及振幅控制部的構成方塊圖;[第19圖]係說明根據本發明第四實施例的雜音抑制裝置的處理流程的流程圖;[第20圖]係說明根據本發明第五實施例的應用例圖;[第21圖]係說明根據本發明第五實施例的應用例圖;[第22圖]係顯示根據本發明第六實施例的信號處理裝置的構成方塊圖;[第23圖]係顯示根據本發明第七實施例的雜音抑制裝置的構成方塊圖;[第24圖]係顯示根據本發明第七實施例的轉換部的構成方塊圖;[第25圖]係顯示根據本發明第七實施例的逆轉換部的構
成方塊圖;[第26圖]係顯示根據本發明第七實施例的相位控制部及振幅控制部的構成方塊圖;[第27圖]係說明根據本發明第七實施例的算出部及驟變判斷部的構成圖;[第28圖]係說明根據本發明第七實施例的計算部的處理圖;[第29圖]係顯示根據本發明第七實施例的雜音抑制裝置的硬體構成方塊圖;[第30A圖]係說明根據本發明第七實施例的雜音抑制裝置的處理流程的流程圖;[第30B圖]係說明根據本發明第七實施例的雜音抑制裝置的處理流程的流程圖;[第30C圖]係說明根據本發明第七實施例的雜音抑制裝置的處理流程的流程圖;[第31圖]係顯示根據本發明第八實施例的轉換部的構成方塊圖;[第32圖]係顯示根據本發明第九實施例的雜音抑制裝置的構成方塊圖;[第33圖]係說明根據本發明第十實施例的應用例圖;[第34圖]係說明根據本發明第十實施例的應用例圖;[第35圖]係顯示根據本發明第十一實施例的信號處理裝置的構成方塊圖;[第36圖]係顯示根據本發明第十二實施例的雜音抑制裝
置的構成方塊圖;[第37A圖]係顯示根據本發明第十三實施例的雜音抑制裝置的構成方塊圖;[第37B圖]係顯示根據本發明第十三實施例的相關除去部構成的一範例方塊圖;[第37C圖]係顯示根據本發明第十三實施例的相關除去部構成的另一範例方塊圖;[第38A圖]係顯示根據本發明第十三實施例的轉換部的構成方塊圖;[第38B圖]係顯示根據本發明第十三實施例的逆轉換部的構成方塊圖;[第39圖]係顯示根據本發明第十三實施例的相位控制部及振幅控制部的構成方塊圖;[第40圖]係說明根據本發明第十三實施例的算出部及驟變判斷部的構成圖;[第41圖]係說明根據本發明第十三實施例的計算部的處理圖;[第42圖]係顯示根據本發明第十三實施例的雜音抑制裝置的硬體構成方塊圖;[第43A圖]係說明根據本發明第十三實施例的雜音抑制裝置的處理流程的流程圖;[第43B圖]係說明根據本發明第十三實施例的雜音抑制裝置的處理流程的流程圖;[第43C圖]係說明根據本發明第十三實施例的雜音抑制裝
置的處理流程的流程圖;[第44圖]係顯示根據本發明第十四實施例的雜音抑制裝置的構成方塊圖;[第45圖]係顯示根據本發明第十五實施例的雜音抑制裝置的構成方塊圖;[第46圖]係顯示根據本發明第十六實施例的信號處理裝置的構成方塊圖;[第47圖]係顯示根據本發明第十七實施例的雜音抑制裝置的構成方塊圖;[第48圖]係顯示根據本發明第十七實施例的轉換部的構成方塊圖;[第49圖]係顯示根據本發明第十七實施例的逆轉換部的構成方塊圖;[第50圖]係顯示根據本發明第十七實施例的相位控制部及振幅控制部的構成方塊圖;[第51圖]係說明根據本發明第十七實施例的直線性計算部及驟變判斷部的構成圖;[第52圖]係說明根據本發明第十七實施例的直線性計算部的處理圖;[第53圖]係顯示根據本發明第十七實施例的雜音抑制裝置的硬體構成方塊圖;[第54圖]係說明根據本發明第十七實施例的雜音抑制裝置的處理流程的流程圖;[第55圖]係顯示根據本發明第十八實施例的雜音抑制裝
置的構成方塊圖;[第56圖]係顯示根據本發明第十八實施例的相位控制部及振幅控制部的構成方塊圖;[第57圖]係顯示根據本發明第十九實施例的相位控制部及振幅控制部的構成方塊圖;[第58圖]係說明根據本發明第十九實施例的雜音抑制裝的處理流程的流程圖;[第59圖]係說明根據本發明第二十實施例的應用例圖;[第60圖]係說明根據本發明第二十實施例的應用例圖;[第61圖]係說明根據本發明第二十一實施例的應用圖;以及[第62圖]係說明根據本發明第二十一實施例的應用例圖。
以下,參照圖面,以例示詳細說明關於本發明的實施例。但是,以下實施例中記載的構成要素終究是例示,宗旨並非只限定本發明的技術範圍於這些。又,以下說明中的「語音信號」係根據語音等的聲音產生的直接電性變化,用以傳送語音等的音響,不限定於語音。
關於本發明第一實施例的信號處理裝置100,利用第1圖說明。信號處理裝置100,係用以檢測輸入信號驟變的裝置。
如第1圖所示,信號處理裝置100,包含轉換部101、計算部102、及信號驟變判斷部103。轉換部101,轉換輸入信號
110為頻率區域中的相位成分信號120及振幅成分信號130。計算部102,計算相位成分信號120及振幅成分信號130的變化。信號驟變判斷部103,根據計算的變化,判斷輸入號的驟變。
由以上的構成,根據頻率區域中的相位成分信號與振幅成分信號的變化,可以有效檢測輸入信號的驟變。
<<全體構成>>
關於本發明第二實施例的雜音抑制裝置100,利用第2至11圖說明。本實施例的雜音抑制裝置,例如可以應用於數位相機、筆記型電腦、行動電話、鍵盤、遊戲機的控制器、行動電話的按鍵等的雜音抑制。即,對於重疊於其上的信號(雜音或妨礙信號),可以強調作為語音、音樂、環境音等目的的信號。但是,本發明不限定於此,可以應用於被要求檢測來自輸入信號的信號驟變之所有信號處理裝置。又,本實施例中,說明關於檢測衝擊音並抑制的雜音抑制裝置,作為信號驟變的一範例。作為本實施例的雜音抑制裝置,例如,形成麥克風附近的按鍵押下等的操作形態中,適當抑制相關按鍵操作產生的衝擊音。簡單說明的話,轉換包含衝擊音的時間區域信號為頻率區域信號,並算出頻率空間中的相位成分及振幅成分的變化。於是,根據這些變化的組合,判斷衝擊音的存在。
第2圖係顯示雜音抑制裝置200的全體構成方塊圖。對輸入端子206,供給惡化信號(所希望信號與雜音的混合信號),作為樣品值系列。對輸入端子206供給的惡化信號,
在轉換部201中施行傅立葉轉換等的轉換,分割成複數的頻率成分。複數的頻率成分係每頻率獨立處理。在此,注意特定的頻率成分,繼續說明。頻率成分中振幅頻譜(振幅成分)230供給至雜音抑制部205及計算部208。相位頻譜(相位成分)220供給至相位控制部202及計算部208。又,在此雖然轉換部201供給惡化信號振幅頻譜230至雜音抑制部205,但本發明不限於此,供給相當於振幅頻譜的平方的功率頻譜至雜音抑制部205也可以。
雜音抑制部205,使用轉換部201供給的惡化信號振幅頻譜230,推斷雜音,產生推斷雜音頻譜。又,雜音抑制部205,利用轉換部201供給的惡化信號振幅頻譜230與產生的推斷雜音頻譜,抑制雜音,並傳達作為雜音抑制結果的強調信號振幅頻譜至振幅控制部203。又,雜音抑制部205,從驟變判斷部209輸入判斷結果,根據信號的有無驟變或其程度,變更雜音的抑制程度。雜音抑制部205使用目的音檢測保護目的音的同時,在信號驟變檢測時置換振幅為推斷背景音也可以。
相位控制部202,旋轉(位移)轉換部201供給的惡化信號相位頻譜220,作為強調信號相位頻譜240,供給至逆轉換部204。又,相位的旋轉量(位移量)傳達至振幅控制部203。振幅控制部203從相位控制部202接受相位的旋轉量(位移量),算出振幅補正量,再利用其振幅補正量,在各頻率補正強調信號振幅頻譜,並供給補正振幅頻譜250至逆轉換部204。逆轉換部204,合成相位控制部202供給的強調信號相位
頻譜240與振幅控制部203供給的補正振幅頻譜250,再進行逆轉換,並作為強調信號供給至輸出端子207。
計算部208,使用轉換部201供給的相位成分信號220與振幅成分信號230,計算其頻率區域中的各個變化。驟變判斷部209,根據計算部208計算的變化,判斷每頻率點信號驟變是什麼程度的存在(存在可能性)。
<<轉換部的構成>>
第3圖係顯示轉換部201的構成方塊圖。如第3圖所示,轉換部201包含框架分割部301、開視窗處理部(windowing unit)302、及傅立葉轉換部303。惡化信號樣品,供給至框架分割部301,分割為每K/2樣品的框架。在此,K為偶數。分割為框架的惡化信號樣品,供給至開視窗處理部302,進行與窗函數(window function)w(t)的乘法運算。對於第n框架的輸入信號yn(t)(t=0,1,...,K/2-1),以w(t)開視窗(windowing)的信號,以次式(1)提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。重疊長度,假設框架長度的50%為重疊長度的話,對於t=0,1,...,k/2-1,由以下的式(2)得到的左邊,成為開視窗處理部302的輸出。
對於實數信號,使用左右對稱窗函數。又,窗函數,在轉換部201的輸出直接供給至逆轉換部204時,設計為輸入信號與輸出信號除去計算誤差為一致。這是指成為w2(t)+w2(t+K/2)=1。
之後,以連續2框架重疊50%再開視窗的情況為例繼續說明。例如,可以使用以次式(3)表示的漢寧(Hanning)窗作為w(t)。
此外,已知漢寧(Hanning)窗、三角窗等各種窗函數。開視窗的輸出供給至傅立葉轉換部303,並轉換為惡化信號頻譜Yn(k)。惡化信號頻譜Yn(k)分離為相位與振幅,惡化信號相位頻譜argYn(k)供給至相位控制部202和計算部208,而惡化信號振幅頻譜|Yn(k)|供給至雜音抑制部205和計算部208。如同已說明地,也可以利用功率頻譜取代振幅頻譜。
<<逆轉換部的構成>>
第4圖係顯示逆轉換部204的構成方塊圖。如第4圖所示,逆轉換部204包含逆傅立葉轉換部401、開視窗處理部402、及框架合成部403。逆傅立葉轉換部401,對振幅控制部203供給的強調信號振幅頻譜250與相位控制部202供給的強調信號相位頻譜240(argXn(k))進行乘法運算,求出強調信號(以下
的式(4)的左邊)。
對得到的強調信號施行逆傅立葉轉換,1框架包含k樣品的時間區域樣品值系列xn(t)(t=0,1,...,K-1),供給至開視窗處理部402,進行與窗函數w(t)的乘法運算。對於第n框架的輸入信號xn(t)(t=0,1,...,K/2-1),以w(t)開視窗的信號,由次式(5)的左邊提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。假設框架長度的50%為重疊長度的話,對於t=0,1,...,K/2-1,以下公式的左邊,成為開視窗處理部402的輸出,傳達至框架合成部403。
框架合成部403,每K/2樣品取出來自開視窗處理部402的鄰接2框架的輸出再重疊,根據以下公式(7),得到t=0,1,...,K-1中的輸出信號(式(7)的左邊)。得到的強調語音信號260,從框架合成部403傳達至輸出端子207。
又,第3圖與第4圖中說明轉換部與逆轉換部中的轉換為傅立葉轉換,但取代傅立葉轉換,使用阿達瑪轉換(Hadamard transform)、哈爾轉換(Haar transform)、小波轉換(wavelet transform)等其他的轉換也可以。哈爾轉換(Haar transform)不用乘法運算,可以縮小LSI(大型積體電路)化時的面積。小波轉換(wavelet transform),因為根據頻率可以變更時間解析度為不同,可以期待提高雜音抑制效果。
又,複數統合轉換部201中得到的頻率成分之後,以雜音抑制部205可以進行實際的抑制。在此之際,從聽覺特性的辨別能力高的低頻率區域,往能力低的高頻率區域,經由統合更多的頻率成分,可以達成高音質。於是,統合複數的頻率成分之後實行雜音抑制時,應用雜音抑制的頻率成分的數量變少,可以削減全體的演算量。
<<雜音抑制部的構成>>
雜音抑制部205,使用轉換部201供給的惡化信號振幅頻譜,推斷雜音,並產生推斷雜音頻譜。於是,使用來自轉換部201的惡化信號振幅頻譜與產生的推斷雜音頻譜,求出抑制係數,乘以惡化信號振幅頻譜,作為強調信號振幅頻譜,供給至振幅控制部203。
又,從驟變判斷部209,接受驟變是什麼程度的存在之資訊(信號驟變存在的可能性、存在可能性),並根據信號
驟變存在的可能性,也可以變更雜音抑制的程度。又,信號驟變存在的可能性以頻率成分、頻帶(統合任意數連續的頻率成分)、或框架單位判斷,上述頻率成分、頻帶或框架單位可以以應施行抑制其驟變的不同信號處理。
對於雜音的推斷,可以利用非專利文件1或非專利文件2中記載的方法等各種推斷方法。
例如,非專利文件1中,揭示以推斷雜音頻譜為目的音不產生的框架的惡化信號振幅頻譜的平均值之方法。此方法必須檢測目的音的產生。目的音產生的區間,可以以強調信號的功率判斷。
理想的動作狀態,係強調信號成為雜音以外的目的音。又,目的音或雜音的水準,在鄰接框架間沒有大變化。根據這些,以過去1框架的強調信號水準作為雜音區域判斷的指標。過去1框架的強調信號功率在一定值以下時,判斷現框架為雜音區間。藉由平均化判斷為雜音區間的框架的惡化信號振幅頻譜,可以推斷雜音頻譜。
又,非專利文件1中,也揭示推斷雜音頻譜作為開始供給惡化信號振幅頻譜的推斷初期的平均值之方法。在此情況下,緊接著開始推斷後,必須滿足不含目的音的條件。滿足條件的情況下,推斷初期的惡化信號振幅頻譜可以作為推斷雜音頻譜。
又,非專利文件2中,揭示從統計的惡化信號振幅頻譜的最小值求出推斷雜音頻譜之方法。此方法,保持統計的一定時間內惡化信號振幅頻譜的最小值,根據其最小值推斷
雜音頻譜。惡化信號振幅頻譜的最小值,因為與雜音頻譜的頻譜形狀相似,可以用作雜音頻譜形狀的推斷值。不過,最小值,變得比原來的雜音水準小。因此,適當增幅最小值用作推斷雜音頻譜。
雜音抑制部205中,可以進行各種抑制,例如以SS(Spectrum Subtraction:頻譜減法運算)法與MMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小平方平均誤差短時間振幅頻譜推斷)法為代表。如果是SS法的話,係轉換部201供給的惡化信號振幅頻譜減去推斷雜音頻譜。MMSE STSA法的話,係使用轉換部201供給的惡化信號振幅頻譜與產生的推斷雜音頻譜,計算抑制係數,此抑制係數乘以惡化信號振幅頻譜。決定此抑制係數為最小化強調信號的平均平方功率。
又,雜音抑制部205從驟變判斷部209輸入驟變判斷結果(信號的驟變是否存在的資訊),根據信號有無驟變或其程度,變更雜音抑制的程度。例如,有信號驟變的頻率成分、頻帶或框架單位中,可以施行應抑制其驟變的信號處理。
以驟變判斷部209判斷為驟變時,惡化信號振幅頻譜與推斷雜音頻譜中小的一方,作為強調信號振幅頻譜,供給至振幅控制部203。即,惡化信號振幅頻譜比推斷雜音頻譜小時,原封不動輸出惡化信號振幅頻譜,除此以外時,也可以以推斷雜音頻譜替換輸入信號再輸出。
又,替換之前,檢測重要的惡化信號振幅頻譜成分,並可以從推斷雜音頻譜產生的替換對象除去檢測的重要惡
化信號振幅頻譜成分。作為檢測重要的惡化信號振幅頻譜成分之際的重要度指標,可以利用惡化信號振幅頻譜的大小。關聯於振幅大的成分為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。
又,作為重要度的指標,也可以利用惡化信號振幅頻譜的峰值性。峰值,即沿著頻率軸具有比周邊大的值之惡化信號振幅,關聯於作為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。特別是,顯著的峰值,即比周邊的振幅值顯著大的振幅值,因為其重要度高,確實保護可以更提高作為目的的信號音質。
峰值的檢測,例如,非專利文件3的純音成分檢測方法或在非專利文件4中揭示其方法。又,根據既定的條件評估檢測的峰值,不滿足條件的峰值除外也可以。例如,取得比上述推斷雜音小的值之峰值,作為目的的信號之可能性低。即,以推斷雜音為基準,只要比起基準足夠大作為峰值留下,除此以外可以除外。是否足夠大,經由與推斷雜音的定數倍比較,可以判斷。於是,評估檢測的峰值是否滿足既定的條件之後,經由選擇最終的峰值成分,可以降低錯誤的峰值檢測,並提高信號驟變部的抑制效果。
又,根據驟變存在的可能性,也可以變化供給至振幅控制部203的信號。執行上述替換的結果與惡化振幅頻譜對應驟變存在的可能性再混合,並輸出作為強調信號振幅頻譜。驟變存在的可能性愈高,執行上述替換的結果加權愈大,執行上述混合處理。
雜音抑制部205,根據信號驟變的存在可能性,可以執行如抑制度0、抑制度1、抑制度2的多段抑制。或是,根據驟變判斷部的判斷結果(例如0~1的數值),也可以無階段地改變抑制程度。
<<相位控制部及振幅控制部的構成>>
第5圖係顯示相位控制部202及振幅控制部203的構成方塊圖。如第5圖所示,相位控制部202包含相位旋轉部501與旋轉量產生部502,而振幅控制部203包含補正量算出部503與振幅補正部504。
旋轉量產生部502,關於驟變判斷部209判斷為「信號驟變存在」的頻率成分,產生惡化信號相位頻譜的旋轉量,供給至相位旋轉部501與補正量算出部503。相位旋轉部501,當旋轉量產生部502供給旋轉量時,對轉換部201供給的惡化信號相位頻譜220只旋轉(位移)供給的旋轉量,並作為強調信號相位頻譜240供給至逆轉換部204。
補正量算出部503,根據旋轉量產生部502供給的旋轉量,決定振幅的補正係數,並供給至振幅補正部504。
旋轉量產生部502,例如以隨機變數產生旋轉量。根據隨機變數,在各頻率旋轉惡化信號相位頻譜時,惡化信號相位頻譜220的形狀變化。根據此形狀變化,可以減弱衝擊音等的信號驟變部的特徵。
隨機變數中,具有其產生機率相同的同樣隨機變數、或發生機率表示正式分佈的正式隨機變數等,首先,說明同樣隨機變數產生的旋轉量產生法。同樣隨機變數可以以線性
同餘法等產生。例如,以線性同餘法產生的同樣隨機變數,在0~(2^M)-1的範圍內同樣分佈。在此,M係任意的整數,^表示指數。相位的旋轉量ψ必須在0~2π的範圍內分佈。因此,轉換產生的同樣隨機變數。轉換由以下的式(8)進行。在此,R係同樣隨機變數,Rmax係其同樣隨機變數能夠產生的最大值。以上述的線性同餘法產生的情況下,成為Rmax=(2^M)-1。
為了簡化計算,R值也可以原封不動作為旋轉量。由於是旋轉量,2π表示正好一轉。相位旋轉2π的情況與未旋轉的情況相同。因此,所謂2π+α的旋轉量,與旋轉量為α的情況相同。在此,雖然說明以線性同餘法產生同樣隨機變數的情況,但除此外的方法產生同樣隨機變數時,也根據式(8)求出旋轉量ψ即可。根據驟變判斷部209的判斷結果,也可以決定何時進行何種程度的隨機變數化。
相位旋轉部501,從旋轉量產生部502接受旋轉量,使惡化信號相位頻譜旋轉。如果,惡化信號相位頻譜以角度表現時,可以以此角度加上旋轉量ψ的值旋轉。惡化信號相位頻譜以複數(complex number)的正式向量表現時,求出旋轉量ψ的正式向量,並乘以惡化信號相位頻譜,藉此可以旋轉。
旋轉量ψ的正式向量以式(9)求出。在此,ψ係旋轉向量,j表示sqrt(-1)。又,sqrt表示平方根。
根據補正量算出部503,說明關於補正係數算出法。首先,因相位旋轉產生的輸出水準下降,利用第6及7圖說明。第6及7圖,顯示惡化信號在第2圖所示的方塊圖中處理時的信號。第6圖及第7圖的不同係有無相位旋轉。第6圖顯示不執行相位旋轉時的信號,而第7圖顯示框架3執行相位旋轉時的信號。
首先,關於不旋轉相位時的信號,利用第6圖說明。第6圖最上部繪所的係惡化信號。在框架分割部301框架分割惡化信號。以點線畫分,上面開始第2個信號,係框架分割後的信號。在此,圖示連續的4框架部分的信號。又,框架的重疊率為50%。
分割為框架的信號由開視窗處理部(windowing unit)302執行開視窗。以點線畫分,上面開始第3個信號係開視窗處理後的信號。第6圖中,因為明確顯示相位旋轉產生的影響,根據矩形窗加權。
其次,根據傅立葉轉換部303,轉換為頻率區域的信號,但第6圖中省略頻率區域中的信號。從相位旋轉的點線開始的下部,圖示根據逆轉換部204的逆傅立葉轉換部401,轉換至時間區域的信號。以點線畫分並從上開始第4信號係相位旋轉後的信號。但是,因為第6圖不執行相位旋轉,從開視窗處理後的信號開始不變化。
對於逆轉換部204的逆傅立葉轉換部401輸出的強調信號,再度實施開視窗處理。第6圖係顯示實施根據矩形窗產生的加權的情況。開視窗處理的信號,在框架合成部403中合成。此時,必須使框架間的時間一致。因為框架的重疊率為50%,每框架正好一半重疊。不實施相位的旋轉時,如第6圖所示,輸入信號與輸出信號一致。
另一方面,關於旋轉相位時的信號,利用第7圖說明。第7圖所示係從框架3開始實施相位旋轉時的信號。最上部所繪係與第6圖相同的惡化信號。框架分割後及開視窗處理後的信號也與第6圖相同。
第7圖中,係描繪從框架3開始實施一定的相位旋轉的情況。注意相位旋轉處理的點線下部所示的向右三角形區間。根據相位旋轉處理,框架3及4的信號往時間方向位移。再度開視窗處理進行相位旋轉的信號,並框架合成。此時,框架2與框架3重疊的ii區間,產生框架2與框架3的信號不同。因此,框架合成後的輸出信號水準在ii區間中變小。即,實施相位旋轉時,第7圖的ii區間中輸出信號水準下降。
此相位旋轉產生的輸出信號水準下降,替換時間區域中的加法運算成頻率區域的加法運算,以頻率區域的向量合成也可以說明。
第8圖中,框架分割及開視窗處理後的連續2框架的惡化信號,表示為x1[n]及x2[m]。又,重疊率為50%。在此,n表示x1的離散時間,而m表示x2的離散時間,重疊率為50%時,以下的式(10)成立。
m=n+L/2…(10)
又,x1與x2的關係,成為以下的式(11)。
x 2[m]=x 1[n+L/2]…(11)
首先,顯示從時間區域信號到頻率區域信號的轉換或逆轉換的公式。頻率區域信號X[k],根據時間區域信號x[n]的傅立葉轉換,如以下的式(12)所示。在此,k代表離散頻率,L係框架長度。
又,經由逆轉換頻率區域信號X[k],回到時間區域信號x[n],如以下的式(13)所示。
據此,轉換時間區域信號x1[n]、x2[m]為頻率區域信號X1[k]、X2[k]時,如以下的式(14)、式(15)所示。
頻率區域信號X1[k]、X2[k]經由逆轉換分別回到時間區域信號x1[n]、x2[m]時,根據式(13),如以下的式(16)、
式(17)所示。
逆轉換部,經由傅立葉轉換,轉換頻率區域信號為時間區域信號。之後,經由框架合成部,前框架與現框架的強調信號重疊加法運算。例如,圖示的範例的重疊率50%的話,在離散時間m=L/2~L-1的區間中執行鄰接框架的加法運算。考慮此加法運算區間m=L/2~L-1。
時間區域的加法運算中,代入式(16)及式(17)時,如以下的式(18)所示。
又,式(18)中的頻率區域信號X1[k]、X2[k]代入式(14)、式(15)時,如以下的式(19)所示。
又,展開式(19)時,如以下的式(20)所示。
在此,考慮式(20)的各項所含的總和演算。導入任意的整數g,以下的式(21)成立。
數位函數δ[g]的傅立葉轉換式,以式(22)表示。
在此,數位函數δ[g],由以下的式(23)表示。
根據式(22),式(21)可以變形為以下的式(24)。
根據式(24)的關係,式(20)由以下的式(25)表示。
因此,式(20)成為以下的式(26)。
且說在此對於頻率區域信號X2[k],考慮相位旋轉的情況。此時的時間區域信號,成為第9圖所示。
X2[k]的相位頻譜旋轉ψ[k]時,其轉換式成為以下的式(27)。
將此代入式(18)時,以下的式(28)成立。
將此展開,以下的式(29)成立。
在此,假設重疊率50%,並考慮關於重疊區間的n=L/2~L-1。重疊區間中,根據式(11),可以展開如以下的式(30)。
在此,在各項括弧內的
的項,因為係向量合成,注意特定的頻率k時,如第10圖所繪。如果,未執行相位旋轉時,即,ψ[k]=0的情況成為第11圖所示。
要求出式(31)的絕對值時,成為以下的式(32)。
因此,式(31)的絕對值成為最大的條件係ψ[k]=0時,且其值為2。即,執行相位旋轉的話,了解輸出信號的大小變小。為了補正此輸出信號水準的下降量,補正量算出部503中決定
強調信號頻譜的振幅補正量。
在此,假設相位旋轉量根據同樣隨機變數決定,具體說明補正量的算出方法。在此,為了簡化問題,著眼於相位旋轉產生的變動大小,各頻率成分成正式化為單位向量。
首先,考慮不執行相位旋轉的情況。連續的框架間相位相同時的合成向量,成為如第11圖所示的S,其向量的大小|S|由以下的式(33)表示。
另一方面,根據同樣隨機變數執行相位旋轉時,連續的框架間相位差ψ,同樣分佈在-π到+π的範圍中。此連續的框架間相位不同時的合成向量,成為如第10圖所示的向量S’,其向量的大小|S’|由以下的式(34)表示。
且說,在此,要求出期待值E(|S’|^2)的話,成為以下的式(35)。
在此,因為ψ分佈同樣分佈在-π到+π的範圍中,成為如以下的式(36)所示。
因此,|S’|^2的期待值,由以下的式(37)表示。
E(|S'|2)=2…(37)
且說,不旋轉相位時的期待值E(|S’|^2),根據式(33),由以下的[式38]表示。
E(|S|2)=E(22)
=E(4)=4…(38)
取式(37)與式(38)的比時,以下的式(39)成立。
E(|S'|2)/E(|S|2)=2/4=1/2…(39)
即,以同樣的隨機變數旋轉相位時,輸出信號的功率平均值與輸入比較,只變小1/2。振幅補正部504中,因為對振幅值進行補正,補正量算出部503以補正係數為sqrt(2),傳達至振幅補正部504。
以上,舉例說明根據同樣的隨機變數產生旋轉量的情況,也由正式隨機變數等決定其分散和平均值的話,可以獨特地決定補正係數。以下說明使用正式隨機變數時補正係數的導出。
正式隨機變數時ψ的發生機率根據正式分佈決定。因此,根據正式隨機變數實施相位旋轉時,為了求出功率期待值,根據ψ的發生機率,必須執行加權。
具體而言,根據ψ的發生機率,導入加權函數f(ψ)。根據其加權函數f(ψ),加權cos(ψ)。又,經由以加權函數f(ψ)的積分值正式化,可以求出功率期待值。
根據正式隨機變數執行相位旋轉時,輸出功率期待值E(S”^2),在同樣的隨機變數的輸出功率期待值之式(35)中,導入加權函數f(ψ)及其積分值,可以如以下的式(40)表示。
加權函數f(ψ),因為根據正式分佈表示,以下的式(41)成立。
在此,σ表示分散,而μ表示平均。
例如,平均值μ=0、σ=1的標準正式分佈中,因為成為以下的式(42),將此代入式(40)的話,成為式(43)。
在此,式(43)的右邊,數值計算第2項時,因為式(44)成立,不旋轉相位時,與期待值E(|S^2|)的比,以式(45)表示。
E(|S"|2)=2{1+0.609}=3.218…(44)
E(|S"|2)/E(|S|2)=3.218/4=0.805…(45)
補正量算出部503,當以標準正式分佈的正式隨機變數旋轉相位時,以補正係數為sqrt(1/0.805)傳達至振幅補正部504。可以對於框架內的全部頻率進行相位旋轉,對於檢測信號驟變的一部分的頻率進行也沒關係。振幅補正係對已執行相位旋轉的頻率,即對已檢測信號驟變的頻率進行。因此,不進行相位旋轉的頻率的補正係數為1.0。只有已執行相位旋轉的頻率的補正係數為以上述導出的值。
於是,振幅控制部203中,利用相位控制部202傳達的相位旋轉量,算出振幅補正係數,乘以雜音抑制部205供給的強調信號振幅頻譜,供給至逆轉換部204。因此,旋轉惡化信號相位頻譜,可以消除得到強調信號相位頻譜時的輸出水準下降。
又,可以無視算出的振幅補正量(補正係數接近1.0)時,想要削減補正量算出與振幅補正的演算量時等,在認為必須時,可以省略振幅補正自體。其時,只實施相位旋轉部501中的相位旋轉。
又,說明關於目前為止使用隨機變數旋轉相位的範例,但不使用嚴格的意義中的隨機變數之構成,也可以得到同樣的效果。因為輸入的惡化信號的相位特性中存在的特有圖案消去或變弱是相位旋轉的目的,可以達成此目的的數列都可以利用於相位旋轉。例如,周期比框架長度的一半(振幅及功
率頻譜是獨立的頻率成分的數量)長,一周期內的相關小數列的利用是有效的。
<<計算部及驟變判斷部的構成>>
第12圖係用以說明計算部208及驟變判斷部209的內部構成圖。如第12圖所示,計算部208包含算出頻率方向中相位變化量之變化量算出部1201、算出相位變化量的平坦度之平坦度算出部1202、以及算出頻率方向中振幅平坦度之振幅平坦度算出部1203。
變化量算出部1201,係輸入相位成分信號220(p(k),k係頻率),求出鄰接的頻率相位差△p(k)=p(k)-p(k-1)作為相位變化量1210(相位傾斜)。
平坦度算出部1202,調查以變化量算出部1201得到的相位變化量△p(k)=p(k)-p(k-1)沿著頻率軸的平坦度(偏離)。假設鄰接頻率的相位變化量的階差△2p(k)=△p(k)-△p(k-1)為平坦度1220。相位變化量平坦的話,階差為0。對於每頻率成分、每頻帶、全頻率中任一,求出一平坦度1220也可以。又,統合單一或複數的頻帶中的平坦度,取代全頻率中的平坦度使用也可以。
相位的頻率方向的變化量,在信號驟變存在時變成平坦的理由與以下相同。假設轉換部201的框架內孤立脈衝存在。已傅立葉轉換孤立脈衝時的頻率方向的相位傾斜,對應孤立脈衝的位置求出唯一值是已知的。例如,轉換部中框架長度為L樣品且孤立脈衝位置為n0(0≦n0≦L-1)時,相位的傾斜成為-2πn0/L。因為,關於振幅a的孤立脈衝,經由傅立
葉轉換得到的第k頻率成分D(k)由下面的公式提供。D(k)=a‧exp(-jθ(k))θ(k)=-2π‧k‧n0/L
相位θ(k),明顯地與k即頻率成正比。因此,成為相當於相位微分的頻率方向變化量的△θ(k)=-2π‧n0/L。這是常數。即,頻率方向的相位變化量成為一定值(平坦)。
在此,並非每頻率而是每頻帶(子頻帶)或框架判斷時,根據更全局的判斷,可以降低由於信號驟變成分以外的相位成分產生的判斷錯誤。又,利用每頻帶或每框架的判斷結果,修正每頻率的判斷結果也可以。例如,某頻帶的判斷結果係「信號驟變存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。相反地,某頻帶的判斷結果為「信號驟變不存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變不存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。或者,上述頻帶內的各頻率中,往容易判斷容易度(臨界值)為存在的方向修正,維持各頻率獨自執行判斷之構成自體也可以。每頻率或每頻帶求出判斷結果時,每頻率或每頻帶可以抑制驟變,成為可以進行更高精確度的抑制。
又,以相位的微分值作為相位變化量,更以其微分值為平坦度1220也可以。在此情況下,相位的二次微分值接近0的話(既定值以下的話),可以判斷為平坦。判斷每頻帶或每頻率成分時,可以進行更仔細的信號驟變的判斷處理。即,每頻帶或每頻率成分也可以獨立抑制信號驟變,而可以進行更高精確度的抑制。
在此,變化量算出部1201,利用鄰接頻率間的相位階差算出變化量,但本發明不限於此。以相位頻率產生的微分判斷直線性(相位變化的平坦度)也可以。複數的頻率中的複數微分結果的偏離越小,直線性越高。局部的直線性,可以利用局部的微分結果評估。特別是因為鄰接的2頻率成分間的微分在段差中可以近似,此情況下判斷為複數的階差偏離越小直線性越高。可以利用平坦度作為偏離的指標。
振幅平坦度算出部1203,算出沿著頻率軸的振幅變化1225,供給至驟變判斷部209。鄰接頻率間振幅變化小的頻率表示信號驟變。振幅變化,對於每頻帶或全頻率中的任一,求出一個平坦度1225也可以。具體而言,如以下的式(46)所示,求出表示平坦度的FM(平坦度測量)。x(n)係頻率n中的振幅或功率頻譜,N係平坦度算出區間內包含的頻率成分數量。
FM係取0.0到1.0的值。完全平坦的情況下,FM係1.0。關於平坦度,非專利文件3中揭示。
平坦度也可以利用另外的指標表示。例如,對於每頻帶或全頻率中的任一,求出x(n)的平均,各頻率成分n中的x(n)與其平均值的階差平方值總和可以作為每頻帶或全頻率的平坦度。取代全頻率,單一或複數的頻帶中求出一個上述
階差平方值總和,以此作為平坦度也可以。因此,求出的平坦度在完全平坦時0.0,隨著平坦度下降取大的值。
另外的平坦度的指標,也可以使用平滑度。平滑度,可以以沿著頻率軸的鄰接樣品間的階差絕對值總和表示。凹凸多(不平滑)的波形取平滑度大的值,而凹凸少(平滑)波形取小的值。此指標係已知的全變動量(TV:Total Variation)。
目前為止,雖然使用沿著頻率軸的平坦度作為平坦度,但也可以利用沿著時間軸的平坦度。因為信號驟變部中振幅及功率急劇增加,利用此性質的話,沿著時間軸的平坦度低時,可以判斷為信號驟變存在。具體而言,現框架與緊接在前的框架的振幅或功率的差成為一定值以上時,判斷為平坦度低,即信號驟變存在。又,對於數框架過去的框架到現在的框架為止的複數框架,求出鄰接框架間的振幅或功率差,定義線形或非線形結合這些的結果為平坦度也可以。藉由使用過去的框架的資訊,變得容易檢測包含低通成分變形的信號驟變部,提高其抑制性能。又,計算鄰接框架的振幅或功率差之際,對每頻率成分、每頻帶或全頻率中任一計算也可以。又,對於單一或複數的頻帶,也可以計算上述振幅或功率差。例如,在單一的頻帶,特別在高頻區中藉由計算上述振幅或功率差,可以降低語音或其他信號的影響,可以更正確檢測信號驟變部。
目前為止說明的2個平坦度,即沿著頻率軸的平坦度與沿著時間軸的平坦度,可以分別單獨使用,也可以組合兩方使用。組合的範例,係根據2個平坦度的線形或非線形結合的信號驟變部檢測、或根據各平坦度的檢測結果組合等。頻
率方向的平坦度大時,時間方向的平坦度小時,因為判斷為信號驟變的檢出,組合之際必須設法使哪邊為倒數後再組合等。
驟變判斷部209,使用相位變化量的平坦度與振幅平坦度的2個指標,判斷信號的驟變。因為,振幅沿著頻率軸平坦(偏離小)時,認為信號驟變部的可能性高。根據信號驟變係脈衝性(短時間內增加再減少)以及衝量的傅立葉轉換成為白色信號(全頻率中振幅及功率相等),這是顯而易見的。判斷的方法,例如可以選擇以下任一。
(1)相位變化量的平坦度與振幅平坦度都滿足各個條件時(例如,相位的二次微分值係N=0.1以下,振幅平坦度FM係M=0.8以上時),判斷為有信號驟變。
(2)單獨使用平行度與振幅平坦度時的判斷結果之邏輯和。算出信號驟變的存在可能性時,根據平行度的存在可能性與根據振幅平坦度的存在可能性中,根據較大(或較小)的一方判斷。
(3)相位變化量的平坦度與振幅平坦度兩方的平均滿足條件時(例如,相位的二次微分值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)間的平均AV1=(PX+QX)/2在0.1以下),判斷為有信號驟變。
(4)對於相位變化量的平坦度與振幅平坦度執行加權的同時,滿足合併兩方的複合條件的情況下(例如,相位的二次微分值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)之間的加權平均AV2=(0.8×PX+0.2×QX)在0.1以下),判斷為有信號驟變。
(5)利用線形或非線形函數,組合相位變化量的平坦度與振幅平坦度,當組合結果比一定值大時,判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(6)只使用相位變化量的平坦度與振幅平坦度之中任一較大的一方(接近理想值的一方),其較大的一方滿足條件時(例如相位的二次微分PX、以及振幅平坦度FM與1.0的階差值QX之間任一較大的一方與臨界值比較),判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(7)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且振幅或功率頻譜平坦的話,減少相位平坦度的加權。
(8)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且輸入的惡化信號的振幅或功率頻譜比振幅或功率頻譜的最小值小時,暫時大變更用以檢測信號驟變的臨界值,使檢出不易。
處理特定的信號時,例如檢測.抑制雜音小而接近衝量的衝擊音時,關於振幅或功率的資訊有時比相位資訊可以信賴。例如,安靜的環境中檢測手槍的開槍聲之際,只使用振幅檢測也可以。另一方面,雜音的振幅或功率變化大時,例如,機場的警備中檢測開槍聲的情況下,安靜(雜音小)的狀況、及雜音大的狀況下,改變振幅與相位的加權是有效的。此時,振幅與相位的加權,根據雜音的有無或時間帶改變也可以。例如,可以從管制塔得到飛行時刻表的最新資訊的話,因為知道飛機的離著陸時刻,飛機來的時機(雜音多的時機)可以加大相位的加權用於開槍聲的檢測。因為開槍聲(檢測對象的
衝擊音)以外的信號混合時,使用相位資訊的衝擊音檢測比使用振幅的檢測有效。另一方面,雜音小的狀況下,重視輸入的惡化信號的頻率區域向量的絕對值即振幅值並判斷,可以有效檢測衝擊音。當然在此也可以取代振幅頻譜使用功率頻譜值。又,根據信號的種類,衝擊音的振幅會有不平坦的情況。在此情況下,加大相位平坦度的加權並進行檢測,藉此可以高精確度檢測信號驟變。又,事前得到關於衝擊音的振幅或功率頻譜的資訊時,使用得到的資訊,為了得到與振幅平坦時相同的結果,也可以補正振幅平坦度的計算結果。具體而言,在各頻率成分中振幅頻譜230乘以衝擊音的振幅或功率頻譜形狀的倒數後,算出振幅平坦度。
驟變判斷部209,輸出有信號驟變(1)或無信號驟變(0),作為判斷結果1230。但是,輸出與平坦度的絕對值對應的0與1之間的值作為判斷結果1230也可以。在此情況下,可以得到信號驟變存在的可能性(存在可能性)。存在可能性,例如,可以如下求出。首先,決定正值作為臨界值,臨界值為正值是因為上述相位平坦度和振幅平坦度雙方都是更大的正值表示信號驟變的存在可能性高低。又,兩者的最小值為0。其次,組合兩指標得到的值(組合指標)超過臨界值時,假設信號驟變的存在可能性為1。又,組合指標為0時,假設存在可能性為0。存在可能性的一般值係定義為組合指標的函數。如此的函數,最簡單係直線。決定與組合指標成正比的值,作為存在可能性。直線傾斜與y軸截距(上述組合指標為0時的函數值),定為滿足當上述組合指標等於0及1時的邊界條件。
函數,也可以使用任意的線形或非線形函數、多項式等。
第13圖係圖形顯示相位及其變化量。頻率區域中,沿著頻率軸,相位如圖形1301變化時,其相位變化量,在頻率區域中,沿著頻率軸,如圖形1302所示地變化。藉由此變化導出平坦的頻率1303,辨別相位的直線性。
因為已知信號的驟變部中相位直線變化,如此求出相位的直線性,並判斷其平坦度,藉此可以判斷號驟變的存在或其程度。於是,衝擊音等信號驟變存在的頻率成分,在頻帶或全頻率中,藉由旋轉操作相位頻譜或抑制振幅頻譜,因為可以抑制其驟變、減弱其影響,可以得到高品質的強調信號。
第14圖係關於本實施中使用軟體實現雜音抑制裝置200時的硬體構成說明圖。
雜音抑制裝置200,包括處理器1410、ROM(唯讀記憶體)1420、RAM(隨機存取記憶體)1440、儲存器1450、輸出入界面1460、操作部1461、輸入部1462及輸出部1463。雜音抑制裝置200,也可以包括攝影機1464。處理器1410係中央處理部,經由執行各種程式,控制雜音抑制裝置200全體。
ROM(唯讀記憶體)1420,除了處理器1410最初應執行的開機程式之外,還記憶各種參數等。RAM1440,除了未圖示的程式載入區域之外,還有記憶輸入信號210、相位成分信號220、振幅成分信號230、強調信號260、相位變化量1210、相位變化平坦度1220、振幅平坦度1225及驟變判斷結果1230等的區域。
又,儲存器1450,收納雜音抑制程式1451。雜音
抑制程式1451,包含轉換模組、相位控制模組、振幅控制模組、逆轉換模組、雜音抑制模組、相位直線性計算模組、振幅平坦度判斷模組及驟變判斷模組。藉由處理器1410實行雜音抑制程式1451內包含的各模組,可以實現第2圖的轉換部201、相位控制部202、振幅控制部203、逆轉換部204、雜音抑制部205、計算部208、驟變判斷部209的各功能。又,儲存器1450也可以收納雜音資料庫。
處理器1410實行的雜音抑制程式1451的輸出的強調信號,經由輸出入界面1460,從輸出部1463輸出。因此,例如,可以抑制從輸入部1462輸入的操作部1461的操作音等。又,檢測從輸入部1462輸入的輸入信號中包含信號驟變,再開始攝影機1464的攝影等的應用法也可以。
第15圖係用以說明上述雜音抑制程式1451產生的信號驟變判斷處理流程之流程圖。首先,步驟S1501中,從輸入部1462輸入信號時,進行至步驟S1503。步驟S1503中,轉換部201轉換輸入信號至頻率區域,分割為振幅.相位。其次,步驟S1505中,計算部208設定離散頻率k為1,計數值I(k)為0,依序開始頻率空間內的處理。進行至步驟S1507時,計算部208,算出設定的頻率中的相位變化(微分值或階差值)。又,步驟S1509中,計算部208算出相位變化的變化(微分值或階差值)。又,步驟S1510中,計算部208使用上述的式(46),算出振幅A(k)的平坦度FM(k)。其次,步驟S1511中,驟變判斷部209將相位變化的平坦度絕對值及振幅平坦度與各臨界值N、M作比較。具體而言,相位變化的變化絕對值不超
過既定的臨界值N,而且振幅平坦度FM在臨界值M以上時,進行至步驟S1513,判斷其頻率k中信號驟變存在,立下標幟(假設I(k)=1)。另一方面,相位變化與振幅變化不吻合條件時,步驟S1514中,假設I(k)=0。重複以上的步驟S1507~S1514直到成為k=F(F為框架全體的頻率成分數)的k的頻率數。最後,在步驟S1517中,成為I(k)=1的k的頻率,判斷為信號驟變,並供給判斷結果至雜音抑制部205及相位控制部202。對於全框架重複執行以上的步驟S1501~S1514的處理。又,改變至步驟S1517,框架內累計I(k),且I(k)的累計值超過既定的臨界值時,驟變判斷部209判斷為包含信號驟變的框架也可以。又,在此之際,在下一頻帶中累計驟變判斷結果也可以。
又,作為重疊作用,後繼的框架中可以設定大的臨界值N,還有小的M。於是,藉由設定後繼框架的臨界值,使檢測信號驟變(衝擊音)變得容易,可以降低遺漏檢出。後繼的框架中的臨界值N與M的設定,可以對任一方或雙方同時進行。
根據以上的處理,可以更正確檢測信號驟變(衝擊音),並可以適當抑制其信號驟變(衝擊音)。
其次關於本發明第三實施例的雜音抑制裝置,利用第16圖說明。第16圖,係用以說明本實施例的雜音抑制裝置1600的功能構成圖。本實施例的雜音抑制裝置1600,相較於上述第二實施例,不同點係轉換部1601產生複數信號1650,計算部1608及驟變判斷部1609根據其複數信號1650
執行相位直線性的計算及信號驟變的判斷。其他的構成及動作,因為與第二實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
第17圖係用以說明計算部1608及驟變判斷部209的內部構成圖。如第17圖所示,計算部1608包含算出往頻率方向的相位變化量之變化量算出部1701、及算出相位變化量的平坦度之平坦度算出部1202。變化量算出部1701,輸入複數信號1650(q(k),k係頻率),求出鄰接頻率的相位差△p(k)=p(k)-p(k-1),作為相位變化量1210(相位傾斜)。
平坦度算出部1202,調查以變化量算出部1201得到的相位變化量差△p(k)=p(k)-p(k-1)沿著頻率軸之平坦度(偏離)。假設鄰接頻率的相位變化量的差△2p(k)=△p(k)-△p(k-1)為平坦度1220。相位變化量平坦的話,階差為0。對於每頻率成分、每頻帶、全頻率中任一,求出一平坦度1220也可以。又,統合單一或複數的頻帶中的平坦度,取代全頻率中的平坦度使用也可以。
又,以相位的微分值作為相位變化量,更以其微分值為平坦度1220也可以。在此情況下,相位的二次微分值接近0的話(既定值以下的話),可以判斷為平坦。判斷每頻帶或每頻率成分時,可以進行更仔細的信號驟變的檢測處理。即,每頻帶或每頻率成分也可以獨立抑制信號驟變,而可以進行更高精確度的抑制。
驟變判斷部209,當算出的平坦度絕對值在一定以下的情況下,判斷對應其平坦度的頻率(一個頻率成分、頻帶
或全頻率(即,一個框架))包含信號驟變。輸出有信號驟變(1)或無信號驟變(0),作為判斷結果1230。但是,輸出與平坦度絕對值對應的0與1間的值作為判斷結果1230也可以。在此情況下,可以得到信號驟變存在的可能性。
與以上說明相同,根據本實施例,取代相位成分信號,可以使用複數信號檢測相位的直線性。
其次,關於本發明第四實施例的雜音抑制裝置,利用第18圖說明。根據本實施例的雜音抑制裝置1800,相較於上述第三實施例,不同點係取代計算部1608,具有計算部1808。第18圖係用以說明本實施例的雜音抑制裝置內包含的計算部1808的功能構成圖。根據本實施例的計算部1808,相較於上述第三實施例,不同點係包括單位向量產生部1881、旋轉向量產生部1882及1883。又,驟變判斷部1809,根據旋轉向量,判斷信號有無驟變或其程度也是不同點。其他的構成及動作,因為與第三實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
單位向量產生部1881,使用複數信號1650,每頻率成分單位向量化輸入頻譜(複數向量)。具體而言,複數信號1650的實數部與虛數部分別除以振幅值。
旋轉向量轉換部1882,轉換單位向量1810為鄰接頻率間的旋轉向量(第1旋轉向量1820)。在此的旋轉向量的旋轉量(相位)與鄰接頻率中的單位向量間的相位變化量同義。執行取得基準向量的共軛A*與旋轉後的向量B的內積之乘法運
算,如下求得旋轉向量RotVec。RotVec=A*‧B
具體而言,基準向量的實部間的積與虛部間的積之和為旋轉向量的實部,基準向量的實部與虛部的積兩者的差為旋轉向量的虛部,藉此可以算出旋轉向量1820。
又,旋轉向量轉換部1883,調查從旋轉向量轉換部1882得到的第1旋轉向量1820沿著頻率軸的平坦度(偏離)。沿著頻率軸的相位變化量為一定時,旋轉向量的偏離變小。因此,沿著頻率軸求出第1旋轉向量1820的變化量。具體而言,關於第1旋轉向量1820,求出鄰接頻率間的旋轉向量(第2旋轉向量1830)。這與微分第1旋轉向量同義。於是,驟變判斷部1809,辨識第2旋轉向量1830的實部為平坦部。這是因為以下的理由。
因為第2旋轉向量1830也是單位向量,其實部取-1到1的值。相位越直線變化,第1旋轉向量的角度變化量越小(旋轉向量的偏離越小)。於是,第1旋轉向量的變化量越小(旋轉向量的偏離越小),第2旋轉向量的角度變化量越小。第2旋轉向量的角度越小,其實部越大。在此,關於每頻率點、每頻帶、全頻率中的任一,也可以求出一個平坦度。
又,平坦度的求出方法,不限於上述。例如,每鄰接頻率成分算出上述第1旋轉向量的差向量之後,差向量的實部、虛部分別平方再相加得到的差向量大小用作平坦度也可以。又,第2旋轉向量的角度也可以用作平坦度。第2旋轉向量的角度,相當於鄰接頻率成分的第1旋轉向量的角度差。
驟變判斷部1809,使用第2旋轉向量1830的實部
及振幅平坦度FM的2個指標,判斷信號驟變。關於用於振幅平坦度判斷,全部相同於關於驟變判斷部209的動作說明。關於第2旋轉向量1830的實部,根據實部是否超過預先決定的+1的臨界值N(例如0.7或0.8)或是存在於N與+1之間的哪個位置,判斷驟變的存在或其程度。於是,輸出有信號驟變(1)或無信號驟變(0)作為判斷結果1840。但是,也可以輸出與平坦度絕對值對應的0與1之間的值作為判斷結果1840。此時,可以得到信號驟變存在的可能性。例如,將平坦度在每頻率成分與第1臨界值作比較,並計數判斷為第1臨界值以下的頻率bin數,並且其計數值在第2臨界值以上的話,即使其框架中存在驟變部,每框架檢測也可以。
又,在此也是,與第二實施例說明的相同,根據狀況高平衡度地使用相位變化的平坦度與振幅平坦度,可以檢測信號驟變。又,每頻帶或每頻率成分判斷時,可以進行更仔細的信號驟變的檢測處理。即,每頻帶或每頻率成分也可以獨立抑制信號驟變,而可以進行更高精確度的抑制。
第19圖係用以說明執行本實施例的雜音抑制程式的情況下信號驟變檢測處理流程之流程圖。首先,步驟S1501中,從輸入部1462輸入語音信號時,進行至步驟S1903。步驟S1903中,轉換部201轉換輸入信號至頻率區域,產生每頻率成分的複數信號。其次,步驟S1505中,設定離散頻率k為1,計數值I(k)為0,依序開始頻率空間內的處理。進行至步驟S1907時,設定的頻率中單位向量化複數信號。其次,步驟S1908中,從鄰接頻率成分的單位向量轉換至第1旋轉向量。
又,步驟S1909中,鄰接的頻率成分從第1旋轉向量轉換為第2旋轉向量。又,步驟S1510中,振幅平坦度算出部1203使用上述的式(46),算出振幅A(k)的平坦度FM(k)。其次,步驟S1911中,將第2旋轉向量的實部與臨界值N作比較,並將振幅平坦度與臨界值M作比較,結果,實部超過臨界值N,且振幅平坦度超過臨界值M時,進行至步驟S1513,假設I(k)=1。另一方面,實部在既定的臨界值N以下,或振幅平坦度在臨界值M以下時,步驟S1514中,假設I(k)=0。重複以上的步驟S1907~S1514直到成為k=F(F為框架全體的頻率成分數)。最後,步驟S1517中,成為I(k)=1的k的頻率中判斷為有信號驟變,並供給判斷結果至雜音抑制部205及相位控制部202。
與以上說明相同,根據本實施例,使用複數信號根據相位的旋轉向量檢測直線性,與振幅平坦度合併可以檢測衝擊音。又,平坦度的判斷中為了使用旋轉向量的實部,雖然單位向量化,但本發明不限於此。又,取代第2旋轉向量的實部,將第2旋轉向量的角度大小與臨界值作比較,並在角度的大小比臨界值大時判斷為有信號驟變也可以。
又,上述第一至四實施例中,雖然說明關於應用信號驟變檢測方法至以抑制信號驟變部為目的的雜音抑制裝置,但本發明不限於此。以檢測衝擊音為目的的各種裝置、系統及狀況下可以利用。又,檢測對象不限定於衝擊音(急劇上升再立刻下降的語音信號)。即使信號急劇上升(或是下降)並維持原狀的情況下,也可以檢測為驟變部。
例如,現在的聲音符號化方式(例如MPEG、AAC的符號化部)中,在稱作所謂起音(attack)的信號驟變部中,雖然採用不同於通常的資訊壓縮方式,但也可以適用於此時信號驟變部的檢測。信號驟變部中,由於變更分析窗長再抑制稱作pre-echo(前回聲)的先行雜音,檢測是必須的。相較於使用振幅或熵(entropy)的變化等檢出的方法,可以高精確度地檢測驟變,有效進行資訊壓縮。
又,如第20圖所示,也考慮車輛2000中安裝麥克風2001、計算部208、驟變判斷部209、及影像記錄部2002的應用例。影像記錄部2002觸發衝擊音的檢測,並進行禁止改寫保存攝影機產生的攝影畫面的話,可以留下事故狀況的記錄。在此之際,從衝擊音檢測延遲一定時間後,執行禁止改寫保存也可以。不同於觸發衝擊本身的情況,衝擊小的情況下、或其他車輛遭遇事故的情況下也具有能執行自動記錄事故狀況的優點。
又,如第21圖所示,也考慮心電計2100連接計算部208、驟變判斷部209及警報部2101的應用例。可以更正確且有效執行檢測心電圖的異常心跳。特別是雜音多的情況下有效。同樣地,也可以應用於胎兒回音的監視器。由於雜音的妨礙,會有無法正確取得心音的情況,但此時本技術有效。即,可以廣泛應用於生物體信號的驟變檢測。
關於作為本發明第六實施例的信號處理裝置2200,利用第22圖說明。信號處理裝置2200,係用以檢測輸
入信號驟變的裝置。如第22圖所示,信號處理裝置2200包含轉換部2201、第1算出部2202、第2算出部2203及信號驟變判斷部2204。
轉換部2201,轉換輸入信號2210為頻率區域中的相位成分信號2220及振幅成分信號2230。第1算出部2202,根據輸入信號2210的時間區域中的驟增部的位置,算出相位傾斜2250。已傅立葉轉換孤立脈衝時的頻率方向的相位傾斜,對應孤立脈衝的位置求出唯一值是已知的。例如,轉換部中框架長度為L樣品且孤立脈衝位置為n0時,相位的傾斜成為-2πn0/L。例如可以使用振幅絕對值的最大值,作為用以辨識驟增部的指標。此指標,在實際信號接近孤立脈衝時(大致單峰性形狀),提供正確位置。另一方面,具有雙峰性形狀的脈衝時,振幅最大值不提供正確位置。在如此的情況下,使用振幅絕對值的最大值與振幅絕對值的第2大值的指標有效。例如,可以使用兩者的位置的中間值或兩者的位置的加權平均等。脈衝更沿著時間軸變廣時,藉由利用脈衝的大致中心部,可以求出正確位置。如此的指標中有重心。第2算出部2203,算出頻率區域中的相位成分信號2220的傾斜2260。信號驟變判斷部2204,根據第1算出部2202算出的傾斜與第2算出部2203算出的傾斜,判斷輸入信號的驟變。
根據以上的構成,利用頻率區域中相位成分信號的傾斜與根據時間區域信號的驟變部位置求出的相位傾斜之間的一致程度,可以有效檢測輸入信號的驟變。
<<全體構成>>
使用第23到30圖說明關於作為本發明第七實施例的雜音抑制裝置。本實施例的雜音抑制裝置,例如可以應用於數位攝影機、筆記型電腦、行動電話、鍵盤、遊戲機的控制器、行動電話的按鍵等的雜音抑制。即,對於重疊於其上的信號(雜音或妨礙信號),可以強調作為語音、音樂、環境音等目的的信號。但是,本發明不限於此,可以應用於要求檢測來自輸入信號驟變之全部信號處理裝置。又,本實施例中,說明關於檢測再抑制衝擊音的雜音抑制裝置,作為信號驟變的一範例。作為本實施例的雜音抑制裝置,例如,在麥克風附近按下按鍵等的操作形態中,適當抑制由於相關按鍵操作產生的衝擊音。簡單說明的話,包含衝擊音的時間區域信號轉換為頻率區域信號,並算出頻率空間中的相位成分傾斜。又,時間區域信號的驟增部看作孤立脈衝時的頻率區域的相位傾斜,即求出-2πn0/L。於是,根據這2種類的相位傾斜的一致程度,判斷衝擊音的存在。
第23圖係顯示雜音抑制裝置2300的全體構成方塊圖。對輸入端子2306,供給惡化信號(所希望信號與雜音的混合信號)作為樣品值系列。對輸入端子2306供給的惡化信號,在轉換部2301中施行傅立葉轉換等的轉換,分割成複數的頻率成分。複數的頻率成分係每頻率獨立處理。在此,注意特定的頻率成分,繼續說明。頻率成分中振幅頻譜(振幅成分)2330供給至雜音抑制部2305,而相位頻譜(相位成分)2320供給至相位控制部2302及算出部2381。又,轉換部2301,將
框架分割後施行高速傅立葉轉換等的轉換前的時間區域信號2370供給至算出部2382。又,在此雖然轉換部2301供給惡化信號振幅頻譜2330至雜音抑制部2305,但本發明不限於此,相當於振幅頻譜的平方之功率頻譜供給至雜音抑制部2305也可以。
雜音抑制部2305,使用轉換部2301供給的惡化信號振幅頻譜2330,推斷雜音,並產生推斷雜音頻譜。又,雜音抑制部2305,使用轉換部2301供給的惡化信號振幅頻譜2330及產生的推斷雜音頻譜,抑制雜音,作為雜音抑制結果的強調信號頻譜傳達至振幅控制部2303。又,雜音抑制部2305,從驟變判斷部2309輸入判斷結果,並根據有無信號驟變或其程度,變更雜音的抑制程度。雜音抑制部2305,執行所希望信號的檢測並每頻率保護所希望信號成分的同時,信號驟變存在且未檢出所希望信號成分時,置換振幅為推斷背景音也可以。
相位控制部2302,旋轉(位移)轉換部2301供給的惡化信號相位頻譜2320,並作為強調信號相位頻譜2340供給至逆轉換部2304。又,傳達相位的旋轉量(位移量)至振幅控制部2303。振幅控制部2303從相位控制部2302接受旋轉量(位移量),算出振幅補正量,並使用其振幅補正量,補正每頻率強調信號振幅頻譜,並供給補正振幅頻譜2350至逆轉換部2304。逆轉換部2304,合成相位控制部2302供給的強調信號相位頻譜2340及振幅控制部2303供給的補正振幅頻譜2350再進行逆轉換,並作為強調信號供給至輸出端子2307。
算出部2381,根據以頻率微分轉換部2301供給的
相位成分信號2320,算出各頻率中的相位傾斜(變化)。另一方面,算出部2382,從轉換部2301輸入分割為框架的惡化信號樣品2370,算出框架的信號絕對值,並根據顯示驟增部的時間,算出頻率區域的相位傾斜。驟變判斷部2309,比較算出部2381、2382提供的相位傾斜,並根據這些類似度,判斷每頻率點信號驟變是什麼程度的存在(存在可能性)。
在此,傾斜的類似度,可以使用根據時間區域信號求出的傾斜與根據頻率區域信號求出的傾斜的階差絕對值,但不限定於此。也可以使用這2個傾斜的比值與1之間的距離、或兩者和以哪一方的傾斜的2倍正式化的值與1之間的距離等。根據類似度的存在可能性,例如可以如以下求出。首先,決定正值為臨界值。階差絕對值比此臨界值大時,存在可能性假設為0。又,階差絕對值等於0時,存在可能性假設為1。存在可能性的一般值定義為階差絕對值的函數。如此的函數,如此的函數最簡單為為直線。存在可能性,定義為與階差絕對值成正比的值。直線傾斜與y軸截距(上述階差絕對值為0時的函數值),定為滿足上述階差絕對值等於0及1時的邊界條件。函數,也可以使用任意的線形或非線形函數或多項式等。
<<轉換部的構成>>
第24圖係顯示轉換部2301的構成方塊圖。如第24圖所示,轉換部2301包含框架分割部2401、開視窗處理部(windowing unit)2402及傅立葉轉換部2403。惡化信號樣品供給至框架分割部301,並分為每K/2樣品的框架。在此,假設K為偶數。分割為框架的惡化信號樣品2370,供給至開視窗處
理部2402及算出部2382,開視窗處理部2402中執行與窗函數w(t)的乘法運算。對於第n框架的輸入信號yn(t)(t=0,1,...,K/2-1)以w(t)開視窗(windowing)的信號,以次式提供。
又,連續2框架的一部分重疊(overlap)開視窗也可以。假設框架長度的50%為重疊長度的話,對於t=0,1,...,K/2-1,由以下的公式得到的左邊,成為開視窗處理部2402的輸出。
對於實數信號,使用左右對稱函數。又,窗函數,設計為直接供給轉換部2301的輸出至逆轉換部2304時的輸入信號與輸出信號除了計算誤差之外一致。係指成為w2(t)+w2(t+K/2)=1。
之後,以連續2框架的50%重疊開視窗的情況為範例繼續說明。w(t),例如,可以使用次式所示的漢寧視窗(Hanning window)。
其他,也已知漢明視窗(Hamming window)、三角窗等各種窗函數。開視窗的輸出供給至傅立葉轉換部2403,並轉換為
惡化信號頻譜Yn(k)。惡化信號頻譜Yn(k)分離為相位與振幅,惡化信號相位頻譜argYn(k)供給至相位控制部2302與算出部2381,而惡化信號振幅頻譜|Yn(k)|供給至雜音抑制部2305與算出部2382。如已說明的,也可以取代振幅頻譜使用功率頻譜。
<<逆轉換部的構成>>
第25圖係顯示逆轉換部2304的構成方塊圖。如第25圖所示,逆轉換部2304包含逆傅立葉轉換部2501、開視窗處理部2502、及框架合成部2503。逆傅立葉轉換部2501,對振幅控制部2303供給的強調信號振幅頻譜2350與相位控制部2302供給的強調信號相位頻譜2340(arg Xn(k))進行乘法運算,求出強調信號(以下的公式的左邊)。
對得到的強調信號施行逆傅立葉轉換,1框架包含k樣品的時間區域樣品值系列xn(t)(t=0,1,...,K-1),供給至開視窗處理部2502,進行與窗函數w(t)的乘法運算。對於第n框架的輸入信號xn(t)(t=0,1,...,K/2-1),以w(t)開視窗的信號,由次式的左邊提供。
又,(overlap)連續的2框架的一部分重疊開視窗也可以。
假設框架長度的50%為重疊長度的話,對於t=0,1,...,k/2-1,以下公式的左邊,成為開視窗處理部2502的輸出,傳達至框架合成部2503。
框架合成部2503,每K/2樣品取出來自開視窗處理部2502的鄰接2框架的輸出再重疊,根據以下公式,得到t=0,1,...,k-1中的輸出信號(左邊)。得到的強調語音信號2360,從框架合成部2503傳達至輸出端子2307。
又,第24圖與第25圖中說明轉換部與逆轉換部中的轉換為傅立葉轉換,但取代傅立葉轉換,使用阿達瑪轉換(Hadamard transform)、哈爾轉換(Haar transform)、小波轉換(wavelet transform)等其他的轉換也可以。哈爾轉換(Haar transform)不用乘法運算,可以縮小LSI(大型積體電路)化時的面積。小波轉換(wavelet transform),因為根據頻率可以變更時間解析度為不同,可以期待提高雜音抑制效果。
又,複數統合轉換部2301中得到的頻率成分之後,以雜音抑制部2305可以進行實際的抑制。統合後的頻率成分數量,變得比統合前的頻率成分數量少。具體而言,對於以頻率成分的統合得到的統合頻率成分,求出共同的抑制度,
對於屬於相同統合頻率成分的個別頻率成分共同使用其抑制度。在此之際,從聽覺特性的辨別能力高的低頻率區域,往能力低的高頻率區域,經由統合更多的頻率成分,可以達成高音質。於是,統合複數的頻率成分之後實行雜音抑制時,應用雜音抑制的頻率成分的數量變少,可以削減全體的演算量。
<<雜音抑制部的構成>>
回到第23圖時,雜音抑制部2305,使用轉換部2301供給的惡化信號振幅頻譜,推斷雜音,並產生推斷雜音頻譜。於是,使用來自轉換部2301的惡化信號振幅頻譜與產生的推斷雜音頻譜,求出抑制係數,乘以惡化信號振幅頻譜,並作為強調信號振幅頻譜,供給至振幅控制部2303。又,從驟變判斷部2309接受驟變判斷結果(信號的驟變是否存在的資訊),判斷為驟變時,惡化信號振幅頻譜與推斷雜音頻譜中較小的一方,作為強調信號振幅頻譜,供給至振幅控制部2303。此時,雜音抑制部2305,執行所希望信號的檢測,保護每頻率所希望信號成分也可以。
又,從驟變判斷部2309,接受驟變是什麼程度的存在之資訊(信號驟變存在的可能性、存在可能性),並根據信號驟變存在的可能性,也可以變更雜音抑制的程度。又,信號驟變存在的可能性以頻率成分、頻帶(統合任意數連續的頻率成分)、或框架單位判斷,頻率成分、頻帶或框架單位中可以施行應抑制其驟變的不同信號處理。
對於雜音的推斷,可以利用非專利文件1或非專利文件2中記載的方法等各種推斷方法。
例如,非專利文件1中,揭示以推斷雜音頻譜為所希望信號不產生的框架的惡化信號振幅頻譜的平均值之方法。此方法必須檢測所希望信號的存在。所希望信號存在的區間,可以以強調信號的功率判斷。
理想的動作狀態,係強調信號成為雜音以外的所希望信號。又,所希望信號或雜音的水準,在鄰接框架間沒有大變化。根據這些,以1框架過去的強調信號水準作為雜音區間判斷的指標。1框架過去的強調信號功率在一定值以下時,判斷現框架為雜音區間。藉由平均化判斷為雜音區間的框架的惡化信號振幅頻譜,可以推斷雜音頻譜。
又,非專利文件1中,也揭示推斷雜音頻譜作為開始供給惡化信號振幅頻譜的推斷初期的平均值之方法。在此情況下,緊接著開始推斷後,必須滿足不含所希望信號的條件。滿足條件的情況下,推斷初期的惡化信號振幅頻譜可以作為推斷雜音頻譜。
又,非專利文件2中,揭示從統計的惡化信號振幅頻譜的最小值求出推斷雜音頻譜之方法。此方法,保持統計的一定時間內惡化信號振幅頻譜的最小值,根據其最小值推斷雜音頻譜。惡化信號振幅頻譜的最小值,因為與雜音頻譜的頻譜形狀相似,可以用作雜音頻譜形狀的推斷值。不過,最小值,變得比原來的雜音水準小。因此,適當增幅最小值用作推斷雜音頻譜。
雜音抑制部2305中,可以進行各種抑制,例如以SS(Spectrum Subtraction:頻譜減法運算)法與MMSE
STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小平方平均誤差短時間振幅頻譜推斷)法為代表。SS法的情況,係轉換部2301供給的惡化信號振幅頻譜減去推斷雜音頻譜。MMSE STSA法的情況,係使用轉換部2301供給的惡化信號振幅頻譜與產生的推斷雜音頻譜,計算抑制係數,此抑制係數乘以惡化信號振幅頻譜。決定此抑制係數為最小化強調信號的平均平方功率。
又,雜音抑制部2305從驟變判斷部2309輸入驟變判斷結果(信號的驟變是否存在的資訊),根據信號有無驟變或其程度,變更雜音抑制的程度。例如,有信號驟變的頻率成分、頻帶或框架單位中,可以施行應抑制其驟變的信號處理。
以驟變判斷部2309判斷為驟變時,惡化信號振幅頻譜與推斷雜音頻譜中小的一方,作為強調信號振幅頻譜,供給至振幅控制部2303。即,惡化信號振幅頻譜比推斷雜音頻譜小時,原封不動輸出惡化信號振幅頻譜,除此以外時,也可以以推斷雜音頻譜替換輸入信號再輸出。
又,替換之前,檢測重要的惡化信號振幅頻譜成分,並可以從推斷雜音頻譜產生的替換對象除去檢測的重要惡化信號振幅頻譜成分。作為檢測重要的惡化信號振幅頻譜成分之際的重要度指標,可以利用惡化信號振幅頻譜的大小。關聯於振幅大的成分為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。
又,作為重要度的指標,也可以利用惡化信號振幅頻譜的峰值性。峰值,即沿著頻率軸具有比周邊大的值之惡
化信號振幅,關聯於作為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。特別是,顯著的峰值,即比周邊的振幅值顯著大的振幅值,因為其重要度高,確實保護可以更提高為作為目的的信號音質。
峰值的檢測,例如,非專利文件3的純音成分檢測方法或在非專利文件4中揭示其方法。又,根據既定的條件評估檢測的峰值,不滿足條件的峰值除外也可以。例如,取得比推斷雜音小的值之峰值,作為目的的信號之可能性低。即,推斷雜音作為基準,只要比推斷雜音足夠大作為峰值留下,除此以外可以除外。是否足夠大,經由與推斷雜音的定數倍比較,可以判斷。於是,評估檢測的峰值是否滿足既定的條件之後,經由選擇最終的峰值成分,可以降低錯誤的峰值檢測,並提高信號驟變部的抑制效果。
又,根據驟變存在的可能性,也可以變化供給至振幅控制部203的信號。執行上述替換的結果與惡化振幅頻譜對應驟變存在的可能性而混合,並作為強調信號振幅頻譜輸出。驟變存在的可能性愈高,執行上述替換的結果加權愈大,再實行上述混合處理。
雜音抑制部2305,根據信號驟變的存在可能性,可以執行如抑制度0、抑制度1、抑制度2的多段抑制。或是,根據驟變判斷部的判斷結果(例如0~1的數值),也可以無階段地改變抑制程度。
<<相位控制部及振幅控制部的構成>>
第26圖係顯示相位控制部2302及振幅控制部2303的構
成方塊圖。如第26圖所示,相位控制部2302包含相位旋轉部2601與旋轉量產生部2602,而振幅控制部2303包含補正量算出部2603與振幅補正部2604。
旋轉量產生部2602,關於驟變判斷部2309判斷為「信號驟變存在」的頻率成分,產生惡化信號相位頻譜的旋轉量,供給至相位旋轉部2601與補正量算出部2603。相位旋轉部2601,當旋轉量產生部2602供給旋轉量時,對轉換部2301供給的惡化信號相位頻譜2320只旋轉(位移)供給的旋轉量,並作為強調信號相位頻譜2340供給至逆轉換部2304。
補正量算出部2603,根據旋轉量產生部2602供給的旋轉量,決定振幅的補正係數,並供給至振幅補正部2604。
旋轉量產生部2602,例如以隨機變數產生旋轉量。根據隨機變數,以各頻率旋轉惡化信號相位頻譜時,惡化信號相位頻譜2320的形狀變化。根據此形狀變化,可以減弱衝擊音等的信號驟變部的特徵。
隨機變數中,具有其產生機率相同的同樣隨機變數、或發生機率表示正式分佈的正式隨機變數等,首先,說明同樣隨機變數產生的旋轉量產生法。同樣隨機變數可以以線性同餘法等產生。例如,以線性同餘法產生的同樣隨機變數,在0~(2^M)-1的範圍內同樣分佈。在此,M係任意的整數,^表示指數。相位的旋轉量ψ必須在0~2π的範圍內分佈。因此,轉換產生的同樣隨機變數。轉換由以下公式進行。在此,R係同樣隨機變數,Rmax係其同樣隨機變數能夠產生的最大值。以上述的線性同餘法產生的情況下,成為Rmax=(2^M)-1。
為了計算的簡單化,R值可以原封不動作為旋轉量。由於是旋轉量,2π表示正好一轉。相位旋轉2π的情況與未旋轉的情況相同。因此,所謂2π+α的旋轉量,與旋轉量為α的情況相同。在此,雖說明以線性同餘法產生同樣隨機變數的情況,但以此外的方法產生同樣隨機變數的情況,也根據上式求出旋轉量ψ即可。根據驟變判斷部2309的判斷結果,也可以決定何時進行何種程度的隨機變數化。
相位旋轉部2601,從旋轉量產生部2602接受旋轉量,使惡化信號相位頻譜旋轉。如果,惡化信號相位頻譜以角度表現的情況下,可以以此角度加上旋轉量ψ的值旋轉。惡化信號相位頻譜以複數(complex number)的正式向量表現的情況下,求出旋轉量ψ的正式向量,並乘以惡化信號相位頻譜,藉此可以旋轉。
旋轉量ψ的正式向量由以下公式求出。在此,ψ係旋轉向量,j表示sqrt(-1)。又,sqrt表示平方根。
根據補正量算出部2603的補正係數算出法。因為與說明關於第5圖的補正量算出部503的方法相同,在此省略說明。
<<算出部及驟變判斷部的構成>>
第27圖係用以說明關於算出部2381、2382及驟變判斷部2309的內部構成圖。如第27圖所示,算出部2382具有驟增部
檢測部2701、延遲時間算出部2702、相位轉換部2703及傾斜算出部2704。另一方面,算出部2381具有傾斜算出部2705。
驟增部檢測部2701,算出框架內信號的絕對值,並檢測其絕對值的最大值2710。延遲時間算出部2702,輸出顯示框架內最大值之相對位置(從框架開始到最大值存在的時機為止的時間)作為n0。
其次,相位轉換部2703,轉換延遲時間n02720為頻率區域的相位。具體而言,根據以下的公式轉換。在此,L係轉換部2301的框架長度,0≦n0≦L-1。假設輸入為振幅a的孤立脈衝時,經由傅立葉轉換得到的第k個頻率成分D(k),以次式提供。D(k)=a‧exp(-jθ(k))θ(k)=-2π‧k‧n0/L
傾斜算出部2704,微分如此導出的相位2730,並如下導出頻率區域中的相位傾斜2740。傾斜2740=-2π‧n0/L
另一方面,傾斜算出部2705,微分從轉換部2301輸入的相位成分信號,導出頻率區域中的相位傾斜2750。傾斜算出部2704、2705,分別根據相位頻率產生的微分算出傾斜也可以,以其他的方法算出傾斜也可以。
平行度算出部2706,比較每頻率傾斜算出部2704提供的傾斜2740與傾斜算出部2705提供的傾斜2750,算出其傾斜類似度。即,頻率區域中的相位成分信號,在對於算出部2382算出的直線之算出部2381算出的直線之平行度在各頻率中算出。驟變判斷部2707中,如此的平行度超過一定值的話,判斷在其頻率中存在信號的驟變。
在此,並非每頻率而是每頻帶(子頻帶)或框架判斷時,根據更全局的判斷,可以降低由於信號驟變成分以外的相位成分產生的判斷錯誤。又,利用每頻帶或每框架的判斷結果,修正每頻率的判斷結果也可以。例如,某頻帶的判斷結果係「信號驟變存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。相反地,某頻帶的判斷結果為「信號驟變不存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變不存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。或者,上述頻帶內的各頻率中,往容易判斷判斷容易度(臨界值)為「存在」的方向修正,維持獨自執行各頻率判斷之構成自體也可以。每頻率或每頻帶求出判斷結果時,每頻率或每頻帶可以抑制驟變,成為可以進行更高精確度的抑制。
驟變判斷部2309,輸出有信號驟變(1)或無信號驟變(0),作為判斷結果2730。但是,驟變判斷部2707輸出與平行度對應的0與1之間的值作為驟變存在可能性時,判斷結果2730成為表示驟變存在可能性的0與1之間的值。在此情況下,可以得到信號驟變存在的可能性(驟變存在可能性)。存在可能性,例如,可以如下求出。首先,使用反正切函數(arctangent),轉換傾斜2740與傾斜2750為對應傾斜的角度。角度範圍設為-90度到90度。這2角度的差的絕對值越接近0,信號驟變的存可能性越高。又,2角度的差的絕對值在180度為其最大值。於是,決定正值為臨界值。2角度的差超過臨界值時,信號驟變的存在可能性設為0。又,角度差為0時,存
在可能性設為1。存在可能性的一般值,定義為角度差的函數。如此的函數,最簡單係直線。決定與2角度的差成正比的值,作為存在可能性。直線傾斜與y軸截距(2角度的差為0時的函數值),定為滿足當上述角度差等於0及1時的邊界條件。函數,也可以使用任意的線形或非線形函數、多項式等。
第28圖係圖形顯示相位及其變化量。頻率區域中,沿著頻率軸,相位如圖形2801變化時,其相位變化量,在頻率區域中,沿著頻率軸,如圖形2802變化。
另一方面,根據驟增部的框架內相對位置,可以算出在頻率區域中顯示為直線2803的相位。
本實施例中,根據相位成分信號2801與直線2803平行的部分有多少,判斷信號驟變的存在。
取相位傾斜為縱軸,取頻率為橫軸時,近似直線2803傾斜的範圍,以範圍2840顯示。因此,範圍2840與圖形2802重疊的部分比既定的臨界值大時,驟變判斷部2309判斷信號驟變存在。
第29圖係使用軟體實現本實施例的雜音抑制裝置2300時,關於硬體構成的說明圖。
雜音抑制裝置2300,包括處理器2910、ROM(唯讀記憶體)2920、RAM(隨機存取記憶體)2940、儲存器2950、輸出入界面2960、操作部2961、輸入部2962及輸出部2963。雜音抑制裝置2300,也可以包括攝影機2964。處理器2910係中央處理部,經由執行各種程式,控制雜音抑制裝置2300全體。
ROM(唯讀記憶體)2920,除了處理器2910最初應執行的開機程式之外,還記憶各種參數等。RAM2940,除了未圖示的程式載入區域之外,還有記憶輸入信號2310、相位成分信號2320、振幅成分信號2330、強調信號2360等的區域。又,RAM2940,還有記憶振幅最大值時機2710、延遲時間2720、相位信號2730及相位傾斜2740、2750等的區域。
又,儲存器2950,收納雜音抑制程式2951。雜音抑制程式2951,包含轉換模組、相位控制模組、振幅控制模組、逆轉換模組、雜音抑制模組、相位傾斜算出模組及驟變判斷模組。藉由處理器2910實行雜音抑制程式2951內包含的各模組,可以實現第23圖的轉換部2301、相位控制部2302、振幅控制部2303、逆轉換部2304、雜音抑制部2305、算出部2381、2382、驟變判斷部2309的各功能。又,儲存器2950也可以收納雜音資料庫。
關於處理器2910實行的雜音抑制程式2951的輸出的強調信號,經由輸出入界面2960,從輸出部2963輸出。因此,例如,可以抑制從輸入部2962輸入的操作部1461的操作音等。又,檢測從輸入部2962輸入的輸入信號中包含信號驟變,再開始攝影機2964的攝影等的應用法也可以。
第30A圖係用以說明上述雜音抑制程式2951產生的信號驟變判斷處理流程之流程圖。首先,步驟S3001.,在算出部2382中,開始時間區域中離振幅最大值的相位傾斜算出處理。步驟S3002,在算出部2381中,開始頻率區域中的相位傾斜算出處理。
其次,步驟S3005中,待機到步驟S3001及步驟S3003兩方算出傾斜,如果兩方的做法可以算出傾斜的話,進行到步驟S3007,比較每頻率算出的傾斜。步驟S3009中,判斷傾斜的階差絕對值是否在既定的臨界值N以下,如果N以下的話,進行至步驟S3011,關於其頻率k,立下標幟(假設I(k)=1)。另一方面,不是N以下時,步驟S3014中,假設I(k)=0。步驟S3015中判斷k=F(F為框架全體的頻率成分數),不是k=F的話,進行至步驟S3017,以k=k+1回到步驟S3007,遍及框架全體每頻率進行傾斜比較。最終,步驟S3019中,判斷成為I(k)=1的k的頻率中有信號驟變,並供給判斷結果至雜音抑制部2305及相位控制部2302。又,改變至步驟S3019,框架內累計I(k),且I(k)的累計值超過既定的臨界值時,驟變判斷部2309判斷為包含信號驟變的框架也可以。又,在此之際,在下一頻帶中殘留累計驟變判斷結果也可以。
又,作為殘留作用,可以設定接續框架中的臨界值大。經由如此設定接續框架的臨界值,容易檢測信號驟變(例如衝擊音),可以降低檢測遺漏。
第30B圖係用以說明算出部2382執行的傾斜算出處理流程的流程圖。首先,步驟S3021中輸入信號時,進行至步驟S3023,框架分割部2401執行框架分割。其次,步驟S3025中,驟增部檢測部2701檢測低相關信號的驟增部。步驟S3027中,延遲時間算出部2702輸出驟增部的框架內相對位置(框架開始到驟增存在時機為止的時間)作為n0。
其次,步驟S3029中,相位轉換部2703轉換延遲
時間n02720為頻率區域的相位。步驟S3031中,傾斜算出部2704,微分導出的相位,導出頻率區域中的相位傾斜,在步驟S3033中緩衝。
第30C圖係用以說明算出部2381執行的傾斜算出處理流程的流程圖。步驟S3051中輸入信號時,進行至步驟S3053,經過框架分割、窗處理,以傅立葉轉換,抽出頻率區域中的相位成分信號。其次在步驟S3055中,設定頻率的步驟k為1時,在步驟S3057中,微分相位P(k),算出傾斜△P(k),在步驟S3059中,緩衝其傾斜。步驟S3061中,判斷k=F(F係框架全體的頻率成分數)。不是k=F的話,進行到步驟S3063,以k=k+1回到步驟S3057,遍及框架全體算出每頻率傾斜。
根據以上的處理,可以更正確檢測信號驟變,成為可以適當抑制其驟變部。又,本實施例中,雖然以微分值求出相位的傾斜,但求出單位向量的旋轉量等其他的指標用於判斷也可以。
其次,關於本發明第八實施例的雜音抑制裝置,利用第31圖說明。第31圖,係用以說明本實施例的雜音抑制裝置的功能構成圖。本實施例的雜音抑制裝置,相較於上述第七實施例,不同點係轉換部3101中,輸出開視窗處理部2402中的開視窗處理後的信號至算出部2382。其他的構成及動作,因為與第七實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
根據本實施例,使用從開視窗後的時間區域信號,即與用於傅立葉轉換的信號相同的信號求出的傾斜,可以求出平行度。因此,與使用頻率區域信號求出的相位傾斜的整合性變高,可以進行更正確的信號驟變判斷。
其次,關於本發明第九實施例的雜音抑制裝置3200,利用第32圖說明。第32圖,係用以說明本實施例的雜音抑制裝置3200的功能構成圖。本實施例的雜音抑制裝置3200,相較於上述第七實施例,不同點係具有追加的振幅平坦度算出部3201。其他的構成及動作,因為與第二實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
振幅平坦度算出部3201,算出沿著頻率軸的振幅變化,供給至驟變判斷部3209。鄰接的頻率間振幅變化小的頻率表示信號驟變。振幅變化,對於每頻帶或全頻率中任一,求出一平坦度也可以。具體而言,如以下的公式,求出表示平坦度的FM(平坦度量測)。x(n)係頻率n中的振幅或功率頻譜,N係平坦度算出區域內包含的頻率成分數量。
FM取0.0到1.0的值。完全平坦的情況下,FM係1.0。關於平坦度,在非專利文件3中揭示。
平坦度也可以利用另外的指標表示。例如,對於
每頻帶或全頻率中的任一,求出x(n)的平均,各頻率成分n中的x(n)與其平均值的階差平方值總和可以作為每頻帶或全頻率的平坦度。取代全頻率,單一或複數的頻帶中求出一個上述階差平方值總和,以此為平坦度也可以。因此,求出的平坦度在完全平坦時0.0,隨著平坦度下降取大的值。
另外的平坦度的指標,也可以使用平滑度。平滑度,可以以沿著頻率軸的鄰接樣品間的階差絕對值總和表現。凹凸多(不平滑)的波形取平滑度大的值,而凹凸少(平滑)波形取小的值。此指標係熟知的全變動量(TV:Total Variation)。
目前為止,雖然使用以沿著頻率軸的平坦度作為平坦度,但也可以利用沿著時間軸的平坦度。因為信號驟變部中振幅及功率急驟增加,利用此性質的話,沿著時間軸的平坦度低時,可以判斷為信號驟變存在。具體而言,現框架與緊接在前的框架的振幅或功率的差成為一定值以上時,判斷為平坦度低,即信號驟變存在。又,對於數框架過去的框架到現在的框架為止的複數框架,求出鄰接框架間的振幅或功率差,定義線形或非線形結合這些的結果為平坦度也可以。藉由使用過去的框架的資訊,變得容易檢測包含低通成分變形的信號驟變部,提高其抑制性能。又,計算鄰接框架的振幅或功率差之際,對每頻率成分、每頻帶或全頻率中任一計算也可以。又,對於單一或複數的頻帶,也可以計算上述振幅或功率差。例如,在單一的頻帶,特別在高頻區中藉由計算上述振幅或功率差,可以降低語音或其他信號的影響,可以更正確檢測信號驟變部。
目前為止說明的2個平坦度,即沿著頻率軸的平
坦度與沿著時間軸的平坦度,可以分別單獨使用,而且可以組合兩方使用。組合的範例,有根據2個平坦度的線形或非線形結合的信號驟變部檢測、或根據各平坦度的檢測結果組合等。頻率方向的平坦度大時,時間方向的平坦度小時,因為判斷為信號驟變的檢出,組合之際必須設法使哪邊為倒數後再組合等。
振幅平坦度算出部3203的本質功能係利用振幅的資訊,求出信號驟變的存在可能性,因此也可以以其他的方法代替。利用振幅資訊檢測信號驟變的技術,在非專利文件6、非專利文件7、非專利文件8中揭示。
驟變判斷部3209,利用傾斜的類似度(平行度)與振幅平坦度2個指標,判斷信號驟變。因為振幅沿著頻率軸是平坦(偏離小)時,認為信號驟變部的可能性高。根據信號驟變係脈衝性(短時間內振幅增加再減少)以及衝量的傅立葉轉換成為白色信號(全頻率中振幅及功率相等),這是顯而易見的。判斷的方法,例如可以選擇以下任一。
(1)平坦度與振幅平坦度都滿足各個條件時(例如,傾斜的階差值係N=0.1以下,振幅平坦度FM係M=0.8以上時),判斷為有信號驟變。
(1.5)單獨使用平行度與振幅平坦度時的判斷結果之邏輯和。算出信號驟變的存在可能性時,根據平行度的存在可能性與根據振幅平坦度的存在可能性中,根據較大(或較小)的一方判斷。
(2)平坦度與振幅平坦度兩方的平均滿足條件時(例如,傾
斜的階差值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)之間的平均AV1=(PX+QX)/2在0.1以下),判斷為有信號驟變。
(3)對於傾斜的階差值與振幅平坦度執行加權的同時,滿足合併兩方的複合條件的情況下(例如,傾斜的階差值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)之間的加權平均AV2=(0.8×PX+0.2×QX)在0.1以下),判斷為有信號驟變。
(4)利用線形或非線形函數,組合傾斜的階差值與振幅平坦度,當組合結果比一定值大時,判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(5)只使用傾斜的階差值與振幅平坦度之中任一更接近理想值的一方(階差值小的一方,平坦度大的一方),更接近理想值的一方滿足條件時,判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(6)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且振幅或功率頻譜平坦的話,減少傾斜的階差值的加權。
(7)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且輸入的惡化信號的振幅或功率頻譜比振幅或功率頻譜的最小值小時,暫時放大變更用以檢測信號驟變的臨界值,使檢出不易。
處理特定的信號時,例如檢測.抑制雜音小而接近衝量的衝擊音時,關於振幅或功率的資訊有時比相位資訊可以信賴。例如,安靜的環境中檢測手槍的開槍聲之際,只使用
振幅檢測也可以。另一方面,雜音的振幅或功率變化大時,例如,機場的警備中檢出開槍聲的情況下,安靜(雜音小)的狀況、及雜音大的狀況下,改變振幅與相位的加權是有效的。此時,振幅與相位的加權,根據雜音的有無或時間帶改變也可以。例如,可以從管制塔得到飛行時刻表的最新資訊的話,因為知道飛機的離著陸時刻,飛機來的時機(雜音多的時機)可以加大相位的加權用於開槍聲的檢測。因為開槍聲(檢測對象的衝擊音)以外的信號混合時,使用相位資訊的衝擊音檢測比使用振幅的檢測有效。
另一方面,雜音小的狀況下,重視輸入的惡化信號的頻率區域向量的絕對值即振幅值並判斷,可以有效檢測衝擊音。當然在此也可以取代振幅頻譜使用功率頻譜的值。又,根據信號的種類,衝擊音的振幅會有不平坦的情況。在此情況下,加大相位平坦度的加權並進行檢測,藉此可以高精確度檢測信號驟變。又,事前得到關於衝擊音的振幅或功率頻譜的資訊時,使用得到的資訊,為了得到與振幅平坦時相同的結果,也可以補正振幅平坦度的計算結果。具體而言,在各頻率成分中振幅頻譜2330乘以衝擊音的振幅或功率頻譜形狀的倒數後,算出振幅平坦度。
如以上說明,根據本實施例,合併使用振幅平坦度,可以檢測信號驟變部。因此,可以更正確檢測信號驟變(衝擊音),可以適當抑制其信號驟變(衝擊音)。
又,上述第六至九實施例中,雖然說明關於應用
信號驟變檢測方法於以抑制信號驟變部為目的的雜音抑制裝置之情況,但本發明不限於此。以檢測衝擊音(急劇上升再立刻下降的信號)為目的的各種裝置、系統及狀況中可以利用。又,即使信號急劇上升(或下降)並維持原狀的情況下,也可以檢測為驟變部。
例如,現在的聲音符號化方式(例如MPEG、AAC的符號化部)中,在稱作所謂起音(attack)的信號驟變部中,雖然採用不同於通常的資訊壓縮方式,但也可以適用於此時信號驟變部的檢測。信號驟變部中,由於變更分析窗長再抑制稱作pre-echo(前回聲)的先行雜音,檢測是必需的。相較於使用振幅或熵(entropy)的變化等檢測的方法,可以高精確度地檢測驟變,有效進行資訊壓縮。
又,如第33圖所示,也考慮車輛3300中安裝麥克風3301、計算部2381、2382、驟變判斷部2309、及影像記錄部3302的應用例。影像記錄部3302觸發衝擊音的檢測,並進行禁止改寫保存攝影機產生的攝影畫面的話,可以留下事故狀況的記錄。在此之際,從衝擊音檢測延遲一定時間後,執行禁止改寫保存也可以。不同於觸發衝擊本身的情況,衝擊小的情況下、或其他車輛遭遇事故的情況下也具有能執行自動記錄事故狀況的優點。
又,如第34圖所示,也考慮心電計3400連接計算部2381、2382、驟變判斷部2309及警報部3401的應用例。可以更正確且有效執行檢測心電圖的異常心跳。特別是雜音多的情況下有效。同樣地,也可以應用於胎兒回音的監視器。由
於雜音的妨礙,會有無法正確取得心音的情況,但此時本技術有效。即,可以廣泛應用於生物體信號的驟變檢測。
關於作為本發明第十一實施例的信號處理裝置3500,利用第35圖說明。信號處理裝置3500,係用以檢出輸入信號驟變的裝置。如第35圖所示,信號處理裝置3500包含轉換部3501、相關除去部3502及信號驟變檢測部3504。
轉換部3501,轉換輸入信號3510為頻率區域中的相位成分信號3520及振幅成分信號3530。
相關除去部3502,除去輸入信號3510內包含的某時間相關成分,產生比輸入信號3510時間相關小的低相關信號3550。
構成信號驟變的成分,不能根據過去的信號預測,時間相關小。另一方面,相關除去部3502中,除去信號驟變成分以外的時間相關大的成分,強調信號驟變成分。
相關除去,通常,由輸出計算的2個處理構成,係根據相關成分的預測與預測信號的輸入信號的減法運算產生的。預測,可以以過去的信號樣品的線形結合表示,線形結合的加權係數,即預測過濾的係數熟知有Levinson Durbin法、共分散法、最小平方法等。如此求出的預測過濾係數,預測誤差變最小
信號驟變檢測部3504,根據低相關信號3550與相位成分信號3520,判斷輸入信號3510內包含的驟變。
根據以上的構成,因為使用對應信號驟變成分的
低相關信號與相位成分信號,可以有效檢測輸入信號的驟變。
關於作為本發明第十二實施例的信號處理裝置3600,利用第36圖說明。信號處理裝置3600,係用以檢測輸入信號驟變的裝置。如第36圖所示,信號處理裝置3600包含轉換部3601、相關除去部3602、第1算出部3603、第2算出部3605及信號驟變判斷部3609。
轉換部3601,轉換輸入信號3610為頻率區域中的相位成分信號3620及振幅成分信號3630。相關除去部3602,除去輸入信號3610內包含的某時間相關成分,產生比輸入信號3610時間相關小的低相關信號3640,供給至第1算出部3603。第1算出部3603,根據低相關信號3640的時間區域中的驟增部的位置,算出相位傾斜3650。已傅立葉轉換孤立脈衝時的頻率方向的相位傾斜,對應孤立脈衝的位置求出唯一值是已知的。例如,轉換部中框架長度為N樣品且孤立脈衝位置為n0時,相位的傾斜成為-2πn0/N。例如可以使用振幅絕對值的最大值,作為用以辨識驟增部的指標。此指標,在實際信號接近孤立脈衝時(大致單峰性形狀),提供正確位置。另一方面,具有雙峰性形狀的脈衝時,振幅最大值不提供正確位置。在如此的情況下,使用振幅絕對值的最大值與振幅絕對值的第2大值的指標有效。例如,可以使用兩者的位置的中間值或兩者的位置的加權平均等。脈衝更沿著時間軸變廣時,藉由利用脈衝的大致中心部,可以求出正確位置。如此的指標中有重心。第2算出部3605,算出頻率區域中的相位成分信號3620的傾斜
3660。信號驟變判斷部3609,根據第1算出部3603算出的傾斜與第2算出部3605算出的傾斜,判斷輸入信號的驟變。
根據以上的構成,利用頻率區域中相位成分信號的傾斜與根據對應信號驟變成分的低相關信號的驟增部求出的相位傾斜之間的一致程度,可以有效檢測輸入信號的驟變。
<<全體構成>>
使用第37A到45圖說明關於作為本發明第十三實施例的雜音抑制裝置。本實施例的雜音抑制裝置,例如可以應用於數位攝影機、筆記型電腦、行動電話、鍵盤、遊戲機的控制器、行動電話的按鍵等的雜音抑制。即,對於重疊於其上的信號(雜音或妨礙信號),可以強調作為語音、音樂、環境音等目的的信號。但是,本發明不限於此,可以應用於要求檢測來自輸入信號驟變之全部信號處理裝置。又,本實施例中,說明關於檢測再抑制衝擊音的雜音抑制裝置,作為信號驟變的一範例。作為本實施例的雜音抑制裝置,例如,在麥克風附近按下按鍵等的操作形態中,適當抑制由於相關按鍵操作產生的衝擊音。簡單說明的話,包含衝擊音的時間區域信號轉換為頻率區域信號,並算出頻率空間中的相位成分傾斜。又,除去時間區域信號的相關得到的低相關信號的驟增部看作孤立脈衝時的頻率區域的相位傾斜,即求出-2πn0/L。n0係驟增部的位置。於是,根據這2種類的相位傾斜的一致程度,判斷衝擊音的存在。
第37A圖係顯示雜音抑制裝置3700的全體構成方塊圖。對輸入端子3706,供給惡化信號(所希望信號與雜音的
混合信號)作為樣品值系列。對輸入端子3706供給的惡化信號,在轉換部3701中施行傅立葉轉換等的轉換,分割成複數的頻率成分。複數的頻率成分係每頻率獨立處理。在此,注意特定的頻率成分,繼續說明。頻率成分中振幅頻譜(振幅成分)3730供給至雜音抑制部3705,而相位頻譜(相位成分)3720供給至相位控制部3702及算出部3781。又,供給至輸入端子3706的惡化信號,以相關除去部3712除去相關成分成為低相關信號3770,供給至算出部3782。在此雖然轉換部3701供給惡化信號振幅頻譜3730至雜音抑制部3705,但本發明不限於此,也可以供給相當於振幅頻譜平方的功率頻譜至雜音抑制部3705。
雜音抑制部3705,使用轉換部3701供給的惡化信號振幅頻譜3730,推斷雜音,並產生推斷雜音頻譜。又,雜音抑制部3705,使用轉換部3701供給的惡化信號振幅頻譜3730及產生的推斷雜音頻譜,抑制雜音,作為雜音抑制結果的強調信號頻譜傳達至振幅控制部3703。又,雜音抑制部3705,從驟變判斷部3709輸入判斷結果,並根據有無信號驟變或其程度,變更雜音的抑制程度。雜音抑制部3705,利用目的音檢測保護的同時,衝擊檢測時置換振幅為推斷背景音。
相位控制部3702,旋轉(位移)轉換部3701供給的惡化信號相位頻譜3720,並作為強調信號相位頻譜3740供給至逆轉換部3704。又,傳達相位的旋轉量(位移量)至振幅控制部3703。振幅控制部3703從相位控制部3702接受旋轉量(位移量),算出振幅補正量,並使用其振幅補正量,補正各頻率
強調信號振幅頻譜,並供給補正振幅頻譜3750至逆轉換部3704。逆轉換部3704,合成相位控制部3702供給的強調信號相位頻譜3740及振幅控制部3703供給的補正振幅頻譜3750再進行逆轉換,並作為強調信號供給至輸出端子3707。
算出部3781,根據以頻率微分轉換部3701供給的相位成分信號3720,算出各頻率中的相位傾斜(變化)。另一方面,算出部3782,輸入分割為框架的低相關信號3770,算出框架的信號絕對值,並根據顯示信號絕對值的驟增部,算出頻率區域的相位傾斜。
驟變判斷部3709,比較算出部3781、3782提供的相位傾斜,並根據這些類似度,判斷每頻率點信號驟變是什麼程度的存在(存在可能性)。具體而言,從算出部3781、3782,輸入對應相位成分信號的旋轉向量,並算出這2個旋轉向量之間的旋轉向量,其絕對值接近0時(預定的臨界值0.1以下時),判斷信號驟變存在。
傾斜的類似度,可以使用根據時間區域信號求出的傾斜與根據頻率區域信號求出的傾斜的階差絕對值,但不限定於此。也可以使用這2個傾斜的比值與1之間的距離、或兩者和,以哪一方的傾斜的2倍正式化的值與1之間的距離等。根據類似度的存在可能性,例如可以如以下求出。首先,決定正值為臨界值。階差絕對值比此臨界值大時,存在可能性假設為0。又,階差絕對值等於0時,存在可能性假設為1。存在可能性的一般值定義為階差絕對值的函數。如此的函數最簡單為為直線。存在可能性,定為與階差絕對值成正比的值。直線
傾斜與y軸截距(上述階差絕對值為0時的函數值),定為滿足上述階差絕對值等於0及1時的邊界條件。函數,也可以使用任意的線形或非線形函數或多項式等。
<<相關除去部的構成>>
第37B、37C圖係顯示相關除去部3712的構成方塊圖。如第37B圖所示,相關除去部3712包含預測部3783、減算器3784及框架分割部3785。供給惡化信號樣品3710至預測部3783,預測部3783預測某相關信號3786並供給至減算器3784。預測的方法,使用適應過濾的線形預測或Levinson Durbin法等是已知的。減算器3784,從惡化信號3710減去預測部3783供給的預測信號3786,其差作為低相關信號3787供給至框架分割部3785。框架分割部3785,對於低相關信號3787施行框架分割,作為框架化低相關信號3770輸出。
第37C圖與第37B圖不同,首先執行框架分割之後,執行預測也可以。顯示框架分割後執行預測的構成。第37C圖包含框架分割部3795、預測部3793及減算器3794。框架分割部3795,對惡化信號3710施行框架分割,供給分割的信號樣品3796至預測部3793及減算器3794。預測部3793,預測框架化的惡化信號3796內包含的某相關信號,供給至減算器3794。減算器3794,從框架化的惡化信號3796減去預測部3793供給的預測信號3797輸出其差作為框架化低相關信號3770。
<<轉換部的構成>>
第38A圖係顯示轉換部3701的構成方塊圖。如第38A圖所示,轉換部3701包含框架分割部3801、開視窗處理部
(windowing unit)3802、及傅立葉轉換部3803。惡化信號樣品,供給至框架分割部3801,分割為每K/2樣品的框架。在此,K為偶數。分割為框架的惡化信號樣品3804,供給至開視窗處理部3802,進行與窗函數(window function)w(t)的乘法運算。對於第n框架的輸入信號yn(t)(t=0,1,...,K/2-1),以w(t)開視窗(windowing)的信號,以次式提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。重疊長度,假設框架長度的50%為重疊長度的話,對於t=0,1,...,k/2-1,由以下公式得到的左邊,成為開視窗處理部3802的輸出。
對於實數信號,使用左右對稱窗函數。又,窗函數,設計為轉換部3701的輸出直接供給至逆轉換部3704時的輸入信號與輸出信號除了計算誤差之外為一致。這是指成為w2(t)+w2(t+K/2)=1。
之後,以連續2框架重疊50%再開視窗的情況為例繼續說明。例如,可以使用以下式(3)表示的漢寧(Hanning)窗作為w(t)。
此外,已知漢寧(Hanning)窗、三角窗等各種窗函數。開視窗的輸出供給至傅立葉轉換部3803,並轉換為惡化信號頻譜Yn(k)。惡化信號頻譜Yn(k)分離為相位與振幅,惡化信號相位頻譜argYn(k)供給至相位控制部3702和計算部3781,而惡化信號振幅頻譜|Yn(k)|供給至雜音抑制部3705。如同已說明地,也可以利用功率頻譜取代振幅頻譜。
<<逆轉換部的構成>>
第38B圖係顯示逆轉換部3704的構成方塊圖。如第38B圖所示,逆轉換部3704包含逆傅立葉轉換部3811、開視窗處理部3812、及框架合成部3813。逆傅立葉轉換部3811,對振幅控制部3703供給的強調信號振幅頻譜3750與相位控制部3702供給的強調信號相位頻譜3740(argXn(k))進行乘法運算,求出強調信號(以下公式的左邊)。
對得到的強調信號施行逆傅立葉轉換,1框架包含k樣品的時間區域樣品值系列xn(t)(t=0,1,...,K-1),供給至開視窗處理部3812,進行與窗函數w(t)的乘法運算。對於第n框架的輸入信號xn(t)(t=0,1,...,K/2-1),以w(t)開視窗的信號,由次式的左邊提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。假設框架長度的50%為重疊長度的話,對於t=0,1,...,k/2-1,以下公式的左邊,成為開視窗處理部3812的輸出,傳達至框架合成部3813。
框架合成部3813,每K/2樣品取出來自開視窗處理部3812的鄰接2框架的輸出再重疊,根據以下的公式,得到t=0,1,...,k-1中的輸出信號(公式的左邊)。得到的強調信號3760,從框架合成部3813傳達至輸出端子3707。
又,第38A圖與第38B圖中說明轉換部與逆轉換部中的轉換為傅立葉轉換,但取代傅立葉轉換,使用阿達瑪轉換(Hadamard transform)、哈爾轉換(Haar transform)、小波轉換(wavelet transform)等其他的轉換也可以。哈爾轉換(Haar transform)不用乘法運算,可以縮小LSI(大型積體電路)化時的面積。小波轉換(wavelet transform),因為根據頻率可以變更時間解析度為不同,可以期待提高雜音抑制效果。
又,複數統合轉換部3701中得到的頻率成分之
後,以雜音抑制部3705可以進行實際的抑制。在此之際,從聽覺特性的辨別能力高的低頻率區域,往能力低的高頻率區域,經由統合更多的頻率成分,可以達成高音質。於是,統合複數的頻率成分之後實行雜音抑制時,應用雜音抑制的頻率成分的數量變少,可以削減全體的演算量。
<<雜音抑制部的構成>>
雜音抑制部3705,使用轉換部3701供給的惡化信號振幅頻譜,推斷雜音,並產生推斷雜音頻譜。於是,使用來自轉換部3701的惡化信號振幅頻譜與產生的推斷雜音頻譜,求出抑制係數,乘以惡化信號振幅頻譜,作為強調信號振幅頻譜,供給至振幅控制部3703。
又,從驟變判斷部3709,接受驟變是什麼程度的存在之資訊(信號驟變存在的可能性、存在可能性),並根據信號驟變存在的可能性,也可以變更雜音抑制的程度。又,信號驟變存在的可能性以頻率成分、頻帶(統合任意數連續的頻率成分)、或框架單位判斷,上述頻率成分、頻帶或框架單位中可以實施應抑制其驟變的不同信號處理。
對於雜音的推斷,可以利用非專利文件1或非專利文件2中記載的方法等各種推斷方法。
例如,非專利文件1中,揭示以推斷雜音頻譜為目的音不產生的框架的惡化信號振幅頻譜的平均值之方法。此方法必須檢測目的音的產生。目的音產生的區間,可以以強調信號的功率判斷。
理想的動作狀態,係強調信號成為雜音以外的目
的音。又,目的音或雜音的水準,在鄰接框架間沒有大變化。根據這些,以1框架過去的強調信號水準作為雜音區域判斷的指標。1框架過去的強調信號功率在一定值以下時,判斷現框架為雜音區間。藉由平均化判斷為雜音區間的框架的惡化信號振幅頻譜,可以推斷雜音頻譜。
又,非專利文件1中,也揭示推斷雜音頻譜作為開始供給惡化信號振幅頻譜的推斷初期的平均值之方法。在此情況下,緊接著開始推斷後,必須滿足不含目的音的條件。滿足條件的情況下,推斷初期的惡化信號振幅頻譜可以作為推斷雜音頻譜。
又,非專利文件2中,揭示從統計的惡化信號振幅頻譜的最小值求出推斷雜音頻譜之方法。此方法,保持統計的一定時間內惡化信號振幅頻譜的最小值,根據其最小值推斷雜音頻譜。惡化信號振幅頻譜的最小值,因為與雜音頻譜的頻譜形狀相似,可以用作雜音頻譜形狀的推斷值。不過,最小值,變得比原來的雜音水準小。因此,適當增幅最小值用作推斷雜音頻譜。
雜音抑制部3705中,可以進行各種抑制,例如以SS(Spectrum Subtraction:頻譜減法運算)法與MMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小平方平均誤差短時間振幅頻譜推斷)法為代表。SS法的情況,係轉換部3701供給的惡化信號振幅頻譜減去推斷雜音頻譜。MMSE STSA法的情況,係使用轉換部3701供給的惡化信號振幅頻譜與產生的推斷雜音頻譜,計
算抑制係數,此抑制係數乘以惡化信號振幅頻譜。決定此抑制係數為最小化強調信號的平均平方功率。
又,雜音抑制部3705從驟變判斷部3709輸入驟變判斷結果(信號的驟變是否存在的資訊),根據信號有無驟變或其程度,變更雜音抑制的程度。例如,有信號驟變的頻率成分、頻帶或框架單位中,可以施行應抑制其驟變的信號處理。
以驟變判斷部3709判斷為驟變時,惡化信號振幅頻譜與推斷雜音頻譜中小的一方,作為強調信號振幅頻譜,供給至振幅控制部3703。即,惡化信號振幅頻譜比推斷雜音頻譜小時,原封不動輸出惡化信號振幅頻譜,除此以外時,也可以以推斷雜音頻譜替換輸入信號再輸出。
又,替換之前,檢測重要的惡化信號振幅頻譜成分,並可以從推斷雜音頻譜產生的替換對象除去檢測的重要惡化信號振幅頻譜成分。作為檢測重要的惡化信號振幅頻譜成分之際的重要度指標,可以利用惡化信號振幅頻譜的大小。關聯於振幅大的成分為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。
又,作為重要度的指標,也可以利用惡化信號振幅頻譜的峰值性。峰值,即沿著頻率軸具有比周邊大的值之惡化信號振幅,關聯於作為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。特別是,顯著的峰值,即比周邊的振幅值顯著大的振幅值,因為其重要度高,確實保護可以更提高作為目的的信號音質。
峰值的檢測,例如,非專利文件3的純音成分檢
測方法或在非專利文件4中揭示其方法。又,根據既定的條件評估檢測的峰值,不滿足條件的峰值除外也可以。例如,取得比上述推斷雜音小的值之峰值,作為目的的信號之可能性低。即,推斷雜音作為基準,只要比推斷雜音足夠大作為峰值留下,除此以外可以除外。是否足夠大,經由與推斷雜音的定數倍比較,可以判斷。於是,評估檢測的峰值是否滿足既定的條件之後,經由選擇最終的峰值成分,可以降低錯誤的峰值檢測,並提高信號驟變部的抑制效果。
又,根據驟變存在的可能性,也可以變化供給至振幅控制部3703的信號。執行上述替換的結果與惡化振幅頻譜對應驟變存在的可能性而混合,並作為強調信號振幅頻譜輸出。驟變存在的可能性愈高,執行上述替換的結果加權愈大,執行上述混合處理。
即,雜音抑制部3705,根據信號驟變的存在可能性,可以執行如抑制度0、抑制度1、抑制度2的多段抑制。或是,根據驟變判斷部的判斷結果(例如0~1的數值),也可以無階段地改變抑制程度。
<<相位控制部及振幅控制部的構成>>
第39圖係顯示相位控制部3702及振幅控制部3703的構成方塊圖。如第39圖所示,相位控制部3702包含相位旋轉部3901與旋轉量產生部3902,而振幅控制部3703包含補正量算出部3903與振幅補正部3904。
旋轉量產生部3902,關於驟變判斷部3709判斷為「信號驟變存在」的頻率成分,產生惡化信號相位頻譜的旋轉
量,供給至相位旋轉部3901與補正量算出部3903。相位旋轉部3901,當旋轉量產生部3902供給旋轉量時,對轉換部3701供給的惡化信號相位頻譜3720只旋轉(位移)供給的旋轉量,並作為強調信號相位頻譜3740供給至逆轉換部3704。
補正量算出部3903,根據旋轉量產生部3902供給的旋轉量,決定振幅的補正係數,並供給至振幅補正部3904。
旋轉量產生部3902,例如以隨機變數產生旋轉量。根據隨機變數,以各頻率旋轉惡化信號相位頻譜時,惡化信號相位頻譜3720的形狀變化。根據此形狀變化,可以減弱衝擊音等的信號驟變部的特徵。
隨機變數中,具有其產生機率相同的同樣隨機變數、或發生機率表示正式分佈的正式隨機變數等,首先,說明同樣隨機變數產生的旋轉量產生法。同樣隨機變數可以以線性同餘法等產生。例如,以線性同餘法產生的同樣隨機變數,在0~(2^M)-1的範圍內同樣分佈。在此,M係任意的整數,^表示指數。相位的旋轉量ψ必須在0~2π的範圍內分佈。因此,轉換產生的同樣隨機變數。轉換由以下公式)進行。在此,R係同樣隨機變數,Rmax係其同樣隨機變數能夠產生的最大值。以上述的線性同餘法產生的情況下,成為Rmax=(2^M)-1。
為了計算的簡單化,R值可以原封不動作為旋轉量。由於是旋轉量,2π表示正好一轉。相位旋轉2π的情況與
未旋轉的情況相同。因此,所謂2π+α的旋轉量,與旋轉量為α的情況相同。在此,雖說明以線性同餘法產生同樣隨機變數的情況,但以此外的方法產生同樣隨機變數的情況,也根據上式求出旋轉量ψ即可。根據驟變判斷部3709的判斷結果,也可以決定何時進行何種程度的隨機變數化。
相位旋轉部3901,從旋轉量產生部3902接受旋轉量,使惡化信號相位頻譜旋轉。如果,惡化信號相位頻譜以角度表現的情況下,可以以此角度加上旋轉量ψ的值旋轉。惡化信號相位頻譜以複數(complex number)的正式向量表現的情況下,求出旋轉量ψ的正式向量,並乘以惡化信號相位頻譜,藉此可以旋轉。
旋轉量ψ的正式向量由以下公式求出。在此,ψ係旋轉向量,j以sqrt(-1)表示。又,sqrt表示平方根。
由於根據補正量算出部3903的補正係數算出法與關於第5圖的補正量算出部503的說明方法相同。在此省略說明。
<<算出部及驟變判斷部的構成>>
第40圖係用以說明算出部3781、3782及驟變判斷部3709的內部構成圖。如第40圖所示,算出部3782具有驟增部檢測部4001、延遲時間算出部4002、相位轉換部4003及傾斜算出部4004。另一方面,算出部3781具有傾斜算出部4005。
驟增部檢測部4001,算出框架內信號的絕對值,並檢測其絕對值的最大值4010。延遲時間算出部4002,輸出顯示框架內最大值的相對位置(從框架開始到最大值存在存在的時機為止的時間)作為n0。
其次,相位轉換部4003,轉換延遲時間τ4020為頻率區域的相位。具體而言,根據以下的公式轉換。在此,L係轉換部3701的框架長度,0≦n0≦L-1。假設輸入為振幅a的孤立脈衝時,經由傅立葉轉換得到的第k個頻率成分D(k),以次式提供。
D(k)=a‧exp(-jθ(k))θ(k)=-2π‧k‧n0/L
傾斜算出部4004,微分如此導出的相位4030,並如下導出頻率區域中的相位傾斜4040。傾斜4040=-2π‧n0/L
另一方面,傾斜算出部4005,微分從轉換部3701輸入的相位成分信號,導出頻率區域中的相位傾斜4050。傾斜算出部4004、4005,分別根據相位頻率產生的微分算出傾斜也可以,以其他的方法算出傾斜也可以。
平行度算出部4006,比較每頻率傾斜算出部4004提供的傾斜4040與傾斜算出部4005提供的傾斜4050,算出其傾斜類似度。即,頻率區域中的相位成分信號,在對於算出部3782算出的直線之算出部3781算出的直線之平行度在各頻率中算出。驟變判斷部4007中,如此的平行度超過一定值的話,判斷在其頻率中存在信號的驟變。
在此,並非每頻率而是每頻帶(子頻帶)或框架判斷時,根據更全局的判斷,可以降低由於信號驟變成分以外的
相位成分產生的判斷錯誤。又,利用每頻帶或每框架的判斷結果,修正每頻率的判斷結果也可以。例如,某頻帶的判斷結果係「信號驟變存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。相反地,某頻帶的判斷結果為「信號驟變不存在」時,藉由強制設定其頻帶內的全頻率判斷結果為「信號驟變不存在」,可以降低其他信號成分的妨礙產生的判斷錯誤。或者,上述頻帶內的各頻率中,往容易判斷判斷容易度(臨界值)為存在的方向修正,維持獨自執行各頻率判斷之構成自體也可以。每頻率或每頻帶求出判斷結果時,每頻率或每頻帶可以抑制驟變,成為可以進行更高精確度的抑制。
驟變判斷部3709,輸出有信號驟變(1)或無信號驟變(0),作為判斷結果4030。但是,驟變判斷部4007輸出與平行度對應的0與1之間的值作為驟變存在可能性時,判斷結果4030成為表示驟變存在可能性的0與1之間的值。在此情況下,可以得到包含信號驟變存在的可能性。
第41圖係圖形顯示相位及其變化量。頻率區域中,沿著頻率軸,相位如圖形4101變化時,其相位變化量,在頻率區域中,沿著頻率軸,如圖形4102所示地變化。
另一方面,根據驟增部的框架內相對位置,可以算出在頻率區域中顯示為直線4103的相位。
本實施例中,根據相位成分信號4101與直線4103平行的部分有多少,判斷信號驟變的存在。
取相位傾斜為縱軸,取頻率為橫軸時,近似直線
4103傾斜的範圍,以範圍4104顯示。因此,範圍4104與圖形4102重疊的部分4105比既定的臨界值大時,驟變判斷部4007判斷信號驟變存在。
第42圖係使用軟體實現本實施例的雜音抑制裝置3700時,關於硬體構成的說明圖。
雜音抑制裝置3700,包括處理器4210、ROM(唯讀記憶體)4220、RAM(隨機存取記憶體)4240、儲存器4250、輸出入界面4260、操作部4261、輸入部4262及輸出部4263。雜音抑制裝置3700,也可以包括攝影機4264。處理器4210係中央處理部,經由執行各種程式,控制雜音抑制裝置3700全體。
ROM(唯讀記憶體)4220,除了處理器4210最初應執行的開機程式之外,還記憶各種參數等。RAM4240,除了未圖示的程式載入區域之外,還有記憶輸入信號310、相位成分信號320、振幅成分信號330、強調信號360等的區域。又,RAM4240,還有記憶振幅最大值時機4010、延遲時間4020、相位信號4030及相位傾斜4040、4050等的區域。
又,儲存器4250,收納雜音抑制程式4251。雜音抑制程式4251,包含轉換模組、相位控制模組、振幅控制模組、逆轉換模組、雜音抑制模組、相位傾斜算出模組及驟變判斷模組。藉由處理器4210實行雜音抑制程式4251內包含的各模組,可以實現第3A圖的轉換部301、相位控制部302、振幅控制部303、逆轉換部304、雜音抑制部305、算出部381、382、驟變判斷部309的各功能。又,儲存器4250也可以收納雜音
資料庫。
關於處理器4210實行的雜音抑制程式4251的輸出的強調信號,經由輸出入界面4260,從輸出部4263輸出。因此,例如,可以抑制從輸入部4262輸入的操作部4261的操作音等。又,檢測從輸入部4262輸入的輸入信號中包含信號驟變,再開始攝影機4264的攝影等的應用法也可以。
第43A圖係用以說明上述雜音抑制程式4251產生的信號驟變判斷處理流程之流程圖。首先,步驟S4301中,在相關除去部312、算出部382中,開始對應低相關信號的驟增部之相位傾斜算出處理。步驟S4303中,在算出部381中,開始頻率區域中的相位傾斜算出處理。
其次,步驟S4305中,待機到步驟S4301及步驟S4303兩方算出傾斜,如果兩方的做法可以算出傾斜的話,進行到步驟S4307,比較每頻率算出的傾斜。步驟S4309中,判斷傾斜的階差絕對值是否在既定的臨界值N以下,如果N以下的話,進行至步驟S4311,關於其頻率k,立下標幟(假設I(k)=1)。另一方面,不是N以下時,步驟S4313中,假設I(k)=0。步驟S4315中判斷k=F(F為框架全體的頻率成分數),不是k=F的話,進行至步驟S4317,以k=k+1回到步驟S4307,遍及框架全體每頻率進行傾斜比較。最終,步驟S4319中,判斷成為I(k)=1的k的頻率中有信號驟變,並供給判斷結果至雜音抑制部3705及相位控制部302。又,改變至步驟S4319,框架內累計I(k),且I(k)的累計值超過既定的臨界值時,驟變判斷部3709判斷為包含信號驟變的框架也可以。又,在此
之際,在下一頻帶中殘留累計驟變判斷結果也可以。
又,作為殘留作用,可以設定接續框架中的臨界值大。經由如此設定接續框架的臨界值,容易檢測信號驟變(例如衝擊音),可以降低檢測遺漏。
第43B圖係用以說明相關除去部3712及算出部3782執行的傾斜算出處理流程的流程圖。首先,步驟S4321中輸入信號時,進行至步驟S4322,相關除去部3712預測輸入信號310內包含的某時間相關成分並除去,低相關信號產生後,執行框架分割。步驟S4325中,驟增部檢測部4001檢測低相關信號的驟增部。步驟S4327中,延遲時間算出部4002輸出驟增部的框架內相對位置(框架開始到驟增存在時機為止的時間)作為n0。
其次,步驟S4329中,相位轉換部4003轉換延遲時間n04020為頻率區域的相位。步驟S4331中,傾斜算出部4004,微分導出的相位,導出頻率區域中的相位傾斜,在步驟S4333中緩衝。
第43C圖係用以說明算出部3781執行的傾斜算出處理流程的流程圖。步驟S4351中輸入信號時,進行至步驟S4353,經過框架分割、窗處理,以傅立葉轉換,抽出頻率區域中的相位成分信號。其次在步驟S4355中,設定頻率的步驟k為1時,在步驟S4357中,微分相位P(k),算出傾斜△P(k),在步驟S4359中,緩衝其傾斜。步驟S4361中,判斷k=F(F係框架全體的頻率成分數)。不是k=F的話,進行到步驟S4363,以k=k+1回到步驟S4357,遍及框架全體算出每頻
率傾斜。
根據以上的處理,因為利用除去相關的低相關信號,推斷信號驟變部中的相位傾斜,所以輸入信號內包含某時間相關成分的狀況時,可以大幅提高信號驟變的檢測精確度。例如,音樂以大音量響起的狀況下,有信號驟變時,根據本實施例的方法,可以大幅提高其檢測精確度。結果,可以更正確檢測信號驟變,成為可以適當抑制其驟變。又,本實施例中,雖然以微分值求出相位的傾斜,但求出單位向量的旋轉量等其他的指標用於判斷也可以。
其次,關於本發明第十四實施例的雜音抑制裝置,利用第44圖說明。第44圖,係用以說明本實施例的雜音抑制裝置4400的功能構成圖。本實施例的雜音抑制裝置4400,相較於上述第十三實施例,不同點係相關除去部3712與算出部3782之間設置開視窗部4486。其他的構成及動作,因為與第十三實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
與上述說明相同,根據本實施例,使用從開視窗後的時間區域信號,即與用於傅立葉轉換的信號相同的信號求出的傾斜,可以求出平行度。因此,與使用頻率區域信號求出的相位傾斜的整合性變高,可以進行更正確的信號驟變判斷。
其次,關於本發明第十五實施例的雜音抑制裝置4500,利用第45圖說明。第45圖,係用以說明本實施例的雜
音抑制裝置4500的功能構成圖。本實施例的雜音抑制裝置4500,相較於上述第十三實施例,不同點係具有追加的振幅平坦度算出部4501。其他的構成及動作,因為與第十三實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
振幅平坦度算出部4501,算出沿著頻率軸的振幅變化,供給至驟變判斷部4509。鄰接的頻率間振幅變化小的頻率表示信號驟變。振幅變化,對於每頻帶或全頻率中任一,求出一平坦度也可以。具體而言,如以下的公式,求出表示平坦度的FM(平坦度量測)。x(n)係頻率n中的振幅或功率頻譜,N係平坦度算出區域內包含的頻率成分數量。
FM取0.0到1.0的值。完全平坦的情況下,FM係1.0。關於平坦度,在非專利文件3中揭示。
平坦度也可以利用另外的指標表示。例如,對於每頻帶或全頻率中的任一,求出x(n)的平均,各頻率成分n中的x(n)與其平均值的階差平方值總和可以作為每頻帶或全頻率的平坦度。取代全頻率,單一或複數的頻帶中求出一個上述階差平方值總和,以此為平坦度也可以。因此,求出的平坦度在完全平坦時0.0,隨著平坦度下降取大的值。
另外的平坦度的指標,也可以使用平滑度。平滑度,可以以沿著頻率軸的鄰接樣品間的階差絕對值總和表現。
凹凸多(不平滑)的波形取平滑度大的值,而凹凸少(平滑)波形取小的值。此指標係熟知的全變動量(TV:Total Variation)。
目前為止,雖然使用以沿著頻率軸的平坦度作為平坦度,但也可以利用沿著時間軸的平坦度。因為信號驟變部中振幅及功率急劇增加,利用此性質的話,沿著時間軸的平坦度低時,可以判斷為信號驟變存在。具體而言,現框架與緊接在前的框架的振幅或功率的差成為一定值以上時,判斷為平坦度低,即信號驟變存在。又,對於數框架過去的框架到現在的框架為止的複數框架,求出鄰接框架間的振幅或功率差,定義線形或非線形結合這些的結果為平坦度也可以。藉由使用過去的框架的資訊,變得容易檢測包含低通成分變形的信號驟變部,提高其抑制性能。又,計算鄰接框架的振幅或功率差之際,對每頻率成分、每頻帶或全頻率中任一計算也可以。又,對於單一或複數的頻帶,也可以計算上述振幅或功率差。例如,在單一的頻帶,特別在高頻區中藉由計算上述振幅或功率差,可以降低語音或其他信號的影響,可以更正確檢測信號驟變部。
目前為止說明的2個平坦度,即沿著頻率軸的平坦度與沿著時間軸的平坦度,可以分別單獨使用,而且可以組合兩方使用。組合的範例,係根據2個平坦度的線形或非線形結合的信號驟變部檢測、或根據各平坦度的檢測結果組合等。頻率方向的平坦度大時,時間方向的平坦度小時,因為判斷為信號驟變的檢出,組合之際必須設法使哪邊為倒數後再組合等。
驟變判斷部4509,利用傾斜的類似度(平行度)與
振幅平坦度2個指標,判斷信號驟變。因為振幅沿著頻率軸是平坦(偏離小)時,認為信號驟變部的可能性高。根據信號驟變係脈衝性(短時間內振幅增加再減少)以及衝量的傅立葉轉換成為白色信號(全頻率中振幅及功率相等),這是顯而易見的。判斷的方法,例如可以選擇以下任一。
(1)平坦度與振幅平坦度都滿足各個條件時(例如,傾斜的階差值係N=0.1以下,振幅平坦度FM係M=0.8以上時),判斷為有信號驟變。
(2)單獨使用平行度與振幅平坦度時的判斷結果之邏輯和。算出信號驟變的存在可能性時,根據平行度的存在可能性與根據振幅平坦度的存在可能性中,根據較大(或較小)的一方判斷。
(3)平坦度與振幅平坦度兩方的平均滿足條件時(例如,傾斜的階差值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)之間的平均AV1=(PX+QX)/2在0.1以下),判斷為有信號驟變。
(4)對於傾斜的階差值與振幅平坦度執行加權的同時,滿足合併兩方的複合條件的情況下(例如,傾斜的階差值PX、以及振幅平坦度FM與1.0的階差值QX=(1.0-FM)之間的加權平均AV2=(0.8×PX+0.2×QX)在0.1以下),判斷為有信號驟變。
(5)利用線形或非線形函數,組合傾斜的階差值與振幅平坦度,當組合結果比一定值大時,判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(6)只使用傾斜的階差值與振幅平坦度之中任一更接近理想值的一方(階差值小的一方,平坦度大的一方),更接近理想值的一方滿足條件時,判斷為有信號驟變。包含時間方向的振幅平坦度時,使用其倒數代替。
(7)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且振幅或功率頻譜平坦的話,減少傾斜的階差值的加權。
(8)得到關於要事前檢測的驟變信號的振幅或功率頻譜之資訊,且輸入的惡化信號的振幅或功率頻譜比振幅或功率頻譜的最小值小時,暫時放大變更用以檢測信號驟變的臨界值,使檢出不易。
處理特定的信號時,例如檢測.抑制雜音小而接近衝量的衝擊音時,關於振幅或功率的資訊有時比相位資訊可以信賴。例如,安靜的環境中檢測手槍的開槍聲之際,只使用振幅檢測也可以。另一方面,雜音的振幅或功率變化大時,例如,機場的警備中檢測開槍聲的情況下,安靜(雜音小)的狀況、及雜音大的狀況下,改變振幅與相位的加權是有效的。此時,振幅與相位的加權,根據雜音的有無或時間帶改變也可以。例如,可以從管制塔得到飛行時刻表的最新資訊的話,因為知道飛機的離著陸時刻,飛機來的時機(雜音多的時機)可以加大相位的加權用於開槍聲的檢測。因為開槍聲(檢測對象的衝擊音)以外的信號混合時,使用相位資訊的衝擊音檢測比使用振幅的檢測有效。另一方面,雜音小的狀況下,重視輸入的惡化信號的頻率區域向量的絕對值即振幅值並判斷,可以有效檢測衝擊音。當然在此也可以取代振幅頻譜使用功率頻譜的
值。又,根據信號的種類,衝擊音的振幅會有不平坦的情況。在此情況下,加大相位平坦度的加權並進行檢測,藉此可以高精確度檢測信號驟變。又,事前得到關於衝擊音的振幅或功率頻譜的資訊時,使用得到的資訊,為了得到與振幅平坦時相同的結果,也可以補正振幅平坦度的計算結果。具體而言,在各頻率成分中振幅頻譜3730乘以衝擊音的振幅或功率頻譜形狀的倒數後,算出振幅平坦度。
如以上說明,根據本實施例,合併使用振幅平坦度,可以檢測信號驟變部。因此,可以更正確檢測信號驟變(衝擊音),可以適當抑制其信號驟變(衝擊音)。
關於作為本發明第十六實施例的信號處理裝置4600,利用第46圖說明。信號處理裝置4600,係用以檢測輸入信號驟變的裝置。
如第46圖所示,信號處理裝置4600包含轉換部4601、直線性計算部4602及信號驟變判斷部4604。轉換部4601,轉換輸入信號4610為頻率區域中的相位成分信號4620及振幅成分信號4630。直線性計算部4602,計算相位成分信號4620的直線性4640。又,信號驟變判斷部4604,根據直線性計算部4602計算的直線性4640,計算輸入信號驟變的存在可能性(推斷的存在機率)。
由以上的構成,根據頻率區域中的相位成分信號是什麼程度的直線,可以高精確度地檢測輸入信號的驟變。
<<全體構成>>
關於本發明第十七實施例的雜音抑制裝置,利用第47至54圖說明。本實施例的雜音抑制裝置,例如可以應用於數位相機、筆記型電腦、行動電話、鍵盤、遊戲機的控制器、行動電話的按鍵等的雜音抑制。即,對於重疊於其上的信號(雜音或妨礙信號),可以強調作為語音、音樂、環境音等目的的信號(所希望信號)。但是,本發明不限定於此,可以應用於被要求檢測來自輸入信號的信號驟變之所有信號處理裝置。又,本實施例中,說明關於檢測衝擊音並抑制的雜音抑制裝置,作為信號驟變的一範例。作為本實施例的雜音抑制裝置,例如,形成麥克風附近的按鍵押下等的操作形態中,適當抑制相關按鍵操作產生的衝擊音。簡單說明的話,轉換包含衝擊音的時間區域信號為頻率區域信號,並計算出對於頻率空間的相位成分的直線性。於是,根據直線性的高度(傾斜的偏離),計算衝擊音的存在可能性(推斷的存在機率)。
第47圖係顯示雜音抑制裝置4700的全體構成方塊圖。對輸入端子4706,供給惡化信號(所希望信號與雜音的混合信號),作為樣品值系列。對輸入端子4706供給的惡化信號,在轉換部4701中施行傅立葉轉換等的轉換,分割成複數的頻率成分。複數的頻率成分係每頻率獨立處理。在此,注意特定的頻率成分,繼續說明。頻率成分中的振幅頻譜(振幅成分)4730供給至雜音抑制部4705,相位頻譜(相位成分)4720供給至相位控制部4702及直線性計算部4708。又,在此雖然轉換部4701供給惡化振幅頻譜4730至雜音抑制部4705,但本發
明不限於此,供給相當於其平方的功率頻譜至雜音抑制部4705也可以。
雜音抑制部4705,使用轉換部4701供給的惡化信號振幅頻譜4730,推斷雜音,產生推斷雜音頻譜。又,雜音抑制部4705,利用轉換部4701供給的惡化信號振幅頻譜4730、與產生的推斷雜音頻譜,抑制雜音,作為雜音抑制結果的強調信號頻譜傳達至振幅控制部4703。又,雜音抑制部4705,從驟變判斷部4709輸入判斷結果,根據信號的有無驟變或其程度,以不同的強度抑制雜音。雜音抑制部4705執行所希望信號的檢測保護每頻率所希望信號成分的同時,信號驟變存在,且未檢出所希望信號成分時,置換振幅為推斷背景音也可以。
相位控制部4702,旋轉(移動)轉換部4701供給的惡化信號相位頻譜4720,並作為強調信號相位頻譜4740供給至逆轉換部4704。又,相位的旋轉量(位移量)傳達至振幅控制部4703。振幅控制部4703從相位控制部4702接受相位的旋轉量(位移量),算出振幅補正量,再利用其振幅補正量,以各頻率補正強調信號振幅頻譜,並供給補正振幅頻譜4750至逆轉換部4704。逆轉換部4704,合成相位控制部4702供給的強調信號相位頻譜4740與振幅控制部4703供給的補正振幅頻譜,再進行逆轉換,並作為強調信號供給至輸出端子4707。
直線性計算部4708,利用轉換部4701供給的相位頻譜4720,計算其頻率區域中的直線性。驟變判斷部4709,根據直線性計算部4708計算的直線性,計算信號驟變的存在可能性(推斷的存在機率)。
衝擊音(信號的驟變)存在時,利用相位的直線可以推斷其存在可能性的理由同下。假設轉換部4701的框架內孤立脈衝存在。已傅立葉轉換孤立脈衝時的頻率方向的相位傾斜,對應孤立脈衝的位置求出唯一值是已知的。例如,轉換部中框架長度為L樣品且孤立脈衝位置為n0(0≦n0≦L-1)時,相位的傾斜成為-2πn0/L。因為,關於振幅a的孤立脈衝,經由傅立葉轉換得到的第k頻率成分D(k)由次式提供。
D(k)=a‧exp(-jθ(k))θ(k)=-2π‧k‧n0/L
相位θ(k),明顯地與k即頻率成正比。成為往右下的直線。
<<轉換部的構成>>
第48圖係顯示轉換部4701的構成方塊圖。如第48圖所示,轉換部4701包含框架分割部4801、開視窗處理部(windowing unit)4802、及傅立葉轉換部4803。惡化信號樣品,供給至框架分割部4801,分割為每K/2樣品的框架。在此,K為偶數。分割為框架的惡化信號樣品,供給至開視窗處理部4802,進行與窗函數(window function)w(t)的乘法運算。對於第n框架的輸入信號yn(t)(t=0,1,...,K/2-1),以w(t)開視窗(windowing)的信號,以次式提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。重疊長度,假設框架長度的50%為重疊長度的話,對於t=0,1,...,K/2-1,由以下公式得到的左邊,成為開視窗處理部4802
的輸出。
對於實數信號,使用左右對稱窗函數。又,窗函數,設計為轉換部4701的輸出直接供給至逆轉換部4704時的輸入信號與輸出信號除了計算誤差之外為一致。這是指成為w2(t)+w2(t+K/2)=1。
之後,以連續2框架重疊50%再開視窗的情況為例繼續說明。例如,可以使用次式表示的漢寧(Hanning)窗作為w(t)。
此外,已知漢寧(Hanning)窗、三角窗等各種窗函數。開視窗的輸出供給至傅立葉轉換部4803,並轉換為惡化信號頻譜Yn(k)。惡化信號頻譜Yn(k)分離為相位與振幅,惡化信號相位頻譜argYn(k)供給至相位控制部4702和直線性計算部4708,而惡化信號振幅頻譜|Yn(k)|供給至雜音抑制部4705。如同已說明地,也可以利用功率頻譜取代振幅頻譜。
<<逆轉換部的構成>>
第49圖係顯示逆轉換部4704的構成方塊圖。如第49圖所示,逆轉換部4704包含逆傅立葉轉換部4901、開視窗處理
部4902、及框架合成部4903。逆傅立葉轉換部4901,對振幅控制部4703供給的強調信號振幅頻譜4750與相位控制部4702供給的強調信號相位頻譜4740(argXn(k))進行乘法運算,求出強調信號(以下的公式的左邊)。
對得到的強調信號施行逆傅立葉轉換,1框架包含k樣品的時間區域樣品值系列xn(t)(t=0,1,...,K-1),供給至開視窗處理部4902,進行與窗函數w(t)的乘法運算。對於第n框架的輸入信號xn(t)(t=0,1,...,K/2-1),以w(t)開視窗的信號,由次式的左邊提供。
又,連續的2框架的一部分重疊(overlap)開視窗也可以。假設框架長度的50%為重疊長度的話,對於t=0,1,...,k/2-1,以下公式的左邊,成為開視窗處理部4902的輸出,傳達至框架合成部4903。
框架合成部4903,每K/2樣品取出來自開視窗處理部4902的鄰接2框架的輸出再重疊,根據以下的公式,得
到t=0,1,...,k-1中的輸出信號(公式的左邊)。得到的強調語音信號4760,從框架合成部4903傳達至輸出端子4707。
又,第48圖與第49圖中說明轉換部與逆轉換部中的轉換為傅立葉轉換,但取代傅立葉轉換,使用阿達瑪轉換(Hadamard transform)、哈爾轉換(Haar transform)、小波轉換(wavelet transform)等其他的轉換也可以。哈爾轉換(Haar transform)不用乘法運算,可以縮小LSI(大型積體電路)化時的面積。小波轉換(wavelet transform),因為根據頻率可以變更時間解析度為不同,可以期待提高雜音抑制效果。
又,複數統合轉換部4701中得到的頻率成分之後,以雜音抑制部4705也可以進行實際的抑制。統合後的頻率成分數量,變得比統合前的頻率成分數量少。具體而言,對於以頻率成分的統合得到的統合頻率成分,求出共同的抑制度,對於屬於相同統合頻率成分的個別頻率成分共同使用其抑制度。在此之際,從聽覺特性的辨別能力高的低頻率區域,往能力低的高頻率區域,經由統合更多的頻率成分,可以達成高音質。於是,統合複數的頻率成分之後實行雜音抑制時,應用雜音抑制的頻率成分的數量變少,可以削減全體的演算量。
<<雜音抑制部的構成>>
雜音抑制部4705,使用轉換部4701供給的惡化信號振幅頻譜,推斷雜音,並產生推斷雜音頻譜。於是,使用來自轉換
部4701的惡化信號振幅頻譜與產生的推斷雜音頻譜,求出抑制係數,乘以惡化信號振幅頻譜,作為強調信號振幅頻譜,供給至振幅控制部4703。又,從驟變判斷部4709接受信號驟變的存在可能性(信號的驟變是什麼程度存在的資訊),根據存在可能性,混合的惡化信號振幅頻譜與推斷雜音頻譜,作為強調信號振幅頻譜,供給至振幅控制部4703。此時,雜音抑制部4705,執行所希望信號的檢測,保護每頻率所希望信號成分也可以。
對於雜音的推斷,可以利用非專利文件1或非專利文件2中記載的方法等各種推斷方法。
例如,非專利文件1中,揭示以推斷雜音頻譜為所希望信號不產生的框架的惡化信號振幅頻譜的平均值之方法。此方法必須檢測所希望信號的產生。所希望信號存在的區間,可以以強調信號的功率判斷。
理想的動作狀態,係強調信號成為雜音以外的所希望信號。又,所希望信號或雜音的水準,在鄰接框架間沒有大變化。根據這些,以1框架過去的強調信號水準作為雜音區域判斷的指標。1框架過去的強調信號功率在一定值以下時,判斷現框架為雜音區間。藉由平均化判斷為雜音區間的框架的惡化信號振幅頻譜,可以推斷雜音頻譜。
又,非專利文件1中,也揭示推斷雜音頻譜作為開始供給惡化信號振幅頻譜的推斷初期的平均值之方法。在此情況下,緊接著開始推斷後,必須滿足不含所希望信號的條件。滿足條件的情況下,推斷初期的惡化信號振幅頻譜可以作
為推斷雜音頻譜。
又,非專利文件2中,揭示從統計的惡化信號振幅頻譜的最小值求出推斷雜音頻譜之方法。此方法,保持統計的一定時間內惡化信號振幅頻譜的最小值,根據其最小值推斷雜音頻譜。惡化信號振幅頻譜的最小值,因為與雜音頻譜的頻譜形狀相似,可以用作雜音頻譜形狀的推斷值。不過,最小值,變得比原來的雜音水準小。因此,適當增幅最小值用作推斷雜音頻譜。
雜音抑制部4705中,可以進行各種抑制,例如以SS(Spectrum Subtraction:頻譜減法運算)法與MMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小平方平均誤差短時間振幅頻譜推斷)法為代表。SS法的情況,係轉換部4701供給的惡化信號振幅頻譜減去推斷雜音頻譜。MMSE STSA法的情況,係使用轉換部4701供給的惡化信號振幅頻譜與產生的推斷雜音頻譜,計算抑制係數,此抑制係數乘以惡化信號振幅頻譜。決定此抑制係數為最小化強調信號的平均平方功率。
又,雜音抑制部4705,根據從驟變判斷部4709接受的驟變存在可能性(信號驟變是什麼程度的存在的資訊),變更雜音抑制的程度。例如,根據存在可能性,混合的惡化信號振幅頻譜與推斷雜音頻譜,作為強調信號振幅頻譜,供給至振幅控制部4703也可以。具體而言,信號驟變的存在可能性高的頻率成分、頻帶或框架單位中,應抑制其驟變,更提高推斷雜音頻譜的混合比例(應用強力的抑制)。抑制程度的設定,根
據存在可能性可以無階段地控制,也可以執行如抑制度0、抑制度1、抑制度2的多段(離散的階段)抑制。
又,替換之前,檢測重要的惡化信號振幅頻譜成分,並可以或是從推斷雜音頻譜產生的替換對象除去檢測的重要惡化信號振幅頻譜成分,或是提高惡化信號振幅頻譜的混合比例。作為檢測重要的惡化信號振幅頻譜成分之際的重要度指標,可以利用惡化信號振幅頻譜的大小。關聯於振幅大的成分為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。
又,作為重要度的指標,也可以利用惡化信號振幅頻譜的峰值性。峰值,即沿著頻率軸具有比周邊大的值之惡化信號振幅,關聯於作為目的的信號成分之機率高並防止保持此為目的的信號音質惡化。特別是,顯著的峰值,即比周邊的振幅值顯著大的振幅值,因為其重要度高,確實保護可以更提高作為目的的信號音質。
峰值的檢測,例如,非專利文件3的純音成分檢測方法或在非專利文件5中揭示其方法。又,根據既定的條件評估檢測的峰值,不滿足條件的峰值除外也可以。例如,取得比上述推斷雜音小的值之峰值,作為目的的信號之可能性低。即,推斷雜音作為基準,只要比推斷雜音足夠大作為峰值留下,除此以外可以除外。是否足夠大,經由與推斷雜音的定數倍比較,可以判斷。於是,評估檢測的峰值是否滿足既定的條件之後,經由選擇最終的峰值成分,可以降低錯誤的峰值檢測,並提高信號驟變部的抑制效果。
<<相位控制部及振幅控制部的構成>>
第50圖係顯示相位控制部4702及振幅控制部4703的構成方塊圖。如第50圖所示,相位控制部4702包含相位旋轉部5001與旋轉量產生部5002,而振幅控制部4703包含補正量算出部5003與振幅補正部5004。
旋轉量產生部5002,關於驟變判斷部4709判斷為「信號驟變存在」的頻率成分,產生惡化信號相位頻譜的旋轉量,供給至相位旋轉部5001與補正量算出部5003。相位旋轉部5001,當旋轉量產生部5002供給旋轉量時,對轉換部4701供給的惡化信號相位頻譜4720只旋轉(位移)供給的旋轉量,並作為強調信號相位頻譜4740供給至逆轉換部4704。
補正量算出部5003,根據旋轉量產生部5002供給的旋轉量,決定振幅的補正係數,並供給至振幅補正部5004。
旋轉量產生部5002,例如以隨機變數產生旋轉量。根據隨機變數,以各頻率旋轉惡化信號相位頻譜時,惡化信號相位頻譜4720的形狀變化。根據此形狀變化,可以減弱衝擊音等的信號驟變部的特徵。
隨機變數中,具有其產生機率相同的同樣隨機變數、或發生機率表示正式分佈的正式隨機變數等,首先,說明同樣隨機變數產生的旋轉量產生法。同樣隨機變數可以以線性同餘法等產生。例如,以線性同餘法產生的同樣隨機變數,在0~(2^M)-1的範圍內同樣分佈。在此,M係任意的整數,^表示指數。相位的旋轉量ψ必須在0~2π的範圍內分佈。因此,轉換產生的同樣隨機變數。轉換由以下的公式進行。在此,R
係同樣隨機變數,Rmax係其同樣隨機變數能夠產生的最大值。以上述的線性同餘法產生的情況下,成為Rmax=(2^M)-1。
為了計算的簡單化,R值可以原封不動作為旋轉量。由於是旋轉量,2π表示正好一轉。相位旋轉2π的情況與未旋轉的情況相同。因此,所謂2π+α的旋轉量,與旋轉量為α的情況相同。在此,雖然說明以線性同餘法產生同樣隨機變數的情況,但以此外的方法產生同樣隨機變數的情況,也根據上式求出旋轉量ψ即可。根據驟變判斷部4709的判斷結果,也可以決定何時進行何種程度的隨機變數化。
相位旋轉部5001,從旋轉量產生部5002接受旋轉量,使惡化信號相位頻譜旋轉。如果,惡化信號相位頻譜以角度表現的情況下,可以以此角度加上旋轉量ψ的值旋轉。惡化信號相位頻譜以複數(complex number)的正式向量表現的情況下,求出旋轉量ψ的正式向量,並乘以惡化信號相位頻譜,藉此可以旋轉。
旋轉量ψ的正式向量由以下公式求出。在此,ψ係旋轉向量,j表示sqrt(-1)。又,sqrt表示平方根。
根據補正量算出部5003的補正係數算出法。因為與說明關於第5圖的補正量算出部503的方法相同,在此省略說明。
<<直線性計算部及驟變判斷部的構成>>
第51圖係用以說明關於直線性計算部4708及驟變判斷部4709的內部構成圖。如第51圖所示,直線性計算部4708包含算出頻率方向相位變化量的變化量算出部5101、以及算出相位變化量平坦度的平坦度算出部5102。變化量算出部5101係輸入相位成分信號4720(p(k),k頻係率),求出鄰接的頻率相位差△p(k)=p(k)-p(k-1)作為相位變化量5110(相位傾斜)。
平坦度算出部5102,調查從變化量算出部5101得到的相位變化量△p(k)=p(k)-p(k-1)沿著頻率軸的平坦度(偏離)。假設鄰接頻率的相位變化量的差△2p(k)=△p(k)-△p(k-1)為平坦度5120。相位變化量平坦的話,階差為0。對於每頻率成分、每頻帶、全頻率中任一,求出一平坦度5120也可以。又,統合單一或複數的頻帶中的平坦度,取代全頻率中的平坦度使用也可以。
在此,並非每頻率而是每頻帶(子頻帶)或框架判斷時,根據更全局的判斷,可以降低由於信號驟變成分以外的相位成分產生的判斷錯誤。例如,也可以求出各頻率中的平坦度的頻率方向總和,作為每框架的平坦度。根據此修正,可以提高各頻率中的平坦度可靠性。又,利用每頻帶或每框架的平坦度,修正每頻率的平坦度也可以。例如,某頻帶的平坦度係表示「信號驟變存在」時,藉由修正其頻帶內的全頻率平坦度強制顯示「信號驟變存在」,可以降低其他信號成分的妨礙產生的平坦度誤差。相反地,某頻帶的平坦度顯示為「信號驟變不存在」時,藉由修正其頻帶內的全頻率平坦度強制顯示「信
號驟變不存在」,可以降低其他信號成分的妨礙產生的平坦度誤差。或者,上述頻帶內的各頻率中,一律往容易判斷平坦度為存在的方向修正,維持求出各頻率獨自的平坦度之構成自體也可以。每頻率或每頻帶求出平坦度時,每頻率或每頻帶可以變更驟變的抑制程度,成為可以進行更高精確度的抑制。
又,以相位的微分值作為相位變化量,更以其微分值為平坦度1220也可以。在此情況下,相位的二次微分值接近0的話(既定值以下的話),平坦度是高的。
在此,變化量算出部5101,利用鄰接頻率間的相位階差算出變化量,但本發明不限於此。以相位頻率產生的微分判斷直線性(相位變化的平坦度)也可以。複數的頻率中的複數微分結果的偏離越小,直線性越高。局部的直線性,可以利用局部的微分結果評估。特別是因為鄰接的2頻率成分間的微分在段差中可以近似,此情況下判斷為複數的階差偏離越小直線性越高。可以利用平坦度(Flatness Measure)作為偏離的指標。
驟變判斷部4709,以算出的平坦度作為信號驟變存在的可能性。又,利用既定的線形函數、非線形函數、多項式等轉換平坦度的結果,輸出作為信號驟變存在的可能性5130也可以。藉由檢測信號驟變作為其「存在可能性」,可以達成比「存在本身」更高品質的抑制。因為,以「存在本身」的判斷即2值判斷發生判斷錯誤時,對抑制成為致命的影響。因為只有「抑制」或「不抑制」2個選擇,不應抑制時,由於判斷錯誤應用抑制,會提供以致命變形為目的的信號,並且這會被
察覺。相反地,應抑制時不應用抑制的話,信號驟變原狀留下,被察覺。相反地,藉由使用「存在可能性」即連續值,進行判斷,並進行根據其判斷結果程度的抑制,可以減小任一方的判斷錯誤的影響。
第52圖係圖形顯示相位及其變化量。頻率區域中,沿著頻率軸,相位如圖形5201變化時,其相位變化量,在頻率區域中,沿著頻率軸,如圖形5202變化。藉由導出此變化的平坦度5203,辨別相位的直線性。
因為已知信號的驟變部中相位直線變化,如此算出相位的直線性,即相位變化的平坦度,藉此可以評估信號驟變的存在可能性。於是,衝擊音等信號驟變存在的框架中,藉由旋轉操作相位頻譜,因為可以抑制其驟變、降低其影響,可以得到高品質的強調信號。
第53圖係關於本實施中使用軟體實現雜音抑制裝置4700時的硬體構成說明圖。
雜音抑制裝置4700,包括處理器5310、ROM(唯讀記憶體)5320、RAM(隨機存取記憶體)5340、儲存器5350、輸出入界面5360、操作部5361、輸入部5362及輸出部5363。雜音抑制裝置4700,也可以包括攝影機5364。處理器5310係中央處理部,經由執行各種程式,控制雜音抑制裝置4700全體。
ROM(唯讀記憶體)5320,除了處理器5310最初應執行的開機程式之外,還記憶各種參數等。RAM5340,除了未圖示的程式載入區域之外,還有記憶輸入信號4710、相位成分
信號4720、振幅成分信號4730、強調信號4760、相位變化量5110、平坦度5120及驟變判斷結果5130等的區域。
又,儲存器5350,收納雜音抑制程式5351。雜音抑制程式5351,包含轉換模組、相位控制模組、振幅控制模組、逆轉換模組、雜音抑制模組、直線性計算模組及驟變判斷模組。藉由處理器5310實行雜音抑制程式5351內包含的各模組,可以實現第47圖的轉換部4701、相位控制部4702、振幅控制部4703、逆轉換部4704、雜音抑制部4705、直線性計算部4708、驟變判斷部4709的各功能。又,儲存器5350也可以收納雜音資料庫。
處理器5310實行的雜音抑制程式5351的輸出的強調信號,經由輸出入界面5360,從輸出部5363輸出。因此,例如,可以抑制從輸入部5362輸入的操作部5361的操作音等。又,檢出從輸入部5362輸入的輸入信號中包含信號驟變,再開始攝影機5364的攝影等的應用法也可以。
第54圖係用以說明上述雜音抑制程式5351產生的處理流程之流程圖。首先,步驟S5401中,從輸入部5362輸入信號時,進行至步驟S5403。步驟S5403中,轉換部4701轉換輸入信號至頻率區域,分割為振幅.相位。其次,步驟S5405中,設定離散頻率k為1,計數值I為0,依序開始頻率空間內的處理。進行至步驟S5407時,算出設定的頻率中的相位變化。又,步驟S5409中,算出相位變化的變化。對應相位變化的變化大小,判斷的相位的直線性。具體而言,根據相位變化的變化多接近0,作為頻率k中的直線性高度的指標。又,
為了算出框架單位中信號驟變的存在可能性,相位變化的變化未滿既定的臨界值N時,在步驟S5413中增加I。
另一方面,相位變化的變化在既定的臨界值N以上時,判斷為相位變化不平坦,即相位直線性低,不增加I而進行至步驟S5415。重複以上的步驟S5407~S5413,直到k=F(F係框架全體的頻率成分數)。最後,步驟S5417中,將I(直線性高的頻率)與既定臨界值M比較。I在M以上時,判斷為有衝擊音(信號驟變)的框架(S5421),除此以外判斷為無衝擊音(S5423)。每頻率的信號驟變存在可能性,供給至雜音抑制部4705及相位控制部4702(S5425)。合併供給每框架的信號驟變有無存在的判斷結果至雜音抑制部4705及相位控制部4702也可以。
根據以上的處理,可以更正確檢測代表衝擊音的信號驟變,可以適當抑制其衝擊音(信號驟變)。
其次,關於本發明第十八實施例的雜音抑制裝置,利用第55圖說明。第55圖,係用以說明本實施例的雜音抑制裝置5500的功能構成圖。本實施例的雜音抑制裝置5500,相較於上述第十七實施例,不同點係轉換部5501產生複數信號5550,且直線性檢測部5508及驟變判斷部5509根據其複數信號5550執行檢測並判斷。其他的構成及動作,因為與第十七實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
第56圖係用以說明直線性檢測部5508及驟變判
斷部4709的內部構成圖。如第56圖所示,直線性檢測部5508包含算出往頻率方向的相位變化量之變化量算出部5601、及算出相位變化量的平坦度之平坦度算出部5102。變化量算出部5601,輸入複數信號5550(q(k),k係頻率),求出鄰接頻率的相位差△p(k)=p(k)-p(k-1),作為相位變化量5110(相位的傾斜)。
平坦度算出部5102,調查從變化量算出部5101得到的相位變化量△p(k)=p(k)-p(k-1)沿著頻率軸的平坦度(偏離)。假設鄰接頻率的相位變化量的差△2p(k)=△p(k)-△p(k-1)為平坦度5120。相位變化量平坦的話,階差為0。對於每頻率成分、每頻帶(以任意寬度畫分頻率的頻帶)、全頻率中任一,求出一平坦度5120也可以。又,以相位的微分值為相位變化量,再以其微分值為平坦度5120也可以。在此情況下,相位的二次微分值接近0的話(既定值以下的話)可以判斷為平坦。每頻帶判斷時,可以進行更細緻的處理。即,可以每頻帶分開消除衝擊音,變得可以執行更高精確度的衝擊音抑制。
驟變判斷部4709,例如算出的平坦度絕對值在一定以下時,判斷對應其平坦度的頻率(一個頻率成分、頻帶、或全頻帶(即一個框架))包含衝擊音。判斷結果5130,輸出與平坦度絕對值對應的0與1間的值作為判斷結果5130。因此,可以得到包含衝擊音的可能性。
與以上說明相同,本實施例中,取代相位成分信號,可以利用複數信號檢測相位的直線性。
其次,關於本發明第十九實施例的雜音抑制裝
置,利用第57圖說明。第57圖,係用以說明本實施例的雜音抑制裝置內包含的直線性檢測部5708的功能構成圖。本實施例的直線性檢測部5708,相較於上述第十八實施例,不同點係包括單位向量產生部5781、旋轉向量轉換部5782、及旋轉向量轉換部5783。又,驟變判斷部5709,根據旋轉向量,判斷信號有無驟變或其程度,也是不同點。其他的構成及動作,因為與第十八實施例相同,關於相同的構成及動作附上相同的符號,省略詳細的說明。
單位向量產生部5781,利用複數信號5550,每頻率單位向量化輸入頻譜(複數向量)。具體而言,分別以振幅值除法運算複數信號5550的實數部和虛數部。
旋轉向量轉換部5782,轉換單位向量5710為鄰接頻率間的旋轉向量(第1旋轉向量5720)。在此的旋轉向量旋轉量與相位變化量同義。進行取得基準向量的共軛A*與旋轉後的向量B的內積之乘法運算,如下求得旋轉向量RotVec。RotVec=A*‧B
具體而言,累計基準向量的實部,累計虛部,加上這些,再虛部減去其一。於是,可以算出旋轉向量5720。
又,旋轉向量轉換部5783,調查從旋轉向量轉換部5782得到的第1旋轉向量5720沿著頻率軸的平坦度(偏離)。頻率方向的相位變化量為一定時,旋轉向量的偏離變小。因此,沿著頻率軸求出第1旋轉向量5720的變化量。具體而言,關於第1旋轉向量5720,求出鄰接頻率間的旋轉向量(第2旋轉向量5730)。這與微分第1旋轉向量同義。
於是,驟變判斷部5709,辨識第2旋轉向量5730的實部為平坦部。
因為第2旋轉向量5730也是單位向量,其實部取-1到1的值。相位越直線變化,第1旋轉向量的角度變化量越小(旋轉向量的偏離越小)。於是,第1旋轉向量的變化量越小(旋轉向量的偏離越小),第2旋轉向量的實部越大。即,第2旋轉向量的角度越小。在此也是,關於每頻率點、每頻帶(以任意寬度畫分頻率的頻帶)、全頻率中的任一,也可以求出一個平坦度。
驟變判斷部5709,把第2旋轉向量5730的實部看做驟變存在可能性,根據是否超過接近+1的臨界值(例如0.7或0.8),判斷驟變的存在或其程度。輸出衝擊音的存在可能性(1~0),作為判斷結果5740。於是,可以得到包含衝擊音的可能性。
第58圖係用以說明本實施例的雜音抑制程式產生的處理流程之流程圖。首先,步驟S5401中,從輸入部5362輸入語音信號時,進行至步驟S5803。步驟S5803中,轉換部5501在頻率區域中從輸入信號產生複數信號。其次,步驟S5405中,設定離散頻率k為1,依序開始頻率空間內的處理。進行至步驟S5807時,設定的頻率中單位向量化複數信號。其次,步驟S5808中,從鄰接頻率成分的單位向量轉換至第1旋轉向量。又,步驟S5809中,從鄰接頻率成分的第1旋轉向量轉換為第2旋轉向量。步驟S5811中,第2旋轉向量的實部看做信號驟變的存在可能性,與臨界值N比較。實部超過既定的
臨界值N時,判斷為相位平坦變化,並判斷為直線性高,在步驟S5413中,假設I(k)=1。另一方面,實部在臨界值N以下時,判斷為相位變化不平坦,並判斷為直線性低,在步驟S5414中,假設I(k)=0。重複以上的步驟S5407~S5414直到成為k=F(F為框架全體的頻率步驟數)。最後,步驟S5417中,成為I(k)=1的k的頻率中判斷為有信號驟變,並供給判斷結果至雜音抑制部4705及相位控制部4702。
與以上說明相同,根據本實施例,使用複數信號根據相位的旋轉向量的旋轉向量可以檢測直線性。又,在此平坦度的判斷中為了使用旋轉向量的實部,雖然單位向量化,但本發明不限於此。又,取代第2旋轉向量的實部,將第2旋轉向量的角度大小與臨界值作比較,並在角度的大小比臨界值大時判斷為有信號驟變也可以。
又,上述第十二至十九實施例中,雖然說明關於應用信號驟變檢測方法至以抑制信號驟變部為目的的雜音抑制裝置,但本發明不限於此。以檢測衝擊音為目的的各種裝置、系統及狀況下可以利用。又,檢測對象不限定於衝擊音(急劇上升再立刻下降的語音信號)。即使信號急劇上升(或是下降)並維持原狀的情況下,也可以檢測為驟變部。
例如,現在的聲音符號化方式(例如MPEG、AAC的符號化部)中,在稱作所謂起音(attack)的信號驟變部中,雖然採用不同於通常的資訊壓縮方式,但也可以適用於此時信號驟變部的檢測。信號驟變部中,由於變更分析窗長再抑制稱作
pre-echo(前回聲)的先行雜音,檢測是必需的。相較於使用振幅或熵(entropy)的變化等檢測的方法,可以高精確度地檢測驟變,有效進行資訊壓縮。
又,如第59圖所示,也考慮車輛5900中安裝麥克風2001、直線性計算部4708、驟變判斷部4709、及影像記錄部5902的應用例。影像記錄部5902觸發衝擊音的檢測,並進行禁止改寫保存攝影機產生的攝影畫面的話,可以留下事故狀況的記錄。在此之際,從衝擊音檢測延遲一定時間後,執行禁止改寫保存也可以。不同於觸發衝擊本身的情況,衝擊小的情況下、或其他車輛遭遇事故的情況下也具有能執行自動記錄事故狀況的優點。
又,如第60圖所示,也考慮心電計6000連接計算部4708、驟變判斷部4709及警報部6001的應用例。可以更正確且有效執行檢測心電圖的異常心跳。特別是雜音多的情況下有效。同樣地,也可以應用於胎兒回音的監視器。由於雜音的妨礙,會有無法正確取得心音的情況,但此時本技術有效。即,可以廣泛應用於生物體信號的驟變檢測。
同樣地,如第61圖所示,上述實施例中,為了檢測硬碟驅動器6100的異常,也可以利用本發明的衝擊音檢測,如第62圖所示,例如檢測機場等噪音大的狀況下的開槍聲或爆發聲,也可以利用本發明。
以上,參照實施例,說明本發明,但本發明不限
定於上述實施例。本發明的構成或細節,在本發明的範圍內可以做熟悉此技藝者能夠理解的各種變更。又,如何組合各實施例內包含的各個特徵之系統或裝置也包含在本發明的範疇內。
又,本發明,也可以應用於複數的機器構成的系統,也可以應用於單體的裝置。又,本發明中,實現實施例的功能之資訊處理程式,也可以應用於直接或從遠處供給至系統或裝置的狀況。因此,為了以電腦實現本發明的功能,電腦中安裝的程式或收納其程式的媒體、下載其程式的WWW(全球網路)伺服器,也包含在本發明的範疇內。特別是,至少非暫性電腦可讀媒體包含在本發明的範疇內。
又,上述的各實施例中,顯示如下所示的信號處理裝置、信號處理方法及信號處理程式的特徵構成(並非限定如下)。
(附記1)
信號處理裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;計算裝置,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷裝置,根據上述計算裝置計算的上述特徵值,判斷關於上述輸入信號的驟變存在可能性。
(附記2)
附記1中記載的信號處理裝置,其特徵在於:上述計算裝置,算出上述相位成分信號變化的平坦度作為
上述特徵值。
(附記3)
附記1或2中記載的信號處理裝置,其特徵在於:上述計算裝置,算出上述振幅成分信號的平坦度作為上述特徵值。
(附記4)
附記1、2或3中記載的信號處理裝置,其特徵在於:上述判斷裝置,分別加權並加上上述相位成分信號的變化與上述振幅成分信號的變化,再根據得到的值判斷關於上述信號驟變的存在可能性。
(附記5)
附記1、2或3中記載的信號處理裝置,其特徵在於:上述判斷裝置,平均上述相位成分信號的變化與上述振幅成分信號的變化,再根據得到的值判斷關於上述信號驟變的存在可能性。
(附記6)
附記1、2或3中記載的信號處理裝置,其特徵在於:上述判斷裝置,非線性結合上述相位成分信號的變化與上述振幅成分信號的變化,再根據得到的值判斷關於上述信號驟變的存在可能性。
(附記7)
附記1至5中任一項記載的信號處理裝置,其特徵在於:上述計算裝置,計算頻率區域中的上述相位成分信號的微分值平坦度;以及
上述判斷裝置,如果上述微分值的上述平坦度高,且上述振幅成分信號的平坦度高的話,判斷關於上述輸入信號驟變的存在可能性高。
(附記8)
附記1至7中任一項記載的信號處理裝置,其特徵在於:上述計算裝置,根據上述相位成分信號,求出各頻率的相位變化(ψn=θn-θn=1),求出上述相位變化差(ψn-ψn-1)為旋轉角的旋轉向量cos(ψn-ψn-1)+j sin(ψn-ψn-1)的大小,作為上述特徵值。
(附記9)
附記1至8中任一項記載的信號處理裝置,其特徵在於:上述轉換裝置,輸出包含相位成分信號及振幅成分信號的複數信號;上述計算裝置,包括:正式化裝置,正式化各頻率中的上述複數信號為單位向量;第1算出裝置,根據鄰接頻率中的上述單位向量比算出第1旋轉向量;以及第2算出裝置,根據鄰接頻率中的上述第1旋轉向量比算出第2旋轉向量;以及上述判斷裝置,根據上述第2旋轉向量的實部大小,判斷關於上述輸入信號驟變的存在可能性。
(附記10)
附記1至8中任一項記載的信號處理裝置,其特徵在於:
上述轉換裝置,輸出包含相位成分信號及振幅成分信號的複數信號;上述計算裝置,包括:正式化裝置,正式化各頻率中的上述複數信號為單位向量;第1算出裝置,根據鄰接頻率中的上述單位向量比算出第1旋轉向量;以及第2算出裝置,根據鄰接頻率中的上述第1旋轉向量比算出第2旋轉向量;以及上述判斷裝置,根據上述第2旋轉向量的角度大小,檢測上述輸入信號的驟變。
(附記11)
附記1至10中任一項記載的信號處理裝置,更包括:振幅控制裝置,對應上述判斷裝置求出的關於上述驟變的存在可能性之程度,執行振幅的抑制。
(附記12)
附記1至11中任一項記載的信號處理裝置,更包括:相位控制裝置,關於以上述判斷裝置判斷包含上述驟變的框架,使上述輸入信號的相位改變。
(附記13)
信號處理裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;第1算出裝置,根據上述輸入信號的驟增部位置,算出第1相位傾斜;
第2算出裝置,算出頻率區域中的上述相位成分信號的第2相位傾斜;以及判斷裝置,根據上述第1相位傾斜和上述第2相位傾斜,判斷關於上述輸入信號驟變的存在可能性。
(附記14)
附記13中記載的信號處理裝置,其特徵在於:上述判斷裝置,根據上述第1相位傾斜和上述第2相位傾斜間的類似度,判斷關於上述輸入信號驟變的存在可能性。
(附記15)
附記13或14中記載的信號處理裝置,其中上述第1算出裝置,包括:驟增部檢測裝置,檢測框架內信號絕對值驟增的位置;延遲時間算出裝置,算出從框架開始到上述驟增部存在位置的延遲時間;以及相位轉換裝置,轉換上述延遲時間為頻率區域的相位。
(附記16)
附記13中記載的信號處理裝置,其中上述轉換裝置,更包括:算出裝置,更算出上述輸入信號在頻率區域中的振幅成分信號,並算出上述振幅成分信號的平坦度;其中,上述判斷裝置,更考慮上述振幅成分信號的平坦度,再判斷上述輸入信號的驟變存在可能性。
(附記17)
附記13至16中任一項記載的信號處理裝置,其特徵在於:
上述判斷裝置,根據分別加權上述第1相位傾斜與上述第2相位傾斜間的類似度以及上述振幅成分信號的平坦度得到的值,判斷上述信號驟變的存在可能性。
(附記18)
附記13至17中任一項記載的信號處理裝置,更包括:振幅控制裝置,以對應上述判斷裝置求出的上述驟變的存在可能性之程度,執行振幅抑制。
(附記19)
附記13至18中任一項記載的信號處理裝置,更包括:相位控制裝置,關於以上述判斷裝置判斷包含上述驟變的框架,使上述輸入信號的相位改變。
(附記20)
信號處理裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;產生裝置,從上述輸入信號除去上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷裝置,根據上述低相關信號與上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
(附記21)
附記20中記載的信號處理裝置,更包括:第1算出裝置,根據上述低相關信號的驟增部位置,算出信號驟變部中的第1相位傾斜;以及第2算出裝置,算出頻率區域中的上述相位成分信號的第2相位傾斜;
其中,上述判斷裝置,根據上述第1相位傾斜與上述第2相位傾斜,判斷上述輸入信號驟變的存在可能性。
(附記22)
附記21中記載的信號處理裝置,其特徵在於:上述判斷裝置,根據上述第1相位傾斜與上述第2相位傾斜間的類似度,判斷上述輸入信號驟變的存在可能性。
(附記23)
附記21或22中任一項記載的信號處理裝置,其中上述第1算出裝置,包括:驟增部檢測裝置,檢測框架內信號絕對值驟增的位置;延遲時間算出裝置,算出從框架開始到上述驟增部存在位置的延遲時間;以及相位轉換裝置,轉換上述延遲時間為頻率區域的相位。
(附記24)
附記20中記載的信號處理裝置,其中上述轉換裝置,更包括:算出裝置,更算出上述輸入信號在頻率區域中的振幅成分信號,並算出上述振幅成分信號的平坦度;其中,上述判斷裝置,更考慮上述振幅成分信號的平坦度,再判斷上述輸入信號的驟變存在可能性。
(附記25)
附記20至24中任一項記載的信號處理裝置,更包括:振幅控制裝置,以對應上述判斷裝置求出的上述驟變的存
在可能性之程度,執行振幅抑制。
(附記26)
附記20至25中任一項記載的信號處理裝置,更包括:相位控制裝置,關於以上述判斷裝置判斷包含上述驟變的框架,使上述輸入信號的相位改變。
(附記27)
信號處理裝置,包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;直線性計算裝置,計算頻率區域中上述相位成分信號的直線性;以及判斷裝置,根據上述直線性計算裝置計算的上述直線性,計算上述輸入信號驟變的存在可能性。
(附記28)
附記27中記載的信號處理裝置,其特徵在於:上述直線性計算裝置,根據頻率區域中上述相位成分信號的變化,計算上述直線性。
(附記29)
附記27或28中記載的信號處理裝置,其特徵在於:上述直線性計算裝置,計算頻率區域中上述相位成分信號的微分值平坦度;以及上述判斷裝置,上述微分值平坦度高的話,判斷為上述輸入信號的驟變存在可能性高。
(附記30)
附記27、28或29中記載的信號處理裝置,其特徵在於:
上述直線性計算裝置,算出相位成分差,作為每頻率相位成分與鄰接頻率中的相位成分差;以及根據上述相位成分差的鄰接頻率中的差,計算上述直線性。
(附記31)
附記30中記載的信號處理裝置,其特徵在於:上述直線性計算裝置,計算每框架上述相位成分差在鄰接頻率中的差相加的總和,作為上述框架的直線性;以及上述判斷裝置,如果上述總和在臨界值以上的話,修正使上述相位成分差在鄰接頻率中的差變大。
(附記32)
信號處理方法,包括下列步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;計算步驟,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷步驟,根據計算的上述特徵值,判斷關於上述輸入信號的驟變存在可能性。
(附記33)
信號處理方法,包括下列步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;
第1算出步驟,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜和上述第2相位傾斜,判斷上述輸入信號驟變的存在可能性。
(附記34)
信號處理方法,包括下列步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;產生步驟,從上述輸入信號除去上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷步驟,根據上述低相關信號與上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
(附記35)
信號處理方法,包括下列步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;直線性計算步驟,計算頻率區域中上述相位成分信號的直線性;以及存在可能性計算步驟,根據計算的上述直線性,計算上述輸入信號驟變的存在可能性。
(附記36)
信號處理程式,在電腦中實行的各步驟包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號及振幅成分信號;
計算步驟,計算上述相位成分信號及上述振幅成分信號的特徵值;以及判斷步驟,根據計算的上述特徵值,判斷關於上述輸入信號的驟變存在可能性。
(附記37)
信號處理程式,在電腦中實行的各步驟包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;第1算出步驟,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜和上述第2相位傾斜,判斷上述輸入信號驟變的存在可能性。
(附記38)
信號處理程式,在電腦中實行的各步驟包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;產生步驟,從上述輸入信號除去上述輸入信號內包含的時間相關的某成分,產生低相關信號;以及判斷步驟,根據上述低相關信號與上述相位成分信號,判斷上述輸入信號內包含的驟變存在可能性。
(附記39)信號處理程式,在電腦中實行的各步驟包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;直線性計算步驟,計算頻率區域中上述相位成分信號的直線性;以及
存在可能性計算步驟,根據計算的上述直線性,計算上述輸入信號驟變的存在可能性。
本申請書,主張以2013年3月5日申請的日本專利申請,專利申請2013-042448號、專利申請2013-042449號、專利申請2013-042450號、專利申請2013-042451號為基礎的優先權,在此取入其全部的揭示。
100‧‧‧信號處理裝置
101‧‧‧轉換部
102‧‧‧計算部
103‧‧‧信號驟變判斷部
110‧‧‧輸入信號
120‧‧‧相位成分信號
130‧‧‧振幅成分信號
Claims (9)
- 一種信號處理裝置,其特徵在於包括:轉換裝置,轉換輸入信號為頻率區域中的相位成分信號;第1算出裝置,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出裝置,算出頻率區域中的上述相位成分信號的第2相位傾斜;以及判斷裝置,根據上述第1相位傾斜和上述第2相位傾斜,判斷從頻率點或複數的頻率點所構成的每一個頻帶之關於上述輸入信號驟變的存在可能性。
- 如申請專利範圍第1項所述的信號處理裝置,其中上述判斷裝置,根據上述第1相位傾斜和上述第2相位傾斜間的類似度,判斷關於上述輸入信號驟變的存在可能性。
- 如申請專利範圍第1項所述的信號處理裝置,其中上述第1算出裝置包括:驟增部檢測裝置,檢測框架內信號絕對值驟增的位置;延遲時間算出裝置,算出從框架開始到上述驟增部存在位置的延遲時間;以及相位轉換裝置,轉換上述延遲時間為頻率區域的相位。
- 如申請專利範圍第1項所述的信號處理裝置,其中上述轉換裝置更包括:算出裝置,更算出上述輸入信號在頻率區域中的振幅成分信號,並算出上述振幅成分信號的平坦度;其中,上述判斷裝置,更考慮上述振幅成分信號的平坦度, 再判斷上述輸入信號的驟變存在可能性。
- 如申請專利範圍第1項所述的信號處理裝置,其中上述判斷裝置,根據分別加權上述第1相位傾斜與上述第2相位傾斜間的類似度以及上述振幅成分信號的平坦度得到的值,判斷上述信號驟變的存在可能性。
- 如申請專利範圍第1項所述的信號處理裝置,更包括:振幅控制裝置,以對應上述判斷裝置求出的上述驟變的存在可能性之程度,執行振幅抑制。
- 如申請專利範圍第1項所述的信號處理裝置,更包括:相位控制裝置,關於以上述判斷裝置判斷包含上述驟變的框架,使上述輸入信號的相位改變。
- 一種信號處理方法,其特徵在於包括下列步驟:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;第1算出步驟,根據上述輸入信號的驟增部位置,算出第1相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜和上述第2相位傾斜,判斷從頻率點或複數的頻率點所構成的每一個頻帶之上述輸入信號驟變的存在可能性。
- 一種信號處理程式,其特徵在於在電腦中實行的各步驟包括:轉換步驟,轉換輸入信號為頻率區域中的相位成分信號;第1算出步驟,根據上述輸入信號的驟增部位置,算出第1 相位傾斜;第2算出步驟,算出頻率區域中上述相位成分信號的第2相位傾斜;以及判斷步驟,根據上述第1相位傾斜和上述第2相位傾斜,判斷從頻率點或複數的頻率點所構成的每一個頻帶之上述輸入信號驟變的存在可能性。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013042449 | 2013-03-05 | ||
JP2013042450 | 2013-03-05 | ||
JP2013042448 | 2013-03-05 | ||
JP2013042451 | 2013-03-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201642252A true TW201642252A (zh) | 2016-12-01 |
TWI585753B TWI585753B (zh) | 2017-06-01 |
Family
ID=51491149
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103106690A TWI581256B (zh) | 2013-03-05 | 2014-02-27 | A signal processing device, a signal processing method, and a signal processing program |
TW105125574A TWI587293B (zh) | 2013-03-05 | 2014-02-27 | A signal processing device, a signal processing method, and a signal processing program |
TW105125568A TWI585753B (zh) | 2013-03-05 | 2014-02-27 | A signal processing device, a signal processing method, and a signal processing program |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103106690A TWI581256B (zh) | 2013-03-05 | 2014-02-27 | A signal processing device, a signal processing method, and a signal processing program |
TW105125574A TWI587293B (zh) | 2013-03-05 | 2014-02-27 | A signal processing device, a signal processing method, and a signal processing program |
Country Status (4)
Country | Link |
---|---|
US (1) | US9715885B2 (zh) |
JP (1) | JP6528679B2 (zh) |
TW (3) | TWI581256B (zh) |
WO (1) | WO2014136629A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014123011A (ja) * | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
CN106157967A (zh) * | 2015-04-28 | 2016-11-23 | 杜比实验室特许公司 | 脉冲噪声抑制 |
JP6785446B2 (ja) * | 2016-04-14 | 2020-11-18 | パナソニックIpマネジメント株式会社 | 生体信号計測システム |
EP3553780B1 (en) * | 2016-12-06 | 2021-08-11 | Nippon Telegraph and Telephone Corporation | Signal feature extraction apparatus, signal feature extraction method, and program |
AU2017201760B2 (en) | 2017-03-15 | 2023-03-09 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
CN111031902B (zh) * | 2017-08-31 | 2022-10-11 | 加利福尼亚大学董事会 | 多传感器心搏出量监测系统和分析法 |
CN111050633A (zh) | 2017-08-31 | 2020-04-21 | 加利福尼亚大学董事会 | 多传感器心脏功能监测和分析系统 |
US11769517B2 (en) * | 2018-08-24 | 2023-09-26 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
US11284856B2 (en) * | 2019-12-31 | 2022-03-29 | Industrial Technology Research Institute | Method for detecting vascular obstruction and system using the same |
JP7355972B2 (ja) * | 2021-06-24 | 2023-10-04 | 学校法人東京工芸大学 | 検査装置、方法、及びプログラム |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2558876B2 (ja) | 1989-06-02 | 1996-11-27 | 松下電器産業株式会社 | 音声符号化装置 |
CA2506118C (en) * | 1991-05-29 | 2007-11-20 | Microsoft Corporation | Electronic signal encoding and decoding |
JP3285178B2 (ja) | 1994-08-10 | 2002-05-27 | 日本電信電話株式会社 | 音信号立ち上がり検出方法 |
AU730123B2 (en) | 1997-12-08 | 2001-02-22 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for processing sound signal |
US6420989B1 (en) * | 2001-01-22 | 2002-07-16 | Credence Systems Corporation | Programmable non-uniform clock signal generator |
DE10224161B4 (de) * | 2002-05-31 | 2012-07-12 | Globalfoundries Inc. | Restphasenfehlerkorrektur |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
KR100580643B1 (ko) * | 2004-02-10 | 2006-05-16 | 삼성전자주식회사 | 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법 |
JP2006042025A (ja) * | 2004-07-28 | 2006-02-09 | Casio Comput Co Ltd | Ofdm信号復調回路及びofdm信号復調方法 |
SG161223A1 (en) | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for vector quantizing of a spectral envelope representation |
ES2705589T3 (es) | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
JP2007251908A (ja) | 2006-02-15 | 2007-09-27 | Sanyo Electric Co Ltd | ノイズ検出回路及びそれを用いたam受信機 |
CN101548486A (zh) * | 2006-10-02 | 2009-09-30 | 三井松岛产业株式会社 | 用于主平巷的无线通信系统 |
US9047874B2 (en) | 2007-03-06 | 2015-06-02 | Nec Corporation | Noise suppression method, device, and program |
CN102881294B (zh) | 2008-03-10 | 2014-12-10 | 弗劳恩霍夫应用研究促进协会 | 操纵具有瞬变事件的音频信号的方法和设备 |
JP2011254122A (ja) | 2009-03-23 | 2011-12-15 | Nec Corp | 回路、制御システム、制御方法及びプログラム |
JP5310494B2 (ja) * | 2009-11-09 | 2013-10-09 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
KR20110090232A (ko) * | 2010-02-03 | 2011-08-10 | 엘에스산전 주식회사 | 위상변위기를 이용한 벡터 모듈레이터 |
JP2011199808A (ja) | 2010-03-24 | 2011-10-06 | Hitachi Kokusai Electric Inc | 受信装置の等化部 |
EP2767978B1 (en) * | 2010-05-25 | 2017-03-15 | Nec Corporation | Noise suppression in a deteriorated audio signal |
CN103250208B (zh) * | 2010-11-24 | 2015-06-17 | 日本电气株式会社 | 信号处理装置和信号处理方法 |
US9531344B2 (en) * | 2011-02-26 | 2016-12-27 | Nec Corporation | Signal processing apparatus, signal processing method, storage medium |
US8791854B2 (en) * | 2011-10-10 | 2014-07-29 | Infineon Technologies Ag | Automotive radar transmitter architecture |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
WO2014136628A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US10276178B2 (en) * | 2013-08-30 | 2019-04-30 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
JP6406258B2 (ja) * | 2013-08-30 | 2018-10-17 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JP6593643B2 (ja) * | 2013-10-04 | 2019-10-23 | 日本電気株式会社 | 信号処理装置、メディア装置、信号処理方法および信号処理プログラム |
US9667219B2 (en) * | 2015-04-22 | 2017-05-30 | The Regents Of The University Of California | Phase noise measurement and filtering circuit |
-
2014
- 2014-02-26 WO PCT/JP2014/054634 patent/WO2014136629A1/ja active Application Filing
- 2014-02-26 JP JP2015504258A patent/JP6528679B2/ja active Active
- 2014-02-26 US US14/773,273 patent/US9715885B2/en active Active
- 2014-02-27 TW TW103106690A patent/TWI581256B/zh active
- 2014-02-27 TW TW105125574A patent/TWI587293B/zh active
- 2014-02-27 TW TW105125568A patent/TWI585753B/zh active
Also Published As
Publication number | Publication date |
---|---|
TWI585753B (zh) | 2017-06-01 |
TWI581256B (zh) | 2017-05-01 |
TW201503115A (zh) | 2015-01-16 |
WO2014136629A1 (ja) | 2014-09-12 |
JP6528679B2 (ja) | 2019-06-12 |
US9715885B2 (en) | 2017-07-25 |
JPWO2014136629A1 (ja) | 2017-02-09 |
US20160019914A1 (en) | 2016-01-21 |
TW201642253A (zh) | 2016-12-01 |
TWI587293B (zh) | 2017-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI585753B (zh) | A signal processing device, a signal processing method, and a signal processing program | |
JP6406258B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US7844453B2 (en) | Robust noise estimation | |
JP2015158696A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP6406257B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
WO2014136628A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
EP2192579A1 (en) | Noise suppression device, its method, and program | |
US9792925B2 (en) | Signal processing device, signal processing method and signal processing program | |
EP2767978B1 (en) | Noise suppression in a deteriorated audio signal | |
US6658380B1 (en) | Method for detecting speech activity | |
JP2016111473A (ja) | 客観画質評価装置及びプログラム | |
JP7152112B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP6964872B2 (ja) | 船舶エンジン回転数推定装置、船舶エンジン回転数推定方法および船舶エンジン回転数推定プログラム | |
JP6119604B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
JP2880683B2 (ja) | 雑音抑制装置 |