TW201333935A - 半導體裝置及聲音通訊裝置 - Google Patents
半導體裝置及聲音通訊裝置 Download PDFInfo
- Publication number
- TW201333935A TW201333935A TW102100748A TW102100748A TW201333935A TW 201333935 A TW201333935 A TW 201333935A TW 102100748 A TW102100748 A TW 102100748A TW 102100748 A TW102100748 A TW 102100748A TW 201333935 A TW201333935 A TW 201333935A
- Authority
- TW
- Taiwan
- Prior art keywords
- noise
- determination
- unit
- signal
- input signal
- Prior art date
Links
- 239000004065 semiconductor Substances 0.000 title claims abstract description 40
- 238000004891 communication Methods 0.000 title claims description 29
- 238000000034 method Methods 0.000 claims abstract description 67
- 230000008569 process Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims description 267
- 230000001629 suppression Effects 0.000 claims description 142
- 230000005236 sound signal Effects 0.000 claims description 112
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
Abstract
本發明提供一種用以實現更高精度之雜訊消除之技術。本發明之半導體裝置(3)包括:解碼部(11),其對已編碼之輸入信號進行解碼;判定部(1001、4001),其進行上述輸入信號中是否含有聲音信號之判定;抑制部(1002、1003),其基於上述判定部之判定結果,而進行用以抑制上述輸入信號中所含之雜訊分量之抑制處理;及第1記憶部(107、208),其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊之比例之第1基準值(SNR2)作為上述判定中使用之判定基準值。
Description
本發明係關於半導體裝置及聲音通訊裝置,尤其係關於有效適用於進行用以自含有聲音信號與雜訊之輸入信號消除雜訊之處理之半導體裝置之技術。
行動電話或電話會議系統等之聲音通訊裝置中,降低雜訊非常重要。行動電話等聲音通訊機器多數適用用以消除背景雜訊(環境雜訊)之技術。例如,專利文獻1及2揭示有用以自含有聲音信號與背景雜訊之信號消除背景雜訊之先前技術。
專利文獻1中揭示有一種雜訊消除技術,其為不損音質而消除背景雜訊,而自輸入信號消除已除去背景雜訊之急劇變化分量之推斷背景雜訊,且對S/N(Signal/Noise:訊噪)比小之頻帶,消除含有背景雜訊之急劇變化分量之再更新推斷背景雜訊。又,專利文獻2揭示有一種技術,其於自含有聲音信號與背景雜訊之信號消除背景雜訊之背景雜訊消除裝置中,基於根據過去之雜訊區間之頻帶頻譜而計算出之按頻帶分之S/N比,而判定當前之訊框信號為聲音區間或雜訊區間中之何者。
[專利文獻1]日本專利特開平10-171497號公報
[專利文獻2]日本專利特開平2001-265367號公報
消除背景雜訊之裝置中,多數係於進行檢測輸入信號中是否含有聲音信號之處理(以下,亦稱為雜訊判定處理)之後,進行區分聲音與雜訊並抑制雜訊之處理。上述雜訊判定處理中,例如使用用以判定為聲音或雜訊之判定基準,而判定輸入信號中是否含有聲音信號。先前,該判定所使用之判定基準係基於背景雜訊而決定。例如,適用行動電話之既存之回音消除器技術之雜訊抑制器中,雜訊判定處理所使用之判定基準係基於表示假設之使用環境中一般之使用環境中之輸入信號相對於背景雜訊之S/N比(例如,22dB)而決定。
另一方面,聲音通訊機器通訊時之音質除了如背景雜訊般之線性雜訊(附加性之雜訊)以外,亦會因聲音信號之編碼引起之聲音信號自身之失真,或存在於說話者與麥克風之間之障礙物(例如,口罩或面罩等)引起之聲音信號自身之失真而劣化。本案發明者發現如下情況:於對含有該背景雜訊以外之雜訊之輸入信號,如先前辦使用僅考慮背景雜訊而決定之判定基準進行雜訊判定處理之情形時,有儘管為聲音仍被錯誤地判定為雜訊之虞。例如,於因利用編碼解碼器之低位元率之編碼而導致聲音信號劣化,且背景雜訊以外之雜訊大於假定之背景雜訊之情形時,若使用基於假定之背景雜訊而決定之判定基準進行雜訊判定處理,則有儘管為聲音仍被錯誤地判定為雜訊,從而不當地抑制聲音之虞。例如,於通話聲音存在背景雜訊以外之雜訊,且背景雜訊以外之聲音之S/N比為17 dB之情形,若使用基於背景雜訊決定之雜訊判定基準(22 dB)進行雜訊判定處理,則大於17 dB且小於22 dB之範圍內之輸入信號儘管含有聲音信號之可能性較高,但仍有被判定
為雜訊之虞。關於基於該聲音信號之失真之雜訊,於專利文獻2中並未特別考慮。
又,本案發明者認為,即便適用專利文獻1記載之技術等進行自輸入信號抑制雜訊之處理,亦無法抑制背景雜訊以外之雜訊分量,故作為雜訊消除並不充分。
本發明之目的在於提供一種用以實現更高精度之雜訊消除之技術。
本發明之上述及其他目的與新穎之特徵當根據本說明書之記述及添附圖式而變得明確。
若簡單地說明本案中所揭示之發明中代表性者之概要,則如下所述。
即,本半導體裝置包括:解碼部,其對已編碼之輸入信號進行解碼;判定部,其進行上述輸入信號中是否含有聲音信號之判定;抑制部,其基於上述判定部之判定結果,而進行用以抑制上述輸入信號中所含之雜訊分量之抑制處理;及第1記憶部,其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊之比例之第1基準值,作為上述判定中使用之判定基準值。
若簡單地說明藉由本案中所揭示之發明中代表性者而獲得之效果,則如下所述。
即,根據本半導體裝置,可實現更高精度之雜訊消除。
1‧‧‧行動電話終端
2‧‧‧行動電話終端
3‧‧‧半導體裝置
10‧‧‧聲音處理部
20‧‧‧聲音處理部
30‧‧‧聲音處理部
40‧‧‧聲音處理部
100‧‧‧雜訊抑制部
101‧‧‧能量計算部
102‧‧‧背景雜訊表更新部
103‧‧‧背景雜訊表保持部
104‧‧‧背景雜訊判定基準選擇部
105‧‧‧背景雜訊判定基準保持部
106‧‧‧特有雜訊選擇部
107‧‧‧特有雜訊判定基準保持部
108‧‧‧雜訊判定基準選擇部
109‧‧‧特有雜訊表保持部
208‧‧‧雜訊判定基準保持部
304‧‧‧背景雜訊判定基準計算部
400‧‧‧雜訊抑制部
1001‧‧‧判定處理部
1002‧‧‧特有雜訊抑制處理部
1003‧‧‧背景雜訊抑制處理部
4001‧‧‧判定處理部
SNR‧‧‧雜訊判定基準
SNR1‧‧‧背景雜訊判定基準
SNR2‧‧‧特有雜訊判定基準
圖1係例示搭載有於聲音播放時進行用以抑制輸入信號中所含之雜訊分量之雜訊抑制處理之聲音處理裝置之行動電話終端之說明圖。
圖2係例示聲音處理部10之信號處理之流程之說明圖。
圖3係例示聲音處理部10之內部構成之方塊圖。
圖4係例示背景雜訊判定基準SNR1之種類之說明圖。
圖5係例示特有雜訊判定基準SNR2之種類之說明圖。
圖6係例示特有雜訊表之說明圖。
圖7係例示特有雜訊表之種類之說明圖。
圖8係例示聲音處理部10之雜訊抑制處理之流程之流程圖。
圖9係例示雜訊判定處理之流程之流程圖。
圖10係例示實施形態2之聲音處理部之內部構成之方塊圖。
圖11係例示聲音處理部20之雜訊抑制處理之流程之流程圖。
圖12係例示實施形態3之聲音處理部之內部構成之方塊圖。
圖13係例示聲音處理部30之雜訊抑制處理之流程之流程圖。
圖14係例示實施形態4之聲音處理部之內部構成之方塊圖。
圖15係例示聲音處理部40之雜訊抑制處理之流程之流程圖。
1.實施形態之概要首先,對本案中所揭示之發明之代表性實施形態之概要進行說明。於代表性實施形態之概要說明中附帶括弧而參照之圖式中之參照符號僅例示附有符號之構成要素之概念中所包含者。
[1](考慮到聲音之失真所引起之雜訊而檢測聲音之半導體裝置)本發明之代表性實施形態之半導體裝置(3)包括:解碼部(11),其對已編碼之輸入信號進行解碼;判定部(1001、4001),其進行上述輸入信號中是否含有聲音信號之判定;抑制部(1002、1003),其基於上述判定部之判定結果,進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊分量之抑制處理;及第1記憶部(107、208),其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊(特有雜訊)之比例之第1基準值(SNR2)作為上述判定中使用之判定基準值。
根據第1項之半導體裝置,由於可使用上述第1基準值作為上述判定之判定基準值,故例如即便於基於聲音信號之失真之雜訊大於假定之背景雜訊之情形時,相較於使用僅考慮背景雜訊之判定基準值之情形,仍可使誤判定聲音信號為雜訊之概率降低,從而可提高雜訊消除之精度。
[2](選擇最小之基準值作為判定基準)如第1項之半導體裝置進而包括:第2記憶部(105、208),其用以儲存規定聲音信號相對於背景雜訊之比例之第2基準值(SNR1)作為上述判定部進行之判定之判定基準值;及選擇部(108),其選擇儲存於上述第1記憶部之上述第1基準值、與儲存於上述第2記憶部之上述第2基準值中最小之基準值。又,第1項之半導體裝置中,上述判定部係使用藉由上述選擇部選擇之基準值進行上述判定。
藉此,容易根據設定於上述第1記憶部及上述第2記憶部之基準值,而選擇適於上述判定之判定基準值。
[3](根據背景雜訊之大小動態地決定判定基準)如第2項之半導體裝置進而包括更新部(304),其基於上述解碼之輸入信號中所含之背景雜訊之信號位準而計算出上述第2基準值,並且更新上述第2記憶部之值。
藉此,即便於輸入信號中所含之背景雜訊之信號位準發生變化之情形時,仍可選擇適於上述判定之判定基準值。
[4](判定方法)如第2或3項之半導體裝置中,上述判定部於上述輸入信號之信號位準大於基於上述判定基準值而決定之判定閾值(雜訊位準×雜訊判定基準SNR)之情形時,判定為上述輸入信號中含有聲音信號,而於上述輸入信號之信號位準小於上述判定閾值之情形時,判定為上述輸入信號中不含聲音信號。
[5](進行自含有聲音之信號抑制背景雜訊與基於上述聲音失真之
雜訊之處理)如第1至4項中任一項之半導體裝置中,上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號進行用以抑制上述背景雜訊之處理,並且進行用以抑制基於上述聲音信號之失真之雜訊之處理。
藉此,不僅背景雜訊,基於聲音信號之失真之雜訊亦得以抑制,故可進一步提高音質。
[6](用於抑制處理之基準值(雜訊表))如第1至5項中任一項之半導體裝置進而包括:第3記憶部(103),其用以儲存成為背景雜訊之抑制量之基準之第3基準值(背景雜訊表);及第4記憶部(109),其用以儲存成為基於聲音信號之失真之雜訊之抑制量之基準之第4基準值(特有雜訊表)。該半導體裝置中,上述抑制部於藉由上述判定部判定為含有聲音信號之情形時,進行用以自上述輸入信號減去對應於上述第3基準值之抑制量,並且減去對應於上述第4基準值之抑制量之處理,而於藉由上述判定部判定為不含聲音信號之情形時,進行用以自上述輸入信號減去基於第3基準值之抑制量之處理。
藉此,除了背景雜訊,亦可容易地抑制基於聲音雜訊之失真之雜訊。
[7](對濁音抑制基於聲音失真之雜訊)如第5或6項之半導體裝置中,上述抑制部對藉由上述判定部(4001)判定為含有聲音信號之輸入信號中含有濁音之聲音信號之輸入信號,進行用以減去對應於上述第3基準值之抑制量及對應於上述第4基準值之抑制量之處理。
藉此,由於未對清音進行對應於上述第4基準值之雜訊之抑制,故即便為基於聲音信號之失真之雜訊具有接近清音之信號波形之情形時,亦不會對含有清音之聲音信號造成不良影響。
[8](對應於聲音之編碼方式之雜訊)如第1至7項中任一項之半導體裝置中,基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
藉此,由於可進行不僅考慮背景雜訊亦考慮到基於編碼解碼器之編碼之雜訊之雜訊抑制,故即便為例如利用編碼解碼器之編碼之位元率較低且聲音信號之失真較大之情形,仍可進一步提高音質。
[9](考慮基於聲音之失真之雜訊而檢測聲音之聲音通訊裝置)本發明之代表性實施形態之聲音通訊裝置(1)包括:接收部(12),其用以接收已編碼之輸入信號;解碼部(11),其對由上述接收部接收到之輸入信號進行解碼;及抑制處理部(100、400),其進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊之處理。上述抑制處理部包括:判定部(1001),其進行上述輸入信號中是否含有聲音信號之判定;及抑制部(1002、1003),其基於上述判定部之判定結果而進行用以抑制上述輸入信號中所含之雜訊分量之抑制處理。進而上述抑制處理部包括第1記憶部(107、208),其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊之比例之第1基準值(SNR2)作為上述判定中使用之判定基準值。
藉此,與第1項相同,可提高利用聲音通訊裝置之雜訊消除之精度。
[10](選擇最小之基準值作為判定基準)如第9項之聲音通訊裝置中,上述抑制處理部進而包括:第2記憶部(105),其用以儲存規定聲音信號相對於背景雜訊之比例之第2基準值(SNR1)作為上述判定部進行之判定之判定基準值;及選擇部(108),其選擇儲存於上述第1記憶部之上述第1基準值、與儲存於上述第2記憶部之上述第2基準值中最小之基準值。又,上述判定部使用藉由上述選擇部選擇之基準值進行上述判定。
藉此,與第2項相同,可選擇適於上述判定之判定基準值。
[11](根據背景雜訊之大小而動態地決定判定基準)如第10項之聲音通訊裝置中,上述抑制處理部進而包括更新部(304),其基於上述
已解碼之輸入信號中所含之背景雜訊之信號位準而計算出上述第2基準值,並且更新上述第2記憶部之值。
藉此,與第3項目相同,可選擇適於上述判定之判定基準值。
[12](判定方法)如第10或11項之聲音通訊裝置中,上述判定部於上述輸入信號之信號位準大於基於上述判定基準值而決定之判定閾值(雜訊位準×雜訊判定基準SNR)之情形時,判定為上述輸入信號中含有聲音信號,而於上述輸入信號之信號位準小於上述判定閾值之情形時,判定為上述輸入信號中不含聲音信號。惟即使於判定為不含聲音信號之情形下、亦被判定為於時間軸上之判定結果含有聲音信號之情形時,判定為含有聲音信號。
[13](進行自含有聲音之信號抑制背景雜訊與基於上述聲音失真之雜訊之處理)如第9至12項中任一項之聲音通訊裝置中,上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號進行用以抑制上述背景雜訊之處理,並且進行用以抑制基於上述聲音信號之失真之雜訊之處理。
藉此,不僅抑制背景雜訊亦抑制基於聲音信號之失真之雜訊,故可進一步提高音質。
[14](抑制處理中使用之基準值)如第9至13項中任一項之聲音通訊裝置中,上述抑制處理部進而包括:第3記憶部(103),其用以儲存成為背景雜訊之抑制量之基準之第3基準值(背景雜訊表);及第4記憶部(109),其用以儲存成為基於聲音信號之失真之雜訊之抑制量之基準之第4基準值(特有雜訊表)。又,上述抑制部於藉由上述判定部判定為含有聲音信號之情形時,進行用以自上述輸入信號減去對應於上述第3基準值之抑制量並減去對應於上述第4基準值之抑制量之處理,而於藉由上述判定部判定為不含聲音信號之情形時,進行用以自上述輸入信號減去對應於第3基準值之抑制量之處理。
藉此,與第6項相同,可容易地抑制基於聲音信號之失真之雜訊。
[15](對濁音抑制基於聲音失真之雜訊)如第13或14項之聲音通訊裝置中,上述抑制部對藉由上述判定部(4001)判定為含有聲音信號之輸入信號中含有濁音之聲音信號之輸入信號,進行用以抑制對應於上述第3基準值之信號分量及對應於上述第4基準值之信號分量之處理。
藉此,與第7項相同,藉由用以抑制雜訊之處理不會對含有濁音之聲音信號造成不良影響。
[16](對應於聲音之編碼方式之雜訊)如第9至15項中任一項之聲音通訊裝置中,基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
藉此,可進行不僅考慮背景雜訊,亦考慮到基於編碼解碼器之編碼之雜訊之抑制處理。
[17](抑制因聲音之失真引起之雜訊之半導體裝置)本發明之代表性實施形態之另一半導體裝置(3)包括:解碼器(11),其對已編碼之輸入信號進行解碼;抑制處理部(100、400),其進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊之抑制處理;及記憶部(107、208、109),其用以儲存在上述抑制處理中使用之、用以抑制上述已解碼之輸入信號中所含之雜訊中基於聲音信號之失真之雜訊之基準值(SNR2、特有雜訊表)。
藉此,由於可進行考慮有基於聲音信號之失真之雜訊之抑制處理,故相較於僅考慮背景雜訊之情形,可提高雜訊消除之精度。
[18](對應於聲音之編碼方式之雜訊)如第17項之半導體裝置中,基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
藉此,與第8項相同,可進一步提高音質。
[19](對濁音抑制基於聲音失真之雜訊)如第18項之半導體裝置
中,上述抑制處理部(400)對藉由上述解碼部解碼之輸入信號中含有濁音之聲音信號之輸入信號,進行用以抑制基於聲音信號之失真之雜訊之處理。
藉此,與第7項相同,藉由用以抑制雜訊之處理,不會對含有清音之聲音信號造成不良影響。
2.實施形態之詳情對實施形態進行更詳細之記述。
《實施形態1》圖1係例示作為聲音通訊裝置之一實施形態之搭載有於聲音播放時進行用以消除輸入信號中所含之雜訊分量之雜訊抑制處理之聲音處理裝置的行動電話終端。該圖中,搭載於行動電話終端1之聲音處理裝置3並無特別限制,藉由眾所周知之CMOS(Complementary Metal-Oxide Semiconductor,互補金屬氧化物半導體)積體電路之製造技術形成於1個如單晶矽般之半導體基板。
使用圖1簡單地說明行動電話終端2接收自行動電話終端2發送之聲音通訊資料進行播放之情形之處理流程。再者,該圖中僅圖示有用以說明該處理之內容所需之功能塊,當然,行動電話終端1具備用以發送聲音通訊資料之功能部(發送部或編碼器等),及行動電話終端2具備用以接收聲音通訊資料之功能部(聲音處理部或接收部等)。
首先,自說話者發出之聲音藉由內置於行動電話終端2之麥克風轉換為電信號。此時,由於來自說話者所處之周邊環境之背景雜訊亦輸入至麥克風,故含有聲音與背景雜訊之聲音轉換為電信號。藉由麥克風生成之電信號藉由編碼器編碼。雖並無特別限制,但編碼器之聲音編碼方式為例如AMR(Adaptive Multi-Rate:適應性多重速率)或ADPCM(adaptive differential pulse code modulation:自適性差分脈衝編碼調製)方式之G.726等。藉由利用編碼器之編碼處理而產生之編碼資料藉由發送部21以特定之傳送方式發送。
行動電話終端1係經由接收部12接收自行動電話終端2發送之編
碼資料。解碼器11進行用以對所接收之編碼資料進行解碼之解碼處理而生成PCM(Pulse Code Modulation脈衝碼調變)資料。聲音處理部10基於上述PCM資料,進行用以聲音播放之各種信號處理,並經由揚聲器播放聲音。
圖2係例示聲音處理部10之信號處理之流程。如圖2所示,自解碼器11輸出之PCM資料暫時儲存於記憶體(緩衝記憶體)。儲存於記憶體之PCM資料以特定之資料單位依序讀出並進行各種信號處理。例如,按每個以80個取樣為1訊框之資料單位進行信號處理。首先,抑制PCM資料所含之DC(direct current:直流)分量。其後,為抑制PCM資料所含之雜訊分量而進行雜訊抑制處理。而且,為修正音質而進行修正信號之頻率特性之處理。最後,以使聲音信號之輸出位準成為適當之大小之方式進行增益調整。
以下,使用圖式對聲音處理部10之雜訊抑制處理進行詳細之說明。
圖3係例示聲音處理部10之內部構成之方塊圖。該圖中為便於說明,僅圖示有雜訊抑制處理之功能塊。如該圖所示,聲音處理部10包括雜訊抑制部100、能量計算部101、背景雜訊表更新部102、背景雜訊表保持部103、背景雜訊判定基準選擇部104、背景雜訊判定基準保持部105、特有雜訊判定基準保持部107、特有雜訊選擇部106、特有雜訊表保持部109、及雜訊判定基準選擇部108。該等功能部中,雜訊抑制部100、能量計算部101、背景雜訊表更新部102、背景雜訊判定基準選擇部104、特有雜訊選擇部106、及雜訊判定基準選擇部108係藉由例如CPU(Central Processing Unit,中央處理單元)等程式處理裝置執行儲存於ROM(Read Only Memory,唯讀記憶體)或RAM(Random Access Memory,隨機存取記憶體)之程式而實現之功能實現機構之一部分。
聲音處理部10之雜訊抑制處理係藉由雜訊抑制部100進行,其處理內容大致分為兩種。其一為判定處理,判定輸入之1訊框之PCM資料(以下,亦僅稱為輸入信號)是否含有聲音信號,其二為抑制處理,用以基於上述判定結果而抑制輸入信號中所含之雜訊。
首先,對上述判定處理進行詳細之說明。判定處理係藉由判定處理部10進行。作為判定處理部10進行之判定處理,有於時間軸上進行之判定處理,與於頻率軸上進行之判定處理之2種處理。本說明書中,將於時間軸上進行之判定處理表示為「有聲/無聲判定處理」,且將於頻率軸上進行之判定處理表示為「雜訊判定處理」而區分2種判定處理,以下,特別以雜訊判定處理為中心進行說明。
判定處理部1001首先對輸入信號進行快速傅立葉轉換(FFT,Fast Fourier Transform)運算,將以時間函數表示之時間軸信號轉換為頻率軸上之信號(頻譜信號)。其次,判定處理部1001對該轉換之輸入信號使用雜訊判定基準SNR進行雜訊判定處理,藉此判定該輸入信號是否含有聲音信號。上述雜訊判定基準SNR為用以決定用以判別雜訊與聲音之閾值之資訊,例如為以「20 log(Ps/Pn)」表示之值。此處,Ps為聲音信號之信號電壓(或信號電流),Pn為雜訊之信號電壓(或信號電流)。判定處理部1001比較對雜訊之信號位準乘以雜訊判定基準SNR而得之值,與輸入信號之信號位準,進行以下處理:若輸入信號較大,則判定為聲音訊框,若輸入信號較小則判定為雜訊訊框。例如,於雜訊判定基準SNR之值為22 Db(振幅比:13)之情形時,判定處理部1001判別輸入信號之信號位準相對於雜訊之信號位準是否為22 dB以上。即,若輸入信號為雜訊之13倍以上之信號位準,則判定處理部1001判定該輸入信號為含有聲音信號之訊框(聲音訊框),若非如此,則判定該輸入信號為不含聲音信號之訊框(雜訊訊框)。
上述之判定處理部1001之判定處理中,使用何種雜訊判定基準
成為問題。例如,於僅考慮背景雜訊之情形時,雜訊少較安靜之環境中,由於聲音信號相對於背景雜訊之S/N比較大,故使用S/N比大之雜訊判定基準(大閾值)進行判定處理,反之,嘈雜之環境中,由於聲音信號相對於背景雜訊之S/N比小,故使用S/N比小之雜訊判定基準(小閾值)進行判定處理。藉此,可抑制通話環境之變化引起之判定精度之降低。然而,如上所述,輸入信號除了含有如背景雜訊般之線性雜訊分量以外,亦含有基於聲音信號之失真之雜訊(以下,稱為特有雜訊)。例如,特有雜訊包含基於編碼解碼器之編碼方式或位元率及壓縮率等引起之聲音信號之失真之雜訊,或基於存在於說話者與麥克風之間之口罩或面罩等障礙物引起之聲音信號之失真的雜訊等。因此,如上所述,於因利用編碼解碼器之低位元率之編碼等導致聲音信號較大地失真,而特有雜訊大於假定之背景雜訊之情形時,若使用基於背景雜訊決定之雜訊判定基準進行雜訊判定處理,則有儘管為聲音訊框,但仍會誤判定為雜訊訊框,在後段之抑制處理中不當地抑制聲音信號之虞。因此,本實施形態之聲音處理部10不僅考慮背景雜訊亦考慮特有雜訊而進行雜訊判定處理。具體而言,使用表示聲音信號相對於背景雜訊之S/N比之背景雜訊判定基準SNR1,與表示聲音信號相對於特有雜訊之S/N比之特有雜訊判定基準SNR2中最小之雜訊判定基準而進行雜訊判定處理。
首先,就背景雜訊判定基準SNR1詳細地進行說明。
圖4係例示背景雜訊判定基準SNR1。如圖4所示,背景雜訊判定基準SNR1根據所假定之通話環境準備複數個。例如,假定安靜之室內般之通話環境之雜訊判定基準SNR1_0(=45 dB),或假定通常之室內般之一般之通話環境之雜訊判定基準SNR1_1(=22 dB)、假定較大之雜訊之雜訊判定基準SNR1_n(=6 dB)等。該等雜訊判定基準SNR1_0~SNR1_n(n為1以上之整數)之資訊保持於例如背景雜訊判定基
準保持部105。背景雜訊判定基準保持部105為具有用以儲存資料之記憶區域之記憶裝置,例如,包含記憶體等。使用何種資訊作為背景雜訊判定基準SNR1係由例如N/S調整模式信號決定。上述N/S調整模式信號為指示背景雜訊判定基準SNR1之信號,經由例如外部或使用者界面輸入。具體而言,背景雜訊判定基準選擇部104自背景雜訊判定基準保持部105選擇並讀出與藉由N/S調整模式信號指示之值對應之背景雜訊判定基準SNR1_0~SNR1_n,且作為背景雜訊判定基準SNR1賦予給雜訊判定基準選擇部108。例如,於藉由N/S調整模式信號指定之參數值為「1」之情形時,背景雜訊判定基準選擇部104選擇背景雜訊判定基準SNR1_1(=22 dB),並將該資訊作為背景雜訊判定基準SNR1賦予給雜訊判定基準選擇部108。
其次,對特有雜訊判定基準SNR2進行說明。
如上所述,聲音信號因利用編碼解碼器之編碼等而失真。本案發明者發現可將該聲音信號之失真作為依存於編碼解碼器之編碼方式或位元率及壓縮率等而不依存於聲音信號之雜訊分量進行模型化(數值化)。例如,為不依存於頻率之白色雜訊形狀之雜訊分量、脈衝形狀雜訊分量、或按每個頻率以特定比率加權之白色雜訊形狀之雜訊分量等。本實施形態中,基於該模型化之特有雜訊而預先計算出特有雜訊判定基準SNR2,並將計算出之特有雜訊判定基準SNR2預先儲存於聲音處理裝置內之記憶裝置。
圖5係例示特有雜訊判定基準SNR2之種類。如圖5所示,特有雜訊判定基準SNR2根據所假定之特有雜訊準備複數個。例如,準備利用編碼解碼器之編碼方式為G.726且位元率為24 kbit/s之情形之雜訊判定基準SNR2_2,及假定使用口罩時之通話之雜訊判定基準SNR2_5等。該等雜訊判定基準SNR2_0~SNR2_m係由以下方法計算出。例如,根據基於設計階段中進行之模擬結果或實際之評估結果而掌握之
特有雜訊之特性,將特有雜訊分量模型化。而且,計算出模型化之特有雜訊分量之平均能量,並基於該平均能量計算出特有雜訊判定基準。特有雜訊判定基準係例如於半導體裝置之設計階段或行動電話終端之製造階段計算出,並儲存於特有雜訊判定基準保持部107。特有雜訊判定基準保持部107為具有用以儲存資料之記憶區域之記憶裝置,例如包含記憶體等。使用何種資訊作為雜訊判定基準SNR2係由例如特有雜訊選擇信號決定。上述特有雜訊選擇信號為指示應該考慮之特有雜訊之信號,且經由例如外部或使用者界面輸入。具體而言,特有雜訊選擇部106自特有雜訊判定基準保持部107讀出與藉由特有雜訊選擇信號指定之參數值對應之特有雜訊判定基準SNR2_0~SNR2_m之資訊,並作為特有雜訊判定基準SNR2賦予給雜訊判定基準選擇部108。例如,於根據特有雜訊選擇信號而指定參數值「0」與參數值「5」之情形時,特有雜訊選擇部106選擇特有雜訊判定基準SNR2_0與特有雜訊判定基準SNR2_5並賦予給雜訊判定基準選擇部108。
雜訊判定基準選擇部108輸入藉由背景雜訊判定基準選擇部104選擇之背景雜訊判定基準SNR1,與藉由特有雜訊選擇部106選擇之特有雜訊判定基準SNR2,選擇所輸入之雜訊判定基準中最小之雜訊判定基準賦予給判定處理部1001。此處,若以式表示利用雜訊判定基準選擇部108之雜訊判定基準之決定方法,則如下述(式1)所示。(式1)中,Ps為聲音信號之信號電壓(或信號電流),Pn_0~Pn_m(m為1以上之整數)為特有雜訊之信號電壓(或信號電流),Pb為背景雜訊之信號電壓(或信號電流)。根據(式1)之決定方法,例如於背景雜訊判定基準SNR1_1、特有雜訊判定基準SNR2_0、及特有雜訊判定基準SNR2_5輸入至雜訊判定基準選擇部108之情形時,若特有雜訊判定基準SNR2_0之值最小,則選擇特有雜訊判定基準SNR2_0賦予給判定處理部1001。判定處理部1001使用藉由雜訊判定基準選擇部108選擇之雜
訊判定基準,藉由上述之方法進行雜訊判定處理。
藉此,例如即便為聲音信號因低位元率之編碼等而較大地失真,且對應於該失真之特有雜訊大於假定之背景雜訊之情形時,由於使用最小之雜訊判定基準進行雜訊判定處理,故含有聲音信號之訊框仍被誤判定為雜訊訊框之概率變低。
其次,對抑制處理詳細地進行說明。抑制處理之處理內容根據輸入信號是否為聲音訊框而不同。具體而言,上述雜訊判定處理中進行對判定為聲音訊框之輸入信號抑制特有雜訊之特有雜訊抑制處理,與抑制背景雜訊之背景雜訊抑制處理,另一方面,對判定為雜訊訊框之輸入信號進行背景雜訊抑制處理。
對特有雜訊抑制處理進行說明。藉由判定處理部1001判定為聲音訊框之輸入信號之頻譜信號被輸入至特有雜訊抑制處理部1002。此處,上述頻譜信號設為含有例如81個頻帶之每個頻帶之頻譜資料之構成。特有雜訊抑制處理部1002基於特有雜訊表之值,對上述頻譜信號進行特有雜訊抑制處理。
圖6係例示特有雜訊表之說明圖。如該圖所示,特有雜訊表係設為例如表示特有雜訊之大小之頻譜資料針對分割為81個之頻帶之每一個加以儲存之資料構成。再者,上述81個之個數只要為與雜訊抑制處理之FFT運算之頻率點數對應之個數即可,並不特別限制於該數。各頻帶之頻譜資料為例如根據基於設計階段中進行之模擬結果或實際評估結果掌握之特有雜訊之特性,針對每個頻帶將特有雜訊進行模型化(數值化)之資料。本實施形態中,針對所假定之特有雜訊之每一種而
預先製作特有雜訊表,並將所製作之特有雜訊表預先儲存於聲音處理裝置內之記憶裝置。
圖7係例示特有雜訊表之種類。如圖7所示,特有雜訊表NT2根據所假定之特有雜訊準備複數個。例如,準備利用編碼解碼器之編碼方式為G.726且位元率為24 kbit/s之情形之特有雜訊表NT2_0,及假定使用口罩時之通話之特有雜訊表NT2_5等。該等特有雜訊表NT2_0~NT2_m之資訊例如保持於特有雜訊表保持部109。特有雜訊表保持部109為具有用以儲存資料之記憶區域之記憶裝置,例如包含記憶體等。特有雜訊抑制處理中,使用何種特有雜訊表係由例如特有雜訊選擇信號決定。特有雜訊抑制處理部1002自特有雜訊表保持部109讀出與藉由特有雜訊選擇信號指定之參數值對應之特有雜訊表NT2_0~NT2_m,並使用所讀出之資料進行特有雜訊抑制處理,自輸入信號除去特有雜訊分量。具體而言,特有雜訊抑制處理部1002係進行以下處理:自輸入信號之頻譜資料之值,減去藉由特有雜訊選擇信號指定之特有雜訊表之頻譜資料之值。該減法處理係針對81個頻帶之每一個而進行。
對背景雜訊抑制處理進行說明。藉由判定處理部1001判定為雜訊訊框之輸入信號(頻譜信號)不經由特有雜訊抑制處理部1002便輸入至背景雜訊抑制處理部1003。又,藉由特有雜訊抑制處理部1002經抑制特有雜訊分量之聲音訊框之輸入信號(頻譜信號)亦輸入至背景雜訊抑制處理部1003。背景雜訊抑制處理部1003係對所輸入之頻譜信號進行背景雜訊抑制處理。具體而言,背景雜訊抑制處理部1003自背景雜訊資料保持部103讀出背景雜訊表之值,並且進行自所輸入之頻譜信號,減去對該讀出之表之值乘以特定之係數而得之值之處理。該減法處理針對頻帶之每一個而進行。上述背景雜訊表例如如上述圖6所示之特有雜訊表所示,設為將表示背景雜訊之大小之頻譜資料針對分割
為81個之頻帶之每一個加以儲存之資料構成,且儲存於背景雜訊表保持部103。背景雜訊表保持部103為具有用以儲存資料之記憶區域之記憶裝置,且包含記憶體等。上述特定之係數為加減背景雜訊之減去量之係數,設為例如根據輸入信號是否為聲音訊框而不同之值。例如對於判定為雜訊訊框之輸入信號,藉由將上述特定之係數設為較大之值而增大抑制量,另一方面,對於判定為聲音訊框之輸入信號,藉由將上述特定之係數設為較小之值而縮小抑制量。背景雜訊抑制處理部1003係對完成背景雜訊抑制處理之頻譜信號進行逆向快速傅立葉轉換(IFFT)運算,而逆轉換為以時間函數表示之時間軸信號。經逆轉換之輸入信號被輸入至進行頻率特性之調整或增益調整等之功能部,最後藉由揚聲器播放。
此處,對背景雜訊表之生成方法進行說明。背景資訊表更新部102假定於通話開始後之固定期間輸入信號中不含聲音信號而僅含有背景雜訊,利用系統啟動後之特定期間製作背景雜訊表。具體而言,首先,能量計算電路101計算出通話開始後之固定期間所輸入之輸入信號(1訊框之PCM資料)之平均能量。其次,背景雜訊表更新部102對計算出之平均能量進行FFT運算處理,生成81個頻帶之每一個之頻譜信號。背景雜訊表更新部102將生成之頻譜資料儲存於背景雜訊表保持部103。其後,於判定處理部1001之雜訊判定處理中,若判定輸入信號為雜訊信號,且雜訊期間持續一定期間以上之情形時,背景雜訊表更新部102基於該輸入信號之平均能量,生成每個頻帶之頻譜資料,並更新儲存於背景雜訊表保持部103之背景雜訊表。又,於更新背景雜訊表時,以不引起急劇之背景雜訊表變化之方式進行更新。藉此,可根據通話環境之變化而更新背景雜訊表。對利用聲音處理部10之雜訊抑制處理之流程詳細地進行說明。
圖8係例示聲音處理部10之雜訊抑制處理之流程之流程圖。
若行動電話終端1與行動電話終端2之間開始通話,且PCM資料儲存於脈衝記憶體,則開始雜訊抑制處理。首先,決定背景雜訊判定基準SNR1(S101)。具體而言,若輸入N/S調整模式信號,則背景雜訊判定基準選擇部104自背景雜訊判定基準保持部105讀出與以N/S調整模式信號指定之參數值對應之背景雜訊判定基準SNR1_0~1_n,並賦予給雜訊判定基準選擇部108。其次,決定特有雜訊判定基準SNR2(S102)。具體而言,若輸入特有雜訊選擇信號,則特有雜訊選擇部106自特有雜訊判定基準保持部107讀出與以特有雜訊選擇信號指定之參數值對應之特有雜訊判定基準SNR2_0~1_m,並賦予給雜訊判定基準選擇部108。
其次,若已抑制DC分量之1訊框PCM資料(輸入信號)輸入至判定處理部1001,則判定處理部1001計算出輸入信號之平均能量(S103)。判定處理部1001基於所計算出之平均能量,而判定輸入信號是否含有聲音信號(S104)。該判定處理為於時間軸上進行之濁音/清音判定處理。濁音/清音判定處理並無特別限制,係基於該訊框之平均能量與在該訊框之前輸入之訊框之平均能量之相互關係,二判別有無聲音信號。
又,判定處理部1001決定頻率軸上進行之雜訊判定處理中所使用之雜訊判定基準SNR(S105)。具體而言,雜訊判定基準選擇部108係藉由選擇所輸入之背景雜訊判定基準SNR1及特有雜訊判定基準SNR2中之最小之雜訊判定基準賦予給判定處理部1001,而決定雜訊判定基準SNR。
其次,判定處理部1001對步驟103中進行了時間軸上之雜訊判定處理之輸入信號進行FFT運算處理,生成頻譜信號(S106)。該頻譜信號例如含有81個頻帶之每一個之頻譜資料。繼而,判定處理部1001計算出輸入信號之信號位準(輸入信號位準)與雜訊之信號位準(雜訊位
準)(S107)。具體而言,判定處理部1001根據輸入信號之81個頻帶之每一個之頻譜資料,而生成表示輸入信號位準之單一資料。又,於生成背景雜訊表之情形時,判定處理部1001根據背景雜訊表之81個頻帶之每一個之頻譜資料,而生成表示雜訊位準之單一之資料。其後之處理根據通話開始後是否經過固定期間而分支(S108)。於通話開始後未經過固定期間之情形時,背景雜訊表更新部102藉由上述之方法製作背景雜訊表,並儲存於背景雜訊表保持部103(S109)。而且,判定處理部1001對上述步驟S106中轉換為頻譜信號之輸入信號進行IFFT運算,而逆轉換為時間軸上之信號(S115)。經逆轉換之輸入信號被輸出至進行後段之頻率特性之修正之功能部(S116)。然後,判定通話是否結束(S117),於通話結束之情形時,聲音處理部10之雜訊抑制處理結束,而於通話未結束之情形時,轉移至上述步驟S103。即,通話開始後經過固定期間之前所輸入之輸入信號係用於背景雜訊表之製作,不實施雜訊抑制處理而直接播放。
另一方面,上述步驟S108中,通話開始後經過固定期間後之輸入信號被輸入至判定處理部1001進行雜訊判定處理(S110)。
圖9係例示雜訊判定處理之流程之流程圖。首先,判定處理部1001比較對雜訊之信號位準乘以雜訊判定基準SNR而得之值,與輸入信號之信號位準(S1101)。具體而言,係比較將上述步驟107中計算出之雜訊位準與上述步驟S105中決定之雜訊判定基準SNR相乘而得之值,與上述步驟S107中計算出之輸入信號位準。步驟S1101中,於輸入信號位準較大之情形時,判定處理部1001判定該輸入信號為聲音訊框(步驟S1104)。另一方面,於輸入信號位準較小之情形時,判定處理部1001參照上述步驟S104之判定結果(S1102)。於上述步驟S104中判定為聲音訊框之情形時,判定處理部1001判定該輸入信號為聲音訊框(S1104)。於上述步驟S194中判定為雜訊訊框之情形時,判定處理
部1001判定該輸入信號為雜訊訊框(S1103)。
於上述步驟S110中輸入信號繼續固定期間以上而判定為雜訊訊框之情形時,該判定結果通知給背景雜訊表更新部102,背景雜訊表更新部102藉由上述之方法更新背景雜訊表(S111),然後,判定為雜訊訊框之輸入信號藉由背景雜訊抑制處理部1003抑制背景雜訊分量(S114)。
於上述步驟S110中判定輸入信號為聲音訊框之情形時,特有雜訊抑制處理部1002讀出與以特有雜訊選擇信號指定之參數值對應之特有雜訊表之值(S112)。然後,特有雜訊抑制處理部1002基於所讀出之特有雜訊表進行特有雜訊抑制處理(S113)。其後,抑制了特有雜訊分量之頻譜信號藉由背景雜訊抑制處理部1003進一步抑制背景雜訊分量(S114)。背景雜訊抑制處理部1003對抑制了特有雜訊分量及背景雜訊分量之頻譜信號、或抑制了背景雜訊分量之頻譜信號進行IFFT運算,而逆轉換為時間軸之信號(S115)。逆轉換之輸入信號輸出至進行後段之頻率特性之修正之功能部(S116)。而且,判定通話是否結束(S117),於通話結束之情形時,聲音處理部10之雜訊抑制處理結束,而於通話未結束之情形時,再次轉移至上述步驟S103,重複進行步驟S103~步驟S116之處理直至通話結束。
以上,根據實施形態1,於存在背景雜訊以外之雜訊之情形時,可根據上述(式1)之決定方法決定雜訊判定基準值,故相較於使用僅基於背景雜訊之雜訊判定基準值進行雜訊判定之方法,可降低將含有聲音信號之訊框誤判定為雜訊訊框之概率,從而可提高雜訊判定處理之精度。進而,進行特有雜訊抑制處理,藉此,由於不僅背景雜訊基於聲音信號之失真之雜訊亦經抑制,故可進行更高精度之雜訊消除。
《實施形態2》圖10係表示實施形態2之聲音處理部之內部構成之一例。圖10所示之聲音處理部20係設為自實施形態1之聲音處理部
10取消選擇雜訊判定基準SNR之功能之構成。具體而言,聲音處理部20取代雜訊判定基準選擇部108、特有雜訊判定基準保持部107、特有雜訊選擇部106、背景雜訊判定基準選擇部104、及背景雜訊判定基準保持部105,而具備雜訊判定基準保持部208。
雜訊判定基準保持部208為具有用以儲存資料之記憶區域之記憶專職,例如包含記憶體等。於雜訊判定基準保持部208儲存有基於上述之(式1)決定之雜訊判定基準SNR之資訊。例如,於包含聲音處理部10之半導體積體電路之設計階段,預先計算出與所假定之通話環境對應之背景雜訊判定基準SNR1,及與所假定之特有雜訊對應之特有雜訊判定基準SNR2,並將其中最小之雜訊判定基準之資訊預先寫入上述雜訊判定基準保持部208。或,亦可於行動電話終端之設計階段自外部寫入雜訊判定基準保持部208。同樣地,亦於特有雜訊表保持部109預先寫入與所假定之特有雜訊對應之特有雜訊表。例如,於編碼解碼器之編碼方式為AMR之情形時,預先儲存特有雜訊表NT2_0,而於編碼方式為G.726且位元率為24 kbit/s之情形時,預先儲存特有雜訊表NT2_2。
圖11係例示利用聲音處理部20之雜訊抑制處理之流程。
行動電話終端1與行動電話終端2之間之通話一開始,便開始雜訊抑制處理。首先,決定雜訊判定基準SNR(S201)。具體而言,判定處理部1001藉由讀出儲存於雜訊判定基準保持部208之雜訊判定基準SNR,而決定用於雜訊判定處理之雜訊判定基準SNR。其後之處理除了步驟S105(基於SNR1、SNR2之雜訊判定基準之選擇處理)以外,與圖8所示之處理流程大致相同。
以上,根據實施形態2,可進行不僅考慮背景雜訊亦考慮到特有雜訊之雜訊判定處理,故與實施形態1相同,可提高雜訊判定處理之精度。又,進行特有雜訊抑制處理,藉此,由於不僅抑制背景雜訊,
亦抑制基於聲音信號之失真之雜訊,故可進行更高精度之雜訊消除。再者,根據實施形態2,由於將預先基於上述(式1)決定之雜訊判定基準儲存於雜訊判定基準保持部208,故無需用以自複數個雜訊判定基準中選擇1個雜訊判定基準之功能部,從而可使系統構成簡單化。
《實施形態3》圖12中表示實施形態3之聲音處理部之內部構成之一例。該圖所示之聲音處理部30除了實施形態1之聲音處理部10之功能以外,亦具備根據背景雜訊之變化而更新背景雜訊判定基準SNR1之功能。具體而言,聲音處理部30取代背景雜訊判定基準選擇部104,而具備背景雜訊判定基準計算部304。
背景雜訊判定基準計算部304基於判定為雜訊訊框之輸入信號,而計算出背景雜訊判定基準SNR1並賦予給雜訊判定基準選擇部108。例如,背景雜訊判定基準計算部304於監控判定處理部1001之判定結果並判定為雜訊訊框之情形時,基於藉由能量計算部101計算出之輸入信號之平均能量,而計算出雜訊判定基準SNR1並賦予給雜訊判定基準選擇部108。再者,雜訊判定基準SNR1之更新可如上所述般監控判定結果而自行進行,亦可配合背景雜訊表之更新時序而進行,更新頻率並無特別限定。
圖13中例示聲音處理部30之雜訊抑制處理之流程。
行動電話終端1與行動電話終端2之間之通話一開始,便開始雜訊抑制處理。首先,決定背景雜訊判定基準SNR1之初始值(S301)。具體而言,若輸入N/S調整模式信號,則背景雜訊判定基準計算部304自背景雜訊判定基準保持部105讀出與以N/S調整模式信號指定之參數值對應之背景雜訊判定基準SNR1_0~1_n,並賦予給雜訊判定基準選擇部108。至其後之步驟S110為止,與上述之圖8之處理流程相同。
步驟S110中,於判定輸入信號為聲音訊框之情形時,與上述相同,進行抑制特有雜訊分量與背景雜訊分量之處理(S112~S114)。另
一方面,步驟S110中,於判定輸入信號為雜訊訊框之情形時,進行背景雜訊表之更新(S111)。而且,背景雜訊判定基準計算部304藉由上述之方法,基於判定為雜訊訊框之輸入信號之平均能量,而計算出背景雜訊判定基準,並作為新的背景雜訊判定基準SNR1賦予給背景雜訊判定基準選擇部108。其後之處理與圖8相同。
以上,根據實施形態3,與實施形態1相同,可提高雜訊判定之精度,從而可進行更高精度之雜訊消除。又,根據實施形態3,即便於例如說話者自嘈雜之通話環境移動至安靜之通話環境,相對於利用編碼之特有雜訊之S/N比小於相對於背景雜訊之S/N比之情形時,亦可根據其變化而選擇最佳之雜訊判定基準,從而可進一步提高雜訊判定之精度。
《實施形態4》圖14中例示實施形態4之聲音處理部之內部構成。該圖所示之聲音處理部40除了實施形態1之聲音處理部10之功能以外,亦具備判別濁音與清音並進行抑制處理之功能。
濁音為伴隨著聲帶之週期性振動之音,具有重複相似波形之特徵。相對於此,清音為不使聲帶振動而直接通過之音,接近白色雜訊等雜訊波形,不會檢測出重複波形。又,清音之頻譜功率與濁音之頻譜功率相比極其小。因此,若進行自含有清音之輸入信號之頻譜資料減去模型化之特有雜訊之頻譜分量之處理,則會有產生頻譜失真之虞。因此,實施形態4之聲音處理部40對含有濁音之聲音訊框進行抑制特有雜訊之處理,而對含有清音之聲音訊框不進行抑制特有雜訊之處理。
圖14所示之雜訊抑制部400之判定處理部4001與上述之判定處理部1001相同,藉由雜訊判定處理讓他判別雜訊訊框與聲音訊框。判定處理部4001於該判別後,進而進行用以判別聲音訊框是否含有濁音之濁音/清音判定處理。判定處理部4001利用濁音之波形(特性)有週期
性,根據波形之週期性之出現率而判定有無濁音。具體而言,判定處理部4001基於相關間距之強度而判定有無濁音。例如,若標準化相互相關值為設定之閾值以上則判定為濁音,若小於閾值則判定為清音。再者,利用判定處理部4001之濁音/清音之判定方法並不限定於上述方法,亦可為其他之方法。例如,由於即便為週期性不明瞭之濁音,亦可高精度地判定,故除了標準化相互相關值以外,作為其他參數值亦可使用零交叉數等進行判定。
藉由上述濁音/清音判定處理判定為含有濁音之聲音訊框之輸入信號(頻譜信號)被輸入至特有雜訊抑制處理部1002,且藉由上述之方法抑制特有雜訊。另一方面,判定為不含濁音(清音)之聲音訊框之輸入信號(頻譜信號)被輸入至背景雜訊抑制處理部1003,且藉由上述之方法抑制背景雜訊。藉此,不會使濁音之特性劣化,而可有效地抑制雜訊,從而有助於通話質量之提高。
再者,背景雜訊抑制處理部1003之背景雜訊抑制處理並無特別限定,與實施形態1相同,處理內容於聲音訊框與雜訊訊框之間不同,但處理內容於濁音之聲音訊框與清音之聲音訊框之間並無不同。
圖15係例示聲音處理部40之雜訊抑制處理之流程。
自步驟S101至步驟S110為止與上述之圖8之處理流程相同。
步驟S110中,於輸入信號判定為雜訊訊框之情形時,與圖8相同,進行背景雜訊表之更新,與抑制雜訊訊框之背景雜訊分量之處理(S111、S114)。另一方面,步驟S110中,於判定輸入信號為聲音訊框之情形時,判定處理部4001進而對判定為聲音訊框之輸入信號進行上述濁音/清音判定處理(S401)。於步驟S401中判定為濁音之情形時,與圖8相同,進行自輸入信號抑制特有雜訊及背景雜訊之處理(S112、S114)。另一方面,於步驟S401中判定為清音之情形時,進行自輸入信號抑制背景雜訊之處理(S114)。其後之處理與圖8相同。
以下,根據實施形態4,與實施形態1相同,可提高雜訊判定之精度。又,區分濁音之聲音訊框與清音之聲音訊框而進行雜訊抑制處理,藉此,可不使濁音之特性劣化而有效地抑制雜訊,從而有助於通話質量之提高。
以上雖已基於實施形態具體地說明由本發明者完成之發明,但本發明並不限定於此,當然亦可於不脫離其主旨之範圍內進行各種變更。
例如,實施形態4中,雖例示有對實施形態1之聲音處理部10追加有區分濁音與清音進行雜訊抑制處理之功能之形態,但並不限定於此,對實施形態2、3之聲音處理部20、30追加上述功能亦可期待相同之效果。
實施形態1至4中,雖以搭載於行動電話終端之聲音處理裝置為例進行說明,但並不限定於此,只要為搭載於電話會議系統或浴室用電話等雜訊消除對音質會產生較大影響之聲音通訊裝置之聲音處理裝置,就可適用上述技術。
又,聲音處理裝置3可為例如以獨立之半導體晶片形成聲音處理部10與編碼解碼器11者,亦可作為將聲音處理部10、編碼解碼器11、接收部12密封於1個封裝之SIP(System In Package,系統級封裝)般之半導體裝置而構成。
再者,雖例示有聲音處理部10、20、30、40內之各功能部藉由由CPU等執行之程式處理而實現,但並不限定於此,可藉由專用硬體實現,亦可以混合有專用硬體與利用軟體之程式處理之系統實現。
10‧‧‧聲音處理部
100‧‧‧雜訊抑制部
101‧‧‧能量計算部
102‧‧‧背景雜訊表更新部
103‧‧‧背景雜訊表保持部
104‧‧‧背景雜訊判定基準選擇部
105‧‧‧背景雜訊判定基準保持部
106‧‧‧特有雜訊選擇部
107‧‧‧特有雜訊判定基準保持部
108‧‧‧雜訊判定基準選擇部
109‧‧‧特有雜訊表保持部
1001‧‧‧判定處理部
1002‧‧‧特有雜訊抑制處理部
1003‧‧‧背景雜訊抑制處理部
SNR‧‧‧雜訊判定基準
SNR1‧‧‧背景雜訊判定基準
SNR2‧‧‧特有雜訊判定基準
Claims (19)
- 一種半導體裝置,其包括:解碼部,其對已編碼之輸入信號進行解碼;判定部,其進行上述輸入信號中是否含有聲音信號之判定;抑制部,其基於上述判定部之判定結果,進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊分量之抑制處理;及第1記憶部,其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊之比例之第1基準值作為上述判定中使用之判定基準值。
- 如請求項1之半導體裝置,其進而包括:第2記憶部,其用以儲存規定聲音信號相對於背景雜訊之比例之第2基準值作為上述判定部進行之判定之判定基準值;及選擇部,其選擇儲存於上述第1記憶部之上述第1基準值、與儲存於上述第2記憶部之上述第2基準值中最小之基準值。
- 如請求項2之半導體裝置,其進而包括更新部,其基於上述解碼之輸入信號中所含之背景雜訊之信號位準而計算出上述第2基準值,並且更新上述第2記憶部之值。
- 如請求項2之半導體裝置,其中上述判定部於上述輸入信號之信號位準大於基於上述判定基準值而決定之判定閾值之情形時,判定為上述輸入信號中含有聲音信號,而於上述輸入信號之信號位準小於上述判定閾值之情形時,判定為上述輸入信號中不含聲音信號。
- 如請求項2之半導體裝置,其中上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號進行用以抑制上述背景雜訊之處理,並且進行用以抑制基於上述聲音信號之失真之雜訊之處理。
- 如請求項5之半導體裝置,其進而包括:第3記憶部,其用以儲存成為背景雜訊之抑制量之基準之第3基準值;及第4記憶部,其用以儲存成為基於聲音信號之失真之雜訊之抑制量之基準之第4基準值;上述抑制部於藉由上述判定部判定為含有聲音信號之情形時,進行用以自上述輸入信號減去對應於上述第3基準值之抑制量,並且減去對應於上述第4基準值之抑制量之處理,而於藉由上述判定部判定為不含聲音信號之情形時,進行用以自上述輸入信號減去對應於第3基準值之抑制量之處理。
- 如請求項6之半導體裝置,其中上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號中含有濁音之聲音信號之輸入信號,進行用以減去對應於上述第3基準值之抑制量及對應於上述第4基準值之抑制量之處理。
- 如請求項1之半導體裝置,其中基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
- 一種聲音通訊裝置,其包括:接收部,其用以接收已編碼之輸入信號;解碼部,其對由上述接收部接收到之輸入信號進行解碼;及抑制處理部,其進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊之處理;且上述抑制處理部包括:判定部,其進行上述輸入信號中是否含有聲音信號之判定;及抑制部,其基於上述判定部之判定結果而進行用以抑制上述輸入信號中所含之雜訊分量之抑制處理;及第1記憶部,其用以儲存規定聲音信號相對於基於聲音信號之失真之雜訊之比例之第1基準值作為上述判定中使用之判定基準值。
- 如請求項9之聲音通訊裝置,其中上述抑制處理部進而包括:第2記憶部,其用以儲存規定聲音信號相對於背景雜訊之比例之第2基準值作為上述判定部進行之判定之判定基準值;及選擇部, 其選擇儲存於上述第1記憶部之上述第1基準值、與儲存於上述第2記憶部之上述第2基準值中最小之基準值;上述判定部使用藉由上述選擇部選擇之基準值進行上述判定。
- 如請求項10之聲音通訊裝置,其中上述抑制處理部進而包括更新部,其基於上述已解碼之輸入信號中所含之背景雜訊之信號位準而計算出上述第2基準值,並且更新上述第2記憶部之值。
- 如請求項10之聲音通訊裝置,其中上述判定部於上述輸入信號之信號位準大於基於上述判定基準值而決定之判定閾值之情形時,判定為上述輸入信號中含有聲音信號,而於上述輸入信號之信號位準小於上述判定閾值之情形時,判定為上述輸入信號中不含聲音信號。
- 如請求項10之聲音通訊裝置,其中上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號進行用以抑制上述背景雜訊之處理,並且進行用以抑制基於上述聲音信號之失真之雜訊之處理。
- 如請求項13之聲音通訊裝置,其中上述抑制處理部進而包括:第3記憶部,其用以儲存成為背景雜訊之抑制量之基準之第3基準值;及第4記憶部,其用以儲存成為基於聲音信號之失真之雜訊之抑制量之基準之第4基準值;上述抑制部於藉由上述判定部判定為含有聲音信號之情形時,進行用以自上述輸入信號減去對應於上述第3基準值之抑制量並減去對應於上述第4基準值之抑制量之處理,而於藉由上述判定部判定為不含聲音信號之情形時,進行用以自上述輸入信號減去對應於第3基準值之抑制量之處理。
- 如請求項14之聲音通訊裝置,其中上述抑制部對藉由上述判定部判定為含有聲音信號之輸入信號中含有濁音之聲音信號之輸 入信號,進行用以減去對應於上述第3基準值之抑制量及對應於上述第4基準值之抑制量之處理。
- 如請求項9之聲音通訊裝置,其中基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
- 一種半導體裝置,其包括:解碼器,其對已編碼之輸入信號進行解碼;抑制處理部,其進行用以抑制藉由上述解碼部解碼之輸入信號中所含之雜訊之抑制處理;及記憶部,其用以儲存在上述抑制處理中使用之、用以抑制上述已解碼之輸入信號中所含之雜訊中基於聲音信號之失真之雜訊之基準值。
- 如請求項17之半導體裝置,其中基於上述聲音信號之失真之雜訊為基於上述編碼之雜訊。
- 如請求項18之半導體裝置,其中上述抑制處理部對藉由上述解碼部解碼之輸入信號中含有濁音之聲音信號之輸入信號,進行用以抑制基於聲音信號之失真之雜訊之處理。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012030384A JP5898515B2 (ja) | 2012-02-15 | 2012-02-15 | 半導体装置及び音声通信装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201333935A true TW201333935A (zh) | 2013-08-16 |
Family
ID=48946376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102100748A TW201333935A (zh) | 2012-02-15 | 2013-01-09 | 半導體裝置及聲音通訊裝置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9431022B2 (zh) |
JP (1) | JP5898515B2 (zh) |
KR (1) | KR20130094246A (zh) |
CN (1) | CN103258542A (zh) |
TW (1) | TW201333935A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6206271B2 (ja) * | 2014-03-17 | 2017-10-04 | 株式会社Jvcケンウッド | 雑音低減装置、雑音低減方法及び雑音低減プログラム |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US11146607B1 (en) * | 2019-05-31 | 2021-10-12 | Dialpad, Inc. | Smart noise cancellation |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
AU730123B2 (en) * | 1997-12-08 | 2001-02-22 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for processing sound signal |
JP3588030B2 (ja) * | 2000-03-16 | 2004-11-10 | 三菱電機株式会社 | 音声区間判定装置及び音声区間判定方法 |
JP3762621B2 (ja) * | 2000-07-31 | 2006-04-05 | 株式会社ケンウッド | 通信端末 |
JP4207494B2 (ja) * | 2002-08-19 | 2009-01-14 | ソニー株式会社 | 音声信号の処理装置および処理方法、並びに方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体 |
KR100640865B1 (ko) * | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
JP4729927B2 (ja) | 2005-01-11 | 2011-07-20 | ソニー株式会社 | 音声検出装置、自動撮像装置、および音声検出方法 |
CN101043560A (zh) * | 2006-03-22 | 2007-09-26 | 北京大学深圳研究生院 | 回声消除器及回声消除方法 |
JP2008219549A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 信号処理の方法、装置、及びプログラム |
US8175145B2 (en) * | 2007-06-14 | 2012-05-08 | France Telecom | Post-processing for reducing quantization noise of an encoder during decoding |
CN101789240B (zh) * | 2009-12-25 | 2012-04-25 | 华为技术有限公司 | 语音信号处理方法和装置以及通信系统 |
-
2012
- 2012-02-15 JP JP2012030384A patent/JP5898515B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-09 TW TW102100748A patent/TW201333935A/zh unknown
- 2013-02-08 CN CN201310050871XA patent/CN103258542A/zh active Pending
- 2013-02-13 US US13/766,329 patent/US9431022B2/en active Active
- 2013-02-14 KR KR1020130015719A patent/KR20130094246A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
KR20130094246A (ko) | 2013-08-23 |
JP5898515B2 (ja) | 2016-04-06 |
US9431022B2 (en) | 2016-08-30 |
JP2013167720A (ja) | 2013-08-29 |
CN103258542A (zh) | 2013-08-21 |
US20130211831A1 (en) | 2013-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8483854B2 (en) | Systems, methods, and apparatus for context processing using multiple microphones | |
JP5690415B2 (ja) | 雑音抑圧方法及び当該雑音抑圧方法を適用するための雑音抑圧器 | |
JP5923994B2 (ja) | 音声処理装置及び音声処理方法 | |
US20130163781A1 (en) | Breathing noise suppression for audio signals | |
JP2008519553A (ja) | バーク帯域ワイナ・フィルタと線形減衰とを用いたノイズ低減及びコンフォート・ノイズ・ゲイン制御 | |
CN108133712B (zh) | 一种处理音频数据的方法和装置 | |
US11488616B2 (en) | Real-time assessment of call quality | |
TW201333935A (zh) | 半導體裝置及聲音通訊裝置 | |
Bhattacharya et al. | Low-latency smartphone app for real-time noise reduction of noisy speech signals | |
JP2008309955A (ja) | ノイズサプレス装置 | |
JP2011053557A (ja) | 悲鳴検出装置および悲鳴検出方法 | |
US9978394B1 (en) | Noise suppressor | |
JP2011172165A (ja) | エコー除去装置、方法及びプログラム |