TW200832359A - Method of a voice signal processing - Google Patents

Method of a voice signal processing Download PDF

Info

Publication number
TW200832359A
TW200832359A TW096102443A TW96102443A TW200832359A TW 200832359 A TW200832359 A TW 200832359A TW 096102443 A TW096102443 A TW 096102443A TW 96102443 A TW96102443 A TW 96102443A TW 200832359 A TW200832359 A TW 200832359A
Authority
TW
Taiwan
Prior art keywords
frequency
voice signal
sound
energy
bandwidth
Prior art date
Application number
TW096102443A
Other languages
English (en)
Other versions
TWI308740B (en
Inventor
Tai-Huei Huang
Po-Kai Huang
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW096102443A priority Critical patent/TWI308740B/zh
Priority to US11/856,057 priority patent/US20080177539A1/en
Publication of TW200832359A publication Critical patent/TW200832359A/zh
Application granted granted Critical
Publication of TWI308740B publication Critical patent/TWI308740B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/353Frequency, e.g. frequency shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

200832359 j^^zyDUU /4TW 22309twf.doc/n 九、發明說明: 【發明所屬之技術領域】 本發明是關於一種語音信號處理方法,且特別b 於 一種為聽覺頻寬調整的聽障者提升語音辨識能力之 號處理方法。 #曰信 【先前技術】
隨著社會人口的高齡化現象,愈來愈多年長者面臨聽 力降低或者受損的問題,致使其對自然語音的辨識能 下降。一般而言,聽障者會使用助聽器來提升聽力此統 助聽器利用控麵帶能量增益的方^,以補償聽障者聽力 受損頻帶的能量,同時也採用頻譜能量動態範圍壓縮^術 以避免過度放大訊號而造成的不適或傷害聽神經,。 此外,根據臨床研究,大部分隨年紀老化而聽力受損 的現象多從喪失高頻訊號的感知開始,如圖1A所示,區 塊101為一般日常聲音的頻率與抵達耳朵時的音量大小分 佈範圍,區塊102為子音字母(例如:b、c、f··)頻率與音量 大小分布範圍,區塊103為母音字母(例如:音_中的yi/、 /a/···)頻率與音量大小分佈範圍。如圖1B所示,曲線1〇5 為隨年紀老化而聽力受損者的聽力臨界值曲線,因此可以 ,現聽力受損者主要為喪失頻率範圍刚的高頻訊號。此 時’聽障者對高頻頻帶可接受的動態變化範圍極小,在這 些頻帶即便採取增益補償策略也難以提升語音辨識能力。 ,,,如何因應聽力受損者耳朵可聽的頻寬變窄的現象而 提昇語音辨識能力成為現今重要課題之一。 5 200832359 P52950074TW 22309twf.doc/n 隨著語音訊號數位化處理技術的精進,在語音訊號經 過取樣量化後,利用頻率轉移處理將語音訊號的頻譜調整 轉移至使用者殘餘聽力的頻寬範圍内,以解決使用者耳朵 可聽頻寬變窄之問題。圖2繪示為習知頻率轉移處理方法 之流程圖。請參照圖2,首先將取樣量化後的語音訊號A[n] 經離散傅立葉轉換處理(步驟§201),在頻域上分析此語音 訊號後,利用一頻率轉移函數將語音訊號頻率壓縮轉移至 低頻(步驟S202),最後再經離散反傅立葉轉換將其轉換為 時域上的語音訊號。相關頻率轉移處理技術揭露 在 Discrimination of speech processed by low_pass filtering and pitch-invariant frequency lowering,,,J· Acoust· Soc· Am· 74 (2) ρ·409〜419, 1983 之論文與”FreqUenCy i〇wering 此吨 a discrete exponential transform, EUROSPEECH55 99? 2769-2772· 1999 之論文中。 此外,在” Frequency lowering processing for listeners with significant hearing loss,Proceeding of ICECS” 99· v〇i 2, p741〜744, 1999之論文中更提出語音訊號經頻率轉移處 理之後再增加頻譜的能量峰值,以增加語音辨識效果。然 而上述所提及相關頻率轉移處理技術的論文中,皆假設原 訊號的頻寬為取樣頻率的一半,而將此固定的頻寬轉移至 聽障者的聽覺頻寬。由於語音信號的頻寬會依不同的語音 類型或說話者的發音特性而不同,我們發現倘若皆施以固 定的頻率轉移函數,則頻寬較窄的語音訊號經頻率轉移處 理後會產生較大的頻譜形狀誤差,因此降低處理後語音可 6 200832359 P52950074TW 22309twf.doc/n 辨識的效果。 美國第20040175010號專利案中提出“Method for frequency transposition in a hearing device and a hearing device” 技術。此專利之内容提出類比人耳聽神經對頻率敏感度分佈之 頻率壓縮轉移函數。該轉移函數的主要定義參數為語音訊號的 取樣頻率與聽障者的聽覺頻寬,但是依然無法因不同語音頻寬 而進行動態調適。 【發明内容】 本發明提供一種語音訊號處理方法。首先在頻域上估 測每一音框語音訊號的實際頻寬,而此實際頻寬為每一個 音框旎1集中的頻帶,藉以在壓縮轉移原訊號至低頻帶 日守,能充分的利用頻帶能量集中的特性以有效保留頻譜形 狀的特徵。而將此訊號頻寬壓縮轉移至低頻帶之目的為使 A號頻I能付合聽障者可感知的聽覺頻寬,以提升聽障者 的語音辨識能力。此外,更進一步補償此實際頻寬壓縮轉 移後以高頻帶訊號置換低頻帶訊號所降低的能量,以維持 原訊5虎整體的能量外型。 ' 本發明提供一種語音訊號處理方法。首先分析出語音 訊號的頻寬,藉充分利用能量集中的頻帶以保留這些音框 頻譜=狀的特徵。再依據此頻寬動態調整頻寬壓縮轉移至 低頻帶的賴缝’以聽減較窄之喊簡縮轉移後 造成較大的賴形麟差㈣響聽障者語音賴能力。此 外’ i進r步的補償此職雜轉移後以高頻帶訊號置換 低頻帶訊賴降低的能量轉持原減整體的能量。 7 200832359 P52950074TW 22309twf.doc/n 本發明提出一種語音訊號處理方法,適用於提升語音 辨識旎力,此語音訊號處理方法包括接收語音訊號,其中 此語音訊號依據一窗函數可分為多個音框。接著,將每一 個曰框轉換至頻域,並估測每一個音框的實際頻寬。再依 财際織大小祕碰—鮮轉移函數,並使用此頻率 轉移函數對每-個音框的實際頻寬做鮮轉移處理。 立本發明另提出-種語音信號處理方法,適用於提升聽 卩羊者的叩曰辨識此力,此語音信號處理方法包括接收纽立 訊號’其中語音訊號依據-窗函數可分為多個音框。接^ 判,每一個音框是否為高頻部分能量較高之子音。當音框 為高頻類之子音時,則估測此音框的實際頻寬,並I使用 -頻率轉移缝將此音框的實際職做解轉移處理,立 中頻率轉移函數隨實際頻寬大小而動態調整。 一 依照本發雜佳實闕所叙語音錢處理方法,其 每—個音框是否為高頻類之子音的步驟中更包: 计异每-個音㈣高頻帶平均能量與低頻帶平均能量,以 及計算此低解平均能量與此高歸 值。當此能量比值祕藏參數鱗,航音框為月高^ 之子音。 料齡每—個音框的實際訊 使在針對每―個音框進行鮮壓縮轉移至 ^員心,能充分能量射的鱗以保留原有的頻譜 升聽障者語音辨識能力。此外更依據每-個 曰框訊奴實際航大小,動_整敏魏轉移至 200832359 P52950074TW 22309twf.doc/n 帶的轉換函數,使聽障者能有效感知原屬高頻帶語音頻轉 的變化。更進一步的補償因壓縮轉移後以高頻帶訊號置換 低頻帶訊號而降低之能量以維持原訊號的能量。 為讓本發明之上述和其他目的、特徵和優點能更明顯 易懂’下文特舉本發明之較佳實施例,並配合所附圖式, 作詳細說明如下。 【實施方式】 φ 在說明本發明實施例之前,首先假設本實施例應用在 聽障者所使用之助聽器,藉以提升聽障者的語音辨識能 力,然而本實施例並不侷限於此範圍,仍可應用在其他範 圍,例如:語音轉換器。 圖3繪示為本發明之一較佳實施例的語音信號處理方 法=流程圖。請參照圖3,首先接收一語音訊號,且使用 一窗函數,例如一矩形窗函數,將語音訊號可分為多個音 框(S301),如圖4所示,範圍4(n、4〇2與4〇3各為不同之 音框(在此僅圖示3個音框)。接著,再針對每一個音框進 肇 行快速傅立葉轉換(fast Fourier transform,FFT)之處理(如 步驟S302),在頻域上分析每一個音框之頻譜特性,其 冑音訊號在做快速傅立葉轉換處理_先經過取樣以&旦 化。 里 一估測此音,的訊號實際頻寬(如步驟S303),如圖5 不之方法’言十算此音框頻率fstart赫兹i fs/2赫兹的總能量 E,,以及此音框-預設頻寬赫茲至^赫兹的能量 其中fs為語音訊號的取樣頻率。由於人麵話聲音的頻率 9 200832359 r jzy』υυ /4TW 22309twf.doc/n 大多集中在8000赫茲以下,在此假設8〇〇赫茲至8〇〇〇赫 茲的能量為總能量E〗。而當此音框預設頻寬的能量&與 總能量Ε〗的比值為一預定值時,即可估測出此音框訊號的 實際頻帶為0〜fbw赫茲,例如:此預定值若設為〇 9,則取 此音框約佔總能量九成的頻寬為實際頻寬。 將每一音框取得之實際頻寬調整至聽障者可感知的頻 寬範圍内,亦即將此訊號經過頻率壓縮處理,藉以轉移至 φ 低頻帶(即步驟S304),而幫助耳朵聽覺頻寬較小的聽障者 感知語音。而在此舉例說明頻率轉移處理為利用一頻率轉 移函數/’=1_75_:抓^11(//1〇〇(^)/(:;?),將此實際頻寬壓縮轉 移至低頻帶,其中/為壓縮轉移前的頻率,而/,為壓縮轉 移後的頻率,且Ci?為依據估測之實際頻寬大小所產生的動 悲調整餐數,亦即隨著每一個音框訊號之實際頻寬大小而 動態调整頻率轉移函數,藉以針對每一個音框的頻譜特性 做適當的頻率轉移處理。 ' 而動態調整參數Ci? = arctan(/㈣/lOOoV^/arctanC^ /lOOoV^),其 馨 中尨為估測之實際頻寬,且Λ為聽障者可感知的頻寬,此 動悲調整參數之調整主要目的為避免如頻寬較窄的語音信 號,假設施以固定的頻率轉移函數,會致使壓縮轉移後產 生較大的頻譜形狀誤差,因而降低壓縮轉移後語音訊號可 辨識的效果。如圖6所示,假設聽障者所感知的頻寬入與 壓縮轉移前的輸入訊號頻寬/固定(例如/吋㈧❹赫茲),當 估測之實際頻寬/_越小,動態調整參數Ci?越小,則壓縮轉 矛夕後《有效的成5虎頻I中取得的的頻率點數較多,因'此即 可避免頻寬較窄的語音訊號壓縮轉移太過,造成頻譜形狀 200832359 P52950074TW 22309twf.doc/n 誤差 在經過頻率轉移處理之後,由於將每—音框的訊 ,頻寬縮轉移至低頻帶,可能造成能量降低,因此^能 1維持不變為糊’補償每—個音框崎低的能量(即步驟 S3〇5)。在此舉例說明能量補償處理之方式為分別計算每一 =音框做辭轉移處縣後的能量值,定祕理前後的能 ,比值為增益值,再將每—個音框做頻率轉移處理後各頻 率的頻,乘上3值^^成能量娜之動作。例 ’其中卿)與而⑽)分 別為弟/個a框做頻率轉移處理前與頻率轉移處理後 個頻率之頻譜值’ *能量補償後之鱗值如)=㈣⑽, ’其中N為每—個音框經快速傅立葉轉換後 頻率取樣點數。 ^最後’再將每—個音框_快速反傅立葉轉換(inverse 細F0urier transform,IFFT)之處理,即可轉換為時域上的 语音訊號(即步驟S3〇6)。因此藉由本實施例之實施可以調 整語音訊敍猶者可.的職範_,制提升語音 辨識能力的目的。如上述之說明,圖7A、圖7B以及圖% 繪示為本發明之—触實施_語音峨處理方法之示 圖。請參照圖7A、圖7B以及圖7C,首統測語音訊& 的每-個音框的實際頻寬,如圖7A所示,選擇能量隼中 的頻帶701為實際頻寬。接著將此實際頻X 7〇1經頻率轉 移處理’如圖7B所示’將此實際駐壓轉移至聽障者 2感知:頻見702。之後再對此頻率轉移處理後的實際頻 見做能量補償之處理’如圖W之曲線期為能量補償後 11 200832359 rjz.yjvufATW 22309twf.doc/n 之頻譜值。 虛田,4本發θ 3 l佳實施例巾將此語音訊號處理方法 2在,2頻類子音之語音辨識能力,圖⑽示為本發 2 例的語音訊號處理方法之流程圖。請參照
:,/丨^先’/接收―語音訊號,其中語音訊號依據一窗函 你士 Γ、矩形固函數可分為多個音框(即步驟s801)。由 二”紀,化的聽力受損現象為喪失高頻訊號的感 二,’:了提ί對1^頻類子音的辨識能力,因此判斷每-個 為高,率之子音(即步驟驗),再針對高頻類子 處理’讓聽障者可以以較低頻帶的 車父仏I力來辨識這些高頻類的子音。 在此舉例朗如何_每—個音框是否為高頻率之 =方^ ’如圖9所示,計算此音框頻率〇赫兹至右⑽赫
Ei°w與此音框頻率u赫兹至w赫 兹冋如7平均心£_的—能量比值。當此能量比值小 於-預設參數值時’即可判斷此音框為高頻率之子音。接 著便針對此高鮮之子音騎辭轉移之處㈣及頻率補 Ϊ之處理,以下步驟如上述圖3實關之制,故不加以 贅述。 接著,藉由模擬實驗比較本發明之較佳實施例盘習知 技術。如圖10A、圖10B與圖1〇c所示,圖為語音訊 號做頻率轉移處理前的頻譜,圖應為本發明實施例對語 音訊號做頻率轉移處理後的頻譜,而圖1GC為習知技術中 對語音訊舰_定的鮮轉移函㈣處理。圖· 1001的頻譜經本發明實施例頻率轉移處理後,仍齡有原 12 200832359 rjzyjw/4TW 22309twf.doc/u 頻譜值的大小(如圖1GB中範圍刪 _ 施以固定頻率轉移函數的處理後,告 經習知技術
中範圍1003所示)。 σ化成失真(如圖10C 此外,耩由實驗證明本發者 子音之語音辨識能力的效果,首“I::,升高頻類 中高頻類子音,如1|、〈、丁、生Ί衣'"曰貪料包含華語 匚等中文音續,而錄製的語音資料包含四17今、Λ、 性,亦即不同的說話者所錄製的j <男性及四位女 料經三種處理方法’分別為=::曰貝科。而將此語音資 法二:習知固定頻率轉移函數nU轉移處理,方 =態調整頻率轉移函數之處 ::二=: 頻率為16000赫兹。 ,、r扣曰訊旎的取樣 ιί設聽障者的聽覺頻寬為_ 二種處理方法的語音資跡鉍將上述分別經 波器處理,以模擬發障者丁項見為2000赫兹的低通濾 常者進_驗。1見之方法’再針對15位聽力正 與正確ϊΐΐ有ί 3目门如圖11所示,設計三項誘答選項 處理方同但如^ 土翌兰確率(%) 553% 83.0% ~~----- 87.7% 、处所述,本^ 估測 13
200832359 P52950074TW 22309twf.doc/n 每曰訊射每—個音框能量集中的實際頻寬,並且依據此 估測之實際頻寬大小動態調整頻率轉移函數,使得纽立 號在頻率轉移處理時能充分的利用能量集中 ^伴 留頻譜形狀的特徵’崎低解轉移處理 失^ :除此之外,本發明所提出之語音訊號處理方 饧經頻率轉移處理後所降低的能量。另外,更牛 升兩頻類子音的語音辨識能力。 〆 剌已崎佳實闕揭露如上,然其並非用以 限疋本發明,任何所屬技術領域中具有通常知識者,在不 脫離本發明之精神和範_,#可作些許之更動與潤倚, 因此本發明之賴翻#視後社_請專職圍所界定者 為準。 【圖式簡單說明】 圖1A繪示為日常聲音大小與頻率大小之分布圖。 圖1B繪示為隨年齡老化之聽力受損者之聽力分布圖 圖2繪示為習知頻率轉移處理方法之流程圖。 、圖3繪示為本發明之一較佳實施例的語音訊號處理方 法之流程圖。 圖4繪示為語音訊號分為多個音框之示意圖。 圖5緣示為計算實際頻寬之示意圖。 圖6繪示為動態調整參數影響頻率轉移函數輸出頻笋 值之不意圖。 一圖7A繪示為本發明之一較佳實施例的估測實際頻寬 之示意圖。 、、 200832359 fdz!/3uu/4TW 22309twf.doc/n 圖7B 之示意圖。 繪示為本發明之—較佳實施例的解轉移處理 圖7C!會示為本發明之一較佳實施例的能量補償處理 之示意圖。 圖8繪示為本發明另一較佳實施例的語音訊號處理方 法之流程圖。 圖9繪示為計算高頻類子音高低頻帶能量之示意圖。
圖10A緣示為語音峨未經解轉減理之頻譜。 圖10B緣不為語音訊號經本發明實施例頻率 理後之頻譜。 圖10C繪示為語音訊號經習知頻率轉移處理後之頻 譜。 、 圖11繪示為本發明實施例的實驗設計題型。 【主要元件符號說明】 101:日常聲音發聲頻率與聲音大小分布範圍 102 :子音發聲頻率與聲音大小分布範圍 103 :母音發聲頻率與聲音大小分布範圍 104 :頻寬範圍 105 :聽力臨界值曲線 S201〜S203:習知語音訊號處理方法之流程圖 S301〜S306 :本發明之一較佳實施例的語音訊號處理 方法之步驟 401〜403 :音框 E1、E2、Blow、Ehigh :能量 15 200832359 P52950074TW 22309twf.doc/n [start、fbw、flow ··頻率 f;:取樣頻率 701 :實際頻寬 702 :頻率轉移後的頻寬 703 :能量補償後的頻譜值 S801〜S809 :本發明之一較佳實施例的語音訊號處理 方法之步驟 1001〜1003 :頻譜範圍
16

Claims (1)

  1. 200832359 谓/4TW 22309tw£d〇c/n 十、申請專利範圍: 1. 一種語音訊號處理方法,適用於提升語音辨識能 力,包括: 接收一語音訊號,其中該語音訊號依據一窗函數分為 多個音框; ^ 將每一該些音框轉換至一頻域,並估測每一該些音框 的一實際頻寬;以及 φ 依據該實際頻寬的大小動態調整一頻率轉移函數,並 使用該頻率轉移函數對該實際頻寬做頻率轉移處理。 2·如申請專利範圍第1項所述之語音訊號處理方 法,更包括: 計算每一該些音框的總能量與經頻率轉移處理後每 一該些音框的能量的一增益值;以及 依據該增益值對每一該些音框做能量補償處理。 3·如申請專利範圍第1項所述之語音訊號處理方 法,其中估測每一該些音框的該實際頻寬之步驟包括·· 馨 冲异母一該些音框的總能量與每一該些音框一預設 頻寬的能量的一比值;以及 當該比值為一預定值,則該預設頻寬為該實際頻寬。 4·如申请專利範圍第1項所述之語音訊號處理方 法’其中對該實際頻寬做頻率轉移處理之步驟包括·· 依據人類感知之聽力頻寬fh與該實際頻寬fuse產生一 動調整參數 CR,其中 ci^arctanC/^/lOOOV^/aretanC^/lOOOV^ ; 以及 17 200832359 /4TW 22309twf.doc/n 依據該動態調整參數CR調整該頻率轉移函數f, /=100(^__1311(//100{^)/〇),其中f為頻率轉移處理前之 頻率。 5·如申請專利範圍第1項所述之語音訊號處理方 法’其中該頻域為對母一該些音框做快速傅立葉轉換處理。 6·如申請專利範圍第1項所述之語音訊號處理方 法,其中該窗函數為矩形窗函數。 7· —種語音訊號處理方法,適用於提升語音辨識能 力,包括: 接收一語音訊號,其中該語音訊號依據一窗函數分為 多個音框; 判斷每一該些音框是否為較高頻率之子音; 當每一該些音框為較高頻率之子音,則將每一該些音 框轉換至一頻域,並估測每一該些音框的一實際頻寬;以 及 ' ^ 依據該實際頻寬的大小動態調整一頻率轉移函數,並 使用該頻率轉移函數對該實際頻寬做頻率轉移處理。 、8·如申請專利範圍第7項所述之語音訊號處理方 法’其中判斷每一該些音框是否為較高頻率之子音更包括: 計算每一該些音框的一高頻帶平均能量與一低頻帶 平均能量; 計异該低頻帶平均能量與該高頻帶平均能量的一能 量比值;以及 當該能量比值小於一預設參數值,則每一該些音框為 18 200832359 P52950074TW 22309twf.doc/n 焉頻率之子音。 、9·如中請專·圍第7項所述之語音訊號處理方 法,在對該實際頻寬做頻率轉移處理之後更包括: 計算每一該些音框的總能量與經頻率轉移處理後每 一該些音框的能量的一增益值;以及 根據該增盈值對每一該些音框做能量補償處理。 10·如申請專利範圍第7項所述之語音訊號處理方 法,其中估測每一該些音框的該實際頻寬之步驟包括: 計算每一該些音框總能量與每一該些音框一預設頻 寬内能量的一比值;以及 當該比值為一預定值,則該預設頻寬為該實際頻寬。 11·如申請專利範圍第7項所述之語音訊號處理方 法’其中對該實際頻寬做頻率轉移處理包括: 依據人類感知之聽力頻寬fh與該實際頻寬fuse產生一 動態調整參數 CR,其中 Ci? = /100〇v^/arctanC^ ; 以及 • 依據該動態調整參數CR調整該頻率轉移函數f, /’=100〇V^tan(arctan(//l〇〇〇V^)/Ci?),其中 f 為頻率轉移處理前之 頻率。 12·如申請專利範圍第7項所述之語音訊號處理方 法’其中該頻域為對每一該些音框做快速傅立葉轉換處理。 13·如申請專利範圍第7項所述之語音訊號處理方 法,其中該窗函數為矩形窗函數。 19
TW096102443A 2007-01-23 2007-01-23 Method of a voice signal processing TWI308740B (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW096102443A TWI308740B (en) 2007-01-23 2007-01-23 Method of a voice signal processing
US11/856,057 US20080177539A1 (en) 2007-01-23 2007-09-16 Method of processing voice signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW096102443A TWI308740B (en) 2007-01-23 2007-01-23 Method of a voice signal processing

Publications (2)

Publication Number Publication Date
TW200832359A true TW200832359A (en) 2008-08-01
TWI308740B TWI308740B (en) 2009-04-11

Family

ID=39642124

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096102443A TWI308740B (en) 2007-01-23 2007-01-23 Method of a voice signal processing

Country Status (2)

Country Link
US (1) US20080177539A1 (zh)
TW (1) TWI308740B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI504282B (zh) * 2012-07-20 2015-10-11 Unlimiter Mfa Co Ltd 增加聽障者聽到聲音正確性之方法及助聽器
TWI557728B (zh) * 2015-01-26 2016-11-11 宏碁股份有限公司 語音辨識裝置及語音辨識方法
CN106205637A (zh) * 2015-03-02 2016-12-07 智原科技股份有限公司 音频信号的噪声检测方法与装置
TWI566242B (zh) * 2015-01-26 2017-01-11 宏碁股份有限公司 語音辨識裝置及語音辨識方法
TWI576824B (zh) * 2013-05-30 2017-04-01 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5010743B2 (ja) * 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
KR101589942B1 (ko) 2009-01-16 2016-01-29 돌비 인터네셔널 에이비 외적 향상 고조파 전치
DK2211339T3 (en) * 2009-01-23 2017-08-28 Oticon As listening System
TWI421857B (zh) * 2009-12-29 2014-01-01 Ind Tech Res Inst 產生詞語確認臨界值的裝置、方法與語音辨識、詞語確認系統
US20120197643A1 (en) * 2011-01-27 2012-08-02 General Motors Llc Mapping obstruent speech energy to lower frequencies
TWI519123B (zh) * 2013-03-20 2016-01-21 元鼎音訊股份有限公司 電話語音輸出之方法,用於電話語音之電腦程式產品及可撥打電話之電子裝置
TWI609365B (zh) * 2016-10-20 2017-12-21 宏碁股份有限公司 助聽器及其寬動態範圍壓縮的恢復時間動態調整方法
TWI664627B (zh) * 2018-02-06 2019-07-01 宣威科技股份有限公司 可優化外部的語音信號裝置
US11776558B1 (en) * 2022-03-22 2023-10-03 Sonova Ag Systems and methods for generating and/or implementing a modified audiogram

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173062B1 (en) * 1994-03-16 2001-01-09 Hearing Innovations Incorporated Frequency transpositional hearing aid with digital and single sideband modulation
US6169813B1 (en) * 1994-03-16 2001-01-02 Hearing Innovations Incorporated Frequency transpositional hearing aid with single sideband modulation
US20040175010A1 (en) * 2003-03-06 2004-09-09 Silvia Allegro Method for frequency transposition in a hearing device and a hearing device
US7248711B2 (en) * 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
WO2006133431A2 (en) * 2005-06-08 2006-12-14 The Regents Of The University Of California Methods, devices and systems using signal processing algorithms to improve speech intelligibility and listening comfort

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI504282B (zh) * 2012-07-20 2015-10-11 Unlimiter Mfa Co Ltd 增加聽障者聽到聲音正確性之方法及助聽器
TWI576824B (zh) * 2013-05-30 2017-04-01 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器
TWI557728B (zh) * 2015-01-26 2016-11-11 宏碁股份有限公司 語音辨識裝置及語音辨識方法
TWI566242B (zh) * 2015-01-26 2017-01-11 宏碁股份有限公司 語音辨識裝置及語音辨識方法
CN106205637A (zh) * 2015-03-02 2016-12-07 智原科技股份有限公司 音频信号的噪声检测方法与装置
TWI576834B (zh) * 2015-03-02 2017-04-01 聯詠科技股份有限公司 聲頻訊號的雜訊偵測方法與裝置
CN106205637B (zh) * 2015-03-02 2019-12-10 联咏科技股份有限公司 音频信号的噪声检测方法与装置

Also Published As

Publication number Publication date
US20080177539A1 (en) 2008-07-24
TWI308740B (en) 2009-04-11

Similar Documents

Publication Publication Date Title
TW200832359A (en) Method of a voice signal processing
Levy et al. Extended high-frequency bandwidth improves speech reception in the presence of spatially separated masking speech
Bentler et al. Digital noise reduction: An overview
US10652674B2 (en) Hearing enhancement and augmentation via a mobile compute device
Souza et al. Exploring the limits of frequency lowering
US9130523B2 (en) Methods and apparatus for processing audio signals
US9654876B2 (en) Multiband audio compression system and method
Killion et al. Twenty years later: A new count-the-dots method
CN101256776B (zh) 语音信号处理方法
Moore et al. Comparison of the CAM2 and NAL-NL2 hearing aid fitting methods
Arehart et al. Effects of noise, nonlinear processing, and linear filtering on perceived speech quality
Kates An auditory model for intelligibility and quality predictions
Reinhart et al. Effects of reverberation and compression on consonant identification in individuals with hearing impairment
Sato et al. Acceptable range of speech level in noisy sound fields for young adults and elderly persons
Schum Noise-reduction circuitry in hearing aids:(2) Goals and current strategies
DK2584795T3 (da) Fremgangsmåde til bestemmelse af en kompressionskarakteristik
Lunner et al. A digital filterbank hearing aid: Three digital signal processing algorithms-User preference and performance
Liu et al. Contribution of low-frequency harmonics to Mandarin Chinese tone identification in quiet and six-talker babble background
Jemaa et al. Intelligibility enhancement of vocal announcements for public address systems: a design for all through a presbycusis pre-compensation filter.
Arehart et al. Determining perceived sound quality in a simulated hearing aid using the international speech test signal
Wu et al. The influence of audiovisual ceiling performance on the relationship between reverberation and directional benefit: Perception and prediction
Mourgela et al. Investigation of a real-time hearing loss simulation for use in audio production
Sabin et al. Acoustical correlates of performance on a dynamic range compression discrimination task
Lunner et al. A digital filterbank hearing aid: Predicting user preference and performance for two signal processing algorithms
Strelcyk et al. Multichannel compression hearing aids: effect of channel bandwidth on consonant and vowel identification by hearing-impaired listeners

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees