TWI393453B - 適用於自動控制裝置的音調偵測方法及音調偵測裝置 - Google Patents

適用於自動控制裝置的音調偵測方法及音調偵測裝置 Download PDF

Info

Publication number
TWI393453B
TWI393453B TW097138359A TW97138359A TWI393453B TW I393453 B TWI393453 B TW I393453B TW 097138359 A TW097138359 A TW 097138359A TW 97138359 A TW97138359 A TW 97138359A TW I393453 B TWI393453 B TW I393453B
Authority
TW
Taiwan
Prior art keywords
tone
frame data
energy
time frame
groups
Prior art date
Application number
TW097138359A
Other languages
English (en)
Other versions
TW201016027A (en
Inventor
yue sheng Chen
Min Wei Chung
Sung Tsun Chou
Original Assignee
Sonix Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sonix Technology Co Ltd filed Critical Sonix Technology Co Ltd
Priority to TW097138359A priority Critical patent/TWI393453B/zh
Priority to US12/483,896 priority patent/US8155327B2/en
Publication of TW201016027A publication Critical patent/TW201016027A/zh
Application granted granted Critical
Publication of TWI393453B publication Critical patent/TWI393453B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/45Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling
    • H04Q1/457Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling with conversion of multifrequency signals into digital signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

適用於自動控制裝置的音調偵測方法及音調偵測裝置
本發明係關於一種音調偵測裝置及方法適用於適用於自動控制裝置,特別是關於一種從一音調中取得一指令的音調偵測裝置及方法。
一般,電信系統中使用格澤濾波器分辨雜訊、靜音、聲音及音調。例如美國專利第6381330號其是應用於電信系統,接收端為線路輸入,在偵測上是使用格澤濾波器(Goertzel Filter)的輸出特徵,但是此專利在偵測程序上是以小區段分析來取代完整時框分析,以此來降低運算量,再利用是否有諧波產生來重複確定音調訊號是否存在。又利如美國專利第6671252號其是應用於電信系統,接收端為線路輸入,在偵測上是使用格澤濾波器的輸出特徵,此專利的偵測程序為利用短時框和長時框的不同特性做不同的功能,以增加偵測時的強健度,短時框分析是增加時域上的解析度,長時框分析是增加抗雜訊的能力。習知電信系統中的發送器及接收器間以線路連接,信號透過線路傳送至接收器。若利用無線方式傳送信號時,會因發送器及接收器間隔一段距離,而降低偵測信號的正確性。此外,更具體而言當一揚音器發出一聲音信號以供相對於此揚音器移動的麥克風接收時,會因揚音器與麥克風間距離的變化,更進一步降低偵測信號的正確性。
針對上述問題,本發明一實施例之目的在提供一種能夠增加偵測正確性的音調偵測裝置及方法。本發明一實施例之目的在提供一種能夠從一音調中取得一指令的音調偵測裝置及方法。
本發明一實施例提供了一種音調偵測裝置,用以偵測一輸入信號中是否存在一音調,輸入信號包含至少一時框資料,音調偵測裝置包含:一能量計算單元、一門檻值計算單元、一濾波器及一比較器。能量計算單元對時框資料進行一能量增益處理並輸出能量增益處理後的時框資料以及時框資料的時域上的能量,其中能量增益處理計算時框資料於時域上的能量,並依據時框資料的能量選擇性地調整時框資料的大小。門檻值計算單元依據能量增益處理後的時框資料的能量計算一門檻值。濾波器以一演算法轉換能量增益處理後的時框資料並輸出於一第一期間的一第一特徵值。比較器比較第一特徵值及門檻值產生一比較結果,並依據比較結果判斷輸入信號的時框資料中存在音調。
本發明一實施例提供了一種音調偵測方法,用以偵測一輸入信號中是否存在一音調,輸入信號包含至少一時框資料,音調偵測方法包含:一能量計算步驟、一門檻值計算步驟、一轉換步驟及一比較步驟。能量計算步驟對時框資料進行一能量增益處理並輸出能量增益處理後的時框資料以及時框資料的時域上的能量,其中能量增益處理計算時框資料之於時域上的能量,並依據時框資料的能量選擇性地調整時框資料的大小。門檻值計算步驟依據能量增 益處理後的時框資料的能量計算一門檻值。轉換步驟以一演算法轉換能量增益處理後的時框資料並輸出於一第一期間的一第一特徵值。比較步驟比較第一特徵值及門檻值產生一比較結果,並依據比較結果判斷輸入信號的時框資料中存在音調。
於一實施例中,上述音調偵測裝置及方法的能量計算單元及步驟更分別於測得時框資料的能量大於一預設值時,縮小時框資料的大小。
於一實施例中,上述音調偵測裝置及方法的濾波器及轉換單元更分別輸出於一第二期間的一第二特徵值,且當第一特徵值及第二特徵值不符合一預定關係時,判斷輸入信號的時框資料不存在音調。較佳地預定關係為一頻帶連續關係。且濾波器為一格澤濾波器,演算法為一格澤演算法,而轉換步驟係利用一格澤演算法進行。
於一實施例中,音調偵測裝置及方法更分別包含一指令輸出單元及步驟,指令輸出單元及步驟分別當被判斷存在有音調的該些時框資料的組數符合一預定組數時,輸出一指令。
本發明一實施例之音調偵測裝置及方法能夠判斷出音調,尤其能夠因應接收器及發送器間相對距離的改變,改變計算方式而較正確地判斷出音調。
第1圖顯示依據本發明一實施例之音調偵測方法的流程圖。如第1圖所示,依據本發明一實施例之音調偵測方法可以適用於偵測一輸入信號Sin中是否存在一音調 Tone。輸入信號Sin包含至少一時框資料(frame data)Fda。
於一實施例中,輸入信號Sin可以為一聲音信號並由係為揚音器的一發送器輸出後再由一接收器接收。接收器具有將係為類比的聲音信號轉成係為數位的聲音信號的功能。輸入信號Sin可以僅是一音調Tone,並依據音調Tone的頻率與時間的關係而於此音調Tone中設置一指令,較佳地使此音調Tone的一頻率持續不同的期間,來將一指令設置於音調Tone中。於本實施例中,使用具有一第一頻率及一第二頻率的音調Tone,較佳地將第一頻率設成相異於第二頻率。
此外,係為聲音信號的輸入信號Sin亦可以包含一背景聲音及至少一音調Tone。於實際操作時,背景聲音可以為播放器播放CD光碟的背景音樂。第2圖為人耳可聽最小響度(聽覺門檻值)曲線圖。請參考第2圖,一般而言,當聲音信號頻率為1 kHz時響度只要7 db就能被人聽到,當聲音信號頻率為20 kHz時響度必須要70db以上人類才聽的到。因此可以將背景聲音的頻率設於較低頻以便於人類察覺,而音調Tone的第一頻率及第二頻率設為較高頻,以減少人聽背景音樂時被音調Tone干擾的情況。背景聲音的頻率可以設為小於16kHz,較佳地設為小於10 kHz,更較佳地設為小於5 kHz。而音調Tone的第一頻率及第二頻率可以設為人耳較不靈敏的頻率,例如設為大於或等於16kHz,較佳地第一頻率設為18kHz而第二頻率設為20 kHz。
以下將此指令設成具有一開始位元及4個指令位元作 為示例加以說明,每個指令位元可以為邏輯值0或邏輯值1,因此能夠產生2的4次方種命令。第3圖顯示一音調之示例其時間及頻率的示意圖。詳言之,此音調能夠包含有一值為0101的指令。表一揭示值為0101的指令的示例。請參照表一及第3圖,使音調Tone中的第一頻率持續一第一期間t1(例如0.045秒),作為開始位元。使第二頻率持續一第二期間t2(例如0.015秒)後接著第一頻率持續一第三期間t3(例如0.03秒),作為邏輯值為0的指令位元。使第一頻率持續一第四期間t4(例如0.03秒)後接著第二頻率持續一第五期間t5(例如0.015秒),作為邏輯值為1的指令位元。開始位元不具任何邏輯值僅為作為辨識用。
第4圖顯示包含一指令位元的音調其時間及頻率的示 意圖。一指令位元b0包含多組時框資料Fda,可依產品設計,選擇具適當取樣率的接收器,來決定每一時框所需的秒數。以指令位元b0需要頻率20kHz持續0.015秒且頻率18kHz持續0.03秒共0.045秒作為示例,例如當接收器的每一時框的秒數為0.045/450秒時,則指令位元b0包含了450組時框資料Fda,更詳細說明可參考表2。
再請參照第1圖,本實施例之音調偵測方法的步驟包含: S01:開始。
S10:信號傳遞步驟,由一發送器將輸入信號Sin傳遞至一接收器。於一實施例中此接收器能夠相對發送器移動。
S20:能量計算步驟,對時框資料Fda進行一能量增益(volume gain)處理並輸出能量增益處理後的時框資料Fda以及時框資料Fda的時域上的能量,能量增益處理計算時框資料Fda之於時域上的能量,並依據時框資料Fda的能量選擇性地調整時框資料Fda的大小。
S30:門檻值計算步驟,依據能量增益處理後的時框資料Fda的能量計算一門檻值。
S40:轉換步驟,以一演算法轉換能量增益處理後的時框資料Fda並輸出於一第一期間的一第一特徵值。於一實施例中,還可以更輸出於一第二期間的一第二特徵值。
S60:比較步驟,比較第一特徵值及門檻值產生一比較結果,並依據比較結果判斷輸入信號Sin的時框資料Fda中存在音調Tone。於一實施例中,還可以更比較並測得第一特徵值及第二特徵值不符合一預定關係時,判斷輸入信號Sin的時框資料Fda不存在音調Tone。
S70:指令判斷步驟,當被判斷存在有該音調的該些時框資料的組數符合一預定組數時,輸出一指令。
S90:等待步驟,等待偵測下一組時框資料Fda。依據設計等待預定秒數後,回到步驟S20。
S09:結束。
第5A圖顯示本發明一實施例音調偵測方法之能量計 算步驟一示例的流程圖。如第5A圖所示,能量計算步驟包含:步驟S22輸入時框資料Fda;及能量增益處理步驟。能量增益處理步驟包含:步驟S24計算時框資料Fda於時域的能量;步驟S26判斷時框資料Fda於時域的能量是否大於值例如為29490的一預定值Td1,若是則進行步驟S28;若否則輸出該能量及時框資料Fda並進行門檻值計算步驟S30,此時未經過步驟28之能量增益處理後的時框資料Fda及其能量等於步驟22所輸入之時框資料Fda及其能量。步驟S28:以值例如為0.5的一比例L1縮小時框資料Fda的大小,再將一預設值為0的旗標Cyclecnt加1後(將於後說明其功能),回到步驟S24。
當所輸入之時框資料Fda能量過大時,亦即音量過大時,後述之格澤濾波(goertzel filter)運算會較不精準,例如發生溢位,因此本實施例中先求取時框資料Fda能量,並判斷能量超過一預定值Td1時,將此時框資料Fda大小縮小一比例L1,直到能量增益處理後的時框資料Fda的能量小於預定值Td1。更詳言之,此預定值Td1可以設為一個字元(signed word)之最大能量值的百分之九十。此外於一實施例中可利用一能量計算單元執行能量計算步驟。
第5B圖顯示本發明一實施例音調偵測方法之門檻值計算步驟一示例的流程圖。如第5B圖所示,門檻值計算步驟包含:步驟S32判斷時框資料Fda的值是否曾被調整過,若是進行步驟S34,若否進行步驟S36。詳言之,當旗標Cyclecnt大於0時,代表時框資料Fda的值曾被調整 過,如參照第5A圖及步驟S26;當旗標Cyclecnt等於預設值0時則否。步驟S34將門檻值Td2設成能量增益處理後之時框資料Fda的能量乘以值例如為0.7的一比例L2。步驟S36將門檻值Td2設成能量增益處理後之時框資料Fda的能量乘以值例如為0.48的一比例L3。
當接收器與發送器的相對距離改變時,接收器所接收到之聲音信號的音量亦會改變,本實施例之音調偵測方法,隨著接收器所接收到之音量動態地調整門檻值Td2,能夠更精確地判斷出輸入信號Sin是否具有一音調Tone。此外於一實施例中可利用一門檻值計算單元執行門檻值計算步驟。
轉換步驟可於格澤濾波器中執行,其係利用格澤演算法對時框資料Fda進行轉換取得於一第一期間的一第一特徵值。第5C圖顯示本發明一實施例音調偵測方法之轉換步驟中一演算法的示例的流程圖,詳言之係顯示一格澤演算法的流程圖。參照第5C圖,格澤濾波器根據第5C圖所示運算程序,並用下述數學式(1)、(2)及(3),依據一輸入序列x[n]計算出一回饋相序列s[n],再計算輸出序列y[n]後,將所得特徵值加以輸出。
其中,N為一時框資料的取樣數量,fsample 為取樣頻率(於本實施例中接收器之一取樣裝置(例如為AD轉換 器)的取樣頻率小於10kHz),ftone 為音調頻率(於本實施例中採用18kHz及20kHz兩頻率),sk [-1]及sk [-2]為頻率點之回饋存儲單元(feedback storag elements)且其值皆為0,n為0、1、2、……、N-1,sk [n]為第k期間第n時框的資料,特徵值yk [n]為格澤濾波器的第k期間第n時框的輸出。
以格澤演算法,利用第5C圖之二次遞迴無限脈衝響應濾波(second order recursive infinite impulse response filter)來離散信號的傅立葉轉換,已為數位信號處理(digital signal processing)領域中具有通常知識者所習知,故將省略其詳細說明。
第5D圖顯示本發明一實施例音調偵測方法之轉換步驟一示例的流程圖。如第5D圖所示,轉換步驟包含:步驟S42分別依格澤濾波演算法計算出第n時框之第k期間的特徵值yk [n]及第n時框之第k+k/5期間的特徵值y(k+k/5) [n]。步驟S44以一預定關係計算y(k+k/5) [n]及yk [n]間的差異Diff。步驟S46判斷差異Diff是否大於0,若是則判斷此時框資料Fda為雜訊,亦即將此時框資料Fda視為不存在音調Tone,並進行步驟S90;若否則判斷此時框資料Fda為工作信號,並進行步驟S62,工作信號可以包含背景聲音或音調Tone等非雜訊N的信號。步驟S44中,一預定關係為用以判斷目前時框資料Fda與先前之時框資料Fda的頻率是否具有連續性的頻帶連續關係,本實施例係以下述數學式(4)求得y(k+k/5) [n]及yk [n]間的差異Diff。
其中,scale設為0.4。當音調偵測方法在操作時,環境中有可能會產生雜訊N而影響偵測的正確性,由於雜訊N的頻帶通常不具連續關係而工作信號則具有頻帶連續關係,因此能夠藉由測得輸入信號Sin的某些時框資料Fda的頻帶不具連續關係時,將其視為雜訊並加以濾除,而能夠增加偵測的正確性。應了解的是,判斷輸入信號Sin是否具頻帶連續關係為使音調偵測方法能夠更進一步增加偵測的正確性,一實施例可以僅由後述之比較步驟判斷時框資料Fda是否具音調Tone。
第5E圖顯示本發明一實施例音調偵測方法之比較步驟一示例的流程圖。比較步驟包含:步驟S62比較特徵值yk [n]及門檻值Td2,並判斷特徵值yk [n]是否大於門檻值Td2,若是則判斷此時框資料Fda具有音調Tone並進行步驟S72;若否則判斷此時框資料Fda具有雜訊N並進行步驟S90。此外於一實施例中,利用比較時域上的能量及頻域上的輸出判斷音調,因此可利用成本較便宜的一比較器執行比較步驟,以簡省製造成本。
第5F圖顯示本發明一實施例音調偵測方法之指令輸出步驟一示例的流程圖。於一實施例中可利用一指令輸出單元執行指令輸出步驟,較佳地指令輸出單元包含用以執行位元判斷步驟的位元判斷單元;及用以執行指令判斷步驟的指令判斷單元。位元判斷步驟包含步驟S72疊加各頻率之時框資料Fda的組數。步驟S74判斷各頻率之時框資料Fda的組數是否符合一對應之預定組數,若是輸出一位元並進行步驟S76;若否進行步驟S72。指令判斷步驟包 含步驟S76疊加各種位元之個數。步驟S78判斷各種位元(例如開始及/或指令位元)之個數是否符合一對應之預定個數,若是進行步驟S79;若否進行步驟S90。步驟S79輸出此指令。
詳言之,請參考表1及2,當被判斷存在有頻率18kHz的時框資料Fda的組數符合450組時,輸出一開始位元;當被判斷存在有頻率18kHz的時框資料Fda的組數符合300組,且被判斷存在有頻率20kHz的時框資料Fda的組數符合150組時,輸出一具有邏輯值0的指令位元;當被判斷存在有頻率18kHz的時框資料Fda的組數符合150組,且被判斷存在有頻率20kHz的時框資料Fda的組數符合300組時,輸出一具有邏輯值1的指令位元。當指令位元的個數符合4時,輸出該指令。
明顯地,指令的設計方式非本發明所限定者,例如,亦可將一指令設成頻率20kHz持續0.03秒視為邏輯值0,其他頻率與時間的關係為未具邏輯值;或者隨後停止播放音調Tone 0.015秒並視為邏輯值1,因此分別地能夠產生2的1次方種命令;或者2的2次方種命令,於此情況下亦可僅計算時框資料Fda的個數即輸出指令。
第6圖顯示依據本發明一實施例之音調偵測裝置的功能方塊圖。如第6圖所示,依據本發明一實施例之音調偵測裝置100可以適用於偵測一輸入信號Sin中是否存在至少一音調Tone,且輸入信號Sin包含至少一時框資料Fda。音調偵測裝置100包含一能量計算單元110、一門檻值計算單元120、一濾波器130及一比較器140。此外還可以 包含有一發送器150及一接收器160。較佳地,還可以包含指令輸出單元170。
能量計算單元110對時框資料Fda進行一能量增益處理並輸出能量增益處理後的時框資料Fda以及時框資料Fda的時域上的能量,能量增益處理計算時框資料Fda於時域上的能量,並依據時框資料Fda的能量選擇性地調整時框資料Fda的大小。門檻值計算單元120依據能量增益處理後的時框資料Fda的能量計算一門檻值。濾波器130以一演算法轉換能量增益處理後的時框資料Fda並輸出於一第一期間的一第一特徵值。於一實施例中,濾波器為一格澤濾波器,而演算法為一格澤演算法,且濾波器130可以更輸出一第二期間的第二特徵值,且當第一特徵值及第二特徵值不符合一預定關係時,判斷輸入信號Sin的時框資料Fda不存在音調Tone。比較器140比較第一特徵值及門檻值產生一比較結果,並依據此比較結果判斷輸入信號Sin的時框資料Fda中存在音調Tone。指令輸出單元170測得被判斷存在有該音調的該些時框資料的組數符合一預定組數時,輸出一指令。於一實施例中,指令輸出單元170包含位元判斷單元171及指令判斷單元172。位元判斷單元171疊加各頻率之時框資料Fda的組數並判斷各頻率之時框資料Fda的組數是否符合一對應之預定組數,輸出一位元;及指令判斷單元172疊加各種位元之個數並判斷各種位元之個數是否符合一對應之預定個數,輸出一指令。
更具體而言,能量計算單元110、門檻值計算單元 120、濾波器130及比較器140可以利用一程式及一數位信號處理器來實施,亦可以由適當設計後的晶片實施,故其實施方式不再詳細說明。
發送器150為一揚音器且可以輸出係為一聲音信號的一輸入信號Sin。接收器160能夠與發送器150間隔一段距離,且能夠相對於係為一揚音器的發送器150移動,適於接收輸入信號Sin。接收器160可以包含一麥克風161、一放大器162、一窄波濾波器163及一數位類比轉換器(analog to digital converter)164。麥克風161可以為一電容式麥克風(Electric Condenser Microphone,ECM)用以接收輸入信號Sin。因麥克風161所接收之輸入信號Sin的強度有時候會過小或者因麥克風161本身產品特性,而造成其輸出信號過小,因此可以增設收大器162放大麥克風161所接收後再輸出的輸入信號Sin。由於係為揚聲器的發送器150所發出的聲音及音調皆為類比信號,而以數位信號處理器來實施的能量計算單元110係處理數位信號,因此於麥克風161與能量計算單元110之間可以設置數位類比轉換器164,以將係為類比信號的聲音信號轉化為數位信號的聲音信號。此外,還可以於收大器162及數位類比轉換器164間增設窄波濾波器163。於本發明一實施例中,音調Tone的頻率可以設為16kHz以上;而背景聲音(包含音調偵測裝置100之環境的聲音)一般為16kHz以下,因此可以利用窄波濾波器163預先大約地濾除背景聲音,以增加音調偵測裝置100及執行本發明一實施例之音調偵測方法的裝置偵測音調的準確性。
本發明實施例之方法,或特定型態或其部份,可以以程式碼的型態包含於實體媒體,如軟碟、光碟片、硬碟、或是任何其他機器可讀取(如電腦可讀取)儲存媒體,其中,當程式碼被機器,如電腦載入且執行時,此機器變成用以參與本發明之裝置。本發明之方法與裝置也可以以程式碼型態透過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態進行傳送,其中,當程式碼被機器,如電腦接收、載入且執行時,此機器變成用以參與本發明之裝置。當在一般用途處理器實作時,程式碼結合處理器提供一操作類似於應用特定邏輯電路之獨特裝置。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。另外本發明的任一實施例或申請專利範圍不須達成本發明所揭露之全部目的或優點或特點。此外,摘要部分和標題僅是用來輔助專利文件搜尋之用,並非用來限制本發明之權利範圍。
100‧‧‧音調偵測裝置
110‧‧‧能量計算單元
120‧‧‧門檻值計算單元
130‧‧‧濾波器
140‧‧‧比較器
150‧‧‧發送器
160‧‧‧接收器
161‧‧‧麥克風
162‧‧‧放大器
163‧‧‧窄波濾波器
164‧‧‧數位類比轉換器
170‧‧‧指令輸出單元
171‧‧‧位元判斷單元
172‧‧‧指令判斷單元
第1圖顯示依據本發明一實施例之音調偵測方法的流程圖。
第2圖為人耳可聽最小響度曲線圖。
第3圖顯示一音調之示例其時間及頻率的示意圖。
第4圖顯示包含一指令位元的音調其時間及頻率的示意圖。
第5A-5F圖顯示本發明一實施例音調偵測方法之一步驟的示例的流程圖。
第6圖顯示依據本發明一實施例之音調偵測裝置的功能方塊圖。

Claims (19)

  1. 一種音調偵測裝置,用以偵測一輸入信號中是否存在一音調,該輸入信號包含至少一時框資料,該音調偵測裝置包含:一能量計算單元,對該時框資料進行一能量增益處理並輸出該能量增益處理後的該時框資料以及該時框資料的時域上的能量,其中該能量增益處理計算該時框資料於時域上的能量,並依據該時框資料的能量選擇性地調整該時框資料的大小;一門檻值計算單元,依據該能量增益處理後的該時框資料的能量計算一門檻值;一濾波器,以一演算法轉換該能量增益處理後的該時框資料並輸出於一第一期間的一第一特徵值;以及一比較器,比較該第一特徵值及該門檻值產生一比較結果,並依據該比較結果判斷該輸入信號的該時框資料中存在該音調,其中,該濾波器更輸出於一第二期間的一第二特徵值,且當該第一特徵值及該第二特徵值不符合一預定關係時,判斷該輸入信號的該時框資料不存在該音調。
  2. 如申請專利範圍第1項所述之音調偵測裝置,更包含一發送器及相對該發送器移動的一接收器,且該輸入信號由該發送器被傳送至該接收器。
  3. 如申請專利範圍第1項所述之音調偵測裝置,其 中,該能量計算單元於測得該時框資料的能量大於一預設值時,縮小該時框資料的大小。
  4. 如申請專利範圍第3項所述之音調偵測裝置,其中,當該時框資料的能量大於該預設值時,該門檻值計算單元將該能量增益處理後的該時框資料的能量乘以一第一比例計算出該門檻值;當該時框資料的能量小於該預設值時,該門檻值計算單元將該能量增益處理後的該時框資料的能量乘以一相異於該第一比例的第二比例計算出該門檻值。
  5. 如申請專利範圍第1項所述之音調偵測裝置,其中,該預定關係為一頻帶連續關係。
  6. 如申請專利範圍第1項所述之音調偵測裝置,其中,該濾波器為一格澤濾波器,而該演算法為一格澤演算法。
  7. 如申請專利範圍第1項所述之音調偵測裝置,更包含一指令輸出單元,當被判斷存在有該音調的該些時框資料的組數符合一預定組數時,輸出一指令。
  8. 如申請專利範圍第1項所述之音調偵測裝置,其中,該音調包含一第一頻率及一第二頻率,該輸入信號包含一指令,該指令由一開始位元及至少一指令位元所構成,且該音調偵測裝置更包含一指令輸出單元,該指令輸出單元包含:一位元判斷單元,當被判斷存在有該第一頻率之該音調的該些時框資料的組數符合一第一預定組數時,輸出一開始位元;當被判斷存在有該第一頻率之該音調的該些時 框資料的組數符合一第二預定組數,且被判斷存在有該第二頻率之該音調的該些時框資料的組數符合一第三預定組數時,輸出一具有第一邏輯值的指令位元;當被判斷存在有該第一頻率之該音調的該些時框資料的組數符合一第四預定組數,且被判斷存在有該第二頻率之該音調的該些時框資料的組數符合一第五預定組數時,輸出一具有第二邏輯值的指令位元;以及一指令判斷單元,當該至少一指令位元的個數符合一預設位元數時,輸出該指令。
  9. 如申請專利範圍第8項所述之音調偵測裝置,其中,該第二預定組數等於該第五預定組數,該第三預定組數等於該第四預定組數,且該第一預定組數等於該第二預定組數加該第三預定組數。
  10. 如申請專利範圍第8項所述之音調偵測裝置,其中,該第一頻率及該第二頻率皆大於或等於約16kHz。
  11. 一種適用於自動控制裝置的音調偵測方法,用以偵測一輸入信號中是否存在一音調,該輸入信號包含至少一時框資料,該音調偵測方法包含:一能量計算步驟,對該時框資料進行一能量增益處理並輸出該能量增益處理後的該時框資料以及該時框資料的時域上的能量,其中該能量增益處理計算該時框資料之於時域上的能量,並依據該時框資料的能量選擇性地調整該時框資料的大小;一門檻值計算步驟,依據該能量增益處理後的該時框資料的能量計算一門檻值; 一轉換步驟,以一演算法轉換該能量增益處理後的該時框資料並輸出於一第一期間的一第一特徵值;以及一比較步驟,比較該第一特徵值及該門檻值產生一比較結果,並依據該比較結果判斷該輸入信號的該時框資料中存在該音調,其中,該轉換步驟更輸出於一第二期間的一第二特徵值,且判斷該第一特徵值及該第二特徵值不符合一預定關係時,判斷該輸入信號的該時框資料不存在該音調。
  12. 如申請專利範圍第11項所述之音調偵測方法,更包含由一發送器將該輸入信號傳送至相對該發送器移動的一接收器。
  13. 如申請專利範圍第11項所述之音調偵測方法,其中,該能量計算步驟測得該時框資料的能量大於一預設值時,縮小該時框資料的大小。
  14. 如申請專利範圍第13項所述之音調偵測方法,其中,該門檻值計算步驟判斷該時框資料的能量大於該預設值時,將該能量增益處理後的該時框資料的能量乘以一第一比例計算出該門檻值;判斷該時框資料的能量小於該預設值時,將該能量增益處理後的該時框資料的能量乘以一相異於該第一比例的第二比例計算出該門檻值。
  15. 如申請專利範圍第11項所述之音調偵測方法,其中,該預定關係為一頻帶連續關係。
  16. 如申請專利範圍第11項所述之音調偵測方法,其中,該轉換步驟係利用一格澤演算法進行。
  17. 如申請專利範圍第11項所述之音調偵測方法, 更包含一指令輸出步驟,當被判斷存在有該音調的該些時框資料的組數符合一預定組數時,輸出一指令。
  18. 如申請專利範圍第11項所述之音調偵測方法,更包含一指令判斷步驟,該指令判斷步驟包含:一位元判斷步驟,當被判斷存在有一第一頻率之該音調的該些時框資料的組數符合一第一預定組數時,輸出一開始位元;當被判斷存在有該第一頻率之該音調的該些時框資料的組數符合一第二預定組數,且被判斷存在有一第二頻率之該音調的該些時框資料的組數符合一第三預定組數時,輸出一具有第一邏輯值的指令位元;當被判斷存在有該第一頻率之該音調的該些時框資料的組數符合一第四預定組數,且被判斷存在有該第二頻率之該音調的該些時框資料的組數符合一第五預定組數時,輸出一具有第二邏輯值的指令位元;以及一指令判斷步驟,當該至少一指令位元的個數符合一預設位元數時,輸出該指令。
  19. 如申請專利範圍第18項所述之音調偵測方法,其中,該第二預定組數等於該第五預定組數,該第三預定組數等於該第四預定組數,且該第一預定組數等於該第二預定組數加該第三預定組數。
TW097138359A 2008-10-06 2008-10-06 適用於自動控制裝置的音調偵測方法及音調偵測裝置 TWI393453B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW097138359A TWI393453B (zh) 2008-10-06 2008-10-06 適用於自動控制裝置的音調偵測方法及音調偵測裝置
US12/483,896 US8155327B2 (en) 2008-10-06 2009-06-12 Tone detector and method used in a robot for detecting a tone

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW097138359A TWI393453B (zh) 2008-10-06 2008-10-06 適用於自動控制裝置的音調偵測方法及音調偵測裝置

Publications (2)

Publication Number Publication Date
TW201016027A TW201016027A (en) 2010-04-16
TWI393453B true TWI393453B (zh) 2013-04-11

Family

ID=42075837

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097138359A TWI393453B (zh) 2008-10-06 2008-10-06 適用於自動控制裝置的音調偵測方法及音調偵測裝置

Country Status (2)

Country Link
US (1) US8155327B2 (zh)
TW (1) TWI393453B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5605158B2 (ja) * 2010-10-19 2014-10-15 アイコム株式会社 Ctcss用のトーン信号回路およびそれを用いる無線受信機
US9454893B1 (en) 2015-05-20 2016-09-27 Google Inc. Systems and methods for coordinating and administering self tests of smart home devices having audible outputs
US9953516B2 (en) * 2015-05-20 2018-04-24 Google Llc Systems and methods for self-administering a sound test
US10078959B2 (en) 2015-05-20 2018-09-18 Google Llc Systems and methods for testing hazard detectors in a smart home
US20230326473A1 (en) * 2022-04-08 2023-10-12 Digital Voice Systems, Inc. Tone Frame Detector for Digital Speech

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4689760A (en) * 1984-11-09 1987-08-25 Digital Sound Corporation Digital tone decoder and method of decoding tones using linear prediction coding
US6671252B1 (en) * 1999-04-05 2003-12-30 Agere Systems Inc. Robust signaling tone duration measurement
US6826404B2 (en) * 2000-02-11 2004-11-30 Telefonaktiebolaget Lm Ericsson Tone signalling with TFO communication links
US7245637B2 (en) * 2003-09-11 2007-07-17 Intel Corporation Methods and apparatus for suppressing signaling tones in telephony signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2598913Y2 (ja) * 1992-07-27 1999-08-23 ミツミ電機株式会社 データスライサ
EP0884839B1 (en) * 1997-06-11 2005-06-29 Lg Electronics Inc. Method and apparatus for automatically compensating sound volume
US6763106B1 (en) 1998-11-19 2004-07-13 Legerity Inc. Signal detector with duration-based frame width
US6381330B1 (en) * 1998-12-22 2002-04-30 Agere Systems Guardian Corp. False tone detect suppression using multiple frame sweeping harmonic analysis
US6795448B1 (en) * 2000-03-02 2004-09-21 Intel Corporation IP packet ready PBX expansion circuit for a conventional personal computer with expandable, distributed DSP architecture
ATE377911T1 (de) * 2002-02-08 2007-11-15 Hewlett Packard Co Verbesserungen in beziehung zur detektion eines zweitonmehrfrequenzsignales
US6950511B2 (en) 2003-11-13 2005-09-27 Avaya Technology Corp. Detection of both voice and tones using Goertzel filters
JP5086524B2 (ja) * 2005-01-13 2012-11-28 ルネサスエレクトロニクス株式会社 コントローラ・ドライバ及びそれを用いた液晶表示装置
US9208797B2 (en) * 2008-04-18 2015-12-08 General Motors Llc Tone detection for signals sent through a vocoder

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4689760A (en) * 1984-11-09 1987-08-25 Digital Sound Corporation Digital tone decoder and method of decoding tones using linear prediction coding
US6671252B1 (en) * 1999-04-05 2003-12-30 Agere Systems Inc. Robust signaling tone duration measurement
US6826404B2 (en) * 2000-02-11 2004-11-30 Telefonaktiebolaget Lm Ericsson Tone signalling with TFO communication links
US7245637B2 (en) * 2003-09-11 2007-07-17 Intel Corporation Methods and apparatus for suppressing signaling tones in telephony signal

Also Published As

Publication number Publication date
US20100086140A1 (en) 2010-04-08
US8155327B2 (en) 2012-04-10
TW201016027A (en) 2010-04-16

Similar Documents

Publication Publication Date Title
KR101260131B1 (ko) 잡음 감소를 위한 센서 어레이를 사용한 오디오 소스 근접도 추정
US8942398B2 (en) Methods and apparatus for early audio feedback cancellation for hearing assistance devices
EP2494792B1 (en) Speech enhancement method and system
US6655212B2 (en) Sound field measuring apparatus and method
CN101388216A (zh) 声音处理装置、控制增益的装置和方法
TWI393453B (zh) 適用於自動控制裝置的音調偵測方法及音調偵測裝置
KR102191736B1 (ko) 인공신경망을 이용한 음성향상방법 및 장치
US11580966B2 (en) Pre-processing for automatic speech recognition
CN112037816B (zh) 语音信号频域频率的校正、啸叫检测、抑制方法及装置
JP2003057341A (ja) 音源位置の検出および音声装置の動作特性を調整する方法および装置
CN112272848A (zh) 使用间隙置信度的背景噪声估计
TW202034152A (zh) 聲音播放裝置及其調整輸出聲音之方法
CN110996238B (zh) 双耳同步信号处理助听系统及方法
JP2017522594A (ja) 音声信号を明瞭化するためのマルチ聴覚mmse分析技法
CN111726730A (zh) 声音播放装置及其调整输出声音的方法
JP2001188599A (ja) オーディオ信号復号装置
CN115243183A (zh) 一种音频检测方法、设备及存储介质
CN101383982B (zh) 适用于自动控制装置的音调检测方法及音调检测装置
JP2008011342A (ja) 音響特性測定装置および音響装置
CN115835092B (zh) 一种音频扩音反馈抑制方法、系统、计算机及存储介质
JP2012095254A (ja) 音量調整装置、音量調整方法及び音量調整プログラム並びに音響機器
EP1104925A1 (en) Method for processing speech signals by substracting a noise function
KR101336203B1 (ko) 전자기기에서 음성 검출 방법 및 장치
JP2007184820A (ja) 受信装置及び受信音声信号の補正方法
JP4305313B2 (ja) オーディオ調整パラメータ決定方法およびオーディオ装置