TW396699B

TW396699B - Communication device responsive to spoken commands and method of using same

Info

Publication number: TW396699B
Application number: TW086100144A
Authority: TW
Inventors: Theodore Mazurkiewicz; Gil E Levendel; Shay Ping Thomas Wang
Original assignee: Motorola Inc
Priority date: 1995-12-28
Filing date: 1997-01-08
Publication date: 2000-07-01
Also published as: FR2743238B1; WO1997024710A1; AU1330497A; US5749072A; AR005286A1; FR2743238A1

Description

A7 ____._二___ 五、發明説明（1 ) 這是應用序號第08/253,893的共同審理中的部’ 於1994年5月31曰申請並讓渡給同一讓渡人做爲本發明。該上述的應用透過此參考在此被併入。技術镇域 '本發明一般而言是有關通訊系統及，.特別，是有關對使用者的聲音指令起反應的收發兩用通訊裝置。本發明之背景 • 許多年來，科學家已嚐試擭出一裝置以簡化人機之間的介面。例如鍵盤’滑鼠，觸控式螢幕和筆等輸入裝置皆爲目前執行人機介面時最普遍使用的工具。然而，人機之間較簡單的和較自然的介面可能是人類的聲音。自動辨識聲音的裝置可提供此一介面。自動化的聲音辨識應用包括器_及使用聲音指令，聲 , ,11— I I ......—........丨晋輸入以控制家電應用的收發兩用頻道選擇，以及在撥號時可讓駕駛人集中注意力於路面的聲音撥號蜂巢式電話。經濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事項再填寫本頁) 、一s° 不幸地，自動化的聲音辨識並非普通的工作。理由之一是聲音隨不同的人而變化。例如，不同的人發出相同的字由於腔碉，説話的速度，性別或年齡而聽起來可能相當不同。除了説話者的變化之外，音的清晰效果，説話的模式（大叫/耳語），以及背-景雜詆對聲音辨寧裝置產生了相當多的問題。 , 在1960年後期，各種方法論被導入自動化聲音辨識。然而有些方法是基於與啓發式策略相符的延伸知識，其它的則靠聲音資料庫及學習方法論。後者的方法包括動態的時

經濟部中央標準局員工消費合作社印製 A7 ~^________ + 五、發明説明: 〜---— 間重疊（DTW)及隱藏馬可夫模式（HMM) ^這兩個方法，與使用時間遲延神經網路相同，將於下面討論。動態時間重疊是一種使用最佳化原則以最小化未知語句儲存的已知孚句彳永板之間的錯誤。報告顯示該動態時間重疊技術是非常機械的並且產生良好辨，識。然而，該動態時間重疊技術是計算密集的。因此，在現實世界應用上^ 行該時間重疊技術目前不可行.的。 •相對於直接地將未知語句奐已知字句樣板做比較，隱藏馬可夫模式技術使用供已知字句.的推測模式並且比較每一模式所產生的該未知字句的該機率。當說出未知字句時，遠隱藏馬可夫模式技術將檢查該字句的該順序（或狀態），並且找出提供最佳配對的該模式。隱藏馬可夫模式技術已成功地使用在許多商業應用上；然而，該技術有許多缺點。這些缺點包括無法將聽覺上類似的字句差異化，對雜訊的易感度及計.算上的密集度最近，神經纟^被用於高度未結構化以及其他不可追縱的問題，例如聲音辨識。時間遲延神經網路是神經網路的一種，該網路可透過採用有限的神經細胞關連來將該聲音的暫時效果足址.。對有限的字句_辨識而言，時間遲延神經網路顯示較佳於該隱藏馬可^夫模式方法,的效果。然而，.時間遲延神經網路也有某些嚴重的缺點。首先，時間遲延神經網路的該訊練時間非常冗長，要數星期之久。其次，時間遲延神經網路的該訓練互除法通常集中於局部最小化，這不是廣泛的最佳解決方案。 -5- 本纸張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐）~~' ' (請先閱讀背面之注意事項再填寫本頁) 訂 _、A7 —：___—_ 五、發明説明（3~~~ : " ' :— 之，自動化的聲甘辨識（例如，需要不實際的數量的計算的互除法，對説話者變異性和背景雜訊有限的容忍度 .，.過多的訓練時間等）現有已知方法的缺點嚴重地限制聲音辨識裝置在許多可能的領域的應.用的接收度和增殖。例如，對聲晋指令起反應的目前普遍使用的，蜂巢式電話及收發兩用無線電皆有無法信賴的聲音辨識能力 '结果，他們讓使用者受挫並且在市場上並未被普遍接受。 •因而，需要一種能提供高位準正確性，無視於背景雜訊，單一新時代訓練，及對説話者差異不敏感的結合自動聲音辨識系統的通訊裝置。附圖之簡要敘述本發明在所附的專利申請範圍中已被指出獨特性。然而 ’透過參考與附圖有關的以下詳細敘述，本發明的其他特色將變爲更明顯且將了解得更透徹：圖1顯示根據本發明的一個具體實例的通訊裝置的方塊圖。圖2顯示根據本發明的另一個具體實例使用圖1該通訊裝置的方法的流程圖。經濟部中央標率局員工消費合作社印製圖3顯示根據本發明的進一步具體實例的通訊裝置的方塊圖。 - 兮 · 圖4顯示根據本發明的替代具體實例的通訊裝置的方塊圖。圖5顯示訊框順序的圖示。圖6圖示結合將本發明具體實現的通訊裝置的通訊系统。 -6- 本紙張尺度適用中國國家標準（CNS ) 規格（210X297公釐）

五、發明説明（4 ) ~~~~-—- 較佳具體實例之詳細敘述本發明的優點是提供一種能讓使用者以相當高的信賴使用聲音指令進入通訊頻道的通訊裝置。本發明的另二點是提供一種不需重覆地訓練的聲音辨識系統並且對背& 雜訊和説話者變動不敏感的通訊裝置。，本發明的進—二ς ;疋it ί、種在軟上精簡地執行的聲音辨識系統因而可讓它易於結合到手提式無線電或蜂巢式電話中。本發明的 •另個優點在於它提供一種減少資料緩衝所需數量的結人聲音辨識系統的手提式通訊裝置。 σ σ 圖1圖示代表根據本發明的—個具體實例的通訊裝置的方塊圖。該通訊裝置20包括介面22，及聲音辨識系統24 。該聲晉辨識系統包括特色分離器26和分類器28。该介面2 2'根據由該聲音辨識系統2 4所產生的控制信號可 %使用者進入通訊頻道。.該介面22可以是任何可讓使用者透過通訊頻道移轉電子資料的裝置。例如，該貪面可以是一收發兩用無線電，電話，個人數位助理，或呼叫器。在 .這些範例中，該通訊頻道是在另一裝置或基地台之間的無線電聯結。然而，該通訊頻道可包括任何媒介，包括但不限於光纖，同軸電纜及绞線電纜。該介面2 2可對各種使用者輸入起反應’例如鍵盤輸入’聲音萌令，觸控式螢幕，或滑鼠輸入。該聲音辨識系統2 JL對聲音指令起反應而產生該控制信號。該特色分離器26從該聲音指令中分離複數個特色。依次，該分類器2 8根據多項式展開而產生識別信號。被該介面 -7- 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） (請先閎讀背面之注意事項再填寫本頁) d-----訂-— —#· 經濟部中央標準局員工消費合作社印製 B7 五、發明説明（5 ) 2 2所接收的該控制信號是根據識別信號。該特色分離器26所分離的該特色最好包括cepstral相關係數’ cepstral相關係數的第一階導函數，以及字句位準特色，-· ' ’例如常態化能量和框架指數·〇…字句位準特色將在以下與圖3相關敘述中詳細描述。 f 對該特色起反應，該分類器2 8根據以下的多項式展開產，生該識別信號： m η .. Y = X ''i [ Π κ ji ] (1) i = 0 j = 〇 .. - . 在方程式1中，Xi代表該特色；V代表該識別信號；w: Λ

J ----一 —*v ------- 1 1 ， 1 N 表相關係數；g.j i代表指數.；並且i，j，m和η皆爲整數β 在本發明的較佳具體實例中，.該分離函數是—個有以下形式的二階多項式展開： η '/ = a〇 + X i=0

(2) 經濟部中央 h 準 /¾ 員工消費合 # it ί 在方程式2中，a〇氏表零赜相關係數：bi代表第一階相關係數，並且Cij代表第二階相關係數，~和勺代表該特色， y代表孩識別信號，並且i，j，n皆爲整數。有二十個特色χ0-χ19 ’導致二階多項式中有231項。在本發明的各種其他具體實例中，該分離函數可以根據 * 8 - 本紙張尺度適用中國國家標準（CNS )八4祕（210父297公釐了 A7 A7 經濟部中央標準局員工消費合作社印製五、發明説明（δ ) 函數，例如正弦，餘弦，指數/對數，傅利葉轉換， Legendre多項式，非線性基礎函數例如v〇lterra函數或基礎函數，或類似，或多項式展開和直角函數的组合。在本發明的較佳具體實例中，…該多項式分離函數適合_ 組代表輸入聲音範例的p -維特色空間來.的樣本。若在該多項式中該項的該數目等於範例的數目，可能要使用矩陣逆轉技巧以解決每一個相關係數的該値。若在該多項式中該 .項的該數目不等於範例的數|，則使用最小平方估算技巧以解決每一個相關係數的該値。適合的最小平方估算技巧包括，例如，最小平方，展開的最小平方，反虛擬對數， Kalman ;慮波器’取大可能演算法，Bayesian估算法，以及其他相同的估算法。 —般而f，該聲晋範例的數目超過多項式項的數目；因此’使用最小平方技巧以導出該相關係數。然而，若聲音範例的數目和項是相等的，該分離轉換函數可以矩陣方程式Y = WZ來表示，其中γ代表範例分離信號的矩陣，w代表相關係數的矩陣，並且Z代表表示該項的矩陣，其中可以是該範例輸入的.函數，例如導.出特色的指數函數。該相_ 關係數矩陣是根據W = Z-i Y的方程式來決定，其中Z-1代表Z的.反矩陣。 . 圖2顯示根據本發明的另一個具體實例控制通訊頻道的流程圖。在方塊40，聲音指令被該聲音辨識系統24所接收。在方塊42中，該特色從聲音指令中分離出來。在方塊44 中’根據方程式（1)的該形式的多項式函數產生一分離信號 -9 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） (請先閱讀背面之注意事項再填寫本頁)

五、羥濟部中央樣準局員工消費合作社印製 A7 發明説明（7 其/入在方塊46中，根據該分離信號進入該通訊頻道。聲θ 4曰·？可以是任何字句，然而，在本發明妁較佳真體實例中，該聲音指令是從〇到9的數字出或”幫助，.，，，喷叫"和”傳送"的字句中選出。，當依順序説出時，可辨識出該數字而撥進入碼，例如電話號碼或特別的無線電頻道’這將讓使用者以其它連接到該通訊頻道的裝置來通訊。邊和令呼叫"可界定電話或無線電頻道數目的開始 ;然而"傳送"的該指4可界_定該號碼的結束並且導致通訊裝置20經過該通訊頻道傳送該數目。 . ”幫助"的該指令可用於經過該通訊頻道播放緊急信號。這特色提供例如警察及救火員等緊急人員極大的優點。圖3顯示根據本發明的進—步具體實例的通訊裝置的方塊圖。該通訊裝置5〇包括一介面52，麥克風54，交流到直轉換器5 6，前處理器5 8，聲音活動偵測器（s a D ) 6 0，特色分離器6 2，複數個分類器6 4到6 8，複數個累加器 7 〇到7 4，以及選擇器7 6。在本發明的較佳具體實例中，該介面5 2是一個根據該選擇器7 6所產生的控制信號來透過無線電頻道傳送及接收資料的收發兩用聽覺介面。該控制信號對應於谀用者的聲音指，令而產生。該麥克風5 4對應於聲音指令產生聽覺信號。該交流到直流轉換器5 6透過以預定比率抽樣來將該聽覺信號數位化。該抽樣比率最好是8到1 0仟赫。此外，該交流到直流轉換器 5 6可以包括抗信號重疊濾波器。 -10 良紙張尺度適用十國囯家標準（CNS ) M規格（2丨〇><297公釐） (請先閱讀背面之注意事項存填寫本頁)

五、發明説明（）該前處理器58用信號處理技巧支配該數位化聽覺信號並且將它轉換爲資料向量的順序，該資料向量已準備好供特色分離用。該前處理器5 8在該數位化的聽覺信號上可執行頻道成形《頻道成形將抽樣比率調整爲符合下游疋件所需的處理比率，例如該分離器芩累加器64到7 4。此外，該前處理器58預先強調該數位化的聽覺信號以將聲音輸入中該頻譜傾斜的天性平衡。可使用第一階有限 .脈衝響應（FIR)濾波器以預_先強調。當其濾波器相關係數接近一致時，預先強調在直流電値上逐漸減少。該前處理器5 8同樣可將漢明hamming函數應用到每一個資料向量以抑制不要的頻譜加工品。此外，在資料向量區間可執订自動修正以產生包括在該輸出資料向量中的相關信號。 f性預測編碼（LPC)相關係數被該特色分離62當做該相關信號函數來計算。這減少了該特色分離器62所需的該輸入資料頻寬。上述孩處理的結果是，該前處理器58產生資料向量數列 ,同樣也被視爲資料框。最好，每一資料框代表2〇微秒期間的輸入聲骨。在各種具體實例中，該資料框可被暫時地經濟部中央標準局員工消合作社印製重疊以透過該特色分離器62和分類器64到68提供較多有意義的解釋。 X- 聲音活動指示器0八!>)6〇產生包括那些代表該聲音指令的該資料向量次數列。必要地，該聲音活動指示器6〇將代表實際聲音的資料向量從這些包含背景雜訊中分離出來。在本發明的較佳具體實例中，此該聲音活動指示器6 〇連 -11 - 本紐尺度朗t國國家標準（CNS ) A4規格（2l〇x^^jy

五、發明説明（9 續地接收資料向量的該數列。該輸出向量子數列僅包括那些flb量位準超過過背景雜訊門檻的輸入資料向量。該能量値可從由該前處理器5 8的自相關處理所產生的資料導出。該背景雜訊門楹是由已知不包括聲音的資料向量能量位準所決走。該雜訊門禮最好是有限數目的，無聲資料向量的多重平均能量位準。當在輸入向量的鄰近數列中的該能量位準超過該背景估計，已偵測到該字句的開始。鄰近向量所 -需的數目被預定系統母數所指定。同樣地，當向量的子數列鄰近數列低於此估計時，已偵測到字句的尾端。 . 特色分離器62從該聲音活動指示器6〇所產生的該向量子數列中分離特色訊框數列。最好，該特色訊框包括cepstral 相關係數和該cepstral相關係數得第一階導函數。較佳的特色訊框包括1 0個第一階導函數和丨〇個從一符合的資料向量中分離的cepstral相關係數。此外，該特色訊框可同樣包括字句位準特色，例如常態化的能量和訊框指數。向量子數列的該常態化的能量可從該前處理器58的該自相關處理的該輸出中導出。該訊框指數是一個指示資料向量（資料訊框）在向量予數列中的該相關位置的整數。在該向量子數列中所執彳才以產生.該pepstral相關係數的 cepstral分析導致該聲音信號的出現，該聲音信號特徵在於該連續聲音的相關特色。它可被視爲可維持該聲音信號重要的特徵並且減少來自該聲音信號的不相關的特徵的不想要的干擾的資料減量程序，因而簡化了該分類器6 4到6 8的 -12- 本紙張尺度適用中國國家標準（CNS ) A4規格（2丨0X297公釐） ^— L-----id-- - ./V (請先閱讀背面之注意事項再填寫本頁) -訂經濟部中央標準局員工消費合作社印製經濟部中央標準局員工消費合作社印製 Ί ' Β7 Τη " ' ----- 五、發明説明（）該決策制定過程。該cepstral分析執行如下。首先，將第ρ階（最好ρ = 8到10) 線性預測分析應用到該向量子數列以產生ρ預測相關係數。最好使用該Levinson-Durgin卸歸以執行分析。該預測相，關係數然後利用以下的回歸方程式來轉換爲cepstruin相關係數：. η-1 · c (n) = a (η) + Σ(1 — k./n) ;(k) c (n _ k)㈠) _ k = l 、在方私式（3)中’ c(n)代表第11111個cep Sfrum相關係數， a(n)代表第nth個預測相關係數.，Un邛，ρ等於cepstrum 相關係數的該數目，η代表整數指數，k代表整數指數， a(k)代表第k個預測相_係數且c(n_k)代表第（n_k)個 cep strum相關係數。熟於先前技術的人將了解到方程式（3)不需將“”打“相關係數的數目限制爲線性預測编碼相關係數的數目並且該 c e p s t r a 1相關係數事實上可超過線性預測編碼相關係數的數目。該cepstral相關係數的該氣一階導函可根據來自暫時地鄰近資料向量的cepstral相關係數之間的差來估計。然而，此技術導致雜訊估計。該第一階導函數最好使用適於預定數目連續資料向量的該cepstral相關係數的第二階多項式來估 »十’該相關係數是使用回歸來計算。特色的其它組可從較 -13- ' 本紙張尺度適用til®家標準（CMS ) A4規格（21GX297公楚）~~' ~~---- —L-I---^----yd—I (請先閱讀背面之注意事項再填寫本頁)

••IT ·#. 經濟部中央標準局負工消費合作社印製 A7 B7 11 ----- 五、發明説明（）高階導函數產生。該特色框訊被分配到該複數個分類器64到68。可使用任何數目的分類起以辨識該聲音指令。傳統上，每一個分類器指定不同的聲音指令並且根據·第二階導函數展開，如方程式（2 )所描述的，來產生識別信號。該分類器6 4到6 8的該輸出被累加其符合的累加器7 0到7 4。每一個累加器加總各自分類器的該輸出。此導致複數個被累加的符合每__分 .類的識別信號的產生。被累加的識別信號被傳送到該選擇器76。 . ' 該選擇器76選擇最大被累加識別信號並且據此產生該控制信號。該控制信號是該最大累加識別信號的一個函數。對聲音指令起反應，該通訊裝置5 0將該介面5 2結構化以便讓該使用者以不同方式進入該通訊頻道。例如，當"幫助" 的該指令被該通訊裝置5 0所接收時，該介面5 2將在該通訊 ' 頻道上自動地產生緊急廣播信號。此外，該聲音指令可順序地被組合以產生該介面52的各種結構。圖4顯示根據本發明之替代具體實例的通訊裝置8 2的方塊圖。在圖4顯示的該通訊裝置82包括與圖3有關所敘述的該元件5 2到7 6。然而，相對於前述的通訊裝置5 0，圖4的該通訊裝置8 2包括改良的特色分離器8 Q。在本發明的此具體實例中，該改良的特色分離器80被放該該聲音活動指示器6 0之前。這是可能的，因爲字句位準特色不是被該改良的特色分離器8 0所分離。將該特色分離器8 0放在該聲音活動指示器6 0之前提供的優點在於它減少 -14- 本纸張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐） ---2---1------\/裝-- (請先閱讀背面之注意事項再填寫本頁)

*1T -I# 五、發明説明（12 ) 了 β通訊裝置82所需的緩衝量，結果減少了該聲音辨識系統所需的整體記憶體空間。除了字句位準特色分離的例外之外，該改良的特色分離執行如圖〇的特色分離器6 2所敘的必要的祖同功能。，5顯、TF IV料訊框數列的能量位準的亂。該訊框的能量位準是由該前處理器58的該自動更正特色所线。該圖的乂軸指示該訊框數列的時間順序，而Υ軸指示該訊框的能量位準。該背景雜訊門檻同樣氣示在丫軸上。 i Et活動扣不器6〇藉著決定該背景雜訊門檻的能量位準轉變來偵測聲音指令界限。在本發明較佳具體實例中，聲音活動指示器6 〇與帶有正能量位準轉變的字句界限開始聯結，該轉變伴隨著能量位準超過門㈣預定資料向量期間。相反地，該聲音活動指不器60與帶有負値能量位準轉變的字尾界限聯結，該轉變伴随著能量位準維持低於該雜訊門檻的後來的暫停期間。在聲音指令的即時取得方面，聲音辨識系統能接受能量輪廓暫時低於該雜訊㈣的聲音指令。藉著計算伴隨轉變而來的能量位竽變化。該聲音活動指示器6〇大大地提昇了經濟部中央標隼局員工消費合作社印製孩聲骨辨識系統的正確性，因爲它較不可能錯誤地债測字句尾端的界限。 _ ^ 在所示的範例中，訊框4代表聲音指令的第一訊框。當訊框的該能量位準隨後地落在該門檻之下時，即偵測到字句尾端。在此情況下，訊框1〇代表該聲音指令的最後訊框。暫停期間不應太短以免錯誤地激發字句尾端的偵測，然 ____一 -15· 本纸張尺度朝巾酬家縣（CNS ) Α4·_ (2lGx297公幻

經濟部中央標準局員工消費合作社印製五、發明説明（13 ) 而也不應太長以免在聲音指令之間需要不當地長時間暫停3 圖6圖示可將具體實現本發明的通訊裝置併入的通訊系統。.該通訊系統包括通訊裝置9〇，通訊連結92和基地.台 94。該通訊裝置90包括本發明.的各種具體實例之例如這些在圖1，2 , 3和4中所示的任何一，個。該通訊埠結可以是無線電連結，而基地台9 4可以是細胞地點或無線電基地台。可用該通訊裝置90將資料傳送到其他同樣連結到該 •基地台94的通訊裝置（未顯示）。簡s之’在此已敘述通訊裝置的觀念和較佳具體實例以及根據聲音指令進入一通訊頻道可使用的方法。因爲在此所述的該通訊裝置的該各種具體實例使用多項式分離函數 ’該函數對使用者變動不敏感，因而可有較高程度的信賴性。既然該多項式分離函數適於使用最小平方估計或矩障逆轉技巧的範例空間，不需要該分類器重覆地訓練。雖然本發明的特殊具體實例已被顯示和敘述過，對這些熟於先前技術的人而言，它將很明顯的是該所揭露的發明可以各種方法改良並且可假設還有許多有別於上述的較佳特殊形式的具體實例。據此’附件的專利申請試圖涵蓋落在本發明的眞實精神和範籌内的本發明的所有改〜良。 · -16- 本紙張尺度適用中國國家標準（CNS ) M规格（210X297公釐） --Γ---r-------破-- ί請先閱讀背面之注意事項再填寫本頁} y"

Claims

π、申請專利範圍經濟部中央襟準局員工消費合作社印製 L ~種通訊裝置，包括：一個可讓使用者根據控制信.號進入通訊頻道的介面；. 以及一個對聲音指令起反應產生該控制信號的聲音辨識系统，該聲音辨識系統包括：一個從聲音指令中分離複數個特色的特色分離器；以及 • 一個根據以下的多項展開來產生識別傳號的分類器瓠 in η y = Σ Wi [π >;jgji]. i=0 j=〇」其中’ Xj代表複數個特色，y代表該識別信號，Wi代表相關係數，gji代表指數，並且i，j., 皆爲整數；其中該控制信號是根據該識別信號。 2·根據申請專利範圍第1項之該通訊裝置，其中該介面包括一個從一群包括收發兩用無線電，電話，個人數位助理，和呼叫器中選擇出來的裝置。 3.根據申請專利範圍第1項之該通訊裝置，其中該聲音辨識系統進一步包括： * 兮 ♦ —個前處理器，運算上與該特色分離器有關’侏將使用信號處理技巧的聽覺信號轉換爲代表該聲音指令的資料向量數列，並且該複數個特色是從此向量數列中被分離0 --— 一.____ i -17 - 本氏張认適用十國国家標準（CNS ) A4娜 ( 2獻297公疫） (請先閣讀背面之注意事項再填寫本頁)

4. - .. . I 申請專利範圍 A8 B8 C8 一種通訊裝置，包括： —個將聽覺信號轉換爲資料向量數列的前處理器；從資料向量數列中分離複數個特色訊框的分離裝置；產生複數個識別信號的複數姻分類器，每—個該複數個分類器根據以下形式的多項式展開，定一個不同的聲音指令並且產生一識別信號 m · 經濟部中央標牟局員工消費合作社印製 y = Σ wi [fl x j i ]； i=0 j=0 · 其中’ Xj代表特色訊框’，y代表該識別信號，Wi代表相關係數，代表指數，並且i， j，^和11皆爲整數；一個產生複數個被累加的識別信號的累#器，該累加器透過將複數個由該複數個分類器之一各別產生的識別信號之一加總，而產生每一個該複數個被累加的識別信號；一個從該複數個被累加的識別信號中選擇一個最大的被累加識別信號的選擇器；以及一個根據控制信號而透過通訊頻道傳送和接收資料的收發兩用無線電介面，贫控制信號拳該最大被累加識別信號的一個函數。. 根據申請專利範圍第4項之該通訊裝置，其中該分離裝置包括： · 一個供將特色訊框從資料向量數列中分離出來的特色 18 衣紙fjjd朗巾關家標準（CNS)从祕（21Qx297公瘦 (请先間讀背面之注意事項善填寫本頁)

396699申請專利範圍 A8 B8 C8 分離器；以及一個從特色訊框的該數列中選擇代表聲音指令的該複數個特色訊框的聲音活動偵測器。 6·根據申請專利範圍第4項之該通訊裝置，其中該分離裝置包括： . '* 一個從資料向量的該數列中選擇一個代表聲音指令的向量子數列的聲音活動偵測器；以及 . 一個將複數個特色訊框從_該向量子數列中分離出來的特色分離器。 · 7-根據申請專利範圍第4項之該通訊裝置，其中該多項式展開有以下形式： Σ Σ i=0 經濟部中央標準局員工消費合作社印製其中a〇代表零階相關係數，bi代表第一階相且c ij代表第二階相關係數。 8. —種控制進入通訊頻道的方法，包括以下步碟接收一聲音指令；從該聲音指令中分-離一每複數個特色； * 根據以下形式的多項式展開產生識別信號關係數，並 m 19 本紙張尺度適用中國國家標準（CNS ) A4規格（21〇x加公釐） (請先閱讀背面之注意事項再填寫本頁)

Αδ Βδ C8 經濟部中央標準局員工消費合作社印製申請專利範圍其中，Xj代表該组複數個特色，y代表該識別信號，、代表相關係數，gji代表指數，並且丨，』，m和η皆爲整數 :以及根據該識別信號進入該通訊頻道。 9.根據申請專利範圍第8項之該方法，進一步包括以下步驟： * 使用信號處理技巧，將聽覺信號轉換爲代表該聲音指 •令的資料向量數列，並且該-組複數個特色是從該數列中分離出來。】〇·根據申請專利範圍第8項之該方法，其中該分離的步裸包_括以下子步驟.：從一群包括cepstral相關係數，cepstral相關係數的第一階導函數，和字句位準特色中產生該複數個特色。 -20 本紙張尺度適用中國國寒標準（CNS ) Μ規格（2丨〇)<297公釐） (請先閎讀背面之注意事項再填寫本頁}