TW323364B

TW323364B -

Info

Publication number: TW323364B
Application number: TW083102745A
Authority: TW
Original assignee: At & T Corp
Priority date: 1993-11-24
Filing date: 1994-03-30
Publication date: 1997-12-21
Also published as: EP0655732A3; JPH07199985A; US5737724A; JP3363630B2; CA2117932C; EP0655732A2; KR950015199A; DE69426969T2; DE69426969D1; ES2156890T3; EP0655732B1; CA2117932A1; KR100321011B1

Description

A7 B7 五、發明説明（1 ) 發明部份本發明一般係有關語音辨識部份，且例如，係有關偵測連縯語音中之命令。發明背景 —命令觀察系統爲一語音辨識系統，此監視一聲頻输入波道，及每當输入中出現一特定之發話（命令）時，即採取一預定之行動。输入可包含自由語音，雜音，音樂等，且大體並不符合任何既知之模型。對欲由該系統辨識之每一命令，該系統保持一統計上之模型（例如，一樣板或本藝中所热悉之一隱藏Markov模型HMM)，此界定输入之一特定節段中包含該命令發話之可能性。在其操作之期間中，一普通命令觀察系統不斷產生有關現所觀察之输入中之命令辭之本體及位置之推測（或假設）。此等假設各由一各別之命令模型檢驗，並產生其各別可能性之評分。此評分例如可由普通Viterbi評分法決定。如評分超過一臨限T，則該假設視爲可接受，且實施其有關之行動。否則，拒絕該推測。經濟部中央標準局員工消費合作社印製正確或虛僞假設之評分之可能率分佈取決於多種因素，包括揚聲器，轉換器，及聲音環境。臨限T通常設定充分高，以確保在預期之操作情況之整個範圍上獲得可接受低之僞警率。故此，在各種惡劣之情況中，正確假設之評分具有超過該臨限之低可能率。故此，在此等情況中，該系統似乎％忽視'使用者。降低該臨限可解決此等'"本地 83. 3.10,000 (請先聞讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公嫠）經濟部中央標準局貝工消費合作社印製 A7 B7 五、發明説明（2 ) "問題，然而，亦會增加整個僞警率。故此，一般言之，此法之用途有限。發明概要本發明之目的爲一語音辨識方法，適用於在一操作情況範園中之命令観察，及其他應用上。本發明利用一事實，即當一第一次發出之片語未能由一特定之語音辨識系統辨識時，骸語音辨識系統之使甩者可能重覆該同一片語（不管有無提示）。故此，例如，假定一語音辨識系統逋用於命令觀察上，一使用者可能發出一命令片語，此片語未能獲得充分髙之評分，以便被接受爲一命令。在此情況下，使用者可能認爲該片語未被辨識，且隨後重覆該命令。本發明之一例解實施例使用第一及箪覆發出之命令，以辨識該命令。故此，可例如由比較連績發話之二評分及一較低之臨限來達成辨識工作，此臨限較之單獨一發話上所用者爲低。依據本發明，發出之一片語（此可包含一或更多之辭 )由如下辨識：比較一第一發話及一或更多之語音模型，以決定每一此比較之一相似性衡童；根據一或更多之相似性衡置，決定何語音模型最密切匹配該第一發話：決定與最密切匹配語音模型相對應之相似性衡量是否滿足一第一辨識檩準；比較一第二發話及最密切匹配之語音模型，以決定一第二發話相似性衡量；決定第二發話之相似性衡量是否滿足一第二辨識檫準；當第一及第二辨識檩準滿足時本紙張尺度適用中國國家揉準（CNS ) A4規格（210X297公釐） 83. 3.10,000 (請先閱讀背面之注意事項再填寫本頁) -訂 A7 B7 圖4顯示由圖1 3^〇864 五、發明説明（3 ) ，根搛最密切匹配之語音模型，辨識該第二發話。附圖簡述圓1顯示本發明之一例解單胞電話機實施例。圚2顯示圖1之語音辨識系統之數位信號處理器之處理之方塊流程圖。圖3顯示圖2之決定器方塊之處理之方塊流程圖。之例解實施例所執行之辨識處理之一例。圖5顯示辨識蛊參數値及辨識器性能間之關係曲線。 (請先聞讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消費合作社印装詳細說明序言爲求說明清楚，本發明之例解實施例以方塊（包括標以'處理器'之功能方塊）來此等方塊之功能可由使用共用或專用之硬髖，但'不限於能執行軟雅之硬髋。例如，圖1 之功能可由一單共用處理器提供。（ '處理用不應解釋爲專指能執行軟髖之硬馥。）例解之實施例可包含數位信號處理器（，諸如 AT&T DSP 或 DSP 3 2 C ； ROM)，用以儲存執行下述操作之軟體；憶器（RAM)，用以儲存DSP結果。亦型稹體（VLSI)硬體實施例，以及訂製別功能所示之，包括所示之處理器辭之使含有個顯示。來提供

器'一 D S P 僅讀記及隨意可設置之V L )硬體憶器（進出記非常大 S I電 83. 3.10,000 本紙張尺度適用中國國家標準（CNS > A4規格（210X297公釐）經濟部中央樣準局貝工消費合作社印製 328364 五、發明説明（4 ) 路與通用DSP結合。例解之實施例圖1顯示本發明之一例解資施例，此係有關使用語音辨識之一單胞電話機。例解之單胞電話機包含一免手持之微音器1 3，一語音辨識系統3，一電話控制處理器2及有關之I/O周邊設備2 1、2 2，一聲頻處理器1，無線電收發機1 4，一免手持揚聲器1 2，及手持話筒1 1 Ο 聲頻處理器1爲本藝中普通者，並在m話控制微處理器2之控制下執行各種功能。例如，聲頻處理器1接收來自話筒1 1，微音器1 3，及收發機1 4之聲頻输入信號。此等信號各依需要由現行之單胞通信棵準（例如I S -5 4 )以及任何特定之電話系統需求處理。處理器1引導聲頻输出信號至話筒1 1，免手持揚聲器1 2，及收發機 1 4。處理器1產生各種可聞信號，供引導使用者之用（例如電話響鈴），及對收發機1 4所接收之控制信息（例如忙線信號）解碼，俾由電話控制微處理器2使用。而且，聲頻處理器1對由電話擯制微處理器2所接收之信息解碼爲聲頻信號，並發送該信號至收發機1 4。電路控制處理器2亦可爲本藝中之普通型式。處理器 2控制單胞電話機之電話呼叫處理及一般操作。處理器2 接收來自鍵墊2 1，語音辨識系統3，及聲頻處理器1之輸入，並發送控制指令給顯示器2 2，聲頻處理器1，及 ----------^------訂------線f I V - (請先閲讀背面之注$項再填寫本頁) 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83. 3.10,000 經濟部中央標準局貝工消費合作社印製 A7 B7 五、發明説明（5 ) 語音辨識系統3。語音辨識系統3對電話控制微處理器里現如一控制输入來源，與鍵墊2 1相似。電話控制微處理器2可由發送適當之指令而改變語音辨識系統之操作模式，如下述。語音辨識系統3包含一普通之類比至數位（A/D) 變換器31，此變換由微音器13所拾起之聲頻信號爲一數位樣品流：一數位信號處理器3 2，諸如AT&T DSP 16A，此處理由A/D變換器3 1所產生之數位信號樣品；一 R0M3 3，此含有由數位信號處理器 3 2所執行之程式指令（閱圖2及3 ) :— HMM參數記憶器35 (此爲不消滅之記憶器，諸如EEPROM， ROM，閃爍RAM，電池支持之RAM等），此含有隱藏之Markov模式（HMM)，用於欲辨識之片語上；及 —RAM3 4，其中儲存暫時計算之結果。在一些實施例中，若干組成件31，32，33，34，35)可實際置於同一電子晶方上。 HMM參數記憶器3 5儲存HMM，此相當於欲由系統3辨識之片語。例如，此等片辭包含可用以操作電話機之命令片語（例如·離鈎'，^撥號#，*掛上'等），以及欲呼叫之人或地之名字之電話號碼表（例如德利，麥特，克來斯，家，等）。代表語音數字之模型（例如 "，、二，，……，'九"等）亦可儲存。此等模型之訓練及儲存爲本藝內之普通者。雖本發明以單胞電話機來作例解說明，但普通精於本本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83. 3.10,000 ----------狀------訂------線一 I * (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局負工消費合作社印製 A7 B7 五、發明説明（6 ) 藝之人士知道，該單胞電話機僅爲能使用本發明之語音辨識能量之例解性裝置。其他之此類使用裝置例如包括普通家庭及商業電話機，無線電話機，個人通信機，個人呼叫裝置，個人資料組織機，電腦（諸如個人電腦），及電腦終端機。而且，本發明可應用於電傳通訊網路基礎之服務上，此由語音辨識裝置或系統進出或控制。辨識模式例解實施例之語音辨識系統3在數位僧號處理器3 2 之控制下依以下模式操作。此等模式可由電話控制處理器 2選擇。命令觀察模式語音辨識系統3由來自處理器2之一信號置於命令觀察模式中，表示目前無由使用者所發動之m話控制操作待辦。在此模式中，系統3檢査來自A/D變換器3 1之每一進來之語音發話是否有出現HMM參數記憶器3 5中所儲存之一或更多之HMM之命令片語。換言之，在命令觀察模式中，辨識器使用記憶器3 5中與命令片語相當之 HMM。如系統3證實有此一命令片語出現，則接受使用者之發話爲一命令。否則拒絕該發話。如語音辨識器3接受該發話，則發送一信號至電話微處理器2表示偵得一特定之命令片語。電話控制微處理器2，表示偵得一特定之命令片語。電話控制微處理器2然後發動該命令有關之操本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83. 3.10,000 I 款 ————— —訂 n 線一 I (請先聞讀背面之注意事項再填寫本頁) pfS64_^_ 五、發明説明（7 ) 作（例如掛上）。如發話被拒絕，則無信息送至處理器2 。處理器2反應接受之命令之操作在本藝內爲普通者。撥號模式語音辨識系統3由來自處理器2之一信號置於撥號模式，表示使用者已發動一撥號程序。此撥號程序可由按下一鍵墊鈕或由說出一命令片語（例如％撥號^ )發動，此引起撥號操作。在此模式中，辨識器3使用名字片語之 HMM (而非命令觀察模式中之命令片語），其中，每一名字片語與一對應之電話號碼相關連。此名字片語HMM 及所觸之電話號碼儲存於記億器3 5中。如口發之一名字片語爲辨識器3所接受，則表示已接受一名字片語之辨識之一信息發送至處理器2。電話控制處理器2然後撥發經辨識之名字片語有關之電話號碼，並告知使用者該名字已正確辨認。經濟部中央揉準局負工消費合作社印製如語音辨識器3拒絕一發話，仍發送一信息至電話控制微處理器2，表示拒絕一發話。電話控制微處理器然後提示使用者重覆該發話。該告知及提示普通在放出一適當之語音信息後由一清晰之音調執行。辨識器操作爲在圖1之例解實施例之範困中簡單討論本發明，本發明將以辨識系統3在命令模式中之方式提出。精於本藝之普通人士明瞭，由本討論所例解之本發明可應用於撥號 83.3.10,000 (請先閲讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家樑準（CNS > A4規格（210X297公釐）經濟部中央標準局員工消費合作社印製 A 7 B7 五、發明説明（8 ) 模式中之辨識器操作。圖2爲由語音辨識系統3之數位信號處理器3 2所執行之處理之方塊流程圖。該圚中之方塊各包含一不同之處理功能，此普通以R0M3 3中所儲存之程式之次常式資施0 依搛該圖，由A/D變換器3 1所提供之語音樣品由普通特色抽取器4 0處理，以產生語音特色之一向量流，普通速率爲5 0至1 5 0向量/秒。此等向量各包含語音特色之1 0至3 0組成份，與語音能置，語音能量增量，對數倒頻譜係數，及對數倒頻譜係數增置有關。該特色向置流由普通端點偵測器4 2處理，此決定語音中所藏之發話之起點及終點。端點偵測器輸出包含有限之特色向量序列，其中，毎一向量序列包含一單發話。假設器4 3接收此等特色向置序列，並產生有關其言辭內容之假設。在如此進行中，假設器使用片語之HMM 模型，其參數儲存於片語模型參數方塊4 4中；及一 HMM背景模型，其參數儲存於背景模型參數方塊4 5中。背景'一辭指靜寂，雜音，或並非命令片語之任何語音。所有此等模型實際置於圖1之HMM參數記憶器3 5 中 Ο 假設器4 3作二式假設。第一式假設（稱爲 ' 背景假設# )假定該特色向量序列僅包含背景。第二式假設（稱爲 '片語假設假定該特色序列包含一命令辭，可能後或前帶有背景。對此二假設，假設器各實施一普通動態程本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83. 3.10,000 -----------敌'------訂------線I I A (請先閲讀背面之注意事項再填寫本頁) 11 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（9 ) 式最佳化程序，諸如Viterbi解碼（或評分），此決定該式之最可能假設，及該假設之估計可能性之一對應數値 (或評分）° 而且，該動態程式程序產生該片語假設之一些額外參數，稱爲％匹配參數'。一第一匹配參數由製造最可能片語假設之一預期片語持績時間及由假設器對該最可能片語假設之對應之發話所決定之片語持績時間之間之差所產生。一第二匹配參數由製造最可能假設之預期之HMM狀態持績時間及由假設器4 3所測定之狀態持縯時間之間之差之絕對値之平均値所產生。一第三匹配參數由製造最佳片語假設及次佳片語假設之最可能假設之相似性評分間之差所產生。如精於本藝之普通人士所熟悉，用以產生匹配參數之資料可作爲使用例如HMM及Viterbi評分之普通語音辨識程序之一部份提供。假設器43之輸出包含（i )最可能片語假設，（i i ) 一對應之評分，此爲片語假設相似性估計及背景假設相似性估計之記錄之差；及（i i i)匹配參數。鑑定器4 6接收假設器4 3之输出，並檢査每一匹配參數是否在對應之規定範園內。鑑定器4 6檢査第一匹配參數是否在一1/2至1之範圍內。鑑定器4 6檢査第二匹配參數是否在1 〇〇ms之範圍內。鑑定器4 6並檢査第三匹配參數是否在最佳假設評分之10 %以內。（此等範圍任一均可改變，以適應特定之操作環境。）。如各匹配參數均在範圍內，則鑑定器4 6通過該假設及其各別評本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83. 3.10,000 ----------故.丨— (請先聞讀背面之注意事項再填寫本頁) 訂線一 -12 - 經濟部中央標準局貝工消費合作社印製 Α7 Β7 五、發明説明（10 ) 分至決定器47。否則，拒絕該假設。決定器4 7決定是否接受或拒絕該最可能片語假設。如決定器4 7接受設假設，則呈報設假設至圖1之電話控制處理器2 (在名字撥號模式中，亦呈報拒絕）。決定器 4 7之操作方法利用I —片語之注意時程'之構想。決定器4 7以不同之方式處理一最可能片語假設，此視該片語是發生於該片語之一注意時程之內或外而定。一注意時程爲一時段，開始於一預定時刻，並具有一預定之持績時間。當最可能假設之評分超過其一臨限時，建立一注意時程。該時程之情形爲，在該時程中，必窬收到同一片語之第二次發出，俾由本實施例辨識（當第二次發話之評分亦超過該臨限時）。起先，並不界定注意時程。在決定器4 7操作之過程中，可建立，撤消，或終止特定片語之各種注意時程。決定器4 7作決定及其界定注意時程之方法在圖3之流程圖中說明。圖3之流程圖開始於步驟5 0，在此接收假設之片語及其對應之評分。步驟5 2檢査假設之片語是否在一對應之注意時程內發生。如爲是，則控制指向方塊5 3，在其中，一臨限設定於一固定値T2 。如爲否，則控制指方方塊5 1，在其中，臨限Τ設定於一固定値！^ 。例如，

Tl > Τ 2 ° 步驟5 4比較假設之片語之評分及臨限Τ。如假設之評分大於Τ，則控制移至步驟5 5，此接受該假設。控制然後移至步騍5 7，此消除去該假設之片語之任何現有之本紙張尺度適用中國國家標準（CNS ) Α4规格（210X297公釐） 83.3.10,000 ----------狀 _ (請先聞讀背面之注意事項再填寫本頁) 訂線一 -13 - 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（11 ) 注意時程。最後，步驟6 0產生一输出信號給處理器2，表示接受該假設。如該假設之評分不大於T，則控制移至步驟5 6，此拒絕該假設。在此情形，控制移至步騍5 8，此決定是否應對該假設之片語建立一注意時程。此由檢査該假設之評分是否大於一臨限TA而行之。臨限TA代表一最低之可信程度，在此以下時，不應嘗試接受該片語。例如，臨限 Τα可採取小於或等於Τ2之任一所瞽之値。如該假設之評分大於Τα ，則控制移至步驟5 9。步驟5 9對該假設之片語建立一注意時程，由設定該時程之開始及終止時刻，並使片語本身與該時程相關連而成。在例解之命令檢査模式中，開始及終止時刻設定於較之系統3收到假設之命令片語時延後固定之時刻（在例解之撥號模式中，開始及終止時刻可設定於較之發出氰話提示要求使用者重覆输入時延後一固定時刻）。在例解之命令觀察模式中，經建立之一注意時程開始於1秒之延遲及終止於5秒之延遲。延遲時間可由系統設計者依以下之考慮設定。假定片語假設爲正確（即正確辨識爲語音片語），但仍爲辨識系統3所拒絕，則該系統之使用者一旦知道該系統並不接受該輸入時，彼可能重覆該片語。注意時程應界定爲使用者在該假定情況下可能重覆該命令之時間。在例解之命令觀察模式中，要注意時程開始前之延遲時間應爲該系統對接受之發話反應之時間加上使用者需注意該系統未能反應之本紙張尺度適用中國團家標準（CNS > Α4規格（210Χ297公釐） 83.3.10,000 (請先閣讀背面之注意事項再填寫本頁) 訂線一 -14 - 經濟部中央樣準局貝工消费合作社印製 B7 五、發明説明（12 ) 時間。在例解之名字撥號模式中，該延遲時間應設定等於使用者對提示重覆該名字之估計反應時間。任一注意時程之持縯時間應涵蓋使用者人群間之各不同之反應時間。例如，步驟5 9可用以建立數個注意時程，同時對不同之片語或相同之片語資施。如由於處理之複雜性而不需要此情況，則步驟5 9可修改，俾當一新時程建立時，撤消所有先前建立之注意時程。如步驟5 8之決定爲否，則控制到達步驟6 0 ;否則，如決定爲是，則控制通過步驟5 9後到達步驟6 0。在任一情形，步驟6 0產生一输出信號，表示拒絕該假設。僅在撥號模式中，拒絕信號亦送至處理器2。圖2之決定器4 7之操作另可由檢討圖4所示之實例而獲得明瞭。在本實例中，該系統在命令觀察模式中。例如，該系統經設計來辨識一單命令（例如 '離鈎'）。圖 4之水平軸線表示時間，而垂直軸線則表示辨識評分。臨限丁： * T 2 ，TA顯示爲水平虛線。注意時程顯示爲在時間軸線下之水平節段。單命令之每一假設顯示爲垂直節段。節段之高度表示設假設之評分。垂直節段之水平位置代表發話發生之時刻。經接受之命令假設在其頂端由箭頭標不0 如顯示於圖4，假設Α並不在一對應之注意時程內（尙未發生用以界定一注意時程之情事）。依據圖3之步驟 52-54 >Τ = Τι ，評分>1^ ，及該假設被接受。假設B亦不在一對應之注意時程內。故此，依據步驟本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公嫠） 83. 3.10,000 ----------^------訂------線一 I a' (請先閱讀背面之注意事項再填寫本頁) -15 - A7 B7 經濟部中央標準局員工消費合作社印製五、發明説明 ( 13 ) 1 I 5 2 及 5 1 9 T = T 1 Ο 然而 9 由於假設 B 之評分並不超 1 | 過 T 1 9 故假設 B 被拒絕 ( 閱步驟 5 4及 5 6 ) 〇然而 9 1 1 由於假設 B 之評分超過 T A 9 故建立一注意時程 I B ( 閱 1 I 請 1 步騄 ( 5 8 — 5 9 ) 0 先聞 1 I 程讀 1 •假設 C 發生於前對命令片語所建立之對應注意時背面 1 I I B 內 0 故此 9 依據步驟 5 2 及 5 3 ，T 二 T 2 0 由於該乏注意 1 1 1 假設評分超過 T 2 9 故該假設被接受，且注 Μ時程 I B 被事項再 1 1 撤消 ( 閱步驟 5 4 9 5 5 9 及 5 7 ；注意該時程 I B 顯示 % 寫太 1 狀如其建立時者假設 C 之接受在接受時切除去I B ) 〇頁 1 I 假設 D 顯示發生於原注意時段 I B內 0 然而 9 由於 1 I I B 已由假設 C 撤消 9 故不管時程 I B 0 故此， T = T 1 1 1 I ( 閱步驟 5 2 及 5 1 ) 〇由於假設 D 之評分並不超過 T 1 1 訂 9 故假設 D 被拒絕〇然而 9 由於其評分超過 T A 9 故建立 1 1 注意時程 I D ( 閱步踩 5 8 及 5 9 ) 0 1 | 假設 E 發生於注意時程 I D 終止之後〇故此， T — 1 | T 1 ( 依據步騄 5 2 及 5 1 ) 9 由於假設 E 之評分並不超缕過 T 1 9 故假設 E 被拒絕 ( 閱步驟 5 4及 5 6 ) 〇而且 9 1 由於其評分並不超過 T A 9 故並不建立一注意時程 ( 閱步 1 1 騍 5 8 ) 〇 1 | 臨限 T 1 9 T 2 9 T A 之特定値可依據手邊之辨顆工 1 作選擇〇例如 9 正常化之臨限値如下：T 1 =2 • 5 9 1 1 I T 2 1 * 5 9 及 T A — 1 0 圖 5 顯不有關決定命令觀察 1 之臨限之一些考慮〇同樣之考慮可用於撥號模式上〇 1 1 圖 5 顯示 —~- 曲線 ren 圖 9 其中 9 主軸線表示該系統之二主 1 1 1 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 83.3.10,000 -16 - 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（14 ) 要性能參數。水平軸線表示假警率（每單位時間之假接受數），及垂直軸線表示漏失偵測之可能率（即拒絕含有命令片語之一發話之可能率）。由原點及點（Fc ，Me ) 所界定之方形區域代表可接受性能之區域。曲線Cl及η分別描繪在靜寂及嘈雜環境中之系統性能。每一曲線上之毎一點相當於在臨限Τα之特定値上之系統性能，假定Τα = 〇〇(即從未界定注意時程，故此恒Τ = ΤΑ )。各曲線由實驗獲得，由含有命令片語之發話及不含命令片語之發話之收集統計而得。靜寂環境曲線g通過可接受性能區。故此，可選擇一値1'1 ，俾該系統之性能烏可接受者。使Q上之點<31相當於此Ti 。嘈雜環境曲線η並不通過可接受性能區。明確言之，與所選之臨限Τα相當之點Ni具有一可接受假警率，但一不可接受之高漏失偵測可能率。現可界定T2 及Τα ，俾在第二發出之命令辭中漏失偵測之可能率與在靜寂情況下第一發出之命令辭之偵測之可能率相同，且該系統之整個假警率與Να者相同。假定D爲一注意時程之持績時間，及Να爲η上具有坐標（Fa ，Μα )之點，俾FaD<<1 (故此，由一假設所產生之一注意時程中之一時間點之可能率微不足道 )，及μα <<1 (故此，被拒絕之正確假設不產生一注意時程之可能率微不足道）。在實際上，常可發現到此點。N2選擇爲η上之一點，具有與（31相同之漏失偵測之可能率。Τ2 ，ΤΑ選擇爲分別與Ν2 ，Να相對應之臨本紙張尺度適用中國國家標準（CNS ) A4规格（210X297公釐） 83. 3.10,000 ----------狀------訂------線f I (請先聞讀背面之注意事項再填寫本頁) -17 - 經濟部中央標準局貝工消费合作社印製〇^3864 五、發明説明（15 ) 限。如一正確之命令片語被拒絕，則幾乎確可界定一注意時程。故此，在第二次附近中漏失偵測之可能率接近該 Qi 。如無命令片語，則注意時程之累稹持績時間相對於語音之總持縯時間而言爲微不足道。故此，在幾乎整個時間中均使用臨限丁1 ，且假警率與1^1者相同。雖例解實施例之說明係有關並不隨欲辨識之片語而變化之臨限値，但精於本藝之普通人士明瞭，可使用不同之臨限來辨識不同之片語。一些辭或命令（即片語）對一使用裝e可具有較其他辭或命令爲重要或深逮之影響。故此，可能僅當決定該辨識至較高之可信度時，分需辨識此' 較重要'之辭或命令。此較髙之可信程度可由使用較之用於較不重要之片語上者爲高之辨識臨限來確保。此構想亦可延伸至使用裝置操作之狀態上。即是，一特定之片語在使用裝置在一第一狀態中時可具有一低度之重要性，及在使用裝e在一第二狀態中時可具有一較高程度之重要性。故此，辨識臨限可依語音辨識器所在之環境 (即使用裝置之狀態）設定。在本發明之一些實施例中，一個以上之模型可與一單片語對應（例如各別之模型用於不同之方言上）。在此情形，一注意時程可由一模型之評分建立，而在該注意時程內之一發話之接受則可根_同一片語之一不同模型（即不同方言中之同一片語）之評分。雖此處已顯示及說明本發明之一特定實施例，但應明瞭本實施例僅爲例解可應用本發明之原理設計之許多可能本紙張尺度適用中國國家標準（CNS > A4規格（210X297公釐） 83.3.10,000 ----------狄------訂------線| I (請先聞讀背面之注意事項再填寫本頁) -18 - 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（16 ) 之特定裝置。精於本藝之人士可依據此等原理設計出許多不同之其他裝置，而不脫離本發明之精神及範圍。狀訂線( I (請先聞讀背面之注意事項再填寫本頁) 83. 3.10,000 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -19 -

Claims

C8 D8 、申請專利範圍附件1:第83102745號專利申請案中文申請專利範圍修正本民國8 6年8月修正 1.一種辨識發話片語的方法，該片語包含一或更多之辭，方法包括以下步驟：執行第一語音辨識程序，以試圖辨識片語之第一次發話’此第一程序運用第一語音辨識標準，但造成辨識第一發話之失敗；建立容許接受該片語之另如果在該時段中收到另一識程序以試圖辨識該另一次發音辨識標準較第一語音辨識標 2 ·如申請專利範圍第1 程序包含以下步驟：一次發話的時段；及次發話，便執行第二語音辨話，該第二程序所運用之語準更寬容。項所述之方法，其中該第一之比較，而爲每一請 Λ 閲讀背面之注意事項再填寫本頁訂經濟部中央標準局®C工消費合作社印製根據第一發話與一或更多語音模型語音模型決定一第一相似性衡量；及判斷是否有任何第一相似性衡量滿 3·如申請專利範圍第2項所述之音模型反映一或多個預定辭。 4 ·如申請專利範圍第3項所述之方法，其中該語音模型還反映一聲音背景。 5 ·如申請專利範圍第2項所述之辨識標準包含判定第一相似性衡量是否足第一辨識標準。方法，其中一個語r 方法，其中該第一超過第一臨限值。本紙張尺度逋用中國國家標準（CNS ) Α4規格（210X297公釐） 88. 8, 經濟部中央標準局員工消費合作社印製 ^^〇8β4 i ______ D8六、申請專利範圍 6 ·如申請專利範圍第1項所述之方法，其中該第二程序包含以下步驟：根據第二發話與一或更多語音模型之比較，而爲每— 語音模型決定一第二相似性衡量；判斷第二相似性衡量何者滿足所述較寬容之語音辨識標準；及辨識第二發話爲與滿足較寬容辨識標準之特定第二相似性衡量相對應的片語。 7 ·如申請專利範圍第6項所述之方法，其中該第一辨識標準包含判定第一相似性衡量是否超過第一臨限值，且其中該較寬容辨識標準包含判定第二相似性衡量是否超過比第一臨限值低的第二臨限值。 8 ·如申請專利範圍第1項所述之方法，更包含將第一發話與一反映聲音背景之模型予以比較的步驟。 9 ·如申請專利範圍第1項所述之方法，其中該片語包含對一使用裝置之命令片語。 10.如申請專利範圍第1項所述之方法，另包括接收第一發話之步驟，且其中，該預定時段開始於第一發話之接收後之一預定時刻》 1 1 .如申請專利範圍第1項所述之方法，另包括發出第二發話之提示的步驟，且其中，該預定時程開始於發出該提示後之一預定時刻。 1 2 .如申請專利範圍第1項所述之方法，其中，該片語相當於一孤立之辭。 (請先聞讀背面、之注意事項再填寫本頁) 本紙張尺度適用中國國家梂準（CNS ) A4規格（2丨0X297公釐） -2 - A8 B8 C8 D8 經濟部中央標準局貝工消費合作社印製々、申請專利範圍 1 3 .如申請專利範圍第1項所述之方法，其中，第一辨識標準係根據欲辨識之片語。 14.如申請專利範圍第1項所述之方法，其中，該較寬容之辨識標準係根據欲辨識之片語。 1 5 .如申請專利範圍第1項所述之方法，其中，第一辨識標準係根據使用裝置之狀態。 1 6 .如申請專利範圍第1項所述之方法，其中，該較寬容之辨識標準係根據使用裝置之狀態。 1 7 .如申請專利範圍第1項所述之方法，其中，該等步驟實施於電傳通訊網路上，以方便網路服務之操作。 18.如申請專利範圍第1項所述之方法，其中，該等步驟實施於電腦上，以方便電腦之操作。 1 9 種辨識發話片語的設備，該片語包含一或更多之辭，設備包含：執行第一語音辨識程序，以試圖辨識片語之第一次發話的裝置，該第一程序運用第一語音辨識標準；建立容許接受該片語另一次發話的時段之裝置；及如臬在該時段中收到另一次發話，便執行第二語音辨識程序以試圖辨識該另一次發話的裝置，該第二程序所運用之語音辨識標準較第一語音辨識標準更寬容。 2 0 ·如申請專利範圍第1 9項所述之設備，其中該第一程序執行裝置包含：根據第一發話與一或更多語音模型之比較，而爲每一語音模型決定一第一相似性衡量的裝置；及 ----------^ II (請先閲讀背面之注意事項再填寫本頁) 、νβ 本紙張尺度逍用中國國家標準（CNS ) Α4規格（210X297公釐） A8 B8 C8 D8 32S864 六、申請專利範圍判斷是否有任何第一相似性衡量滿足第一辨識檩準， 2 1 ·如申請專利範圍第2 0項所述之設備，其中一個語音模型反映一或多個預定辭· 2 2 ·如申請專利範圍第2 1項所述之設備，其中該語音模型還反映一聲音背景。 2 3 ·如申請專利範圍第2 0項所述之設備，其中該第一辨識標準包含判定第一相似性衡量是否超過第一臨限值。 2 4 ·如申請專利範圍第1 9項所述之設備，其中該第二程序執行裝置包含：根據第二發話與一或更多語音模型之比較，而爲每— 語音模型決定一第二相似性衡量的裝置；判斷第二相似性衡量何者滿足所述較寬容之語音辨識標準的裝置；及辨識第二發話爲與滿足較寬容辨識標準之特定第二相似性衡量相對應的片語之裝置。 2 5 ·如申請專利範圔第2 4項所述之設備，其中該第一辨識標準包含判定第一相似性衡量是否超過第一臨限值，且其中該較寬容辨識標準包含判定第二相似性衡量是否超過比第一臨限值低的第二臨限值。 2 6 ·如申請專利範圍第1 9項所述之設備，更包含將第一發話與一反映聲音背景之模型予以比較的裝置。 2 7 ·如申請專利範圍第1 9項所述之設備，其中該片語包含對一使用裝置之命令片語* 本紙張尺度適用中國國家標準（CNS ) Μ規格（210X297公釐） (請先閎讀背面之注意事項再填寫本頁) 訂經濟部中央標準局員工消費合作社印製 -4 - 經濟部中央標準局貝工消費合作社印策 32S864 i D8六、申請專利範圍 28.如申請專利範圍第19項所述之設備，另包括接收第一發話之裝置，且其中，該預定時段開始於第一發話之接收後之一預定時刻。 2 9 .如申請專利範圍第1 9項所述之設備，另包括發出第二發話之提示的裝置，且其中，該預定時程開始於發出該提示後之一預定時刻。 30.如申請專利範圍第19項所述之設備，其中，該片語相當於一孤立之辭。 3 1 .如申請專利範圍第1 9項所述之設備，其中，第一辨識標準係根據欲辨識之片語。 3 2 .如申請專利範圍第1 9項所述之設備，其中，該較寬容之辨識標準係根據欲辨識之片語。 3 3 .如申請專利範圍第1 9項所述之設備，其中，第一辨識標準係根據使用裝置之狀態。 3 4 .如申請專利範圍第1 9項所述之設備，其中，該較寬容之辨識標準係根據使用裝置之狀態。 3 5 .—種電話機，包含： (1 ). 一微音器； (2)· —語音辨識器，與微音器連接，以供辨識一發話片語，該片語包含一或更多之辭，該語音辨識器包含執行第一語音辨識程序，以試圚辨識片語之第一次發話*此第一程序運用第一語音辨識標準；建立容許接受該片語另一次發話的時段之裝置；及如果在該時段中收到另一次發話，便執行第二語音辨 ----------Y-------1T------4 (請先閱讀背面.之注意事項再填寫本頁) 本紙張尺度適用中國國家捸準（CNS ) A4规格（210X297公釐） 325364 | D8 々、申請專利範圍識程序以試圖辨識該另一次發話的裝置，該第二程序所運用之語音辨識標準較第一語音辨識標準更寬容；以及 (3)·—電話電路，用以反應該經辨識之第二發話而提供電話機操作。 3 6 .如申請專利範圍第3 5項所述之電話機，另包含：一無線電收發機；及聲頻處理裝置，用以介面連接微音器及電話電路至收發機，該聲頻處理裝置反應由電話電路所提供之控制信號。 3 7 .如申請專利範圍第3 5項所述之電話機，其中，該微音器爲免手持之微音器。 3 8 .如申請專利範圔第3 5項所述之電話機’其中，該微音器爲手持微音器》 3 9 .如申請專利範圍第3 5項所述之電話機，另包含一無線電收發機，連接至該電話機，以提供無線電話通信。 (請先聞讀背面.之注意事項再填寫本頁) 、\5 經濟部中央標準局貝工消费合作社印装本紙張尺度適用中國國家標準（CNS ) A4規格（2ί〇Χ297公釐） 6