TW200809769A

TW200809769A - Sharing voice application processing via markup

Info

Publication number: TW200809769A
Application number: TW095144896A
Authority: TW
Inventors: Amit Anil Nanavati; Nitendra Rajput
Original assignee: Ibm
Priority date: 2005-12-20
Filing date: 2006-12-04
Publication date: 2008-02-16
Also published as: CN101341532A; WO2007071602A2; WO2007071602A3; US9330668B2; JP5179375B2; CN101341532B; JP2009520224A; US20070143113A1

Description

200809769 九、發明說明：【發明所屬之技術領域】本發明係關於在一主從式環境中處理語音應用【先前技術】如在網際網路之普遍使用中所證明，近年來以電子方可用之資訊及服務已有巨大發展。通常，使用者藉由⑽ 如）使用鍵盤或觸控螢幕鍵入資訊且在視訊顯^上結果而與系統互動。然而，允許使用者口頭輸入資訊之交談式糸統愈加可用。可將系統輸出聽覺提供至使用者。該等交談式“允許制者❹在活動㈣時獲得資訊及^ 務，從而使使用者雙手空閒以進行其他任務。交談式系統要求話音辨識以理解使用者且要求話音從而以類似於人類之語音來再現資訊。通常，該等II在電話基礎架構中執行4中用戶端裝置為諸如行動: 電話器具。最初，該等交談式系統與㈣戶端裝置―同工作且因此所有話音處理（辨識及合成）皆在與唯用戶端通信 =服器中執行。然而’掌上型用戶端之處理能力的提高使仔話音處理（辨識以及合成）在用戶端侧處變得可行。在-些交談式系統中，話音辨識之部分在用戶端裝置上 ^里°山術語"分散式話音辨識”用來指代允許應隸式組合土戶端裝置上的本端話音處理與對基於網路之話音服務之 =存取的系統。舉例而言，諸如雜訊減少之信號處理可 ==端裝置上執行，該用戶端裝置接著發送所處理之資枓至基於網路之話音服務。x，話音服務處理所接收之信 116441.doc 200809769 號以判定使用者之諳、戈 # /使用語音輸出來回應使用者。一用用戶、之處理能力的另一已知技術為篏文子轉語音（eCTTS)，其中話立八赤，，月31 行。將話音片段伴持為斤缩 77在用戶端處進話音。Χ保持為屋縮特徵向量，其可重新建構回為 ^另-已知方法中’交談式系統可完全常駐 =話音辨識處理在本端執行。由於用 = 限之處理能力，因此僅非常 [、有有上執行。又火式系統可在該等裝置不管現有技術如何，仍存在對用於處理語更有效且通用之系統的不斷需求。 -知式之【發明内容】對靈活機制，其中基於用戶端之計算能力使--“方塊㈣之計算得以在用戶端料 ” 一標記層處執行分散且該方法致能可由用戶端指令碼。尸鲕哀置執订之中=:之第一態樣’提供了一種在主從式計算系統十算^上處理語音應用程式之方法。接收指示用戶端使㈣料。基於該所接收之資料，選擇規定在- 戶端ϋπ統之間的一基於語音之對話方塊中待由用 = 務的一組指令。將該組指令提供至用戶端以中=!Γ另一態樣’提供了一種在主從式計算系統 ;用戶^置上處理語音應用程式之方法。自飼服器接 116441.doc 200809769 收一指令碼，該指令碼係視指示用戶端裝置之計算能力的資料而定而加以選擇的。剖析指令碼以判定在使用者與主從式計算系統之間的一基於語音之對話方塊中待由用戶端裝置執行的一組指令。在用戶端裝置上執行該等指令。根據本發明之另一態樣，提供了一用於在主從式計算系統中處理語音應用程式之伺服器。該伺服器首先包含用於接收指示該用戶端之計算能力之資料的構件。該伺服器亦具有用於基於所接收之資料選擇規定在一使用者與計算系統之間的-基於語音之對話方塊中待由用戶端執行之任務的一組指令之構件。該伺服器亦具有用於將該組指令提供至用戶端以供執行之構件。統中處理語音應用程式之用戶端裝置。該用戶端裝置包含

之構件及用於在用戶端裝置上執行指令之構件。根據本發明之另一態樣，提供了一用於在主從式計算系根據本發明之另一態樣，提供了一一包含記錄於機器可讀

根據本發明之另一態樣，提供了包含記錄於機器可讀 116441.doc 200809769 取記錄媒體上之機器可讀取程式碼的電腦於控制程式碼執行於其上 “產’其用八上Μ執仃在一主從式計理語音應用程式之方法的用…处上文所述之步驟。 ^置之知作。該方法包含 =發明：又一態樣’提供了一用於處理語音應用程端n广、統包含一用戶端裝置’其具有指示該用戶衣置之计舁能力的相關聯資料。該系統進—步包含資料 Γ子器，其儲存規定在—❹者與㈣統之間的-基於語曰之料方塊中待執行之_的複數個指令碼。另外存在伺服盗’其基於該相關聯之資料而選擇一用於用戶端裝之適當指令碼。-解譯器層處理所選指令碼從而為對話方塊判定待執行於用户端裝置上之第-組指令及待執行於伺服器上之第-細於人 ^ , 、之弟一，、“曰令。一同步層使第一組指令及第二組指令之執行同步。【實施方式】本文所描述之技術提供_ 在1戶端與飼服器之間分擔對話方塊處理之靈活機制。致能可執行於用戶端處之指 :碼。在所描述之配置中，伺服器能夠存取各種版本之指令碼，其中每一版本經特製而用於一對應之裝置設定檔。圖1展不了一具有用戶端裝置10及伺服器20之系統1。如所說明’用戶端裝置1〇為一行動電話手機。然而，用戶端 10可為具有計算資源之任何具備語音功能型裝置。舉例而。，用戶端裝置10可為個人數位助理（pDA)或通用電腦，其具有使該電腦能夠偵測口頭輸入且提供可聽輸出之一麥 H6441.doc 200809769 克風及-或多個揚聲器。用戶端裝置具有足夠處理能力以執行一嵌入式話音辨識引擎。此 ^ 用戶端裝置10(例如）經由蜂巢式電話網路傳輸資訊1 伺服器20，且自伺服器20接收資訊14。下、σ 「又參看圖3論述祠服器20及用戶端裝置10之硬體結構。伺服器20包括一話音伺服器24及一語音瀏覽器u。咳节音伺服器24執行自動話音辨識（ASR)以將自用戶端裝置⑺ 之使用者接收之請求轉換為更適於進一步處理之袼式。自用戶端裝置10接收之資料12可包括話音且亦包括^訊輸入，諸如雙音多頻（DTMF)鍵控輸入。話音伺服器24亦使用文字轉語音（TTS)能力將資訊轉換為音矾。該音訊連同資料14被發送回用戶端裝置丨〇。語音瀏覽器22接收輸入資料12且輸出資料14。在使用類似於圖1中所見之架構的先前技術系統中，語音瀏覽器u 僅為用戶端裝置10與話音伺服器24之間的管道。然而，在當前所描述之配置中，語音瀏覽器22規定待執行於用戶端裝置10上之對話方塊及/或話音處理。藉由基於用戶端裝置之能力調適性地分擔處理，系統1藉由減少伺服器往返程而提高效率。伺服器20可使用超文字傳送協定（HTTp)設施26來存取資訊及服務。如所說明，資訊及服務來源於資料儲存器3〇。然而’實務上，存在使用系統1可存取之資訊及服務的許多來源。HTTP設施26與資料儲存器30之間的通信鏈路28 可（例如）為網際網路或區域網路。鏈路28可簡單地為一點 116441.doc 200809769 對點連接。自用戶端裝置10發送至語音瀏覽器22之資料12包括定義用戶端裝置10之設定檔的話音、文字及參數。語音瀏覽器 22選擇一規定待於用戶端裝置丨〇上進行之處理的指令碼 (稱作”語音指令碼”）。因此，用戶端裝置1〇之能力及該語音指令碼判定在伺服器20與用戶端裝置1〇之間處理之劃分。語音指令碼之使用提供在判定哪些對話方塊係在用戶端10上本端處理且哪一部分之話音處理發生於用戶端丨〇上而非伺服器20上方面的靈活性。自語音劉覽H22發送至用戶端裝置1()之資料⑽括語音指令碼及話音。用戶端裝置1〇執行語音指令碼。話音祠服器24不受在伺服器2〇與用戶端裝置1〇之間處理任務之分散的影響。在一配置中Μ吏用語音可延伸性標記⑼&乂紙）來撰寫語音指令碼。V〇iceXML為基於XML之指令碼語言，其獲邊可為互動式具備語音功能型應用程式之標準。 XML提# _用於基於音訊對話方塊來撰寫語音應用私式之平$獨立语言。存在兩種主要類型之對話方塊。表格呈現資訊並荒集輸人，且功能表呈現—組選擇。圖2為在用戶端1〇與伺服器2〇之間靈活地分擔處理之方法之流程圖。在步驟202中，用戶端1〇與伺服器2〇通信，從而提供定義用戶端奘筈t 表置10之此力的參數。伺服器2〇可於呼叫建立時間被告知用戶端之能力，或替代地伺服器2〇可已被通知用戶端之能力。舉例而言，資訊可與電話號碼相 116441.doc 200809769 關聯以告知飼服器20該電話號碼係由一具有特定能力之用戶端裝置使用。描述用戶端能力之參數包括可用記憶體之量、處理能力及電池電力。亦可使用其他參數，包括識別某些硬體或軟體資源（諸如程式或協定）可用於用戶端上之資料。在步驟204中，伺服器使用參數以判定用户端裝置⑺之設定檔。在步驟206中，㈤服器2〇選擇一適當語音指令碼且將所選指令碼發送至用戶端裝置1〇。伺服器能夠存取複數種語音指令碼，每一者經特製以用於一特定裝置設定檔m令碼規定待於用戶端1G處進行之對話方=及 :或話音處理’且亦規定哪些部分可於伺服器20處執行。活音辨識擎已安裝於用戶端裝置10上，且指令碼定義為了執行而使用話音辨識引擎之處理步驟。用戶端裝置10剖析語音指令碼（步驟2〇8)且在步驟中’用戶端裝置10完全或部分執行語音指令碼。用戶端裝置10解譯指令碼以判定需進行哪些任務及以何次序進行。、二:裝置Η)接著如指令碼要求來執行所規定之話音辨識入=任務。舉例而言，語音指令碼可規定用戶端裝置需 ; 提示且向使用者播放該提示。用戶端褒置呼叫話音口成弓I擎以合成該提示。接著’用戶端裝置接收使用者之員回應且使用話音辨識系統來處理該回應。來自使應之文法提供於指令碼中。話音辨識系統之輪出 ^疋如語音指令碼中所規定的所執行之下一步歸因於執行時期約束， h ° 1 ^用戶鈿裝置10可未必能夠支持語 ^6441.(10, -12- 200809769 音指令碼所規定之計算。用戶端ίο可接著選擇表現為一啞用戶端。在此情況下，主從式交換支持所要求之多重互動。在一配置中，語音指令碼由用於對話方塊及話音之 Javascript™組成。發送至用戶端裝置10之語音指令碼提及可在用戶端裝置上進行之動作。語音指令碼包括裝置敏感構造，使得藉由剖析指令碼用戶端可判定可在用戶端上進行之處理。語音指令碼包括對話方塊處理所要求之文法構造及話音處理所要求之話音構造。語音指令碼之構造亦包括一 ’’任選模態”以用於區分分類為”必須具有”或”可具有’· 之文字，且用於識別分類為π必須具有’’之話音。語音伺服器之語言為VXML之延伸，其支持在伺服器20 與用戶端裝置10之間分散處理之特徵。該語言含有標記標示，其並未以VXML定義且由剖析器使用以自延伸VXML 產生VXML伺服器及VXML用戶端。下文描述了一些額外標記。 1. <Block process = ,,client/ServerM splitblock=ff25M> 若存在一待處理之大區塊，則使用此。代替在伺服器20 或用戶端10上處理該大區塊，延伸語言提供特徵以將區塊分割為兩個部分且接著分別在用戶端及伺服器上處理該兩個部分。此處，splitblock=n25n意謂區塊之開始的25個字元將於用戶端裝置10上處理且剩餘字元將於伺服器20上處理。 2. <merge source=,fclient,? destination=ffservern> 116441.doc -13- 200809769 若存在需由用戶端裝置10提示之問題，則該等問題可視用戶端之設定檔而定而被合併。用戶端10之設定檔包括關於可用記憶體之量及用戶端10上之使用者是否匆忙的資訊。若使用者為匆忙的，則該等問題可合並且可按照規格由用戶端或伺服器詢問。可存在用於合併之其他標準。 3.<split source=nClient or Server” destination="client，，> 若存在伺服器20或用戶端i〇經π次嘗試而未辨識之任何問題，則可將該問題分割為不同提示。該等問題如在目的厂地中所規定由用戶端裝置1〇或伺服器20詢問。可存在用於分割之其他標準。問題之基本文法（巢套或連續）在判定分割中起作用。在巢套文法之情況下，一般最後之答案而非所有答案需返回至伺服器以分割提示。巢套文法之實例： a·哪一州？ b ·哪一城市？ c·哪一機場？若需進一步提交答案，則僅最後之答案可為所關心的，因為目的在於判定哪一機場。整個問題歸因於記憶體約束而被分割為三個小文法。在連續文法之情況下，使用者不僅對最後問題之答案感興：，而且亦對整個問題之每一部分的答案感興趣。在某種分割之後，必須在最後連接且儲存與每一子部分相關之答案以產生與在伺服器本身處辨識整個文法等效之效應。 116441.doc -14- 200809769 連續文法之實例： a.名為何？ b·姓為何？ C·地址為何？在此情況下吾人關心完整答案，因為所合併之問題為 "你想要何人之電話號碼且此人在何位置？”對此之一答案可為（在辦公室的Nitendra Rajput)。與分割及合併相關之不同可能性 1)在伺服器20處辨識整個問題且與該問題相關之整個大文法不需分割。 2) 將該問題劃分為若干小部分且話音辨識在用戶端處進仃。每次將與提示相關之文法傳送至用戶端裝置1〇。在巢套文法之情況下文法視使用者所給出之答案而定，但在連 ’ ’、只文法之情況下，所傳送之文法可獨立於答案或可視使用者所給出的較早答案（例如，布林（Boolean)答案）而定。 3) 另-可能性可為若干小部分中之—些部分在伺服器2〇處得到辨識且其他部分在用戶端裝置1〇處得到辨識。在此配置中，將與待於用戶端1G處辨識之問題相關的文法傳送至用戶端。飼服)送文法中存在一潛在問題。即使用戶端1〇無需向任何東西，接著用戶端仍將需要返回飼服器吏㈣服器可視早先答案而定來加用戶端!。之時間回應。因&，若用戶二：二此將: 來處理所有文法，則應將所有文法==充足記憶體丁〇负又忐傳达至用戶端以防止用 116441.doc 15 200809769 戶端需要返回伺服器以使適當之文法得以運送。實例： a ·哪一 j ? b·哪一域市？在此情況下’第二個問題獨立於第一個問題。因此五人 :將所有辦之所有城市之文法保持於用戶端若：戶端之能力允許此）而非基於對先前問題之回答個問題之適當的文法。疋乐一 5)在理想狀態中，飼服器2G之記憶體為有效地無窮大，因此任何數目之問題可合併於舰㈣上端裝置H)處，考慮到用戶㈣之記憶體約束㈣ :。提不之若干合併組合係可行的。此意謂若向用戶端二 I:複數個問題以合併，則並非所有問題在用戶端處:被實例： a·你的姓名為何？ b ·你的地址為何？ c·你父親的姓名為何？。然而，考慮到問題之第一者及發送此等三個問題以於用戶端1〇處合併用戶端1〇之記憶體約I，可能僅合併該等最後一者。 6)分割/合併無需基於用戶端1〇之記憶體約束而他可能考慮包括對"無匹配"之數目的計數，t進行。其之數目的計數。若使用者心，則可 #對'’無輸入" 〇併，且若使用 116441.doc • 16 - 200809769 者不能夠處理大問題而僅寧可回答小〜〜1進行分割。为割可基於使用者所提供之資訊而進行。舉例而一若使用者提供比相應提示所要求的更多之信息，則分割。、進仃實例： a ·你的姓名為何？ b·你的姓氏及出生日期為何？若使用者對於第一個問題之答案為"Neeraj

Chaudhary ’則可將第二個問題分割為兩個部分且僅將詢問"你的出生日期為何？ ”。附錄A包括以延伸VXML語言之樣本程式。如所說明，該樣本程式可經剖析且劃分為可分別執行於伺服器2〇與用戶端裝置10上之兩個部分。通信層（同步協定) 圖4β兒明了 -用於使執行於用戶端1G與健㈣上之處理同步的通信層。語音指令碼（亦即νχΜι^檔幻術在。MLext解#器層中處理，該解譯器層包括解譯器之分解器403及-組功能特定模組彻。解譯器層為由用戶端财飼服器20所進行之剖析之部分。在_配置中，解譯器層可為常駐於用戶端及伺服器兩者上之語音㈣器(亦即，一用戶端語音劉覽器及-飼服器語音劉覽器22)之部分。將功能料模組彻之輸出提供至—執行於㈣器獻之伺服器引擎407及-執行於用戶端1()上之用戶端引擎又引擎407、409與使主從式互動同步之同步器411 116441.doc -17· 200809769 U @步益411與執行於飼服器20上之瀏覽器碼413及執用戶端ίο上之w览器碼415互動。同步器川連同劉覽器碼413、415—起組成通信層。 ‘ 目的地π中規定一· /fig tv l , 、兄疋個以上之值（以，V”隔開）時，第一個

值為·^父佳目的地。若禅fp又A 右知σ己不施夠在第一個目的地令執行，則執行將於下一規定地址執行。孤机仃。為此專初始值之組合的值在執行序列中具有以下含義·· •用戶端/伺服器··執行於用 — 奶Μ丁 y用戶鈿上。若執行不成功，則執行於伺服器上。用戶端/部分/祠服器··執行於用戶端上。若執行不成功則在用戶端上進行部分執行且剩餘執行在伺服器上進行。若此亦不成功，則在伺服器上執行。 ^ 1戶端/分割··執行於用戶端上。若不成功，則將對活方塊分割為子對話方塊且接著執行於用戶端上。

•用戶端/分割/伺服器：執行於用戶端上。若不成功，則將對話方塊分割為子對話方塊且執行於用戶端上。若此亦不成功，則於伺服器上執行該對話方塊。用戶端/伺服器/分割：執行於用戶端上。若不成功，則執行於伺服ϋ上。若此h成功，則將對話方塊分割為子對話方塊且執行於用戶端上。若此亦失敗，則於祠服器上執行子對話方塊。 •伺服器/用戶端：此值有效但僅對於及 block>^ 5己有意義。當用於，所合併之對話方塊將執行於伺服器上且若此不成功，則將對話方塊分割且 116441.doc 18 200809769 接著執行於用戶端上。字描述同v層以用於目的地值為"用戶端/分割/伺服器，之情況。在處理發生於用戶端10處之同時，飼服H 20處於等待模式。若處理成功，則用戶端10撰寫，，成功”訊息且亦撰寫一辨識串至待發送至伺服器2G之檔案。用戶端Μ接著移向如VXMLext(吾音指令碼）4〇1中所規定將發生於用戶端μ 或祠服為20上之下一對話方塊。右用戶端10處之處理不成功，則用戶端藉由使用執行於用戶端上之適當模組彻來再次分割呼叫流而繼續。祠服器20保持處於等待狀態。若用戶端1G處之所有步驟皆不成功’則最終向飼服器20發送一"不成功"訊息且㈣辨識之串設定為空串。處理接著在與用戶端1〇相比具有更好辨識準確性及更好處理能力之伺服器2〇上繼續。若第-次嘗試失敗，則飼服器2〇分割問題。在此情況下，即使在伺服器20處對於辨識之嘗試失敗，用戶端⑺仍需知曉祠服器之當前狀態。此倍、由於即使辨識發生於祠服器20處，用戶端10仍具有記錄話音、發送該話音至祠服器 20及接著接收並播放合成話音之任務。在所有處理發生於用戶端10上之情況下，如標記"目的地"所允許，伺服器不具有任何作用且可保持待用直至已在用戶端10上嘗試了每一件事。由於通信層傳送所辨識之串，因此策略改變以用於連接、連續及巢套呼叫流。 116441.doc -19- 200809769 a) · σ己住，在連接問題之情況下，所有答案應在連接之後提交。實例·你的姓名為何？需連接以下三個部分： 1·你的名為何？ 2·你的中名為何？ 3 ·你的姓為何？ b) .在巢套呼叫流之情況下，僅需提交最後一問題之答案。 " 實例-吾人僅關心機場，但被詢問到以下巢套問題_ 1 ·哪一州？ 2·哪一城市？ 3.哪一機場？〇·在連續呼叫流之情況下，需提交最後一問題之答案。實例-吾人僅關心座位號 1·告知吾人在1與20之間、21與4〇之間、41與6〇之間、 61與80之間的座位號； 2 ·告知吾人你的座位號。所遵循之用以使用戶端1〇與伺服器2〇同步的方法對於其他目的地值（伺服器/用戶端、伺服器/用戶端/分割、用戶' 端/祠服器等等）而言係類似的，但事件發生之序列將視目的地值而定而變化。電腦硬艘圖3為電腦系統300之示意性表示，該電觸系統3〇〇屬於 116441.doc -20^ 200809769 適於執行電腦軟體以在用戶端與伺服器之間分擔語音廣、用程式之處理之類型。電腦軟體係在一安裝於電腦系統3〇〇上之合適作業糸統下執行，且可被認為包含用於達成特定步驟之各種軟體碼構件。電腦系統3〇〇可用作伺服器2〇。使用下文所描述之修改，電腦系統300之結構亦可用於用戶端裝置10中。電腦系統300之組件包括電腦32〇、鍵盤31〇、滑氣315及顯示器390。電腦320包括處理器34〇、記憶體35〇、輸入 /輸出（I/O)介面3 60、365、視訊介面345及儲存裝置355。處理器340為執行作業系統及在作業系統下執行之電腦軟體的中央處理單元（CPU)。記憶體35〇可包括隨機存取記憶體（RAM)及唯讀記憶體（R〇M)，且可在處理器34〇之指導下使用。視訊介面345連接至顯示器39〇且提供顯示於顯示器39〇上的信號。例如，自鍵盤310及滑氣315提供用以操作電腦 320之使用者輸入。亦可伟用士矣』便用4如麥克風之其他類型的輸入。亦可使用一或多個揚簦卓裔（未圖不）來可聽地輸出信號。儲存裝置355可包括磁碟她十7 磁磲機或任何其他合適之儲存媒電腦320之每一組件連接至包牧王巴括身料、位址及控制匯流排之内部匯流排3 3 0，以允却雪⑽ 兄峰電恥320之組件經由匯流排 3 3 0彼此通信。電腦系統300可使用至一網 380)之通信通道385而經由輸路（在圖3中表示為網際網路入/輸出（I/O)介面365連接至 116441.doc 21 200809769 一或多個類似電腦。電腦軟體可記錄於攜帶型儲存媒體上，在該情況下，由電腦系統300自儲存裝置355存取電腦軟體程式。或者，可由電腦320直接自網際網路38〇存取電腦軟體。在任一情況中，使用者均可使用（例如）鍵盤3 1〇及滑鼠315來與電腦系統300互動，從而操作執行於電腦32〇上的程式化電腦軟體。可同樣良好地使用其他組態或類型之電腦系統以執行辅助實施本文所述之技術的電腦軟體。此外，可在所述技術之實施中使用定製裝置及專門硬體，諸如數位信號處理器。掌上型用戶端裝置10可具有類似於圖3所示之計算結構的計算結構。顯示器390及小鍵盤完整地形成於通常不具有滑鼠315之用戶端裝置1〇中。用戶端裝置1〇中之ι/〇介面 365為用於經由蜂巢式網路發送及接收信號之收發器，且用戶端裝置10進一步包括麥克風及揚聲器以處理可聽輸入及輸出。結論如將為熟習相關技術者所顯而易見，可對本文所描述之技術及配置作各種改變及修改。附錄A : VXML延伸樣本程式 <vxmlext> <block pro cess = ” client/server，，splitblock=” 25 ”> 116441.doc -22- 200809769 </block> <form id=’’id_name"> 〈merge source: =nclient19 destination^ ffserver n> <field name- ft. •…” execute:” client’’〉 <prompt> ....... ............〈/prompt〉〈grammar src=”..........V> </field> 〈field name=”· execute = ,’clientM> <prompt> ....... ............ </prompt> 〈grammar src = </field> 〃........."丨> <pl>................ <gotomerge/> 〈/merge〉 ..</pl> 〈field name:”· ........rt execute = nclient/server f9> <prompt>......... .....................................</prompt> 〈grammar src="............〃/> <nomatch count =ttnn> < got o split/></nomat ch> <split Source = r,client or server" destination^11 client <pl>............... • </pl> <p2>............... .</p2> <p3>............... .</p3> 116441.doc -23- 200809769 <p4>............ </split> </field> </form> </vxmlext> ….</p4> 將此檔案饋入至剖析器，且產生以下"VXML伺服器”及 "VXML用戶端”檔案且使其分別執行於伺服器及用戶端上。所產生之VXML伺服器 <vxml> <block> <............after 25 characters> </block> -------------合併後..................... <form id=n… ··，，> 〈field name = ft <prompt>pl … ......</prompt> <grammar src=ftgrammar destination after merging^/> </field> .......分割前..................... <field name = n tt^ <prompt>...... <grammar src^ngrammar destination before splittingn/> </field> 116441.doc -24- 200809769 </form> </vxml> 所產生之VXML用戶端 <vxm/> <block> 開始之25個字元.......... </block> <form id= n...... ”> ------合併如----------------------------- <field name = ”· ····"> <prompt>......... .......</prompt> 〈grammar src=".........V> </field> 〈field name=”· ····"> <prompt>........ ..........〈/prompt〉〈grammar src = </field> :,f........."/> --分割前-------------------------- <field name = n. ........〃> <prompt>........ ...............................</prompt> 〈grammar src = </field> •-"grammar destination before splitting”/〉 --------分割後----------------------- 〈field name=pl> 116441.doc -25- 200809769 <prompt>....................</prompt> 〈grammar src=n......"l> </field> 〈field name=p2> <prompt>....................</prompt> 〈grammar src=n......〃/> </field> <field name=p3> <prompt>....................</prompt> 〈grammar src="......V> </field> 〈field name=p4> <prompt>.....................</prompt> 〈grammar src="......V> </field> </form> </vxml> 標記庫 1. 合併屬性來源目的地 2. 分割屬性 116441.doc - 26 - 200809769 來源目的地 3 ·區塊新屬性過程分割區塊 4.搁位新屬性執行 5·去合併 7 ·去分割 8.Vxmlext 插入此標記以將該語言與正常Vxml語言區分，因為其具有各種其他特徵亦添加用以合併及分割提示之某些標記（語法 <p(pr〇mptnumberafter p)>) 【圖式簡單說明】圖1為一適於執行本文所述之技術之主從式配置的示意性表示；圖2為一種用於在用戶端與伺服器之間靈活地分散計算之方法的流程圖；圖3為一適合用於圖！之配置中之計算裝置的示意性表示；及圖4為一提供用戶端與伺服器之間之同步的通信層之示 116441.doc -27- 200809769 意性表示。【主要元件符號說明】 1 系統 10 用戶端裝置 12 資訊/資料 14 資訊 20 伺服器 22 語音瀏覽器 24 話音伺服器 26 超文字傳送協定（HTTP)設施 28 通信鍵路 30 貧料儲存器 300 電腦系統 310 鍵盤 315 滑鼠 320 電腦 330 内部匯流排 340 處理器 345 視訊介面 350 記憶體 355 儲存裝置 360 輸入/輸出（I/O)介面 365 輸入/輸出（I/O)介面 380 網際網路 116441.doc -28· 200809769 385 通信通道 390 顯示器 401 語音指令碼 403 分解器 405 功能特定模組 407 伺服器引擎 409 用戶端引擎 411 同步器 413 瀏覽器碼 415 瀏覽器碼 116441.doc -29-

Claims

200809769 十、申請專利範圍： K 包含—伺服器及—用戶端之主從式計算系統中靈活地處理語音應用程式器上執行：方法&方法包含在該词服接收=該用戶端之一計算能力之資料；一^a貝科選擇規定在—使用者與該計算系統之音之對話方塊中待由該用戶端執行之任務的組指令；及得的一提供該組指令至該用戶端以供執行。 2.如請求項1之方法，其進一步包含·· 右於違用戶端上未成功執行該等任務中之則在該飼服器上執行該一或多者任務。 ”者， 3·如請求項1之方法，其中該接收包含：識別該用戶端，·及擷取制戶端之該計算能力之—職義設定幹。 4.如請求们之方法，其中該接收步驟在該基於活方塊之一執行時期接收該資料。㈢^ 5·如請求項1之方法，其中該資料包含以去： r T之至少〜在該用戶端上可用之記憶體之一量測；該用戶端之一電池電力；該用戶端之一處理能力；及識別在該用戶端上可用之一或多個n之 6. -種在-包含—飼服器及—用戶端芏破式計算系 116441.doc 200809769 7· 8. 9· 10. 11. 統中處理語音應用程式之方法，該方法包含在該用戶端上執行：自该伺服器接收一指令碼，該指令碼係視指示該用戶端裝置之一計算能力之資料而加以選擇的；剖析該指令碼以判定在一使用者與該主從式計算系統之間的-基於語音之對話方塊中待由該用戶端裝置執行的一組指令；及在該用戶端裝置上執行該等指令。如咕求項6之方法，其進一步包含以下步驟：自該用戶端裝置發送指示計算能力之該資料至該飼服如明求項6之方法，其進一步包含以下步驟：通知該飼服器該等指令中之至少一者未成功執行於該用戶端裝置上。如明求項6之方法，其中該對話方塊包含待播放給該使用者之提不及對該等提示之預期回應的對應文法，該方法進一步包含以下步驟：卜基於該用戶端裝置之該計算能力，將該等提示中之至少一者及對應文法分割為複數個提示及對應文法。如哨求項9之方法’其中該指令碼包含規定該複數個提不及文法將執行於該伺服器上還是該用戶端裝置上的一或多個目的地參數。如叫求項6之方法，其中該對話方塊包含待播放給該使之提示及預期回應之對應文法，且其中基於該用戶 116441.doc 200809769 端裝置之該計算能力而將複數個該等提示及對應文法人併為一單一提示及對應文法。 12. —種用於在一主從式計算系統中處理語音應用程式之伺服器，該伺服器經調適以·· 接收指示一用戶端之一計算能力之資料；基於該接收之資料選擇規定在一使用者與該計算系统之間的一基於語音之對話方塊中待由該用戶端執行之任務的一組指令；及提供該組指令至該用戶端以供執行。 13. -種用於在-主從式計算系統中處理語音應用程式之用戶端裝置，該用戶端裝置經調適以：自-伺服器接收一指令碼，該指令碼係視指示該用戶端裝置之一計算能力之資料而加以選擇的；剖析該指令碼以判定在一使用者與該主從式計算系統之間的-基於語音之對話方塊中待由該用戶端裝置執行的一組指令；及在該用戶端裝置上執行該等指令。 14. -種包含記錄於一機器可讀取記錄媒體上之機器可讀取程式碼的電腦程式產品，其用於控制該程式碼執行於其上以執行纟主；^式計算系統中處理語音應用程式之方法的一伺服器之操作，該方法包含·· 接收指示一用戶端之一計算能力之資料；基於該接收之資料撰傅土目A 貝丁叶k擇規定在一使用者與該計算系統之間的-基於語音之對話方塊中待由該用戶端執行之任 116441.doc 200809769 務的一組指令；及提供該組指令至該用戶端以供執行。 15. -種包含記錄於一機器可讀取記錄媒體上之機器可讀取程式碼的電腦程式產品，其用於控制該程式碼執行於其上以執行-在-主從式計算系統中處理語音應用程式之方法的一用戶端裝置之操作，該方法包含：自-飼服器接收一指令碼，該指令碼係視指示該用戶端裝置之一計算能力之資料而加以選擇的；朴該指令碼以判定在—使用者與該主從式計算系統之間的-基於語音之對話方塊中待由該用戶端裝置執行的一組指令，·及在該用戶端裝置上執行該等指令。 16. —種用於處理語音應用程式之系統，其包含： -用戶端裝置’Μ有指示該用戶端裝置之一計算能力的相關聯資料；資料儲存器，其健存規定在一使用者與該系統之間的基於每音之對話方塊中待執行之任務的複數個 … 碼；一伺服器，其基於該相關聯之資料選擇一用於該用戶端裝置之適當指令碼；一解譯器層，其處理該所選指令碼，從而為該對話方塊判定待執行於該用戶端裝置上之—第—組指令及待執行於該伺服器上之一第二組指令；及一同步層，其使該第一組指令及該第二組指令之該行同步。 116441.doc -4-