TW421755B

TW421755B - System and method for adding speech recognition capabilities to java

Info

Publication number: TW421755B
Application number: TW087100099A
Authority: TW
Inventors: Charles T Hemphill; C Scott Baker
Original assignee: Texas Instruments Inc
Priority date: 1997-01-06
Filing date: 1998-08-04
Publication date: 2001-02-11
Also published as: EP0854418A3; KR100663821B1; SG72779A1; KR19980070342A; US6456974B1; JPH10240493A; EP0854418A2

Description

經濟部中央標準局員工消費合作社印製 A 2 Π 5 5 A7 _______B7 五、發明説明（1〉發明之技術領域本發明係概括關於資料通訊及處理之領域，尤指一種供將語音辨認能力加至爪哇之系統及方法。發明之背景電腦使用者久巳希望個人軟體應用能響應口頭命令》允許使用者與使用語音作為輸入媒介之軟體應用互動，提供一種較之例如鍵盤，滑鼠或觸控螢幕輸入裝置更自然之介面。語音輪入提供方便不用手操作之優點。除了允許使用者照應其他事情，同時與軟體應用互動外，不用手操作使行動不便之使用者可利用電膘。語音輸入提供避免拼音及語法誤差問題，及必須捲動舆其他輪入方法關聯之大型清單之另外優點。一種提供語音辨認能力供顧客應用之方法，為以HXdmhypgp text markup language)為基礎之精靈頁概念。精靈頁為全球資訊網(WorltHyide-ffeb，簡稱ffeb)頁，内含一至該頁之文法特定之連結，並能翻譯該文法之結果。精靈頁之著者界定該頁將會對其窨應之文法，將一連結嵌入至該精靈頁内之文法並就預期之口頭輸入型式，對使用者產生視覺提示。語音引擎遭遇精靈頁其結合文法，使其能響應語音輸入，並將結果轉回至精靈頁。精靈頁翻譯該結果並相應響應。此方法之一項缺點，為以町亂為基礎之Web頁為無狀態·，亦即，在依循目前頁至一新頁上之連結時，新頁對於前一頁一無所知。 URL(Uniform Resource Locator, M URL) 將狀態資訊編碼，可藉以克服此限制，但此方法提供一種非常欠缺效率之解決瓶。此綠之# _触，辅並未提鶴決辦法，供 -3- 本張尺用中國國^揉率（CNS ) ( 210X297^4 ) " "" ----- I---------- ^------------i (請先聞讀背面之注意事項再填寫本頁} 42Π55 A7 B7 經濟部中央樣準局員工消費合作衽印製五、發明説明（2) 將語音辨認能力加至一般之顧客應用。因為並非一種完全程式規劃語言，其實際應用限於Web頁及瀏覽命令。發明之概述根據本發明之旨意，提供一種系統，供將語音辨認能力加至爪哇，其消除或實際減少與先前所開發之系統關聯之缺點及問題。根據本發明之一種實施例，一種供將語音辨認能力加至爪哇之系統包括一語音辨認伺服器，通過一應用程式介面耦合至一爪哇應用。爪哇應用對應用程式介面動態指定一種文法，其將該文法傳遞至語音辨認伺服器。語音辨認伺服器接收文法及一語音輸入。語音辨認伺服器對語音輸入進行語音辨認，並依據該文法產生一結果。應用程式介面將結果傳遞至爪哇應用其依據所接收之結果進行動作《本發明提供重要之技街優點，包括能容易在爪哇應用將狀態資訊編碼。不同於無狀態之HTML，爪哇為完全程式規劃語言，能有效率傳送必要之狀態資訊。而且，jg為爪錢完全程式規劃語言，本發明方便任何爪哇程式應用之語音啟動，並且不限於货吐瀏覽應用6另一優點為爪哇係一種平台獨立語言。如此，如果在背景執行語音飼㈣，本㈣允許相同料在多平台使用語音辨認。這允許顧客程式設計師不管平台相依問題，諸如錄音及語音辨認器特性再一優點為用以語音啟動爪法應用之應用程式介面之變通性。本發明允許無經驗之程式設計師，藉簡單之樣板快速語音啟動應用，同時對較有經驗之程式設計師提供實施更複雜特色之變通性。 I--Ί冒------裝------^訂----丨—瘃 (諳先聞讀背面之注意事項再填寫本頁) -4-

經濟部中央榡隼局員工消費合作社印^. 421755 A7 --------B7 五、發明説明（3) 本發明之又一優點為應用程式介面所依據之顧客/伺服器模型。因為語音辨認伺服器處理大部份處理負載，較輕之負載置於較緩慢翻譯之爪哇應用》再者，顧客/伺服器模型允許顧客應用執行單獨，或許功力較不及伺服器電腦之裝置，而藉以提供變通性。在Web以爪哇程式傳遞時，爪哇之顧客邊性質大為簡化在互動時追蹤對話上下文》再者,直接以爪哇應用傳遞，消除等待響應時之網路延遲" 本發明之又一優點為提供動態修改文法資料結構之内容。語音引擎所遭遇之上下文為不可預測，諸如潘丨覽fforld—Wide_ffeb網址之情形，動態修改為一具有償值之優點·》在此情形，動態修改允許語音辨認伺服器增強語音引擎之語言，以適合所遭遇之應用之上下文。本發明之文法資料結構提供另一優於習知單一規律文法之簡潔優點》附圖之簡要說明為更佳瞭解本發明，請參照附圖，在附圖中：圖1例示一根據本發明之旨意，供方便至一爪哇應用之語音介面之簡化例證性系統；圖2例示一根據本發明之旨意，供方便至一爪哇應用之語音介面之例證性系統；圖3例示一根據本發明之旨意，在語音辨認伺服器與爪哇應用間之例證性介面；以及圖4例示一根據本發明之旨意，供方便至一爪哇應用之語音介面之例證性方法。發明之詳細說明本紙張尺度適用中國國家橾準{ CNS > Α4規格（210X297公釐） --------------裝------訂------故 (請先Μ讀背面之注意事項再填寫本Κ·) 經濟部中央標嗥局員工消費合作社印聚 421755 A7 _______B7 五、發明説明（4 ) 圖1-4中例示本發明之諸較佳實施例相同參考圓號用以指各圖之相同及對應部份。圓1為一供啟動具有語音辨認能力之爪哇之系統之簡化圖示。該系統可包括一爪哇應用（應用）24, 一語音辨認伺服器（speech recognition server,簡稱SRS)18,一伺服器邊應用程式介面（飼服器邊API)218，及一應用邊應用程式介面(應用邊AP0224。伺服器邊API 218及應用邊API 224合稱為API 20〇在操作時，應用24對API 20動態指定一種或多種文法。文法為界定應用24 所將響應之語法及字彙之成組規則。API 20將文法傳遞至SRS18, 其接收並儲存文法。在處理文法後,SRS 18可接收一語音輸入，並且依據爪哇應用24所指定之文法，進行語音辨認並產生結果。迚j 20然後可將結果傳遞至爪哇應用24。爪哇應用24可依據所接收之結果進行適當動作。應用24所進行之動作可為響應應用24所支援之命令而適當採取之任何動作。動作可例如為響應”向上捲動"命令將螢幕向上捲動，響應"退後"命令轉回至前一 Web頁，或響應"示預測"命令顯示天氣預測。所採取之動作依接收結果之特定應用之功能而定。圖2例示一例證性系統1〇,其包括一語音主電腦語音主電腦12可包括SRS 18及應用24-30。概括稱為廉用24之應用24-32,通過API 20與SRS 18交接。爪嗅應用24-28可源自存在於網路34之網路電腦36-38。爪哇應用30可局部存在於語音主電腦 12,存在於記憶體，或作為語音主電腦12之硬連線組件。AH 20 可通過一應用翻譯器22與爪哇應用24-30交接。系統1〇可另包括一介面裝置14,其通過一介面16耗合至語音主電腦12。爪唾本紙張尺度適用中國国家標準（CNS)A4規格（2]〇x297公釐） —is 1^1 -- n I m n* I. ! I j— n* I - I---- X· 、y,l° (諳先閲讀背面之注意事項再填寫本頁) 421755 t A7 B7 五、發明説明（5 ) 應用32可存在於介面裝置14,並通過介面16與API 218連繫。語音主電腦12可為能支援SRS 18及API 20之任何裝置，諸如主機，迷你電膜，工作站，或個人電腦《通常，SRS 18可為將會聽取來自顧客應用之連接，瞭解顧客伺服器協議，並進行應用24所要求動作之任何裝置或應用。在一種較特定實施例，SRS 18可予以整合至一與發言者無關，連續語音，任意字彙辨認系統。與發言者無關指辨認器在引入新發言者時能繼續發生功能，而不必對新發言者語音特質之訓練》支援連續語音指辨認器能發生功能，而在所說之字中間無需停頓。任意之字彙為不受預先界定之字彙大小及/或/¾•容所約束。SRS 18不僅對爪攻應用為特定。其可與依循供顧客與伺服器間通訊之協議之任何應用交接β SRS 18 可配合一 web 瀏覽器諸如 Netscape 或 Microsof tExplorer 使用，以支援供與world-Wide-Web語音互動之特定特色。除了在與fforld-Wide-Web互動時提供若干優點外，SRS 18可使用作為供各種其他多媒體目的之語音辨認伺服器。其中有通過書報亭之資訊存取，語音驅動之互動式多媒體呈現，互動式訓練及修理手冊之語音引導，以及通過Web之電視整合。經濟部中央標率局貝工消费合作社印製 --1 - i··- - n .^1 I I * — - - si - - -I- - -I - I I -I (諳先閲讀背面之注意事項再填寫本頁} 應用程式介面20可包括一組常式，命令，資料結構，虛擬及其他功能，虛擬及其他功能呼叫，資料定義，以及控制SRS 18之一種或 .多種操作之其他變數。API 20包括伺服器邊API 218及應用邊API 224-232,概括稱作API 224 ^伺服器邊API 218可包括控制SRS 18 之操作所必要之大多數代碼。應用邊224包括特定之代碼線，其方便SRS 18與應用24間之互動。伺服器邊Ap〗218及應用邊 API 224集合形成API 20。API 20允許特定應用所獨有之文法本紙張财關家料（;）鐵# {21QX 297公楚） 421755 A7 B7 五、發明説明（規範及指令，以變成SRS 18之一部份。利用此特色，程式設計師可增加一應用邊API，藉以語音啟動任何爪哇應用，以方便SRS 18 與應用間之互動。在本案實施例應用24_32巳藉分別將其以應用邊API 224-232編瑪而予以語音啟動。意在作為實例，並且不作為限制下列例證性代碼可用以語音啟動應用24: import javaspeech. //The java speech API package * · * Iiiilic class l^^le extends ijplet isploneats Runeble； Speokable { 〈請先閲讀背面之注意事項再填寫本頁) 經濟部中央標率局員工消費合作社印製

SpeechRecoanizer SR; SRGrananar grammar; • * · SR = new SceechRecognizer(this); if (SR. connect(){ SRGrammar grammar - new SRGrammar(,,blink_grainmar"); graranar.addruieCblink_granDar — > start bliridnk | st)〇p blinking); SR. loadGrammarToRecoqnizer(grainniar); SR. startListeningO; -s- 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公麓） A7 421755 B7 __ 五、發明説明（7 ) public void onSpeechRec〇gnition(SRResult result} ( //sinulated callback that receives the SResult object and is //responsible for its processing } « · * SR. stopListeninqO; SR. disconnectO; 在目的導向之程式規劃，一類別界定屬性，服務，資料結構，常式，或在該類別之其他資訊特徵說明目的，或該類別之情形。在以上之例證性代碼，所使用之諸類別為SpeechRecoanizer，SRResult, 及SRGrammar。SpeechRecoanizer類別控制基本語音辨認操作，諸如建立SRS 18與應用24間之連接，與SRS 18連繫及自SRS 18分開。SRGr_ar類別用以指定文法56。通過淡Grammar,應用24 可增加及替換文法，解除啟用及重新啟用文法，以及在執行應用24 時動態重新載入改變之文法。SRResult類別可包含諸如文法56, 自文法56所辨認之結果58,可信度分數及η-最佳結果及其可信度分數之清單等資訊。為處理供非同步辨認所需要之模擬召回，應用24也可包括一功能〇n-SpeechRecognition,其在已收到辨認結果58時自動予以呼叫。以上所說明之例證性代碼，例示一種以極簡單樣板語音啟動應 -9 ^張尺度通用中國國家標準（CNS ) Μ^ϋ〇·χ297公楚） " -- (請先閱讀背面之注項再填寫本頁) 裝. ，.訂經滴部中央標準局員工消费合作社印製

T 經濟部中央標隼局負工消費合作社印製 421755 A7 ______B7 _ 五、發明説明（8 ) ~ 用24之方法。例證性代碼之簡明性提供允許無經驗者語音辨認以最小工夫語音啟動應用之優點e API 20提供支援較有經驗之程式設計師所可能希望之更先進語音辨認能力之另一優點。應用24可為適合爪哇程式規割語言之任何應用。意在作為資例，並且不作為限制，應用24可為一電腦排行程式，電雎遊戲程式，或fforld-Wide-ffeb頁。；]\厚為一與平台無關之程式規劃語言β 如此，本發明提供以語音辨認能力啟動顧客應用，而不管語音主電腦12之平台之優點。 API 20可與應用24-32以若干方式交接。在一種特定實施例，一應用30可為語音主電腦12局部所有。例如，應用30可存在於語音主電腦12之硬碟機，存在於一外部磁碟機,諸如軟碟機或光碟機，或硬連線至語音主電腦12。通常，應用30可對語音主電躏12局部存在於適合儲存應用30並方便其在系統10操作之任何媒質。在另一實施例，應用32可存在於一介面裝置14,諸如細胞式電話，個人數位輔助裝置或set-top box。應用32可通過一介面16 與API 20連繫。介面16可包括適合方便介面裝置14與語音主電腦12間連繫之任何有線或無線裝置。在此實施例，因為大部份處理負載係置於語音主電腦12,顧客應用32無需具有供功率及記憶體之大容量。這提供一種對於在否則可能缺少必要記憶體及功率需求之小型低功率介面裝置執行之應用提供語音辨認能力之優點。在又一實施例，應用24-28可存在於網路34之某處。網路34 可包括任何適當有線或無線連結，以方便語音主電腦12與網路本紙張尺度適用中國國家標率（CNS ) Λ4規格（210X297公势） • —I— n I H |策 -訂 (諳先閲讀背面之注意事唄再填轉本頁) 經濟部中央標準局貝工消費合作社印製 42175 5 A7 B7 五、發明説明（9) 電聪36-40間之連繫。例如，網路34可包括公眾交換電話網路，整體服務數位網路（integrated services digital network,簡稱 ISDN),局部區域網路(local area network,簡稱LAN),都會區域網路(metropolitan area network» 簡稱 MAN))，廣域網路(wide area network,簡稱WAN),全球網路諸如world-Wide-Web，或其他專用或交換網路或其他通訊機構《語音主電腦12可通過應用翻譯器22與應用24-30交接》應用翻譯器22可適合利用網路34, 並找到及檢索應用24之任何裝置，諸如瀏覽器或对)1)1討“6\^1·。圖3為根據本發明旨意之語音辨認/司服器18與爪哇應用24~32 間之例證性介面。語音主電腦12支援SRS 18, API 20及一種或多種概括稱作應用24之爪哇應用24-32。SRS 18可包括一可利用文法資料結構52及應用資料結構54之語音引擎50。通常，語音引擎50可為任何適合對語音輸入進行語音辨認之算法。在一特定實施例，如在此項技藝所知，語音引擎50可包括至少三層：一表示聲音模型之Hidden Markov模型層，一任選之字發音層，及一指定預期字順序之語句語法層。通常，文法資料結構52可予以儲存在任何資料儲存裝置，並且應用可操作以接收，儲存及方便檢索文法56。在一特定實施例，如在此項技藝所知,文法資料結構52可為成一種定向非循環式圖形之規律文法（regular grammars in a directed acyclic graph, 簡稱RGDAG)。在RGDAG，在第一文法之終端符號匹配在第二文法之開始符號時，一文法便連接至另一文法。實施RGDAG作為文法資料結構52,允許語音引擎50以RGDAG内之任何次組開始符號開始其搜尋過程。這方便根據所遭遇之應用之上下文，動態修改語 -11 - 本紙張尺度適用中國國家標準< CNS ) A4規格（2丨Ox 297公釐） —--------裳— f讀先閲讀背面之ii意事項再填巧本頁) :tx A7 B7 421755 五、發明説明（10) 音引擎之語言。 1^1 —II - · ·. m I -1 I -1*^-I I I Hr I - - II I-» '^=0. (請先閲讀背面之注意事項再填寫本頁) 在語音引擎50所遭遇之上下文為不可預測，諸如瀏覽World-Wide-Web網址之情形，動態修改RGDAG為語音辨認伺服器18之一項優點。在此等情形，動態修改文法，允許語音辨認伺服器18増強語音引擎50之語言，以適合所遭遇之應用之上下文。RGDAG結構方便較之習知單一規律文法更有效率之文法儲存，而提供另一簡潔之優點。應用資料結構54追縱應用24之狀態。應用資料結構54可指定應用24為"現用"或"非現用，"為•，聽取”或"不聽取”，或為，，執行 ”或"不執行”。另外，應用資料結構54可標記每一文法為"啟動/ 或”中止"，藉以追蹤與每一應用關聯之文法之狀態。以此方式，語音辨認飼服器18可追蹤及支援多顧客應用之同時操作。應用資料結構可另啟動應用24,以接收一語音焦點。可能必要一語音焦點以解決很多各聽取來自其本身文法之結果之應用間之爭用β 對應用24賦予一語音焦點，應用24可防止語音引擎50發出結果 58至其他聽取應用c以此方式預計之應用，應用以，接收結果诏。經濟部中央橾準局員工消費合作社印製 SRS 18也可包括API 20之祠服器邊部份，伺服器邊API 218。伺服器邊API 218可包括一語法分析器6〇〇語法分析器60可接收來自語音U擎50之結果58，語法分析結果並將語法分析之結果61傳遞至應用24。在操作時，語法分析器60可允許顧客24 扎疋文法56内之某些非終端。語法分析器6〇僅使對應於指定非終端之結果58之部份轉回至應用24。例如，文法56可成下列形式：<ARTICLE> ^cADJECTIvg〉 <N〇UN> <ADVERB> <VERB> 〈PREPOSITIdALP鹏E>;語法储_ 6G可析取名雛動詞為語 -12- 公楚)~--- 經濟部中央橾準局員工消費合作社印製 421755 ____ 五'發明说明（„ ) 法分析結果61，並且僅將語法分析之結果61傳至應用24。這允許應用24忽略非必要之資訊β語法分析器60之一項優點，為其無需應用24重新語法分析結果58,其可能為一項麻煩之複雜文法過程。伺服器邊API 218可另包括一參變器(parametizer) 62。參變器62可接收一來自應用24之參數64,並將參數64傳遞至語音引擎50。語音引擎50可接收參數64並相應修改其操作ο參數64 可為語音引擎50之函數中之任何變數，諸如終點參數，其指定一足以確定一語音表達結束之無聲持續期間《也請參照圖4,囷示一供語音啟動應用24之例證性方法。該方法在步驟100開始，在此步驟在應用24與SRS 18之間建立連接。一經作成連接，在步称102, SRS 18將應用24加至應用資料結構54 中之現用應用之清單，並周期性檢查來自應用24之命令。應用24 然後可在步驟104動態指定文法56至API 20。文法56可存在於任何位置或狀態，允許應用24利用及指定其至API 20。例如，文法56可在應用24之爪哇代碼内存在於一文字串，存在於由應用 24所指定之檔案，或存在於一由應用24所指定之統一資源定位器 (URL)。 ° 另外在步驟104,應用24可指定參數64。如以上所說明，參數可對應於#音引擎50之任何變數。API 20然後在步驟將文法56及參數64傳遞至SRS 18。也在步驟1〇4,應用24可指定一已傳遞至SRS 18之文法為”啟動"或"中止。” SRS 18在步驟1〇6接收文法56時，其將文法56加至一與文法資料結構52中之應用24關聯之文法之清單。也在步驟现岔μ -13- 本紙張尺度通國國家標準（CNS) Μ規格{210χ 297公G ' ——-- {請先閲讀背面之注意事項再填寫本頁) 裝. 經濟部中央標準局貝工消費合作杜印製 421755 at ___ Β7 五、發明説明（12) 可如應用24所指定，啟動或中止文法資料結構52中之文法。另夕卜，SRS 18可根據參數64之值調整語音引擎5〇之參數。如果應用24在步驟107未"聽取"，其在步驟1〇8通過μ 20 將一聽取信號傳遞至SRS18。在步驟1〇9接收"聽取，'信號時，SRS 19將應用24加至應用資料結構54中之聽取應用之清單。應用一經標記為”聽取"，SRS18可在步驟U0對應用24賦予一語音焦點。如以上所說明，語音焦點防止語音引擎50發出結果58至其他聽取應用。在步驟111，語音引擎50可接收語音輸入66,並在步驟112進行語音辨認，及依據語音輸入66產生結果58 〇語法分析器60可在步驟113接收結果58,並語法分析結果58 »語法分析器60然後可在步驟114將語法分析之結果61傳遞至應用2‘在步驟116 接收結果58,或語法分析之結果61時，應用24可依據所接收之結果進行動作》應用24可在步驟118指定另外之文法及/或參數，及/或啟動或中止文法資料結構52中之文法。要不然，應用24可在步黎^20 將一"停止聽取"信號傳遞至API 20,藉以暫時中斷與SRS 18之連繫。在步驟121接收"停止聽取信號時’ SRS 18自應用資料結構54中之聽取應用之清單除去應用24。在步驟122,應用24 可發出另外之文法及/或將一，，聽取”信號傳遞至仙〗2〇，藉以恢復與SRS 18連繫°要不然，應用24可在步驟124將一'，分開"信號傳遞至API 20,藉以终止與SRS 18連繫。在步驟126接收”分開 •'信號時，SRS 18自應用資料結構除去應用24。雖然本發明及其優點業巳予以詳細說明但請予瞭解其中可作 -14 - ⑤尺度適用現格（210x21^~~---~~~ (請先閱讀背面之注意事項再填寫本頁) 裝' 訂 421755 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（13) 成各種變化，替代及更改，而不偏離如後附申請專利範圍所界定之本發明之精神及範圍。 -15- (請先閲讀背面之注意事項再填寫本頁) 裝· 本紙張尺度適用中國國家標準（CNS > A4规格（210X297公釐）

Claims

4 w W ^21755 Λ8 BS C8 D8 經濟部中央揉率局—工消費合作社印製申請專利範園種增強爪哇語音介面之系一語音辨認伺服器，可文法及一語音輸入，該語音辨認伺服器另可操作響應語音輸入而進行語音辨認，及依據文法產生一結果；至少一爪哇應用，可操作動態指定文法以接收結果,並依據結果進行動作；以及一應用程式介面，可操作接收文法，以將文法傳遞至語音辨認飼服器，並響應語音辨認而接收來自語音辨認伺服器之結果，並將結果傳遞至爪啥應用。 2.根據申請專利範圍第1項之系統其中語音辨認伺服器包含：一語音引擎，可操作進行語音辨認;以及一文法資料結構，可操作接收並儲存文法。 3·根據申請專利範圍第1項之系統其中語音辨認伺服器包含：一語音引擎，可操作進行語音辨認並產生結果；一文法資料結構，可操作接收並儲存文法；一應用資料結構，可操作追蹤爪哇應用之狀態，及追縱與爪哇應用關聯之文法之狀態。 4. 根據申請專利範圍第3項之系統其中應用資料結構包含一語音焦點，可操作限制結果傳遞至一預計之爪哇應用。 5. 根據申請專利範圍第1項之系統，其中語音辨認伺服器包含：一語音引擎，可操作進行語音辨認並產生結果；一應用資料結構，可操作追蹤爪哇應用之狀態，及追蹤與爪嗅應用關聯之文法之狀態；以及 —組成定向非循環式圖形之規律文法，可操作接收文法並 -16- 本紙張纽適用中國國家插準（CNS)八规格（2l〇x297公釐 ----------^--.!---、1Τ------^ (請先W讀背面之注意事項再填寫本X) 421755 A8 B8 C8 Οδ 申請專利範圍響應所接收之文法動態修改該組成定向非循環式圖形之規律文法之内容。 6·根據申請專利範圍第5項之系统，其中應用資料結構包含一語音焦點，可操作限制結果傳遞至預計之爪哇應用。 7‘根據申請專利範圍第1項之系統，其中應用程式介面包含一伺服器邊應用程式介面及一應用邊應用程式介面。 8. 根據申請專利範圍第1項之系統，其中應用程式介面包含：一伺服器邊應用程式介面及一應用邊應用程式介面；其中伺服器邊應用程式介面包含一語法分析器，可操作接收來自語音辨認伺服器之結果，語法分析該結果,並產生一語法分析之結果，其中伺服器邊應用程式介面另可操作將語法分析之結果傳遞至爪哇應用。 9. 根據申請專利範圍第1項之系統其中應用程式介面包含：一伺服器邊應用程式介面及一應用邊應用程式介面；其中伺服器邊應用程式介面包含一參變器，可操作接收一來自爪唾應用之參數值，並根據所接收之參數值修改語音辨認伺服器之參數。 10·根據申請專利範圍第I項之系統其中語音辨認伺服器包含經濟部中央榇準局舅工消費合作社印掣一有任意大小之字彙，其中語音辨認伺服器為與發言者無關並支援連續語音^ 11. 一種增強爪哇語音介面之方法該方法包含下列步驟：在一語音辨認伺服器與一爪哇應用之間建立連繫；將一文法傳遞至語音辨認伺服器；響應一語音輸入進行語音辨認，並依據文法產生一結果； -17· 本紙張尺度適i中mrn^ #_V 婦 A 1/ Λ 釐公 7 9 2 421755 經濟部中央標隼局貝工消費合作社印製 A8 哲 D8六、申請專利範圍以及將結果傳遞至爪哇應用。 12. 根據申請專利範圍第11項之方法’其中在語音辨認伺服器與爪哇應用之間建立連繫之步驟包含將爪哇應用加至—應用資結構之步驟。， 13. 根據申請專利範圍第11項之方法，其中將一文法傳遞至語音辨認伺服器之步驟包含下列步驟：對應用程式介面指定文法；將文法加至一文法資料結構，·以及蜜應文法之增加而動態修改文法資料結構C 14. 根據申請專利範圍第11項之方法，另包含將另一文法傳遞至語音辨認祠服器之步称。 15. 根據申請專利範圍第11項之方法，另包含在將結果傳遞至爪哇應用前對其語法分析之步驟。 16. 根據申請專利範圍第11項之方法另包含下列步驟：接收一參數值；以及依據該參數值修改語音辨認伺服器之參數。 π·根據申請專利範圍第11項之方法，另包含對一預計爪哇應用賦予一語音焦點之步驟。 18.—種增強爪哇應用語音介面之方法，該方法包含下列步驟：在一語音辨認伺服器與一爪哇應用之間建立連繫；對應用程式介面指定一文法；將文法傳遞至語音辨認伺服器；響應所接收之文法動態修改一組成定向非循環式圖形之 -18- 本紙張尺度顧中國國家縣（CNS >从樣（21Gx297公赛） f請先閑讀背面之注意事項再填寫本頁j .裝_ -訂. 421755 ί88 C8 - ^ _DS_;_ κ、申請專利範圍 &律文法；響應一語音輸入進行語音辨認，並依據文法產生一結果; 以及將結果傳遞至爪哇應用。 U·根據申請專利範圍第18項之方法另包含:對語音辨認伺服器指定一參數值，及依據所接收之參數值修改語音辨認伺服器之參數之步驟；對語音辨認伺服器所產生之結果語法分析，產生一語法分析之結果及將語法分析之結果傳遞至爪哇應用之步驊；以及對爪哇應用賦予一語音焦點之步驟。 20·根據申請專利範圍第18項之方法，另包含下列步驟：追鞭許多爪哇應用之狀態；以及追縱一與爪哇應用關聯之文法之狀態β ί I n n I m. n n n 訂 (請先閲讀背面之注$項再填寫本i ) 經濟部中央標準局員工消費合作社印繁 -19- 本紙張纽適用中國國家標準（CNS )从祕（21{);<297公羡）