TW421755B - System and method for adding speech recognition capabilities to java - Google Patents

System and method for adding speech recognition capabilities to java Download PDF

Info

Publication number
TW421755B
TW421755B TW087100099A TW87100099A TW421755B TW 421755 B TW421755 B TW 421755B TW 087100099 A TW087100099 A TW 087100099A TW 87100099 A TW87100099 A TW 87100099A TW 421755 B TW421755 B TW 421755B
Authority
TW
Taiwan
Prior art keywords
application
grammar
java
voice
speech recognition
Prior art date
Application number
TW087100099A
Other languages
English (en)
Inventor
Charles T Hemphill
C Scott Baker
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Application granted granted Critical
Publication of TW421755B publication Critical patent/TW421755B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Description

經濟部中央標準局員工消費合作社印製 A 2 Π 5 5 A7 _______B7 五、發明説明(1〉 發明之技術領域 本發明係概括關於資料通訊及處理之領域,尤指一種供將語音 辨認能力加至爪哇之系統及方法。 發明之背景 電腦使用者久巳希望個人軟體應用能響應口頭命令》允許使用 者與使用語音作為輸入媒介之軟體應用互動,提供一種較之例如 鍵盤,滑鼠或觸控螢幕輸入裝置更自然之介面。語音輪入提供方 便不用手操作之優點。除了允許使用者照應其他事情,同時與軟 體應用互動外,不用手操作使行動不便之使用者可利用電膘。語 音輸入提供避免拼音及語法誤差問題,及必須捲動舆其他輪入方 法關聯之大型清單之另外優點。 一種提供語音辨認能力供顧客應用之方法,為以HXdmhypgp text markup language)為基礎之精靈頁概念。精靈頁為全球資訊 網(WorltHyide-ffeb,簡稱ffeb)頁,内含一至該頁之文法特定之連 結,並能翻譯該文法之結果。精靈頁之著者界定該頁將會對其窨 應之文法,將一連結嵌入至該精靈頁内之文法並就預期之口頭輸 入型式,對使用者產生視覺提示。語音引擎遭遇精靈頁其結合文 法,使其能響應語音輸入,並將結果轉回至精靈頁。精靈頁翻譯 該結果並相應響應。 此方法之一項缺點,為以町亂為基礎之Web頁為無狀態·,亦即, 在依循目前頁至一新頁上之連結時,新頁對於前一頁一無所知。 URL(Uniform Resource Locator, M URL) 將狀態資訊編碼,可藉以克服此限制,但此方法提供一種非常欠缺 效率之解決瓶。此綠之# _触,辅並未提鶴決辦法,供 -3- 本張尺用中國國^揉率(CNS ) ( 210X297^4 ) " "" ----- I---------- ^------------i (請先聞讀背面之注意事項再填寫本頁} 42Π55 A7 B7 經濟部中央樣準局員工消費合作衽印製 五、發明説明(2) 將語音辨認能力加至一般之顧客應用。因為並非一種完全 程式規劃語言,其實際應用限於Web頁及瀏覽命令。 發明之概述 根據本發明之旨意,提供一種系統,供將語音辨認能力加至爪哇, 其消除或實際減少與先前所開發之系統關聯之缺點及問題。 根據本發明之一種實施例,一種供將語音辨認能力加至爪哇之 系統包括一語音辨認伺服器,通過一應用程式介面耦合至一爪哇 應用。爪哇應用對應用程式介面動態指定一種文法,其將該文法 傳遞至語音辨認伺服器。語音辨認伺服器接收文法及一語音輸 入。語音辨認伺服器對語音輸入進行語音辨認,並依據該文法產 生一結果。應用程式介面將結果傳遞至爪哇應用其依據所接收 之結果進行動作《 本發明提供重要之技街優點,包括能容易在爪哇應用將狀態資 訊編碼。不同於無狀態之HTML,爪哇為完全程式規劃語言,能有 效率傳送必要之狀態資訊。而且,jg為爪錢完全程式規劃語言, 本發明方便任何爪哇程式應用之語音啟動,並且不限於货吐瀏覽 應用6另一優點為爪哇係一種平台獨立語言。如此,如果在背景 執行語音飼㈣,本㈣允許相同料在多平台使用語音辨認。 這允許顧客程式設計師不管平台相依問題,諸如錄音及語音辨認 器特性再一優點為用以語音啟動爪法應用之應用程式介面之變 通性。 本發明允許無經驗之程式設計師,藉簡單之樣板快速語音啟 動應用,同時對較有經驗之程式設計師提供實施更複雜特色之變 通性。 I--Ί冒------裝------^訂----丨—瘃 (諳先聞讀背面之注意事項再填寫本頁) -4-
經濟部中央榡隼局員工消費合作社印^. 421755 A7 --------B7 五、發明説明(3) 本發明之又一優點為應用程式介面所依據之顧客/伺服器模 型。因為語音辨認伺服器處理大部份處理負載,較輕之負載置於 較緩慢翻譯之爪哇應用》再者,顧客/伺服器模型允許顧客應用執 行單獨,或許功力較不及伺服器電腦之裝置,而藉以提供變通性。 在Web以爪哇程式傳遞時,爪哇之顧客邊性質大為簡化在互動時 追蹤對話上下文》再者,直接以爪哇應用傳遞,消除等待響應時之 網路延遲" 本發明之又一優點為提供動態修改文法資料結構之内容。語音 引擎所遭遇之上下文為不可預測,諸如潘丨覽fforld—Wide_ffeb網址 之情形,動態修改為一具有償值之優點·》在此情形,動態修改允 許語音辨認伺服器增強語音引擎之語言,以適合所遭遇之應用之 上下文。本發明之文法資料結構提供另一優於習知單一規律文法 之簡潔優點》 附圖之簡要說明 為更佳瞭解本發明,請參照附圖,在附圖中: 圖1例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之簡化例證性系統; 圖2例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之例證性系統; 圖3例示一根據本發明之旨意,在語音辨認伺服器與爪哇應用 間之例證性介面;以及 圖4例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之例證性方法。 發明之詳細說明 本紙張尺度適用中國國家橾準{ CNS > Α4規格(210X297公釐) --------------裝------訂------故 (請先Μ讀背面之注意事項再填寫本Κ·) 經濟部中央標嗥局員工消費合作社印聚 421755 A7 _______B7 五、發明説明(4 ) 圖1-4中例示本發明之諸較佳實施例相同參考圓號用以指 各圖之相同及對應部份。 圓1為一供啟動具有語音辨認能力之爪哇之系統之簡化圖示。 該系統可包括一爪哇應用(應用)24, 一語音辨認伺服器(speech recognition server,簡稱SRS)18,一伺服器邊應用程式介面(飼 服器邊API)218,及一應用邊應用程式介面(應用邊AP0224。伺 服器邊API 218及應用邊API 224合稱為API 20〇在操作時, 應用24對API 20動態指定一種或多種文法。文法為界定應用24 所將響應之語法及字彙之成組規則。API 20將文法傳遞至SRS18, 其接收並儲存文法。在處理文法後,SRS 18可接收一語音輸入,並 且依據爪哇應用24所指定之文法,進行語音辨認並產生結果。迚j 20然後可將結果傳遞至爪哇應用24。爪哇應用24可依據所接收 之結果進行適當動作。 應用24所進行之動作可為響應應用24所支援之命令而適當採 取之任何動作。動作可例如為響應”向上捲動"命令將螢幕向上捲 動,響應"退後"命令轉回至前一 Web頁,或響應"示預測"命令顯示 天氣預測。所採取之動作依接收結果之特定應用之功能而定。 圖2例示一例證性系統1〇,其包括一語音主電腦語音主電 腦12可包括SRS 18及應用24-30。概括稱為廉用24之應用24-32,通過API 20與SRS 18交接。爪嗅應用24-28可源自存在於網 路34之網路電腦36-38。爪哇應用30可局部存在於語音主電腦 12,存在於記憶體,或作為語音主電腦12之硬連線組件。AH 20 可通過一應用翻譯器22與爪哇應用24-30交接。系統1〇可另包 括一介面裝置14,其通過一介面16耗合至語音主電腦12。爪唾 本紙張尺度適用中國国家標準(CNS)A4規格(2]〇x297公釐) —is 1^1 -- n I m n* I. ! I j— n* I - I---- X· 、y,l° (諳先閲讀背面之注意事項再填寫本頁) 421755 t A7 B7 五、發明説明(5 ) 應用32可存在於介面裝置14,並通過介面16與API 218連繫。 語音主電腦12可為能支援SRS 18及API 20之任何裝置,諸如 主機,迷你電膜,工作站,或個人電腦《通常,SRS 18可為將會聽取 來自顧客應用之連接,瞭解顧客伺服器協議,並進行應用24所要 求動作之任何裝置或應用。在一種較特定實施例,SRS 18可予以 整合至一與發言者無關,連續語音,任意字彙辨認系統。與發言者 無關指辨認器在引入新發言者時能繼續發生功能,而不必對新發 言者語音特質之訓練》支援連續語音指辨認器能發生功能,而在 所說之字中間無需停頓。任意之字彙為不受預先界定之字彙大 小及/或/¾•容所約束。SRS 18不僅對爪攻應用為特定。其可與依 循供顧客與伺服器間通訊之協議之任何應用交接β SRS 18 可配合一 web 瀏覽器諸如 Netscape 或 Microsof tExplorer 使用,以支援供與world-Wide-Web語音互動之特定特色。除了在 與fforld-Wide-Web互動時提供若干優點外,SRS 18可使用作為供 各種其他多媒體目的之語音辨認伺服器。其中有通過書報亭之資 訊存取,語音驅動之互動式多媒體呈現,互動式訓練及修理手冊之 語音引導,以及通過Web之電視整合。 經濟部中央標率局貝工消费合作社印製 --1 - i··- - n .^1 I I * — - - si - - -I- - -I - I I -I (諳先閲讀背面之注意事項再填寫本頁} 應用程式介面20可包括一組常式,命令,資料結構,虛擬及其他 功能,虛擬及其他功能呼叫,資料定義,以及控制SRS 18之一種或 .多種操作之其他變數。API 20包括伺服器邊API 218及應用邊API 224-232,概括稱作API 224 ^伺服器邊API 218可包括控制SRS 18 之操作所必要之大多數代碼。應用邊224包括特定之代碼線, 其方便SRS 18與應用24間之互動。伺服器邊Ap〗218及應用邊 API 224集合形成API 20。API 20允許特定應用所獨有之文法 本紙張财關家料(;)鐵# {21QX 297公楚) 421755 A7 B7 五 、發明説明( 規範及指令,以變成SRS 18之一部份。利用此特色,程式設計師 可增加一應用邊API,藉以語音啟動任何爪哇應用,以方便SRS 18 與應用間之互動。在本案實施例應用24_32巳藉分別將其以應 用邊API 224-232編瑪而予以語音啟動。 意在作為實例,並且不作為限制下列例證性代碼可用以語音啟 動應用24: import javaspeech. //The java speech API package * · * Iiiilic class l^^le extends ijplet isploneats Runeble; Speokable { 〈請先閲讀背面之注意事項再填寫本頁) 經濟部中央標率局員工消費合作社印製
SpeechRecoanizer SR; SRGrananar grammar; • * · SR = new SceechRecognizer(this); if (SR. connect(){ SRGrammar grammar - new SRGrammar(,,blink_grainmar"); graranar.addruieCblink_granDar — > start bliridnk | st)〇p blinking); SR. loadGrammarToRecoqnizer(grainniar); SR. startListeningO; -s- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公麓) A7 421755 B7 __ 五、發明説明(7 ) public void onSpeechRec〇gnition(SRResult result} ( //sinulated callback that receives the SResult object and is //responsible for its processing } « · * SR. stopListeninqO; SR. disconnectO; 在目的導向之程式規劃,一類別界定屬性,服務,資料結構,常式, 或在該類別之其他資訊特徵說明目的,或該類別之情形。在以上 之例證性代碼,所使用之諸類別為SpeechRecoanizer,SRResult, 及SRGrammar。SpeechRecoanizer類別控制基本語音辨認操作,諸 如建立SRS 18與應用24間之連接,與SRS 18連繫及自SRS 18分 開。SRGr_ar類別用以指定文法56。通過淡Grammar,應用24 可增加及替換文法,解除啟用及重新啟用文法,以及在執行應用24 時動態重新載入改變之文法。SRResult類別可包含諸如文法56, 自文法56所辨認之結果58,可信度分數及η-最佳結果及其可信 度分數之清單等資訊。為處理供非同步辨認所需要之模擬召回,應 用24也可包括一功能〇n-SpeechRecognition,其在已收到辨認 結果58時自動予以呼叫。 以上所說明之例證性代碼,例示一種以極簡單樣板語音啟動應 -9 ^張尺度通用中國國家標準(CNS ) Μ^ϋ〇·χ297公楚) " -- (請先閱讀背面之注項再填寫本頁) 裝. ,.訂 經滴部中央標準局員工消费合作社印製
T 經濟部中央標隼局負工消費合作社印製 421755 A7 ______B7 _ 五、發明説明(8 ) ~ 用24之方法。例證性代碼之簡明性提供允許無經驗者語音辨認 以最小工夫語音啟動應用之優點e API 20提供支援較有經驗之程 式設計師所可能希望之更先進語音辨認能力之另一優點。 應用24可為適合爪哇程式規割語言之任何應用。意在作為資 例,並且不作為限制,應用24可為一電腦排行程式,電雎遊戲程式, 或fforld-Wide-ffeb頁。;]\厚為一與平台無關之程式規劃語言β 如此,本發明提供以語音辨認能力啟動顧客應用,而不管語音主電 腦12之平台之優點。 API 20可與應用24-32以若干方式交接。在一種特定實施例, 一應用30可為語音主電腦12局部所有。例如,應用30可存在 於語音主電腦12之硬碟機,存在於一外部磁碟機,諸如軟碟機或 光碟機,或硬連線至語音主電腦12。通常,應用30可對語音主電 躏12局部存在於適合儲存應用30並方便其在系統10操作之任 何媒質。 在另一實施例,應用32可存在於一介面裝置14,諸如細胞式電 話,個人數位輔助裝置或set-top box。應用32可通過一介面16 與API 20連繫。介面16可包括適合方便介面裝置14與語音主 電腦12間連繫之任何有線或無線裝置。在此實施例,因為大部份 處理負載係置於語音主電腦12,顧客應用32無需具有供功率及記 憶體之大容量。這提供一種對於在否則可能缺少必要記憶體及功 率需求之小型低功率介面裝置執行之應用提供語音辨認能力之優 點。 在又一實施例,應用24-28可存在於網路34之某處。網路34 可包括任何適當有線或無線連結,以方便語音主電腦12與網路 本紙張尺度適用中國國家標率(CNS ) Λ4規格(210X297公势) • —I— n I H |策 -訂 (諳先閲讀背面之注意事唄再填轉本頁) 經濟部中央標準局貝工消費合作社印製 42175 5 A7 B7 五、發明説明(9) 電聪36-40間之連繫。例如,網路34可包括公眾交換電話網路, 整體服務數位網路(integrated services digital network,簡稱 ISDN),局部區域網路(local area network,簡稱LAN),都會區 域網路(metropolitan area network» 簡稱 MAN)),廣域網路(wide area network,簡稱WAN),全球網路諸如world-Wide-Web,或其他 專用或交換網路或其他通訊機構《語音主電腦12可通過應用翻 譯器22與應用24-30交接》應用翻譯器22可適合利用網路34, 並找到及檢索應用24之任何裝置,諸如瀏覽器或对)1)1討“6\^1·。 圖3為根據本發明旨意之語音辨認/司服器18與爪哇應用24~32 間之例證性介面。語音主電腦12支援SRS 18, API 20及一種或多 種概括稱作應用24之爪哇應用24-32。SRS 18可包括一可利用 文法資料結構52及應用資料結構54之語音引擎50。通常,語音 引擎50可為任何適合對語音輸入進行語音辨認之算法。在一特 定實施例,如在此項技藝所知,語音引擎50可包括至少三層:一表 示聲音模型之Hidden Markov模型層,一任選之字發音層,及一指 定預期字順序之語句語法層。 通常,文法資料結構52可予以儲存在任何資料儲存裝置,並且 應用可操作以接收,儲存及方便檢索文法56。在一特定實施例,如 在此項技藝所知,文法資料結構52可為成一種定向非循環式圖形 之規律文法(regular grammars in a directed acyclic graph, 簡稱RGDAG)。在RGDAG,在第一文法之終端符號匹配在第二文法 之開始符號時,一文法便連接至另一文法。實施RGDAG作為文法 資料結構52,允許語音引擎50以RGDAG内之任何次組開始符號開 始其搜尋過程。這方便根據所遭遇之應用之上下文,動態修改語 -11 - 本紙張尺度適用中國國家標準< CNS ) A4規格(2丨Ox 297公釐) —--------裳— f讀先閲讀背面之ii意事項再填巧本頁) :tx A7 B7 421755 五、發明説明(10) 音引擎之語言。 1^1 —II - · ·. m I -1 I -1*^-I I I Hr I - - II I-» '^=0. (請先閲讀背面之注意事項再填寫本頁) 在語音引擎50所遭遇之上下文為不可預測,諸如瀏覽World-Wide-Web網址之情形,動態修改RGDAG為語音辨認伺服器18之一 項優點。在此等情形,動態修改文法,允許語音辨認伺服器18増 強語音引擎50之語言,以適合所遭遇之應用之上下文。RGDAG結 構方便較之習知單一規律文法更有效率之文法儲存,而提供另一 簡潔之優點。 應用資料結構54追縱應用24之狀態。應用資料結構54可指 定應用24為"現用"或"非現用,"為•,聽取”或"不聽取”,或為,,執行 ”或"不執行”。另外,應用資料結構54可標記每一文法為"啟動/ 或”中止",藉以追蹤與每一應用關聯之文法之狀態。以此方式, 語音辨認飼服器18可追蹤及支援多顧客應用之同時操作。應用 資料結構可另啟動應用24,以接收一語音焦點。可能必要一語音 焦點以解決很多各聽取來自其本身文法之結果之應用間之爭用β 對應用24賦予一語音焦點,應用24可防止語音引擎50發出結果 58至其他聽取應用c以此方式預計之應用,應用以,接收結果诏。 經濟部中央橾準局員工消費合作社印製 SRS 18也可包括API 20之祠服器邊部份,伺服器邊API 218。 伺服器邊API 218可包括一語法分析器6〇〇語法分析器60可接 收來自語音U擎50之結果58,語法分析結果並將語法分析之結 果61傳遞至應用24。在操作時,語法分析器60可允許顧客24 扎疋文法56内之某些非終端。語法分析器6〇僅使對應於指定非 終端之結果58之部份轉回至應用24。例如,文法56可成下列形 式:<ARTICLE> ^cADJECTIvg〉 <N〇UN> <ADVERB> <VERB> 〈PREPOSITIdALP鹏E>;語法储_ 6G可析取名雛動詞為語 -12- 公楚)~--- 經濟部中央橾準局員工消費合作社印製 421755 ____ 五'發明说明(„ ) 法分析結果61,並且僅將語法分析之結果61傳至應用24。這允 許應用24忽略非必要之資訊β語法分析器60之一項優點,為其 無需應用24重新語法分析結果58,其可能為一項麻煩之複雜文 法過程。 伺服器邊API 218可另包括一參變器(parametizer) 62。參變 器62可接收一來自應用24之參數64,並將參數64傳遞至語音引 擎50。語音引擎50可接收參數64並相應修改其操作ο參數64 可為語音引擎50之函數中之任何變數,諸如終點參數,其指定一 足以確定一語音表達結束之無聲持續期間《 也請參照圖4,囷示一供語音啟動應用24之例證性方法。該方 法在步驟100開始,在此步驟在應用24與SRS 18之間建立連接。 一經作成連接,在步称102, SRS 18將應用24加至應用資料結構54 中之現用應用之清單,並周期性檢查來自應用24之命令。應用24 然後可在步驟104動態指定文法56至API 20。文法56可存在於 任何位置或狀態,允許應用24利用及指定其至API 20。例如,文 法56可在應用24之爪哇代碼内存在於一文字串,存在於由應用 24所指定之檔案,或存在於一由應用24所指定之統一資源定位器 (URL)。 ° 另外在步驟104,應用24可指定參數64。如以上所說明,參數 可對應於#音引擎50之任何變數。API 20然後在步驟將文 法56及參數64傳遞至SRS 18。也在步驟1〇4,應用24可指定一 已傳遞至SRS 18之文法為”啟動"或"中止。” SRS 18在步驟1〇6接收文法56時,其將文法56加至一與文法 資料結構52中之應用24關聯之文法之清單。也在步驟现岔μ -13- 本紙張尺度通國國家標準(CNS) Μ規格{210χ 297公G ' ——-- {請先閲讀背面之注意事項再填寫本頁) 裝. 經濟部中央標準局貝工消費合作杜印製 421755 at ___ Β7 五、發明説明(12) 可如應用24所指定,啟動或中止文法資料結構52中之文法。另 夕卜,SRS 18可根據參數64之值調整語音引擎5〇之參數。 如果應用24在步驟107未"聽取",其在步驟1〇8通過μ 20 將一聽取信號傳遞至SRS18。在步驟1〇9接收"聽取,'信號時,SRS 19將應用24加至應用資料結構54中之聽取應用之清單。應用一 經標記為”聽取",SRS18可在步驟U0對應用24賦予一語音焦點。 如以上所說明,語音焦點防止語音引擎50發出結果58至其他聽 取應用。 在步驟111,語音引擎50可接收語音輸入66,並在步驟112進 行語音辨認,及依據語音輸入66產生結果58 〇語法分析器60可 在步驟113接收結果58,並語法分析結果58 »語法分析器60然 後可在步驟114將語法分析之結果61傳遞至應用2‘在步驟116 接收結果58,或語法分析之結果61時,應用24可依據所接收之結 果進行動作》 應用24可在步驟118指定另外之文法及/或參數,及/或啟動或 中止文法資料結構52中之文法。要不然,應用24可在步黎^20 將一"停止聽取"信號傳遞至API 20,藉以暫時中斷與SRS 18之連 繫。在步驟121接收"停止聽取信號時’ SRS 18自應用資料 結構54中之聽取應用之清單除去應用24。在步驟122,應用24 可發出另外之文法及/或將一,,聽取”信號傳遞至仙〗2〇,藉以恢復 與SRS 18連繫°要不然,應用24可在步驟124將一',分開"信號 傳遞至API 20,藉以终止與SRS 18連繫。在步驟126接收”分開 •'信號時,SRS 18自應用資料結構除去應用24。 雖然本發明及其優點業巳予以詳細說明但請予瞭解其中可作 -14 - ⑤尺度適用現格(210x21^~~---~~~ (請先閱讀背面之注意事項再填寫本頁) 裝' 訂 421755 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(13) 成各種變化,替代及更改,而不偏離如後附申請專利範圍所界定之 本發明之精神及範圍。 -15- (請先閲讀背面之注意事項再填寫本頁) 裝· 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐)

Claims (1)

  1. 4 w W ^21755 Λ8 BS C8 D8 經濟部中央揉率局—工消費合作社印製 申請專利範園 種增強爪哇語音介面之系 一語音辨認伺服器,可文法及一語音輸入,該語 音辨認伺服器另可操作響應語音輸入而進行語音辨認,及依據 文法產生一結果; 至少一爪哇應用,可操作動態指定文法以接收結果,並依據 結果進行動作;以及 一應用程式介面,可操作接收文法,以將文法傳遞至語音辨 認飼服器,並響應語音辨認而接收來自語音辨認伺服器之結果, 並將結果傳遞至爪啥應用。 2.根據申請專利範圍第1項之系統其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認;以及 一文法資料結構,可操作接收並儲存文法。 3·根據申請專利範圍第1項之系統其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認並產生結果; 一文法資料結構,可操作接收並儲存文法; 一應用資料結構,可操作追蹤爪哇應用之狀態,及追縱與爪 哇應用關聯之文法之狀態。 4. 根據申請專利範圍第3項之系統其中應用資料結構包含一語 音焦點,可操作限制結果傳遞至一預計之爪哇應用。 5. 根據申請專利範圍第1項之系統,其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認並產生結果; 一應用資料結構,可操作追蹤爪哇應用之狀態,及追蹤與爪 嗅應用關聯之文法之狀態;以及 —組成定向非循環式圖形之規律文法,可操作接收文法並 -16- 本紙張纽適用中國國家插準(CNS)八规格(2l〇x297公釐 ----------^--.!---、1Τ------^ (請先W讀背面之注意事項再填寫本X) 421755 A8 B8 C8 Οδ 申請專利範圍 響應所接收之文法動態修改該組成定向非循環式圖形之規律文 法之内容。 6·根據申請專利範圍第5項之系统,其中應用資料結構包含一語 音焦點,可操作限制結果傳遞至預計之爪哇應用。 7‘根據申請專利範圍第1項之系統,其中應用程式介面包含一伺 服器邊應用程式介面及一應用邊應用程式介面。 8. 根據申請專利範圍第1項之系統,其中應用程式介面包含: 一伺服器邊應用程式介面及一應用邊應用程式介面; 其中伺服器邊應用程式介面包含一語法分析器,可操作接 收來自語音辨認伺服器之結果,語法分析該結果,並產生一語法 分析之結果,其中伺服器邊應用程式介面另可操作將語法分析 之結果傳遞至爪哇應用。 9. 根據申請專利範圍第1項之系統其中應用程式介面包含: 一伺服器邊應用程式介面及一應用邊應用程式介面; 其中伺服器邊應用程式介面包含一參變器,可操作接收一 來自爪唾應用之參數值,並根據所接收之參數值修改語音辨認 伺服器之參數。 10·根據申請專利範圍第I項之系統其中語音辨認伺服器包含 經濟部中央榇準局舅工消費合作社印掣 一有任意大小之字彙,其中語音辨認伺服器為與發言者無關並 支援連續語音^ 11. 一種增強爪哇語音介面之方法該方法包含下列步驟: 在一語音辨認伺服器與一爪哇應用之間建立連繫; 將一文法傳遞至語音辨認伺服器; 響應一語音輸入進行語音辨認,並依據文法產生一結果; -17· 本紙張尺度適i中mrn^ #_V 婦 A 1/ Λ 釐 公 7 9 2 421755 經濟部中央標隼局貝工消費合作社印製 A8 哲 D8六、申請專利範圍 以及 將結果傳遞至爪哇應用。 12. 根據申請專利範圍第11項之方法’其中在語音辨認伺服器與 爪哇應用之間建立連繫之步驟包含將爪哇應用加至—應用資 結構之步驟。 , 13. 根據申請專利範圍第11項之方法,其中將一文法傳遞至語音 辨認伺服器之步驟包含下列步驟: 對應用程式介面指定文法; 將文法加至一文法資料結構,·以及 蜜應文法之增加而動態修改文法資料結構C 14. 根據申請專利範圍第11項之方法,另包含將另一文法傳遞至 語音辨認祠服器之步称。 15. 根據申請專利範圍第11項之方法,另包含在將結果傳遞至爪 哇應用前對其語法分析之步驟。 16. 根據申請專利範圍第11項之方法另包含下列步驟: 接收一參數值;以及 依據該參數值修改語音辨認伺服器之參數。 π·根據申請專利範圍第11項之方法,另包含對一預計爪哇應用 賦予一語音焦點之步驟。 18.—種增強爪哇應用語音介面之方法,該方法包含下列步驟: 在一語音辨認伺服器與一爪哇應用之間建立連繫; 對應用程式介面指定一文法; 將文法傳遞至語音辨認伺服器; 響應所接收之文法動態修改一組成定向非循環式圖形之 -18- 本紙張尺度顧中國國家縣(CNS >从樣(21Gx297公赛) f請先閑讀背面之注意事項再填寫本頁j .裝_ -訂. 421755 ί88 C8 - ^ _DS_;_ κ、申請專利範圍 &律文法; 響應一語音輸入進行語音辨認,並依據文法產生一結果; 以及 將結果傳遞至爪哇應用。 U·根據申請專利範圍第18項之方法另包含:對語音辨認伺服器 指定一參數值,及依據所接收之參數值修改語音辨認伺服器之 參數之步驟; 對語音辨認伺服器所產生之結果語法分析,產生一語法分析 之結果及將語法分析之結果傳遞至爪哇應用之步驊;以及 對爪哇應用賦予一語音焦點之步驟。 20·根據申請專利範圍第18項之方法,另包含下列步驟: 追鞭許多爪哇應用之狀態;以及 追縱一與爪哇應用關聯之文法之狀態β ί I n n I m. n n n 訂 (請先閲讀背面之注$項再填寫本i ) 經濟部中央標準局員工消費合作社印繁 -19- 本紙張纽適用中國國家標準(CNS )从祕(21{);<297公羡)
TW087100099A 1997-01-06 1998-08-04 System and method for adding speech recognition capabilities to java TW421755B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US3464297P 1997-01-06 1997-01-06

Publications (1)

Publication Number Publication Date
TW421755B true TW421755B (en) 2001-02-11

Family

ID=21877693

Family Applications (1)

Application Number Title Priority Date Filing Date
TW087100099A TW421755B (en) 1997-01-06 1998-08-04 System and method for adding speech recognition capabilities to java

Country Status (6)

Country Link
US (1) US6456974B1 (zh)
EP (1) EP0854418A3 (zh)
JP (1) JPH10240493A (zh)
KR (1) KR100663821B1 (zh)
SG (1) SG72779A1 (zh)
TW (1) TW421755B (zh)

Families Citing this family (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2280494A3 (en) 1996-04-26 2011-12-07 AT & T Corp. Method and apparatus for data transmission using multiple transmit antennas
US6078886A (en) * 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6856960B1 (en) 1997-04-14 2005-02-15 At & T Corp. System and method for providing remote automatic speech recognition and text-to-speech services via a packet network
US8209184B1 (en) 1997-04-14 2012-06-26 At&T Intellectual Property Ii, L.P. System and method of providing generated speech via a network
US6101473A (en) * 1997-08-08 2000-08-08 Board Of Trustees, Leland Stanford Jr., University Using speech recognition to access the internet, including access via a telephone
US20020008751A1 (en) * 1998-03-25 2002-01-24 Stephen L. Spurgeon Decorating system for edible items
KR20010022493A (ko) * 1998-06-03 2001-03-15 이데이 노부유끼 정보처리장치 및 정보처리방법
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US7137126B1 (en) * 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
US6272469B1 (en) 1998-11-25 2001-08-07 Ge Medical Systems Global Technology Company, Llc Imaging system protocol handling method and apparatus
US8321411B2 (en) 1999-03-23 2012-11-27 Microstrategy, Incorporated System and method for management of an automatic OLAP report broadcast system
AU3165000A (en) * 1999-03-26 2000-10-16 Koninklijke Philips Electronics N.V. Client-server speech recognition
EP1088299A2 (en) * 1999-03-26 2001-04-04 Scansoft, Inc. Client-server speech recognition
US20050261907A1 (en) 1999-04-12 2005-11-24 Ben Franklin Patent Holding Llc Voice integration platform
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
DE19918382B4 (de) * 1999-04-22 2004-02-05 Siemens Ag Erstellen eines Referenzmodell-Verzeichnisses für ein sprachgesteuertes Kommunikationsgerät
US6571389B1 (en) * 1999-04-27 2003-05-27 International Business Machines Corporation System and method for improving the manageability and usability of a Java environment
GB9911971D0 (en) * 1999-05-21 1999-07-21 Canon Kk A system, a server for a system and a machine for use in a system
US9208213B2 (en) 1999-05-28 2015-12-08 Microstrategy, Incorporated System and method for network user interface OLAP report formatting
US8607138B2 (en) 1999-05-28 2013-12-10 Microstrategy, Incorporated System and method for OLAP report generation with spreadsheet report within the network user interface
AU5399300A (en) * 1999-06-09 2001-01-02 Koninklijke Philips Electronics N.V. Method of speech-based navigation in a communications network and of implementing a speech input possibility in private information units.
US8130918B1 (en) 1999-09-13 2012-03-06 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with closed loop transaction processing
US6964012B1 (en) 1999-09-13 2005-11-08 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through personalized broadcasts
US6850603B1 (en) * 1999-09-13 2005-02-01 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services
US6263051B1 (en) 1999-09-13 2001-07-17 Microstrategy, Inc. System and method for voice service bureau
US7330815B1 (en) * 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US7685252B1 (en) * 1999-10-12 2010-03-23 International Business Machines Corporation Methods and systems for multi-modal browsing and implementation of a conversational markup language
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US6532446B1 (en) * 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
US6424945B1 (en) 1999-12-15 2002-07-23 Nokia Corporation Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
US20010037287A1 (en) * 2000-03-14 2001-11-01 Broadbent David F. Method and apparatus for an advanced speech recognition portal for a mortgage loan management system
AU2001250050A1 (en) * 2000-03-24 2001-10-08 Eliza Corporation Remote server object architecture for speech recognition
US6785653B1 (en) * 2000-05-01 2004-08-31 Nuance Communications Distributed voice web architecture and associated components and methods
US6931376B2 (en) * 2000-07-20 2005-08-16 Microsoft Corporation Speech-related event notification system
US6957184B2 (en) * 2000-07-20 2005-10-18 Microsoft Corporation Context free grammar engine for speech recognition system
US7139709B2 (en) 2000-07-20 2006-11-21 Microsoft Corporation Middleware layer between speech related applications and engines
GB2365189A (en) * 2000-07-26 2002-02-13 Canon Kk Voice-controlled machine
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method
US8200485B1 (en) 2000-08-29 2012-06-12 A9.Com, Inc. Voice interface and methods for improving recognition accuracy of voice search queries
US7240006B1 (en) * 2000-09-27 2007-07-03 International Business Machines Corporation Explicitly registering markup based on verbal commands and exploiting audio context
AU2001294222A1 (en) 2000-10-11 2002-04-22 Canon Kabushiki Kaisha Information processing device, information processing method, and storage medium
GB0025331D0 (en) 2000-10-16 2000-11-29 Canon Kk Control apparatus
EP1881685B1 (en) * 2000-12-01 2012-08-01 The Trustees of Columbia University in the City of New York A method and system for voice activating web pages
CA2436940C (en) * 2000-12-01 2010-07-06 The Trustees Of Columbia University In The City Of New York A method and system for voice activating web pages
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
US20020077814A1 (en) * 2000-12-18 2002-06-20 Harinath Garudadri Voice recognition system method and apparatus
US7451075B2 (en) * 2000-12-29 2008-11-11 Microsoft Corporation Compressed speech lexicon and method and apparatus for creating and accessing the speech lexicon
US6658414B2 (en) * 2001-03-06 2003-12-02 Topic Radio, Inc. Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals
US20060265397A1 (en) * 2001-03-06 2006-11-23 Knowledge Vector, Inc. Methods, systems, and computer program products for extensible, profile-and context-based information correlation, routing and distribution
CN101833952B (zh) 2001-05-04 2013-02-13 微软公司 客户服务器系统中处理输入数据的方法
CN1266625C (zh) * 2001-05-04 2006-07-26 微软公司 用于web启用的识别的服务器
CN1279465C (zh) * 2001-05-04 2006-10-11 微软公司 Web启用的识别体系结构
US7409349B2 (en) * 2001-05-04 2008-08-05 Microsoft Corporation Servers for web enabled speech recognition
US7610547B2 (en) * 2001-05-04 2009-10-27 Microsoft Corporation Markup language extensions for web enabled recognition
US20020178182A1 (en) * 2001-05-04 2002-11-28 Kuansan Wang Markup language extensions for web enabled recognition
US7506022B2 (en) * 2001-05-04 2009-03-17 Microsoft.Corporation Web enabled recognition architecture
US7366673B2 (en) * 2001-06-15 2008-04-29 International Business Machines Corporation Selective enablement of speech recognition grammars
CN1223984C (zh) * 2001-06-19 2005-10-19 英特尔公司 基于客户机-服务器的分布式语音识别系统
KR20030012064A (ko) * 2001-07-30 2003-02-12 와이더덴닷컴 주식회사 서버-씬 클라이언트 구성용 분산형 음성 인식 시스템
KR20030011459A (ko) * 2001-08-03 2003-02-11 와이더덴닷컴 주식회사 분산형 멀티모달 시스템
DE10150108B4 (de) * 2001-10-11 2004-03-11 Siemens Ag Fortwährende Sprecherauthentifizierung
US8229753B2 (en) * 2001-10-21 2012-07-24 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting
US7711570B2 (en) * 2001-10-21 2010-05-04 Microsoft Corporation Application abstraction with dialog purpose
KR100432373B1 (ko) * 2001-11-07 2004-05-24 주식회사 아이엔커넥트 독립적 음성처리를 위한 음성인식 시스템
US20030149566A1 (en) * 2002-01-02 2003-08-07 Esther Levin System and method for a spoken language interface to a large database of changing records
US7188066B2 (en) * 2002-02-04 2007-03-06 Microsoft Corporation Speech controls for use with a speech system
US7139713B2 (en) * 2002-02-04 2006-11-21 Microsoft Corporation Systems and methods for managing interactions from multiple speech-enabled applications
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
US8374879B2 (en) * 2002-02-04 2013-02-12 Microsoft Corporation Systems and methods for managing interactions from multiple speech-enabled applications
US7603627B2 (en) * 2002-02-05 2009-10-13 Microsoft Corporation Systems and methods for creating and managing graphical user interface lists
US7257776B2 (en) * 2002-02-05 2007-08-14 Microsoft Corporation Systems and methods for scaling a graphical user interface according to display dimensions and using a tiered sizing schema to define display objects
US7587317B2 (en) * 2002-02-15 2009-09-08 Microsoft Corporation Word training interface
US6895379B2 (en) * 2002-03-27 2005-05-17 Sony Corporation Method of and apparatus for configuring and controlling home entertainment systems through natural language and spoken commands using a natural language server
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7502730B2 (en) * 2002-06-14 2009-03-10 Microsoft Corporation Method and apparatus for federated understanding
US7502610B2 (en) * 2002-06-28 2009-03-10 Qualcomm Incorporated System and method for application management through threshold events
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
FR2848053B1 (fr) * 2002-11-29 2005-04-01 Streamwide Procede de traitement de donnees audio sur un reseau et dispositif de mise en oeuvre de ce procede
US20040111259A1 (en) * 2002-12-10 2004-06-10 Miller Edward S. Speech recognition system having an application program interface
US20040122653A1 (en) * 2002-12-23 2004-06-24 Mau Peter K.L. Natural language interface semantic object module
US7729913B1 (en) 2003-03-18 2010-06-01 A9.Com, Inc. Generation and selection of voice recognition grammars for conducting database searches
US7260535B2 (en) * 2003-04-28 2007-08-21 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting for call controls
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
CN1894658B (zh) 2003-06-06 2012-02-29 纽约市哥伦比亚大学托管会 用于话音激活网页的系统和方法
CA2529040A1 (en) * 2003-08-15 2005-02-24 Silverbrook Research Pty Ltd Improving accuracy in searching digital ink
AU2004265700B2 (en) * 2003-08-15 2008-10-02 Silverbrook Research Pty Ltd Natural language recognition using distributed processing
US8311835B2 (en) 2003-08-29 2012-11-13 Microsoft Corporation Assisted multi-modal dialogue
US7552055B2 (en) 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
US8160883B2 (en) 2004-01-10 2012-04-17 Microsoft Corporation Focus tracking in dialogs
US7448041B2 (en) * 2004-04-28 2008-11-04 International Business Machines Corporation Interfacing an application server to remote resources using Enterprise Java Beans as interface components
US20060004574A1 (en) * 2004-06-30 2006-01-05 Microsoft Corporation Semantic based validation information in a language model to detect recognition errors and improve dialog performance
US7739117B2 (en) * 2004-09-20 2010-06-15 International Business Machines Corporation Method and system for voice-enabled autofill
US8942985B2 (en) * 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US8024194B2 (en) * 2004-12-08 2011-09-20 Nuance Communications, Inc. Dynamic switching between local and remote speech rendering
US8788271B2 (en) * 2004-12-22 2014-07-22 Sap Aktiengesellschaft Controlling user interfaces with contextual voice commands
US8694322B2 (en) * 2005-08-05 2014-04-08 Microsoft Corporation Selective confirmation for execution of a voice activated user interface
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7848928B2 (en) * 2005-08-10 2010-12-07 Nuance Communications, Inc. Overriding default speech processing behavior using a default focus receiver
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US20070300185A1 (en) * 2006-06-27 2007-12-27 Microsoft Corporation Activity-centric adaptive user interface
US8364514B2 (en) * 2006-06-27 2013-01-29 Microsoft Corporation Monitoring group activities
US7970637B2 (en) 2006-06-27 2011-06-28 Microsoft Corporation Activity-centric granular application functionality
US20070300225A1 (en) * 2006-06-27 2007-12-27 Microsoft Coporation Providing user information to introspection
US20070297590A1 (en) * 2006-06-27 2007-12-27 Microsoft Corporation Managing activity-centric environments via profiles
US20070299713A1 (en) * 2006-06-27 2007-12-27 Microsoft Corporation Capture of process knowledge for user activities
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9570078B2 (en) 2009-06-19 2017-02-14 Microsoft Technology Licensing, Llc Techniques to provide a standard interface to a speech recognition platform
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US9484018B2 (en) * 2010-11-23 2016-11-01 At&T Intellectual Property I, L.P. System and method for building and evaluating automatic speech recognition via an application programmer interface
US8898065B2 (en) 2011-01-07 2014-11-25 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
WO2014055076A1 (en) 2012-10-04 2014-04-10 Nuance Communications, Inc. Improved hybrid controller for asr
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US9196250B2 (en) 2012-11-16 2015-11-24 2236008 Ontario Inc. Application services interface to ASR
EP2733697A1 (en) * 2012-11-16 2014-05-21 QNX Software Systems Limited Application services interface to ASR
US8694305B1 (en) * 2013-03-15 2014-04-08 Ask Ziggy, Inc. Natural language processing (NLP) portal for third party applications
KR101505127B1 (ko) * 2013-03-15 2015-03-26 주식회사 팬택 음성 명령에 의한 오브젝트 실행 장치 및 방법
US9690854B2 (en) 2013-11-27 2017-06-27 Nuance Communications, Inc. Voice-enabled dialog interaction with web pages
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10971157B2 (en) 2017-01-11 2021-04-06 Nuance Communications, Inc. Methods and apparatus for hybrid speech recognition processing
US20200250326A1 (en) * 2017-10-25 2020-08-06 Telefonaktiebolaget Lm Ericsson (Publ) Operation of an Electronic Device during Maintenance

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5509104A (en) * 1989-05-17 1996-04-16 At&T Corp. Speech recognition employing key word modeling and non-key word modeling
US5222187A (en) * 1989-12-29 1993-06-22 Texas Instruments Incorporated Grammar-based checksum constraints for high performance speech recognition circuit
DE4131133B4 (de) * 1991-09-19 2005-09-08 Robert Bosch Gmbh Verfahren und Vorrichtung zum Austausch von Daten in Datenverarbeitungsanlagen
EP0547903B1 (en) * 1991-12-17 2001-10-31 Texas Instruments Incorporated Method and system for isolating data and information collection components from other components in a distributed environment
DE69326431T2 (de) * 1992-12-28 2000-02-03 Toshiba Kawasaki Kk Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist
US5390279A (en) * 1992-12-31 1995-02-14 Apple Computer, Inc. Partitioning speech rules by context for speech recognition
GB9316948D0 (en) * 1993-08-14 1993-09-29 Ibm Programming aid for distributed computing systems
US5748841A (en) * 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US5546583A (en) * 1994-04-05 1996-08-13 International Business Machines Corporation Method and system for providing a client/server interface in a programming language
US5668928A (en) * 1995-01-31 1997-09-16 Kor Team International, Inc. Speech recognition system and method with automatic syntax generation
US5774628A (en) * 1995-04-10 1998-06-30 Texas Instruments Incorporated Speaker-independent dynamic vocabulary and grammar in speech recognition
US5752246A (en) * 1995-06-07 1998-05-12 International Business Machines Corporation Service agent for fulfilling requests of a web browser
US5721908A (en) * 1995-06-07 1998-02-24 International Business Machines Corporation Computer network for WWW server data access over internet
US5701451A (en) * 1995-06-07 1997-12-23 International Business Machines Corporation Method for fulfilling requests of a web browser
US5748191A (en) * 1995-07-31 1998-05-05 Microsoft Corporation Method and system for creating voice commands using an automatically maintained log interactions performed by a user
US5715369A (en) * 1995-11-27 1998-02-03 Microsoft Corporation Single processor programmable speech recognition test system
US5754774A (en) * 1996-02-15 1998-05-19 International Business Machine Corp. Client/server communication system
US5751956A (en) * 1996-02-21 1998-05-12 Infoseek Corporation Method and apparatus for redirection of server external hyper-link references
US5819220A (en) * 1996-09-30 1998-10-06 Hewlett-Packard Company Web triggered word set boosting for speech interfaces to the world wide web

Also Published As

Publication number Publication date
EP0854418A3 (en) 2005-10-12
KR100663821B1 (ko) 2007-06-04
SG72779A1 (en) 2000-05-23
KR19980070342A (ko) 1998-10-26
US6456974B1 (en) 2002-09-24
JPH10240493A (ja) 1998-09-11
EP0854418A2 (en) 1998-07-22

Similar Documents

Publication Publication Date Title
TW421755B (en) System and method for adding speech recognition capabilities to java
JP3432076B2 (ja) 音声対話型ビデオスクリーン表示システム
CA2436940C (en) A method and system for voice activating web pages
US7890333B2 (en) Using a WIKI editor to create speech-enabled applications
US9083798B2 (en) Enabling voice selection of user preferences
US7657828B2 (en) Method and apparatus for coupling a visual browser to a voice browser
US7912726B2 (en) Method and apparatus for creation and user-customization of speech-enabled services
JP5166661B2 (ja) 計画に基づくダイアログを実行する方法および装置
EP1175060B1 (en) Middleware layer between speech related applications and engines
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
US20030036906A1 (en) Voice site personality setting
JP2009059378A (ja) ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法
AU2004201992A1 (en) Semantic object synchronous understanding implemented with speech application language tags
KR100826778B1 (ko) 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법
JP2002023996A (ja) 音声対応スクリプト動作装置
KR100399574B1 (ko) 외국인을 위한 전화안내 자동 통역시스템 및 방법
KR20020040479A (ko) 음성 인터넷 서비스 제공 장치 및 방법
KR20040018687A (ko) 인터넷 컨텐츠를 tts 변환하여 개인정보처리기로제공하는 네트워크 동기화 시스템 및 그 방법
Kurschl et al. Gulliver-A framework for building smart speech-based applications
Pargellis et al. A language for creating speech applications.
JP2004171111A (ja) Webブラウザ制御方法及び装置
Raggett et al. Voice Browsers
JP2003195884A (ja) 音声合成装置及びその方法と音声合成システム
Nichols et al. Voice-commanded Scripting Language for Programming Navigation Strategies on-the-fly
JPH10143352A (ja) 文章情報変換装置および変換方法

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MK4A Expiration of patent term of an invention patent