TW421755B - System and method for adding speech recognition capabilities to java - Google Patents
System and method for adding speech recognition capabilities to java Download PDFInfo
- Publication number
- TW421755B TW421755B TW087100099A TW87100099A TW421755B TW 421755 B TW421755 B TW 421755B TW 087100099 A TW087100099 A TW 087100099A TW 87100099 A TW87100099 A TW 87100099A TW 421755 B TW421755 B TW 421755B
- Authority
- TW
- Taiwan
- Prior art keywords
- application
- grammar
- java
- voice
- speech recognition
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Description
經濟部中央標準局員工消費合作社印製 A 2 Π 5 5 A7 _______B7 五、發明説明(1〉 發明之技術領域 本發明係概括關於資料通訊及處理之領域,尤指一種供將語音 辨認能力加至爪哇之系統及方法。 發明之背景 電腦使用者久巳希望個人軟體應用能響應口頭命令》允許使用 者與使用語音作為輸入媒介之軟體應用互動,提供一種較之例如 鍵盤,滑鼠或觸控螢幕輸入裝置更自然之介面。語音輪入提供方 便不用手操作之優點。除了允許使用者照應其他事情,同時與軟 體應用互動外,不用手操作使行動不便之使用者可利用電膘。語 音輸入提供避免拼音及語法誤差問題,及必須捲動舆其他輪入方 法關聯之大型清單之另外優點。 一種提供語音辨認能力供顧客應用之方法,為以HXdmhypgp text markup language)為基礎之精靈頁概念。精靈頁為全球資訊 網(WorltHyide-ffeb,簡稱ffeb)頁,内含一至該頁之文法特定之連 結,並能翻譯該文法之結果。精靈頁之著者界定該頁將會對其窨 應之文法,將一連結嵌入至該精靈頁内之文法並就預期之口頭輸 入型式,對使用者產生視覺提示。語音引擎遭遇精靈頁其結合文 法,使其能響應語音輸入,並將結果轉回至精靈頁。精靈頁翻譯 該結果並相應響應。 此方法之一項缺點,為以町亂為基礎之Web頁為無狀態·,亦即, 在依循目前頁至一新頁上之連結時,新頁對於前一頁一無所知。 URL(Uniform Resource Locator, M URL) 將狀態資訊編碼,可藉以克服此限制,但此方法提供一種非常欠缺 效率之解決瓶。此綠之# _触,辅並未提鶴決辦法,供 -3- 本張尺用中國國^揉率(CNS ) ( 210X297^4 ) " "" ----- I---------- ^------------i (請先聞讀背面之注意事項再填寫本頁} 42Π55 A7 B7 經濟部中央樣準局員工消費合作衽印製 五、發明説明(2) 將語音辨認能力加至一般之顧客應用。因為並非一種完全 程式規劃語言,其實際應用限於Web頁及瀏覽命令。 發明之概述 根據本發明之旨意,提供一種系統,供將語音辨認能力加至爪哇, 其消除或實際減少與先前所開發之系統關聯之缺點及問題。 根據本發明之一種實施例,一種供將語音辨認能力加至爪哇之 系統包括一語音辨認伺服器,通過一應用程式介面耦合至一爪哇 應用。爪哇應用對應用程式介面動態指定一種文法,其將該文法 傳遞至語音辨認伺服器。語音辨認伺服器接收文法及一語音輸 入。語音辨認伺服器對語音輸入進行語音辨認,並依據該文法產 生一結果。應用程式介面將結果傳遞至爪哇應用其依據所接收 之結果進行動作《 本發明提供重要之技街優點,包括能容易在爪哇應用將狀態資 訊編碼。不同於無狀態之HTML,爪哇為完全程式規劃語言,能有 效率傳送必要之狀態資訊。而且,jg為爪錢完全程式規劃語言, 本發明方便任何爪哇程式應用之語音啟動,並且不限於货吐瀏覽 應用6另一優點為爪哇係一種平台獨立語言。如此,如果在背景 執行語音飼㈣,本㈣允許相同料在多平台使用語音辨認。 這允許顧客程式設計師不管平台相依問題,諸如錄音及語音辨認 器特性再一優點為用以語音啟動爪法應用之應用程式介面之變 通性。 本發明允許無經驗之程式設計師,藉簡單之樣板快速語音啟 動應用,同時對較有經驗之程式設計師提供實施更複雜特色之變 通性。 I--Ί冒------裝------^訂----丨—瘃 (諳先聞讀背面之注意事項再填寫本頁) -4-
經濟部中央榡隼局員工消費合作社印^. 421755 A7 --------B7 五、發明説明(3) 本發明之又一優點為應用程式介面所依據之顧客/伺服器模 型。因為語音辨認伺服器處理大部份處理負載,較輕之負載置於 較緩慢翻譯之爪哇應用》再者,顧客/伺服器模型允許顧客應用執 行單獨,或許功力較不及伺服器電腦之裝置,而藉以提供變通性。 在Web以爪哇程式傳遞時,爪哇之顧客邊性質大為簡化在互動時 追蹤對話上下文》再者,直接以爪哇應用傳遞,消除等待響應時之 網路延遲" 本發明之又一優點為提供動態修改文法資料結構之内容。語音 引擎所遭遇之上下文為不可預測,諸如潘丨覽fforld—Wide_ffeb網址 之情形,動態修改為一具有償值之優點·》在此情形,動態修改允 許語音辨認伺服器增強語音引擎之語言,以適合所遭遇之應用之 上下文。本發明之文法資料結構提供另一優於習知單一規律文法 之簡潔優點》 附圖之簡要說明 為更佳瞭解本發明,請參照附圖,在附圖中: 圖1例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之簡化例證性系統; 圖2例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之例證性系統; 圖3例示一根據本發明之旨意,在語音辨認伺服器與爪哇應用 間之例證性介面;以及 圖4例示一根據本發明之旨意,供方便至一爪哇應用之語音介 面之例證性方法。 發明之詳細說明 本紙張尺度適用中國國家橾準{ CNS > Α4規格(210X297公釐) --------------裝------訂------故 (請先Μ讀背面之注意事項再填寫本Κ·) 經濟部中央標嗥局員工消費合作社印聚 421755 A7 _______B7 五、發明説明(4 ) 圖1-4中例示本發明之諸較佳實施例相同參考圓號用以指 各圖之相同及對應部份。 圓1為一供啟動具有語音辨認能力之爪哇之系統之簡化圖示。 該系統可包括一爪哇應用(應用)24, 一語音辨認伺服器(speech recognition server,簡稱SRS)18,一伺服器邊應用程式介面(飼 服器邊API)218,及一應用邊應用程式介面(應用邊AP0224。伺 服器邊API 218及應用邊API 224合稱為API 20〇在操作時, 應用24對API 20動態指定一種或多種文法。文法為界定應用24 所將響應之語法及字彙之成組規則。API 20將文法傳遞至SRS18, 其接收並儲存文法。在處理文法後,SRS 18可接收一語音輸入,並 且依據爪哇應用24所指定之文法,進行語音辨認並產生結果。迚j 20然後可將結果傳遞至爪哇應用24。爪哇應用24可依據所接收 之結果進行適當動作。 應用24所進行之動作可為響應應用24所支援之命令而適當採 取之任何動作。動作可例如為響應”向上捲動"命令將螢幕向上捲 動,響應"退後"命令轉回至前一 Web頁,或響應"示預測"命令顯示 天氣預測。所採取之動作依接收結果之特定應用之功能而定。 圖2例示一例證性系統1〇,其包括一語音主電腦語音主電 腦12可包括SRS 18及應用24-30。概括稱為廉用24之應用24-32,通過API 20與SRS 18交接。爪嗅應用24-28可源自存在於網 路34之網路電腦36-38。爪哇應用30可局部存在於語音主電腦 12,存在於記憶體,或作為語音主電腦12之硬連線組件。AH 20 可通過一應用翻譯器22與爪哇應用24-30交接。系統1〇可另包 括一介面裝置14,其通過一介面16耗合至語音主電腦12。爪唾 本紙張尺度適用中國国家標準(CNS)A4規格(2]〇x297公釐) —is 1^1 -- n I m n* I. ! I j— n* I - I---- X· 、y,l° (諳先閲讀背面之注意事項再填寫本頁) 421755 t A7 B7 五、發明説明(5 ) 應用32可存在於介面裝置14,並通過介面16與API 218連繫。 語音主電腦12可為能支援SRS 18及API 20之任何裝置,諸如 主機,迷你電膜,工作站,或個人電腦《通常,SRS 18可為將會聽取 來自顧客應用之連接,瞭解顧客伺服器協議,並進行應用24所要 求動作之任何裝置或應用。在一種較特定實施例,SRS 18可予以 整合至一與發言者無關,連續語音,任意字彙辨認系統。與發言者 無關指辨認器在引入新發言者時能繼續發生功能,而不必對新發 言者語音特質之訓練》支援連續語音指辨認器能發生功能,而在 所說之字中間無需停頓。任意之字彙為不受預先界定之字彙大 小及/或/¾•容所約束。SRS 18不僅對爪攻應用為特定。其可與依 循供顧客與伺服器間通訊之協議之任何應用交接β SRS 18 可配合一 web 瀏覽器諸如 Netscape 或 Microsof tExplorer 使用,以支援供與world-Wide-Web語音互動之特定特色。除了在 與fforld-Wide-Web互動時提供若干優點外,SRS 18可使用作為供 各種其他多媒體目的之語音辨認伺服器。其中有通過書報亭之資 訊存取,語音驅動之互動式多媒體呈現,互動式訓練及修理手冊之 語音引導,以及通過Web之電視整合。 經濟部中央標率局貝工消费合作社印製 --1 - i··- - n .^1 I I * — - - si - - -I- - -I - I I -I (諳先閲讀背面之注意事項再填寫本頁} 應用程式介面20可包括一組常式,命令,資料結構,虛擬及其他 功能,虛擬及其他功能呼叫,資料定義,以及控制SRS 18之一種或 .多種操作之其他變數。API 20包括伺服器邊API 218及應用邊API 224-232,概括稱作API 224 ^伺服器邊API 218可包括控制SRS 18 之操作所必要之大多數代碼。應用邊224包括特定之代碼線, 其方便SRS 18與應用24間之互動。伺服器邊Ap〗218及應用邊 API 224集合形成API 20。API 20允許特定應用所獨有之文法 本紙張财關家料(;)鐵# {21QX 297公楚) 421755 A7 B7 五 、發明説明( 規範及指令,以變成SRS 18之一部份。利用此特色,程式設計師 可增加一應用邊API,藉以語音啟動任何爪哇應用,以方便SRS 18 與應用間之互動。在本案實施例應用24_32巳藉分別將其以應 用邊API 224-232編瑪而予以語音啟動。 意在作為實例,並且不作為限制下列例證性代碼可用以語音啟 動應用24: import javaspeech. //The java speech API package * · * Iiiilic class l^^le extends ijplet isploneats Runeble; Speokable { 〈請先閲讀背面之注意事項再填寫本頁) 經濟部中央標率局員工消費合作社印製
SpeechRecoanizer SR; SRGrananar grammar; • * · SR = new SceechRecognizer(this); if (SR. connect(){ SRGrammar grammar - new SRGrammar(,,blink_grainmar"); graranar.addruieCblink_granDar — > start bliridnk | st)〇p blinking); SR. loadGrammarToRecoqnizer(grainniar); SR. startListeningO; -s- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公麓) A7 421755 B7 __ 五、發明説明(7 ) public void onSpeechRec〇gnition(SRResult result} ( //sinulated callback that receives the SResult object and is //responsible for its processing } « · * SR. stopListeninqO; SR. disconnectO; 在目的導向之程式規劃,一類別界定屬性,服務,資料結構,常式, 或在該類別之其他資訊特徵說明目的,或該類別之情形。在以上 之例證性代碼,所使用之諸類別為SpeechRecoanizer,SRResult, 及SRGrammar。SpeechRecoanizer類別控制基本語音辨認操作,諸 如建立SRS 18與應用24間之連接,與SRS 18連繫及自SRS 18分 開。SRGr_ar類別用以指定文法56。通過淡Grammar,應用24 可增加及替換文法,解除啟用及重新啟用文法,以及在執行應用24 時動態重新載入改變之文法。SRResult類別可包含諸如文法56, 自文法56所辨認之結果58,可信度分數及η-最佳結果及其可信 度分數之清單等資訊。為處理供非同步辨認所需要之模擬召回,應 用24也可包括一功能〇n-SpeechRecognition,其在已收到辨認 結果58時自動予以呼叫。 以上所說明之例證性代碼,例示一種以極簡單樣板語音啟動應 -9 ^張尺度通用中國國家標準(CNS ) Μ^ϋ〇·χ297公楚) " -- (請先閱讀背面之注項再填寫本頁) 裝. ,.訂 經滴部中央標準局員工消费合作社印製
T 經濟部中央標隼局負工消費合作社印製 421755 A7 ______B7 _ 五、發明説明(8 ) ~ 用24之方法。例證性代碼之簡明性提供允許無經驗者語音辨認 以最小工夫語音啟動應用之優點e API 20提供支援較有經驗之程 式設計師所可能希望之更先進語音辨認能力之另一優點。 應用24可為適合爪哇程式規割語言之任何應用。意在作為資 例,並且不作為限制,應用24可為一電腦排行程式,電雎遊戲程式, 或fforld-Wide-ffeb頁。;]\厚為一與平台無關之程式規劃語言β 如此,本發明提供以語音辨認能力啟動顧客應用,而不管語音主電 腦12之平台之優點。 API 20可與應用24-32以若干方式交接。在一種特定實施例, 一應用30可為語音主電腦12局部所有。例如,應用30可存在 於語音主電腦12之硬碟機,存在於一外部磁碟機,諸如軟碟機或 光碟機,或硬連線至語音主電腦12。通常,應用30可對語音主電 躏12局部存在於適合儲存應用30並方便其在系統10操作之任 何媒質。 在另一實施例,應用32可存在於一介面裝置14,諸如細胞式電 話,個人數位輔助裝置或set-top box。應用32可通過一介面16 與API 20連繫。介面16可包括適合方便介面裝置14與語音主 電腦12間連繫之任何有線或無線裝置。在此實施例,因為大部份 處理負載係置於語音主電腦12,顧客應用32無需具有供功率及記 憶體之大容量。這提供一種對於在否則可能缺少必要記憶體及功 率需求之小型低功率介面裝置執行之應用提供語音辨認能力之優 點。 在又一實施例,應用24-28可存在於網路34之某處。網路34 可包括任何適當有線或無線連結,以方便語音主電腦12與網路 本紙張尺度適用中國國家標率(CNS ) Λ4規格(210X297公势) • —I— n I H |策 -訂 (諳先閲讀背面之注意事唄再填轉本頁) 經濟部中央標準局貝工消費合作社印製 42175 5 A7 B7 五、發明説明(9) 電聪36-40間之連繫。例如,網路34可包括公眾交換電話網路, 整體服務數位網路(integrated services digital network,簡稱 ISDN),局部區域網路(local area network,簡稱LAN),都會區 域網路(metropolitan area network» 簡稱 MAN)),廣域網路(wide area network,簡稱WAN),全球網路諸如world-Wide-Web,或其他 專用或交換網路或其他通訊機構《語音主電腦12可通過應用翻 譯器22與應用24-30交接》應用翻譯器22可適合利用網路34, 並找到及檢索應用24之任何裝置,諸如瀏覽器或对)1)1討“6\^1·。 圖3為根據本發明旨意之語音辨認/司服器18與爪哇應用24~32 間之例證性介面。語音主電腦12支援SRS 18, API 20及一種或多 種概括稱作應用24之爪哇應用24-32。SRS 18可包括一可利用 文法資料結構52及應用資料結構54之語音引擎50。通常,語音 引擎50可為任何適合對語音輸入進行語音辨認之算法。在一特 定實施例,如在此項技藝所知,語音引擎50可包括至少三層:一表 示聲音模型之Hidden Markov模型層,一任選之字發音層,及一指 定預期字順序之語句語法層。 通常,文法資料結構52可予以儲存在任何資料儲存裝置,並且 應用可操作以接收,儲存及方便檢索文法56。在一特定實施例,如 在此項技藝所知,文法資料結構52可為成一種定向非循環式圖形 之規律文法(regular grammars in a directed acyclic graph, 簡稱RGDAG)。在RGDAG,在第一文法之終端符號匹配在第二文法 之開始符號時,一文法便連接至另一文法。實施RGDAG作為文法 資料結構52,允許語音引擎50以RGDAG内之任何次組開始符號開 始其搜尋過程。這方便根據所遭遇之應用之上下文,動態修改語 -11 - 本紙張尺度適用中國國家標準< CNS ) A4規格(2丨Ox 297公釐) —--------裳— f讀先閲讀背面之ii意事項再填巧本頁) :tx A7 B7 421755 五、發明説明(10) 音引擎之語言。 1^1 —II - · ·. m I -1 I -1*^-I I I Hr I - - II I-» '^=0. (請先閲讀背面之注意事項再填寫本頁) 在語音引擎50所遭遇之上下文為不可預測,諸如瀏覽World-Wide-Web網址之情形,動態修改RGDAG為語音辨認伺服器18之一 項優點。在此等情形,動態修改文法,允許語音辨認伺服器18増 強語音引擎50之語言,以適合所遭遇之應用之上下文。RGDAG結 構方便較之習知單一規律文法更有效率之文法儲存,而提供另一 簡潔之優點。 應用資料結構54追縱應用24之狀態。應用資料結構54可指 定應用24為"現用"或"非現用,"為•,聽取”或"不聽取”,或為,,執行 ”或"不執行”。另外,應用資料結構54可標記每一文法為"啟動/ 或”中止",藉以追蹤與每一應用關聯之文法之狀態。以此方式, 語音辨認飼服器18可追蹤及支援多顧客應用之同時操作。應用 資料結構可另啟動應用24,以接收一語音焦點。可能必要一語音 焦點以解決很多各聽取來自其本身文法之結果之應用間之爭用β 對應用24賦予一語音焦點,應用24可防止語音引擎50發出結果 58至其他聽取應用c以此方式預計之應用,應用以,接收結果诏。 經濟部中央橾準局員工消費合作社印製 SRS 18也可包括API 20之祠服器邊部份,伺服器邊API 218。 伺服器邊API 218可包括一語法分析器6〇〇語法分析器60可接 收來自語音U擎50之結果58,語法分析結果並將語法分析之結 果61傳遞至應用24。在操作時,語法分析器60可允許顧客24 扎疋文法56内之某些非終端。語法分析器6〇僅使對應於指定非 終端之結果58之部份轉回至應用24。例如,文法56可成下列形 式:<ARTICLE> ^cADJECTIvg〉 <N〇UN> <ADVERB> <VERB> 〈PREPOSITIdALP鹏E>;語法储_ 6G可析取名雛動詞為語 -12- 公楚)~--- 經濟部中央橾準局員工消費合作社印製 421755 ____ 五'發明说明(„ ) 法分析結果61,並且僅將語法分析之結果61傳至應用24。這允 許應用24忽略非必要之資訊β語法分析器60之一項優點,為其 無需應用24重新語法分析結果58,其可能為一項麻煩之複雜文 法過程。 伺服器邊API 218可另包括一參變器(parametizer) 62。參變 器62可接收一來自應用24之參數64,並將參數64傳遞至語音引 擎50。語音引擎50可接收參數64並相應修改其操作ο參數64 可為語音引擎50之函數中之任何變數,諸如終點參數,其指定一 足以確定一語音表達結束之無聲持續期間《 也請參照圖4,囷示一供語音啟動應用24之例證性方法。該方 法在步驟100開始,在此步驟在應用24與SRS 18之間建立連接。 一經作成連接,在步称102, SRS 18將應用24加至應用資料結構54 中之現用應用之清單,並周期性檢查來自應用24之命令。應用24 然後可在步驟104動態指定文法56至API 20。文法56可存在於 任何位置或狀態,允許應用24利用及指定其至API 20。例如,文 法56可在應用24之爪哇代碼内存在於一文字串,存在於由應用 24所指定之檔案,或存在於一由應用24所指定之統一資源定位器 (URL)。 ° 另外在步驟104,應用24可指定參數64。如以上所說明,參數 可對應於#音引擎50之任何變數。API 20然後在步驟將文 法56及參數64傳遞至SRS 18。也在步驟1〇4,應用24可指定一 已傳遞至SRS 18之文法為”啟動"或"中止。” SRS 18在步驟1〇6接收文法56時,其將文法56加至一與文法 資料結構52中之應用24關聯之文法之清單。也在步驟现岔μ -13- 本紙張尺度通國國家標準(CNS) Μ規格{210χ 297公G ' ——-- {請先閲讀背面之注意事項再填寫本頁) 裝. 經濟部中央標準局貝工消費合作杜印製 421755 at ___ Β7 五、發明説明(12) 可如應用24所指定,啟動或中止文法資料結構52中之文法。另 夕卜,SRS 18可根據參數64之值調整語音引擎5〇之參數。 如果應用24在步驟107未"聽取",其在步驟1〇8通過μ 20 將一聽取信號傳遞至SRS18。在步驟1〇9接收"聽取,'信號時,SRS 19將應用24加至應用資料結構54中之聽取應用之清單。應用一 經標記為”聽取",SRS18可在步驟U0對應用24賦予一語音焦點。 如以上所說明,語音焦點防止語音引擎50發出結果58至其他聽 取應用。 在步驟111,語音引擎50可接收語音輸入66,並在步驟112進 行語音辨認,及依據語音輸入66產生結果58 〇語法分析器60可 在步驟113接收結果58,並語法分析結果58 »語法分析器60然 後可在步驟114將語法分析之結果61傳遞至應用2‘在步驟116 接收結果58,或語法分析之結果61時,應用24可依據所接收之結 果進行動作》 應用24可在步驟118指定另外之文法及/或參數,及/或啟動或 中止文法資料結構52中之文法。要不然,應用24可在步黎^20 將一"停止聽取"信號傳遞至API 20,藉以暫時中斷與SRS 18之連 繫。在步驟121接收"停止聽取信號時’ SRS 18自應用資料 結構54中之聽取應用之清單除去應用24。在步驟122,應用24 可發出另外之文法及/或將一,,聽取”信號傳遞至仙〗2〇,藉以恢復 與SRS 18連繫°要不然,應用24可在步驟124將一',分開"信號 傳遞至API 20,藉以终止與SRS 18連繫。在步驟126接收”分開 •'信號時,SRS 18自應用資料結構除去應用24。 雖然本發明及其優點業巳予以詳細說明但請予瞭解其中可作 -14 - ⑤尺度適用現格(210x21^~~---~~~ (請先閱讀背面之注意事項再填寫本頁) 裝' 訂 421755 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(13) 成各種變化,替代及更改,而不偏離如後附申請專利範圍所界定之 本發明之精神及範圍。 -15- (請先閲讀背面之注意事項再填寫本頁) 裝· 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐)
Claims (1)
- 4 w W ^21755 Λ8 BS C8 D8 經濟部中央揉率局—工消費合作社印製 申請專利範園 種增強爪哇語音介面之系 一語音辨認伺服器,可文法及一語音輸入,該語 音辨認伺服器另可操作響應語音輸入而進行語音辨認,及依據 文法產生一結果; 至少一爪哇應用,可操作動態指定文法以接收結果,並依據 結果進行動作;以及 一應用程式介面,可操作接收文法,以將文法傳遞至語音辨 認飼服器,並響應語音辨認而接收來自語音辨認伺服器之結果, 並將結果傳遞至爪啥應用。 2.根據申請專利範圍第1項之系統其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認;以及 一文法資料結構,可操作接收並儲存文法。 3·根據申請專利範圍第1項之系統其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認並產生結果; 一文法資料結構,可操作接收並儲存文法; 一應用資料結構,可操作追蹤爪哇應用之狀態,及追縱與爪 哇應用關聯之文法之狀態。 4. 根據申請專利範圍第3項之系統其中應用資料結構包含一語 音焦點,可操作限制結果傳遞至一預計之爪哇應用。 5. 根據申請專利範圍第1項之系統,其中語音辨認伺服器包含: 一語音引擎,可操作進行語音辨認並產生結果; 一應用資料結構,可操作追蹤爪哇應用之狀態,及追蹤與爪 嗅應用關聯之文法之狀態;以及 —組成定向非循環式圖形之規律文法,可操作接收文法並 -16- 本紙張纽適用中國國家插準(CNS)八规格(2l〇x297公釐 ----------^--.!---、1Τ------^ (請先W讀背面之注意事項再填寫本X) 421755 A8 B8 C8 Οδ 申請專利範圍 響應所接收之文法動態修改該組成定向非循環式圖形之規律文 法之内容。 6·根據申請專利範圍第5項之系统,其中應用資料結構包含一語 音焦點,可操作限制結果傳遞至預計之爪哇應用。 7‘根據申請專利範圍第1項之系統,其中應用程式介面包含一伺 服器邊應用程式介面及一應用邊應用程式介面。 8. 根據申請專利範圍第1項之系統,其中應用程式介面包含: 一伺服器邊應用程式介面及一應用邊應用程式介面; 其中伺服器邊應用程式介面包含一語法分析器,可操作接 收來自語音辨認伺服器之結果,語法分析該結果,並產生一語法 分析之結果,其中伺服器邊應用程式介面另可操作將語法分析 之結果傳遞至爪哇應用。 9. 根據申請專利範圍第1項之系統其中應用程式介面包含: 一伺服器邊應用程式介面及一應用邊應用程式介面; 其中伺服器邊應用程式介面包含一參變器,可操作接收一 來自爪唾應用之參數值,並根據所接收之參數值修改語音辨認 伺服器之參數。 10·根據申請專利範圍第I項之系統其中語音辨認伺服器包含 經濟部中央榇準局舅工消費合作社印掣 一有任意大小之字彙,其中語音辨認伺服器為與發言者無關並 支援連續語音^ 11. 一種增強爪哇語音介面之方法該方法包含下列步驟: 在一語音辨認伺服器與一爪哇應用之間建立連繫; 將一文法傳遞至語音辨認伺服器; 響應一語音輸入進行語音辨認,並依據文法產生一結果; -17· 本紙張尺度適i中mrn^ #_V 婦 A 1/ Λ 釐 公 7 9 2 421755 經濟部中央標隼局貝工消費合作社印製 A8 哲 D8六、申請專利範圍 以及 將結果傳遞至爪哇應用。 12. 根據申請專利範圍第11項之方法’其中在語音辨認伺服器與 爪哇應用之間建立連繫之步驟包含將爪哇應用加至—應用資 結構之步驟。 , 13. 根據申請專利範圍第11項之方法,其中將一文法傳遞至語音 辨認伺服器之步驟包含下列步驟: 對應用程式介面指定文法; 將文法加至一文法資料結構,·以及 蜜應文法之增加而動態修改文法資料結構C 14. 根據申請專利範圍第11項之方法,另包含將另一文法傳遞至 語音辨認祠服器之步称。 15. 根據申請專利範圍第11項之方法,另包含在將結果傳遞至爪 哇應用前對其語法分析之步驟。 16. 根據申請專利範圍第11項之方法另包含下列步驟: 接收一參數值;以及 依據該參數值修改語音辨認伺服器之參數。 π·根據申請專利範圍第11項之方法,另包含對一預計爪哇應用 賦予一語音焦點之步驟。 18.—種增強爪哇應用語音介面之方法,該方法包含下列步驟: 在一語音辨認伺服器與一爪哇應用之間建立連繫; 對應用程式介面指定一文法; 將文法傳遞至語音辨認伺服器; 響應所接收之文法動態修改一組成定向非循環式圖形之 -18- 本紙張尺度顧中國國家縣(CNS >从樣(21Gx297公赛) f請先閑讀背面之注意事項再填寫本頁j .裝_ -訂. 421755 ί88 C8 - ^ _DS_;_ κ、申請專利範圍 &律文法; 響應一語音輸入進行語音辨認,並依據文法產生一結果; 以及 將結果傳遞至爪哇應用。 U·根據申請專利範圍第18項之方法另包含:對語音辨認伺服器 指定一參數值,及依據所接收之參數值修改語音辨認伺服器之 參數之步驟; 對語音辨認伺服器所產生之結果語法分析,產生一語法分析 之結果及將語法分析之結果傳遞至爪哇應用之步驊;以及 對爪哇應用賦予一語音焦點之步驟。 20·根據申請專利範圍第18項之方法,另包含下列步驟: 追鞭許多爪哇應用之狀態;以及 追縱一與爪哇應用關聯之文法之狀態β ί I n n I m. n n n 訂 (請先閲讀背面之注$項再填寫本i ) 經濟部中央標準局員工消費合作社印繁 -19- 本紙張纽適用中國國家標準(CNS )从祕(21{);<297公羡)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3464297P | 1997-01-06 | 1997-01-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW421755B true TW421755B (en) | 2001-02-11 |
Family
ID=21877693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW087100099A TW421755B (en) | 1997-01-06 | 1998-08-04 | System and method for adding speech recognition capabilities to java |
Country Status (6)
Country | Link |
---|---|
US (1) | US6456974B1 (zh) |
EP (1) | EP0854418A3 (zh) |
JP (1) | JPH10240493A (zh) |
KR (1) | KR100663821B1 (zh) |
SG (1) | SG72779A1 (zh) |
TW (1) | TW421755B (zh) |
Families Citing this family (133)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2280494A3 (en) | 1996-04-26 | 2011-12-07 | AT & T Corp. | Method and apparatus for data transmission using multiple transmit antennas |
US6078886A (en) * | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6856960B1 (en) | 1997-04-14 | 2005-02-15 | At & T Corp. | System and method for providing remote automatic speech recognition and text-to-speech services via a packet network |
US8209184B1 (en) | 1997-04-14 | 2012-06-26 | At&T Intellectual Property Ii, L.P. | System and method of providing generated speech via a network |
US6101473A (en) * | 1997-08-08 | 2000-08-08 | Board Of Trustees, Leland Stanford Jr., University | Using speech recognition to access the internet, including access via a telephone |
US20020008751A1 (en) * | 1998-03-25 | 2002-01-24 | Stephen L. Spurgeon | Decorating system for edible items |
KR20010022493A (ko) * | 1998-06-03 | 2001-03-15 | 이데이 노부유끼 | 정보처리장치 및 정보처리방법 |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US7137126B1 (en) * | 1998-10-02 | 2006-11-14 | International Business Machines Corporation | Conversational computing via conversational virtual machine |
US6272469B1 (en) | 1998-11-25 | 2001-08-07 | Ge Medical Systems Global Technology Company, Llc | Imaging system protocol handling method and apparatus |
US8321411B2 (en) | 1999-03-23 | 2012-11-27 | Microstrategy, Incorporated | System and method for management of an automatic OLAP report broadcast system |
AU3165000A (en) * | 1999-03-26 | 2000-10-16 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
EP1088299A2 (en) * | 1999-03-26 | 2001-04-04 | Scansoft, Inc. | Client-server speech recognition |
US20050261907A1 (en) | 1999-04-12 | 2005-11-24 | Ben Franklin Patent Holding Llc | Voice integration platform |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
DE19918382B4 (de) * | 1999-04-22 | 2004-02-05 | Siemens Ag | Erstellen eines Referenzmodell-Verzeichnisses für ein sprachgesteuertes Kommunikationsgerät |
US6571389B1 (en) * | 1999-04-27 | 2003-05-27 | International Business Machines Corporation | System and method for improving the manageability and usability of a Java environment |
GB9911971D0 (en) * | 1999-05-21 | 1999-07-21 | Canon Kk | A system, a server for a system and a machine for use in a system |
US9208213B2 (en) | 1999-05-28 | 2015-12-08 | Microstrategy, Incorporated | System and method for network user interface OLAP report formatting |
US8607138B2 (en) | 1999-05-28 | 2013-12-10 | Microstrategy, Incorporated | System and method for OLAP report generation with spreadsheet report within the network user interface |
AU5399300A (en) * | 1999-06-09 | 2001-01-02 | Koninklijke Philips Electronics N.V. | Method of speech-based navigation in a communications network and of implementing a speech input possibility in private information units. |
US8130918B1 (en) | 1999-09-13 | 2012-03-06 | Microstrategy, Incorporated | System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with closed loop transaction processing |
US6964012B1 (en) | 1999-09-13 | 2005-11-08 | Microstrategy, Incorporated | System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through personalized broadcasts |
US6850603B1 (en) * | 1999-09-13 | 2005-02-01 | Microstrategy, Incorporated | System and method for the creation and automatic deployment of personalized dynamic and interactive voice services |
US6263051B1 (en) | 1999-09-13 | 2001-07-17 | Microstrategy, Inc. | System and method for voice service bureau |
US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US7685252B1 (en) * | 1999-10-12 | 2010-03-23 | International Business Machines Corporation | Methods and systems for multi-modal browsing and implementation of a conversational markup language |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US6532446B1 (en) * | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
US6424945B1 (en) | 1999-12-15 | 2002-07-23 | Nokia Corporation | Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection |
US20010037287A1 (en) * | 2000-03-14 | 2001-11-01 | Broadbent David F. | Method and apparatus for an advanced speech recognition portal for a mortgage loan management system |
AU2001250050A1 (en) * | 2000-03-24 | 2001-10-08 | Eliza Corporation | Remote server object architecture for speech recognition |
US6785653B1 (en) * | 2000-05-01 | 2004-08-31 | Nuance Communications | Distributed voice web architecture and associated components and methods |
US6931376B2 (en) * | 2000-07-20 | 2005-08-16 | Microsoft Corporation | Speech-related event notification system |
US6957184B2 (en) * | 2000-07-20 | 2005-10-18 | Microsoft Corporation | Context free grammar engine for speech recognition system |
US7139709B2 (en) | 2000-07-20 | 2006-11-21 | Microsoft Corporation | Middleware layer between speech related applications and engines |
GB2365189A (en) * | 2000-07-26 | 2002-02-13 | Canon Kk | Voice-controlled machine |
TW472232B (en) * | 2000-08-11 | 2002-01-11 | Ind Tech Res Inst | Probability-base fault-tolerance natural language understanding method |
US8200485B1 (en) | 2000-08-29 | 2012-06-12 | A9.Com, Inc. | Voice interface and methods for improving recognition accuracy of voice search queries |
US7240006B1 (en) * | 2000-09-27 | 2007-07-03 | International Business Machines Corporation | Explicitly registering markup based on verbal commands and exploiting audio context |
AU2001294222A1 (en) | 2000-10-11 | 2002-04-22 | Canon Kabushiki Kaisha | Information processing device, information processing method, and storage medium |
GB0025331D0 (en) | 2000-10-16 | 2000-11-29 | Canon Kk | Control apparatus |
EP1881685B1 (en) * | 2000-12-01 | 2012-08-01 | The Trustees of Columbia University in the City of New York | A method and system for voice activating web pages |
CA2436940C (en) * | 2000-12-01 | 2010-07-06 | The Trustees Of Columbia University In The City Of New York | A method and system for voice activating web pages |
US6973429B2 (en) * | 2000-12-04 | 2005-12-06 | A9.Com, Inc. | Grammar generation for voice-based searches |
US20020077814A1 (en) * | 2000-12-18 | 2002-06-20 | Harinath Garudadri | Voice recognition system method and apparatus |
US7451075B2 (en) * | 2000-12-29 | 2008-11-11 | Microsoft Corporation | Compressed speech lexicon and method and apparatus for creating and accessing the speech lexicon |
US6658414B2 (en) * | 2001-03-06 | 2003-12-02 | Topic Radio, Inc. | Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals |
US20060265397A1 (en) * | 2001-03-06 | 2006-11-23 | Knowledge Vector, Inc. | Methods, systems, and computer program products for extensible, profile-and context-based information correlation, routing and distribution |
CN101833952B (zh) | 2001-05-04 | 2013-02-13 | 微软公司 | 客户服务器系统中处理输入数据的方法 |
CN1266625C (zh) * | 2001-05-04 | 2006-07-26 | 微软公司 | 用于web启用的识别的服务器 |
CN1279465C (zh) * | 2001-05-04 | 2006-10-11 | 微软公司 | Web启用的识别体系结构 |
US7409349B2 (en) * | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
US7610547B2 (en) * | 2001-05-04 | 2009-10-27 | Microsoft Corporation | Markup language extensions for web enabled recognition |
US20020178182A1 (en) * | 2001-05-04 | 2002-11-28 | Kuansan Wang | Markup language extensions for web enabled recognition |
US7506022B2 (en) * | 2001-05-04 | 2009-03-17 | Microsoft.Corporation | Web enabled recognition architecture |
US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
CN1223984C (zh) * | 2001-06-19 | 2005-10-19 | 英特尔公司 | 基于客户机-服务器的分布式语音识别系统 |
KR20030012064A (ko) * | 2001-07-30 | 2003-02-12 | 와이더덴닷컴 주식회사 | 서버-씬 클라이언트 구성용 분산형 음성 인식 시스템 |
KR20030011459A (ko) * | 2001-08-03 | 2003-02-11 | 와이더덴닷컴 주식회사 | 분산형 멀티모달 시스템 |
DE10150108B4 (de) * | 2001-10-11 | 2004-03-11 | Siemens Ag | Fortwährende Sprecherauthentifizierung |
US8229753B2 (en) * | 2001-10-21 | 2012-07-24 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting |
US7711570B2 (en) * | 2001-10-21 | 2010-05-04 | Microsoft Corporation | Application abstraction with dialog purpose |
KR100432373B1 (ko) * | 2001-11-07 | 2004-05-24 | 주식회사 아이엔커넥트 | 독립적 음성처리를 위한 음성인식 시스템 |
US20030149566A1 (en) * | 2002-01-02 | 2003-08-07 | Esther Levin | System and method for a spoken language interface to a large database of changing records |
US7188066B2 (en) * | 2002-02-04 | 2007-03-06 | Microsoft Corporation | Speech controls for use with a speech system |
US7139713B2 (en) * | 2002-02-04 | 2006-11-21 | Microsoft Corporation | Systems and methods for managing interactions from multiple speech-enabled applications |
US7167831B2 (en) * | 2002-02-04 | 2007-01-23 | Microsoft Corporation | Systems and methods for managing multiple grammars in a speech recognition system |
US8374879B2 (en) * | 2002-02-04 | 2013-02-12 | Microsoft Corporation | Systems and methods for managing interactions from multiple speech-enabled applications |
US7603627B2 (en) * | 2002-02-05 | 2009-10-13 | Microsoft Corporation | Systems and methods for creating and managing graphical user interface lists |
US7257776B2 (en) * | 2002-02-05 | 2007-08-14 | Microsoft Corporation | Systems and methods for scaling a graphical user interface according to display dimensions and using a tiered sizing schema to define display objects |
US7587317B2 (en) * | 2002-02-15 | 2009-09-08 | Microsoft Corporation | Word training interface |
US6895379B2 (en) * | 2002-03-27 | 2005-05-17 | Sony Corporation | Method of and apparatus for configuring and controlling home entertainment systems through natural language and spoken commands using a natural language server |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7502730B2 (en) * | 2002-06-14 | 2009-03-10 | Microsoft Corporation | Method and apparatus for federated understanding |
US7502610B2 (en) * | 2002-06-28 | 2009-03-10 | Qualcomm Incorporated | System and method for application management through threshold events |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
FR2848053B1 (fr) * | 2002-11-29 | 2005-04-01 | Streamwide | Procede de traitement de donnees audio sur un reseau et dispositif de mise en oeuvre de ce procede |
US20040111259A1 (en) * | 2002-12-10 | 2004-06-10 | Miller Edward S. | Speech recognition system having an application program interface |
US20040122653A1 (en) * | 2002-12-23 | 2004-06-24 | Mau Peter K.L. | Natural language interface semantic object module |
US7729913B1 (en) | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
US7260535B2 (en) * | 2003-04-28 | 2007-08-21 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting for call controls |
US20040230637A1 (en) * | 2003-04-29 | 2004-11-18 | Microsoft Corporation | Application controls for speech enabled recognition |
CN1894658B (zh) | 2003-06-06 | 2012-02-29 | 纽约市哥伦比亚大学托管会 | 用于话音激活网页的系统和方法 |
CA2529040A1 (en) * | 2003-08-15 | 2005-02-24 | Silverbrook Research Pty Ltd | Improving accuracy in searching digital ink |
AU2004265700B2 (en) * | 2003-08-15 | 2008-10-02 | Silverbrook Research Pty Ltd | Natural language recognition using distributed processing |
US8311835B2 (en) | 2003-08-29 | 2012-11-13 | Microsoft Corporation | Assisted multi-modal dialogue |
US7552055B2 (en) | 2004-01-10 | 2009-06-23 | Microsoft Corporation | Dialog component re-use in recognition systems |
US8160883B2 (en) | 2004-01-10 | 2012-04-17 | Microsoft Corporation | Focus tracking in dialogs |
US7448041B2 (en) * | 2004-04-28 | 2008-11-04 | International Business Machines Corporation | Interfacing an application server to remote resources using Enterprise Java Beans as interface components |
US20060004574A1 (en) * | 2004-06-30 | 2006-01-05 | Microsoft Corporation | Semantic based validation information in a language model to detect recognition errors and improve dialog performance |
US7739117B2 (en) * | 2004-09-20 | 2010-06-15 | International Business Machines Corporation | Method and system for voice-enabled autofill |
US8942985B2 (en) * | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
US8024194B2 (en) * | 2004-12-08 | 2011-09-20 | Nuance Communications, Inc. | Dynamic switching between local and remote speech rendering |
US8788271B2 (en) * | 2004-12-22 | 2014-07-22 | Sap Aktiengesellschaft | Controlling user interfaces with contextual voice commands |
US8694322B2 (en) * | 2005-08-05 | 2014-04-08 | Microsoft Corporation | Selective confirmation for execution of a voice activated user interface |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7848928B2 (en) * | 2005-08-10 | 2010-12-07 | Nuance Communications, Inc. | Overriding default speech processing behavior using a default focus receiver |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US20070300185A1 (en) * | 2006-06-27 | 2007-12-27 | Microsoft Corporation | Activity-centric adaptive user interface |
US8364514B2 (en) * | 2006-06-27 | 2013-01-29 | Microsoft Corporation | Monitoring group activities |
US7970637B2 (en) | 2006-06-27 | 2011-06-28 | Microsoft Corporation | Activity-centric granular application functionality |
US20070300225A1 (en) * | 2006-06-27 | 2007-12-27 | Microsoft Coporation | Providing user information to introspection |
US20070297590A1 (en) * | 2006-06-27 | 2007-12-27 | Microsoft Corporation | Managing activity-centric environments via profiles |
US20070299713A1 (en) * | 2006-06-27 | 2007-12-27 | Microsoft Corporation | Capture of process knowledge for user activities |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9570078B2 (en) | 2009-06-19 | 2017-02-14 | Microsoft Technology Licensing, Llc | Techniques to provide a standard interface to a speech recognition platform |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US9484018B2 (en) * | 2010-11-23 | 2016-11-01 | At&T Intellectual Property I, L.P. | System and method for building and evaluating automatic speech recognition via an application programmer interface |
US8898065B2 (en) | 2011-01-07 | 2014-11-25 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
WO2014055076A1 (en) | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
KR20140054643A (ko) * | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9196250B2 (en) | 2012-11-16 | 2015-11-24 | 2236008 Ontario Inc. | Application services interface to ASR |
EP2733697A1 (en) * | 2012-11-16 | 2014-05-21 | QNX Software Systems Limited | Application services interface to ASR |
US8694305B1 (en) * | 2013-03-15 | 2014-04-08 | Ask Ziggy, Inc. | Natural language processing (NLP) portal for third party applications |
KR101505127B1 (ko) * | 2013-03-15 | 2015-03-26 | 주식회사 팬택 | 음성 명령에 의한 오브젝트 실행 장치 및 방법 |
US9690854B2 (en) | 2013-11-27 | 2017-06-27 | Nuance Communications, Inc. | Voice-enabled dialog interaction with web pages |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
US20200250326A1 (en) * | 2017-10-25 | 2020-08-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Operation of an Electronic Device during Maintenance |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5509104A (en) * | 1989-05-17 | 1996-04-16 | At&T Corp. | Speech recognition employing key word modeling and non-key word modeling |
US5222187A (en) * | 1989-12-29 | 1993-06-22 | Texas Instruments Incorporated | Grammar-based checksum constraints for high performance speech recognition circuit |
DE4131133B4 (de) * | 1991-09-19 | 2005-09-08 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Austausch von Daten in Datenverarbeitungsanlagen |
EP0547903B1 (en) * | 1991-12-17 | 2001-10-31 | Texas Instruments Incorporated | Method and system for isolating data and information collection components from other components in a distributed environment |
DE69326431T2 (de) * | 1992-12-28 | 2000-02-03 | Toshiba Kawasaki Kk | Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist |
US5390279A (en) * | 1992-12-31 | 1995-02-14 | Apple Computer, Inc. | Partitioning speech rules by context for speech recognition |
GB9316948D0 (en) * | 1993-08-14 | 1993-09-29 | Ibm | Programming aid for distributed computing systems |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5546583A (en) * | 1994-04-05 | 1996-08-13 | International Business Machines Corporation | Method and system for providing a client/server interface in a programming language |
US5668928A (en) * | 1995-01-31 | 1997-09-16 | Kor Team International, Inc. | Speech recognition system and method with automatic syntax generation |
US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
US5752246A (en) * | 1995-06-07 | 1998-05-12 | International Business Machines Corporation | Service agent for fulfilling requests of a web browser |
US5721908A (en) * | 1995-06-07 | 1998-02-24 | International Business Machines Corporation | Computer network for WWW server data access over internet |
US5701451A (en) * | 1995-06-07 | 1997-12-23 | International Business Machines Corporation | Method for fulfilling requests of a web browser |
US5748191A (en) * | 1995-07-31 | 1998-05-05 | Microsoft Corporation | Method and system for creating voice commands using an automatically maintained log interactions performed by a user |
US5715369A (en) * | 1995-11-27 | 1998-02-03 | Microsoft Corporation | Single processor programmable speech recognition test system |
US5754774A (en) * | 1996-02-15 | 1998-05-19 | International Business Machine Corp. | Client/server communication system |
US5751956A (en) * | 1996-02-21 | 1998-05-12 | Infoseek Corporation | Method and apparatus for redirection of server external hyper-link references |
US5819220A (en) * | 1996-09-30 | 1998-10-06 | Hewlett-Packard Company | Web triggered word set boosting for speech interfaces to the world wide web |
-
1997
- 1997-10-03 US US08/943,711 patent/US6456974B1/en not_active Expired - Lifetime
-
1998
- 1998-01-05 KR KR1019980000055A patent/KR100663821B1/ko not_active IP Right Cessation
- 1998-01-05 SG SG1998000026A patent/SG72779A1/en unknown
- 1998-01-06 EP EP98300093A patent/EP0854418A3/en not_active Withdrawn
- 1998-01-06 JP JP10001106A patent/JPH10240493A/ja active Pending
- 1998-08-04 TW TW087100099A patent/TW421755B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP0854418A3 (en) | 2005-10-12 |
KR100663821B1 (ko) | 2007-06-04 |
SG72779A1 (en) | 2000-05-23 |
KR19980070342A (ko) | 1998-10-26 |
US6456974B1 (en) | 2002-09-24 |
JPH10240493A (ja) | 1998-09-11 |
EP0854418A2 (en) | 1998-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW421755B (en) | System and method for adding speech recognition capabilities to java | |
JP3432076B2 (ja) | 音声対話型ビデオスクリーン表示システム | |
CA2436940C (en) | A method and system for voice activating web pages | |
US7890333B2 (en) | Using a WIKI editor to create speech-enabled applications | |
US9083798B2 (en) | Enabling voice selection of user preferences | |
US7657828B2 (en) | Method and apparatus for coupling a visual browser to a voice browser | |
US7912726B2 (en) | Method and apparatus for creation and user-customization of speech-enabled services | |
JP5166661B2 (ja) | 計画に基づくダイアログを実行する方法および装置 | |
EP1175060B1 (en) | Middleware layer between speech related applications and engines | |
CN100424632C (zh) | 用于高级交互接口的语义对象同步理解 | |
US20030036906A1 (en) | Voice site personality setting | |
JP2009059378A (ja) | ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法 | |
AU2004201992A1 (en) | Semantic object synchronous understanding implemented with speech application language tags | |
KR100826778B1 (ko) | 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법 | |
JP2002023996A (ja) | 音声対応スクリプト動作装置 | |
KR100399574B1 (ko) | 외국인을 위한 전화안내 자동 통역시스템 및 방법 | |
KR20020040479A (ko) | 음성 인터넷 서비스 제공 장치 및 방법 | |
KR20040018687A (ko) | 인터넷 컨텐츠를 tts 변환하여 개인정보처리기로제공하는 네트워크 동기화 시스템 및 그 방법 | |
Kurschl et al. | Gulliver-A framework for building smart speech-based applications | |
Pargellis et al. | A language for creating speech applications. | |
JP2004171111A (ja) | Webブラウザ制御方法及び装置 | |
Raggett et al. | Voice Browsers | |
JP2003195884A (ja) | 音声合成装置及びその方法と音声合成システム | |
Nichols et al. | Voice-commanded Scripting Language for Programming Navigation Strategies on-the-fly | |
JPH10143352A (ja) | 文章情報変換装置および変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MK4A | Expiration of patent term of an invention patent |