TWI590082B - 應用程式的共享分散式詞庫 - Google Patents

應用程式的共享分散式詞庫 Download PDF

Info

Publication number
TWI590082B
TWI590082B TW099105180A TW99105180A TWI590082B TW I590082 B TWI590082 B TW I590082B TW 099105180 A TW099105180 A TW 099105180A TW 99105180 A TW99105180 A TW 99105180A TW I590082 B TWI590082 B TW I590082B
Authority
TW
Taiwan
Prior art keywords
application
thesaurus
formatted
vocabulary
compiled
Prior art date
Application number
TW099105180A
Other languages
English (en)
Other versions
TW201037532A (en
Inventor
板倉謙
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201037532A publication Critical patent/TW201037532A/zh
Application granted granted Critical
Publication of TWI590082B publication Critical patent/TWI590082B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/36Software reuse
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Stored Programmes (AREA)
  • Computer And Data Communications (AREA)

Description

應用程式的共享分散式詞庫
本發明關於一種應用程式的共享式分散式詞庫。
電子詞庫可能為進行語言分析之應用程式的重要組件,例如輸入方法編輯器(Input method editor,「IME」)、拼字檢查器、手寫辨識器、語音聽寫等等。但是,當自然語言與軟體之性質持續演進,在一應用程式中囊括所有需要的文字是不可能的,此乃因為應用程式的效能可能降低、產品上市後會出現新字、特定領域的用語對於不屬於該領域的使用者而言可能降低準確性等。
處理這種問題的常見方式包括提供特定領域的詞庫做為一附加詞庫,或例如提供一種特徵來產生自訂詞庫給個人使用。目前附加詞庫及自訂詞庫的一個問題在於特定應用程式之專屬格式的使用。因此,縱使術語對各應用程式的使用者或使用者群組而言是常見的,這些專屬格式很難或不可能橫跨其它應用程式來共享。
該附加詞庫的另一個問題為該詞庫的細微度(granularity)。在市面上,詞庫僅用於會有大量使用者的廣細微度領域,這是因為較小領域的詞庫很難商業化。
以下將提供一簡化的摘要,藉以提供對於此處一些創新具體實施例之基本瞭解。此摘要並非廣泛的概述,且其並非辨識關鍵元件或描述其範圍。其唯一的目的係以一簡化的形式呈現一些觀念,做為稍後更為詳細的說明之序言。
所揭示的架構提供一種通用格式的電子詞庫,例如可延伸標示語言(Extensible markup language,「XML」)。為了支援,亦提供一即時詞庫編譯器,其係安裝在使用者環境中,並提供一詞庫編寫工具。利用這種模型,由一使用者為一特定領域及一特定應用程式產生的詞庫,可輕易地由其它應用程式重新使用,並在屬於相同領域的使用者當中共享。再者,該詞庫檔案可藉由儲存在一網頁伺服器上、附加在電子郵件中等方式來散佈。
為了完成前述及相關的目的,某些圖示性態樣將在此處配合以下描述及附加圖面來說明。這些態樣指明多種方式,其中此處所述的該等原理可被實現,且所有態樣及其同等者皆係在所主張的標的之範圍內。其它好處及創新特徵將可配合該等圖面由以下的實施方式更加瞭解。
本發明所揭示的架構提供及處理一種通用格式的詞庫,例如可延伸標示語言(Extensible markup language,「XML」)。當以該通用格式、指定給多個相容的應用程式使用、並使用一詞庫編譯器即時編譯時,該詞庫可被編寫。該詞庫可經由一網頁伺服器、電子郵件及其它適當的資料傳輸技術來共享及/或散佈。一旦下載到該用戶端應用程式,該詞庫即由該請求的用戶端應用程式註冊使用。利用這種模型,由一使用者為一特定領域及一特定應用程式產生的詞庫可輕易地由其它應用程式重新使用,並在屬於相同領域的使用者當中共享。
應可瞭解該用戶端系統並不需要編譯該詞庫,但當為該通用格式時可使用該詞庫。此外,該轉移方法可為用於轉移一電腦檔案的任何方法。亦請注意其不需要轉移該檔案到另一機器。該詞庫可在橫跨不同應用程式的一環境中共享。
再者,本發明所揭示的架構亦可用於文字搜尋、文字拆解(分解文字成為字詞)、文字探勘(由文字取得高品質資訊)、文字到語音處理,機器轉譯(將文字或語音由一種語言轉換成另一種語言),及用於人類閱讀的詞庫。
現在將參考圖面,其中類似的元件符號用於參照所有類似的元件。在以下的說明中,為了解釋起見,提出許多特定細節,藉以提供對其完整瞭解。但明顯地,該等創新具體實施例可不使用這些特定細節來實施。在其它實例中,熟知的結構及裝置以方塊圖之形式顯示,藉此用於說明。本說明書之意圖係涵蓋所有落在所主張標的之精神及範疇內的修正、同等者及變化。
第1圖為根據所揭示的架構之電腦實作的詞庫系統100。系統100包括格式組件102,用於由通用格式組件106格式化一詞庫104(例如電子)成為一通用格式,通用格式化詞庫108可由不同的應用程式使用。系統100亦包括一編譯器組件110,其用於回應於詞庫104被存取時,編譯通用格式化詞庫108成為經編譯的格式化詞庫112而在應用程式114中使用。該通用格式可為:例如XML。
詞庫104可集中地設置(例如一伺服器)而由該等不同的應用程式存取。編譯器組件110為該等多個不同應用程式進行詞庫104的適當編譯。換言之,編譯器組件110代表多種不同的編譯器用於不同的編譯使用。例如,編譯器組件110包括一編譯器,用於編譯通用格式化詞庫108而使用於一語言分析應用程式。編譯器組件110亦包括一編譯器,用於編譯通用格式化詞庫108而使用於一拼字檢查應用程式。再者,編譯器組件110包括一編譯器,用於編譯通用格式化詞庫108而使用於一語音聽 寫系統。其它編譯器可包括成為編譯器組件110的一部份。
經編譯的格式化詞庫112可由應用程式114下載及註冊而使用於應用程式114。經編譯的格式化詞庫112亦可經由例如一網站、一電子訊息或一檔案共享應用程式中至少一者共享。然而應瞭解,應用程式114可直接(以該通用格式)利用通用格式化詞庫108,而非該編譯的形式(經編譯的格式化詞庫112)。
第2圖所示為第1圖之系統100的另一具體實施例之系統200,其進一步利用編寫工具202。系統200包括格式組件102,用於由通用格式組件106格式化詞庫104成為該通用格式。通用格式化詞庫108可由不同的應用程式使用。這些可為用戶端應用程式及/或伺服器應用程式。系統200亦包括編譯器組件110,用於回應於正被存取(或請求的)詞庫104而編譯通用格式化詞庫108成為經編譯的格式化詞庫112,而用於應用程式114(或其它相容應用程式)。
編寫工具202被用於編寫通用格式化詞庫108以包括例如文字資料、語言資料、手寫資料或聽寫資料中至少一項。一詞庫作者使用編寫工具202產生通用格式化詞庫108(例如一XML格式),或使用一腳本或其它適當程式轉換該詞庫來源。
為了一特定應用程式產生的一詞庫,可能不具有指定用於其它應用程式之該等屬性。因此,如果該作者想要使用其它應用程式之詞庫,可以加入那些遺漏的屬性。該分散式詞庫可由支援該詞庫的其它用戶端使用。應用程式114之支援包括該詞庫適當的載入器。
此外,使用該詞庫(詞庫104)之一應用程式(應用程式114)具有一關聯的詞庫編譯器(編譯器110)。基本上,編譯器110係在生產環境中,而非在使用者環境中。由來源文字編譯該詞庫的基本機制相當常見,所以這種組件的產生接收通用格式化詞庫108做為輸入,其藉由重新使用該應用程式的既有詞庫編譯器。該接收或指定的應用程式114註冊經編譯的格式化詞庫112,使得該詞庫可由應用程式114使用。再者,相同的詞庫可於支援該格式之相容的應用程式之間共享。
換言之,系統200為一電腦實作的詞庫系統,其包含格式組件102,用於以可由不同應用程式使用的一通用格式來格式化詞庫104;編寫工具202,用於編寫通用格式化詞庫108來包括文字資料、語言資料或聽寫資料中至少一項;及編譯器組件110,用於回應於對詞庫104的一請求來編譯通用格式化詞庫108。
格式組件102、編寫工具202及編譯器組件110係集中地設置而由該等不同應用程式存取。編譯器組件110 編譯通用格式化詞庫108,其用於一語言分析應用程式、一拼字檢查應用程式或一語音聽寫應用系統中至少一者。經編譯的格式化詞庫112可由一用戶端應用程式下載及註冊而用於該用戶端應用程式。經編譯的格式化詞庫112可經由一網站、一電子訊息或一檔案共享應用程式散佈及共享。
第3圖為由不同應用程式用於個別詞庫的流程圖300。在302中,提供該詞庫來源以包括文字及屬性。該等屬性可指定該詞庫將用於一或多個終端使用者應用程式。在304中,該詞庫編寫工具被用於對該詞庫來源作改變。在306中,該詞庫使用該通用格式進行格式化。在308中,一散佈組件將該格式化的詞庫散佈到適當的應用程式。
例如在310中,回應於來自一輸入方法應用程式(IME輸入方法編輯器)之請求,該散佈組件轉送該通用格式化詞庫到該輸入方法應用程式的一詞庫編譯器。在312中,該輸入方法應用程式詞庫接著預備用於該輸入方法應用程式。類似地在314中,回應於來自一拼字檢查應用程式之請求,該散佈組件轉送該通用格式化詞庫到該拼字檢查應用程式之一詞庫編譯器。在316中,該拼字檢查詞庫接著預備用於該拼字檢查應用程式。然而再一次的在318中,回應於來自一語音聽寫應用程式之請 求,該散佈組件轉送該通用格式化詞庫到該語音聽寫應用程式之一詞庫編譯器。在320中,該語音聽寫詞庫接著預備用於該語音聽寫應用程式。
第4圖為基於一通用格式共享及散佈詞庫之集中設置的伺服器系統400。系統400包括格式組件102,用於格式化在該通用格式中的詞庫104,其由通用格式組件106進行,經由一散佈組件404由用戶端系統402散佈及共享。檔案同步化可在例如儲存相同詞庫檔案的多個伺服器之間執行。此可對於許多不同用戶端系統402產生及使用的該等多個不同詞庫檔案而發生。
散佈組件404傳送通用格式化詞庫108到一或多個用戶端系統402,用於回應於正在被存取(或被請求)的詞庫104而編譯成該編譯的詞庫,以由用戶端系統402使用或在用戶端系統402中使用。系統400亦可包括編寫工具202,用於編寫通用格式化詞庫108來包括例如文字資料、語言資料、手寫資料、聽寫資料、及/或其它種類的資料。伺服器系統400可為一網頁伺服器,其例如經由網際網路或企業散佈該詞庫。
對於該輸入方法應用程式,該等語彙的涵蓋範圍可被管理來改善準確性及使用者經驗。該輸入方法應用程式詞庫可配置成涵蓋最常用的文字,以良好地處理主要的情況,而不會受到使用頻率少的文字之副作用。
該網頁詞庫可涵蓋該使用者詞庫的大部份領域,且亦部份涵蓋例如該領域詞庫、新文字詞庫及協同詞庫。
所揭示的詞庫架構可由在主要網路(例如網際網路)上其它可使用的詞庫來源取得內容。例如,關於亞洲語言、汽車、印刷、財經、建築、簡稱、日式英文、翻譯、古老文字的語彙可由其搜尋並獲得內容。類似地,詞庫內容可由關於繁體中文(Chinese traditional,「CHT」)及簡體中文(Chinese simplified,「CHS」)、複合字、古詩、法律、經濟、醫藥等的來源取得。
應瞭解該編譯器亦可做為一用戶端應用程式,其自該集中的位置接收該通用式格式化的詞庫,並自動地編譯該等本地用戶端的詞庫。
可利用一詞庫全球唯一識別(Globally unique identifier,「GUID」),其為該詞庫的識別。當一詞庫被加入且該詞庫GUID符合於一既有詞庫清單之一者時,該既有的詞庫由該加入的詞庫所取代。
該網頁詞庫XML檔案可包括一特定字串,其可由不同的搜尋爬行器(search crawler)所辨識,使得使用者可找到該網頁詞庫,即使該詞庫並不在一網頁詞庫入口上。一網頁詞庫入口可包括一鏈結到該搜尋的該搜尋結果頁面。一網頁詞庫入口係為例如一線上套裝應用程式的一簡單網頁。該入口保有該等可使用網頁詞庫的一分 類清單。
一內容提供者可請求加入一詞庫。可以進行關於地理政治學、準確性及效能的基本檢查來確保該詞庫可滿足預先定義的條件。一網頁詞庫可開始服務而不需要先載入該入口上的詞庫。此外,因為該網頁詞庫為一鏈結清單,任何使用者能夠產生另一個網頁詞庫入口。
一使用者可藉由選擇一詞庫特性之「更新」按鈕來更新一詞庫。該更新URL可直接指向該詞庫檔案本身,但亦可指向一般的網頁,其具有一鏈結到該詞庫,並可包含關於該詞庫的解釋。
詞庫可被編碼簽章。為了安全性理由,即使當該詞庫GUID相同時,一編碼簽章的詞庫不能由未編碼簽章的詞庫所取代。
一詞庫可能包括有問題的內容,其會影響效能或轉換準確性。提供一使用者從該特性移除該詞庫的選項。但是,因為其很難自動地區別在該詞庫中一項目是否有問題,該等可疑的項目可被阻隔。此為效益與信任度無法兼顧的結果。
該等詞庫檔案的數位簽章可被提供來確保該等內容並未改變。有簽章及無簽章的詞庫來源皆可被支援。當該詞庫來源被簽章時,顯示該簽章,且提示該使用者是否使用該詞庫。類似地,當該詞庫來源為未簽章,可顯示 一訊息來請求該使用者選擇是否要使用該詞庫。
該數位簽章係用於避免竄改。藉由檢查該簽章,使用者能夠藉由簽章的名稱判定該詞庫的品質。對於該內容提供者而言,該簽章可用於避免攻擊,也因此避免由於該詞庫內容被改變而造成該公司名譽受損。
自一網站註冊一輸入方法應用程式詞庫的範例如下述。當一使用者在一網站上選擇一鏈結到一網頁詞庫,該瀏覽器可顯示並執行一下載確認對話。該輸入方法應用程式檢查該數位簽章,並當該詞庫為未簽章時顯示一指示器,或當該詞庫已被適當簽章時顯示一不同的指示器。該使用者可選擇繼續或是不使用該未簽章的詞庫。
以下包括的為一系列的流程圖,其代表用於執行所揭示的架構之創新態樣的範例性方法。為了簡化說明起見,此處顯示一或多種方法,例如以流程圖的形式,並以一系列的動作來顯示及描述,將可瞭解該方法並不限於動作的順序,因為根據本發明,一些動作可與此處所顯示及描述之不同順序下發生,及/或與其它動作同步發生。例如,本技藝專業人士將可瞭解到,一方法可另外表示成一系列的交互關連的狀態或事件,例如狀態圖。再者,在一方法中圖示的動作不一定皆需用於一種創新實施中。
第5圖為處理一詞庫做為應用程式使用的方法。在500 中,一詞庫被格式化成為可由不同用戶端應用程式使用的一通用格式。在502中,該格式化的詞庫回應於對該詞庫的一請求而編譯成用於一應用程式。在504中,該編譯的詞庫被下載而用於該應用程式。
第6圖為第5圖之方法的額外態樣。在600中,註冊該下載的詞庫而用於該應用程式。在602中,一屬性被加入到關連一不同應用程式的該詞庫,而可由該不同應用程式使用該詞庫。在604中,編寫該格式化的詞庫以包括文字資料、語言資料、手寫資料或聽寫資料中至少一項。在606中,該詞庫被集中地更新成一XML格式而由相容的應用程式做分散式的使用。在608中,下載該編譯的詞庫而用於一語言分析應用程式、一拼字檢查應用程式或一語音聽寫應用程式中至少一者。
第7圖為處理一詞庫用於一特定目的之方法。例如,該目的可為語言分析或聽寫。在700中,選擇一通用格式來產生該詞庫。在702中,該詞庫對於該特定目的做編寫。在704中,該詞庫被編譯及散佈到關聯於該目的之使用者。散佈可為將該編譯的詞庫直接傳輸到關聯於該目的之該等使用者,張貼在一網站上,及/或橫跨可由該等使用者存取的多個伺服器之分散式儲存。
第8圖為提供一特定領域詞庫的方法。在800中,該特定領域詞庫係以一通用格式(例如XML)對於亞洲語言 分析來開發。在802中,自該詞庫的一相容用戶端應用程式接收一請求。在804中,該詞庫被自動地對於一輸入方法應用程式(例如IME)進行編譯。在806中,該詞庫被暴露而用於該輸入方法應用程式。該暴露可為一附加式模組,例如被下載到該輸入方法應用程式。另外,該暴露可做為該輸入方法應用程式之一既有組件的更新。在808中,該詞庫被暴露而用於其它消費者。該等消費者可為其他使用者之類似輸入方法應用程式,及/或可連接到該詞庫的相容應用程式。
如本申請案中所使用的名詞「組件」及「系統」係代表一電腦相關的實體,其可為硬體、硬體及軟體的組合、軟體或執行中的軟體。例如,一組件可為(但不限於)在一處理器上運行的一程序、一處理器、一硬碟機、多重儲存驅動器(光學、固態及/或磁性儲存媒體)、一物件、一可執行程式、執行的執行緒、一程式及/或一電腦。藉由圖示,在一伺服器上執行的一應用程式與該伺服器可為一組件。一或多個組件可存在於一程序及/或一執行緒之中,且一組件可位在一電腦上及/或分散在兩個以上的電腦之間。在此處使用的用語「範例性」係代表做為一範例、實例或圖示。在此所述之任何態樣或設計做為「範例性」者,不一定被視為比其它態樣或設計較佳或較有利。
現在請參照第9圖,所示為根據所揭示的架構用於執行詞庫編譯及共享的運算系統900之方塊圖。為了提供其多種態樣的額外內容,第9圖及以下的討論係要提供適當的運算系統900之一簡短概略性的描述,其中可以實作多種態樣。雖然以上的說明係置於可在一或多部電腦上運轉的電腦可執行指令的一般性內文中,本技藝專業人士將可瞭解到,一創新具體實施例亦可結合其它程式模組及/或硬體及軟體的組合來實施。
用於實作多種態樣之運算系統900包括電腦902,其具有處理單元904、系統記憶體906及系統匯流排908。處理單元904可為多種商用處理器之任一種,例如單一處理器、多處理器、單一核心單元與多核心單元。再者,本技藝專業人士將可瞭解到本發明方法可利用其它電腦系統組態來實施,其中包括迷你級電腦、主機級電腦、以及個人電腦(例如桌上型、膝上型等)、掌上型運算裝置、以微處理器為主或可程式化的消費性電子產品及類似者,其每一個皆可以在運作上結合於一或多個關聯的裝置。
系統記憶體906可包括揮發性(VOL)記憶體910(例如隨機存取記憶體(Random access memory,「RAM」)及非揮發性記憶體(NON-VOL)912(例如ROM,EPROM,EEPROM等)。一基本輸入/輸出系統(Basic input/output system,「BIOS」)可儲存在非揮發性記憶體912中,並包括該等基本常式,其可在電腦902內的組件之間進行資料與信號之傳遞,例如在開機期間。揮發性記憶體910亦可包括一高速RAM,例如用於快取資料的靜態RAM。
系統匯流排908提供系統組件的介面,其包括但不限於記憶體子系統906到處理單元904。系統匯流排908可為數種匯流排結構中任何一種,其進一步可互連到一記憶體匯流排(可利用一記憶體控制器,也可不用),及一周邊匯流排(例如PCI,PCIe,AGP,LPC等),其可使用多種商用匯流排架構之任何一種。
電腦902進一步包括儲存子系統914及儲存介面916,用於連接儲存子系統914到系統匯流排908及其它想要的電腦組件。儲存子系統914可包括像是一或多個硬碟機(Hard disk drive,「HDD」)、一磁性軟碟機(Floppy disk drive,「FDD」)、及/或光碟儲存驅動器(例如CD-ROM驅動器、DVD驅動器)。儲存介面916可包括介面技術,例如像是EIDE,ATA,SATA及IEEE 1394。
一或多個程式及資料可儲存在記憶體子系統906中,可移除式記憶體子系統918(例如來自快閃驅動形式技術),及/或儲存子系統914(例如光學、磁性、固態),其包括作業系統920、一或多個應用程式922、其它程式模組924及程式資料926。
當電腦902為一伺服器機器時,一或多個應用程式922、其它程式模組924及程式資料926可包括例如第1圖的格式組件102、詞庫104、通用格式組件106、通用格式化詞庫108及編譯器組件110;第2圖的編譯工具202;第3圖之流程圖300所代表的該等項目、組件及流程;第4圖之伺服器系統400及用戶端系統402;及第5-8圖之流程圖所代表的該等方法。
概言之,程式包括常式、方法、資料結構及其它軟體組件等,其可執行特殊工作或實作特定的摘要資料型態。作業系統920、應用程式922、模組924及/或資料926之所有或部份亦可快取在記憶體中,例如像是非揮發性記憶體910。應瞭解所揭示的架構可用多種商用作業系統或作業系統之組合(例如做為虛擬機器)來實作。
儲存子系統914與記憶體子系統(906及918)做為資料、資料結構、電腦可執行指令等之揮發性與非揮發性儲存的電腦可讀取媒體。電腦可讀取媒體可為任何可由電腦902存取的可用媒體,其包括揮發性與非揮發性媒體,可移除與不可移除式媒體。對於電腦902,該媒體可用一適當的數位格式容納任何資料的儲存。本技藝專業人士應可瞭解到可利用其它種類的電腦可讀取媒體,例如Zip驅動器、磁帶、快閃記憶卡、卡匣及類似者,用於儲存電腦可執行指令來執行所揭示架構之創新方 法。
一使用者可使用外部使用者輸入裝置928(例如鍵盤與滑鼠)來與電腦902、程式與資料進行互動。其它外部使用者輸入裝置928可包括一麥克風、一紅外線(Infrared,「IR」)遙控器、搖桿、遊戲板、相機辨識系統、光筆、觸控螢幕、姿態系統(例如眼睛移動、頭部移動等),及/或類似者。該使用者可使用電路板上使用者輸入裝置930(例如觸控板、麥克風、鍵盤等)與電腦902、程式及資料進行互動,其中電腦902例如可為一攜帶式電腦。這些及其它輸入裝置透過系統匯流排904經由輸入/輸出(I/O)裝置介面932連接至處理單元908,但可由其它介面連接,例如並列埠、IEEE 1394標準序列埠、遊戲埠、USB埠、IR介面等。I/O裝置介面932亦可使用輸出周邊934,例如印表機、音訊裝置、相機裝置等等,例如音效卡及/或電路板上音訊處理能力。
一或多個繪圖介面936(亦通常稱之為繪圖處理單元(Graphics processing input,「GPU」)提供電腦902與外部顯示器938(例如LCD,電漿)及/或電路板上顯示器940(例如用於攜帶式電腦)之間的繪圖與視訊信號。繪圖介面936亦可製造成電腦系統電路板上的一部份。
電腦902經由一有線/無線通訊子系統942,使用邏輯連接到一或多個網路及/或其它電腦,在一網路化環境 (例如IP)中操作。其它的電腦可包括工作站、伺服器、路由器、個人電腦、微處理器式娛樂裝置、一端點裝置或其它共用網路節點,且基本上包括相對於電腦902所述之許多或所有的組件。該等邏輯連接可包括有線/無線連接到一區域網路(Local area network,「LAN」)、一廣域網路(Wide area network,「WAN」)、熱點(hotspot)等等。LAN及WAN網路化環境為辦公室與公司內常見到,其可實施整個企業內的電腦網路,例如企業內網路,其所有可以連接至一全球通訊網路,例如網際網路。
當用於網路化環境中時,電腦902經由一有線/無線通訊子系統942連接至該網路(例如一網路介面轉接器、電路上收發器子系統等),以與有線/無線網路、有線/無線印表機、有線/無線輸入裝置944等通訊。電腦902可包括一數據機,或具有其它設施在該網路上建立通訊。在一網路化環境中,相對於電腦902的程式及資料可儲存在遠端記憶體/儲存裝置中,其係關聯於一分散式系統。將可瞭解所示的網路連接為範例性,其可使用在電腦之間建立通訊的其它手段。
電腦902可使用像是IEEE 802.xx家族的標準之無線電技術用於與有線/無線裝置或個體進行通訊,像是可運作地設置成無線通訊之無線裝置(例如IEEE 802.11,空中傳輸調變技術),藉由例如印表機、掃描機、桌上型及 /或攜帶式電腦、個人數位助理(PDA)、通訊衛星、任何關連於一無線偵測標籤(如服務亭、新聞架、盥洗室)及電話之設備或位置的任何片段。此包括至少熱點用的Wi-Fi(或Wireless Fidelity),WiMax及藍芽無線技術。因此,該等通訊可為如同與一傳統網路之一預先定義的結構,或僅為至少兩個裝置之間的一臨時性通訊。Wi-Fi網路使用稱為IEEE 802.1x(a,b,g等)之無線電技術來提供安全可靠及快速的無線連接。一Wi-Fi網路可用於將電腦彼此連接,連接到網際網路,及連接到有線網路(其使用IEEE 802.3相關的媒體及功能)。
現在請參照第10圖,所示為用於散佈詞庫的一運算環境1000的架構性方塊圖。環境1000包括一或多個用戶端1002。用戶端1002可為硬體及/或軟體(如執行緒、程序、運算裝置)。用戶端1002例如包含小程式(cookies)及/或相關的內文資訊。
環境1000亦包括一或多個伺服器1004。伺服器1004亦可為硬體及/或軟體(如執行緒、程序、運算裝置)。伺服器1004藉由使用該架構例如執行緒來執行轉換。在用戶端1002及伺服器1004之間一種可能的通訊的形式可為用於在兩個以上的電腦程序之間傳送的一資料封包的形式。該資料封包可包括例如一小程式及/或相關的內文資訊。環境1000包括通訊架構1006(如一全球通訊網 路,如網際網路),其可用於實施用戶端1002與伺服器1004之間的通訊。
通訊可透過一有線(包括光纖)及/或無線技術來實施。用戶端1002可以在操作上連接到一或多個用戶端資料儲存1008,其可用於在用戶端1002的本地端儲存資訊(如小程式及/或相關的內文資訊)。類似地,伺服器1004可在操作上連接到一或多個伺服器資料儲存1010,其可用於在伺服器1004本地儲存資訊。
以上所描述的包括所揭示架構的範例。當然,其不可能描述每一項可以想到的組件或方法之組合,但本技藝專業人士應可瞭解許多進一步的組合及排列係可能的。因此,該創新架構係包含所有這些改變、修正及位在附屬申請專利範圍的精神及範疇內的變化。再者,在實施方式或申請專利範圍中的用語「包括」,其涵蓋性類似在一申請專利範圍內做為一轉折語的「包含」被詮釋之意義。
100‧‧‧詞庫系統
102‧‧‧格式組件
104‧‧‧詞庫
106‧‧‧通用格式組件
108‧‧‧通用格式化詞庫
110‧‧‧編譯器組件
112‧‧‧經編譯的格式化詞庫
114‧‧‧應用程式
200‧‧‧系統
202‧‧‧編寫工具
300‧‧‧流程圖
302‧‧‧詞庫來源(文字與屬性)
304‧‧‧詞庫編寫工具
306‧‧‧通用格式化詞庫
308‧‧‧散佈組件(經由網站、電子郵件、檔案共享等)
310‧‧‧輸入方法應用程式(IMA)的詞庫編譯器
312‧‧‧預備好使用IMA
314‧‧‧拼字檢查器的詞庫編譯器
316‧‧‧預備好使用拼字檢查器
318‧‧‧語音聽寫系統之詞庫編譯器
320‧‧‧預備好使用語音聽寫系統
400‧‧‧伺服器系統
402‧‧‧用戶端系統
404‧‧‧散佈組件
900‧‧‧運算系統
902‧‧‧電腦
904‧‧‧處理單元
906‧‧‧系統記憶體
906‧‧‧記憶體子系統
908‧‧‧系統匯流排
910‧‧‧揮發性記憶體
912‧‧‧非揮發性記憶體
914‧‧‧儲存子系統
916‧‧‧儲存器介面
918‧‧‧可移除式記憶體子系統
920‧‧‧作業系統
922‧‧‧應用程式
924‧‧‧模組
926‧‧‧資料
928‧‧‧外部使用者輸入裝置
930‧‧‧電路板上使用者輸入裝置
932‧‧‧輸入/輸出裝置介面
934‧‧‧輸出周邊
936‧‧‧繪圖介面
938‧‧‧外部顯示器
940‧‧‧電路板上顯示器
942‧‧‧有線/無線通訊子系統
944‧‧‧網路、電腦、無線周邊、無線輸入裝置
1000‧‧‧運算環境
1002‧‧‧用戶端
1004‧‧‧伺服器
1006‧‧‧通訊架構
1008‧‧‧用戶端資料舖
1010‧‧‧伺服器資料舖
第1圖為根據所揭示的架構之電腦實作的詞庫系統。
第2圖為第1圖的系統之另一具體實施例的系統,其進一步利用一編寫工具。
第3圖為由不同應用程式做個別詞庫使用的流程圖。
第4圖為基於一通用格式共享及散佈詞庫之集中設置的伺服器系統。
第5圖為處理一詞庫以供應用程式使用的方法。
第6圖為第5圖之方法的額外態樣。
第7圖為處理一詞庫以用於一特定目的之方法。
第8圖為提供一特定領域詞庫的方法。
第9圖為根據所揭示的架構用於執行詞庫編譯及共享的一運算系統之方塊圖。
第10圖為用於散佈詞庫的一運算環境之架構方塊圖。
100‧‧‧詞庫系統
102‧‧‧格式組件
104‧‧‧詞庫
106‧‧‧通用格式組件
108‧‧‧通用格式化詞庫
110‧‧‧編譯器組件
112‧‧‧經編譯的格式化詞庫
114‧‧‧應用程式

Claims (20)

  1. 一種電腦實作的詞庫系統,包含:一格式組件,用於以不同應用程式可使用之一通用格式來格式化一詞庫;一詞庫架構,由在網路上其他可使用的詞庫來源取得用於經格式化的該詞庫之內容,包括關於亞洲語言、汽車、印刷、財經、建築、簡稱、日式英文、翻譯、古老文字之語彙、以及關於繁體中文(CHT)及簡體中文(CHS)、複合字、古詩、法律、經濟、及醫藥之來源;一編譯器組件,用於回應於該詞庫正被存取而編譯經取得且經格式化的該詞庫,以特定用於該等不同應用程式之每一者中;以及一散佈組件,用於與該等不同應用程式中之相容應用程式之每一者共享經編譯且經格式化的該詞庫,該等相容應用程式支援經編譯且經格式化的該詞庫之一格式,其中該等不同應用程式包含語音聽寫、拼字檢查、語言分析、以及輸入方法應用程式。
  2. 如申請專利範圍第1項所述之系統,其中該詞庫被集中地設置而供該等不同應用程式存取。
  3. 如申請專利範圍第1項所述之系統,其中該通用格式為XML。
  4. 如申請專利範圍第1項所述之系統,進一步包含一編寫工具,用於編寫經格式化的該詞庫以包括文字資料、語言資料或聽寫資料之至少一者。
  5. 如申請專利範圍第1項所述之系統,其中在該編譯器組件編譯經格式化的該詞庫而用於該語言分析應用程式之後,經編譯且經格式化的該詞庫以該應用程式下載並註冊,以用於該應用程式。
  6. 如申請專利範圍第1項所述之系統,其中在該編譯器組件編譯經格式化的該詞庫而用於該拼字檢查應用程式之後,經編譯且經格式化的該詞庫以該應用程式下載並註冊,以用於該應用程式。
  7. 如申請專利範圍第1項所述之系統,其中在該編譯器組件編譯經格式化的該詞庫而用於該語音聽寫應用程式之後,經編譯且經格式化的該詞庫以該應用程式下載並註冊,以用於該應用程式。
  8. 如申請專利範圍第1項所述之系統,其中經格式化且經編譯的該詞庫以一應用程式下載並註冊,而用於該應用程式,該應用程式為該輸入方法應用程式。
  9. 如申請專利範圍第1項所述之系統,其中經編譯且經格式化的該詞庫經由一網站、一電子訊息或一檔案共享應用程式中之至少一者來共享。
  10. 一種電腦實作的詞庫系統,包含:一格式組件,用於以不同應用程式可使用之一通用格式來格式化一詞庫;一編寫工具,用於編寫經格式化的該詞庫,以包括文字資料、語言資料或聽寫資料中之至少一者;一詞庫架構,由在網路上其他可使用的詞庫來源取得用於經格式化的該詞庫之內容,包括關於亞洲語言、汽車、印刷、財經、建築、簡稱、日式英文、翻譯、古老文字之語彙、以及關於繁體中文(CHT)及簡體中文(CHS)、複合字、古詩、法律、經濟、及醫藥之來源;一編譯器組件,用於回應於對該詞庫的一請求,而編譯經取得且經格式化的該詞庫,以特定用於該等不同應用程式之每一者中,並進行關於地理政治學、 準確性及效能之一組合中之至少一者之檢查來確保經取得且經格式化的該詞庫滿足預先定義的條件;以及一散佈組件,用於將經編譯且經格式化的該詞庫與用於該等不同應用程式中之至少一個應用程式的至少一個其他經編譯且經格式化的詞庫同步,其中該等不同應用程式包含語音聽寫、拼字檢查、語言分析、以及輸入方法應用程式,而該編譯器組件編譯經格式化的該詞庫而用於該語言分析應用程式、該拼字檢查應用程式、以及該語音聽寫應用程式。
  11. 如申請專利範圍第10項所述之系統,其中該格式組件、編寫工具及編譯器組件係被集中地設置,而由該等不同應用程式存取。
  12. 如申請專利範圍第10項所述之系統,其中下載經編譯且經格式化的該詞庫,以用於該語言分析應用程式、該拼字檢查應用程式或該語音聽寫應用程式中之至少一者。
  13. 如申請專利範圍第10項所述之系統,其中經格式化 及經編譯的該詞庫以一用戶端應用程式下載並註冊,而用於該用戶端應用程式。
  14. 如申請專利範圍第10項所述之系統,其中經編譯且經格式化的該詞庫經由一網站、一電子訊息或一檔案共享應用程式中之至少一者來散佈及共享。
  15. 一種電腦實作的詞庫方法,包含以下步驟:以不同用戶端應用程式可使用的一通用格式來格式化一詞庫;由在網路上其他可使用的詞庫來源取得用於經格式化的該詞庫之內容,包括關於亞洲語言、汽車、印刷、財經、建築、簡稱、日式英文、翻譯、古老文字之語彙、以及關於繁體中文(CHT)及簡體中文(CHS)、複合字、古詩、法律、經濟、及醫藥之來源;回應於對該詞庫的一請求,編譯經取得且經格式化的該詞庫,而特定用於該等不同應用程式中之每一者;進行關於地理政治學、準確性及效能之一組合中之至少一者之檢查來確保該詞庫滿足預先定義的條件; 下載經編譯的該詞庫,而用於該應用程式;與該等不同用戶端應用程式中之至少一個相容應用程式共享經編譯且經格式化的該詞庫,該等不同用戶端應用程式中之該至少一個相容應用程式支援經編譯且經格式化的該詞庫之一格式;以及將經編譯且經格式化的該詞庫與用於該等不同用戶端應用程式中之至少一個其他應用程式的至少一個其他經編譯且經格式化的詞庫同步,其中該等不同應用程式包含語音聽寫、拼字檢查、語言分析、以及輸入方法應用程式。
  16. 如申請專利範圍第15項所述之方法,進一步包含以下步驟:註冊經下載的該詞庫,而用於該應用程式。
  17. 如申請專利範圍第15項所述之方法,進一步包含以下步驟:加入一屬性到關於一另外應用程式的該詞庫,使得該詞庫由該另外應用程式使用。
  18. 如申請專利範圍第15項所述之方法,進一步包含以下步驟:編寫經格式化的該詞庫,以包括文字資料、語言資料、手寫資料或聽寫資料中之至少一者。
  19. 如申請專利範圍第15項所述之方法,進一步包含以下步驟:集中地更新該詞庫,以一XML格式供相容應用程式之分散式使用。
  20. 如申請專利範圍第15項所述之方法,進一步包含以下步驟:下載經編譯的該詞庫,用於該語言分析應用程式、該拼字檢查應用程式或該語音聽寫應用程式中之至少一者。
TW099105180A 2009-03-25 2010-02-23 應用程式的共享分散式詞庫 TWI590082B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/410,477 US8423353B2 (en) 2009-03-25 2009-03-25 Sharable distributed dictionary for applications

Publications (2)

Publication Number Publication Date
TW201037532A TW201037532A (en) 2010-10-16
TWI590082B true TWI590082B (zh) 2017-07-01

Family

ID=42781787

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099105180A TWI590082B (zh) 2009-03-25 2010-02-23 應用程式的共享分散式詞庫

Country Status (6)

Country Link
US (1) US8423353B2 (zh)
JP (1) JP5655056B2 (zh)
KR (1) KR101859775B1 (zh)
CN (1) CN102362277B (zh)
TW (1) TWI590082B (zh)
WO (1) WO2010111146A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10304450B2 (en) 2016-05-10 2019-05-28 Google Llc LED design language for visual affordance of voice user interfaces
USD822716S1 (en) 2016-05-13 2018-07-10 Google Llc Voice interface device
US20090300126A1 (en) * 2008-05-30 2009-12-03 International Business Machines Corporation Message Handling
JP2011192113A (ja) * 2010-03-16 2011-09-29 Buffalo Inc ネットワーク装置、並びにネットワーク装置への言語設定方法、及び言語設定プログラム
US20120030564A1 (en) * 2010-07-30 2012-02-02 International Business Machines Corporation Domain-Specific Spell Check Overlays
US9785628B2 (en) * 2011-09-29 2017-10-10 Microsoft Technology Licensing, Llc System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication
US8386926B1 (en) * 2011-10-06 2013-02-26 Google Inc. Network-based custom dictionary, auto-correction and text entry preferences
US9235565B2 (en) * 2012-02-14 2016-01-12 Facebook, Inc. Blending customized user dictionaries
TWI480743B (zh) * 2012-12-11 2015-04-11 Inventec Corp 將目標資料拆分至伺服器與客戶端翻譯之系統及其方法
US9430465B2 (en) * 2013-05-13 2016-08-30 Facebook, Inc. Hybrid, offline/online speech translation system
US20150113072A1 (en) * 2013-10-17 2015-04-23 International Business Machines Corporation Messaging auto-correction using recipient feedback
CN105956046A (zh) * 2016-04-25 2016-09-21 广州神马移动信息科技有限公司 一种字典的更新方法、系统和服务器
EP3757753A1 (en) 2016-05-13 2020-12-30 Google LLC Initiating by voice play of media content
US11308112B2 (en) 2018-03-08 2022-04-19 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301531B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301424B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US10732993B2 (en) 2018-03-08 2020-08-04 Micah Mossman Interactive library system and method of interactive, real-time creation and customization
US11301530B2 (en) 2018-03-08 2022-04-12 Micah Mossman Interactive library system and method of interactive, real-time creation and customization

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
US5418957A (en) 1992-03-09 1995-05-23 Narayan; Rom Network data dictionary
JPH08153090A (ja) * 1994-11-29 1996-06-11 Internatl Business Mach Corp <Ibm> かな漢字変換システム及びその辞書作成方法
IT1285286B1 (it) * 1996-03-01 1998-06-03 Finmeccanica Spa Dispositivo per la lettura automatica di assegni.
FR2751492B1 (fr) * 1996-07-16 1998-11-13 Alcatel Mobile Comm France Procede et dispositif de compression et de decompression de messages
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
US6886130B1 (en) * 1997-11-26 2005-04-26 International Business Machines Corporation Compiled structure for efficient operation of distributed hypertext
US6782510B1 (en) * 1998-01-27 2004-08-24 John N. Gross Word checking tool for controlling the language content in documents using dictionaries with modifyable status fields
US6457172B1 (en) * 1999-04-13 2002-09-24 International Business Machines Corporation Compiler for supporting multiple runtime data representations
US6901588B1 (en) 2000-04-17 2005-05-31 Codemesh, Inc. Sharing components between programming languages by use of polymorphic proxy
US7747782B2 (en) * 2000-04-26 2010-06-29 Novarra, Inc. System and method for providing and displaying information content
JP2001306091A (ja) * 2000-04-26 2001-11-02 Nec Software Kobe Ltd 音声認識システムおよび単語検索方法
US20020049790A1 (en) 2000-08-08 2002-04-25 Ricker Jeffrey M Data interchange format transformation method and data dictionary used therefor
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US7107279B2 (en) 2000-12-20 2006-09-12 Insitech Group, Inc. Rapid development in a distributed application environment
US7254773B2 (en) * 2000-12-29 2007-08-07 International Business Machines Corporation Automated spell analysis
US20020129069A1 (en) * 2001-01-08 2002-09-12 Zhixun Sun Computerized dictionary for expressive language, and its vocabularies are arranged in a narrative format under each topic and retrievable via a subject-oriented index system
US6961722B1 (en) * 2001-09-28 2005-11-01 America Online, Inc. Automated electronic dictionary
AU2002330242A1 (en) 2001-10-05 2003-04-22 Vitria Technology, Inc. System and method for vocabulary-based data transformation
WO2003042823A1 (en) * 2001-11-14 2003-05-22 Exegesys, Inc. Method and system for software application development and customizable runtime environment
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
EP1481332A2 (en) * 2002-03-05 2004-12-01 Siemens Medical Solutions Health Services Corporation A dynamic dictionary and term repository system
JP3737779B2 (ja) * 2002-05-29 2006-01-25 富士通株式会社 翻訳サーバ、翻訳方法及びプログラム
US20050080797A1 (en) * 2002-08-26 2005-04-14 Gordon Short Dynamic lexicon
US20050055197A1 (en) * 2003-08-14 2005-03-10 Sviatoslav Karavansky Linguographic method of compiling word dictionaries and lexicons for the memories of electronic speech-recognition devices
WO2005017767A1 (en) * 2003-08-15 2005-02-24 Silverbrook Research Pty Ltd Natural language recognition using distributed processing
US7191160B2 (en) 2003-11-10 2007-03-13 Sap Ag Platform-independent data dictionary
CA2498728A1 (en) * 2004-02-27 2005-08-27 Dictaphone Corporation A system and method for normalization of a string of words
US7322026B2 (en) * 2004-03-02 2008-01-22 Hewlett-Packard Development Company, L.P. Scoring assertions
US7254774B2 (en) * 2004-03-16 2007-08-07 Microsoft Corporation Systems and methods for improved spell checking
US7409337B1 (en) * 2004-03-30 2008-08-05 Microsoft Corporation Natural language processing interface
KR20050096352A (ko) * 2004-03-30 2005-10-06 부산대학교 산학협력단 인터넷에서 전자사전을 편집하는 방법
US7487448B2 (en) * 2004-04-30 2009-02-03 Microsoft Corporation Document mark up methods and systems
US7367019B2 (en) 2004-09-16 2008-04-29 International Business Machines Corporation Parameter management using compiler directives
US8458467B2 (en) 2005-06-21 2013-06-04 Cisco Technology, Inc. Method and apparatus for adaptive application message payload content transformation in a network infrastructure element
CN100530171C (zh) * 2005-01-31 2009-08-19 日电(中国)有限公司 字典学习方法和字典学习装置
JP2006215823A (ja) * 2005-02-03 2006-08-17 Advanced Telecommunication Research Institute International 辞書作成システム
US8214353B2 (en) * 2005-02-18 2012-07-03 International Business Machines Corporation Support for schema evolution in a multi-node peer-to-peer replication environment
US20060271920A1 (en) * 2005-05-24 2006-11-30 Wael Abouelsaadat Multilingual compiler system and method
JP2007026155A (ja) * 2005-07-19 2007-02-01 Ricoh Co Ltd 単語情報の分散開発システム
US7827484B2 (en) 2005-09-02 2010-11-02 Xerox Corporation Text correction for PDF converters
US7739696B2 (en) * 2005-09-08 2010-06-15 Honeywell International Inc. Message translation systems and methods
JP4769559B2 (ja) * 2005-11-30 2011-09-07 富士ソフト株式会社 Ai予測システム
FR2896603B1 (fr) * 2006-01-20 2008-05-02 Thales Sa Procede et dispositif pour extraire des informations et les transformer en donnees qualitatives d'un document textuel
WO2007114181A1 (ja) * 2006-03-31 2007-10-11 Justsystems Corporation データ入力装置、方法、及びプログラム
US8849653B2 (en) * 2006-05-09 2014-09-30 International Business Machines Corporation Updating dictionary during application installation
US20070265831A1 (en) * 2006-05-09 2007-11-15 Itai Dinur System-Level Correction Service
US7684976B2 (en) * 2006-05-13 2010-03-23 International Business Machines Corporation Constructing regular-expression dictionary for textual analysis
JPWO2008007688A1 (ja) * 2006-07-13 2009-12-10 日本電気株式会社 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法
DE102006036338A1 (de) * 2006-08-03 2008-02-07 Siemens Ag Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
US7899673B2 (en) * 2006-08-09 2011-03-01 Microsoft Corporation Automatic pruning of grammars in a multi-application speech recognition interface
US7945527B2 (en) * 2006-09-21 2011-05-17 Aebis, Inc. Methods and systems for interpreting text using intelligent glossaries
JP4790024B2 (ja) * 2006-12-15 2011-10-12 三菱電機株式会社 音声認識装置
CN100555284C (zh) * 2006-12-28 2009-10-28 凌阳科技股份有限公司 一种电子字典数据更新系统及其方法
US7801928B2 (en) * 2007-03-29 2010-09-21 Nokia Corporation Method, computer-readable medium, apparatus, user interface, and system for provision of a dictionary
US7917355B2 (en) * 2007-08-23 2011-03-29 Google Inc. Word detection
US9910850B2 (en) * 2007-10-25 2018-03-06 Disney Enterprises, Inc. System and method of localizing assets using text substitutions
US7480411B1 (en) * 2008-03-03 2009-01-20 International Business Machines Corporation Adaptive OCR for books
US20090271200A1 (en) * 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
US8645350B2 (en) * 2008-07-11 2014-02-04 Adobe Systems Incorporated Dictionary compilations
US20100114887A1 (en) * 2008-10-17 2010-05-06 Google Inc. Textual Disambiguation Using Social Connections
US20100185631A1 (en) * 2009-01-19 2010-07-22 Microsoft Corporation Techniques for data aggregation, analysis, and distribution
US9045098B2 (en) * 2009-12-01 2015-06-02 Honda Motor Co., Ltd. Vocabulary dictionary recompile for in-vehicle audio system
US8347402B2 (en) * 2010-01-15 2013-01-01 Apollo Enterprise Solutions, Inc. Software development and distribution workflow employing meta-object time stamping
US8290931B2 (en) * 2010-02-22 2012-10-16 Hewlett-Packard Development Company, L.P. Database designer
US8738635B2 (en) * 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking

Also Published As

Publication number Publication date
WO2010111146A3 (en) 2011-01-13
JP5655056B2 (ja) 2015-01-14
KR101859775B1 (ko) 2018-06-28
CN102362277B (zh) 2015-07-08
WO2010111146A2 (en) 2010-09-30
TW201037532A (en) 2010-10-16
CN102362277A (zh) 2012-02-22
KR20110132570A (ko) 2011-12-08
US20100250239A1 (en) 2010-09-30
US8423353B2 (en) 2013-04-16
JP2012521608A (ja) 2012-09-13

Similar Documents

Publication Publication Date Title
TWI590082B (zh) 應用程式的共享分散式詞庫
US11853705B2 (en) Smart content recommendations for content authors
US20220107802A1 (en) Extraquery context-aided search intent detection
Ide et al. The language application grid
EP3514694B1 (en) Query translation
US7634720B2 (en) System and method for providing context to an input method
US7627854B2 (en) Graphical aid for generating object setup scripts
US10360906B2 (en) Computer proxy messaging bot
US20200167134A1 (en) Programming Environment Augment with Automated Dialog System Assistance
US11157444B2 (en) Generating index entries in source files
WO2021017735A1 (zh) 一种智能合约的形式化验证方法、电子装置及存储介质
US8689175B2 (en) Business rules management system
US20140136185A1 (en) Sentiment analysis based on demographic analysis
US20120158742A1 (en) Managing documents using weighted prevalence data for statements
US11360973B2 (en) Generating multilingual queries
US20100169871A1 (en) Structured search in source code
Fonseca Cacho et al. Reproducible research in document analysis and recognition
US20140331127A1 (en) Template based copy and paste function
US9208142B2 (en) Analyzing documents corresponding to demographics
CN111078228A (zh) 网页到小程序的转换方法、装置、服务器及存储介质
US20180314683A1 (en) Method and device for processing natural language
US20230214580A1 (en) Contextual and personalized real time content modification for language assistance
Jain et al. Integration of wit API with python coded terminal bot
Vetter et al. Enhancing the IBM Power Systems Platform with IBM Watson Services
US11971887B2 (en) Identifying and replacing logically neutral phrases in natural language queries for query processing

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees